Sunteți pe pagina 1din 7

Tema 6

CURS – Prelucrări statistice pe computer


Identificare, specificare, parametrizare şi testare în
modelul de regresie multifactorială

1.Specificarea şi identificarea modelului econometric de regresie multifactorială


2.Estimări ale parametrilor în modelul econometric de regresie multifactorială
3.Ipoteze, teste şi validări ale modelului econometric de regresie multifactorială

1. Specificarea şi identificarea modelului econometric de regresie multifactorială

Modelul multifactorial se defineşte prin următoarea relaţie:


y = f(x1; x2; ... xn) + ε

unde:
x = (x1; x2; ... xn) este variabila exogenă, independentă sau variabila cauză;
y este variabila endogenă, dependentă sau variabila efect;
u = (u1; u2; ... un) sau ε (ε1; ε2; ... εn) este variabila reziduală, aleatoare, perturbatoare sau eroare.
f(x1; x2; ... xn) este funcţia de regresie cu ajutorul căreia vor fi estimate valorile variabilei y.

Alegerea funcţiei de regresie multifactoriale se face prin utilizarea mai multor tipuri de funcţii de regresie şi se
decide care este modelul cel mai performant.

Principalele funcţii de regresie multifactoriale sunt de forma:


 funcţia liniară: yt = b0 + b1x1t + b2x2t + ...+ bkxkt
b b b
 funcţia pătratică: y t =b 0⋅x 1t1⋅x 22t ¿… x ktk ; se liniarizează funcţia folosind logaritmul: logy = logb +
t 0
b1logx1t + b2 logx2t + ...+ bk logxkt
x1 x2 xk

 funcţia exponenţială: y t =b 0⋅b 1 t⋅b2 t ¿… bk t


; se liniarizează funcţia folosind logaritmul: logyt =
logb0 + x1tlog b1 + x2tlogb2+ ...+ xktlogbk

1
Analiza de regresie în cazul modelului multifactorial constă în estimarea parametrilor modelului
econometric, prin determinarea estimatorilor.
Acești estimatori trebuie calculați astfel încât diferența dintre valorile reale ale variabilei dependente (yi)

și valorile estimate cu ajutorul parametrilor calculați să fie cât mai mică (


y i− yi =min ).

2. Estimări ale parametrilor în modelul econometric de regresie multifactorială

Forma generală a unui model multifactorial se prezintă astfel:

yt = b0 + b1x1t + b2x2t + ...+ bkxkt + t

unde:

t= 1,n ; n este numărul de termeni ai seriei statistice

j= 1,k ; k este numărul de variabile exogene

Coeficienţii de regresie (b1, b2, …, bn) măsoară influenţa fiecăreia dintre cele n caracteristici factoriale
asupra rezultativei y.

Estimarea parametrilor modelului econometric de regresie liniară multifactorială se realizează cu metoda


celor mai mici pătrate

Conform principiului metodei celor mai mici patrate vom avea:


n n
2
∑ ( y t − y t )2 =∑ ( y t −b0−b 1 x1 −b2 x 2 −⋯−bk x k ) =min
t t t
t =1 t=1

în care
yt reprezintă valorile estimate ale variabilei endogene corespunzatoare nivelurilor variabilelor

exogene x1t, x2t, ...xkt iar


b0 ,b1 ,b2 ,⋯bk sunt estimatorii parametrilor b0, b1, b2, ... bk
Se obține sistemul de ecuații:

2
{b0+b1x1+b2x12+. +bkx1k+u1=y1¿{b0+b1x21+b2x2+. +bkx2k+u2=y2¿{b0+b1x31+b2x32+. +bkx3k+u3=y3 {⋮¿ ¿
Estimația termenului liber b0 arată nivelul variabilei endogene atunci când toate variabilele de influență
(x1t, x2t, …, xkt) au valoarea zero.
Estimațiile parametrilor b1, b2, ... bk arată cu cât variază variabila endogenă atunci când variabila
exogenă corespunzătoare parametrului respectiv variază cu o unitate, în condițiile în care toate celelalte variabile
sunt constante.

Semnul și valoarea parametrului b1 sunt folosite pentru descrierea interdependenței dintre variabila
dependentă y și cea independentă x1.
 dacă parametrul b1 > 0, atunci legatura dintre variabila independentă x1 și variabila dependentă y este
directă (când variabila independentă x1 are o evoluție crescătoare, crește și variabila dependentă y, iar
când variabila independentă x1 are evoluție descrescătoare, scade și variabila dependentă y). Când
parametrul b1 este pozitiv se pot distinge trei situații:
 dacă b1 < 1, atunci influența variabilei independente asupra celei dependente este mai slabă (la
variația cu o unitate a variabilei independente x1, variabila dependentă y variază cu o valoare
subunitară);
 dacă b1 > 1, atunci influența variabilei independente asupra celei dependente este foarte
puternica (la variația cu o unitate a variabilei independente x1, variabila dependentă y variază cu
o valoare supraunitară);
 dacă b1 = 1, atunci variabila dependentă y variază direct proportional cu variația variabilei
independentă x1.
 dacă b1 < 0, atunci legătura dintre variabila independentă x1 și variabila dependentă y este inversă (când
variabila independentă x1 evolueaza crescător, variabila dependentă y are o evoluție descrescătoare, iar
când variabila independentă x1 evoluează descrescator, variabila dependentă y are o evoluție
crescătoare).
 dacă b1 = 0, variabila dependentă y este independentă în raport cu variabila independentă x1.

Aceiași interpretare o avem și pentru ceilalți parametrii.

Analiza corelației în cazul modelului multifactorial liniar se realizează cu ajutorul raportului de corelație
multiplă, a coeficientului de determinație multiplă, precum și a coeficienților de corelație.

3. Verificarea statistica a modelului multifactorial


3
În urma analizei de regresie și a analizei corelației a modelului multifactorial s-au stabilit forma, sensul
și intensitatea legăturii dintre variabilele exogene și variabila endogenă. Modelul econometric rezultat este
analizat cu un ansamblu de metode și teste statistice care sunt numite generic verificarea statistică a modelului.

 Prima etapă de verificare a modelului econometric de regresie multifactorială constă în calcularea și


interpretarea erorilor standard generate de model.

Erorile standard reprezinta abateri ale valorilor estimate de la valorile reale și se împart în:

 eroarea standard a modelului (S) este calculată ca abatere a valorilor estimate ale variabilei endogene
y t față de cele reale y și se determină cu relația:
t

∑ ( yt− yt)2

unde k reprezintă numărul de variabile exogene


S ε=
√ n−k −1

Cu cât valoarea erorii standard a modelului este mai mica în raport cu valorile variabilei endogene, cu
atât modelul aproximează mai corect realitatea economică studiată. Interpretarea calității modelului în funcție de
valoarea erorii standard a modelului este destul de relativă.
 erorile standard ale parametrilor modelului multifactorial sunt abaterile valorilor estimate ale
parametrilor funcției de regresie de la valorile lor reale. Aceste erori se determină pentru fiecare
parametru din modelul de regresie

Cu cât valorile acestor erori ale parametrilor modelului econometric multifactorial sunt mai mici în
raport cu valorile absolute ale parametrilor pe care îi caracterizează, cu atât valorile estimate ale parametrilor
respectivi sunt mai apropiate de cele reale.

 A doua etapă de verificare a modelului econometric de regresie multifactorială constă în verificarea ipotezei
de normalitate a variabilei aleatoare .

Ipoteza de normalitate a variabilei aleatoare , se poate verifica cu ajutorul testului χ2.


Aplicarea testului statistic χ2 presupune parcurgerea următorilor pași:
Pasul 1. Se formulează ipoteza nulă H0, prin care se presupune că distribuția
variabilei aleatoare este normală;

x t −m
zt=
Pasul 2. Se calculează valorile standardizate zt: σ ;
Pasul 3. Se preia din tabelul Laplace valorile φ(zt)
Pasul 4. Se calculează valorile pt = φ(zt) - φ(zt-1)

4
2
( nt −n⋅pt )
χ 2c = ∑
Pasul 5. Se calculează valoarea
n⋅pt

Pasul 6. Se compară valoarea calculată cu valoarea tabelară. Dacă valoarea calculată este mai mică decât
valoarea tabelară atunci se acceptă ipoteza de normalitate a variabilei aleatoare iar modelul econometric este
2
corect. În cazul în care valoarea calculată a testului
χceste mai mare decât valoarea tabelară, atunci ipoteza
de normalitate a variabilei aleatoare se respinge și modelul nu este corect. În această a doua situație sunt
necesare corecții, fie în sensul suplimentării factorilor de influență, fie în sensul creșterii volumului eșantionului
de date pe care se face analiza.

 A treia etapă de verificare a modelului econometric de regresie multifactorială constă în verificarea ipotezei
de autocorelare a variabilei aleatoare .

Verificarea ipotezei de autocorelare a variabilei aleatoare se realizează cu ajutorul testului Durbin –


Watson. Acest test constă în parcurgerea următorilor pași:
Pasul 1. Se stabilește ipoteza nulă H0 conform căreia variabila aleatoare este
autocorelată;
Pasul 2. Se determină valoarea calculată a testului, d, după relația:
n
∑ ( ε t −ε t−1) 2
d c = t=2 n
∑ ε 2t
t =1

Pasul 3. Se determină din tabelele statistice aferente testului Durbin – Watson două valori tabelare, una
inferioară și alta superioară, notate dL și dU. Cele două valori se iau din tabele în funcție de pragul de semnificație
al testului (α = 0,05 sau 0,01), în funcție de numărul de observații, n, precum și în raport de numărul de variabile
exogene, k;
Pasul 4. Se compară valoarea calculată a testului statistic Durbin – Watson, dc, cu cele două valori tabelare și pot
rezulta trei situații:
 dacă dc < dL, înseamnă că ipoteza autocorelării variabilei aleatoare se acceptă. În acest caz valorile variabilei
aleatoare sunt dependente una față de cealaltă, deci datele din eșantioane sunt dependente unele de altele și
modelul trebuie corectat;
 dacă dL ≤ dc ≤ dU, testul este neconcludent și trebuie refăcut pe alte eșantioane de date;
 dacă dc > dU, înseamnă că ipoteza autocorelării variabilei aleatoare se respinge deci modelul econometric de
regresie este corect din punct de vedere statistic. În acest caz valorile variabilei aleatoare sunt independente
între ele iar datele din eșantioane sunt independente.

 A patra etapă de verificare a modelului econometric de regresie multifactorială constă în verificarea


efectului de multicoliniaritate între variabilele exogene.
5
Efectul de multicoliniaritate se stabilește parcurgând următorii pași:
Pasul 1. Se determină coeficientul de determinare (R2) al variabilei endogene de către variabilele exogene

Pasul 2. Se calculează toleranța variabilei xt folosind formula: t = 1-Rt2


Valoare mică a toleranței (mai mică decât 0,1) determină un coeficient de determinare mare, apropiat de
1, deci o legătură liniară puternică între xt şi restul variabilelor exogene. Prin urmare xt este coliniară cu celelalte
variabile exogene

1
FIV =
Pasul 3. Se calculează factorul de inflație a varianței cu ajutorul relației: τ . Valoarea mare a acestui
factor (mai mare decât 10) denotă coliniaritate

Eliminarea multicoliniarității se face prin renunțarea la una din cele două variabile independente corelate. Se vor
exclude din model acele variabile care au toleranțe mici sau factori de inflație mari.

 A cincea etapă de verificare a modelului econometric de regresie multifactorială constă în verificarea


semnificației parametrilor.

Pași parcurși pentru a verifica semnificația parametrilor cu ajutorul testului Student sunt următorii:
Pasul 1. Se stabilește ipoteza nulă H0 conform căreia estimatorii parametrilor nu diferă semnificativ de zero.
Pasul 2. Se stabilește pragul de semnificație al testului, α;
Pasul 3. Se calculează valorile testului Student pentru fiecare estimator în parte, ca raport între valoarea absolută
a parametrului estimat și eroarea sa standard, conform relațiilor:

|b k|
t kc=
Sb
k

Pasul 4. Se determină valoarea tabelară a variabilei standardizate (tα;υ) unde: υ = n – 1 grade de libertate
Pasul 5. Se compară valoarea tabelară cu valorile calculate și rezultă următoarele situații:
bk
 dacă valoarea calculată a testului t este mai mică decât valoarea tabelară ( t c <t α :υ ), atunci ipoteza
nulă H0 se acceptă și se poate spune că estimatorii nu diferă semnificativ de zero. În acest caz, datele nu
confirmă existența legăturii între variabilele exogene și cea endogenă, fiind necesară fie alegerea altui
factor de influență, fie găsirea unei noi forme a legăturii;
b
 dacă valoarea calculată a testului t este mai mare sau egală cu valoarea tabelară ( t c ≥t α : υ ), ipoteza
k

nulă se respinge și se poate spune că estimatorii diferă semnificativ de zero, iar modelul este corect din
punct de vedere statistic.

6
 A șasea etapă de verificare a modelului econometric de regresie multifactorială constă în verificarea
capacității modelului de a reconstitui valorile empirice ale variabilei endogene yt prin intermediul valorilor

estimate
yt .

Această etapă presupune folosirea testului statistic Fisher care presupune parcurgerea următorilor pași:
Pasul 1. Se stabilește ipoteza nulă, H0, conform căreia modelul este irelevant
Pasul 2. Se stabilește pragul de semnificație al testului, α
Pasul 3. Se determină valoarea calculată a testului F folosind relația:
2
s y / x 1 , x2 , …
F c=
s 2ε
Pasul 4. Se alege valoarea tabelară (Fα;υ1;υ2) din tabelul repartiției Fisher – Snedecor în funcție de pragul de
semnificație α și de numărul de grade de libertate: υ1 = k – 1 și υ2 = n – k; unde: k reprezintă numărul de
variabile iar n numărul de observații.
Pasul 5. Se compară valoarea calculată Fc cu valoarea tabelară Fα;υ1;υ2 și rezultă următoarele situații:

F <F
c α ; υ1 ;υ 2
 dacă valoarea calculată a testului F este mai mică decât valoarea tabelară ( ), atunci
ipoteza nulă H0 se acceptă, ceea ce înseamnă că modelul trebuie refăcut. Acest lucru constă fie în sensul
alegerii altui factor de influență (variabilă exogenă), fie în sensul alegerii unei alte funcții de regresie;

c F ≥F
α ; υ1 ; υ2
 dacă valoarea calculată a testului F este mai mare sau egală cu valoarea tabelară ( ),
ipoteza nulă H0 se respinge și se poate spune că variabila exogenă are o influență semnificativă asupra
variabilei endogene.

S-ar putea să vă placă și