Sunteți pe pagina 1din 9

Tema 12

LABORATOR – De la modelul regresiei unifactoriale


prin iteraţie către cel multifactorial. Aspecte specifice în
modelul multifactorial (aplicaţii şi studii decaz) (2 ore
tema 10; 2 ore tema 11; 2 ore tema 12)

1.Specificarea şi identificarea modelului econometric de regresie multifactorială


2.Estimări ale parametrilor în modelul econometric de regresie multifactorială
3.Ipoteze, teste şi validări ale modelului econometric de regresie multifactorială

1. Specificarea şi identificarea modelului econometric de regresie


multifactorială

Modelul multifactorial se defineşte prin următoarea relaţie:


y = f(x1; x2; ... xn) + ε
unde:
x = (x1; x2; ... xn) este variabila exogenă, independentă sau variabila cauză;
y este variabila endogenă, dependentă sau variabila efect;
u = (u1; u2; ... un) sau ε (ε1; ε2; ... εn) este variabila reziduală, aleatoare, perturbatoare sau
eroare.
f(x1; x2; ... xn) este funcţia de regresie cu ajutorul căreia vor fi estimate valorile variabilei
y.

Alegerea funcţiei de regresie multifactoriale se face prin utilizarea mai multor tipuri de
funcţii de regresie şi se decide care este modelul cel mai performant.

1
Principalele funcţii de regresie multifactoriale sunt de forma:
 funcţia liniară: yt = b0 + b1x1t + b2x2t + ...+ bkxkt
b1 b2 bk
 funcţia pătratică: y t =b 0⋅x 1t⋅x 2 t ¿… x kt ; se liniarizează funcţia folosind logaritmul:
logyt = logb0 + b1logx1t + b2 logx2t + ...+ bk logxkt
x1 x2 xk

 funcţia exponenţială: y t =b 0⋅b 1 t⋅b2 t ¿… bk t


; se liniarizează funcţia folosind
logaritmul: logyt = logb0 + x1tlog b1 + x2tlogb2+ ...+ xktlogbk

Analiza de regresie în cazul modelului multifactorial constă în estimarea


parametrilor modelului econometric, prin determinarea estimatorilor.
Acești estimatori trebuie calculați astfel încât diferența dintre valorile reale ale
variabilei dependente (yi) și valorile estimate cu ajutorul parametrilor calculați să fie cât
mai mică ( y i− yi =min ).

2. Estimări ale parametrilor în modelul econometric de regresie


multifactorială

Forma generală a unui model multifactorial se prezintă astfel:


yt = b0 + b1x1t + b2x2t + ...+ bkxkt + t

unde:

t = 1,n ; n este numărul de termeni ai seriei statistice

j = 1,k ; k este numărul de variabile exogene

Coeficienţii de regresie (b1, b2, …, bn) măsoară influenţa fiecăreia dintre cele n
caracteristici factoriale asupra rezultativei y.

2
Estimarea parametrilor modelului econometric de regresie liniară multifactorială
se realizează cu metoda celor mai mici pătrate

Conform principiului metodei celor mai mici patrate vom avea:


n n

∑ ( y t − y t ) =∑ ( y t −b0−b 1 x1 −b2 x 2 −⋯−bk x k )2 =min


2
t t t
t =1 t=1

în care yt reprezintă valorile estimate ale variabilei endogene corespunzatoare


nivelurilor variabilelor exogene x1t, x2t, ...xkt iar b0 ,b1 ,b2 ,⋯bk sunt estimatorii
parametrilor b0, b1, b2, ... bk
Se obține sistemul de ecuații:

{b0+b1x1+b2x12+. +bkx1k+u1=y1¿{b0+b1x21+b2x2+. +bkx2k+u2=y2¿{b0+b1x31+b2x32+. +bkx3k+u3=y3 {⋮¿ ¿


Estimația termenului liber b0 arată nivelul variabilei endogene atunci când toate
variabilele de influență (x1t, x2t, …, xkt) au valoarea zero.
Estimațiile parametrilor b1, b2, ... bk arată cu cât variază variabila endogenă atunci
când variabila exogenă corespunzătoare parametrului respectiv variază cu o unitate, în
condițiile în care toate celelalte variabile sunt constante.

Semnul și valoarea parametrului b1 sunt folosite pentru descrierea


interdependenței dintre variabila dependentă y și cea independentă x1.
 dacă parametrul b1 > 0, atunci legatura dintre variabila independentă x1 și variabila
dependentă y este directă (când variabila independentă x1 are o evoluție
crescătoare, crește și variabila dependentă y, iar când variabila independentă x1 are
evoluție descrescătoare, scade și variabila dependentă y). Când parametrul b1 este
pozitiv se pot distinge trei situații:

3
 dacă b1 < 1, atunci influența variabilei independente asupra celei
dependente este mai slabă (la variația cu o unitate a variabilei independente
x1, variabila dependentă y variază cu o valoare subunitară);
 dacă b1 > 1, atunci influența variabilei independente asupra celei
dependente este foarte puternica (la variația cu o unitate a variabilei
independente x1, variabila dependentă y variază cu o valoare supraunitară);
 dacă b1 = 1, atunci variabila dependentă y variază direct proportional cu
variația variabilei independentă x1.
 dacă b1 < 0, atunci legătura dintre variabila independentă x1 și variabila
dependentă y este inversă (când variabila independentă x1 evolueaza crescător,
variabila dependentă y are o evoluție descrescătoare, iar când variabila
independentă x1 evoluează descrescator, variabila dependentă y are o evoluție
crescătoare).
 dacă b1 = 0, variabila dependentă y este independentă în raport cu variabila
independentă x1.

Aceiași interpretare o avem și pentru ceilalți parametrii.

Analiza corelației în cazul modelului multifactorial liniar se realizează cu ajutorul


raportului de corelație multiplă, a coeficientului de determinație multiplă, precum și a
coeficienților de corelație.

3. Verificarea statistica a modelului multifactorial

În urma analizei de regresie și a analizei corelației a modelului multifactorial s-au


stabilit forma, sensul și intensitatea legăturii dintre variabilele exogene și variabila
endogenă. Modelul econometric rezultat este analizat cu un ansamblu de metode și teste
statistice care sunt numite generic verificarea statistică a modelului.

 Prima etapă de verificare a modelului econometric de regresie multifactorială constă


în calcularea și interpretarea erorilor standard generate de model.

4
Erorile standard reprezinta abateri ale valorilor estimate de la valorile reale și se
împart în:
 eroarea standard a modelului (S) este calculată ca abatere a valorilor estimate ale
variabilei endogene y t față de cele reale y și se determină cu relația:
t

∑ ( yt− yt)2
S ε=

unde k reprezintă numărul de variabile exogene
n−k −1

Cu cât valoarea erorii standard a modelului este mai mica în raport cu valorile
variabilei endogene, cu atât modelul aproximează mai corect realitatea economică
studiată. Interpretarea calității modelului în funcție de valoarea erorii standard a
modelului este destul de relativă.
 erorile standard ale parametrilor modelului multifactorial sunt abaterile valorilor
estimate ale parametrilor funcției de regresie de la valorile lor reale. Aceste erori
se determină pentru fiecare parametru din modelul de regresie

Cu cât valorile acestor erori ale parametrilor modelului econometric multifactorial


sunt mai mici în raport cu valorile absolute ale parametrilor pe care îi caracterizează, cu
atât valorile estimate ale parametrilor respectivi sunt mai apropiate de cele reale.

 A doua etapă de verificare a modelului econometric de regresie multifactorială


constă în verificarea ipotezei de normalitate a variabilei aleatoare .

Ipoteza de normalitate a variabilei aleatoare , se poate verifica cu ajutorul testului


2
χ.
Aplicarea testului statistic χ2 presupune parcurgerea următorilor pași:
Pasul 1. Se formulează ipoteza nulă H0, prin care se presupune că distribuția
variabilei aleatoare este normală;
x t −m
zt=
Pasul 2. Se calculează valorile standardizate zt: σ ;
Pasul 3. Se preia din tabelul Laplace valorile φ(zt)
Pasul 4. Se calculează valorile pt = φ(zt) - φ(zt-1)

5
2
( nt −n⋅pt )
χ 2c = ∑
Pasul 5. Se calculează valoarea n⋅pt

Pasul 6. Se compară valoarea calculată cu valoarea tabelară. Dacă valoarea calculată


este mai mică decât valoarea tabelară atunci se acceptă ipoteza de normalitate a
variabilei aleatoare iar modelul econometric este corect. În cazul în care valoarea
2
calculată a testului χ c este mai mare decât valoarea tabelară, atunci ipoteza de
normalitate a variabilei aleatoare se respinge și modelul nu este corect. În această a doua
situație sunt necesare corecții, fie în sensul suplimentării factorilor de influență, fie în
sensul creșterii volumului eșantionului de date pe care se face analiza.

 A treia etapă de verificare a modelului econometric de regresie multifactorială


constă în verificarea ipotezei de autocorelare a variabilei aleatoare .
Verificarea ipotezei de autocorelare a variabilei aleatoare se realizează cu ajutorul
testului Durbin –Watson. Acest test constă în parcurgerea următorilor pași:
Pasul 1. Se stabilește ipoteza nulă H0 conform căreia variabila aleatoare este
autocorelată;
Pasul 2. Se determină valoarea calculată a testului, d, după relația:
n
∑ ( ε t −ε t−1) 2
d c = t=2 n
∑ ε 2t
t =1

Pasul 3. Se determină din tabelele statistice aferente testului Durbin – Watson două
valori tabelare, una inferioară și alta superioară, notate dL și dU. Cele două valori se iau
din tabele în funcție de pragul de semnificație al testului (α = 0,05 sau 0,01), în funcție
de numărul de observații, n, precum și în raport de numărul de variabile exogene, k;
Pasul 4. Se compară valoarea calculată a testului statistic Durbin – Watson, dc, cu cele
două valori tabelare și pot rezulta trei situații:
 dacă dc < dL, înseamnă că ipoteza autocorelării variabilei aleatoare se acceptă. În
acest caz valorile variabilei aleatoare sunt dependente una față de cealaltă, deci datele
din eșantioane sunt dependente unele de altele și modelul trebuie corectat;
6
 dacă dL ≤ dc ≤ dU, testul este neconcludent și trebuie refăcut pe alte eșantioane de
date;
 dacă dc > dU, înseamnă că ipoteza autocorelării variabilei aleatoare se respinge deci
modelul econometric de regresie este corect din punct de vedere statistic. În acest caz
valorile variabilei aleatoare sunt independente între ele iar datele din eșantioane sunt
independente.

 A patra etapă de verificare a modelului econometric de regresie multifactorială


constă în verificarea efectului de multicoliniaritate între variabilele exogene.

Efectul de multicoliniaritate se stabilește parcurgând următorii pași:


Pasul 1. Se determină coeficientul de determinare (R2) al variabilei endogene de către
variabilele exogene
Pasul 2. Se calculează toleranța variabilei xt folosind formula: t = 1-Rt2
Valoare mică a toleranței (mai mică decât 0,1) determină un coeficient de
determinare mare, apropiat de 1, deci o legătură liniară puternică între xt şi restul
variabilelor exogene. Prin urmare xt este coliniară cu celelalte variabile exogene
1
FIV =
Pasul 3. Se calculează factorul de inflație a varianței cu ajutorul relației: τ .
Valoarea mare a acestui factor (mai mare decât 10) denotă coliniaritate

Eliminarea multicoliniarității se face prin renunțarea la una din cele două variabile
independente corelate. Se vor exclude din model acele variabile care au toleranțe mici
sau factori de inflație mari.

 A cincea etapă de verificare a modelului econometric de regresie multifactorială


constă în verificarea semnificației parametrilor.
Pași parcurși pentru a verifica semnificația parametrilor cu ajutorul testului
Student sunt următorii:
Pasul 1. Se stabilește ipoteza nulă H0 conform căreia estimatorii parametrilor nu diferă
semnificativ de zero.
Pasul 2. Se stabilește pragul de semnificație al testului, α;
7
Pasul 3. Se calculează valorile testului Student pentru fiecare estimator în parte, ca
raport între valoarea absolută a parametrului estimat și eroarea sa standard, conform
relațiilor:
|b k|
t kc=
Sb
k

Pasul 4. Se determină valoarea tabelară a variabilei standardizate (tα;υ) unde: υ = n – 1


grade de libertate
Pasul 5. Se compară valoarea tabelară cu valorile calculate și rezultă următoarele
situații:
 dacă valoarea calculată a testului t este mai mică decât valoarea tabelară (
b
t ck <t α :υ ), atunci ipoteza nulă H se acceptă și se poate spune că estimatorii nu
0
diferă semnificativ de zero. În acest caz, datele nu confirmă existența legăturii
între variabilele exogene și cea endogenă, fiind necesară fie alegerea altui factor
de influență, fie găsirea unei noi forme a legăturii;
 dacă valoarea calculată a testului t este mai mare sau egală cu valoarea tabelară (
b
t ck ≥t α : υ ), ipoteza nulă se respinge și se poate spune că estimatorii diferă
semnificativ de zero, iar modelul este corect din punct de vedere statistic.

 A șasea etapă de verificare a modelului econometric de regresie multifactorială


constă în verificarea capacității modelului de a reconstitui valorile empirice ale
variabilei endogene y prin intermediul valorilor estimate y t .
t

Această etapă presupune folosirea testului statistic Fisher care presupune parcurgerea
următorilor pași:
Pasul 1. Se stabilește ipoteza nulă, H0, conform căreia modelul este irelevant
Pasul 2. Se stabilește pragul de semnificație al testului, α
Pasul 3. Se determină valoarea calculată a testului F folosind relația:
2
s y/ x
1 , x2 , …
F c= 2

Pasul 4. Se alege valoarea tabelară (Fα;υ1;υ2) din tabelul repartiției Fisher – Snedecor în
funcție de pragul de semnificație α și de numărul de grade de libertate: υ1 = k – 1 și υ2 =
n – k; unde: k reprezintă numărul de variabile iar n numărul de observații.
8
Pasul 5. Se compară valoarea calculată Fc cu valoarea tabelară Fα;υ1;υ2 și rezultă
următoarele situații:
 dacă valoarea calculată a testului F este mai mică decât valoarea tabelară (
F c < F α ; υ ;υ
1 2 ), atunci ipoteza nulă H 0 se acceptă, ceea ce înseamnă că modelul

trebuie refăcut. Acest lucru constă fie în sensul alegerii altui factor de influență
(variabilă exogenă), fie în sensul alegerii unei alte funcții de regresie;
 dacă valoarea calculată a testului F este mai mare sau egală cu valoarea tabelară (
F c≥F α ; υ ; υ
1 2 ), ipoteza nulă H0 se respinge și se poate spune că variabila exogenă
are o influență semnificativă asupra variabilei endogene.

S-ar putea să vă placă și