Sunteți pe pagina 1din 28

Econometrie cursul 3

Modelul clasic de regresie


Modelul de regresie liniară unifactorială

CSIE, anul II, 2021-2022,


specializarea Statistică și previziune economică

Această prezentare urmărește, în principal,


• Teorie și practică econometrică, V. Voineagu, E. Țițan, R. Șerban, S. Ghiță,
D. Todose, C. Boboc, D. Pele, Ed. Meteor Press, 2007.
• Basic Econometrics, ed. a 5-a, D. Gujarati, D. Porter, McGraw-Hill, 2009.
• Introductory Econometrics: A Modern Approach, ed a 5-a, J. Wooldridge,
South-Western Cengage Learning, 2013.
1
Ipotezele modelului clasic de regresie liniară

2
Etapele modelării econometrice
1. Specificarea modelului
- precizarea variabilei dependente (explicative sau endogene) Y
şi a variabilei independente (explicative sau exogene) X
Y=f(X)+ε
2. Identificarea modelului
- alegerea unei funcţii care descrie valorile variabilei dependente în funcţie de variaţia
variabilei explicative;
- se realizează cu ajutorul procedeului grafic (a diagramei de împrăștiere sau scatter
plot) sau a calculelor algebrice (analiza de varianţă sau analiza dispersionala), având
la dispoziție o serie de date bivariate {(xi,yi), i=1,…,n} provenind dintr-un eșantion de
volum n;
- în cazul în care diagrama de împrăștiere sugerează existența unei dependențe liniare
între cele două variabile, atunci funcția ce dă legătura dintre ele este f(x)=β0+β1x
- modelul matematic este Y  f  X   Y  0  1 X
- modelul econometric este Y  f  X     Y  0  1 X  
cunoscut ca modelul de regresie liniară unifactorială
sau modelul de regresie liniară simplă

3
Etapele modelării econometrice
 Modelul de regresie liniară observat (în eșantion) este:

yi  ˆ0  ˆ1 xi  ˆi , i  1, n

 cu componenta predictibilă: yˆi  ˆ0  ˆ1 xi , i  1, n ,


care se mai numeste și valoarea ajustată sau estimată a mediei condiționate
a variabilei dependente, M Y X  xi  , pe baza modelului de regresie;

 ˆ0 este estimatorul parametrului “intercept” 0;

 ˆ1 este estimatorul parametrului “pantă” 1;

 ˆi este valoarea reziduală (pentru unitatea statistica i) în eşantion:

ˆi  yi  yˆi  yi  ( ˆ0  ˆ1xi ), i  1, n


4
Etapele modelării econometrice
3. Estimarea parametrilor modelului
- metoda minimizării sumei pătratelor reziduurilor (MCMMP) pentru
estimarea parametrilor 0 şi 1 pe baza datelor observate presupune
n n n
min  ˆi2  min
ˆ0 , ˆ1 i 1

  yi  yˆi 
ˆ , ˆ
2
 min  i 0 1i
( y  ˆ  ˆ x )2

i 1 0 1 i 1

adică determinarea punctului de minim ( ˆ0 , ˆ1 ) al funcției


n
1 
S ( ˆ , ˆ )  ( y  ˆ  ˆ x )2
0 i 0 1 i
i 1 n
- se obține n  x  x  y  y
 x  x  y  y
i i
i 1
i i
n 1 sxy
ˆ1  i 1
n
 n
 2 și ˆ0  y  ˆ1 x
 x  x   x  x 
2 2 s x
i i
i 1 i 1
n 1
5
Etapele modelării econometrice
unde:
n

x
n
i y i
 x i 1
, y i 1
sunt mediile de selecție ale variabilelor X, respectiv Y;
n n
n n

 xi  x 
2

 iy  y 2

 s x2  i 1 , s y2  i 1 sunt dispersiile de selecție ale variabilelor X și Y;


n 1 n 1

 s x  s x2 , s y  s y2 sunt abaterile standard de selecție ale lui X, respectiv Y;


n

 x  x  y  y 
i i
 s xy  i 1
 covx, y  este covarianța de selecție a variabilelor X și Y.
n 1

6
Etapele modelării econometrice –
coeficientul de corelație liniară de selecție
- În cazul legăturii simple liniare, o măsură relativă a dependenţei
liniare dintre două variabile este coeficientul de corelaţie liniară
Pearson (semnul arată direcţia legăturii, iar valoarea intensitatea
legăturii).
- Coeficientul de corelație liniară de selecție al variabilelor X și Y este:
n

 ( x  x )( y  y ) n

 x  x  y  y 
i i
i 1
i i
sxy n 1   1;1
cov( x, y )
rx , y     i 1

s  s
2 2 sx  s y n n n n
x y
(x  x) i
2
y  yi
2
 x  x 
i
2
 y  y
i
2

i 1
 i 1 i 1 i 1
n 1 n 1
și reprezintă un estimator (o estimație) al coeficientului de corelație
liniară   X , Y  al variabilelor X și Y de la nivelul populației statistice,
rx , y  ˆ  X , Y  .
7
Etapele modelării econometrice –
coeficientul de corelație liniară de selecție
- Între coeficientul de corelaţie liniară de selecție
(Pearson) rx,y și estimația pantei ˆ1 a dreptei de
regresie există următoarea relație:

ˆ sxy sxy s y ˆ sy
1  2    1  rx , y 
sx sx  s y sx sx

ˆ sx
și rx , y  1  ,
sy
astfel că rx,y și ˆ1 au același semn deoarece
abaterile standard sunt strict pozitive, sx>0 și sy>0.

8
Relația între pantă și coeficientul de corelație liniară,
considerând o relație liniară între variabillele X și Y

9
Etapele modelării econometric
Evaluarea validității modelului de regresie

4. Evaluarea validităţii modelului


- se verifică dacă variaţia lui X este un bun predictor pentru variaţia lui Y ;
- presupune:

a) Testarea validităţii modelului de regresie folosind analiza dispersională


(ANOVA – Analysis of Variance);
b) Determinarea raportului de corelație și a coeficientului de determinație;
c) Inferenţa statistică pentru parametrii modelului de regresie:
c.1) Testarea semnificației statistice a parametrilor;
c.2) Intervale de încredere ale parametrilor;
d) Verificarea ipotezelor modelului de regresie.

10
Etapele modelării econometrice
Evaluarea validității modelului de regresie
- testarea validității modelului cu ANOVA

4. a) Testarea validităţii modelului de regresie folosind analiza


dispersională (ANOVA)
- la nivelul eșantionului, valorii yi a variabilei dependente Y îi asociem două medii:
media “totală” de selecție, adică ( y ) și

media condiţionată de selectie ( ).

- abaterea individuală ( yi  y ) a valorii observate yi față de media de selecție y


poate fi descompusă astfel:

yi  y

 
yi  yˆi 
 
 
yˆi  y 
 
abaterea individuală abaterea neexplicat ă abaterea explicată
de modelul de regresie de modelul de regresie

11
Etapele modelării econometrice
Evaluarea validității modelului de regresie
- testarea validității modelului cu ANOVA

- abaterea ( yi  ŷi ) nu poate fi explicată de dreapta de regresie, deoarece


atunci când xi se modifică, ambele valori yi şi ŷi se modifică;
- abaterea ( yˆ i  y) poate fi explicată, deoarece când xi se schimbă,
y rămâne constant.

12
Etapele modelării econometrice
Evaluarea validității modelului de regresie
- testarea validității modelului cu ANOVA
n n n
Se poate demonstra că:  i
( y
i 1
 y ) 2
 i i  i
( y 
i 1
ˆ
y )  ( ˆ
2
y  y )
i 1
2
,

relație care se numește Identitatea fundamentală a analizei dispersionale


(pentru un model de regresie)

Vom nota:
n
 SST   ( yi  y )2
i 1
SST = Total Sum of Squares
= variaţia totală a variabilei dependente Y la nivelul eșantionului,
adică suma pătratelor abaterilor individuale ale valorilor observate yi
față de media de selecție y ; n
 ( yi  y )2 SST
2 i 1
SST are n-1 grade de libertate, astfel că s y  
n 1 n 1
reprezintă dispersia de selecție a variabilei Y (corectată cu gradele de libertate).

13
Etapele modelării econometrice
Evaluarea validității modelului de regresie
- testarea validității modelului cu ANOVA
n n
 SSR   ( yi  yˆ i )  ˆi2
2

i 1 i 1
SSR = Residual Sum of Squares
= variaţia neexplicată (reziduală) a variabilei dependente Y,
adică suma pătratelor reziduurilor;
SSR are n-(k+1)=n-k-1 grade de libertate,
unde k este numărul de variabile explicative din modelul de regresie liniară,
iar k+1 este numărul de parametri ce se estimează pe baza selecției de volum n;
astfel
SSR
MSR   ˆ2 reprezintă dispersia reziduală de selecție
n  k 1 (corectată cu gradele de libertate)
sau estimatorul nedeplasat al dispersiei   termenului eroare
2

(componenta eroare din modelul de regresie).

14
Etapele modelării ,econometrice
Evaluarea validității modelului de regresie
- testarea validității modelului cu ANOVA
n

SSE   ( yˆ i  y ) 2
i 1
SSE = Explained Sum of Squares
= variaţia variabilei dependente Y explicată de modelul de regresie,
adică suma pătratelor abaterilor valorilor ajustate ŷ
i
prin modelul de regresie estimat, față de media de selecție y .
SSE are (k+1)-1 = k grade de libertate;
SSE
astfel că dispersia corectată corespunzătoare este MSE  .
k
Observații:
1) SST = SSE + SSR
Variaţia totală (SST) a variabilei dependente Y, la nivelul eșantionului, poate fi descompusă
ca o sumă între variația explicată de modelul de regresie (SSE)
și variația reziduală (SSR) (neexplicată de modelul de regresie).

2) SST SSE
 
SSR , adică s 2y  MSE  MSR .
n 1 k n  k 1
15
Etapele modelării econometrice
Evaluarea validității modelului de regresie
- testarea validității modelului cu ANOVA

SSE
MSE k
F  ~ Fisher( k ,n  k 1) , sub H 0
MSR SSR
n  k 1

Fcritic  F ;k ,nk 1

16
Etapele modelării econometrice
Evaluarea validității modelului de regresie
- testarea validității modelului cu ANOVA

 Regiunea critică a testului este Rc : F  F ;k ,nk 1


 Regula de decizie: dacă Fcalc  F ;k ,nk 1 ,
atunci respingem H0 la nivelul de semnificație α
și concluzionîm că datele de selecție
sunt în favoarea ipotezei alternative H1,
adică modelul de regresie este valid statistic.

17
Etapele modelării econometrice
Evaluarea validitatii modelului de regresie
- testarea validitatii modelului cu ANOVA

18
Etapele modelării econometrice
Evaluarea validității modelului de regresie
- testarea validității modelului cu ANOVA

19
Etapele modelării econometrice
Evaluarea validității modelului de regresie
- testarea validității modelului cu ANOVA

20
Etapele modelării econometrice
Evaluarea validitatii modelului de regresie
- testarea validitatii modelului cu ANOVA

se mai numește și Standard Error of regression 21


Etapele modelării econometrice
Evaluarea validității modelului de regresie
- testarea semnificației raportului de corelație

b) Determinarea raportului de corelaţie și a coeficientului de determinație

Raportul de corelaţie este un indicator relativ utilizat pentru:


- măsurarea intensităţii legăturii dintre variabila explicată și
variabila/variabilele explicative dintr-un model de regresie;

Raportul de corelaţie se calculează ca:

n n
  yˆi  y 
2
SSE
  yi  yˆi 2 SSR
R  i n1  sau R  1  i n1  1
SST SST

 iy  y 2

 iy  y 2

i 1 i 1
Raportul de corelaţie ia valori cuprinse între 0 (când linia de regresie este situată pe nivelul
mediu, deci nu există legătură între variabile) şi 1 (când valorile observate se situează exact pe
linia de regresie, deci legătura este perfectă).

22
Etapele modelării econometrice
Evaluarea validității modelului de regresie
- coeficientul de determinație

 Pătratul raportului de corelaţie este coeficientul de


determinaţie (R2), care, exprimat procentual, arată
proporţia din variaţia totală a variabilei dependente
explicată de variaţia variabilei independente.

, R2  0;1
2 SSE SSR
R   1
SST SST

23
Etapele modelării econometrice
Evaluarea validității modelului de regresie
- coeficientul de determinație
- coeficientul de determinație ajustat

24
Etapele modelării econometrice
Evaluarea validității modelului de regresie
- legatura intre raportul de corelație, coeficientul de determinație și
coeficientul de corelație liniară Pearson

25
Etapele modelării econometrice
Evaluarea validității modelului de regresie
- testarea semnificației coeficientului de corelație liniară Pearson 

26
Etapele modelării econometrice
Evaluarea validității modelului de regresie
- testarea semnificației coeficientului de corelație liniară Pearson 

27
Etapele modelării econometrice
Evaluarea validității modelului de regresie
- testarea semnificației coeficientului de corelație liniară Pearson 

28

S-ar putea să vă placă și