Sunteți pe pagina 1din 32

Curs 11

MODELE DE REGRESIE PENTRU


DATE DE TIP PANEL
• Date de tip panel

• Regresia prin metoda celor mai mici pătrate

grupată (POLS – Pooled ordinary least squares)

• Modelul de regresie cu efecte fixe

• Modelul de regresie cu efecte aleatoare

• Testul Hausman

2
• Exista 3 tipuri de structuri de date:
• Serii de tip profil (transversale): i = 1, 2, …, N; T=1.
• Serii cronologice (serii de timp): N=1; t = 1, 2, …, T.
• Panel de date: i = 1, 2, …, N; t = 1, 2, …, T.

• Tipuri de structuri cu date de tip panel:


• Panel de date clasic (scurt sau micro): N > T
• Panel de date macro (lung): T > N
• Panel echilibrat: date disponibile pentru toate
perioadele si toti indivizii: nr de obs = N x T
• Panel dezechilibrat: lipsesc inregistrari (de regula
perioade diferite de timp pentru indivizi) - !! Eviews nu
poate citi date de tip panel dezechilibrat

3
Numărul Timp Variabila 1 Variabila 2
unităţii Xit Yit
1 1 X11 Y11
1 … X1t Y1t
1 T X1T Y1T
… 1 Xi1 Yi1
… … Xi2 Yi2
… T Xi3 Yi3
N 1 XN1 Y31
N … XNt YNt
N T XN3 YNT

4
5
6
7
 Datele de tip panel fac posibilă estimarea relaţiilor în
dinamică, chiar dacă datele sunt disponibile pentru o
perioadă scurtă de timp, prin creşterea numărului
observaţiilor (N x T)

 Încorporează dimensiunea timp pentru datele în secţiune


transversală şi dimensiunea spaţiu pentru serii temporale

 Eficienţă sporită a estimărilor modelelor de regresie prin


mărimea eşantionului

 Capacitatea de a controla efectele individuale fixe – ceea


ce este comun unui individ de-a lungul timpului, dar care
poate varia între indivizi

8
9
yit =  0 + 1 x1it +  2 x2it + uit
 Termenul eroare include întotdeauna toţi factorii neobservabili care determină
variabila rezultativă Y
 Termenul eroare într-un model de regresie pe date de tip panel are 3
componente:
yit =  0 + 1 x1it +  2 x2it +  i + t +  it

efect neobservat efect neobservat


efect neobservat
specific individului specific timpului specific individului
si timpului
 αi cuprinde impactul variabilelor neobservate constante în timp pentru un anumit
individ, dar care variază între indivizi: calitatea managementului (firma), sexul
(individ), calitatea instituţiilor (ţări)
 μt cuprinde impactul variabilelor neobservate care afectează în acelaşi fel toţi
indivizii într-o anumită perioadă de timp, însă variază în timp: modificări de
politică, rata de schimb, schimbarea valorilor în societate
 εit cuprinde impactul variabilelor neobservate care variază atât între indivizi cât şi
în timp: norocul, starea de bine, etc

10
uit =  i + t +  it

 Dacă se face o secţiune transversală (se observă N indivizi la un


moment de timp t, de exemplu t = 2019)

Y1 2019 =  0 + 1 X 11 2019 +  2 X 21 2019 + 1 +  2019 +  1 2019

Yi 2019 =  0 + 1 X 1i 2019 +  2 X 2i 2019 +  i +  2019 +  i 2019

YN 2019 =  0 + 1 X 1N 2019 +  2 X 2 N 2019 +  N +  2019 +  N 2019

11
 Observaţii repetate în diverse momente de timp
pentru acelaşi individ
Y1 2017 =  0 + 1 X 11 2017 +  2 X 21 2017 + 1 +  2017 +  1 2017
Y1 2018 =  0 + 1 X 11 2018 +  2 X 21 2018 + 1 +  2018 +  1 2018
Y1 2019 =  0 + 1 X 11 2019 +  2 X 21 2019 + 1 +  2019 +  1 2019

Y2 2017 =  0 + 1 X 12 2017 +  2 X 2 2 2017 +  2 +  2017 +  2 2017


Y2 2018 =  0 + 1 X 12 2018 +  2 X 2 2 2018 +  2 +  2018 +  2 2018
Y2 2019 =  0 + 1 X 12 2019 +  2 X 2 2 2019 +  2 +  2019 +  2 2019

………………………………………………………………….

12
 Una din ipotezele metodei celor mai mici pătrate este:
Cov(Xi, Ui)=0

 Se presupune că toate cele trei componente sunt


independente între ele şi cu variabila X

uit =  i + t +  it
 Descompunerea termenului eroare indică faptul că una
dintre presupunerile metodei celor mai mici pătrate nu va
fi respectată: "Două observaţii ale aceluiaşi individ vor fi
mai asemănătoare comparativ cu două observaţii
provenind de la doi indivizi diferiţi"
Cov ( X i i )  0

13
 Este cea mai simplă abordare
 Combină într-o singură mulţime ambele dimensiuni
 Renunţă la structura temporală şi transversală

 Se estimează parametrii ecuaţiei de regresie liniară

yit =  0 + 1 x1it +  2 x2it + ... +  p x pit + uit

unde i este individul iar t este timpul

14
 Metoda celor mai mici pătrate grupată va furniza estimatori ai
parametrilor constanţi fără diferenţiere între indivizi şi timp
 Din cauza componentei efectului neobservat specific indivizilor
una din ipotezele pe care se bazează metoda celor mai mici
pătrate poate fi nerespectată:
◦ Presupunerea că fiecare eroare în fiecare perioadă de timp, pentru fiecare
persoană este necorelată cu variabilele şi efectele pentru fiecare persoană şi
de-a lungul timpului, poate să nu fie respectată

 Structura de tip panel are dimensiunea timp, deci corelaţia


dintre erori succesive poate să conducă la violarea ipotezei
privind non autocorelarea erorilor
◦ Estimatorii obţinuţi nu vor fi deplasaţi însă vor fi neeficienţi (informaţia cu
privire la autocorelarea erorilor poate fi folosită pentru obţinerea de
estimatori mai buni)

15
 Permit diferenţierea comportamentului între indivizi
şi în perioade diferite de timp sub forma:

◦ Efectelor fixe (Fixed effects): atunci când există


corelaţie între X şi αi

◦ Efectelor aleatoare (Random effects): atunci


când corelaţia între X şi α i este zero

16
y it = x it  + u it şi u it =  i +  it pentru i = 1,..., N ; t = 1,..., T

( )
E  i  it = 0

( )
E xit i  0  fixed effects model

17
 Modelul pentru o singură observaţie:
y it =  i + x it  +  it i = 1,..., N ; t = 1,..., T
 Modelul pentru individul i:

 y i1   1   x i11 x iK1    1    i1 
       

  =   i + 

   +   resp. y i = T  i + X i  +  i
 y iT  1  1 K     
     x iT x iT    K    iT 

 Modelul pentru toate observatiile

 y1   T 0
  0 
0  1   X 1 
   
 1 
 
y = DN  + X  + 
0  2  +  X 2   + 2 
 y2  =  T

          ( NT 1) ( NT  N ) ( N 1) ( NT  K ) ( K 1) ( NT 1)


         
 yN   0 0  T  
   
N  X N   N  Variabilă dummy pentru individul i

18
 Estimarea folosind metoda celor mai mici pătrate cu variabile dummy:
 Estimatorul lui ß este BLUE (atâta timp cât  este zgomot alb)

 Dar:
➔ calcule complexe dacă N este mare
➔ dimensiunea mare a vectorului coeficienţilor poate conduce la estimări imprecise
➔ pierdere mare a gradelor de libertate
➔ de multe ori nu suntem interesaţi de toţi parametrii i dacă N este mare!

 Scop: Eliminarea efectului individual, adică


➔ Transformarea prin diferente de ordinul I
➔ Transformarea in interiorul perioadelor de timp (toate observatiile se masoara in deviatie
fata de media in timp a fiecarui individ)

19
 Transformarea în interiorul perioadelor de timp:

y it − y i. = ( x it − x i . )  + ( it −  i . ) i = 1,..., N ; t = 1,..., T


T
unde y i. = t =1
y it / T

Modelul transformat: y it = x it  +  it , where y it = y it − y i . etc.

Observăm că parametrii α nu mai apar în ecuaţie → aceştia sunt


consideraţi neimportanţi şi nu vor mai fi estimaţi

Prin aplicarea metodei celor mai mici pătrate clasică ecuaţiei


transformate va rezulta estimatorul obţinut prin metoda celor mai mici
pătrate cu variabile dummy numit Within Estimator:

( )
−1
ˆW = X X X y = ˆLSDV

20
 Estimatorul modelului cu efecte fixe pentru :
▪ nedeplasat
▪ consistent în toate cele trei cazuri (N mare & T
fix, T mare & N fix, N & T mari)
▪ eficient
▪ asimptotic normal distribuit

21
 Estimarea termenilor liberi individuali:

ˆ i ,W = y i − x i ˆW
 Dacă modelul iniţial include o constantă , atunci este estimat efectul
compus i+  (interpretare diferită a lui i ).
 Nu este posibilă identificarea efectelor individuale decât în cazul în
care se face o presupunere suplimentară, adică:

 i = 0
N
i =1

 Estimatorii pentru i :
 nu sunt consistenţi pentru N mare:
 numarul parametrilor creste odata cu cresterea lui N

22
(*) y it =  + x it  + u it , i = 1,..., N ; t = 1,..., T şi u it =  i +  it

Ipotezele privind termenul eroare  zgomot alb (ca în regresia


liniară):
- media zero a erorilor
- dispersia erorilor constantă
- non-autocorelarea erorilor

Ipotezele privind efectele individuale i: distribuţia constantă de-a


lungul lui i
- media zero a erorilor
- dispersia erorilor constantă
- non-autocorelarea erorilor
Ipoteză: Nu există corelaţie între efectul individual şi termenul eroare :
( )
E  i  it = 0
Ipoteză: Nu există corelaţie între efectul individual şi variabilele explicative:

( )
E xit i = 0  random effects model
23
 Cum poate fi implementat estimatorul modelului cu efecte
aleatoare?
 Estimator RE (Random Effects)
 Se face următoarea transformare pentru fiecare observaţie:

y it −  y i = (1 −  )  + ( x it −  x i )  + (u it −  ui ),
i = 1,..., N ; t = 1,..., T

Unde

 = 1−
 2 + T 2
(σε2 este dispersia lui ε şi σα2 este dispersia lui α)

24
 Estimarea ecuaţiei transformate se va face cu metoda
celor mai mici pătrate. Acesta este estimatorul
obţinut prin metoda celor mai mici pătrate
generalizată şi se numeşte estimator RE (Random
Effects).

Estimatorul RE:
➔ este consistent

➔ este eficient dacă modelul pentru componentele


erorilor este adevărat

25
 Estimatorul BE
y it =  + x it  +  i +  it i = 1,..., N ; t = 1,..., T
 Putem scrie
y i =  + x i.  +  i +  i. i = 1,..., N (Transformarea dintre perioadele de timp)

 Se calculează estimatorul prin metoda celor mai mici pătrate


pentru acest model transformat, numit estimator BE (Between
Estimator)

 Estimatorul BE:
• Este consistent, dacă efectele individuale şi X sunt necorelate

• Nu este eficient (ţine cont doar de variaţia dintre indivizi)

26
 Estimatorul RE este o sumă ponderată a estimatorilor Within şi
Between:
ˆRE = ( X M D X + X PD X ) X M D X ˆFE + ( X M D X + X PD X ) X PD X ˆBE
−1 −1

 2
 = (1 −  )
2
=
T   2 +  2
 Cazuri speciale
 2 = 0   = 1  OLS
T →    → 0  Within estimator
 2 = 0   = 0  Within estimator
 →  Between estimator

27
 Modelul clasic de regresie liniara
Var ( yˆ ) Var ( y) − Var (uˆ ) yˆ yˆ uˆuˆ
y = X  + u = X ˆ + uˆ = yˆ + uˆ R 2 = corr ( yˆ , y)2 = = = = 1−
Var ( y) Var ( y) yy yy

 Alte modele
1. Modelul initial general y it =  + x it  +  i +  it yˆ it = ˆ + x it ˆ
2. Modelul transformat Between y i =  + x i.  +  i +  i . yˆ i = ˆ + x i. ˆ
3. Modelul transformat Within y it − y i. = ( x it − x i. )  + ( it −  i. ) yˆ = yˆ it − yˆ i. = ( x it − x i. ) ˆ

4. Modelul transofrmat RE y it −  y i. = ( x it −  x i. )  + (u it −  ui. )

28
 Exista efecte fixe invididuale? => Testul F

 H0: nu există efecte fixe individuale (= modelul grupat)


1 =  2 = =N =
 H1: există efecte fixe individuale
 Testul statistic
FT =
( RSS0 − RSS1 ) / ( N − 1)
RSS1 / ( NT − N − K )

 Regula de decizie: se respinge ipoteza nula (şi deci modelul


grupat) dacă FT este mai mare decât valoarea critică (adică dacă
p-value < un nivel de semnificaţie dat , în general 0.05).

29
 Dacă se respinge modelul grupat: Se foloseşte
modelul cu efecte fixe sau aleatoare?
◦ Testul Hausman
◦ Se testează dacă efectele individuale aleatoare sunt
corelate cu variabilele explicative (FE) sau nu (RE)

 Ideea generala a testului Hausman


- Compară un estimator care este consistent
şi eficient sub ipoteza nulă şi inconsistent în
ipoteza alternativă cu un estimator care este
consistent în ambele alternative

30
Ipotezele in cazul testului Hausman:
 Ho: nu exista corelatie, FE consistent, RE consistent
si eficient
( )
E xit i = 0

 H1: exista corelatie, FE consistent, RE inconsistent

( )
E xit i  0

31
 Testul statistic:
( )

( ) sub ipoteza H0 este χ2k unde k este
a
HW = ˆRE − ˆFE (  RE −  FE ) ˆRE − ˆFE numărul( de coloane în X
 K = number of columns in X )
−1 2

Regula de decizie
- Se respinge ipoteza nulă dacă HW este
mai mare decât valoarea critică (sau dacă p-
value < valoarea dată a nivelului de
semnificaţie , în general 0.05).

32

S-ar putea să vă placă și