CURS 11

Curs 11
MODELE DE REGRESIE PENTRU

DATE DE TIP PANEL
• Date de tip panel
• Regresia prin metoda celor mai mici pătrate
grupată (POLS – Pooled ordinary least squares)
• Modelul de regresie cu efecte fixe
• Modelul de regresie cu efecte aleatoare
• Testul Hausman
2
• Exista 3 tipuri de structuri de date:
• Serii de tip profil (transversale): i = 1, 2, …, N; T=1.
• Serii cronologice (serii de timp): N=1; t = 1, 2, …, T.
• Panel de date: i = 1, 2, …, N; t = 1, 2, …, T.
• Tipuri de structuri cu date de tip panel:

• Panel de date clasic (scurt sau micro): N > T
• Panel de date macro (lung): T > N
• Panel echilibrat: date disponibile pentru toate
perioadele si toti indivizii: nr de obs = N x T
• Panel dezechilibrat: lipsesc inregistrari (de regula
perioade diferite de timp pentru indivizi) - !! Eviews nu
poate citi date de tip panel dezechilibrat
3
Numărul Timp Variabila 1 Variabila 2
unităţii Xit Yit
1 1 X11 Y11
1 … X1t Y1t
1 T X1T Y1T
… 1 Xi1 Yi1
… … Xi2 Yi2
… T Xi3 Yi3
N 1 XN1 Y31
N … XNt YNt
N T XN3 YNT
4
5
6
7
 Datele de tip panel fac posibilă estimarea relaţiilor în
dinamică, chiar dacă datele sunt disponibile pentru o
perioadă scurtă de timp, prin creşterea numărului
observaţiilor (N x T)
 Încorporează dimensiunea timp pentru datele în secţiune

transversală şi dimensiunea spaţiu pentru serii temporale
 Eficienţă sporită a estimărilor modelelor de regresie prin

mărimea eşantionului
 Capacitatea de a controla efectele individuale fixe – ceea

ce este comun unui individ de-a lungul timpului, dar care
poate varia între indivizi
8
9
yit =  0 + 1 x1it +  2 x2it + uit
 Termenul eroare include întotdeauna toţi factorii neobservabili care determină
variabila rezultativă Y
 Termenul eroare într-un model de regresie pe date de tip panel are 3
componente:
yit =  0 + 1 x1it +  2 x2it +  i + t +  it
efect neobservat efect neobservat

efect neobservat
specific individului specific timpului specific individului
si timpului
 αi cuprinde impactul variabilelor neobservate constante în timp pentru un anumit
individ, dar care variază între indivizi: calitatea managementului (firma), sexul
(individ), calitatea instituţiilor (ţări)
 μt cuprinde impactul variabilelor neobservate care afectează în acelaşi fel toţi
indivizii într-o anumită perioadă de timp, însă variază în timp: modificări de
politică, rata de schimb, schimbarea valorilor în societate
 εit cuprinde impactul variabilelor neobservate care variază atât între indivizi cât şi
în timp: norocul, starea de bine, etc
10
uit =  i + t +  it
 Dacă se face o secţiune transversală (se observă N indivizi la un

moment de timp t, de exemplu t = 2019)
Y1 2019 =  0 + 1 X 11 2019 +  2 X 21 2019 + 1 +  2019 +  1 2019
Yi 2019 =  0 + 1 X 1i 2019 +  2 X 2i 2019 +  i +  2019 +  i 2019
YN 2019 =  0 + 1 X 1N 2019 +  2 X 2 N 2019 +  N +  2019 +  N 2019
11
 Observaţii repetate în diverse momente de timp
pentru acelaşi individ
Y1 2017 =  0 + 1 X 11 2017 +  2 X 21 2017 + 1 +  2017 +  1 2017
Y1 2018 =  0 + 1 X 11 2018 +  2 X 21 2018 + 1 +  2018 +  1 2018
Y1 2019 =  0 + 1 X 11 2019 +  2 X 21 2019 + 1 +  2019 +  1 2019
Y2 2017 =  0 + 1 X 12 2017 +  2 X 2 2 2017 +  2 +  2017 +  2 2017

Y2 2018 =  0 + 1 X 12 2018 +  2 X 2 2 2018 +  2 +  2018 +  2 2018
Y2 2019 =  0 + 1 X 12 2019 +  2 X 2 2 2019 +  2 +  2019 +  2 2019
………………………………………………………………….
12
 Una din ipotezele metodei celor mai mici pătrate este:
Cov(Xi, Ui)=0
 Se presupune că toate cele trei componente sunt

independente între ele şi cu variabila X
uit =  i + t +  it
 Descompunerea termenului eroare indică faptul că una
dintre presupunerile metodei celor mai mici pătrate nu va
fi respectată: "Două observaţii ale aceluiaşi individ vor fi
mai asemănătoare comparativ cu două observaţii
provenind de la doi indivizi diferiţi"
Cov ( X i i )  0
13
 Este cea mai simplă abordare
 Combină într-o singură mulţime ambele dimensiuni
 Renunţă la structura temporală şi transversală
 Se estimează parametrii ecuaţiei de regresie liniară
yit =  0 + 1 x1it +  2 x2it + ... +  p x pit + uit
unde i este individul iar t este timpul
14
 Metoda celor mai mici pătrate grupată va furniza estimatori ai
parametrilor constanţi fără diferenţiere între indivizi şi timp
 Din cauza componentei efectului neobservat specific indivizilor
una din ipotezele pe care se bazează metoda celor mai mici
pătrate poate fi nerespectată:
◦ Presupunerea că fiecare eroare în fiecare perioadă de timp, pentru fiecare
persoană este necorelată cu variabilele şi efectele pentru fiecare persoană şi
de-a lungul timpului, poate să nu fie respectată
 Structura de tip panel are dimensiunea timp, deci corelaţia

dintre erori succesive poate să conducă la violarea ipotezei
privind non autocorelarea erorilor
◦ Estimatorii obţinuţi nu vor fi deplasaţi însă vor fi neeficienţi (informaţia cu
privire la autocorelarea erorilor poate fi folosită pentru obţinerea de
estimatori mai buni)
15
 Permit diferenţierea comportamentului între indivizi
şi în perioade diferite de timp sub forma:
◦ Efectelor fixe (Fixed effects): atunci când există

corelaţie între X şi αi
◦ Efectelor aleatoare (Random effects): atunci

când corelaţia între X şi α i este zero
16
y it = x it  + u it şi u it =  i +  it pentru i = 1,..., N ; t = 1,..., T
( )
E  i  it = 0
( )
E xit i  0  fixed effects model
17
 Modelul pentru o singură observaţie:
y it =  i + x it  +  it i = 1,..., N ; t = 1,..., T
 Modelul pentru individul i:
 y i1   1   x i11 x iK1    1    i1 
       

  =   i + 

   +   resp. y i = T  i + X i  +  i
 y iT  1  1 K     
     x iT x iT    K    iT 
 Modelul pentru toate observatiile
 y1   T 0
  0 
0  1   X 1 
   
 1 
 
y = DN  + X  + 
0  2  +  X 2   + 2 
 y2  =  T
          ( NT 1) ( NT  N ) ( N 1) ( NT  K ) ( K 1) ( NT 1)

         
 yN   0 0  T  
   
N  X N   N  Variabilă dummy pentru individul i
18
 Estimarea folosind metoda celor mai mici pătrate cu variabile dummy:
 Estimatorul lui ß este BLUE (atâta timp cât  este zgomot alb)
 Dar:
➔ calcule complexe dacă N este mare
➔ dimensiunea mare a vectorului coeficienţilor poate conduce la estimări imprecise
➔ pierdere mare a gradelor de libertate
➔ de multe ori nu suntem interesaţi de toţi parametrii i dacă N este mare!
 Scop: Eliminarea efectului individual, adică

➔ Transformarea prin diferente de ordinul I
➔ Transformarea in interiorul perioadelor de timp (toate observatiile se masoara in deviatie
fata de media in timp a fiecarui individ)
19
 Transformarea în interiorul perioadelor de timp:
y it − y i. = ( x it − x i . )  + ( it −  i . ) i = 1,..., N ; t = 1,..., T

T
unde y i. = t =1
y it / T
Modelul transformat: y it = x it  +  it , where y it = y it − y i . etc.
Observăm că parametrii α nu mai apar în ecuaţie → aceştia sunt

consideraţi neimportanţi şi nu vor mai fi estimaţi
Prin aplicarea metodei celor mai mici pătrate clasică ecuaţiei

transformate va rezulta estimatorul obţinut prin metoda celor mai mici
pătrate cu variabile dummy numit Within Estimator:
( )
−1
ˆW = X X X y = ˆLSDV
20
 Estimatorul modelului cu efecte fixe pentru :
▪ nedeplasat
▪ consistent în toate cele trei cazuri (N mare & T
fix, T mare & N fix, N & T mari)
▪ eficient
▪ asimptotic normal distribuit
21
 Estimarea termenilor liberi individuali:
ˆ i ,W = y i − x i ˆW
 Dacă modelul iniţial include o constantă , atunci este estimat efectul
compus i+  (interpretare diferită a lui i ).
 Nu este posibilă identificarea efectelor individuale decât în cazul în
care se face o presupunere suplimentară, adică:
 i = 0
N
i =1
 Estimatorii pentru i :
 nu sunt consistenţi pentru N mare:
 numarul parametrilor creste odata cu cresterea lui N
22
(*) y it =  + x it  + u it , i = 1,..., N ; t = 1,..., T şi u it =  i +  it
Ipotezele privind termenul eroare  zgomot alb (ca în regresia

liniară):
- media zero a erorilor
- dispersia erorilor constantă
- non-autocorelarea erorilor
Ipotezele privind efectele individuale i: distribuţia constantă de-a

lungul lui i
- media zero a erorilor
- dispersia erorilor constantă
- non-autocorelarea erorilor
Ipoteză: Nu există corelaţie între efectul individual şi termenul eroare :
( )
E  i  it = 0
Ipoteză: Nu există corelaţie între efectul individual şi variabilele explicative:
( )
E xit i = 0  random effects model
23
 Cum poate fi implementat estimatorul modelului cu efecte
aleatoare?
 Estimator RE (Random Effects)
 Se face următoarea transformare pentru fiecare observaţie:
y it −  y i = (1 −  )  + ( x it −  x i )  + (u it −  ui ),
i = 1,..., N ; t = 1,..., T
Unde

 = 1−
 2 + T 2
(σε2 este dispersia lui ε şi σα2 este dispersia lui α)
24
 Estimarea ecuaţiei transformate se va face cu metoda
celor mai mici pătrate. Acesta este estimatorul
obţinut prin metoda celor mai mici pătrate
generalizată şi se numeşte estimator RE (Random
Effects).
Estimatorul RE:
➔ este consistent
➔ este eficient dacă modelul pentru componentele

erorilor este adevărat
25
 Estimatorul BE
y it =  + x it  +  i +  it i = 1,..., N ; t = 1,..., T
 Putem scrie
y i =  + x i.  +  i +  i. i = 1,..., N (Transformarea dintre perioadele de timp)
 Se calculează estimatorul prin metoda celor mai mici pătrate

pentru acest model transformat, numit estimator BE (Between
Estimator)
 Estimatorul BE:
• Este consistent, dacă efectele individuale şi X sunt necorelate
• Nu este eficient (ţine cont doar de variaţia dintre indivizi)
26
 Estimatorul RE este o sumă ponderată a estimatorilor Within şi
Between:
ˆRE = ( X M D X + X PD X ) X M D X ˆFE + ( X M D X + X PD X ) X PD X ˆBE
−1 −1
 2
 = (1 −  )
2
=
T   2 +  2
 Cazuri speciale
 2 = 0   = 1  OLS
T →    → 0  Within estimator
 2 = 0   = 0  Within estimator
 →  Between estimator
27
 Modelul clasic de regresie liniara
Var ( yˆ ) Var ( y) − Var (uˆ ) yˆ yˆ uˆuˆ
y = X  + u = X ˆ + uˆ = yˆ + uˆ R 2 = corr ( yˆ , y)2 = = = = 1−
Var ( y) Var ( y) yy yy
 Alte modele
1. Modelul initial general y it =  + x it  +  i +  it yˆ it = ˆ + x it ˆ
2. Modelul transformat Between y i =  + x i.  +  i +  i . yˆ i = ˆ + x i. ˆ
3. Modelul transformat Within y it − y i. = ( x it − x i. )  + ( it −  i. ) yˆ = yˆ it − yˆ i. = ( x it − x i. ) ˆ
4. Modelul transofrmat RE y it −  y i. = ( x it −  x i. )  + (u it −  ui. )
28
 Exista efecte fixe invididuale? => Testul F
 H0: nu există efecte fixe individuale (= modelul grupat)

1 =  2 = =N =
 H1: există efecte fixe individuale
 Testul statistic
FT =
( RSS0 − RSS1 ) / ( N − 1)
RSS1 / ( NT − N − K )
 Regula de decizie: se respinge ipoteza nula (şi deci modelul

grupat) dacă FT este mai mare decât valoarea critică (adică dacă
p-value < un nivel de semnificaţie dat , în general 0.05).
29
 Dacă se respinge modelul grupat: Se foloseşte
modelul cu efecte fixe sau aleatoare?
◦ Testul Hausman
◦ Se testează dacă efectele individuale aleatoare sunt
corelate cu variabilele explicative (FE) sau nu (RE)
 Ideea generala a testului Hausman

- Compară un estimator care este consistent
şi eficient sub ipoteza nulă şi inconsistent în
ipoteza alternativă cu un estimator care este
consistent în ambele alternative
30
Ipotezele in cazul testului Hausman:
 Ho: nu exista corelatie, FE consistent, RE consistent
si eficient
( )
E xit i = 0
 H1: exista corelatie, FE consistent, RE inconsistent
( )
E xit i  0
31
 Testul statistic:
( )

( ) sub ipoteza H0 este χ2k unde k este
a
HW = ˆRE − ˆFE (  RE −  FE ) ˆRE − ˆFE numărul( de coloane în X
 K = number of columns in X )
−1 2
Regula de decizie
- Se respinge ipoteza nulă dacă HW este
mai mare decât valoarea critică (sau dacă p-
value < valoarea dată a nivelului de
semnificaţie , în general 0.05).
32

CURS 11 - Modele Cu Date de Tip Panel

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

CURS 11 - Modele Cu Date de Tip Panel

Încărcat de

Drepturi de autor:

Formate disponibile

MODELE DE REGRESIE PENTRU

• Regresia prin metoda celor mai mici pătrate

grupată (POLS – Pooled ordinary least squares)

• Modelul de regresie cu efecte fixe

• Modelul de regresie cu efecte aleatoare

• Tipuri de structuri cu date de tip panel:

 Încorporează dimensiunea timp pentru datele în secţiune

 Eficienţă sporită a estimărilor modelelor de regresie prin

 Capacitatea de a controla efectele individuale fixe – ceea

efect neobservat efect neobservat

 Dacă se face o secţiune transversală (se observă N indivizi la un

Y1 2019 =  0 + 1 X 11 2019 +  2 X 21 2019 + 1 +  2019 +  1 2019

Yi 2019 =  0 + 1 X 1i 2019 +  2 X 2i 2019 +  i +  2019 +  i 2019

YN 2019 =  0 + 1 X 1N 2019 +  2 X 2 N 2019 +  N +  2019 +  N 2019

Y2 2017 =  0 + 1 X 12 2017 +  2 X 2 2 2017 +  2 +  2017 +  2 2017

 Se presupune că toate cele trei componente sunt

 Se estimează parametrii ecuaţiei de regresie liniară

yit =  0 + 1 x1it +  2 x2it + ... +  p x pit + uit

unde i este individul iar t este timpul

 Structura de tip panel are dimensiunea timp, deci corelaţia

◦ Efectelor fixe (Fixed effects): atunci când există

◦ Efectelor aleatoare (Random effects): atunci

 Modelul pentru toate observatiile

          ( NT 1) ( NT  N ) ( N 1) ( NT  K ) ( K 1) ( NT 1)

 Scop: Eliminarea efectului individual, adică

Modelul transformat: y it = x it  +  it , where y it = y it − y i . etc.

Observăm că parametrii α nu mai apar în ecuaţie → aceştia sunt

Prin aplicarea metodei celor mai mici pătrate clasică ecuaţiei

Ipotezele privind termenul eroare  zgomot alb (ca în regresia

Ipotezele privind efectele individuale i: distribuţia constantă de-a

➔ este eficient dacă modelul pentru componentele

 Se calculează estimatorul prin metoda celor mai mici pătrate

• Nu este eficient (ţine cont doar de variaţia dintre indivizi)

4. Modelul transofrmat RE y it −  y i. = ( x it −  x i. )  + (u it −  ui. )

 H0: nu există efecte fixe individuale (= modelul grupat)

 Regula de decizie: se respinge ipoteza nula (şi deci modelul

 Ideea generala a testului Hausman

 H1: exista corelatie, FE consistent, RE inconsistent

S-ar putea să vă placă și