Sunteți pe pagina 1din 5

CURS 5

3.3 Test de normalitate a reziduurilor- Testul Jarque – Berra

Ipoteza normalității reziduurilor trebuie confirmată prin teste.


Una dintre ipotezele determinării parametrilor unui model unifactorial liniar prin metoda
celor mai mici pătrate se referă la normalitatea variabilei reziduale 𝜀.
Această ipoteză trebuie să fie îndeplinită pentru ca modelul construit să poată fi validat.
Ipoteza de normalitate a variabilei aleatoare reziduale 𝜀 se poate testa cu ajutorul unuia dintre
testele Jarque-Bera, 𝜒 2 , Lilliefors, Kolmogorov – Smirnov.
Vom prezenta aici testul lui Jarque și Berra care utilizează estimatorii coeficientului de
asimetrie și ai coeficientului de aplatizare pentru a judeca normalitatea reziduurilor.
Etapele testului Jarque – Berra:
1. Se formulează ipoteza nulă, prin care se presupune că variabila reziduală 𝜀 urmează o
repartiție normală caracterizată printr-un coeficient de asimetrie Pearson egal cu 0 și
printr-un coeficient de boltire Pearson egal cu 3.
𝐻0 : 𝑆 = 0
𝐾=3
Ipoteza alternativă a acestui test pleacă de la presupunerea că 𝜀 nu este normal
distribuită, adică:
𝐻1 : 𝑆 ≠ 0
𝐾≠3
2. Se stabilește nivelul de semnificație al testului 𝛼 = 1 − 𝑝
3. Se determină valoarea calculată a testului:
𝑛 − 𝑘 + 1 2 (𝐾 − 3)2
𝐽𝐵 = [𝑆 + ]
6 4
unde:

1 𝑛
∑ (𝜀 )3
𝜇3
𝑆= 3= 𝑛 𝑖=1 𝑖 − 𝜀̅
𝜎 3
√[1 ∑𝑛 (𝜀𝑖 − 𝜀̅)2 ]
𝑛 𝑖=1
1 𝑛
𝜇4 𝜇4 ∑𝑖=1(𝜀𝑖 − 𝜀̅)4
𝐾= 4= 2 2= 𝑛
𝜎 (𝜎 ) 2
1
[𝑛 ∑𝑛𝑖=1(𝜀𝑖 − 𝜀̅)2 ]

4. Din tabelele aferente repartiției 𝜒 2 se extrage valoarea critică specifică testului în


funcție de probabilitatea 𝛼 și 2 grade de libertate:
𝜒 2 𝑐𝑟𝑖𝑡𝑖𝑐 (𝛼, 2)
5. Se compară valoarea calculată cu valoarea critică și putem avea:
a) dacă 𝐽𝐵 < 𝜒 2 𝑐𝑟𝑖𝑡𝑖𝑐 , se acceptă ipoteza nulă și putem spune cu probabilitatea 𝑝 că
variabila reziduală 𝜀 urmează o repartiție normală cu 𝑆 = 0 și 𝐾 = 3;
b) dacă 𝐽𝐵 > 𝜒 2 𝑐𝑟𝑖𝑡𝑖𝑐 , se respinge ipoteza nulă și putem spune cu probabilitatea 𝑝 că
variabila reziduală 𝜀 nu urmează o repartiție normală, având 𝑆 ≠ 0 și 𝐾 ≠ 3.

3.4 Test de autocorelație a reziduurilor

Dacă datele utilizate pentru estimarea parametrilor unui model liniar de două variabile
sunt serii temporale, atunci aplicarea unui test Durbin-Watson este necesară pentru verificarea
prezenței sau absenței autocorelației reziduurilor
Pentru ca modelul să fie valid, trebuie ca 𝜀 să nu prezinte autocorelare. Testul Durbin –
Watson verifică această ipoteză în următoarele etape:
1. Se formulează ipoteza nulă, prin care se presupune că variabila reziduală 𝜀 prezintă
autocorelare:
𝐻0 : 𝜀 este autocorelată
Ipoteza alternativă a acestui test pleacă de la presupunerea că 𝜀 nu este autocorelată:
𝐻1 : 𝜀 nu este autocorelată
2. Se stabilește nivelul de semnificație al testului 𝛼 = 1 − 𝑝
3. Se determină valoarea calculată a testului:
∑𝑛𝑖=2(𝜀𝑖 − 𝜀𝑖−1 )2
𝐷𝑊 =
∑𝑛𝑖=1 𝜀𝑖2
4. Din tabelele aferente testului DW se extrag 2 valori critice 𝑑𝐿 și 𝑑𝑈 în funcție de
numărul de observații 𝑛, de numărul variabilelor factoriale 𝑘 și de probabilitatea 𝛼, cu
mențiunea că 𝑑𝐿 < 𝑑𝑈 :
𝑑𝐿 (𝛼, 𝑛, 𝑘)
𝑑𝑈 (𝛼, 𝑛, 𝑘)

5. Se compară valoarea calculată cu cele 2 valori critice și putem avea:


a) dacă 𝐷𝑊 < 𝑑𝐿 , se acceptă ipoteza nulă și putem spune cu probabilitatea 𝑝 că
variabila reziduală 𝜀 prezintă autocorelare, încălcând astfel una dintre ipotezele
modelului;
b) dacă 𝑑𝐿 < 𝐷𝑊 < 𝑑𝑈 , testul este neconcludent și ar trebui refăcut pe un alt eșantion
care să reprezinte mai bine fenomenul studiat;
c) dacă 𝐷𝑊 > 𝑑𝑈 , se respinge ipoteza nulă și putem spune cu probabilitatea 𝑝 că
variabila reziduală 𝜀 nu prezintă autocorelare, nu are “memorie”, iar ipoteza privind
autocorelarea lui 𝜀 este îndeplinită.

Aplicație- modelul regresiei liniare simple

1. Se doreste a se verifica dacă nivelul consumului gospodăriilor (y) poate fi explicat prin cel
al venitului disponibil (x). Cele două variabile sunt exprimate în mii euro. Pentru studiul
econometric utilizăm un eșantion de 𝑛 = 400 de gospodării iar rezultatele intermediare
sunt următoarele:
𝑥̅ = 35 ș𝑖 𝑦̅ = 25, ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 = 8250, ∑𝑛𝑖=1(𝑦𝑖 − 𝑦̅)2 = 4500,
∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅) = 5788, ∑𝑛𝑖=1 𝑥𝑖 2 = 498250,
𝑛 𝑛

∑ 𝑦𝑖 2 = 254500, ∑ 𝑥𝑖 𝑦𝑖 = 355788.
𝑖=1 𝑖=1
a. Scrieți ecuația modelului și argumentați alegerea dumneavoastră. (1.0)
b. Determinați și interpretați coeficientul de corelație. (1.0)
c. Determinați estimatorii parametrilor modelului. (1.0)
d. Cum interpretați acești parametri ? (1.0)
e. Stiind că: ∑𝑛𝑖=1(𝑦̂𝑖 − 𝑦̅)2 = 4061.25,
Determinați coeficientul de determinație și comentați calitatea modelului. (1.0)
f. Verificați relația existentă între coeficientul de corelație și cel de determinație. (1.0)
g. Determinați un estimator al erorii modelului (erorii reziduale) 𝑠𝜀̂ . (1.0)
h. Determinați cele două valori calculate ale testului Student. (1.0)
i. Știind că valoarea tabelară a lui Student, pentru un risc de 0.05 este egală cu 1.96, care
sunt concluziile? Explicați răspunsurile date. (1.0)
j. Estimați valoarea consumului dacă venitul disponibil este egal cu 40. (1.0)

REZOLVARE

a) yi(consumul)=a+b*xi(venitul)+ε
b) ρ(r) =5788/√8250 ∗ √4500 =0.95
∑𝑛𝑖=1 𝑥𝑖 = 𝑛 ∗ 𝑥̅ .

∑𝑛𝑖=1 𝑥𝑖
𝑥̅ =
𝑛

Coeficientul de corelație este diferit de 0, deci între concum si venit există o dependență
liniară, este pozitiv, deci legătura este direct și este apropiat de 1, deci legătura este
puternică.
c)

𝑑𝑒𝑡𝑀𝑎̂ ∑𝑛𝑖=1 𝑥𝑖2 ∑𝑛𝑖=1 𝑦𝑖 − ∑𝑛𝑖=1 𝑥𝑖 ∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖


𝑎̂ = =
𝑑𝑒𝑡𝑀 𝑛 ∑𝑛𝑖=1 𝑥𝑖2 − (∑𝑛𝑖=1 𝑥𝑖 )2
=(498250*400*25-400*35*355788)/(400*498250-(400*35)2
𝑎̂ =0.44

𝑑𝑒𝑡𝑀𝑏̂ 𝑛 ∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖 − ∑𝑛𝑖=1 𝑥𝑖 ∑𝑛𝑖=1 𝑦𝑖


𝑏̂ = =
𝑑𝑒𝑡𝑀 𝑛 ∑𝑛𝑖=1 𝑥𝑖2 − (∑𝑛𝑖=1 𝑥𝑖 )2
=(400*355788-400*35*400*25)/(400*498250-(400*35)2
𝑏̂=0.7
d) 0.44 este valoare consumului independent de venit, este de fapt valoarea
consumului autonom.
0.7 este valoarea cu care se modifică valoarea consumului cand venitul se
modifică cu o unitate, iar variațiile consumului vor avea același sens cu variațiile
venitului.
e) R2= 4061.25/4500= 0.9025- 90% din variația consumului se datorează variației
venitului.
f) (r)2= R2 0.952=0.9025 (A)
g) 𝑠𝜀̂ = √∑𝑛𝑖=1(𝑦 − 𝑦
̂ )2 /(𝑛 − 2)=√438.75/398 =1.05

𝑛 𝑛 𝑛

∑(𝑦 − 𝑦̅)2 = ∑(𝑦̂ − 𝑦̅)2 + ∑(𝑦 − 𝑦̂)2


𝑖=1 𝑖=1 𝑖=1

4500=4061.25+∑𝑛𝑖=1(𝑦 − 𝑦̂)2

∑(𝑦 − 𝑦̂)2 = 4500 − 4061.25 = 438.75


𝑖=1

|𝑎̂|
h) 𝑡𝑎̂ = =0.44/0.4=1.1
𝑠𝑎
̂

|𝑏̂ |
𝑡𝑏̂ = = 0.7/0.01=70
𝑠𝑏̂

∑𝑛 2
𝑖=1 𝑥𝑖
𝑠𝑎̂ = 𝑠ℇ × √ 2 = 1.05*√498250/(400 ∗ 498250 − (400 ∗ 35) ∗ (400 ∗ 35))
𝑛×∑𝑖=1 𝑥𝑖 −(∑𝑛
𝑛 2
𝑖=1 𝑥𝑖 )

𝑠𝑎̂ =0.4
𝑛
𝑠𝑏̂ = 𝑠ℇ × √ 2 =1.05*√400/(400 ∗ 498250 − (400 ∗ 35) ∗ (400 ∗ 35)
𝑛×∑𝑛 2 𝑛
𝑖=1 𝑥𝑖 −(∑𝑖=1 𝑥𝑖 )

𝑠𝑏̂ = 0.01

i) tt=1.96, deci a nu este un estimator corect, iar b este un estimator corect, prin urmare
trebuie refăcut modelul fără termen liber.
j) 𝑐̂ = 0.44 + 0.7 ∗ 40 = 28.44 𝑢. 𝑚.

S-ar putea să vă placă și