Sunteți pe pagina 1din 18

Ipotezele asupra componentei aleatoare (erorilor)

Introducere
Modelarea econometrică se realizează în anumite condiţii sau cu respectarea unui set de restricţii
care se numesc ipoteze ale modelului de regresie.
Calitatea estimării parametrilor modelului de regresie depinde de îndeplinirea a două clase de
ipoteze:
I. ipoteze asupra componentei aleatoare sau asupra variabilei eroare:
- 𝑴(𝜺𝒊)=𝟎, media erorilor este nulă;
- 𝑽(𝜺𝒊)=𝝈𝟐, ipoteza de homoscedasticitate;
- 𝜺𝒊~𝑵(𝟎,𝝈𝟐), ipoteza de normalitate;
- 𝒄𝒐𝒗(𝜺𝒊,𝜺𝒋)=𝟎, ipoteza de necorelare sau de independenţă a erorilor.

II. ipoteze asupra componentei deterministe sau asupra variabilelor independente:


- variabilele independente sunt non-aleatoare, deterministe;
- variabilele independente şi variabila eroare sunt necorelate, 𝒄𝒐𝒗(𝑿𝒋,𝜺)=𝟎;
- variabilele independente sunt necoliniare (cazul regresiei liniare multiple)

!!! Nerespectarea acestor ipoteze:


- determină modificarea proprietăţilor estimatorilor parametrilor modelului de regresie;
- ridică probleme importante în realizarea demersului cercetării econometrice.

I. Ipotezele asupra componentei aleatoare (erorilor)

1. Media erorilor este nulă:

a. Definire: M(εi)=0

b. Efectele încălcării ipotezei


Dacă această ipoteză este încălcată, atunci se modifică proprietăţile estimatorilor parametrilor
modelului de regresie. Există două situaţii: când media variabilei reziduale este constantă şi când
aceasta nu este constantă.
- 𝑴(𝜺𝒊)=𝝁=𝒄𝒔𝒕 - parametrul 𝛽0 este estimat nedeplasat de estimatorul ^β 0
¿

𝑀( ^β 0)=𝛽0+𝜇
¿

- 𝑴(𝜺𝒊)=𝝁𝒊 - parametrul 𝛽1 este estimat nedeplasat de estimatorul ^β 1.


¿

În concluzie, dacă ipoteza 𝑴(𝜺𝒊)=𝟎 este încălcată, estimarea parametrilor modelului se


realizează cu o eroare sistematică. Mai exact, este vorba de o deplasare de care suferă fie
estimarea parametrului 𝛽1, fie estimarea parametrului 𝛽0.
b. Testarea ipotezei
H0: M(εi)=0 (media erorilor este nulă; erorile nu afecteaz[ systematic media variabilei
dependente Y)

H1: M(εi)≠0 (media erorilor este diferită semnificativ de zero; erorile afectează sistematic media
variabilei dependente 𝑌)

^
M ( εi )−M ( εi )
 Alegerea testului: t=
√ V^ ( M
^ ( εi ) )
 Valoarea teoretică a testului: tα/2,n-1

M (ei) M (ei )
 Calculul statisticii test: t calc= =
s /√ n s M^ (ε)

 Regula de decizie:
În funcţie de statistica 𝑡:
- dacă |𝑡𝑐𝑎𝑙𝑐|≤𝑡𝛼2⁄;𝑛−1, atunci nu se respinge (se acceptă) ipoteza nulă (𝐻0)
- dacă |𝑡𝑐𝑎𝑙𝑐|>𝑡𝛼2⁄;𝑛−1, atunci se respinge ipoteza nulă (𝐻0), cu o probabilitate de (1−𝛼)

În funcţie de 𝑆𝑖𝑔 (probabilitatea asociată statisticii test):


- dacă 𝑆𝑖𝑔≥𝛼, atunci se acceptă ipoteza nulă (𝐻0)
- dacă 𝑆𝑖𝑔<𝛼, atunci se respinge ipoteza nulă (𝐻0)

 Decizie

EXEMPLU: Pentru un esantion de masini se considera legatura dintre variabilele Consum si


Puterea motorului.Rezultatele obtinute sunt prezentate in tabelele de mai jos:

Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 39.855 .730 54.578 .000
Horsepower -.157 .007 -.771 -23.931 .000
a. Dependent Variable: Miles per Gallon
Testarea mediei erorilor in raport cu zero
Să se verifice dacă media erorilor este diferită semnificativ de zero, considerând un risc de 5%.

One-Sample Test
Test Value = 0
95% Confidence
Interval of the
Sig. (2- Mean Difference
t df tailed) Difference Lower Upper
Unstandardized .000 391 1.000 .00000000 -.4932982 .4932982
Residual (tcalc) (n-1) (sig)

1. Formularea ipotezelor:
H0: M(εi)=0
H1: M(εi)≠0

2. Alegerea statisticii test: Student


3. Alegerea pragului de semnificatie: tteoretic= tα/2,n-1= t0.05/2,392-1= t0.25,391=1.96
4. Calculul statisticii test: t calc=0.00
5. Regula de decizie:
- dacă |𝑡𝑐𝑎𝑙𝑐|≤𝑡𝛼2⁄;𝑛−1 sau 𝑆𝑖𝑔≥, atunci nu se respinge (se acceptă) ipoteza nulă (𝐻0)
- dacă |𝑡𝑐𝑎𝑙𝑐|>𝑡𝛼2⁄;𝑛−1 sau 𝑆𝑖𝑔<𝛼 , atunci se respinge ipoteza nulă (𝐻0), cu o
probabilitate de (1−𝛼)
6. Decizie si interpretare
|𝑡𝑐𝑎𝑙𝑐| = 0.00
tteoretic =1.96

 |𝑡𝑐𝑎𝑙𝑐| < tteoretic => nu se respinge H0

SAU
sig=1
𝛼 =0.05
 𝑆𝑖𝑔<𝛼 => nu se respinge H0

Interpretare: Cu o probabilitatea de 95%, se poate garanta că media erorilor este nula,


erorile nu afectează sistematic media variabilei dependente 𝑌.
One-Sample Statistics
Std. Std. Error
N Mean Deviation Mean
Unstandardized 392 .0000000 4.96773143 .25090833
Residual

1. Formularea ipotezelor:
H0: M(εi)=0
H1: M(εi)≠0

2. Alegerea statisticii test: Student


3. Alegerea pragului de semnificatie: tteoretic= tα/2,n-1= t0.05/2,392-1= t0.25,391=1.96

M (e i) 0.00 M (ei) 0.00


4. Calculul statisticii test: t calc= = =0 sau = =0
s ^M (ε) 0.2509 s/√ n 4.96 /√ 392
5. Regula de decizie:
- dacă |𝑡𝑐𝑎𝑙𝑐|≤𝑡𝛼2⁄;𝑛−1 sau 𝑆𝑖𝑔≥, atunci nu se respinge (se acceptă) ipoteza nulă (𝐻0)
- dacă |𝑡𝑐𝑎𝑙𝑐|>𝑡𝛼2⁄;𝑛−1 sau 𝑆𝑖𝑔<𝛼 , atunci se respinge ipoteza nulă (𝐻0), cu o
probabilitate de (1−𝛼)
6. Decizie si interpretare
|𝑡𝑐𝑎𝑙𝑐| = 0.00
tteoretic =1.96

 |𝑡𝑐𝑎𝑙𝑐| < tteoretic => nu se respinge H0

Interpretare: Cu o probabilitatea de 95%, se poate garanta că media erorilor este nula,


erorile nu afectează sistematic media variabilei dependente 𝑌. (Ipoteza este respectata)

Residuals Statisticsa
Minimu Maximu Std.
m m Mean Deviation N
Predicted Value 3.64 32.61 23.45 6.020 392
Residual -16.212 16.980 .000 4.968 392
Std. Predicted -3.290 1.523 .000 1.000 392
Value
Std. Residual -3.259 3.414 .000 .999 392
a. Dependent Variable: Miles per Gallon

1. Formularea ipotezelor:
H0: M(εi)=0
H1: M(εi)≠0
2. Alegerea statisticii test: Student
3. Alegerea pragului de semnificatie: tteoretic= tα/2,n-1= t0.05/2,392-1= t0.25,391=1.96
M (ei) 0.00
4. Calculul statisticii test: t calc=¿ = =0
s/√ n 4.96 /√ 392
5. Regula de decizie:
- dacă |𝑡𝑐𝑎𝑙𝑐|≤𝑡𝛼2⁄;𝑛−1 sau 𝑆𝑖𝑔≥, atunci nu se respinge (se acceptă) ipoteza nulă (𝐻0)
- dacă |𝑡𝑐𝑎𝑙𝑐|>𝑡𝛼2⁄;𝑛−1 sau 𝑆𝑖𝑔<𝛼 , atunci se respinge ipoteza nulă (𝐻0), cu o
probabilitate de (1−𝛼)

6. Decizie si interpretare
|𝑡𝑐𝑎𝑙𝑐| = 0.00
tteoretic =1.96

 |𝑡𝑐𝑎𝑙𝑐| < tteoretic => nu se respinge H0

Interpretare: Cu o probabilitatea de 95%, se poate garanta că media erorilor este nula, erorile nu
afectează sistematic media variabilei dependente 𝑌. (Ipoteza este respectata)

Descriptive Statistics
Maximu Std.
N Minimum m Mean Deviation
Unstandardized 392 -16.21164 16.97969 .0000000 4.96773143
Residual
Valid N (listwise) 392

1. Formularea ipotezelor:
H0: M(εi)=0
H1: M(εi)≠0

2. Alegerea statisticii test: Student


3. Alegerea pragului de semnificatie: tteoretic= tα/2,n-1= t0.05/2,392-1= t0.25,391=1.96
M (ei) 0.00
4. Calculul statisticii test: t calc=¿ = =0
s/√ n 4.96 /√ 392
5. Regula de decizie:
- dacă |𝑡𝑐𝑎𝑙𝑐|≤𝑡𝛼2⁄;𝑛−1 sau 𝑆𝑖𝑔≥, atunci nu se respinge (se acceptă) ipoteza nulă (𝐻0)
- dacă |𝑡𝑐𝑎𝑙𝑐|>𝑡𝛼2⁄;𝑛−1 sau 𝑆𝑖𝑔<𝛼 , atunci se respinge ipoteza nulă (𝐻0), cu o
probabilitate de (1−𝛼)

6. Decizie si interpretare
|𝑡𝑐𝑎𝑙𝑐| = 0.00
tteoretic =1.96

 |𝑡𝑐𝑎𝑙𝑐| < tteoretic => nu se respinge H0


Interpretare: Cu o probabilitatea de 95%, se poate garanta că media erorilor este nula, erorile nu
afectează sistematic media variabilei dependente 𝑌. (Ipoteza este respectata)

3.Ipoteza de normalitate a erorilor: ε i N (0 , σ 2)


a. Definirea ipotezei
Erorile 𝜀𝑖 urmează o lege normală de medie 0 şi varianţă σ 2: 𝜀𝑖~𝑁(0, σ 2 ¿

b. Efectele încălcării ipotezei


Ipoteza de normalitate a erorilor este importantă pentru stabilirea proprietăţilor estimatorilor
parametrilor modelului de regresie:
- dacă 𝜀𝑖~𝑁(0, σ 2), atunci estimatorii parametrilor modelului de regresie urmează, de asemenea,
o lege normală: 𝛽̂𝑗~ N ( β 1 , σ ^β );
2
1

- dacă ipoteza de normalitate este încălcată, atunci estimatorii construiţi pe baza metodei celor
mai mici pătrate nu urmează o lege de repartiţie normală, având doar proprietăţi asimptotice,
adică necesită eşantioane sau seturi mari de date.

c. Testarea ipotezei
c.1. Procedee grafice: histograma si curba frecventelor , box-plot, Q-Q plot, P-P plot
Histograma şi curba frecvenţelor

50

40
Frequency

30

20

10

Mean = 3.6082248E-16
Std. Dev. = 4.96773143
N = 392
0
-20.00000 -10.00000 0.00000 10.00000 20.00000

Unstandardized Residual
Diagrama PP-Plot Diagrama QQ-Plot

Normal P-P Plot of Unstandardized Residual Normal Q-Q Plot of Unstandardized Residual

1.0 15

10
0.8

Expected Normal Value


Expected Cum Prob

0.6

0.4

-5

0.2
-10

c.2. Procedee numerice


0.0 -15
0.0 0.2 0.4 0.6 0.8 1.0

-20 -10 0 10 20
Testul Kolmogorov-Smirnov
Observed Cum Prob Observed Value

1. Formularea ipotezelor:
𝐻0:𝜀𝑖~𝑁(0,𝜎2) (ipoteza de normalitate: erorile urmează o lege de repartiţie normală sau
erorile sunt normal distribuite)
𝐻1:𝜀𝑖≠𝑁(0,𝜎2) (erorile nu urmează o lege de repartiţie normală sau erorile nu sunt
normal distribuite)
2. Alegerea pragului de semnificaţie: 𝛼=0,05
3. Regula de decizie:
În funcţie de 𝑆𝑖𝑔 (probabilitatea asociată statisticii test):
- dacă 𝑆𝑖𝑔≥𝛼 atunci nu se respinge (se acceptă) ipoteza nulă (𝐻0)
- dacă 𝑆𝑖𝑔<𝛼, atunci se respinge ipoteza nulă (𝐻0)

 Testul Jarque-Bera - se bazează pe verificarea simultană a proprietăţilor de


asimetrie şi boltire ale seriei reziduurilor. Pentru o distribuţie normală, valoarea
coeficientului de asimetrie Fisher (sw) este zero, iar valoarea coeficientului de boltire
Fisher (k) este zero.

1. Formularea ipotezelor:
𝐻0:𝜀𝑖~𝑁(0,𝜎2) (ipoteza de normalitate: erorile urmează o lege de repartiţie normală sau
erorile sunt normal distribuite)
𝐻1:𝜀𝑖≠𝑁(0,𝜎2) (erorile nu urmează o lege de repartiţie normală sau erorile nu sunt
normal distribuite)

2. Alegerea pragului de semnificaţie: 𝛼=0,05

3. Citirea valorii teoretice a statisticii test: χ 2teoretic = χ 2α , 2= χ 20.05 , 2=5.991


[ ]
2
n k
4. Calcularea statisticii test: JB= ⋅ s w2 +
6 4
- unde 𝑠𝑤 este estimaţia coeficientul de asimetrie 𝑆𝑤 şi 𝑘 este estimaţia coeficientul de
boltire 𝐾.

5. Regula de decizie:
În funcţie de valoarea calculată a statisticii 𝐽𝐵:
- dacă 𝐽𝐵𝑐𝑎𝑙𝑐≤ χ 2α , 2, atunci se acceptă ipoteza nulă (𝐻0);
2
- dacă 𝐽𝐵𝑐𝑎𝑙𝑐> χ α , 2, atunci se respinge ipoteza nulă (𝐻0), cu o probabilitate de (1−𝛼).

6. Decizie

Exemplu: Pentru un esantion de masini se considera legatura dintre variabilele Consum si


Puterea motorului. Rezultatele obtinute sunt prezentate in tabelele de mai jos:

Diagrama PP-Plot Diagrama QQ-Plot


Normal P-P Plot of Unstandardized Residual Normal Q-Q Plot of Unstandardized Residual

1.0 15

10
0.8

5
Expected Normal Value
Expected Cum Prob

0.6

0.4
-5

0.2
-10

0.0 -15
0.0 0.2 0.4 0.6 0.8 1.0 -20 -10 0 10 20

Observed Cum Prob Observed Value

Histograma şi curba frecvenţelor

50

40
Frequency

30

20

10

Mean = 3.6082248E-16
Std. Dev. = 4.96773143
N = 392
0
-20.00000 -10.00000 0.00000 10.00000 20.00000

Unstandardized Residual
Conform celor trei procedee grafice observam ca erorile nu urmează o lege de distribuție
normala. In P-P plot si Q-Q plot erorile se abat de la dreapta, iar conform histogramei si curbei
frecventelor se observa ca distribuția este una leptocurtica si simetrica si nu simetrica si
mezocurtica. Astfel conform celor 3 procedee grafice ipoteza de normalitate este incalcata.

Testul Kolmogorov Smirnov


One-Sample Kolmogorov-Smirnov Test
Unstandardized
Residual
N 392
a,b
Normal Parameters Mean .0000000
Std. Deviation 4.96773143
Most Extreme Differences Absolute .058
Positive .058
Negative -.034
Test Statistic .058
Asymp. Sig. (2-tailed) .003c
a. Test distribution is Normal.
b. Calculated from data.
c. Lilliefors Significance Correction.

1. Formularea ipotezelor:
𝐻0:𝜀𝑖~𝑁(0,𝜎2) (ipoteza de normalitate: erorile urmează o lege de repartiţie normală sau
erorile sunt normal distribuite)
𝐻1:𝜀𝑖≠𝑁(0,𝜎2) (erorile nu urmează o lege de repartiţie normală sau erorile nu sunt
normal distribuite)
2. Alegerea pragului de semnificaţie: 𝛼=0,05
3. Regula de decizie:
În funcţie de 𝑆𝑖𝑔 (probabilitatea asociată statisticii test):
- dacă 𝑆𝑖𝑔≥𝛼 atunci nu se respinge (se acceptă) ipoteza nulă (𝐻0)
- dacă 𝑆𝑖𝑔<𝛼, atunci se respinge ipoteza nulă (𝐻0)

4. Decizie si interpretare:
sig=0,003
𝛼 = 0,05
 sig< 𝛼 => se respinge ipoteza nula
Interpretare: Cu o probabilitatea de 95%, se poate garanta că erorile nu urmează o lege de
repartiţie normală sau erorile nu sunt normal distribuite sau distribuţia. Cu alte cuvinte, ipoteza
de normalitate a erorilor (𝜀𝑖~𝑁(0,𝜎2)) nu este îndeplinită
 Testul Jarque-Bera

Statistics

Unstandardized Residual
N Valid 392
Missing 14
Skewness .411
Std. Error of Skewness .123
Kurtosis .450
Std. Error of Kurtosis .246

1. Formularea ipotezelor:
𝐻0:𝜀𝑖~𝑁(0,𝜎2) (ipoteza de normalitate: erorile urmează o lege de repartiţie normală sau
erorile sunt normal distribuite)
𝐻1:𝜀𝑖≠𝑁(0,𝜎2) (erorile nu urmează o lege de repartiţie normală sau erorile nu sunt
normal distribuite)

2. Alegerea pragului de semnificaţie: 𝛼=0,05

3. Citirea valorii teoretice a statisticii test: χ 2teoretic = χ 2α , 2= χ 20.05 , 2=5.991

[ ] [ ]
2 2
n k 392 2 0.450
4. Calcularea statisticii test: JB= ⋅ s w2 + = ⋅ 0.411 +
6 4 6 4
=65.33⋅ [ 0.168+0.050 ]=14.24
- unde 𝑠𝑤 este estimaţia coeficientul de asimetrie 𝑆𝑤 şi 𝑘 este estimaţia coeficientul de
boltire 𝐾.

5. Regula de decizie:
În funcţie de valoarea calculată a statisticii 𝐽𝐵:
2
- dacă 𝐽𝐵𝑐𝑎𝑙𝑐≤ χ α , 2, atunci se acceptă ipoteza nulă (𝐻0);
- dacă 𝐽𝐵𝑐𝑎𝑙𝑐> χ 2α , 2, atunci se respinge ipoteza nulă (𝐻0), cu o probabilitate de (1−𝛼).

6. Decizie

𝐽𝐵𝑐𝑎𝑙𝑐=14.24 > χ 2α , 2=5.991 => se respinge ipoteza nula

Interpretare: Cu o probabilitatea de 95%, se poate garanta că erorile nu urmează o lege de


repartiţie normală sau erorile nu sunt normal distribuite. Cu alte cuvinte, ipoteza de normalitate a
erorilor (𝜀𝑖~𝑁(0,𝜎2)) nu este îndeplinită.
4.Ipoteza de necorelare sau de independenţă a erorilor: cov(εi, εi)=0.
a. Definirea ipotezei
Ipoteza de necorelare sau de independenţă a erorilor se referă la lipsa une corelaţii între
variabilele reziduale sau la faptul că eroarea asociată unei valori a variabilei dependente nu este
influenţată de eroarea asociată altei valori a variabilei dependente.

În condiţiile în care ipoteza de independenţă a erorilor nu este verificată, modelul de regresie


înregistrează o autocorelare a erorilor sau o corelaţie serială.
Autocorelarea sau corelaţia serială presupune existenţa unei autocorelări între erorile 𝜀𝑖, altfel
spus: 𝑐𝑜𝑣(𝜀𝑖,𝜀𝑗)≠0 sau 𝑀(𝜀𝑖∙𝜀𝑗)≠0.

Autocorelarea erorilor poate fi cauzată de:


- neincluderea în modelul de regresie a uneia sau a mai multor variabile explicative importante;
- modelul de regresie nu este corect specificat;

b. Efectele încălcării ipotezei


În condiţiile existenţei autocorelării erorilor, este afectată calitatea estimaţiilor obţinute
prin metoda celor mai mici pătrate (pentru parametrul 𝛽0, se obţine un estimator
neeficient)

c. Testarea ipotezei
H0: cov(εi, εi)=0 sau (r = 0)
H1: cov(εi, εi)≠0 sau (r ≠ 0)

c.1. Procedee grafice


c.2. Procedee numerice

 Testul Durbin-Watson
1. Formularea ipotezelor:
H0: erorile nu sunt autocorelate ( = 0)
H1: erorile sunt autocorelate (  0 )

2. Alegerea pragului de semnificaţie: 𝛼

3. Alegerea statisticii test: 𝐷𝑊=𝑑=2(1−𝜌̂)~𝐷𝑊(𝑑𝐿,𝑑𝑈)

* 𝑑𝐿 = limita inferioara
* 𝑑U = limita superioara

Întrucât (−1≤𝜌̂≤1), valorile 𝐷𝑊 sunt date de intervalul (0≤𝑑≤4):


- dacă 𝜌̂=1⇒𝑑=0, există autocorelare pozitivă maximă a erorilor;
- dacă 𝜌̂=−1⇒𝑑=4, există autocorelare negativă maximă a erorilor;
- dacă 𝜌̂=0⇒𝑑=2, nu există autocorelare sau erorile nu sunt autocorelate.

4. Citirea valorii teoretice a statisticii test:


Se citesc valorile din tabela Durbin-Watson pentru 𝑑𝐿 ş𝑖 𝑑𝑈, ţinând cont de numărul de
parametrii din model, de volumul eşantionului 𝑛 şi de riscul asumat 𝛼.

5. Regula de decizie
În funcţie de aceste valori critice se determină următoarele intervale, care permit luarea deciziei
de respingere sau acceptare a ipotezei nule:

- dacă (0<𝑑𝑐𝑎𝑙𝑐<𝑑𝐿), se respinge ipoteza nulă (𝐻0), erorile înregistrează autocorelare pozitivă;
- dacă (4−𝑑𝐿<𝑑𝑐𝑎𝑙𝑐<4), se respinge ipoteza nulă (𝐻0), erorile înregistrează autocorelare
negativă;
- (𝑑𝐿<𝑑𝑐𝑎𝑙𝑐<𝑑𝑈) şi (4−𝑑𝑈<𝑑𝑐𝑎𝑙𝑐<4−𝑑𝐿) sunt regiuni de nedeterminare, nu se poate decide
asupra existenţei autocorelării erorilor;
- dacă (𝑑𝑈<𝑑𝑐𝑎𝑙𝑐<4−𝑑𝑈), se acceptă ipoteza nulă (𝐻0), erorile nu sunt autocorelate sau nu
există autocorelare a erorilor.

 Testul RUNS - se bazează pe ideea că valorile variabilei reziduale se constituie în


secvenţe sau seturi de valori pozitive sau negative numite runs, care se succed într-o
anumită ordine sau aleator.

1. Formularea ipotezelor
H0: k este distribuit normal (nu există autocorelare a erorilor)
H1: k nu este distribuit normal (ipoteza este încălcată)
2. Calculul statisticii test
- se foloseşte statistica t Student, calculată după relaţia:
k −M (k )
t calc=
sk

unde: k este numărul de runs caracterizat prin:


n1 n 2
M (k )=2 +1
n1 +n2
2 2n 1 n2−n1−n2
sk =2n 1 n2
¿¿
 n1 este numărul de valori pozitive ale erorilor ei ;
 n2 este numărul de valori negative ale erorilor ei,
cu n1 + n2 = n .

 s2k este o valoare calculată la nivelul eşantionului a estimatorului σ^ 2k

3. Regula de decizie:

- dacă |tcalc| ≤ ta/2,n-2 sau sau sig >𝛼 sau k ∈ [ M (k )± 1 , 96 ⋅s k ] , atunci se

acceptă ipoteza H0.

Exemplu: Pentru un esantion de masini se considera legatura dintre variabilele Consum si


Puterea motorului. rezultatele sunt prezentate in tabelele de mai jos:

Testul Durbin-Watson

Model Summaryb
Adjusted R Std. Error of the
Model R R Square Square Estimate Durbin-Watson
a
1 .771 .595 .594 4.974 .964
a. Predictors: (Constant), Horsepower
b. Dependent Variable: Miles per Gallon

1. Formularea ipotezelor:
H0: erorile nu sunt autocorelate ( = 0)
H1: erorile sunt autocorelate (  0 )

DW = 0.964
Din tabele Durbin-Watson, pt un prag de semnificatie de 0.05, pt un model de regresie cu doi
parametri si un esantion de volum n=392, se citesc cele doua valori critice:
dl=1.758
du=1.779

0.964
1.758 1.779 4-1.779 4 - 1.758
DW

DW = 0.964=> (0<𝑑𝑐𝑎𝑙𝑐<𝑑𝐿), se respinge ipoteza nulă (𝐻0), erorile înregistrează autocorelare


pozitivă;

 Testul RUNS

Runs Test

Unstandardiz
ed Residual
Test Valuea -.31137
Cases < Test Value 195
Cases >= Test Value 197
Total Cases 392
Number of Runs 106
Z -9.204
Asymp. Sig. (2-tailed) .000
a. Median

1. Formularea ipotezelor
H0: k este distribuit normal (nu există autocorelare a erorilor)
H1: k nu este distribuit normal (ipoteza este încălcată)
2. Regula de decizie

- dacă |tcalc| ≤ ta/2,n-2 sau sau sig >𝛼 sau k ∈ [ M (k )± 1 , 96 ⋅s k ] , atunci se

acceptă ipoteza H0.


3. Decizie si interpretare
sig= 0.00
𝛼=0.05
sig < 𝛼=> se respinge H0=> k nu este distribuit normal (ipoteza este încălcată)=>
există autocorelare a erorilor

II. Ipoteze asupra variabilelor independente


1. Variabilele independente sunt nestochastice sau deterministe.
2. Variabilele independente şi variabila eroare sunt necorelate, cov (Xi,εi)=0.
- această ipoteză este îndeplinită dacă variabilele independente sunt nestochastice.
3. Ipoteza de necoliniaritate a variabilelor independente

IPOTEZA DE NECOLINIARITATE A VARIABILELOR INDEPENDENTE


 Definire
 Tipuri de coliniaritate
 Testarea coliniarității
a. Procedee grafice: Scatter plot
b. Procedee numerice
- un prim indiciu pentru existenţa coliniarităţii poate fi următorul: dacă între variabilele
independente există o legătură de tip liniar, cel mai probabil, coeficientul de determinaţie
pentru acest model va avea o valoare ridicată, însă testul Student pentru fiecare parametru
al variabilelor coliniare nu va fi semnificativ statistic. În consecinţă, se poate testa
coliniaritatea prin testarea coeficienţilor de regresie, iar indiciul este existenţa unui
coeficient de determinaţie mare. În condiţiile în care parametrii modelului de regresie
sunt nesemnificativi, se poate decide că modelul admite fenomenul de coliniaritate.
- o altă metodă de testare a coliniarităţii este testarea parametrilor modelelor de regresie
auxiliară construite ca modele de regresie liniară doar pe baza variabilelor independente.
Dacă parametrii acestor modele sunt semnificativi, atunci variabilele independente sunt
coliniare.
- pe baza modelelor de regresie auxiliare, se pot construi doi indicatori cu ajutorul cărora
se poate detecta existenţa coliniarităţii: Tolerance şi VIF (Variance Inflation Factor).

1. Factorul varianței crescute (Variance-inflated factor-VIF)


1
VI F j= 2
1−R j
 Unde R2j este raportul de determinaţie din modelul de regresie auxiliar, respectiv dintre
variabila Xj şi celelalte variabile independente.
Interpretare:

VIF=1=> lipsa coliniarității și se realizează dacă R2j =0


2
R j =1=> intre variabilele independente => există o coliniaritate perfectă=> VIF este infinit

!VIF are o valoarea ridicată (VIF>10) => variabilele independente sunt coliniare
2. Toleranţa (Tolerance)
1
TOL= =1- R2j
VI F j

Interpretare:
TOL=1 => nu există coliniaritate
TOL=0=> există coliniaritate perfectă
! existența coliniarității este sugerată de valorile mici la indicatorului TOL.

EXERCIȚII:
1. În vederea testării coliniarităţii dintre variabilele independente ale unui model de regresie,
s-au obţinut următoarele rezultate:
Coefficientsa

Unstandardized Standardized
Coefficients Coefficients Collinearity Statistics
Model B Std. Error Beta t Sig. Tolerance VIF
1 (Constant) 65,705 27,731 2,369 ,037
X1 48,979 10,658 ,581 4,596 ,001 ,950 1,052
X2 59,654 23,625 ,359 2,525 ,028 ,753 1,328
X3 -1,838 ,814 -,324 -2,258 ,045 ,738 1,355
a. Dependent Variable: Y

Pentru exemplul dat, se poate considera că există coliniaritate între variabilele independente?

Indicatorul VIF pentru fiecare din cele trei variabile independente este mai mic decat 10 =>
variabilele independente nu sunt coliniare

In ceea ce priveste inticatorul TOL, pentru cele trei variabile independente TOL este mai aproape
de 1 decat de 0, ceea de indica lipsa coliniaritatii intre variabilele independente.

S-ar putea să vă placă și