Documente Academic
Documente Profesional
Documente Cultură
Introducere
Modelarea econometrică se realizează în anumite condiţii sau cu respectarea unui set de restricţii
care se numesc ipoteze ale modelului de regresie.
Calitatea estimării parametrilor modelului de regresie depinde de îndeplinirea a două clase de
ipoteze:
I. ipoteze asupra componentei aleatoare sau asupra variabilei eroare:
- 𝑴(𝜺𝒊)=𝟎, media erorilor este nulă;
- 𝑽(𝜺𝒊)=𝝈𝟐, ipoteza de homoscedasticitate;
- 𝜺𝒊~𝑵(𝟎,𝝈𝟐), ipoteza de normalitate;
- 𝒄𝒐𝒗(𝜺𝒊,𝜺𝒋)=𝟎, ipoteza de necorelare sau de independenţă a erorilor.
a. Definire: M(εi)=0
𝑀( ^β 0)=𝛽0+𝜇
¿
H1: M(εi)≠0 (media erorilor este diferită semnificativ de zero; erorile afectează sistematic media
variabilei dependente 𝑌)
^
M ( εi )−M ( εi )
Alegerea testului: t=
√ V^ ( M
^ ( εi ) )
Valoarea teoretică a testului: tα/2,n-1
M (ei) M (ei )
Calculul statisticii test: t calc= =
s /√ n s M^ (ε)
Regula de decizie:
În funcţie de statistica 𝑡:
- dacă |𝑡𝑐𝑎𝑙𝑐|≤𝑡𝛼2⁄;𝑛−1, atunci nu se respinge (se acceptă) ipoteza nulă (𝐻0)
- dacă |𝑡𝑐𝑎𝑙𝑐|>𝑡𝛼2⁄;𝑛−1, atunci se respinge ipoteza nulă (𝐻0), cu o probabilitate de (1−𝛼)
Decizie
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 39.855 .730 54.578 .000
Horsepower -.157 .007 -.771 -23.931 .000
a. Dependent Variable: Miles per Gallon
Testarea mediei erorilor in raport cu zero
Să se verifice dacă media erorilor este diferită semnificativ de zero, considerând un risc de 5%.
One-Sample Test
Test Value = 0
95% Confidence
Interval of the
Sig. (2- Mean Difference
t df tailed) Difference Lower Upper
Unstandardized .000 391 1.000 .00000000 -.4932982 .4932982
Residual (tcalc) (n-1) (sig)
1. Formularea ipotezelor:
H0: M(εi)=0
H1: M(εi)≠0
SAU
sig=1
𝛼 =0.05
𝑆𝑖𝑔<𝛼 => nu se respinge H0
1. Formularea ipotezelor:
H0: M(εi)=0
H1: M(εi)≠0
Residuals Statisticsa
Minimu Maximu Std.
m m Mean Deviation N
Predicted Value 3.64 32.61 23.45 6.020 392
Residual -16.212 16.980 .000 4.968 392
Std. Predicted -3.290 1.523 .000 1.000 392
Value
Std. Residual -3.259 3.414 .000 .999 392
a. Dependent Variable: Miles per Gallon
1. Formularea ipotezelor:
H0: M(εi)=0
H1: M(εi)≠0
2. Alegerea statisticii test: Student
3. Alegerea pragului de semnificatie: tteoretic= tα/2,n-1= t0.05/2,392-1= t0.25,391=1.96
M (ei) 0.00
4. Calculul statisticii test: t calc=¿ = =0
s/√ n 4.96 /√ 392
5. Regula de decizie:
- dacă |𝑡𝑐𝑎𝑙𝑐|≤𝑡𝛼2⁄;𝑛−1 sau 𝑆𝑖𝑔≥, atunci nu se respinge (se acceptă) ipoteza nulă (𝐻0)
- dacă |𝑡𝑐𝑎𝑙𝑐|>𝑡𝛼2⁄;𝑛−1 sau 𝑆𝑖𝑔<𝛼 , atunci se respinge ipoteza nulă (𝐻0), cu o
probabilitate de (1−𝛼)
6. Decizie si interpretare
|𝑡𝑐𝑎𝑙𝑐| = 0.00
tteoretic =1.96
Interpretare: Cu o probabilitatea de 95%, se poate garanta că media erorilor este nula, erorile nu
afectează sistematic media variabilei dependente 𝑌. (Ipoteza este respectata)
Descriptive Statistics
Maximu Std.
N Minimum m Mean Deviation
Unstandardized 392 -16.21164 16.97969 .0000000 4.96773143
Residual
Valid N (listwise) 392
1. Formularea ipotezelor:
H0: M(εi)=0
H1: M(εi)≠0
6. Decizie si interpretare
|𝑡𝑐𝑎𝑙𝑐| = 0.00
tteoretic =1.96
- dacă ipoteza de normalitate este încălcată, atunci estimatorii construiţi pe baza metodei celor
mai mici pătrate nu urmează o lege de repartiţie normală, având doar proprietăţi asimptotice,
adică necesită eşantioane sau seturi mari de date.
c. Testarea ipotezei
c.1. Procedee grafice: histograma si curba frecventelor , box-plot, Q-Q plot, P-P plot
Histograma şi curba frecvenţelor
50
40
Frequency
30
20
10
Mean = 3.6082248E-16
Std. Dev. = 4.96773143
N = 392
0
-20.00000 -10.00000 0.00000 10.00000 20.00000
Unstandardized Residual
Diagrama PP-Plot Diagrama QQ-Plot
Normal P-P Plot of Unstandardized Residual Normal Q-Q Plot of Unstandardized Residual
1.0 15
10
0.8
0.6
0.4
-5
0.2
-10
1. Formularea ipotezelor:
𝐻0:𝜀𝑖~𝑁(0,𝜎2) (ipoteza de normalitate: erorile urmează o lege de repartiţie normală sau
erorile sunt normal distribuite)
𝐻1:𝜀𝑖≠𝑁(0,𝜎2) (erorile nu urmează o lege de repartiţie normală sau erorile nu sunt
normal distribuite)
2. Alegerea pragului de semnificaţie: 𝛼=0,05
3. Regula de decizie:
În funcţie de 𝑆𝑖𝑔 (probabilitatea asociată statisticii test):
- dacă 𝑆𝑖𝑔≥𝛼 atunci nu se respinge (se acceptă) ipoteza nulă (𝐻0)
- dacă 𝑆𝑖𝑔<𝛼, atunci se respinge ipoteza nulă (𝐻0)
1. Formularea ipotezelor:
𝐻0:𝜀𝑖~𝑁(0,𝜎2) (ipoteza de normalitate: erorile urmează o lege de repartiţie normală sau
erorile sunt normal distribuite)
𝐻1:𝜀𝑖≠𝑁(0,𝜎2) (erorile nu urmează o lege de repartiţie normală sau erorile nu sunt
normal distribuite)
5. Regula de decizie:
În funcţie de valoarea calculată a statisticii 𝐽𝐵:
- dacă 𝐽𝐵𝑐𝑎𝑙𝑐≤ χ 2α , 2, atunci se acceptă ipoteza nulă (𝐻0);
2
- dacă 𝐽𝐵𝑐𝑎𝑙𝑐> χ α , 2, atunci se respinge ipoteza nulă (𝐻0), cu o probabilitate de (1−𝛼).
6. Decizie
1.0 15
10
0.8
5
Expected Normal Value
Expected Cum Prob
0.6
0.4
-5
0.2
-10
0.0 -15
0.0 0.2 0.4 0.6 0.8 1.0 -20 -10 0 10 20
50
40
Frequency
30
20
10
Mean = 3.6082248E-16
Std. Dev. = 4.96773143
N = 392
0
-20.00000 -10.00000 0.00000 10.00000 20.00000
Unstandardized Residual
Conform celor trei procedee grafice observam ca erorile nu urmează o lege de distribuție
normala. In P-P plot si Q-Q plot erorile se abat de la dreapta, iar conform histogramei si curbei
frecventelor se observa ca distribuția este una leptocurtica si simetrica si nu simetrica si
mezocurtica. Astfel conform celor 3 procedee grafice ipoteza de normalitate este incalcata.
1. Formularea ipotezelor:
𝐻0:𝜀𝑖~𝑁(0,𝜎2) (ipoteza de normalitate: erorile urmează o lege de repartiţie normală sau
erorile sunt normal distribuite)
𝐻1:𝜀𝑖≠𝑁(0,𝜎2) (erorile nu urmează o lege de repartiţie normală sau erorile nu sunt
normal distribuite)
2. Alegerea pragului de semnificaţie: 𝛼=0,05
3. Regula de decizie:
În funcţie de 𝑆𝑖𝑔 (probabilitatea asociată statisticii test):
- dacă 𝑆𝑖𝑔≥𝛼 atunci nu se respinge (se acceptă) ipoteza nulă (𝐻0)
- dacă 𝑆𝑖𝑔<𝛼, atunci se respinge ipoteza nulă (𝐻0)
4. Decizie si interpretare:
sig=0,003
𝛼 = 0,05
sig< 𝛼 => se respinge ipoteza nula
Interpretare: Cu o probabilitatea de 95%, se poate garanta că erorile nu urmează o lege de
repartiţie normală sau erorile nu sunt normal distribuite sau distribuţia. Cu alte cuvinte, ipoteza
de normalitate a erorilor (𝜀𝑖~𝑁(0,𝜎2)) nu este îndeplinită
Testul Jarque-Bera
Statistics
Unstandardized Residual
N Valid 392
Missing 14
Skewness .411
Std. Error of Skewness .123
Kurtosis .450
Std. Error of Kurtosis .246
1. Formularea ipotezelor:
𝐻0:𝜀𝑖~𝑁(0,𝜎2) (ipoteza de normalitate: erorile urmează o lege de repartiţie normală sau
erorile sunt normal distribuite)
𝐻1:𝜀𝑖≠𝑁(0,𝜎2) (erorile nu urmează o lege de repartiţie normală sau erorile nu sunt
normal distribuite)
[ ] [ ]
2 2
n k 392 2 0.450
4. Calcularea statisticii test: JB= ⋅ s w2 + = ⋅ 0.411 +
6 4 6 4
=65.33⋅ [ 0.168+0.050 ]=14.24
- unde 𝑠𝑤 este estimaţia coeficientul de asimetrie 𝑆𝑤 şi 𝑘 este estimaţia coeficientul de
boltire 𝐾.
5. Regula de decizie:
În funcţie de valoarea calculată a statisticii 𝐽𝐵:
2
- dacă 𝐽𝐵𝑐𝑎𝑙𝑐≤ χ α , 2, atunci se acceptă ipoteza nulă (𝐻0);
- dacă 𝐽𝐵𝑐𝑎𝑙𝑐> χ 2α , 2, atunci se respinge ipoteza nulă (𝐻0), cu o probabilitate de (1−𝛼).
6. Decizie
c. Testarea ipotezei
H0: cov(εi, εi)=0 sau (r = 0)
H1: cov(εi, εi)≠0 sau (r ≠ 0)
Testul Durbin-Watson
1. Formularea ipotezelor:
H0: erorile nu sunt autocorelate ( = 0)
H1: erorile sunt autocorelate ( 0 )
* 𝑑𝐿 = limita inferioara
* 𝑑U = limita superioara
5. Regula de decizie
În funcţie de aceste valori critice se determină următoarele intervale, care permit luarea deciziei
de respingere sau acceptare a ipotezei nule:
- dacă (0<𝑑𝑐𝑎𝑙𝑐<𝑑𝐿), se respinge ipoteza nulă (𝐻0), erorile înregistrează autocorelare pozitivă;
- dacă (4−𝑑𝐿<𝑑𝑐𝑎𝑙𝑐<4), se respinge ipoteza nulă (𝐻0), erorile înregistrează autocorelare
negativă;
- (𝑑𝐿<𝑑𝑐𝑎𝑙𝑐<𝑑𝑈) şi (4−𝑑𝑈<𝑑𝑐𝑎𝑙𝑐<4−𝑑𝐿) sunt regiuni de nedeterminare, nu se poate decide
asupra existenţei autocorelării erorilor;
- dacă (𝑑𝑈<𝑑𝑐𝑎𝑙𝑐<4−𝑑𝑈), se acceptă ipoteza nulă (𝐻0), erorile nu sunt autocorelate sau nu
există autocorelare a erorilor.
1. Formularea ipotezelor
H0: k este distribuit normal (nu există autocorelare a erorilor)
H1: k nu este distribuit normal (ipoteza este încălcată)
2. Calculul statisticii test
- se foloseşte statistica t Student, calculată după relaţia:
k −M (k )
t calc=
sk
3. Regula de decizie:
Testul Durbin-Watson
Model Summaryb
Adjusted R Std. Error of the
Model R R Square Square Estimate Durbin-Watson
a
1 .771 .595 .594 4.974 .964
a. Predictors: (Constant), Horsepower
b. Dependent Variable: Miles per Gallon
1. Formularea ipotezelor:
H0: erorile nu sunt autocorelate ( = 0)
H1: erorile sunt autocorelate ( 0 )
DW = 0.964
Din tabele Durbin-Watson, pt un prag de semnificatie de 0.05, pt un model de regresie cu doi
parametri si un esantion de volum n=392, se citesc cele doua valori critice:
dl=1.758
du=1.779
0.964
1.758 1.779 4-1.779 4 - 1.758
DW
Testul RUNS
Runs Test
Unstandardiz
ed Residual
Test Valuea -.31137
Cases < Test Value 195
Cases >= Test Value 197
Total Cases 392
Number of Runs 106
Z -9.204
Asymp. Sig. (2-tailed) .000
a. Median
1. Formularea ipotezelor
H0: k este distribuit normal (nu există autocorelare a erorilor)
H1: k nu este distribuit normal (ipoteza este încălcată)
2. Regula de decizie
!VIF are o valoarea ridicată (VIF>10) => variabilele independente sunt coliniare
2. Toleranţa (Tolerance)
1
TOL= =1- R2j
VI F j
Interpretare:
TOL=1 => nu există coliniaritate
TOL=0=> există coliniaritate perfectă
! existența coliniarității este sugerată de valorile mici la indicatorului TOL.
EXERCIȚII:
1. În vederea testării coliniarităţii dintre variabilele independente ale unui model de regresie,
s-au obţinut următoarele rezultate:
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients Collinearity Statistics
Model B Std. Error Beta t Sig. Tolerance VIF
1 (Constant) 65,705 27,731 2,369 ,037
X1 48,979 10,658 ,581 4,596 ,001 ,950 1,052
X2 59,654 23,625 ,359 2,525 ,028 ,753 1,328
X3 -1,838 ,814 -,324 -2,258 ,045 ,738 1,355
a. Dependent Variable: Y
Pentru exemplul dat, se poate considera că există coliniaritate între variabilele independente?
Indicatorul VIF pentru fiecare din cele trei variabile independente este mai mic decat 10 =>
variabilele independente nu sunt coliniare
In ceea ce priveste inticatorul TOL, pentru cele trei variabile independente TOL este mai aproape
de 1 decat de 0, ceea de indica lipsa coliniaritatii intre variabilele independente.