Documente Academic
Documente Profesional
Documente Cultură
PROIECT ECONOMETRIE
Student:
Cristina- Nicoleta Porumb
Grupa 144, seria C, an III
Bucureti
2014
1
Problema A
nregistrai pentru 42 de uniti (judee), valorile specifice ale unei perechi de caracteristici (X i
Y) ntre care exist o legtur logic. Datele prezentate sub forma tabelar fac parte din lucrare.
1. Prezentarea problemei (inclusiv descrierea naturii legturii dintre cele dou variabile, conform teoriei
economice);
2. Definirea modelului de regresie simpl liniar
2.1- Forma, variabilele i parametrii modelului de regresie
2.2- Reprezentarea grafic a modelului legturii dintre variabile
3. Estimarea parametrilor modelului i interpretarea acestora
3.1- Estimarea punctual a parametrilor
3.2- Estimarea parametrilor prin interval de ncredere
4. Testarea semnificaiei corelaiei i a parametrilor modelului de regresie
4.1- Testarea semnificaiei corelaiei
4.2- Testarea parametrilor unui model de regresie simplu
5. Aplicarea analizei de tip ANOVA pentru validitatea modelului de
regresie simplu i interpretarea
rezultatelor
6. Testarea ipotezelor clasice asupra modelului de regresie simpl
6.1- Ipoteze statistice clasice supra modelului de regresie simpl
6.2- Testarea liniaritii modelului propus
6.3- Testarea normalitii erorilor
6.4- Testarea ipotezei de homoscedasticitate
6.5- Testarea ipotezei de autocorelare a erorilor
7.
Previziunea valorii variabilei Y dac variabila X crete cu 10% fa de ultima valoare nregistrat
(inclusiv interval de ncredere) pentru toate variantele cunoscute.
Rezolvarea problemei A de exemplificat att n Excel ct i n Eviews.
Rezolvare problema A
suprafaa cultivat=f(producia agricol vegetal, nr. semntori) n anul 2005 pentru 42 judee
A1
1. Informaiile despre cele 42 de judete i cele 2 variabile pentru anul 2005 se regsesc n tabelul
urmtor.
y = variabil endogen (dependent), x = variabil exogen (independent)
y = Suprafaa cultivat;
x1 = Producia agricol vegetal.
2
Nr
crt.
1
2
3
4
5
6
7
8
9
10
11
12
13
Judee
Bihor
Bistria-Nsud
Cluj
Maramure
Satu Mare
Slaj
Alba
Braov
Covasna
Harghita
Mure
Sibiu
Bacu
Suprafaa cultivat
(hectare)
270183
86489
157307
73827
193528
106299
116044
92864
77243
70543
190117
78858
168400
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
Botoani
Iai
Neam
Suceava
Vaslui
Brila
Buzu
Constana
Galai
Tulcea
Vrancea
Arge
Clrai
Dmbovia
Giurgiu
Ialomia
Prahova
Teleorman
Ilfov
Municipiul Bucureti
Dolj
Gorj
Mehedini
Olt
Vlcea
Arad
Cara-Severin
Hunedoara
Timi
790955
1005521
651561
985909
689718
727750
725575
981963
1052650
497580
607316
689518
622070
987017
491678
651968
492421
717421
374627
41678
1056598
446328
440979
788496
442155
865958
621434
456755
1195743
271746
238669
157230
169971
267550
313766
243812
432228
265397
245774
135474
160853
397989
163483
243597
344059
136091
439352
94614
1451
447679
92580
173019
360539
80628
285252
106230
66437
450720
Datele pentru realizarea acestui proiect au fost preluate din Statistic Teritorial editat de INSS, din
anul statistic 2005.
2. Definirea modelului de regresie simpl liniar
2.1- Forma, variabilele i parametrii modelului de regresie
Forma:
4
Modelul de regresie simpl reprezint acel model care descrie legtura dintre factorul cauzal (exogen)
x i factorul de efect (de ieire, endogen) notat y. Forma ecuaiei de regresie simpl liniar este
urmtoarea:
y f(x)
y 0 1 x
Unde:
i reprezint eroarea aleatoare (componenta rezidual) pentru unitatea statistic respectiv.
yi variabila efect (endogen) suprafaa cultivat
xi variabila cauz (exogen) nr. semntori
o termenul liber al ecuaiei
1 coeficientul variabilei independente (panta de regresie).
Parametrii
Parametrii modelului econometric sunt cei care fac obiectul procesului de estimare i testare statistic.
Sunt numii i coeficieni de regresie, sunt mrimi reale, fixe dar necunoscute care apar n model n
diferite expresii alturi de variabile.
Forma: =
na b xi y i
i 1
i 1
i 1
i 1
i 1
a xi b xi2 xi yi
=
=
Parametrii modelului :
= -26022,21
= 0,34
y i 61537,08 88,16 xi
na b xi y i
i 1
i 1
i 1
i 1
i 1
a xi b xi2 xi yi
Parametrii modelului :
= -26022,21
= 0,34
1.Abaterea medie ptratica a valorii reziduale
Se=
= 8014796326
SE( )=Se
= 41576,4712
SE( )=Se
= 0,0589
= -26022,21
= 0,34
a a z critic s a
(-110051,3988; 58006,9667)
Parametrul
b b z critic s b
(0,2229; 0,4610)
7
Pramentrul
= 0,676
Multiple R (coeficientul de corelaie sau r y/x) = 0,676. Observm c valoarealui ry/x este > 0, ceea ce
inseamn ca ntre cele dou variabile considerate: suprafaa cultivat si producia agricol vegetal
exist o legatur direct.
Testarea semnificatiei coeficientului de corelatie ry/x
- se stabilete ipoteza nul: H0: ry/x = 0;
- se stabilete ipoteza alternativ: H1: ry/x 0
- se calculeaz testul t:
zry/x=
= 5,797
Ry/x=
= 0,676
Deoarece Ry/x = ry/x = 0,676, apreciem c exist o legtur liniar, puternic i direct ntre cele dou
variabile.
Testarea semnificatiei raportului de corelatie Ry/x
- se stabilete ipoteza nul: H0: Ry/x = 0;
- se stabilete ipoteza alternativ: H1: Ry/x 0
- se calculeaz testul Fisher
9
FRy/x=
40 = 33,69
=0,457
R2(0,1)
46% din suprafaa cultivat este influenat de producia agricol vegetal, restul de 54 % reprezentnd
influena altor factori.
Testarea semnificatiei coeficientul de determinaieR2
- se stabilete ipoteza nul: H0: R2 = 0;
- se stabilete ipoteza alternativ: H1: R2 0
- se calculeaz testul Fisher
F R2 =
40 = 33,69
= -26022,21
= 0,34
10
=0
0, adic
z =
= -0,62588
SE( )=Se
= 41576,47
zcritic=1,96
|z |<zcritic(|-0,62588|<1,96) se accept H0 se respinge H1,parametrul
=0
0, adic
Testul Student
z =
= 5,80496
11
SE( )=Se
= 0,058
zcritic=1,96
z
semnificativ diferit de 0.
df (numrul gradelor de libertate): k =1, n k-1=40, n 1=41, unde k=1 este numrul devariabile ale
modelului (variabila x, respectiv y), iar n = 42 este numrul de observaii.
SS(sumele de patrate) potrivit descompunerii:Suma global de ptrate = Suma de ptrate datorata
regresiei + Suma de ptrate rezidual;
MS(media sumelor de ptrate): SS mparit la numrul respectiv de grade delibertate.Valoarea de pe
linia a doua (Residual ) este estimaia dispersiei pentru repartiia erorilor ieste ptratul erorii standard a
estimaiei.
F(valoarea statisticii F) pentru testul caracterizat de:
H0: modelul nu este valid statistic;
H1: modelul este valid statistic;
Significance F(probabilitatea critic unilateral). Dac valoarea rezultat este < dect pragul de
semnificaie fixat, atunci se respinge ipoteza nul n favoarea ipotezei alternative.
12
2 y/x + e=y
y/x=
e=
= 270079740016,507
= = 320591853071,969
13
y=(y - ) = 590671593088,476
Sy/x =
= 270079740016,507
Se =
= 8014796326,79924
Fcalc =
= 33,69764234
Fcritic = 4
Fcalc>Fcristic(33.69764234 > 4) se respinge H0 se accept H1modelul este valid,corect identificat din
punct de vedere statistic.
6. Testarea ipotezelor clasice asupra modelului de regresie simpl
6.1- Ipoteze statistice clasice supra modelului de regresie simpl
Ipoteza 1: Forma funcional:
Ipoteza de liniaritate se refer la felul n care parametrii intra n ecuaie, nu neaprat n relaia
dintre variabila x si y.
Ipoteza 2: Media erorilor este zero:
=0
Ipoteza 3: Homoscedasticitatea:
Variabilele aleatoare
14
24
6
JB n
~ ;2
unde:
n = numrul de observaii;
15
1 n
yi y
n i 1
S
3
1 n
yi y
n i 1
K
4
Dac probabilitatea p(JB) corespunztoare valorii calculate a testului este suficient de sczut, atunci
ipoteza de normalitate a erorilor este respins, n timp ce, n caz contrar, pentru un nivel suficient de
ridicat al probabilitii ipoteza de normalitate a erorilor este acceptat, sau dac
ipoteza de normalitate a erorilor este respins.
JB
;k , atunci
; 2 =5,99
K = 2,94
S = 0,67
JB = 3,16
Utiliznd pachetul de programe EViews n vederea calculrii testului Jarque-Berra se constat c JB =
2
5,9915
i c p(JB) =0,20. Deoarece valoarea calculat a testului J-B este < dect
2
valoarea tabelat a lui ; 2 , iar probabilitatea ca testul J-B s nu depeasc valoarea tabelat este
suficient de mic, ipoteza de normalitate a erorilor poate fi respins.
16
ei2 0 1 xi 2 x i2 i
i calcularea coeficientului de determinare, R2, corespunztor acestei regresii auxiliare;
- verificarea semnificaiei parametrilor modelului nou construit, iar dac unul dintre acetia este
nesemnificativ, atunci ipoteza de heteroscedasticitate a erorilor este acceptat.
Exist dou variante de aplicare a testului White:
- utilizarea testului Fisher Snedecor clasic, bazat pe ipoteza nulitii parametrilor, respectiv:
Dac ipoteza nul, potrivit creia rezultatele estimrii sunt nesemnificative ( Fc F ;k ;n k 1 ), este
acceptat, atunci ipoteza de homoscedasticitate se verific, cazul contrar semnificnd prezena
heteroscedasticitii erorilor.
- utilizarea testului LM, calculat ca produs ntre numrul de observaii corespunztoare modelului, n, i
coeficientul de determinare, R2, corespunztor acestei regresii auxiliare. n general, testul LM este
2
asimptotic distribuit sub forma unui ;v , pentru care numrul gradelor de libertate este egal cu: v k ,
unde k = numrul variabilelor exogene, respectiv:
2
LM n R 2 ~ ;k
Dac
LM
1.926492
3.776291
3.333797
Prob. F(2,39)
Prob. Chi-Square(2)
Prob. Chi-Square(2)
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
17
0.1593
0.1514
0.1888
Coefficient
Std. Error
t-Statistic
Prob.
C
PRODAGRICOLAVEG
PRODAGRICOLAVEG^2
-7.84E+09
36635.13
-0.017902
1.00E+10
30158.01
0.021634
-0.780841
1.214773
-0.827506
0.4396
0.2318
0.4130
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.089912
0.043241
1.05E+10
4.34E+21
-1027.347
1.926492
0.159268
7.63E+09
1.08E+10
49.06415
49.18827
49.10964
1.984349
Analiznd rezultatele afiate de programul EViews se constat c Fc 1,926 F0, 05; 2;7 4,74 i
LM 3,776
< 0, 05; 2
5,99
Verificarea ipotezei de independen a erorilor n cazul acestui model va fi realizat cu ajutorul testului
Durbin-Watson i const n calcularea termenului empiric:
n
i2
i 1
i 1
2
i
i compararea acestei mrimi d cu dou valori teoretice d 1 i d 2 , preluate din tabela DurbinWatson (vezi anexa nr. 1) n funcie de un prag de semnificaie , arbitrar ales, de numrul variabilelor
exogene k i de valorile observate n , n 15 .
Acceptarea sau respingerea ipotezei de independen a erorilor se bazeaz pe o anumit regul,
care const n:
- dac 0 d d 1 autocorelare pozitiv;
- dac d 1 d d 2 indecizie, recomandndu-se acceptarea autocorelrii pozitive;
- dac d 2 d 4 d 2 erorile sunt independente;
- dac 4 d 2 d 4 d 1 indecizie, recomandndu-se acceptarea autocorelrii
negative;
- dac 4 d 1 d 4 autocorelare negativ.
18
i2
i 1
i 1
= 2,12
2
i
Lucrnd cu un prag de semnificaie 0,05 , numrul variabilelor exogene fiind k 1 , iar numrul
observaiilor n 42 , din tabela distribuiei Durbin-Watson se citesc valorile (pentru cazul n 45 )
d1 1,48 i d 2 1,57 .
7. Previziunia valorii variabilei Y dac variabila X crete cu 10% fa de ultima valoare nregistrat
Cum xn+v = 10%
0
42
42
423762,4632-1,9691663,74
s y n v
x
x
1
s 1 nv
n
i xi x
2
u
423762,4632+1,9691663,74
91663,74
Deci, intervalul de ncredere pentru suprafaa cultivat:
244101,5328
603423,3936
19
A2
1. Prezentarea problemei (inclusiv descrierea naturii legturii dintre cele dou variabile, conform
teoriei economice);
Informaiile despre cele 42 de judete i cele 2 variabile pentru anul 2005 se regsesc n tabelul
urmtor.
y = variabil endogen (dependent), x = variabil exogen (independent)
y = Suprafaa cultivat;
x2 = Nr. semntori.
Nr
crt.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
Judee
Bihor
Bistria-Nsud
Cluj
Maramure
Satu Mare
Slaj
Alba
Braov
Covasna
Harghita
Mure
Sibiu
Bacu
Botoani
Iai
Neam
Suceava
Vaslui
Brila
Buzu
Constana
Galai
Tulcea
Nr. semntori
(buci)
3167
465
1410
331
1684
919
1373
978
737
445
1899
716
1095
1280
1281
840
894
1461
1742
1100
2343
1464
1282
20
Suprafaa cultivat
(hectare)
270183
86489
157307
73827
193528
106299
116044
92864
77243
70543
190117
78858
168400
271746
238669
157230
169971
267550
313766
243812
432228
265397
245774
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
Vrancea
Arge
Clrai
Dmbovia
Giurgiu
Ialomia
Prahova
Teleorman
Ilfov
Municipiul Bucureti
Dolj
Gorj
Mehedini
Olt
Vlcea
Arad
Cara-Severin
Hunedoara
Timi
1069
1284
2442
1764
1845
1738
1051
3713
866
17
4532
871
1777
3501
472
3505
894
1041
5444
135474
160853
397989
163483
243597
344059
136091
439352
94614
1451
447679
92580
173019
360539
80628
285252
106230
66437
450720
Datele pentru realizarea acestui proiect au fost preluate din Statistic Teritorial editat de INSS, din
anul statistic 2005.
2. Definirea modelului de regresie simpl liniar
2.1- Forma, variabilele i parametrii modelului de regresie
Forma:
Modelul de regresie simpl reprezint acel model care descrie legtura dintre factorul cauzal (exogen)
x i factorul de efect (de ieire, endogen) notat y. Forma ecuaiei de regresie simpl liniar este
urmtoarea:
y f(x)
y 0 1 x
Unde:
i reprezint eroarea aleatoare (componenta rezidual) pentru unitatea statistic respectiv.
i
xi variabila cauz (exogen) nr. semntori
na b xi y i
i 1
i 1
i 1
i 1
i 1
a xi b xi2 xi yi
=
=
Parametrii modelului :
= 61537,08
22
= 88,16
y i 61537,08 88,16 xi
Direcia i forma legturii dintre variabile poate fi corelograma sau diagrama de norului de puncte.
3.
na b xi y i
i 1
i 1
i 1
i 1
i 1
a xi b xi2 xi yi
Parametrii modelului :
= 61537,08
= 88,16
23
= 4271606766
Se=
SE( )=Se
= 17359,84
SE( )=Se
= 8,89
= 61537,08
= 88,16
a a z critic s a
(26451,52824; 96622,6494)
Parametrul
b b z critic s b
(70,18970526; 106,137522)
Pramentrul
24
25
ry/x=
= 0,843
Multiple R (coeficientul de corelaie sau ry/x) = 0,843. Observm c valoarealui ry/x este > 0, ceea ce
nseamn ca ntre cele dou variabile considerate: suprafaa cultivat si numrul semntorilor exist o
legatur directa.
Testarea semnificatiei coeficientului de corelatie ry/x
- se stabilete ipoteza nul: H0: ry/x = 0;
- se stabilete ipoteza alternativ: H1: ry/x 0
- se calculeaz testul t:
zry/x=
= 9,921
Ry/x=
= 0,843
Deoarece Ry/x = ry/x = 0,843, apreciem c exist o legtur liniar, puternic i direct ntre cele dou
variabile.
Testarea semnificatiei raportului de corelatie Ry/x
- se stabilete ipoteza nul: H0: Ry/x = 0;
- se stabilete ipoteza alternativ: H1: Ry/x 0
- se calculeaz testul Fisher
FRy/x=
40 = 98,278
R2=
=0,710
R2(0,1)
71% din suprafaa cultivat este influenat de numrul semntorilor, restul de 29 % reprezentnd
influena altor factori.
Testarea semnificatiei coeficientul de determinaieR2
- se stabilete ipoteza nul: H0: R2 = 0;
- se stabilete ipoteza alternativ: H1: R2 0
- se calculeaz testul Fisher
F R2 =
40 = 98,278
= 61537,08
= 88,16
Testarea semnificatiei lui
1) Se stabilete ipoteza nul:
H0 :
=0
0, adic
27
z =
= 3,544794
= 17359,84
zcritic=1,96
|z |<zcritic(|3,544794|<1,96) se accept H0 se respinge H1,parametrul
=0
0, adic
z =
= 9,91355
= 8,89
zcritic=1,96
z <zcritic(9,91355 > 1,96) se accept H1 se respinge H0,parametrul
semnificativ diferit de 0.
5. Aplicarea analizei de tip ANOVA pentru validitatea modelului de
rezultatelor
28
df (numrul gradelor de libertate): k =1, n k-1=40, n 1=41, unde k=1 este numrul devariabile ale
modelului (variabila x, respectiv y), iar n = 42 este numrul de observaii.
SS(sumele de patrate) potrivit descompunerii:Suma global de ptrate = Suma de ptrate datorata
regresiei + Suma de ptrate rezidual;
MS(media sumelor de ptrate): SS mparit la numrul respectiv de grade delibertate.Valoarea de pe
linia a doua (Residual ) este estimaia dispersiei pentru repartiia erorilor ieste ptratul erorii standard a
estimaiei.
F(valoarea statisticii F) pentru testul caracterizat de:
H0: modelul nu este valid statistic;
H1: modelul este valid statistic;
Significance F(probabilitatea critic unilateral). Dac valoarea rezultat este < dect pragul de
semnificaie fixat, atunci se respinge ipoteza nul n favoarea ipotezei alternative.
29
2 y/x + e=y
y/x=
e=
= 419807322420,426
= = 170864270668,050
y=(y- )= 590671593088,476
30
Sy/x =
= 419807322420,426
Se =
= 4271606766,70125
Fcalc =
= 98,2785508
Fcritic= 4
Fcalc>Fcristic(98,2785508 > 4) se respinge H0 se accepta H1modelul este valid,corect identificat din
punct de vedere statistic.
6. Testarea ipotezelor clasice asupra modelului de regresie simpl
6.1- Ipoteze statistice clasice supra modelului de regresie simpl
Ipoteza 1: Forma funcional:
Ipoteza de liniaritate se refer la felul n care parametrii intra n ecuaie, nu neaprat n rela ia
dintre variabila x si y.
Ipoteza 2: Media erorilor este zero:
=0
Ipoteza 3: Homoscedasticitatea:
Variabilele aleatoare
31
= 0 ij
Ipoteza 5 : Variabila aleatoare
24
6
JB n
~ ;2
unde:
n = numrul de observaii;
S= coeficientul de asimetrie (skewness), ce msoar simetria distribuiei erorilor n jurul mediei
acestora, care este egal cu zero, avnd urmtoarea relaie de calcul:
32
1 n
yi y
n i 1
S
3
1 n
yi y
n i 1
K
4
Dac probabilitatea p(JB) corespunztoare valorii calculate a testului este suficient de sczut, atunci
ipoteza de normalitate a erorilor este respins, n timp ce, n caz contrar, pentru un nivel suficient de
ridicat al probabilitii ipoteza de normalitate a erorilor este acceptat, sau dac
ipoteza de normalitate a erorilor este respins.
JB
;k
, atunci
; 2 =5,99
K = 2,67
S = 0,78
JB = 4,53
Utiliznd pachetul de programe EViews n vederea calculrii testului Jarque-Berra se constat c JB =
2
5,9915
i c p(JB) =0,10. Deoarece valoarea calculat a testului J-B este < dect
33
valoarea tabelat a lui ; 2 , iar probabilitatea ca testul J-B s nu depeasc valoarea tabelat este
suficient de mic, ipoteza de normalitate a erorilor poate fi respins.
6.4- Testarea ipotezei de homoscedasticitate
Verificarea ipotezei de homoscedasticitate a erorilor n cazul acestui model se va realiza cu ajutorul
testului White.
Aplicarea testului White presupune parcurgerea urmtoarelor etape:
- estimarea parametrilor modelului iniial i calculul valorilor estimate ale variabilei reziduale, u;
- construirea unei regresii auxiliare, bazat pe prespunerea existenei unei relaii de dependen ntre
ptratul valorilor erorii, variabila exogen inclus n modelul iniial i ptratul valorilor acesteia:
ei2 0 1 xi 2 x i2 i
i calcularea coeficientului de determinare, R2, corespunztor acestei regresii auxiliare;
- verificarea semnificaiei parametrilor modelului nou construit, iar dac unul dintre acetia este
nesemnificativ, atunci ipoteza de heteroscedasticitate a erorilor este acceptat.
Exist dou variante de aplicare a testului White:
- utilizarea testului Fisher Snedecor clasic, bazat pe ipoteza nulitii parametrilor, respectiv:
Dac ipoteza nul, potrivit creia rezultatele estimrii sunt nesemnificative ( Fc F ;k ;n k 1 ), este
acceptat, atunci ipoteza de homoscedasticitate se verific, cazul contrar semnificnd prezena
heteroscedasticitii erorilor.
- utilizarea testului LM, calculat ca produs ntre numrul de observaii corespunztoare modelului, n, i
coeficientul de determinare, R2, corespunztor acestei regresii auxiliare. n general, testul LM este
2
asimptotic distribuit sub forma unui ;v , pentru care numrul gradelor de libertate este egal cu: v k ,
unde k = numrul variabilelor exogene, respectiv:
2
LM n R 2 ~ ;k
Dac
LM
34
3.002685
5.604342
4.256073
Prob. F(2,39)
Prob. Chi-Square(2)
Prob. Chi-Square(2)
0.0612
0.0607
0.1191
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 05/03/14 Time: 05:29
Sample: 1 42
Included observations: 42
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
NRSEMANATORI
NRSEMANATORI^2
-1.12E+09
5242015.
-823.7831
2.30E+09
2373107.
456.7700
-0.486885
2.208925
-1.803496
0.6291
0.0331
0.0790
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.133437
0.088998
5.09E+09
1.01E+21
-996.7255
3.002685
0.061250
4.07E+09
5.33E+09
47.60598
47.73010
47.65147
1.918872
Analiznd rezultatele afiate de programul EViews se constat c Fc 3,002 F0, 05; 2;7 4,74 i
LM 5,604
< 0, 05; 2
5,99
i2
i 1
i 1
2
i
35
i compararea acestei mrimi d cu dou valori teoretice d 1 i d 2 , preluate din tabela DurbinWatson (vezi anexa nr. 1) n funcie de un prag de semnificaie
1
- dac
autocorelare negativ.
i2
i 1
i 1
= 0,93
2
i
Lucrnd cu un prag de semnificaie 0,05 , numrul variabilelor exogene fiind k 1 , iar numrul
observaiilor n 42 , din tabela distribuiei Durbin-Watson se citesc valorile (pentru cazul n 45 )
d1 1,48 i d 2 1,57 .
7. Previziunia valorii variabilei Y dac variabila X crete cu 10% fa de ultima valoare nregistrat
Cum xn+v = 10%
xn+v = X42 + 10% X42 = 5444 + 544,4 = 5988,4
y n v 61537,08882 + 88,1636137*5988,4 = 589496,0731 Suprafaa cultivat
36
589496,0731 -1,965228817,83
s y n v
x
x
1
s 1 nv
n
i xi x
2
u
589496,0731 +1,965228817,83
= 5228817,83
Deci, intervalul de ncredere pentru suprafaa cultivat:
-9658986,8737
10837979,0199
Problema B
1. Definirea modelului de regresie multipl liniar
1.1- Forma, variabilele, parametrii modelului de regresie multipl
1.2 -Reprezentarea grafic a modelului legturii dintre variabile
1.
regresie multipl i
Judee
Bihor
Bistria-Nsud
Cluj
Maramure
Satu Mare
Slaj
Alba
Braov
Covasna
Harghita
Mure
Sibiu
Bacu
Botoani
Iai
Neam
Suceava
Vaslui
Producia agricol
vegetal
(mii lei)
879070
579280
922061
563843
649426
442894
534755
450171
466240
403047
873152
410084
685610
790955
1005521
651561
985909
689718
38
Nr. semntori
(buci)
3167
465
1410
331
1684
919
1373
978
737
445
1899
716
1095
1280
1281
840
894
1461
Suprafaa cultivat
(hectare)
270183
86489
157307
73827
193528
106299
116044
92864
77243
70543
190117
78858
168400
271746
238669
157230
169971
267550
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
Brila
Buzu
Constana
Galai
Tulcea
Vrancea
Arge
Clrai
Dmbovia
Giurgiu
Ialomia
Prahova
Teleorman
Ilfov
Municipiul Bucureti
Dolj
Gorj
Mehedini
Olt
Vlcea
Arad
Cara-Severin
Hunedoara
Timi
727750
725575
981963
1052650
497580
607316
689518
622070
987017
491678
651968
492421
717421
374627
41678
1056598
446328
440979
788496
442155
865958
621434
456755
1195743
1742
1100
2343
1464
1282
1069
1284
2442
1764
1845
1738
1051
3713
866
17
4532
871
1777
3501
472
3505
894
1041
5444
313766
243812
432228
265397
245774
135474
160853
397989
163483
243597
344059
136091
439352
94614
1451
447679
92580
173019
360539
80628
285252
106230
66437
450720
Forma general a modelului multifactorial de regresie ,la nivelul unei colectiviti generale este :
Y=f(X1,X2,Xn)+
suprafaa cultivat=f(producia agricol vegetal, nr. semntori) n anul 2005 pentru 42 judee
y = variabil endogen (dependent), x = variabil exogen (independent)
y = Suprafaa cultivat;
x1 = Producia agricol vegetal;
x2 = Nr. semntori.
Parametrii
39
Parametrii modelului econometric sunt cei care fac obiectul procesului de estimare i testare statistic.
Sunt numii i coeficieni de regresie, sunt mrimi reale, fixe dar necunoscute care apar n model n
diferite expresii alturi de variabile.
y x1 , x2 ,i b0 b1 x1i b2 x 2i
40
Parametrii modelului:
b0= 8228,060557
b1= 0,117055695
b2= 72,67212426
= 3902028447,45327
= 29474,65602
= 0,053492062
41
= 11,06179473
b0 z n 3 sb 0 0 b0 z ; n 3 sb 0
b0 z 0,5;39 s b 0 0 b0 z 0,5;39 sb 0
b1 z ; n 3 sb1 1 b1 z ; n 3 sb1
b1 z 0,5;39 sb1 1 b1 z 0,5; 39 s b1
b2 z ; n 3 sb 2 2 b2 z ; n 3 sb 2
b2 z ; 39 sb 2 2 b2 z ; 39 sb 2
Parametrul 2 este seminificativ statistic deoarce intervalul de ncredere nu include valoarea nul
ry/x=
= 0,861604650
Multiple R (coeficientul de corelaie sau r y/x) = 0,861604650. Observm c valoarea lui ry/x este > 0,
ceea ce nseamn c ntre cele dou variabile considerate: suprafaa cultivat i producia agricol
vegetal exist o legatur direct.
Testarea semnificaiei coeficientului de corelaie ry/x
- se stabilete ipoteza nul: H0: ry/x = 0;
- se stabilete ipoteza alternativ: H1: ry/x 0
- se calculeaz testul z:
zry/x=
= 10,56
0.
43
Ry/x=
= 0,8616
Deoarece Ry/x = ry/x = 0,8616, apreciem c exist o legtur liniar, puternic i direct ntre cele dou
variabile.
Testarea semnificaiei raportului de corelaie Ry/x
- se stabilete ipoteza nul: H0: Ry/x = 0;
- se stabilete ipoteza alternativ: H1: Ry/x 0
- se calculeaz testul Fisher
FRy/x=
19.5 = 56,169
0.
3.Coeficinetul de determinaie(R2)
R2=
= 0,7423
R2(0,1)
74,23% din suprafaa cultivat este reprezentat de influena produciei agricole vegetale i de numrul
de semntori, restul de 25,77 % reprezentnd influena altor factori.
Testarea semnificaiei coeficientului de determinaieR2
- se stabilete ipoteza nul: H0: R2 = 0;
- se stabilete ipoteza alternativ: H1: R2 0
- se calculeaz testul Fisher
FRy/x=
19.5 = 56,169
0.
44
=0,27915
SE(b0)=Se
= 29474,65602
b0 = 8228,060557
z0<zcritic(0,27915<1,96) se accept H0 se respinge H1,parametrul 0 nu este semnificativ statistic, nu
este semnificativ 0.
Testarea semnificaiei parametrului 1 :
1) Se stabilete ipoteza nul:
H0 : 1= 0 adic 1 nu este semnificativ 0 pentru un prag de semnificaie ales.
2) Se stabilete ipoteza alternativ:
H1 : 1 0, adic 1 este semnificativ 0 pentru un prag de semnificaie ales.
n = 42 >30 eantion de volum redus i pentru testare vom utiliza testul z.
tiind c pragul de semnificaie este 0,05 i k 2 (exist doi factori de influen) se stabilete:
valoarea critic: zcritic=1,96
Statistica testului este:
zcalc=
=2,188281602
45
SE(b1)= Se
= 0,053492062
b1= 0,117055695
z1>zcritic(2,188281602>1,96)se accept H1 se respinge H0,parametrul 1 este semnificativ statistic, este
semnificativ 0.
Testarea semnificaiei parametrului 2 :
1) Se stabilete ipoteza nul:
H0 : 2= 0( adic 2 nu este semnificativ diferit de zero pentru un prag de semnificaie ales.
2) Se stabilete ipoteza alternativ:
H1 : 2 0,( adic 2 este semnificativ diferit de zero pentru un prag de semnificaie ales.
n = 42 >30 eantion de volum redus i pentru testare vom utiliza testul z.
tiind c pragul de semnificaie este 0,05 i k 2 (exist doi factori de influen) se stabilete:
valoarea critic: zcritic=1,96
Statistica testului este:
zcalc=
= 6,569650406
SE(b2)= Se
= 11,06179473
b2= 72,67212426
|z2|>zcritic(|6,569650406|>1,96)se accept H1 se respinge H0,parametrul 2 este semnificativ statistic,
este semnificativ 0.
4.Aplicarea analizei de tip ANOVA pentru validitatea modelului de
rezultatelor
df (numrul gradelor de libertate): k =1, n k-1=39, n 1=40, unde k=2 este numrul devariabile ale
modelului (variabila x, respectiv y), iar n = 42 este numrul de observaii.
SS(sumele de patrate) potrivit descompunerii:Suma global de ptrate = Suma de ptrate datorata
regresiei + Suma de ptrate rezidual;
46
2 y/x + e=y
y/x=
= 438492483637,798
47
e=
= = 152179109450,678
y=(y - )= 590671593088.476
Sy/x=
= 219246241818,899
Se=
= 3902028447,45327
Fcalc=
= 56,169
Fcritic=4
Fcalc>Fcristic(56,169>4)se respinge H0 se accept H1, modelul este valid, este corect identificat din punct
de vedere statistic.
5.Testarea ipotezelor clasice asupra modelului de regresie multipl
5.1 Ipoteze statistice clasice asupra modelului de regresie multipl
Ipoteza 1: Forma funcional:
Ipoteza de liniaritate se refer la felul n care parametrii intra n ecuaie, nu neaprat n rela ia
dintre variabila x si y.
Ipoteza 2: Media erorilor este zero:
=0
Ipoteza 3: Homoscedasticitatea:
Variabilele aleatoare
48
49
S 2 K 3 2
24
6
JB n
~ ;2
unde:
n = numrul de observaii;
S= coeficientul de asimetrie (skewness), ce msoar simetria distribuiei erorilor n jurul mediei
acestora, care este egal cu zero, avnd urmtoarea relaie de calcul:
1 n
yi y
n i 1
S
3
1 n
yi y
n i 1
K
4
Dac probabilitatea p(JB) corespunztoare valorii calculate a testului este suficient de sczut, atunci
ipoteza de normalitate a erorilor este respins, n timp ce, n caz contrar, pentru un nivel suficient de
ridicat al probabilitii ipoteza de normalitate a erorilor este acceptat, sau dac
ipoteza de normalitate a erorilor este respins.
2
; 2 =5,99
K = 2,89
S = 0,80
50
JB
;k , atunci
JB = 4,54
Utiliznd pachetul de programe EViews n vederea calculrii testului Jarque-Berra se constat c JB =
2
5,9915
4,54 > 0,05; 2
i c p(JB) =0,10. Deoarece valoarea calculat a testului J-B este < dect valoarea
2
tabelat a lui ;2 , iar probabilitatea ca testul J-B s nu depeasc valoarea tabelat este suficient de
mic, ipoteza de normalitate a erorilor poate fi respins.
5.4 Testarea ipotezei de homoscedasticitate
Verificarea ipotezei de homoscedasticitate a erorilor n cazul acestui model se va realiza cu ajutorul
testului White.
Aplicarea testului White presupune parcurgerea urmtoarelor etape:
- estimarea parametrilor modelului iniial i calculul valorilor estimate ale variabilei reziduale, u;
- construirea unei regresii auxiliare, bazat pe prespunerea existenei unei relaii de dependen ntre
ptratul valorilor erorii, variabila exogen inclus n modelul iniial i ptratul valorilor acesteia:
ei2 0 1 xi 2 x i2 i
i calcularea coeficientului de determinare, R2, corespunztor acestei regresii auxiliare;
- verificarea semnificaiei parametrilor modelului nou construit, iar dac unul dintre acetia este
nesemnificativ, atunci ipoteza de heteroscedasticitate a erorilor este acceptat.
Exist dou variante de aplicare a testului White:
- utilizarea testului Fisher Snedecor clasic, bazat pe ipoteza nulitii parametrilor, respectiv:
Dac ipoteza nul, potrivit creia rezultatele estimrii sunt nesemnificative ( Fc F ;k ;n k 1 ), este
acceptat, atunci ipoteza de homoscedasticitate se verific, cazul contrar semnificnd prezena
heteroscedasticitii erorilor.
- utilizarea testului LM, calculat ca produs ntre numrul de observaii corespunztoare modelului, n, i
coeficientul de determinare, R2, corespunztor acestei regresii auxiliare. n general, testul LM este
2
asimptotic distribuit sub forma unui ;v , pentru care numrul gradelor de libertate este egal cu: v k ,
unde k = numrul variabilelor exogene, respectiv:
2
LM n R 2 ~ ;k
Dac
LM
3.109995
Prob. F(5,36)
51
0.0196
Obs*R-squared
Scaled explained SS
12.66924
10.36474
Prob. Chi-Square(5)
Prob. Chi-Square(5)
0.0267
0.0655
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 05/04/14 Time: 23:41
Sample: 1 42
Included observations: 42
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
PRODUCTIAAGVEG
PRODUCTIAAGVEG^2
PRODUCTIAAGVEG*NRSEMANATOR
I
NRSEMANATORI
NRSEMANATORI^2
-9.30E+08
-1444.390
-0.011922
4.46E+09
17263.05
0.016149
-0.208510
-0.083669
-0.738259
0.8360
0.9338
0.4651
13.13196
3629157.
-2739.008
7.436338
3388176.
1043.055
1.765917
1.071124
-2.625946
0.0859
0.2912
0.0126
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.301649
0.204655
4.51E+09
7.31E+20
-989.9557
3.109995
0.019592
3.62E+09
5.05E+09
47.42646
47.67470
47.51745
2.286506
nu se verific.
i2
i 1
i 1
2
i
i compararea acestei mrimi d cu dou valori teoretice d 1 i d 2 , preluate din tabela DurbinWatson (vezi anexa nr. 1) n funcie de un prag de semnificaie
exogene k i de valorile observate n , n 15 .
52
i2
i 1
i 1
= 1,38
2
i
6. Previziunia valorii variabilei Y dac variabila X crete cu 10% fa de ultima valoare nregistrat
1
42
42
42
C(1)
C(2)
C(3)
Coefficient
Std. Error
t-Statistic
Prob.
8228.061
0.117056
72.67212
29474.66
0.053492
11.06179
0.279157
2.188282
6.569650
0.7816
0.0347
0.0000
53
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.742363
0.729150
62466.22
1.52E+11
-521.8192
56.18776
0.000000
201616.5
120027.6
24.99139
25.11551
25.03688
1.381565
Problema C
Folosind datele Problemei A, s se testeze dac dispersiile (variaiile) celor dou populaii (variabila
exogen i variabila endogen) sunt egale; testai dac mediile celor dou populaii sunt egale.
Rezolvarea problemei C de exemplificat n Excel, cu interpretarea rezultatelor i parcurgerea etapelor
testrii ipotezelor statistice.
Nr
crt.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
Judee
Bihor
Bistria-Nsud
Cluj
Maramure
Satu Mare
Slaj
Alba
Braov
Covasna
Harghita
Mure
Sibiu
Bacu
Botoani
Iai
Neam
Suceava
Vaslui
Brila
Buzu
Constana
Galai
Tulcea
Suprafaa cultivat
(hectare)
270183
86489
157307
73827
193528
106299
116044
92864
77243
70543
190117
78858
168400
271746
238669
157230
169971
267550
313766
243812
432228
265397
245774
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
Vrancea
Arge
Clrai
Dmbovia
Giurgiu
Ialomia
Prahova
Teleorman
Ilfov
Municipiul Bucureti
Dolj
Gorj
Mehedini
Olt
Vlcea
Arad
Cara-Severin
Hunedoara
Timi
607316
689518
622070
987017
491678
651968
492421
717421
374627
41678
1056598
446328
440979
788496
442155
865958
621434
456755
1195743
135474
160853
397989
163483
243597
344059
136091
439352
94614
1451
447679
92580
173019
360539
80628
285252
106230
66437
450720
zcalc=
55
Valoarea testului z este -11,30787865.Deoarece este un test bilateral,valoarea critic este 1,959963985
c zcalc<zcritic atunci se respinge H0 se accept H1 deci mediile sunt egale.
H 1 : 12 / 22 1 .
Fcalc=
56
Valoarea testului F este 0,255742161 .Deoarece este un test bilateral,valoarea critic este
0,594656101 c Fcalc<Fcritic atunci se respinge H1 se accept H0 deci dispersiile sunt egale.
Nr
crt.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
Judee
Bihor
Bistria-Nsud
Cluj
Maramure
Satu Mare
Slaj
Alba
Braov
Covasna
Harghita
Mure
Sibiu
Bacu
Botoani
Iai
Neam
Suceava
Vaslui
Brila
Buzu
Constana
Galai
Tulcea
Vrancea
Arge
Clrai
Dmbovia
Giurgiu
Ialomia
Prahova
Teleorman
Ilfov
Nr. semntori
(buci)
3167
465
1410
331
1684
919
1373
978
737
445
1899
716
1095
1280
1281
840
894
1461
1742
1100
2343
1464
1282
1069
1284
2442
1764
1845
1738
1051
3713
866
57
Suprafaa cultivat
(hectare)
270183
86489
157307
73827
193528
106299
116044
92864
77243
70543
190117
78858
168400
271746
238669
157230
169971
267550
313766
243812
432228
265397
245774
135474
160853
397989
163483
243597
344059
136091
439352
94614
33
34
35
36
37
38
39
40
41
42
Municipiul Bucureti
Dolj
Gorj
Mehedini
Olt
Vlcea
Arad
Cara-Severin
Hunedoara
Timi
17
4532
871
1777
3501
472
3505
894
1041
5444
1451
447679
92580
173019
360539
80628
285252
106230
66437
450720
zcalc=
Valoarea testului z este 10,7997485. Deoarece este un test bilateral,valoarea critic este 1,959963985
c zcalc>zcritic atunci se respinge H1 se accept H0 deci mediile nu sunt egale.
TESTAREA IPOTEZEI PRIVIND RAPORTUL DINTRE DOU DISPERSII
Ipotezele statistice sunt:
58
H 0 : 12 / 22 1 ,
H 1 : 12 / 22 1 .
Fcalc=
Valoarea testului F este 10936,41147 . Deoarece este un test bilateral,valoarea critic este
1,681644228 c Fcalc>Fcritic atunci se respinge H0 se accept H1 deci dispersiile nu sunt egale.
59