Sunteți pe pagina 1din 59

ACADEMIA DE STUDII ECONOMICE

PROIECT ECONOMETRIE

Profesor coordonator: Lavinia oan

Student:
Cristina- Nicoleta Porumb
Grupa 144, seria C, an III

Bucureti
2014
1

Problema A
nregistrai pentru 42 de uniti (judee), valorile specifice ale unei perechi de caracteristici (X i
Y) ntre care exist o legtur logic. Datele prezentate sub forma tabelar fac parte din lucrare.
1. Prezentarea problemei (inclusiv descrierea naturii legturii dintre cele dou variabile, conform teoriei
economice);
2. Definirea modelului de regresie simpl liniar
2.1- Forma, variabilele i parametrii modelului de regresie
2.2- Reprezentarea grafic a modelului legturii dintre variabile
3. Estimarea parametrilor modelului i interpretarea acestora
3.1- Estimarea punctual a parametrilor
3.2- Estimarea parametrilor prin interval de ncredere
4. Testarea semnificaiei corelaiei i a parametrilor modelului de regresie
4.1- Testarea semnificaiei corelaiei
4.2- Testarea parametrilor unui model de regresie simplu
5. Aplicarea analizei de tip ANOVA pentru validitatea modelului de
regresie simplu i interpretarea
rezultatelor
6. Testarea ipotezelor clasice asupra modelului de regresie simpl
6.1- Ipoteze statistice clasice supra modelului de regresie simpl
6.2- Testarea liniaritii modelului propus
6.3- Testarea normalitii erorilor
6.4- Testarea ipotezei de homoscedasticitate
6.5- Testarea ipotezei de autocorelare a erorilor
7.
Previziunea valorii variabilei Y dac variabila X crete cu 10% fa de ultima valoare nregistrat
(inclusiv interval de ncredere) pentru toate variantele cunoscute.
Rezolvarea problemei A de exemplificat att n Excel ct i n Eviews.

Rezolvare problema A
suprafaa cultivat=f(producia agricol vegetal, nr. semntori) n anul 2005 pentru 42 judee
A1
1. Informaiile despre cele 42 de judete i cele 2 variabile pentru anul 2005 se regsesc n tabelul
urmtor.
y = variabil endogen (dependent), x = variabil exogen (independent)
y = Suprafaa cultivat;
x1 = Producia agricol vegetal.
2

Nr
crt.
1
2
3
4
5
6
7
8
9
10
11
12
13

Judee
Bihor
Bistria-Nsud
Cluj
Maramure
Satu Mare
Slaj
Alba
Braov
Covasna
Harghita
Mure
Sibiu
Bacu

Producia agricol vegetal


(mii lei)
879070
579280
922061
563843
649426
442894
534755
450171
466240
403047
873152
410084
685610

Suprafaa cultivat
(hectare)
270183
86489
157307
73827
193528
106299
116044
92864
77243
70543
190117
78858
168400

14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42

Botoani
Iai
Neam
Suceava
Vaslui
Brila
Buzu
Constana
Galai
Tulcea
Vrancea
Arge
Clrai
Dmbovia
Giurgiu
Ialomia
Prahova
Teleorman
Ilfov
Municipiul Bucureti
Dolj
Gorj
Mehedini
Olt
Vlcea
Arad
Cara-Severin
Hunedoara
Timi

790955
1005521
651561
985909
689718
727750
725575
981963
1052650
497580
607316
689518
622070
987017
491678
651968
492421
717421
374627
41678
1056598
446328
440979
788496
442155
865958
621434
456755
1195743

271746
238669
157230
169971
267550
313766
243812
432228
265397
245774
135474
160853
397989
163483
243597
344059
136091
439352
94614
1451
447679
92580
173019
360539
80628
285252
106230
66437
450720

Datele pentru realizarea acestui proiect au fost preluate din Statistic Teritorial editat de INSS, din
anul statistic 2005.
2. Definirea modelului de regresie simpl liniar
2.1- Forma, variabilele i parametrii modelului de regresie
Forma:
4

Modelul de regresie simpl reprezint acel model care descrie legtura dintre factorul cauzal (exogen)
x i factorul de efect (de ieire, endogen) notat y. Forma ecuaiei de regresie simpl liniar este
urmtoarea:
y f(x)

y 0 1 x

Suprafaa cultivat=f(nr. semntori)


Variabilele:
La nivelul unitii statistice i, dependena dintre variabile este:
yi o 1 xi i

Unde:
i reprezint eroarea aleatoare (componenta rezidual) pentru unitatea statistic respectiv.
yi variabila efect (endogen) suprafaa cultivat
xi variabila cauz (exogen) nr. semntori
o termenul liber al ecuaiei
1 coeficientul variabilei independente (panta de regresie).

Parametrii
Parametrii modelului econometric sunt cei care fac obiectul procesului de estimare i testare statistic.
Sunt numii i coeficieni de regresie, sunt mrimi reale, fixe dar necunoscute care apar n model n
diferite expresii alturi de variabile.
Forma: =

na b xi y i
i 1
i 1

i 1

i 1

i 1

a xi b xi2 xi yi

=
=
Parametrii modelului :
= -26022,21
= 0,34
y i 61537,08 88,16 xi

2.2- Reprezentarea grafic a modelului legturii dintre variabile


Direcia i forma legturii dintre variabile poate fi corelograma sau diagrama de norului de puncte.

3. Estimarea parametrilor modelului i interpretarea acestora


3.1- Estimarea punctual a parametrilor

na b xi y i
i 1
i 1

i 1

i 1

i 1

a xi b xi2 xi yi
Parametrii modelului :

= -26022,21
= 0,34
1.Abaterea medie ptratica a valorii reziduale
Se=

= 8014796326

2.Abaterea medie ptratica a estimatorului

SE( )=Se

= 41576,4712

3.Abaterea medie ptratica a estimatorului

SE( )=Se

= 0,0589

3.2- Estimarea parametrilor prin interval de ncredere

= -26022,21
= 0,34
a a z critic s a

(-110051,3988; 58006,9667)
Parametrul

nu este seminificativ statistic deoarce intervalul de incredere include valoarea nul .

b b z critic s b

(0,2229; 0,4610)
7

Pramentrul

este semnificativ statistic doarece intervalul de incredere nu include valoarea nul.

Estimarea parametrilor modelului de regresie liniara cu ajutorul programului EViews :

4. Testarea semnificaiei corelaiei i a parametrilor modelului de regresie


4.1- Testarea semnificaiei corelaiei

1. Coeficientul de corelaie liniar


Este un indicator sintetic care msoar intensitatea legturii liniare dintre dou variabile i se
calculeaz ca medie a produselor abaterilor normale normate.
ry/x=

= 0,676

Multiple R (coeficientul de corelaie sau r y/x) = 0,676. Observm c valoarealui ry/x este > 0, ceea ce
inseamn ca ntre cele dou variabile considerate: suprafaa cultivat si producia agricol vegetal
exist o legatur direct.
Testarea semnificatiei coeficientului de corelatie ry/x
- se stabilete ipoteza nul: H0: ry/x = 0;
- se stabilete ipoteza alternativ: H1: ry/x 0
- se calculeaz testul t:

zry/x=

= 5,797

zry/x>zcritic(5,797 > 1,96) se respinge H0 se accept H1,coeficientul de corelatie este semnificativ


statistic,semnificativ diferit de 0.
2. Raportul de corelatie (Ry/x)
Este un indicator sintetic utilizat att pentru msurarea intensitii legturilor dintre variabile, ct i
pentru validarea modelelor de regresie.

Ry/x=

= 0,676

Deoarece Ry/x = ry/x = 0,676, apreciem c exist o legtur liniar, puternic i direct ntre cele dou
variabile.
Testarea semnificatiei raportului de corelatie Ry/x
- se stabilete ipoteza nul: H0: Ry/x = 0;
- se stabilete ipoteza alternativ: H1: Ry/x 0
- se calculeaz testul Fisher
9

FRy/x=

40 = 33,69

FRy/x>Fcritic(33,69 > 4) se respinge H0 se accept H1,raporul de corelaie este semnificativ


statistic,semnificativ diferit de 0.
3.Coeficinetul de determinaie(R2)
R2=

=0,457

R2(0,1)
46% din suprafaa cultivat este influenat de producia agricol vegetal, restul de 54 % reprezentnd
influena altor factori.
Testarea semnificatiei coeficientul de determinaieR2
- se stabilete ipoteza nul: H0: R2 = 0;
- se stabilete ipoteza alternativ: H1: R2 0
- se calculeaz testul Fisher

F R2 =

40 = 33,69

FR2>Fcritic(33,69 > 4) se respinge H0 se accept H1,coeficientul de determinaie este


.

4.2- Testarea parametrilor unui model de regresie simplu

= -26022,21
= 0,34

10

Testarea semnificatiei lui


1) Se stabilete ipoteza nul:
H0 :

=0

2) Se stabilete ipoteza alternativ:


H1 :

0, adic

z =

este semnificativ diferit de zero pentru un prag de semnificaie ales.

= -0,62588

SE( )=standard error

SE( )=Se

= 41576,47

zcritic=1,96
|z |<zcritic(|-0,62588|<1,96) se accept H0 se respinge H1,parametrul

nu este semnificativ statistic,nu

este semnificativ diferit de 0.


Testarea semnificatiei lui
1) Se stabilete ipoteza nul:
H0 :

=0

2) Se stabilete ipoteza alternativ:


H1 :

0, adic

este semnificativ diferit de zero pentru un prag de semnificaie ales.

Testul Student

z =

= 5,80496

SE( )=standard error

11

SE( )=Se

= 0,058

zcritic=1,96
z

zcritic(5,80496 > 1,96)se accept H1 se respinge H0,parametrul

este semnificativ statistic, este

semnificativ diferit de 0.

5. Aplicarea analizei de tip ANOVA pentru validitatea modelului de


rezultatelor

regresie simplu i interpretarea

df (numrul gradelor de libertate): k =1, n k-1=40, n 1=41, unde k=1 este numrul devariabile ale
modelului (variabila x, respectiv y), iar n = 42 este numrul de observaii.
SS(sumele de patrate) potrivit descompunerii:Suma global de ptrate = Suma de ptrate datorata
regresiei + Suma de ptrate rezidual;
MS(media sumelor de ptrate): SS mparit la numrul respectiv de grade delibertate.Valoarea de pe
linia a doua (Residual ) este estimaia dispersiei pentru repartiia erorilor ieste ptratul erorii standard a
estimaiei.
F(valoarea statisticii F) pentru testul caracterizat de:
H0: modelul nu este valid statistic;
H1: modelul este valid statistic;
Significance F(probabilitatea critic unilateral). Dac valoarea rezultat este < dect pragul de
semnificaie fixat, atunci se respinge ipoteza nul n favoarea ipotezei alternative.

12

2 y/x + e=y
y/x=
e=

= 270079740016,507
= = 320591853071,969

13

y=(y - ) = 590671593088,476

Sy/x =

= 270079740016,507

Se =

= 8014796326,79924

Fcalc =

= 33,69764234

Fcritic = 4
Fcalc>Fcristic(33.69764234 > 4) se respinge H0 se accept H1modelul este valid,corect identificat din
punct de vedere statistic.
6. Testarea ipotezelor clasice asupra modelului de regresie simpl
6.1- Ipoteze statistice clasice supra modelului de regresie simpl
Ipoteza 1: Forma funcional:

Ipoteza de liniaritate se refer la felul n care parametrii intra n ecuaie, nu neaprat n relaia
dintre variabila x si y.
Ipoteza 2: Media erorilor este zero:
=0
Ipoteza 3: Homoscedasticitatea:

Variabilele aleatoare

au dispersie constant, dispersia reziduurilor n populaie este constant

pentru toate valorile xi.

14

Ipoteza 4: Non-autocorelarea erorilor (deviaiile observaiilor de la valorile lor ateptate sunt


necorelate).
= 0 ij
Ipoteza 5 : Variabila aleatoare

este normal distribuit.

Ipoteza 6: Necorelarea ntre regresor i erori.


)=0
6.2 Testarea liniaritii modelului propus

6.3 Testarea normalitii erorilor


Verificarea ipotezei de normalitate a erorilor se va realiza cu ajutorul testului Jarque-Berra, care este i
el un test asimptotic (valabil n cazul unui eantion de volum mare), ce urmeaz o distribuie hi ptrat cu
un numr al gradelor de libertate egal cu 2, avnd urmtoarea form:
S 2 K 3 2

24
6

JB n

~ ;2

unde:
n = numrul de observaii;
15

S= coeficientul de asimetrie (skewness), ce msoar simetria distribuiei erorilor n jurul mediei


acestora, care este egal cu zero, avnd urmtoarea relaie de calcul:

1 n
yi y
n i 1
S
3

K = coeficientul de aplatizare calculat de Pearson (kurtosis), ce msoar boltirea distribuiei (ct de


ascuit sau de aplatizat este distribuia comparativ cu distribuia normal), avnd urmtoarea relaie
de calcul:

1 n
yi y
n i 1
K
4

Dac probabilitatea p(JB) corespunztoare valorii calculate a testului este suficient de sczut, atunci
ipoteza de normalitate a erorilor este respins, n timp ce, n caz contrar, pentru un nivel suficient de
ridicat al probabilitii ipoteza de normalitate a erorilor este acceptat, sau dac
ipoteza de normalitate a erorilor este respins.

JB

;k , atunci

; 2 =5,99

K = 2,94
S = 0,67
JB = 3,16
Utiliznd pachetul de programe EViews n vederea calculrii testului Jarque-Berra se constat c JB =
2

3,16 < 0, 05; 2

5,9915

i c p(JB) =0,20. Deoarece valoarea calculat a testului J-B este < dect
2

valoarea tabelat a lui ; 2 , iar probabilitatea ca testul J-B s nu depeasc valoarea tabelat este
suficient de mic, ipoteza de normalitate a erorilor poate fi respins.
16

6.4- Testarea ipotezei de homoscedasticitate


Verificarea ipotezei de homoscedasticitate a erorilor n cazul acestui model se va realiza cu ajutorul
testului White.
Aplicarea testului White presupune parcurgerea urmtoarelor etape:
- estimarea parametrilor modelului iniial i calculul valorilor estimate ale variabilei reziduale, u;
- construirea unei regresii auxiliare, bazat pe prespunerea existenei unei relaii de dependen ntre
ptratul valorilor erorii, variabila exogen inclus n modelul iniial i ptratul valorilor acesteia:

ei2 0 1 xi 2 x i2 i
i calcularea coeficientului de determinare, R2, corespunztor acestei regresii auxiliare;
- verificarea semnificaiei parametrilor modelului nou construit, iar dac unul dintre acetia este
nesemnificativ, atunci ipoteza de heteroscedasticitate a erorilor este acceptat.
Exist dou variante de aplicare a testului White:
- utilizarea testului Fisher Snedecor clasic, bazat pe ipoteza nulitii parametrilor, respectiv:
Dac ipoteza nul, potrivit creia rezultatele estimrii sunt nesemnificative ( Fc F ;k ;n k 1 ), este
acceptat, atunci ipoteza de homoscedasticitate se verific, cazul contrar semnificnd prezena
heteroscedasticitii erorilor.
- utilizarea testului LM, calculat ca produs ntre numrul de observaii corespunztoare modelului, n, i
coeficientul de determinare, R2, corespunztor acestei regresii auxiliare. n general, testul LM este
2

asimptotic distribuit sub forma unui ;v , pentru care numrul gradelor de libertate este egal cu: v k ,
unde k = numrul variabilelor exogene, respectiv:
2

LM n R 2 ~ ;k

Dac

LM

;k , erorile sunt heteroscedastice, n caz contrar, sunt homoscedastice, respectiv

ipoteza nulitii parametrilor, 0 1 2 0 , este acceptat.

Aplicarea testului White s-a realizat utiliznd pachetul de programe EViews:


Heteroskedasticity Test: White
F-statistic
Obs*R-squared
Scaled explained SS

1.926492
3.776291
3.333797

Prob. F(2,39)
Prob. Chi-Square(2)
Prob. Chi-Square(2)

Test Equation:
Dependent Variable: RESID^2
Method: Least Squares

17

0.1593
0.1514
0.1888

Date: 05/03/14 Time: 11:23


Sample: 1 42
Included observations: 42
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
PRODAGRICOLAVEG
PRODAGRICOLAVEG^2

-7.84E+09
36635.13
-0.017902

1.00E+10
30158.01
0.021634

-0.780841
1.214773
-0.827506

0.4396
0.2318
0.4130

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.089912
0.043241
1.05E+10
4.34E+21
-1027.347
1.926492
0.159268

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

7.63E+09
1.08E+10
49.06415
49.18827
49.10964
1.984349

Analiznd rezultatele afiate de programul EViews se constat c Fc 1,926 F0, 05; 2;7 4,74 i
LM 3,776

< 0, 05; 2

5,99

, iar estimatorii parametrilor modelului sunt semnificativi pentru un prag de

semnificaie 0,05 ( z 0, 05;10 2,228 ), deci ipoteza de homoscedasticitate nu se verific.


6.5- Testarea ipotezei de autocorelare a erorilor

Verificarea ipotezei de independen a erorilor n cazul acestui model va fi realizat cu ajutorul testului
Durbin-Watson i const n calcularea termenului empiric:
n


i2

i 1

i 1

2
i

i compararea acestei mrimi d cu dou valori teoretice d 1 i d 2 , preluate din tabela DurbinWatson (vezi anexa nr. 1) n funcie de un prag de semnificaie , arbitrar ales, de numrul variabilelor
exogene k i de valorile observate n , n 15 .
Acceptarea sau respingerea ipotezei de independen a erorilor se bazeaz pe o anumit regul,
care const n:
- dac 0 d d 1 autocorelare pozitiv;
- dac d 1 d d 2 indecizie, recomandndu-se acceptarea autocorelrii pozitive;
- dac d 2 d 4 d 2 erorile sunt independente;
- dac 4 d 2 d 4 d 1 indecizie, recomandndu-se acceptarea autocorelrii
negative;
- dac 4 d 1 d 4 autocorelare negativ.
18

Pe baza datelor problemei, valoarea empiric a variabilei Durbin-Watson este:


n


i2

i 1

i 1

= 2,12
2
i

Lucrnd cu un prag de semnificaie 0,05 , numrul variabilelor exogene fiind k 1 , iar numrul
observaiilor n 42 , din tabela distribuiei Durbin-Watson se citesc valorile (pentru cazul n 45 )
d1 1,48 i d 2 1,57 .
7. Previziunia valorii variabilei Y dac variabila X crete cu 10% fa de ultima valoare nregistrat
Cum xn+v = 10%
0

42

42

x = x + 10% x = 1195743 +119574,3 = 1315317,3


y n v -26022.21606 + 0.341959069 * 1315317,3 = 423762,4632

Pentru estimarea pe baza unui interval de ncredere vom avea:


y n v t / 2; n k 1 s y nv yn v y n v t / 2; n k 1 s y nv

423762,4632-1,9691663,74

s y n v

x
x
1
s 1 nv
n

i xi x

2
u

423762,4632+1,9691663,74

91663,74
Deci, intervalul de ncredere pentru suprafaa cultivat:
244101,5328

603423,3936

19

A2
1. Prezentarea problemei (inclusiv descrierea naturii legturii dintre cele dou variabile, conform
teoriei economice);
Informaiile despre cele 42 de judete i cele 2 variabile pentru anul 2005 se regsesc n tabelul
urmtor.
y = variabil endogen (dependent), x = variabil exogen (independent)
y = Suprafaa cultivat;
x2 = Nr. semntori.
Nr
crt.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23

Judee
Bihor
Bistria-Nsud
Cluj
Maramure
Satu Mare
Slaj
Alba
Braov
Covasna
Harghita
Mure
Sibiu
Bacu
Botoani
Iai
Neam
Suceava
Vaslui
Brila
Buzu
Constana
Galai
Tulcea

Nr. semntori
(buci)
3167
465
1410
331
1684
919
1373
978
737
445
1899
716
1095
1280
1281
840
894
1461
1742
1100
2343
1464
1282
20

Suprafaa cultivat
(hectare)
270183
86489
157307
73827
193528
106299
116044
92864
77243
70543
190117
78858
168400
271746
238669
157230
169971
267550
313766
243812
432228
265397
245774

24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42

Vrancea
Arge
Clrai
Dmbovia
Giurgiu
Ialomia
Prahova
Teleorman
Ilfov
Municipiul Bucureti
Dolj
Gorj
Mehedini
Olt
Vlcea
Arad
Cara-Severin
Hunedoara
Timi

1069
1284
2442
1764
1845
1738
1051
3713
866
17
4532
871
1777
3501
472
3505
894
1041
5444

135474
160853
397989
163483
243597
344059
136091
439352
94614
1451
447679
92580
173019
360539
80628
285252
106230
66437
450720

Datele pentru realizarea acestui proiect au fost preluate din Statistic Teritorial editat de INSS, din
anul statistic 2005.
2. Definirea modelului de regresie simpl liniar
2.1- Forma, variabilele i parametrii modelului de regresie

Forma:
Modelul de regresie simpl reprezint acel model care descrie legtura dintre factorul cauzal (exogen)
x i factorul de efect (de ieire, endogen) notat y. Forma ecuaiei de regresie simpl liniar este
urmtoarea:
y f(x)

y 0 1 x

Suprafaa cultivat=f(nr. semntori)


Variabilele:
21

La nivelul unitii statistice i, dependena dintre variabile este:


yi o 1 xi i

Unde:
i reprezint eroarea aleatoare (componenta rezidual) pentru unitatea statistic respectiv.

variabila efect (endogen) suprafaa cultivat


y

i
xi variabila cauz (exogen) nr. semntori

o termenul liber al ecuaiei


1 coeficientul variabilei independente (panta de regresie).
Parametrii
Parametrii modelului econometric sunt cei care fac obiectul procesului de estimare i testare statistic.
Sunt numii i coeficieni de regresie, sunt mrimi reale, fixe dar necunoscute care apar n model n
diferite expresii alturi de variabile.
Forma: =

na b xi y i
i 1
i 1

i 1

i 1

i 1

a xi b xi2 xi yi

=
=
Parametrii modelului :

= 61537,08
22

= 88,16

y i 61537,08 88,16 xi

2.2- Reprezentarea grafic a modelului legturii dintre variabile

Direcia i forma legturii dintre variabile poate fi corelograma sau diagrama de norului de puncte.

3.

Estimarea parametrilor modelului i interpretarea acestora

3.1- Estimarea punctual a parametrilor

na b xi y i
i 1
i 1

i 1

i 1

i 1

a xi b xi2 xi yi
Parametrii modelului :
= 61537,08
= 88,16

23

1.Abaterea medie ptratica a valorii reziduale

= 4271606766

Se=

2.Abaterea medie ptratica a estimatorului

SE( )=Se

= 17359,84

3.Abaterea medie ptratica a estimatorului

SE( )=Se

= 8,89

3.2- Estimarea parametrilor prin interval de ncredere

= 61537,08
= 88,16
a a z critic s a

(26451,52824; 96622,6494)
Parametrul

nu este seminificativ statistic deoarce intervalul de incredere include valoarea nul .

b b z critic s b

(70,18970526; 106,137522)
Pramentrul

este semnificativ statistic doarece intervalul de incredere nu include valoarea nul.

Estimarea parametrilor modelului de regresie liniara cu ajutorul programului EViews :

24

4. Testarea semnificaiei corelaiei i a parametrilor modelului de regresie


4.1- Testarea semnificaiei corelaiei

1. Coeficientul de corelaie liniar


Este un indicator sintetic care msoar intensitatea legturii liniare dintre dou variabile i se
calculeaz ca medie a produselor abaterilor normale normate.

25

ry/x=

= 0,843

Multiple R (coeficientul de corelaie sau ry/x) = 0,843. Observm c valoarealui ry/x este > 0, ceea ce
nseamn ca ntre cele dou variabile considerate: suprafaa cultivat si numrul semntorilor exist o
legatur directa.
Testarea semnificatiei coeficientului de corelatie ry/x
- se stabilete ipoteza nul: H0: ry/x = 0;
- se stabilete ipoteza alternativ: H1: ry/x 0
- se calculeaz testul t:

zry/x=

= 9,921

zry/x>zcritic(9,921 > 1,96) se respinge H 0 se accepta H1,coeficientul de corelatie este semnificativ


statistic,semnificativ diferit de 0.
2. Raportul de corelatie (Ry/x)
Este un indicator sintetic utilizat att pentru msurarea intensitii legturilor dintre variabile, ct i
pentru validarea modelelor de regresie.

Ry/x=

= 0,843

Deoarece Ry/x = ry/x = 0,843, apreciem c exist o legtur liniar, puternic i direct ntre cele dou
variabile.
Testarea semnificatiei raportului de corelatie Ry/x
- se stabilete ipoteza nul: H0: Ry/x = 0;
- se stabilete ipoteza alternativ: H1: Ry/x 0
- se calculeaz testul Fisher

FRy/x=

40 = 98,278

FRy/x>Fcritic(98,278 > 4) se respinge H0 se accepta H1,raporul de corelaie este semnificativ


statistic,semnificativ diferit de 0.
3.Coeficinetul de determinaie(R2)
26

R2=

=0,710

R2(0,1)
71% din suprafaa cultivat este influenat de numrul semntorilor, restul de 29 % reprezentnd
influena altor factori.
Testarea semnificatiei coeficientul de determinaieR2
- se stabilete ipoteza nul: H0: R2 = 0;
- se stabilete ipoteza alternativ: H1: R2 0
- se calculeaz testul Fisher

F R2 =

40 = 98,278

FR2>Fcritic(98,278 > 4) se respinge H0 se accepta H1,coeficientul de determinaie este


.

4.2- Testarea parametrilor unui model de regresie simplu

= 61537,08
= 88,16
Testarea semnificatiei lui
1) Se stabilete ipoteza nul:
H0 :

=0

2) Se stabilete ipoteza alternativ:


H1 :

0, adic

este semnificativ diferit de zero pentru un prag de semnificaie ales.

27

z =

= 3,544794

SE( )=standard error


SE( )=Se

= 17359,84

zcritic=1,96
|z |<zcritic(|3,544794|<1,96) se accept H0 se respinge H1,parametrul

nu este semnificativ statistic,nu

este semnificativ diferit de 0.

Testarea semnificatiei lui


1) Se stabilete ipoteza nul:
H0 :

=0

2) Se stabilete ipoteza alternativ:


H1 :

0, adic

z =

este semnificativ diferit de zero pentru un prag de semnificaie ales.

= 9,91355

SE( )=standard error


SE( )=Se

= 8,89

zcritic=1,96
z <zcritic(9,91355 > 1,96) se accept H1 se respinge H0,parametrul

este semnificativ statistic, este

semnificativ diferit de 0.
5. Aplicarea analizei de tip ANOVA pentru validitatea modelului de
rezultatelor
28

regresie simplu i interpretarea

df (numrul gradelor de libertate): k =1, n k-1=40, n 1=41, unde k=1 este numrul devariabile ale
modelului (variabila x, respectiv y), iar n = 42 este numrul de observaii.
SS(sumele de patrate) potrivit descompunerii:Suma global de ptrate = Suma de ptrate datorata
regresiei + Suma de ptrate rezidual;
MS(media sumelor de ptrate): SS mparit la numrul respectiv de grade delibertate.Valoarea de pe
linia a doua (Residual ) este estimaia dispersiei pentru repartiia erorilor ieste ptratul erorii standard a
estimaiei.
F(valoarea statisticii F) pentru testul caracterizat de:
H0: modelul nu este valid statistic;
H1: modelul este valid statistic;
Significance F(probabilitatea critic unilateral). Dac valoarea rezultat este < dect pragul de
semnificaie fixat, atunci se respinge ipoteza nul n favoarea ipotezei alternative.

29

2 y/x + e=y
y/x=
e=

= 419807322420,426
= = 170864270668,050

y=(y- )= 590671593088,476

30

Sy/x =

= 419807322420,426

Se =

= 4271606766,70125

Fcalc =

= 98,2785508

Fcritic= 4
Fcalc>Fcristic(98,2785508 > 4) se respinge H0 se accepta H1modelul este valid,corect identificat din
punct de vedere statistic.
6. Testarea ipotezelor clasice asupra modelului de regresie simpl
6.1- Ipoteze statistice clasice supra modelului de regresie simpl
Ipoteza 1: Forma funcional:

Ipoteza de liniaritate se refer la felul n care parametrii intra n ecuaie, nu neaprat n rela ia
dintre variabila x si y.
Ipoteza 2: Media erorilor este zero:
=0
Ipoteza 3: Homoscedasticitatea:

Variabilele aleatoare

au dispersie constant, dispersia reziduurilor n populaie este constant

pentru toate valorile xi.


Ipoteza 4: Non-autocorelarea erorilor (deviaiile observaiilor de la valorile lor ateptate sunt
necorelate).

31

= 0 ij
Ipoteza 5 : Variabila aleatoare

este normal distribuit.

Ipoteza 6: Necorelarea ntre regresor i erori.


)=0
6.2 Testarea liniaritii modelului propus

6.3 Testarea normalitii erorilor


Verificarea ipotezei de normalitate a erorilor se va realiza cu ajutorul testului Jarque-Berra, care este i
el un test asimptotic (valabil n cazul unui eantion de volum mare), ce urmeaz o distribuie hi ptrat cu
un numr al gradelor de libertate egal cu 2, avnd urmtoarea form:
S 2 K 3 2

24
6

JB n

~ ;2

unde:
n = numrul de observaii;
S= coeficientul de asimetrie (skewness), ce msoar simetria distribuiei erorilor n jurul mediei
acestora, care este egal cu zero, avnd urmtoarea relaie de calcul:

32

1 n
yi y
n i 1
S
3

K = coeficientul de aplatizare calculat de Pearson (kurtosis), ce msoar boltirea distribuiei (ct de


ascuit sau de aplatizat este distribuia comparativ cu distribuia normal), avnd urmtoarea relaie
de calcul:

1 n
yi y
n i 1
K
4

Dac probabilitatea p(JB) corespunztoare valorii calculate a testului este suficient de sczut, atunci
ipoteza de normalitate a erorilor este respins, n timp ce, n caz contrar, pentru un nivel suficient de
ridicat al probabilitii ipoteza de normalitate a erorilor este acceptat, sau dac
ipoteza de normalitate a erorilor este respins.

JB

;k

, atunci

; 2 =5,99

K = 2,67
S = 0,78
JB = 4,53
Utiliznd pachetul de programe EViews n vederea calculrii testului Jarque-Berra se constat c JB =
2

4,53 < 0, 05; 2

5,9915

i c p(JB) =0,10. Deoarece valoarea calculat a testului J-B este < dect

33

valoarea tabelat a lui ; 2 , iar probabilitatea ca testul J-B s nu depeasc valoarea tabelat este
suficient de mic, ipoteza de normalitate a erorilor poate fi respins.
6.4- Testarea ipotezei de homoscedasticitate
Verificarea ipotezei de homoscedasticitate a erorilor n cazul acestui model se va realiza cu ajutorul
testului White.
Aplicarea testului White presupune parcurgerea urmtoarelor etape:
- estimarea parametrilor modelului iniial i calculul valorilor estimate ale variabilei reziduale, u;
- construirea unei regresii auxiliare, bazat pe prespunerea existenei unei relaii de dependen ntre
ptratul valorilor erorii, variabila exogen inclus n modelul iniial i ptratul valorilor acesteia:

ei2 0 1 xi 2 x i2 i
i calcularea coeficientului de determinare, R2, corespunztor acestei regresii auxiliare;
- verificarea semnificaiei parametrilor modelului nou construit, iar dac unul dintre acetia este
nesemnificativ, atunci ipoteza de heteroscedasticitate a erorilor este acceptat.
Exist dou variante de aplicare a testului White:
- utilizarea testului Fisher Snedecor clasic, bazat pe ipoteza nulitii parametrilor, respectiv:

Dac ipoteza nul, potrivit creia rezultatele estimrii sunt nesemnificative ( Fc F ;k ;n k 1 ), este
acceptat, atunci ipoteza de homoscedasticitate se verific, cazul contrar semnificnd prezena
heteroscedasticitii erorilor.
- utilizarea testului LM, calculat ca produs ntre numrul de observaii corespunztoare modelului, n, i
coeficientul de determinare, R2, corespunztor acestei regresii auxiliare. n general, testul LM este
2

asimptotic distribuit sub forma unui ;v , pentru care numrul gradelor de libertate este egal cu: v k ,
unde k = numrul variabilelor exogene, respectiv:
2

LM n R 2 ~ ;k

Dac

LM

;k , erorile sunt heteroscedastice, n caz contrar, sunt homoscedastice, respectiv

ipoteza nulitii parametrilor, 0 1 2 0 , este acceptat.

34

Aplicarea testului White s-a realizat utiliznd pachetul de programe EViews:


Heteroskedasticity Test: White
F-statistic
Obs*R-squared
Scaled explained SS

3.002685
5.604342
4.256073

Prob. F(2,39)
Prob. Chi-Square(2)
Prob. Chi-Square(2)

0.0612
0.0607
0.1191

Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 05/03/14 Time: 05:29
Sample: 1 42
Included observations: 42
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
NRSEMANATORI
NRSEMANATORI^2

-1.12E+09
5242015.
-823.7831

2.30E+09
2373107.
456.7700

-0.486885
2.208925
-1.803496

0.6291
0.0331
0.0790

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.133437
0.088998
5.09E+09
1.01E+21
-996.7255
3.002685
0.061250

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

4.07E+09
5.33E+09
47.60598
47.73010
47.65147
1.918872

Analiznd rezultatele afiate de programul EViews se constat c Fc 3,002 F0, 05; 2;7 4,74 i
LM 5,604

< 0, 05; 2

5,99

, iar estimatorii parametrilor modelului sunt semnificativi pentru un prag de

semnificaie 0,05 ( t0, 05;10 2,228 ), deci ipoteza de homoscedasticitate nu se verific.


6.5- Testarea ipotezei de autocorelare a erorilor
Verificarea ipotezei de independen a erorilor n cazul acestui model va fi realizat cu ajutorul testului
Durbin-Watson i const n calcularea termenului empiric:
n


i2

i 1

i 1

2
i

35

i compararea acestei mrimi d cu dou valori teoretice d 1 i d 2 , preluate din tabela DurbinWatson (vezi anexa nr. 1) n funcie de un prag de semnificaie

, arbitrar ales, de numrul variabilelor

exogene k i de valorile observate n, n 15 .


Acceptarea sau respingerea ipotezei de independen a erorilor se bazeaz pe o anumit regul,
care const n:
- dac 0 d d 1 autocorelare pozitiv;
- dac d 1 d d 2 indecizie, recomandndu-se acceptarea autocorelrii pozitive;
- dac d 2 d 4 d 2 erorile sunt independente;
- dac 4 d 2 d 4 d 1 indecizie, recomandndu-se acceptarea autocorelrii
negative;
4

1
- dac
autocorelare negativ.

Pe baza datelor problemei, valoarea empiric a variabilei Durbin-Watson este:


n


i2

i 1

i 1

= 0,93
2
i

Lucrnd cu un prag de semnificaie 0,05 , numrul variabilelor exogene fiind k 1 , iar numrul
observaiilor n 42 , din tabela distribuiei Durbin-Watson se citesc valorile (pentru cazul n 45 )
d1 1,48 i d 2 1,57 .
7. Previziunia valorii variabilei Y dac variabila X crete cu 10% fa de ultima valoare nregistrat
Cum xn+v = 10%
xn+v = X42 + 10% X42 = 5444 + 544,4 = 5988,4
y n v 61537,08882 + 88,1636137*5988,4 = 589496,0731 Suprafaa cultivat

36

Pentru estimarea pe baza unui interval de ncredere vom avea:


y n v t / 2; n k 1 s y nv yn v y n v t / 2; n k 1 s y nv

589496,0731 -1,965228817,83

s y n v

x
x
1
s 1 nv
n

i xi x

2
u

589496,0731 +1,965228817,83

= 5228817,83
Deci, intervalul de ncredere pentru suprafaa cultivat:
-9658986,8737

10837979,0199

Problema B
1. Definirea modelului de regresie multipl liniar
1.1- Forma, variabilele, parametrii modelului de regresie multipl
1.2 -Reprezentarea grafic a modelului legturii dintre variabile
1.

Estimarea parametrilor modelului i interpretarea acestora

2.1- Estimare punctual a parametrilor


2.2- Estimarea parametrilor prin interval de ncredere
2.

Testarea semnificaiei corelaiei i a parametrilor regresiei modelului de regresie multipl

3.1- Testarea semnificaiei corelaiei multipl


3.2- Testarea parametrilor modelului de regresie multipl
3.

Aplicarea analizei de tip ANOVA pentru validitatea modelului de


interpretarea rezultatelor

4. Testarea ipotezelor clasice asupra modelului de regresie multipl


5.1 Ipoteze statistice clasice asupra modelului de regresie multipl
5.2 Testarea liniaritii modelului propus
37

regresie multipl i

5.3 Testarea normalitii erorilor


5.4 Testarea ipotezei de homoscedasticitate
5.5 Testarea ipotezei de autocorelare a erorilor
5. Previziunia valorii variabilei Y dac variabila X crete cu 10% fa de ultima valoare nregistrat
Rezolvarea problemei B de exemplificat att n Excel ct i n Eviews.
Rezolvare problema B
suprafaa cultivat=f(producia agricol vegetal, nr. semntori) n anul 2005 pentru 42 judee
1. Definirea modelului de regresie multipl liniar
1.1- Forma, variabilele, parametrii modelului de regresie multipl
Informaiile despre cele 42 de judete i cele 2 variabile pentru anul 2005 se regsesc n tabelul
urmtor.
Nr
crt.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18

Judee

Bihor
Bistria-Nsud
Cluj
Maramure
Satu Mare
Slaj
Alba
Braov
Covasna
Harghita
Mure
Sibiu
Bacu
Botoani
Iai
Neam
Suceava
Vaslui

Producia agricol
vegetal
(mii lei)
879070
579280
922061
563843
649426
442894
534755
450171
466240
403047
873152
410084
685610
790955
1005521
651561
985909
689718
38

Nr. semntori
(buci)
3167
465
1410
331
1684
919
1373
978
737
445
1899
716
1095
1280
1281
840
894
1461

Suprafaa cultivat
(hectare)
270183
86489
157307
73827
193528
106299
116044
92864
77243
70543
190117
78858
168400
271746
238669
157230
169971
267550

19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42

Brila
Buzu
Constana
Galai
Tulcea
Vrancea
Arge
Clrai
Dmbovia
Giurgiu
Ialomia
Prahova
Teleorman
Ilfov
Municipiul Bucureti
Dolj
Gorj
Mehedini
Olt
Vlcea
Arad
Cara-Severin
Hunedoara
Timi

727750
725575
981963
1052650
497580
607316
689518
622070
987017
491678
651968
492421
717421
374627
41678
1056598
446328
440979
788496
442155
865958
621434
456755
1195743

1742
1100
2343
1464
1282
1069
1284
2442
1764
1845
1738
1051
3713
866
17
4532
871
1777
3501
472
3505
894
1041
5444

313766
243812
432228
265397
245774
135474
160853
397989
163483
243597
344059
136091
439352
94614
1451
447679
92580
173019
360539
80628
285252
106230
66437
450720

Forma general a modelului multifactorial de regresie ,la nivelul unei colectiviti generale este :
Y=f(X1,X2,Xn)+
suprafaa cultivat=f(producia agricol vegetal, nr. semntori) n anul 2005 pentru 42 judee
y = variabil endogen (dependent), x = variabil exogen (independent)
y = Suprafaa cultivat;
x1 = Producia agricol vegetal;
x2 = Nr. semntori.
Parametrii

39

Parametrii modelului econometric sunt cei care fac obiectul procesului de estimare i testare statistic.
Sunt numii i coeficieni de regresie, sunt mrimi reale, fixe dar necunoscute care apar n model n
diferite expresii alturi de variabile.
y x1 , x2 ,i b0 b1 x1i b2 x 2i

b0 termen liber NU ARE INTERPRETARE ECONOMICA; ne arat c funcia de regresie y

intersecteaz axa Oy n punctul 8228,060557


b1= 0,117055695, ceea ce nsemn c la creterea numrului semntorilor pentru suprafaa cultivat cu
unul, suprafaa cultivat va crete cu 0,117055695;
b2= 72,67212426ne arat c, la o cretere a produciei agricole vegetal cu unu, suprafaa cultivat va
crete cu 72,67212426.

1.2-Reprezentarea grafic a modelului legturii dintre variabile

40

2.Estimarea parametrilor modelului i interpretarea acestora


2.1. Estimare punctual a parametrilor

Parametrii modelului:
b0= 8228,060557
b1= 0,117055695
b2= 72,67212426

1.Abaterea medie ptratica a valorii reziduale


Se=

= 3902028447,45327

2.Abaterea medie ptratica a estimatorului b0 :


SE(b0)=Se

= 29474,65602

3.Abaterea medie ptratica a estimatorului b1


SE(b1)=Se

= 0,053492062

41

3.Abaterea medie ptratica a estimatorului b2


SE(b2)=Se

= 11,06179473

2.2- Estimarea parametrilor prin interval de ncredere

Interval de ncredere pentru 0 :


b0 z ; n k 1 sb 0 0 b0 z n k 1 sb 0

b0 z n 3 sb 0 0 b0 z ; n 3 sb 0
b0 z 0,5;39 s b 0 0 b0 z 0,5;39 sb 0

8228,060557-1,96 29474,6560208228,060557+1,96 29474,65602


-49542,2652422 0 65998,3863562
Parametrul 0 este seminificativ statistic deoarce intervalul de ncredere nu include valoarea nul.
Interval de ncredere pentru 1 :
b1 z ; n k 1 sb1 1 b1 z ; n k 1 sb1

b1 z ; n 3 sb1 1 b1 z ; n 3 sb1
b1 z 0,5;39 sb1 1 b1 z 0,5; 39 s b1

0,117055695-1,96 0,05349206210,117055695+1,96 0,053492062


0,01221125348 1 0,22190013652
Parametrul 1 este seminificativ statistic deoarce intervalul de ncredere nu include valoarea nul
Interval de ncredere pentru 2 :
b2 z ; n k 1 sb 2 2 b2 z ; n k 1 sb 2

b2 z ; n 3 sb 2 2 b2 z ; n 3 sb 2
b2 z ; 39 sb 2 2 b2 z ; 39 sb 2

72,67212426-1,96 11,061794732 72,67212426+1,96 11,06179473


50,9910065892 2 93,3532419308
42

Parametrul 2 este seminificativ statistic deoarce intervalul de ncredere nu include valoarea nul

3.Testarea semnificaiei corelaiei i a parametrilor regresiei modelului de regresie multipl


3.1- Testarea semnificaiei corelaiei multipl

1. Coeficientul de corelaie liniar

ry/x=

= 0,861604650

Multiple R (coeficientul de corelaie sau r y/x) = 0,861604650. Observm c valoarea lui ry/x este > 0,
ceea ce nseamn c ntre cele dou variabile considerate: suprafaa cultivat i producia agricol
vegetal exist o legatur direct.
Testarea semnificaiei coeficientului de corelaie ry/x
- se stabilete ipoteza nul: H0: ry/x = 0;
- se stabilete ipoteza alternativ: H1: ry/x 0
- se calculeaz testul z:

zry/x=

= 10,56

zry/x>zcritic(10,56<1,96) se accept H1 se respinge H0 ,coeficientul de corelaie este semnificativ


statistic,este semnificativ

0.

2.Raportul de corelaie (Ry/x)

43

Ry/x=

= 0,8616

Deoarece Ry/x = ry/x = 0,8616, apreciem c exist o legtur liniar, puternic i direct ntre cele dou
variabile.
Testarea semnificaiei raportului de corelaie Ry/x
- se stabilete ipoteza nul: H0: Ry/x = 0;
- se stabilete ipoteza alternativ: H1: Ry/x 0
- se calculeaz testul Fisher

FRy/x=

19.5 = 56,169

FRy/x>Fcritic(56,169>4) se accept H1 se respinge H0,raporul de corelaie este semnificativ statistic,


semnificativ

0.

3.Coeficinetul de determinaie(R2)
R2=

= 0,7423

R2(0,1)
74,23% din suprafaa cultivat este reprezentat de influena produciei agricole vegetale i de numrul
de semntori, restul de 25,77 % reprezentnd influena altor factori.
Testarea semnificaiei coeficientului de determinaieR2
- se stabilete ipoteza nul: H0: R2 = 0;
- se stabilete ipoteza alternativ: H1: R2 0
- se calculeaz testul Fisher
FRy/x=

19.5 = 56,169

FRy/x>Fcritic(56,169>4) se accept H1 se respinge H0,raporul de corelaie este semnificativ statistic,


semnificativ

0.

3.2- Testarea parametrilor unui model de regresie multipl

44

Testarea semnificaiei parametrului 0 :


1) Se stabilete ipoteza nul:
H0 : 0= 0 adic 0 nu este semnificativ

0 pentru un prag de semnificaie ales.

2) Se stabilete ipoteza alternativ:


H1 : 0 0, adic 0 este semnificativ

0 pentru un prag de semnificaie ales.

n = 42 >30 eantion de volum redus i pentru testare vom utiliza testul z.


tiind c pragul de semnificaie este 0,05 i k 2 (exist doi factori de influen) se stabilete:
valoarea critic: zcritic=1,96
Statistica testului este:
zcalc=

=0,27915

SE(b0)=Se

= 29474,65602

b0 = 8228,060557
z0<zcritic(0,27915<1,96) se accept H0 se respinge H1,parametrul 0 nu este semnificativ statistic, nu
este semnificativ 0.
Testarea semnificaiei parametrului 1 :
1) Se stabilete ipoteza nul:
H0 : 1= 0 adic 1 nu este semnificativ 0 pentru un prag de semnificaie ales.
2) Se stabilete ipoteza alternativ:
H1 : 1 0, adic 1 este semnificativ 0 pentru un prag de semnificaie ales.
n = 42 >30 eantion de volum redus i pentru testare vom utiliza testul z.
tiind c pragul de semnificaie este 0,05 i k 2 (exist doi factori de influen) se stabilete:
valoarea critic: zcritic=1,96
Statistica testului este:
zcalc=

=2,188281602

45

SE(b1)= Se

= 0,053492062

b1= 0,117055695
z1>zcritic(2,188281602>1,96)se accept H1 se respinge H0,parametrul 1 este semnificativ statistic, este
semnificativ 0.
Testarea semnificaiei parametrului 2 :
1) Se stabilete ipoteza nul:
H0 : 2= 0( adic 2 nu este semnificativ diferit de zero pentru un prag de semnificaie ales.
2) Se stabilete ipoteza alternativ:
H1 : 2 0,( adic 2 este semnificativ diferit de zero pentru un prag de semnificaie ales.
n = 42 >30 eantion de volum redus i pentru testare vom utiliza testul z.
tiind c pragul de semnificaie este 0,05 i k 2 (exist doi factori de influen) se stabilete:
valoarea critic: zcritic=1,96
Statistica testului este:
zcalc=

= 6,569650406

SE(b2)= Se

= 11,06179473

b2= 72,67212426
|z2|>zcritic(|6,569650406|>1,96)se accept H1 se respinge H0,parametrul 2 este semnificativ statistic,
este semnificativ 0.
4.Aplicarea analizei de tip ANOVA pentru validitatea modelului de
rezultatelor

regresie multipl i interpretarea

df (numrul gradelor de libertate): k =1, n k-1=39, n 1=40, unde k=2 este numrul devariabile ale
modelului (variabila x, respectiv y), iar n = 42 este numrul de observaii.
SS(sumele de patrate) potrivit descompunerii:Suma global de ptrate = Suma de ptrate datorata
regresiei + Suma de ptrate rezidual;
46

MS(media sumelor de ptrate): SS mparit la numrul respectiv de grade delibertate.Valoarea de pe


linia a doua (Residual ) este estimaia dispersiei pentru repartiia erorilor ieste ptratul erorii standard a
estimaiei.
F(valoarea statisticii F) pentru testul caracterizat de:
H0: modelul nu este valid statistic;
H1: modelul este valid statistic;
Significance F(probabilitatea critic unilateral). Dac valoarea rezultat este mai micdect pragul de
semnificaie fixat, atunci se respinge ipoteza nul n favoarea ipotezei alternative

2 y/x + e=y
y/x=

= 438492483637,798

47

e=

= = 152179109450,678

y=(y - )= 590671593088.476

Sy/x=

= 219246241818,899

Se=

= 3902028447,45327

Fcalc=

= 56,169

Fcritic=4
Fcalc>Fcristic(56,169>4)se respinge H0 se accept H1, modelul este valid, este corect identificat din punct
de vedere statistic.
5.Testarea ipotezelor clasice asupra modelului de regresie multipl
5.1 Ipoteze statistice clasice asupra modelului de regresie multipl
Ipoteza 1: Forma funcional:

Ipoteza de liniaritate se refer la felul n care parametrii intra n ecuaie, nu neaprat n rela ia
dintre variabila x si y.
Ipoteza 2: Media erorilor este zero:
=0
Ipoteza 3: Homoscedasticitatea:

Variabilele aleatoare

au dispersie constant, dispersia reziduurilor n populaie este constant

pentru toate valorile xi.

48

Ipoteza 4: Non-autocorelarea erorilor (deviaiile observaiilor de la valorile lor ateptate sunt


necorelate).
= 0 ij

Ipoteza 5 : Variabila aleatoare

este normal distribuit.

Ipoteza 6: Necorelarea ntre regresor i erori.


)=0

5.2 Testarea liniaritii modelului propus

5.3 Testarea normalitii erorilor


Verificarea ipotezei de normalitate a erorilor se va realiza cu ajutorul testului Jarque-Berra, care este i
el un test asimptotic (valabil n cazul unui eantion de volum mare), ce urmeaz o distribuie hi ptrat cu
un numr al gradelor de libertate egal cu 2, avnd urmtoarea form:

49

S 2 K 3 2

24
6

JB n

~ ;2

unde:
n = numrul de observaii;
S= coeficientul de asimetrie (skewness), ce msoar simetria distribuiei erorilor n jurul mediei
acestora, care este egal cu zero, avnd urmtoarea relaie de calcul:

1 n
yi y
n i 1
S
3

K = coeficientul de aplatizare calculat de Pearson (kurtosis), ce msoar boltirea distribuiei (ct de


ascuit sau de aplatizat este distribuia comparativ cu distribuia normal), avnd urmtoarea relaie
de calcul:

1 n
yi y
n i 1
K
4

Dac probabilitatea p(JB) corespunztoare valorii calculate a testului este suficient de sczut, atunci
ipoteza de normalitate a erorilor este respins, n timp ce, n caz contrar, pentru un nivel suficient de
ridicat al probabilitii ipoteza de normalitate a erorilor este acceptat, sau dac
ipoteza de normalitate a erorilor este respins.
2

; 2 =5,99

K = 2,89
S = 0,80
50

JB

;k , atunci

JB = 4,54
Utiliznd pachetul de programe EViews n vederea calculrii testului Jarque-Berra se constat c JB =
2
5,9915
4,54 > 0,05; 2
i c p(JB) =0,10. Deoarece valoarea calculat a testului J-B este < dect valoarea
2

tabelat a lui ;2 , iar probabilitatea ca testul J-B s nu depeasc valoarea tabelat este suficient de
mic, ipoteza de normalitate a erorilor poate fi respins.
5.4 Testarea ipotezei de homoscedasticitate
Verificarea ipotezei de homoscedasticitate a erorilor n cazul acestui model se va realiza cu ajutorul
testului White.
Aplicarea testului White presupune parcurgerea urmtoarelor etape:
- estimarea parametrilor modelului iniial i calculul valorilor estimate ale variabilei reziduale, u;
- construirea unei regresii auxiliare, bazat pe prespunerea existenei unei relaii de dependen ntre
ptratul valorilor erorii, variabila exogen inclus n modelul iniial i ptratul valorilor acesteia:

ei2 0 1 xi 2 x i2 i
i calcularea coeficientului de determinare, R2, corespunztor acestei regresii auxiliare;
- verificarea semnificaiei parametrilor modelului nou construit, iar dac unul dintre acetia este
nesemnificativ, atunci ipoteza de heteroscedasticitate a erorilor este acceptat.
Exist dou variante de aplicare a testului White:
- utilizarea testului Fisher Snedecor clasic, bazat pe ipoteza nulitii parametrilor, respectiv:
Dac ipoteza nul, potrivit creia rezultatele estimrii sunt nesemnificative ( Fc F ;k ;n k 1 ), este
acceptat, atunci ipoteza de homoscedasticitate se verific, cazul contrar semnificnd prezena
heteroscedasticitii erorilor.
- utilizarea testului LM, calculat ca produs ntre numrul de observaii corespunztoare modelului, n, i
coeficientul de determinare, R2, corespunztor acestei regresii auxiliare. n general, testul LM este
2

asimptotic distribuit sub forma unui ;v , pentru care numrul gradelor de libertate este egal cu: v k ,
unde k = numrul variabilelor exogene, respectiv:
2

LM n R 2 ~ ;k

Dac

LM

;k , erorile sunt heteroscedastice, n caz contrar, sunt homoscedastice, respectiv

ipoteza nulitii parametrilor, 0 1 2 0 , este acceptat.

Aplicarea testului White s-a realizat utiliznd pachetul de programe EViews:


Heteroskedasticity Test: White
F-statistic

3.109995

Prob. F(5,36)

51

0.0196

Obs*R-squared
Scaled explained SS

12.66924
10.36474

Prob. Chi-Square(5)
Prob. Chi-Square(5)

0.0267
0.0655

Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 05/04/14 Time: 23:41
Sample: 1 42
Included observations: 42
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
PRODUCTIAAGVEG
PRODUCTIAAGVEG^2
PRODUCTIAAGVEG*NRSEMANATOR
I
NRSEMANATORI
NRSEMANATORI^2

-9.30E+08
-1444.390
-0.011922

4.46E+09
17263.05
0.016149

-0.208510
-0.083669
-0.738259

0.8360
0.9338
0.4651

13.13196
3629157.
-2739.008

7.436338
3388176.
1043.055

1.765917
1.071124
-2.625946

0.0859
0.2912
0.0126

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.301649
0.204655
4.51E+09
7.31E+20
-989.9557
3.109995
0.019592

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

3.62E+09
5.05E+09
47.42646
47.67470
47.51745
2.286506

Analiznd rezultatele afiate de programul EViews se constat c Fc= 10,36>Fcritic = 4 i LM=12,66>


, iar estimatorii parametrilor modelului sunt semnificativi pentru un prag de semnificaie 0,05 (

z critic 1,79 ), deci ipoteza de homoscedasticitate

nu se verific.

5.5 Testarea ipotezei de autocorelare a erorilor


Verificarea ipotezei de independen a erorilor n cazul acestui model va fi realizat cu ajutorul testului
Durbin-Watson i const n calcularea termenului empiric:
n


i2

i 1

i 1

2
i

i compararea acestei mrimi d cu dou valori teoretice d 1 i d 2 , preluate din tabela DurbinWatson (vezi anexa nr. 1) n funcie de un prag de semnificaie
exogene k i de valorile observate n , n 15 .

52

, arbitrar ales, de numrul variabilelor

Acceptarea sau respingerea ipotezei de independen a erorilor se bazeaz pe o anumit regul,


care const n:
- dac 0 d d 1 autocorelare pozitiv;
- dac d 1 d d 2 indecizie, recomandndu-se acceptarea autocorelrii pozitive;
- dac d 2 d 4 d 2 erorile sunt independente;
- dac 4 d 2 d 4 d 1 indecizie, recomandndu-se acceptarea autocorelrii
negative;
- dac 4 d 1 d 4 autocorelare negativ.

Pe baza datelor problemei, valoarea empiric a variabilei Durbin-Watson este:


n


i2

i 1

i 1

= 1,38
2
i

6. Previziunia valorii variabilei Y dac variabila X crete cu 10% fa de ultima valoare nregistrat
1

42

42

42

X = X + 10% X = 5444+ = 5444 = 10888


42

X = x + 10% x = 1195743+ 1195743 = 2391486


y n v 8228,060557+ 0,117055695*2391486+ 72,67212426*10888= 1079419,205 Suprafa cultivat

Dependent Variable: SUPRAFATACULTIV


Method: Least Squares
Date: 05/04/14 Time: 23:38
Sample: 1 42
Included observations: 42
SUPRAFATACULTIV=C(1)+C(2)*PRODUCTIAAGVEG+C(3)
*NRSEMANATORI

C(1)
C(2)
C(3)

Coefficient

Std. Error

t-Statistic

Prob.

8228.061
0.117056
72.67212

29474.66
0.053492
11.06179

0.279157
2.188282
6.569650

0.7816
0.0347
0.0000

53

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.742363
0.729150
62466.22
1.52E+11
-521.8192
56.18776
0.000000

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

201616.5
120027.6
24.99139
25.11551
25.03688
1.381565

Problema C
Folosind datele Problemei A, s se testeze dac dispersiile (variaiile) celor dou populaii (variabila
exogen i variabila endogen) sunt egale; testai dac mediile celor dou populaii sunt egale.
Rezolvarea problemei C de exemplificat n Excel, cu interpretarea rezultatelor i parcurgerea etapelor
testrii ipotezelor statistice.
Nr
crt.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23

Judee
Bihor
Bistria-Nsud
Cluj
Maramure
Satu Mare
Slaj
Alba
Braov
Covasna
Harghita
Mure
Sibiu
Bacu
Botoani
Iai
Neam
Suceava
Vaslui
Brila
Buzu
Constana
Galai
Tulcea

Producia agricol vegetal


(mii lei)
879070
579280
922061
563843
649426
442894
534755
450171
466240
403047
873152
410084
685610
790955
1005521
651561
985909
689718
727750
725575
981963
1052650
497580
54

Suprafaa cultivat
(hectare)
270183
86489
157307
73827
193528
106299
116044
92864
77243
70543
190117
78858
168400
271746
238669
157230
169971
267550
313766
243812
432228
265397
245774

24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42

Vrancea
Arge
Clrai
Dmbovia
Giurgiu
Ialomia
Prahova
Teleorman
Ilfov
Municipiul Bucureti
Dolj
Gorj
Mehedini
Olt
Vlcea
Arad
Cara-Severin
Hunedoara
Timi

607316
689518
622070
987017
491678
651968
492421
717421
374627
41678
1056598
446328
440979
788496
442155
865958
621434
456755
1195743

135474
160853
397989
163483
243597
344059
136091
439352
94614
1451
447679
92580
173019
360539
80628
285252
106230
66437
450720

TESTAREA IPOTEZEI PRIVIND DIFERENA DINTRE DOU MEDII PENTRU EANTIOANE


DE VOLUM MARE
- pentru test bilateral;
H0: 1 = 2 (1- 2 = D),
H1: 1 2 (1- 2 D),

zcalc=

55

Valoarea testului z este -11,30787865.Deoarece este un test bilateral,valoarea critic este 1,959963985
c zcalc<zcritic atunci se respinge H0 se accept H1 deci mediile sunt egale.

TESTAREA IPOTEZEI PRIVIND RAPORTUL DINTRE DOU DISPERSII


Ipotezele statistice sunt:
H 0 : 12 / 22 1 ,

H 1 : 12 / 22 1 .
Fcalc=

56

Valoarea testului F este 0,255742161 .Deoarece este un test bilateral,valoarea critic este
0,594656101 c Fcalc<Fcritic atunci se respinge H1 se accept H0 deci dispersiile sunt egale.

Nr
crt.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32

Judee
Bihor
Bistria-Nsud
Cluj
Maramure
Satu Mare
Slaj
Alba
Braov
Covasna
Harghita
Mure
Sibiu
Bacu
Botoani
Iai
Neam
Suceava
Vaslui
Brila
Buzu
Constana
Galai
Tulcea
Vrancea
Arge
Clrai
Dmbovia
Giurgiu
Ialomia
Prahova
Teleorman
Ilfov

Nr. semntori
(buci)
3167
465
1410
331
1684
919
1373
978
737
445
1899
716
1095
1280
1281
840
894
1461
1742
1100
2343
1464
1282
1069
1284
2442
1764
1845
1738
1051
3713
866
57

Suprafaa cultivat
(hectare)
270183
86489
157307
73827
193528
106299
116044
92864
77243
70543
190117
78858
168400
271746
238669
157230
169971
267550
313766
243812
432228
265397
245774
135474
160853
397989
163483
243597
344059
136091
439352
94614

33
34
35
36
37
38
39
40
41
42

Municipiul Bucureti
Dolj
Gorj
Mehedini
Olt
Vlcea
Arad
Cara-Severin
Hunedoara
Timi

17
4532
871
1777
3501
472
3505
894
1041
5444

1451
447679
92580
173019
360539
80628
285252
106230
66437
450720

TESTAREA IPOTEZEI PRIVIND DIFERENA DINTRE DOU MEDII PENTRU EANTIOANE


DE VOLUM MARE
- pentru test bilateral;
H0: 1 = 2 (1- 2 = D),
H1: 1 2 (1- 2 D),

zcalc=

Valoarea testului z este 10,7997485. Deoarece este un test bilateral,valoarea critic este 1,959963985
c zcalc>zcritic atunci se respinge H1 se accept H0 deci mediile nu sunt egale.
TESTAREA IPOTEZEI PRIVIND RAPORTUL DINTRE DOU DISPERSII
Ipotezele statistice sunt:
58

H 0 : 12 / 22 1 ,

H 1 : 12 / 22 1 .

Fcalc=

Valoarea testului F este 10936,41147 . Deoarece este un test bilateral,valoarea critic este
1,681644228 c Fcalc>Fcritic atunci se respinge H0 se accept H1 deci dispersiile nu sunt egale.

59

S-ar putea să vă placă și