Sunteți pe pagina 1din 12

Studiu de caz

Modelul de atenuare a heteroscedasticității

Datele problemei:

Datele privind cheltuielile publice pentru educație (Y) și Produsul Intern Brut (X) în milioane, pentru o
perioadă analizată timp de 34 de ani, sânt prezentate în tabelul următor:

Nr. Cheltuieli PIB

1 3,39 6,07

2 3,27 10,53

3 3,37 11,74

4 4,28 19,28

5 4,86 21,34

6 4,07 22,56

7 4,32 24,23

8 4,12 25,07

9 3,72 27,96

10 4,3 27,97

11 3,8 40,55

12 5,85 52,02

13 8,95 58,11

14 8,55 63,43

15 9,5 66,72

16 4,65 67,37

17 7,31 77,28

18 9,36 102,05

19 9,45 116,37

20 10,2 119,89

21 14,27 124,55

22 11,71 141,38

23 8,61 154,25

24 16,46 169,78

25 8,51 186,73

26 7,84 212,18
27 11,97 250,12

28 21,95 261,81

29 19 395,92

30 32,95 535,37

31 36,64 655,69

32 41,67 815,4

33 614,66 1040,85

34 1814,35 2586,8

Se cere:

1. Specificarea modelului;

2. Detectarea heteroscedasticității modelului cu ajutorul testului Goldfeld – Quandt;

Rezolvare:

1) Specificarea modelului

Pentru a specifica modelului:

a) Se poate utiliza metoda grafică de corelare între Y și X (corelograma):

200

160

120
Y

80

40

0
0 400 800 1,200 1,600 2,000 2,400 2,800

Fig.1. Corelația între cheltuielile pentru educație și PIB


Concluzie: Se observă că distribuția punctelor empirice poate fi aproximată cu o dreaptă. Deci, modelul
econometric se transformă într-un model unifactorial de forma: y=a+bx+u,

Unde:

- a și b – parametrii modelului;

- b – panta dreptei;

- u – variabila aleatoare, eroarea care apare datorită unor factori diverși care nu sânt
incluși în model.

b) Se poate estima modelul de regresie:

Se estimează parametrii modelului cu ajutorul Metodei celor Mai Mici Pătrate, care presupune că suma
pătratelor abaterilor valorilor reale de la valorile estimate să fie minimă.

 (y i  yˆ i )2  min

Condiția de minimum a acestei funcții rezultă din:

n  a +  X  b =  Y

  X  a +  X  b =  X  Y
2

Estimația parametrului b:

^ 34∗5442958,827−8491,37∗2777,91 = 1 85060600,118−23588261,6367 =0,6281


b=
34∗9681639,522−(8491,37)2 329175743,748−72103364,4769

Estimația parametrului a:

naˆ  bˆ  xi   y i / 1 / n  aˆ  bˆ  x i / n   y i / n  aˆ  y  bx
ˆ

2777 , 91
ý= =81,70
34

8491 ,37
x́= =249,75
34

a^ =81,7 0−0,6281∗249,75=−75 , 16

Având estimatorii parametrilor putem determina valorile teoretice ale variabilelor endogene cu ajutorul
relației:

y i=−75,16+ 0,6281∗x i
^
Valorile variabilei reziduale vor rezulta din următoarea relație:

uˆ  y i  yˆ i

Estimarea modelului de regresie – datele din EViews:

Nr              

1 3,39 6,07 36,8449 20,5773 -71,347433 74,737433 5585,683891

2 3,27 10,53 110,8809 34,4331 -68,546107 71,816107 5157,553225

3 3,37 11,74 137,8276 39,5638 -67,786106 71,156106 5063,191421

4 4,28 19,28 371,7184 82,5184 -63,050232 67,330232 4533,360141

5 4,86 21,34 455,3956 103,7124 -61,756346 66,616346 4437,737554

6 4,07 22,56 508,9536 91,8192 -60,990064 65,060064 4232,811928

7 4,32 24,23 587,0929 104,6736 -59,941137 64,261137 4129,493729

8 4,12 25,07 628,5049 103,2884 -59,413533 63,533533 4036,509815

9 3,72 27,96 781,7616 104,0112 -57,598324 61,318324 3759,936858

10 4,3 27,97 782,3209 120,271 -57,592043 61,892043 3830,624987

11 3,8 40,55 1644,3025 154,09 -49,690545 53,490545 2861,238404

12 5,85 52,02 2706,0804 304,317 -42,486238 48,336238 2336,391904

13 8,95 58,11 3376,7721 520,0845 -38,661109 47,611109 2266,8177

14 8,55 63,43 4023,3649 542,3265 -35,319617 43,869617 1924,543296

15 9,5 66,72 4451,5584 633,84 -33,253168 42,753168 1827,833374

16 4,65 67,37 4538,7169 313,2705 -32,844903 37,494903 1405,867751

17 7,31 77,28 5972,1984 564,9168 -26,620432 33,930432 1151,274216

18 9,36 102,05 10414,2025 955,188 -11,062395 20,422395 417,0742175

19 9,45 116,37 13541,9769 1099,6965 -2,068003 11,518003 132,6643931

20 10,2 119,89 14373,6121 1222,878 0,142909 10,057091 101,1450794

21 14,27 124,55 15512,7025 1777,3285 3,069855 11,200145 125,443248

22 11,71 141,38 19988,3044 1655,5598 13,640778 -1,930778 3,727903685

23 8,61 154,25 23793,0625 1328,0925 21,724425 -13,114425 171,9881431

24 16,46 169,78 28825,2484 2794,5788 31,478818 -15,018818 225,5648941

25 8,51 186,73 34868,0929 1589,0723 42,125113 -33,615113 1129,975822

26 7,84 212,18 45020,3524 1663,4912 58,110258 -50,270258 2527,098839


27 11,97 250,12 62560,0144 2993,9364 81,940372 -69,970372 4895,852958

28 21,95 261,81 68544,4761 5746,7295 89,282861 -67,332861 4533,71417

29 19 395,92 156752,6464 7522,48 173,517352 -154,517352 23875,61207

30 32,95 535,37 286621,0369 17640,4415 261,105897 -228,155897 52055,11334

31 36,64 655,69 429929,3761 24024,4816 336,678889 -300,038889 90023,33491

32 41,67 815,4 664877,16 33977,718 436,99274 -395,32274 156280,0688

33 614,66 1040,85 1083368,723 639768,861 578,597885 36,062115 1300,476138

34 1814,35 2586,8 6691534,24 4693360,58 1549,60908 264,74092 70087,75472

2777,91 8491,37 9681639,522 5442958,827 2777,91 0,00 466427,4798


Tota
l

c) Verificarea semnificației estimatorilor:

Estimatorii sânt semnificativ diferiți de 0, cu un prag de semnificație  , dacă se verifică următoarele


relații:

â b̂
t â   t  , t bˆ   t  ,
sâ sb̂
;

Unde:   0,05 ,   n  k  1 - grade de libertate (k – var. independente)

sû sâ sb̂


Calculăm ecarturile tip a variabilei reziduale și ecarturile tip a celor doi estimatori, și :

2 y t )2 466427,4798
( y t− ^
Su^ =∑ = =1 4575,856
n−k−1 32

Su^ = √ S2u^ =√107796,469=1857,279

1 1
Sa^ =
√ √
S2u^ ∗
n+ x́2
∑ ( x t − x́ )
S2u^∗1
2
=
14575,856∗
34+62376,0625
7560952
=0,000 175

Sb^ =
√ ∑ ( x i− x́ )
2
=
√ 14575,856∗1
7560952
=0 ,043906

Cunoscând valorile ecarturilor tip a acestor doi estimatori, putem verifica semnificația estimatorilor:

1)
H0 : a  0  

H1 : a  0
|a^| |−75,16|
t ^a= = =429485,714>t 0,05 ;32=2,04 2
Sa^ 0 , 000175

Deoarece, calc
t t
tab , ipoteza H
0 se respinge, estimatorul â este semnificativ, venitul are o influență
semnificativă asupra variației consumului unei familii.

2)
H0 : b  0  

^
H1 : b  0 t ^b=|b| = |0,6281| =14,305> t 0,05 ;32=2,04 2
Sb^ 0,043906

Deoarece,
t calc  t tab , ipoteza H 0 se respinge, estimatorul b̂ este de asemenea semnificativ.

d) Verificăm ipoteza de linearitate a modelului, calculând coeficientul linear de corelație și raportul de corelație:

Coeficientul linear de corelație:

ry/x 
cov(y,x)

 (y - y)(x t - x)
t

 x y n x  y

σ x=
√ ∑ ( xi −x́ )
n
=
√ 7560952
34
=471,57

σ y=
√ ∑ ( y i −ý ) =
n √ 3449487
34
=318,5 2

4749186 4749186
r y / x= = =0,9299
34∗471,57∗318,52 5106952,1976

Raportul de corelație:

466427,4798
R y / x = 1−
√ 3449487
=0,13 5

Coeficientul de determinație:

466427,4798
R2=1− =1−0,135=0,86 5
3449487
Deci, egalitatea dintre coeficientul linear de corelație și raportul de corelație indică o corelație lineară puternică
între aceste două variabile.

e) Verificarea probabilității modelului se face cu ajutorul analizei variației dispersiei, efectuând tabelul ANOVA:

Sursa de variație Măsura variației Numărul Varinațele corectate Valoarea testului F


gradelor de
libertate Fc Fα;k;n-k-1

Varianța 34

explicativă VE =  (yˆ t - y) 2 =
t=1
k=1
= 2 982 868
= 2 982 868

Fcalc  F0,05;1;32
VR =  (y t - yˆ t )
Varianța 2 =
205,03 7  
reziduală
= 466 427,4798 n-k-1=32 = 4,17
14 575,858

Varianța totală VT =  (y t - y) 2 =
=3 449 487 n-1=33

104 529,909

Nr ui (x i  x) (x i  x)2 (y t  y ) ෝ
(࢟ ࢚െ ഥሻ
࢟ (yˆ t - y)2 (x i  x) (y t  y) û i 1 uˆ i  uˆ i 1 ˆi  u
(u ˆ i 1 ) 2 ሺ࢚࢟ െഥሻ૛

1 74,73743 -243,68 59379,9424 -78,31 -153,047433 23423,51675 19082,5808 - - - 6132,4561
2 71,81611 -239,22 57226,2084 -78,43 -150,246107 22573,89267 18762,0246 74,737433 -2,921326 8,534145598 6151,2649
3 71,15611 -238,01 56648,7601 -78,33 -149,486106 22346,09589 18643,3233 71,816107 -0,660001 0,43560132 6135,5889
4 67,33023 -230,47 53116,4209 -77,42 -144,750232 20952,62966 17842,9874 71,156106 -3,825874 14,63731186 5993,8564
5 66,61635 -228,41 52171,1281 -76,84 -143,456346 20579,72321 17551,0244 67,330232 -0,713886 0,509633221 5904,3856
6 65,06006 -227,19 51615,2961 -77,63 -142,690064 20360,45436 17636,7597 66,616346 -1,556282 2,422013664 6026,4169
7 64,26114 -225,52 50859,2704 -77,38 -141,641137 20062,21169 17450,7376 65,060064 -0,798927 0,638284351 5987,6644
8 63,53353 -224,68 50481,1024 -77,58 -141,113533 19913,0292 17430,6744 64,261137 -0,727604 0,529407581 6018,6564
9 61,31832 -221,79 49190,8041 -77,98 -139,298324 19404,02307 17295,1842 63,533533 -2,215209 4,907150914 6080,8804
10 61,89204 -221,78 49186,3684 -77,4 -139,292043 19402,27324 17165,772 61,318324 0,573719 0,329153491 5990,76
11 53,49055 -209,2 43764,64 -77,9 -131,390545 17263,47532 16296,68 61,892043 -8,401498 70,58516864 6068,41
12 48,33624 -197,73 39097,1529 -75,85 -124,186238 15422,22171 14997,8205 53,490545 -5,154307 26,56688065 5753,2225
13 47,61111 -191,64 36725,8896 -72,75 -120,361109 14486,79656 13941,81 48,336238 -0,725129 0,525812067 5292,5625
14 43,86962 -186,32 34715,1424 -73,15 -117,019617 13693,59076 13629,308 47,611109 -3,741492 13,99876239 5350,9225
15 42,75317 -183,03 33499,9809 -72,2 -114,953168 13214,23083 13214,766 43,869617 -1,116449 1,24645837 5212,84
16 37,4949 -182,38 33262,4644 -77,05 -114,544903 13120,5348 14052,379 42,753168 -5,258265 27,64935081 5936,7025
17 33,93043 -172,47 29745,9009 -74,39 -108,320432 11733,31599 12830,0433 37,494903 -3,564471 12,70545351 5533,8721
18 20,4224 -147,7 21815,29 -72,34 -92,762395 8604,861926 10684,618 33,930432 -13,508037 182,4670636 5233,0756
19 11,518 -133,38 17790,2244 -72,25 -83,768003 7017,078327 9636,705 20,422395 -8,904392 79,28819689 5220,0625
20 10,05709 -129,86 16863,6196 -71,5 -81,557091 6651,559092 9284,99 11,518003 -1,460912 2,134263872 5112,25
21 11,20015 -125,2 15675,04 -67,43 -78,630145 6182,699703 8442,236 10,057091 1,143054 1,306572447 4546,8049
22 -1,93078 -108,37 11744,0569 -69,99 -68,059222 4632,057699 7584,8163 11,200145 -13,130923 172,4211388 4898,6001
23 -13,1144 -95,5 9120,25 -73,09 -59,975575 3597,069597 6980,095 -1,930778 -11,183647 125,0739602 5342,1481
24 -15,0188 -79,97 6395,2009 -65,24 -50,221182 2522,167121 5217,2428 -13,114425 -1,904393 3,626712698 4256,2576
25 -33,6151 -63,02 3971,5204 -73,19 -39,574887 1566,171681 4612,4338 -15,018818 -18,596295 345,8221877 5356,7761
26 -50,2703 -37,57 1411,5049 -73,86 -23,589742 556,4759276 2774,9202 -33,615113 -16,655145 277,393855 5455,2996
27 -69,9704 0,37 0,1369 -69,73 0,240372 0,057778698 -25,8001 -50,270258 -19,700114 388,0944916 4862,2729
28 -67,3329 12,06 145,4436 -59,75 7,582861 57,49978095 -720,585 -69,970372 2,637511 6,956464275 3570,0625
29 -154,517 146,17 21365,6689 -62,7 91,817352 8430,426128 -9164,859 -67,332861 -87,184491 7601,135471 3931,29
30 -228,156 285,62 81578,7844 -48,75 179,405897 32186,47588 -13923,975 -154,517352 -73,638545 5422,63531 2376,5625
31 -300,039 405,94 164787,284 -45,06 254,978889 65014,23384 -18291,6564 -228,155897 -71,882992 5167,164539 2030,4036
32 -395,323 565,65 319959,923 -40,03 355,29274 126232,9311 -22642,9695 -300,038889 -95,283851 9079,012261 1602,4009
33 36,06211 791,1 625839,21 532,96 496,897885 246907,5081 421624,656 -395,32274 431,384855 186092,8931 284046,3616
34 264,7409 2337,05 5461802,7 1732,65 1467,90908 2154757,067 4049289,683 36,062115 228,678805 52293,99586 3002076,023
TOTAL 0 0 7560952 0 0 2982868 4749186 -264,82 190,00 267427,64 3449487
Verificăm semnificația raportului de corelație și a coeficientului de corelație linear cu ajutorul testului
Fisher -Snedecor:

=205,037  > F1,32  4,17


0,05
32∗0,865
F calc=
1−0,865

Deoarece,
Fcalc  Ftab rezultă că modelul liniar unifactorial este un model valid cu un prag de

semnificație   0,05 . VT  VE  VR  100  VE / VT  100  VR / VT  100;

VE
=0,865  acest model descrie în mod corect dependența dintre variabile, acest fapt explică 86,5% din
VT
variația totală a variabilei dependente, astfel variația cheltuielilor publice pentru educație se datorează în
proporție de 86,5% din valoarea PIB-ului.

2. Testele de detectare a heteroscedasticității.

1. Coeficientul de corelare a rangurilor Spearman se calculează după cum urmează:

a) ordonăm datele variabilei reziduale explicative în ordine crescătoare;

u i  R x R ui
b) stabilim rangurile pentru caracteristica X și pentru reziduul u;

d1  R x  R ui
c) calculăm diferențele dintre ranguri: ;

rx/u  1  6 d i2 / n 3  n
d) calculăm coeficientul de corelație după relația:

rx/u   1;1 . Deoarece coeficientul se apropie de extremele intervalului, legătura este mai puternică.

Ipotezele statistice care permit detectarea heteroscedasticității:

H 0 :  modelul este homoscedastic (nu există dependență între variabilele explicative și cele reziduale).

H1 : modelul este heteroscedastic.

6  358
rx/y  1   0,9453 ui
343  34  indică o legătură puternică între variabilele x și
rx,y  n  2 0,9453  32
t calc    50,25
1  rx,y
2
1  0,8935  t 0,05
32  2,042  ipoteza H 0 se respinge și se

acceptă ipoteza
H1 , modelul este heteroscedastic.

Nr. Cheltuieli (y)  PIB (x)        d i2  

1 3,39 6,07 1 3 -2 4

2 3,27 10,53 2 2 0 0

3 3,37 11,74 3 1 2 4

4 4,28 19,28 4 8 -4 16

5 4,86 21,34 5 12 -7 49

6 4,07 22,56 6 4 2 4

7 4,32 24,23 7 10 -3 9

8 4,12 25,07 8 7 1 1

9 3,72 27,96 9 5 4 16

10 4,3 27,97 10 9 1 1

11 3,8 40,55 11 6 5 25

12 5,85 52,02 12 13 -1 1

13 8,95 58,11 13 18 -5 25

14 8,55 63,43 14 14 0 0

15 9,5 66,72 15 16 -1 1

16 4,65 67,37 16 11 5 25

17 7,31 77,28 17 15 2 4

18 9,36 102,05 18 19 -1 1

19 9,45 116,37 19 22 -3 9

20 10,2 119,89 20 23 -3 9

21 14,27 124,55 21 26 -5 25

22 11,71 141,38 22 24 -2 4

23 8,61 154,25 23 21 2 4

24 16,46 169,78 24 27 -3 9
25 8,51 186,73 25 20 5 25

26 7,84 212,18 26 17 9 81

27 11,97 250,12 27 25 2 4

28 21,95 261,81 28 29 -1 1

29 19 395,92 29 28 1 1

30 32,95 535,37 30 30 0 0

31 36,64 655,69 31 31 0 0

32 41,67 815,4 32 32 0 0

33 614,66 1040,85 33 33 0 0

34 1814,35 2586,8 34 34 0 0

Total 2777,91 8491,37 595 595   358

2. Testul Goldfeld – Quandt

Acest test este valabil în cazul în care una dintre variabile este cauza heteroscedasticității și numărul de observații
este important. Acest test poate fi aplicat numai în cazul dependenței liniare și, în special, atunci când variația
variabilei aleatorii perturbatoare este proporțională cu pătratul uneia dintre variabilele explicative. Acest test
constă din trei etape:
x
Pasul 1: ordonăm observațiile în funcție de variabila explicativă i , care este considerată cauza
heteroscedasticității (apoi, la aceste observații se atribuie valorile corespunzătoare variabilei dependente).

Pasul 2: omitem C observații centrale ale datelor ordonate. Alegem în mod arbitrar C observații situate în centrul
eșantionului. Aceste C observații sunt excluse din analiză. Valoarea lui C ar trebui să fie aproximativ egală cu un
sfert Nr.     din numărul Nr.R
dR xyuy2i x 2 
xiŷxu   total de
yi xi observații. C = xyiiuiiiiii i [n / 4] = 34/4 =
8,5 1 3,39 6,07 (vom lua un 1 11,71 141,38 număr întreg C =
8).
2 3,27 10,53 2 8,61 154,25

3 3,37 11,74 Pasul 3: 3 16,46 169,78 stabilim


regresiile pe cele două
4 4,28 19,28 4 8,51 186,73 subeșantioane

(cu 5 4,86 21,34 5 7,84 212,18 n1  n 2  13


6 4,07 22,56 6 11,97 250,12
), se calculează
SCR 1 și
7 4,32 24,23 7 21,95 261,81
SCR 2 și se verifică testul
8 4,12 25,07 8 19 395,92
Fisher.
9 3,72 27,96 9 32,95 535,37
1) 2)
10 4,3 27,97 10 36,64 655,69

11 3,8 40,55 11 41,67 815,4

12 5,85 52,02 12 614,66 1040,85

13 8,95 58,11 13 1814,35 2586,8


1) ^ 13∗1783,3599−347,43∗58,3 = 23183,6787−20255,169 =0 , 010
b=
13∗12128,4563−(347,43)
2
412367,514−120 707,6049
naˆ  bˆ  xi   y i / 1 / n  aˆ  bˆ  x i / n   y i / n  aˆ  y  bx
ˆ
58,3
ý= =4,485
13
347,43
x́= =26,725
13
a^ =4,485−0 , 010∗26,725=4,21 7
y i=4,217+0 , 010∗xi
^
Raportul de corelație:

23,1

R y / x = 1−
27,32
=0 ,393

Coeficientul de determinație:

23,1
R2=1− =1−0 , 845=0 , 155
27,32
SCR 1=∑ ui2=23,1

^ 13∗5434066,023−7406,28∗2646,32 70642858,299−19599386,8896
2) b= = =0 , 730
13∗9596682,733−(7406,28)
2
124756875,529−54852983,4384
naˆ  bˆ  xi   y i / 1 / n  aˆ  bˆ  x i / n   y i / n  aˆ  y  bx
ˆ
2646,32
ý= =203,563
13
7406,28
x́= =569,714
13
a^ =203,563−0,730∗569,714=−212,328
y i=−212,328 4,217+0,730∗xi
^
Raportul de corelație:

269693,91

R y / x = 1−
3136746,53
=0 , 956

Coeficientul de determinație:

269693,91
R2=1− =1−0 , 0859=0 , 9141
3136746,53
SCR 2=∑ ui2=269693,91

Ipotezele statistice care permit detectarea heteroscedasticității:


H 0 :  modelul este homoscedastic (nu există dependență între variabilele explicative și cele reziduale.

H1 : modelul este heteroscedastic.

269693,91/(13−2) 24517,628
F calc= = =8227,39 2
13 2,980
23,1/(1 3− −2)
4

Ftab  F ,n1  2,n n/42  F0,05;11;24  2,61

Fcalc  Ftab  ipoteza de homoscedasticitate


H 0 se respinge, deci modelul este heteroscedastic.