Sunteți pe pagina 1din 19

ACADEMIA DE STUDII ECONOMICE BUCURETI

FACULTATEA DE RELAII ECONOMICE INTERNAIONALE

PROIECT LA ECONOMETRIE

Coordonator: PROF. DR. ERIKA MARIN

2010-2011

A SCOPUL PROIECTULUI. PREZENTAREA PROBLEMEI

Acest studiu i propune s gseasc corelaia dintre nivelul PIB-ului i numrul


locuitorilor (populaia) statelor din Europa (cele 27 membre UE plus nc 5 state nemembre
UE) pentru anul 2009. Se va urmri dac populaia influeneaz n vreun fel nivelul PIB-ului.
Produsul intern brut este un indicator macroeconomic care reflect suma valorii de piaa a
tuturor mrfurilor i serviciilor destinate consumului final, produse n toate ramurile economiei
n interiorul unui stat n decurs de un an.
Dei numrul locuitorilor nu este folosit n calcularea PIB-ului, consumul privat, care este
una dintre componentele principale ale PIB-ului, depinde de populaie.
Consumul privat - este n mod normal cea mai mare component a PIB, reprezentnd
cheltuielile gospodariilor n economie. Aceste cheltuieli pot fi clasificate n: bunuri durabile,
bunuri perisabile i servicii. Exemple: hran, chirie, bijuterii.
Au fost nregistrate 32 de uniti, reprezentnd valorile specifice perechii de caracteristici
X i Y, unde numrul locuitorilor reprezint variabila independent (X), iar nivelul PIB-ului,
variabila dependent (Y).
Modelul econometric se va construi pe baza datelor obinute de pe site-ul Comisiei Europene cu
privire la date statistice ale rilor membre UE, dar si ale celorlalte state din Europa i a marilor
puteri economice:
http://epp.eurostat.ec.europa.eu/tgm/table.do?tab=table&init=1&plugin=1&language=en&pcode=tec00001;
http://epp.eurostat.ec.europa.eu/tgm/table.do?tab=table&init=1&plugin=1&language=en&pcode=tps00001

Anexa Excel cuprinde mai multe sheet-uri : indicatori regresie simpl liniar,
reprezentarea grafic, ANOVA, Homoscedasticitatea, regresie set1, regresie set3, previziune,
testarea liniaritii.

Tabel 1. Populaia i PIB-ul rilor din Europa n anul 2009


NR
.
POPULATIA
PIB
CR
(milioane
(miliarde
T
TARA
locuitori)
euro)
1
Belgia
10,75
339
2
Bulgaria
7,6
35
3
Cehia
10,46
137
4
Danemarca
5,51
222
5
Germania
82
2397
6
Estonia
1,34
13
7
Irlanda
4,45
159
8
Grecia
11,26
233
9
Spania
45,82
1053
10
Frana
64,36
1907
11
Italia
60,04
1520
12
Cipru
0,79
16
13
Letonia
2,26
18
14
Lituania
3,34
26
15
Luxembourg
0,49
38
16
Ungaria
10,03
92
17
Malta
0,41
5
18
Olanda
16,48
571
19
Austria
8,35
274
20
Polonia
38,13
310
21
Portugalia
10,62
168
22
Romania
21,49
115
23
Slovenia
2,03
35
24
Slovacia
5,41
63
25
Finlanda
5,32
171
26
Suedia
9,25
290
27
Marea Britanie
61,59
1563
28
Islanda
0,31
8
29
Norvegia
4,79
272
30
Elveia
7,7
354
31
Croaia
4,43
45
32
Turcia
71,51
440
Sursa: Eurostat; http://epp.eurostat.ec.europa.eu/tgm/table.do?tab=table&init=1&plugin=1&language=en&pcode=tec00001
http://epp.eurostat.ec.europa.eu/tgm/table.do?tab=table&init=1&plugin=1&language=en&pcode=tps00001

DEFINIREA

MODELULUL DE REGRESIE SIMPL LINIAR

Modelul liniar: Yi=+xi+i


unde: xi = variabila independent;
Yi = variabila dependent;
, = parametrii funciei de regresie;
= ordonata la origine;
= d semnul funciei;
i = eroarea aleatoare.
Modelul de regresie liniar n eantion: yi=a+bxi+ei
unde: xi = variabila independent;
yi = variabila dependent;
a, b = estimatorii parametrilor , ;
ei = valoarea rezidual.
Pentru datele noastre funcia de regresie are urmtoarea form: Yi = 22,205xi - 5,4547 (pentru
reprezentarea grafic a variabilelor vezi anexa.).

C ESTIMAREA PARAMETRILOR MODELULUI I INTERPRETAREA ACESTORA


yi = na + bxi
xiyi = axi + bxi2
a = 5,454
b = 22,205
Funcia de regresie : yi = 22,205* xi 5,454
4

unde: a = ordonata la origine din punct de vedere matematic; nu are semnificaie


statistic; Intercept este termenul liber, deci coeficientul a = - 5,454. Termenul liber este punctul
n care variabila explicativ este 0, adic nivelul PIB-ului dac populatia este 0.
b = coeficientul de regresie din punct de vedere statistic; panta dreptei din punct
de vedere matematic. Coeficientul b=22,205, b>0 relev existena unei legturi directe ntre
populaie i PIB, ceea ce nseamn c la modificarea populaiei cu o unitate, PIB-ul se modific,
n acelai sens, n medie, cu 22,205 mld..

D TESTAREA SEMNIFICAIEI CORELATIEI I A PARAMETRILOR MODELULUI


DE REGRESIE

Conform calculelor avem suficient eviden statistic pentru a demonstra c ntre variabile
exist o legtur liniar semnificativ.

Conform calculelor avem suficient eviden statistic pentru a demonstra c legtura dintre
populaie i PIB este liniar. (Pentru urmrirea etapelor rezolvrii vezi anexa punctul D).

E APLICAREA ANALIZEI DE TIP ANOVA I INTERPRETAREA REZULTATELOR


Caseta ANOVA se refer la descompunerea variaiei totale (SST) a variabilei dependente
n dou componente: variaia explicat prin rgresie (SSR) i variia neexplicat (SSE) sau
variaia rezidual. Tot n aceast caset gsim Fcalc i Significance F, valorile acestora dndu-ne
elemente importante care stau la baza validrii modelului de regresie.

Ele ne furnizeaz

informaii privind valoarea calculat a statisticii test F i a erorii pe care putem s-o facem cnd
respingem modelul de regresie ca fiind neadecvat. Regula de decizie privind acceptarea
modelului este: valori mici pentru Significance F i valori mari pentru statistica test F.
Significance F reprezint valoarea erorii pe care o facem prin respingerea ipotezei nule cnd de
fapt ea este adevrat; aceasta trebuie s fie n general mai mic de 5%.
SS reprezint suma ptratelor i explic variaia dat de regresie.
Pentru datele noastre Fcalc (102,6102307)

Ftab (4,170876757) i Significance

F = 3,38634E-11 reprezint o valoare mai mic de 5%, putem accepta faptul c modelul este
valid.
5

F TESTAREA IPOTEZELOR CLASICE ASUPRA MODELULUI DE REGRESIE SIMPL


Ipoteze statistice clasice supra modelului de regresie simpl
1.

Forma funcional: yi=+xi+i

Ipoteza de liniaritate se refer la felul n care parametrii intr n ecuaie, nu neaprat la


relaia ntre variabilele x i y.
2.

Normalitatea ( i N(0, 2))


-

Valorile Y snt normal distribuite pentru orice X

Erorile snt normal distribuite cu medie zero E(i)=0 i

Ipoteza c media erorilor este zero: E( i)=0 i, este natural atta timp ct este vzut ca
suma efectelor individuale, cu semne diferite. Este o ipotez de lucru, tehnic, ce permite
obinerea unor estimatori buni.
3.

Homoscedasticitatea (dispersia este constant): 2(i)= 2, i

Ipoteza de baz a modelului de regresie este c dispersia erorilor trebuie s fie constant.
Dac aceast ipotez nu se verific ne aflm n cazul de heteroscedasticitate. n acest caz
coeficienii sunt afectai de eroare.
4.

Non-autocorelarea erorilor: E( i j)=0 i j

Aceast ipotez nu implic faptul c yi i yj sunt necorelate, ci faptul c deviaiile observaiilor


de la valorile lor ateptate sunt necorelate.
5.

Necorelarea ntre regresor i erori: Cov( X i , j ) = 0, i, j

Testarea ipotezei de homoscedasticitate


Testm dac variaia erorilor este constant. H0: Dispersia erorilor este constant
H1: Dispersia erorilor nu este constant
Etapele testrii:
1.

Se ordoneaz seria de date dup valorile lui xi; (vezi anexa pctul F)

2. Se mparte seria de date 3 pri;


I.

12 observaii

II.

8 observaii

III.

12 observaii

3. Se fac 2 analize de regresie pentru primul i ultimul set de date;


4. Se calculeaz/extrage din ANOVA pentru fiecare parte (cele 2 seturi) SSR-urile;
SSR1 =22,92

SSR2 = 4276017,91
7

5.

SSE1 = 16,26

SSE2 = 2403196,76

SST1 = 39,18

SST2 = 6679214,67

Se calculeaz Fcalc =

i se compar cu valoarea teoretic din tabele pentru testul F, cu

df =

= 147798,08

Fcalc =

Ftab = finv(;df;df) = finv(5%;10;10) = 2,978 (conform Excel)


df=

=
6.

= 10 grade de libertate

Datorit faptului c Fcalc

Ftab ne aflm n situaia de heteroscedasticitate, adic variaia

erorilor nu este constant, iar modelul este reprezentativ.

Testarea ipotezei de autocorelare a erorilor


Verificm independena erorilor. n urma testrii rezult c ne aflm n zona de indecizie
(Anexa-pctul F).

Testarea normalitii erorilor


Pentru a testa normalitatea erorilor se utilizeaz testele de concordan (goodness-of-fit
tests) care realizeaz verificarea concordanei repartiiei emprice (pus n eviden de datele
experimentale) cu repartiia teoretic presupus c mbrac adecvat, c se muleaz cel mai
bine pe aceast repartiie empiric. (Anexa pctul F)
n urma testrii rezult c avem suficient eviden statistic pentru a demonstra c erorile
urmeaz o distribuie normal.

Testarea liniaritii
Din grafic se observ liniaritatea funciei. n urma testrii rezult c media erorilor este 0 .

(vezi Anexa-pctul F)

Previziunea valorii variabilei y dac variabila x crete cu 10% fa de ultima valoare

nregistrat

Se consider pentru ara M, variabila x = 10%*71,51 mil loc = 0,71 mil loc
y = 22,205*0,71 5,454 = 10,31 mld euro
E = t,n-2*se

= 2,042*292,95

= 598,20*1,01 = 610,04
Yi E

Ypred Yi + E

-599,73

Ypred 620,35

PIB-ul poate fi ntre 599,73 i 620,35 mld euro.

ANEX

NR.
CRT

TARA

xi
POPULATIA
(milioane
locuitori)

yi
PIB
(miliarde
euro)

xi^2

xi*yi

Yi

ei

(ei)^2

yi-Yi

(yi-Yi)^2

xi-xmed

Tabel 1. Populaia i Pib-ul rilor din Europa n anul 2009 (indicatori)

(xixmed)^2

ei - 1

ei - ei - 1

105,75

57,76

105,75

10,46

109,41

11046,95

5,51

581,64

338309,74

24,30

-11,30

707,55

93,36

126,79

2623,58

1053

2099,47

64,36

1907

Italia

60,04

12

Cipru

13

Belgia

10,75

339

115,56

3644,25

233,25

105,75

11183,12

-7,635

58,29

Bulgaria

7,6

35

57,76

266

163,30

-128,30

16461,92

7,6

Cehia

10,46

137

109,41

1433,02

226,81

-89,81

8065,89

Danemarca

5,51

222

30,36

1223,22

116,90

105,10

Germania

82

2397

6724

196554

1815,36

Estonia

1,34

13

1,80

17,42

Irlanda

4,45

159

19,80

Grecia

11,26

233

Spania

45,82

10

Frana

11

(ei - ei - 1)^2

valori
asteptate
(Ei)

11183,06

0,001365

-234,05

54781,39

0,001365

-128,30

38,49

1481,76

0,001365

30,36

-89,81

194,91

37991,76

0,001365

82

6724,00

105,10

476,54

227089,94

0,001313

127,71

1,34

1,80

581,64

-592,94

351583,42

0,001365

65,64

4308,84

4,45

19,80

-11,30

76,94

5920,14

0,001365

244,57

-11,57

133,96

11,26

126,79

65,64

-77,22

5962,32

0,001364

48248,46

1011,98

41,02

1682,71

45,82

2099,47

-11,57

52,60

2766,26

0,001349

4142,21

122734,52

1423,66

483,34

233617,75

64,36

4142,21

41,02

442,32

195646,36

0,001333

1520

3604,80

91260,8

1327,73

192,27

36966,14

60,04

3604,80

483,34

-291,07

84724,31

0,001337

0,79

16

0,62

12,64

12,09

3,91

15,30

0,79

0,62

192,27

-188,35

35477,14

0,001365

Letonia

2,26

18

5,11

40,68

44,73

-26,73

714,46

2,26

5,11

3,91

-30,64

938,89

0,001365

14

Lituania

3,34

26

11,16

86,84

68,71

-42,71

1824,20

3,34

11,16

-26,73

-15,98

255,41

0,001365

15

Luxembourg

0,49

38

0,24

18,62

5,43

32,57

1061,04

0,49

0,24

-42,71

75,28

5667,72

0,001365

16

Ungaria

10,03

92

100,60

922,76

217,26

-125,26

15690,61

10,03

100,60

32,57

-157,84

24912,11

0,001365

17

Malta

0,41

0,17

2,05

3,65

1,35

1,82

0,41

0,17

-125,26

126,61

16030,62

0,001365

18

Olanda

16,48

571

271,59

9410,08

360,48

210,52

44316,82

16,48

271,59

1,35

209,17

43750,27

0,001363

19

Austria

8,35

274

69,72

2287,9

179,96

94,04

8843,94

8,35

69,72

210,52

-116,47

13566,04

0,001365

20

Polonia

38,13

310

1453,90

11820,3

841,22

-531,22

282197,50

38,13

1453,90

94,04

-625,26

390956,20

0,001354

21
22

Portugalia
Romania

10,62
21,49

168
115

112,78
461,82

1784,16
2471,35

230,36
471,73

-62,36
-356,73

3889,16
127257,33

10,62
21,49

112,78
461,82

-531,22
-62,36

468,86
-294,37

219829,28
86652,73

0,001365
0,001362

23

Slovenia

2,03

35

4,12

71,05

39,62

-4,62

21,36

2,03

4,12

-356,73

352,11

123980,96

0,001365

24

Slovacia

5,41

63

29,27

340,83

114,68

-51,68

2670,31

5,41

29,27

-4,62

-47,05

2213,98

0,001365

25

Finlanda

5,32

171

28,30

909,72

112,68

58,32

3401,62

5,32

28,30

-51,68

110,00

12099,66

0,001365

26

Suedia

9,25

290

85,56

2682,5

199,94

90,06

8110,40

9,25

85,56

58,32

31,73

1007,07

0,001365

27

Marea Britanie

61,59

1563

3793,33

96265,17

1362,15

200,85

40339,94

61,59

3793,33

90,06

110,79

12274,49

0,001336

28
29

Islanda
Norvegia

0,31
4,79

8
272

0,10
22,94

2,48
1302,88

1,43
100,91

6,57
171,09

43,17
29272,49

0,31
4,79

0,10
22,94

200,85
6,57

-194,28
164,52

37743,79
27067,36

0,001365
0,001365

30

Elveia

7,7

354

59,29

2725,8

165,52

188,48

35523,01

7,7

59,29

171,09

17,38

302,18

0,001365

(ei-Ei)^2
11182,8266
8
16462,2666
9
8066,13509
8
11046,6584
3
338308,215
3
127,736683
5
4308,66010
2
133,996007
7
1682,60357
5
233616,460
4
36965,6237
15,2934535
5
714,528474
2
1824,32052
9
1060,94720
5
15690,9481
1
1,81868024
5
44316,2438
5
8843,68806
8
282198,942
4
3889,32644
1
127258,299
21,3768949
7
2670,45189
1
3401,45973
8
8110,15251
8
40339,4026
8
43,1528716
1
29272,0224
35522,4995
7

(ei-Ei)^2/Ei
8192525,106
12060198,91
5911000,896
8091451,448
257658918,7
93548,93884
3155811,308
98204,49339
1247420,436
175268265,8
27646366,92
11200,20144
523300,5004
1336127,979
776985,7728
11498003,21
1331,911782
32506397,6
6479306,475
208426487,2
2850220,53
93448720,17
15655,74492
1956038,968
2491469,845
5942431,838
30202752,73

11

31603,02322
21440231,53
26023890,74

B.
Gafic 1. Populaia i PIB-ul rilor din Europa n anul 2009

C.
Estimarea punctual a parametrilor
yi = na + bxi

12889 = 32*a + 588,32*b

xiyi = axi + bxi2

633534,38 = 588,32*a + 28675,89*b


xi2 = 28675,89 mld. euro

unde: yi = 12889 mil. loc.


xi = 588,32 mld. euro

n = numrul de observaii = 32

xiyi = 633534,38

(calcule cu ajutorul Excel)

Utiliznd metoda substituiei rezult: a = 5,454 i b = 22,205

Estimarea parametrilor prin intervale de ncredere


se =

292,95 mld.

n medie, valorile predictorii difer de cele observate cu

b - t,n-2 * sb
sb =

292,95 mld. .

b + t,n-2 * sb
=

= 1,73

ttab= tinv(;df) = tinv(5%;30) = 2.042


22,205 2,042*1,73

(conform Excel)

22,205 + 2,042*1,73

18,672

25,737

[18,672; 25,737]

D
Testarea semnificaiei corelaiei (testarea coeficientului de corelaie )
1. Formularea ipotezelor:
H0: = 0 (ntre variabile nu exist legtur liniar)
H1:

0(ntre variabile exist legtur liniar)

2. Selectarea nivelului de semnificaie


= 5%
3. Determinarea distribuiei testul t
4. Graficul

Zona de acceptare
Zona de respingere

Zona de respingere

-ttab

5.

tcalc = r

= 0,88

+ttab

= 0,88 *

tcalc

= 10,05

r = 0,88
conform calculelor din Excel
2

r = 0,77
r = coeficientul de corelaie
6.

tcalc ZR (zonei de respingere). Avem suficient eviden statistic pentru a respinge H0.
ntre variabile exist legtur liniar semnificativ.

Testarea parametrilor unui model de regresie ()


1.

H0 : =0 (panta dreptei nu exist)


H1 : 0 (panta dreptei exist)

2.

=5%

3. Distribuia t
13

ttab= tinv(;df)=tinv(5%;30)=2,042

4. Graficul

Zona de acceptare

Zona de respingere

Zona de respingere

-ttab

+ttab

tcalc

= 12,835

5.

tcalc=

6.

Respingem H0. Avem suficient evidena statistic pentru a demonstra c legtura


dintre populaie i PIB este liniar, adic panta dreptei exist.

E Analiza ANOVA
ANOVA
df
Regression

SS

MS

8805774,362

8805774,362

Residual

30

2574531,107

85817,70357

Total

31

11380305,47

Coefficients
Intercept
POPULATIA
(milioane
locuitori)

Standard
Error

Significance F

Lower 95%
-139,4684192

Upper 95%
128,559099
9

17,7280543

26,6816176
8

-5,454659652

65,61992233

-0,083125055

P-value
0,93430428
9

22,20483599

2,192058993

10,12967081

3,38634E-11

SST=SSR+SSE

t Stat

F
102,610230
7

3,38634E-11

(Y Y) = (Y Y) + (Y Y )
2

Lower 95,0%

Upper
95,0%

-139,4684192

128,5590999

17,7280543

26,68161768

SST = Total Sum of Squares = msoar variaia valorilor observate Yi n jurul mediei Y
SSR = Regression Sum of Squares = msoar variaia explicat de modelul de regresie
14

SSE = Error Sum of Squares = msoar variaia ce poate fi atribuit altor factori, diferii de
variabila explicativ X

F
Testarea ipotezei de homoscedasticitate
xi

yi
PIB
(miliarde
euro)

NR.
CRT

TARA

POPULATIA
(milioane
locuitori)

28

Islanda

0,31

17

Malta

0,41

15

Luxembourg

0,49

38

12

Cipru

0,79

16

Estonia

1,34

13

23

Slovenia

2,03

35

13

Letonia

2,26

18

14

Lituania

3,34

26

31

Croaia

4,43

45

Irlanda

4,45

159

29

Norvegia

4,79

272

25

Finlanda

5,32

171

24

Slovacia

5,41

63

Danemarca

5,51

222

Bulgaria

7,6

35

30

Elveia

7,7

354

19

Austria

8,35

274

26

Suedia

9,25

290

16

Ungaria

10,03

92

Cehia

10,46

137

3
21

Portugalia

10,62

168

Belgia

10,75

339

Grecia

11,26

233

18

Olanda

16,48

571

22

Romania

21,49

115

20

Polonia

38,13

310

Spania

45,82

1053

11

Italia

60,04

1520

27

Marea Britanie

61,59

1563

10

Frana

64,36

1907

32

Turcia

71,51

440

82

2397

588,32

12889

5
Total

Germania
32

Tabel 2. Seturile de ri pentru testarea homosedasticitii


15

Pentru primul set de observaii


Regression Statistics
Multiple R
R Square
Adjusted R Square
Standard Error
Observations

0,764819407
0,584948725
0,543443598
1,275244435
12

ANOVA
df
Regression

Residual

10

Total

11

SS
22,9193829
7
16,2624837
39,1818666
7

MS
22,919
38
1,6262
48

F
14,093
41

Pentru al treilea set de observaii


SUMMARY
OUTPUT
Regression Statistics
0,800123
Multiple R
557
0,640197
R Square
706
Adjusted R
0,604217
Square
477
490,2241
Standard Error
077
Observations
12
ANOVA
df
Regression

Residual

10

Total

11

SS
4276017,90
9
2403196,75
8
6679214,66
7

MS
4276017,
909
240319,6
758

Significanc
F
eF
17,79304 0,0017767
127
38

16

Significa
eF
0,00375

Testarea ipotezei de autocorelare a erorilor


http://www.nd.edu/~wevans1/econ30331/Durbin_Watson_tables.pdf
Testul Durbin-Watson

D=

= 1, 277

dl = 1,160
du = 1,283
H0 : Nu exist autocorelaie pozitiv
H1 : Nu exist autocorelaie negativ

Respingem H0

Acceptm H0 i H1

Zon de indecizie
0

dl du

Respingem H1
Zon de indecizie

4-du

4-dl

Testarea liniaritii

Din numrul de 32 de ri se extrage un eantion de 9 ri.


xi

yi
17

NR.
CRT
TARA
1
Belgia
2
Bulgaria
3
Cehia
4 Danemarca
5 Germania
6
Estonia
7
Irlanda
8
Grecia
9
Spania
Tota
l
9

POPULATIA
(milioane locuitori)
10,75
7,6
10,46
5,51
82
1,34
4,45
11,26
45,82

PIB
(miliarde
euro)
339
35
137
222
2397
13
159
233
1053

-9,16
-12,31
-9,45
-14,4
62,09
-18,57
-15,46
-8,65
25,91

83,91
151,54
89,30
207,36
3855,17
344,84
239,01
74,82
671,33

83,91
303,07
267,91
829,44
19275,84
2069,07
1673,08
598,58
6041,95

179,19

4588

5717,28

31142,85

xi-xmed

(xi-xmed)^2

(xi-xmed)^2*ni

Media eantionului este : xmed=19,91 mil loc


Dispersia eantionului este: 2= 3460,3166
Abaterea standard este: =58,82

1.

H0: = 0 (media erorilor este 0)


H1: 0 (media erorilor nu este 0)

2. =5%
3. distribuia t
4. Graficul

Zona de acceptare
Zona de respingere

Zona de respingere

-ttab

tcalc

+ttab

ttab= 2,3646
5.

tcalc =

= 1,0158
18

6. Acceptm ipoteza nul. Avem suficient eviden statistic pentru a demonstra c


media erorilor este 0.

Testarea normalitii erorilor


1.

H0: Erorile nu urmeaz o distribuie normal


H1: Erorile urmeaz o distribuie normal

2.

= 5%

3.

2 (Goodness of fit)
df= 32 - 1 = 31
2tab = chinv(5%;31) = 44,98

4. Graficul

Zona de acceptare

Zona de respingere

2tab
5.

2calc =

6.

2calc

2calc

= 1931792123,36

2tab. Repingem H0. Avem suficient eviden statistic pentru a demonstra c

erorile urmeaz o distribuie normal

19