Sunteți pe pagina 1din 21

Academia de Studii Economice

Bucuresti

PROIECT ECONOMETRIE AN III,


REI, ZI

Studiul legaturii dintre valorile Exportului si PIB-


ului. Aplicat pe 25 de state europene.

Epure Ioana Camelia


Grupa 952, Seria C
A) Prezentarea Problemei

Pentru a putea studia legatura statistica dintre cele doua variabile


trebuie sa intetelegem in primul rand legarura economica dinre cele doua.

Exportul reprezinta o operatiune comerciala de vanzare a unor bunuri


materiale si/sau servicii catre persoane fizice sau juridice dintr-o alta tara
in schimbul unei sume dintr-o valuta convenita.
Produsul intern brut (prescurtat PIB) este un indicator macroeconomic
care reflecta suma valorii de piata a tuturor marfurilor si serviciilor
destinate consumului final, produse in toate ramurile economiei in
interiorul unei tari în decurs de un an. Acesta se poate calcula si la nivelul
unei regiuni sau localitati.

PIB = consum + investitii + exporturi – importuri

Prin urmare putem obserba o legatura inca din definirea celor doua
variabile. Nivelul exporturilor influenteaza in mod direct niveul PIB-ului.

Atat Exporturile cat si PIB-ul ajuta la relatarea gradului de dezvoltare si de


prosperitate a unei tari. Important pentru studiul economic este procentul
din PIB reprezentat de exporturi, o tara puternica este o tara care reuseste
sa exporte o cantitate ridicata de produse si servicii.

Prin urmare cele doua variabile identificate sunt:

Xi= Exportul in anul 2006 exprimat in mii euro

Yi= PIB-ul aferent celor 25 de tari in 2006, exprimat in mld euro

Valorile Exportului si PIB-ului pentru cele 25 de tari sunt prezentate in


urmatorul tabel, prezent si in anexa Excel:

Tabel 1.

Export PIB 2006


Tara 2006 mil mld
Belgia 292087,00 392,00
Bulgaria 11748,00 31,00
Cehia 75604,00 141,80
Danema
rca 73716,00 275,20
Germani
a 882532,00 2906,60
Irlanda 86593,00 222,60
Grecia 16525,00 244,90
Spania 170211,00 1223,90
Franta 394925,00 2230,70
Italia 332013,00 1844,70
Letonia 4902,00 20,12
Luxemb
urg 18241,00 41,30
Ungaria 59936,00 112,80
Lituania 11263,00 29,79
Olanda 369249,00 657,50
Austria 108913,00 322,40
Polonia 88229,00 338,70

Romania 25850,00 121,60


Slovenia 18501,00 37,30
Slovacia 33340,00 55,05

Finlanda 61489,00 209,40


Suedia 117707,00 384,92
UK 357322,00 2345,02
Norvegi
a 97331,00 310,95
Elvetia 117506,00 379,75
Sursa: Eurostat
B) Definirea modelului de regresie simpla liniara
Pentru a studia modelul de regresie de trebuie analizata corelograma
rezultata dupa studiul parametrilor xi (valorile exportului din cele 25 de
tari studiate) si yi (valorile PIB-ului celor 25 de tari).
Corelograma 1.

Sursa: anexa Excel


Conform corelogramei putem observa ca punctele sunt plasate pe directia
primei bisectoare asadar avem o legatura directa intre cele doua variabile.

Din functia de regresie Y=bx+a putem afla cei doi parametrii, peramentrul
”a” nu are semnificatie economica in timp ce “b” reprezinta panta dreptei.
Parametrul b ne arata ca la o crestere cu 1 milion de euro a exportului PIB-
ul creste cu 0,003 miliarde.

C) Pentru estimarea parametrilor modelului vom folosi functia


de regresie liniara:

Yi= a+bXi+ εi unde:


Yi= Variabila dependenta
Xi= Variabila independenta
εi= Variabila de perturbatie
a= Termenul constant
b= Panta dreptei

Parametrii a şi b se determină cu ajutorul metodei celor mai mici


pătrate:
aplicarea ei ducand la
∑( y − yˆ i ) ∑( y − a − bxi )
2 2
i min ⇔ i min ⇔
i i

obtinerea urmatorului sistem de ecuatii:

∑ yi = na + b∑ xi
 i i

∑ xi yi = a ∑ xi + b∑ xi
2

 i i i

 n n
 n  n 
 ∑ y i ∑ xi −  ∑ xi  ∑ xi y i 
2

 i =1  i =1  = y − bx
a = i =1 i =1
 n
 n 
2

 n ∑ xi −  ∑ xi 
2

 i =1  i =1 

 ∑i xi yi − n x y
b =
∑i i
2
 x 2
− n x


Pentru a rezolva acest sistem folosim urmatoarea secventa din anexa


Excel:
Tabel 2.
Sursa: anexa Excel
Asadar
14879,99 = 25a + 3825733b

5728496433,44 = 3825733a + 1509192231471b

a=(14879,99-3825733b)/25 =>
5728496433,44= (14879,99-3825733b)/25*3825733+ 1509192231471b
=>
5728496433,44= 2277074751,3068 – 585449319491,56b+
1509192231471b => 3451421682,1332= 923742911979,44b =>
b=0,0037363444280588

Stiind ca b=0,003 putem afla parametrul a:


a= (14879,99 – 0,003*3825733)/25 =>
a= (14879,99 - 14294,25617779071)/25 =>
a= 23,42936

In ceea ce priveste parametrul a=23,42, acesta reprezinta ordonata la


origine si nu are semnificatie economica. Parametrul b reprezinta
coeficientul de regresie si panta dreptei. Acesta este mai mare decat 0
deci intre Exporturile tarilor si PIB-ul acestora exista o legatura directa
astfel, la fiecare crestere cu o unitate a primului indicator studiat cel de-al
doilea se modifica cu 0,003, adica valoarea parametrului.

Pentru estimarea parametrilor prin interval de incredere trebuie sa


cunoastem atat eroarea standard a estimatei, eroarea standart a
ordonatei la origine cat si eroarea standard a corficientului de regresie.

Eroarea standard a estimatiei (sau SEM) se regaseste si in anexa excel in


studiul regresiei:
Regression Statistics
0,88549346
Multiple R 2
0,78409867
R Square 1
Adjusted R 0,77471165
Square 6
392,917057
Standard Error 7
Observations 25

Calculul SEM se realizeaza cu ajutorul urmatoarei formule:


n

∑ ( y − yˆ ) 2

se = i =1
In cazul de fata, datorita faptului ca studiam o
n − k −1
regresie liniara simpla, k (numarul de variabile independente) este egal cu
1 => formula
n devine:
∑ ( y − yˆ ) 2

se = i =1

n−2
Conform rezultatelor aflate in anexa excel ecuatia devine:
Se=3550827,7325-2=154383,8143478261 = 392,9170578478696
Intervalul de incredere parametrul α :

a − tα / 2;n−2 ⋅ sa ≤ α ≤ a + tα / 2;n−2 ⋅ sa

sa = se
∑x 2
i
= 392,9170577⋅
1509192231471
= 100,44
n∑ ( x − x ) 25 ⋅ 923742911979,44 α=0,05
2
i

=> ecuatia
de aflare a intervalului de incredere devine:
23- 2,397875*100,44 ≤ α ≤ 23+2,397875*100,44 =>
23-240,842565 ≤ α ≤ 23 + 240,842565 =>
-217,842565 ≤ α ≤ 263,842565

Intervalul de incredere al parametrului β:


b − tα / 2 ;n − 2 ⋅ s b ≤ β ≤ b + tα / 2 ; n − 2 ⋅ s b

se 392,9170577 392,9170577
sb = = = = 0,000408813589358391
n
923742911979,44 961115,4519512419
∑( x − x)
2
i
i =1

=> ecuatia de aflare a intervalului de incredere devine:


0,0037- 2,397875*0,000408813589358391 0,0037+
≤ β ≤

2,397875*0,000408813589358391 =>
0,0037- 0,000980283885582533 0,0037+
≤ β ≤

0,000980283885582533=>
0,0027197161144175≤ β ≤ 0,0046802838855825
D) Pentru studiul semnificatiei corelatiei si a perametrilor vom
folosi urmatoarea secventa de calcul din tabelul principal
gasit in anexa excel:
Tabel 3.
(xi-xmed)^2 (xi-
(yi- xmed)*(yi-
yi-ymed ymed)^2 xi-xmed ymed)
19337038366,
-20 139057,6 -
3,20 9841290,04 8 28256453,83
19960411380, -
94318321,1 141281,3
5994680177,1
-564,20 0 2 79710852,93
0205571,1
6290602729,4
-453,40 2 -77425,32 35104602,92
2102399,6
53217416012
-320,00 9 -79313,32 25380224,33
7,185342572, 729502,6 1686172844,
4413784615,1
2311,40 18 8 71
4138830,4
18633429378,
-372,60 0 -66436,32 24754140,94
66 -
295210127,62
122709,7 136504,3
58513520002,
-350,30 5 2 47817397,77
66395264,2
32035157706,
628,70 9 17181,68 10802130,46
342674861, 241895,6 395620500,7
21941702930,
1635,50 82 8 5
381561251, 178983,6 223640194,0
18167891208,
1249,50 45 8 7
42 -
8666366228,6
330722,2 148127,3
2
-575,08
20097689486, 1 2 85185728,72
-
34
46750950019,306804,6 134788,3
-553,90 30 8 2 74659185,75
1946249690,3232709,3
-482,40 4 0 -93093,32 44908172,88
4199081472,1 -

0319687,9 141766,3
16174579435,
-565,41 3 2 80156026,94
66 216219,6
18097868882,
62,30 3881,35 8 13470589,85
-272,80 0274419,58 -44116,32 12034910,92
14325533322,
-256,50 65792,00 -64800,32 16621250,98
06 -
8379630185,7
224296,5 127179,3
0
-473,60 1 2 60232064,91
1247666290,1
-
8
311251,8 134528,3
-557,90 7 2 75053285,15
41735499101,
58
3102302850,8
2
1261906263,8
2
923742911979,
44

Sursa: anexa Excel

xmed= media exporturilor celor 25 de tari = i=1nxin= 153029,32


ymed= PIB mediu al celor 25 de tari= i=1nyin= 595,20
Pentru testarea semnificatiei corelatiei trebuie a aflam covarianta si
coeficientul de corelatie.

Covarianta: COVxy=xi-xmed(yi-ymed)n=3451421988,1925=138056879,5276

Coeficientul de corelatie r:
n

cov ( x, y ) ∑( x i − xmed ) ⋅ ( y i − ymed )


r= = i =1

sx ⋅ s y n 2 
n
2
 ∑ ( x i − xmed )   ( y i − ymed ) 

 i =1   i =1 

r= 3451421988,19923742911979,44*16446530,19= 3451421988,193897738535,31357=
0,8854934616368093= 0,89
De asemenea putem observa valoarea coeficientului de corelatie din
output-ul de regresie anexat in excel:

Regression Statistics
Multiple R 0,89
R Square 0,78
Adjusted R Square 0,77
392,9
Standard Error 2
Observations 25,00

Coeficientul de corelatie masoara intensitatea legaturii dintre doua


variabile, in cazul aplicat in acest proiect, legatura dintre Exportul unei tari
si PIB-ul acesteia. r=0,89 arata o legatura puternica intre cele doua
sintagme economice.

Testarea coeficientului de corelatie:


1. Formularea ipotezelor
H0: ρ=0 (nu exista legatura liniara intre cele doua variabile)
H1: ρ≠0 (exista legatura liniara intre cele doua variabile)
2. Folosim testul statistic „t” (student) deoarece n=25 < 30, deci
avem un esantion de volum redus.
α=0,05
3. ttab=tα/2;df ; d.f= n-2 deoarece avem regresie simpla; ttab=t0,025;23
ttab=2,397875
zona de respingere: (-∞;-2,397875)U(+2,397875;+∞)
zona de acceptare: (-2,397875;+ 2,397875)
4. tcalc= rn-21-r2= 0,89231-0,78= 93,04
5. 93,04> 2,397875 => resping H0
6. Exista suficienta evidenta statistica pentru a respinge ipoteza
nula si pentru a accepta ipoteza alternativa, asadar exista o
legatura liniara intre Exportul unei tari si PIB-ul acesteia.

Testarea parametrilor modelului de regresie:


Testarea parametrului a:
1. H0: α=0 (α nu este semnificativ diferit de 0, deci nu este
semnificativ statistic)
H1: α≠0 (α este semnificativ diferit de 0, deci este semnificativ
statistic)
2. Folosim testul statistic „t” (student) deoarece n=25 < 30, deci
avem un esantion de volum redus.
α=0,05
3. ttab=tα/2;n-k-1 ; n-2 deoarece avem regresie simpla; ttab=t0,025;23
ttab=2,397875
zona de respingere: (-∞;-2,397875)U(+2,397875;+∞)
zona de acceptare: (-2,397875;+ 2,397875)
4.
a − µa a − 0 a
t calculat = t a = = =
sa sa sa

sa = se
∑x i
2

= 392,9170577⋅
1509192231471
= 100,44
n∑ ( x − x ) 25 ⋅ 923742911979,44
2
i

tcalculat= aSa= 23,42936100,44= 0,2332672242134608


5. -2,39<0,233<2,39 => accept H0
6. Nu exista suficienta evidenta statistica pentru a respinge ipoteza
nula, asadar putem spune ca α nu este semnificativ diferit de 0,
deci nu este semnificativ statistic.

Testarea parametrului b:
1. H0: β=0
H1: β≠0
2. Folosim testul statistic „t” (student) deoarece n=25 < 30, deci avem
un esantion de volum redus.
α=0,05
3. ttab=tα/2;n-k-1 ; n-2 deoarece avem regresie simpla; ttab=t0,025;23
ttab=2,397875
zona de respingere: (-∞;-2,397875)U(+2,397875;+∞)
zona de acceptare: (-2,397875;+ 2,397875)
4.
b − µb b − 0 b
t calc = t b = = =
sb sb sb

se 392,9170577 392,9170577
sb = = = = 0,000408813589358391
n
923742911979,44 961115,4519512419
∑( x
i =1
i − x)
2

tcalc= 0,0037 = 9,050659230449353


0,000408813589358391

5. Tcalc apartine zonei de respingere=> resping Ho


6. Este foarte putin probabil ca estimatorul b sa provina dintr-o
populatie cu β=0, β este semnificativ statistic.

A) ANOVA
Pentru aplicarea analizei de tip anova am folostit data analisys pentru a
obtine urmatoarea secventa:
• Regression Statistics

Regression Statistics
Multiple R 0,89
R Square 0,78
Adjusted R Square 0,77
392,9
Standard Error 2
Observations 25,00

Din aceasta secventa afla coeficientul de corelatie, Multiple R, care ia


valori de la 0 la 1. In cazul studiat Multiple r= 0,89, o valoare aflata intre
0,8 si 0,95, ceea ce inseamna ca intre Exportul si PIB-ul unei tari exista o
legatura puternica.
R square este diferit de 0 ceea ce inseamna ca variabila aleaza x,
Exporturile, au valoare explicativa. Putem imterpreta deci ca Exportul
explica variatia PIB-ului in masura de 0,78 sau 78%.
Din Standard Error putem deduce ca intre valorile reale si cele estimate
pe baza fuctiei liniare de regresie exista o diferenta de 392,92 mii euro.
• ANOVA
Significance
df SS MS F F
12895702 12895702
Regression 1,00 ,46 ,46 83,53 0,000000004
Residual 23,00 3550827, 154383,8
73 1
16446530
Total 24,00 ,19

In aceasta secventa, denumita si ANOVA, putem observa:


gradelul de libertate, 23
numarul de variabile, 1
suma patratelor 16446530,19
media pa tratica 12895702,46
raportul anova F=85,53.
Cu ajutorul raportului ANOVA putem verifica validitatea modelului de
regresie ales. Datorita faptului ca F=85,53 si Significance F= 0,000000004
putem spune ca modelul este valid si poate fi folosit pentru analiza dependentei
dintr e cele doua variabile.

Testul F de verificare a validitatii modelului:

1. H0: Modelul nu este valid statistic


H1: Modelul este valid statistic
2. Ftabelar= Fα;k;n-k-1=F0,05;1;23= 4,279344

s y2 / x
3. Fcalc = = 12895702,46392,9170578478696= 32820,41897247684
2
s ε

4. Fcalc> Ftab => resping H0

5. Avem evidenta statistica pentru a concluziona ca modelul de


regresie ales este reprezentativ.
• Parametrii de regresie
Standa
Coefficie rd t Lower Upper Lower Upper
nts Error Stat P-value 95% 95% 95,0% 95,0%
Intercep
t 23,43 100,44 0,23 0,82 -184,36 231,22 -184,36 231,22
X
Variable 0,0000000040591 0,00289 0,00458 0,00289 0,0045
1 0,0037 0,00 9,14 892 06 20 06 82

Din aceasta ultima secventa putem afla cei doi parametrii: a=23.43
si b=0,0037. Dupa cum am mai reamintit parametrul a nu are semnificatie
economica, iar b ne arata ca exista o legatura directa intre Export si PIB.
In ceea ce priveste parametrul a,valoarea p-value este 0,82 < 0,05,
ceea ce inseamna ca acesta nu este semnificativ. In cazul parametrului b,
p value este 0,000000004059 < 0,05 asadar parametrul b este semnificativ
pentru studiul nostru.
De asemenea din acest tabel putem observa intervalele de incredere ale
parametrilor, in cazul α=0,05: -184,36< a< 231,22 si 0,0028906<b<0,004582

A) Testarea ipotezelor clasice asupra modelului de regresie


simpla

Testarea liniaritatii modelului propus

In conformitate cu testarea coeficientului de corelatie prezentata mai sus,


Ttabelar > Tcalculat ceea ce inseamna ca respingem H0, conform careia nu
exista o legatura liara intre cele doua variabile.
In concluzie acceptam H1 ceea ce inseamna ca exista o legatura liniara
intre cele doua variabile. Asadar intre Exportul si PIB-ul unei tari exista o
legatura liniara.

Testarea normalitatii erorilor


Pentru testarea normalitatii erorilor se va studia urmatorul grafic:
Corelograma 2.

Sursa: anexa Excel

Putem considera ca punctele din figura formeaza o regiune de tip banda


orizontala ceea ce nu contrazice ipotezele de normalitate a erorilor. Forma
de banda reflecta
constanta dispersiei reziduurilor pentru tot domeniul variabilei
independente.

Homoscedasticitatea/ Heteroscedasticitatea
Pentru a afla daca modelul de regresie ales ideplineste ipoteza de
homoscedasticitate vom aplica urmatorul test:
1. Dupa ordonare seria va arata:
Tabel 4.
PIB
Export 2006
Tara 2006 mil mld
Letonia 4902,00 20,12
Lituania 11263,00 29,79
Bulgaria 11748,00 31,00
Grecia 16525,00 244,90
Luxembu
rg 18241,00 41,30
Slovenia 18501,00 37,30
Romania 25850,00 121,60
Slovacia 33340,00 55,05
Ungaria 59936,00 112,80
Finlanda 61489,00 209,40
Danema
rca 73716,00 275,20
Cehia 75604,00 141,80
Irlanda 86593,00 222,60
Polonia 88229,00 338,70
Norvegi
a 97331,00 310,95
Austria 108913,00 322,40
Elvetia 117506,00 379,75
Suedia 117707,00 384,92
Spania 170211,00 1223,90
Belgia 292087,00 392,00
Italia 332013,00 1844,70
UK 357322,00 2345,02
Olanda 369249,00 657,50
Franta 394925,00 2230,70
Germani
a 882532,00 2906,60
Sursa: anexa Excel

2. Dupa ordonare am impartit seria de date in 3 parti, colorate


distinctiv in tabelul de mai sus. Setul 1 si 3 contin un numar egal de
termeni si anume 10, iar setul 2 contine 5 termeni.
3. Pentru seturile 1 si 3 se fac analizele de regresie si se obtine:

ANOVA setul 1
df SS
10328,860
Regression 1 09
42322,424
Residual 7 42
52651,284
Total 8 51
ANOVA setul 3
df SS
4471366,0
Regression 1 14
3242898,7
Residual 7 32
7714264,7
Total 8 46

Fcalculat=SSE3SSE1= 3242898,73242322,42442=76,62365227043862

Ftabelar= Fα;k;(n-d-2k)/2=F0,05;1; 25-5-4=4,493998

4. Fcalculat>Ftabelar => heteroscedasticitate


5. In cazul modelului de regresie ales avem heteroscedasticitate,
asadar variatia erorilor nu este constanta.

Autocorelarea erorilor
In urmatorul test vom verifica daca erorile la momentul t sunt corelate cu
erorile la momentul t-1. Rezolvarea problemelor se fac pe baza
urmatoarei secvente din Tabelul principal al anexei Excel:
Tabel 5.

(ei-ei-
ei ei-1 1)^2 ei^2
522392,0 522392,0
-722,77 7 7
471204,2
-36,32 -722,77 0 1319,42
-164,11 -36,32 16329,78 26932,69
-23,66 -164,11 19727,39 559,68
152580,4 171622,1
-414,27 -23,66 1 5
-124,37 -414,27 84043,47 15468,03
159,73 -124,37 80711,79 25512,93
163843,7 318664,5
564,50 159,73 1 4
535377,3
731,69 564,50 27952,84 2
337277,2
580,76 731,69 22782,61 4
362868,3
-21,63 580,76 3 467,85
-50,28 -21,63 821,06 2528,47
-134,57 -50,28 7104,28 18109,30
-35,72 -134,57 9771,15 1276,04
503885,7 555875,8
-745,57 -35,72 7 0
406540,2
-107,97 -745,57 0 11656,60
-14,38 -107,97 8757,69 206,88
1,59 -14,38 255,02 2,52
-55,26 1,59 3230,97 3053,15
-92,95 -55,26 1420,96 8639,88
-43,77 -92,95 2418,44 1916,10
-78,30 -43,77 1192,31 6131,38
1133821, 973197,2
986,51 -78,30 93 4
1129222,
-76,14 986,51 88 5797,51
-82,72 -76,14 43,31 6842,95
5132922,5 3550827,7
0,00 82,72 4 3
Sursa: anexa Excel

Se aplica testul Durbin-Watson

∑ (e − e
i i −1 )2 = 5132922,543550827,73 = 1,445556622370976
D= i=2
n

∑e 2
i
Confrorm
i =1
tabelului „DURBIN-WATSON d STATISTICS” pentru n=25 si k=1 :
dlow= 1,055
dupper= 1,211
Conform urmatoarei scheme:
Intre: 0 si 1,055 respingem H0; intre 1,055 si 1,211 este zona de indecizie;
intre 1,211 si 2 nu respingem H0; intre 2 si 2,789 nu respingem H0; intre
2,789 si 2,945 este din nou zona de indecizie; in final intre 2,945 si 4
respingem H0

Rezultatul testului Darbin-Watson este 1,445556622370976, acesta se


incadreaza intre 1,211 si 2, caz in care nu respingem H0. Putem
concluziona deci, ca datele nu sunt autocorelate.

F) Previziunea valorii variabilei Y daca variabila X creste cu 10%


fata de ultima valoare înregistrata (inclusiv interval de incredere).

Ultima valoare inregistrata o reprezinta Elvetia cu Exportul= 117506 mii


euro.

x’=1,1*x= 1,1*117506= 129256,6

Y’= a+bx’= 23,42+0,0037*129256,6= 501,66942

Pentru a afla intervalul de incredere ne folosim de urmatoarea formula:

Y’-E ≤ Yprevizionat ≤ Y’+ E, unde E este egal cu:

E= tα;n-2*Se1+1 n+(X'-Xmed)2(Xi-Xmed)2
E= 2,07*392,9170578478696*1+0,04+0,00061179
E=1,02010381628412*2,07*392,9170578478696 = 829,6895137010421
Intervalul de incredere pentru Y’ este:
-328,0200937010421≤ Yprevizionat≤ 1331,358933701042