Sunteți pe pagina 1din 19

Academia de Studii Economice

Bucuresti

PROIECT ECONOMETRIE AN III,


REI, ZI

Studiul legaturii dintre valorile Exportului si PIB-ului. Aplicat


pe 25 de state europene.

Epure Ioana Camelia

Grupa 952, Seria C


A) Prezentarea Problemei

Pentru a putea studia legatura statistica dintre cele doua variabile trebuie sa intetelegem
in primul rand legarura economica dinre cele doua.

Exportul reprezinta o operatiune comerciala de vanzare a unor bunuri materiale si/sau


servicii catre persoane fizice sau juridice dintr-o alta tara in schimbul unei sume dintr-o
valuta convenita.
Produsul intern brut (prescurtat PIB) este un indicator macroeconomic care reflecta
suma valorii de piata a tuturor marfurilor si serviciilor destinate consumului final, produse in
toate ramurile economiei in interiorul unei tari în decurs de un an. Acesta se poate calcula si
la nivelul unei regiuni sau localitati.

PIB = consum + investitii + exporturi – importuri

Prin urmare putem obserba o legatura inca din definirea celor doua variabile. Nivelul
exporturilor influenteaza in mod direct niveul PIB-ului.

Atat Exporturile cat si PIB-ul ajuta la relatarea gradului de dezvoltare si de prosperitate a


unei tari. Important pentru studiul economic este procentul din PIB reprezentat de
exporturi, o tara puternica este o tara care reuseste sa exporte o cantitate ridicata de
produse si servicii.

Prin urmare cele doua variabile identificate sunt:

Xi= Exportul in anul 2006 exprimat in mii euro

Yi= PIB-ul aferent celor 25 de tari in 2006, exprimat in mld euro

Valorile Exportului si PIB-ului pentru cele 25 de tari sunt prezentate in urmatorul tabel,
prezent si in anexa Excel:

Tabel 1.

Tara Export 2006 mil PIB 2006 mld


Belgia 292087,00 392,00
Bulgaria 11748,00 31,00
Cehia 75604,00 141,80
Danemarca 73716,00 275,20
Germania 882532,00 2906,60
Irlanda 86593,00 222,60
Grecia 16525,00 244,90
Spania 170211,00 1223,90
Franta 394925,00 2230,70
Italia 332013,00 1844,70
Letonia 4902,00 20,12
Luxemburg 18241,00 41,30
Ungaria 59936,00 112,80
Lituania 11263,00 29,79
Olanda 369249,00 657,50
Austria 108913,00 322,40
Polonia 88229,00 338,70

Romania 25850,00 121,60


Slovenia 18501,00 37,30
Slovacia 33340,00 55,05

Finlanda 61489,00 209,40


Suedia 117707,00 384,92
UK 357322,00 2345,02
Norvegia 97331,00 310,95
Elvetia 117506,00 379,75
Sursa: Eurostat
B) Definirea modelului de regresie simpla liniara
Pentru a studia modelul de regresie de trebuie analizata corelograma rezultata dupa studiul
parametrilor xi (valorile exportului din cele 25 de tari studiate) si yi (valorile PIB-ului celor 25
de tari).
Corelograma 1.

Corelograma dintre exportul celor 25 de tari si PIB-ul


aferent acestora
3500.00
f(x) = 0 x + 23.43
3000.00 R² = 0.78

2500.00

2000.00
PIB mld

Linear ()
1500.00

1000.00

500.00

0.00
0.00 200000.00 400000.00 600000.00 800000.00 1000000.00
Export mil

Sursa: anexa Excel


Conform corelogramei putem observa ca punctele sunt plasate pe directia primei bisectoare
asadar avem o legatura directa intre cele doua variabile.

Din functia de regresie Y=bx+a putem afla cei doi parametrii, peramentrul ”a” nu are
semnificatie economica in timp ce “b” reprezinta panta dreptei. Parametrul b ne arata ca la o
crestere cu 1 milion de euro a exportului PIB-ul creste cu 0,003 miliarde.
C) Pentru estimarea parametrilor modelului vom folosi functia de regresie liniara:

Yi= a+bXi+ εi unde:


Yi= Variabila dependenta
Xi= Variabila independenta
εi= Variabila de perturbatie
a= Termenul constant
b= Panta dreptei

Parametrii a şi b se determină cu ajutorul metodei celor mai mici pătrate:

∑ ( y i− ^y i ) 2 min ⇔ ∑ ( y i −a−bx i )2 min ⇔


i i aplicarea ei ducand la obtinerea
urmatorului sistem de ecuatii:

∑{ yi=na+b ∑ xi ¿ ¿¿¿
i i

n n n n

{ ( )( )
2
∑ yi ∑ xi − ∑ xi ∑ xi yi
i=1 i=1 i=1 i=1
a= 2
= y−b x ¿ ¿¿¿
n n
n ∑ x 2i −
i=1
(∑ )
i=1
xi
Pentru a rezolva acest sistem folosim urmatoarea secventa din anexa Excel:
Tabel 2.

Sursa: anexa Excel

Asadar
{14879 , 99=25 a+3825733 b
5728496433 , 44=3825733 a+1509192231471 b
a=(14879,99-3825733b)/25 =>
5728496433,44= (14879,99-3825733b)/25*3825733+ 1509192231471b =>
5728496433,44= 2277074751,3068 – 585449319491,56b+ 1509192231471b =>
3451421682,1332= 923742911979,44b =>
b=0,0037363444280588

Stiind ca b=0,003 putem afla parametrul a:


a= (14879,99 – 0,003*3825733)/25 =>
a= (14879,99 - 14294,25617779071)/25 =>
a= 23,42936

In ceea ce priveste parametrul a=23,42, acesta reprezinta ordonata la origine si nu are


semnificatie economica. Parametrul b reprezinta coeficientul de regresie si panta dreptei.
Acesta este mai mare decat 0 deci intre Exporturile tarilor si PIB-ul acestora exista o legatura
directa astfel, la fiecare crestere cu o unitate a primului indicator studiat cel de-al doilea se
modifica cu 0,003, adica valoarea parametrului.

Pentru estimarea parametrilor prin interval de incredere trebuie sa cunoastem atat eroarea
standard a estimatei, eroarea standart a ordonatei la origine cat si eroarea standard a
corficientului de regresie.

Eroarea standard a estimatiei (sau SEM) se regaseste si in anexa excel in studiul regresiei:
Regression Statistics
Multiple R 0,885493462
R Square 0,784098671
Adjusted R Square 0,774711656
Standard Error 392,9170577
Observations 25

Calculul SEM se realizeaza cu ajutorul urmatoarei formule:


n

s e=
√∑ ( y − ^y )2
i=1
n−k −1
In cazul de fata, datorita faptului ca studiam o regresie liniara
simpla, k (numarul de variabile independente) este egal cu 1 => formula devine:
n

s e=
√ ∑ ( y − ^y )2
i=1
n−2
3550827,73
Conform rezultatelor aflate in anexa excel ecuatia devine: Se=
√ 25−2
=

√ 154383,8143478261 = 392,9170578478696

Intervalul de incredere parametrul α :


a − t α /2 ; n−2⋅s a ≤ α ≤ a + t α /2; n−2⋅s a

∑ x 2i =392 , 9170577⋅
s a =s e
√ n ∑ ( xi − x̄ )
2

=> ecuatia de aflare a intervalului de incredere devine:
1509192231471
25⋅923742911979 , 44
=100 , 44
α=0,05

23- 2,397875*100,44 ≤ α ≤ 23+2,397875*100,44 =>


23-240,842565 ≤ α ≤ 23 + 240,842565 =>
-217,842565 ≤ α ≤ 263,842565

(xi-xmed)*(yi-
yi-ymed (yi-ymed)^2
Intervalul de incredere al parametrului β:
xi-xmed b ymed)
− t α /2; n−2⋅sb ≤ β ≤ b + t α /2 ;n−2⋅s b
-203,20 41290,04 139057,68 -28256453,83
s e
-564,20 392, 9170577-141281,32 392 , 9170577
sb= =318321,10 = 79710852,93 =0,000408813589358391
n √ 923742911979 , 44 961115,4519512419
√∑ (
i=1
-453,40
-320,00
x i− x̄ )2
205571,12
102399,69
-77425,32
-79313,32
35104602,92
25380224,33
2311,40 5342572,18 729502,68 1686172844,71

=> ecuatia-372,60
de aflare 138830,40 -66436,32
a intervalului de 24754140,94
incredere devine:
-350,30 122709,75 -136504,32 47817397,77
0,0037- 2,397875*0,000408813589358391 ¿ β ≤ 0,0037+
628,70 395264,29 17181,68 10802130,46
2,397875*0,000408813589358391
1635,50 2674861,82 =>
241895,68 395620500,75

0,0037- 0,000980283885582533 ¿ β ≤ 0,0037+ 0,000980283885582533=>


1249,50 1561251,45 178983,68 223640194,07
-575,08 330722,21 -148127,32 85185728,72
0,0027197161144175≤ β ≤ 0,0046802838855825
-553,90 306804,68 -134788,32 74659185,75
-482,40 232709,30 -93093,32 44908172,88
-565,41 319687,93 -141766,32 80156026,94
62,30 3881,35 216219,68 13470589,85
-272,80 74419,58 -44116,32 12034910,92
-256,50 65792,00 -64800,32 16621250,98

-473,60 224296,51 -127179,32 60232064,91


-557,90 311251,87 -134528,32 75053285,15
D) Pentru studiul semnificatiei corelatiei si a perametrilor vom folosi urmatoarea
-540,15 291763,66 -119689,32 64650368,13
secventa de calcul din tabelul principal gasit in anexa excel:
-385,80 148841,27 -91540,32 35316211,52
Tabel 3.
-210,28 44217,48 -35322,32 7427560,49
1749,82 3061854,21 204292,68 357474493,91
-284,25 80797,79 -55698,32 15832220,72
-215,45 46418,50 -35523,32 7653482,24
16446530,1
0,00 9 0,00 3451421988,19
(xi-xmed)^2
19337038366,98

19960411380,94
5994680177,10
6290602729,42
532174160127,18
4413784615,14
18633429378,66
295210127,62
58513520002,66
32035157706,34
21941702930,38

18167891208,42
8666366228,62
20097689486,34
46750950019,30
1946249690,34
4199081472,10

16174579435,66
18097868882,02
14325533322,06

8379630185,70
1247666290,18
41735499101,58
3102302850,82
1261906263,82
923742911979,44

Sursa: anexa Excel

xmed= media exporturilor celor 25 de tari =


∑ xi = 153029,32
i=1
n
n

ymed= PIB mediu al celor 25 de tari=


∑ yi = 595,20
i=1
n
Pentru testarea semnificatiei corelatiei trebuie a aflam covarianta si coeficientul de corelatie.

Covarianta: COVxy=
∑ ( xi−xmed ) ( yi− ymed) = 3451421988,19 =138056879,5276
n 25

Coeficientul de corelatie r:
n

cov ( x , y )
∑ ( x i −xmed )⋅( y i− ymed )
i=1
r= =
s x⋅s y n n

√[ ∑ ( xi −xmed )2
i=1
] [∑ (
i=1
y i− ymed )2
]
3451421988,19 3451421988,19
r= = = 0,8854934616368093= 0,89
√ 923742911979,44∗16446530,19 3897738535,31357
De asemenea putem observa valoarea coeficientului de corelatie din output-ul de regresie
anexat in excel:

Regression Statistics
Multiple R 0,89
R Square 0,78
Adjusted R Square 0,77
Standard Error 392,92
Observations 25,00

Coeficientul de corelatie masoara intensitatea legaturii dintre doua variabile, in cazul aplicat
in acest proiect, legatura dintre Exportul unei tari si PIB-ul acesteia. r=0,89 arata o legatura
puternica intre cele doua sintagme economice.

Testarea coeficientului de corelatie:


1. Formularea ipotezelor
H0: ρ=0 (nu exista legatura liniara intre cele doua variabile)
H1: ρ≠0 (exista legatura liniara intre cele doua variabile)
2. Folosim testul statistic „t” (student) deoarece n=25 < 30, deci avem un esantion
de volum redus.
α=0,05
3. ttab=tα/2;df ; d.f= n-2 deoarece avem regresie simpla; ttab=t0,025;23
ttab=2,397875
zona de respingere: (-∞;-2,397875)U(+2,397875;+∞)
zona de acceptare: (-2,397875;+ 2,397875)
n−2 23
4. tcalc= r
√ 1−r 2 = 0,89
√1−0,78
= 93,04

5. 93,04> 2,397875 => resping H0


6. Exista suficienta evidenta statistica pentru a respinge ipoteza nula si pentru a
accepta ipoteza alternativa, asadar exista o legatura liniara intre Exportul unei tari
si PIB-ul acesteia.

Testarea parametrilor modelului de regresie:


Testarea parametrului a:
1. H0: α=0 (α nu este semnificativ diferit de 0, deci nu este semnificativ statistic)
H1: α≠0 (α este semnificativ diferit de 0, deci este semnificativ statistic)
2. Folosim testul statistic „t” (student) deoarece n=25 < 30, deci avem un esantion
de volum redus.
α=0,05
3. ttab=tα/2;n-k-1 ; n-2 deoarece avem regresie simpla; ttab=t0,025;23
ttab=2,397875
zona de respingere: (-∞;-2,397875)U(+2,397875;+∞)
zona de acceptare: (-2,397875;+ 2,397875)
a−μ a a−0 a
t calculat =t a = = =
4. sa sa sa

∑ x 2i =392 , 9170577⋅
s a =s e
√ n ∑ ( xi − x̄ )
a 23,42936
2
√ 1509192231471
25⋅923742911979 , 44
=100 , 44

tcalculat= Sa = 100,44 = 0,2332672242134608

5. -2,39<0,233<2,39 => accept H0


6. Nu exista suficienta evidenta statistica pentru a respinge ipoteza nula, asadar
putem spune ca α nu este semnificativ diferit de 0, deci nu este semnificativ
statistic.
Testarea parametrului b:
1. H0: β=0
H1: β≠0
2. Folosim testul statistic „t” (student) deoarece n=25 < 30, deci avem un esantion de
volum redus.
α=0,05
3. ttab=tα/2;n-k-1 ; n-2 deoarece avem regresie simpla; ttab=t0,025;23
ttab=2,397875
zona de respingere: (-∞;-2,397875)U(+2,397875;+∞)
zona de acceptare: (-2,397875;+ 2,397875)
b−μ b b−0 b
t calc=t b = = =
4. sb sb sb

se 392, 9170577 392 , 9170577


sb= = = =0,000408813589358391
n √ 923742911979 , 44 961115,4519512419
√∑ (
i=1
x i− x̄ )2

tcalc= 0,0037
❑ = 9,050659230449353
5. Tcalc apartine zonei de respingere=> resping Ho
6. Este foarte putin probabil ca estimatorul b sa provina dintr-o populatie cu β=0, β este
semnificativ statistic.

E) ANOVA
Pentru aplicarea analizei de tip anova am folostit data analisys pentru a obtine urmatoarea
secventa:
 Regression Statistics

Regression Statistics
Multiple R 0,89
R Square 0,78
Adjusted R Square 0,77
Standard Error 392,92
Observations 25,00

Din aceasta secventa afla coeficientul de corelatie, Multiple R, care ia valori de la 0 la 1. In


cazul studiat Multiple r= 0,89, o valoare aflata intre 0,8 si 0,95, ceea ce inseamna ca intre
Exportul si PIB-ul unei tari exista o legatura puternica.
R square este diferit de 0 ceea ce inseamna ca variabila aleaza x, Exporturile, au valoare
explicativa. Putem imterpreta deci ca Exportul explica variatia PIB-ului in masura de 0,78 sau
78%.
Din Standard Error putem deduce ca intre valorile reale si cele estimate pe baza fuctiei
liniare de regresie exista o diferenta de 392,92 mii euro.
 ANOVA

  df SS MS F Significance F
12895702,4 12895702,4
Regression 1,00 6 6 83,53 0,000000004
Residual 23,00 3550827,73 154383,81
16446530,1
Total 24,00 9      

In aceasta secventa, denumita si ANOVA, putem observa:


gradelul de libertate, 23
numarul de variabile, 1
suma patratelor 16446530,19
media pa tratica 12895702,46
raportul anova F=85,53.
Cu ajutorul raportului ANOVA putem verifica validitatea modelului de regresie ales. Datorita
faptului ca F=85,53 si Significance F= 0,000000004 putem spune ca modelul este valid si poate fi
folosit pentru analiza dependentei dintr e cele doua variabile.

Testul F de verificare a validitatii modelului:

1. H0: Modelul nu este valid statistic


H1: Modelul este valid statistic
2. Ftabelar= Fα;k;n-k-1=F0,05;1;23= 4,279344

s 2y / x
F calc=
s 2ε
12895702,46
3. = 392,9170578478696 = 32820,41897247684

4. Fcalc> Ftab => resping H0

5. Avem evidenta statistica pentru a concluziona ca modelul de regresie ales este


reprezentativ.
 Parametrii de regresie
Standard Upper Lower Upper
  Coefficients Error t Stat P-value Lower 95% 95% 95,0% 95,0%
Intercept 23,43 100,44 0,23 0,82 -184,36 231,22 -184,36 231,22
X Variable 1 0,0037 0,00 9,14 0,0000000040591892 0,0028906 0,0045820 0,0028906 0,004582

Din aceasta ultima secventa putem afla cei doi parametrii: a=23.43 si b=0,0037. Dupa
cum am mai reamintit parametrul a nu are semnificatie economica, iar b ne arata ca exista o
legatura directa intre Export si PIB.
In ceea ce priveste parametrul a,valoarea p-value este 0,82 < 0,05, ceea ce inseamna
ca acesta nu este semnificativ. In cazul parametrului b, p value este 0,000000004059 < 0,05
asadar parametrul b este semnificativ pentru studiul nostru.
De asemenea din acest tabel putem observa intervalele de incredere ale parametrilor, in
cazul α=0,05: -184,36< a< 231,22 si 0,0028906<b<0,004582

F) Testarea ipotezelor clasice asupra modelului de regresie simpla

Testarea liniaritatii modelului propus

In conformitate cu testarea coeficientului de corelatie prezentata mai sus, T tabelar > Tcalculat
ceea ce inseamna ca respingem H0, conform careia nu exista o legatura liara intre cele doua
variabile.
In concluzie acceptam H1 ceea ce inseamna ca exista o legatura liniara intre cele doua
variabile. Asadar intre Exportul si PIB-ul unei tari exista o legatura liniara.

Testarea normalitatii erorilor


Pentru testarea normalitatii erorilor se va studia urmatorul grafic:
Corelograma 2.

Export 2006 mil Residual Plot


1500.00
1000.00
Residuals

500.00
0.00
-500.000.00 500000.00 1000000.00
-1000.00
Export 2006 mil

Sursa: anexa Excel

Putem considera ca punctele din figura formeaza o regiune de tip banda orizontala ceea ce
nu contrazice ipotezele de normalitate a erorilor. Forma de banda reflecta
constanta dispersiei reziduurilor pentru tot domeniul variabilei independente.

Homoscedasticitatea/ Heteroscedasticitatea
Pentru a afla daca modelul de regresie ales ideplineste ipoteza de homoscedasticitate vom
aplica urmatorul test:
1. Dupa ordonare seria va arata:
Tabel 4.
Export 2006 PIB 2006
Tara mil mld
Letonia 4902,00 20,12
Lituania 11263,00 29,79
Bulgaria 11748,00 31,00
Grecia 16525,00 244,90
Luxemburg 18241,00 41,30
Slovenia 18501,00 37,30
Romania 25850,00 121,60
Slovacia 33340,00 55,05
Ungaria 59936,00 112,80
Finlanda 61489,00 209,40
Danemarc
a 73716,00 275,20
Cehia 75604,00 141,80
Irlanda 86593,00 222,60
Polonia 88229,00 338,70
Norvegia 97331,00 310,95
Austria 108913,00 322,40
Elvetia 117506,00 379,75
Suedia 117707,00 384,92
Spania 170211,00 1223,90
Belgia 292087,00 392,00
Italia 332013,00 1844,70
UK 357322,00 2345,02
Olanda 369249,00 657,50
Franta 394925,00 2230,70
Germania 882532,00 2906,60
Sursa: anexa Excel

2. Dupa ordonare am impartit seria de date in 3 parti, colorate distinctiv in tabelul de


mai sus. Setul 1 si 3 contin un numar egal de termeni si anume 10, iar setul 2 contine
5 termeni.
3. Pentru seturile 1 si 3 se fac analizele de regresie si se obtine:

ANOVA setul 1
  df SS
Regression 1 10328,86009
Residual 7 42322,42442
Total 8 52651,28451

ANOVA setul 3
  df SS
Regression 1 4471366,014
Residual 7 3242898,732
Total 8 7714264,746

SSE 3 3242898,732
Fcalculat= SSE 1 = 42322,42442 =76,62365227043862

Ftabelar= Fα;k;(n-d-2k)/2=F0,05;1; 25-5-4=4,493998

4. Fcalculat>Ftabelar => heteroscedasticitate


5. In cazul modelului de regresie ales avem heteroscedasticitate, asadar variatia erorilor
nu este constanta.

Autocorelarea erorilor
In urmatorul test vom verifica daca erorile la momentul t sunt corelate cu erorile la
momentul t-1. Rezolvarea problemelor se fac pe baza urmatoarei secvente din Tabelul
principal al anexei Excel:
Tabel 5.

ei ei-1 (ei-ei-1)^2 ei^2


-722,77   522392,07 522392,07
-36,32 -722,77 471204,20 1319,42
-164,11 -36,32 16329,78 26932,69
-23,66 -164,11 19727,39 559,68
-414,27 -23,66 152580,41 171622,15
-124,37 -414,27 84043,47 15468,03
159,73 -124,37 80711,79 25512,93
564,50 159,73 163843,71 318664,54
731,69 564,50 27952,84 535377,32
580,76 731,69 22782,61 337277,24
-21,63 580,76 362868,33 467,85
-50,28 -21,63 821,06 2528,47
-134,57 -50,28 7104,28 18109,30
-35,72 -134,57 9771,15 1276,04
-745,57 -35,72 503885,77 555875,80
-107,97 -745,57 406540,20 11656,60
-14,38 -107,97 8757,69 206,88
1,59 -14,38 255,02 2,52
-55,26 1,59 3230,97 3053,15
-92,95 -55,26 1420,96 8639,88
-43,77 -92,95 2418,44 1916,10
-78,30 -43,77 1192,31 6131,38
986,51 -78,30 1133821,93 973197,24
-76,14 986,51 1129222,88 5797,51
-82,72 -76,14 43,31 6842,95
0,00 82,72 5132922,54 3550827,73
Sursa: anexa Excel

Se aplica testul Durbin-Watson


n
∑ ( ei −e i−1 )2 5132922,54
D= i=2 n
=
3550827,73
= 1,445556622370976
∑ e 2i
i=1

Confrorm tabelului „DURBIN-WATSON d STATISTICS” pentru n=25 si k=1 :


dlow= 1,055
dupper= 1,211
Conform urmatoarei scheme:

Intre: 0 si 1,055 respingem H0; intre 1,055 si 1,211 este zona de indecizie; intre 1,211 si 2 nu
respingem H0; intre 2 si 2,789 nu respingem H0; intre 2,789 si 2,945 este din nou zona de
indecizie; in final intre 2,945 si 4 respingem H0

Rezultatul testului Darbin-Watson este 1,445556622370976, acesta se incadreaza intre 1,211


si 2, caz in care nu respingem H0. Putem concluziona deci, ca datele nu sunt autocorelate.

F) Previziunea valorii variabilei Y daca variabila X creste cu 10% fata de ultima valoare
înregistrata (inclusiv interval de incredere).

Ultima valoare inregistrata o reprezinta Elvetia cu Exportul= 117506 mii euro.

x’=1,1*x= 1,1*117506= 129256,6

Y’= a+bx’= 23,42+0,0037*129256,6= 501,66942

Pentru a afla intervalul de incredere ne folosim de urmatoarea formula:

Y’-E ≤ Yprevizionat ≤ Y’+ E, unde E este egal cu:

( X ' −Xmed )2
√1
E= tα;n-2*Se 1+ +
n ∑ ( Xi−Xmed )2

E= 2,07*392,9170578478696*√ 1+0,04+ 0,00061179


E=1,02010381628412*2,07*392,9170578478696 = 829,6895137010421
Intervalul de incredere pentru Y’ este:
-328,0200937010421≤ Yprevizionat≤ 1331,358933701042

S-ar putea să vă placă și