Documente Academic
Documente Profesional
Documente Cultură
Bucuresti
Pentru a putea studia legatura statistica dintre cele doua variabile trebuie sa intetelegem
in primul rand legarura economica dinre cele doua.
PIB = consum + investitii + exporturi – importuri
Prin urmare putem obserba o legatura inca din definirea celor doua variabile. Nivelul
exporturilor influenteaza in mod direct niveul PIB-ului.
Valorile Exportului si PIB-ului pentru cele 25 de tari sunt prezentate in urmatorul tabel,
prezent si in anexa Excel:
Tabel 1.
2500.00
2000.00
PIB mld
Linear ()
1500.00
1000.00
500.00
0.00
0.00 200000.00 400000.00 600000.00 800000.00 1000000.00
Export mil
Din functia de regresie Y=bx+a putem afla cei doi parametrii, peramentrul ”a” nu are
semnificatie economica in timp ce “b” reprezinta panta dreptei. Parametrul b ne arata ca la o
crestere cu 1 milion de euro a exportului PIB-ul creste cu 0,003 miliarde.
C) Pentru estimarea parametrilor modelului vom folosi functia de regresie liniara:
∑{ yi=na+b ∑ xi ¿ ¿¿¿
i i
n n n n
{ ( )( )
2
∑ yi ∑ xi − ∑ xi ∑ xi yi
i=1 i=1 i=1 i=1
a= 2
= y−b x ¿ ¿¿¿
n n
n ∑ x 2i −
i=1
(∑ )
i=1
xi
Pentru a rezolva acest sistem folosim urmatoarea secventa din anexa Excel:
Tabel 2.
Asadar
{14879 , 99=25 a+3825733 b
5728496433 , 44=3825733 a+1509192231471 b
a=(14879,99-3825733b)/25 =>
5728496433,44= (14879,99-3825733b)/25*3825733+ 1509192231471b =>
5728496433,44= 2277074751,3068 – 585449319491,56b+ 1509192231471b =>
3451421682,1332= 923742911979,44b =>
b=0,0037363444280588
Pentru estimarea parametrilor prin interval de incredere trebuie sa cunoastem atat eroarea
standard a estimatei, eroarea standart a ordonatei la origine cat si eroarea standard a
corficientului de regresie.
Eroarea standard a estimatiei (sau SEM) se regaseste si in anexa excel in studiul regresiei:
Regression Statistics
Multiple R 0,885493462
R Square 0,784098671
Adjusted R Square 0,774711656
Standard Error 392,9170577
Observations 25
s e=
√∑ ( y − ^y )2
i=1
n−k −1
In cazul de fata, datorita faptului ca studiam o regresie liniara
simpla, k (numarul de variabile independente) este egal cu 1 => formula devine:
n
s e=
√ ∑ ( y − ^y )2
i=1
n−2
3550827,73
Conform rezultatelor aflate in anexa excel ecuatia devine: Se=
√ 25−2
=
√ 154383,8143478261 = 392,9170578478696
∑ x 2i =392 , 9170577⋅
s a =s e
√ n ∑ ( xi − x̄ )
2
√
=> ecuatia de aflare a intervalului de incredere devine:
1509192231471
25⋅923742911979 , 44
=100 , 44
α=0,05
(xi-xmed)*(yi-
yi-ymed (yi-ymed)^2
Intervalul de incredere al parametrului β:
xi-xmed b ymed)
− t α /2; n−2⋅sb ≤ β ≤ b + t α /2 ;n−2⋅s b
-203,20 41290,04 139057,68 -28256453,83
s e
-564,20 392, 9170577-141281,32 392 , 9170577
sb= =318321,10 = 79710852,93 =0,000408813589358391
n √ 923742911979 , 44 961115,4519512419
√∑ (
i=1
-453,40
-320,00
x i− x̄ )2
205571,12
102399,69
-77425,32
-79313,32
35104602,92
25380224,33
2311,40 5342572,18 729502,68 1686172844,71
=> ecuatia-372,60
de aflare 138830,40 -66436,32
a intervalului de 24754140,94
incredere devine:
-350,30 122709,75 -136504,32 47817397,77
0,0037- 2,397875*0,000408813589358391 ¿ β ≤ 0,0037+
628,70 395264,29 17181,68 10802130,46
2,397875*0,000408813589358391
1635,50 2674861,82 =>
241895,68 395620500,75
19960411380,94
5994680177,10
6290602729,42
532174160127,18
4413784615,14
18633429378,66
295210127,62
58513520002,66
32035157706,34
21941702930,38
18167891208,42
8666366228,62
20097689486,34
46750950019,30
1946249690,34
4199081472,10
16174579435,66
18097868882,02
14325533322,06
8379630185,70
1247666290,18
41735499101,58
3102302850,82
1261906263,82
923742911979,44
Covarianta: COVxy=
∑ ( xi−xmed ) ( yi− ymed) = 3451421988,19 =138056879,5276
n 25
Coeficientul de corelatie r:
n
cov ( x , y )
∑ ( x i −xmed )⋅( y i− ymed )
i=1
r= =
s x⋅s y n n
√[ ∑ ( xi −xmed )2
i=1
] [∑ (
i=1
y i− ymed )2
]
3451421988,19 3451421988,19
r= = = 0,8854934616368093= 0,89
√ 923742911979,44∗16446530,19 3897738535,31357
De asemenea putem observa valoarea coeficientului de corelatie din output-ul de regresie
anexat in excel:
Regression Statistics
Multiple R 0,89
R Square 0,78
Adjusted R Square 0,77
Standard Error 392,92
Observations 25,00
Coeficientul de corelatie masoara intensitatea legaturii dintre doua variabile, in cazul aplicat
in acest proiect, legatura dintre Exportul unei tari si PIB-ul acesteia. r=0,89 arata o legatura
puternica intre cele doua sintagme economice.
∑ x 2i =392 , 9170577⋅
s a =s e
√ n ∑ ( xi − x̄ )
a 23,42936
2
√ 1509192231471
25⋅923742911979 , 44
=100 , 44
tcalc= 0,0037
❑ = 9,050659230449353
5. Tcalc apartine zonei de respingere=> resping Ho
6. Este foarte putin probabil ca estimatorul b sa provina dintr-o populatie cu β=0, β este
semnificativ statistic.
E) ANOVA
Pentru aplicarea analizei de tip anova am folostit data analisys pentru a obtine urmatoarea
secventa:
Regression Statistics
Regression Statistics
Multiple R 0,89
R Square 0,78
Adjusted R Square 0,77
Standard Error 392,92
Observations 25,00
df SS MS F Significance F
12895702,4 12895702,4
Regression 1,00 6 6 83,53 0,000000004
Residual 23,00 3550827,73 154383,81
16446530,1
Total 24,00 9
s 2y / x
F calc=
s 2ε
12895702,46
3. = 392,9170578478696 = 32820,41897247684
Din aceasta ultima secventa putem afla cei doi parametrii: a=23.43 si b=0,0037. Dupa
cum am mai reamintit parametrul a nu are semnificatie economica, iar b ne arata ca exista o
legatura directa intre Export si PIB.
In ceea ce priveste parametrul a,valoarea p-value este 0,82 < 0,05, ceea ce inseamna
ca acesta nu este semnificativ. In cazul parametrului b, p value este 0,000000004059 < 0,05
asadar parametrul b este semnificativ pentru studiul nostru.
De asemenea din acest tabel putem observa intervalele de incredere ale parametrilor, in
cazul α=0,05: -184,36< a< 231,22 si 0,0028906<b<0,004582
In conformitate cu testarea coeficientului de corelatie prezentata mai sus, T tabelar > Tcalculat
ceea ce inseamna ca respingem H0, conform careia nu exista o legatura liara intre cele doua
variabile.
In concluzie acceptam H1 ceea ce inseamna ca exista o legatura liniara intre cele doua
variabile. Asadar intre Exportul si PIB-ul unei tari exista o legatura liniara.
500.00
0.00
-500.000.00 500000.00 1000000.00
-1000.00
Export 2006 mil
Putem considera ca punctele din figura formeaza o regiune de tip banda orizontala ceea ce
nu contrazice ipotezele de normalitate a erorilor. Forma de banda reflecta
constanta dispersiei reziduurilor pentru tot domeniul variabilei independente.
Homoscedasticitatea/ Heteroscedasticitatea
Pentru a afla daca modelul de regresie ales ideplineste ipoteza de homoscedasticitate vom
aplica urmatorul test:
1. Dupa ordonare seria va arata:
Tabel 4.
Export 2006 PIB 2006
Tara mil mld
Letonia 4902,00 20,12
Lituania 11263,00 29,79
Bulgaria 11748,00 31,00
Grecia 16525,00 244,90
Luxemburg 18241,00 41,30
Slovenia 18501,00 37,30
Romania 25850,00 121,60
Slovacia 33340,00 55,05
Ungaria 59936,00 112,80
Finlanda 61489,00 209,40
Danemarc
a 73716,00 275,20
Cehia 75604,00 141,80
Irlanda 86593,00 222,60
Polonia 88229,00 338,70
Norvegia 97331,00 310,95
Austria 108913,00 322,40
Elvetia 117506,00 379,75
Suedia 117707,00 384,92
Spania 170211,00 1223,90
Belgia 292087,00 392,00
Italia 332013,00 1844,70
UK 357322,00 2345,02
Olanda 369249,00 657,50
Franta 394925,00 2230,70
Germania 882532,00 2906,60
Sursa: anexa Excel
ANOVA setul 1
df SS
Regression 1 10328,86009
Residual 7 42322,42442
Total 8 52651,28451
ANOVA setul 3
df SS
Regression 1 4471366,014
Residual 7 3242898,732
Total 8 7714264,746
SSE 3 3242898,732
Fcalculat= SSE 1 = 42322,42442 =76,62365227043862
Autocorelarea erorilor
In urmatorul test vom verifica daca erorile la momentul t sunt corelate cu erorile la
momentul t-1. Rezolvarea problemelor se fac pe baza urmatoarei secvente din Tabelul
principal al anexei Excel:
Tabel 5.
Intre: 0 si 1,055 respingem H0; intre 1,055 si 1,211 este zona de indecizie; intre 1,211 si 2 nu
respingem H0; intre 2 si 2,789 nu respingem H0; intre 2,789 si 2,945 este din nou zona de
indecizie; in final intre 2,945 si 4 respingem H0
F) Previziunea valorii variabilei Y daca variabila X creste cu 10% fata de ultima valoare
înregistrata (inclusiv interval de incredere).
( X ' −Xmed )2
√1
E= tα;n-2*Se 1+ +
n ∑ ( Xi−Xmed )2