Sunteți pe pagina 1din 9

Analiza PIB folosind modelul de regresie liniara

Academia de Studii Economice Bucuresti Facultatea de Contabilitate si Informatica de Gestiune

Bucuresti 2012

In acest proiect am incercat sa determin influenta numarului populatiei, a indicelui preturilor de consum, a ratei somajului si a venitului mediu al populatiei asupra produsului intern brut pentru 30 de tari membre al Uniunii Europene in cea mai mare parte. Ca sursa a indicatorilor am folosit http://ro.wikipedia.org cat si http://www.insse.ro. Ecuatia modelului de regersie liniara multipla este : y = a + bx1 + cx2 + d x3 + e x4 + E, unde y reprezinta fenomenul analizat, in acest caz PIB-ul; x1 indicele pretului, x2 rata somajului, x3 reprezinta venitul mediu al populatiei, iar x4 numarul populatiei. a, b, c, d si e sunt parametrii modelului de regresie. E este valoarea eroarea. Consider ca variabilele independente: indicele pretului, rata somajulului, venitul mediu al populatiei si numarul populatiei influenteaza marimea produsului intern brut realizat de o tara. In urmatorul model voi determina masura in care aceste variabile influenteaza PIBul,unde PIB-ul este variabila dependenta.

Nr. Crt
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26

Tara
Austria Belgia Cipru Danemarca Estonia Finanda Franta Germania Grecia Irlanda Italia Letonia Lituania Luxemburg Malta Polonia Portugalia Regatul Unit Cehia Romania Slovacia Slovenia Spania Suedia Olanda Ungaria

IP 1,70 2,30 2,60 2,20 2,70 1,70 1,70 1,20 4,70 -1,60 1,60 -1,20 1,20 2,80 2,00 2,70 1,40 3,30 1,20 6,10 0,70 2,10 2,00 1,90 0,20 4,70

Rata somajului
4,8 7,9 5,3 6 13,8 8,2 9,5 7,5 9,5 11,9 7,8 17,1 13,7 5,2 7 8,2 9,6 7,6 6,7 6,9 12 5,9 18 8,3 3,1 10 1

Venitul mediu al populatiei ($) 4235,00 4428,00 2977,00 5793,00 1016,00 4202,00 4000,00 3703,00 969,00 5400,00 3200,00 986,00 806,00 5795,00 1626,00 1070,00 1906,00 3930,00 1313,00 641,00 1100,00 1200,00 3060,00 3689,00 4675,00 648,00

Nr. Populatiei (locuitori) 8206524,00 10445852,00 8182,00 5447084,00 1332893,00 5261008,00 63392140,00 82422299,00 11244118,00 4234925,00 58751711,00 2290237,00 3596617,00 468571,00 402668,00 38132277,00 10605870,00 60209500,00 10287189,00 22329977,00 5431363,00 2011070,00 45061274,00 9047752,00 16407491,00 10076000,00

PIB (miliarde USD) 376,80 465,70 22,75 310,76 19,22 239,23 2582,53 3315,64 305,42 204,26 2055,11 23,39 35,73 52,43 7,80 468,54 229,34 2247,46 192,15 161,63 36,26 46,44 1409,95 455,85 783,29 128,96

27 28 29 30

Bulgaria Croatia Islanda Turcia

3,00 1,10 7,50 8,60

6,8 9,1 3,1 12,5

422,00 1465,00 3417,00 4562,00

7761000,00 4425747,00 318452,00 73722988,00

44,84 59,92 12,77 741,85

Cu ajutorul blocului Data Analisys obtinem rezultatele de mai jos:

SUMMARY OUTPUT Regression Statistics Multiple R 0,941001 R Square 0,885483 Adjusted R Square 0,86716 Standard Error 314,8225 Observations 30

ANOVA df Regression Residual Total SS 4 19159310 25 2477830 29 21637139 MS F 4789827 48,32685 99113,18 Significance F 2,08E-11

Coefficients Intercept IP rata somajului venitul mediu al populatiei ($) Nr. Populatiei (locuitori) 493,6667 -120,835 -38,596 0,020415 3,39E-05

Standard Error 241,2819 29,07536 18,03268 0,037811 2,63E-06

t Stat 2,046016

P-value 0,05141

Lower 95% -3,26271 -180,716 -75,735 -0,05746 2,84E-05

Upper 95%

990,596 3

-4,15591 0,000332 -2,14034 0,04227 0,539912 0,594035 12,89403 1,52E-12

-60,9527 1 -1,45701

0,098288 0 3,93E-05

RESIDUAL OUTPUT

Observation 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

Predicted PIB (miliarde USD) 467,2750275 354,8790725 35,98972296 298,9280216 -299,3450536 235,6546323 2149,382621 2925,193805 -40,46679897 481,3223033 2053,645992 76,34126039 -41,88246618 88,79761634 28,65222678 1163,73627 351,9483698 1920,202602 465,1488149 259,3296099 152,2651829 104,7800631 1145,285813 325,3553866 1000,765871 -105,8645109 140,0734879 189,2660767 -451,7016871 1561,059666

Residuals -90,47502751 110,8209275 -13,23772296 11,83197841 318,5650536 3,577367695 433,1443787 390,4491951 345,881799 -277,0613033 1,468007681 -52,95626039 77,61646618 -36,36461634 -20,85122678 -695,19727 -122,6123698 327,2523984 -272,9968149 -97,70060987 -116,0031829 -58,33806314 264,6601866 130,4926134 -217,4728709 234,8245109 -95,23048793 -129,3490767 464,4686871 -819,2066665

Din model obseravam : Interpreatarea rezultatelor din SUMMARY OUTPUT: Multiple R (coeficientul multiplu de corelatie) este 0,94001 arata ca intre cele patru variabile exista o legatura puternica ( tendinta de a se apropia de valoarea 1). Coeficientul de corelatie multipla arata intensitatea intre variabila rezultativa (PIB)si variabilele factoriale. R Square sau R2 (coeficientul de determinare) este 0,885483; aceasta valoare explica cum ca 88,5% din variatia variabilei y, in cazul nostru PIB-ul este explicata prin modelul de regresie. Adjusted R Square reprezinta valoarea corectata a coeficientului de determinare sau abaterea standard a lui y. Este introdusa pentru a contracara (partial) efectul cresterii mecanice a lui R Square o data cu cresterea numarul variabilelor independente. Standard Error reprezinta eroarea standard a estimatiei si este pentru acest model 314.8225 . Eroarea standard (abaterea medie patratica a erorilor) se calculeaza ca abaterea standard a rezidurilor (pentru numarul gradelor de libertate utilizat) si este estimatia abaterii standard a erorilor E ( in ipoteza normalitatii acestora). Daca aceasta valoare ar fi 0, toate punctele observate s-ar afla pe dreapta de regresie; Astfel, este de dorit ca aceasta valoare sa fie cat mai apropiata de 0. In cazul modelului de mai sus valoarile nu sunt apropiata de aceasta dreapta. Observations numarul de observatii din esantion, n est egal cu 30. Interpretarea rezultatelor din ANOVA df reprezinta numarul de grade de libertate sau numarul de valori care pot sa varieze liber. Numarul de varul de valori care poate varia liber este egal cu numarul de observatii minus 1. Numarul gradelor de libertate este afisat atat pentru modelul de regresie cat si pentru valorile reziduale. Numarul de valori care pot varia liber este de 29 pe total model si 25 pentru regresie si 4 pentru valorile reziduale. SS ( Source of Squares ) reprezinta variatia totala ( suma patratelor ) a valorii PIBului. Variatia PIB are valoarea 21637139 si este insumarea variatiei aferente regresiei 19159310 si variatiei datorata erorilor 21637139. MS sau Minimum of Squares reprezinta variatia in raport cu numarul de grade de libertate. Aceasta valoare se calculeaza atat pentru valorile datorate regresiei - 4789827 , cat si pentru valorile datorate erorilor - 99113,18. Significance F ne arata daca modelul este generalizabi de la model de esantion la model de populatie. In ANOVA F ne ajuta sa determinam masura in care modeul este sau nu valid, adica masura in care variabilele independente influenteaza fenomenul analizat, in aceste caz produsul intern brut. Fie: H0 : modelul nu este valid din punct de vedere statistic( b=c=d=e=0) H1 : model valid din punct de vedere statistic (abcde0) F calculat = 48,32685, iar F0,05;4;25 ( 2,758 ). Deoarece F calculat > F 0.05;4;25 se respinge ipoteza nula H0 (cea de homoscedascititate); exista o probabilitate de 95% ca modelul sa fie valid. In concluzie acceptam ipoteza alternativa, validitatea modelului.
4

In continuare com compara pragul de semnificatie P-value cu valoarea 0.05, unde P-Value reprezinta probabilitatea critica unilaterala. Cum P-value (0.0514) > 0.05 accepta H0, deci modelul nu este valid din punct de vedere statistic.

Al treilea tablou de rezultate contine valorile estimate pentru coeficientii modelului, precum si statisticile necesare verificarii ipotezelor uzuale asupra coeficientilor. De remarcat ca, spre deosebire de testul F, testele asupra coeficientilor sunt individuale. Liniile tabelului se refera la variabilele din model, incluzand si termenul liber. Termenul liber este punctul in care variabilele explicative (factoriala) sunt 0. Modelul ecuatiei de regresie este y = a1 + b x1 + c x2 + d x3 + e, unde a, b, c, si d reprezinta influenta variabilelor independente iar e reprezinta variabiala eroare. Ecuatia modelului va fi in acest caz: Y = 493,6667 - 120,835 x1 -38,596 x2 + 0,020415 x3 + 3,39E-05 x4 + 314,8225. PIB = 493,6667 120,832 * indicele pretului -38,596 rata somajului + 0,020415 venitul mediu + 3,39E-05 numarul populatiei + 314,8225 a) a este termenul liber al modelului si arata care este valoare PIB in momentul in care ceilalti factori alesi au valoarea 0. a arata influenta altor factori care nu au fost prezizati in model. Atunci cand indicele pretului, rata somajului,venitul mediu al populatiei si numarul de locuitori au valoarea nula, ceilelelte variabile independente fac ca produsul intern brut sa aiba valoarea 493,6667. b) b = -120,835 La cresterea indicelui de pret cu o unitate procentuala se produce o modificare in sensul scaderii PIB-ului cu 120.835 mld USD. Coeficientul b are valoare negativa, ceea ce inseamna ca legatura nu este directa, ci indirecta. P-Value pentru acest coeficient este < 0.05 (0.000332) ceea ce inseamna ca coeficientul este semnificativ. c) c = - 38,596 La scaderea ratei somajului cu o unitate pocentuala, scade PIB-ul cu 38.596 mld USD. P-Value este < 0.05 deci coeficientul este semnificativ. d) d = 0,02415 La o modificare in sensul cresterii venitului mediu al populatiei cu 1 $ are loc modificarea PIB, in sensul cresterii cu 0.20415 mld USD. P-Value este > 0.05 ceea ce inseamna ca acest coeficient nu este semnificativ. e) e = 3,39 La modificarea in sensul cresterii numarului de locuitori cu 1 va avea loc o modificare, in sensul cresterii PIB-ului cu 3,39E-05 mld $. P-Value in acest caz este < 0.05 ceea ce inseamna ca acest coeficient este semnificativ. f) E = 314,8225 E reprezinta eroarea globala a modelului.

Pentru primele doua variabile ( indicele pretului, rata somajului ) si ultima variabila (numarul populatei), t0,05;4;25 este mai mare decat t calculat (2,76 > t caculat); acesta se interpreteaza prin faptul ca coeficientii sunt semnificativi statistic, deci exista o corelatie intre cele trei variabile independente si fenomenul studiat. In acest caz nu se respinge ipoteza nula, pentru aceste doua variabile privite seprat. Pentru penultimul factor ( vanitul mediu al populatie) t 0.05;4;25 este mai mic decat t calculat (2.76 < t calculat); aceasta inseamna ca factorul nu este semnificativ statistic, ci doar intamplator. In acest caz se respinge ipoteza nula pentru acest factori, si se accepta ipoteza alternativa; nu exista o corelatie intre variabila independente venit mediu al populatei si fenomenul PIB pentru aceste doua variabile privite separat in model. Fie pentru valoarea indicelui de pret de 106,1%; ratei somajului de 106,9%; venitului mediu al populatiei de 641 $ si fie un numar al populatiei de 22 de milioane de locuitori, nivelul produsului intern brut previzionat va fi de 259 miliarde$. PIB = 493,6667-120,835*6,1-38,596*6,9+0,020415*641+0,0000339*22000000+314,8225 In continuare, in graficele de mai jos am folosit proprietatile Regression pentru a realiza o previziune a PIB-ului in functie de fiecare varibila independenta:

Nr. Populatiei (locuitori)


PIB (miliarde USD) 4000.00 2000.00 PIB (miliarde USD) 0.00 0.00 -2000.00 50000000.00 100000000.00 Predicted PIB (miliarde USD) Nr. Populatiei (locuitori)

venitul mediu al populatiei ($)


4000.00 PIB (miliarde USD) 3000.00 2000.00 1000.00 0.00 -1000.00 0.00 2000.00 4000.00 6000.00 8000.00 venitul mediu al populatiei ($) PIB (miliarde USD) Predicted PIB (miliarde USD)

Rata somajului
PIB (miliarde USD) 4000.00 2000.00 PIB (miliarde USD) 0.00 0 -2000.00 5 10 rata somajului 15 20 Predicted PIB (miliarde USD)

IP
PIB (miliarde USD) 4000.00 2000.00 PIB (miliarde USD) 0.00 0.00 -2000.00 IP 5.00 10.00 Predicted PIB (miliarde USD)

-5.00

In ultimile grafice se afle evidentiate eroriele previzionate ale fiecarei variabile independente:

Valorile reziduale ale IP


1000 Residuals 500 0 -2.00 -500 -1000 0.00 2.00 4.00 6.00 8.00 10.00

-4.00

IP

valorile reziduale ale Rata somajului


1000 Residuals 500 0 -500 -1000 0 5 10 15 20

rata somajului

Valorile reziduale ale venitul mediu al populatiei ($)


1000 Residuals 500 0 -500 0.00 -1000 1000.00 2000.00 3000.00 4000.00 5000.00 6000.00 7000.00

venitul mediu al populatiei ($)

Valorile reziduale ale venitul mediu al populatiei ($)


1000 Residuals 500 0 -500 0.00 -1000 20000000.00 40000000.00 60000000.00 80000000.00 100000000.00

venitul mediu al populatiei ($)