Sunteți pe pagina 1din 9

Proiect ECONOMETRIE

1. Problematica analizat

n scopul implementrii modelului unifactorial, respectiv multifactorial pe un exemplu din
economia real, am decis s studiez care este influena ctigului net mediu lunar a unui romn
asupra valorilor nregistrate de Produsul intern brut calculat pe cap de locuitor, i de asemeanea
care este influena variabilei timp n modelui multifactorial.
Pentru aceasta am luat n considerare datele din perioada 1997-2011 i am nregistrat 15 valori
pentru urmtoarele variabile:
Y PIB/loc
X
1
- Ctigul salarial mediu net lunar pe luna Octombrie
X
2
anul
Y X
1
X
2
29 117
1997
27 165
1998
26 235
1999
26 321
2000
28 396
2001
29 495
2002
31 607
2003
34 742
2004
35 866
2005
38 1084
2006
42 1327
2007
47 1375
2008
47 1340
2009
47 1340
2010
49 1552
2011


2. Modelul econometric unifactorial

Pentru a observa care este influena variabilei X
1
(Ctigul salarial mediu net lunar) asupra
variabilei Y(PIB/loc) vom utiliza modelul econometric unifactorial:


Unde:
Y PIB/loc
X - Ctigul salarial mediu net lunar pe luna Octombrie
a) Reprezentarea grafic a datelor de observaie si comentarea legturii
dintre variabile

Pentru a identifica existena unei relaii de dependen ntre variabilele analizate, precum i
forma i sensul acestei legaturi, construim diagram mprtirii datelor. n analiza de regresie
variabila explicativ va aprea pe axa orizontal, iar variabila explicat va aprea pe axa
vertical.
Am folosit EXCEL pentru a efectua calculele pentru estimarea modelului de regresie.

Reprezentarea grefic a perechilor de puncte observate (x
i
,y
i
)
i yi xi xi^2 xi*yi xi-xmed yi-ymed (xi-xmed)^2 (yi-ymed)^2 (xi-xmed)(yi-ymed)
1 29 117 13689 3393 -680,4667 -6,6667 463034,8844 44,4444 4536,4444
2 27 165 27225 4455 -632,4667 -8,6667 400014,0844 75,1111 5481,3778
3 26 235 55225 6110 -562,4667 -9,6667 316368,7511 93,4444 5437,1778
4 26 321 103041 8346 -476,4667 -9,6667 227020,4844 93,4444 4605,8444
5 28 396 156816 11088 -401,4667 -7,6667 161175,4844 58,7778 3077,9111
6 29 495 245025 14355 -302,4667 -6,6667 91486,0844 44,4444 2016,4444
7 31 607 368449 18817 -190,4667 -4,6667 36277,5511 21,7778 888,8444
8 34 742 550564 25228 -55,4667 -1,6667 3076,5511 2,7778 92,4444
9 35 866 749956 30310 68,5333 -0,6667 4696,8178 0,4444 -45,6889
10 38 1084 1175056 41192 286,5333 2,3333 82101,3511 5,4444 668,5778
11 42 1327 1760929 55734 529,5333 6,3333 280405,5511 40,1111 3353,7111
12 47 1375 1890625 64625 577,5333 11,3333 333544,7511 128,4444 6545,3778
13 47 1340 1795600 62980 542,5333 11,3333 294342,4178 128,4444 6148,7111
14 47 1340 1795600 62980 542,5333 11,3333 294342,4178 128,4444 6148,7111
15 49 1552 2408704 76048 754,5333 13,3333 569320,5511 177,7778 10060,4444
sume 535 11962 13096504 485661 3557207,7333 1043,3333 59016,3333
medii
xmed 797,4667
ymed 35,6667

Se observ c ntre variabilele X si Y exist o legtur direct si liniar.
b) Estimarea parametriilor modelului si interpretarea rezultatelor
obinute

Pentru a determina estimatorii a i b ai parametrilor , rezolvm sistemul de ecuaii normale
ale lui Gauss:
{


{



Soluiile sistemului sunt:
a22,4362
b0,0166
Dreapta de regresie estimat este:

. Fiecare punct de pe dreapta de


regresie estimat este o estimaie a valorii medii a lui Y, adic o estimaie a lui E(Y|X).
Interpretarea rezultatelor obinute:

0
10
20
30
40
50
60
0 500 1,000 1,500 2,000
P
I
B
/
l
o
c

Castigul salarial mediu net lunar
Modelul unifactorial de regresie
Valoarea b=0,0166 msoar panta dreptei de regresie i arat c, pentru valorile ctigului
salarial mediu net lunar(variabila X1) cuprinse ntre 117 i 1552, atunci cnd X1 crete cu 1
unitate , PIB/loc va crete, n medie, cu 0,0166 uniti.
Valoarea a=22,4362 arat nivelul PIB-ului pe locuitor atunci cnd ctigului salarial mediu net
lunar este 0 i reprezint efectul mediu asupra lui Y a tuturor factorilor care nu sunt considerai
n modelul de regresie.
Vom compara estimaiile obinute prin MCMMP cu cele rezultate din pachetul de regresie oferit
de Microsoft Excel.
SUMMARY OUTPUT

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 22,4361887 1,101092325 20,3763 3,00184E-11 20,05742333 24,814954
X Variable 1 0,01659063 0,001178397 14,07898 3,00899E-09 0,014044862 0,01913641

ANOVA

df SS MS F Significance F
Regression 1 979,1184157 979,1184 198,2178 3,00899E-09
Residual 13 64,21491765 4,939609

Total 14 1043,333333

Regression Statistics
Multiple R 0,9687374
R Square 0,93845216
Adjusted R
Square 0,93371771
Standard Error 2,22252313
Observations 15

c) Testarea semnificaiei statistice a parametrilor modelului i
determinarea intervalelor de ncredere 95% pentru parametrii
modelului

Testarea semnificaiei statistice a paramentrului
H
0
: =0(parametrul nu este semnificativ statistic, modelul nu este valid)
H
1
: 0(parametrul este semnificativ statistic, modelul este valid)
Statistica testului este:

care urmeaza o distributie Student cu (n-2) grade de libertate.


Se observa din aplicarea pachetului de regresie ca tcalc= 14,07898
t
critic
=t
tabelat
=t
0,025;13
=2,16
Pentru a determina valoarea critica a statisticii testului ne vom folosi de intervalul de incredere si
de valoarea lui Lower 95% pentru parametrul b din outputul oferit de pachetul de regresie din
Excel.
Astfel, din ecuatia b-t
ctr
*se(b)=0,014044 obtinem ca t
ctr=


Deoarece 14,07898 > 2,16 respingem H
0
si acceptam H
1
, deci parametrul este semnificativ
statistic.
Intervalul de incredere pentru parametrul
Deoarece am luat nivelul de semnificatie =0,05 , vom estima intervalul de incredere cu o
probabilitate de 95%. Un interval de incredere 95% pentru parametrul este:
(b-t
ctr
*se(b)b+t
ctr
*se(b)), adica
(b-t
0,025;13
*se(b)b+t
0,025;13
*se(b))
Prin urmare intervalul de incredere pentru va fi: (0,0140448620,01913641).
Interpretare: Pentru un coeficient de incredere de 95%, pe termen lung, intervale de incredere
precum (0,0140448620,01913641) vor include valoarea reala a lui .
Cum intervalul de incredere nu contine valoarea 0 avem un argument in plus ca 0, adica H
1

este adevarata. Prin urmare, spunem ca variabila independenta X are putere explicativa
semnificativa asupra variabilei dependente Y sau este semnificativ diferit de 0.
Testarea semnificaiei statistice a paramentrului
H
0
: =0(parametrul nu este semnificativ statistic, modelul nu este valid)
H
1
: 0(parametrul este semnificativ statistic, modelul este valid)
Statistica testului este:

care urmeaza o distributie Student cu (n-2) grade de libertate.


Se observa din aplicarea pachetului de regresie ca t
calc
= 20,3763
t
critic
=t
tabelat
=t
0,025;13
=2,16
Deoarece 20,3763 > 2,16 respingem H
0
si acceptam H
1
, deci parametrul este semnificativ
statistic.
Intervalul de incredere pentru parametrul
Deoarece am luat nivelul de semnificatie =0,05 , vom estima intervalul de incredere cu o
probabilitate de 95%. Un interval de incredere 95% pentru parametrul este:
(a-t
ctr
*se(a)a+t
ctr
*se(a)), adica
(a-t
0,025;13
*se(a)a+t
0,025;13
*se(a))
Prin urmare intervalul de incredere pentru va fi: (20,05742333 24,814954).
Interpretare: Pentru un coeficient de incredere de 95%, pe termen lung, intervale de incredere
precum (20,05742333 24,814954) vor include valoarea reala a lui .
d) Testarea validitii modelului de regresie

Pentru a verifica dac modelul de regresie identificat este valid statistic se formuleaz cele 2
ipoteze:
H
0
: modelul nu este valid statistic(MSR=MSE)
H
1
: modelul este valid statistic(MSR>MSE)
Pentru testare ne vom folosi de datele pbtinute in tabelul de analiza a variatiei (ANOVA)
ANOVA

df SS MS F Significance F
Regression 1 979,1184157 979,1184 198,2178 3,00899E-09
Residual 13 64,21491765 4,939609

Total 14 1043,333333

Statistica testului folosita este:

care urmeaza o distributie F


;1;n-2

F
calculat
=198,2178
F
critic
=F
tabelat
=F
0,05;1;13
=4,67(valoare preluata din tabelul statisticii F pentru nivel de semnificatie
=0,05)
Deoarece 198,2178 > 4,67, adica F
calculat
> F
critic
, respingem H
0
si acceptam H
1
. Asadar modelul
este valid statistic. Totodata din tabelul rezultat n Excel oninem o probabilitate numita
Siognificance F care reprezint cel mai mic nivel de semnificaie la care ipoteza nul poate fi
respins pe baza datelor de observaie. Cum aceasta are o valuare mai mica decat 0,05 se
respinge H
0
si se accepta H
1
, adica modelul de regresie este valid statistic.
Raportarea rezultatelor analizei de regresie


se = (1,101092325) (0,001178397)
t = (20,3763) (14,07898)
p = (3,00184E-11) (3,00899E-09)

Valoare obtinut pentru coeficientul de determinaie, R
2
0,9384 arat c aproximativ 93,84%
din variaia variabilei dependente Y (PIB/loc) este explicat prin variaia ctigului salarial
mediu net lunar(variabila independent X
1
). Cum R
2
poate fi maxim 1, valoarea obinut 0,9384
sugereaza c dreapta de regresie estimat aproximeaz foarte bine datele de observaie.

e) Verificarea ndeplinirii ipotezelor modelului clasic de regresie
liniar(heteroscedasticitatea, autocorelarea, normalitatea erorilor
aleatoare)
DE COMPLETAT
f) Previzionarea valoarii variabilei dependente Y dac variabila X1 creste
cu 10% fa de ultima valoare nregistrat

Ultima valoare nregistrat pentru X
1
este 1552, cea corespunztoare anului 2011. Dac variabila
crete cu 10% fa ultima nregistrare, atunci valoarea ei va fi: x
0
= 1552+0,1* 1552= 1707,2.
Pentru previzionarea valorii variabilei dependente ne folosim de ecuaia dreptei de regresie
estimat:



Estimatia punctula a valorii individuale este:

50,77572, aceasta este cea mai buna


predictie a valorii individuale

.
Determinarea intervalului de incredere pentru o valoare individuala:
Luand nivelul de semnificatie =0,05, construim intervalul de incredere 95% pentru valoarea
individuala

de forma:



Pentru determinarea intervalului de incredere avem nevoia de valorea erorii standard a erorii de
previziune:

)
Dupa efectuarea calculelor n Excel obinem c

2,5334.
Asadar intervalul de ncredere este: 50,77572-2,16*2,5334

50,77572+2,16*2,5334
Se observ deci c 45,303576

56,247864
Astfel dac lum

in 95% din cazuri intervale precum 45,303576

56,247864 vor contine valoarea reala

.

3. Specificarea modelului econometric multifactorial. Estimarea
parametriilor modelului si interpretarea valorilor
obinute.Verificarea existenei multicoliniaritii variabilelor
explicative
g) Specificarea modelului econometric multifactorial

Considerm n acest caz regresia PIB-ului/loc n raport cu Ctigul mediu net lunar pe o perioad
de 15 ani, ntre 1997-2011. Am considerat n acest caz cele dou variabile independente ca fiind
Ctigul i variabila timp. Am luat n calcul variabila timp, deoarece pentru exemplul urmat
aceasta afecteaz variabila dependent, ea putnd semnifica populaia total.
Modelul econometric liniar cu 2 variabile independente este:
15 ,..., 2 , 1 ,
2 2 1 1 0
i x x y
i i i i

Unde:
Y - PIB/loc
X
1
- Ctigul salarial mediu net lunar pe luna Octombrie
X
2
- anul
Model de regresie liniar multifactorial cu 2 variabile exogene: x1 i x2
yi xi1 xi2 xi1^2 xi2^2 xi1*xi2 xi1*yi xi2*yi
29 117 1 13689 1 117 3393 29
27 165 2 27225 4 330 4455 54
26 235 3 55225 9 705 6110 78
26 321 4 103041 16 1284 8346 104
28 396 5 156816 25 1980 11088 140
29 495 6 245025 36 2970 14355 174
31 607 7 368449 49 4249 18817 217
34 742 8 550564 64 5936 25228 272
35 866 9 749956 81 7794 30310 315
38 1084 10 1175056 100 10840 41192 380
42 1327 11 1760929 121 14597 55734 462
47 1375 12 1890625 144 16500 64625 564
47 1340 13 1795600 169 17420 62980 611
47 1340 14 1795600 196 18760 62980 658
49 1552 15 2408704 225 23280 76048 735
535 11962 120 13096504 1240 126762 485661 4793 total
medii
x1med 797,4667
x2med 8
ymed 35,6667