Documente Academic
Documente Profesional
Documente Cultură
STUDENT:
sTEFANACHE CRISTINA-MARIA
ANUL III SPE GRUPA 031
2007
CUPRINS
1. Scopul studiului
2. Modelul liniar unifactorial: PIB in functie de venituri
2.1. Analiza regresiei
2.2. Variabilele folosite
2.3. Testarea parametrilor
2.4. Corelarea
2.5. Autocorelarea
2.6. Analiza reziduurilor si predictiilor
2.6.1. Media reziduurilor
2.6.2. Distributia erorilor fata de model
2.6.3. Testarea normalitatii reziduurilor
2.7. Variante constante (homoscedasticitatea)
3. Modelul liniar unifactorial: PIB in functie de nivelul preturilor
3.1. Analiza regresiei
3.2. Variabilele folosite
3.3. Testarea parametrilor
3.4. Corelarea
3.5. Autocorelarea
3.6. Analiza reziduurilor si predictiilor
3.6.1. Media reziduurilor
3.6.2. Distributia erorilor fata de model
3.6.3. Testarea normalitatii reziduurilor
3.7. Variante constante (homoscedasticitatea)
4. Modelul liniar multifactorial: PIB in functie de nivelul veniturilor si
al preturilor
4.1. Analiza regresiei
4.2. Corelarea
4.2.1. Eliminarea fenomenului de corelare a factorilor
4.2.2. Regresia in functie de factorii F1 si F2
4.3. Corelatia partiala
4.4. Autocorelarea erorilor
4.4.1. Eliminarea fenomenului de autocorelare
4.5. Testarea parametrilor
4.6. Legatura intre reziduuri si variabilele factor
4.7. Analiza reziduurilor si predictiilor
4.7.1. Media reziduurilor
4.7.2. Distributia erorilor fata de model
4.7.3. Testarea normalitatii reziduurilor
4.8. Testarea ipotezelor liniare privind parametrii
4.8.1. Testul lui Ramsey
4.8.2. Testul lui Chaw
4.9. Variante constante (homoscedasticitatea)
1. Scopul studiului
Acest proiect isi propune sa gaseasca corelatia dintre nivelul
produsului intern brut (PIB) in functie de nivelul veniturilor personale
si al preturilor. Se va urmari influenta veniturilor, precum si a
preturilor asupra produsului intern brut. Modelul econometric se va
construi pe baza datelor obtinute de pe site-ul guvernului SUA (siteul
de
unde
au
fost
preluate
datele
este:
http://www.bea.gov/bea/dn/nipaweb/NIPATableIndex.asp).
Aceste
date sunt structurate pe ani, incepand cu anul 1929 pana in 2006.
Se va studia influenta celor 2 factori separat: influenta
veniturilor asupra nivelului produsului intern brut, apoi influenta
indicelui preturilor asupra aceluiasi produs intern brut, urmand ca
mai apoi sa se testeze modelele astfel obtinute, testari prelucrate cu
ajutorul programului STATA9.
Variabila endogena considerata este produsul intern
brut(PIB) si variabilele exogene sunt veniturile populatiei si indicele
preturilor.
Modelul econometric are urmatoarea forma:
Yt = + 1 * X1 + 2 * X2 + ut
Number
F( 1,
76)
Model | 1.2210e+10
1 1.2210e+10
F
= 0.0000
Residual | 3782509.88
76 49769.8668
squared
= 0.9997
-------------+-----------------------------squared = 0.9997
Total | 1.2210e+10
77 158616055
MSE
= 223.09
Prob >
RAdj
R-
Root
-----------------------------------------------------------------------------PIB |
Coef. Std. Err.
t P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------venit | 1.185684 .0023939 495.30 0.000
1.180916
1.190452
_cons |
174.051 33.70646
5.16 0.000
106.9188
241.1832
------------------------------------------------------------------------------
Se
observa
ca
varianta
explicata
de
model,
ESS=1.2210e+10, este mult mai mare deat cea reziduala,
RSS=3782509.88, ceea ce ne ofera o prima informatie asupra
faptului ca modelul este reprezentativ si ca o mare parte din
informatia produsului intern brut este data de catre factorul ales,
nivelul
veniturilor.
Impartind
ESS/TSS,
adica
1.2210e+10/1.2210e+10 se obtine R-sqared = 0.9997, care arata
ca informatia explicata de factor este in proportie de 99.97, ceea ce
inseamna ca factorul este reprezentativ.
De asemenea tesul F, care testeaza eficienta modelului,
raspunde la intrebarea "variabila independenta prezice bine
variabila dependenta?". Avand in vedere ca valoarea obtinuta
pentru F este 0, se poate aprecia ca modelul este reprezentativ si
poate fi folosit pentru estimatii viitoare.
Avand aceste informatii in vedere se poate determina forma
modelului. Astfel:
PIB = 174.051
3782509.88
+ 1.185684 * venit +
units: 1
missing .: 0/78
percentiles:
703
10%
25%
50%
75%
90%
1792
4361
19517
33181
----------------------------------------------------------------------------------------------------------------------venit
(unlabeled)
----------------------------------------------------------------------------------------------------------------------type: numeric (float)
range: [373,36632]
unique values: 78
units: 1
missing .: 0/78
mean: 9322.58
std. dev: 10620.3
percentiles:
556
10%
25%
50%
75%
90%
1388 3404.5
16255
27933
( 1) venit = 0
F( 1, 76) = 2.5e+05
Prob > F = 0.0000
Intrucat valoarea F este 0, ipoteza nula "parametrul variabilei venit
este 0" este respinsa, asadar parametrul este diferit de 0.
2.4. Corelarea
. correlate PIB venit
(obs=78)
|
PIB venit
-------------+-----------------PIB | 1.0000
venit | 0.9998 1.0000
Inca o data se demonstreaza corelarea dintre PIB si venit. Aceasta
corelatie este foarte mare 0.9998, deci factorul considerat poate
explica in mare masura variatia variabilei dependente.
2.5. Autocorelarea
Prin aplicarea testului Breusch-Godfrey putem determina
existenta unei autocorelari la nivelul modelului:
. estat bgodfrey
Breusch-Godfrey LM test for autocorrelation
--------------------------------------------------------------------------lags(p) |
chi2
df
Prob > chi2
-------------+------------------------------------------------------------1
|
37.453
1
0.0000
--------------------------------------------------------------------------H0: no serial correlation
Avand in vedere ca valoarea ,hi patrat' este 0, ipoteza nula de
inexistenta autocorelarii este respinsa. Asadar modelul prezinta o
autocorelare.
. estat dwatson
Durbin-Watson d-statistic( 2,
78) = 0 .5973365
Ha: mean != 0
Pr(|T| > |t|) = 1.0000
distribuite normal.
. swilk r
Shapiro-Wilk W test for normal data
Variable | Obs
W
V
z
Prob>z
-------------+------------------------------------------------r
|
78 0.89337
7.169
4.310 0.00001
Prob>z = 0.05 > 0.00001
normal.
. sfrancia r
Shapiro-Francia W' test for normal data
Variable | Obs
W'
V'
z
Prob>z
-------------+------------------------------------------------r
|
78 0.88143
8.755
4.105 0.00002
Prob>z = 0.05 >0.00002
normal.
Testul White
. estat imtest,white
---------------------------------------------------
Source |
chi2
df
p
---------------------+----------------------------
Heteroskedasticity |
26.20
0.0000
Skewness |
8.35
1 0.0038
Kurtosis
|
2.52
1 0.1126
---------------------+-----------------------------
Total
|
37.07
4 0.0000
---------------------------------------------------
calc = 26.20
Number
F( 1,
76)
Prob >
RAdj
RRoot
-----------------------------------------------------------------------------PIB |
Coef. Std. Err.
t P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------indicepret | 362.0339 6.755405
53.59 0.000
348.5793
375.4884
_cons | -4378.348 371.3653 -11.79 0.000 -5117.986 3638.71
-----------------------------------------------------------------------------Se
observa
ca
varianta
explicata
de
model,
ESS=1.1899e+10, este mult mai mare deat cea reziduala,
RSS=314856781, ceea ce ne ofera o prima informatie asupra
faptului ca modelul este reprezentativ si ca o mare parte din
informatia produsului intern brut este data de catre factorul ales,
indicele
preturilor.
Impartind
ESS/TSS,
adica
1.1899e+10/1.2213e+10 se obtine R-sqared = 0.9742, care arata
ca informatia explicata de factor este in proportie de 97.42, ceea ce
inseamna ca factorul este reprezentativ.
De asemenea tesul F, care testeaza eficienta modelului,
raspunde la intrebarea "variabila independenta prezice bine
variabila dependenta?". Avand in vedere ca valoarea obtinuta
pentru F este 0, se poate aprecia ca modelul este reprezentativ si
poate fi folosit pentru estimatii viitoare.
Avand aceste informatii in vedere se poate determina forma
modelului. Astfel:
PIB =
314856781
-4378.348
362.0339
indicepret
units: 1
missing .: 0/78
percentiles:
10%
25%
50%
75%
90%
703
1792
4361
19517
33181
----------------------------------------------------------------------------------------------------------------------indicepret
(unlabeled)
----------------------------------------------------------------------------------------------------------------------type: numeric (float)
range: [8.91,116.568]
unique values: 78
units: .001
missing .: 0/78
mean: 43.1065
std. dev: 34.3363
percentiles:
10%
25%
50%
75%
90%
9.81 16.364 24.4065 73.204 97.868
3.4. Corelarea
. correlate PIB indicepret
(obs=78)
|
PIB indice~t
-------------+-----------------PIB | 1.0000
indicepret | 0.9870 1.0000
3.5. Autocorelarea
Prin aplicarea testului Breusch-Godfrey putem determina
existenta unei autocorelari la nivelul modelului:
. estat bgodfrey
78) = .0368163
---------+-------------------------------------------------------------------rpret |
78 -7.60e-06
228.9622
2022.14 -455.9221
455.9221
-----------------------------------------------------------------------------mean = mean(rpret)
t = -0.0000
Ho: mean = 0
degrees of freedom =
77
Ha: mean < 0
Pr(T < t) = 0.5000
0.5000
Ha: mean != 0
Pr(|T| > |t|) = 1.0000
rpret
0.182
0.188
3.64
Prob>chi2
0.1620
. swilk rpret
rpret |
78
0.97213
1.874
1.374 0.08477
rpret |
78
0.97054
2.175
1.530 0.06305
se accepta, erorile nu
Testul White
. estat imtest,white
---------------------------------------------------
Source |
chi2
df
p
---------------------+-----------------------------
Heteroskedasticity |
Skewness
|
Kurtosis
|
34.21
18.18
1.06
2 0.0000
1 0.0000
1 0.3037
sunt
---------------------+-----------------------------
Total
|
53.44
4 0.0000
---------------------------------------------------
calc = 34.21
Number
F( 2,
75)
Prob >
RAdj
RRoot
-----------------------------------------------------------------------------PIB |
Coef. Std. Err.
t P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------venit | 1.157639 .0143654
80.59 0.000
1.129022
1.186257
indicepret | 8.792613 4.443268
1.98 0.052
-.0588302
17.64406
_cons | 56.47864 68.00137
0.83 0.409
-78.98703
191.9443
-----------------------------------------------------------------------------La fel ca in cazul modelelor unifactoriale, si aici se observa o
puternica informatie detinuta de cei 2 factori. Asadar variatia
modelului este 1.2210e+10 , net mai mare decat cea reziduala,
ceea ce conduce la un R patrat foarte mare de 0.9997. Aceasta
inseamna ca informatia explicata de factori este in proportie de
99.97%.
De asemenea, o prima analiza a modelului il anunta valid, astfel ca
valoarea F este 0, ceea ce inseamna ca modelul este reprezentativ
si poate conduce la viitoare prognoze.
Forma modelului este data de coeficientii parametrilor:
PIB =
56.47864
+ 1.157639
indicepret + 3594817.54
venit
8.792613*
4.2. Corelarea
. correlate PIB venit indicepret
(obs=78)
|
PIB venit indice~t
-------------+---------------------------
PIB | 1.0000
venit | 0.9998 1.0000
indicepret | 0.9870 0.9865 1.0000
Din analiza tabelului de corelatii se observa puternica corelatie
dintre variabila dependenta si fiecare factor, dar si puternica
corelatie dintre factori, ceea ce slabeste din validitatea modelului
regresional.
Number of
Number
of comp. =
Trace
=
2
Rotation: (unrotated
Rho
= 1.0000
principal)
-------------------------------------------------------------------------Component |
Eigenvalue
Difference
Proportion
Cumulative
-------------+-----------------------------------------------------------Comp1 |
1.98654
1.97308
0.9933
0.9933
Comp2 |
.0134622
.
0.0067
1.0000
-------------------------------------------------------------------------Principal components (eigenvectors)
-----------------------------------------------Variable | Comp1
Comp2 | Unexplained
-------------+--------------------+------------venit | 0.7071 0.7071 |
0
indicepret | 0.7071 -0.7071 |
0
-----------------------------------------------Noile componente ale modelului vor fi:
F1 = 0.7071*venit + 0.7071*indicepret
F2 = 0.7071*venit - 0.7071*indicepret
Number
F( 2,
75)
Prob >
RAdj
RRoot
-----------------------------------------------------------------------------PIB |
Coef. Std. Err.
t P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------f1 | 7.036149 3.131896
2.25 0.028
.7970917
13.27521
f2 | -5.398985 3.151939
-1.71 0.091
-11.67797
.
8799989
_cons | 56.47501 68.00173
0.83 0.409
-78.99139
191.9414
-----------------------------------------------------------------------------Se observa ca si in acest caz se mentin valorile ridicate ale variantei
explicite cat si a R. Asadar si acest model este reprezentativ si trece
de primele teste.
Forma modelului este:
PIB = 56.47501 + 7.036149*f1 -5.398985*f2
Inlocuind cu valorile initiale ale factorilor vom avea:
PIB = 56.47501 + 1.1576378 * venit + 1.1576378 *
indicepret
Variable | Corr.
Sig.
-------------+-----------------venit | 0.9943 0.000
indicepret | 0.2228 0.052
Daca se ia in considerare doar actiunea factorului
(venit), celalalt factor ramanand constant, atunci rezulta ca acesta
influenteaza variabila Y in proportie de 0.9943.
Daca se ia in considerare doar actiunea factorului
(indicepret), celalalt factor ramanand constant, atunci rezulta ca
acesta influenteaza variabila Y in proportie de 0.2228.
78) = .6110033
Cochran-Orcutt.
Datele obtinute vor fi vizibil diferite fata de
cele originale:
. prais PIB f1 f2 ,corc
Iteration
Iteration
Iteration
Iteration
Iteration
Iteration
Iteration
Iteration
Iteration
0:
1:
2:
3:
4:
5:
6:
7:
8:
rho
rho
rho
rho
rho
rho
rho
rho
rho
=
=
=
=
=
=
=
=
=
0.0000
0.7081
0.7167
0.7181
0.7183
0.7183
0.7183
0.7183
0.7183
Number
F( 2,
74)
Prob >
RAdj
RRoot
-----------------------------------------------------------------------------PIB |
Coef. Std. Err.
t P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------f1 | 9.545685 6.797692
1.40 0.164
-3.999012
23.09038
f2 | -7.921125 6.839497
-1.16 0.251
-21.54912
5.706871
_cons | 6.719343 164.2768
0.04 0.967
-320.6093
334.048
-------------+---------------------------------------------------------------rho | .7183342
-----------------------------------------------------------------------------Durbin-Watson statistic (original) 0.611004
Durbin-Watson statistic (transformed) 1.717177
One-sample t test
-----------------------------------------------------------------------------Variable |
Obs
Mean
Std. Err. Std. Dev. [95% Conf.
Interval]
---------+-------------------------------------------------------------------rmodel |
78
3.89e-07
24.46501
216.0691 -48.71606
48.71607
-----------------------------------------------------------------------------mean = mean(rmodel)
t = 0.0000
Ho: mean = 0
degrees of freedom =
77
Ha: mean < 0
Pr(T < t) = 0.5000
0.5000
Ha: mean != 0
Pr(|T| > |t|) = 1.0000
se respinge
Number
F( 2,
62)
Prob >
RAdj
RRoot
-----------------------------------------------------------------------------PIB |
Coef. Std. Err.
t P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------venit | 1.089366 .0209872
51.91 0.000
1.047414
1.131319
indicepret | 25.18873 5.367007
4.69 0.000
14.46024
35.91722
_cons | -95.6645 59.36767
-1.61 0.112
-214.3388
23.00978
-----------------------------------------------------------------------------Estimam parametrii pentru intreg esantionul:
. regress PIB venit indicepret
Source |
SS
df
MS
Number of obs =
78
-------------+-----------------------------2, 75) =
.
Model | 1.2210e+10
2 6.1049e+09
Prob > F
= 0.0000
Residual | 3594817.54 75 47930.9005
R-squared
= 0.9997
-------------+-----------------------------R-squared = 0.9997
Total | 1.2213e+10 77 158616055
Root MSE
= 218.93
F(
Adj
-----------------------------------------------------------------------------PIB |
Coef. Std. Err.
t P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------venit | 1.157639 .0143654
80.59 0.000
1.129022
1.186257
indicepret | 8.792613 4.443268
1.98 0.052
-.0588302
17.64406
_cons | 56.47864 68.00137
0.83 0.409
-78.98703
191.9443
------------------------------------------------------------------------------
Fcalc = mare
Ftab = 3.13
se respinge, parametrii celor doua grupe nu sunt
constanti
calc = 13.37
. estat imtest,white
White's test for Ho: homoskedasticity
against Ha: unrestricted heteroskedasticity
chi2(5)
=
27.05
Prob > chi2 = 0.0001
Cameron & Trivedi's decomposition of IM-test
--------------------------------------------------Source
|
chi2
df
p
---------------------+----------------------------Heteroskedasticity |
27.05
5 0.0001
Skewness
|
7.08
2 0.0290
Kurtosis
|
1.22
1 0.2686
---------------------+----------------------------Total
|
35.35
8 0.0000
--------------------------------------------------H0: modelul este homoscedastic
calc = 27.05
78
0
R-squared
= 1.0000
Adj R-squared =
Source | Partial SS df
MS
F
Prob > F
-----------+---------------------------------------------------Model | 1.2213e+10 77 158616055
|
venit | 1.2213e+10 77 158616055
indicepret |
0
0
|
Residual |
0
0
-----------+---------------------------------------------------Total | 1.2213e+10 77 158616055
Facand testul ANOVA acesta ne arata ca varianta totala este data de
varianta explicta a modelului, iar varianta reziduala este 0. aceasta
inseamna ca modelul este vaid si poate fi folosit in previziune.
In continuare voi prezenta graficele suprapuse ale valorilor
PIB-ului, asa cum au fost ele preluate din tabele si asa cum au fost
prezise de model. Astfel:
PIB-ul in functie de variatia veniturilor:
Ha: ratio != 1
Pr(F > f) =
5. Concluzii
Analizand validitatea modelelor se observa ca acestea nu trec toate
testele necesitand astfel diferite ajustari. Este clar insa ca intr-o
economie, variatia PIB-ului este determinata de variatia nivelului
veniturilor si de variatia nivelului preturilor. Asadar, variabila
independenta, dupa cum ne arata si testele si modelele depinde in
mare masura de cei doi factori analizati.