Sunteți pe pagina 1din 11

Academia de Studii Economice

Facultatea de Finante, Asigurari, Banci si Burse de valori

Modelul de Regresie Multiplă


cu ajutorul Excel

Bucureşti, 2010

1
Proiectul urmareste realizarea unui model econometric referitor la datele despre
suprafata, populatie si densitatea acesteia in perioada 2005.

Datele au fost preluate de siteul INS, din anuarul statistic 2007 referitor la statistica
internationala.

Centru Administrativ Suprafata(km²) Populatia(mil. loc.) Densitatea(loc/km²)


Tirana 28748 3.2 111.3
Andorra la Vella 468 0.1 213.7
Viena 83858 8.3 99
Misk 207600 9.7 46.7
Buxelles 30528 10.5 343.9
Sarajevo 51197 3.9 76.2
Sofia 110912 7.7 69.4
Praga 78866 10.3 130.6
Zagreb 56538 4.4 77.8
Copenhaga 43094 5.4 125.3
Berna 41284 7.5 181.7
Tallin 4100 1.3 28.8
Thorshavn 1399 0.05 35.7
Helsinki 338145 5.3 15.7
Paris 551500 61.2 111
Berlin 357022 82.4 230.8
Gibraltar 6 0.03 5000
Atena 131957 11.1 84.1
Dublin 70273 4.2 59.8
Reykjavik 103000 0.3 2.9
Roma 301318 59 195.8
Riga 64600 2.3 35.6
Luxemburg 2586 0.5 193.3
Chisinau 33851 4 118.2
Monaco 2 0.03 15000

SUMMARY OUTPUT

Regression Statistics
Multiple R 0.210924
R Square 0.044489
Adjusted
R Square -0.04238
Standard
Error 3160.832
Observatio
ns 25

2
ANOVA
Significan
  df SS MS F ce F
Regressio 102338 511694 0.5121
n 2 94 7 63 0.606169
2.2E+0 999086
Residual 22 8 1
2.3E+0
Total 24 8      

Coefficie Standar Lower Upper Lower Upper


  nts d Error t Stat P-value 95% 95% 95.0% 95.0%
-
808.459 1.7464 0.0946 3088.5 264.6 3088.5
Intercept 1411.953 3 74 78 -264.689 95 89 95
- -
X Variable 0.00785 0.7572 0.4569 0.0103 0.022 0.0103
1 -0.00594 1 1 59 -0.02223 37 23 37
-
X Variable 50.7737 0.2144 0.8321 116.18 94.40 116.18
2 10.88973 7 76 52 -94.4086 81 86 81

Folosind informaţiile din tabel(coloana Coefficients), elaborăm modelul liniar de regresie


multipla:

Y =α 0 + α 1⋅X 1 + α 2⋅X 2 + u ,unde X₁-Suprafata(km²)

X₂-Populatia(loc)

Y-Densitatea(loc/km²)

De unde Y=1411.953-0.00594*X₁+10.88973*X₂

Observand datele din tabel putem deduce faptul ca intensitatea legaturii dintre variabilele
analizate este slaba, deoarece indicatorul Multiple R=0.210924 nu se afla in apropierea
maximului 1.

R Square fiind in proportie de 4,4489% ceea ce inseamna ca variatia densitatii(variabila


Y) este explicata de variatia suprafetei si a populatiei in proportie de 4,4489%.

3
Interpretarea coeficientilor

α₀: Intercept – reprezinta cresterea medie a densitatii in conditiile in care suprafata si populatia
sunt nule.

tα₀=1.746474 iar pragul de semnificatie este 0.094678>0.05 inseamna ca acest parametru este
nesemnificativ.Probabilitatea fiind de 100-9.4678=90.5322%<95%

α₁: La o crestere a suprafetei cu 1 km², in conditiile in care populatia ramane constanta,


densitatea va scadea in medie cu 0.00594 loc/km².

Intervalul de incredere fiind (-0.02223; 0.010337).

tα₁=-0.75721 iar pragul de semnificatie este 0.456959>0.05 ceea ce insemna ca parametrul este
nesemnificativ.Probabilitatea fiind de 100-45.6959=54.3041%<95%.

α₂: La o crestere a populatiei cu 1 mil loc, in conditiile in care suprafata ramane constanta,
densitatea va creste in medie cu 10.88973 loc/km².

Intervalul de incredere fiind (-94.4086; 116.1881).

tα₂=0.214476 iar pragul de semnificatie este 0.832152>0.05 ceea ce insemna ca parametrul nu


este semnificativ. Probabilitatea fiind de 100-83.2152=16.7848%<95%.

Testul Fisher

Ipoteze:

H 0 :V 2y /x ~ V 2u

2 2
H 1 :V y/ x ¿V u ¿
2
n−k −1 V x
∗ 2
k Vu
F= ,unde

n= numarul de observatii

k=numarul de parametrii
¿

^¿− y )2 2
¿^ )
2 2
Vx = ∑( y ¿ ; V u = ∑ ( y− y ¿

4
Ymediu=
∑Yi
n

U=Yreal-Y calc

Y=α₀+α₁*X₁+α₂*X₂+u

Y=1411.953-0.00594*X₁+10.88973*X₂+u

Y calculat-Y
Y calculat U U² mediu (Y calculat-Y mediu)²
1276.037016 -1164.737016 1356612.316 372.545016 138789.7889
1410.262053 -1196.562053 1431760.747 506.770053 256815.8866
1004.221239 -905.221239 819425.4915 100.729239 10146.37959
284.439381 -237.739381 56520.01328 -619.052619 383226.1451
1344.958845 -1001.058845 1002118.811 441.466845 194892.9752
1150.312767 -1074.112767 1153718.236 246.820767 60920.49102
836.986641 -767.586641 589189.2514 -66.505359 4422.962776
1055.653179 -925.053179 855723.384 152.161179 23153.02439
1124.032092 -1046.232092 1094601.59 220.540092 48637.93218
1214.779182 -1089.479182 1186964.888 311.287182 96899.70968
1248.399015 -1066.699015 1137846.789 344.907015 118960.849
1401.755649 -1372.955649 1885007.214 498.263649 248266.6639
1404.187427 -1368.487427 1872757.836 500.6954265 250695.9101
-538.912731 554.612731 307595.2814 -1442.404731 2080531.408
-1197.505524 1308.505524 1712186.706 -2100.997524 4414190.596
188.556072 42.243928 1784.549453 -714.935928 511133.3811
1412.244052 3587.755948 12871992.74 508.7520519 258828.6503
749.004423 -664.904423 442097.8917 -154.487577 23866.41145
1040.268246 -980.468246 961317.9814 136.776246 18707.74147
803.399919 -800.499919 640800.1203 -100.092081 10018.42468
264.61815 -68.81815 4735.937769 -638.87385 408159.7962
1053.275379 -1017.675379 1035663.177 149.783379 22435.06062
1402.037025 -1208.737025 1461045.196 498.545025 248547.142
1254.43698 -1136.23698 1291034.475 350.94498 123162.379
1412.267812 13587.73219 184626466 508.7758119 258852.8268
    219798966.6   10214262.54

5
25−2−1 10214262 .54

F= 2 219798966. 6

F=0.511180237

Pentru a afla F critic consultand tabelul cu Valori Critice Pentru Repartitia F : α 0.05 cu 2 si 22
grade de libertate observam F critic=3.44>0.511180237(F calculat) => alegem acceptam H₀,
model valid statistic.

Testul Durbin-Watson pentru verificarea autocorelarii


n−1 2
∑2 ( ut −u t−1 ) 257636219 . 7-1356612. 316
DW = n
= =1. 165972758
219798966 . 6
∑ u2t
1

Ut Ut-1 (Ut-Ut-1)² (Ut)²


1356612.31 1356612.31
-1164.737016   6 6
1431760.74
-1196.562053 -1164.737016 1012.83298 7
819425.491
-905.221239 -1196.562053 84879.4699 5
445532.030 56520.0132
-237.739381 -905.221239 8 8
582656.604 1002118.81
-1001.058845 -237.739381 1 1
1153718.23
-1074.112767 -1001.058845 5336.87552 6
93958.2659 589189.251
-767.586641 -1074.112767 2 4
24795.7105
-925.053179 -767.586641 9 855723.384
14684.3289
-1046.232092 -925.053179 6 1094601.59
1870.31079 1186964.88
-1089.479182 -1046.232092 3 8
518.936008 1137846.78
-1066.699015 -1089.479182 5 9
93793.1258 1885007.21
-1372.955649 -1066.699015 7 4
19.9650123 1872757.83
-1368.487427 -1372.955649 1 6

6
3698314.21 307595.281
554.612731 -1368.487427 6 4
568354.343 1712186.70
1308.505524 554.612731 3 6
1784.54945
42.243928 1308.505524 1603418.43 3
12570655.4 12871992.7
3587.755948 42.243928 8 4
18085120.2 442097.891
-664.904423 3587.755948 3 7
99580.5263 961317.981
-980.468246 -664.904423 9 4
32388.5987 640800.120
-800.499919 -980.468246 2 3
535358.211 4735.93776
-68.81815 -800.499919 1 9
1035663.17
-1017.675379 -68.81815 900330.041 7
36504.5525 1461045.19
-1208.737025 -1017.675379 7 6
5256.25652 1291034.47
-1136.23698 -1208.737025 5 5
216795268.
13587.73219 -1136.23698 1 184626466
257636219. 219798966.
  7 6

Din tabelul Durbin Watson preluam valorile d1 si d2 (25 de observatii si 2 parametrii):


d1=1.29 si d2=1,45.

DW apartine intervalului (0; d1) tragem concluzia ca intre erori exista o autocorelare
puternica si directa.

Testul Klein pentru verificarea multicolinearitatii

Y=1411.953-0.00594*X₁+10.88973*X₂+u

Construim modelul:

X 1 =β 1 + β 2⋅X 2 + v

7
SUMMARY
OUTPUT

Regression Statistics
0.80699125
Multiple R 1
R Square 0.65123488
Adjusted R 0.63607117
Square 9
Standard Error 83951.711
Observations 25

ANOVA
Significan
  df SS MS F ce F
3.0269E+1 3.03E+1 42.9469
Regression 1 1 1 6 1.1E-06
7.05E+0
Residual 23 1.621E+11 9
4.6479E+1
Total 24 1      

Coefficient Standard Lower Upper Lower Upper


  s Error t Stat P-value 95% 95% 95.0% 95.0%
44518.4579 19362.508 2.29920 0.03091 84572.8 4464.05 84572
Intercept 9 2 9 2 4464.058 6 8
5219.15546 796.40506 6.55339 6866.64 3571.66 6866.6
X Variable 1 3 1 3 1.1E-06 3571.666 5 6

Multiple R=0.806991251 repezentand noul model al regresiei.

R2 =0 .65123488 . Obtinem r>R2, deci multicolinearitatea poate fi neglijata.

Testarea ipotezei de normalitate a erorilor JB

Ipoteze:
H₀: perturbatia u are o disributie normala
H₁:perturbatia u nu are o ditributie normala

2
s 2 (k−3 )
JB=n⋅ [ +
6 24 ] , unde:
8
n- numarul de observatii,

s- este coeficientul de asimetrie

k-coeficientul de aplatizare.

Acesti coeficienti se calculeaza cu ajutorul aplicatiei Excel:

s=SKEW(erori)=> s=4.142778

k=KURT(erori)=> k=18.46461

4 . 1427782 (18 . 46461−3 )2


Deci
JB calc=25⋅ [ 6
+
24 ]
=320 . 6297924

χ 20 , 05 ;3 =7 . 815<JBcalc deci acceptam H1

Testarea homoscedasticitatii GQ
H₀: erori homoscedastice
H₁: erori heteroscedasice

Y=1411.953-0.00594*X₁+10.88973*X₂+u

U=y-ycalc

û
X₁ X₂ ỷ
13587.73
2 0.03 1412.268
3587.756
6 0.03 1412.244
-1196.56
468 0.1 1410.262
-1368.49
1399 0.05 1404.187
-1208.74
2586 0.5 1402.037
-1164.74
28748 3.2 1276.037
-1001.06
30528 10.5 1344.959

9
-1136.24
33851 4 1254.437
-1066.7
41284 7.5 1248.399
-1089.48
43094 5.4 1214.779
-1129.42
45100 1.3 1158.216
-1074.11
51197 3.9 1150.313
-1046.23
56538 4.4 1124.032
-1017.68
64600 2.3 1053.275
-980.468
70273 4.2 1040.268
-925.053
78866 10.3 1055.653
-905.221
83858 8.3 1004.221
-800.5
103000 0.3 803.3999
-767.587
110912 7.7 836.9866
-664.904
131957 11.1 749.0044
-237.739
207600 9.7 284.4394
-68.8182
301318 59 264.6182
554.6127
338145 5.3 -538.913
42.24393
357022 82.4 188.5561
1308.506
551500 61.2 -1197.51

Eliminam din centrul seriei k=n\3=25\3~9 unitati

SP1=205913788.1

SP2=3754909.752

gl=(n-c)/2-k=(25-9)/2-2=6

Testul Fisher
F=(SP1/gl)/(sp2/gl)=(205913788.1/6)/(3754909.752/6)=34318964.68/625818.292=54.83854518

10
Fα,6,6=4,28<F=>prezumtia homoscedasticitatii este infirmata(acceptam alternativa).Eroarea u
este heteroscedastica

11

S-ar putea să vă placă și