Sunteți pe pagina 1din 40

ACADEMIA DE STUDII ECONOMICE DIN BUCURETI

ECONOMETRIE




Locuinte = f(camere de locuit, suprafata locuibila)













Studenta: Zavoiu Ana-Maria

Grupa 146, seria C






2013-2014

2

Problema A
Cazul I
- Realizarea i interpretarea regresiei unifactoriale
( )
i i
x f y =
- Locuinte = f(Camere de locuit)

Tabel cu valorile de intrare:
Judet Locuinte (y)
Camere de locuit
(x1)
Bihor 226836 527894
Bistrita-Nasaud 100206 241268
Cluj 264498 593554
Maramures 176479 391905
Satu Mare 135340 312296
Salaj 96467 221069
Alba 139529 321599
Brasov 214611 493380
Covasna 83960 180677
Harghita 123417 257795
Mures 213935 476004
Sibiu 153950 367416
Bacau 246592 610333
Botosani 162052 365628
Iasi 257680 604746
Neamt 194479 475935
Suceava 227971 532560
Vaslui 155775 363466
Braila 130594 358905
Buzau 184272 509412
Constanta 238542 653636
Galati 208986 551458
Tulcea 91362 267399
Vrancea 141011 384137
Arges 252416 622404
Calarasi 112552 327160
Dambovita 190103 503818
Giurgiu 108545 332400
Ialomita 103504 290797
Prahova 297687 805117
Teleorman 167610 465722
Ilfov 93366 286528
Municipiul
Bucuresti 783229 1878733
Dolj 263163 727148
3

Gorj 143458 368788
Mehedinti 125467 315735
Olt 180366 493135
Valcea 164211 410407
Arad 180335 449517
Caras-Severin 128748 315843
Hunedoara 191956 429114
Timis 252260 604605

a) prezentarea problemei (inclusiv descrierea naturii legaturii dintre cele doua variabile,
conform teoriei economice)

In tabelul de mai sus sunt nscrise date statistice referitoare la valorile camerelor de locuit
i locuintelor din anul 2000 in cele 42 judete ale Romaniei.
Locuintele reprezinta variabila dependenta, endogena, iar Camerele de locuit reprezinta
variabila independenta, exogena.
Intre cele 2 variabile se manifesta o legatura simpla, directa deoarece punctele sunt
concentrate in jurul diagonalei principale.

b) definirea modelului de regresie simpla liniara;
- forma, variabilele si parametrii modelului de regresie
- reprezentarea grafica a modelului legaturii dintre variabile

Definim modelul unifactorial de regresie printr-o relatie matematica construita pe baza
teoriei economice, care presupune ca fenomenul economic Y (fenomenul efect) este rezultatul
actiunii a doua categorii de factori:
-prima, constituita dintr-un singur factor principal, determinant, X
-a doua, formata din toti ceilalti factori specificati prin variabila reziduala e

Forma, variabilele si parametrii modelului de regresie:
y
i
= b0 + b
1
*

x
1i
+ e
i

x
i
, y
i
- reprezinta valorile numerice ale variabilelor cauza X si efect Y, inregistrate la
nivelul unitatii statistice i.
Parametrul b0 - reprezinta termenul liber, intercept.
Parametrul b
1
- reprezint panta dreptei, numindu-se si coeficient de regresie.
e
i
reprezinta componenta reziduala sau eroarea aleatoare.















4

Legatura Camere de locuit- Locuinte



Intre cele 2 variabile se manifesta o legatura liniara simpla,directa deoarece punctele sunt
concentrate in jurul diagonalei principale.

c) estimarea parametrilor modelului si interpretarea acestora;
- estimarea punctuala a parametrilor
- estimarea parametrilor prin interval de incredere

Criteriul ales pentru determinarea parametrilor b0 si b
1
este minimul sumei patratelor abaterilor
valorilor reale y
i
de la valorile ajustate
i
. Metoda este cunoscuta sub denumirea de metoda celor mai
mici patrate.

=
.
=
=
= =
1
2
1 0 1 0
2
1 1
2
1 0
) ( min ) , (
) ( min min ) , (
i
n
i i
i
n
i i
i
n
x b b y b b S
y y ei b b S

Aplicam conditiile de ordin 1 de minimizare a functiei pentru a calcula
0
b i
1
b , care sunt:

= +
= +


= = =
= =
n
i
i i
n
i
i
n
i
i
n
i
i
n
i
i
y x x b x b
y x b nb
1 1
2
1
1
0
1 1
1 0
=>

=>


Judet Locuinte
(y)
Camere de
locuit (xi)
xi
2
xi*yi
i
y
i -

i
( yi -
i)
2

Xi -
X
i
-

(X
i
-X
i
-
)
2

Bihor 226836 527894 278672075236 1197453
63384
21250
4,36
14331,64 2053
9590
5,1
59097
,74
34925426
47,97
Bistrita-
Nasaud
100206 241268 58210247824 2417650
1208
94987
,7
5218,3 2723
0654,
89
-
22752
8,26
51769109
965,40
y = 0,4109x - 4373,8
R = 0,9789
0
200000
400000
600000
800000
1000000
0 500000 1000000 1500000 2000000
L
o
c
u
i
n
t
e

(
Y
)

Camere de locuit (X1)
Evolutia locuintelor in functie de camerele
de locuit in anul 2000

= +
= +
827 4885167554 9875 1209729130 * 1 19689443 * 0
7907520 19689443 * 1 0 42
b b
b b

=
=
41 , 0 1
18 , 3932 0
b
b
5

Cluj 264498 593554 352306350916 1569938
45892
23942
4,96
25073,04 6286
5733
4,8
12475
7,74
15564493
214,64
Maramur
es
176479 391905 153589529025 6916300
2495
15674
8,87
19730,13 3892
7802
9,8
-
76891
,26
59122661
57,31
Satu
Mare
135340 312296 97528791616 4226614
0640
12410
9,18
11230,82 1261
3131
7,9
-
15650
0,26
24492331
976,26
Salaj 96467 221069 48871502761 2132586
3223
86706
,11
9760,89 9527
4973,
59
-
24772
7,26
61368796
290,83
Alba 139529 321599 103425916801 4487238
6871
12792
3,41
11605,59 1346
8971
9,2
-
14719
7,26
21667033
912,26
Brasov 214611 493380 243423824400 1058847
75180
19835
3,62
16257,38 2643
0240
4,5
24583
,74
60436017
8,74
Covasna 83960 180677 32644178329 1516964
0920
70145
,39
13814,61 1908
4344
9,5
-
28811
9,26
83012709
080,54
Harghita 123417 257795 66458262025 3181628
5515
10176
3,77
21653,23 4688
6236
9,4
-
21100
1,26
44521532
525,40
Mures 213935 476004 226579808016 1018339
15740
19122
9,46
22705,54 5155
4154
6,7
7207,
74
51951488
,45
Sibiu 153950 367416 134994517056 5656369
3200
14670
8,38
7241,62 5244
1060,
22
-
10138
0,26
10277957
503,88
Bacau 246592 610333 372506370889 1505032
35136
24630
4,35
287,65 8274
2,522
5
14153
6,74
20032648
230,64
Botosani 162052 365628 133683834384 5925074
8656
14597
5,3
16076,7 2584
6028
2,9
-
10316
8,26
10643690
264,45
Iasi 257680 604746 365717724516 1558309
49280
24401
3,68
13666,32 1867
6830
2,3
13594
9,74
18482331
288,16
Neamt 194479 475935 226514124225 9255936
2865
19120
1,17
3277,83 1074
4169,
51
7138,
74
50961581
,59
Suceava 227971 532560 283620153600 1214082
35760
21441
7,42
13553,58 1836
9953
0,8
63763
,74
40658142
95,88
Vaslui 155775 363466 132107533156 5661891
6150
14508
8,88
10686,12 1141
9316
0,7
-
10533
0,26
11094464
072,93
Braila 130594 358905 128812799025 4687083
9570
14321
8,87
-12624,87 1593
8734
2,5
-
10989
1,26
12076089
443,02
Buzau 184272 509412 259500585744 9387036
8064
20492
6,74
-20654,74 4266
1828
4,5
40615
,74
16496381
81,02
Constanta 238542 653636 427240020496 1559196
38712
26405
8,58
-25516,58 6510
9585
4,9
18483
9,74
34165728
779,12
Galati 208986 551458 304105925764 1152470
01588
22216
5,6
-13179,6 1737
0185
6,2
82661
,74
68329629
44,93
Tulcea 91362 267399 71502225201 2443010
7438
10570
1,41
-14339,41 2056
1867
9,1
-
20139
7,26
40560857
102,74
Vrancea 141011 384137 147561234769 5416754
2507
15356
3,99
-12552,99 1575
7755
7,9
-
84659
,26
71671906
26,26
6

Arges 252416 622404 387386739216 1571047
28064
25125
3,46
1162,54 1351
499,2
52
15360
7,74
23595337
202,74
Calarasi 112552 327160 107033665600 3682251
2320
13020
3,42
-17651,42 3115
7262
8
-
14163
6,26
20060830
686,35
Dambovit
a
190103 503818 253832577124 9577731
3254
20263
3,2
-12530,2 1570
0591
2
35021
,74
12265221
39,21
Giurgiu 108545 332400 110489760000 3608035
8000
13235
1,82
-23806,82 5667
6467
8,5
-
13639
6,26
18603940
261,59
Ialomita 103504 290797 84562895209 3009865
2688
11529
4,59
-11790,59 1390
1801
2,5
-
17799
9,26
31683737
238,64
Prahova 297687 805117 648213383689 2396728
64379
32616
5,79
-28478,79 8110
4147
9,9
33632
0,74
11311163
8872,93
Teleorma
n
167610 465722 216896981284 7805966
4420
18701
3,84
-19403,84 3765
0900
6,7
-
3074,
26
9451086,
26
Ilfov 93366 286528 82098294784 2675197
3248
11354
4,3
-20178,3 4071
6379
0,9
-
18226
8,26
33221719
297,78
Municipi
ul
Bucuresti
783229 1878733 3529637685289 1471478
168857
76634
8,35
16880,65 2849
5634
4,4
14099
36,74
19879216
05430,64
Dolj 263163 727148 528744213904 1913584
49124
29419
8,5
-31035,5 9632
0226
0,3
25835
1,74
66745620
576,83
Gorj 143458 368788 136004588944 5290558
8904
14727
0,9
-3812,9 1453
8206,
41
-
10000
8,26
10001652
449,21
Mehedinti 125467 315735 99688590225 3961432
3245
12551
9,17
-52,17 2721,
7089
-
15306
1,26
23427749
895,88
Olt 180366 493135 243182128225 8894478
7410
19825
3,17
-17887,17 3199
5085
0,6
24338
,74
59237417
2,07
Valcea 164211 410407 168433905649 6739334
3877
16433
4,69
-123,69 1529
9,216
1
-
58389
,26
34093059
05,78
Arad 180335 449517 202065533289 8106364
8195
18036
9,79
-34,79 1210,
3441
-
19279
,26
37168993
9,59
Caras-
Severin
128748 315843 99756800649 4066415
4564
12556
3,45
3184,55 1014
1358,
7
-
15295
3,26
23394700
327,31
Hunedoar
a
191956 429114 184138824996 8237100
6984
17200
4,56
19951,44 3980
5995
8,1
-
39682
,26
15746819
09,88
Timis 252260 604605 365547206025 1525176
57300
24395
5,87
8304,13 6895
8575,
06
13580
8,74
18444013
343,02
TOTAL
7907520 19689443 1209729130987
5
4885167
554827
1045
6850
322
28669540
32488,12

=>
i i
x y 41 , 0 18 , 3932 + =


Coeficientul de regresie b
1
, reprezentand panta liniei drepte,are valoarea 0,41.
b1> 0, deci intre camerele de locuit si locuinte exista o legatura directa.

-Estimarea parametrilor prin interval de incredere pentru un nivel de semnificatie de 5%

7

Intervalul de incredere pentru
0
este:
b
0
-z
,n-2
*Sb
0
<
0
<b
0
+ z
,n-2
*Sb
0
,unde:
-
( )

=
2
2
x x n
x
s Sbo
i
i
e



-


Se==16168,53
Sb
0
=

=5173,93
z
/2,n-2
=1,96 => -3932,18-1,6*5173,93<
0
<-3932,18+1,96*5173,93=>
-14730,18<
0
<5982,63
Intervalul de incredere pentru 1 este:
b
1
-z
,n-2
*Sb
1
<
1
<b
1
+ z
,n-2
*Sb
1
,unde:
-
( )

=

=
n
i
i
e
x x
s
Sb
1
2
1


-

Se==16168,53
Sb
1
=

=0.1
z
/2,n-2
=1,96 => 0,41-1,96*0.1<
1
<0,41+1,96*0.1=>
0,39<
1
<0,43

d) testarea semnificaiei corelaiei si a parametrilor modelului de regresie;
- testarea semnificaiei corelaiei
- testarea parametrilor modelului de regresie simpla liniara

Testarea semnificatiei corelatiei se realizeaz prin testarea celor doi indicatori cantitativi ai
intensittii legturii dintre cele dou variabile : raportul si coeficientul de corelatie.
Testarea semnificatiei raportului de corelatie R
Calcularea raportului de corelatie presupune folosirea urmtoarei relatii:
( )
2

2
1
2
2

A
=

=
n
y y
n
s
n
i
i i
e
e
( )
2

2
1
2
2

A
=

=
n
y y
n
s
n
i
i i
e
e
8

( )
( )
0.9893

1
2
1
2
=

=
=
n
i
i
n
i
i
y y
y y
R

Pentru testarea semnificatiei raportului de corelatie se utilizeaz testul Fisher, iar pentru un nivel de
semnificatie =5% ( =0,05), testarea se realizeaz astfel:

0 :
0
= R H
(raportul de corelatie nu este semnificativ statistic)

0 :
1
= R H
(raportul de corelatie este semnificativ statistic)
Pentru n =42, k =1 rezult:
76 , 1864
1
1 1 42
*
979 . 0 1
979 , 0 1
*
1
2
2
=

=
k
k n
R
R
F
calculat

Pentru =0,05, k=1 si n =42, rezult:
4
1 ; ;
= =
k n k
F Fcritic
o

Deoarece ( ) 4 ) 1864,76 ( Fcritic F
calculat
> , rezult c se respinge H
0
, deci se accept H
1
, ceea ce
nseamna ca raportul de corelatie al colectivitatii din care s-a extras esantionul de 42 judete, difera
semnificativ de zero, deci este semnificativ statistic.

Testarea semnificatiei coeficientului de corelatie r
Coeficientului de corelatie se poate determina prin mai multe moduri, avnd mai multe formule de
calcul. Pentru c ntre locuinte si camerele de locuit exist o legtur liniar.
Raportul de corelatie si coeficientul de corelatie au aceeasi valoare, si anume R = r = 0,9893
(legtur liniar, deoarece conform corelogramei, valorile camerelor de locuit sunt mprstiate de o parte
si de alta a dreptei, iar panta este pozitiv).
Pentru testarea semnificatiei coeficientului de corelatie se utilizeaz testul Student, iar pentru un
nivel de semnificatie =0,05, testarea se realizeaz astfel:

0 :
0
= r H
(coeficientul de corelatie nu este semnificativ statistic)

0 :
1
= r H
(coeficientul de corelatie este semnificativ statistic)
Pentru n =42, k =1 rezult:
5 , 62
) 989 . 0 1 (
) 1 1 42 ( 989 . 0
1
2
2
=

=
r
n r
z
calculat

Pentru =0,05, k=1 si n =42, rezult:
96 , 1
1 ;
2
= =

k n
tabelar
z z


Deoarece ( ) ( ) 96 , 1 62,5 zcritic z
calculat
> H
0
se respinge, deci H
1
este adevarata, prin urmare
coeficientul de corelatie al colectivitatii din care s-a extras esantionul de 42 judete, difera semnificativ de
zero, deci este semnificativ statistic.

Testarea parametrilor modelului de regresie simpla liniara
Testarea seminificatiei parametrului
0

H0 :
0
= 0 (parametrul
0
nu este semnificativ statistic)
H1 :
0
= 0 (parametrul
0
este semnificativ statistic)
9

Pentru testare se utilizeaza testul Student, pentru un nivel de semnificatie =0,05, k=1 si n =42,
testarea este:
76 , 0
93 , 5173
18 , 3932
0
0
=

= =
b
calculat
S
b
z
96 , 1
1 ;
2
= =

k n
critic
t z

Deoarece
calculat critic
z z > rezulta ca H0 se accepta , ceea ce nsemna ca H1 se respinge, deci o
nu este semnificativ diferit de zero (
0
este semnificativ statistic). Pentru o probabilitate de 0.95 este
foarte probabil ca estimatorul b
0
s provin dintr-o populatie cu
0
diferit de 0.
Testarea seminificatiei parametrului
1

H0 :
1
= 0 (parametrul
1
nu este semnificativ statistic)
H1 :
1
= 0 (parametrul
1
este semnificativ statistic)
Pentru testare se utilizeaza testul Student, pentru un nivel de semnificatie =0,05, k=1 si n =42, testarea
este:
1 , 4
1 , 0
41 , 0
1
1
= = =
b
calculat
S
b
z
96 , 1
1 ;
2
= =

k n
critic
z z

Deoarece
critic
z z
calculat
> rezulta ca H
0
se respinge , ceea ce nsemna ca H
1
se accepta, deci o
este semnificativ diferit de zero (
1
este semnificativ statistic). Pentru o probabilitate de 0.95 este foarte
probabil ca estimatorul b
1
s provin dintr-o populatie cu
1
diferit de 0.

e) aplicarea analizei de tip ANOVA si interpretarea rezultatelor

SUMMARY OUTPUT


Regression Statistics
Multiple R 0,989375246
R Square 0,978863378
Adjusted R Square 0,978334962
Standard Error 16166,55997
Observations 42

R= 0.989 arata ca intre locuinte si camerele de locuit exista o legatura puternica.
R
2
=0,978.
Abaterea medie patratica a erorilor Se=16166,55. In cazul in care acest indicator este zero
inseamna ca toate punctele sunt pe dreapta de regresie.

ANOVA

df SS MS F
Significance
F
Regression 1 484151996077,96 484151996077,96 1852,449986 4,01165E-35
Residual 40 10454306453 261357661,3

Total 41 494606302530,57
10


Interpretarea rezultatelor analizei de tip ANOVA:

df = Degree of freedom- gradele de libretate
k=1
n-k-1=42-1-1=40
n-1=42-1=41

Sum of squares- suma ptratelor
SSR=
( ) 96 , 77 4841519960
1
2
2
/
= = A

=
n
i
i x y
y y

SSE=
( ) 3 1045430645
1
2 2
= = A

=
n
i
i i e
y y

SST= ( ) 30,57 4946063025
1
2
2
= = A

=
n
i
i y
y y

Media ptratelor sau dispersia corectat

MS=SS/df
96 , 77 4841519960
2
/
2
/
=
A
=
k
s
x y
x y

3 261357661,
1
2
2
=

A
=
k n
s
e
e



Significance F=0,00001 < pragul de semnificatie =0,05 rezult c modelul este valid si
poate fi utilizat pentru analiza dependentei dintre cele dou variabile.

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept -4373,773662 5124,207137 -0,8535513 0,398436374 -14730,1826 5982,635278
Camere de locuit
(x1) 0,41094197 0,009547887 43,04009742 4,01165E-35 0,391644971 0,430238969

Intercept este termenul liber, deci coeficientul b0 este -4373,77. Termenul liber este
punctul in care variabila explicativa (factoriala) este 0. Deoarece t
b0
= -0,83 iar pragul de
semnificaie P-value este 0.39>0.05 inseamna ca acest coeficient este nesemnificativ. De altfel
faptul ca limita inferioara a intervalului de incredere(-14730,18<
0
<5982,63) pentru acest
parametru este negativa, iar limita superioara este pozitiva arata ca parametrul din colectivitatea
generala este aproximativ zero.
Coeficientul b1 este 0,41. Deoarece t
b1
= 43,04, iar pragul de semnificatie P-value este
0,00001<0.05 inseamna ca acest coeficient este semnificativ statistic. Intervalul de incredere
pentru acest parametru este 0,39< 1<0,43.


f) testarea ipotezelor clasice asupra modelului de regresie simpla;
- ipoteze statistice clasice supra modelului de regresie simpla
- testarea liniaritii modelului propus
- testarea normalitii erorilor
- testarea ipotezei de homoscedasticitate
11

- testarea ipotezei de autocorelare a erorilor


1. Ipoteze statistice clasice asupra modelului de regresie simpl

Ipoteza 1 : Forma funcional.
i i i i i
y x y c c | | + = + + =
1 0



Ipoteza 2 : Media erorilor este 0.
0 = c


Ipoteza 3 : Homoscedasticitatea: dispersia reziduurilor n populaie este constant pentru
toate valorile
i
x
.
n i , 1 cst
2
= =
c
o


Ipoteza 4 : Non-autocorelarea erorilor (deviaiile observaiilor de la valorile lor ateptate
sunt necorelate)
j i Cov
j i
= = 0 ) , ( c c


Ipoteza 5 : Necorelare ntre regresor i erori
j i x Cov
j i
si 0 ) , ( = c


Ipoteza 6 : Variabila aleatoare este normal distribuit
) , 0 ( ~
2
o c N
i


2. Testarea liniarittii modelului propus

H
0
: modelul nu este valid;
2
/ x y
s =
2
e
s
H
1
: modelul este valid;
2
/ x y
s =
2
e
s
F
calculat
=
2
/ x y
s /
2
e
s = 1864,76
F
critic
= F
1 , , k n k
= 4
Deoarece F
calculat
(1864,76) >
1 ; ; k n k
F
o
(4) H
0
se respinge, deci H
1
este adevarata; cu o
probabilitate de 95% putem aprecia ca exista suficiente dovezi pentru a spune ca modelul este valid,
rezultand faptul ca modelul este liniar.

3. Testarea normalitii erorilor
Pentru testarea normalittii erorilor utilizm testul Jarque-Bera, a crui valoare o
determinm cu ajutorul Eviews.
Verificarea ipotezei de normalitate a erorilor se va realiza cu ajutorul testului Jarque-
Berra, care este i el un test asimptotic (valabil n cazul unui eantion de volum mare), ce
urmeaz o distribuie hi ptrat cu un numr al gradelor de libertate egal cu 2, avnd urmtoarea
form:
12

Dac probabilitatea p(JB) corespunztoare valorii calculate a testului este suficient de
sczut, atunci ipoteza de normalitate a erorilor este respins, n timp ce, n caz contrar, pentru
un nivel suficient de ridicat al probabilitii ipoteza de normalitate a erorilor este acceptat, sau
dac jB
>
k ,
2
, atunci ipoteza de normalitate a erorilor este respins.



H
0
: erorile nu sunt normal distribuite
H
1
: erorile sunt normal distribuite
jB
calculat
=
(


+
24
) 3 (
6
*
2 2
k S
n
=42*
(


+
24
) 3 1 (
6
091 , 0
2
=7,77
jB
tabelar
= = k ,
2
5,99
Deoarece jB
calculat
> jB
critic
rezult ca se accept ipoteza conform creia pentru o probabilitate
de 0.95,erorile sunt normal distribuite.

4. Testarea ipotezei de homoscedasticitate
Verificarea ipotezei de homoscedasticitate a erorilor n cazul acestui model se va realiza
cu ajutorul testului White.
13


1.Folosind testul Fisher:
H
0
: modelul este homoscedastic
H
1
: modelul este heteroscedastic
F
calculat
= F-statistic = 3,272
F
critic
= F
1 , , k n k
= 4
Deoarece F
calculat
< F
1 , , k n k
rezult c pentru o probabilitate de 95% exist suficiente
dovezi pentru a accepta ipoteza conform creia modelul este homoscedastic.

2. Utilizand testul LM
H
0
: Modelul este homoscedastic
H
1
: Modelul este heteroscedastic
LM = n* R-squared = 42*0.143= 6,006
= k ,
2
5,99
Comparand valorile observam ca LM>5,99 ceea ce inseamna ca se respinge ipoteza nula,
si se accepta H
1
,astfel modelul este hoteroscedastic.

5. Testarea ipotezei de autocorelare a erorilor
Se realizeaz prin intermediul testului Durbin-Watson.
14

In analiza autocorelarii variabilelor reziduale testul cel mai utilizat este testul Durbin-
Watson.



In analiza autocorelarii variabilelor reziduale testul cel mai utilizat este testul Durbin-
Watson.
Ipotezele testului:
1. H
0
: =0, deci nu exista autocorelare la nivelul seriei reziduurilor
2. H
1
: 0, exista autocorelare
3. Din figura prezentata mai sus observam ca Eviews a calculat implicit si statistica
Durbin Watson:
Durbin Watson stat = 0,833
Valorile critice ale statisticii depind de numarul de variabile factor din cadrul modelului
(1), de numarul de observatii (42) si de pragul de semnificatie ales (0.05).
Tabelele de valori critice cuprind pentru elementele specificate cate o pereche de valori
d1 si d2, unde d1=0.6 si d2=1.93.
Observam ca DW stat apartine intervalului (d2, 4-d2), motiv pentru care putem afirma ca
nu exista autocorelare a erorilor, deci se accepta ipoteza H
0
.

g) previziunea valorii variabilei Y daca variabila X creste cu 10% fata de ultima valoare
nregistrata (inclusiv interval de incredere)

n+1
=b
0
+b
1
*X
n+1

X
n+1
=X
n
+10%* X
n
=1.1* X
n
=1.1*604605=665065,5

15

n+1
= -3932,18+0,41*665065,5=268744,675

Interval de incredere:

=>



=>

Cazul II
- Realizarea i interpretarea regresiei unifactoriale
( )
i i
x f y =
- Locuinte = f(Suprafata lucuibila)

Tabel cu valorile de intrare:
Judet
Locuinte
(y) Suprafata locuibila (x2)
Bihor 226836 8025,9
Bistrita-Nasaud 100206 3943,4
Cluj 264498 9209,2
Maramures 176479 6163
Satu Mare 135340 4936,6
Salaj 96467 3456,7
Alba 139529 4938,9
Brasov 214611 7710
Covasna 83960 2907,3
Harghita 123417 4264,4
Mures 213935 7475,4
Sibiu 153950 5900,5
Bacau 246592 8413,1
Botosani 162052 4751,4
Iasi 257680 8095,2
Neamt 194479 6440,1
Suceava 227971 7782,8
Vaslui 155775 4696,5
Braila 130594 4549,9
Buzau 184272 6159,9
Constanta 238542 8688,4
Galati 208986 7289,3
Tulcea 91362 3280,1
Vrancea 141011 5000,9
Arges 252416 8094,6
Calarasi 112552 3787,4
Dambovita 190103 6344,2
( )
( )

=
+
+

+ +
n
i
i
n
e k n n
x x
x x
n
s z y
1
2
2
1
1 , 2 / 1
1
1 * *
o
12 , 488 2866954032
177 , 0 3852161457
42
1
1 53 , 16168 * 262 , 2
1
+ +
+ n
y
41 , 37670
1

+ n
y
16

Giurgiu 108545 3913,5
Ialomita 103504 3479
Prahova 297687 10439,6
Teleorman 167610 5293,5
Ilfov 93366 3723,5
Municipiul
Bucuresti 783229 27496,2
Dolj 263163 9375,8
Gorj 143458 4587,2
Mehedinti 125467 4087,3
Olt 180366 5863,1
Valcea 164211 5006,5
Arad 180335 7543,9
Caras-Severin 128748 4727,1
Hunedoara 191956 6329,8
Timis 252260 9751,6
TOTAL
7907520
273922,7

a) prezentarea problemei (inclusiv descrierea naturii legaturii dintre cele doua variabile,
conform teoriei economice)

In tabelul de mai sus sunt nscrise date statistice referitoare la valorile suprafetei locuibile
(x
2
) i locuintelor (y) din anul 2000 in cele 42 judete ale Romaniei.
Locuintele reprezinta variabila dependenta, endogena, iar suprafata locuibila reprezinta
variabila independenta, exogena.
Intre cele 2 variabile se manifesta o legatura simpla, directa deoarece punctele sunt
concentrate in jurul diagonalei principale.

b) definirea modelului de regresie simpla liniara;
- forma, variabilele si parametrii modelului de regresie
- reprezentarea grafica a modelului legaturii dintre variabile

Definim modelul unifactorial de regresie printr-o relatie matematica construita pe baza
teoriei economice, care presupune ca fenomenul economic Y (fenomenul efect) este rezultatul
actiunii a doua categorii de factori:
-prima, constituita dintr-un singur factor principal, determinant, X
-a doua, formata din toti ceilalti factori specificati prin variabila reziduala e

Forma, variabilele si parametrii modelului de regresie:
y
i
= b0 + b
1
*

x
1i
+ e
i

x
i
, y
i
- reprezinta valorile numerice ale variabilelor cauza X si efect Y, inregistrate la
nivelul unitatii statistice i.
Parametrul b0 - reprezinta termenul liber, intercept.
Parametrul b
1
- reprezint panta dreptei, numindu-se si coeficient de regresie.
e
i
reprezinta componenta reziduala sau eroarea aleatoare.





17

Legatura Suprafata locuibila- Locuinte



Intre cele 2 variabile se manifesta o legatura liniara simpla,directa deoarece punctele sunt
concentrate in jurul diagonalei principale.

c) estimarea parametrilor modelului si interpretarea acestora;
- estimarea punctuala a parametrilor
- estimarea parametrilor prin interval de incredere

Criteriul ales pentru determinarea parametrilor b0 si b
1
este minimul sumei patratelor abaterilor
valorilor reale y
i
de la valorile ajustate
i
. Metoda este cunoscuta sub denumirea de metoda celor mai
mici patrate.

=
.
=
=
= =
1
2
1 0 1 0
2
1 1
2
1 0
) ( min ) , (
) ( min min ) , (
i
n
i i
i
n
i i
i
n
x b b y b b S
y y ei b b S

Aplicam conditiile de ordin 1 de minimizare a functiei pentru a calcula
0
b i
1
b , care sunt:

= +
= +


= = =
= =
n
i
i i
n
i
i
n
i
i
n
i
i
n
i
i
y x x b x b
y x b nb
1 1
2
1
1
0
1 1
1 0
=>

=>



y = 28,204x + 4325,5
R = 0,9871
0
100000
200000
300000
400000
500000
600000
700000
800000
900000
0 10000 20000 30000
L
o
c
u
i
n
t
e

Suprafata locuibila
Evolutia locuintelor in functie de
suprafata locuibila in anul 2000

Locuinte (y)
Linear (Locuinte (y))

= +
= +
5,30 6888222576 ,09 2400234147 * 1 273922,7 * 0
7907520 273922,7 * 1 0 42
b b
b b

=
=
20 , 28 1
474 , 4325 0
b
b
18

Judet Locuint
e (y)
Suprafata
locuibila (x2)
xi
2
xi*yi
i
y
i -

i
( yi -
i)
2

Xi -
X
i
-

(X
i
-X
i
-
)
2

Bihor 226836 8025,9 6441507
0,81
1820563
052,40
23068
7,96
-
3851,9
6
1483757
7,35
1503
,93
226180
8,31
Bistrita-Nasaud 100206 3943,4 1555040
3,56
3951523
40,40
11554
5,13
-
15339,
13
2352888
35,53
-
2578
,57
664901
8,33
Cluj 264498 9209,2 8480936
4,64
2435814
981,60
26406
1,75
436,25 190313,
36
2687
,23
722121
0,19
Maramures 176479 6163 3798256
9,00
1087640
077,00
17814
6,73
-
1667,7
3
2781310
,01
-
358,
97
128858
,78
Satu Mare 135340 4936,6 2437001
9,56
6681194
44,00
14355
7,34
-
8217,3
4
6752468
3,25
-
1585
,37
251339
5,02
Salaj 96467 3456,7 1194877
4,89
3334574
78,90
10181
8,24
-
5351,2
4
2863577
8,10
-
3065
,27
939587
4,33
Alba 139529 4938,9 2439273
3,21
6891197
78,10
14362
2,21
-
4093,2
1
1675436
4,83
-
1583
,07
250610
7,61
Brasov 214611 7710 5944410
0,00
1654650
810,00
22177
8,31
-
7167,3
1
5137038
9,97
1188
,03
141141
7,54
Covasna 83960 2907,3 8452393
,29
2440969
08,00
86322
,96
-
2362,9
6
5583595
,08
-
3614
,67
130658
32,32
Harghita 123417 4264,4 1818510
7,36
5262994
54,80
12459
8,61
-
1181,6
1
1396205
,97
-
2257
,57
509661
8,00
Mures 213935 7475,4 5588160
5,16
1599249
699,00
21516
1,66
-
1226,6
6
1504683
,96
953,
43
909030
,58
Sibiu 153950 5900,5 3481590
0,25
9083819
75,00
17074
3,18
-
16793,
18
2820107
60,17
-
621,
47
386223
,78
Bacau 246592 8413,1 7078025
1,61
2074603
155,20
24160
8,55
4983,4
5
2483480
9,78
1891
,13
357637
6,28
Botosani 162052 4751,4 2257580
1,96
7699738
72,80
13833
3,96
23718,
04
5625454
40,42
-
1770
,57
313491
4,75
Iasi 257680 8095,2 6553226
3,04
2085971
136,00
23264
2,49
25037,
51
6268766
66,64
1573
,23
247505
5,63
Neamt 194479 6440,1 4147488
8,01
1252464
207,90
18596
2,05
8516,9
5
7253836
2,35
-
81,8
7
6702,5
4
Suceava 227971 7782,8 6057197
5,84
1774252
698,80
22383
1,57
4139,4
3
1713492
0,46
1260
,83
158969
4,69
Vaslui 155775 4696,5 2205711
2,25
7315972
87,50
13678
5,56
18989,
44
3605988
31,51
-
1825
,47
333233
7,24
Braila 130594 4549,9 2070159
0,01
5941896
40,60
13265
0,85
-
2056,8
5
4230646
,73
-
1972
,07
388905
6,33
Buzau 184272 6159,9 3794436
8,01
1135097
092,80
17805
9,29
6212,7
1
3859772
0,81
-
362,
07
131094
,00
Constanta 238542 8688,4 7548829
4,56
2072548
312,80
24937
3,11
-
10831,
11
1173128
91,84
2166
,43
469342
3,07
Galati 208986 7289,3 5313389
4,49
1523361
649,80
20991
2,89
-926,89 859127,
30
767,
33
588796
,79
Tulcea 91362 3280,1 1075905
6,01
2996764
96,20
96837
,41
-
5475,4
1
2998016
2,85
-
3241
,87
105097
14,92
Vrancea 141011 5000,9 2500900
0,81
7051819
09,90
14537
0,86
-
4359,8
1900835
8,29
-
1521
231365
1,05
19

6 ,07
Arges 252416 8094,6 6552254
9,16
2043206
553,60
23262
5,57
19790,
43
3916610
24,59
1572
,63
247316
8,11
Calarasi 112552 3787,4 1434439
8,76
4262794
44,80
11114
5,30
1406,7
0
1978794
,76
-
2734
,57
747786
7,88
Dambovita 190103 6344,2 4024887
3,64
1206051
452,60
18325
7,29
6845,7
1
4686373
4,45
-
177,
77
31601,
83
Giurgiu 108545 3913,5 1531548
2,25
4247908
57,50
11470
1,83
-
6156,8
3
3790653
1,02
-
2608
,47
680411
0,77
Ialomita 103504 3479 1210344
1,00
3600904
16,00
10244
7,19
1056,8
1
1116847
,38
-
3042
,97
925966
0,62
Prahova 297687 10439,6 1089852
48,16
3107733
205,20
29876
3,95
-
1076,9
5
1159826
,47
3917
,63
153478
32,28
Teleorman 167610 5293,5 2802114
2,25
8872435
35,00
15362
3,35
13986,
65
1956264
34,17
-
1228
,47
150913
6,20
Ilfov 93366 3723,5 1386445
2,25
3476483
01,00
10934
3,07
-
15977,
07
2552667
01,88
-
2798
,47
783142
9,01
Municipiul
Bucuresti
783229 27496,2 7560410
14,44
2153582
1229,80
77982
8,30
3400,7
0
1156476
8,65
2097
4,23
439918
364,04
Dolj 263163 9375,8 8790562
5,64
2467363
655,40
26876
0,54
-
5597,5
4
3133242
2,71
2853
,83
814435
1,10
Gorj 143458 4587,2 2104240
3,84
6580705
37,60
13370
2,86
9755,1
4
9516270
1,79
-
1934
,77
374333
1,27
Mehedinti 125467 4087,3 1670602
1,29
5128212
69,10
11960
3,68
5863,3
2
3437848
3,90
-
2434
,67
592761
3,37
Olt 180366 5863,1 3437594
1,61
1057503
894,60
16968
8,35
10677,
65
1140122
86,40
-
658,
87
434108
,42
Valcea 164211 5006,5 2506504
2,25
8221223
71,50
14552
8,80
18682,
20
3490245
96,84
-
1515
,47
229664
6,43
Arad 180335 7543,9 5691042
7,21
1360429
206,50
21709
3,63
-
36758,
63
1351196
850,07
1021
,93
104434
2,87
Caras-Severin 128748 4727,1 2234547
4,41
6086046
70,80
13764
8,60
-
8900,6
0
7922072
3,08
-
1794
,87
322155
4,90
Hunedoara 191956 6329,8 4006636
8,04
1215043
088,80
18285
1,15
9104,8
5
8289823
5,25
-
192,
17
36928,
94
Timis 252260 9751,6 9509370
2,56
2459938
616,00
27935
9,60
-
27099,
60
7343883
41,84
3229
,63
104305
16,09
TOTAL 7907520 273922,7 2400234
147,09
6888222
5765,30
79073
85,74
6397155
741,84
613718
776,25

=>
i i
x y 204 , 28 474 , 4325 + =


Coeficientul de regresie b
1
, reprezentand panta liniei drepte,are valoarea 28,204.
b1> 0, deci intre suprafata locuibila si locuinte exista o legatura directa.

-Estimarea parametrilor prin interval de incredere pentru un nivel de semnificatie de 5%

Intervalul de incredere pentru
0
este:
b
0
-z
,n-2
*Sb
0
<
0
<b
0
+ z
,n-2
*Sb
0
,unde:
20

-
( )

=
2
2
x x n
x
s Sbo
i
i
e



-


Se==159928879,1
Sb
0
=

= 48779308,12
z
/2,n-2
=1,96 => 4325,474-1,96*48779308,12 <
0
<4325,474+1,96*48779308,12 =>
-3473,964<
0
<12124,914
Intervalul de incredere pentru 1 este:
b
1
-z
,n-2
*Sb
1
<
1
<b
1
+ z
,n-2
*Sb
1
,unde:
-
( )

=

=
n
i
i
e
x x
s
Sb
1
2
1


-

Se==159928879,1
Sb
1
=

=6455,67
z
/2,n-2
=1,96 => 28,204-1,96*6455,67<
1
<28,204+1,96*6455,67=>
27,172<
1
<29,236

d) testarea semnificaiei corelaiei si a parametrilor modelului de regresie;
- testarea semnificaiei corelaiei
- testarea parametrilor modelului de regresie simpla liniara

Testarea semnificatiei corelatiei se realizeaz prin testarea celor doi indicatori cantitativi ai
intensittii legturii dintre cele dou variabile : raportul si coeficientul de corelatie.
Testarea semnificatiei raportului de corelatie R
Calcularea raportului de corelatie presupune folosirea urmtoarei relatii:
( )
2

2
1
2
2

A
=

=
n
y y
n
s
n
i
i i
e
e
( )
2

2
1
2
2

A
=

=
n
y y
n
s
n
i
i i
e
e
21

( )
( )
0.993

1
2
1
2
=

=
=
n
i
i
n
i
i
y y
y y
R

Pentru testarea semnificatiei raportului de corelatie se utilizeaz testul Fisher, iar pentru un nivel de
semnificatie =5% ( =0,05), testarea se realizeaz astfel:

0 :
0
= R H
(raportul de corelatie nu este semnificativ statistic)

0 :
1
= R H
(raportul de corelatie este semnificativ statistic)
Pentru n =42, k =1 rezult:
92 , 3036
1
1 1 42
*
987 . 0 1
987 , 0 1
*
1
2
2
=

=
k
k n
R
R
F
calculat

Pentru =0,05, k=1 si n =42, rezult:
4
1 ; ;
= =
k n k
F Fcritic
o

Deoarece ( ) 4 ) 3036,92 ( Fcritic F
calculat
> , rezult c se respinge H
0
, deci se accept H
1
, ceea ce
nseamna ca raportul de corelatie al colectivitatii din care s-a extras esantionul de 42 judete, difera
semnificativ de zero, deci este semnificativ statistic.

Testarea semnificatiei coeficientului de corelatie r
Coeficientului de corelatie se poate determina prin mai multe moduri, avnd mai multe formule de
calcul. Pentru c ntre locuinte si camerele de locuit exist o legtur liniar.
Raportul de corelatie si coeficientul de corelatie au aceeasi valoare, si anume R = r = 0,993
(legtur liniar, deoarece conform corelogramei, valorile camerelor de locuit sunt mprstiate de o parte
si de alta a dreptei, iar panta este pozitiv).
Pentru testarea semnificatiei coeficientului de corelatie se utilizeaz testul Student, iar pentru un
nivel de semnificatie =0,05, testarea se realizeaz astfel:

0 :
0
= r H
(coeficientul de corelatie nu este semnificativ statistic)

0 :
1
= r H
(coeficientul de corelatie este semnificativ statistic)
Pentru n =42, k =1 rezult:
142 , 897
) 993 . 0 1 (
) 1 1 42 ( 993 . 0
1
2
2
=

=
r
n r
z
calculat

Pentru =0,05, k=1 si n =42, rezult:
96 , 1
1 ;
2
= =

k n
critic
t z


Deoarece ( ) ( ) 96 , 1 879,142
critic calculat
z z > H
0
se respinge, deci H
1
este adevarata, prin urmare
coeficientul de corelatie al colectivitatii din care s-a extras esantionul de 42 judete, difera semnificativ de
zero, deci este semnificativ statistic.

Testarea parametrilor modelului de regresie simpla liniara
Testarea seminificatiei parametrului
0

H0 :
0
= 0 (parametrul
0
nu este semnificativ statistic)
H1 :
0
= 0 (parametrul
0
este semnificativ statistic)
22

Pentru testare se utilizeaza testul Student, pentru un nivel de semnificatie =0,05, k=1 si n =42,
testarea este:
000086 , 0
12 , 48779308
474 , 4325
0
0
= = =
b
calculat
S
b
z
96 , 1
1 ;
2
= =

k n
critic
t z

Deoarece
calculat critic
z z > rezulta ca H0 se accepta , ceea ce nsemna ca H1 se respinge, deci o
nu este semnificativ diferit de zero (
0
este semnificativ statistic). Pentru o probabilitate de 0.95 este
foarte probabil ca estimatorul b
0
s provin dintr-o populatie cu
0
diferit de 0.
Testarea seminificatiei parametrului
1

H0 :
1
= 0 (parametrul
1
nu este semnificativ statistic)
H1 :
1
= 0 (parametrul
1
este semnificativ statistic)
Pentru testare se utilizeaza testul Student, pentru un nivel de semnificatie =0,05, k=1 si n =42, testarea
este:
1 , 4
1 , 0
41 , 0
1
1
= = =
b
calculat
S
b
z
96 , 1
1 ;
2
= =

k n
critic
z z

Deoarece
critic calculat
z z > rezulta ca H
0
se respinge , ceea ce nsemna ca H
1
se accepta, deci o
este semnificativ diferit de zero (
1
este semnificativ statistic). Pentru o probabilitate de 0.95 este foarte
probabil ca estimatorul b
1
s provin dintr-o populatie cu
1
diferit de 0.

e) aplicarea analizei de tip ANOVA si interpretarea rezultatelor

SUMMARY OUTPUT


Regression Statistics
Multiple R 0,993512037
R Square 0,987066167
Adjusted R Square 0,986742821
Standard Error 12646,29903
Observations 42

R= 0.993 arata ca intre locuinte si camerele de locuit exista o legatura puternica.
R
2
=0,987.
Abaterea medie patratica a erorilor Se=12646,29. In cazul in care acest indicator este zero
inseamna ca toate punctele sunt pe dreapta de regresie.

ANOVA

Df SS MS F Significance F
Regression 1 488209147365,27 488209147365,27 3052,664097 2,16487E-39
Residual 40 6397155165 159928879,1

Total 41 494606302530,57

23

Interpretarea rezultatelor analizei de tip ANOVA:

df = Degree of freedom- gradele de libretate
k=1
n-k-1=42-1-1=40
n-1=42-1=41

Sum of squares- suma ptratelor
SSR=
( ) 65,27 4882091473
1
2
2
/
= = A

=
n
i
i x y
y y

SSE=
( ) 6397155165
1
2 2
= = A

=
n
i
i i e
y y

SST= ( ) 30,57 4946063025
1
2
2
= = A

=
n
i
i y
y y

Media ptratelor sau dispersia corectat

MS=SS/df
65,27 4882091473
2
/
2
/
=
A
=
k
s
x y
x y

125 159928879,
1
2
2
=

A
=
k n
s
e
e



Significance F=0,00001 < pragul de semnificatie =0,05 rezult c modelul este valid si
poate fi utilizat pentru analiza dependentei dintre cele dou variabile.

Coefficients
Standard
Error
t Stat P-value Lower 95% Upper 95%
Intercept 4325,474991 3859,054405 1,120863957 0,269030238 -3473,9649 12124,9149
Suprafata locuibila
(x2)
28,20448999 0,510480012 55,25091942 2,16487E-39 27,1727714 29,2362086

Intercept este termenul liber, deci coeficientul b0 este 4325,474. Termenul liber este
punctul in care variabila explicativa (factoriala) este 0. Deoarece t
b0
= 1,12 iar pragul de
semnificaie P-value este 0.26>0.05. De altfel intervalul de incredere este -
3473,9649<
0
<12124,9149.
Coeficientul b1 este 28,204. Deoarece t
b1
= 55,25 iar pragul de semnificatie P-value este
2,16>0.05 inseamna ca acest coeficient este nesemnificativ statistic. Intervalul de incredere
pentru acest parametru este 27,172< 1<29,236.


f) testarea ipotezelor clasice asupra modelului de regresie simpla;
- ipoteze statistice clasice supra modelului de regresie simpla
- testarea liniaritii modelului propus
- testarea normalitii erorilor
- testarea ipotezei de homoscedasticitate
- testarea ipotezei de autocorelare a erorilor

24


1. Ipoteze statistice clasice asupra modelului de regresie simpl

Ipoteza 1 : Forma funcional.
i i i i i
y x y c c | | + = + + =
1 0



Ipoteza 2 : Media erorilor este 0.
0 = c


Ipoteza 3 : Homoscedasticitatea: dispersia reziduurilor n populaie este constant pentru
toate valorile
i
x
.
n i , 1 cst
2
= =
c
o


Ipoteza 4 : Non-autocorelarea erorilor (deviaiile observaiilor de la valorile lor ateptate
sunt necorelate)
j i Cov
j i
= = 0 ) , ( c c


Ipoteza 5 : Necorelare ntre regresor i erori
j i x Cov
j i
si 0 ) , ( = c


Ipoteza 6 : Variabila aleatoare este normal distribuit
) , 0 ( ~
2
o c N
i


2. Testarea liniarittii modelului propus

H
0
: modelul nu este valid;
2
/ x y
s =
2
e
s
H
1
: modelul este valid;
2
/ x y
s =
2
e
s
F
calculat
=
2
/ x y
s /
2
e
s = 3036,92
F
critic
= F
1 , , k n k
= 4
Deoarece F
calculat
(3036,92) >
1 ; ; k n k
F
o
(4) H
0
se respinge, deci H
1
este adevarata; cu o
probabilitate de 95% putem aprecia ca exista suficiente dovezi pentru a spune ca modelul este valid,
rezultand faptul ca modelul este liniar.

3. Testarea normalitii erorilor
Pentru testarea normalittii erorilor utilizm testul Jarque-Bera, a crui valoare o
determinm cu ajutorul Eviews.
Verificarea ipotezei de normalitate a erorilor se va realiza cu ajutorul testului Jarque-
Berra, care este i el un test asimptotic (valabil n cazul unui eantion de volum mare), ce
urmeaz o distribuie hi ptrat cu un numr al gradelor de libertate egal cu 1, avnd urmtoarea
form:
Dac probabilitatea p(JB) corespunztoare valorii calculate a testului este suficient de
sczut, atunci ipoteza de normalitate a erorilor este respins, n timp ce, n caz contrar, pentru
25

un nivel suficient de ridicat al probabilitii ipoteza de normalitate a erorilor este acceptat, sau
dac jB
>
k ,
2
, atunci ipoteza de normalitate a erorilor este respins.



H
0
: erorile nu sunt normal distribuite
H
1
: erorile sunt normal distribuite
jB
calculat
=
(


+
24
) 3 (
6
*
2 2
k S
n
=42*
(


+
24
) 3 1 (
6
130 , 0
2
=8,022
jB
tabelar
= = k ,
2
5,99
Deoarece jB
calculat
> jB
critic
rezult ca se accept ipoteza conform creia pentru o probabilitate
de 0.95,erorile sunt normal distribuite.

4. Testarea ipotezei de homoscedasticitate
Verificarea ipotezei de homoscedasticitate a erorilor n cazul acestui model se va realiza
cu ajutorul testului White.

26


1.Folosind testul Fisher:
H
0
: modelul este homoscedastic
H
1
: modelul este heteroscedastic
F
calculat
= F-statistic = 1,008
F
critic
= F
1 , , k n k
= 4
Deoarece F
calculat
< F
1 , , k n k
rezult c pentru o probabilitate de 95% exist suficiente
dovezi pentru a accepta ipoteza conform creia modelul este homoscedastic.
2. Utilizand testul LM
H
0
: Modelul este homoscedastic
H
1
: Modelul este heteroscedastic
LM = n* R-squared = 42*0.0004= 0,016
= k ,
2
5,99
Comparand valorile observam ca LM<5,99 ceea ce inseamna ca se accepta ipoteza nula,
si se respinge H
1
,astfel modelul este homoscedastic.

5. Testarea ipotezei de autocorelare a erorilor
Se realizeaz prin intermediul testului Durbin-Watson.
27

In analiza autocorelarii variabilelor reziduale testul cel mai utilizat este testul Durbin-
Watson.



In analiza autocorelarii variabilelor reziduale testul cel mai utilizat este testul Durbin-
Watson.
Ipotezele testului:
1. H
0
: =0, deci nu exista autocorelare la nivelul seriei reziduurilor
2. H
1
: 0, exista autocorelare
3. Din figura prezentata mai sus observam ca Eviews a calculat implicit si statistica
Durbin Watson:
Durbin Watson stat = 1,806
Valorile critice ale statisticii depind de numarul de variabile factor din cadrul modelului
(1), de numarul de observatii (42) si de pragul de semnificatie ales (0.05).
Tabelele de valori critice cuprind pentru elementele specificate cate o pereche de valori
d1 si d2, unde d1=0.6 si d2=1.93.
Observam ca DW stat apartine intervalului (d2, 4-d2), motiv pentru care putem afirma ca
nu exista autocorelare a erorilor, deci se accepta ipoteza H
0
.

g) previziunea valorii variabilei Y daca variabila X creste cu 10% fata de ultima valoare
nregistrata (inclusiv interval de incredere)

n+1
=b
0
+b
1
*X
n+1

X
n+1
=X
n
+10%* X
n
=1.1* X
n
=1.1*9751,6=10726,76

28

n+1
= 4325,474+28,204*10726,76=306863,013

Interval de incredere:

=>



=>
























( )
( )

=
+
+

+ +
n
i
i
n
e k n n
x x
x x
n
s z y
1
2
2
1
1 , 2 / 1
1
1 * *
o
25 , 613718776
9 , 17680258
42
1
1 546 , 159928893 * 96 , 1
1
+ +
+ n
y
13 , 321297147
1

+ n
y
29

Problema B
- Realizarea i interpretarea regresiei multifactoriale:
( )
i i i
x x f y
2 1
, =
- Locuinte = f (Camere de locuit, Suprafata locuibila)


Tabel cu valorile de intrare
Judet Locuite (y) Camere de locuit (x1) Suprafata locuibila (x2)
Bihor 226836 527894 8025,9
Bistrita-Nasaud 100206 241268 3943,4
Cluj 264498 593554 9209,2
Maramures 176479 391905 6163
Satu Mare 135340 312296 4936,6
Salaj 96467 221069 3456,7
Alba 139529 321599 4938,9
Brasov 214611 493380 7710
Covasna 83960 180677 2907,3
Harghita 123417 257795 4264,4
Mures 213935 476004 7475,4
Sibiu 153950 367416 5900,5
Bacau 246592 610333 8413,1
Botosani 162052 365628 4751,4
Iasi 257680 604746 8095,2
Neamt 194479 475935 6440,1
Suceava 227971 532560 7782,8
Vaslui 155775 363466 4696,5
Braila 130594 358905 4549,9
Buzau 184272 509412 6159,9
Constanta 238542 653636 8688,4
Galati 208986 551458 7289,3
Tulcea 91362 267399 3280,1
Vrancea 141011 384137 5000,9
Arges 252416 622404 8094,6
Calarasi 112552 327160 3787,4
Dambovita 190103 503818 6344,2
Giurgiu 108545 332400 3913,5
Ialomita 103504 290797 3479
Prahova 297687 805117 10439,6
Teleorman 167610 465722 5293,5
Ilfov 93366 286528 3723,5
Municipiul Bucuresti 783229 1878733 27496,2
Dolj 263163 727148 9375,8
Gorj 143458 368788 4587,2
Mehedinti 125467 315735 4087,3
30

Olt 180366 493135 5863,1
Valcea 164211 410407 5006,5
Arad 180335 449517 7543,9
Caras-Severin 128748 315843 4727,1
Hunedoara 191956 429114 6329,8
Timis 252260 604605 9751,6

a) prezentarea problemei (inclusiv descrierea naturii legaturii dintre cele doua variabile,
conform teoriei economice)
n tabelul de mai sus sunt nscrise date statistice referitoare la locuinte, camerele de locuit
si suprafata locuibila din cele 42 judete ale Romaniei.
Acesta este un model multifactorial liniar deoarece y, fiind corelat liniar cu x
1
si x
2
, se
deduce uor c va fi corelat liniar i n raport cu cei doi factori.
Pornind de la aceste date vom ncerca s artm influena variabilelor independente
Camere de locuit (X
1
) si Suprafata locuibila (X
2
) asupra variabilei dependente, Locuinte(Y) i
anume, conform Locuinte= f(Camere de locuit, Suprafata locuibila).

b) definirea modelului de regresie multipla liniara;
- forma, variabilele si parametrii modelului de regresie
- reprezentarea grafica a modelului legturii dintre variabile

Pentru aceasta, considerm ecuaia de regresie de forma:
Y = 0 + 1*X
1
+2*X
2
+
-Y=variabila dependent/endogena/rezultativa;
-X
1
, X
2
= variabile independente/factor/exogene
-
0
=
constanta modelului( termenul liber, C din Eviews);
- 1, 2 =coeficientii variabilelor independente;
-
=
termenul de eroare al ecuatiei



















31



Legatura Camere de locuit- Locuinte


Intre cele 2 variabile se manifesta o legatura liniara simpla, directa deoarece punctele
sunt concentrate in jurul diagonalei principale.

Legatura Suprafata locuibila- Locuinte

Intre cele 2 variabile se manifesta o legatura liniara simpla, directa deoarece punctele
sunt concentrate in jurul diagonalei principale.


c) estimarea parametrilor modelului si interpretarea acestora;
- estimarea punctuala a parametrilor
- estimarea parametrilor prin interval de ncredere

In urma prelucrarii datelor in Eviews obtinem:
y = 0,4109x - 4373,8
R = 0,9789
0
100000
200000
300000
400000
500000
600000
700000
800000
900000
0 500000 1000000 1500000 2000000
L
o
c
u
i
n
t
e

Camere de locuit
Evolutia locuintelor in functie de camerele de locuit in
anul 2000
y = 28,204x + 4325,5
R = 0,9871
0
100000
200000
300000
400000
500000
600000
700000
800000
900000
0 5000 10000 15000 20000 25000 30000
L
o
c
u
i
n
t
e

Suprafata locuibila
Evolutia locuintelor in functie de suprafata locuibila in
anul 2000
32



La nivelul esantionului,modelul liniar de regresie multifactoriala se scrie:
y
i
= b
0
+ b
1
*

x
1i
+ b
2
* x
2i
+ e
i


Iar componeta predictibila este
i
= b
0
+b
1
*xi
1
+b
2
*x
i2



Sistemul de ecuatii va fi:

{



{





Coeficientul b
1
este 0,153.
Coeficientul b
2
este 17,883

33

- Intervalul de incredere pentru
0
este:
b
0
-z
/2,n-3
*S
b0
<
0
<b
0
+ z
/2,n-3
*S
b0 ,
unde:
-b
0
= -294,484
- S
b0
=3361,096
-z
/2,n-3
=1,96
=> -294,484-1,96*3361,096<
0
< -294,484+1,96*3361,096
=>-7092,941<
0
< 6503,972

- Intervalul de incredere pentru
1
este:
b
1
-z
/2,n-3
*S
b1
<
1
<b
1
+ z
/2,n-3
*S
b1
,unde:
-b
1
= 0,153
- S
b1
= 0,034
-z
/2,n-3
=1,96
=> 0,153-1,96*0,034<
1
< 0,153+1,96*0,034
=>0,083<
1
<0,223

- Intervalul de incredere pentru
2
este:
b
2
-z
/2,n-3
*S
b2
<
2
<b
2
+ z
/2,n-3
*S
b2
,unde:
-b
2
= 17,883
- S
b2
= 2,38
-z
/2,n-3
=1,96
=> 17,883-1,96*2,38<
2
< 17,883+1,96*2,38
=>13,069<
2
<22,698

d) testarea semnificaiei corelaiei si a parametrilor modelului de regresie;
- testarea semnificaiei corelaiei
- testarea parametrilor modelului de regresie multipla liniara

Testarea semnificaiei raportului de corelaie R pentru =5%
Testarea semnificaiei raportului de corelaie (R) se efectueaz utiliznd statistica F
(Fisher)
1.se stabileste ipoteza nula H
0
: R=0 (nu este semnificativ statistic)
2.se stabileste ipoteza alternativa H
1
: R0 (este semnificativ statistic)
3.se calculeaza testul F:

F
calc
=2238,722
F
,k,n-k-1
=4


F
calc
>F
,k,n-k-1
=> pentru o probabilitate de 95% avem suficiente dovezi pentru a accepta
ipoteza H
1
care afirma ca R este semnificativ statistic







2
2
1
1
R
R
k
k n
F
calc


=
34

e) aplicarea analizei de tip ANOVA si interpretarea rezultatelor
SUMMARY OUTPUT


Regression Statistics
Multiple R 0,995673082
R Square 0,991364886
Adjusted R Square 0,99092206
Standard Error 10464,81494
Observations 42

R=0.9956 arata ca intre locuinte si cele 2 variabile luate in studiu (camere de locuit,
suprafata locuiibila) exista o legatura puternica
R
2
=0.9913 arata ca 99.13% din variatia locuintelor este explicata de influenta celor 2
variabile(camere de locuit, suprafata lociuibila).
Abaterea medie patratica a erorilor S
e
=10464,8149.In cazul in care acest indicator este
zero, inseamana ca toate punctele se afla pe dreapta de regresie

ANOVA

df SS MS F
Significance
F
Regression 2 490335320817,20 245167660408,60 2238,722 5,71778E-41
Residual 39 4270981713 109512351,6

Total 41 494606302530,57

df - gradele de libretate
k=2
n-k-1=42-2-1=39
n-1=42-1=41

Sum of squares- suma ptratelor
SSR=
( ) 20 , 17 4903353208
1
2
2
/
= = A

=
n
i
i x y
y y

SSE=
( ) 4270981713
1
2 2
= = A

=
n
i
i i e
y y

SST= ( ) 57 , 30 4946063025
1
2
2
= = A

=
n
i
i y
y y

Media ptratelor sau dispersia corectat

MS=SS/df
60 , 08 2451676604
2
/
2
/
=
A
=
k
s
x y
x y

6 , 109512351
1
2
2
=

A
=
k n
s
e
e


35

In acest tabel este calculat testul F pentru validarea modelului de regresie. Intrucat
F=2238,722, iar Significance F (pragul de semnificatie) este 0.0001 (valoare mai mica de 0.05)
atunci modelul de regresie construit este valid si poate fi utilizat pentru analiza dependentei
dintre cele patru variabile.

Coefficients
Standard
Error t Stat P-value Lower 95% Upper 95%
Intercept
-
294,4845291 3361,095514 -0,087615638 0,93063051
-
7092,941906 6503,972848
Camere de locuit
(x1) 0,153435728 0,034822401 4,406236392 0,000079823 0,083000775 0,223870682
Suprafata
locuibila (x2) 17,88396624 2,380040603 7,514143339 0,000000004 13,06987973 22,69805276

Intercept este termenul liber,deci coeficientul b
0
este -294,484.Termenul liber este punctul
in care toate variabilele explicative sunt 0.Deoarece t
b0
= -0,0876, iar pragul de semnificatie P-
value este 0.93>0.05,inseamna ca acest coeficient este nesemnificativ statistic.
Coeficientul b
1
este 0,153. Deoarece t
b1
= 4,406 iar pragul de semnificatie P-value este
0,000079<0,05 inseamna ca acest coeficient este nesemnificativ. Intervalului de incredere este
-0,083 <
1
<0,223.
Coeficientul b
2
este 17,883. Deoarece t
b2
=7,514, iar pragul de semnificatie P-value este
0.0000000004<0.05 inseamna ca acest coeficient este semnificativ. Intervalul de incredere
pentru acest parametru este 13,069<
2
<22,698.

f) testarea ipotezelor clasice asupra modelului de regresie multipla;
- ipoteze statistice clasice supra modelului de regresie multipla
- testarea liniaritii modelului propus
- testarea normalitii erorilor
- testarea ipotezei de homoscedasticitate
- testarea ipotezei de autocorelare a erorilor

1. Ipoteze statistice clasice asupra modelului de regresie multipla

Ipoteza 1 : Forma funcionala.
i i i i i i
y x x y c c | | | + = + + + =
2 2 1 1 0


Ipoteza 2 : Media erorilor este 0.
0 = c


Ipoteza 3 : Homoscedasticitatea: dispersia reziduurilor in populatie este constanta pentru
toate valorile
i
x
.
n i , 1 cst
2
= =
c
o


Ipoteza 4 : Non-autocorelarea erorilor (deviatiile observatiilor de la valorile lor asteptate
sunt necorelate)
j i Cov
j i
= = 0 ) , ( c c


Ipoteza 5 : Necorelare intre regresor si erori
j i x Cov
j i
si 0 ) , ( = c

36


Ipoteza 6 : Variabila aleatoare este normal distribuita
) , 0 ( ~
2
o c N
i


2. Testarea liniarittii modelului propus

H
0
: modelul nu este valid;
2
/ x y
s =
2
e
s
H
1
: modelul este valid;
2
/ x y
s =
2
e
s
F
calculat
=
2
/ x y
s /
2
e
s = 109512351,6
F
critic
= F
1 , , k n k
= 4
Deoarece F
calculat
(109512351,6) >
1 ; ; k n k
F
o
(2,0227) H
0
se respinge, deci H
1
este adevarata;
cu o probabilitate de 95% putem aprecia ca exista suficiente dovezi pentru a spune ca modelul este valid,
rezultand faptul ca modelul este liniar.

3. Testarea normalitii erorilor



H
0
: erorile nu sunt normal distribuite
H
1
: erorile sunt normal distribuite
jB
calculat
=
(


+
24
) 3 (
6
*
2 2
k S
n
=42*
(


+
24
) 3 1 (
6
007 , 0
2
=7,182
37

jB
tabelar
= = k ,
2
5,99
Deoarece jB
calculat
> jB
critic
rezulta ca se accept ipoteza conform careia pentru o probabilitate
de 0.95,erorile sunt normal distribuite.


4.Testarea ipoteza privind homoscedasticitatea erorilor
Testul WHITE:
Pentru testarea homoscedasticitatii am aplicat in Eviews testul White (Cross Terms) dupa cum putem
observa in figura de mai jos:


1.Folosind testul Fisher:
H
0
: modelul este homoscedastic
H
1
: modelul este heteroscedastic
F
calculat
= F-statistic = 0,634
F
critic
= F
1 , , k n k
= 4
38

Deoarece F
calculat
< F
1 , , k n k
rezulta ca pentru o probabilitate de 95% exista suficiente
dovezi pentru a accepta ipoteza conform careia modelul este homoscedastic.

2. Utilizand testul LM
H
0
: Modelul este homoscedastic
H
1
: Modelul este heteroscedastic
LM = n* R-squared = 42*0.081= 3,40
= k ,
2
5,99
Comparand valorile observam ca LM<5,99 ceea ce inseamna ca se accepta ipoteza nula,
si se respinge H
1
,astfel modelul nu este heteroscedastic.

5.Testarea ipotezei privind autocorelarea erorilor


In analiza autocorelarii variabilelor reziduale testul cel mai utilizat este testul Durbin-
Watson.
Ipotezele testului:
1. H
0
: =0, deci nu exista autocorelare la nivelul seriei reziduurilor
2. H
1
: 0, exista autocorelare
3. Din figura prezentata mai sus observam ca Eviews a calculat implicit si statistica
Durbin Watson:
Durbin Watson stat = 1,826
Valorile critice ale statisticii depind de numarul de variabile factor din cadrul modelului
(2), de numarul de observatii (42) si de pragul de semnificatie ales (0.05).
39

Tabelele de valori critice cuprind pentru elementele specificate cate o pereche de valori
d1 si d2, unde d1=0.6 si d2=1.93.
Observam ca DW stat apartine intervalului (d2, 4-d2), motiv pentru care putem afirma ca
nu exista autocorelare a erorilor, deci se accepta ipoteza H
0
.

g) previziunea valorii variabilei Y daca variabila X
1
, X
2
si X
3
creste cu 10% fata de
ultima valoare inregistrata.

n+1
= b
0
+ b
1
*

X
1n+1
+ b
2
* X
n2



X
1n+1
=X
1n
+10%* X
1n
=1.1* X
1n
=1.1*604605= 665065,5
X
2n+1
=X
2n
+10%* X
2n
=1.1* X
2n
=1.1*9751,6= 10726,76

n+1
= 2092.14+(-8.546)*415.89+2.375*1887.644 +0.0015*447210.5 = 3691.914






































40

Problema C



Cazul I
H
0
:
1
2
=
2
2

H
1
:
1
2

2
2

F-Test Two-Sample for Variances


Variable 1 Variable 2
Mean 468796,2619 188274,2857
Variance 69925708109 12063568354
Observations 42 42
Df 41 41
F 5,796436515

P(F<=f) one-tail 6,2671E-08

F Critical one-tail 1,681644228

F
calculat
> F
critic
=> respingem H
0
si acceptam H
1



Cazul II
H
0
:
1
2
=
2
2

H
1
:
1
2

2
2

F-Test Two-Sample for Variances


Variable 1 Variable 2
Mean 188274,2857 6521,969048
Variance 12063568354 14968750,64
Observations 42 42
Df 41 41
F 805,9168493

P(F<=f) one-tail 3,42056E-49

F Critical one-tail 1,681644228

F
calculat
> F
critic
=> respingem H
0
si acceptam H
1