Sunteți pe pagina 1din 47

Academia de Studii Economice Bucureti

Proiect econometrie

Problema A

nregistrai pentru 42 de uniti (judee), valorile specifice ale unei perechi de


caracteristici (X i Y) ntre care exist o legtur logic. Datele prezentate sub forma tabelar fac
parte din lucrare.
1.

Prezentarea problemei (inclusiv descrierea naturii legturii dintre cele dou


variabile, conform teoriei economice)

Se presupune c n cadrul prosului intern brut (PIB), ntre veniturile totale ale
gospodriilor i cheltuielile totale ale acestora exist o dependen. Pentru a se verifica aceast
ipotez se nregistreaz urmtoarele date privind veniturile totale ale gospodriilor i cheltuielile
totale ale acestora n anul 2005 pentru cele 42 de uniti teritoriale (judee) ale rii:

Nr.cr
t.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31

Cheltuieli
totale
gospodarii

Judet

Microregiunea
1
Nord Vest

Microregiunea
1
Centru

Microregiunea
2
Nord Est

Microregiunea
2
Sud Est

Microregiunea
3
Sud Muntenia

BH
BN
CJ
MM
SM
SJ
AB
BV
CV
HR
MS
SB
BC
BT
IS
NT
SV
VS
BR
BZ
CT
GL
TL
VN
AG
CL
DB
GR
IL
PH
TR

586.50
247.20
660.40
392.30
284.90
203.30
324.40
558.70
181.60
295.80
463.70
412.90
576.90
344.80
630.70
414.40
545.70
327.30
271.90
414.70
758.40
493.30
212.30
353.50
534.40
204.30
371.70
180.70
194.20
646.10
298.70

Venituri
totale
gospodarii
567.90
239.60
615.40
385.40
278.70
197.30
319.10
549.40
174.50
276.20
456.60
400.80
560.60
340.00
610.30
402.60
541.20
323.50
262.90
412.20
693.90
489.90
198.80
350.70
527.10
197.90
368.50
177.10
186.60
633.10
295.80

Numarul
mediu al
salariatilor de
sex masculin
76
28
89
49
35
21
44
84
24
28
65
54
63
26
81
46
52
28
34
44
99
70
23
26
74
23
45
18
23
96
31

32
33
34
35
36
37
38
39
40
41
42

Microregiunea
3
Bucuresti Ilfov
Microregiunea
4
SudVest
Oltenia
Microregiunea
4
Vest

3155.10

2937.70

408

IF

333.40

295.10

39

DJ
GJ
MH
OT
VL
AR
CS
HD
TM

526.10
307.20
226.70
327.40
328.20
429.50
301.30
432.10
728.20

509.00
302.00
224.70
323.40
320.30
391.30
300.60
422.40
716.90

63
49
26
37
43
58
32
63
96

Pe baza datelor problemei se poate construi un model econometric de forma:


y = f (x) + u
unde y reprezint valorile reale ale variabilelor dependente, x valorile reale ale
variabilelor independente i u variabila rezidual (influena celorlal i factori ai variabilei y,
nespecificai n model, care au influene nesemnificative asupra variabilei y).
n acest caz, analiznd datele din tabel, se pot specifica variabilele astfel: x reprezint
veniturile totale ale gospodriilor i este variabila endogen (factorial), fiind considerat ipoteza
de lucru cu influena cea mai puternic asupra variabilei y; n timp ce y reprezint numrul
mediu al salariailor de sex masculin i este variabila exogen (rezultativ), ale cror valori
depind de mai muli factori (veniturile totale ale gospodriilor etc.)

2.

Definirea modelului de regresie simpl liniar

Modelul de regresie liniar reprezint o ecuaie sau o serie de ecuaii care exprim
dependena variabilelor complexe de un ansamblu de factori care acioneaz n acelai sens sau
n sensuri diferite. Astfel, modelul de regresie simpl liniar (unifactorial) are n vedere
dependena dintre variabila X (variabil endogen sau factorial) i variabila Y (variabil
exogen sau rezidual).

2.1. Forma, variabilele i parametrii modelului de regresie

Un model de regresie simpl liniar poate fi exprimat prin urmtoarea ecuaie:


Y= o + 1X +
unde Y reprezint variabila endogen sau rezultativ, o i 1 reprezint parametrii
ecuaiei de regresie i reprezint componenta rezidual (eroare aleatoare). Dintre acestea o este
punctul de intersecie al dreptei de regresie cu axa Oy, iar 1 este panta dreptei, care se mai
numete coeficient de regresie, care arat cu cte uniti se modific Y dac X se modific cu o
unitate.
Aa cu am menionat i mai sus, variabilele n acest caz sunt veniturile totale ale
gospodriilor (X) - variabil endogen (factorial), i numrul mediu al salaria ilor de se
masculin (Y) - variabil exogen (rezultativ).

2.2 Reprezentarea grafic a modelului legturii dintre variabile

Legatura dintre cheltuielile totale ale gospodariilor si veniturile acestora in anul 2005, in cele 42 de judete
3500.00
3000.00
2500.00

f(x) = 1.08x - 16.91


R = 1

2000.00
Cheltuielile gospodariilor 1500.00
1000.00
500.00
0.00
0.00

1000.00 2000.00 3000.00 4000.00


Veniturile gospodariilor

3.

Estimarea parametrilor modelului i interpretarea acestora

3.1. Estimarea punctual a parametrilor


Modelul de regresie simpl liniar n eantion este:
yi = 0 + 1xi + i,
y
cu i = 0 + 1xi
unde 0 i 1 sunt parametrii funciei de regresie, iar i este valoarea rezidual.
Parametrii funciei de regresie, 0 i 1, se determin cu ajutorul metodei celor mai mici
ptrate. Utilizarea acestei metode pornete de la relaia:
y i = 0 + 1x i + i
y i
reprezint valorile teoretice ale variabilei y obinute numai n funcie de valorile factorului
esenial x i valorile estimatorilor parametrilor 0 i 1
4

n mod concret, M.C.M.M.P. const n a minimiza funcia:


2
F ( 0 , 1 ) =min 2i =min ( y i i ) =min ( y i 0 1 x i )2

Sistem pentru modelul de regresie unifactorial:

n*0 + 1 * X t = Y t
0 * X t + 1 * X2t = X t Y
n = 42
42 * 0 + 1 * 18777 = 19480.9
0* 18777 + 1* 15656558.98 = 16518171.13

0 = (19480.9 18777 * 1) / 42
18777 * 19480.9 18777 * 18777 * 0 + 15656558.98 * 0 * 42 = 42 * 16518171.13
365792859.3 352575729 * 0 + 657575477.16 * 0 = 693763187.46
352575729 * 0 = 327970328.16
0 = 327970328.16 / 352575729
0 = - 16.911
42 * 1 + 18777 * 0 = 19480.9
42 * 1 + 18777 * (- 16.911) = 19480.9
42 * 1 - 317537.847 = 19480.9
1 = 1.0753
0 = - 16.911
1 = 1.0753
i=16.911+1.075xi

Intercept
Venituri totale gospodarii
(X1)

Coefficients
-16.91096306
1.075313439

3.2 Estimarea parametrilor prin interval de ncredere


a) parametrul o
b0 z/2,n-2 * Sb0 o b0 + z/2,n-2 * Sb0
-16.911 2.021 * 2.954 0 -16.911 + 2.021 * 2.954
-10.94 o -22.88
Lower
95%
22.882708
07

1.065532
563

Upper
10.939218

1.085094

b) parametrul 1
6

b1 z/2,n-2 * Sb1 1 b1 + z/2,n-2 * Sb1


1.075 2.021 * 0.0048 1 1.075 + 2.021 * 0.0048
1.065 1 1.084
Lower
95%

Upper
95%

22.88270
807
1.065532
563

4.

10.93921
805
1.085094
315

Testarea semnificaiei corelaiei i a parametrilor modelului de regresie

4.1. Testarea semnificaiei corelaiei


Testarea semnificaiei corelaiei cuprinde mai multe etape:
a) calcularea coeficientului de corelaie:
r

n xi y i xi y i

n x

2
i

xi n y i2 y i
2

42 16518171,13 18777 19480,9

42 15656558,98 352575729 42 17439573,63 379505464,81

0,9995

Deoarece r = 0,9995 (pozitiv i apropiat de 1) putem afirma c ntre cele dou


variabile exist o legtur puternic.
Regression Statistics
Multiple R
R Square
Adjusted R Square
Standard Error
Observations

0.999595157
0.999190478
0.99917024
13.0412831
42

b) testarea semnificaiei coeficientului de corelaie


7

et.1: se stabilete ipoteza nul:


H0: r = 0 (coeficientul este semnificativ statistic)
et.2: se stabilete ipoteza alternativ:
H1: r

0 (coeficientul nu este semnificativ statistic)

et.3: se determin pragul de semnificaie:


=0,05=5

et.4: se calculeaz valoarea testului, folosindu-se testul t:

tr

r r n 2 0,999 40

141,315
sr
1 r2
1 0,999 2

et.5: se determin valoarea critic:


tcritic = t,n-2= 2,021
tcalculat>tcritic se neag ipoteza nul
et.6: se desprind concluzii:
Pentru o probabilitate de 95%, exist suficiente dovezi statistice pentru a aprecia
c r, coeficientul de corelaie, este semnificativ statistic.
c) determinarea raportului de corelaie:

R =1

y
i

y
y i

( yi )2

( yi y )2

Deoarece R = 0,9991 (pozitiv i apropiat de 1) putem afirma c ntre cele dou


variabile exist o legtur liniar, puternic i direct.
Regression Statistics
Multiple R
R Square
Adjusted R Square
Standard Error
Observations

0.999595157
0.999190478
0.99917024
13.0412831
42

d) testarea raportului de corelaie


Testarea raportului de corelaie se realizeaz cu testul F (Fisher):
Fcalc

R2
n k 1
0,9991 40

49378,023
2
k
1 0,9991 1
1 R

df

SS

8396926.227

Residual

40

6803.002594

Total

41

8403729.23

Regression

MS
8396926.22
7
170.075064
9

F
49371.88
314

unde k reprezint numrul de variabile exogene.


Fcalculat = 49378,023 > Fcritic = 4,08
Pentru o probabilitate de 95% putem afirma c R, raportul de corelaie, este semnificativ
diferit de 0.

4.2. Testarea parametrilor unui model de regresie simplu


a) parametrul o
et.1: se stabilete ipoteza nul:
H0: o = 0
et.2: se stabilete ipoteza alternativ:
H0: o

et.3: se determin pragul de semnificaie:


=0,05=5

et.4: deoarece n > 30, se aplic testul Z


et.5: se calculeaz indicatorii:

sb 0

1
x
se
n xi x
i

1
447,07 2

13
,
041


2
42
7261898
,
77

2,955

Intercept
Venituri totale gospodarii
(X1)

Coefficients
-16.91096306

Standard
Error
2.954736394

1.075313439

0.004839441

10

Se

n2

6803,01
40

= 13,041

Regression Statistics
Multiple R
R Square
Adjusted R Square
Standard Error
Observations

0.999595157
0.999190478
0.99917024
13.0412831
42

et.6: se calculeaz valoarea testului:


z calc

b0 b0 0 b 0
16,911

5.722
sb 0
sb0
sb0
2,955

Intercept
Venituri totale gospodarii
(X1)

Coefficients
-16.91096306

Standard
Error
2.954736394

t Stat
-5.7233407

1.075313439

0.004839441

222.1978468

et.7: se determin valoarea critic:


zcritic = z/2,n-2 = 2,021 zcritic > zcalc se accept ipoteza nul (H0)
et.8: se desprind concluzii:
Pentru o probabilitate de 95% exist suficiente dovezi statistice pentru a afirma c
estimatorul b0 provine dintr-o populaie cu o = 0, deci este nesemnificativ statistic.
et.9: intervalul de ncredere:
b0 z/2,n-2 Sb0 o b0 + z/2,n-2 Sb0
-16,911 2,021 2,955 o -16,911 + 2,021 2,955
-22,88 o -10,99
b) parametrul 1
11

et.1: se stabilete ipoteza nul:


H0: 1 = 0
et.2: se stabilete ipoteza alternativ:
H0: 1

et.3: se determin pragul de semnificaie:


=0,05=5

et.4: deoarece n > 30, se aplic testul Z


et.5: se calculeaz indicatorii:
Sc

Sb1 =

(x ix )2

13,041
7261898,77

= 0,00484

i=1

Intercept
Venituri totale gospodarii
(X1)

Se

n2

6803,01
40

Coefficients
-16.91096306

Standard
Error
2.954736394

1.075313439

0.004839441

= 13,041

Regression Statistics
Multiple R
R Square
Adjusted R Square
Standard Error
Observations

0.999595157
0.999190478
0.99917024
13.0412831
42

12

et.6: se calculeaz valoarea testului:


z calc

b1 b1 0 b1
1,075

222,17
sb1
sb1
s b1 0,00484

Intercept
Venituri totale gospodarii
(X1)

Coefficients
-16.91096306

Standard
Error
2.954736394

t Stat
-5.7233407

1.075313439

0.004839441

222.1978468

et.7: se determin valoarea critic:


zcritic = z/2,n-2 = 2,021 zcritic > zcalc se respinge ipoteza nul (H0) i se accept ipoteza
alternativ (H1)
et.8: se desprind concluzii:
Pentru o probabilitate de 95% exist suficiente dovezi statistice pentru a afirma c

estimatorul b1 provine dintr-o populaie cu o 0, deci este semnificativ statistic.


et.9: intervalul de ncredere:
b1 z/2,n-2 Sb1 o b1 + z/2,n-2 Sb1
1,075 2,021 0,00484 o 1,075 + 2,021 0,00484
1,065 o 1,085

5.Aplicarea analizei de tip ANOVA pentru validitatea modelului de regresie simplu i


interpretarea rezultatelor

13

Verificarea verosimilitii modelului se face cu ajutorul analizei dispersionale (analiza


variaiei).

Sursa de
variaie

Msura
variaiei

Variana
dintre
grupe

Nr. grade
de
libertate

2
V y i y
2
x

i 1

k 1

8396716,34

Variana
rezidual

Vu2 y i Yi

n k 1 40

i 1

6803,01

Variana
total

V yi y
2
0

n 1 41

i 1

Dispersii
corectate
V x2
s

k
8396716,34
2
Y/X

Valoarea testului F
Fc
F ; v1 ; v2
Fc

sY2 / X
s u2

F0,05;1; 40 5,32

49370,667

F0,01;1; 40 11,3

Vu2
n k 1
170,075

s u2

8403729,23

H0: ipoteza nul


H1: ipoteza alternativ
Se aplic testul FISHER:

Fcalc

sY2 / X
s e2

8396716,34

/ 170,075 = 49370,667
14

Fcalc>Fcritic 49370,667 > 4 rezult c se respinge ipoteza H0 si se accept H1.


Pentru o probabilitate de 95% exist suficiente dovezi statistice pentru a aprecia c
modelul de regresie este valid, iar ntre cele dou variabile exist o legtur.

6. Testarea ipotezelor clasice asupra modelului de regresie simpl


6.1. Ipoteze statistice clasice asuprta modelului de regresie simpl
Ipoteza 1: Forma funcional
yi 0 1 xi i y i i
forma se respect, n acest caz fiind: y 16,911 x
Ipoteza 2: Media erorilor este 0
0
Ipoteza 3: Homoscedasticitatea
dispersia reziduurilor n populaie este constant pentru toate valorile xi
2
cst i 1, n
Ipoteza 4: Non-autocorelarea erorilor
deviaiile observaiilor de la valorile lor ateptate sunt necorelate
Cov( i , j ) 0 i j

Ipoteza 5: Necorelare ntre regresor i erori


variabila x nu este influenat de eroarea oricrei observaii

i ~ N (0, 2 )
Ipoteza 6: Variabila aleatoare este normal distribuit
15

6.2. Testarea liniaritaii modelului propus


a) calcularea coeficientului de corelaie:
et.1: se stabilete ipoteza nul:
H0: legtura dintre variabile este liniar
et.2: se stabilete ipoteza alternativ:
H1: legtura dintre variabile nu este liniar
et.3: se determin pragul de semnificaie:
= 0,05 = 5%
et.4: se calculeaz indicatorii (calculai i la punctul 4.1):

n xi y i xi y i

n x

2
i

xi n y y i
2

2
i

42 16518171,13 18777 19480,9

42 15656558,98 352575729 42 17439573,63 379505464,81

0,9995

Deoarece r = 0,9995 (pozitiv i apropiat de 1) putem afirma c ntre cele dou


variabile exist o legtur puternic.
Regression Statistics
Multiple R
R Square
Adjusted R Square
Standard Error
Observations

0.999595157
0.999190478
0.99917024
13.0412831
42

b) testarea semnificaiei coeficientului de corelaie (realizat i la punctul 4.1):


et.1: se stabilete ipoteza nul:
16

H0: r = 0 (coeficientul nu este semnificativ statistic)


et.2: se stabilete ipoteza alternativ:
H1: r 0 (coeficientul nu este semnificativ statistic)
et.3: se determin pragul de semnificaie:
= 0,05 = 5%
et.4: se calculeaz valoarea testului, folosindu-se testul Z bilateral:
z r=

r r n2 0,9995 40
=
=
=200,170
S r 1r 2 10,99952

et.5: se determin valoarea critic:


zcritic = z,n-2= 1,960
zcalculat>zcritic se neag ipoteza nul
et.6: se desprind concluzii:
Pentru o probabilitate de 95%, exist suficiente dovezi statistice pentru a aprecia c r,
coeficientul de corelaie, este semnificativ statistic.

6.3. Testarea normalitii erorilor


et.1: se stabilete ipoteza nul:
H0: distribuia erorilor este normal
et.2: se stabilete ipoteza alternativ:
H1: distribuia erorilor nu este normal
et.3: se determin pragul de semnificaie:
= 0,05 = 5%
et.4: se determin valoarea calculat cu ajutorul testului Jaque-Bera:

17

JB = n *

S2 (k3)
+
6
24

= 42 *

177119,48 (23)
+
6
24

= 1239838.11

et.5: se determin valoarea critic:


JB > 2
;k

Condiia de normalitate a erorilor este ca valorile reziduale (Residuals) s se ncadreze n


intervalul:
(-ttabelar Se; ttabelar Se)
( -26,355; 26,355)

Se observ c nu exist abateri de la trend-ul liniar, astfel exist suficiente dovezi


statistice pentru a afirma c erorile sunt normal distribuite n prezenta situaie, acceptndu-se
astfel ipoteza nul.
6.4. Testarea ipotezei de homoscedasticitate
et.1: se stabilete ipoteza nul:
H0: 0 = 1 = ... = k = 0, (homoscedasticitate)
et.2: se stabilete ipoteza alternativ:
H1: 0 = 1 = ... = k 0, (heteroscedasticitate)
et.3: se determin pragul de semnificaie:
18

= 0,05 = 5%
et.4: se folosete testul White (LM):
LM = n *

R2 = 42 * 0,9991 = 41.9622

LM > 2
;k

Pentru o probabilitate de 95% esist suficiente dovezi statistice pentru a afirma c


modelul de regresie este heteroscedastic, adic k 0, respingndu-se ipoteza nul.
6.5. Testarea ipotezei de autocorelare a erorilor
et.1: se stabilete ipoteza nul:
H0: autocorelarea erorilor nu exist
et.2: se stabilete ipoteza alternativ:
H1: autocorelarea erorilor exist
et.3: se determin pragul de semnificaie:
= 0,05 = 5%
et.4: se folosete testul Durbin-Watson (DW):
n

( e ie i1 )2

DW = i=1

ei2

18606668,94
=0,1067
174322770,63

i=1

rezult DWtabelar tabelului Durbin-Watson, astfel dl=1,197 i dU=1,398.

19

Astfel:
4 dl = 2,803
4 dU = 2,602
[0;dl] = [0;1,197] zon de respingere - autocorelare pozitiv,
[dl;du] = [1,197;1,398] zon de indecizie,
[du;4-du] = [1,398;2,602] zon de acceptare a ipotezei nule (H0),
[4-du;4-dl] = [2,602;2,803] zon de indecizie,
[4-dl;] = [2,803;] zon de respingere - autocorelare negativ.
DWcalc se afl in zona de respingere, astfel pentru o probabilitate de 95% exist suficiente
dovezi statistice pentru a afirma c autocorelarea erorilor exist, acceptndu-se ipoteza
alternativ.
7. Previziunea valorii variabilei Y dac variabila X crete cu 10% fa de ultima
valoare nregistrat (inclusive interval de ncredere) pentru toate variantele cunoscute
Dac variabila x crete cu 10% fata de ultima valoare inregistrat, se va studia modul n
care se va modifica y42, dac x42 crete cu 10%, i va rezulta:
x43 = x42 * (1+0,1) = 716.90 * 1,1 = 788,59
Astfel, pentru un jude cu veniturile totale ale gospodriilor de 788,59 ecuaia modelului
de regresie va fi:
43 = 1,0753 * 788,59 16,911 = 831.060827
20

Intervalul de ncredere pentru valoarea previzionat:


x
xn 1

( x ix )2
i=1

x
xn 1

1
+
n
43z S e
2

,n2

831,06 2,021 * 13,04 *

1
358,69
+
43 7375821,26

y 43

831,06 + 2,021 * 13,04 *

1
358,69
+
43 7375821,26

827.04

y 43

835.08

Pentru un jude cu veniturile totale ale gospodriilor de 788,59, veniturile totale ale
gospodariilor aferente vor fi cuprinse ntre 827,04 si 835,08.

21

Problema B
1. Definirea modelului de regresie multipl liniar
Modelul de regresie liniar reprezint o ecuaie sau o serie de ecuaii care exprim
dependena variabilelor complexe de un ansamblu de factori care acioneaz n acelasi sens sau
n sensuri diferite. Astfel, modelul de regresie multipl liniar are n vedere rela ia dintra
variabila dependent (variabil endogen, explicat, rezultativ) i o mulime de variabile
independente (variabile exogene, explicative). Modelul de regresie multipl liniar se bazeaz pe
modelul general de regresie, dar permite mai multe variabile dependente simultan.
1.1.

Forma, variabilele, parametrii modelului de regresie multipl

Un model de regresie multipl liniar poate fi exprimat prin urmtoarea ecuaie:


y = f (xj) + unde y reprezinta variabila endogen, f (x j) este funcia de regresie. De
asemenea xj reprezint variabilele exogene (factoriale sau cauzale).
Modelul liniar multifactorial, la nivelul colectivitii generale, are forma:

yi b0 b1 xi1 b2 xi 2 i

cu i 1, n

La nivelul eantionului modelului de regresie


multipl n acest caz:

1.2.

Reprezentarea grafic a modelului legturii dintre variabile

22

Legatura dintre cheltuielile totale ale gospodariilor si veniturile acestora in anul 2005, in cele 42 de judete
3500.00
3000.00

f(x) = 1.08x - 16.91


R = 1

2500.00
2000.00
Cheltuielile gospodariilor 1500.00
1000.00
500.00
0.00
0.00

1000.00 2000.00 3000.00 4000.00


Veniturile gospodariilor

Legatura dintre cheltuielile totale ale gospodariilor si numarul mediu al salariatilor de sex masculin in anul 2005, in cele 42 de judete
3500.00
3000.00

f(x) = 7.48x + 34.3


2500.00 R = 0.99
2000.00
Cheltuielile gospodariilor 1500.00
1000.00
500.00
0.00
0 50 100 150 200 250 300 350 400 450
Numarul mediu al salariatilor de sex masculin

23

2. Estimarea parametrilor modelului i interpretarea acestora


2.1.
Estimarea punctual a parametrilor
Modelul de regresie multipl liniar are in vedere stabilirea funciei de regresie:
x1,x2,i = b0 + b1xi + b2x2i unde b0 i b1 sunt parametrii funciei de regresie, iar
este valoarea rezidual.
Sistemul de ecuaii pentru determinarea estimatorilor b0, b1 i b2 este:

24

nb0 b1 xi1 b2 xi 2 yi

i 1

i 1
n

i 1
n

i 1

i 1

i 1

i 1

b0 xi1 b1 x b2 xi1 xi 2 xi1 yi


2
i1

i 1

i 1
n

i 1

i 1

b
2
x

b
x
x

b
x

0
i
2
1
i
1
i
2
2
i
2 xi 2 yi

Avnd la baz sistemul de ecuaii anterior se obine cu ajutorul programului Excel


urmtoarele valori:

Intercept
Venituri totale gospodarii (X1)
Numarul mediu al salariatilor de sex
masculin (X2)

Coefficients
-15.00563133
1.029526202
0.323134285

b0 = -15.00563133
b1 = 1.029526202
b2 = 0.323134285

25

n acest caz ecuaia de regresie are forma:


y = -15.00563133 + 1.029526202 * x1 + 0.323134285 * x2
2.2. Estimarea parametrilor prin interval de ncredere

Coefficients
Intercept

-15.00563133

Venituri totale gospodarii (X1)

1.029526202

Numarul mediu al salariatilor de sex


masculin (X2)

0.323134285

Lower
95%
21.772044
31
0.9512742
8
0.2248207
41

Upper
95%
8.239218
357
1.107778
123
0.871089
312

Pentru estimarea parametrilor prin intervalul de ncredere este nevoie de erorile standard
ale variabilelor:

Coefficients

Standard
Error

26

Intercept

-15.00563133

Venituri totale gospodarii (X1)


Numarul mediu al salariatilor de sex
masculin (X2)

1.029526202
0.323134285

3.3452530
53
0.0386870
38
0.2709039
83

Sb0 = 3.345253053
Sb1 = 0.038687038
Sb2 = 0.270903983
a) parametrul 0

b0 z/2,n-2 * Sb0 o b0 + z/2,n-2 * Sb0


-15.00563133 2,021 * 3.345253053 o -15.00563133 + 2,021 * 3.345253053
-21.76919 o -8.24079
b) parametrul 1
b1 z/2,n-2 * Sb1 1 b1 + z/2,n-2 * Sb1
1.029526202 2,021 * 0.038687038 1 1.029526202 + 2,021 * 0.038687038
0.9514508 1 1.1075492
c) parametrul 2
b2 z/2,n-2 * Sb2 2 b2 + z/2,n-2 * Sb2
0.323134285 2,021 * 0.270903983 2 0.323134285 + 2,021 * 0.270903983
-0.2246598 2 0.8708898
3. Testarea semnificaiei corelaiei i a parametrilor regresiei modelului de regresie
multipl
3.1 Testarea semnificaiei corelaiei multipl
a) Calcularea coeficientului de corelaie
y i y
( ij y )2

()2=0,9996
r x1, x 2=
Deoarece R = 0,9996 (pozitiv i apropiat de 1) putem afirma c ntre variabile exist o
legtur puternic.

27

Regression Statistics
Multiple R
R Square
Adjusted R Square
Standard Error
Observations

0.999609409
0.999218971
0.999178918
12.97290604
42

b) Testarea semnificaiei coeficientului de corelaie


et.1: se stabilete ipoteza nul:
H0: r = 0 (coeficientul este semnificativ statistic)
et.2: se stabilete ipoteza alternativ:
H1: r

0 (coeficientul nu este semnificativ statistic)

et.3: se determin pragul de semnificaie:


=0,05=5

et.4: se calculeaz valoarea testului, folosindu-se testul Z bilateral:


z r=

r r n2 0,9996 40
=
=
=225.785
S r 1r 2 10,99962

et.5: se determin valoarea critic:


tcritic = t,n-2= 2,021
tcalculat>tcritic se neag ipoteza nul
et.6: se desprind concluzii:
Pentru o probabilitate de 95%, exist suficiente dovezi statistice pentru a aprecia
c r, coeficientul de corelaie, este semnificativ statistic.
c) Determinarea raportului de corelaie
28

R2=1

y
i

y
y i

( yi )2

( yi y )2

Regression Statistics
Multiple R
R Square
Adjusted R Square

Deoarece

R2

0.999609409
0.999218971
0.999178918

= 0,9992 (pozitiv i apropiat de 1) putem spune c ntre cele dou

variabile exist o legtur liniar, puternic i direct.


d) Testarea raportului de corelaie
Testarea raportului de corelaie se realizeaz cu testul F (Fisher):
Fcalc

R2
n k 1
0,9992 40

24947,55
2
k
1 0,9992 1
1 R

unde k reprezint numrul de variabile exogene.


Fcalculat = 24947,55 > Fcritic = 3,22
Pentru o probabilitate de 95% putem afirma c R, raportul de corelaie, este semnificativ
diferit de 0.
29

3.2 Testarea parametrilor modelului de regresie multipl


a) parametrul o
et.1: se stabilete ipoteza nul:
H0: o = 0
et.2: se stabilete ipoteza alternativ:
H0: o

et.3: se determin pragul de semnificaie:


=0,05=5

et.4: deoarece n > 30, se aplic testul Z bilateral:


et.5: se calculeaz indicatorii:
Se= 12,973
Regression Statistics
Multiple R
R Square
Adjusted R Square
Standard Error

0.999609409
0.999218971
0.999178918
12.97290604

Sb0 = 3,345

Coefficients
Intercept

-15.00563133

Standard
Error
3.3452530
53

30

Venituri totale gospodarii (X1)


Numarul mediu al salariatilor de sex
masculin (X2)

1.029526202
0.323134285

0.0386870
38
0.2709039
83

et.6: se calculeaz valoarea testului:


b b0 0 b 0
15,005
z calc 0

4,485
sb 0
sb 0
sb0
3,345

Coefficient
Intercept

-15.00563133

Venituri totale gospodarii (X1)


Numarul mediu al salariatilor de sex
masculin (X2)

1.029526202
0.323134285

Standard
Error

t Stat

3.34525305
3
0.03868703
8
0.27090398
3

et.7: se determin valoarea critic:


zcritic = z/2,n-2 = 2,021 zcritic > zcalc se accept ipoteza nul (H0)
et.8: se desprind concluzii:
Pentru o probabilitate de 95% exist suficiente dovezi statistice pentru a afirma c
estimatorul b0 provine dintr-o populaie cu o = 0, deci este nesemnificativ statistic.

b) parametrul 1

et.1: se stabilete ipoteza nul:


H0: 1 = 0
et.2: se stabilete ipoteza alternativ:
H0: 1

0
31

4.4856490
96

26.611657
08
1.1928000
53

et.3: se determin pragul de semnificaie:


=0,05=5

et.4: deoarece n > 30, se aplic testul Z bilateral


et.5: se calculeaz indicatorii:
Se= 12,972
Regression Statistics
Multiple R
R Square
Adjusted R Square
Standard Error
Observations

0.999609409
0.999218971
0.999178918
12.97290604
42

Sb1 = 0,038

Coefficients
Intercept

-15.00563133

Venituri totale gospodarii (X1)


Numarul mediu al salariatilor de sex
masculin (X2)

1.029526202
0.323134285

Standard
Error
3.3452530
53
0.0386870
38
0.2709039
83

et.6: se calculeaz valoarea testului:


z calc

b1 b1 0 b1 12,972

26,611
sb1
sb1
sb1
0,038

Coefficients
Intercept

-15.00563133

Venituri totale gospodarii (X1)

1.029526202

Standard
Error
3.3452530
53
0.0386870
38

t Stat
4.485649
096
26.61165
708

32

Numarul mediu al salariatilor de sex


masculin (X2)

0.323134285

0.2709039
83

1.192800
053

et.7: se determin valoarea critic:


zcritic = z/2,n-2 = 2,021 zcritic zcalc se respinge ipoteza nul (H 0) i se accept ipoteza
alternativ (H1)
et.8: se desprind concluzii:
Pentru o probabilitate de 95% exist suficiente dovezi statistice pentru a afirma c

estimatorul b1 provine dintr-o populaie cu o 0, deci este semnificativ statistic.


c) parametrul 2

et.1: se stabilete ipoteza nul:


H0: 2 = 0
et.2: se stabilete ipoteza alternativ:
H1: 2

et.3: se determin pragul de semnificaie:


=0,05=5

et.4: deoarece n > 30, se aplic testul Z bilateral


et.5: se calculeaz indicatorii:
Se = 12,973
Regression Statistics
Multiple R
R Square
Adjusted R Square
Standard Error

0.999609409
0.999218971
0.999178918
12.97290604

33

Sb2 = 0,271

Coefficients
Intercept

-15.00563133

Venituri totale gospodarii (X1)


Numarul mediu al salariatilor de sex
masculin (X2)

1.029526202
0.323134285

Standard
Error
3.3452530
53
0.0386870
38
0.2709039
83

et.6: se calculeaz valoarea testului:


z calc

b b1 0 b 2 12,973

1,193
sb 2
sb 2
sb 2
0,271

Coefficients
Intercept

-15.00563133

Venituri totale gospodarii (X1)


Numarul mediu al salariatilor de sex
masculin (X2)

1.029526202
0.323134285

Standard
Error
3.3452530
53
0.0386870
38
0.2709039
83

t Stat
4.485649
096
26.61165
708
1.192800
053

et.7: se determin valoarea critic:


zcritic = z/2,n-2 = 2,021 zcritic > zcalc se accept ipoteza nul (H0)
et.8: se desprind concluzii:
Pentru o probabilitate de 95% exist suficiente dovezi statistice pentru a afirma c
estimatorul b2 provine dintr-o populaie cu o= 0, deci este nesemnificativ statistic.
4. Aplicarea analizei de tip ANOVA pentru validitatea modelului de regresie
multipl i interpretarea rezultatelor
et.1: se stabilete ipoteza nul:

34

H0: modelul de regresie este valid


et.2: se stabilete ipoteza alternativ:
H1: modelul de regresie nu este valid
et.3: se determin pragul de semnificaie:
=0,05=5
k = 2, n-k-1 = 42-2-1 = 39
et.4: se aplic testul Fisher
et.5: se calculeaz indicatorii:
n

sY2 / X

2
x

y
i 1

k
n

s e2

2
e

n k 1

y
i 1

Yi

n k 1

8397165.674
4198582,837
2
2

6563,555
168,296
39

df
Regression

SS
8397165.6
74
6563.5553
49
8403729.2
3

Residual

39

Total

41

MS
4198582.
837
168.2962
91

et.6: se calculeaz valoarea testului:

Fcalc

sY2 / X
s

2
u

4198582,837
24947,566
168,2963

df

SS

MS

35

Regression

Residual

39

Total

41

8397165.
674
6563.555
349
8403729.
23

4198582.
837
168.2962
91

24947.56
606

et.7: se determin valoare critic:

F0,05;1; 40 4,08
Fcritic = Fcalc = 4,08 Fcritic Fcalc se neag ipoteza nul (H0) variabila x are o
influen
semnificativ asupra variabilei y
et.8: se desprin concluzii:
Pentru o probabilitate de 95% exist suficiente dovezi statistice pentru a aprecia c
modelul de regresie este valid, iar ntre cele dou variabile exist o legtur.
5. Testarea ipotezelor clasice asupra modelului de regresie multipl
5.1 Ipoteze statistice clasice asupra modelului de regresie multipl
a)
b)
c)
d)

Model liniar
Normalitatea erorilor
Homoscedasticitatea variaia erorilor este constant
Non autocorelarea erorilor: Cov(i,j)=0 eroarea oricrei observaii nu este
influenat de alt observaie
e) Variabilele exogene xj sunt independente ntre ele

5.2 Testarea liniaritii modelului propus


a) Calcularea coeficientului de corelaie (realizat i la punctual 3.1):
y i y
( ij y )2

()2=0,9996
r x1, x 2=
Deoarece R = 0,9996 (pozitiv i apropiat de 1) putem afirma c ntre variabile exist o
legtur puternic.

36

Regression Statistics
Multiple R
R Square
Adjusted R Square
Standard Error
Observations

0.999609409
0.999218971
0.999178918
12.97290604
42

b) Testarea semnificaiei coeficientului de corelaie (realizat i la punctual 3.1):


et.1: se stabilete ipoteza nul:
H0: r = 0 (coeficientul este semnificativ statistic)
et.2: se stabilete ipoteza alternativ:
H1: r

0 (coeficientul nu este semnificativ statistic)

et.3: se determin pragul de semnificaie:


=0,05=5

et.4: se calculeaz valoarea testului, folosindu-se testul Z bilateral:


z r=

r r n2 0,9996 40
=
=
=225.785
S r 1r 2 10,99962

et.5: se determin valoarea critic:


tcritic = t,n-2= 2,021
tcalculat>tcritic se neag ipoteza nul
et.6: se desprind concluzii:
Pentru o probabilitate de 95%, exist suficiente dovezi statistice pentru a aprecia
c r, coeficientul de corelaie, este semnificativ statistic.
5.3 Testarea normalitii erorilor

37

et.1: se stabilete ipoteza nul:


H0: distribuia erorilor este normal
et.2: se stabilete ipoteza alternativ:
H1: distribuia erorilor nu este normal
et.3: se determin pragul de semnificaie:
= 0,05 = 5%
et.4: se determin valoarea calculat cu ajutorul testului Jaque-Bera:

JB = n *

S (k3)
+
6
24

= 42 *

177119,48 (23)
+
6
24

= 1239838.11

et.5: se determin valoarea critic:


JB > 2
;k

Condiia de normalitate a erorilor este ca valorile reziduale (Residuals) s se ncadreze n


intervalul:
(-ttabelar Se; ttabelar Se)
( -26,355; 26,355)

Venituri totale gospodarii (X1) Residual Plot


40
20
Residuals

0
0.00
-20

500.00 1000.00 1500.00 2000.00 2500.00 3000.00 3500.00

-40
Venituri totale gospodarii (X1)

38

Numarul mediu al salariatilor de sex masculin (X2) Residual Plot


40
30
20
Residuals

10
0
-10 0

50

100 150 200 250 300 350 400 450

-20
-30
Numarul mediu al salariatilor de sex masculin (X2)

Se observ c exist abateri de la trend-ul linear, astfel exist suficiente dovezi statistice
pentru a afirma c erorile nu sunt normal distribuite in prezenta situaie, respingndu-se astfel
ipoteza nul.
5.4. Testarea ipotezei de homoscedasticitate
et.1: se stabilete ipoteza nul:
H0: 0 = 1 = ... = k = 0, (homoscedasticitate)
et.2: se stabilete ipoteza alternativ:
H1: 0 = 1 = ... = k 0, (heteroscedasticitate)
et.3: se determin pragul de semnificaie:
= 0,05 = 5%
et.4: se folosete testul White (LM):
LM = n *

= 42 * 0,9992 = 41.9664

LM > 2
;k

Pentru o probabilitate de 95% esist suficiente dovezi statistice pentru a afirma c


modelul de regresie este heteroscedastic, adic k 0, respingndu-se ipoteza nul.
39

5.5. Testarea ipotezei de autocorelare a erorilor


et.1: se stabilete ipoteza nul:
H0: autocorelarea erorilor nu exist
et.2: se stabilete ipoteza alternativ:
H1: autocorelarea erorilor exist
et.3: se determin pragul de semnificaie:
= 0,05 = 5%
et.4: se folosete testul Durbin-Watson (DW):
n

( e ie i1 )2

DW = i=1

ei2

14811
=2.2565
6563,56

i=1

rezult DWtabelar tabelului Durbin-Watson, astfel dl=1,197 i dU=1,398.


Astfel:
4 dl = 2,803
4 dU = 2,602
[0;dl] = [0;1,197] zon de respingere - autocorelare pozitiv,
[dl;du] = [1,197;1,398] zon de indecizie,
[du;4-du] = [1,398;2,602] zon de acceptare a ipotezei nule (H0),
[4-du;4-dl] = [2,602;2,803] zon de indecizie,
[4-dl;] = [2,803;] zon de respingere - autocorelare negativ.
DWcalc se afl in zona de acceptare, astfel pentru o probabilitate de 95% exist suficiente
dovezi statistice pentru a afirma c autocorelarea erorilor nu exist, acceptndu-se ipoteza nul.
6. Previziunea valorii variabilei Y dac variabila X crete cu 10% fa de ultima
valoare nregistrat
Dac variabilele x1 i x2 cresc cu 10% fa de ultima valoare inregistrat , se va studia
modul n care se va modifica y42, dac x142 i x242 vor crete cu 10%, i va rezulta:
x143 = x142 * (1+0,1) = 716,9 * 1,1 = 788.59
40

x243 = x242 * (1+0,1) = 96 * 1,1 = 105.6


Astfel, pentru un jude cu veniturile totale ale gospodriilor de 788,59 si un numr de
salariai de sex masculin de 105,6, ecuaia modelului de regresie va fi:
43= -15,00563 + 1,02952 * 788,59 + 0,32313 * 105,6 = 830.9860748
Intervalul de ncredere pentru valoarea previzionat
x
xn 1

( x ix )2
i=1

x
xn 1

1
+
n
43z S e
2

,n2

830,986 2,021 * 12,97 *

1 358,62
+
43
0

y 43

830,986 + 2,021 * 12,97 *

1 358,62
+
43
0

826.989

y 43

834.983

Pentru un jude cu veniturile totale ale gospodriilor de 788,59 si un numr de salariai de


sex masculine de 105,6, valoarea cheltuielilor totale ale gospodriilor aferente va fi cuprins
ntre 826,989 i 834,983.

41

Problema C
Folosind datele Problemei A, s se testeze dac dispersiile (variaiile) celor dou populaii
(variabila exogen i variabila endogen) sunt egale; testai dac mediile celor dou populaii
sunt egale. Rezolvarea problemei C de exemplificat n Excel, cu interpretarea rezultatelor i
parcurgerea etapelor testrii ipotezelor statistice.
Testarea ipotezei privind raportul dintre cele dou dispersii
et.1: se stabilete ipoteza nul:

H0:

21
=1
22

et.2: se stabilete ipoteza alternativ:

42

1
1
2
2

H1:

et.3: se determin pragul de semnificaie:


=0,05=5

et.4: se aplic testul Fisher


et.5: se calculeaz valoarea testului:
1

S
177119.482195122
Fcalc = 22 =
=0.8641281235092818
S 2 204969.0056097561
x ix

i=1

S 12=
y i y

i=1
2
2

S =

43

F-Test Two-Sample for


Variances
xi
447.0714
286
177119.4
821
42
41
0.864128
123
0.321148
062
0.594656
101

Mean
Variance
Observations
df
F
P(F<=f) one-tail
F Critical one-tail

yi
463.8309
524
204969.0
056
42
41

et.6: se determin valoarea critic:


F 2,n 11,n 21 =0.594656101
Fcalc > Fcritic

et.7: se desprind concluzii:


Pentru o probabilitate de 95% exist suficiente dovezi statistice pentru a aprecia c
dispersiile (variaiile) celor dou populaii (variabila exogen i cea endogen) nu sunt egale.
2. Testarea ipotezei privind diferena dintre cele dou medii
et.1: se stabilete ipoteza nul:
H0:

1=2

et.2: se stabilete ipoteza alternativ:


H1:

1 2

et.3: se determin pragul de semnificaie:


44

=0,05=5

et.4: deoarece n>30 se folosete testul Z bilateral


et.5: se calculeaz valoarea testului:

Z calc =

x1 x 2

1
2

2
2

S S
+
n1 n2

447,071463,831
16.76
=
=0.17571
177119,4882 204969,0056 9097.345
+
42
42

et.6: se determin valoarea critic


Z / 2=1,9599
Z calc <Z critic

et.7: se desprind concluzii:


Pentru o probabilitate de 95% exist suficiente dovezi statistice pentru a aprecia c
mediile celor dou popolaii nu sunt egale, astfel se neag ipoteza nul.

z-Test: Two Sample for


Means

Mean
Known Variance
Observations
Hypothesized Mean
Difference
z
P(Z<=z) one-tail
z Critical one-tail

xi
447.0714
286
177119.4
882
42

yi
463.8309
524
204969.0
056
42

0
0.175713
181
0.430259
64
1.644853
627

45

P(Z<=z) two-tail
z Critical two-tail

0.860519
28
1.959963
985

46