Sunteți pe pagina 1din 5

Modelul de regresie multifactorial (bifactorial)

Problem rezolvat
Din activitatea unei firme se cunosc urmtoarele date pentru perioada 2000-2009:
Anul

Producia fizic(mii buc)

2000
2001
2002
2003
2004
2005
2006
2007
2008
2009

20
24
28
32
34
40
40
42
44
46

Numr de salariai
1000
1200
1400
1100
1500
1700
1900
1900
2000
2100

Capitalul fix (mii lei


preuri comparabile)
4000
4200
4400
4600
4600
4200
4600
4800
4800
5000

Presupunnd c ntre cele 3 variabile exist o dependen liniar, se cere:


1. s se estimeze parametrii modelului de regresie
2. s se determine erorile reziduale
3. s se msoare intensitatea legturii dintre producie i cele dou variabile
4. s se testeze validitatea modelului de regresie folosit
Rezolvare:
1. Notm cu :
y=producia
x1=numr de salariai
x2=capitalul fix
Ecuaia de regresie este de forma:
=a0+a1x1+a2x2
y
=valorile ajustate sau teoretice ale variabilei y n funcie de cele dou
unde y
variabile factoriale x1 i x2.
Determinarea parametrilor modelului de regresie de face cu ajutorul MCMMP
(sistemul de ecuaii normale este dat in cursul predat sau in cel tiprit, iar a0,a1 i a2 se
calculeaz prin metoda substituiei sau a determinanilor):

Anul

2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
Total

y productia
(mii buc)y

20
24
28
32
34
40
40
42
44
46
350

a0= -23,13
a1= 1,67
a2= 0,70

x1numar
salariati

10
12
14
11
15
17
19
19
20
21
158

x2capitalul
fix(sute de
mii lei
pcomp)

40
42
44
46
46
42
46
48
48
50
452

xi1^2

100
144
196
121
225
289
361
361
400
441
2638

xi2^2

1600
1764
1936
2116
2116
1764
2116
2304
2304
2500
20520

xi1*xi2

400
504
616
506
690
714
874
912
960
1050
7226

xi1*yi

200
288
392
352
510
680
760
798
880
966
5826

xi2*yi

800
1008
1232
1472
1564
1680
1840
2016
2112
2300
16024

Deci, y = -23,13+1,67x1+0,70x2
n concluzie, la o cretere cu 100 a numrului de salariai, producia crete cu 1,67 mii
buci, iar la o cretere a capitalului fix cu 100 000 lei, producia va crete cu 0,7 mii
buci (700 buci).
2. Erorile sau valorile reziduale sunt ei=yiy productia
(sute mii
buc)y
20
24
28
32
34
40
40
42
44
46
350

an
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
Total

y^i
21.6527
26.40036
31.14802
27.53478
34.2235
34.76126
40.91222
42.31552
43.9877
47.06318
349.9992

i
y

, rezultatele sunt prezentate mai jos:

ei=yi- y^i
-1.6527
-2.40036
-3.14802
4.46522
-0.2235
5.23874
-0.91222
-0.31552
0.0123
-1.06318
0.00076

ei^2
2.731417
5.761728
9.91003
19.93819
0.049952
27.4444
0.832145
0.099553
0.000151
1.130352
67.89792

(yiymediu)^2
225
121
49
9
1
25
25
49
81
121
706

(y^iymediu)^2
178.1504
73.95381
14.83775
55.72951
0.602952
0.056997
34.95435
53.51683
80.77875
145.5203
638.1017

3. Pentru msurarea intensitii legturii dintre producie i cele dou variabile folosim
raportul de corelaie multipl:

( y i y i)

1
( y i y i )

y / x1, x 2

= 1 67.89 = 0.95
706

Deoarece R=0,95, foarte apropiat de 1, rezult c ntre cele 3 variabile sxist o legtur
direct, puternic.
4. Testarea validitii modelului de regresie
Se stabilesc cele 2 ipoteze:
H0: modelul nu este valid
H1: modelul este valid
i se calculeaz testul F
2

s
Fcalc=
s

x1, x 2
2

e
10

(y
i y i) 2 638.1017
SSR
= 1
=
= 319.0508
Iar s x1, x 2 =
k
k
2
2

10

se =

SSE
=
n k 1

( y y )
1

n k 1

, unde k=2, iar n=10


67.89
= 9.699702
7

Atunci

s
Fcalc=
s

x1, x 2
2

319.163
= 32.89
9.7

F
Deoarece Fcalc=32.9 > F
Se compar Fcalc cu

;k ;n k 1

0.05; 2; 7

adic

= 4.74

0.05; 2; 7

= 4.74

respingem ipoteza nul i acceptm alternativa,

deci modelul este valid.


Rezolvarea prin EXCEL:
Se introduc valorile variabilei rezultative y n celulele A2-A11
Se introduc valorile variabilei x1 n celulele C2-C11
Se introduc valorile variabilei x2 n celulele D2-D11
Se selecteaz din meniul principal opiunea Tools, apoi Data Analysis i apoi Regression
i se va deschide urmtoarea fereastr:

Rezultatele obinute cu ajutorul Excel-ului sunt:


SUMMARY OUTPUT
Regression Statistics
Multiple R
0.950698
R Square
0.903827
Adjusted R
Square
0.876349
Standard Error
3.114434
Observations
10

ANOVA
df

SS

MS

Regression

638.1021

Residual
Total

7
9

67.89792
706

Coefficient
s

Standard
Error

319.051
9.69970
2

t Stat

Intercept

-23.1352

18.27936

X Variable 1

1.672178

0.395221

-1.26564
4.23099
9

X Variable 2

0.701653

0.496841

1.41223

RESIDUAL OUTPUT
Predicted
Observation
Y
1
21.65277
2
26.40043
3
31.14809
4
27.53487
5
34.22358
6
34.76132
7
40.91229
8
42.3156
9
43.98778
10
47.06326

Residuals
-1.65277
-2.40043
-3.14809
4.465133
-0.22358
5.238677
-0.91229
-0.3156
0.012221
-1.06326

F
32.8928
7

Significanc
eF
0.000276

Upper
95%

Lower
95.0%

Upper
95.0%

-66.359

20.08865

-66.359

20.08865

0.73763

2.606727

2.606727

-0.47319

1.876495

0.73763
0.47319

P-value
0.24613
6
0.00388
3

Lower 95%

0.20076

1.876495

Explicaii la rezultatele obinute:


SUMMARY OUTPUT
Regression Statistics
0.95069
Multiple R
8
0.90382
R Square
7
0.87634
Adjusted R Square
9
3.11443
Standard Error
4
Observations
10

Multiple R=0.950698 arat c ntre cele 3 variabile exist o legtur puternic direct.
R Square sau R2=0.903827 arat c 90% din variaia produciei este explicat de
model (depinde de variaia celor 2 factori cauzali numrul de personal si capitalul
fix)
Abaterea medie ptratic a erorilor se=3.114434. n cazul n care acest indicator este 0
nseamn c toate punctele sunt pe dreapta de regresie

ANOVA
df
Regression SSR

SS
638.1021

MS
319.051

F
32.89287

Significance F
0.000276

Residual SSE
Total

7
9

67.89792
706

9.699702

n acest tabel este calculat testul F pentru validarea modelului de regresie. ntruct
F=32.89287, iar Significance F=0.000276 (valoare mai mic dect pragul impus de 0,05),
putem concluziona c modelul este valid i poate fi utilizat pentru analiza dependenei
dintre cele trei variabile.
Coefficient
s

Standard
Error

t Stat

Intercept

-23.1352

18.27936

X Variable 1

1.672178

0.395221

-1.26564
4.23099
9

X Variable 2

0.701653

0.496841

1.41223

Upper
95%

Lower
95.0%

Upper
95.0%

-66.359

20.08865

-66.359

20.08865

0.73763

2.606727

2.606727

-0.47319

1.876495

0.73763
0.47319

P-value
0.24613
6
0.00388
3

Lower 95%

0.20076

1.876495

Intercept este termenul liber, a0=-23.1352. Termenul lber este punctul in care varabilele
explicative (factoriale) sunt nule. Deoarece ta0=-1.26564, iar P-value este 0.246136 > 0.05
nseamn c acest coeficient este nesemnificativ. De altfel, faptul c limita inferioar a
intervalului de ncredere ( 66.359 0 20.08865 pentru acest parametru este negativ,
iar limita superioar este pozitiv indic faptul c parametrul din colectivitatea general
este aproximativ zero.
Coeficientul a1 este 1.672178, ceea ce nseamn c la creterea numrului de salariai cu
100 (atenie la unitatea de msur in care s-au fcut calculele), producia va crete cu 1672
buci (1,672178 mii buci). Deoarece ta1= 4.230999, iar P-value este 0.003883< 0.05
nseamn c acest coeficient este semnificativ. Intervalul de ncredere pentru acest
parametru este 0.73763 1 2.606727.
Coeficientul a2 este 0.701653, ceea ce nseamn c la creterea capitalului fix cu 100 mii
lei (atenie la unitatea de msur in care s-au fcut calculele), producia va crete cu 701
buci (0,701653 mii buci). Deoarece ta2= 1.41223, iar P-value este 0.20076> 0.05
nseamn c acest coeficient este nesemnificativ. De altfel, faptul c limita inferioar a
intervalului de ncredere ( 0.47319 2 1.876495 ) pentru acest parametru este
negativ, iar limita superioar este pozitiv indic faptul c parametrul din colectivitatea
general este aproximativ zero.