Sunteți pe pagina 1din 8

UNITATEA DE NVARE 5

Modelul liniar de regresie multifactorial

APLICAIE rezolvat - regresie liniar multipl


1. Se cunosc urmtoarele date privind vnzrile la produsul alimentar A, nregistrate n 10 uniti
comerciale:
Numrul curent al
unitii comerciale
1
2
3
4
5
6
7
8
9
10

Vnzri
(buci)
22
20
23
26
30
32
45
50
52
60

Numr vnztori
(persoane)
7
5
8
9
12
15
22
25
32
40

Suprafaa
comercial (mp)
98
90
110
130
140
145
156
160
164
175

Se cere:
1. S se determine modelul de regresie pe baza datelor din esantion i s se interpreteze parametrii
acesteia;

2. S se verifice validitatea modelului de regresie pentru un nivel de semnificaie 0,05;


3. S se arate cum se stabilesc( sau s se determine) intervalele de ncredere pentru parametrii
modelului liniar de regresie;
4. S se testeze semnificaia parametrilor modelului de regresie, pentru un nivel de semnificaie 0,05;
5. S se msoare intensitatea legturii dintre variabile folosind coeficientul de corelaie i raportul de
corelaie, testnd semnificaia acestora pentru un nivel de semnificaie 0,05;
6. Ce pondere din variaia variabilei efect este explicat de variatia variabilei cauz?
Rezolvare:
Notm cu :
Y - variabila vnzri.
X1 - variabila numrul vnztorilor,

X2 - variabila suprafaa comercial

yi = f ( x1i , x2i )
Vnzri =

f ( numr vnztori,

suprafa comercial )

yi = y i + ei
Numrul curent al
unitii comerciale
1
2
3
4
5

Vnzri
(buci)
Yi
22
20
23
26
30

Numr vnztori
(persoane)
X1i
7
5
8
9
12

Suprafaa
comercial (mp)
X2i
98
90
110
130
140

6
7
8
9
10

32
45
50
52
60

15
22
25
32
40

145
156
160
164
175

Rezolvare folosind EXCEL:


1.
2.
3.
4.

Introducei datele din tabel ncepnd din celula A1.


Apsai Tools-Data Analysis i Regression.
La Input Y Range selectai A1:A11. La Input X Range selectai B1:E11. Selectai Labels.
Dac dorii s calculai valorile reziduale, selectai Residuals. Apsai OK.

Se obin rezultatele:
SUMMARY OUTPUT
Regression Statistics
Multiple R
0,989430469
R Square
0,978972653
Adjusted R Square
0,97296484
Standard Error
2,377677944
Observations
10
ANOVA
df
Regression
2
Residual
7
Total
9
Coefficients

Intercept
Numar vanzatori
(persoane)
Suprafata comerciala
(mp)

SS
1842,426533
39,57346682
1882
Standard Error

1
2
3
4
5
6
7
8
9
10

F
162,94991

Significance F

t Stat

P-value

Lower 95%

Upper 95%

1,34817E-06

4,702902918

6,18676278

0,760156

0,4719829

-9,926466387

19,332272

0,974543752

0,151386668

6,437448

0,0003545

0,616571165

1,3325163

0,104112437

0,061427843

1,694874

0,133923

-0,04114133

0,2493662

Predicted
Vnzari
(bucati)
21,72772804
18,94574103
23,95162104
27,00841353
30,97316916
34,41736261
42,38440568
45,72448669
52,9627427
61,90432952

Residuals
0,272271963
1,054258965
-0,951621037
-1,008413534
-0,973169163
-2,417362606
2,61559432
4,275513315
-0,962742698
-1,904329524

RESIDUAL OUTPUT

Observation

MS
921,2133
5,653352

1 S se determine modelul de regresie pe baza datelor din esantion i s se interpreteze parametrii


acesteia
Modelul de regresie are n vedere stabilirea funciei de regresie

y x1 , x2 ,i = b0 + b1 x1i + b2 x 2 i
Coeficienii

Coefficients

Intercept
Numar vanzatori
(persoane)
Suprafata comerciala
(mp)

4,702902918

b0 termen liber

0,974543752

b1 coeficient de regresie (primul factor)

0,104112437

b2 coeficient de regresie (al doilea factor)

y x1 , x2 ,i = 4,7029 + 0,9745 x1i + 0,1041x 2i

b0 termen liber NU ARE INTERPRETARE ECONOMICA; ne arat c funcia de regesie y intersecteaz axa Oy
n punctul 4,7029;

b1 = +0,9754 , ceea ce nsemn c creterea numrului de vnztori cu unul, vnzarea va crete cu 0,9745
buci;
b2 = +0,1041 ne arat c, la o cretere cu 1 mp a suprafeei comerciale, vnzarea va nregistra o cretere
cu 0,1041 buci.
2 S se verifice validitatea modelului de regresie pentru un nivel de semnificaie 0,05.
ANOVA
df
Regression
Residual
Total

Tabel 2 ---ANOVA
Regression
(variaia
datorat
regresiei)
Residual
(variaia
rezidual)
Total (variaia
total)

2
7
9

SS
1842,426533
39,57346682
1882

df
(grade de
libertate)

SS (variana)
(suma ptratelor)

df1 = k

2y / x

1842,426533

df1 = n k 1

2e

39,57346682

df1 = df1 + df 2
df 1 = n 1
9

2y = y / x + e
1882

MS
921,2133
5,653352

F
162,94991

MS
(media
patratelor)
(dispersia
corectat)

s y2 / x =

1,34817E-06

F(calculat)

Significance F

Testul

1,34817E-06
este

F=162,94991

1,34817 10 6

2y / x
k

921,2133

s e2 =

Significance F

2
e

n k 1

5,653352

F= s y / x / se

este
0,00000134817
< = 0,05
(se respinge H0
Modelul este valid)

H0: modelul nu este valid statistic (mprtierea valorilor y t datorate factorului timp nu difer
semnificativ de mprtierea acelorai valori datorate ntmplrii)
H1: modelul este valid statistict
tiind c pragul de semnificaie este = 0,05 i k = 2 (exist doi factori de influen) se stabilete:
valoarea critic: Ftabelar = F ; k ; n k 1 = F ; 2 ; n 2 1 = F0 , 05; 2 ; 7 = 4,96

regiunea de respingere: dac Fc > F ; k ; n k 1 , atunci H0 se respinge

Determinarea statisticii testului ( Fcalculat ) are la baz relaia: F =

s y2 / x
s

2
e

921,2133
= 162,9499
5,6533

Decizia: deoarece Fcalculat (162,9499) > F ; k ; n k 1 (4,96) H 0 se respinge, deci H1 este adevrat,
prin urmare, modelul este valid.
7. S se arate cum se stabilesc( sau s se determine) intervalele de ncredere pentru parametrii
modelului liniar de regresie

Intercept

Lower 95%
(limita inferioara)

Upper 95%
(limita superioara)

-9,926466387
b0 t / 2; n k 1 s b 0

19,332272
b0 + t / 2; n k 1 s b 0

0,616571165

1,3325163
b1 + t / 2; n k 1 s b1

Numar vanzatori
(persoane)

b1 t / 2;n k 1 s b1

Suprafata
comerciala (mp)

b2 t / 2;n k 1 s b 2

-0,04114133

Lower

0,2493662
b 2 + t / 2; n k 1 s b 2

Upper

Interval de ncredere pentru 0 :


b0 t / 2; n k 1 s b 0 0 b0 + t / 2; n k 1 s b 0
b0 tBILATERAL ; n 3 s b 0 0 b0 + tBILATERAL ; n 3 s b 0
b0 t 0,5 BILATERAL ; 7 sb 0 0 b0 + t 0 ,5 BILATERAL ; 7 s b 0

4,702902918 2,365 6,18676278 0 4,702902918 + 2,365 6,18676278


9,926466387 0 19,332272
Interval de ncredere pentru 1 :
b1 t / 2; n k 1 s b1 1 b1 + t / 2; n k 1 s b1
b1 tBILATERAL ; n 3 s b1 1 b1 + tBILATERAL ; n 3 s b1
b1 t 0,5 BILATERAL ; 7 sb1 1 b1 + t 0 ,5 BILATERAL ; 7 s b1

0,9745 43752 2,365 0,151386668 1 0,974543752 + 2,365 0,151386668


0,616571165 1 1,3325163

Interval de ncredere pentru 2 :


b2 t / 2; n k 1 s b 2 2 b2 + t / 2; n k 1 s b 2
b2 tBILATERAL ; n 3 s b 2 2 b2 + tBILATERAL ; n 3 sb 2
b2 t 0 ,5 BILATERAL ; 7 sb 2 2 b2 + t 0,5 BILATERAL ; 7 s b 2

0,104112437 2,365 0,061427843 2 0,104112437 + 2,365 0,061427843


0,04114133 2 0,2493662

1 S se testeze semnificaia parametrilor modelului de regresie, pentru un nivel de semnificaie 0,05.


t Stat

P-value

Lower 95%

Upper 95%

4,702902918

Coefficients

Standard Error

6,18676278

0,760156

0,4719829

-9,926466387

19,332272

0,974543752

0,151386668

6,437448

0,0003545

0,616571165

1,3325163

0,104112437

0,061427843

1,694874

0,133923

-0,04114133

0,2493662

Intercept
Numar vanzatori
(persoane)
Suprafata comerciala
(mp)

Coefficients

Standard Error

t Stat

(Abaterea medie
patratica)

Testul t

Tabel 3

Intercept

Nr.vnz.

Supraf.
Com.

b0= 4,7029

b1= 0,9745

b2=0,1041

sb0

sb1

sb2

tb0 =

6,18676278

b0
sb 0

0,760156

t b1 =

0,151386668

P-value

Lower 95%
Limita inf. a
intervalului de
incredere

Upper 95%
Limita sup. a
intervalului de
incredere

0,4719829>0,05
coeficientul b0
nu este semnificativ

-9,926466387

19,332272

b0 t / 2; n 3 s b 0

b0 + t / 2; n 3 s b 0

b1
sb1

0,0003545<0,05
coeficientul b1
este
semnificativ

6,437448

tb2 =

0,06142784

b2
sb 2

0,133923>0,05
coeficientul b2
nu este semnificativ

1,694874

0,616571165

1,3325163

b1 t / 2; n 3 s b1

b1 + t / 2; n 3 s b1

-0,04114133

b2 t / 2 ; n 3 s b 2

0,2493662

b2 + t / 2 ; n 3 s b 2

I. Testarea semnificaiei parametrului 0 :


H0 : 0 = 0 (panta 0 este zero, adic 0 nu este semnificativ diferit de zero, deci 0 nu este
semnificativ statistic)
H1 : 0 0, (panta 0 nu este diferit de zero, adic 0 este semnificativ diferit de zero, deci 0 este
semnificativ statistic)
Deoarece n = 10 < 30 avem eantion de volum redus i pentru testare vom utiliza testul t.
tiind c pragul de semnificaie este = 0,05 i k = 2 (exist doi factori de influen) se stabilete:
valoarea critic: t critic = t
= t
= t 0,5 BILATERAL ;103 = t 0,5 BILATERAL ; 7 = 2,365
2

; n k 1

;n 3

regiunea de respingere: dac t calc > t


2

;n 3

sau t b 0 > t
2

; n 3

atunci H0 se respinge

Statistica testului este: t calc = t b 0 =

b0
4,702902918
=
= 0,760156
sb 0 6,186766278

Decizia:
Se observ c parametrul 0 nu este semnificativ statistic deoarece:
 din compararea statisticii testului cu valoarea testului critic (tabelar sau teoretic) rezult c:
t critic ( 2,365) < t b 0 (0,7602 ) < t critic (2,365) ;
critic P-value b0 = 0,4719829 > = 0,05 pragul de semnificaie
 limita inferioar a intervalului de ncredere (lower 95% = - 9,926466387) este cu semn contrar fa de
limita superioar a intervalului (upper 95% = + 19,332272); intervalul de ncredere este
9,926466387 0 19,332272 ;
 pragul

II. Testarea semnificaiei parametrului 1 :


H0 : 1 = 0 (panta 1 este zero, adic 1 nu este semnificativ diferit de zero, deci 1 nu este
semnificativ statistic)
H1 : 1 0, (panta 1 nu este diferit de zero, adic 1 este semnificativ diferit de zero, deci 1 este
semnificativ statistic)
Deoarece n = 10 < 30 avem eantion de volum redus i pentru testare vom utiliza testul t.
tiind c pragul de semnificaie este = 0,05 i k = 2 (exist doi factori de influen) se stabilete:
valoarea critic: t critic = t
= t
= t 0,5 BILATERAL ;103 = t 0,5 BILATERAL ; 7 = 2,365
2

; n k 1

;n 3

regiunea de respingere: dac t calc > t


2

Statistica testului este: t calc = t b1 =

;n 3

sau t b1 > t
2

; n 3

atunci H0 se respinge

b1 0,974543752
=
= 6,437448
sb1 0,151386668

Decizia:
Se observ c parametrul 1 este semnificativ statistic deoarece:
 din compararea statisticii testului cu valoarea testului critic (tabelar sau teoretic) rezult c:
t c (6,4374 ) > t critic (2,365) ;
critic P-value b0 = 0,0003545 < = 0,05 pragul de semnificaie
 limita inferioar a intervalului de ncredere (lower 95% = + 0,616571165) este cu acelai semn ca
limita superioar a intervalului (upper 95% = + 1,3325163); intervalul de ncredere este
+ 0,616571165 1 + 1,3325163 ;
 pragul

III. Testarea semnificaiei parametrului 2 :


H0 :
2 = 0 ( 2 este zero, adic 2 nu este semnificativ diferit de zero, deci 2 nu este
semnificativ statistic)
H1 : 2 0, ( 2 nu este diferit de zero, adic 2 este semnificativ diferit de zero, deci 2 este
semnificativ statistic)
Deoarece n = 10 < 30 avem eantion de volum redus i pentru testare vom utiliza testul t.
tiind c pragul de semnificaie este = 0,05 i k = 2 (exist doi factori de influen) se stabilete:
valoarea critic: t critic = t
= t
= t 0,5 BILATERAL ;103 = t 0,5 BILATERAL ; 7 = 2,365
2

; n k 1

;n 3

regiunea de respingere: dac t calc > t


2

;n 3

sau t b 2 > t
2

; n 3

atunci H0 se respinge

Statistica testului este: t calc = t b 2 =

b2
0,104112437
=
= 1,694874
sb 2 0,061427843

Decizia:
Se observ c parametrul 2 nu este semnificativ statistic deoarece:
 din compararea statisticii testului cu valoarea testului critic (tabelar sau teoretic) rezult c:
t critic ( 2,365) < t b 2 (1,694874 ) < t critic (2,365)
critic P-value b2 = 0,1339 > = 0,05 pragul de semnificaie
 limita inferioar a intervalului de ncredere (lower 95% = - 0,04114133) este cu semn contrar fa de
limita superioar a intervalului (upper 95% = + 0,2493662); intervalul de ncredere este
0,04114133 2 0,2493662
 pragul

2 S se msoare intensitatea legturii dintre variabile folosind cu indicatorul adecvat, testnd


semnificaia acestora pentru un nivel de semnificaie 0,05.
SUMMARY OUTPUT
Regression Statistics
Multiple R
0,989430469
R Square
0,978972653
Adjusted R Square
0,97296484
Standard Error
2,377677944
Observations
10

Din tabel avem Multiple R (Raportul de corelaie): R = 0,989430469 (0,95;1) ceea ce nseamn
c legtura dintre vnzri, numr vnztori i suprafa comercial este foarte puternic.
Testarea semnificaiei raportului de corelaie:
Ipoteza nul H 0 : R = 0 (raportul de corelaie al colectivitii din care s-a extras eantionul de 10 uniti,
nu difer semnificativ de zero, deci nu este semnificativ statistic);
Ipoteza alternativ H1 : R 0 ( raportul de corelaie al colectivitii din care s-a extras eantionul de
10 uniti, difer semnificativ de zero, deci este semnificativ statistic);
tiind c pragul de semnificaie este = 0,05 i k = 2 (exist doi factori de influen) se stabilete:
valoarea critic: Ftabelar = F ; k ; n k 1 = F ; 2 ;n 2 1 = F0 , 05; 2 ; 7 = 4,96

regiunea de respingere: dac Fc > F ; k ; n k 1 , atunci H0 se respinge

Determinarea statisticii testului ( Fcalculat = Fc ) are la baz relaia:

Fc =

R2 n k 1
0,989432
7
0,97897 7

=
=
= 162,93
2
2
k
1 R
1 0,998943 2 1 0,97897 2

Concluzie:
Deoarece Fc (162,93) > F0 ,05; 1; 13 (4,96 ) , atunci H 0 se respinge, deci H1 se accept, ceea ce
nseamn c raportul de corelaie al colectivitii din care s-a extras eantionul de 10 uniti, difer
semnificativ de zero, deci este semnificativ statistic.

3 Ce pondere din variaia variabilei efect este explicat de variatia variabilei cauz?
SUMMARY OUTPUT
Regression Statistics
Multiple R
0,989430469
R Square
0,978972653
Adjusted R Square
0,97296484
Standard Error
2,377677944
Observations
10

Coeficientul de determinaie (R SQUARE - R 2 ) ne indic pondrea de influen a factorului ( x ) n variaia


rezultatului ( y )
R SQUARE -

R 2 = 0,978972653 ne arat c, 97,897% reprezint influena ambilor factori (numr

vnztori i suprafa) asupra variaiei vnzrilor.

OBSERVAIE !
Tabelul RESIDUAL OUTPUT cuprinde informaii privind
RESIDUAL OUTPUT
Predicted Vnzari
(bucati)

y
Observation
1
2
3
4
5
6
7
8
9
10

21,72772804
18,94574103
23,95162104
27,00841353
30,97316916
34,41736261
42,38440568
45,72448669
52,9627427
61,90432952

Residuals

ei = yi y i
0,272271963
1,054258965
-0,951621037
-1,008413534
-0,973169163
-2,417362606
2,61559432
4,275513315
-0,962742698
-1,904329524

S-ar putea să vă placă și