Sunteți pe pagina 1din 8

APLICAIE rezolvat - regresie liniar multipl

1. Se cunosc urmtoarele date privind vnzrile la produsul alimentar A, nregistrate n 10 uniti


comerciale:
Numrul curent al
unitii comerciale
1
2
3
4
5
6
7
8
9
10

Vnzri
(buci)
22
20
23
26
30
32
45
50
52
60

Numr vnztori
(persoane)
7
5
8
9
12
15
22
25
32
40

Suprafaa
comercial (mp)
98
90
110
130
140
145
156
160
164
175

Se cere:
1. S se determine modelul de regresie pe baza datelor din esantion i s se interpreteze parametrii
acesteia;

2. S se verifice validitatea modelului de regresie pentru un nivel de semnificaie 0,05;


3. S se arate cum se stabilesc( sau s se determine) intervalele de ncredere pentru parametrii
modelului liniar de regresie;
4. S se testeze semnificaia parametrilor modelului de regresie, pentru un nivel de semnificaie 0,05;
5. S se msoare intensitatea legturii dintre variabile folosind coeficientul de corelaie i raportul de
corelaie, testnd semnificaia acestora pentru un nivel de semnificaie 0,05;
6. Ce pondere din variaia variabilei efect este explicat de variatia variabilei cauz?
Rezolvare:
Notm cu :
Y - variabila vnzri.
X1 - variabila numrul vnztorilor,

X2 - variabila suprafaa comercial

yi = f ( x1i , x2i )
Vnzri =

f ( numr vnztori,

suprafa comercial )

y i y i ei
Numrul curent al
unitii comerciale
1
2
3
4
5
6
7
8
9
10

Vnzri
(buci)
Yi
22
20
23
26
30
32
45
50
52
60

Numr vnztori
(persoane)
X1i
7
5
8
9
12
15
22
25
32
40

Suprafaa
comercial (mp)
X2i
98
90
110
130
140
145
156
160
164
175

Rezolvare folosind EXCEL:


1.
2.
3.
4.

Introducei datele din tabel ncepnd din celula A1.


Apsai Tools-Data Analysis i Regression.
La Input Y Range selectai A1:A11. La Input X Range selectai B1:E11. Selectai Labels.
Dac dorii s calculai valorile reziduale, selectai Residuals. Apsai OK.

Se obin rezultatele:
SUMMARY OUTPUT
Regression Statistics
Multiple R
0,989430469
R Square
0,978972653
Adjusted R Square
0,97296484
Standard Error
2,377677944
Observations
10
ANOVA
df
Regression
2
Residual
7
Total
9
Coefficients

Intercept
Numar vanzatori
(persoane)
Suprafata comerciala
(mp)

SS
1842,426533
39,57346682
1882
Standard Error

MS
921,2133
5,653352

F
162,94991

Significance F

1,34817E-06

t Stat

P-value

Lower 95%

Upper 95%

4,702902918

6,18676278

0,760156

0,4719829

-9,926466387

19,332272

0,974543752

0,151386668

6,437448

0,0003545

0,616571165

1,3325163

0,104112437

0,061427843

1,694874

0,133923

-0,04114133

0,2493662

Predicted
Vnzari
(bucati)
21,72772804
18,94574103
23,95162104
27,00841353
30,97316916
34,41736261
42,38440568
45,72448669
52,9627427
61,90432952

Residuals
0,272271963
1,054258965
-0,951621037
-1,008413534
-0,973169163
-2,417362606
2,61559432
4,275513315
-0,962742698
-1,904329524

RESIDUAL OUTPUT
Observation
1
2
3
4
5
6
7
8
9
10

1 S se determine modelul de regresie pe baza datelor din esantion i s se interpreteze parametrii


acesteia

Modelul de regresie are n vedere stabilirea funciei de regresie

y x1 , x2 ,i b0 b1 x1i b2 x 2i
Coeficienii

Coefficients

Intercept
Numar vanzatori
(persoane)
Suprafata comerciala
(mp)

4,702902918

b0 termen liber

0,974543752

b1 coeficient de regresie (primul factor)

0,104112437

b2 coeficient de regresie (al doilea factor)

y x1 , x2 ,i 4,7029 0,9745 x1i 0,1041x 2i


intersecteaz axa
b0 termen liber NU ARE INTERPRETARE ECONOMICA; ne arat c funcia de regesie y

Oy n punctul 4,7029;

b1 0,9754 , ceea ce nsemn c creterea numrului de vnztori cu unul, vnzarea va crete cu 0,9745

buci;

b2 0,1041 ne arat c, la o cretere cu 1 mp a suprafeei comerciale, vnzarea va nregistra o cretere

cu 0,1041 buci.

2 S se verifice validitatea modelului de regresie pentru un nivel de semnificaie 0,05.


ANOVA
df
Regression
Residual
Total

Tabel 2 ---ANOVA
Regression
(variaia
datorat
regresiei)
Residual
(variaia
rezidual)
Total (variaia
total)

2
7
9

SS
1842,426533
39,57346682
1882

df
(grade de
libertate)

SS (variana)
(suma ptratelor)

df 1 k

2y / x

1842,426533

df 1 n k 1

39,57346682

df1 df 1 df 2
df 1 n 1

2y y / x e

2
e

MS
921,2133
5,653352

F
162,94991

MS
(media
patratelor)
(dispersia
corectat)

2
y/x

Significance F

1,34817E-06

F(calculat)

2y / x
k

921,2133

2e
s
n k 1
2
e

5,653352

Testul
F=162,94991
2
2
F= s y / x / se

Significance F

1,34817E-06
este
1,34817 10 6
este
0,00000134817
< 0,05
(se respinge H0
Modelul este valid)

1882

H0: modelul nu este valid statistic (mprtierea valorilor y t datorate factorului timp nu difer
semnificativ de mprtierea acelorai valori datorate ntmplrii)
H1: modelul este valid statistict
tiind c pragul de semnificaie este 0,05 i k 2 (exist doi factori de influen) se stabilete:
valoarea critic: Ftabelar F ; k ; n k 1 F ; 2; n 2 1 F0 , 05; 2; 7 4,96

regiunea de respingere: dac Fc F ; k ; n k 1 , atunci H0 se respinge


s y2 / x 921,2133
F
162,9499
Determinarea statisticii testului ( calculat ) are la baz relaia: F 2
5,6533
se

Decizia: deoarece Fcalculat (162,9499) F ; k ; n k 1 (4,96) H 0 se respinge, deci H 1 este


adevrat, prin urmare, modelul este valid.
7. S se arate cum se stabilesc( sau s se determine) intervalele de ncredere pentru parametrii
modelului liniar de regresie
Lower 95%
(limita inferioara)

Upper 95%
(limita superioara)

Intercept

-9,926466387
b0 t / 2; n k 1 s b 0

19,332272
b0 t / 2; n k 1 s b 0

Numar vanzatori
(persoane)

0,616571165
b1 t / 2; n k 1 s b1

1,3325163
b1 t / 2; n k 1 s b1

Suprafata
comerciala (mp)

-0,04114133
b2 t / 2; n k 1 s b 2

0,2493662
b 2 t / 2; n k 1 s b 2

Lower

Upper

Interval de ncredere pentru 0 :


b0 t / 2; n k 1 s b 0 0 b0 t / 2; n k 1 s b 0
b0 tBILATERAL ; n 3 s b 0 0 b0 tBILATERAL ; n 3 s b 0

b0 t 0,5 BILATERAL ; 7 s b 0 0 b0 t 0, 5 BILATERAL ; 7 s b 0

4,702902918 2,365 6,18676278 0 4,702902918 2,365 6,18676278

9,926466387 0 19,332272

Interval de ncredere pentru 1 :


b1 t / 2; n k 1 s b1 1 b1 t / 2; n k 1 s b1
b1 tBILATERAL ; n 3 s b1 1 b1 t BILATERAL ; n 3 s b1

b1 t 0 , 5 BILATERAL ; 7 s b1 1 b1 t 0, 5 BILATERAL ; 7 s b1

0,9745 43752 2,365 0,151386668 1 0,974543752 2,365 0,151386668


0,616571165 1 1,3325163

Interval de ncredere pentru 2 :

b2 t / 2; n k 1 s b 2 2 b2 t / 2; n k 1 s b 2

b2 tBILATERAL ; n 3 s b 2 2 b2 tBILATERAL ; n 3 s b 2

b2 t 0 ,5 BILATERAL ; 7 s b 2 2 b2 t 0 ,5 BILATERAL ; 7 s b 2

0,104112437 2,365 0,061427843 2 0,104112437 2,365 0,061427843


0,04114133 2 0,2493662

1 S se testeze semnificaia parametrilor modelului de regresie, pentru un nivel de semnificaie 0,05.


t Stat

P-value

Lower 95%

Upper 95%

Intercept
Numar vanzatori
(persoane)
Suprafata comerciala
(mp)

4,702902918

Coefficients

6,18676278

0,760156

0,4719829

-9,926466387

19,332272

0,974543752

0,151386668

6,437448

0,0003545

0,616571165

1,3325163

0,104112437

0,061427843

1,694874

0,133923

-0,04114133

0,2493662

Coefficients

Standard Error

t Stat

(Abaterea medie
patratica)

Testul t

Tabel 3

Intercept

Nr.vnz.

Supraf.
Com.

b0= 4,7029

b1= 0,9745

b2=0,1041

s b0

s b1

s b2

Standard Error

tb0
6,18676278

P-value

b0
sb 0

0,760156

t b1
0,151386668

b1
sb1

6,437448

tb2
0,06142784

b2
sb 2

Lower 95%
Limita inf. a
intervalului de
incredere

0,4719829>0,05
coeficientul b0
nu este semnificativ

b0 t / 2; n 3 s b 0

0,0003545<0,05
coeficientul b1
este
semnificativ

b1 t / 2; n 3 s b1

-9,926466387

0,616571165

0,133923>0,05
coeficientul b2
nu este semnificativ

1,694874

-0,04114133

b2 t / 2 ; n 3 s b 2

Upper 95%
Limita sup. a
intervalului de
incredere
19,332272

b0 t / 2; n 3 s b 0

1,3325163

b1 t / 2; n 3 s b1

0,2493662

b2 t / 2; n 3 s b 2

I. Testarea semnificaiei parametrului 0 :


H0 : 0 = 0 (panta 0 este zero, adic 0 nu este semnificativ diferit de zero, deci 0 nu este
semnificativ statistic)
H1 : 0 0, (panta 0 nu este diferit de zero, adic 0 este semnificativ diferit de zero, deci 0
este semnificativ statistic)
Deoarece n = 10 30 avem eantion de volum redus i pentru testare vom utiliza testul t.
tiind c pragul de semnificaie este 0,05 i k 2 (exist doi factori de influen) se stabilete:
t critic t

t 0 ,5 BILATERAL ;10 3 t 0, 5 BILATERAL ; 7 2,365

valoarea critic:

regiunea de respingere: dac t calc t ;n 3 sau t b 0 t ;n 3 atunci H0 se respinge

; n k 1

Statistica testului este: t calc t b 0

; n 3

b0
4,702902918

0,760156
s b 0 6,186766278

Decizia:
Se observ c parametrul 0 nu este semnificativ statistic deoarece:
din compararea statisticii testului cu valoarea testului critic (tabelar sau teoretic) rezult c:
t critic 2,365 t b 0 0,7602 t critic 2,365 ;
pragul critic P-value b0 = 0,4719829 > 0,05 pragul de semnificaie
limita inferioar a intervalului de ncredere (lower 95% = - 9,926466387) este cu semn contrar fa de
limita superioar a intervalului (upper 95% = + 19,332272); intervalul de ncredere este
9,926466387 0 19,332272 ;

II. Testarea semnificaiei parametrului 1 :


H0 : 1 = 0 (panta 1 este zero, adic 1 nu este semnificativ diferit de zero, deci 1 nu este
semnificativ statistic)

H1 :
1 0, (panta 1 nu este diferit de zero, adic 1 este semnificativ diferit de zero, deci 1
este semnificativ statistic)
Deoarece n = 10 30 avem eantion de volum redus i pentru testare vom utiliza testul t.
tiind c pragul de semnificaie este 0,05 i k 2 (exist doi factori de influen) se stabilete:
t critic t

t 0 ,5 BILATERAL ;10 3 t 0, 5 BILATERAL ; 7 2,365

valoarea critic:

regiunea de respingere: dac t calc t ;n 3 sau t b1 t ;n 3 atunci H0 se respinge

; n k 1

; n 3

Statistica testului este: t calc t b1

b
0,974543752
1
6,437448
sb1 0,151386668

Decizia:
Se observ c parametrul 1 este semnificativ statistic deoarece:
din compararea statisticii testului cu valoarea testului critic (tabelar sau teoretic) rezult c:
t c 6,4374 t critic 2,365 ;
critic P-value b0 = 0,0003545 < 0,05 pragul de semnificaie
limita inferioar a intervalului de ncredere (lower 95% = + 0,616571165) este cu acelai semn ca
limita superioar a intervalului (upper 95% = + 1,3325163); intervalul de ncredere este
0,616571165 1 1,3325163 ;
pragul

III. Testarea semnificaiei parametrului 2 :


H0 : 2 = 0 ( 2 este zero, adic 2 nu este semnificativ diferit de zero, deci 2 nu este
semnificativ statistic)
H1 : 2 0, ( 2 nu este diferit de zero, adic 2 este semnificativ diferit de zero, deci 2 este
semnificativ statistic)
Deoarece n = 10 30 avem eantion de volum redus i pentru testare vom utiliza testul t.
tiind c pragul de semnificaie este 0,05 i k 2 (exist doi factori de influen) se stabilete:
t critic t

t 0 ,5 BILATERAL ;10 3 t 0, 5 BILATERAL ; 7 2,365

valoarea critic:

regiunea de respingere: dac t calc t ;n 3 sau t b 2 t ;n 3 atunci H0 se respinge

; n k 1

Statistica testului este: t calc t b 2

; n 3

b2
0,104112437

1,694874
sb 2 0,061427843

Decizia:
Se observ c parametrul 2 nu este semnificativ statistic deoarece:
din compararea statisticii testului cu valoarea testului critic (tabelar sau teoretic) rezult c:
t critic 2,365 t b 2 1,694874 t critic 2,365
pragul critic P-value b2 = 0,1339 > 0,05 pragul de semnificaie
limita

inferioar a intervalului de ncredere (lower 95% = - 0,04114133) este cu semn contrar fa de


limita superioar a intervalului (upper 95% = + 0,2493662); intervalul de ncredere este
0,04114133 2 0,2493662

2 S se msoare intensitatea legturii dintre variabile folosind cu indicatorul adecvat, testnd


semnificaia acestora pentru un nivel de semnificaie 0,05.

SUMMARY OUTPUT
Regression Statistics
Multiple R
0,989430469
R Square
0,978972653
Adjusted R Square
0,97296484
Standard Error
2,377677944
Observations
10

Din tabel avem Multiple R (Raportul de corelaie): R 0,989430469 0,95;1 ceea ce


nseamn c legtura dintre vnzri, numr vnztori i suprafa comercial este foarte puternic.
Testarea semnificaiei raportului de corelaie:
Ipoteza nul H 0 : R 0 (raportul de corelaie al colectivitii din care s-a extras eantionul de 10 uniti,
nu difer semnificativ de zero, deci nu este semnificativ statistic);
Ipoteza alternativ H 1 : R 0 ( raportul de corelaie al colectivitii din care s-a extras eantionul de
10 uniti, difer semnificativ de zero, deci este semnificativ statistic);
tiind c pragul de semnificaie este 0,05 i k 2 (exist doi factori de influen) se stabilete:
valoarea critic: Ftabelar F ; k ; n k 1 F ; 2; n 2 1 F0 , 05; 2; 7 4,96
regiunea de respingere: dac Fc F ; k ; n k 1 , atunci H0 se respinge
Determinarea statisticii testului ( Fcalculat Fc ) are la baz relaia:
Fc

R2
n k 1
0,98943 2
7
0,97897 7


162,93
2
2
k
1 R
1 0,998943 2 1 0,97897 2

Concluzie:
Deoarece Fc (162,93) F0, 05; 1; 13 4,96 , atunci H 0 se respinge, deci H 1 se accept, ceea ce
nseamn c raportul de corelaie al colectivitii din care s-a extras eantionul de 10 uniti, difer
semnificativ de zero, deci este semnificativ statistic.

3 Ce pondere din variaia variabilei efect este explicat de variatia variabilei cauz?

Coeficientul

de

ne indic pondrea de influen a


rezultatului ( y )
R

SQUARE

SUMMARY OUTPUT
Regression Statistics
Multiple R
0,989430469
R Square
0,978972653
Adjusted R Square
0,97296484
Standard Error
2,377677944
Observations
10

determinaie (R SQUARE - R 2 )
factorului

(x)

variaia

R 2 0,978972653 ne arat c,

97,897% reprezint influena ambilor factori (numr vnztori i suprafa) asupra variaiei vnzrilor.

OBSERVAIE !
Tabelul RESIDUAL OUTPUT cuprinde informaii privind

RESIDUAL OUTPUT
Predicted Vnzari
(bucati)

y
Observation
1
2
3
4
5
6
7
8
9
10

21,72772804
18,94574103
23,95162104
27,00841353
30,97316916
34,41736261
42,38440568
45,72448669
52,9627427
61,90432952

Residuals

ei y i y i
0,272271963
1,054258965
-0,951621037
-1,008413534
-0,973169163
-2,417362606
2,61559432
4,275513315
-0,962742698
-1,904329524

S-ar putea să vă placă și