Sunteți pe pagina 1din 8

APLICAIE rezolvat - regresie liniar multipl Se cunosc urmtoarele date privind vnzrile la produsul alimentar A, nregistrate n 10 uniti comerciale:

Numrul curent al unitii comerciale 1 2 3 4 5 6 7 8 9 10 Vnzri (buci) 22 20 23 26 30 32 45 50 52 60 Numr vnztori (persoane) 7 5 8 9 12 15 22 25 32 40 Suprafaa comercial (mp) 98 90 110 130 140 145 156 160 164 175

1. 2. 3. 4. 5. 6.

Se cere: S se determine modelul de regresie pe baza datelor din eantion interpretnd parametrii acesteia; S se verifice validitatea modelului de regresie (probabilitatea de garantare a rezultatelor de 95%); S se arate cum se stabilesc (s se determine) intervalele de ncredere pentru parametrii modelului liniar de regresie; S se testeze semnificaia parametrilor modelului de regresie, pentru un nivel de semnificaie 0,05; S se msoare intensitatea legturii dintre variabile folosind coeficientul de corelaie i raportul de corelaie, testnd semnificaia acestora pentru un nivel de semnificaie 0,05; Care este proporia n care cei doi factori (numr vnztori i suprafaa comercial) influeneaz variaia vnzrii? Rezolvare: Notm cu : Y - variabila vnzri. X1 - variabila numrul vnztorilor, X2 - variabila suprafaa comercial yi = f ( x1i , x2i ) Vnzri = f ( numr vnztori, suprafa comercial )

y i = y i + ei
Numrul curent al unitii comerciale 1 2 3 4 5 6 7 8 9 10 Rezolvare folosind EXCEL: Vnzri (buci) Yi 22 20 23 26 30 32 45 50 52 60 Numr vnztori (persoane) X1i 7 5 8 9 12 15 22 25 32 40 Suprafaa comercial (mp) X2i 98 90 110 130 140 145 156 160 164 175

1. 2. 3. 4. 5.

Introducei datele din tabel ncepnd din celula A1 (prima coloan cu vnzri: A1-A11; a doua coloan cu numr vnztori: B1B11; a treia coloan cu suprafa a comrcial: C1-C11). Apsai Tools sau Data, apoi -Data Analysis i Regression. La Input Y Range selectai toat coloana de la A1 la A11. La Input X Range selectai ambele coloane simultan de la B1C1la B11C11. Selectai Labels. Dac dorii s calculai valorile reziduale, selectai Residuals.

6.

Apsai OK.

Se obin rezultatele: SUMMARY OUTPUT Regression Statistics Multiple R 0,989430469 R Square 0,978972653 Adjusted R Square 0,97296484 Standard Error 2,377677944 Observations 10 ANOVA df Regression 2 Residual 7 Total 9 Coefficients 4,702902918 0,974543752 0,104112437

SS 1842,426533 39,57346682 1882 Standard Error 6,18676278 0,151386668 0,061427843

MS 921,2133 5,653352

F 162,94991

Significance F 1,34817E-06

Intercept Numr vnztori (persoane) Suprafaa comercial (mp)

t Stat 0,760156 6,437448 1,694874

P-value 0,4719829 0,0003545 0,133923

Lower 95% -9,926466387 0,616571165 -0,04114133

Upper 95% 19,332272 1,3325163 0,2493662

RESIDUAL OUTPUT Predicted Vnzari y i (bucti) 21,72772804 18,94574103 23,95162104 27,00841353 30,97316916 34,41736261 42,38440568 45,72448669 52,9627427 61,90432952 Residuals

Observation 1 2 3 4 5 6 7 8 9 10

ei
0,272271963 1,054258965 -0,951621037 -1,008413534 -0,973169163 -2,417362606 2,61559432 4,275513315 -0,962742698 -1,904329524

S se determine modelul de regresie pe baza datelor din eantion interpretnd parametrii acesteia

Modelul de regresie are n vedere stabilirea funciei de regresie

y x1 , x2 ,i = b0 + b1 x1i + b2 x 2i
Coefficients Intercept Numr vnztori (persoane) Suprafaa comercial (mp) 4,702902918 0,974543752 0,104112437 Coeficienii

b0

termen liber

b1 coeficient de regresie (primul factor) b2 coeficient de regresie (al doilea factor)

y x1 , x2 ,i = 4,7029 + 0,9745 x1i + 0,1041x 2i b0


termen liber NU ARE INTERPRETARE ECONOMIC; ne arat c funcia de regesie

y intersecteaz axa Oy n punctul 4,7029;

b1 = +0,9754 , ceea ce nsemn c o cretere a numrului de vnztori cu unul, determin o cretere a vnzrii cu 0,9745 buci; b2 = +0,1041 ne arat c, la o cretere cu 1 mp a suprafeei comerciale, vnzarea va nregistra o cretere cu 0,1041 buci. 2
S se verifice validitatea modelului de regresie (probabilitatea de garantare a rezultatelor de 95%).

ANOVA df Regression Residual Total Tabel 2 ---ANOVA Regression (variaia datorat regresiei) Residual (variaia rezidual) Total (variaia total) df (grade de libertate) 2 7 9 SS 1842,426533 39,57346682 1882 MS 921,2133 5,653352 F 162,94991 Significance F 1,34817E-06

SS (variana) (suma ptratelor)

MS (media patratelor) (dispersia corectat)

F(calculat)

Significance F 1,34817E-06 este

df R = k
2

SSR
1842,426533

MSR = MSE =

SSR k

921,2133

Testul

df E = n k 1
7

SSE
39,57346682

5,653352

SSE n k 1

1,34817 10 6
este 0,00000134817 < = 0,05 (se respinge H0 Modelul este valid)

MSR =

MSR MSE

df T = df R + df E
df T = n 1
9

F=162,94991

SST = SSR + SST


1882

H0: modelul nu este valid (mprtierea valorilor y t datorate factorului timp nu difer semnificativ de mprtierea acelorai valori datorate ntmplrii) H1: modelul este valid tiind c pragul de semnificaie este = 0,05 i k = 2 (exist doi factori de influen: numr vnztori i suprafaa comercial) se stabilete:

valoarea critic:

Fcritic = F ; k ; n k 1 = F ; 2;n 21 = F0,05; 2; 7 = 4,96 Fc > F ; k ; nk 1 , atunci H0 se respinge F=

regiunea de respingere: dac

Determinarea statisticii testului ( Fcalculat ) are la baz relaia: Decizia: deoarece valid.

Fcalculat (162,9499) > F ; k ; nk 1

MSR 921,2133 = = 162,9499 MSE 5,6533 (4,96) H 0 se respinge, deci H 1 este adevrat, prin urmare, modelul este

3.

S se arate cum se stabilesc (s se determine) intervalele de ncredere pentru parametrii modelului liniar de regresie Lower 95% (limita inferioar) Intercept Upper 95% (limita superioar)

b0 t / 2;n k 1 s b 0
0,616571165

-9,926466387

b0 + t / 2;n k 1 s b 0
1,3325163

19,332272

Numr vnztori (persoane)

b1 t / 2;n k 1 s b1
-0,04114133

b1 + t / 2; n k 1 s b1
0,2493662

Suprafata comercial (mp)

b2 t / 2;n k 1 s b 2

b 2 + t / 2;n k 1 s b 2

Lower Upper
Interval de ncredere pentru

0 :
b0 t / 2; n k 1 sb 0 0 b0 + t / 2; n k 1 sb 0 b0 t ( B ); n 3 sb 0 0 b0 + t ( B ); n 3 sb 0 b0 t 0,5( B ); 7 sb 0 0 b0 + t 0,5( B ); 7 sb 0

4,702902918 2,365 6,18676278 0 4,702902918 + 2,365 6,18676278 9,926466387 0 19,332272 Interval de ncredere pentru 1 : b1 t / 2; n k 1 sb1 1 b1 + t / 2; n k 1 sb1 b1 t ( B ); n 3 sb1 1 b1 + t ( B ); n 3 sb1 b1 t 0,5( B ); 7 sb1 1 b1 + t 0,5( B ); 7 sb1 0,9745 43752 2,365 0,151386668 1 0,974543752 + 2,365 0,151386668 0,616571165 1 1,3325163

Interval de ncredere pentru

2 :

b2 t / 2; n k 1 sb 2 2 b2 + t / 2; n k 1 sb 2 b2 t ( B ); n 3 sb 2 2 b2 + t ( B ); n 3 sb 2 b2 t 0,5( B ); 7 sb 2 2 b2 + t 0,5( B ); 7 sb 2

0,104112437 2,365 0,061427843 2 0,104112437 + 2,365 0,061427843 0,04114133 2 0,2493662 4.


S se testeze semnificaia parametrilor modelului de regresie (probabilitatea de garantare a rezultatelor de 95%). Coefficients 4,702902918 0,974543752 0,104112437 Standard Error 6,18676278 0,151386668 0,061427843 t Stat 0,760156 6,437448 1,694874 P-value 0,4719829 0,0003545 0,133923 Lower 95% -9,926466387 0,616571165 -0,04114133 Upper 95% 19,332272 1,3325163 0,2493662

Intercept Numr vnztori (persoane) Suprafaa comercial (mp)

Coefficients Tabel 3

Standard Error (Abaterea medie ptratic)

t Stat Statistica testului t (

P-value Probabilitatea critic

Lower 95% Limita inferioar. a intervalului de incredere

Upper 95% Limita suerioar. a intervalului de incredere

t calculat ) t b0 = b0 sb0 b1 sb1

b0 Intercept 4,7029

sb0
6,18676278

0,760156

0,4719829 > 0,05 coeficientul b0 nu este semnificativ

b0 t / 2; n3 sb0
-9,926466387

b0 + t / 2; n3 sb0
19,332272

Numr vnztori

b1 0,9745

sb1
0,151386668

t b1 =

6,437448

0,0003545 < 0,05 coeficientul b1 este semnificativ

b1 t / 2; n 3 sb1
0,616571165

b1 + t / 2; n3 sb1
1,3325163

Suprafa comercial

b2 0,1041

sb2
0,06142784

t b2 =

b2 sb2

1,694874

0,133923 > 0,05 coeficientul b2 nu este semnificativ

b2 t / 2; n3 sb2
-0,04114133

b2 + t / 2; n3 sb2
0,2493662

Testarea semnificaiei parametrului 0 (termen liber): Criteriul I - compararea statisticii testului cu valoarea testului critic

I.

H0 :

0 = 0

(panta

este zero, adic

nu este semnificativ diferit de zero, deci

0
H1 :

nu este semnificativ statistic)

0, (panta

nu este diferit de zero, adic

este semnificativ diferit de zero, deci

este semnificativ statistic)

Deoarece n = 10 < 30 avem eantion de volum redus i pentru testare vom utiliza testul t. tiind c pragul de semnificaie este = 0,05 i k = 2 (exist doi factori de influen) se stabilete:

valoarea critic:

t critic = t
2

;n k 1

= t
2

;n 3

= t 0,5( B );103 = t 0,5( B ); 7 = 2,365


sau

regiunea de respingere: dac

t calc > t
2

;n 3

tb0 > t
2

; n 3

atunci H0 se respinge

Statistica testului este: Decizia: rezult c:

t calc. = t b 0 =

b0 4,702902918 = = 0,760156 sb 0 6,186766278

Se observ c parametrul

0 nu este semnificativ statistic deoarece din compararea statisticii testului cu valoarea testului critic t critic ( 2,365) < t b 0 ( 0,7602 ) < t critic ( 2,365) ;
= 0,05 )
nu este semnificativ statistic

Criteriul II - compararea probabilitii critice cu pragul de semnificaie ( n aplicaie, P-valueb0 = 0,4719829 >

= 0,05 pragul de semnificaie, deci 0

Criteriul III compararea semnelor limitelor intervalului de ncredere Decizia: deoarece limita inferioar a intervalului de ncredere (lower 95% = - 9,926466387) este cu semn contrar fa de limita superioar a intervalului (upper 95% = + 19,332272), n contextul unui interval de ncredere atunci parametrul

9,926466387 0 19,332272 ,

nu este semnificativ statistic;

II. Testarea semnificaiei parametrului H0 :

1 (coeficient de regresie):

Criteriul I - compararea statisticii testului cu valoarea testului critic

1 = 0

(panta

H1 :

1
1

este zero, adic

nu este semnificativ diferit de zero, deci

nu este semnificativ statistic)

0, (panta

nu este diferit de zero, adic

este semnificativ diferit de zero, deci

este semnificativ statistic)

Deoarece n = 10 < 30 avem eantion de volum redus i pentru testare vom utiliza testul t. tiind c pragul de semnificaie este = 0,05 i k = 2 (exist doi factori de influen) se stabilete:

valoarea critic:

t critic = t
2

;n k 1

= t
2

;n 3

= t 0,5( B );103 = t 0,5( B ); 7 = 2,365


sau

regiunea de respingere: dac

t calc > t
2

;n 3

t b1 > t
2

; n 3 atunci

H0 se respinge

Statistica testului este: Decizia:

t calc = t b1 =

b1 0,974543752 = = 6,437448 sb1 0,151386668

1 este rezult c: t c ( 6,4374 ) > t critic ( 2,365) ;


Se observ c parametrul

semnificativ statistic deoarece, din compararea statisticii testului cu valoarea testului critic

Criteriul II - compararea probabilitii critice cu pragul de semnificaie ( n aplicaie, pragul critic P-value b0 = 0,0003545 <

= 0,05 )
este semnificativ statistic

= 0,05 pragul de semnificaie, deci 1

Criteriul III compararea semnelor limitelor intervalului de ncredere Decizia: deoarece limita inferioar a intervalului de ncredere (lower 95% = + 0,616571165) este cu acelai semn ca limita superioar a intervalului (upper 95% = + 1,3325163); intervalul de ncredere este atunci 1 este semnificativ statistic

+ 0,616571165 1 + 1,3325163

III. Testarea semnificaiei parametrului

2 :

Criteriul I - compararea statisticii testului cu valoarea testului critic H0 : H1 :

2 = 0 ( 2 este zero, adic 2 nu este semnificativ diferit de zero, deci 2 nu este semnificativ statistic) 2 0, ( 2 nu este diferit de zero, adic 2 este semnificativ diferit de zero, deci 2 este semnificativ statistic)
t critic = t
2

Deoarece n = 10 < 30 avem eantion de volum redus i pentru testare vom utiliza testul t. tiind c pragul de semnificaie este = 0,05 i k = 2 (exist doi factori de influen) se stabilete:

valoarea critic:

;n k 1

= t
2

;n 3

= t 0,5( B );103 = t 0,5( B ); 7 = 2,365


sau

regiunea de respingere: dac

t calc > t
2

;n 3

tb2 > t
2

;n 3

atunci H0 se respinge

Statistica testului este: Decizia:

t calc = t b 2 =

b2 0,104112437 = = 1,694874 sb 2 0,061427843

Se observ c parametrul (tabelar sau teoretic) rezult c:

nu este semnificativ statistic deoarece din compararea statisticii testului cu valoarea testului critic

t critic ( 2,365) < t b 2 (1,694874 ) < t critic ( 2,365) = 0,05 )


nu este semnificativ statistic

Criteriul II - compararea probabilitii critice cu pragul de semnificaie ( n aplicaie, pragul critic P-value b2 = 0,1339 >

= 0,05 pragul de semnificaie, deci 2

Criteriul III compararea semnelor limitelor intervalului de ncredere Decizia: deoarece limita inferioar a intervalului de ncredere (lower 95% = - 0,04114133) este cu semn contrar fa de limita superioar a intervalului (upper 95% = + 0,2493662); intervalul de ncredere este este semnificativ statistic

0,04114133 2 0,2493662 atunci 2

nu

5.

S se msoare intensitatea legturii dintre variabile folosind cu indicatorul adecvat, testnd semnificaia acestora pentru un nivel de semnificaie 0,05. SUMMARY OUTPUT Regression Statistics Multiple R (R) 0,989430469 R Square (R2) 0,978972653 Adjusted R Square 0,97296484 Standard Error 2,377677944 Observations 10

Din tabel avem Multiple R (Raportul de corelaie):

R = 0,989430469 ( 0,95;1)

ceea ce nseamn c, legtura dintre

vnzri, numr vnztori i suprafa comercial este foarte puternic.

Testarea semnificaiei raportului de corelaie: Ipoteza nul

H0 : R = 0

(raportul de corelaie al colectivitii din care s-a extras eantionul de 10 uniti, nu difer semnificativ de

zero, deci nu este semnificativ statistic); Ipoteza alternativ de zero, deci este semnificativ statistic);

H 1 : R 0 ( raportul de corelaie al colectivitii din care s-a extras eantionul de 10 uniti, difer semnificativ

tiind c pragul de semnificaie este


valoarea critic:

= 0,05 i k = 2 (exist doi factori de influen) se stabilete: Ftabelar = F ; k ; n k 1 = F ; 2;n 21 = F0, 05; 2; 7 = 4,96
Fc > F ; k ; nk 1 , atunci H0 se respinge = Fc ) are la baz relaia:

regiunea de respingere: dac

Determinarea statisticii testului ( Fcalculat

Fc =
Concluzie: Deoarece Fc

R2 n k 1 0,98943 2 7 0,97897 7 = = = 162,93 2 2 k 1 R 1 0,998943 2 1 0,97897 2


, atunci

(162,93) > F0,05; 1; 13 ( 4,96 )

H 0 se

respinge, deci

H1

se accept, ceea ce nseamn c raportul de

corelaie al colectivitii din care s-a extras eantionul de 10 uniti, difer semnificativ de zero, deci este semnificativ statistic.

6.

Care este propor ia n care cei doi factori (numr vnztori i suprafa a comercial) influen eaz variaia vnzrii? SUMMARY OUTPUT Regression Statistics Multiple R 0,989430469 R Square 0,978972653 Adjusted R Square 0,97296484 Standard Error 2,377677944 Observations 10

Coeficientul de determinaie (R SQUARE -

R2 ) y ),

ne indic pondrea de

influen a factorului ( x ) n variaia rezultatului ( adic proporia n care

factorii influeneaz variaia rezultatului. R SQUARE -

R 2 = 0,978972653

ne arat c 97,897% reprezint influena ambilor factori (numr vnztori i suprafa)

asupra variaiei vnzrilor. OBSERVAIE ! Tabelul RESIDUAL OUTPUT cuprinde informaii privind valorile funciei de regresie i a erorilor corespunztoare acestui model de regresie liniar multifactorial RESIDUAL OUTPUT Predicted Vnzari (bucati) Residuals

y
Observation 1 2 3 4 5 6 7 8 9 21,72772804 18,94574103 23,95162104 27,00841353 30,97316916 34,41736261 42,38440568 45,72448669 52,9627427

ei = y i y i
0,272271963 1,054258965 -0,951621037 -1,008413534 -0,973169163 -2,417362606 2,61559432 4,275513315 -0,962742698

10

61,90432952

-1,904329524

S-ar putea să vă placă și