Sunteți pe pagina 1din 5

Pentru a decide n ce zon s fie amplasat un magazin de casete video, managerul unei firme de comercializare i nchiriere de casete video

realizeaz un studiu. Astfel, el consider c succesul afacerii este cuantificat prin profitul anual brut obinut (sute euro). Factorii, considerai determinani pentru succesului acestei afaceri, sunt: numrul de locuitori pe o raz de un kilometru (mii loc.) venitul mediu al locuitorilor de pe o raz de un kilometru (zeci euro) numrul competitorilor pe o raz de un kilometru preul unei casete video la nchiriere (euro)

Sunt selectate aleator 15 de supermarket-uri i sunt nregistrate valorile celor 5 variabile.


Profit 323,581 343,682 375,264 351,242 328,417 318,069 330,959 267,236 320,883 409,535 316,262 351,806 333,655 372,679 362,796 Nr. Loc. 5,556 5,917 5,483 6,4 5,917 6,683 6,065 7,491 6,284 5,851 5,681 5,187 6,164 7,32 5,062 Venit 42,746 43,106 46,993 43,249 40,695 41,253 40,791 39,932 36,826 45,3 42,645 42,306 44,842 45,233 41,426 Competitori 3 2 5 2 3 3 2 3 1 3 3 2 3 3 3 Pre 2,49 2,99 2,99 1,99 2,49 2,49 2,49 2,49 2,99 2,99 2,49 2,99 1,99 2,99 2,99

a) Analizai dependena dintre profitul obinut i cei 4 factori de influen cu ajutorul unui model de regresie (nivel de semnificaie de 5%). b) Analizai corelaiile dintre variabile. Rezolvare: a) Modelul liniar de regresie n eantion este: yi = b0 + b1xi1 + b2xi2 + b3xi3+ b4xi4+ ei Rezolvare folosind EXCEL: 1. Introducei datele din tabel ncepnd din celula A1. 2. Apsai Tools-Data Analysis i Regression. 3. La Input Y Range selectai A1:A16. La Input X Range selectai B1:E16. Selectai Labels. 4. Dac dorii s calculai valorile reziduale, selectai Residuals. Apsai OK. Se obin rezultatele:

SUMMARY OUTPUT Regression Statistics Raportul de corelatie multipla (R)

Multiple R

0,85879

Ry / x1 , x 2 , ..., x k =

( y

( y
i =1
n

i =1 n

y) y)

= 1
2

( y
i =1 n i =1

i ) y y)

( y

Coeficientul (gradul ) de determinaie R Square 0,737519

R2 =

SSR SSE = 1 = SST SST

(y

(y
i =1

i =1 n

y y

) )

Valoarea ajustat a coeficientului de determinaie Adjusted R Square 0,632527

2 = 1 SSE / n k 1 R SST / n 1

Abaterea medie ptratic a erorilor n eantion Standard Error 19,95674

se =
Observations 15

SSE = n2

(y
i =1

i ) 2 y

n2

Numarul observaiilor (n)

ANOVA Sursa variaiei Regression (variaia datorat regresiei) Residual (variaia rezidual) df (grade de libertate) 4 (k) SS (variana) (suma ptratelor) MS (media patratelor) (dispersia corectat)
2

F(calculat)

Significance F

i y SSR = y
i =1

=
11190,66123

MSR =

SSR k

=2797,665307
2

10 (n-k-1)

i ) SSE = ( y i y
i =1

MSE =

=
3982,716528

=398,2716528

SSE n k 1

Testul F=7,024515 F= MSR /

MSE

Total (variaia total)

14 (n-1)

SST = y i y
i =1

0,00584031< 0.05 (resping H0 model valid pentru o probabilitate de cel mult 100-0,58= 99,42%>95% )

=
15173,37776

s2 y =

SST n 1

Coefficients

Standard Error (Abaterea medie patratica)

t Stat Testul t

P-value

Lower 95% Limita inf. a intervalului de incredere -436,6620065 -27,61715833 4,99850612 -32,47090868 1,320067288

Upper 95% Limita sup. a intervalului de incredere 164,0904 8,154484 17,66211 3,575129 69,32325

Intercept Nr. Loc. Venit Competitori Pre

b0= -136,286 b1= -9,73134 b2=11,33031 b3= -14,4479 b4=35,32166

s b0 s b1 s b2 s b3 s b4

=134,8103572 =8,027247094 =2,841745705 =8,08882227 =15,26008696

t b0

= -1,010944678

0,335878>0,05 0,253266>0,05 0,002571<0,05 0,104378>0,05 0,043165<0,05

t b1 = -1,212288244

t b2 t b3 t b4

=3,987095005 = -1,786154907 =2,314643414

RESIDUAL OUTPUT Observation 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Predicted Profit 338.5796 371.2542 376.1748 332.8525 311.8281 310.6962 325.9235 287.8659 310.9763 382.3073 336.2188 369.2938 338.7504 367.2528 346.0917 Residuals -14.9986 -27.5722 -0.9108 18.3895 16.5889 7.3728 5.0355 -20.6299 9.9067 27.2277 -19.9568 -17.4878 -5.0954 5.4262 16.7043

Interpretare rezultate din tabelul SUMMARY OUTPUT: R= 0,85879 arat c ntre profitul anual i cele 4 variabile luate n studiu (nr. locuitori, venit, nr. competitori, pre) exist o legtur puternic. R2=0,737519 arat c 73% din variaia profitului este explicat de influena celor 4 variabile (nr. locuitori, venit, nr. competitori, pre). Abaterea medie ptratic a erorilor se = 19,95674. n cazul n care acest indicator este zero nseamn c toate punctele sunt pe dreapta de regresie. Interpretare rezultate din tabelul ANOVA: n acest tabel este calculat testul F pentru validarea modelului de regresie. ntruct F=7,024515, iar Significance F (pragul de semnificatie) este 0,00584031 (valoare mai mic de 0.05) atunci modelul de regresie construit este valid pentru o probabilitate de cel mult 100-0,58=99,42% i poate fi utilizat pentru analiza dependenei dintre variabilele precizate. Interpretare rezultate din tabel: Intercept este termenul liber, deci coeficientul b0 este -136,286. Termenul liber este punctul n care toate variabilele explicative sunt 0. Deci profitul care s-ar obine, dac nu ar fi nici un locuitor pe o raz de 1 Km, veniturile medii ale acestora ar fi zero, nu ar fi nici un competitor i nu s-ar plti nici o chirie pentru casetele nchiriate, ar fi de -136,286 sute euro. Deoarece tb0= - 1,010944678 iar pragul de semnificatie Pvalue este 0,335878>0,05 nseamn c acest coeficient este nesemnificativ (probabilitate de 10033,59=66,41%<95%, ct s-a stabilit iniial). De altfel, faptul c limita inferioar a intervalului de ncredere (-36,6620065 1 164,0904) pentru acest parametru este negativ, iar limita superioar este pozitiv arat c parametrul din colectivitatea general este aproximativ zero. Coeficientul b1 este 9,73134, ceea ce nsemn c la creterea numrului de locuitori cu 1000, profitul va creste cu 9,73134 sute euro. Deoarece t b1 = -1,212288244 iar pragul de semnificaie P-value este
3

0,253266>0,05 nseamn c acest coeficient este nesemnificativ (probabilitate 100-25,32=74,68%). De altfel, faptul c limita inferioar a intervalului de ncredere (-27,61715833 1 8,154484) pentru acest parametru este negativ, iar limita superioar este pozitiv arat c parametrul din colectivitatea general este aproximativ zero. Coeficientul b2 este 11,33031, ceea ce nseamn c la creterea venitului mediu al locuitorilor cu 10 euro profitul va crete cu 11,33031 sute euro. Deoarece b2 =3,987095005 iar pragul de semnificaie P-value este 0,002571<0,05 nseamn c acest coeficient este semnificativ (pentru o probabilitate de 1000,257=99,743%>95%). Intervalului de ncredere (4,99850612 2 17,66211) pentru acest parametru arat c dac managerul respectiv i deschide o firm de nchiriere i vnzare de casete video, atunci la o cretere a venitului mediu a unui locuitor din zon cu 10 euro, profitul va crete cu o valoare cuprins ntre aprox. 5 si 17.6 euro. Coeficientul b3 este -14,4479, ceea ce nseamn c la creterea numrului de competitori cu o unitate (adic 1000), profitul va scade cu 1 4,4479 sute euro. Deoarece b3 = -1,786154907 iar pragul de semnificaie P-value este 0,104378>0,05 nseamn c acest coeficient este nesemnificativ (probabilitate de 10010,4=89,6%<95%, stabilit iniial). De altfel faptul c limita inferioar a intervalului de ncredere (32,47090868 3 3,575129) pentru acest parametru este negativ, iar limita superioar este pozitiv arat c parametrul din colectivitatea general este aproximativ zero. Coeficientul b4 este 35,32166, ceea ce nseamn c la creterea preului pltit pentru nchirierea unei casete cu un euro, profitul va crete cu 35,32166 sute euro. Deoarece b4 =2,314643414 iar pragul de semnificaie P-value este 0,043165<0,05 nseamn c acest coeficient este semnificativ (pentru o probabilitate de 100-4,3=95,7%>95%, stabilit n problem). Intervalului de ncredere (1,320067288 4 69,32325) pentru acest parametru arat c dac managerul respectiv i deschide o firm de nchiriere i vnzare de casete video, atunci la o cretere a preului mediu pltit pentru nchirierea unei casete cu un euro profitul va crete cu o valoare cuprins ntre aprox. 1.32 si 69 euro. Observm c pentru variabilele nr. locuitori, i nr. competitori am obinut coeficieni de regresie nesemnificativi. b) Pentru calculul corelaiilor dintre variabile se parcurg paii: 1. 2. 3. 4. 5. Introducei datele din tabel ncepnd din celula A1. Apsai Tools-Data Analysis i Correlation. La Input Range selectai A1:E16. Selectai Grouped by: Columns Selectai Labels in first row. Apsai OK.

Se obin rezultatele urmtoare, sub forma matricei corelaiilor:


Yi Yi Xi1 Xi2 Xi3 Xi4 1 -0,39738 0,65407 6 0,22757 2 0,44885 4 Xi1 1 -0,15141 -0,10321 -0,25737 1 0,66545 7 0,02539 5 Xi2 Xi3 Xi4

1 0,03722 6

Dac studiem corelaiile existente ntre variabile observm c cea mai puternic corelaie (direct) este ntre Yi i Xi2, adic ntre profit i venitul mediu pe locuitor din zon (coeficient de corelaie: 0,665). Cea mai slab corelaie este ntre variabilele Yi i Xi3, adic ntre profit i numrul competitorilor (coeficientul de corelaie: 0,22).
4

De asemenea, se observ c profitul este invers corelat cu numrul de locuitori (coeficient de corelaie ntre variabilele Yi i Xi1 de -0,397).

TEMA
Pentru a decide zona de amplasare a unui nou magazin, managerul unui lan de supermarketuri realizeaz un studiu pe urmtoarele variabile: profitul anual brut obinut (sute euro), venitul mediu al locuitorilor din zon (sute euro) i numrul competitorilor pe o raz de un kilometru. n urma nregistrrii i prelucrrii datelor nregistrate de la 15 supermarketuri i n ipoteza unei dependene liniare ntre variabilele considerate, s-au obinut urmtoarele rezultate: Regression Statistics Multiple R . R Square . Adjusted R Square 0,423 Standard Error . Observations 15 ANOVA df Regression Residual Total Coefficient s . . -13,886 SS 15173,378 MS 625,607 F Significance F 0,015

Intercept Venit Competitori a)

Standard Error 133,661 3,538 10,134

t Stat -0,899 3,316 .

P-value 0,386 0,006 0,196

Lower 95% -411,388 4,024

Upper 95% 171,056 19,442 .

Scriei ecuaia de regresie care modeleaz legtura dintre cele trei variabile i interpretai valorile coeficienilor de regresie; b) Testai semnificaia statistic a ultimului parametru al modelului i determinai i interpretai intervalul su de ncredere (valoare critic: 2,179); c) Analizai dac modelul de regresie identificat este valid statistic, pentru un nivel de semnificaie de 5% (valoare critic: 3,88); d) Msurai intensitatea legturii dintre cele trei variabile; testai semnificaia statistic a indicatorului folosit.