Documente Academic
Documente Profesional
Documente Cultură
realizeaz un studiu. Astfel, el consider c succesul afacerii este cuantificat prin profitul anual brut obinut (sute euro). Factorii, considerai determinani pentru succesului acestei afaceri, sunt: numrul de locuitori pe o raz de un kilometru (mii loc.) venitul mediu al locuitorilor de pe o raz de un kilometru (zeci euro) numrul competitorilor pe o raz de un kilometru preul unei casete video la nchiriere (euro)
a) Analizai dependena dintre profitul obinut i cei 4 factori de influen cu ajutorul unui model de regresie (nivel de semnificaie de 5%). b) Analizai corelaiile dintre variabile. Rezolvare: a) Modelul liniar de regresie n eantion este: yi = b0 + b1xi1 + b2xi2 + b3xi3+ b4xi4+ ei Rezolvare folosind EXCEL: 1. Introducei datele din tabel ncepnd din celula A1. 2. Apsai Tools-Data Analysis i Regression. 3. La Input Y Range selectai A1:A16. La Input X Range selectai B1:E16. Selectai Labels. 4. Dac dorii s calculai valorile reziduale, selectai Residuals. Apsai OK. Se obin rezultatele:
Multiple R
0,85879
Ry / x1 , x 2 , ..., x k =
( y
( y
i =1
n
i =1 n
y) y)
= 1
2
( y
i =1 n i =1
i ) y y)
( y
R2 =
(y
(y
i =1
i =1 n
y y
) )
2 = 1 SSE / n k 1 R SST / n 1
se =
Observations 15
SSE = n2
(y
i =1
i ) 2 y
n2
ANOVA Sursa variaiei Regression (variaia datorat regresiei) Residual (variaia rezidual) df (grade de libertate) 4 (k) SS (variana) (suma ptratelor) MS (media patratelor) (dispersia corectat)
2
F(calculat)
Significance F
i y SSR = y
i =1
=
11190,66123
MSR =
SSR k
=2797,665307
2
10 (n-k-1)
i ) SSE = ( y i y
i =1
MSE =
=
3982,716528
=398,2716528
SSE n k 1
MSE
14 (n-1)
SST = y i y
i =1
0,00584031< 0.05 (resping H0 model valid pentru o probabilitate de cel mult 100-0,58= 99,42%>95% )
=
15173,37776
s2 y =
SST n 1
Coefficients
t Stat Testul t
P-value
Lower 95% Limita inf. a intervalului de incredere -436,6620065 -27,61715833 4,99850612 -32,47090868 1,320067288
Upper 95% Limita sup. a intervalului de incredere 164,0904 8,154484 17,66211 3,575129 69,32325
s b0 s b1 s b2 s b3 s b4
t b0
= -1,010944678
t b1 = -1,212288244
t b2 t b3 t b4
RESIDUAL OUTPUT Observation 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Predicted Profit 338.5796 371.2542 376.1748 332.8525 311.8281 310.6962 325.9235 287.8659 310.9763 382.3073 336.2188 369.2938 338.7504 367.2528 346.0917 Residuals -14.9986 -27.5722 -0.9108 18.3895 16.5889 7.3728 5.0355 -20.6299 9.9067 27.2277 -19.9568 -17.4878 -5.0954 5.4262 16.7043
Interpretare rezultate din tabelul SUMMARY OUTPUT: R= 0,85879 arat c ntre profitul anual i cele 4 variabile luate n studiu (nr. locuitori, venit, nr. competitori, pre) exist o legtur puternic. R2=0,737519 arat c 73% din variaia profitului este explicat de influena celor 4 variabile (nr. locuitori, venit, nr. competitori, pre). Abaterea medie ptratic a erorilor se = 19,95674. n cazul n care acest indicator este zero nseamn c toate punctele sunt pe dreapta de regresie. Interpretare rezultate din tabelul ANOVA: n acest tabel este calculat testul F pentru validarea modelului de regresie. ntruct F=7,024515, iar Significance F (pragul de semnificatie) este 0,00584031 (valoare mai mic de 0.05) atunci modelul de regresie construit este valid pentru o probabilitate de cel mult 100-0,58=99,42% i poate fi utilizat pentru analiza dependenei dintre variabilele precizate. Interpretare rezultate din tabel: Intercept este termenul liber, deci coeficientul b0 este -136,286. Termenul liber este punctul n care toate variabilele explicative sunt 0. Deci profitul care s-ar obine, dac nu ar fi nici un locuitor pe o raz de 1 Km, veniturile medii ale acestora ar fi zero, nu ar fi nici un competitor i nu s-ar plti nici o chirie pentru casetele nchiriate, ar fi de -136,286 sute euro. Deoarece tb0= - 1,010944678 iar pragul de semnificatie Pvalue este 0,335878>0,05 nseamn c acest coeficient este nesemnificativ (probabilitate de 10033,59=66,41%<95%, ct s-a stabilit iniial). De altfel, faptul c limita inferioar a intervalului de ncredere (-36,6620065 1 164,0904) pentru acest parametru este negativ, iar limita superioar este pozitiv arat c parametrul din colectivitatea general este aproximativ zero. Coeficientul b1 este 9,73134, ceea ce nsemn c la creterea numrului de locuitori cu 1000, profitul va creste cu 9,73134 sute euro. Deoarece t b1 = -1,212288244 iar pragul de semnificaie P-value este
3
0,253266>0,05 nseamn c acest coeficient este nesemnificativ (probabilitate 100-25,32=74,68%). De altfel, faptul c limita inferioar a intervalului de ncredere (-27,61715833 1 8,154484) pentru acest parametru este negativ, iar limita superioar este pozitiv arat c parametrul din colectivitatea general este aproximativ zero. Coeficientul b2 este 11,33031, ceea ce nseamn c la creterea venitului mediu al locuitorilor cu 10 euro profitul va crete cu 11,33031 sute euro. Deoarece b2 =3,987095005 iar pragul de semnificaie P-value este 0,002571<0,05 nseamn c acest coeficient este semnificativ (pentru o probabilitate de 1000,257=99,743%>95%). Intervalului de ncredere (4,99850612 2 17,66211) pentru acest parametru arat c dac managerul respectiv i deschide o firm de nchiriere i vnzare de casete video, atunci la o cretere a venitului mediu a unui locuitor din zon cu 10 euro, profitul va crete cu o valoare cuprins ntre aprox. 5 si 17.6 euro. Coeficientul b3 este -14,4479, ceea ce nseamn c la creterea numrului de competitori cu o unitate (adic 1000), profitul va scade cu 1 4,4479 sute euro. Deoarece b3 = -1,786154907 iar pragul de semnificaie P-value este 0,104378>0,05 nseamn c acest coeficient este nesemnificativ (probabilitate de 10010,4=89,6%<95%, stabilit iniial). De altfel faptul c limita inferioar a intervalului de ncredere (32,47090868 3 3,575129) pentru acest parametru este negativ, iar limita superioar este pozitiv arat c parametrul din colectivitatea general este aproximativ zero. Coeficientul b4 este 35,32166, ceea ce nseamn c la creterea preului pltit pentru nchirierea unei casete cu un euro, profitul va crete cu 35,32166 sute euro. Deoarece b4 =2,314643414 iar pragul de semnificaie P-value este 0,043165<0,05 nseamn c acest coeficient este semnificativ (pentru o probabilitate de 100-4,3=95,7%>95%, stabilit n problem). Intervalului de ncredere (1,320067288 4 69,32325) pentru acest parametru arat c dac managerul respectiv i deschide o firm de nchiriere i vnzare de casete video, atunci la o cretere a preului mediu pltit pentru nchirierea unei casete cu un euro profitul va crete cu o valoare cuprins ntre aprox. 1.32 si 69 euro. Observm c pentru variabilele nr. locuitori, i nr. competitori am obinut coeficieni de regresie nesemnificativi. b) Pentru calculul corelaiilor dintre variabile se parcurg paii: 1. 2. 3. 4. 5. Introducei datele din tabel ncepnd din celula A1. Apsai Tools-Data Analysis i Correlation. La Input Range selectai A1:E16. Selectai Grouped by: Columns Selectai Labels in first row. Apsai OK.
1 0,03722 6
Dac studiem corelaiile existente ntre variabile observm c cea mai puternic corelaie (direct) este ntre Yi i Xi2, adic ntre profit i venitul mediu pe locuitor din zon (coeficient de corelaie: 0,665). Cea mai slab corelaie este ntre variabilele Yi i Xi3, adic ntre profit i numrul competitorilor (coeficientul de corelaie: 0,22).
4
De asemenea, se observ c profitul este invers corelat cu numrul de locuitori (coeficient de corelaie ntre variabilele Yi i Xi1 de -0,397).
TEMA
Pentru a decide zona de amplasare a unui nou magazin, managerul unui lan de supermarketuri realizeaz un studiu pe urmtoarele variabile: profitul anual brut obinut (sute euro), venitul mediu al locuitorilor din zon (sute euro) i numrul competitorilor pe o raz de un kilometru. n urma nregistrrii i prelucrrii datelor nregistrate de la 15 supermarketuri i n ipoteza unei dependene liniare ntre variabilele considerate, s-au obinut urmtoarele rezultate: Regression Statistics Multiple R . R Square . Adjusted R Square 0,423 Standard Error . Observations 15 ANOVA df Regression Residual Total Coefficient s . . -13,886 SS 15173,378 MS 625,607 F Significance F 0,015
Scriei ecuaia de regresie care modeleaz legtura dintre cele trei variabile i interpretai valorile coeficienilor de regresie; b) Testai semnificaia statistic a ultimului parametru al modelului i determinai i interpretai intervalul su de ncredere (valoare critic: 2,179); c) Analizai dac modelul de regresie identificat este valid statistic, pentru un nivel de semnificaie de 5% (valoare critic: 3,88); d) Msurai intensitatea legturii dintre cele trei variabile; testai semnificaia statistic a indicatorului folosit.