Sunteți pe pagina 1din 14

1.

Folosind tehnica verificrii ipotezelor statistice, stabilii dac exist vreo diferen semnificativ ntre preul caselor din zona Cotroceni i cel al caselor din zona Foiorul de Foc. Pentru a decide dac exista vreo diferenta semnificativa ntre preul caselor din zona Cotroceni i preul caselor din zona Foiorul de Foc, am aplicat testul privind diferena a dou medii pentru eantioane de volum mare,cu dispersii necunoscute,presupuse egale, t-Test for Two-Sample Assuming Equal Variances. Ipotezele folosite au fost :

H 0 : 1 3 = 0 H A : 1 3 0
3 reprezinta estimatorul diferenei dintre x1 i 3 , mediile unde 1 eantioanelor, preurile caselor din zona Cotroceni, si preurile caselor din zona Foiorul de Foc. Regula de decizie a acestui test este:

t < t critic = >acceptH 0 t t critic = >respingH 0


Dupa aplicarea testului t, s-a obinut variabila t stat = 5,6749. Deoarece 2, rezult :

t critic =

0 , asadar exist t stat = 5,6749> critic = 2 =>se respinge ipoteza nul diferen semnificativ ntre preul caselor din zona Cotroceni i din zona Foiorul de Foc.

t-Test: Two-Sample Assuming Equal Variances cotrocen i 389.849 3 14493.2 9 30 8758.01 8 0 58 5.67495 6 2.33E-07 1.67155 3 4.65E-07 2.00171 7 foisor de foc 252.723333 3 3022.74047 1 30

Mean Variance Observations Pooled Variance Hypothesized Mean Difference df t Stat P(T<=t) one-tail t Critical one-tail P(T<=t) two-tail t Critical two-tail

2. Folosind metodologia ANOVA, stabilii dac zona este un

factor semnificativ de influen al preului de vnzare. Ca sa putem decide dac zona reprezinta un factor semnificativ de influen asupra preului, am aplicat modelul de analiz dispersional unifactorial ANOVA: Single Factor. Am folosit urmtoarele ipoteze :

H 0 : 1 = 2 = 3 H A : nonH 0
unde 1 2 3 sunt estimatorii mediilor preurilor de vnzare a caselor din cele 3 zone. Regula de decizie pentru ANOVA este:

, ,

Fcalculat Fcrit = >acceptH 0 Fcalculat > Fcrit = >respingH 0


n urma aplicrii modelului ANOVA, am obinut variabila F=56. De asemenea,

Fcrit =3,101, rezult:

Fcalculat = 56 > Fcrit = 3,101 => se respinge ipoteza nul H 0 , ceea ce

inseamna ca mediile preurilor celor 3 zone prezinta diferente semnificative.Asadar zona este un factor semnificativ care influeneaza a preul vnzarii caselor. Anova: Single Factor SUMMARY Groups cotroceni p vict foisor

Count 30 30 30

Sum 11695.4 8 17806.4 7581.7

Average 389.849 3 593.546 7 252.723 3

Variance 14493.2 9 29743.1 4 3022.74

ANOVA Source of Variation Between Groups Within Groups Total

SS 176456 7 137051 6 313508 3

df 2 87 89

MS 882283. 4 15753.0 6

F 56.0071 2

P-value 2.33E16

F crit 3.10129 6

3. Alegei una dintre cele trei zone i stabilii dac suprafaa casei, suprafaa terenului, precum i numrul de camere influeneaz semnificativ preul de vnzare, construind pentru fiecare caz n parte cte un model de regresie liniar simpl. Am ales zona Piaa Victoriei pentru a putea observa dac suprafaa casei,

suprafaa terenului, precum i numrul de camere au vreo influenta semnificativa asupra preul. Forma general a unui model de regresie liniar este urmatoarea: Yi=b0 + b1*xi + i Unde: Yi, xi sunt valorile numerice ale variabilelor efect i cauz variabile nregistrate la nivelul unitii statistice i, iar b0 i b1 sunt parametrii ai ecuaiei de regresie. Pentru problema noastra, variabila efect este preul,in timpce variabilele cauzale sunt reprexentate de suprafaa casei, suprafaa terenului i numrul de camere, modelul general fiind: Pi = b0 + b1*Suprcasa + b2*Suprteren + b3*Nrcamere + i Acum vom arta ct de mult variabilele influenteaza preul caselor din Cotroceni. a) Suprafaa casei Pentru a putea gasi dependena dintre pre i suprafaa casei s-a realizat un grafic pentru determinarea tipului de legtur:
pret-supr casei 1500 pretul 1000 supr casei 500 0 0 500 supr casei 1000

Aici se poate observa faptul c punctele reprezentate sunt grupate n jurul diagonalei principale, fapt care arata existena unei dependene liniare, directe ntre variabile. Deci, se poate afirma faptul c suprafaa unei casei influeneaz semnificativ i n aceeai direcie preul de vnzare al caselor din Piaa Victoriei.

SUMMARY OUTPUT Regression Statistics Multiple R 0,84029921 8 R Square 0,70610277 5 Adjusted R 0,69560644 Square 6 Standard Error 95,1505081 7 Observations 30

Interpretarea rezultatelor din tabelul SUMMARY OUTPUT


Intensitatea legturii se stabilete cu ajutorul coeficientului de corelaie liniar (Multiple R). n acest caz, R=0,84, ceea ce arat c ntre pre i suprafaa casei

exist o legtur direct, puternic, suprafaa casei influennd foarte mult preul acesteia. Pentru a putea spune n ce msur modelul liniar de regresie explic dependena dintre variabile, se calculeaz coeficientul de determinaie (R-square). n cazul nostru, R2=0,70, deci 70% din variaia preului este explicat prin influena suprafeei casei asupra preului. Abaterea medie ptratic a erorilor (Standard Eror) = 95,1505 reprezint deviaia punctelor de la dreapta de regresie. Coeficientul de determinaie ajustat (Adjusted R Square) = 0,6956. ANOVA Regression Residual Total df 1 28 29 SS 609049,636 9 253501,337 8 862550,974 7 MS 609049, 6 9053,61 9 F 67,271 4 Significanc eF 0,00

Interpretarea rezultatelor din tabelul ANOVA


Validitatea modelului de regresie se testeaz folosind testul F (Fischer). n tabelul ANOVA din Excel sunt calculate cele trei variaii: cea explicat de model, cea rezidual i cea total. Cu ajutorul acestora se calculeaz statistica F. n cazul nostru, F=67,271, iar Significance F (pragul de semnificaie) este 0,00 (valoare mai mic de 0,05) rezult c modelul de regresie construit este valid i poate fi utilizat pentru analiza dependenei dintre cele dou variabile. Coefficients Intercept supr casei 157,641773 0,611822103 Standard Error 55,9138779 5 0,07459503 6 t Stat 2,81936 8 8,20191 4 P-value 0,00873 7 0,00 Lower 95% 43,1073 9 0,45902 1 Upper 95% 272,176 2 0,76462 3

Interpretarea rezultatelor din tabelul SUMMARY OUTPUT: Intercept este termenul liber, deci coeficientul b0 este 157,641773, ce reprezint punctul n care dreapta de regresie intersecteaz axa y. Limitele inferioar i superioar ale intervalului de ncredere sunt 43,10739 = 1 = 72,1762. Coeficientul b1 este 0,611822103, ceea ce nseamn c la creterea cu un metru ptrat a suprafeei casei, preul va crete cu 0,61182 mii euro. Intervalul de ncredere pentru acest parametru este 0,459021 = 1 = 0,764623. n coloana Standard Error sunt calculate erorile standard ale parametrilor estimai: 55,91387795 pentru b0 i 0,074595036 pentru b1. Aceste erori sunt folosite pentru calculul statisticii t pentru testarea semnificaiei estimatorilor. Acestea sunt calculate n coloana tStat, t0=2,819368 i t1=8,201914. Deoarece valorile p asociate (P-value) sunt foarte apropiate de 0 (i <0,05), se poate spune c estimatorii sunt semnificativi. Modelnd dependena preului de suprafaa casei printr-o ecuaie de regresie liniar simpl, aceasta ia forma: Pi = 157,641773 + 0,611822103*Suprcasa

Coeficientul de corelaie liniar este reprezentat n tabelul: Pretul de vanzare 1 0,840299218 Suprafata casei(mp) 1

Pretul de vanzare Suprafata casei(mp)

Coeficientul este 0,8402. Deoarece este pozitiv i apropiat de 1, se poate spune c exist o legtur puternic i direct ntre preul de vnzare i suprafaa casei n zona Piaa Victoriei. b) Suprafaa terenului Pentru e determina dependena dintre pre i suprafaa terenului s-a realizat un grafic pentru determinarea tipului de legtur (corelogram):
pr et-sup r teren 2500 2000 p ret 1500 1000 500 0 0 500 sup r ter en 1000 s upr teren

Se observ c punctele reprezentate sunt grupat n jurul diagonalei principale, fapt ce indic existena unei dependene liniare, directe ntre cele dou variabile. Astfel, se poate spune c suprafaa terenului influeneaz semnificativ i n aceeai direcie preul de vnzare al caselor din zona Piaa Victoriei. SUMMARY OUTPUT Regression Statistics Multiple R 0,71932431 R Square 0,51742746 4 Adjusted R 0,50019273 Square Standard Error 121,925535 2 Observations 30 Interpretarea rezultatelor din tabelul SUMMARY OUTPUT Raportului de corelaie (Multiple R): R = 0,71, ceea ce arat c ntre pre i suprafaa terenului exist o legtur direct, puternic. Coeficientul de determinaie (R Square): R2=0,51 arat c 51% din variaia preului este explicat prin influena suprafeei terenului. Abaterea medie ptratic a erorilor (Standard Error) = 121,9255 reprezint deviaia punctelor de la dreapta de regresie. Coeficientul de determinaie ajustat (Adjusted R Square) = 0,5001.

ANOVA df Regressio n Residual Total 1 28 29 SS 446307,563 416243,4117 862550,9747 MS 446307, 6 14865,8 4 F 30,0223 7 Significanc eF 0,00

Interpretarea rezultatelor din tabelul ANOVA


Validitatea modelului de regresie se testeaz folosind testul F (Fischer). n tabelul ANOVA din Excel sunt calculate cele trei variaii: cea explicat de model, cea rezidual i cea total. Cu ajutorul acestora se calculeaz statistica F. n cazul nostru, F=30,022, iar Significance F (pragul de semnificaie) este 0,00 (valoare mai mic de 0,05) rezult c modelul de regresie construit este valid i poate fi utilizat pentru analiza dependenei dintre cele dou variabile. Coefficients Intercep t supr teren 302,835028 2 0,28803103 Standard Error 57,53727322 0,05256744 t Stat 5,26328 4 5,47926 7 P-value 0, 00 00 0, Lower 95% 184,975 3 0,18035 2 Upper 95% 420,694 8 0,39571 1

Interpretarea rezultatelor din tabelul SUMMARY OUTPUT


Intercept este termenul liber, deci coeficientul b0 este 302,8350282, ce reprezint punctul n care dreapta de regresie intersecteaz axa y. Limitele inferioar i superioar ale intervalului de ncredere sunt 184,9753 = 1 = 420,6948. Coeficientul b1 este 0,28803103, ceea ce nseamn c la creterea cu un metru ptrat a suprafeei terenului, preul va crete cu 0,28803103 mii euro. Intervalul de ncredere pentru acest parametru este 0,180352 = 1 = 0,395711. n coloana Standard Error sunt calculate erorile standard ale parametrilor estimai: 57,537273 pentru b0 i 0,05256744 pentru b1. Aceste erori sunt folosite pentru calculul statisticii t pentru testarea semnificaiei estimatorilor. Acestea sunt calculate n coloana tStat, t0=5,263284 i t1=5,479267. Deoarece valorile p asociate (P-value) sunt foarte apropiate de 0 (i <0,05), se poate spune c estimatorii sunt semnificativi. Modelnd dependena preului de suprafaa casei printr-o ecuaie de regresie liniar simpl, aceasta ia forma: Pi = 302,8350282 + 0,28803103*Suprteren Coeficientul de corelaie liniar este reprezentat n tabelul: Pretul de vanzare 1 0,71932431 Suprafata terenului(mp) 1

Pretul de vanzare Suprafata terenului(mp)

Coeficientul este 0719. Fiind pozitiv i mai mare de 0,5, dar nu are o valoare aproape de 1, se poate spune c exist o legtur de putere medie i direct ntre suprafaa terenului i preul de vnzare al casei n zona Piaa Victoriei. c) Numrul de camere Pentru e determina dependena dintre pre i numrul de camere s-a realizat un grafic pentru determinarea tipului de legtur (corelogram):
p re t-nr cam 12 10 8 6 4 2 0 0 500 n r cam 1000

p ret

nr cam

n acest caz, se observ c punctele sunt grupate mai mult n jurul liniilor de regresie cu pant 0, de unde reiese c ntre pre i numrul de camere nu exist legtur. SUMMARY OUTPUT Regression Statistics Multiple R 0,19119 7 R Square 0,03655 6 Adjusted R 0,00214 Square 7 Standard 172,276 Error 7 Observations 30

Interpretarea rezultatelor din tabelul SUMMARY OUTPUT


Raportului de corelaie (Multiple R): R = 0,19, ceea ce arat c ntre pre i numrul de camere exist o legtur direct, slab, numrul de camere influennd foarte puin (sau deloc) preul casei. Coeficientul de determinaie (R Square): R2=0,03 arat c 3% din variaia preului este explicat prin influena numrului de camere asupra preului. Abaterea medie patratic a erorilor (Standard Error) = 172,2767 reprezint deviaia punctelor de la dreapta de regresie. Coeficientul de determinaie ajustat (Adjusted R Square) = 0,002147. ANOVA Regressio n Residual Total df 1 28 29 SS 31531,5 1 831019, 5 862551 MS 31531,5 1 29679,2 7 F 1,06240 9 Significanc eF 0,311488

Interpretarea rezultatelor din tabelul ANOVA


Validitatea modelului de regresie se testeaz folosind testul F (Fischer). n tabelul ANOVA din Ecxel sunt calculate cele trei variaii: cea explicat de model, cea rezidual i cea total. Cu ajutorul acestora se calculeaz statistica F. n cazul nostru, F=1,0624, iar Significance F (pragul de semnificaie) este 0,311 (valoare mai mare de 0,05) rezult c modelul de regresie construit nu este valid i nu poate fi utilizat pentru analiza dependenei dintre cele dou variabile. Coefficient s 386,6077 29,01014 Standar d Error 203,217 8 28,1451 8 t Stat 1,90243 1,03073 2 P-value 0,06744 6 0,31148 8 Lower 95% -29,6652 -28,6426 Upper 95% 802,8805 86,66293

Intercep t nr cam

Interpretarea rezultatelor din tabelul SUMMARY OUTPUT


Intercept este termenul liber, deci coeficientul b0 este 386,6077, ce reprezint punctul n care dreapta de regresie intersecteaz axa y. Limitele inferioar i superioar ale intervalului de ncredere sunt -29,6652= 1 = 802,8805. Coeficientul b1 este 29,01014, ceea ce nseamn c la mrirea cu o camer a casei, preul va crete cu 29,01014 mii euro. Intervalul de ncredere pentru acest parametru este -28,6426= 1 = 86,66293. n coloana Standard Error sunt calculate erorile standard ale parametrilor estimai: 203,2178 pentru b0 i 28,14518 pentru b1. Aceste erori sunt folosite pentru calculul statisticii t pentru testarea semnificaiei estimatorilor. Acestea sunt calculate n coloana tStat, t0=1,90243 i t1=1,030732. Valorile p asociate (P-value) sunt 0,06 i, respectiv, 0,311, mai mari dect 0,05, deci estimatorii nu sunt semnificativi. Modelnd dependena preului de suprafaa casei printr-o ecuaie de regresie liniar simpl, aceasta ia forma: Pi = 386,6077 + 29,01014*Nrcamere 4. Construii un model de regresie multipl pentru a explica variaia preului de vnzare n funcie de zon, suprafaa terenului, suprafaa casei, numrul de camere, numrul de bi i numrul de garaje. In cele ce urmeaza am realizat un model de regresie multipl pentru a explica variaia preului de vnzare n funcie de zon, suprafaa terenului, suprafaa casei, numrul de camere, numrul de bi i numrul de garaje. Pentru a verifica variaia preului n funcie de zon, vom apela la variabilele Dummy. Seturile de ipoteze sunt urmtoarele:

H 0 : 1, dac e zona Cotroceni H : 0, alt zon d1: A H 0 : 1, dac e zona Piata Victoriei H : 0, alt zon d2: A
Datele rezultate vor fi introduse n tabelul iniial, iar apoi le vom folosi pentru crearea modelului de regresie multipl cu variabile independente.

Intercept d1 d2 Suprafata terenului(mp) Suprafata casei(mp) Vechimea constructiei(ani) Numarul camerelor Numarul bailor Numarul garajelor

Coefficient s 36,086128 4 56,328882 8 212,86816 2 0,0854695 1 0,3923085 4 0,6430634 7,9230417 19,813375 8 7,5806349 5

Standard Error 45,7491816 6 17,8944838 2 18,2987515 4 0,01737464 0,04991894 1 0,39241752 9 5,30598677 1 11,8984578 8 14,1435140 7

t Stat 0,788781942 3,147835017 11,63293363 4,919210474 7,858911647 -1,63872246 1,493226807 1,665205359 0,535979596

P-value 0,43 0,00 0,00 0,00 0,00 0,11 0,14 0,10 0,59

Lower 95% 54,9403911 20,7244737 176,459387 2 0,05089942 9 0,29298551 2 1,42385119 18,4802908 3,86082267 20,5605211

Upper 95% 127,112 6 91,9332 9 249,276 9 0,12004 0,49163 2 0,13772 4 2,63420 7 43,4875 7 35,7217 9

Se poate observa c 4 caracteristici sunt nesemnificative (vechimea construciei, numrul camerelor, numrul bilor i numrul garajelor) i nu vor fi utilizate n continuare pentru analiza dependenei dintre variabile. Rezultatele obinute n urma excluderii acestora din model sunt urmtoarele: SUMMARY OUTPUT Regression Statistics Multiple R R Square Adjusted R Square Standard Error Observations 0,936939002 0,877854693 0,872106679 67,12023088 90

Interpretarea rezultatelor din tabelul SUMMARY OUTPUT


Raportului de corelaie (Multiple R): R = 0,93, ceea ce arat c ntre variabilele independente i preul de vnzare exist o legtur direct i foarte puternic. Coeficientul de determinaie (R Square): R2 = 0,87 arat c 87% din variabilitatea preului de vnzare este explicat prin variabilitatea suprafeei terenului, suprafeei casei i a zonei. Abaterea medie ptratic a erorilor (Standard Eror) = 67,12023088 reprezint deviaia punctelor de la dreapta de regresie. Coeficientul de determinaie ajustat (Adjusted R Square) = 0,872106679.

ANOVA Regression Residual Total Aici am F=152,723, iar de 0,05) rezult cel mult 100% precizate. df 4 85 89 SS 2752147,212 382935,6585 3135082,871 MS 688036,8031 4505,125394 F 152,723119 3 Significance F 0,00

Interpretarea rezultatelor din tabelul ANOVA


calculat testul F pentru validarea modelului de regresie=> Significance F (pragul de semnificaie) este 0,00 (valoare mai mic c modelul de regresie construit este valid pentru o probabilitate de i poate fi utilizat pentru analiza dependenei dintre variabilele

Coefficients Intercept d1 d2 Suprafata terenului(mp) Suprafata casei(mp) 19,56493007 77,24874013 234,0513755 0,08619278 0,409933433

Standard Error 22,68716209 18,17222233 18,78413705 0,018493615 0,041622886

t Stat -0,862378908 4,250924225 12,46005472 4,660677682 9,84875082

P-value 0,39 0,00 0,00 0,00 0,00

Lower 95% -64,6731 41,11749 196,7035 0,049423 0,327176

Upper 95

25,5432

113,38 271,399 0,12296

0,49269

Interpretarea rezultatelor din tabelul SUMMARY OUTPUT


Intercept este termenul liber, deci coeficientul b0 este -19,56493007. Termenul liber este punctul n care toate variabilele explicative sunt 0, reprezentnd totodat influena celei de a treia zone, neinclus n model (Foiorul de Foc) asupra preurilor de vnzare ale caselor din celelalte modele. Deoarece t b0 = -0,862378908, iar pragul de semnificaie P-value este 0,39 > 0,05 nseamn c acest coeficient este nesemnificativ. Faptul c limita inferioar a intervalului de ncredere pentru acest parametru este negativ, iar limita superioar este pozitiv (-64,6731= 1 = 25,54323), arat c parametrul din colectivitatea general este aproximativ 0. Coeficientul b1 este 0.08619, ceea ce nseamn ca la creterea cu 1 metru ptrat al suprafeei terenului, preul va crete cu 0.08619 mii euro. Deoarece t b1= 4.6606, iar pragul de semnificaie P-value este 0.00<0,05, nseamn c acest coeficient este semnificativ. Intervalul de ncredere pentru acest parametru este 0.049423= 1 = 0.122963. Coeficientul b2 este 0.40993, ceea ce nseamn c la creterea cu 1 metru ptrat al suprafeei casei, preul va crete cu 0.40993 mii euro. Deoarece t b2 = 9.8487, iar pragul de semnificaie P-value este 0.00<0,05, nseamn c acest coeficient este semnificativ. Intervalul de ncredere pentru acest parametru este 0.3271 = 1 = 0.4926. Coeficientul b3 este 77.2487, ceea ce nseamn c diferena dintre preurile caselor din zona Cotroceni i din celelalte zone este de 77.2487mii euro. Deoarece tb3 = 4.2509, iar pragul de semnificaie P-value este 0.00<0,05, nseamn c acest coeficient este semnificativ. Intervalul de ncredere pentru acest parametru este 41.11749 = 1 = 113.3799. Coeficientul b4 este 234.051, ceea ce nseamn ca preul caselor din cea de a doua zon (Piaa Victoriei) este cu 234.051mii euro mai mare dect preul caselor din

celelalte zone. Deoarece tb4 = 12.46, iar pragul de semnificaie P-value este 0.00<0,05, nseamn c acest coeficient este semnificativ. Intervalul de ncredere pentru acest parametru este 196.703 = 1 = 271.399. n urma estimrii coeficienilor modelului, a rezultat relaia: Yi = -19,5649+ 0,08619*X1+0,40993*X2+77,2487*d1+234,05*d2

5.

Pentru modelul construit la punctul ipotezelor modelului de regresie. Ipotezele modelului de regresie : 1) Multicoliniaritatea d1 d2 1 0.19447 0.32853 7

4,

verificai

ndeplinirea

d1 d2 Suprafaa terenului(mp) Suprafaa casei(mp)

1 -0.5 0.15831 6 -0.03924

Suprafaa terenului(mp) 1 0.542477137

Suprafaa casei(mp)

Nu exist multicoliniaritate pentru ca nu exista valori ale coeficienilor >0,7 sau <-0,7. Se mai poate observa ca intre factorii d2 (amplasarea n zona Piaa Victoriei) si d1 (Amplasarea in zona Cotroceni) se stabilete o legtura indirect, de intensitate medie, intre suprafaa casei i amplasarea n Zona Cotroceni se stabilete o legtur indirect de intensitate slab, ntre ceilali factori de influen stabilindu-se legturi directe, iar o legtura direct de intensitate medie se poate observa ntre suprafaa casei i suprafaa terenului. 2) Homoscedasticitatea Variabila aleatoare (rezidual) U este medie nul i dispersia variabilei reziduale este constant i independent de variabilele factoriale. Se observa homoscedasticitatea prin intermediul acestui grafic dintre valorile estimate i cele reziduale aprute n Excel n tabelul Residual Output. Se reprezint pe axa Ox valorile variabilei factoriale, iar pe axa Oy se reprezint valorile variabilei reziduale U.

Homosc. pret-residuals
200 150 100 50 0 -50 0 -100 -150 -200

pret

Series1 200 400 600 800 1000

residuals

Observam astfel, analiznd graficul de corelaie ntre variabilele reziduale i pre, c nu se respect ipoteza de homoscedasticitate, deoarece variaia erorilor nu este constant.

3) Necorelarea Analizand cele grafice ce prezint corelarea sau necorelarea ntre variabila reziduala i cte una dintre cele factoriale, realizam necorelarea ntre variabila rezidual i cele independente.
supr teren-residuals
3000 2500

supr casei-residuals
1400 1200 1000 residuals
Suprafata terenului(mp)

residuals

2000 1500 1000 500 0 -200 -100 0 supr teren 100 200

800 600 400 200 0 -200 -100 0 supr casei 100 200

Suprafata casei(mp)

Lipsa corelarii dintre suprafata terenului si a casei si pretul de vanzare al casei reiese din valorile din cele 2 grafice ce arat o tendin de centrare mai mult orizontal dect oblic. 4) Normalitatea

Normal Probability Plot


Pre?ul de vnzare(mii de euro) 1000 500 0 0 50 100 150 Sample Percentile

Valorile Y sunt normal distribuite pentru orice X si erorile sunt normal distribuite cu medie 0. Asadar, din corelogram, rezult c se verific ipoteza de normalitate a modelului de regresie. 5) Necorelarea erorilor Pentru testarea ipotezei necorelrii erorilor, am aplicat testul DurbinWatson. Dac indicele acestuia este cuprins n intervalul [1,8;2,2], rezult c erorile nu sunt corelate - situaia e favorabil. Aceast ipotez arata faptul ca variabilele sunt msurate fr eroare (caracter nestochastic).

(e
i=2

i n

ei 1 ) 2
2 i

DW=

e
i =1

=2,006519

unde de regresie multipl.

ei sunt varibilele Residuals, rmase dup reestimarea modelului

DW aparine intervalului [1,8;2,2] => erorile sunt necorelate. 6. Pentru modelul construit la punctul 4, estimai preul de vnzare al caselor cu urmtoarele caracteristici: Zona Suprafaa terenului( mp) 900 800 600 Suprafaa casei(mp) 820 750 400 Vechimea construciei( ani) 45 70 25 Numr ul camere lor 7 10 6 Num rul bilor 3 2 2 Numr ul garajel or 1 1 0

Cotroceni Piaa Victoriei Foiorul de Foc

Modelul de regresie multipl obinut la punctul 4 este : y i = -19,5649 + 0,008619* X 1 + 0,40993*X 2 + 77,2487*d 1 +234,05*d 2

1, Cotroceni 0, rest unde d 1 este

1,Victoriei 0, rest d2

Preurile previzionate pentru cele 3 zone, prin metoda estimaiei punctuale sunt : - pentru zona Cotroceni: y i = -19,5649 + 0,008619* 900+ 0,40993*820+ 77,2487*1+234,05*0=471,3974 - pentru zona Piaa Victoriei : y i = -19,5649 + 0,008619* 800+ 0,40993*750+ 77,2487*0+234,05*1=590,8846 - pentru zona Foiorul de Foc: y i = -19,5649 + 0,008619* 600+ 0,40993*400+ 77,2487*0+234,05*0=196,1211 Estimaia pe interval de ncredere :

Y t / 2;n 2 *S Y E (Y ) Y + t / 2;n 2 * S Y
unde :

S Y =

( x p x) 2 1 + n n ( xi x) 2
i =1

iar

2 =

e
i =1

2 i

n2

Astfel: 1)Pentru zona Cotroceni [460,58;480,36] 2)Pentru zona Piaa Victoriei [521,5;538,5] ( dar se observ c preul estimat prin metoda estimaiei punctuale nu se ncadreaz n intervalul de ncredere obinut). 3)Pentru zona Foiorul de Foc-[184,69;204,59].

S-ar putea să vă placă și