Documente Academic
Documente Profesional
Documente Cultură
M4: Pentru a se studia legătura dintre variabilele Y = preţul unei case (în mii euro),
X1 = suprafaţa casei (în mp) şi X2 = vechimea casei (în ani), folosim un număr de 23 observaţii
şi modelul liniar cu două variabile explicative:
𝑦 𝛽 𝛽𝑥 𝛽𝑥 𝜀 , 𝑖 1,2, … , 𝑛.
Datele de observaţie se găsesc în fişierul „AT3 M4 Date-Pret.casa-Supraf-Vechime.xls”.
Utilizăm modelul liniar cu două variabile explicative:
În urma prelucrării datelor observate cu Excel, am obţinut rezultatele de mai jos:
Regression Statistics
Multiple R ………
R Square ………
Adjusted R
Square 0.7085
Standard Error ………
Observations ……….
ANOVA
df SS MS F Significance F
Regression …… 8659.1982 ……….. ………..
Residual …… ………… 156.1075
Total 22 ………..
Rezolvare.
a) Ne gândim ce informaţii sunt cunoscute şi care informaţii pot fi completate mai întâi.
Multiple R este Raportul de corelaţie dintre cele două variabile: 𝑅 = ? Nu putem calcula acum.
R Square este Coeficientul de determinaţie: 𝑅 = ? Nu putem calcula acum.
Ştim că dispersia reziduala este 𝑀𝑆𝐸 𝑠 = 156,1075
Standard Error este abaterea standard a erorilor în eşantion:
𝑠 𝑠 156,1075 = 12,494298 = 12,4943
Care este numarul de observatii? n = 23.
Pe coloana df avem: k=2; n3=23-3=20; n1=23-1=22
Folosim formulele cunoscute: 𝑀𝑆𝑅 𝑀𝑆𝐸 𝐹
Interpretare:
𝛽 = parametrul de interceptare
𝛽 = coeficient de regresie parţial pentru variabila independentă X1.
𝛽 = coeficient de regresie parţial pentru variabila independentă X2.
𝛽 𝑏 = 0,1732 este coeficient pantă şi arată că, în perioada analizată,
menţinând celelalte variabile constante, atunci când Suprafaţa casei (X1)
creşte cu 1 mp (o unitate), preţul casei creşte, în medie, cu 0,1732 mii euro.
𝛽 𝑏 = 0,7713 este coeficient pantă şi arată că, în perioada analizată,
menţinând celelalte variabile constante, atunci când vechimea casei (X2)
creşte cu un an, preţul casei scade, în medie, cu 0,7714 mii euro.
𝛽 𝑏 = 59,0848 este parametru de interceptare şi arată că, dacă cele două
variabile explicative, X1 şi X2 au valoarea 0, valoarea medie a
preţului casei este estimată la 59,0848 mii euro.
c) Testaţi validitatea modelului (nivelul de semnificaţie este 𝛼 0,05 şi valoarea tabelară 3,49) .
Pentru testarea validităţii modelului de regresie construim tabelul ANOVA:
df SS MS F Fcritic
Regression k=2 SSR MSR= F= 𝐹; ,
d) În ce proporţie preţul unei case este influenţat de suprafaţa casei şi de vechimea casei?
Coeficientul de determinaţie este: 𝑅 = 0,7350
73,50% din variaţia variabilei Y (preţul unei case) este explicată prin variaţia variabilelor
X1 si X2 (suprafaţa casei şi vechimea casei).
,
𝑡calc = 3,2385
,
Important!
Pentru testarea semnificaţiei coeficienţilor avem 3 posibilităţi, cu rezultate identice:
Folosim testul t
Folosim P-value
Folosim intervalele de încredere
Avem: 𝑡
, ,
𝑡calc = 0,2997
,
Deoarece 0,2997 > 2,086 𝑡 𝑅 acceptăm H0 ⇒ 𝛽 nu diferă semnificativ de 0,7.
g) Previzionaţi preţul unei case ştiind că suprafaţa casei este de 500 mp şi vechimea casei este de 10 ani.
Se doreşte predicţia unei valori individuale a lui Y, cunoscând că x1 = 500 iar x2 = 10.
Regression Statistics
Multiple R 0.8573
R Square 0.7350
Adjusted R
Square 0.7085
Standard Error 12.4943
Observations 23
ANOVA
df SS MS F Significance F
Regression 2 8659.1982 4329.5991 27.7347 0.0000
Residual 20 3122.1500 156.1075
Total 22 11781.3482