Documente Academic
Documente Profesional
Documente Cultură
Norbert Petrovici
NorbertPetrovici@yahoo.com
regresie multipl
Variabila Dependenta:
Venitul ateptat per membru de familie (se msoar n milioane ROL)
Nivel de educaie
0: nivel de educaie primar sau mediu
1: nivel de educaie superior (colegiu sau facultate)
Interpretarea coeficientului a
n condiiile n care toate variabilele independente sunt egale cu 0 atunci venitul ateptat
este de 2 975 mii lei. Adic: dac cineva este femeie (Gender = 0), rural (Mediu = 0),
fr facultate (Educ = 0) i n a crei gospodriei consumul per mebru de familie a fost nul,
i avea vrsta de zero ani, atunci venitul ateptat n medie este de 2 975 mii lei (admind c
ntre cele dou variabile exist o dependen linear) [ceea ce este absurd!!]
Coeficientului
Utilitatea lui vine atunci cnd vrem s comparm coeficienii, pentru a stabili care variabil
are efectul cel puternic. Coeficienii b nu pot fi folosii n acest scop datorit faptului c
pstreaz unitatea de msur a variabilelor. Coeficienii n schimb sunt msurai n aceeai
unitate de msur: abateri standard.
n cazul nostru cea mai important variabil n cazul nostru este Educaia Consum = 0.321
efecte directe
Coeficientului
Educaie Indic intensitatea
efectului direct pe care o
0.22 are o var. indep. asupra
6 unei unei var. depend.
Gender
-0.001 n cazul nostru dou
dintre efecte sunt foarte
mici Gender = -0.001 i
Consum 0.321 Vrst = - 0.033. De aceea
Venit ateptat ne ntrebm dac aceti
coeficieni pot fi
-0.033 generalizai la ntreaga
Varsta populaie de pe eantion
Adic ne ntrebm dac
0.189 faptul c sunt diferii de 0
nu cumva se datoreaz
Mediu distorsiunilor de eantion
(=erorilor de eantionare)
Testul t ne spune c ntr-
adev aceste dou valori
nu sunt semnificative.
3.72
6
Gender
0.298
Consum Venit ateptat
Varsta
1.629
Mediu
Efectele indirecte
Atunci cnd excludem din model o variabill atunci ea nu mai este inut constant cnd se
evalueaz relaiile dintre variabila dependent si celelalte variabile independente
Prin excludere variabila ea nu este neutralizat deci este introdus in model indirect, prin
efectele indirecte asupra variabilelor independente
Dac efectele indirecte sunt mari atunci coeficieii ai variabilelor independente vor crete n
acest nou model simplificat
regresie multipl simplificat
Sum of
Model Squares df Mean Square F Sig.
1 Regression 5610.062 3 1870.021 197.086 .000a Modelul este generalizabil de la
Residual 14137.624 1490 9.488 eantion la populaie
Total 19747.686 1493
a. Predictors: (Constant), Mediu de rezidenta, Educatie, Consum per membru de
familie Dreapta de regresie nestand.
b. Dependent Variable: Venit asteptat per membru de familie Y* = 2.621 + 2,734*X1 + 0,438*X2
+ 1,399*X3
Coefficientsa
Sau standardizat
Unstandardized Standardized Y* = 0.228*X1+ 0,320*X2 +
Coefficients Coefficients
0.1991*X3
Model B Std. Error Beta t Sig.
1 (Constant) 2.621 .131 19.987 .000 Toti coeficienii b i au
Educatie 2.734 .278 .228 9.844 .000 crescut, ceea ce indic efecte
Consum per membru indirecte, dar au crescut foarte
.438 .032 .320 13.688 .000
de familie puin (cteva zecimi), ceea ce
Mediu 1.399 .168 .191 8.335 .000 indic efecte indirecte mici!
a. Dependent Variable: Venit asteptat per membru de familie
care model de regresie?
principii
Atunci cnd decidem care din modele de regresie pstrm ne uitm la
schimbrile
-coeficieniilor (pentru a vedea daca exist efecte indirecte)
-i la coeficientul R2 (pentru a vedea cine explic mai mult varia)
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 2.621 .131 19.982 .000
Educatie 2.733 .278 .228 9.837 .000 Coeficienii din modeul 1 cu mai
Consum per puine variable
.438 .032 .320 13.681 .000
membru de familie
Mediu 1.400 .168 .192 8.338 .000
2 (Constant) 2.975 .279 10.648 .000
Educatie 2.714 .278 .226 9.749 .000
Consum per Coeficienii din modeul 2 cu mai
.438 .032 .321 13.689 .000
membru de familie multe variable. Putem observa
Mediu 1.382 .168 .189 8.207 .000 c pentru variabilele comune
Genul -.011 .161 -.001 -.066 .947 coeficienii b sau sunt foarte
vrsta -.007 .005 -.033 -1.496 .135 apropiai.
a. Dependent Variable: Venit asteptat
Variabile cantitative :
Venit = venit ateptat per membru de familie
miss val incdec nrmem (98.0, 99.0). /* setam valorile lipsa NS si NR pentru variabilele INCDEC si NRMEM
comp venit = incdec/nrmem. /* crem variabila venit ateptat mprind venitul atepat al
gospodriei (INCDEC) la numrul de membrii din gospodriei
(NRMEM)
miss val venit (120.0). /* dup ce am explorat noua variabila creata cu un grafic boxplot
constatm c exist o valoare extrem de 120 milioane lei pe lun si o
excludem setnd-o ca missing.
Consum = consum per membru de familie
miss val chel nrmem (98.0, 99.0). /* setam valorile lipsa NS si NR pentru variabilele chel si nrmem
comp consum = chel/nrmem. /* crem variabila consum mprind cheltuielile pe luna trecut (chel)
la numrul de membrii din gospodriei (nrmem)
miss val consum (100.0). /* dupa ce am explorat noua variabila creata cu un grafic boxplot
constatm c exist o valoare extrem de 100 milioane lei pe lun si o
excludem setnd-o ca missing.
p0_age = vrsta subiectului
Cum codm variabile din analiz
Variabile dummy:
Educatie = venit gospodrie per membru de familie
miss val p0_scoal ("99.0"). /* setm valorile missing la variabila P0_SCOAL care nregistreaz
educaia.
if (p0_scoal >= 10) educatie = 1. /* cu ajutorul comenzii IF punem condiia c dac cineva a urmat cel puin
colegiu, atunci s se creeze o nou variabil EDUCATIE care s ia n
aceste condiii valoarea 1.
if (p0_scoal < 10) educatie = 0. /* cu aceeai comand IF mai punem condiia c dac cineva are o
diplom mai mic dect cea de colegiu, variabil EDUCATIE care s ia
valoarea 0.