Sunteți pe pagina 1din 23

Modele cu variabile dummy

Noţiuni

 Variabila dummy este o variabilă categorială care


poate lua două valori. Acestor două valori li se
acordă, de regulă, două coduri: codul 1 (pentru
unităţile statistice care posedă caracteristica
urmărită în studiu) şi codul 0 (pentru celelalte
unităţi statistice).

Exemplu:
- sexul persoanei: 1 -masculin şi 0 - feminin.
Modele ANOVA (modele de
analiză a variaţiei)
Sunt modelele în care variabilele independente sunt
variabile dummy.
a. Modele cu o variabilă dummy
Forma generală a modelului ANOVA cu variabile
dummy este:

Y= β0+ β1Di+ε
unde: Di este variabila dummy: D1=1 (de exemplu, în
cazul persoanelor de sex masculin) sau D2=0
(în cazul persoanelor de sex feminin);
β0 este nivelul mediu al variabilei Y pentru
categoria Di=0
β1 arată cu cât este mai mare valoarea medie a
variabilei Y pe cele două categorii (diferenţa dintre
nivelul mediu al variabilei Y pentru categoria 1 şi
nivelul mediu al variabilei Y pentru categoria 0).

β0+β1 arată nivelul mediu al variabilei Y pentru


categoria Di=1.

Exemplu: Pentru un eşantion format din 10 persoane,


se înregistrează salariul lunar obţinut (mil.lei/lună)
pe sexe (1- masculin; 0 - feminin).
Salariu (mil.lei) Sexul persoanei
15 1
10 0
9 0
17 1
11 0
18 1
17 1
12 0
11 0
19 1
În urma prelucrării datelor s-au
obţinut următoarele rezultate:

Coefficientsa

Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 10,600 ,592 17,917 ,000
sexul 6,600 ,837 ,941 7,889 ,000
a. Dependent Variable: salariu
Model Summary

Adjusted Std. Error of


Model R R Square R Square the Es timate
1 ,941a ,886 ,872 1,32288
a. Predictors : (Constant), sexul
ANOVAb

Sum of
Model Squares df Mean Square F Sig.
1 Regres sion 108,900 1 108,900 62,229 ,000a
Residual 14,000 8 1,750
Total 122,900 9
a. Predic tors : (Constant), sex ul
b. Dependent Variable: s alariu
Interpretare:

a) Ecuaţia estimată a legăturii dintre variabile:


Y=10,6+6,6D

b) Interpretarea parametrilor modelului:

 bo=10,6 mil.lei/lună arată că nivelul mediu al salariului


persoanelor de sex feminin este de 10,6 mil.lei/lună.
 b0+b1=17,2 mil. lei/lună reprezintă nivelul mediu al
salariului persoanelor de sex masculin.

 b1=6,6 mil.lei/lună arată diferenţa dintre salariul


mediu al persoanelor de sex masculin şi salariul
mediu al persoanelor de sex feminin.
b. Modele cu două variabile dummy

Forma generală a modelului ANOVA cu variabile


dummy este:

Y= β0+ β1D1+ β2D2+ε

Exemplu: Pentru un eşantion format din 20 persoane,


se înregistrează salariul lunar obţinut (mil.lei/lună)
pe nivele de pregătire (gimnazial; liceal, superior).

D1=1, pt. gimnazial şi D1=0 în rest


D2=1, pt. liceal şi D2=0 în rest
 b1 = – 8,453 este estimaţia diferenţei dintre salariul
mediu al angajaţilor cu studii gimnaziale şi al celor
cu studii superioare.

Coeffi cientsa
 b2 = – 4,612 este estimaţia diferenţei
Unstandardized St andardiz ed
dintre salariul mediu
al angajaţilor cu studii liceale
Coeffic ient s şi al celor
Coeffic ient scu studii superioare
Model B St d. E rror Beta t Si g.
1 (Const ant) 15,187 1,020 14,884 ,000
D1 -8, 453 1,285 -,907 -6, 580 ,000
D2 -4, 612 1,395 -,456 -3, 307 ,004
a. Dependent Variabl e: s alari u
2

 b0=15,187 mil.lei reprezintă nivelul mediu al salariului


persoanelor cu studii superioare.

 b0+b1=15,187 – 8,453 = 6,734 reprezintă nivelul mediu al


salariului persoanelor cu studii gimnaziale.

 b0+b2=15,187 – 4,612 = 10,575 reprezintă nivelul mediu


al salariului persoanelor cu studii liceale.
Modele ANCOVA (modele de
analiză a covarianţei)

 Sunt modele de regresie în care variabila


dependentă este numerică iar variabilele
independente sunt numerice şi categoriale
(dummy).

a. Modelul ANCOVA cu o variabilă dummy şi o


variabilă numerică
Forma generală a modelului:

Y= β0 + β1Di+ β2X+ε

unde:
Y este variabila dependentă numerică;
Di variabila independentă dummy;
X este variabila independentă numerică;
β0 valoarea lui Y când Di=0 şi X=0.
 β1 arată diferenţa dintre valoarea medie a variabilei
Y pe cele două categorii (categoria 1 şi categoria 0).

 β2 arată cu cât variază, în medie, nivelul variabilei Y la


o creştere cu o unitate a lui X (pentru ambele
categorii).

Exemplu: Pentru un eşantion de persoane se


înregistrează salariul lunar obţinut (Y, mil.lei), sexul
persoanei (1-masculin, 0- feminin) şi numărul de ani
de şcoală.
În urma prelucrării datelor s-au
obţinut următoarele rezultate:

Coefficientsa

Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 3,109 2,592 1,199 ,276
sexul 5,757 ,689 ,778 8,351 ,000
ani_scoala ,480 ,165 ,272 2,914 ,027
a. Dependent Variable: salariu
 b0= 3,109 mil.lei/lună reprezintă nivelul mediu al
salariului persoanelor de sex feminin, în condiţiile
în care nivelul studiilor este X=0.

 b1= 5,757 mil.lei/lună reprezintă diferenţa dintre


nivelul mediu al salariului persoanelor de sex
masculin şi nivelul mediu al salariului persoanelor
de sex feminin.
 b0+b1= 8,866 mil. lei reprezintă nivelul mediu al
salariului persoanelor de sex masculin în condiţiile
în care X=0.
 b2= 0,48 mil.lei/lună arată că la o creştere cu un
an a numărului de ani de şcoală, nivelul salariului
pentru ambele categorii creşte, în medie, cu 0,48
mil.lei/lună.
Observaţie:
 dacă valoarea parametrului β1 este semnificativ
diferită de zero, atunci există diferenţe între
nivelurile medii ale variabilei Y pe categorii.

b. Modelul ANCOVA cu două variabile dummy şi o


variabilă numerică

Forma modelului:
Y= β0+ β1Di1+ β2Di2+ β3X+ε
Interpretare:

 Dacă valoarea coeficientului β1 este semnificativ


diferită de zero, atunci se poate considera că
variabila D1 influenţează variaţia variabilei Y. Idem
β2.
 Dacă ambii coeficienţi sunt semnificativi statistic,
atunci ambele variabile influenţează variaţia
variabilei Y.
 Coeficientul β3 arată cu cât creşte sau scade, în
medie, nivelul variabilei Y la o creştere cu o unitate
a nivelului variabilei X.
Exemplu:
În studiul legăturii dintre venitul lunar realizat, sexul
persoanei (1-masculin; 0-feminin), mediul de
rezidenţă (1-urban, 0-rural) şi vârsta persoanei, s-
au obţinut următoarele rezultate:

Y= 2,5 + 1,2D1 + 3,6D2 + 0,9X


(tcalc=5,8) (tcalc=4,3) (tcalc=-3,7) (tcalc=1,79)

Să se interpreteze rezultatele obţinute (n=100


persoane).
 b0= 2,5 mil. lei reprezintă salariul mediu al
persoanelor de sex feminin din mediul rural, când
X=0.
 b0+b1= 3,7 mil. lei reprezintă salariul mediu al
persoanelor de sex masculin din mediul rural, dacă
X=0.
 b1= 1,2 mil. lei arată diferenţa dintre salariul
mediu al persoanelor de sex masculin şi feminin,
dacă X=0.
 b2= 3,6 mil. lei arată diferenţa dintre salariul
mediu al persoanelor din mediul urban şi rural,
dacă X=0.

S-ar putea să vă placă și