Sunteți pe pagina 1din 19

ECONOMETRIE

- 2014 -

Tematic C8
Modele de regresie cu variabile alternative

Modele ANOVA

Modele ANCOVA

Variabilele alternative (dummy) sunt variabile categoriale


care pot lua doar dou valori. Acestor dou valori li se
acord, de regul, dou coduri: codul 1 i codul 0.

Exemplu: - sexul persoanei: masculin i feminin.

MODELE ANOVA (I)


Modelele ANOVA sunt modelele n care variabilele independente sunt
variabile dummy.
Variabilele dummy vor fi notate cu D, iar parametrii asociai acestora cu ai.
Forma general a modelului ANOVA cu variabile dummy este:
Y= a0+ a1D+

Valorile variabilei independente sunt:


Di=1, dac se ndeplinete o anumit condiie sau proprietate pentru
uniti;
Di=0, dac nu se ndeplinete proprietatea.
De exemplu, pentru variabila D = sexul persoanei, valorile sunt:
-Di=1 pentru persoanele de sex masculin,
-Di=0 pentru persoanele de sex feminin.
-M(Y/D)=

a0,
Di=0
a0 + a1, Di=1

MODELE ANOVA (II)


Interpretarea parametrilor
- a0 este nivelul mediu al variabilei Y pentru categoria Di=0;
a0+a1 arat nivelul mediu al variabilei Y pentru categoria Di=1;
a1 arat cu ct difer nivelul mediu al variabilei Y n funcie de
cele dou categorii (diferena dintre nivelul mediu al variabilei
Y pentru categoria 1 i nivelul mediu al variabilei Y pentru
categoria 0).

n situaia n care nu exist nici o diferen semnificativ ntre


valoarea medie a variabilei Y, obinut pentru variabila
dummy cnd D = 0 i valoarea medie a variabile Y cnd D = 1,
variabila dummy nu exercit o influen semnificativ asupra
variabilei Y.

MODELE ANOVA (III)


Pentru o populaie mprit n dou grupe, se utilizeaz modelul de
regresie:
Y= a0+ a1D+
Notm cu:
- 1 media variabilei pentru prima grup (Di=0);
- 2 media variabilei pentru a doua grup (Di=1);
Regresia este: M(Y/D)= a0 = 1,
Di=0
a0 + a1 = 2, Di=1
Pentru parametrii modelului se construiesc estimatorii:

0 1
0 1 2

1 2 1

MODELE ANOVA (IV)


Estimaiile parametrilor modelului sunt:
a0 y 1

y1
n1

a0 a1 y 2

y2
n2

a1 y 2 y 1
unde n1 este volumul eantionului pentru prima grup, iar n2
este volumul eantionului pentru a doua grup.
Estimarea parametrului 1 echivaleaz cu estimarea diferenei
1-2, iar testarea parametrului echivaleaz cu testarea ipotezei
H0: 1=2

MODELE ANOVA (V)


Exemplu: Pentru un eantion format din 10 persoane, se
nregistreaz salariul lunar obinut (mil.lei/lun) pe sexe
(1- masculin; 0 feminin).
Salariu
(mil.lei)

Sexul
persoanei

15

10

17

11

18

17

12

11

19

MODELE ANOVA (VI)


n urma prelucrrii datelor s-au obinut urmtoarele rezultate:
Estimarea parametrilor modelului : Yi=10,6+6,6Di
Coe fficientsa

Model
1

(Cons tant)
sexul

Unstandardiz ed
Coefficients
B
Std. Error
10,600
,592
6,600
,837

Standardized
Coefficients
Beta
,941

t
17,917
7,889

Sig.
,000
,000

a. Dependent Variable: salariu

Valorile estimate ale parametrilor:


- salariului mediu corespunztor persoanelor de sex feminin este de
10,6 mil. lei/lun (estimaia lui a0).
- diferena dintre salariul mediu al persoanelor de sex masculin i
salariul mediu al persoanelor de sex feminin este de 6,6 mil.lei/lun
(estimaia lui a1 ) iar nivelul mediu al salariului persoanelor de sex
masculin este de 17,2 mil. lei/lun (estimaia lui a0+ a1).

MODELE ANOVA (VII)


Testarea semnificaiei parametrilor - att pentru parametrul 0, ct
i pentru parametrul a1 avem sig.< 5% => respingem H0 cu un
risc asumat de 5%.
Din tabelele de mai jos rezult c intensitatea legturii dintre
variabile, msurat prin R, este de 0,941, iar raportul de corelaie
difer semnificativ de zero (sig. < 0.05).
Model Summ ary
Model
1

R
R Square
a
,941
,886

Adjusted
R Square
,872

Std. Error of
the Estimate
1,32288

a. Predictors: (Constant), sexul

ANOVAb
Model
1

Regression
Residual
Total

Sum of
Squares
108,900
14,000
122,900

a. Predictors: (Constant), sexul


b. Dependent Variable: s alariu

df
1
8
9

Mean Square
108,900
1,750

F
62,229

Sig.
,000 a

MODELE ANOVA (VIII)


Pentru o populaie mprit n trei grupe cu ajutorul unei variabile
nominale, construirea unui model de regresie ANOVA presupune
construirea mai multor variabile alternative. Dac variabila nominal
are p categorii, atunci se vor construi p-1 variabile alternative.
De exemplu, pentru o variabil nominal cu 3 categorii, care mparte
populaia n 3 grupe, cele dou variabilele dummy, D1 i D2, se
construiesc astfel:
Grupa

D1

D2

Pentru verificarea diferenelor dintre cele trei grupe se utilizeaz


modelul ANOVA: Y = 0+1D1+2D2+.

MODELE ANOVA (IX)


Mediile condiionate sunt:
M(Y/D)= 0,
D1=0, D2=0
0+1, D1=1, D2=0
0+2, D1=0, D2=1
Interpretare
- Parametrul 0 este media grupei 3, adic 3;
- 0+1 este media grupei 1, adic 1;
- 0+2 este media grupei 2, adic 2;
- 1 este diferena dintre grupa 1 i grupa 3, 1- 3;
- 2 este diferena dintre grupa 2 i grupa 3, 2- 3.

Grupul pentru care nu se construiete explicit o variabil


dummy este considerat grup de referin (de comparare).

MODELE ANOVA (X)


Exemplu
Se consider legtura dintre venitul
persoanelor i nivelul de educaie.
Variabila nivelul de educaie are trei
categorii: gimnazial, liceal i
universitar. Pentru a analiza legtura
dintre venit i educaie se construiesc
dou variabile dummy, gimnazial i
liceal:

Grupa

D1

D2

Gimnazial

Liceal

Universitar

MODELE ANOVA (XI)


Coe fficientsa

Model
1

(Cons tant)
gimnaz ial
liceal

Unstandardiz ed
Coef f icients
B
Std. Error
12.000
.626
-7.667
.921
-4.500
.857

Standardized
Coef f icients
Beta
-1.016
-.641

t
19.178
-8.324
-5.252

Sig.
.000
.000
.000

a. Dependent Variable: venit

Ecuaia estimat a modelului este:


Y = 12-7.667D1-4.5D2+.
Interpretare:
-a0: venitul mediu pentru persoanele cu studii universitare;
-a1: diferena dintre veniturile medii ale persoanelor cu studii gimnaziale i
universitare;
-a2: diferena dintre veniturile medii ale persoanelor cu studii liceale i
universitare;
-a0+a1=12-7.667=4.333: venitul mediu pentru persoanele cu studii gimnaziale;
-a0+a2=12-4.5=7.5: venitul mediu pentru persoanele cu studii liceale.

Modele de regresie cu variabile alternative (II)


Modele

ANCOVA

Modelele ANCOVA sunt modele de regresie n care variabila


dependent este numeric iar variabilele independente sunt
numerice i categoriale (dummy).

MODELE ANCOVA (1)


Modelul ANCOVA cu o variabil dummy i o variabil numeric
Forma general a modelului: Y=0+ 1D+ X+
unde:
- Y este variabila dependent numeric;
- D variabila independent dummy;
- X este variabila independent numeric;
- 0 este nivelul mediu al variabilei Y cnd D=0, n condiiile n care X=0;
- 0 + 1 este nivelul mediu al variabilei Y atunci cnd D=1, n condiiile n care X=0;
- 1 arat diferena dintre valoarea medie a variabilei Y pe cele dou categorii (categoria 1 i
categoria 0);
- arat cu ct variaz, n medie, nivelul variabilei Y la o cretere cu o unitate a lui X, indiferent de
grup (categorie).

M(Y/D)=

a0+X,
D=0
(a0+a1) + X, D=1.

MODELE ANCOVA (2)

Exemplu: Pentru un eantion de persoane se nregistreaz


salariul lunar obinut (Y, mil.lei), sexul persoanei (1-masculin, 0feminin) i numrul de ani de coal.
n urma prelucrrii datelor s-au obinut urmtoarele rezultate:
Coe fficientsa

Model
1

(Cons tant)
sexul
ani_scoala

Unstandardiz ed
Coef f icients
B
Std. Error
3,109
2,592
5,757
,689
,480
,165

a. Dependent Variable: s alariu

Standardized
Coef f icients
Beta
,778
,272

t
1,199
8,351
2,914

Sig.
,276
,000
,027

MODELE ANCOVA (3)


- a0: Nivelul mediu al salariului pentru persoanele de sex feminin, n
condiiile n care nivelul educaiei este de 0 ani;
-a0+

a1 = 8,866: Nivelul mediu estimat al salariului pentru persoanele de


sex masculin, n condiiile n care nivelul educaiei este de 0 ani;
- a1: Nivelul mediu al salariului persoanelor de sex masculin este mai
mare cu 5,757 mil. lei/lun dect nivelul mediu al salariului
persoanelor de sex feminin;
- b: La o cretere cu un an a numrului de ani de coal, nivelul
salariului, n medie, cu 0,48 mil. lei/lun, indiferent de sexul
persoanelor.
Observaie: dac valoarea parametrului 1 este semnificativ diferit de
zero, atunci exist diferene ntre nivelurile medii ale salariului pe sexe.

MODELE ANCOVA (4)


Modelul ANCOVA cu dou variabile dummy i o variabil numeric
Pentru acest tip de model, populaia este structurat n 3 grupe, pentru
care crem dou variabile dummy.
Forma modelului: Y=a0+ 1D1+ 2D2+ X+,
unde:
Y = variabila rezultativ, numeric;
D1, respectiv D2 = variabile factoriale, dummy, ale cror variante sunt da
i nu (posed sau nu posed nsuirea), respectiv 1 i 0;
X = variabila explicativ (factorial), numeric.
Rezult 3 regresii:

0+X,
M(Y/X, D1, D2)= (0+1)+X,
(0+2)+X,

D1=0, D2=0
D1=1, D2=0
D1=0, D2=1

MODELE ANCOVA (5)


Coe fficientsa

Model
1

(Cons tant)
Rata de alf abetiz are
pentru f emei (% )
OECD
EE

Unstandardiz ed
Coef f icients
B
Std. Error
47.226
1.785

Standardized
Coef f icients
Beta

t
26.457

Sig.
.000

.304

.027

.811

11.386

.000

4.379
-1.653

2.745
2.402

.105
-.048

1.595
-.688

.115
.493

a. Dependent V ariable: Speranta medie de viata pentru f emei

Variabila categorial este regiunea de provenien (OECD, Europa de Est i Asia). D1 este
creat pentru OECD, iar D2 pentru EE.
Interpretare:
-a0=47.226 este nivelul mediu estimat al speranei de via pentru femei din Asia, pentru
o RAF de 0%;
- a1=4.379 este diferena dintre sperana de via a femeilor din OECD fa de cele din
Asia. Sperana medie de via a femeilor din OECD este cu 4.379 ani mai mare dect
acelor din Asia;
- a2=-1.653 este diferena dintre sperana de via a femeilor din EE fa de cele din Asia.
Sperana medie de via a femeilor din EE este cu 1.653 ani mai mic dect acelor din
Asia;
- b=0.304 este creterea medie a speranei de via a femeilor la o cretere cu 1% a RAF;
- a0+a1=51.505 este nivelul mediu estimat al SVF pentru persoanele din OECD, pentru o
RAF de 0%;
- a0+a2=45.573 este nivelul mediu estimat al SVF pentru persoanele din EE, pentru o
RAF de 0%;

S-ar putea să vă placă și