Sunteți pe pagina 1din 19

ECONOMETRIE

- 2013 -

Modele de regresie cu variabile alternative

Modele ANOVA

Modele ANCOVA

Variabilele alternative (dummy) sunt variabile categoriale


care pot lua doar dou valori. Acestor dou valori li se acord
dou coduri: codul 1 i codul 0.

Exemplu: - sexul persoanei: masculin i feminin.

MODELE ANOVA (I)


Modelele ANOVA sunt modelele n care variabilele independente sunt
variabile dummy.
Variabilele dummy vor fi notate cu D, iar parametrii asociai acestora cu ai.
Forma general a modelului ANOVA cu variabile dummy este:
Y= a0+ a1D+
Valorile variabilei independente sunt:
D=1, dac se ndeplinete o anumit condiie sau proprietate pentru
uniti;
D=0, dac nu se ndeplinete proprietatea.
De exemplu, pentru variabila D = sexul persoanei, valorile sunt:
-D=1, dac persoanele de sex masculin,
-D=0, dac persoanele nu sunt de sex masculin (sunt de sex feminin).
-M(Y/D)=

a 0,
D=0
a0 + a1, D=1

MODELE ANOVA (II)


Interpretarea parametrilor
- a0 este nivelul mediu al variabilei Y pentru categoria D=0;
-

a0+a1 arat nivelul mediu al variabilei Y pentru categoria D=1;

a1 arat cu ct difer nivelul mediu al variabilei Y n funcie de


cele dou categorii (diferena dintre nivelul mediu al variabilei
Y pentru categoria 1 i nivelul mediu al variabilei Y pentru
categoria 0).

n situaia n care nu exist nici o diferen semnificativ ntre


valoarea medie a variabilei Y, obinut pentru variabila
dummy cnd D = 0 i valoarea medie a variabile Y cnd D = 1,
variabila dummy nu exercit o influen semnificativ asupra
variabilei Y.

MODELE ANOVA (III)


Pentru o populaie mprit n dou grupe, se utilizeaz modelul de
regresie:
Y= a0+ a1D+
Notm cu:
- 1 media variabilei pentru prima grup (D=0);
-

2 media variabilei pentru a doua grup (D=1);

Regresia este: M(Y/D)= a0 = 1,

D=0

a0 + a1 = 2, D=1
Pentru parametrii modelului se construiesc estimatorii:

0 1

0 1 2

1 2 1

MODELE ANOVA (IV)


Estimaiile parametrilor modelului sunt:
a0 y 1

y1
n1

a0 a1 y 2

y2
n2

a1 y 2 y 1
unde n1 este volumul eantionului pentru prima grup, iar n2
este volumul eantionului pentru a doua grup.
Estimarea parametrului 1 echivaleaz cu estimarea diferenei
1-2, iar testarea parametrului echivaleaz cu testarea ipotezei
H0: 1=2

MODELE ANOVA (V)


Exemplu: Pentru un eantion format din 10 persoane, se
nregistreaz salariul lunar obinut (mil.lei/lun) pe sexe
(1- masculin; 0 feminin).
Salariu

Sexul

(mil.lei)
15

persoanei
1

10

17

11

18

17

12

11

19

MODELE ANOVA (VI)


n urma prelucrrii datelor s-au obinut urmtoarele rezultate:
Estimarea parametrilor modelului : Yi=10,6+6,6D
Coefficientsa

Model
1

(Constant)
sexul

Unstandardized
Coefficients
B
Std. Error
10,600
,592
6,600
,837

Standardized
Coefficients
Beta
,941

t
17,917
7,889

Sig.
,000
,000

a. Dependent Variable: salariu

Valorile estimate ale parametrilor:


- salariului mediu corespunztor persoanelor de sex feminin este de
10,6 mil. lei/lun (estimaia lui a0).
- diferena dintre salariul mediu al persoanelor de sex masculin i
salariul mediu al persoanelor de sex feminin este de 6,6 mil.lei/lun
(estimaia lui a1 ) iar nivelul mediu al salariului persoanelor de sex
masculin este de 17,2 mil. lei/lun (estimaia lui a0+ a1).

MODELE ANOVA (VII)


Testarea semnificaiei parametrilor - att pentru parametrul 0, ct

i pentru parametrul a1 avem sig.< 5% => respingem H0 cu un risc


asumat de 5%.
Din tabelele de mai jos rezult c intensitatea legturii dintre
variabile, msurat prin R, este de 0,941, iar raportul de corelaie
difer semnificativ de zero (sig. < 0.05).
Model Summary
Model
1

R
R Square
a
,941
,886

Adjusted
R Square
,872

Std. Error of
the Estimate
1,32288

a. Predictors: (Constant), sexul


ANOVAb
Model
1

Regression
Residual
Total

Sum of
Squares
108,900
14,000
122,900

a. Predictors: (Constant), sexul


b. Dependent Variable: salariu

df
1
8
9

Mean Square
108,900
1,750

F
62,229

Sig.
,000a

MODELE ANOVA (VIII)


Pentru o populaie mprit n trei grupe cu ajutorul unei variabile
nominale, construirea unui model de regresie ANOVA presupune
construirea mai multor variabile alternative. Dac variabila nominal
are p categorii, atunci se vor construi p-1 variabile alternative.
De exemplu, pentru o variabil nominal cu 3 categorii, care mparte
populaia n 3 grupe, cele dou variabilele dummy, D1 i D2, se
construiesc astfel:
Grupa

D1

D2

Pentru verificarea diferenelor dintre cele trei grupe se utilizeaz


modelul ANOVA: Y = 0+ 1D1+ 2D2+.

MODELE ANOVA (IX)


Mediile condiionate sunt:
M(Y/D)= 0,
D1=0, D2=0
0+ 1, D1=1, D2=0
0+ 2, D1=0, D2=1
Interpretare
- Parametrul 0 este media grupei 3, adic 3;
- 0+ 1 este media grupei 1, adic 1;
- 0+ 2 este media grupei 2, adic 2;
- 1 este diferena dintre grupa 1 i grupa 3, 1- 3;
- 2 este diferena dintre grupa 2 i grupa 3, 2- 3.
Grupul pentru care nu se construiete explicit o variabil
dummy este considerat grup de referin (de comparare).

MODELE ANOVA (X)


Exemplu
Se consider legtura dintre venitul
persoanelor i nivelul de educaie.
Variabila nivelul de educaie are trei
categorii: gimnazial, liceal i
universitar. Pentru a analiza legtura
dintre venit i educaie se construiesc
dou variabile dummy, gimnazial i
liceal:

Grupa

D1

D2

Gimnazial

Liceal

Universitar

MODELE ANOVA (XI)


Coefficientsa

Model
1

(Constant)
gimnazial
liceal

Unstandardized
Coefficients
B
Std. Error
12.000
.626
-7.667
.921
-4.500
.857

Standardized
Coefficients
Beta
-1.016
-.641

t
19.178
-8.324
-5.252

Sig.
.000
.000
.000

a. Dependent Variable: venit

Ecuaia estimat a modelului este:


Y = 12-7.667D1-4.5D2+.
Interpretare:
-a0: venitul mediu pentru persoanele cu studii universitare;
-a1:

diferena dintre veniturile medii ale persoanelor cu studii gimnaziale i


universitare;
-a2: diferena dintre veniturile medii ale persoanelor cu studii liceale i
universitare;
-a0+a1=12-7.667=4.333: venitul mediu pentru persoanele cu studii gimnaziale;
-a0+a2=12-4.5=7.5:

venitul mediu pentru persoanele cu studii liceale.

Modele de regresie cu variabile alternative (II)


Modele

ANCOVA

Modelele ANCOVA sunt modele de regresie n care variabila


dependent este numeric iar variabilele independente sunt
numerice i categoriale (dummy).

MODELE ANCOVA (1)


Modelul ANCOVA cu o variabil dummy i o variabil numeric
Forma general a modelului: Y=0+ 1D+ X+
unde:
- Y este variabila dependent numeric;
- D este variabila independent dummy;
- X este variabila independent numeric;
- 0 este nivelul mediu al variabilei Y cnd D=0, n condiiile n care X=0;
-

0 + 1 este nivelul mediu al variabilei Y atunci cnd D=1, n condiiile n care X=0;

1 arat diferena dintre valoarea medie a variabilei Y pe cele dou categorii (categoria 1 i
categoria 0), n condiiile n care X=0;
arat cu ct variaz, n medie, nivelul variabilei Y la o cretere cu o unitate a lui X, indiferent de
grup (categorie).

M(Y/D)=

a0+,
D=0
(a0+a1) + X, D=1.

MODELE ANCOVA (2)

Exemplu: Pentru un eantion de persoane se nregistreaz


salariul lunar obinut (Y, mil.lei), sexul persoanei (1-masculin, 0feminin) i numrul de ani de coal.
n urma prelucrrii datelor s-au obinut urmtoarele rezultate:
Coefficientsa

Model
1

(Constant)
sexul
ani_scoala

Unstandardized
Coefficients
B
Std. Error
3,109
2,592
5,757
,689
,480
,165

a. Dependent Variable: salariu

Standardized
Coefficients
Beta
,778
,272

t
1,199
8,351
2,914

Sig.
,276
,000
,027

MODELE ANCOVA (3)


- a0: Nivelul mediu al salariului pentru persoanele de sex feminin, n
condiiile n care nivelul educaiei este de 0 ani;
-a0+

a1 = 8,866: Nivelul mediu estimat al salariului pentru persoanele de


sex masculin, n condiiile n care nivelul educaiei este de 0 ani;
- a1: Nivelul mediu al salariului persoanelor de sex masculin este mai
mare cu 5,757 mil. lei/lun dect nivelul mediu al salariului
persoanelor de sex feminin, n condiiile n care nivelul educaiei este
nul;
- b: La o cretere cu un an a numrului de ani de coal, nivelul
salariului, n medie, cu 0,48 mil. lei/lun, indiferent de sexul
persoanelor.
Observaie: dac valoarea parametrului 1 este semnificativ diferit de
zero, atunci exist diferene ntre nivelurile medii ale salariului pe sexe.

MODELE ANCOVA (4)


Modelul ANCOVA cu dou variabile dummy i o variabil numeric
Pentru acest tip de model, populaia este structurat n 3 grupe, pentru
care crem dou variabile dummy.
Forma modelului: Y=a0+ 1D1+ 2D2+ X+,
unde:
Y = variabila rezultativ, numeric;
D1, respectiv D2 = variabile factoriale, dummy, ale cror variante sunt da
i nu (posed sau nu posed nsuirea), respectiv 1 i 0;
X = variabila explicativ (factorial), numeric.
Rezult 3 regresii:

0+ X,

D1=0, D2=0

M(Y/X, D1, D2)= ( 0+ 1)+ X,

D1=1, D2=0

( 0+ 2)+ X,

D1=0, D2=1

MODELE ANCOVA (5)


Coefficientsa

Model
1

(Constant)
Rata de alfabetizare
pentru femei (%)
OECD
EE

Unstandardized
Coefficients
B
Std. Error
47.226
1.785

Standardized
Coefficients
Beta

t
26.457

Sig.
.000

.304

.027

.811

11.386

.000

4.379
-1.653

2.745
2.402

.105
-.048

1.595
-.688

.115
.493

a. Dependent Variable: Speranta medie de viata pentru femei

Variabila categorial este regiunea de provenien (OECD, Europa de Est i Asia). D1 este
creat pentru OECD, iar D2 pentru EE.
Interpretare:
-a0=47.226 este nivelul mediu estimat al speranei de via pentru femei din Asia;
- a1=4.379 este diferena dintre sperana de via a femeilor din OECD fa de cele din
Asia. Sperana medie de via a femeilor din OECD este cu 4.379 ani mai mare dect
acelor din Asia;
- a2=-1.653 este diferena dintre sperana de via a femeilor din EE fa de cele din Asia.
Sperana medie de via a femeilor din EE este cu 1.653 ani mai mic dect acelor din
Asia;
- b=0.304 este creterea medie a speranei de via a femeilor la o cretere cu 1% a RAF;
- a0+a1=51.505 este nivelul mediu estimat al SVF pentru persoanele din OECD;
- a0+a2=45.573 este nivelul mediu estimat al SVF pentru persoanele din EE;

S-ar putea să vă placă și