Sunteți pe pagina 1din 19

ECONOMETRIE

- 2013 -
Modele de regresie cu variabile alternative
Modele ANOVA
Modele ANCOVA


Variabilele alternative (dummy) sunt variabile categoriale
care pot lua doar dou valori. Acestor dou valori li se acord
dou coduri: codul 1 i codul 0.

Exemplu: - sexul persoanei: masculin i feminin.

MODELE ANOVA (I)
Modelele ANOVA sunt modelele n care variabilele independente sunt
variabile dummy.
Variabilele dummy vor fi notate cu D, iar parametrii asociai acestora cu a
i
.


Forma general a modelului ANOVA cu variabile dummy este:

Y= a
0
+ a
1
D+


Valorile variabilei independente sunt:
D=1, dac se ndeplinete o anumit condiie sau proprietate pentru
uniti;
D=0, dac nu se ndeplinete proprietatea.

De exemplu, pentru variabila D = sexul persoanei, valorile sunt:
-D=1, dac persoanele de sex masculin,
-D=0, dac persoanele nu sunt de sex masculin (sunt de sex feminin).

-M(Y/D)= a
0
, D=0

a
0
+ a
1
, D=1


MODELE ANOVA (II)
Interpretarea parametrilor
- a
0
este nivelul mediu al variabilei Y pentru categoria D=0;
- a
0
+a
1
arat nivelul mediu al variabilei Y pentru categoria D=1;
- a
1
arat cu ct difer nivelul mediu al variabilei Y n funcie de
cele dou categorii (diferena dintre nivelul mediu al variabilei
Y pentru categoria 1 i nivelul mediu al variabilei Y pentru
categoria 0).

n situaia n care nu exist nici o diferen semnificativ ntre
valoarea medie a variabilei Y, obinut pentru variabila
dummy cnd D = 0 i valoarea medie a variabile Y cnd D = 1,
variabila dummy nu exercit o influen semnificativ asupra
variabilei Y.


MODELE ANOVA (III)
Pentru o populaie mprit n dou grupe, se utilizeaz modelul de
regresie:
Y= a
0
+ a
1
D+

Notm cu:
-
1
media variabilei pentru prima grup (D=0);
-
2
media variabilei pentru a doua grup (D=1);

Regresia este: M(Y/D)= a
0
=
1
, D=0

a
0
+ a
1
=
2
, D=1


Pentru parametrii modelului se construiesc estimatorii:



1 0


2 1 0


1 2 1


MODELE ANOVA (IV)
Estimaiile parametrilor modelului sunt:






unde n
1
este volumul eantionului pentru prima grup, iar n
2

este volumul eantionului pentru a doua grup.

Estimarea parametrului
1
echivaleaz cu estimarea diferenei

1
-
2
, iar testarea parametrului echivaleaz cu testarea ipotezei
H
0
:
1
=
2
1
1
1 0
n
y
y a


2
2
2 1 0
n
y
y a a


1 2 1
y y a
Exemplu: Pentru un eantion format din 10 persoane, se
nregistreaz salariul lunar obinut (mil.lei/lun) pe sexe
(1- masculin; 0 feminin).
Salariu
(mil.lei)
Sexul
persoanei
15 1
10 0
9 0
17 1
11 0
18 1
17 1
12 0
11 0
19 1
MODELE ANOVA (V)
n urma prelucrrii datelor s-au obinut urmtoarele rezultate:
Estimarea parametrilor modelului : Y
i
=10,6+6,6D
Coefficients
a
10,600 ,592 17,917 ,000
6,600 ,837 ,941 7,889 ,000
(Constant)
sexul
Model
1
B Std. Error
Unstandardized
Coef f icients
Beta
Standardized
Coef f icients
t Sig.
Dependent Variable: salariu
a.
MODELE ANOVA (VI)
Valorile estimate ale parametrilor:
- salariului mediu corespunztor persoanelor de sex feminin este de
10,6 mil. lei/lun (estimaia lui a
0
).
- diferena dintre salariul mediu al persoanelor de sex masculin i
salariul mediu al persoanelor de sex feminin este de 6,6 mil.lei/lun
(estimaia lui a
1
) iar nivelul mediu al salariului persoanelor de sex
masculin este de 17,2 mil. lei/lun (estimaia lui a
0
+ a
1
).

Testarea semnificaiei parametrilor - att pentru parametrul
0
, ct
i pentru parametrul a
1
avem sig.< 5% => respingem H
0
cu un
risc asumat de 5%.
Din tabelele de mai jos rezult c intensitatea legturii dintre
variabile, msurat prin R, este de 0,941, iar raportul de corelaie
difer semnificativ de zero (sig. < 0.05).
Model Summary
,941
a
,886 ,872 1,32288
Model
1
R R Square
Adjusted
R Square
Std. Error of
the Estimate
Predictors: (Constant), sexul
a.
MODELE ANOVA (VII)
ANOVA
b
108,900 1 108,900 62,229 ,000
a
14,000 8 1,750
122,900 9
Regression
Residual
Total
Model
1
Sum of
Squares df Mean Square F Sig.
Predictors: (Constant), sexul
a.
Dependent Variable: salariu
b.
MODELE ANOVA (VIII)
Pentru o populaie mprit n trei grupe cu ajutorul unei variabile
nominale, construirea unui model de regresie ANOVA presupune
construirea mai multor variabile alternative. Dac variabila nominal
are p categorii, atunci se vor construi p-1 variabile alternative.
De exemplu, pentru o variabil nominal cu 3 categorii, care mparte
populaia n 3 grupe, cele dou variabilele dummy, D
1
i D
2
, se
construiesc astfel:






Pentru verificarea diferenelor dintre cele trei grupe se utilizeaz
modelul ANOVA: Y =
0
+
1
D
1
+
2
D
2
+.
Grupa D
1
D
2

1 1 0
2 0 1
3 0 0
MODELE ANOVA (IX)
Mediile condiionate sunt:

M(Y/D)=
0
, D
1
=0, D
2
=0

0
+
1
, D
1
=1, D
2
=0

0
+
2
, D
1
=0, D
2
=1

Interpretare
- Parametrul
0
este media grupei 3, adic
3
;
-
0
+
1
este media grupei 1, adic
1
;
-
0
+
2
este media grupei 2, adic
2
;
-
1
este diferena dintre grupa 1 i grupa 3,
1
-
3
;
-
2
este diferena dintre grupa 2 i grupa 3,
2
-
3.


Grupul pentru care nu se construiete explicit o variabil
dummy este considerat grup de referin (de comparare).

MODELE ANOVA (X)
Exemplu
Se consider legtura dintre venitul
persoanelor i nivelul de educaie.
Variabila nivelul de educaie are trei
categorii: gimnazial, liceal i
universitar. Pentru a analiza legtura
dintre venit i educaie se construiesc
dou variabile dummy, gimnazial i
liceal:






Grupa D
1
D
2

Gimnazial 1 0
Liceal 0 1
Universitar 0 0
MODELE ANOVA (XI)






Ecuaia estimat a modelului este:
Y = 12-7.667D
1
-4.5D
2
+.

Interpretare:
-a
0
: venitul mediu pentru persoanele cu studii universitare;
-a
1
: diferena dintre veniturile medii ale persoanelor cu studii gimnaziale i
universitare;
-a
2
: diferena dintre veniturile medii ale persoanelor cu studii liceale i
universitare;
-a
0
+a
1
=12-7.667=4.333: venitul mediu pentru persoanele cu studii gimnaziale;
-a
0
+a
2
=12-4.5=7.5: venitul mediu pentru persoanele cu studii liceale.
Coefficients
a
12.000 .626 19.178 .000
-7.667 .921 -1.016 -8.324 .000
-4.500 .857 -.641 -5.252 .000
(Constant)
gimnazial
liceal
Model
1
B Std. Error
Unstandardized
Coef f icients
Beta
Standardized
Coef f icients
t Sig.
Dependent Variable: venit
a.
Modele de regresie cu variabile alternative (II)
Modele ANCOVA


Modelele ANCOVA sunt modele de regresie n care variabila
dependent este numeric iar variabilele independente sunt
numerice i categoriale (dummy).



MODELE ANCOVA (1)
Modelul ANCOVA cu o variabil dummy i o variabil numeric

Forma general a modelului: Y=
0
+
1
D+ X+

unde:
- Y este variabila dependent numeric;
- D este variabila independent dummy;
- X este variabila independent numeric;
-
0
este nivelul mediu al variabilei Y cnd D=0, n condiiile n care X=0;
-
0
+
1
este nivelul mediu al variabilei Y atunci cnd D=1, n condiiile n care X=0;
-
1
arat diferena dintre valoarea medie a variabilei Y pe cele dou categorii (categoria 1 i
categoria 0), n condiiile n care X=0;
-

arat cu ct variaz, n medie, nivelul variabilei Y la o cretere cu o unitate a lui X, indiferent de
grup (categorie).


- M(Y/D)= a
0
+, D=0

(a
0
+a
1
) + X, D=1.
MODELE ANCOVA (2)
Exemplu: Pentru un eantion de persoane se nregistreaz
salariul lunar obinut (Y, mil.lei), sexul persoanei (1-masculin, 0-
feminin) i numrul de ani de coal.

n urma prelucrrii datelor s-au obinut urmtoarele rezultate:
Coefficients
a
3,109 2,592 1,199 ,276
5,757 ,689 ,778 8,351 ,000
,480 ,165 ,272 2,914 ,027
(Constant)
sexul
ani_scoala
Model
1
B Std. Error
Unstandardized
Coef f icients
Beta
Standardized
Coef f icients
t Sig.
Dependent Variable: salariu
a.
MODELE ANCOVA (3)
- a
0
: Nivelul mediu al salariului pentru persoanele de sex feminin, n
condiiile n care nivelul educaiei este de 0 ani;

-a
0
+ a
1
= 8,866: Nivelul mediu estimat al salariului pentru persoanele de
sex masculin, n condiiile n care nivelul educaiei este de 0 ani;

- a
1
: Nivelul mediu al salariului persoanelor de sex masculin este mai
mare cu 5,757 mil. lei/lun dect nivelul mediu al salariului
persoanelor de sex feminin, n condiiile n care nivelul educaiei este
nul;

- b: La o cretere cu un an a numrului de ani de coal, nivelul
salariului, n medie, cu 0,48 mil. lei/lun, indiferent de sexul
persoanelor.

Observaie: dac valoarea parametrului
1
este semnificativ diferit de
zero, atunci exist diferene ntre nivelurile medii ale salariului pe sexe.
MODELE ANCOVA (4)
Modelul ANCOVA cu dou variabile dummy i o variabil numeric

Pentru acest tip de model, populaia este structurat n 3 grupe, pentru
care crem dou variabile dummy.

Forma modelului: Y=a
0
+
1
D
1
+
2
D
2
+ X+,

unde:
Y = variabila rezultativ, numeric;
D
1
, respectiv D
2
= variabile factoriale, dummy, ale cror variante sunt da
i nu (posed sau nu posed nsuirea), respectiv 1 i 0;
X = variabila explicativ (factorial), numeric.

Rezult 3 regresii:

0
+X, D
1
=0, D
2
=0
M(Y/X, D
1
, D
2
)= (
0
+
1
)+X, D
1
=1, D
2
=0
(
0
+
2
)+X, D
1
=0, D
2
=1



MODELE ANCOVA (5)
Variabila categorial este regiunea de provenien (OECD, Europa de Est i Asia). D1 este
creat pentru OECD, iar D2 pentru EE.

Interpretare:
-a
0
=47.226 este nivelul mediu estimat al speranei de via pentru femei din Asia;
- a
1
=4.379 este diferena dintre sperana de via a femeilor din OECD fa de cele din
Asia. Sperana medie de via a femeilor din OECD este cu 4.379 ani mai mare dect
acelor din Asia;
- a
2
=-1.653 este diferena dintre sperana de via a femeilor din EE fa de cele din Asia.
Sperana medie de via a femeilor din EE este cu 1.653 ani mai mic dect acelor din
Asia;
- b=0.304 este creterea medie a speranei de via a femeilor la o cretere cu 1% a RAF;
- a
0
+a
1
=51.505 este nivelul mediu estimat al SVF pentru persoanele din OECD;
- a
0
+a
2
=45.573 este nivelul mediu estimat al SVF pentru persoanele din EE;
Coefficients
a
47.226 1.785 26.457 .000
.304 .027 .811 11.386 .000
4.379 2.745 .105 1.595 .115
-1.653 2.402 -.048 -.688 .493
(Constant)
Rata de alf abetizare
pentru f emei (%)
OECD
EE
Model
1
B Std. Error
Unstandardized
Coef f icients
Beta
Standardized
Coef f icients
t Sig.
Dependent Variable: Speranta medie de viata pentru f emei
a.

S-ar putea să vă placă și