Documente Academic
Documente Profesional
Documente Cultură
(parte I)
Octubre, 2010
19/10/2010 Mxico, D. F. 1
Introduccin
Algunas de las variables son por su naturaleza propia
cualitativas.
nica Yi = 1 + 2Urbanoi + ui
cmo variable
independiente
mixta Yi = 1 + 2Urbanoi + 3 X 3i + ui
Variable Yi = 1 + 2Urbanoi + ui interaccin
cualitativa Yi = 1 + 2Urbanoi + 3 X 3iUrbanoi + ui
19/10/2010 3
No obstante, una variable cualitativa puede presentar
ms de dos categoras, es decir, puede ser
multicategrica, por ejemplo:
1. Soltero No Unido
2. Casado (civil, iglesia o ambos)
3. Unin
4. Separado o divorciado Alguna vez unido
5. Viudo
En este caso se puede considerar
Yi = 1 + 2 D1 + ui
donde
1 , presencia atributo
D1 =
0 , ausencia atributo
Pudiera coexistir ms de una variable dummy.
Su interpretacin indica el diferencial en el valor
promedio de Y.
Interesa saber si es estadsticamente significativo ese
diferencial.
19/10/2010 5
Ejemplo: Son los autos importados ms caros?
Se desea conocer si el precio de los autos difiere segn
su procedencia (local / extranjera).
Considere el archivo autos.dta que ofrece Stata.
Es posible obtener el precio promedio simple segn el
lugar de fabricacin, esto es:
sum price if foreign==1
Es estadsticamente
19/10/2010 significativa esta diferencia?
6
Son los autos importados ms caros?
Sea el modelo de regresin lineal siguiente:
pricei = 1 + 2 foreign i + ui
donde 1 , local
foreign = D1 =
0 , importado
regress price foreign
------------------------------------------------------------------------------
price | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
foreign | 312.2587 754.4488 0.41 0.680 -1191.708 1816.225
_cons | 6072.423 411.363 14.76 0.000 5252.386 6892.46
19/10/2010 7
------------------------------------------------------------------------------
La forma de asimilar este resultado es
E ( pricei \ D1 ) = 1 + 2 D1 + ui
Si D1 = 1 entonces E ( pricei \ D1 = 1) = 1 + 2 D1
pero si D1 = 0 entonces E ( pricei \ D1 = 0) = 1
Grficamente
19/10/2010 8
Diagrama de dispersin
15,000
10,000
Price
5,000
0
0 .2 .4 .6 .8 1
C ar type
19/10/2010 9
Diagrama de dispersin y recta de ajuste (yhat)
15,000
10,000
5,000
0
0 .2 .4 .6 .8 1
C ar type
19/10/2010 10
Diagrama de dispersin y diferencial
sc price foreign, yline(6072.423 ) yline( 6384.682)
15,000
10,000
Price
5,000
0
0 .2 .4 .6 .8 1
C ar type
19/10/2010 11
Variables Dummy en Stata
Suponga un archivo con 5 observaciones como el
siguiente:
id Salario gnero
1 4500 Mujer
2 12000 Hombre
3 8000 Hombre
4 5210 Mujer
5 6804 Mujer
1 , hombre
D11 =
0 , mujer
siguiendo la siguiente sintaxis:
tab genero2, gen(D1)
list genero genero2 D11 D12
+------------------------------+
| genero genero2 D11 D12 |
|------------------------------|
1. | Mujer Mujer 0 1 |
2. | Hombre Hombre 1 0 |
3. | Hombre Hombre 1 0 |
4. | Mujer Mujer 0 1 |
5. | Mujer Mujer 0 1 |
+------------------------------+
------------------------------------------------------------------------------
salary | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
d2 | 1524.099 2363.139 0.64 0.522 -3227.311 6275.509
d3 | -1721.027 2467.151 -0.70 0.489 -6681.566 3239.512
_cons | 48014.62 1857.204 25.85 0.000 44280.46 51748.77
------------------------------------------------------------------------------
Cmo se interpretan?
19/10/2010 15
Grficamente se tiene
twoway (sc salary d2) (sc salary d3)
70000
60000
Salary
50000
40000
30000
0 .2 .4 .6 .8 1
Salary Salary
19/10/2010 16
dis 48014.52 - 1524.099 = 46490.421
dis 48014.52 - -1721.027 = 49735.547
twoway (sc salary d2) (sc salary d3), yline (48014.62)
yline(46490.421) yline(49735.547
70000
46490.42= Sur
40000
30000
0 .2 .4 .6 .8 1
S a lar y Sa la ry
19/10/2010 17
Ejercicio 2: Salarios por gnero. Fox (2008)
Retome los datos correspondientes a la Encuesta de la
Dinmica Laboral y de Ingreso de Ontario, Canada (Survey of
Labour and Income Dynamics).
http://socserv.socsci.mcmaster.ca/jfox/Books/Applied-
Regression-2E/datasets/index.html (SLID en formato txt).
Seleccione el Data Set Canadian Survey of Labour and
Income Dynamics (SLID) y el Data File SLID-Ontario.txt.
Las variables incluidas en ese archivo son:
1 secundaria o ms
D3i =
0 coc
------------------------------------------------------------------------------
wages | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
D1 | -3.421517 .2426289 -14.10 0.000 -3.897205 -2.945829
_cons | 17.26262 .171929 100.41 0.000 16.92555 17.5997
------------------------------------------------------------------------------
------------------------------------------------------------------------------
wages | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
D3 | 2.695896 1.013011 2.66 0.008 .709828 4.681963
_cons | 12.88984 1.005252 12.82 0.000 10.91898 14.86069
19/10/2010 21
------------------------------------------------------------------------------
Modelo 3: reg wages D1 D3
------------------------------------------------------------------------------
wages | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
D1 | -3.432063 .2424244 -14.16 0.000 -3.90735 -2.956776
D3 | 2.903281 .9887444 2.94 0.003 .96479 4.841772
_cons | 14.40895 .9869135 14.60 0.000 12.47404 16.34385
------------------------------------------------------------------------------
Conclusiones
Si hay discriminacin por gnero (las mujeres ganan en
promedio menos que los hombres) controlando por educacin.
En promedio los ms educados ganan ms que los menos
educados (el diferencial de ingresos por nivel educativo es
19/10/2010
significativo) controlando por gnero. 22