Documente Academic
Documente Profesional
Documente Cultură
1. Variables seleccionadas
Partimos de una muestra de 3267 observaciones, extraída aleatoriamente del Censo de Población
de Estados Unidos de año 2000, de las variables AGEREC, SEX, INCWAGE, WKSWORK,
UHRSWORK, EDUCREC, cuyas características se describen brevemente a continuación:
AGEREC (edad recodificada). Esta variable comprende la edad de las personas censadas en la
muestra en términos de la siguiente codificación: 0, para el intervalo de edad 16-20 años (ambos
incluidos); 1, para 21-25 años; 2, para 26-30; 3, para 31-35 años; 4, para 36-40 años; 5, para
41-45 años; 6, para 46-50 años; 7, para 51-55 años; 8, para 56-60 años; 9, para 61-65 años.
La variable AGEREC ha sido recodificada a partir de la variable AGE suministrada por la fuente.
SEX (sexo). Sexo de las personas censadas pertenecientes a la muestra. Rango: SEX= 0, si la persona
es varón; SEX= 1, si la persona es mujer.
INCWAGE (ingresos por sueldos y salarios). Ingresos anuales (año 1999) por sueldos y salarios,
antes de impuestos, de las personas registradas en la muestra. Las cantidades se expresan en dólares
corrientes.
WKSWORK (semanas de trabajo en el último año). Número de semanas de trabajo en el último año
(1999) de las personas registradas en la muestra.
UHRSWORK (horas de trabajo por semana). Número usual de horas de trabajo por semana de las
personas registradas en muestra.
Los datos correspondientes, así como la descripción detallada de las variables, se contienen en el
archivo público WORKEDU.wf1
FUENTE: Steven Ruggles, Matthew Sobek, Trent Alexander, Catherine A. Fitch, Ronald Goeken,
Patricia Kelly Hall, Miriam King, and Chad Ronnander. Integrated Public Use Microdata Series:
Version 3.0 [Machine-readable database]. Minneapolis, MN: Minnesota Population Center [producer
and distributor], 2004. IPUMS site: http://usa.ipums.org/usa/
2. Especificación y estimación
2.1 Abra el archivo de trabajo WORKEDU.wf1. En una nueva hoja dentro del archivo de trabajo (use
el nombre UHRWAGE_LIN) ejecute las siguientes regresiones:
uhrwage c educrec
uhrwage c educrec sex agerec
uhrwage c educrec sex agerec sex*agerec
Nombre y etiquete los objetos-ecuación creados a tal fin; guarde el archivo de trabajo. Interprete el
significado de los parámetros estimados en las regresiones anteriores. De acuerdo con el tercer
modelo estimado, ¿cuál es el salario medio de las mujeres con más de tres años de estudios
universitarios y con edades comprendidas entre los 26 y 30 años?
2.2 En una nueva hoja dentro del archivo de trabajo (use el nombre EMPLOY_RATE), estime los
siguientes modelos
employ_rate c educrec
employ_rate c educrec sex*educrec
employ_rate c educrec agerec*educrec
Nombre y etiquete los objetos-ecuación creados a tal fin; guarde el archivo de trabajo. Interprete el
significado de los parámetros estimados en las regresiones anteriores. De acuerdo con el tercer
modelo estimado, ¿cuál es la tasa de empleo de las personas con edades comprendidas entre 51
y 55 años?
2.3 En una nueva hoja dentro del archivo de trabajo (use el nombre UHRWAGE_LOG), estime las
siguientes regresiones
log(uhrwage) c educrec
log(uhrwage) c educrec sex
log(uhrwage) c educrec agerec
Nombre y etiquete los objetos-ecuación creados a tal fin; guarde el archivo de trabajo. Interprete el
significado de los parámetros estimados en las regresiones anteriores. De acuerdo con el primer
modelo estimado, ¿cuál sería el salario medio de las personas que tienen entre 1 y 3 años de
estudios universitarios?
2.4 Obtenga el histograma de los residuos de la primera regresión de los apartados 2.1 y 2.3 (cree
dos gráficos de estos histogramas; póngales nombre y etiqueta). Teniendo en cuenta los estadísticos
descriptivos habituales, compare ambas series de residuos desde el punto de vista de su semejanza
con respecto de una distribución normal. Tomado la primera regresión del apartado 2.1, verifique
que se cumplen las propiedades aritméticas asociadas al método de mínimos cuadrados
(ortogonalidad e invariancia).
2.5 En una nueva hoja dentro del archivo de trabajo (use el nombre CORRELACIONES), cree un
objeto grupo (póngale nombre y etiqueta) con las variables UHRWAGE, LOG(UHRWAGE),
EMPLOY_RATE, EDUCREC, SEX y AGEREC. Elabore una tabla (póngale nombre y etiqueta) que
contenga la matriz de correlación de estas variables. De todos los modelos que ha estimado, indique
a partir de la información suministrada por la matriz de correlaciones, qué modelo es en su opinión
el que mejor relaciona los datos de las variables consideradas. Guarde el archivo de trabajo.