Sunteți pe pagina 1din 15

Técnicas de Análisis de Datos I (EGOB-4104)

2019-2

TALLER 3

Integrantes del grupo:

Cristian Camilo Sanín Camargo

Daniel Bustamante Fernández

Johnatan Jesús Clavijo Taborda

Marion Restrepo

Carpeta de acceso a todos los contenidos: https://uniandes-


my.sharepoint.com/:f:/g/personal/cc_sanin_uniandes_edu_co/EogrQP2FLXlGrVdTj10PCBU
BfrA_o45l29lC6_-Ty1fkIA?e=po2jkw

PARTE I: Descripción general de los datos

La base de datos sujeta de análisis contiene un total de 753 observaciones de mujeres casadas
y su participación en el marcado laboral. De esta muestra, tal y como reza en el anexo 1, el
56,84% de las mujeres encuestadas participan en el mercado laboral, por un 43,16% que no lo
hacen. Por su parte, el ingreso promedio mensual de los hogares de las mujeres encuestadas es
de 1’154030 pesos. En aquellos hogares donde las mujeres participan del mercado laboral, el
ingreso promedio del hogar es 11,21% superior a aquellos hogares donde las mujeres no
participan del mercado laboral.

PARTE II: Pruebas de hipótesis y correlaciones

1. Diferencia de edades de esposos entre mujeres que participan o no en el mercado


laboral
0.0458 < 0.1

Se rechaza la H0.

Considerando los resultados de la anterior prueba de hipótesis, se puede concluir con una
confianza del 90% que la edad promedio de los esposos de mujeres que participan en el
mercado laboral es diferente de la edad promedio de los esposos de mujeres que no participan
en el mercado laboral, siendo en este último caso un promedio de edad mayor. Este resultado
podría indicarnos que la edad de los esposos es una variable que puede influir en las
posibilidades de las mujeres de participar en el mercado laboral, posiblemente asociado a
razones culturales. Es por ello que esta variable debería tenerse en cuenta en estudios asociados
a la vinculación de las mujeres al mercado laboral.

2. Diferencia de salario hora entre quienes tienen hijo menor de seis años y quienes no
0.0013 < 0.05

Se rechaza la H0.

Con una confianza del 95% se puede afirmar que los salarios por hora son diferentes entre
quienes tienen, al menos, un hijo menor de seis años (1) y quienes no lo tienen (0). Esto podría
indicarnos que tener hijos menores puede incidir en los ingresos de las personas. Aunque esto
tendría que estudiarse un poco más, podría relacionarse con la dedicación de tiempo que una
persona tiene que dedicar al cuidado de hijos más pequeños, o al enfoque personal de cada
persona.

3. Correlaciones

Correlación de salario por hora de esposo y experiencia laboral en años

Falta explicación
Correlación de salario por hora de esposo y horas laboradas

Falta explicación

Correlación de salario por hora de esposo y años de educación del esposo

Falta explicación

Gráficos de correlación

Falta explicación
PARTE III: Regresión

1. Realice una regresión múltiple usando como variable dependiente el salario


laboral del esposo por hora y como variables independientes las que considere
pertinentes. Interprete todos los coeficientes estimados. Evalúe la bondad de ajuste
del modelo y el error estándar de la regresión. Escriba el modelo.

La literatura refiere, entre los determinantes del salario laboral, aspectos relacionados con el
número de trabajadores empleados en el establecimiento, cobertura sindical, la proporción de
trabajadores que ejercen su oficio en actividades altamente calificadas, el crecimiento en la
productividad laboral, la proporción de empleados con un contrato fijo, además de las variables
relacionadas con el sector de la actividad, país y si la empresas es o no del sector privado,
variables que se refieren como control (Gash, 2012)

A partir de este contexto y tomando como referencia la información disponible, se utilizan


variables relacionadas con las características del individuo y su actividad laboral, tales como:
edad, años de educación, experiencia laboral en años, horas laboradas por el esposo y los
ingresos. Además, se construyó una variable categórica que distingue entre los individuos de
la muestra que alcanzaron al menos bachillerato y los que no.

Modelo 1.

𝐿𝑛(𝑠𝑎𝑙𝑎𝑟𝑖𝑜𝐸𝑠𝑝𝑜𝑠𝑜 )
= 𝛽0 + 𝛽1 𝐸𝑑𝑎𝑑𝑒𝑠𝑝𝑜𝑠𝑜 + 𝛽2 𝐸𝑝𝑒𝑥 + 𝛽3 𝐸𝑑𝑢𝐸𝑠𝑝𝑜𝑠𝑜 + 𝛽4 𝐷𝐸𝑑𝑢 + 𝛽5 𝐻𝑜𝑟𝑎𝑠
+ 𝛽6 𝐷𝐻𝑖𝑗𝑜𝑠 + 𝛽7 𝐸𝑑𝑢𝑃𝑎𝑑𝑟𝑒 + 𝛽8 𝐸𝑑𝑢𝑀𝑎𝑑𝑟𝑒 + 𝜀
Tabla 1. Variables explicativas para el salario laboral del esposo

(1) (2)
VARIABLES salario_esposo salario_esposo

edad 57.24 (45.32) 32.25 (46.04)

exper -244.1*** (44.47) -236.6***(45.30)

horas_esposo -9.553***(0.575) -9.537***(0.587)

ingreso 0.0185*** 0.0192***(0.0006


(0.000605) 03)

2.Posible_Maestría_ 6,104*** (1,256)

3.Universitario_ 2,728***(825.7)

educ_esposo 896.8***(123.0)

Constant 17,682*** (2,808) 26,622***(2,451)

Observations 753 753


R-squared 0.672 0.660

Se estimaron dos modelos como se mencionó anteriormente. La regresión lineal muestra que
todas las variables, excepto la edad del esposo, resultan significativas al 1%. Además, los
signos en su mayoría resultan consistentes con las expectativas presentadas en la literatura, los
modelos son significativos globalmente, lo que indica que las variables incluidas en los
modelos son relevantes para explicar las variaciones en el salario laboral del esposo por hora.

En cuanto al ajuste del modelo se encuentra que en el modelo (1) este asciende a 67%, en tanto
para el modelo (2) es 65%, en ambos casos la bondad de ajuste es relevante, lo que indica que
las variables incluidas como explicativas se ajustan para explicar la diferencias en los salarios.

Atendiendo a un análisis de los coeficientes se encuentra que siguiendo el modelo (1):

- El aumento de un año de experiencia en promedio reduce el salario en 244.0727,


manteniendo todas de demás variables constantes.

- Una hora más de trabajo por parte del esposo reduce en promedio 9.552633 su salario,
ceteris paribus.

- El aumento en una unidad adicional de ingreso aumenta el salario en promedio


0.0185145 el salario del esposo ceteris paribus.

- Un año adicional de educación del esposo, aumenta en promedio 896.8347 su salario,


manteniendo todo lo demás constante.

Ahora bien, siguiendo los resultados del modelo (2), y al estimar la regresión teniendo en
cuenta el status universitario, se encuentra que:

- Para aquellos esposos que tienen posible título universitario o de maestría el salario
aumenta en promedio 2727.527 y 6103.606 respectivamente el salario frente a aquellos
que tienen al menos bachillerato.

El error indica que la probabilidad de error a la hora de estimar las diferencias en el salario a
partir de las variables incluidas en el modelo asciende a 9232.1.
Modelo:

𝑆𝑎𝑙𝑎𝑟𝑖𝑜𝐸𝑠𝑝𝑜𝑠𝑜 = 57.23896𝑒𝑑𝑎𝑑 − 244.0727𝑒𝑥𝑝𝑒𝑟 − 9.552633ℎ𝑜𝑟𝑎𝑠_𝑒𝑠𝑝𝑜𝑠𝑜


+ 0.0185145𝑖𝑛𝑔𝑟𝑒𝑠𝑜 + 896.8347𝑒𝑑𝑢𝑐_𝑒𝑠𝑝𝑜𝑠𝑜

2. Interprete todos los coeficientes estimados y realice las pruebas pertinentes sobre
cada uno de ellos. Sacaría alguna variable del modelo. Corra nuevamente la
regresión con las variables que usted dejaría.

Se estima el modelo:

(1)
VARIABLES salario_esposo

inlf 1,568
(1,147)
horas -4.258***
(0.575)
hijos -816.6
(712.6)
edad -60.33
(89.03)
educ -123.1
(199.2)
horas_esposo -9.953***
(0.542)
edad_esposo -20.44
(87.01)
educ_esposo 847.4***
(139.6)
ingreso 0.0203***
(0.000602)
educ_madre -90.88
(120.2)
educ_padre 66.40
(112.9)
exper -9.974
(47.68)
salario -0.117***
(0.0354)
Constant 25,870***
(3,346)

Observations 753
R-squared 0.716

- Para detectar heterocedasticidad

Se utiliza la prueba de Breush-Pagan.

Gráfico X. 𝒖^ y 𝒚^
100000
50000
Residuals

0
-50000

0 20000 40000 60000 80000 100000


Fitted values

Siguiendo los resultados del estadístico se rechaza la hipótesis nula que indica
homocedasticidad, por lo que comprueba que hay presencia de heterocedasticidad, lo que hace
que los betas obtenidos por Mínimos Cuadrados Ordinarios no sea el mejor estimador lineal
insesgado.

- Prueba de la variable omitida

También, se rechaza la hipótesis nula, lo que indica que hay sesgo de variable omitida.

- Multicolinealidad
Dado que el VIF no es mayor a 10 no se puede afirmar que hay correlación entre las variables
independientes, lo que indica que no hay presencia de multicolinealidad.

- Normalidad

Se rechaza la Ho de que hay normalidad en la distribución.

Volviendo al modelo, luego de realizar las pruebas, sacaríamos aquellas variables que no
resultaron significativas, pues aunque mejoran la bondad de ajuste del modelo, no resultan
significativas para explicar las variaciones en el salario y tampoco se encontró que la literatura
indique ninguna relación causal entre ellas, dejando las siguientes variables:

(1)
VARIABLES salario_esposo

horas_esposo -9.297***
(0.582)
educ_esposo 880.4***
(122.8)
ingreso 0.0186***
(0.000610)
Constant 17,000***
(1,864)

Observations 753
R-squared 0.659

Anexos

Anexo 1.

Anexo 2

Anexo 3

Anexo 4

Anexo 5
Anexos

Anexo 1.

Anexo 2

Anexo 3

Anexo 4

Anexo 5

Anexos

Anexo 1.
Anexo 2

Anexo 3

Anexo 4

Anexo 5

Anexos

Anexo 1.

Anexo 2

Anexo 3

Anexo 4

Anexo 5

Bibliografía
Gash, E. (2012). Measurable determinants of method of pay.

S-ar putea să vă placă și