Sunteți pe pagina 1din 8

Fase 2 - Introducción al modelo de regresión lineal múltiple

Autor:
William Camilo Martínez

Presentado al Tutor:
Dir. Julián David Baquero

Universidad Nacional Abierta y a Distancia – UNAD


Escuela de Ciencias Administrativas, Contables, Económicas y de Negocios
Programa: Economía
Curso: ECOMETRÍA 105010_3
Bogotá D.C. 03 de octubre de 2018
Introducción

Este trabajo está basado en el estudio de la unidad 1 fase 2 del curso de


Econometría de la Escuela de Ciencias Administrativas Contables y de Negocios de
la Universidad Nacional Abierta y a Distancia Unad, el autor por medio del paquete
estadístico R, realizar manipulación de datos y ejecución tanto manual como
sistemática del método del modelo lineal con tres variables y k variables,
significancia de los parámetros, coeficiente de determinación múltiple, significancia
global de la regresión y correlación parcial.

Se presenta el desarrollo de los 2 puntos con sus respectivos ítems propuesto


en la guía, es importante resaltar que los ítems finales 2.4., 2.5., 2.6. no se
desarrollan por la falta de información de la base LAUSCH5.RAW necesaria para
ser solucionados.
Contenido

La siguiente tabla ofrece datos de la renta percápita real en miles de dólares,


el porcentaje de mano de obra empleada en agricultura (X1) y el numero promedio
de años de escolaridad de la población de más de 25 años (X2), para 15 países
desarrollados en 1981, la información se presenta en la tabla a continuación, en
base a la información anterior:

Y X1 X2
6 9 8
8 10 13
8 8 11
7 7 10
7 10 12
12 4 16
9 5 10
8 5 10
9 6 12
10 8 14
10 7 12
11 4 16
9 9 14
10 5 10
11 8 12

Grafica de Dispersión

14

12

10

0
0 2 4 6 8 10 12 14 16 18
Resumen de datos

Estadísticas de la regresión
Coeficiente de
correlación múltiple 0.832588121 3
Coeficiente de
determinación R^2 0.69320298
R^2 ajustado 0.642070143 3
Error típico 1.011264918
Observaciones 15

Análisis de Varianza
Grados de Suma de Promedio de los Valor crítico
libertad cuadrados cuadrados F de F
Regresión 2 27.72811918 13.86405959 13.5569044 0.000833886
Residuos 12 12.27188082 1.022656735
Total 14 40

Superior Inferior Superior


Coeficientes Error típico Estadístico t Probabilidad Inferior 95% 95% 95.0% 95.0%
Intercepción 6.202979516 1.862253219 3.330900144 0.005988114 2.14547831 10.26048072 2.14547831 10.26048072
- - -
X1 0.376163873 0.132723756 -2.834186459 0.0150583 0.665344097 -0.08698365 0.665344097 -0.08698365
X2 0.452513966 0.119511151 3.786374421 0.002593311 0.192121537 0.712906396 0.192121537 0.712906396
1 2
1.1. Ajuste un modelo de regresión múltiple usando MCO de la forma:
𝒀̈ = 𝜷𝟎 + 𝜷𝟏 𝑿𝟏 + 𝜷𝟐 𝑿𝟐 + 𝒖𝟏 , realícelo con cálculos propios.
Haciendo uso de la herramienta regresión de la hoja de cálculo de Excel,
obtenemos modelo de regresión múltiple estimado por mínimos ordinarios

1.2. Contraste significancia individual y global de los parámetros.


El nivel de significancia estimado a través de la probabilidad del estadístico t,
demuestra que con un margen del 5% de error todas las variables resultan
importantes para el modelo, de tal manera que ninguna de ellas se puede excluir
del mismo
1.3. Calcule coeficiente de correlación múltiple ajustado y sin ajustar
Los calculo arrojados por el coeficiente evidencia que las variables
explicativas se relacionan entre sí con la variable dependiente en un 83%, mientras
que el coeficiente de correlación ajustado (R2), da muestra de que las variaciones
de la variable y son explicadas por el modelo en un 64%

1.4. Calcule coeficientes de correlación parcial.


En concordancia con el modelo de regresión múltiple estimado por mínimos
cuadrados ordinarios se tiene que la relación ente las variaciones de y vs x1 y x2
son del -37% y del 45% respectivamente, siendo la primera inversamente
proporcional, además de existir unas variaciones de y no explicadas por el modelo
las cuales se determinan a partir del coeficiente de intersección del 6,2

1.5. Repita los incisos anteriores en R y muestre las salidas


correspondientes.
Leer apartado 3.1 del capítulo 3 de Wooldrige y resolver el problema 3 de
dicho capitulo. “la mediana del salario de enganche para recién egresados de la
escuela de derecho se determina por la siguiente ecuación:”

log(𝑠𝑎𝑙𝑎𝑟𝑦) = 𝛽0 + 𝛽1 𝐿𝑆𝐴𝑇 + 𝛽2 𝐺𝑃𝐴 + 𝛽3 log⁡(𝑙𝑖𝑏𝑣𝑜𝑙) + 𝛽4 log⁡(𝑐𝑜𝑠𝑡) + 𝛽5 𝑟𝑎𝑛𝑘 + 𝑢𝑖


Donde:
Lsat = Mediana del puntaje en las pruebas SAT, para el grupo de graduados
GPA = Mediana del puntaje promedio para el grupo de graduados
Log(libvol) = El número de libros de la biblioteca de derecho.
Cost = Costo anual de estudiar derecho
Rank = Es el ranking de la escuela de derecho.

2.1. Explique porque se espera que 𝜷𝟓 ≤ 𝟎


Dada la relación que existe entre la variable del ranking vs la variable de
salario, no es posible afirmar que el dato esperado para el valor de beta 5 sea menor
o igual a 0, dado que en la medida en que el ranking de la escuela de derecho sea
más elevado existe mayor probabilidad de que el salario aumente en la misma
dirección, en otras palabras, directamente proporcional, en tal caso se esperaría
que el valor de beta 5 sea positivo

2.2. ¿Qué signos se esperan en los otros parámetros estimados?


Al igual que en el caso del ranking los signos de las demás variables
explicativas deberían ser de carácter positivo, es decir, en la medida que el costo
de la carrera, la medina de los puntajes y los libros de la biblioteca, fueran más altos
el salario debería reaccionar con aumentos proporcionales

Nota Explicativa:
Los siguientes puntos no pudieron ser resueltos a falta de base de datos
LAUSCH5.RAW
2.4. ¿Cuál es la diferencia predicha en el salario para escuelas con una
mediana del GPA diferente a un punto? Reporte su respuesta en
porcentaje.
2.5. Interprete el coeficiente en la variable log(libvol)
2.6. ¿Se puede decir que es mejor asistir a una escuela con un mejor
ranking?, ¿Cuánto dinero más en términos de salario ganaría una
persona que estudia en una escuela 20 posiciones más alto en el
ranking?
Conclusiones

La significancia estadística de los parámetros por sí sola no implica que los


resultados tengan una consecuencia práctica. Si utiliza una prueba con una potencia
muy alta, podría concluir que una pequeña diferencia con respecto al valor hipotético
es estadísticamente significativa. Sin embargo, esa pequeña diferencia podría ser
insignificante para su situación. Debe usar su conocimiento especializado para
determinar si la diferencia es significativa desde el punto de vista práctico.

La bondad de la predicción depende de la relación entre las variables. Si dos


variables no covarían, no podremos hacer predicciones válidas, y si la intensidad de
la covariación es moderada, las predicciones no serán demasiado buenas. En
consecuencia, hay que disponer de alguna medida de la capacidad de la ecuación
de Regresión para obtener predicciones buenas (en el sentido de que sean lo
menos erróneas posible).

El procedimiento correlaciones parciales calcula los coeficientes de


correlación parcial, los cuales describen la relación lineal existente entre dos
variables mientras se controlan los efectos de una o más variables adicionales. Las
correlaciones son medidas de asociación lineal. Dos variables pueden estar
perfectamente relacionadas, pero si la relación no es lineal, el coeficiente de
correlación no es un estadístico adecuado para medir su asociación.
Bibliografía

Wooldridge, J. M. (2006). Introducción a la econometría: un enfoque moderno. Editorial Paraninfo.


Capítulo 1, 2.1 y 2.2. Recuperado de http://www.izt.uam.mx/mydes/wp-
content/uploads/2016/04/Wooldridge_4ta_espa%C3%B1ol_1y2.pdf

Gujarati, D. N., & López, Y. M. (2006). Principios de econometría. McGraw-Hill. Capítulo 1, 2 y 3.


Recuperado de https://scalleruizunp.files.wordpress.com/2015/04/econometria_-_damodar_n-
_gujarati.pdf

Tusell, F. (2011). Análisis de Regresión. Introducción Teórica y Práctica basada en R. Capítulo 5


Recuperado de
https://www.uv.es/lejarza/mcaf/materialR/nreg1.pdf

Modelos lineales aplicados en R (2013). Capítulo 5: El modelo de Regresión Lineal Simple (RLS).
Recuperado de
http://umh3067.edu.umh.es/wp-content/uploads/sites/240/2013/02/Modelos-Lineales-Aplicados-en-
R.pdf

Cornelissen, J. (2017) Curso gratuito Introducción a R (SN) Recuperado


dehttps://www.datacamp.com/instructors/jonathanauthor

S-ar putea să vă placă și