Documente Academic
Documente Profesional
Documente Cultură
Correlación y Regresión
Simple (II)
—
Índice
1 Introducción ............................................................................................................................................................ 3
2 Método de Estimación de Mínimos Cuadrados ................................................................................. 3
3 Medidas de la Bondad del Ajuste: Coeficiente de Determinación ......................................... 5
4 Supuestos del Modelo .................................................................................................................................... 6
4.1 Supuestos sobre las Variables ...................................................................................................... 6
4.2 Supuestos sobre los Parámetros ................................................................................................. 6
4.3 Supuestos sobre la Perturbación Aleatoria............................................................................ 6
5 Prueba de Hipótesis ........................................................................................................................................... 7
6 Predicción ................................................................................................................................................................ 7
7 Modelos de Regresión Simple No Lineal ............................................................................................. 8
8 Resumen .................................................................................................................................................................. 9
9 Bibliografía .............................................................................................................................................................. 9
Objetivos:
Comprender el método de regresión lineal simple, obteniendo la recta de
regresión con el método de Mínimos Cuadrados Ordinarios (MCO).
1 Introducción
Veamos con detalle cómo se lleva a cabo el método comúnmente utilizado para
encontrar la recta que proporciona el mejor ajuste entre los valores observados de dos
variables aleatorias, 𝑥 e 𝑦, de las que obtenemos t observaciones.
𝑆 = ∑ 𝑢̂𝑖2
𝑖=1
Esto se consigue con los estimadores 𝛽̂0 y 𝛽̂1 , cuyas fórmulas de cálculo son:
𝑐𝑜𝑣𝑥𝑦
𝛽̂1 = (2. 1)
𝑣𝑥
Y siendo𝛽̂0 :
Ejemplo:
𝒙𝒊 𝒚𝒊 ̅
𝒙𝒊 − 𝒙 ̅
𝒚𝒊 − 𝒚 ̅ )𝟐
(𝒙𝒊 − 𝒙 (𝒙𝒊 − 𝒙
̅) * (𝒚𝒊 − 𝒚
̅)
Obtenemos:
∑𝑡𝑖=1(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅) 5426,39
𝛽̂1 = = = 1,777
∑𝑡𝑖=1(𝑥𝑖 − 𝑥̅ )2 3052,94
Hemos visto que cada observación (𝑦𝑖 ) se separa del punto de la línea de regresión que
hemos estimado (𝑦̂𝑖 ), pero también es diferente al valor medio esperado 𝑦̅. Podemos
decir que la separación entre el valor estimado y el valor medio esperado está explicada
por el propio modelo al estimar la recta, mientras que la separación entre el valor
realmente observado y la recta de regresión no queda explicada por el modelo.
Figura 2. 1
En la figura hemos trazado una línea correspondiente a la media del valor ajustado 𝑦̅,
que llamaremos línea base. Entonces la desviación respecto a esta línea (la desviación
total) podemos expresarla como la suma:
𝑦𝑖 − 𝑦̅ = 𝑦̂𝑖 − 𝑦̅ + 𝑦𝑖 − 𝑦̂𝑖
Ejemplo:
En el caso del seguro de vida, teníamos 𝑟 = 0,9103, de modo que 𝑅2 = 0,91032 = 0,8286,
o sea que los valores estimados por nuestra recta de regresión de 𝑦 sobre 𝑥 explican el
82,86% de la variación de 𝑦.
5 Prueba de Hipótesis
Cuando un hallazgo interesante emerge del análisis de información basado en una muestra,
el investigador se pregunta: ¿Representa el hallazgo empírico solo un accidente de
muestreo, o llegaría al mismo con cualquier otra muestra?
Una hipótesis estadística es una conjetura con respecto a uno o más parámetros
poblacionales y la hipótesis de contraste permite tomar decisiones en base a datos
muestrales y riesgos conocidos.
Dado que los cálculos del coeficiente de correlación y de los parámetros que definen la
función se basan en una muestra aleatoria de valores de las variables, se espera que
varíen de una muestra a otra. Las preguntas sobre la significancia del coeficiente de
correlación, los parámetros de la función y los valores predichos por ella se responden
mediante intervalos de confianza y pruebas de hipótesis, que es lo que constituye el
análisis inferencial o inferencia estadística.
6 Predicción
Después de estimar la recta de regresión a partir de una muestra de n observaciones
posiblemente tengamos interés en predecir el valor de 𝑦0 que con mayor probabilidad
se encuentra asociado a 𝑥0 . El valor de 𝑥0 puede pertenecer al rango de valores de la
muestra o encontrarse fuera de ésta.
Para ello, basta con sustituir en la ecuación de regresión el valor concreto de x que se
quiera (𝑥0 ). Al hacerlo, se obtendrá el valor para y según la ecuación de regresión. Este
valor es conocido de forma genérica como puntuación predicha, siendo representado
simbólicamente como 𝑦̂𝑖 .
Si la relación entre las dos variables fuera perfecta, los valores predichos de y a partir
“Si la relación entre las dos variables fuera
de x coincidirán exactamente con los valores observados de y , no cometiéndose ningún
perfecta, los valores predichos de y a partir
de x coincidirán exactamente con los
valores observados de y, no cometiéndose
ningún error de predicción.”
error de predicción. Sin embargo, esta situación es inusual y casi siempre nos
encontramos con relaciones entre variables no perfectas. En estos casos, cuando se
utiliza la recta de regresión para predecir el valor en y a partir del valor en x , es
probable que se cometa un error en la predicción realizada. A este error se le suele
denominar como error de predicción o residual.
Modelo exponencial (𝑦 = 𝑘 𝑒 𝛽1 𝑥 )
𝑦 = 𝑘 𝑒 𝛽1𝑥
Modelo potencial 𝑦 = 𝑘 𝑥 𝛽1
𝑦 = 𝑘 𝑥 𝛽1 , 𝑦 = 𝑘 𝑥 𝛽1 ,
8 Resumen
Para comprender la utilidad del modelo lineal simple, es necesario comprender
el significado del parámetro de regresión, que es el elemento fundamental que
caracteriza la relación entre la variable explicativa y la variable explicada (o
respuesta). En los modelos de uso común, tenemos:
9 Bibliografía
Barreto, H; Howland, F .: Introductory Econometrics: Using Monte Carlo Simulation
with Microsoft Excel , Nueva York, Cambridge University Press, 2005.
Wooldridge, F.M: Introducción a la econometría: un enfoque moderno , Madrid :
Thomson, 2006