Sunteți pe pagina 1din 9

Correlación y Regresión
Simple (II)

1 © Ast urias Corporación Universitaria


Correlación y Regresión Simple (II)

Índice

1 Introducción ............................................................................................................................................................ 3
2 Método de Estimación de Mínimos Cuadrados ................................................................................. 3
3 Medidas de la Bondad del Ajuste: Coeficiente de Determinación ......................................... 5
4 Supuestos del Modelo .................................................................................................................................... 6
4.1 Supuestos sobre las Variables ...................................................................................................... 6
4.2 Supuestos sobre los Parámetros ................................................................................................. 6
4.3 Supuestos sobre la Perturbación Aleatoria............................................................................ 6
5 Prueba de Hipótesis ........................................................................................................................................... 7
6 Predicción ................................................................................................................................................................ 7
7 Modelos de Regresión Simple No Lineal ............................................................................................. 8
8 Resumen .................................................................................................................................................................. 9
9 Bibliografía .............................................................................................................................................................. 9

02 ASTURIAS CORPORACIÓN UNIVERSITARIA®


Not a Técnica preparada por Ast urias Corporación Universit aria. Su dif usión, reproducción o uso t ot al
o parcial para cual quier ot ro propósit o queda prohibida. Todos l os derechos reservados.
Correlación y Regresión Simple (II)

Objetivos:
 Comprender el método de regresión lineal simple, obteniendo la recta de
regresión con el método de Mínimos Cuadrados Ordinarios (MCO).

 Ser capaz de enunciar los elementos fundamentales de la inferencia estadística


aplicada a un caso sencillo de uso común en Econometría.

1 Introducción
Veamos con detalle cómo se lleva a cabo el método comúnmente utilizado para
encontrar la recta que proporciona el mejor ajuste entre los valores observados de dos
variables aleatorias, 𝑥 e 𝑦, de las que obtenemos t observaciones.

2 Método de Estimación de Mínimos Cuadrados


Como ya sabemos, la recta que mejor represente la correlación entre 𝑥 e 𝑦 será aquella
“El objetivo consiste en minimizar la suma en que la separación de cada punto observado a la recta sea el menor posible.
de los cuadrados de los residuos”
Así pues, el objetivo, es minimizar la suma de los cuadrados de los residuos:
𝑡

𝑆 = ∑ 𝑢̂𝑖2
𝑖=1

Esto se consigue con los estimadores 𝛽̂0 y 𝛽̂1 , cuyas fórmulas de cálculo son:

𝑐𝑜𝑣𝑥𝑦
𝛽̂1 = (2. 1)
𝑣𝑥

Que también puede calcularse como:

∑𝑡𝑖=1(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅)


𝛽̂1 =
∑𝑡𝑖=1(𝑥𝑖 − 𝑥̅ )2 (2. 2)

Y siendo𝛽̂0 :

𝛽̂0 = 𝑦̅ − 𝛽̂1 𝑥̅ (2. 3)

Ejemplo:

Vamos a estimar los parámetros correspondientes a la ecuación de regresión lineal de


nuestro ejemplo del seguro de vida del cabeza de familia. Para facilitar la presentación
de los cálculos, organizamos los datos de la siguiente forma:

03 ASTURIAS CORPORACIÓN UNIVERSITARIA®


Not a Técnica preparada por Ast urias Corporación Universit aria. Su dif usión, reproducción o uso t ot al
o parcial para cual quier ot ro propósit o queda prohibida. Todos l os derechos reservados.
Correlación y Regresión Simple (II)

𝒙𝒊 𝒚𝒊 ̅
𝒙𝒊 − 𝒙 ̅
𝒚𝒊 − 𝒚 ̅ )𝟐
(𝒙𝒊 − 𝒙 (𝒙𝒊 − 𝒙
̅) * (𝒚𝒊 − 𝒚
̅)

15 40 -20,94 -26,39 438,67 552,70

15 30 -20,94 -36,39 438,67 762,15

20 50 -15,94 -16,39 254,23 261,31

20 35 -15,94 -31,39 254,23 500,48

25 55 -10,94 -11,39 119,78 124,65

30 55 -5,94 -11,39 35,34 67,70

30 40 -5,94 -26,39 35,34 156,87

35 65 -0,94 -1,39 0,89 1,31

35 65 -0,94 -1,39 0,89 1,31

40 60 4,06 -6,39 16,45 -25,91

40 50 4,06 -16,39 16,45 -66,47

40 75 4,06 8,61 16,45 34,92

45 70 9,06 3,61 82,00 32,70

45 80 9,06 13,61 82,00 123,26

47 90 11,06 23,61 122,23 261,03

50 110 14,06 43,61 197,56 612,98

55 105 19,06 38,61 363,11 735,76

60 120 24,06 53,61 578,67 1289,65

∑ 647 1 195 3 052,94 5 426,39

Y las medias son: 𝑥̅ = 35,94; 𝑦̅ = 66,39

Obtenemos:
∑𝑡𝑖=1(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅) 5426,39
𝛽̂1 = = = 1,777
∑𝑡𝑖=1(𝑥𝑖 − 𝑥̅ )2 3052,94

𝛽̂0 = 𝑦̅ − 𝛽̂1 𝑥̅ = 66,394 − 1,777 × 35,944 = 2,50

Entonces la ecuación de la recta será: 𝑦̂ = 1,78𝑥 + 2,5

04 ASTURIAS CORPORACIÓN UNIVERSITARIA®


Not a Técnica preparada por Ast urias Corporación Universit aria. Su dif usión, reproducción o uso t ot al
o parcial para cual quier ot ro propósit o queda prohibida. Todos l os derechos reservados.
Correlación y Regresión Simple (II)

3 Medidas de la Bondad del Ajuste: Coeficiente de


Determinación
Una vez que se ha realizado el ajuste por mínimos cuadrados, conviene disponer de
“El coeficiente de determinación
2
R, algún indicador que permita medir el grado de ajuste entre el modelo y los datos. Estas
permite medir el grado de ajuste entre el
medidas se denominan medidas de la bondad del ajuste. La más conocida es el
modelo y los datos”
coeficiente de determinación, R2 .

Hemos visto que cada observación (𝑦𝑖 ) se separa del punto de la línea de regresión que
hemos estimado (𝑦̂𝑖 ), pero también es diferente al valor medio esperado 𝑦̅. Podemos
decir que la separación entre el valor estimado y el valor medio esperado está explicada
por el propio modelo al estimar la recta, mientras que la separación entre el valor
realmente observado y la recta de regresión no queda explicada por el modelo.

Figura 2. 1
En la figura hemos trazado una línea correspondiente a la media del valor ajustado 𝑦̅,
que llamaremos línea base. Entonces la desviación respecto a esta línea (la desviación
total) podemos expresarla como la suma:

𝑦𝑖 − 𝑦̅ = 𝑦̂𝑖 − 𝑦̅ + 𝑦𝑖 − 𝑦̂𝑖

𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑡𝑜𝑡𝑎𝑙 = 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑥𝑝𝑙𝑖𝑐𝑎𝑑𝑎 + 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑛𝑜 𝑒𝑥𝑝𝑙𝑖𝑐𝑎𝑑𝑎

 La variación explicada, 𝑦̂𝑖 − 𝑦̅ es la desviación del valor estimado respecto a la


línea base.

 La variación no explicada, 𝑦𝑖 − 𝑦̂𝑖 es la desviación del valor observado 𝑦𝑖 respecto


a la línea de regresión.
2
Entonces, el coeficiente de determinación, R , expresa la proporción de la variación
total que queda explicada por el modelo:

05 ASTURIAS CORPORACIÓN UNIVERSITARIA®


Not a Técnica preparada por Ast urias Corporación Universit aria. Su dif usión, reproducción o uso t ot al
o parcial para cual quier ot ro propósit o queda prohibida. Todos l os derechos reservados.
Correlación y Regresión Simple (II)

𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑥𝑝𝑙𝑖𝑐𝑎𝑑𝑎 ∑𝑛𝑖=1(𝑦̂𝑖 − 𝑦̅)2


𝑅2 = = 𝑛 (2. 4)
𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑡𝑜𝑡𝑎𝑙 ∑𝑖=1(𝑦𝑖 − 𝑦̅)2

Ejemplo:

Compruébese que el coeficiente de determinación 𝑅2 así calculado equivale al


cuadrado del coeficiente de correlación de Pearson, 𝑟.

En el caso del seguro de vida, teníamos 𝑟 = 0,9103, de modo que 𝑅2 = 0,91032 = 0,8286,
o sea que los valores estimados por nuestra recta de regresión de 𝑦 sobre 𝑥 explican el
82,86% de la variación de 𝑦.

4 Supuestos del Modelo


Sólo se pueden obtener estimaciones fiables de los parámetros 𝛽0 y 𝛽1 a partir de una
muestra aleatoria cuando establecemos una serie de supuestos simplificadores:

4.1 Supuestos sobre las Variables

 Muestra de datos suficientemente grande.


“En este supuesto es necesario disponer
de tantos datos como parámetros a
Este supuesto significa que, como mínimo, es necesario disponer de tantos datos
estimar” como parámetros a estimar.

 Los datos no cambian entre diferentes observaciones.

4.2 Supuestos sobre los Parámetros

 Linealidad en los parámetros.

 Parámetros constantes: suponemos que los parámetros 𝛽0 y 𝛽1 no varían en el


tiempo o entre diferentes observaciones.

4.3 Supuestos sobre la Perturbación Aleatoria

 Esperanza nula: el término 𝑢𝑡 tiene una esperanza nula en todas las


observaciones:
𝐸(𝑢𝑡 ) = 0, ∀𝑡 = 1,2, … 𝑛

 Homocedasticidad (varianza constante), es decir, la varianza de 𝑢𝑡 no depende


de t.
𝑣𝑎𝑟(𝑢𝑡 ) = E(𝑢𝑡2 ) = 𝜎 2 , ∀𝑡 = 1,2, … 𝑛

 No existe correlación entre los errores correspondientes a observaciones


diferentes. Esta ausencia de autocorrelación significa:
𝑐𝑜𝑣(𝑢𝑡 𝑢𝑠 ) = E(𝑢𝑡 𝑢𝑠 ) = 0, ∀𝑡, 𝑠 = 1,2, … 𝑛, 𝑡 ≠ 𝑠

06 ASTURIAS CORPORACIÓN UNIVERSITARIA®


Not a Técnica preparada por Ast urias Corporación Universit aria. Su dif usión, reproducción o uso t ot al
o parcial para cual quier ot ro propósit o queda prohibida. Todos l os derechos reservados.
Correlación y Regresión Simple (II)

 La perturbación aleatoria sigue una distribución normal.

5 Prueba de Hipótesis
Cuando un hallazgo interesante emerge del análisis de información basado en una muestra,
el investigador se pregunta: ¿Representa el hallazgo empírico solo un accidente de
muestreo, o llegaría al mismo con cualquier otra muestra?

Los parámetros de la regresión ajustan de la mejor manera los puntos de un diagrama


de dispersión a una recta. Pero los puntos con los que contamos no son todos los
posibles (la población de puntos), sino que son una muestra aleatoria de ellos.
Esperamos que los valores de (𝑥, 𝑦) sean diferentes de una muestra a otra, y con ellos
los de 𝛽0 y 𝛽1 de modo que, ¿cuál es la probabilidad de que la muestra aleatoria de
puntos nos presente una correlación fuerte cuando en realidad los puntos de la
población no están correlacionados fuertemente?

El parámetro 𝛽1 , o coeficiente de regresión, es la pendiente de la línea de regresión y es


de mucho interés, pues en muchas aplicaciones se desea conocer la velocidad de
cambio de 𝑦 con respecto a la de 𝑥. Además, es importante pues si su valor es próximo
a cero, indica que posiblemente no existe relación lineal entre las variables del estudio.

Una hipótesis estadística es una conjetura con respecto a uno o más parámetros
poblacionales y la hipótesis de contraste permite tomar decisiones en base a datos
muestrales y riesgos conocidos.

Dado que los cálculos del coeficiente de correlación y de los parámetros que definen la
función se basan en una muestra aleatoria de valores de las variables, se espera que
varíen de una muestra a otra. Las preguntas sobre la significancia del coeficiente de
correlación, los parámetros de la función y los valores predichos por ella se responden
mediante intervalos de confianza y pruebas de hipótesis, que es lo que constituye el
análisis inferencial o inferencia estadística.

6 Predicción
Después de estimar la recta de regresión a partir de una muestra de n observaciones
posiblemente tengamos interés en predecir el valor de 𝑦0 que con mayor probabilidad
se encuentra asociado a 𝑥0 . El valor de 𝑥0 puede pertenecer al rango de valores de la
muestra o encontrarse fuera de ésta.

Para ello, basta con sustituir en la ecuación de regresión el valor concreto de x que se
quiera (𝑥0 ). Al hacerlo, se obtendrá el valor para y según la ecuación de regresión. Este
valor es conocido de forma genérica como puntuación predicha, siendo representado
simbólicamente como 𝑦̂𝑖 .

Si la relación entre las dos variables fuera perfecta, los valores predichos de y a partir
“Si la relación entre las dos variables fuera
de x coincidirán exactamente con los valores observados de y , no cometiéndose ningún
perfecta, los valores predichos de y a partir
de x coincidirán exactamente con los
valores observados de y, no cometiéndose
ningún error de predicción.”

07 ASTURIAS CORPORACIÓN UNIVERSITARIA®


Not a Técnica preparada por Ast urias Corporación Universit aria. Su dif usión, reproducción o uso t ot al
o parcial para cual quier ot ro propósit o queda prohibida. Todos l os derechos reservados.
Correlación y Regresión Simple (II)

error de predicción. Sin embargo, esta situación es inusual y casi siempre nos
encontramos con relaciones entre variables no perfectas. En estos casos, cuando se
utiliza la recta de regresión para predecir el valor en y a partir del valor en x , es
probable que se cometa un error en la predicción realizada. A este error se le suele
denominar como error de predicción o residual.

Para establecer la validez de la predicción, se estima estadísticamente la probabilidad


de que la predicción puntual esté dentro de unos determinados márgenes de error: se
define un intervalo de confianza y se comprueba si el valor predicho se encuentra
dentro del intervalo.

7 Modelos de Regresión Simple No Lineal


Una clase importante de modelos está formada por las funciones “intrínsecamente
lineales”. Estas relaciones no son lineales, pero son linealizables fácilmente, realizando
las transformaciones oportunas.

Algunas funciones “intrínsecamente lineales” son:

 Modelo exponencial (𝑦 = 𝑘 𝑒 𝛽1 𝑥 )

𝑦 = 𝑘 𝑒 𝛽1𝑥

08 ASTURIAS CORPORACIÓN UNIVERSITARIA®


Not a Técnica preparada por Ast urias Corporación Universit aria. Su dif usión, reproducción o uso t ot al
o parcial para cual quier ot ro propósit o queda prohibida. Todos l os derechos reservados.
Correlación y Regresión Simple (II)

 Modelo potencial 𝑦 = 𝑘 𝑥 𝛽1

𝑦 = 𝑘 𝑥 𝛽1 , 𝑦 = 𝑘 𝑥 𝛽1 ,

para 𝛽1 > 0 para 𝛽1 < 0

8 Resumen
 Para comprender la utilidad del modelo lineal simple, es necesario comprender
el significado del parámetro de regresión, que es el elemento fundamental que
caracteriza la relación entre la variable explicativa y la variable explicada (o
respuesta). En los modelos de uso común, tenemos:

- En el modelo 𝑦 = 𝛽0 + 𝛽1 𝑥 + 𝑢, el coeficiente 𝛽1 representa el incremento


que experimenta la respuesta 𝑦 cuando la variable explicativa 𝑥 aumenta
en una unidad.

- En el modelo log 𝑦 = 𝛽0 + 𝛽1 log 𝑥 + 𝑢, 𝛽1 es aproximadamente el


incremento relativo de 𝑦 cuando 𝑥 aumenta un 1%. Se utiliza
frecuentemente en Econometría, donde a 𝛽1 se le denomina elasticidad.

9 Bibliografía
 Barreto, H; Howland, F .: Introductory Econometrics: Using Monte Carlo Simulation
with Microsoft Excel , Nueva York, Cambridge University Press, 2005.
 Wooldridge, F.M: Introducción a la econometría: un enfoque moderno , Madrid :
Thomson, 2006

 Goldberger, A.S.: Introducción a la econometría , Barcelona, Ariel, 2001.

09 ASTURIAS CORPORACIÓN UNIVERSITARIA®


Not a Técnica preparada por Ast urias Corporación Universit aria. Su dif usión, reproducción o uso t ot al
o parcial para cual quier ot ro propósit o queda prohibida. Todos l os derechos reservados.

S-ar putea să vă placă și