Sunteți pe pagina 1din 9

REGRESION LINEAL SIMPLE

Con frecuencia, nos encontramos en economa con modelos en los que el comportamiento de una variable, Y, se puede explicar a travs de una variable X; lo que representamos mediante Y = f (X) (1) Si consideramos que la relacin f, que liga Y con X, es lineal, entonces (1) se puede escribir as: t 1 2 t Y = + X (2) Como quiera que las relaciones del tipo anterior raramente son exactas, sino que ms bien son aproximaciones en las que se han omitido muchas variables de importancia secundaria, debemos incluir un trmino de perturbacin aleatoria , que refleja todos los factores distintos de X -que influyen sobre la variable endgena, pero que ninguno de ellos es relevante individualmente. Con ello, laCuando se quiere saber en qu medida estn relacionadas dos variables en estudio se utiliza el modelo de regresin lineal simple, expresado de la forma:

Y = 0 + 1X + Y: 0 y 1: X: :
Variable dependiente Parmetros del modelo Variable independiente Error del modelo

ECUACION DE REGRESION LINEAL SIMPLE Cuando tenemos varias distribuciones de datos con su propia media o valor esperado

E (Y) = 0 + 1X

La relacin lineal entre las dos variable puede ser: E(Y) Si 1 > 0 X E(Y) Si 1 < 0 X E(Y) Si 1 = 0 X No hay relacin Relacin lineal negativa Relacin lineal positiva

Ahora bien, cuando no se conocen los valores poblacionales se utiliza la ECUACION DE REGRESION LINEAL SIMPLE ESTIMADA:

y = b0 + b1x

y : es el estimador puntual de E(Y) b0 , b1: estimadores de 0 y 1 respectivamente


Para hallar la recta de regresin lineal simple estimada, a travs de los datos muestrales, se utilizara el METODO DE LOS MINIMOS CUADRADOS, criterio consiste en encontrar los valores de b0 y b1 que hacen mnima la suma de los cuadrados de las desviaciones entre los valores observados de la variable dependiente y los valores estimados de la misma.

Ejemplo: Suponemos una muestra de 10 restaurantes que presenta el nmero de clientes y las ventas trimestrales: Restaurant Clientes (miles) Ventas (miles BF) 1 2 58 2 6 105 3 8 88 4 8 118 5 12 117 6 16 137 7 20 157 8 20 169 9 22 149 10 26 202

DIAGRAMA DE DISPERSION: Se obtiene de graficar los valores de las variables, en este caso clientes (que ser X) contra ventas (Y)

Yi
250

200

150

100

50

0 0 5 10 15 20 25 30

Xi

Para predecir las ventas del restaurante se utilizar la recta de regresin lineal de la forma:

yi = b0 + b1xi yi : valor estimado de las ventas del restaurante b0 : interseccin de la recta con el eje Y b1 : pendiente de la recta xi : nmero de clientes por restaurant

CRITERIO DE LOS MINIMOS CUADRADOS Consiste en encontrar los valores de b0 y b1 que hacen mnima la suma de los cuadrados de las desviaciones entre los valores observados y los valores estimados de la misma variable. Se utilizan los datos muestrales. Entonces la notacin del criterio es: min(yi yi)2 yi : valores observados de la variable dependiente yi : valores estimados de la variable dependiente

Siguendo con el ejemplo


)
-12 -8 -6 -6 -2 2 6 6 8 12 -72 -25 -42 -12 -13 7 27 39 19 72 864 200 252 72 26 14 162 234 152 864 2840 144 64 36 36 4 4 36 36 64 144 568

Luego:

yi = 60 + 5xi
250

200

150 Series1 100

50

0 0 5 10 15 20 25 30

La pendiente b1 es positiva lo que indica que la relacin lineal entre las dos variables, nmero de clientes y venta trimestral es directamente proporcional. Podemos predecir con la recta obtenida las ventas para cualquier nmero de clientes, por ejemplo, para un restaurant con 16.000 clientes las ventas sern de

yi = 60 + 5Xi
= 60 +5*16 = 60 + 80 = 140

Es decir, 140.000 Bs

SUMA DEL CUADRADO DE LOS ERRORES: SUMA DE CUADRADOS TOTAL: SUMA DE CUADRADOS DE LA REGRESION: Se demuestra que: SCT = SCR + SCE Para el ejemplo:
70 90 100 100 120 140 160 160 170 190 y- -12 15 -12 18 -3 -3 -3 9 -21 12 (yi - )2 144 225 144 324 9 9 9 81 441 144 1530

SCE : STC : SCR :

5184 625 1764 144 169 49 729 1521 361 5184 15730

3600 1600 900 900 100 100 900 900 1600 3600 14200

COEFICIENTE DE DETERMINACION:

* 100

Se expresa en forma de porcentaje, en el caso del ejemplo, r2 = 14200/15730 = 0.9027*100, se entiende que el 90.27 % de la variabilidad en las ventas es explicado por la relacin lineal entre los clientes y las ventas. COEFICIENTE DE CORRELACION MUESTRAL:

Si

tiende a 1 hay mayor correlacin positiva tiende a 1 hay mayor correlacin negativa tiende a 0 no hay correlacin

Para el ejemplo =+ = + 0.9051 Luego, como tiende a 1 se puede decir que hay fuerte correlacin positiva.

ERROR ESTANDAR DE ESTIMACION

TABLA ANOVA. EL CONTRASTE DE REGRESIN. En este apartado se descompone la variabilidad de la variable respuesta en variabilidad explicada por el modelo ms variabilidad no explicada o residual, esto permitir contrastar si el modelo es significativo o no. Bajo la hiptesis de que existe una relacin lineal entre la variable prediccin y predictora, se quiere realizar el siguiente contraste de hiptesis,

frente a la alternativa

por tanto, si se acepta H0, la variable predictora no influye y no hay relacin lineal entre ambas variables. En caso contrario, si existe una dependencia lineal de la variable respuesta respecto a la predictora. Para todos los datos muestrales se hace la siguiente descomposicin

elevando al cuadrado y sumando se obtiene,

en base a la ortagonalidad de los vectores se obtiene que los productos cruzados son cero, de donde se sigue la siguiente igualdad (Teorema de Pitgoras) que permite descomponer la variabilidad de la variable respuesta en la variabilidad explicada por la recta de regresin

ms la variabilidad residual o no explicada por el modelo ajustado ,

Global o Total

del Error

de la Regresin

Ahora se puede construir la siguiente tabla ANOVA Tabla ANOVA del modelo de regresin simple Fuente de Variacin ERROR REGRESION TOTAL Suma de Cuadrados SCE = SCR = SCT =
2

Grados de Libertad 1 n-2 n-1

Varianzas

Para probar si la regresin efectuada es significativa se utilizan tres tipos de pruebas de significacin: Prueba t Intervalo de confianza para 1 Prueba F PRUEBA T: Se elabora el contraste para la no relacin entre las variables, es decir que la pendiente de la recta de regresin 1 es cero contra la pendiente diferente de cero. H0: 1 = 0 Ha: 1 0 Si se rechaza H0 es porque hay una relacin estadsticamente significativa entre las variables. El estadstico de prueba para este contraste es:

En donde

Criterios de rechazo: p-Valor: RECHAZO si p-valor Valor crtico: RECHAZO si t -t /2 RECHAZO si t t /2 INTERVALO DE CONFIANZA PARA 1 b1 ME ME= t /2 * sb1

Donde t tiene n-2 grados de libertad

S-ar putea să vă placă și