Sunteți pe pagina 1din 7

Regresin lineal simple

Si sabemos que existe una relacin entre una variable denominada dependiente y otras denominadas independientes (como por ejemplo las existentes entre: la experiencia profesional de los trabajadores y sus respectivos sueldos, las estaturas y pesos de personas, la produccin agraria y la cantidad de fertilizantes utilizados, etc.), puede darse el problema de que la dependiente asuma mltiples valores para una combinacin de valores de las independientes. Si se da ese tipo de relaciones, se suele recurrir a los estudios de regresin en los cuales se obtiene una nueva relacin pero de un tipo especial denominado funcin, en la cual la variable independiente se asocia con un indicador de tendencia central de la variable dependiente. Diagrama de Dispersin Un Diagrama de Dispersin es la forma ms sencilla de definir si existe o no una relacin causa efecto entre dos variables y que tan firme es esta relacin, como estatura y peso. Una aumenta al mismo tiempo con la otra.

El Diagrama de Dispersin es de gran utilidad para la solucin de problemas de la calidad en un proceso y producto, ya que nos sirve para comprobar que causas (factores) estn influyendo o perturbando la dispersin de una caracterstica de calidad o variable del proceso a controlar.

REGRESIN SIMPLE La Regresin es una tcnica estadstica que se puede utilizar para solucionar problemas comunes en los negocios. Muchos estudios se basan en la creencia de que es posible identificar y cuantificar alguna Relacin Funcional entre dos o ms variables, donde una variable depende de la otra variable. Se puede decir que Y depende de X, en donde Y y X son dos variables cualquiera en un modelo de Regresin Simple. "Y es una funcin de X" Como Y depende de X, Y es la variable dependiente, y X es la variable independiente. En el Modelo de Regresin es muy importante identificar cul es la variable dependiente y cul es la variable independiente. La variable dependiente es la variable que se desea explicar, predecir. Tambin se le llama VARIABLE DE RESPUESTA. La variable Independiente X se le denomina VARIABLE EXPLICATIVA REGRESOR y se le utiliza para EXPLICAR Y. REGRESIN LINEAL SIMPLE En el estudio de la relacin funcional entre dos variables poblacionales, una variable X, llamada independiente, explicativa o de prediccin y una variable Y, llamada dependiente o variable respuesta, presenta la siguiente notacin: Y=a+bX+e Donde: a es el valor de la ordenada donde la recta se intercepta con el eje Y. b es el coeficiente de regresin poblacional (pendiente de la lnea recta) e es el error ESTIMACIN DE LA ECUACIN DE REGRESIN (Mtodo de Mnimos Cuadrados) Consiste en determinar los valores de "a" y "b " a partir de la muestra, es decir, encontrar los valores de a y b con los datos observados de la muestra. El mtodo de estimacin es el de Mnimos Cuadrados, mediante el cual se obtiene: Y = f(X)

Luego, la ecuacin de regresin muestral estimada es

Que se interpreta como: a es el estimador de a Es el valor estimado de la variable Y cuando la variable X = 0 b es el estimador de b , es el coeficiente de regresin Est expresado en las mismas unidades de Y por cada unidad de X. Indica el nmero de unidades en que vara Y cuando se produce un cambio, en una unidad, en X (pendiente de la recta de regresin). PROBLEMA

Los datos de la siguiente tabla representan las estaturas (X, cm) y los pesos (Y, kg) de una muestra de 12 hombres adultos. Para cada estatura fijada previamente se observ el peso de una persona , resultando:

X Y

152 155 152 155 157 152 157 165 162 178 183 178 50 61.5 54.5 57.5 63.5 59 61 72 66 72 84 82

Con estos datos vamos a plantear una ecuacin de regresin simple que nos permita pronosticar los pesos conociendo las tallas.

DESARROLLO

Representacin Grfica

Representacin matemtica: estatura x pesos y X2 Regresin Lineal Y2 XY Residual

Luego la ecuacin de regresin ser: Y=a+bX Y = 64.6 + 0.004 X Cunto se espera que pese (en promedio) una persona que mide 1.60 m? SI X = 1.60 ENTONCES Y = 64.6 Coeficiente de correlacin de Pearson El coeficiente de correlacin de Pearson es un ndice estadstico que mide la relacin lineal entre dos variables cuantitativas. A diferencia de la covarianza, la correlacin de Pearson es independiente de la escala de medida de las variables. El clculo del coeficiente de correlacin lineal se realiza dividiendo la covarianza por el producto de las desviaciones estndar de ambas variables:

Siendo: XY la covarianza de (X,Y) X y Y las desviaciones tpicas. El valor del ndice de correlacin vara en el intervalo [-1, +1]:

Si r = 0, no existe relacin lineal. Pero esto no necesariamente implica una independencia total entre las dos variables, es decir, que la variacin de una de ellas puede influir en el valor que pueda tomar la otra. Pudiendo haber relaciones no lineales entre las dos variables. Estas pueden calcularse con la razn de correlacin. Si r = 1, existe una correlacin positiva perfecta. El ndice indica una dependencia total entre las dos variables denominada relacin directa: cuando una de ellas aumenta, la otra tambin lo hace en idntica proporcin. Si 0 < r < 1, existe una correlacin positiva. Si r = -1, existe una correlacin negativa perfecta. El ndice indica una dependencia total entre las dos variables llamada relacin inversa: cuando una de ellas aumenta, la otra disminuye en idntica proporcin. Si -1 < r < 0, existe una correlacin negativa.

Definicin del Coeficiente de Determinacin Denominamos coeficiente de determinacin R2 como el coeficiente que nos indica el porcentaje del ajuste que se ha conseguido con el modelo lineal, es decir el porcentaje de la variacin de Y que se explica a travs del modelo lineal que se ha estimado, es decir a travs del comportamiento de X . A mayor porcentaje mejor es nuestro modelo para predecir el comportamiento de la variable Y Tambin se puede entender este coeficiente de determinacin como el porcentaje de varianza explicada por la recta de regresin y su valor siempre estar entre 0 y 1 y siempre es igual al cuadrado del coeficiente de correlacin (r). R2 = r 2 * 100% Es una medida de la proximidad o de ajuste de la recta de regresin a la nube de puntos. Tambin se le denomina bondad del ajuste.

1 R2 nos indica qu porcentaje de las variaciones no se explica a travs del modelo de regresin, es como si fuera la varianza inexplicada que es la varianza de los residuos.

TRANSFORMACION DE DATOS EN EL ANALISIS DE REGRESION Se trata de simplificar el clculo de b escala. Es decir: X`= X/h Y`= Y/h y r mediante una reduccin en la

Esta transformacin asegura que el valor de b y r no cambien. Ejemplo: X 20000 14000 35000 23000 12000 7000 5000 OBSERVACION: Cuando una de las variables esta expresada en una unidad de tiempo (das, meses o aos) la regresin se denomina serie de tiempo. Ejemplo: Aos (X) 2000 2001 2002 2003 2004 2005 2006 2007 Produccin (Y) 92.4 92.1 80.5 64.2 63.7 61.2 60.3 62.4 X` 1 2 3 4 5 6 7 8 Y 18000 15000 30000 16000 9000 7000 7000 X`= X/1000 Y`= Y/1000

REGRESION NO LINEAL
Se da cuando la recta de regresin no logra ajustar linealmente a un conjunto de puntos.

El procedimiento consiste en aplicar transformaciones a los datos con la finalidad de linealizarlos y as poder usar el mtodo de mnimos cuadrados. Segn sea la dispersin de los datos (nube de puntos) en el plano cartesiano, pueden darse alguna de las siguientes relaciones, Lineal, Logartmica, Exponencial, Cuadrtica, entre otras. Las ecuaciones de cada relacin se presentan en la siguiente tabla.
Ecuaciones de regresin REGRESIN Lineal Logartmica Exponencial Cuadrtica ECUACIN Y = A + BX

Y AbBX
y = AX(B) y = A + Bx +Cx2

Sin embargo obtener el modelo de regresin no es suficiente para establecer la regresin, ya que es necesario evaluar que tan adecuado es el modelo de regresin obtenido.

S-ar putea să vă placă și