Sunteți pe pagina 1din 23

Estadística Aplicada a la Gestión Empresarial

Regresión Lineal Simple y Múltiple

Profesora: Dra. Alejandrina Gonzales Ochoa

1
Regresión Lineal Simple

Objetivo

Encontrar modelos estadísticos que puedan


ser usados para predecir los valores de una
variable dependiente conocida también
como variable respuesta, basado en los
valores de una variable independiente
denominada variable explicativa.

2
Pasos a seguir para realizar un análisis de
Regresión Lineal Simple

1. Identificar la variable dependiente y la variable


independiente.
2. Realizar un diagrama de dispersión.
3. Definir la función de regresión.
4. Estimación de los coeficientes del modelo, mediante el
método de mínimos cuadrados.
5. Validación del modelo.
a) Coeficiente de Correlación.
b) Coeficiente de Determinación.
c) Prueba de hipótesis: Prueba F.
6. Evaluación del modelo: Comprobación de supuestos
(Normalidad y Homocedasticidad).
7. Uso del modelo para realizar estimaciones para la variable y
en función a la variable x.
3
1. Identificación de:
Variable dependiente: Y
Variable independiente: X

2. Identificar el tipo de relación existente entre las variables


a través de los diagrama de dispersión.

4
3. Definir la función de regresión lineal.
Y = f (x)
Ecuación de la recta:
Y = a + bX + Ԑ
Y = β0 + β1 X + Ԑ

5
4. Estimación de los coeficientes de la recta de regresión.

Modelo de regresión poblacional:


Y = a + bX +Ԑ o Y = β0 +β1 X1 + Ԑ

Modelo de regresión muestral:

Y = a + bX + ei o Y = β0 +β1 X1 + ei

Estimar los coeficientes n n n


a través del n xi yi   xi  yi
b  1  i 1 i 1 i 1
Método de Mínimos n
 
n 2

cuadrados (MMC) n xi2    xi 


i 1  i 1 

Yˆ  a  bX a   0  y  bx

6
Estimación del modelo de regresión lineal simple.

Recta de
Mínimos
Cuadrados

7
5. Validación del modelo.
a) Coeficiente de Correlación.
n

x y i i  nx y
r n
i 1
n

x
i 1
2
i  nx 2
y
i 1
2
i  ny 2

-0.70 0
-1 0.70 1

8
b) Coeficiente de Determinación.

r %
2

Significa que el r2% de la variación de la variable


dependiente (Y), se ve explicado por las variaciones de la
variable independiente (X) y el (1- r2%)% no explica
dicha variación.

0 0.70 1

9
c) Prueba de hipótesis: Análisis de Varianza (ANOVA).
Es utilizado en el modelo de Regresión lineal simple para
confirmar estadísticamente si existe una relación lineal
significativa entre la variable dependiente y la variable
independiente. Se denomina prueba de significancia global o
prueba F.

Pasos a seguir:
1) Planteamiento de la hipótesis:
Hipótesis nula: b = 0 (Y no depende de X)
Hipótesis alternativa: b  0 (Y depende de X, existe relación lineal
significativa entre la variable dependiente y la variable independiente).

2) Nivel de significancia

 = 0.05 (confianza del 95%)

3) Estadística de Prueba
Para ello se construye la tabla ANOVA

10
Tabla de Análisis de Varianza
(ANOVA)

Fuente de Suma de Grados Cuadrado Estadística P_Valor

Variación Cuadrados de Medio de prueba


Libertad (Prueba F)
Regresión SCR k-1 CMR =SCR/k-1
CMR
Fcal 
CME
Residual SCE n – k CME =SCE/n-k

Total SCT n-1

n 
SCE   (Yi  Y ) 2
n __ 2
SCT   (Yi  Y) i SCR = SCT - SCE
i 1
i 1
11
Entonces el estadístico de prueba es:

CMR
Fcal 
CME
4) Comparar:
Decisión 1:
Si Fcal > Ftab. Entonces se rechaza la hipótesis nula.

FTab(  = Este valor se halla en la tabla de la


;k-1,n-k)
distribución F, o en Excel con la función estadística
DISTR.F.INV

Se llega a la misma conclusión observando el “P_valor”


Decisión 2:
Si P_valor <  . Entonces se rechaza la hipótesis nula

12
6. Evaluación del modelo: Comprobación de supuestos
a) Homocedasticidad:
En el diagrama no debe existir tendencias, que la variabilidad de los residuos se
mantengan aproximadamente constante, que exista homocedasticidad.

13
b) Normalidad:
Si los puntos están alineados alrededor de la recta diagonal, se considera una
buena aproximación a una curva normal.

14
7. Uso del modelo para realizar estimaciones futuras de la
variable dependiente en función de la variable
independiente.

15
Regresión Lineal Múltiple



Encontrar modelos estadísticos que puedan ser usados para


predecir los valores de una variable dependiente conocida
también como variable respuesta, basado en los valores de
varias variables independientes denominadas variable
explicativas.

16
Regresión Lineal Múltiple

El procedimiento de Regresión Lineal permite utilizar más de una variable


independiente y permite llevar a cabo análisis de regresión múltiple

En el análisis de regresión múltiple la ecuación ya no define una recta en el


plano, sino un hiperplano en un espacio multidimensional

17
Regresión Lineal Múltiple

Con una variable dependiente y dos independientes…

…necesitamos tres ejes para poder representar el diagrama de


dispersión

18
Regresión Lineal Múltiple

Si en lugar de dos variables independientes utilizáramos tres…

…sería necesario un espacio de cuatro dimensiones para poder


construir el diagrama de dispersión

Con más de una variable independiente, la


POR representación gráfica de las relaciones presentes en
TANTO un modelo de regresión resulta poco intuitiva, muy
complicada y nada útil

19
Regresión Lineal Múltiple

Es más fácil y práctico partir de la ecuación del modelo de


regresión lineal:

Y = β0 + β1*X1 + β2*X2 +……..+ βp*Xp + ε

 La variable dependiente Y se interpreta como una combinación lineal de


un conjunto de p variables independientes, cada una de las cuales va
acompañada de un coeficiente β, que indica el peso relativo de esa variable
en la ecuación.
 La ecuación incluye un componente aleatorio (los residuos ε) que recoge
todo lo que las variables independientes no son capaces de explicar.

20
Pasos a seguir para realizar un análisis de
Regresión Lineal Múltiple

1. Realizar los diagramas de dispersión.


2. Definir la función de regresión.
3. Estimación de los coeficientes mediante el método de mínimos
cuadrados.
4. Validación del modelo.
a) Coeficiente de Correlación Múltiple.
b) Coeficiente de Determinación.
c) Coeficiente de Determinación Ajustado
d) Prueba de hipótesis (Prueba F y Prueba t).
6. Evaluación del modelo: Comprobación de supuestos
7. Uso del modelo para realizar predicciones.
21
Regresión Lineal Simple

Ejemplo:
Caso: Empresa
C&A
(Laboratorio 13)

22
Regresión Lineal Simple

La empresa C&A realizó recientemente una compaña indicando que


tenía vacantes para mensajeros “Despierte ante las oportunidades”,
decía el anuncio. Con una ruta óptima usted trabajará cerca de su
casa, unas horas al día cuando tenga tiempo. La ganancia semanal
promedio en dólares depende del número de clientes diarios.

1. Identificación de la variable dependiente y la


variable dependiente

 Variable dependiente: Ganancia semanal promedio $


 Variable independiente: Número de clientes diarios

23

S-ar putea să vă placă și