Sunteți pe pagina 1din 23

Estadstica Inferencial

Unidad 5. ANLISIS DE REGRESIN.


Logro:
Al finalizar la unidad, el estudiante modela una
variable cuantitativa Y (dependiente), en
funcin de una o ms variables cuantitativas
X (independientes, predictoras o regresoras)
con el propsito de predecir la variable Y, con
el apoyo del software SPSS en problemas
aplicados en administracin y los negocios.

Semana 9
Estadstica Inferencial

Unidad 5. ANLISIS DE REGRESIN.


Temas:
- Regresin Lineal Simple. (RLS)
- Regresin No Lineal. (RNL)
- Regresin Lineal Mltiple. (RLM o RM)

Semana 9
Estadstica Inferencial

Unidad 5. ANLISIS DE REGRESIN.


Tema: Anlisis de Regresin Lineal Simple. (RLS)
1. Identificar la posible relacin funcional entre dos
variables usando el diagrama de dispersin.
2. Modelar la relacin lineal entre dos variables.
3. Interpretar el coeficiente de regresin
4. Validar el modelo de regresin lineal simple.
5. Interpretar el coeficiente de determinacin.
6. Predecir valores de la variable dependiente a travs
de intervalos de confianza.
Semana 9
Logro:

Al finalizar la sesin, el estudiante modela (a travs


de la ecuacin de Regresin Lineal Simple) una
variable cuantitativa Y (dependiente) en funcin
de otra variable cuantitativa X (independiente),
con el propsito de su prediccin en problemas
aplicados a la Administracin y Negocios.

Semana 9
Motivacin

El gerente de marketing de un supermercado, desea


predecir el tiempo que demoran las cajeras en atender
a un cliente.

El tiempo de atencin, puede ser


explicado por el nmero de productos
comprados?

Se definen las variables:

Y = Tiempo de atencin (min)


X = Nmero de productos comprados
Anlisis de Regresin Lineal Simple

Es una tcnica estadstica que permite estudiar la


relacin lineal entre una variable Y (dependiente)
en funcin de otra variable X (independiente).

Yi 0 1 X i ei i = 1, 2, , n

Error ~ NID(0,2)
Variable Variable Prueba de K-S
dependiente Parmetros
predictora Error No Autocorrelacionado
(independiente) Prueba de D - W
Diagrama de dispersin

Grfica para determinar el tipo de relacin entre la


variable X e Y

Scatterplot of Y1 vs X1, Y vs X
6.0 7.5 9.0 10.5 12.0
Y1* X1 Y* X
350 150

140
325
130

120
300
110

100
275
90

250 80

24.0 25.5 27.0 28.5


Tipos de relaciones entre X e Y
Supuestos del Modelo de RLS

1) Los errores se distribuyen normalmente: Para probar


este supuesto no se debe rechazar Ho en la prueba de Kolmogorov-
Smirnov KS.

H0: Los errores se distribuyen normalmente


H1: Los errores no se distribuyen normalmente
2) Los errores no estn autocorrelacionados: Para probar
este supuesto el valor de DW (Durbin-Watson) debe estar en el
intervalo [1,3]

tocorre laci n o a
tocorrelaci n tocorrelaci n -

1 DW 3
Ecuacin de Regresin lineal simple
estimada

Y 0 1 X

0 : Intercepto con el eje Y. Es el valor de Y que


se obtiene cuando X = 0.

1 : Pendiente de la recta. Mide el cambio que


se producir en la variable dependiente Y,
cuando la variable independiente X vara en
una unidad.
La relacin
entre X e Y puede ser:
Directa : 1 0 (pendiente positiva)

Inversa : 1 0 (pendiente negativa)
Anlisis de Variancia

Permite realizar la Prueba de Hiptesis respecto a la


existencia de la relacin lineal entre X e Y

Prueba estadstica: Fcal = CMR / CME


Decisin estadstica: Se rechaza Ho, si Fcal > Fcrtica (1, n 2, )
Validar el Modelo RLS (Coeficiente de Regresin 1)

Formulacin de hiptesis: H 0 : 1 0
H1 : 1 0

1
Estadstico de prueba: tc ~ t (n 2)
Sb1
Se
Donde: Sb1 (Error tpico de 1)
S XX
Decisin estadstica:
Se Re chaza Ho : tc t ,n2
tc t ,n2
2 2

No se rechaza Ho : t ,n2
tc t ,n2
2 2
Prueba de Hiptesis para el Coeficiente de Regresin 1

Formulacin de hiptesis:
Ho : 1 k Ho : 1 k Ho : 1 k
H1 : 1 k H1 : 1 k
H1 : 1 k
1 k
Estadstico de prueba: tc ~ t (n 2)
Sb1

Se SCR
Error tpico de 1: Sb1 Con : S XX


2

S XX

1

SCE
Error estndar de la estimacin: Se CME
n2
Medida de Bondad de Ajuste

2
Coeficiente de determinacin: R
Indica el porcentaje (proporcin) de la variabilidad
de Y que es explicada por la ecuacin de
regresin ajustada.
SCR
R
2
0 R 2
1
SCT
Coeficiente de no determinacin: (1 R 2
)

Porcentaje (proporcin) de la variabilidad de Y


que no es explicada por el modelo
SCR
(1 R 2 ) 1
SCT
Intervalo de Confianza para predecir valores

Para hallar un Intervalo con un nivel de confianza del


(1-)*100%, de los valores predecidos para el valor medio
y para un valor individual de Y, dado un valor de X0:

Para un valor medio: y 0 t ( / 2, n2 ) Se


1

x0 x 2

n S xx

1 x 0 x
2

y
Para un valor individual: 0 ( / 2, n 2 )
t Se 1
n S xx

donde: SCR
SCE S xx
y 0 0 1 x0 ; Se
n2
CME 12
Ejercicio.

La empresa Grupo-XYZ, produce partes para camin que


utilizan en los remolques. La gerencia de produccin desea
desarrollar un modelo de regresin lineal simple, que le permita
predecir los costos de produccin (miles de dlares) en funcin de
las unidades producidas (en cientos). Los datos se muestran en la
siguiente tabla.
Unidades producidas Costos
(cientos) (miles $)
12,3 6,2
8,3 5,3
6,5 4,1
4,8 4,4
6,6 5,2
4,6 4,8
9,6 5,9
6,5 4,2
Salida del procesamiento con el SPSS.
Responda:

1. Verifique los supuestos del modelo de regresin. Utilice =


0,05
2. Escriba la ecuacin de regresin lineal estimada e interprete el
coeficiente de regresin.
3. Con un nivel de significacin de 0,05, valide el modelo de
regresin.
4. Qu porcentaje de la variacin de los costos de produccin se
puede atribuir a la regresin sobre las unidades producidas?
5. Estime con un nivel de confianza del 95% el costo promedio
de produccin, cuando se producen 800 unidades. Interprete.
6. Se puede afirmar con un nivel de significacin del 5% que,
por cada 100 unidades adicionales producidas el costo de
produccin se incrementa en ms de $ 260.
1. Verifique los supuestos del modelo de regresin.
Utilice = 0,05

i. Normalidad de errores
Ho: Los errores siguen una distribucin normal
H1: Los errores no siguen una distribucin normal
Sig asinttica= 0,200 > = 0,05, entonces decisin: NRHo
Conclusin: con un nivel de significacin del 5%, los
errores siguen una distribucin normal. Por lo tanto, se
cumple el supuesto de Normalidad
ii. Autocorrelacin de errores
Como D-W = 1,591 [1, 3], entonces, se puede afirmar
que los errores no estn autocorrelacionados y se
estara cumpliendo el segundo supuesto.
2. Escriba la ecuacin de regresin lineal estimada e
interprete el coeficiente de regresin.

Ecuacin de regresin estimada: Y 3,164 0,250 X

Coeficiente de regresin estimado: 1 0,250
Interpretacin: Por cada cien unidades de produccin que
se aumenten, el costo de produccin se incrementa en 250
dlares.
3. Validacin del modelo de regresin

Ho: 1 = 0 Valor del estadstico de prueba: 1 0,250


TCalc 3,623
S 0,069
H1: 1 1

Valores crticos de la prueba: TCrtico1 (0,025;6) 2,4469


T (0,975;6) 2,4469
Decisin: RHo Crtico 2

Conclusin: Con un nivel de significacin del 5%, el modelo


es vlido porque el coeficiente de regresin es significativo.
4. Qu porcentaje de la variacin de los costos de produccin se
puede atribuir a la regresin sobre las unidades producidas?

R 2 0,686
El 68,6% de la variacin de los costos de produccin se puede
atribuir a la regresin sobre las unidades producidas
5. Estime con un nivel de confianza del 95% el costo promedio de
produccin, cuando se producen 800 unidades. Interprete

Y 0 3,164 0,250 X 0 3,164 0,250(8) 5,164 Se 0,4702

X 7,4 TCrtico1 (0,025;6) 2,447 S XX


SCR 2,903
46,448
1
2
0,250 2

1 8 7,4 IC (Y / x 8) : [4,745;5,583]
2
IC ( Y / x 8) : 5,164 2,447 0,4702
8 46,448
Con un nivel de confianza del 95%, se estima que el costo
promedio de produccin cuando se producen 800 unidades, est
contenido en el intervalo [4,745; 5,583] miles de dlares.
6. Se puede afirmar con un nivel de significacin del 5% que, por
cada 100 unidades adicionales producidas, el costo de
produccin se incrementa en ms de $ 240

Ho: 1 ,2
H1: 1 > 0,240

1 0,240 0,250 0,240
Valor del estadstico de prueba: TCalc 0,145
S 0,069
1

Valor crtico de la prueba: TCrtico1 (0,05;6) 1,94318

Decisin: NRHo
Conclusin: Con un nivel de significacin del 5%, no se puede
afirmar que por cada 100 unidades adicionales producidas, el costo
de produccin se incremente en ms de $ 240.
Evaluacin

Ud. est realizando un estudio sobre la demanda (miles de unidades)


de polos en Lima Metropolitana, y cree que el principal factor que afecta
la demanda es el precio de venta (soles). A partir del anlisis de una
muestra se obtuvo lo siguiente:

Ecuacin de regresin: Y 500 4 X
Coeficiente de determinacin: R 2 0.9025

a. A qu conclusiones llega con el coeficiente de correlacin? Explique.

b. Qu porcentaje de la variabilidad de la demanda se explica por el modelo de


regresin? Explique.

c. Calcule la demanda de polos cuando el precio de venta es 50 soles.

S-ar putea să vă placă și