Documente Academic
Documente Profesional
Documente Cultură
Preguntas y ejercicios
1. Cul es el propsito general del anlisis de regresin?
El propsito general del anlisis de regresin es de investigar la relacin funcional existente
entre dos o ms variables, ajustando algn modelo matemtico.
Ejercicios:
6. En una etapa inicial del procesamiento mecnico de piezas de acero, se sabe que una
herramienta sufre un deterioro gradual que se refleja en cierto dimetro de las piezas
manufacturadas. Para predecir el tiempo de vida til de la herramienta se tomaron datos de
horas de uso y el dimetro promedio de cinco piezas producidas al final de la jornada. Los
datos obtenidos para una herramienta se muestran a continuacin:
b) Diagrama de dispersin: se puede observar que existe una correlacin lineal positiva
entre las horas de uso y el dimetro, ya que conforme aumentan las horas de uso aumenta el
dimetro.
Grfico de Dimetro vs Horas de uso
40
Dimetro
37
34
31
28
25
0
100
200
Horas de uso
300
400
c) Anlisis de regresin, como podemos observar la lnea recta que mejor explica la
relacin entre las horas de uso y el dimetro est dada por:
Dimetro = 24.8632 + 0.0464098*Horas de uso
La cual se puede observar en el grafico del modelo ajustado:
Grfico del Modelo Ajustado
Dimetro = 24.8632 + 0.0464098*Horas de uso
40
Dimetro
37
34
31
28
25
0
100
200
Horas de uso
300
400
Prueba de Hiptesis:
H0: 1= 0 o H0: El modelo no se ajusta
H0: 1 0 o H0: El modelo si se ajusta
De acuerdo a la tabla de coeficientes podemos ver que si existe una pendiente, lo cual
significa que entre las variables horas de uso y dimetro si existe una relacin.
Coeficientes
Parmetro
Intercepto
Pendiente
Mnimos Cuadrados
Estimado
24.8632
0.0464098
Estndar
Error
0.323206
0.00168629
Estadstico
T
76.9267
27.5218
Valor-P
0.0000
0.0000
Para poder rechazar o aceptar la hiptesis nula tenemos que tomar en cuenta el anlisis de
varianza del modelo, el cual se presenta a continuacin:
Anlisis de Varianza
Fuente
Suma de Cuadrados
Modelo
366.674
Residuo
8.71365
Total (Corr.)
375.388
Gl
1
18
19
Cuadrado Medio
366.674
0.484092
Razn-F
757.45
Valor-P
0.0000
Analizando esta tabla podemos concluir que el modelo si se ajusta ya que el valor-P es
menor al nivel de confianza de 0.05, por ello podemos decir que con un nivel de confianza
del 95% se rechaza la hiptesis nula.
Verificacin de supuestos:
El supuesto de varianza constante si se cumple ya que al graficar los residuos contra los
predichos, los puntos caen aleatoriamente dentro de la banda horizontal sin que sigan algn
patrn definido.
Grfico de Residuos
Dimetro = 24.8632 + 0.0464098*Horas de uso
1.2
0.8
residuo
0.4
0
-0.4
-0.8
-1.2
25
28
31
34
predicho Dimetro
37
40
residuo
0.4
0
-0.4
-0.8
-1.2
0
8
12
nmero de fila
16
20
88
Rendimiento
84
80
76
72
68
64
8
10
12
14
Tiempo
16
18
20
c) Anlisis de regresin, como podemos observar la lnea recta que mejor explica la
relacin entre el tiempo y el porcentaje de rendimiento est dada por:
Rendimiento = 57.9578 + 1.19492*Tiempo
La cual se puede observar en el grafico del modelo ajustado:
Grfico del Modelo Ajustado
Rendimiento = 57.9578 + 1.19492*Tiempo
88
Rendimiento
84
80
76
72
68
64
8
10
12
14
Tiempo
16
18
20
Prueba de Hiptesis:
H0: 1= 0 o H0: El modelo no se ajusta
H0: 1 0 o H0: El modelo si se ajusta
De acuerdo a la tabla de coeficientes podemos ver que si existe una pendiente, lo cual
significa que entre las variables tiempo y porcentaje de rendimiento si existe una relacin.
Coeficientes
Parmetro
Intercepto
Pendiente
Mnimos Cuadrados
Estimado
57.9578
1.19492
Estndar
Error
6.28403
0.414959
Estadstico
T
9.22303
2.87962
Valor-P
0.0000
0.0164
Para poder rechazar o aceptar la hiptesis nula tenemos que tomar en cuenta el anlisis de
varianza del modelo, el cual se presenta a continuacin:
Anlisis de Varianza
Fuente
Suma de Cuadrados
Modelo
243.684
Residuo
293.872
Total (Corr.)
537.557
Gl
1
10
11
Cuadrado Medio
243.684
29.3872
Razn-F
8.29
Valor-P
0.0164
Analizando esta tabla podemos concluir que el modelo si se ajusta ya que el valor-P es
menor al nivel de confianza de 0.05, por ello podemos decir que con un nivel de confianza
del 95% se rechaza la hiptesis nula.
Verificacin de supuestos:
El supuesto de varianza constante si se cumple ya que los puntos se encuentran dispersos
de forma aleatoria por toda la grfica a lo largo de la banda horizontal.
Grfico de Residuos
Rendimiento = 57.9578 + 1.19492*Tiempo
7.5
residuo
4.5
1.5
-1.5
-4.5
-7.5
67
70
73
76
predicho Rendimiento
79
82
residuo
4.5
1.5
-1.5
-4.5
-7.5
0
6
nmero de fila
10
12
9. En una industria se desea investigar cmo influye la temperatura (C) en la presin del
vapor de B-trimetilboro, los datos obtenidos para tal propsito se muestran en la siguiente
tabla.
180
150
Presin
120
90
60
30
0
0
20
40
60
Temperatura
80
100
b) Anlisis de regresin, como podemos observar la lnea recta que mejor explica la
relacin entre el tiempo y el porcentaje de rendimiento est dada por:
Presin = -47.9351 + 2.21299*Temperatura
La cual se puede observar en el grafico del modelo ajustado:
Grfico del Modelo Ajustado
Presin = -47.9351 + 2.21299*Temperatura
180
150
Presin
120
90
60
30
0
0
20
40
60
Temperatura
80
100
Grfico de Residuos
Presin = -47.9351 + 2.21299*Temperatura
40
residuo
20
-20
-40
-20
10
40
70
100
predicho Presin
130
160
e y f) No ya que se observa que los datos no poseen una relacin lineal, por eso sera mejor
realizar una regresin exponencial o linealizar los datos aplicando logaritmo, para asi
obtener el modelo que mejor ajustara estos datos, el cual sera:
La cual nos dara una R2ajustada de 97.77%, explicando el modelo en un 97%, esto se puede
observar en la grfica del modelo ajustado.
Presin
120
90
60
30
0
0
20
40
60
Temperatura
80
100
11. A partir de la siguiente tabla de datos realice los clculos necesarios y complete una
tabla similar a la 11.2.
14. En una fbrica de pintura se quiere reducir el tiempo de secado del barniz. Los
siguientes datos corresponden al tiempo de secado del barniz (en horas) y a la cantidad de
aditivo con el que se intenta lograr tal reduccin.
Tiempo de secado
15.5
13.5
11.5
9.5
7.5
0
4
6
Cantidad de aditivo
10
b) con base a la grfica de dispersin y a los datos obtenidos la cantidad de aditivo que
recomendara para bajar la concentracin del tiempo de secado sera de 4.
c) el coeficiente de correlacin es igual a 0.334001, indica una relacin relativamente
dbil entre las variables.
d) el coeficiente de correlacin es muy bajo, lo cual indica que la relacin entre las
variables no es significativa.
e) No es correcto ajustar el modelo a una lnea recta, ya que podemos ver claramente
que los puntos no se alinean y se encuentran muy dispersos, adems la forma del
grafico es como una funcin de una parbola.
f) El modelo cuadrtico fue el que obtuvo el mayor ajuste en el modelo sin embargo
solo fue de un 22.56% por debajo del 70% para qu el modelo sea adecuado.
Tiempo de secado = 9.616 + 0.0382442*Cantidad de aditivo^2
Grfico del Modelo Ajustado
Tiempo de secado = 9.616 + 0.0382442*Cantidad de aditivo^2
Tiempo de secado
15.5
13.5
11.5
9.5
7.5
0
4
6
Cantidad de aditivo
10