Documente Academic
Documente Profesional
Documente Cultură
1
En una etapa inicial del procesamiento mecánico de piezas de acero, se sabe que una herramienta
sufre un deterioro gradual que se refleja en cierto diámetro de las piezas manufacturadas. Para
predecir el tiempo de vida útil de la herramienta se tomaron datos de horas de uso y el diámetro
promedio de cinco piezas producidas al final de la jornada. Los datos obtenidos para una
herramienta se muestran a continuación:
Horas de uso Diámetro (mm)
16 26.2
32 25.7
48 26.0
64 27.7
80 28.3
96 29.5
112 30.1
128 31.8
144 31.4
160 33.4
176 33.6
192 32.7
208 35.0
224 36.1
240 35.7
256 36.2
272 36.8
288 39.1
304 38.7
320 39.2
grafica de dispersion
45
40
f(x) = 0.05x + 24.86
35 R² = 0.98
30
horas de trabajo
25
20
15
10
0
0 50 100 150 200 250 300 350
diametro de la pieza
a) La variable independiente son las horas de uso y la variable dependiente es el diámetro de las
piezas.
b) Diagrama de dispersión: se puede observar que existe una correlación lineal positiva entre las
horas de uso y el diámetro, ya que conforme aumentan las horas de uso aumenta el diámetro.
40
37
34
Diámetro
31
28
25
0 100 200 300 400
Horas de uso
c) Análisis de regresión, como podemos observar la línea recta que mejor explica la relación entre
las horas de uso y el diámetro está dada por:
Diámetro = 24.8632 + 0.0464098*Horas de uso
La cual se puede observar en el grafico del modelo ajustado:
40
37
34
Diámetro
31
28
25
0 100 200 300 400
Horas de uso
Prueba de Hipótesis:
H0: β1= 0 o H0: El modelo no se ajusta
H0: β1≠ 0 o H0: El modelo si se ajusta
De acuerdo a la tabla de coeficientes podemos ver que si existe una pendiente, lo cual significa que
entre las variables horas de uso y diámetro si existe una relación.
Coeficientes
Mínimos Estándar Estadístico
Cuadrados
Parámetro Estimado Error T Valor-P
Intercepto 24.8632 0.323206 76.9267 0.0000
Pendiente 0.0464098 0.00168629 27.5218 0.0000
Para poder rechazar o aceptar la hipótesis nula tenemos que tomar en cuenta el análisis de varianza
del modelo, el cual se presenta a continuación:
Análisis de Varianza
Fuente Suma de Gl Cuadrado Razón-F Valor-P
Cuadrados Medio
Modelo 366.674 1 366.674 757.45 0.0000
Residuo 8.71365 18 0.484092
Total (Corr.) 375.388 19
Analizando esta tabla podemos concluir que el modelo si se ajusta ya que el valor-P es menor al
nivel de confianza de 0.05, por ello podemos decir que con un nivel de confianza del 95% se rechaza
la hipótesis nula.
Verificación de supuestos:
El supuesto de varianza constante si se cumple ya que al graficar los residuos contra los
predichos, los puntos caen aleatoriamente dentro de la banda horizontal sin que sigan algún patrón
definido. Gráfico de Residuos
Diámetro = 24.8632 + 0.0464098*Horas de uso
1.2
0.8
0.4
residuo
-0.4
-0.8
-1.2
25 28 31 34 37 40
predicho Diámetro
1.2
0.8
0.4
residuo
-0.4
-0.8
-1.2
0 4 8 12 16 20
número de fila
d) el coeficiente de determinación R 2ajustado es de 97.6788% lo cual indica que nuestro modelo tiene
una calidad de ajuste satisfactoria, ya que explica el 97.6% de la variabilidad en Diámetro.
e) El valor sería de 433.89 horas a un diámetro de 45 mm, sin embargo realizar una extrapolación la
cual está más allá de la región que contiene a las observaciones originales está mal ya que
probablemente el modelo ya no se ajuste adecuadamente fuera de la región, ya que nuestra región
de estudio va de 25.7 a 39.2 mm de diámetro.
f) el valor de la pendiente es de 0.0464098, esto nos indica la razón de cambio en el diámetro (y)
con respecto al cambio de las horas de uso (x), es decir cuánto va a variar el diámetro cuando se
varíen las horas de uso.
g) El error estándar de la estimación fue de 0.695767, lo cual indica que la calidad de ajuste de
nuestro modelo es buena, ya que si el error estándar de estimación es menor la calidad del ajuste
será mayor.
Problema No. 2
Se piensa que el número de libras de vapor consumidas mensualmente por una planta química se
relaciona con la temperatura ambiente promedio (en °F) de ese mes. En la tabla siguiente se
muestra la temperatura y el consumo anual:
R= Si, con la finalidad de saber cómo la temperatura afecta el consumo y así poder predecir a que
temperatura es conveniente tratar el consumo.
B) Suponiendo que un modelo de regresión lineal simple es apropiado, ajuste el modelo de
regresión que relacione el consumo de vapor ( y ) con la temperatura promedio ( x ).
¿Cuál es la estimación del consumo esperado de vapor cuando la temperatura promedio es
55°F?
R= 497.3545
Y x
240 1.6
181 9.4
193 15.5
155 20.0
172 22.0
110 35.5
113 43.0
75 40.5
94 33.0
Problema No. 4
En un proceso de extracción se estudia la relación entre tiempo de extracción y rendimiento. Los
datos obtenidos se muestran en la siguiente tabla.
88
84
R e n d im ie n to
80
76
72
68
64
8 10 12 14 16 18 20
Tiempo
c) Análisis de regresión, como podemos observar la línea recta que mejor explica la relación entre
el tiempo y el porcentaje de rendimiento está dada por:
RendimientoGráfico
= 57.9578 + 1.19492*Tiempo
del Modelo Ajustado
Rendimiento = 57.9578 + 1.19492*Tiempo
88
La cual se puede observar en el grafico del modelo ajustado:
84
Rendimiento
80
76
72
68
64
8 10 12 14 16 18 20
Tiempo
Prueba de Hipótesis:
H0: β1= 0 o H0: El modelo no se ajusta
H0: β1≠ 0 o H0: El modelo si se ajusta
De acuerdo a la tabla de coeficientes podemos ver que si existe una pendiente, lo cual significa que
entre las variables tiempo y porcentaje de rendimiento si existe una relación.
Coeficientes
Mínimos Estándar Estadístico
Cuadrados
Parámetro Estimado Error T Valor-P
Intercepto 57.9578 6.28403 9.22303 0.0000
Pendiente 1.19492 0.414959 2.87962 0.0164
Para poder rechazar o aceptar la hipótesis nula tenemos que tomar en cuenta el análisis de varianza
del modelo, el cual se presenta a continuación:
Análisis de Varianza
Fuente Suma de Gl Cuadrado Razón-F Valor-P
Cuadrados Medio
Modelo 243.684 1 243.684 8.29 0.0164
Residuo 293.872 10 29.3872
Total (Corr.) 537.557 11
Analizando esta tabla podemos concluir que el modelo si se ajusta ya que el valor-P es menor al
nivel de confianza de 0.05, por ello podemos decir que con un nivel de confianza del 95% se rechaza
la hipótesis nula. Gráfico de Residuos
Rendimiento = 57.9578 + 1.19492*T iempo
Verificación de 7.5
supuestos:
4.5
El supuesto de varianza constante si se cumple ya que los puntos se encuentran dispersos de
re s id u o
1.5
forma aleatoria por toda la gráfica a lo largo de la banda horizontal.
-1.5
-4.5
-7.5
67 70 73 76 79 82
predicho Rendimiento
El supuesto de independencia si se cumple ya que los puntos o residuos se encuentran dispersos
de forma arbitraria dentro del gráfico de residuos vs número de corrida, sin cumplir ninguna
tendencia.
Gráfico de Residuos
Rendimiento = 57.9578 + 1.19492*Tiempo
7.5
4.5
1.5
residuo
-1.5
-4.5
d) el coeficiente de determinación R2ajustado es de .3986 lo cual indica que nuestro modelo no tiene
-7.5
una buena calidad de0ajuste, ya2 que solo4 nosnúmero
explica
6 el 39.865%
de fila
8 de10la variabilidad
12 en Rendimiento.
Además en general, para fines de predicción se recomienda un R 2ajustado de al menos 0.7 o 70% de
explicación del modelo.
f) Se podría calcular el valor que piden con respecto a los 2 min, sin embargo realizar una
extrapolación la cual está más allá de la región que contiene a las observaciones originales está mal
ya que probablemente el modelo ya no se ajuste adecuadamente fuera de la región, ya que nuestra
región de estudio va de 8 a 20 min de Tiempo.
Problema No. 5
En un artículo de Journal of Environmental Energineering se reportan los
resultados de un estudio sobre la presencia de sodio y cloruros en corrientes
superficiales de la parte central de Rhode Island. Los datos que se presentan a
continuación corresponden a la concentración de cloruros y (en mg/l) y al área de
carretera de la vertiente x (en %).
x y
0.19 4.4
0.15 6.6
0.57 9.7
0.70 10.6
0.67 10.8
0.63 10.9
0.47 11.8
0.70 12.1
0.60 14.3
0.78 14.7
0.81 15.0
0.78 17.3
0.69 19.2
1.30 23.1
1.05 27.4
1.06 27.7
1.74 31.8
1.62 39.5
R= 20.567