Sunteți pe pagina 1din 18

Problema No.

1
En una etapa inicial del procesamiento mecánico de piezas de acero, se sabe que una herramienta
sufre un deterioro gradual que se refleja en cierto diámetro de las piezas manufacturadas. Para
predecir el tiempo de vida útil de la herramienta se tomaron datos de horas de uso y el diámetro
promedio de cinco piezas producidas al final de la jornada. Los datos obtenidos para una
herramienta se muestran a continuación:
Horas de uso Diámetro (mm)
16 26.2
32 25.7
48 26.0
64 27.7
80 28.3
96 29.5
112 30.1
128 31.8
144 31.4
160 33.4
176 33.6
192 32.7
208 35.0
224 36.1
240 35.7
256 36.2
272 36.8
288 39.1
304 38.7
320 39.2

a) ¿En este problema cuál variable se considera independiente y cuál dependiente?


R: La variable dependiente serán las horas de trabajo mientras que la independiente será el
diámetro de la pieza.
b) Mediante un diagrama de dispersión analice la relación entre estas dos variables. ¿Qué tipo
de relación observa y cuáles son algunos hechos especiales? Relación positiva fuerte
c) Haga un análisis de regresión (ajuste una línea recta a estos datos, aplique pruebas de
hipótesis y verifique residuos)
d) ¿La calidad de ajuste es satisfactoria? Argumente
e) Si el diámetro máximo tolerado es de 45, ¿Cuántas horas de uso estima que tiene esa
herramienta?
f) Señale el valor de la pendiente de la recta e interprételo en términos prácticos
g) Obtenga el error estándar de estimación y comente qué relación tiene éste con la calidad de
ajuste.

grafica de dispersion
45

40
f(x) = 0.05x + 24.86
35 R² = 0.98

30
horas de trabajo

25

20

15

10

0
0 50 100 150 200 250 300 350

diametro de la pieza
a) La variable independiente son las horas de uso y la variable dependiente es el diámetro de las
piezas.

b) Diagrama de dispersión: se puede observar que existe una correlación lineal positiva entre las
horas de uso y el diámetro, ya que conforme aumentan las horas de uso aumenta el diámetro.

Gráfico de Diámetro vs Horas de uso

40

37

34
Diámetro

31

28

25
0 100 200 300 400
Horas de uso
c) Análisis de regresión, como podemos observar la línea recta que mejor explica la relación entre
las horas de uso y el diámetro está dada por:
Diámetro = 24.8632 + 0.0464098*Horas de uso
La cual se puede observar en el grafico del modelo ajustado:

Gráfico del Modelo Ajustado


Diámetro = 24.8632 + 0.0464098*Horas de uso

40

37

34
Diámetro

31

28

25
0 100 200 300 400
Horas de uso

Prueba de Hipótesis:
H0: β1= 0 o H0: El modelo no se ajusta
H0: β1≠ 0 o H0: El modelo si se ajusta
De acuerdo a la tabla de coeficientes podemos ver que si existe una pendiente, lo cual significa que
entre las variables horas de uso y diámetro si existe una relación.

Coeficientes
Mínimos Estándar Estadístico
Cuadrados
Parámetro Estimado Error T Valor-P
Intercepto 24.8632 0.323206 76.9267 0.0000
Pendiente 0.0464098 0.00168629 27.5218 0.0000

Para poder rechazar o aceptar la hipótesis nula tenemos que tomar en cuenta el análisis de varianza
del modelo, el cual se presenta a continuación:
Análisis de Varianza
Fuente Suma de Gl Cuadrado Razón-F Valor-P
Cuadrados Medio
Modelo 366.674 1 366.674 757.45 0.0000
Residuo 8.71365 18 0.484092
Total (Corr.) 375.388 19

Analizando esta tabla podemos concluir que el modelo si se ajusta ya que el valor-P es menor al
nivel de confianza de 0.05, por ello podemos decir que con un nivel de confianza del 95% se rechaza
la hipótesis nula.

Verificación de supuestos:

El supuesto de varianza constante si se cumple ya que al graficar los residuos contra los
predichos, los puntos caen aleatoriamente dentro de la banda horizontal sin que sigan algún patrón
definido. Gráfico de Residuos
Diámetro = 24.8632 + 0.0464098*Horas de uso

1.2

0.8

0.4
residuo

-0.4

-0.8

-1.2
25 28 31 34 37 40
predicho Diámetro

El supuesto de independencia si se cumple ya que los puntos o residuos se encuentran dispersos


de forma arbitraria dentro del grafico de residuos vs número de corrida, sin cumplir ninguna
tendencia.
Gráfico de Residuos
Diámetro = 24.8632 + 0.0464098*Horas de uso

1.2

0.8

0.4
residuo

-0.4

-0.8

-1.2
0 4 8 12 16 20
número de fila
d) el coeficiente de determinación R 2ajustado es de 97.6788% lo cual indica que nuestro modelo tiene
una calidad de ajuste satisfactoria, ya que explica el 97.6% de la variabilidad en Diámetro.

e) El valor sería de 433.89 horas a un diámetro de 45 mm, sin embargo realizar una extrapolación la
cual está más allá de la región que contiene a las observaciones originales está mal ya que
probablemente el modelo ya no se ajuste adecuadamente fuera de la región, ya que nuestra región
de estudio va de 25.7 a 39.2 mm de diámetro.

f) el valor de la pendiente es de 0.0464098, esto nos indica la razón de cambio en el diámetro (y)
con respecto al cambio de las horas de uso (x), es decir cuánto va a variar el diámetro cuando se
varíen las horas de uso.

g) El error estándar de la estimación fue de 0.695767, lo cual indica que la calidad de ajuste de
nuestro modelo es buena, ya que si el error estándar de estimación es menor la calidad del ajuste
será mayor.
Problema No. 2
Se piensa que el número de libras de vapor consumidas mensualmente por una planta química se
relaciona con la temperatura ambiente promedio (en °F) de ese mes. En la tabla siguiente se
muestra la temperatura y el consumo anual:

Mes Temperatura Consumo/1000


Enero 21 185.79
Febrero 24 214.47
Marzo 32 288.03
Abril 47 424.84
Mayo 50 454.58
Junio 59 539.03
Julio 68 621.55
Agosto 74 657.06
Septiembre 62 562.03
Octubre 50 452.93
Noviembre 41 369.95
A) Trace un Diciembre 30 273.98 diagrama de
dispersión de los datos. ¿Parecería apropiado un modelo de regresión lineal simple en este
caso?

R= Si, con la finalidad de saber cómo la temperatura afecta el consumo y así poder predecir a que
temperatura es conveniente tratar el consumo.
B) Suponiendo que un modelo de regresión lineal simple es apropiado, ajuste el modelo de
regresión que relacione el consumo de vapor ( y ) con la temperatura promedio ( x ).
¿Cuál es la estimación del consumo esperado de vapor cuando la temperatura promedio es
55°F?
R= 497.3545

C) ¿Qué cambio se espera en el consumo de vapor promedio cuando la temperatura mensual


promedio cambia 1°F?
R= 2.15%
R= 108.7056 consumo/1000

D) Suponga que la temperatura mensual promedio es de 47°F. Calcule el vapor ajustado y el


residual correspondiente.
VAPOR= 424.84
RESIDUAL= -0.042718344
Problema No. 3
En un artículo de Wear se presentan los datos del desgaste por rozamiento del acero dulce y la
viscosidad del aceite. Los datos representativos, con x=viscosidad delaceite y
y=volumen del desgaste ( 10−4 mm ), son:

Y x
240 1.6
181 9.4
193 15.5
155 20.0
172 22.0
110 35.5
113 43.0
75 40.5
94 33.0

a) Construya un diagrama de dispersión de los datos. ¿Parecería plausible un modelo de


regresión lineal simple?
R= Si, parece correcto usar el diagrama
b) Ajuste el modelo de regresión lineal simple usando mínimos cuadrados.

c) Estime el desgaste por rozamiento cuando la viscosidad es x=30 .


R= 62.3768
d) Obtenga el valor ajustado de y cuando x=22.0 y calcule el residual
correspondiente.
Y=172
Residual= 15.11749821

Problema No. 4
En un proceso de extracción se estudia la relación entre tiempo de extracción y rendimiento. Los
datos obtenidos se muestran en la siguiente tabla.

Tiempo (minutos) Rendimiento (%)


10 64
15 81.7
20 76.2
8 68.5
12 77.9
13 82.2
15 74.2
12 70
14 76
20 83.2
19 85.3

a) ¿En este problema cuál variable se considera independiente y cuál dependiente?


b) Mediante un diagrama de dispersión analice la relación entre estas dos variables.
c) Haga un análisis de regresión (ajuste una línea recta a estos datos, aplique pruebas de
hipótesis y verifique residuos).
d) ¿La calidad del ajuste es satisfactoria? Argumente
e) Destaque el valor de la pendiente de la recta e interprételo en términos prácticos.
f) Estime el rendimiento promedio que se espera a un tiempo de extracción de 25 minutos y
obtenga un intervalo de confianza para esta estimación.

a) La variable dependiente es el % rendimiento y la variable independiente es el tiempo dado en


minutos.
b) Diagrama de dispersión: se puede visualizar que no existe una relación ya que los puntos son
muy dispersos, algunos incrementan y otros decrecen sin importar el tiempo, sin embargo se tendría
que verificar los supuestos y comprobar si en verdad existe una relación entre el rendimiento y el
tiempo, si no es asi los datos que miden la calidad de ajuste nos lo indicaran.

Gráfico de Rendimiento vs Tiempo

88

84
R e n d im ie n to

80

76

72

68

64
8 10 12 14 16 18 20
Tiempo

c) Análisis de regresión, como podemos observar la línea recta que mejor explica la relación entre
el tiempo y el porcentaje de rendimiento está dada por:
RendimientoGráfico
= 57.9578 + 1.19492*Tiempo
del Modelo Ajustado
Rendimiento = 57.9578 + 1.19492*Tiempo

88
La cual se puede observar en el grafico del modelo ajustado:
84
Rendimiento

80

76

72

68

64
8 10 12 14 16 18 20
Tiempo
Prueba de Hipótesis:
H0: β1= 0 o H0: El modelo no se ajusta
H0: β1≠ 0 o H0: El modelo si se ajusta
De acuerdo a la tabla de coeficientes podemos ver que si existe una pendiente, lo cual significa que
entre las variables tiempo y porcentaje de rendimiento si existe una relación.

Coeficientes
Mínimos Estándar Estadístico
Cuadrados
Parámetro Estimado Error T Valor-P
Intercepto 57.9578 6.28403 9.22303 0.0000
Pendiente 1.19492 0.414959 2.87962 0.0164

Para poder rechazar o aceptar la hipótesis nula tenemos que tomar en cuenta el análisis de varianza
del modelo, el cual se presenta a continuación:

Análisis de Varianza
Fuente Suma de Gl Cuadrado Razón-F Valor-P
Cuadrados Medio
Modelo 243.684 1 243.684 8.29 0.0164
Residuo 293.872 10 29.3872
Total (Corr.) 537.557 11

Analizando esta tabla podemos concluir que el modelo si se ajusta ya que el valor-P es menor al
nivel de confianza de 0.05, por ello podemos decir que con un nivel de confianza del 95% se rechaza
la hipótesis nula. Gráfico de Residuos
Rendimiento = 57.9578 + 1.19492*T iempo

Verificación de 7.5
supuestos:
4.5
El supuesto de varianza constante si se cumple ya que los puntos se encuentran dispersos de
re s id u o

1.5
forma aleatoria por toda la gráfica a lo largo de la banda horizontal.
-1.5

-4.5

-7.5
67 70 73 76 79 82
predicho Rendimiento
El supuesto de independencia si se cumple ya que los puntos o residuos se encuentran dispersos
de forma arbitraria dentro del gráfico de residuos vs número de corrida, sin cumplir ninguna
tendencia.
Gráfico de Residuos
Rendimiento = 57.9578 + 1.19492*Tiempo

7.5

4.5

1.5
residuo

-1.5

-4.5

d) el coeficiente de determinación R2ajustado es de .3986 lo cual indica que nuestro modelo no tiene
-7.5
una buena calidad de0ajuste, ya2 que solo4 nosnúmero
explica
6 el 39.865%
de fila
8 de10la variabilidad
12 en Rendimiento.
Además en general, para fines de predicción se recomienda un R 2ajustado de al menos 0.7 o 70% de
explicación del modelo.

e) el valor de la pendiente es de 1.19492, esto nos indica la razón de cambio en el %Rendimiento


(y) con respecto al cambio de Tiempo(x), es decir cuánto va a variar el Rendimiento cuando se varíe
el tiempo.

f) Se podría calcular el valor que piden con respecto a los 2 min, sin embargo realizar una
extrapolación la cual está más allá de la región que contiene a las observaciones originales está mal
ya que probablemente el modelo ya no se ajuste adecuadamente fuera de la región, ya que nuestra
región de estudio va de 8 a 20 min de Tiempo.
Problema No. 5
En un artículo de Journal of Environmental Energineering se reportan los
resultados de un estudio sobre la presencia de sodio y cloruros en corrientes
superficiales de la parte central de Rhode Island. Los datos que se presentan a
continuación corresponden a la concentración de cloruros y (en mg/l) y al área de
carretera de la vertiente x (en %).

x y
0.19 4.4
0.15 6.6
0.57 9.7
0.70 10.6
0.67 10.8
0.63 10.9
0.47 11.8
0.70 12.1
0.60 14.3
0.78 14.7
0.81 15.0
0.78 17.3
0.69 19.2
1.30 23.1
1.05 27.4
1.06 27.7
1.74 31.8
1.62 39.5

a) Trace un diagrama de dispersión de los datos. ¿Parecería apropiado un


modelo de regresión lineal simple en este caso?
R= Si, para ver la relación aunque presentan un índice de error alto

B) Ajuste el modelo de regresión lineal simple usando el método de mínimos


cuadrados.
b) Estime la concentración de cloruros media de una vertiente que tiene 1%
del área de carretera.

R= 20.567

Encuentre el valor ajustado que corresponde a x=0.47


R= 10.13

S-ar putea să vă placă și