Sunteți pe pagina 1din 11

UNIVERSIDAD NACIONAL DE INGENIERIA

DISEÑO Y OPTIMIZACION DE EXPERIMENTOS Janet Pacheco Lázaro

INFORME N°1. DISEÑO Y OPTIMIZACIÓN DE EXPERIMENTOS

PREGUNTA 1.- En la elaboración de una bebida se desea garantizar que el porcentaje


de CO (gas) por envase esté entre 2.5 y 3.0. Los siguientes datos son obtenidos del
monitoreo del proceso:
2.61 2.62 2.65 2.56 2.68 2.51 2.56 2.62 2.63 2.57 2.60 2.53 2.69 2.53 2.67 2.66 2.63 2.52 2.61
2.60 2.52 2.62 2.67 2.58 2.61 2.64 2.49 2.58 2.61 2.53 2.53 2.57 2.66 2.51 2.57 2.55 2.57 2.56
2.52 2.58 2.64 2.59 2.57 2.58 2.52 2.61 2.55 2.55 2.73 2.51 2.61 2.71 2.64 2.59 2.60 2.64 2.56
2.60 2.57 2.48 2.60 2.61 2.55 2.66 2.69 2.56 2.64 2.67

a) Haga un análisis exploratorio de estos datos (obtenga un histograma y vea el


comportamiento de los datos obtenidos).

Histograma de % CO
Normal
Observando el
14 Media 2.593
Desv.Est. 0.05592 histograma podemos
N 68
12 decir que los datos
siguen una distribución
10
normal, que la media de
Frec uenc ia

8 todos los datos se


6
encuentra dentro del
rango. Podemos
4
concluir que la mayoría
2 de los envases
0
contienen %CO entre
2. 50 2. 55 2. 60 2. 65 2. 70
2.5-2.7
% CO

b) Estime, con una confianza de 95%, ¿cuál es el CO promedio por envase?


En la gráfica de
probabilidad, todos los
puntos están dentro de
las bandas de
confianza, lo que
significa que los
residuos son normales.
El estadístico de
Anderson-Darling y el
valor p confirman esta
conclusión, dado que el
valor p es mayor a 0.05,
los datos pertenecen a
una población de
distribución normal y el
promedio de CO por
envase es de 2.593
c) Se supone que m debe ser igual a 2.75. Dada la evidencia, ¿se puede rechazar
tal supuesto?
Usando test de student (comparación de dos medias)
UNIVERSIDAD NACIONAL DE INGENIERIA
DISEÑO Y OPTIMIZACION DE EXPERIMENTOS Janet Pacheco Lázaro

*comparación de la media de una muestra con un valor referencial (𝜇 =2.75)


Planteamos nuestras hipótesis:
Ho: 𝑋̅ = 𝜇

H1:𝑋̅ ≠ 𝜇(ensayo de dos colas)


El estadístico t0:

(𝑋̅ − 𝜇)𝑥√𝑛
𝑡0 =
𝑠
(2.593−2.75)×√68
|𝑡0 | = = 23.15 , tc= 1.6849
0.05592

Dado que 𝑡0 > 𝑡𝑐 , no existe evidencia suficiente para afirmar que a un nivel de
significancia de 0.05 la media de la muestra sea 2.75, por lo tanto se rechaza el supuesto
que la media sea de 2.75.
Usando minitab:

T de una muestra: %CO


Prueba de μ = 2.75 vs. ≠ 2.75

Error
estándar de
Variable N Media Desv.Est. la media IC de 95% T P
%CO 68 2.59338 0.05592 0.00678 (2.57985; 2.60692) -23.09 0.000

d) Con los datos anteriores estime, con una confianza de 95%, ¿cuál es la
desviación estándar del proceso?.

Para construir intervalo de confianza para la varianza, 𝜎 2, la prueba es una chi-


cuadrada con n-1 grados de libertad. El intervalo de confianza está dado por:

Donde 𝑋𝛼2,𝑛−1 y 𝑋1−


2
𝛼
,𝑛−1
, se encuentran en la tabla chi-cuadrado con n-1 grados
2 2
de libertad, usando minitab nos facilitamos el cálculo.
Método

El método de chi-cuadrada sólo se utiliza para la distribución normal.


El método de Bonett se utiliza para cualquier distribución continua.

Estadísticas

Variable N Desv.Est. Varianza


%CO 68 0.0559 0.00313

Intervalos de confianza de 95%

IC para
Variable Método Desv.Est. IC para varianza
%CO Chi-cuadrada (0.0478; 0.0673) (0.00229; 0.00453)
Bonett (0.0487; 0.0661) (0.00237; 0.00437)
UNIVERSIDAD NACIONAL DE INGENIERIA
DISEÑO Y OPTIMIZACION DE EXPERIMENTOS Janet Pacheco Lázaro

e) El análisis de los datos muéstrales establece que el mínimo es 2.48 y el máximo


es 2.73, ¿por qué el intervalo obtenido en el inciso a) tiene una menor amplitud?.
La amplitud es el rango de cada intervalo y se determina como:
𝑋𝑚𝑎𝑥 − 𝑋𝑚𝑖𝑛
𝐴=
𝑛° 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜
En n° intervalo es de 11 y dado que los datos muéstrales establecen que el minino es
2.48 y el máximo es de 2.73 nos da una amplitud de 0.0227, en el inciso a) .
Da una amplitud de 0.025.

Informe de resumen de %CO


Prueba de normalidad de Anderson-Darling
A-cuadrado 0.30
Valor p 0.585
Media 2.5934
Desv.Est. 0.0559
Varianza 0.0031
Asimetría 0.193661
Curtosis -0.479673
N 68
Mínimo 2.4800
1er cuartil 2.5525
Mediana 2.5950
3er cuartil 2.6375
Máximo 2.7300
Intervalo de confianza de 95% para la media
2.50 2.55 2.60 2.65 2.70
2.5798 2.6069
Intervalo de confianza de 95% para la mediana
2.5700 2.6100
Intervalo de confianza de 95% para la desviación estándar
0.0478 0.0673

Intervalos de confianza de 95%

Media

Mediana

2.57 2.58 2.59 2.60 2.61

PREGUNTA 2.- Una característica importante en la calidad de la leche de vaca es la


concentración de grasa. En una industria en particular se fijó como estándar mínimo que
el producto que recibe directamente de los establos lecheros es de 3.0%. Por medio de
40 muestreos y evaluaciones en cierta época del año se obtuvo que X = 3.2 y S = 0.3.
a) Estime con una confianza de 90% el contenido promedio poblacional de grasa.
𝑠 𝑠
𝑥̅ − 𝑡 × < 𝜇 < 𝑥̅ + 𝑡 × √𝑛 , t=1.3036
√𝑛

0.3 0.3
3.2 − 1.3036 × < 𝜇 < 3.2 + 1.3036 ×
√40 √40
3.138 < 𝜇 < 3.262
UNIVERSIDAD NACIONAL DE INGENIERIA
DISEÑO Y OPTIMIZACION DE EXPERIMENTOS Janet Pacheco Lázaro

b) ¿Cuál es el error máximo de estimación para la media? ¿Por qué? .


El error máximo de estimación se determina con la ecuación siguiente:

𝛼
Para un nivel de confianza de 95%, 1 − = 0.975 , lo que da en tablas un valor para
2
𝑍1−𝛼 = 1.96; reemplazando en la ecuación el error máximo es: E=0.0929, este valor es
2
pequeño porque queremos que nuestra estimación no cometa mucho error al estimar.
Donde el I.C(95%)=[3.1071-3.2929]
c) Estime, con una confianza de 95%, ¿cuál es la desviación estándar poblacional?
Sabemos que la desviación estándar poblacional se expresa como:
√𝑛−1 √39
𝜎=𝑠× = 0.3 × √40 = 0.296
√𝑛

d) ¿Qué puede decir sobre la cantidad mínima y máxima de grasa en la leche? ¿Es
posible garantizar con suficiente confianza que la leche tiene más de 3.0% de
grasa.
El valor real de la grasa en la leche de nuestra muestra se encuentra por encima de del
valor requerido para la industria de leche y esto lo podemos ver en nuestro intervalo de
confianza: I.C(95%)=[3.1071-3.2929], para garantizar esto usaremos el test de t-student
(comparación de dos medias).
*comparación de la media de una muestra con un valor referencial (𝜇 =3.0)
Planteamos nuestras hipótesis:
Ho: 𝑋̅ = 3.0

H1:𝑋̅ > 3.0(ensayo de una cola)


El estadístico t0:

(𝑋̅ − 𝜇)𝑥√𝑛
𝑡0 =
𝑠
(3.2−3.0)×√40
|𝑡0 | = 0.3
= 4.216 , tc=1.994

Dado que 𝑡0 > 𝑡𝑐 , no existe evidencia suficiente para afirmar que a un nivel de
significancia de 0.05 la media de la muestra sea 3.0, por lo tanto se garantiza que la
grasa de la leche es mayor a 3.0%.
PREGUNTA 3.- Un investigador nunca quiso aprender a manejar. Normalmente toma
el autobús para trabajar en la universidad y utiliza uno de los tres caminos diferentes
para llegar al departamento donde trabaja:
UNIVERSIDAD NACIONAL DE INGENIERIA
DISEÑO Y OPTIMIZACION DE EXPERIMENTOS Janet Pacheco Lázaro

A. se baja del autobús en la primera parada para cruzar la carretera, y sigue a lo largo
de un lado de la escuela hasta la entrada que da acceso al departamento de Química.
Este es el camino más libre, y también la más expuesta a la intemperie.
B. se baja en la tercera parada después de la entrada, camina en diagonal a través del
campus. A pesar del riesgo de ser atropellado, este camino es utilizado por muchas
personas y cuenta con varios lugares con sombra agradable.
C. se baja en el otro lado del campus y toma un camino diagonal en dirección opuesta
del punto B. Este es el camino más agradable y seguro y es utilizado por muchas más
personas que los otros dos.

I) SEGÚN CAMINO

Prueba grafica

Gráfica de caja de TIEMPO


24 CAMINO
A
B
22
C

20
19
18
TIEMPO

16

14
13
12
10.9
10
A B C
CAMINO

La mediana de tiempo en más alta para el camino C (19) sin embargo este camino
presenta una mayor variabilidad que el camino A y B, el de menor mediana es el camino
B , es decir el que tomara más tiempo.
Prueba estadística

ANOVA unidireccional: TIEMPO vs. CAMINO

Método

Hipótesis nula Todas las medias son iguales


Hipótesis alterna Por lo menos una media es diferente
Nivel de significancia α = 0.05

Se presupuso igualdad de varianzas para el análisis.

Información del factor

Factor Niveles Valores


CAMINO 3 A; B; C
UNIVERSIDAD NACIONAL DE INGENIERIA
DISEÑO Y OPTIMIZACION DE EXPERIMENTOS Janet Pacheco Lázaro

Análisis de Varianza

Fuente GL SC Ajust. MC Ajust. Valor F Valor p


CAMINO 2 449.31 224.657 157.55 0.000
Error 28 39.93 1.426
Total 30 489.24

Resumen del modelo

R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)
1.19411 91.84% 91.26% 90.29%

Medias

CAMINO N Media Desv.Est. IC de 95%


A 6 12.9833 0.2137 (11.9847; 13.9819)
B 13 11.131 0.636 ( 10.452; 11.809)
C 12 19.408 1.780 ( 18.702; 20.114)

Desv.Est. agrupada = 1.19411

Gráfica de intervalos de TIEMPO vs. CAMINO


95% IC para la media

20

18

16
TIEMPO

14

12

10
A B C
CAMINO
La desviación estándar agrupada se utilizó para calcular los intervalos.

CONCLUSIONES
Teniendo en cuenta las pruebas gráficas y estadísticas podemos concluir que el
camino B es el más aceptable, la prueba estadística nos dice que al menos un
camino difiere de las otras, usando el intervalo de confianza podemos decir que el
que más difiere es el camino C, y que el camino A y B son significativamente iguales.
UNIVERSIDAD NACIONAL DE INGENIERIA
DISEÑO Y OPTIMIZACION DE EXPERIMENTOS Janet Pacheco Lázaro

II) SEGÚN DIA

Prueba grafica

Gráfica de caja de TIEMPO


24 DIA
Friday
Monday
22
Thursday
Tuesday
20 Wednesday

18.45
18
TIEMPO

16

14
13.15
12.7
12 11.75 11.95

10
Friday Monday Thursday Tuesday Wednesday
DIA

Prueba estadística

ANOVA unidireccional: TIEMPO vs. DIA

Método

Hipótesis nula Todas las medias son iguales


Hipótesis alterna Por lo menos una media es diferente
Nivel de significancia α = 0.05

Se presupuso igualdad de varianzas para el análisis.

Información del factor

Factor Niveles Valores


DIA 5 Friday; Monday; Thursday; Tuesday; Wednesday

Análisis de Varianza

Fuente GL SC Ajust. MC Ajust. Valor F Valor p


DIA 4 44.86 11.21 0.66 0.628
Error 26 444.38 17.09
Total 30 489.24

Resumen del modelo

R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)
4.13421 9.17% 0.00% 0.00%
UNIVERSIDAD NACIONAL DE INGENIERIA
DISEÑO Y OPTIMIZACION DE EXPERIMENTOS Janet Pacheco Lázaro

Medias

DIA N Media Desv.Est. IC de 95%


Friday 8 13.38 3.66 (10.37; 16.38)
Monday 6 16.88 4.27 (13.41; 20.35)
Thursday 4 14.00 5.11 ( 9.75; 18.25)
Tuesday 4 14.50 2.94 (10.25; 18.75)
Wednesday 9 14.80 4.40 (11.97; 17.63)

Desv.Est. agrupada = 4.13421

Gráfica de intervalos de TIEMPO vs. DIA

Gráfica de intervalos de TIEMPO vs. DIA


95% IC para la media

20

18

16
TIEMPO

14

12

10

Friday Monday Thursday Tuesday Wednesday


DIA
La desviación estándar agrupada se utilizó para calcular los intervalos.

CONCLUSIONES
Usando la prueba gráfica , observando la mediana podemos decir que los días viernes
el investigador llegaría más temprano a su oficina , sin embargo usando la prueba
estadística ANOVA se puede decir que las medias en todos los días son
significativamente iguales, es decir que el tiempo que se demora para llegar a s oficina
no varía mucho según los días
UNIVERSIDAD NACIONAL DE INGENIERIA
DISEÑO Y OPTIMIZACION DE EXPERIMENTOS Janet Pacheco Lázaro

III) SEGUN HORA DE PARTIDA

Prueba grafica
I) Escogiendo rango de tiempo.

Gráfica de valores individuales de PARTIDA


18:00

16:00

14:00
PARTIDA

12:00

10:00

8:00

Los intervalos de tiempo de partida que se escogerá será


1: [7:00 - 10:00]
2: [10:00 - 12:00]
3: [12:00 – final]

Gráfica de caja de TIEMPO


24

22

20

18
TIEMPO

17.2

16

14
13.1
12.45
12

10
1 2 3
intervalo
UNIVERSIDAD NACIONAL DE INGENIERIA
DISEÑO Y OPTIMIZACION DE EXPERIMENTOS Janet Pacheco Lázaro

Prueba estadística

ANOVA unidireccional: TIEMPO vs. intervalo

Método

Hipótesis nula Todas las medias son iguales


Hipótesis alterna Por lo menos una media es diferente
Nivel de significancia α = 0.05

Se presupuso igualdad de varianzas para el análisis.

Información del factor

Factor Niveles Valores


intervalo 3 1; 2; 3

Análisis de Varianza

Fuente GL SC Ajust. MC Ajust. Valor F Valor p


intervalo 2 49.40 24.70 1.57 0.225
Error 28 439.84 15.71
Total 30 489.24

Resumen del modelo

R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)
3.96342 10.10% 3.67% 0.00%

Medias

intervalo N Media Desv.Est. IC de 95%


1 16 13.550 3.683 (11.520; 15.580)
2 8 16.51 4.42 ( 13.64; 19.38)
3 7 15.23 4.07 ( 12.16; 18.30)

Desv.Est. agrupada = 3.96342

Gráfica de intervalos de TIEMPO vs. intervalo


95% IC para la media
20

19

18

17
TIEMPO

16

15

14

13

12

11
1 2 3
intervalo
La desviación estándar agrupada se utilizó para calcular los intervalos.
UNIVERSIDAD NACIONAL DE INGENIERIA
DISEÑO Y OPTIMIZACION DE EXPERIMENTOS Janet Pacheco Lázaro

CONCLUSIONES
Según la prueba grafica de cajas podemos decir que desde 7:00 – 10:00 a.m. el
investigador puede llegar más temprano a su oficina que si tomara el bus más tarde;
usando la prueba estadística no existe evidencia suficiente para decir que las medias
son diferentes, así que son significativamente iguales.

S-ar putea să vă placă și