Sunteți pe pagina 1din 18

ESCUELA SUPERIOR POLITÉCNICA DE CHIMBORAZO

INGENIERÍA EN BIOTECNOLOGÍA AMBIENTAL


BIOMETRÍA Y DISEÑO EXPERIMENTAL

 Estudiante: LUIA PATIÑO. Docente: Dr. Raúl Benavides.


 Código: 2296 Fecha: 16 de julios de 2019.
 Nivel: Noveno “A”

1. ESTIMACIONES (Cap. 2)

1.1 PARA LA MEDIA Y LA VARINZA y PROPORCIONES (Z o T-student)


Ejemplo 2.4
Peso de costales. Un fabricante de dulces compra costales de azúcar a cierto ingenio. Según los vendedores, los
costales tienen un peso medio de 50.1 kg, con una varianza de (s2 = 0.5). El comprador sospecha que el peso
medio es menor. Para confirmar su sospecha decide contrastar las hipótesis:

Estadísticas descriptivas
Error Límite
estándar superior
de la de 95%
N Media Desv.Est. media para μ
15 49,400 1,200 0,310 49,946
μ: media de Muestra

Prueba
Hipótesis nula H₀: μ = 50,1
Hipótesis alterna H₁: μ < 50,1
Valor T Valor p
-2,26 0,020

Prueba e IC para una varianza: C1


Método
σ: desviación estándar de C1
El método de Bonett es válido para cualquier distribución continua.
El método de chi-cuadrada solo es válido para la distribución normal.
Estadísticas descriptivas
Límite
superior de Límite superior
95% para σ de 95% para σ
usando usando
N Desv.Est. Varianza Bonett Chi-cuadrada
15 1,40 1,96 2,36 2,04
Prueba
Hipótesis nula H₀: σ² = 0,5
Hipótesis alterna H₁: σ² < 0,5
Estadística
Método de prueba GL Valor p
Bonett — — 0,998
Chi-cuadrada 54,82 14 1,000

Ejemplo 2.2
En el proceso de fabricación de discos para computadoras, una de las variables críticas es el rendimiento de
formato. Se toma una muestra aleatoria de n = 10 discos de la producción del turno de la mañana. Se formatean y
se reporta el rendimiento de cada disco. Los datos obtenidos son: 96.11, 91.06, 93.38, 88.52, 89.57, 92.63,
85.20, 91.41, 89.79, 92.62. Con base en estos datos interesa estimar puntualmente y por intervalo la media y la
desviación estándar para la población de discos de dicho turno.

Estadísticas descriptivas
Error
estándar
de la IC de 95% para
N Media Desv.Est. media μ
10 91,020 2,994 0,947 (88,878; 93,162)
μ: media de MUESTRA

Prueba e IC para una varianza: MUESTRA


Método
σ: desviación estándar de MUESTRA
El método de Bonett es válido para cualquier distribución continua.
El método de chi-cuadrada solo es válido para la distribución normal.
Estadísticas descriptivas
IC de 95% IC de 95%
para σ para σ
usando usando
N Desv.Est. Varianza Bonett Chi-cuadrada
10 2,99 8,97 (1,80; 6,19) (2,06; 5,47)
Ejemplo12.
Una muestra aleatoria de 500 reproductores tiene como resultado 15 que fallan en una o más pruebas.
Encuentre un intervalo de confianza de 95% para la proporción de los reproductores de discos compactos
de la población que no pasan todas las pruebas.
Prueba e IC para una proporción
Método
p: proporción de eventos
Para este análisis se utiliza el método de aproximación a la normal.
Estadísticas descriptivas
N Evento Muestra p IC de 95% para p
500 15 0,030000 (0,015048; 0,044952)
Prueba
Hipótesis nula H₀: p = 0,5
Hipótesis alterna H₁: p ≠ 0,5

Se sabe con un nivel de confianza del 95% que la proporción de discos defectuosos que no pasan la
prueba en esa población está entre 0.015 y 0.044.

Ejemplo 10
Se considera cierto cambio en un proceso de fabricación de partes componentes. Se toman muestras del
procedimiento existente y del nuevo para determinar si éste tiene como resultado una mejoría. Si se
encuentra que 75 de 1500 artículos del procedimiento actual son defectuosos y 80 de 2000 artículos del
procedimiento nuevo también lo son, encuentre un intervalo de confianza de 90% para la diferencia real
en la fracción de defectuosos entre el proceso actual y el nuevo.
Prueba e IC para dos proporciones
Método
p₁: proporción donde Muestra 1 = Evento
p₂: proporción donde Muestra 2 = Evento
Diferencia: p₁ - p₂
Estadísticas descriptivas
Muestra N Evento Muestra p
Muestra 1 1500 75 0,050000
Muestra 2 2000 80 0,040000
Estimación de la diferencia
IC de 90% para la
Diferencia diferencia
0,01 (-0,001731; 0,021731)
IC basado en la aproximación a la normal

Prueba
Hipótesis nula H₀: p₁ - p₂ = 0
Hipótesis alterna H₁: p₁ - p₂ ≠ 0
Método Valor Z Valor p
Aproximación normal 1,40 0,161
Exacta de Fisher 0,159

-0.0017<P1-P2<0.0217

Como el intervalo contiene el valor de cero, no hay razón para creer que el nuevo procedimiento
producirá una disminución significativa en la proporción de artículos defectuosos comparado con el
método existente.

Ejemplo 16
En la fabricación de discos compactos una variable de interés es la densidad mínima (grosor) de la capa
de metal, la cual no debe ser menor de 1.5 micras. Se sabe por experiencia que la densidad mínima del
metal casi siempre ocurre en los radios 24 y 57, aunque en el método actual también se miden los radios
32, 40 y 48. Se hacen siete lecturas en cada radio dando un total de 35 lecturas, de las cuales sólo se usa
la mínima. A continuación, se presenta una muestra histórica de 18 densidades mínimas:
1,81; 1,97 ;1,93 ;1,97 ;1,85 ;1,99 ;1,95 ;1,93 ;1,85 ;1,87 ;1,98 ;1,93 ;1,96; 2,02; 2,07;1,92;1,99 ;1,93
a) Argumente estadísticamente si las densidades mínimas individuales cumplen con la
especificación de 1.5 micras.

Estadísticas descriptivas
Error Límite
estándar superior
de la de 95%
N Media Desv.Est. media para μ
18 1,9400 0,0646 0,0152 1,9665
μ: media de GROSOR DISCOS

Prueba
Hipótesis nula H₀: μ = 1,5
Hipótesis alterna H₁: μ < 1,5
Valor T Valor p
28,89 1,000

Observando por regla empírica, es decir; la media y la mediana, es fácil identificar que la especificación de
1.5 micras no se cumple debido a que las dos se encuentran con valores de 1.94, muy alejados de 1.5.

b) Encuentre un intervalo de confianza de 99% para la media de la densidad mínima.


Estadísticas
Error
estándar
de la
Variable N N* Media media Desv.Est. Mínimo Q1 Mediana Q3 Máximo
DENSIDAD 18 0 1,9400 0,0152 0,0646 1,8100 1,9075 1,9400 1,9825 2,0700

El intervalo de confianza al 99% de la media se encontraría entre 1.8959 y 1.9841

c) Dé un intervalo de confianza de 99% para la desviación estándar.

Estadísticas
Error
estándar
de la
Variable N N* Media media Desv.Est. Mínimo Q1 Mediana Q3 Máximo
DENSIDAD 18 0 1,9400 0,0152 0,0646 1,8100 1,9075 1,9400 1,9825 2,0700

d) Dibuje el diagrama de cajas para estos datos. Interprete lo que observa.

Informe de resumen de DENSIDAD


Informe de resumen de DENSIDAD
Prueba de normalidad de Anderson-Darling
A-cuadrado 0,36
Valor p 0,401
Media 1,9400
Desv.Est. 0,0646
Varianza 0,0042
Asimetría -0,226549
Curtosis 0,157296
N 18
Mínimo 1,8100
1er cuartil 1,9075
Mediana 1,9400
3er cuartil 1,9825
Máximo 2,0700
Intervalo de confianza de 95% para la media
1,80 1,85 1,90 1,95 2,00 2,05
1,9079 1,9721
Intervalo de confianza de 95% para la mediana
1,9252 1,9748
Intervalo de confianza de 95% para la desviación estándar
0,0485 0,0969

Intervalos de confianza de 95%

Media

Mediana

1,90 1,92 1,94 1,96 1,98

1.2 HIPÓTESIS PARA COMPARACION DE DOS MEDIAS


Ejemplo 2.6
Comparación de dos básculas. Se desea ver si dos básculas están sincronizadas. Para ello se toma una
muestra aleatoria de 10 especímenes y cada uno se pesa en ambas básculas, cuidando que el orden en
que se utilizan sea elegido al azar. El trabajo lo realiza el mismo operador y los datos obtenidos se
muestran en la tabla 2.3. Es claro que tenemos el caso de observaciones pareadas, ya que el peso que
registra una báscula para un espécimen no es independiente del que registra la otra báscula para el mismo
espécimen, en el sentido de que si uno es muy pesado se espera que ambas básculas lo detecten. La
comparación de las básculas se puede evaluar probando la siguiente hipótesis:
IC y Prueba T pareada: BASCULA1; BASCULA2
Estadísticas descriptivas
Error
estándar
de la
Muestra N Media Desv.Est. media
BASCULA1 10 12,87 5,17 1,63
BASCULA2 10 12,89 5,16 1,63

Gráfica de caja de BASCULA1; BASCULA2


Gráfica de caja de BASCULA1; BASCULA2
25

20
Datos

15

10

5
BASCULA1 BASCULA2

Gráfica de intervalos de BASCULA1; BASCULA2


Gráfica de intervalos de BASCULA1; BASCULA2
95% IC para la media
17

16

15

14
Datos

13

12

11

10

9
BASCULA1 BASCULA2

Las desviaciones estándar individuales se utilizaron para calcular los intervalos.

IC y Prueba T pareada: BASCULA1; BASCULA2


Estadísticas descriptivas
Error
estándar
de la
Muestra N Media Desv.Est. media
BASCULA1 10 12,87 5,17 1,63
BASCULA2 10 12,89 5,16 1,63
Estimación de la diferencia pareada
Error
estándar de IC de 95% para la
Media Desv.Est. la media diferencia_µ
-0,02000 0,02867 0,00907 (-0,04051; 0,00051)
diferencia_µ: media de (BASCULA1 - BASCULA2)

Prueba
Hipótesis nula H₀: diferencia_μ = 0
Hipótesis alterna H₁: diferencia_μ ≠ 0
Valor T Valor p
-2,21 0,055

Ejercicio 27. Se realiza un estudio para comparar dos tratamientos a aplicarse a los frijoles crudos, con
el objetivo de reducir el tiempo de cocción. Un tratamiento (T1) es a base de bicarbonato de sodio, y el
otro, T2, es a base de cloruro de sodio o sal común. La variable de respuesta es el tiempo de cocción en
minutos. Se hacen siete replicas. Los datos se muestran en la siguiente tabla:

a) Realizar una comparación de medias de los dos niveles de tratamiento


b) Realizar una comparación de varianzas

Prueba T e IC de dos muestras: Tratamiento; Orden


Método
μ₁: media de Tratamiento
µ₂: media de Orden
Diferencia: μ₁ - µ₂
No se presupuso igualdad de varianzas para este análisis.

Estadísticas descriptivas
Error
Muestra N Media Desv.Est. estándar
de la
media
Tratamiento 14 1,500 0,519 0,14
Orden 14 4,00 2,08 0,55
Estimación de la diferencia
IC de 95% para
Diferencia la diferencia
-2,500 (-3,726; -1,274)
Prueba
Hipótesis nula H₀: μ₁ - µ₂ = 0
Hipótesis alterna H₁: μ₁ - µ₂ ≠ 0
Valor T GL Valor p
-4,37 14 0,001
Ho se rechaza, así que las medias de los tratamientos no son iguales.

23. En un laboratorio bajo condiciones controladas, se evaluó, para 10 hombres y 10 mujeres, la


temperatura que cada persona encontró más confortable. Los resultados en grados Fahrenheit fueron los
siguientes:
Mujer

a) ¿Cuáles son en realidad los tratamientos que se comparan en este estudio?


b) ¿Las muestras son dependientes o independientes?
c) ¿La temperatura promedio más confortable es igual para hombres que para mujeres?
Ejemplo 3.2
Comparación de cuatro tipos de cuero. Un fabricante de calzado desea mejorar la calidad de las suelas,
las cuales se pueden hacer con uno de los cuatro tipos de cuero A, B, C y D disponibles en el mercado.
Para ello, prueba los cueros con una máquina que hace pasar los zapatos por una superficie abrasiva; la
suela de éstos se desgasta al pasarla por dicha superficie. Como criterio de desgaste se usa la pérdida de
peso después de un número fijo de ciclos. Se prueban en orden aleatorio 24 zapatos, seis de cada tipo de
cuero. Al hacer las pruebas en orden completamente al azar se evitan sesgos y las mediciones en un tipo
de cuero resultan independientes de las demás. Los datos (en miligramos) sobre el desgaste de cada tipo
de cuero se muestran en la tabla 3.2.

Modelo lineal general: SUELAS vs. TIPO CUERO


Método
Codificación de factores (-1; 0; +1)
Información del factor
Factor Tipo Niveles Valores
TIPO CUERO Fijo 4 A; B; C; D
Análisis de Varianza
SC
Fuente GL Ajust. MC Ajust. Valor F Valor p
TIPO CUERO 3 7072 2357,4 23,24 0,000
Error 20 2029 101,5
Total 23 9101
Resumen del modelo
R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)
10,0722 77,71% 74,36% 67,90%
Coeficientes
EE del
Término Coef coef. Valor T Valor p FIV
Constante 229,67 2,06 111,71 0,000
TIPO CUERO
A 27,00 3,56 7,58 0,000 1,50
B -19,17 3,56 -5,38 0,000 1,50
C 1,17 3,56 0,33 0,747 1,50
Ecuación de regresión
SUELAS = 229,67 + 27,00 TIPO CUERO_A - 19,17 TIPO CUERO_B + 1,17 TIPO CUERO_C
- 9,00 TIPO CUERO_D
Ajustes y diagnósticos para observaciones poco comunes
Resid
Obs SUELAS Ajuste Resid est.
14 263,00 230,83 32,17 3,50 R
Residuo grande R

Como v-p < 0.05, El factor tipo de cuero influye sobre la calidad de las suelas

2. DISEÑO COMPLETAMENTE AL AZAR Y ANOVA (CAP.3)


Ejemplo 3.1
Comparación de cuatro métodos de ensamble. Un equipo de mejora investiga el efecto de cuatro
métodos de ensamble A, B, C y D, sobre el tiempo de ensamble en minutos. En primera instancia, la
estrategia experimental es aplicar cuatro veces los cuatro métodos de ensamble en orden completamente
aleatorio (las 16 pruebas en orden aleatorio). Los tiempos de ensamble obtenidos se muestran en la tabla
3.1. Si se usa el diseño completamente al azar (DCA), se supone que, además del método de ensamble,
no existe ningún otro factor que influya de manera significativa sobre la variable de respuesta (tiempo
de ensamble).
ANOVA de un solo factor: A; B; C; D
Método
Hipótesis nula Todas las medias son iguales
Hipótesis alterna No todas las medias son iguales
Nivel de significancia α = 0,05
Se presupuso igualdad de varianzas para el análisis.

Información del factor


Factor Niveles Valores
Factor 4 A; B; C; D
Análisis de Varianza
Fuente GL SC Ajust. MC Ajust. Valor F Valor p
Factor 3 69,50 23,167 9,42 0,002
Error 12 29,50 2,458
Total 15 99,00
Resumen del modelo
R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)
1,56791 70,20% 62,75% 47,03%
Medias
Factor N Media Desv.Est. IC de 95%
A 4 7,250 0,957 (5,542; 8,958)
B 4 8,500 1,291 (6,792; 10,208)
C 4 12,75 2,36 (11,04; 14,46)
D 4 10,500 1,291 (8,792; 12,208)
Desv.Est. agrupada = 1,56791
Gráfica de intervalos de A; B; ...
95% IC para la media
15,0

12,5
Datos

10,0

7,5

5,0
A B C D

La desviación estándar agrupada se utilizó para calcular los intervalos.

3. DISEÑO DE BLOQUES (Cap. 4)


DBCA
Ejemplo 4.1
En el ejemplo 3.1, donde se planteó la comparación de cuatro métodos de ensamble, ahora se va a controlar
activamente en el experimento a los operadores que realizará el ensamble, lo que da lugar al siguiente diseño en
bloques completos al azar.

Modelo lineal general: TIEMPO vs. METODOS; OPERADOR


Método
Codificación de factores (-1; 0; +1)
Información del factor
Factor Tipo Niveles Valores
METODOS Fijo 4 A; B; C; D
OPERADOR Fijo 4 1; 2; 3; 4
Análisis de Varianza
Fuente GL SC Ajust. MC Ajust. Valor F Valor p
METODOS 3 61,50 20,500 10,25 0,003
OPERADOR 3 28,50 9,500 4,75 0,030
Error 9 18,00 2,000
Total 15 108,00
Resumen del modelo
R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)
1,41421 83,33% 72,22% 47,33%
Coeficientes
EE del
Término Coef coef. Valor T Valor p FIV
Constante 10,000 0,354 28,28 0,000
METODOS
A -2,500 0,612 -4,08 0,003 1,50
B -1,000 0,612 -1,63 0,137 1,50
C 2,750 0,612 4,49 0,002 1,50
OPERADOR
1 -1,750 0,612 -2,86 0,019 1,50
2 2,000 0,612 3,27 0,010 1,50
3 0,000 0,612 0,00 1,000 1,50
Ecuación de regresión
TIEMPO = 10,000 - 2,500 METODOS_A - 1,000 METODOS_B + 2,750 METODOS_C + 0,750 METODOS_D
- 1,750 OPERADOR_1 + 2,000 OPERADOR_2 + 0,000 OPERADOR_3 - 0,250 OPERADOR_4

Comparaciones por parejas de Tukey: METODOS


Agrupar información utilizando el método de Tukey y una confianza de 95%
METODOS N Media Agrupación
C 4 12,75 A
D 4 10,75 A B
B 4 9,00 B C
A 4 7,50 C
Las medias que no comparten una letra son significativamente diferentes.

Agrupar información utilizando el método LSD de Fisher y una confianza de 95%


METODOS N Media Agrupación
C 4 12,75 A
D 4 10,75 A B
B 4 9,00 B C
A 4 7,50 C
Las medias que no comparten una letra son significativamente diferentes.

DCL
Ejemplo 4.2
Comparación de cuatro marcas de llantas. Una compañía de mensajería está interesada en determinar
cuál marca de llantas tiene mayor duración en términos del desgaste. Para ello se planea un experimento
en cuadro latino, en el que se comparan las cuatro marcas de llantas sometiéndolas a una prueba de 32
000 kilómetros de recorrido, utilizando cuatro diferentes tipos de auto y las cuatro posiciones posibles
de las llantas en el auto. Así, el factor de interés es el tipo de llanta o marca, y se controlan dos factores
de bloques: el tipo de carro y la posición de la llanta en el carro. Estos factores de bloques se controlan
ya que, por experiencia, se sabe que el tipo de carro y la posición de la llanta tienen efecto en el des gaste
de la misma.

Modelo lineal general: RESPUESTA vs. LLANTA(Tratam);


... N(Columna)
Método
Codificación de factores (-1; 0; +1)
Información del factor
Factor Tipo Niveles Valores
LLANTA(Tratam) Fijo 4 A; B; C; D
CARRO(Fila) Fijo 4 1; 2; 3; 4
POSICION(Columna) Fijo 4 1; 2; 3; 4
Análisis de Varianza
Fuente GL SC Ajust. MC Ajust. Valor F Valor p
LLANTA(Tratam) 3 5,688 1,896 0,37 0,775
CARRO(Fila) 3 16,188 5,396 1,07 0,431
POSICION(Columna) 3 103,687 34,562 6,83 0,023
Error 6 30,375 5,062
Total 15 155,937
Resumen del modelo
R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)
2,25 80,52% 51,30% 0,00%
Coeficientes
EE del
Término Coef coef. Valor T Valor p FIV
Constante 11,438 0,562 20,33 0,000
LLANTA(Tratam)
A 0,312 0,974 0,32 0,759 1,50
B 0,813 0,974 0,83 0,436 1,50
C -0,687 0,974 -0,71 0,507 1,50
CARRO(Fila)
1 -0,438 0,974 -0,45 0,669 1,50
2 -1,438 0,974 -1,48 0,191 1,50
3 1,063 0,974 1,09 0,317 1,50
POSICION(Columna)
1 2,562 0,974 2,63 0,039 1,50
2 1,312 0,974 1,35 0,227 1,50
3 0,313 0,974 0,32 0,759 1,50

Análisis de Varianza
Fuente GL SC Ajust. MC Ajust. Valor F Valor p
LLANTA(Tratam) 3 5,688 1,896 0,37 0,775
CARRO(Fila) 3 16,188 5,396 1,07 0,431
POSICION(Columna) 3 103,687 34,562 6,83 0,023
Error 6 30,375 5,062
Total 15 155,937
DCGL
Ejemplo 4.3
En el caso de ejemplo 4.1, donde se comparan cuatro métodos de ensamble y se tiene el factor de bloque
operador, se podrían tener dos factores de bloque adicionales: orden en el se hace el ensamble y lugar
donde se hace. De acuerdo con esto, el diseño en cuadro grecolatino se observa en la tabla 4.10.

FACTORIAL 2X3

S-ar putea să vă placă și