Sunteți pe pagina 1din 9

Taller 2: Experimentos con un solo factor

Experimentos con un solo factor


Departamento de Ingeniería química
Universidad de los Andes

Punto 1

Un ingeniero determino la cantidad de fluoruro en un vertimiento de agua usando cuatro


métodos de colorimetría en un estudio comparativo. Cuatro replicas se hicieron de cada test.

Tabla 1. Datos experimentales


Método 𝐶𝑓𝑙𝑢𝑜𝑟𝑢𝑟𝑜 (𝑝𝑝𝑚)
1 19.8 14.5 13.8 19.9
2 8.9 11.1 12.4 8.8
3 3.5 5.4 4.8 5.2
4 3.1 2.7 3.7 3.4

Los resultados de la tabla de ANOVA fueron:

1. Hay diferencia estadística entre los métodos, Use un nivel de significancia de 5%.
2. Determine por la prueba de Fisher (DMS) cuales medias difieren entre sí.

Cuando el ingeniero procedió a comprobar si había diferencia entre los métodos usando el
modelo de efectos fijos (con un nivel de significancia de 5%), obtuvo las siguientes graficas de
los residuos (eij).

Figura 1. Grafica de residuales de la concentración.


3. De acuerdo a la Figura 1, justifique si el modelo de efectos fijos es valido para los datos
en la Tabla 1.

Punto 2

La hipótesis nula en un análisis de varianza (ANOVA) es que las medias de cada uno de los
tratamientos son estadísticamente iguales. Explique porque se utiliza un estadístico F para
comprobar dicha hipótesis. Asuma que se trata de un diseño balanceado.

Punto 3

El gerente de una empresa reconocida desea aumentar la productividad de sus empleados.


Uno de sus empleados sugirió que la música podría ayudar a crear un ambiente más
motivador y con ello aumentar la productividad. El gerente decidió probar esta hipótesis con
60 personas que fueron divididas en tres grupos de 20 personas independientes: Grupo A -
No escucha música, Grupo B - Escucha música pero no elige que música puede escuchar y
Grupo C – Escucha la música que desean escuchar.

Los resultados obtenidos del ANOVA fueron:

Suma Grados de Cuadrados


Fuente F
cuadrados libertad medios
Tratamiento 754.4 2 377.22 6.08
Error 3535.7 57 62.03
Total 4290.2 59

1. ¿Escuchar música durante el trabajo afecta la productividad?, Use un nivel de


significancia de 5%.

2. ¿Cuánto seria la potencia del experimento para detectar diferencias en la medición de


productividad de al menos 8 puntos?
Figura 2. Curva de operación para modelos de efectos fijos.

2
𝑛𝐷2
𝛷 =
2𝑎𝜎 2
Solución: Taller experimentos con un solo factor
Autor: John Jairo Ortiz Martínez
Versión: 1
Fecha: 27/01/2015
Revisado por: Rocío Sierra

Punto 1.

1. Modelo

𝑖 = 1,2, … , 𝑎
𝑦𝑖𝑗 = 𝜇 + 𝜏𝑖 + 𝜀𝑖𝑗 {
𝑗 = 1,2, … , 𝑛

Suposiciones del modelo

- Los errores se distribuyen normalmente: 𝜀𝑖𝑗 ~𝑁(0, 𝜎 2 )


- Existe independencia en los errores experimentales.
- La varianza es constante entre los niveles del factor. 𝜎12 = 𝜎22 = 𝜎32 = 𝜎42

Calculo del análisis de varianza (ANOVA)

Tabla 3. Datos experimentales, totales y promedios


Método 𝐶𝑓𝑙𝑢𝑜𝑟𝑢𝑟𝑜 (𝑝𝑝𝑚) Total Promedio
1 19.8 14.5 13.8 19.9 68 17
2 8.9 11.1 12.4 8.8 41.2 10.3
3 3.5 5.4 4.8 5.2 18.9 4.72
4 3.1 2.7 3.7 3.4 12.9 3.22
141 8.81

𝑎
1 𝑦..2 1 1412
𝑆𝑆𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜 = ∑ 𝑦𝑖.2 − = (682 + 41.22 + 18.92 + 12.92 ) − = 468.7025
𝑛 𝑁 4 16
𝑖=𝑖

𝑎 𝑛
2 𝑦..2 1412
𝑆𝑆𝑇𝑜𝑡𝑎𝑙 = ∑ ∑ 𝑦𝑖𝑗 − = (19.82 + 14.52 + ⋯ + 3.42 ) − = 513.4375
𝑁 16
𝑖=𝑖 𝑗=1

𝑆𝑆𝐸𝑟𝑟𝑜𝑟 = 𝑆𝑆𝑇𝑜𝑡𝑎𝑙 − 𝑆𝑆𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜 = 44.735

Suma Grados de Cuadrados


Fuente F0
cuadrados libertad medios
Tratamiento 468.7025 3 156.234 41.909
Error 44.735 12 3.7279
Total 513.4375 15
De las tablas de distribución F se obtiene: 𝐹𝛼,𝑎,𝑁−𝑎 = 𝐹0.05,3,12 = 3.49
Como el valor del estadístico 𝐹0 es mucho mayor al valor crítico de la distribución F
encontrado, se concluye con un 5% de incertidumbre que si hay una diferencia significativa en
la medición de la concentración de fluoruro dependiendo del tipo de método colorimétrico
que se utilice.

2. Diferencia Mínima significativa (DMS)

El termino DMS se calcula como:

2𝑀𝑆𝐸𝑟𝑟𝑜𝑟 2 ∗ 3.7279
𝐷𝑀𝑆 = 𝑡𝛼/2,𝑁−𝑎 √ = 2.1788√ = 2.974
𝑛 4

Se compara la diferencia entre medias con este valor, si la diferencia es mayor al valor de DMS
entonces las medias de la poblaciones son significativamente diferentes.

𝑦̅1 − 𝑦̅2 = 17 − 10.3 = 6.7

𝑦̅1 − 𝑦̅3 = 17 − 4.72 = 12.275

𝑦̅1 − 𝑦̅4 = 17 − 3.22 = 13.775

𝑦̅2 − 𝑦̅3 = 10.3 − 4.72 = 5.575

𝑦̅2 − 𝑦̅4 = 10.3 − 3.22 = 7.075

𝑦̅3 − 𝑦̅4 = 4.72 − 3.22 = 1.5

De lo anterior se concluye que los métodos 3 y 4 no son significativamente diferentes, por el


contrario, los métodos 1 y 2 difieren significativamente de los demás métodos de colorimetría.

3.
Normalidad:

La gráfica de probabilidad normal muestra claramente como los datos experimentales


caen cerca de la línea de tendencia normal. Por lo tanto, no hay evidencia que sugiera
que los datos no son normales.

Adicionalmente en el histograma se evidencia la forma de campana con media 0, lo


cual es un indicio del comportamiento normal de los datos.

En conclusión no hay evidencia que sugiera que se viola la suposición de normalidad.


Independencia:

En la grafica de residuales vs orden no se muestra ningún patrón definido ni algún


otro indicio que sugiera que se viola el principio de independencia.

Varianzas constantes (Homocedasticidad):

En la gráfica de residuales vs el valor ajustado se observa claramente la forma de


corneta a medida que aumenta el valor ajustado, lo cual indica que la varianza es
diferente dependiendo del nivel de factor analizado. Por lo tanto la suposición de
homocedasticidad NO SE CUMPLE, lo cual invalida los resultados obtenidos.

Punto 2

Para poder responder esta pregunta es necesario partir del desarrollo del análisis de varianza,
que comienza del fraccionamiento de la suma de cuadrados totales.

𝑘 𝑛

𝑆𝑆𝑇 = ∑ ∑(𝑦𝑖𝑗 − 𝑌̅.. )2


𝑖=1 𝑗=1

Que se puede expandir de la siguiente forma

𝑘 𝑛

𝑆𝑆𝑇 = ∑ ∑(𝑦𝑖𝑗 − 𝑦̅𝑖. + 𝑦̅𝑖. − 𝑌̅.. )2


𝑖=1 𝑗=1
𝑘 𝑛 𝑘 𝑛 𝑘 𝑛

𝑆𝑆𝑇 = ∑ ∑(𝑦𝑖𝑗 − 𝑦̅𝑖. )2 + ∑ ∑(𝑦̅𝑖. − 𝑌̅.. )2 + 2 ∑ ∑(𝑦𝑖𝑗 − 𝑦̅𝑖. ) (𝑦̅𝑖. − 𝑌̅.. )


𝑖=1 𝑗=1 𝑖=1 𝑗=1 𝑖=1 𝑗=1

Pero el término final es 0 puesto que siempre se cumple


𝑛

∑(𝑦𝑖𝑗 − 𝑦̅𝑖. ) = 𝑦𝑖. − 𝑛𝑦̅𝑖. = 𝑦𝑖. − 𝑛𝑦𝑖. /𝑛 = 𝑦𝑖. − 𝑦𝑖. = 0


𝑗=1

Por lo tanto la ecuación queda

𝑘 𝑛 𝑘 𝑛

𝑆𝑆𝑇 = ∑ ∑(𝑦𝑖𝑗 − 𝑦̅𝑖. ) + ∑ ∑(𝑦̅𝑖. − 𝑌̅.. )2


2

𝑖=1 𝑗=1 𝑖=1 𝑗=1


𝑘 𝑛 𝑘

𝑆𝑆𝑇 ∑ ∑(𝑦𝑖𝑗 − 𝑦̅𝑖. )2 + 𝑛 ∑(𝑦̅𝑖. − 𝑌̅.. )2


𝑖=1 𝑗=1 𝑖=1

𝑆𝑆𝑇 = 𝑆𝑆𝐸 + 𝑆𝑆𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠


Donde 𝑆𝑆𝑇 tiene N-1 grados de libertad
Donde 𝑆𝑆𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠 tiene k-1 grados de libertad
Donde 𝑆𝑆𝑒𝑟𝑟𝑜𝑟 tiene k(n-1) = kn-k = N-k grados de libertad

Si sacamos el valor esperado para las sumas de cuadrados, se obtiene

𝑘 𝑛

𝐸(𝑆𝑆𝐸 ) = 𝐸(∑ ∑(𝑦𝑖𝑗 − 𝑦̅𝑖. )2 )


𝑖=1 𝑗=1
𝑘

= ∑ 𝐸((𝑛 − 1) 𝑆𝑖 2 ) 𝐷𝑒𝑓𝑖𝑛𝑖𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎


𝑖=1
𝑘

= (∑(𝑛 − 1) 𝜎 2 ) 𝑆𝑢𝑝𝑜𝑠𝑖𝑐𝑖𝑜𝑛 𝑑𝑒 ℎ𝑜𝑚𝑜𝑐𝑒𝑑𝑎𝑠𝑡𝑖𝑐𝑖𝑑𝑎𝑑


𝑖=1
= 𝑘(𝑛 − 1)𝜎 2 𝑆𝑢𝑝𝑜𝑠𝑖𝑐𝑖𝑜𝑛 𝑑𝑒 ℎ𝑜𝑚𝑜𝑐𝑒𝑑𝑎𝑠𝑡𝑖𝑐𝑖𝑑𝑎𝑑

𝐸(𝑆𝑆𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠 ) = 𝐸(𝑛 ∑(𝑦̅𝑖. − 𝑌̅.. )2 )


𝑖=1
𝑘

= 𝑛(∑ 𝐸((𝑦̅𝑖. − 𝑌̅.. )2 )


𝑖=1
𝑘

= 𝑛(∑(𝐸(𝑦̅𝑖. − 𝑌̅.. ))2 + 𝑣𝑎𝑟((𝑦̅𝑖. − 𝑌̅.. )) )


𝑖=1
𝑘
𝑘−1 2
= 𝑛( ∑(𝐸(𝑦̅𝑖. ) − 𝐸(𝑌̅.. ))2 + 𝜎 )
𝑁
𝑖=1
𝑘
𝑘−1 2
= 𝑛( ∑((𝜇𝑖 − 𝜇)2 + 𝜎 ))
𝑘𝑛
𝑖=1
𝑘

= 𝑛 ∑(𝜏𝐼 )2 + (𝑘 − 1)𝜎 2
𝑖=1
Por lo tanto

𝐸(𝑀𝑆𝐸 ) = 𝐸(𝑆𝑆𝐸 ⁄(𝑁 − 𝑘 )) = 𝑘(𝑛 − 1)𝜎 2 / 𝑘(𝑛 − 1) = 𝜎 2 → 𝐸(𝑀𝑆𝐸 ) = 𝜎 2

𝐸(𝑀𝑆𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠 ) = 𝐸(𝑆𝑆𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠 ⁄(𝑘 − 1)) = 𝑛 ∑(𝜏𝑖 )2 ⁄(𝑘 − 1) + 𝜎 2


𝑖=1

Sin embargo si la hipótesis nula es verdadera, se cumple 𝜏𝐼 = 0

𝐸(𝑀𝑆𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠 ) = 𝜎 2

Ahora generamos un estadístico para comparar la igualdad entre estas varianzas


𝑀𝑆𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠
𝐹0 =
𝑀𝑆𝐸𝑟𝑟𝑜𝑟

Si la hipótesis nula es verdadera, el estadístico será cercano a 1.

Punto Adicional: Para comprobar que este estadístico es válido, se debe partir nuevamente de
la suma de cuadrados totales.

𝑆𝑆𝑇 = 𝑆𝑆𝐸 + 𝑆𝑆𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠


𝑘 𝑛

∑ ∑(𝑦𝑖𝑗 − 𝑌̅.. )2 = 𝑆𝑆𝐸 + 𝑆𝑆𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠


𝑖=1 𝑗=1
Si se divide todo por 𝜎 2
𝑘 𝑛
𝑦𝑖𝑗 − 𝑌̅.. 2 𝑆𝑆𝐸 𝑆𝑆𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠
∑ ∑( ) = 2 +
𝜎 𝜎 𝜎2
𝑖=1 𝑗=1

Como 𝑦𝑖𝑗 se distribuye normalmente se cumple (𝑦𝑖𝑗 − 𝑌̅.. )⁄𝜎 ~𝑍(0,1)

Dado que la suma de los grados de libertad de cada segmento da el número de grados de
libertad de la suma total. El teorema de Cochran permite decir que tanto 𝑆𝑆𝐸 ⁄𝜎 2 y
𝑆𝑆𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠 ⁄𝜎 2 se distribuyen como variables chi-cuadrado aleatorias e independientes.

Por último, partiendo la definición de la distribución F

𝜒𝑢2 ⁄𝑢
𝐹𝑢,𝑣 =
𝜒𝑣2 ⁄𝑣

(𝑆𝑆𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠 ⁄𝜎 2 ) /𝑘 − 1 𝑆𝑆𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠 ⁄(𝑘 − 1) 𝑀𝑆𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠


𝐹𝑘−1,𝑁−𝑘 = = =
(𝑆𝑆𝐸𝑟𝑟𝑜𝑟 ⁄𝜎 2 ) /𝑁 − 𝑘 𝑆𝑆𝐸𝑟𝑟𝑜𝑟𝑒𝑠 ⁄(𝑁 − 𝑘) 𝑀𝑆𝐸𝑟𝑟𝑜𝑟

Punto 3

1. De las tablas estadísticas para distribución F. 𝐹𝛼,𝑎,𝑁−𝑎 = 𝐹0.05,2,57 = 3.15


Como el valor del estadístico 𝐹0 es mayor al valor crítico de la distribución F encontrado, se
concluye con un 5% de incertidumbre que si hay una diferencia significativa en la
productividad en un empleado si está escuchando música.

2. Usando la fórmula del parámetro Φ

2
𝑛𝐷2 𝑛𝐷2 20 ∗ 82
𝛷 = ≅ = = 3.439
2𝑎𝜎 2 2𝑎𝑀𝑆𝐸𝑟𝑟𝑜𝑟 2 ∗ 3 ∗ 62.03
𝛷 = √𝛷 2 = 1.854

De la gráfica 2, aproximando 𝑣2 = 57 ≈ 60 se obtiene.

𝛽 = 0.2

Por lo tanto la potencia del experimento es:

𝑃 = 1 − 𝛽 = 1 − 0.2 = 0.8 ≡ 80%

S-ar putea să vă placă și