Sunteți pe pagina 1din 19

ANOVA CON UN FACTOR

ANOVA
O El análisis de varianza(ANOVA) es un método de prueba de igualdad de
tres o más medias poblacionales, por medio del análisis de las
varianzas muéstrales
O Importante:
Los métodos de ANOVA requieren de la distribución F

CUANDO UTILIZAR ANOVA


 Variables cuantitativas
 Cuando existen mas de dos grupos
 Comparar medias
Suposiciones de ANOVA
O Existen distribución normal en casa uno de los grupos
O Existe homogeneidad de varianzas en los grupos
O Los grupos son totalmente independientes.

Hipótesis de ANOVA

 Ho= las medidas de los grupos son iguales


 Ha= no todos las medias de los grupos son iguales.
 Al menos una de las medias es distinta.
Existen procedimientos llamados
post hoc, dentro de los cuales se
encuentran:
O Prueba de TUKEY, Hipótesis
alterna:
O Para identificar cual o cales son
las medias que son distintas.
ANOVA de un factor
O compara las medias de la variable dependiente entre los
grupos o categorías de la variable independiente.
O Si las medias de la variable dependiente son iguales en cada
grupo o categoría de la variable independiente, los grupos no
difieren en la variable dependiente, y por tanto no hay
relación entre las variables., si las medias del número de
hijos son diferentes entre los niveles de la clase social es que
las variables están relacionadas.
PROPIEDAD DE DISTRIBUCIÓN F
1. La distribución F no es simetría; está sesgada hacia la derecha.

2. Los valores de F pueden ser 0 o positivos, pero no pueden ser


negativos.

3. Existe una distribución F diferente para cada par de grados de


libertad para el numerador y el denominador.

4. ANOVA permite analizar los datos con observaciones múltiples.


GRÁFICA DE LA DISTRIBUCION F
O El análisis de varianza de un factor es
utilizado para probar las hipótesis de 3 o
más medidas poblacionales son iguales
como Ho: 𝜇1 = 𝜇2 = 𝜇3 = 𝜇𝑛
O Un tratamiento o factor es una
característica que nos permite distinguir
entre si a las poblaciones;
ejemplo el que se puede apreciar en
plantas con tratamientos(ninguno,
fertilizante, riego, fertilizante y riego)
Intervalos de comparación

Objetivo.- Desarrollar un método para calcular intervalos de comparación individuales que se


pudieran utilizar para realizar comparaciones entre las muestras.

Método.- Controla el error aumentado que ocurre cuando proporcionan un intervalo para la
diferencia o múltiples comparaciones. En el especial caso de iguales tamaños de muestra y bajo el
supuesto de desviaciones estándar iguales.

Resultado.- Muestra los intervalos de comparación de la Gráfica de comparación de medias en el


informe de resumen de ANOVA de un solo factor.
TAMAÑO DE LA MUESTRA
•Para desarrollar una metodología para calcular la potencia.
Objetivo

•Para cubrir el infinito número de posibles configuraciones de medias, desarrollamos un


método basado en el enfoque utilizado en el procedimiento ANOVA de un solo factor
Método estándar en Minitab (Estadísticas > ANOVA > Un solo factor).

•La comparación de estos métodos demostró que el método de Kulinskaya proporciona


una buena aproximación de potencia y que nuestro método para trabajar la
Resultado configuración de medias es apropiado
Ejercicios:
O La siguiente información muestral verifique la
hipótesis de que las medios de tratamiento son
iguales, utilice el nivel de significancia del 0.05. T1 T2 T3

F1 8 3 3
1. HO: Todas las medidas son iguales
Hi: al menos uno media sea distinta F2 6 2 4
2. Determinar el nivel de significancia = 0.05 F3 10 4 5
F4 9 3 4
3. Calcular el estadístico prueba, sacando la
media.
X1= 8.25 8.25 3 4
X2= 3
X3= 4
3.1. Calculamos
T1 T2 T3
c= Columnas, 3 F1 8 3 3
r= Filas, 4 F2 6 2 4
n= c x r = 12 F3 10 4 5
3.3. Calculamos la gran media F4 9 3 4

= 1+ 2+ 3
t1 t2 t3 Total
8.53 4.33 4.33 17.19
8.25 + 3 + 4 0.85 9.49 1.17 11.51
= = 5.08
3 24.20 1.17 0.006 25.38
3.4. Calculamos la suma de los cuadrados 15.37 4.33 1.17 20.87
totales (SCT)= 74.95
48.95 19.32 6.68 74.95
SCT= σ(𝑥𝑖𝑗 − 𝑥)2 = (8 − 5.08)2 …
T1 T2 T3
3.5. suma de cuadrados de tratamiento
F1 8 3 3
SCTR: = σ(𝑥𝑗 − 𝑥)2 = 𝟔𝟐. 𝟏𝟖 F2 6 2 4
F3 10 4 5
r(𝑥1 − 𝑥)2 = 4(8.25 − 5.08)2 = 𝟒𝟎. 𝟐𝟎 F4 9 3 4
r(𝑥2 − 𝑥)2 = (3 − 5.08)2 =17.31
r(𝑥1 − 𝑥)2 = 𝟒. 𝟔𝟕

3.6. suma cuadrados de error 8.25 3 4


𝐶𝑀𝐸: (𝑥1 − 𝑥)2 = (8 − 8.25)2 =0.06
.
. totales
.
0.06 0 1 1.06
5.06 1 0 6.06
3.06 1 1 5.06
0.56 0 0 0.56
8.74 2 2 12.74
3.7
𝑆𝐶𝑇 74.95 4. Buscamos en la tabla de FISHER0
𝐶𝑀𝑇 = = = 6.81
𝑛−1 11
(cuadrado medio total) 𝐶−1 3−1 2
𝑔! = = =
𝑛 − 𝑐 12 − 3 9
𝑆𝐶𝑇𝑅 62.18
CMTR = = = 31.09
𝑐−1 2
(cuadrado medio del tratamiento) Posición

𝑆𝐶𝐸 12.74
𝐶𝑀𝐸 = = = 1.42
𝑛−𝑐 9
(cuadrado medio del error)
5. Regla de decisión

4.26

Si f ≤ 𝑣𝑎𝑙𝑜𝑟 𝑡𝑎𝑏𝑙𝑎, 𝑠𝑒 𝑎𝑐𝑒𝑝𝑡𝑎 𝐻𝑂


Si f > 𝑣𝑎𝑙𝑜𝑟 𝑡𝑎𝑏𝑙𝑎, 𝑟𝑒𝑐ℎ𝑎𝑧𝑜 𝐻𝑂

21.89 > 4.26

E este caso, rechazamos que todas las medias son iguales y aceptamos que almenas una media es
distinta0
O Se desea comparar el gasto diario de 4 grupos de ITSON

GRUPO 1 GRUPO 2 GRUPO 3 GRUPO 4

35 62 35 20
40 30 42 40
20 50 39 35
24 28 50 17
50 20 50 19
60 30 26 38
45 50 18 54
22 30 16
TC : 274 294 290 239 = 1,095
X : 39.1428 36.5 36.25 29.875 = 141.7628
N: 7 8 8 8 = 31
Σ𝑥 2 : 11,926 12,312 11,410 8,491 = 44,139

Fórmula :
SST = Σ( 𝑇𝐶 2/ NC) – Σ( 𝑋 2/n)

SSE = Σ𝑋 2 - Σ(𝑇𝐶 2 / NC)


O Σ( 𝑇𝐶 2 / NC) = 2742 / 7 + 2922 /8 + 2902 /8 + 2392 /8 = 39,035.76
O Σ( 𝑋 2 /n) = 1,0952 /31 = 38, 678.22
O SST = Σ( 𝑇𝐶 2 / NC) – Σ( 𝑋 2 /n) = 39,035.76 - 38,678.22 = 357.54
O SSE = Σ𝑋 2 - Σ(𝑇𝐶 2 / NC) = 44,139 – 39,053.76 = 5,103.24

FUENTE DE SUMA DEL GRADO DE CUADRADO MEDIO


VARIACIÓN CUADRADO LIBERTAD

SST K-1
ENTRE GRUPO 357.54 3 119.18

SSE N-K
DENTRO GRUPO 5,103.24 27 189
Grado de Libertad : 2.96
119.18
Para sacar la F : = 0.63
189

Se concluye que se acepta la


hipótesis.

S-ar putea să vă placă și