El procedimiento ANOVA de un factor El anlisis de varianza (ANOVA) de un factor sirve para comparar varios grupos en una variable cuantitativa. Se trata, por tanto, de una generalizacin de la Prueba T para dos muestras independientes al caso de diseos con ms de dos muestras. A la variable categrica (nominal u ordinal) que define los grupos que deseamos comparar la llamamos independiente o factor y la representamos por VI. A la variable cuantitativa (de intervalo o razn) en la que deseamos comparar los grupos la llamamos Dependiente y la representamos por VD. Si queremos, por ejemplo, averiguar cul de tres programas distintos de incentivos aumenta de forma ms eficaz el rendimiento de un determinado colectivo, podemos seleccionar tres muestras aleatorias de ese colectivo y aplicar a cada una de ellas uno de los tres programas. Despus, podemos medir el rendimiento de cada grupo y averiguar si existen o no diferencias entre ellos. Tendremos una VI categrica (el tipo de programa de incentivos) cuyos niveles deseamos comparar entre s, y una VD cuantitativa (la medida del rendimiento), en la cual queremos comparar los tres programas. El ANOVA de un factor permite obtener informacin sobre el resultado de esa comparacin. Es decir, permite concluir si los sujetos sometidos a distintos programas difieren la medida de rendimiento utilizada.
ANOVA de un factor La hiptesis que se pone a prueba en el ANOVA de un factor es que las medias poblacionales (las medias de la VD en cada nivel de la VI) son iguales. Si las medias poblacionales son iguales, eso significa que los grupos no difieren en la VD y que, en consecuencia, la VI o factor es independiente de la VD. La estrategia para poner a prueba la hiptesis de igualdad de medias consiste en obtener un estadstico, llamado F, que refleja el grado de parecido existente entre las medias que se estn comparando. El numerador del estadstico F es una estimacin de la varianza poblacional basada en la variabilidad existente entre las medias de cada grupo: . El denominador del estadstico F es tambin una estimacin de la varianza poblacional, pero basada en la variabilidad existente dentro de cada grupo: (j se refiere a los distintos grupos o niveles del factor): Si las medias poblacionales son iguales, las medias muestrales sern parecidas, existiendo entre ellas tan slo diferencias atribuibles al azar. En ese caso, la estimacin (basada en las diferencias entre las medias) reflejar el mismo grado de variacin que la estimacin (basada en las diferencias entre las puntuaciones individuales) y el cociente F tomar un valor prximo a 1. Si las medias muestrales son distintas, la estimacin reflejar mayor grado de variacin que la estimacin y el cociente F tomar un valor mayor que 1. Cuanto ms diferentes sean las medias, mayor ser el valor de F. Si las poblaciones muestreadas son normales y sus varianzas son iguales, el estadstico F se distribuye segn el modelo de probabilidad F de Fisher-Snedecor (los grados de libertad del numerador son el nmero de grupos menos 1; los del denominador, el nmero total de observaciones menos el nmero de grupos). Si suponemos cierta la hiptesis de igualdad de medias, podemos conocer en todo momento la probabilidad de obtener un valor como el obtenido o mayor (ver Pardo y San Martn, 1998, pgs. 248- 250). El estadstico F se interpreta de forma similar a como hemos hecho en el captulo anterior con el estadstico T. Si el nivel crtico asociado al estadstico F (es decir, si la probabilidad de obtener valores como el obtenido o mayores) es menor que 0,05, rechazaremos la hiptesis de igualdad de medias y concluiremos que no todas las medias poblacionales comparadas son iguales. En caso contrario, no podremos rechazar la hiptesis de igualdad y no podremos afirmar que los grupos comparados difieran en sus promedios poblacionales
ANLISIS DE LA VARIANZA CON UN FACTOR (ANOVA) El anlisis de la varianza permite contrastar la hiptesis nula de que las medias de K poblaciones (K >2) son iguales, frente a la hiptesis alternativa de que por lo menos una de las poblaciones difiere de las dems en cuanto a su valor esperado. Este contraste es fundamental en el anlisis de resultados experimentales, en los que interesa comparar los resultados de K 'tratamientos' o 'factores' con respecto a la variable dependiente o de inters.
El Anova requiere el cumplimiento los siguientes supuestos: Las poblaciones (distribuciones de probabilidad de la variable dependiente correspondiente a cada factor) son normales. Las K muestras sobre las que se aplican los tratamientos son independientes. Las poblaciones tienen todas igual varianza (homoscedasticidad). El ANOVA se basa en la descomposicin de la variacin total de los datos con respecto a la media global (SCT), que bajo el supuesto de que H0 es cierta es una estimacin de obtenida a partir de toda la informacin muestral, en dos partes: Variacin dentro de las muestras (SCD) o Intra-grupos, cuantifica la dispersin de los valores de cada muestra con respecto a sus correspondientes medias. Variacin entre muestras (SCE) o Inter-grupos, cuantifica la dispersin de las medias de las muestras con respecto a la media global. Las expresiones para el clculo de los elementos que intervienen en el Anova son las siguientes: Media Global: Variacin Total: Variacin Intra-grupos: Variacin Inter-grupos: Siendo xij el i-simo valor de la muestra j-sima; nj el tamao de dicha muestra y su media. Cuando la hiptesis nula es cierta SCE/K-1 y SCD/n-K son dos estimadores insesgados de la varianza poblacional y el cociente entre ambos se distribuye segn una F de Snedecor con K-1 grados de libertad en el numerador y N-K grados de libertad en el denominador. Por lo tanto, si H0 es cierta es de esperar que el cociente entre ambas estimaciones ser aproximadamente igual a 1, de forma que se rechazar H0 si dicho cociente difiere significativamente de 1.