Sunteți pe pagina 1din 3

Captulo 14

Anlisis de varianza de un factor:


El procedimiento
ANOVA de un factor
El anlisis de varianza (ANOVA) de un factor sirve para comparar varios grupos en una
variable cuantitativa. Se trata, por tanto, de una generalizacin de la Prueba T para dos
muestras independientes al caso de diseos con ms de dos muestras.
A la variable categrica (nominal u ordinal) que define los grupos que deseamos
comparar la llamamos independiente o factor y la representamos por VI. A la variable
cuantitativa (de intervalo o razn) en la que deseamos comparar los grupos la llamamos
Dependiente y la representamos por VD.
Si queremos, por ejemplo, averiguar cul de tres programas distintos de incentivos
aumenta de forma ms eficaz el rendimiento de un determinado colectivo, podemos
seleccionar tres muestras aleatorias de ese colectivo y aplicar a cada una de ellas uno de
los tres programas.
Despus, podemos medir el rendimiento de cada grupo y averiguar si existen o no
diferencias entre ellos. Tendremos una VI categrica (el tipo de programa de
incentivos) cuyos niveles deseamos comparar entre s, y una VD cuantitativa (la medida
del rendimiento), en la cual queremos comparar los tres programas. El ANOVA de un
factor permite obtener informacin sobre el resultado de esa comparacin. Es decir,
permite concluir si los sujetos sometidos a distintos programas difieren la medida de
rendimiento utilizada.

ANOVA de un factor
La hiptesis que se pone a prueba en el ANOVA de un factor es que las medias
poblacionales (las medias de la VD en cada nivel de la VI) son iguales. Si las medias
poblacionales son iguales, eso significa que los grupos no difieren en la VD y que, en
consecuencia, la VI o factor es independiente de la VD.
La estrategia para poner a prueba la hiptesis de igualdad de medias consiste en obtener
un estadstico, llamado F, que refleja el grado de parecido existente entre las medias que
se estn comparando. El numerador del estadstico F es una estimacin de la varianza
poblacional basada en la variabilidad existente entre las medias de cada grupo: . El
denominador del estadstico F es tambin una estimacin de la varianza poblacional,
pero basada en la variabilidad existente dentro de cada grupo: (j se refiere a los distintos
grupos o niveles del factor):
Si las medias poblacionales son iguales, las medias muestrales sern parecidas,
existiendo entre ellas tan slo diferencias atribuibles al azar. En ese caso, la estimacin
(basada en las diferencias entre las medias) reflejar el mismo grado de variacin que la
estimacin (basada en las diferencias entre las puntuaciones individuales) y el cociente
F tomar un valor prximo a 1. Si las medias muestrales son distintas, la estimacin
reflejar mayor grado de variacin que la estimacin y el cociente F tomar un valor
mayor que 1. Cuanto ms diferentes sean las medias, mayor ser el valor de F.
Si las poblaciones muestreadas son normales y sus varianzas son iguales, el estadstico
F se distribuye segn el modelo de probabilidad F de Fisher-Snedecor (los grados de
libertad del numerador son el nmero de grupos menos 1; los del denominador, el
nmero total de observaciones menos el nmero de grupos). Si suponemos cierta la
hiptesis de igualdad de medias, podemos conocer en todo momento la probabilidad de
obtener un valor como el obtenido o mayor (ver Pardo y San Martn, 1998, pgs. 248-
250).
El estadstico F se interpreta de forma similar a como hemos hecho en el captulo
anterior con el estadstico T. Si el nivel crtico asociado al estadstico F (es decir, si la
probabilidad de obtener valores como el obtenido o mayores) es menor que 0,05,
rechazaremos la hiptesis de igualdad de medias y concluiremos que no todas las
medias poblacionales comparadas son iguales. En caso contrario, no podremos rechazar
la hiptesis de igualdad y no podremos afirmar que los grupos comparados difieran en
sus promedios poblacionales


ANLISIS DE LA VARIANZA CON UN FACTOR (ANOVA)
El anlisis de la varianza permite contrastar la hiptesis nula de que las medias de K
poblaciones (K >2) son iguales, frente a la hiptesis alternativa de que por lo menos una de
las poblaciones difiere de las dems en cuanto a su valor esperado. Este contraste es
fundamental en el anlisis de resultados experimentales, en los que interesa comparar los
resultados de K 'tratamientos' o 'factores' con respecto a la variable dependiente o de
inters.

El Anova requiere el cumplimiento los siguientes supuestos:
Las poblaciones (distribuciones de probabilidad de la variable dependiente
correspondiente a cada factor) son normales.
Las K muestras sobre las que se aplican los tratamientos son independientes.
Las poblaciones tienen todas igual varianza (homoscedasticidad).
El ANOVA se basa en la descomposicin de la variacin total de los datos con respecto a la
media global (SCT), que bajo el supuesto de que H0 es cierta es una estimacin de
obtenida a partir de toda la informacin muestral, en dos partes:
Variacin dentro de las muestras (SCD) o Intra-grupos, cuantifica la dispersin de
los valores de cada muestra con respecto a sus correspondientes medias.
Variacin entre muestras (SCE) o Inter-grupos, cuantifica la dispersin de las
medias de las muestras con respecto a la media global.
Las expresiones para el clculo de los elementos que intervienen en el Anova son las
siguientes:
Media Global:
Variacin Total:
Variacin Intra-grupos:
Variacin Inter-grupos:
Siendo xij el i-simo valor de la muestra j-sima; nj el tamao de dicha muestra y su
media.
Cuando la hiptesis nula es cierta SCE/K-1 y SCD/n-K son dos estimadores insesgados de
la varianza poblacional y el cociente entre ambos se distribuye segn una F de Snedecor
con K-1 grados de libertad en el numerador y N-K grados de libertad en el denominador.
Por lo tanto, si H0 es cierta es de esperar que el cociente entre ambas estimaciones ser
aproximadamente igual a 1, de forma que se rechazar H0 si dicho cociente difiere
significativamente de 1.

S-ar putea să vă placă și