Analisis de Varianza

INTRODUCCION
Las técnicas estadísticas del diseño experimental tienen su razón de ser en la

investigación empírica que trata de indagar cómo ciertas variables, conocidas
como factores, actúan sobre una variable respuesta registrada tras la realización
del experimento.
Es importante hacer destacar que los factores que influyen sobre el valor de la
variable respuesta sólo pueden tomar un número finito de estados o niveles.
Los tests básicos en estos modelos se centran en contrastar si los factores

realmente alteran los resultados de los experimentos al fijarlos en sus diferentes
niveles. La técnica, que consiste en descomponer la variablidad total en las
variabilidades aportadas por los diferentes factores y sus interacciones mutuas,
recibe el nombre de análisis de la varianza.
Análisis De Varianza
El análisis de varianza (ANOVA), se refiere en general a un conjunto de situaciones experimentales

y procedimientos estadísticos para el análisis de respuestas cuantitativas de unidades
experimentales. El problema más sencillo de ANOVA se conoce como el análisis de varianza de un
solo factor o diseño completamente al azar, éste se utiliza para comparar dos o más tratamientos,
dado que sólo consideran dos fuentes de variabilidad, los tratamientos y el error aleatorio.
En este todas las corridas experimentales se deben de realizar en un orden aleatorio. De esta
manera, si durante el estudio se hacen 𝑁 pruebas, éstas se corren al azar, de manera que los
posibles efectos ambientales y temporales se vayan repartiendo equitativamente entre los
tratamientos.
Vamos a suponer que se tienen 𝑘 poblaciones o tratamientos, independientes y con medias

desconocidas 𝜇1, 𝜇2, . . . , 𝜇𝑘, así como varianzas también desconocidas, pero que se supone que
son iguales 𝜎1 2 = 𝜎2 2 = . . . = 𝜎𝑘 2 = 𝜎2. Las poblaciones pueden ser 𝑘 métodos de producción, 𝑘
tratamientos, 𝑘 grupos, etc., y sus medias se refieren o son medidas en términos de la variable de
respuesta.
Si se decide hacer un experimento completamente al azar para comparar las poblaciones, que
cumpla las condiciones antes mencionadas, entonces se tiene que hacer mediante la hipótesis de
igualdad de medias:
𝐻0: 𝜇1 = 𝜇2 = . . . = 𝜇𝑘 = 𝜇
𝐻1: 𝜇𝑖 ≠ 𝜇𝑗 para algún 𝑖 ≠ 𝑗

Los datos generados para un diseño completamente al azar para comparar dichas poblaciones se
pueden escribir tal y como se muestra en la tabla
El número de tratamientos 𝑘 es determinado por el investigador y depende del problema en

particular de que se trata. El número de observaciones en cada tratamiento debe escogerse con
base a la variabilidad que se espera observar en los datos, así como en la diferencia mínima que el
experimentador considera que es importante detectar. Por lo general se recomiendan entre 5 y 30
mediciones en cada tratamiento. En caso de que los tratamientos tengan efecto, las observaciones
𝑦𝑖𝑗 se puede escribir como el modelo estadístico lineal dado por:
𝑌𝑖𝑗 = 𝜇 + 𝜏𝑖 + 𝜀𝑖𝑗 (1)
donde:
𝜇 – Es el parámetro de escala común a todos los tratamientos, llamado media global
𝜏𝑖 – Es un parámetro que mide el efecto del tratamiento 𝑖
𝜀𝑖𝑗 – es el error atribuido a la medición 𝑦𝑖j
Bases del análisis de la varianza

Supónganse k muestras aleatorias independientes, de tamaño n, extraídas de una única población normal. A
partir de ellas existen dos maneras independientes de estimar la varianza de la población 2
1) Una llamada varianza dentro de los grupos (ya que sólo contribuye a ella la varianza dentro de las
muestras), o varianza de error, o cuadrados medios del error, y habitualmente representada
por MSE (Mean Square Error) o MSW (Mean Square Within) que se calcula como la media de las kvarianzas
muestrales (cada varianza muestral es un estimador centrado de2 y la media de k estimadores centrados
es también un estimador centrado y más eficiente que todos ellos). MSE es un cociente: al numerador se le
llama suma de cuadrados del error y se representa por SSE y al denominador grados de libertad por ser los
términos independientes de la suma de cuadrados.
2) Otra llamada varianza entre grupos (sólo contribuye a ella la varianza entre las distintas muestras),
o varianza de los tratamientos, o cuadrados medios de los tratamientos y representada
por MSA o MSB (Mean SquareBetween). Se calcula a partir de la varianza de las medias muestrales y es
también un cociente; al numerador se le llama suma de cuadrados de los tratamientos (se le representa
por SSA) y al denominador (k-1) grados de libertad.
MSA y MSE, estiman la varianza poblacional en la hipótesis de que las kmuestras provengan de la misma
población. La distribución muestral del cociente de dos estimaciones independientes de la varianza de una
población normal es una F con los grados de libertad correspondientes al numerador y denominador
respectivamente, por lo tanto se puede contrastar dicha hipótesis usando esa distribución.
Si en base a este contraste se rechaza la hipótesis de que MSE y MSAestimen la misma varianza, se puede
rechazar la hipótesis de que las kmedias provengan de una misma población.
Aceptando que las muestras provengan de poblaciones con la misma varianza, este rechazo implica que las
medias poblacionales son distintas, de modo que con un único contraste se contrasta la igualdad
de k medias.
Existe una tercera manera de estimar la varianza de la población, aunque no es independiente de las
anteriores. Si se consideran las knobservaciones como una única muestra, su varianza muestral también es
un estimador centrado de 2:
Se suele representar por MST, se le denomina varianza total o cuadrados medios totales, es también un
cociente y al numerador se le llama suma de cuadrados total y se representa por SST, y el denominador (kn -
1) grados de libertad.
Los resultados de un anova se suelen representar en una tabla como la siguiente:
Fuente de variación G.L. SS MS F
Entre grupos k-1 SSA SSA /(k-1) MSA /MSE

Tratamientos
Dentro (n-1)k SSE SSE /k(n-1)

Error
Total kn-1 SST
F se usa para realizar el contraste de la hipótesis de medias iguales. Laregión crítica para dicho contraste es F
> F(k-1,(n-1)k)
Algunas propiedades
Es fácil ver en la tabla anterior que
GLerror+ GLtrata = (n - 1) k + k - 1 = k + k - 1 = nk - 1 = GLtotal

No es tan inmediato, pero las sumas de cuadrados cumplen la misma propiedad,
llamada identidad o propiedad aditiva de la suma de cuadrados:
SST = SSA + SSE
El análisis de la varianza se puede realizar con tamaños muestrales iguales o distintos, sin embargo es
recomendable iguales tamaños por dos motivos:
1) La F es insensible a pequeñas variaciones en la asunción de igual varianza, si el tamaño es igual.
2) Igual tamaño minimiza la probabilidad de error tipo II

EJEMPLO

Analisis de Varianza

Încărcat de

Informații document

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Analisis de Varianza

Încărcat de

Drepturi de autor:

Formate disponibile

INTRODUCCION

Las técnicas estadísticas del diseño experimental tienen su razón de ser en la

Los tests básicos en estos modelos se centran en contrastar si los factores

El análisis de varianza (ANOVA), se refiere en general a un conjunto de situaciones experimentales

Vamos a suponer que se tienen 𝑘 poblaciones o tratamientos, independientes y con medias

𝐻1: 𝜇𝑖 ≠ 𝜇𝑗 para algún 𝑖 ≠ 𝑗

El número de tratamientos 𝑘 es determinado por el investigador y depende del problema en

𝑌𝑖𝑗 = 𝜇 + 𝜏𝑖 + 𝜀𝑖𝑗 (1)

𝜇 – Es el parámetro de escala común a todos los tratamientos, llamado media global

𝜏𝑖 – Es un parámetro que mide el efecto del tratamiento 𝑖

𝜀𝑖𝑗 – es el error atribuido a la medición 𝑦𝑖j

Bases del análisis de la varianza

Los resultados de un anova se suelen representar en una tabla como la siguiente:

Fuente de variación G.L. SS MS F

Entre grupos k-1 SSA SSA /(k-1) MSA /MSE

Dentro (n-1)k SSE SSE /k(n-1)

Total kn-1 SST

GLerror+ GLtrata = (n - 1) k + k - 1 = k + k - 1 = nk - 1 = GLtotal

SST = SSA + SSE

1) La F es insensible a pequeñas variaciones en la asunción de igual varianza, si el tamaño es igual.

2) Igual tamaño minimiza la probabilidad de error tipo II

S-ar putea să vă placă și