Sunteți pe pagina 1din 6

6.

ANALISIS DE VARIANZA

El análisis de varianza es un conjunto de métodos estadísticos utilizados para


analizar datos provenientes de experimentos diseñados; esencialmente,
consiste en la partición de la variación total de la variable de respuesta
dependiente en distintas componentes.

Observaciones: Los modelos a estudiar son los siguientes:

- Modelo de clasificación simple o experimentos de un factor completamente


aleatorizado y aleatorizado por bloques.

- Modelo de clasificación doble o experimentos de dos factores sin


replicación y con replicación.

6.1 MODELO DE CLASIFICACION DE UNA VARIABLE COMPLETAMENTE


ALEATORIZADO

Sea 𝑋 una característica en estudio medida en 𝑘 grupos o poblaciones


distintas, de modo que 𝑋~𝑁(𝜇𝑗 ; 𝜎 2 ) en la j-ésima población 𝑗 = 1,2, … , 𝑘

Sea 𝑋1𝑗 , 𝑋2𝑗 , … , 𝑋𝑛𝑗.𝑗 una muestra aleatoria seleccionada de la j-ésima


población 𝑁(𝜇𝑗 ; 𝜎 2 ), 𝑗 = 1,2, … , 𝑘 donde 𝜇1 , 𝜇2 , … , 𝜇𝑘 y 𝜎 2 son desconocidas. El
número total de observaciones del experimento en las 𝑘 muestras es

𝑛 = 𝑛1 + 𝑛2 + ⋯ + 𝑛𝑘

Y supongamos que las 𝒏 observaciones son independientes.

En un experimento completamente aleatorizado el modelo apropiado es

𝑿𝒊𝒋 = 𝝁 + 𝜷𝒋 + 𝒆𝒊𝒋 , 𝑖 = 1,2, … , 𝑛𝑗 , 𝑗 = 1,2, … , 𝑘

donde 𝑋𝑖𝑗 denota la medida de la i-ésima unidad experimental sujeto al j-èsimo


tratamiento, 𝜇 es la media general, 𝛽𝑗 es el efecto del grupo j y 𝑒𝑖𝑗 el error o
residuo experimental, causada por todos los factores no estudiados o
desconocidos (variables exógenas)

En este modelo suponemos que 𝜇, 𝛽1 , … , 𝛽𝑘 son constantes en el sentido de


que no son variables aleatorias, y 𝑒𝑖𝑗 son variables aleatorias independientes
con distribución 𝑁(0 ; 𝜎 2 ).
Los datos de un experimento no balanceado de una variable completamente
aleatorizado son representados en una tabla de la forma:

Tratamientos o grupos
1 2 j k Total
𝑥11 𝑥12 𝑥1𝑗 𝑥1𝑘
𝑥21 𝑥22 𝑥2𝑗 𝑥2𝑘
. . . .
. . . .
. . . .
𝑥𝑛1 1 𝑥𝑛2 2 𝑥𝑛𝑗 𝑗 𝑥𝑛𝑘 𝑘

Total 𝑇1 𝑇2 𝑇𝑗 𝑇𝑘 T
Medias 𝑋̅1 𝑋̅2 𝑋̅𝑗 𝑋̅𝑘 𝑋̅

Varianzas 𝑆12 𝑆22 𝑆𝑗2 𝑆𝑘2 𝑆2

CONTRASTE DE HIPOTESIS EN UN MODELO DE CLASIFICACION DE


UNA VARIABLE COMPLETAMENTE ALEATORIZADO

Paso 1: formulación de hipótesis:

𝐻𝑜 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑘 = 𝜇 (los efectos de los tratamientos son iguales)

𝐻1 : No todos los 𝜇𝑗 son iguales (los efectos de los tratamientos no son iguales)

Paso 2: nivel de significancia: 𝜶 (𝟎 < 𝛼 < 1)

Paso3: Estadística de Prueba:

𝐶𝑀𝑇𝑅
𝐹= que se distribuye según 𝐹~𝐹(𝑘 − 1; 𝑛 − 𝑘)
𝐶𝑀𝐸

Paso 4: Región crítica: La región crítica de la prueba de tamaño 𝛼 es

𝑅𝐶 = {𝐹/ 𝐹𝑐𝑎𝑙 > 𝐹𝛼 (𝑘 − 1; 𝑛 − 𝑘)}

Paso 5: Cálculos (tabla de análisis de varianza):

Si admitimos que 𝐻𝑜 es verdadero, podemos estimar la varianza común 𝜎 2 de


tres maneras diferentes:
𝑛
La suma total de cuadrados: 𝑆𝐶𝑇 = ∑𝑘𝑗=1 ∑𝑖=1
𝑗 2
𝑥𝑖𝑗 −𝐶

𝑛𝑗 2
𝑇2 (∑𝑘
𝑗=1 ∑𝑖=1 𝑥𝑖𝑗 )
Donde 𝐶= =
𝑛 𝑛−1

𝑇2
Suma de cuadrados entre tratamientos: 𝑺𝑪𝑻𝑹 = ∑𝑘𝑗=1 𝑛𝑗 − 𝐶
𝑗

La variación total es: 𝑺𝑪𝑻 = 𝑺𝑪𝑻𝑹 + 𝑺𝑪𝑬

TABLA DE ANAVA

fuente de suma de grados de cuadrados razón F


variación cuadrados libertad medios o calculada
varianzas
entre SCTR 𝑘−1 𝑆𝐶𝑇𝑅 𝐶𝑀𝑇𝑅
𝐶𝑀𝑇𝑅 = 𝐹𝑐𝑎𝑙 =
tratamientos 𝑘−1 𝐶𝑀𝐸

dentro de los SCE 𝑛−𝑘 𝑆𝐶𝐸


𝐶𝑀𝐸 =
tratamientos 𝑛−𝑘

(Error)
total SCT 𝑛−1
Paso 6: Conclusión: Si 𝐹𝑐𝑎𝑙 > 𝐹𝑡𝑎𝑏 = 𝐹𝛼 (𝑘 − 1; 𝑛 − 𝑘) se rechaza 𝐻𝑜 y
concluimos de que hay diferencia entre las medias y por tanto hay influencia de
los tratamientos sobre la variable analizada

6.2 MODELO DE CLASIFICACION DE UNA VARIABLE EN BLOQUES


COMPLETAMENTE ALEATORIZADO

Sea X una característica de estudio medida en kL grupos o poblaciones


distintas de modo que 𝑋~𝑁(𝜇𝑖𝑗 ; 𝜎 2 ) en el i-ésimo bloque y j-ésimo tratamiento,
𝑖 = 1,2, … , 𝐿 y 𝑗 = 1,2, … , 𝑘.

Sea 𝑋𝑖𝑗 una m.a. seleccionada de la población 𝑁(𝜇𝑖𝑗 ; 𝜎 2 ) definida por una
combinación dada de bloque y de tratamiento i = 1,…, L y j = 1,…, k donde
𝜇11 . 𝜇12 … 𝜇𝐿𝑘 y 𝜎 2 son parámetros desconocidos. El número total de
observaciones del experimento es: 𝑛 = 𝐿. 𝐾

El modelo apropiado es un modelo lineal con efectos aditivos


𝑿𝒊𝒋 = 𝝁 + 𝜶𝒊 + 𝜷𝒋 + 𝒆𝒊𝒋 , 𝑖 = 1,2, … , 𝐿 , 𝑗 = 1,2, … , 𝑘.

𝑋𝑖𝑗 denota las respuestas del j-ésimo tratamiento aplicado al i-ésimo bloque, 𝜇
es la media general, 𝛼𝑖 es el efecto del i-ésimo bloque, 𝛽𝑗 es el efecto del j-
ésimo tratamiento y 𝑒𝑖𝑗 es la parte aleatoria con distribución 𝑁(0; 𝜎 2 ).

Tabla: Modelo de clasificación de una variable en bloques completamente


aleatorizado

bloques tratamientos total de media de varianza de


1 2 k bloque bloque bloque
1 𝑥11 𝑥12 𝑥1𝑘 𝑇1. 𝑋̅1. 𝑆1.2
2 𝑥21 𝑥22 𝑥2𝑘 𝑇2. 𝑋̅2. 𝑆2.2
. . . . . . .
. . . . . . .
. 𝑥𝐿1 𝑥𝐿2 … 𝑥𝐿𝑘 𝑇𝑘. 𝑋̅𝑘. 𝑆𝑘.2
L
total de 𝑇.1 𝑇.2 … 𝑇.𝑘 T
tratamiento
media de 𝑋̅.1 𝑋̅.2 … 𝑋̅.𝑘 𝑋̅
tratamiento
varianza de 𝑆.12 𝑆.22 … 𝑆.𝑘2
tratamiento

CONTRASTE DE HIPOTESIS EN UN MODELO DE CLASIFICACION DE


UNA VARIABLE EN BLOQUES COMPLETAMENTE ALEATORIZADO

Paso 1: Formulación de Hipótesis

𝐻𝑜𝑇 : 𝜇.1 = 𝜇.2 = ⋯ = 𝜇.𝑘 = 𝜇 (los efectos de los tratamientos son iguales)

(𝛽1 = 𝛽2 = ⋯ = 𝛽𝑘 = 0)

𝐻1𝑇 : No todas las 𝜇.𝑗 son iguales, j=1,2,…,k

De manera análoga, para determinar si las medias poblacionales de los


bloques son distintas, se considera las hipótesis

𝐻𝑜𝐵 : 𝜇1. = 𝜇2. = ⋯ = 𝜇𝐿. = 𝜇 (los efectos de los bloques son iguales)

(𝛼1 = 𝛼2 = ⋯ = 𝛼𝐿 = 0)
𝐻1𝐵 : No todas las 𝜇𝑖. son iguales, i=1,2,…,k

Paso 2: nivel de significancia: 0<α<1

Paso 3: Estadística de prueba:


𝐶𝑀𝑇𝑅
𝑇
𝐹𝑐𝑎𝑙 =
𝐶𝑀𝐸
que se distribuye según 𝐹(𝑘 − 1; (𝑘 − 1)(𝐿 − 1))

𝐶𝑀𝐵𝐿
𝐵
𝐹𝑐𝑎𝑙 =
𝐶𝑀𝐸
que se distribuye según 𝐹(𝐿 − 1; (𝑘 − 1)(𝐿 − 1))

Paso 4: región critica

i) La región crítica y de aceptación de la prueba de tamaño α para


contrastar los efectos de los tratamientos es
𝑅𝐶 𝑇 = {𝐹𝑐𝑇 / 𝐹𝑐𝑇 > 𝐹𝛼 (𝑘 − 1; (𝑘 − 1)(𝐿 − 1))}
ii) La región crítica y de aceptación de la prueba de tamaño α para
contrastar los efectos de bloques es:

𝑅𝐶 𝐵 = {𝐹𝑐𝐵 / 𝐹𝑐𝐵 > 𝐹𝛼 (𝐿 − 1; (𝑘 − 1)(𝐿 − 1))}

Paso 5: Cálculos: ( tabla de análisis de varianza)

Si admitimos que las hipótesis nulas 𝐻𝑜𝑇 y 𝐻𝑜𝐵 son verdaderas, podemos
estimar la varianza común 𝜎 2 de 4 formas diferentes que son:

Suma total de cuadrados: 𝑆𝐶𝑇 = ∑𝐿𝑖=1 ∑𝑘𝑗=1 𝑥𝑖𝑗


2
−𝐶

2
𝑇2 (∑𝑘 𝐿
𝑗=1 ∑𝑖=1 𝑥𝑖𝑗 ) 𝑇2
Donde 𝐶 = = = 𝐿𝑘
𝑛 𝑛

Suma de cuadrados entre tratamientos:

∑𝑘𝑗=1 𝑇.𝑗2
𝑆𝐶𝑇𝑅 = −𝐶
𝐿

Suma de cuadrados entre boques:

∑𝐿𝑖=1 𝑇𝑖.2
𝑆𝐶𝐵𝐿 = −𝐶
𝑘

Por tanto la suma total de los cuadrados SCT se descompone:

𝑺𝑪𝑻 = 𝑺𝑪𝑻𝑹 + 𝑺𝑪𝑩𝑳 + 𝑺𝑪𝑬


Los resultados del análisis son resumidos en la siguiente tabla

TABLA ANAVA:

fuentes de suma de grados de cuadrados medios o estadística F


variación cuadrados libertad varianzas calculada
entre SCTR k-1 𝑆𝐶𝑇𝑅 𝑇
𝐶𝑀𝑇𝑅
𝐶𝑀𝑇𝑅 = 𝐹𝑐𝑎𝑙 =
tratamientos 𝑘−1 𝐶𝑀𝐸

entre bloques SCBL L-1 𝑆𝐶𝐵𝐿


𝐶𝑀𝐵𝐿 = 𝐶𝑀𝐵𝐿
𝐿−1 𝐵
𝐹𝑐𝑎𝑙 =
𝑆𝐶𝐸 𝐶𝑀𝐸
error SCE (L-1)(k-1)
𝐶𝑀𝐸 =
(𝐿 − 1)(𝑘 − 1)
total SCT (n-1)
Paso 6: conclusión:

i) Si 𝐹𝑐𝑇 > 𝐹𝛼 (𝑘 − 1; (𝑘 − 1)(𝐿 − 1)), se rechaza 𝐻𝑜 y se concluye de que


hay diferencia entre las medias de tratamientos y consecuentemente hay
influencia de los tratamientos sobre la variable analizada.
ii) Si 𝐹𝑐𝐵 > 𝐹𝛼 (𝐿 − 1; (𝑘 − 1)(𝐿 − 1)), se rechaza 𝐻𝑜 y se concluye de que
hay diferencia entre las medias de los bloques y consecuentemente hay
influencia de los bloques sobre la variable de estudio.

S-ar putea să vă placă și