Sunteți pe pagina 1din 7

ANLISIS DE LA VARIANZA EN DOS DIRECCIONES

(ANOVA EN DOS DIRECCIONES UNA DIRECCIN POR CASILLA)


El anlisis de la varianza en dos direcciones se basa en dos dimensiones de clasificacin o de
tratamientos. Por ejemplo, al analizar el nivel de xito de un programa de capacitacin se puede
considerar el efecto del mtodo de capacitacin y el efecto de los logros escolares anteriores. En
forma similar, el rendimiento de la gasolina se puede investigar de acuerdo con la categora de
peso del automvil y de acuerdo con el grado de gasolina. En otras tablas de datos, a los
tratamientos identificados por los encabezados de las columnas se les acostumbra llamar
tratamientos A, y a los identificados por los encabezados de los renglones se les llama
tratamientos B.
Interaccin en un experimento de dos factores significa que los dos tratamientos no son
independientes, y que el efecto de un tratamiento especfico sobre un factor vara de acuerdo con
los niveles del otro factor. Por ejemplo, al estudiar el rendimiento de la gasolina, una gasolina de
alto octanaje puede mejorar el rendimiento en ciertos tipos de automviles pero en otros no. De
manera similar, la efectividad de os diversos mtodos de capacitacin puede variar de acuerdo
con las habilidades de los estudiantes. Para poder probar esta interaccin, en cada casilla de la
tabla de datos en dos direcciones es necesario tener ms de una observacin o medicin muestral
(es decir, una rplica).

Procedimiento analtico apropiado cuando solo hay una observacin por casilla y en la cual
puede determinarse la interaccin entre los dos factores:
Al modelo de anlisis de varianza en dos direcciones en el cual slo hay una observacin por casilla
por lo general se la conoce como diseo de bloques aleatorizados, debido al uso principal de este
modelo. Qu pasa si se ampla la idea de usar observaciones por partes para comparar dos
medidas mustrales con el modelo bsico de anlisis de varianza en una direccin, y se forman
gropos de k individuos, los cuales son asignados de manera aleatoria a cada nivel de tratamiento?
En el anlisis de la varianza, estos grupos se llaman bloque, y debido a que los individuos (o
elementos) se asignan de manera aleatoria de acuerdo con la perteneca a un grupo, este diseo
se conoce como diseo de bloques aleatorizados.
En estos diseos, la dimensin de los bloques no es una dimensin de tratamiento como tal. El
objetivo de usar este diseo no tiene el propsito especfico de probar el efecto de los bloque,
sino, que, al poder asignar parte de la variabilidad entre sujetos a los logros anteriores, por
ejemplo, el ECM puede reducirse y la prueba resultante del efecto de los tratamientos A es ms
sensible.
La siguiente tabla resume el anlisis de varianza en dos direcciones con una observacin por casilla
(sin replica).
En este caso las frmulas son parecidas a la del ANOVA de una va pero ahora agregando el clculo
por renglones adicional al de columnas donde se incluye la variable de bloqueo.

Se trata de bloquear un factor externo que probablemente tenga efecto en la respuesta pero que
no hay inters en probar su influencia, slo se bloquea para minimizar la variabilidad de este
factor externo, evitando que contamine la prueba de igualdad entre los tratamientos.

Los tratamientos se asignan a las columnas y los bloques a los renglones. Un bloque indica
condiciones similares de los sujetos al experimentar con diferentes tratamientos.
Las hiptesis son:

Ho: No hay diferencia en las medias del factor de columna


Ha: Al menos una media del factor de columna es diferente

Ho: No hay diferencia en las medias de la variable de rengln


Ha: Al menos una media de la variable de rengln es diferente

Fuente de Grados de Cuadrado medio Coeficiente


Suma de cuadrados (SS)
variacin libertad (gl) (MS) F

2 2
Entre grupos de =



= F=
tratamiento (A) K1 =1 1

Entre grupos de
1 2
tratamiento o = 2 =
1
F=

bloque (B) J1 =1

Error de
SSE = SST - SSA - SSB MSE = (1)(1)
muestreo (E) (J - 1) (k 1)

2
Total (T) = 2
N-1
=1 =1

MSA = Cuadrado Medio entre los grupos del tratamiento (CMGT).


MSE = Error Cuadrado Medio (ECM).
T = Suma de los valores mustrales de todos los grupos combinados.
Tk = Suma (total) de los valores para los tratamientos especficos k (Tratamientos A).
N = Tamao total de la muestra condiderando todos los grupos de tratamiento combinados.
n = Tamao de la muestra del tratamiento.
Tj = Suma (total) de los valores para los tratamientos especficos j (Tratamientos B).

Ejemplo 1.
Suponiendo que se quiere investigar si la produccin de tres diferentes mquinas es igual,
tomando en cuenta la experiencia de los operadores a un nivel de significancia del 5%.

Experiencia de Mquinas
Promedios
Ops en aos Maq 1 Maq 2 Maq 3
1 27 21 25 24.33
2 31 33 35 33.00
3 42 39 39 40.00
4 38 41 37 38.66
5 45 46 45 45.33
Promedios 36.6 36 36.2 36.26
Desarrollo

Para j
T1 = 73 T2 = 99 T3= 120 T4 = 116 T5 = 136

T1 = 5.329 T2 = 9.801 T3 = 14.400 T4 = 13.456 T5 = 18.496


Para k
T1 = 183 T2 = 180 T3= 181

T1 = 33.489 T2 = 32.400 T3 = 32.761


T1 / nk= 6697,8 T2 / nk= 6480 T3 / nk= 6552,2

General
T= 544
T = 295.936
N = 15

T/N = 19729,06

= 20.536

K -1 2 SSA 0,93 MSA 0,47 F 0,091


J-1 4 SSB 764,9 MSB 191,2 F 37,3
(J - 1) (K -1) 8 SSE 41,1 MSE 5,1
N - 1 14 SST 806,93

= 0,05
V1 = 2 V1 = 4
V2 = 8 V2 = 8
F = 4,46 F = 3,84

Conclusin: No hay diferencia entre mquinas a pesar de la diferencia en experiencia de los


operadores.
DISEO COMPLETAMENTE ALEATORIZADO DE DOS FACTORES
(ANOVA EN DOS VAS/EN DOS DIRECCIONES, n OBSERVACIONES POR CASILLA)

Cuando se emplean rplicas en un diseo en dos direcciones, se puede probar la interaccin entre
dos factores. As, cuando se usa un diseo de este tipo, mediante al anlisis de varianza se pueden
probar tres hiptesis nulas: que no hay efectos de columnas (las medias en las columnas no son
significativamente diferentes), que no hay efectos de rengln (las medias en los renglones no son
significativamente diferentes) y que no hay interaccin entre estos dos factores (los factores son
independientes). Un efecto de interaccin significativo indica que el efecto de los tratamientos con
un factor vara de acuerdo con los niveles del otro factor. En tal caso, la existencia de efectos de
columna y/o de rengln puede no tener importancia desde el punto de vista de la utilizacin de los
resultados de la investigacin.

Fuente de Grados de Cuadrado medio Coeficiente


Suma de cuadrados (SS)
variacin libertad (gl) (MS) F

Entre grupos de 2 2
K1 = MSA = F=
tratamiento (A) 1
=1

Entre grupos de
2 2
tratamiento o J1 = MSB = 1
F=

bloque (B) =1

2
Interaccin 1
entre los = ( )
MSE =
(J - 1) (k 1) =1 =1 =1
(1)(1)
F=
factores 2

(A y B) (I)

Error de
JK (n -1) SSE = SST - SSA SSB - SSI MSE =
muestreo (E) (1)


2
Total (T) N-1 = 2

=1 =1 =1
Ejemplo 2
Nueve estudiantes de cada una de cuatro reas temticas se asignaron de manera aleatoria en
tres mtodos de capacitacin (tres estudiantes por cada mtodo de capacitacin). Como aparece
en la siguiente tabla; pruebe las diferentes hiptesis nulas que son de inters respecto de un
diseo de este tipo para un nivel de significancia de 5%.

Mtodo de capacitacin
rea temtica Total (Tj) Madia (Xj)
A1 A2 A3
70 83 81
B1 79 89 86 717 79,7
72 78 79
77 77 74
B2 81 87 69 709 78,8
79 88 77
82 94 72
B3 78 83 79 722 80,2
80 79 75
85 84 68
B4 90 90 71 732 81,3
87 88 69
Gran Total
Total (Tk) 960 1.020 900
T = 2.880
) Gran media
Media ( 80 85 756
80

Fuente de Grados de Suma de Cuadrado medio Coeficiente F


variacin libertad (gl) cuadrados (MS)
(SS)
Entre grupos de K1 600 300
SSA = 600 MSA = = 300 F= = 16,57
tratamiento (A) 3 -1 =2 2 18,1

Entre grupos de
J1 30,8 10,3
tratamiento o SSB = 30 MSB = = 10,3 F= = 0,57
41=3 3 18,1
bloque (B)
Interaccin entre
(J - 1) (k 1) 533,9 89
los factores SSI = 533,9 MSE = = 89 F= = 4,92
(4 1) (3 -1) = 6 6 18,1
(A y B) (I)
Error de muestreo JK (n -1) 435,9
SSE = 435,3 MSE = = 18, 1
(E) (4)(3)(3-1)=24 24

N1
Total (T) 1.600
36 1 =35

Con un nivel de significancia de 5%, el coeficiente F que se requiere para el rechazo de la primera
hiptesis nula (gl = 2, 24) es 3,40, para la segunda el F que se requiere (gl = 3, 24) es 3,01 y para la
tercera el F que se requiere (gl =6, 24) es 2,51

As, se concluye que existe una diferencia significativa entre las puntuaciones de las pruebas para
los diferentes mtodos de capacitacin, que no existe una diferencia significativa entre las
diferentes reas temticas y que no hay una interaccin significativa entre los dos factores (o sea
que la efectividad de los tres mtodos de capacitacin vara para las diferentes reas temticas.
ACTIVIDAD DE SEGUIMIENTO

1. A continuacin se incluyen las anchuras del crneo, obtenidas de los crneos de hombres
egipcios de tres pocas diferentes (segn datos de Ancient Races of the Thebaid, de Thomson y
Randall-Maciver). Suponga que planeamos usar una prueba de anlisis de varianza con un nivel de
significancia de 0.06 para someter a prueba la afirmacin de que las diferentes pocas tienen la
misma media.
a) En este contexto, qu caracterstica de los datos indica que deberamos utilizar anlisis de
varianza de un factor?
R/ Los datos estn ordenados de acuerdo con la caracterstica o el factor de la poca.
b) Si el objetivo fuera someter a prueba la afirmacin de que las tres pocas tienen la misma
media, por qu el mtodo se denomina anlisis de varianza?
R/ El trmino anlisis de varianza se refiere al mtodo que se utiliza para someter a prueba la
igualdad de las tres medias. El mtodo se basa en dos estimaciones diferentes de la varianza
poblacional

c) Si usamos un nivel de significancia de 0.05 en un anlisis de varianza con los datos mustrales
del inciso b, obtenemos un valor F (tabla) de 3,68. Qu debemos concluir?

R/ No debemos rechazar la hiptesis nula de que las tres pocas tienen la misma anchura media
del crneo. Existe suficiente evidencia para concluir que de las medias no difieren.

2. A continuacin se presentan los datos de lesiones en la cabeza de los maniques para pruebas
de choque. Se utilizan las unidades de medida condicin de traumatismo craneal hic (por las
siglas de head injury condition), que representan un criterio estndar de lesiones en la cabeza.
Utilice un nivel de significancia de 1% para someter a prueba la hiptesis nula de que las diferentes
categoras de automviles tienen la misma media. Los datos sugieren que los automviles
grandes son ms seguros?
3. Las siguientes son las notas de calificaciones de expertos en dulces de leche y coco (Cocadas),
las diferentes cocadas se realizaron con o sin un ingrediente adicional, y se utilizaron diferentes
cantidades de suero de leche de coco.
Las calificaciones se ven afectadas por una interaccin entre el uso del ingrediente adicional y la
cantidad de suero de leche de coco? Las calificaciones se ven afectadas por el uso del
ingrediente adicional? Las calificaciones se ven afectadas por la cantidad de suero de leche de
coco?

SUERO DE LECHE DE COCO


10% 20% 30% 40%
Sin Ingrediente Adicional 4.4 4.5 4.3 4.6 4.5 4.8 4.5 4.8 4.8 4.6 4.7 5.1
Con Ingrediente Adicional 3.3 3.2 3.1 3.8 3.7 3.6 5.0 5.3 4.8 5.4 5.6 5.3

R/ Para la interaccin, el estadstico de prueba es F = 41.38 y el valor P es 0.000, de manera que


hay un efecto de interaccin significativo.
R/ Parece que la calificacin se ve afectada por una interaccin entre el uso del ingrediente
adicional y la cantidad de suero de leche.

4. Remtase a los datos mustrales del ejercicio anterior y utilice nicamente el primer dato de
cada celda. Suponga que no hay un efecto sobre la calificacin de una interaccin entre el uso del
ingrediente adicional y la cantidad de suero de leche de coco. Existe evidencia suficiente para
sustentar la afirmacin de que las calificaciones se ven afectadas por el uso del ingrediente
adicional? Existe evidencia suficiente para sustentar la afirmacin de que las calificaciones se ven
afectadas por la cantidad de suero de leche de coco?
R/Factor de rengln: el estadstico de prueba es F = 0.10 y el valor P = 0.771, de manera que no
rechace la hiptesis nula de la ausencia de un efecto del factor de rengln del ingrediente
adicional; no existe suficiente evidencia para sustentar la afirmacin de que las calificaciones se
ven afectadas por el uso del ingrediente adicional.
Factor de columna: el estadstico de prueba es F = 1.23 y el valor P = 0.434, de manera que no
rechace la hiptesis nula de la ausencia de un efecto del factor de columna de la cantidad de suero
de leche; no existe suficiente evidencia para sustentar la afirmacin de que las calificaciones se
ven afectadas por la cantidad de suero de leche.

S-ar putea să vă placă și