Sunteți pe pagina 1din 35

Tema

15
ANÁLISIS DE VARIANZA
CON UN FACTOR
VARIABLE
OBJETIVOS
Al finalizar el Tema 15, el participante será capaz de:
1. Comprender la noción general del análisis de
variancia.
2. Enunciar las características de la distribución F.
3. Realizar una prueba de hipótesis para determinar si
dos variancias muestrales provienen de poblaciones
iguales.
4. Establecer y organizar datos en una tabla ANOVA de
una y dos direcciones.

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


5. Definir los términos tratamiento y bloque.
6. Efectuar una prueba de hipótesis entre tres o
más medias de tratamiento.
7. Desarrollar intervalos de confianza para la
diferencia entre medias de tratamiento.
8. Realizar una prueba de hipótesis para
determinar si hay alguna diferencia entre
medias de bloques.

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


CONTENIDO

1. ¿Qué es el ANOVA?
2. Suposiciones del ANOVA
3. Procedimiento para el análisis de varianza
4. La tabla del ANOVA

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


15.1 ¿Qué es el ANOVA?
Es un método de cálculo para probar la hipótesis
de que las medias de dos o mas poblaciones son
iguales.
Ejemplos:
Comparación de efectos logrado por cinco clases
de antibióticos.
Determinar cuál de los cuatro métodos de
capacitación produce un aprendizaje más rápido.
La dosificación de drogas en un paciente.
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
11-8

15.2 Suposiciones del ANOVA


La distribución F también se usa para probar
la igualdad de más de dos medias con una
técnica llamada análisis de variancia
(ANOVA). El ANOVA requiere las siguientes
condiciones:
A. La población que se muestrea tiene
una distribución normal
B. Las poblaciones tienen desviaciones
estándar iguales
C. Las muestras se seleccionan al azar y
son independientes
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
11-9

15.3 Procedimiento para el análisis de


variancia
 Hipótesis nula: las medias de las poblaciones
son iguales.
 Hipótesis alterna: al menos una de las medias
es diferente.
 Estadístico de prueba: F = (variancia entre
muestras)/(variancia dentro de muestras).
 Regla de decisión: para un nivel de significación
, la hipótesis nula se rechaza si F calculada es
mayor que F tabular con grados de libertad en
el numerador y en el denominador.

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


15.4 El modelo aditivo lineal : MAL
Se aplica como una suma y los exponentes
son iguales a 1.
Explica cómo está formada una observación
Xi=  + i
Donde
i = error, es decir la variabilidad (o diferencia)
entre la observación y el promedio

 Xi

i

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


El MAL para el ANOVA con un factor:
Xij     i   ij
Donde
i = efecto del tratamiento
N

 X  (     )
j1
ij

 
i    i ij

N N
 1     1
 2     2

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


Si la Hp : 1= 2

Reemplazando tenemos

Hp :  + 1=  + 2

Hp : 1= 2

Sólo se prueba la diferencia entre tratamientos

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


15.5 El modelo de ANOVA con igual número
de repeticiones

T1 T2 T3

X11 X12 X13

X21 X22 X23

X31 X32 X33

X41 X42 X43

X51 X52 X53

X.1 X.2 X.3

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


La tabla del ANOVA

Fuentes de Suma de Cuadrado F F


variabilidad Cuadrados
t
GL Medio calculado teórico
Entre grupos X
j1
2
j
X2 t-1 CMe 
SC trat Fc 
CMe trat Ft con (t-1) y
(Tratamientos) SC trat   GL CMe ee (rt-t)
r rt

 X  
X 2
SCee
Dentro de los grupos SC 2
ij
j
rt-t CMe 
(Error Experimental)
ee
r GL
X2
  Xij 
2
SC total
Total rt r t -1

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


11-12

Aplicación 1
Se realiza un estudio para comparar la eficacia
de tres programas terapéuticos para el
tratamiento del acné de tipo medio a moderado.
Se emplean tres métodos:
I. Este método, el más antiguo, supone el lavado,
dos veces al día, con un cepillo de polietileno y un
jabón abrasivo, junto con el uso diario de 250 mg.
de tetraciclina.
II. Este método, el utilizado actualmente, consiste, en
la aplicación de crema de tretinoína, evitar el sol,
lavado dos veces al día con jabón emulsionante y
agua, y utilización, dos veces al día, de 250 mg.
De tetraciclina.
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
11-13

III. Este es un método nuevo que consiste en evitar el


agua, lavado dos veces al día con limpiador sin
lípidos, y uso de crema de tretinoína y de peroxido de
benzoilo.
Se comparan estos tres tratamientos en cuanto a su
eficacia en la reducción del número de lesiones de
acné en los pacientes. En el estudio participaban
treinta pacientes. Se les separó aleatoriamente en tres
subgrupos de tamaño 10. A uno de los subgrupos se le
asignó el tratamiento I, a otro el tratamiento II y al
tercero, el tratamiento III. Después de 16 semanas se
anotó para cada paciente la tasa porcentual de
mejoría, medido en número de lesiones.
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
Se obtuvieron los siguientes datos:
I II III
48.6 68.0 67.5
49.4 67.0 62.5
50.1 70.1 64.2
49.8 64.5 62.5
50.6 68.0 63.9
50.8 68.3 64.8
50.8 71.9 62.3
47.1 71.5 61.4
52.5 69.9 67.4
49.0 68.9 65.4
50.6 67.8 63.2
549.3 755.9 705.1

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


Solución
1. Planteamiento de hipótesis:
Hp : 1= 2= 3
Ha : 1= 2= 3 (no todas las medias son iguales)
2. Nivel de significación
 = 0.05
3. Prueba estadística
CMe trat
Fc 
CMe ee

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


4. Criterios de decisión

3,3158

Si {Fc>3,3158} se rechaza la Hp, en caso contrario


se acepta.
4. Cálculos
Excel nos brinda los siguientes resultados:
Fuente de
variabilidad SC GL CMe F cal p-valor F teórico
Tratamientos 2107.20727 2 1053.60364 300.680769 1.42117E-20 3.31583294

Error experimental 105.121818 30 3.50406061

Total 2212.32909 32

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


6. Conclusiones
A. Se rechaza la hipótesis planteada, se acepta
la hipótesis alterna a un nivel de significación
de 0,05. La prueba fue significativa.
B. Al menos un método de capacitación es
diferente a los demás

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


15.6 El modelo de ANOVA con diferente
número de repeticiones

T1 T2 T3
X11 X12 X13

X21 X22 X23

X31 X32 X33

X42 X43

X52

X.1 X.2 X.3

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


La tabla del ANOVA

Fuentes de Suma de Cuadrado F F


variabilidad Cuadrados GL Medio calculado teórico
t  X2j  X2
SC trat     t-1 SC trat CMe trat
Ft con (t-1) y
Entre grupos   r
j 1  rj 
CMe  Fc 
CMe ee
(Tratamientos)
j
GL (rt-t)

 Xij2 
Dentro de los SC ee   X     r t - t
2
 r 
ij SCee
grupos (Error  j  CMe 
Experimental) GL

X2
  Xij 
2
SC total
Total
 rj r t -1

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


Aplicación 2
El director de entrenamiento de una compañía está
tratando de evaluar tres diferentes métodos de
entrenamiento para empleados nuevos. El primer
método consiste en asignar un empleado nuevo con
un trabajador experimentado para que éste lo asista
en la fábrica. El segundo método consiste en ubicar a
todos los empleados nuevos en un salón de
entrenamiento separado de la fábrica, y el tercer
método consiste en utilizar películas de entrenamiento
y materiales de aprendizaje.
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
El director de entrenamiento escoge al azar 16
empleados nuevos asignados a los tres métodos y
registra su producción diaria después que
terminaron sus programas de entrenamiento:
Metodo 1 15 18 19 22 11

Metodo 2 22 27 18 21 17

Metodo 3 18 24 19 16 22 15

El director pregunta si existen diferencias en cuanto


a la efectividad entre los tres métodos.

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


Solución

1. Planteamiento de hipótesis:
Hp : 1= 2= 3
Ha : 1= 2= 3 (no todas las medias son iguales)
2. Nivel de significación
 = 0.05
3. Prueba estadística
CMe trat
Fc 
CMe ee

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


4. Criterios de decisión

3,81

Si {Fc>3,3158} se rechaza la Hp, en caso


contrario se acepta.
4. Cálculos
Excel nos brinda los siguientes resultados:
ANÁLISIS DE VARIANZA
Fuentes de Variabilidad SC GL CMe F cal p-valor F tabular

Entre grupos 40 2 20 1.35 0.29 3.81


Dentro de los grupos 192 13 14.7692308

Total 232 15

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


6. Conclusiones
A. Se acepta la hipótesis planteada, se rechaza
la hipótesis alterna a un nivel de significación
de 0,05. La prueba no resultó significativa.
B. Los datos muestrales no proporcionan
evidencia para afirmar que los tratamientos
son diferentes.

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


15.7 Métodos para encontrar
diferencia entre tratamientos
Cuando se rechaza la hipótesis nula de que las
medias son iguales, quizá sea bueno saber qué
medias de tratamiento difieren.
 Diferencia limite de significación (DLS): Para
comparar promedios de tratamientos.
 Prueba de comparaciones múltiples de Duncan:
Para comparar todos contra todos.
 Prueba de comparaciones múltiples de Tuckey
 Prueba de comparaciones múltiples de Student,
Newman y Keuls.
 Prueba de comparaciones de Dunnett: Para
comparar todos contra un testigo.
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
2CMe
DLS  t  
n
Ventajas
• Fácil de realizar
• De preferencia debe de utilizarse para hacer
comparaciones ortogonales o independientes, sin
embargo su validez no se ve seriamente afectada
cuando algunas comparaciones no son ortogonales,
pero han sido establecidas al momento de instalar el
experimento.
Desventajas
• Por ningún motivo debe usarse DLS para
comparaciones inducidas por los resultados
• No es válida para realizar todas las comparaciones
• Se ve afectada por el número de tratamientos: a
mayor número de tratamientos, se pierde algo de
eficiencia.
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
11-15

15. 8 Inferencias acerca de las


medias de tratamiento
Uno de los procedimientos más sencillo
es el uso de los intervalos de confianza.

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


11-16

Intervalos de confianza para la


diferencia entre dos medias

 1 1
 X 1  X 2   t MSE  n  n 
1 2

donde t se obtiene de la tabla con (N - k) grados


de libertad.
MSE = [SSE /(N - k)]

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


Las hipótesis se plantean de la siguiente manera:
Ho: Todos los tratamientos son iguales 1  2  ....  n
Ha: Al menos un tratamiento es diferente.

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


La técnica consiste en calcular de diferente maneras la
varianza de las muestras.
Existen dos maneras de calcular la varianza:
Dentro SMQD (conocida como varianza no explicada)
Entre SMQE (conocida como varianza explicada)
La prueba estadística que se utiliza es la prueba F
SMQE
Prueba F 
SMQD

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


La distribución F es oblicua hacia la derecha y sus
valores son siempre positivos.
La distribución F depende del nivel  y de los
grados de libertad (d.f. = degree of fredom) del
numerador y de los grados de libertad del
denominador.
D.f numerador = C – 1 donde C es el número de
grupos.
D.f. Denominador = C ( n – 1) donde n es el
número de observaciones en cada grupo.
Material de Clases © Jorge Córdova Egocheaga. Febrero 2003
15.9 Solución aplicando EXCEL
Como solo estamos evaluando el rendimiento de los
empleados con los diferentes métodos de capacitación,
aplicamos análisis de varianza de un solo factor

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


EJEMPLO

Considere un estudio de diez años en el que


se ha observado una muestra de 15 personas
que han usado pastas dentales 1, 2 o 3,
respectivamente. Supongamos que cinco de
los participantes se han asignado
aleatoriamente a cada uno de los tratamientos
y que el estudio ha proporcionado los datos
siguientes:

Material de Clases © Jorge Córdova Egocheaga. Febrero 2003


Material de Clases © Jorge Córdova Egocheaga. Febrero 2003

S-ar putea să vă placă și