Sunteți pe pagina 1din 27

El anlisis de varianza es una tcnica que se puede utilizar para decidir si las

medias de dos o ms poblaciones son iguales. La prueba se basa en una


muestra nica, obtenida a partir de cada poblacin.
El anlisis de varianza puede servir para determinar si las diferencias entre las
medias mustrales revelan las verdaderas diferencias entre los valores medios
de cada una de las poblaciones, o si las diferencias entre los valores medios de
la muestra son ms indicativas de una variabilidad de muestreo.
Si el valor estadstico de prueba (anlisis de varianza) nos impulsa a aceptar la
hiptesis nula, se concluira que las diferencias observadas entre las medias de
las muestras se deben a la variacin casual en el muestreo (y por tanto, que los
valores medios de poblacin son iguales). Si se rechaza la hiptesis nula, se
concluira que las diferencias entre los valores medios de la muestra son
demasiado grandes como para deberse nicamente a la casualidad (y por ello,
no todas las medias de poblacin son iguales).
Los datos para el anlisis de varianza se obtienen tomando una muestra de
cada poblacin y calculando la media muestral y la variancia en el caso de
cada muestra.
Existen tres supuestos bsicos que se deben satisfacer antes de que se pueda
utilizar el anlisis de variancia.

1) Las muestras deben ser de tipo aleatorio independiente.
2) Las muestras deben ser obtenidas a partir de poblaciones normales.
3) Las poblaciones deben tener variancias iguales (es decir, )
El anlisis de varianza, como su nombre lo indica, comprende el clculo de
varianzas. La varianza de una muestra es el promedio de las desviaciones
elevadas al cuadrado de la media del grupo.
Simblicamente, esto se representa de la siguiente manera:



Cabe observar que se debe utilizar n -1, ya que se est trabajando con datos
mustrales. De ah que, para obtener la varianza muestral, el procedimiento
sea el siguiente:
1) Calcular la media muestral
2) Restar la media de cada valor de la muestra.
3) Elevar al cuadrado cada una de las diferencias.
4) Sumar las diferencias elevadas al cuadrado.
5) Dividir entre n -1




LA RAZN F
A diferencia de otras pruebas de medias que se basan en la diferencia existente
entre dos valores, el anlisis de varianza emplea la razn de las estimaciones,
dividiendo la estimacin intermediante entre la estimacin interna



Esta razn F fue creada por Ronald Fisher (1890-1962), matemtico britnico,
cuyas teoras estadsticas hicieron mucho ms precisos los experimentos
cientficos. Sus proyectos estadsticos, primero utilizados en biologa,
rpidamente cobraron importancia y fueron aplicados a la experimentacin
agrcola, mdica e industrial. Fisher tambin contribuy a clarificar las
funciones que desempean la mutacin y la seleccin natural en la gentica,
particularmente en la poblacin humana.
El valor estadstico de prueba resultante se debe comparar con un valor
tabular de F, que indicar el valor mximo del valor estadstico de prueba que
ocurra si H0 fuera verdadera, a un nivel de significacin seleccionado. Antes
de proceder a efectuar este clculo, se debe considerar las caractersticas de la
distribucin F


CARACTERSTICAS DE LA DISTRIBUCIN F
Existe una distribucin F diferente para cada combinacin de tamao de
muestra y nmero de muestras. Por tanto, existe una distribucin F que se
aplica cuando se toman cinco muestras de seis observaciones cada una, al
igual que una distribucin F diferente para cinco muestras de siete
observaciones cada una. A propsito de esto, el nmero distribuciones de
muestreo diferentes es tan grande que sera poco prctico hacer una extensa
tabulacin de distribuciones. Por tanto, como se hizo en el caso de la
distribucin t, solamente se tabulan los valores que ms comnmente se
utilizan.
En el caso de la distribucin F, los valores crticos para los niveles
0,05 y 0,01 generalmente se proporcionan para determinadas combinaciones
de tamaos de muestra y nmero de muestras.

La distribucin es continua respecto al intervalo de 0 a + . La razn ms
pequea es 0. La razn no puede ser negativa, ya que ambos trminos de la
razn F estn elevados al cuadrado. Por otra parte, grandes diferencias entre
los valores medios de la muestra, acompaadas de pequeas variancias
mustrales pueden dar como resultado valores extremadamente grandes de la
razn F.

La forma de cada distribucin de muestreo terico F depende del nmero de
grados de libertad que estn asociados a ella. Tanto el numerador como el
denominador tienen grados de libertad relacionados.

DETERMINACIN DE LOS GRADOS DE LIBERTAD
Los grados de libertad para el numerador y el denominador de la razn F se
basan en los clculos necesarios para derivar cada estimacin de la variancia
de la poblacin. La estimacin intermediante de variancia (numerador)
comprende la divisin de la suma de las diferencias elevadas al cuadrado entre
el nmero de medias (muestras) menos uno, o bien, k -1. As, k -1es el nmero
de grados de libertad para el numerador.
En forma semejante, el calcular cada variancia muestral, la suma de las
diferencias elevadas al cuadrado entre el valor medio de la muestra y cada
valor de la misma se divide entre el nmero de observaciones de la muestra
menos uno, o bien, n -1. Por tanto, el promedio de las variancias mustrales se
determina dividiendo la suma de las variancias de la muestra entre el nmero
de muestras, o k. Los grados de libertad para el denominador son entonces,
k(n -l).
Uso de la tabla de F del anlisis de variancia (ANOVA)
En la tabla se ilustra la estructura de una tabla de F para un nivel de
significacin de 0,01 o 1% y 0,05 o 5%. Se obtiene el valor tabular, localizando
los grados de libertad del numerador (que se listan en la parte superior de la
tabla), as como los del denominador (que se listan en una de las columnas
laterales de la tabla) que corresponden a una situacin dada. Utilizando el
nivel de significacin de 0,05 para grados de libertad, el valor de F es 8,89






El anlisis de la varianza (o Anova: Analysis of variance) es un mtodo para
comparar dos o ms medias, que es necesario porque cuando se quiere
comparar ms de dos medias es incorrecto utilizar repetidamente el contraste
basado en la t de Student. Por dos motivos:

En primer lugar, y como se realizaran simultnea e independientemente
varios contrastes de hiptesis, la probabilidad de encontrar alguno
significativo por azar aumentara. En cada contraste se rechaza la H0 si la t
supera el nivel crtico, para lo que, en la hiptesis nula, hay una probabilidad
a. Si se realizan m contrastes independientes, la probabilidad de que, en la
hiptesis nula, ningn estadstico supere el valor crtico es (1 - a)m, por lo
tanto, la probabilidad de que alguno lo supere es 1 - (1 - a)m, que para valores
de a prximos a 0 es aproximadamente igual a m. Una primera solucin,
denominada mtodo de Bonferroni, consiste en bajar el valor de a, usando en
su lugar a/m, aunque resulta un mtodo muy conservador.

Por otro lado, en cada comparacin la hiptesis nula es que las dos muestras
provienen de la misma poblacin, por lo tanto, cuando se hayan realizado
todas las comparaciones, la hiptesis nula es que todas las muestras provienen
de la misma poblacin y, sin embargo, para cada comparacin, la estimacin
de la varianza necesaria para el contraste es distinta, pues se ha hecho en base
a muestras distintas.

El mtodo que resuelve ambos problemas es el anova, aunque es algo ms que
esto: es un mtodo que permite comparar varias medias en diversas
situaciones; muy ligado, por tanto, al diseo de experimentos y, de alguna
manera, es la base del anlisis multivariante.

EJERCICIO N 1
Una lista de palabras sin sentido se presenta en la pantalla del ordenador
con cuatro procedimientos diferentes, asignados al azar a un grupo de
sujetos. Posteriormente se les realiza una prueba de recuerdo de dichas
palabras, obtenindose los siguientes resultados:

PROCEDIMIENTO 1 PROCEDIMIENTO 2 PROCEDIMIENTO 3 PROCEDIMIENTO 4
5 9 8 1
7 11 6 3
6 8 9 4
3 7 5 5
9 7 7 1
7 4 4
4 4
2
TABLA DE REALIZACION DE EJERCICIO

PROCED. 1 PROCED. 2 PROCED. 3 PROCED.4 TOTAL
Tc
43 42 43 18 146
Nc
8 5 7 6 26
Tc2/nc
231.10 352.8 264.10 54 902
X2
269 364 287 68 988

SST= 902 (146)
2
/26
SST= 902- 819.80
SST= 82.20
SSE= 988-902
SSE= 86



FUENTE DE
VARIACION
SUMA DE
CUADRADOS
GRADOS DE
LIBERTAD
CUADRADO MEDIO
ENTRE LOS GRUPOS
82.20 4-1= 3 27.40
EN GRUPO
86 26-4= 22 3.90
TOTAL
7.03

El valor en la F terica con 3 y 22 grados de libertad a un nivel de confianza
del 95% es 3.05. Por consiguiente se rechaza la hiptesis nula y se concluye
que los cuatro procedimientos de presentacin producen diferencias
significativas.

EJERCICIO N 2
Se quiere evaluar la eficacia de distintas dosis de un frmaco contra la
hipertensin arterial, comparndola con la de una dieta sin sal. Para ello se
seleccionan al azar 25 hipertensos y se distribuyen aleatoriamente en 5
grupos- Al primero de ellos no le suministra ningn tratamiento, al
segundo una dieta con un contenido pobre en sal, al tercero una dieta sin
sal, al cuarto el frmaco a una dosis determinada y al quinto el mismo
frmaco a otra dosis. Las presiones arteriales sistlicas de los 25 sujetos al
finalizar los tratamientos son:
LA TABLA DE ANOVA
LA TABLA DE ANOVA ES: GL SS MS F
FUENTE DE VARIACION
4 2010,64 502,66 11,24
TRATAMIENTO
20 894,4 44,72
ERROR
24 2905,04
TOTAL

GRUPO

1 2 3 4 5
180 172 163 158 147
173 158 170 146 152
175 167 158 160 143
182 160 162 174 155
181 175 170 155 160
Como F=2,87 y 11,25 > 2,87 rechazamos la hiptesis nula y concluimos
que los resultados de los tratamientos son diferentes

EJERCICIO NO. 3
Se tienen las lecturas de hemoglobina de estudiantes varones de 3 aulas de
primero de secundarias en un colegio:

1er Grado A 1er Grado B 1er Grado C
14 16 13
15 17 15
16 15 14
13 14 17
9 8 13
15 12 10
16 14 8




Media m =
14 13.71 12.86 40.57
Tc
98 96 90 284
nc
7 7 7 21

1408 1370 1212 3990









FORMULAS:
Entre grupos Dentro de los grupos



Tc
98 96 90 284


3845.71
nc
7 7 7 21


1408 1370 1212 3990

(

)
2
/N

)

2
/21

Formato General de la tabla de anlisis de la varianza

Fuente de variacin Suma de cuadrados Grados de libertad Cuadrado medio
Entre los grupos
SST K-1 SST/K=MSTR
En los grupos
SSE N-K SSE/N-K=MSR
Total



Fuente de variacin Suma de cuadrados Grados de libertad Cuadrado medio
Entre los grupos
4.95 3-1 4.95/2=2.475
En los grupos
144.29 21-3 144.29/18=8.016
Total

(

)

INTERPRETACIN:

= 0.309, es la funcin de prueba


Con (3-1) y (21-3) grados de libertad = 2 grados de libertad en el
numerador y 18 en el denominador.

, es el valor critico de la distribucin F



Se acepta la hiptesis nula.
Las medias aritmticas son iguales.
EJERCICIO N 4
Un profesor del curso de mercadotecnia pidi a los alumnos de un de sus
grupos que evaluaran su desempeo como excelente, bueno, regular o
deficiente. Un estudiante egresado recopilo las evaluaciones y aseguro a los
estudiantes que el profesor las recibira hasta que las calificaciones del
curso se hubieran enviado a las oficinas de registro. La evaluacin (es decir,
el tratamiento) que cada alumno asigno al profesor se compar con las
calificaciones, que podr ir de 0 a 100 que obtuvo el estudiante en el curso.
A continuacin se presenta la informacin de la muestra existe diferente
entre los promedios de las calificaciones de los alumnos en cada uno de las
cuatro categora de evaluacin? Utilice el nivel de significancia 0.01


CALIFICACIONES DEL CURSO
EXCELENTE BUENO REGULAR DEFICIENTE
94 75 70 68
90 68 73 70
85 77 76 72
80 83 78 65
88 80 74
68 65
65
1. Plantear la hiptesis nula y la hiptesis alternativa



2. Seleccionar el nivel de significancia
Se elige el nivel 0.01
3. Cul es la regla de decisin
Grados de libertad en el numerador = k-1= 4-1=3
Grados de libertad en el numerador= n-k=22-4=18
EXCELENTE BUENO REGULAR DEFICIENTE TOTAL
X



94 8836 75 5625 70 4900 68 4624
90 8100 68 4624 73 5329 70 4900
85 7225 77 5929 76 5776 72 5184
80 6400 83 6889 78 6084 65 4225
88 7744 80 6400 74 5476
68 4624 65 4225
65 4225
349 391 510 414 1664
4 5 7 6 22
30561 30811 37338 28634 127344

4. Calcule SST, SSE Y SS total
SUMA DE CUADRADOS; TOTAL SS total =


127344 -

= 1485.09


SUMA DE CUADRADOS DEBIDOS AL TRATAMIENTO
SST =


SUMA DE CUADRADOS DEL ERROR
SSE = SS total SST
1485.09-890.68 =594.41
5. elabore una tabla de ANOVA

TABLA ANOVA

FUENTE DE
VARIACION
SUMA DE
CUADRADOS
GRADOS DE
LIBERTAD
CUADRADO
MEDIO
F
TRATAMIENTOS SST k-1 SST/(K-1) = MST
MST/MSE
ERROR SSE n-k SSE/(N-K) =MSE

TOTAL SS total n-1



TABLA ANOVA

FUENTE DE VARIACION

SUMA DE CUADRADOS

GRADOS DE LIBERTAD CUADRADO MEDIO F
TRATAMIENTOS

890,68

3 296,89 8,99
ERROR

594,41

18 33,02
TOTAL

1485,09

21
EJERCICIO N 5

Los miembros de un equipo ciclista se dividen al azar en tres grupos que
entrenan con mtodos diferentes. El primer grupo realiza largos recorridos
a ritmo pausado, el segundo grupo realiza series cortas de alta intensidad y
el tercero trabaja en el gimnasio con pesas y se ejercita en el pedaleo de alta
frecuencia. Despus de un mes de entrenamiento se realiza un test de
rendimiento consistente en un recorrido cronometrado de 9 Km. Los
tiempos empleados fueron los siguientes:


A un nivel de confianza del 95% Puede considerarse que los tres mtodos
producen resultados equivalentes? O por el contrario Hay algn mtodo
superior a los dems?



METODO I MEDOTO II METODO III
15 14 13
16 13 12
14 15 11
15 16 14
17 14 11
DESARROLLO
TC
77 72 61 210
NC
5 5 5 15
TC / NC
1185,8 1036,8 744,2 2966,8

1191 1042 751 2984

SST= (TC /NC) - () /N
SST= 2966, 8 (210) / 15
SST= 2966, 8 2940= 26, 8

SSE= - (TC /NC)
SSE= 2984 2966, 8 = 17, 2


FUENTE DE
VARIACION
SUMA DE
CUADRADOS
GRADOS DE
LIBERTAD
CUADRADO
MEDIO
ENTRE GRUPOS
SST K-1
SST/K-1= MSTR
EN LOS GRUPOS
SSE N-K
SSE/N-K= MSE
TOTAL F(MSTR/MSE)

F= (MSTR/MSE)
F= 13, 4 / 1, 43
F= 9, 37
El valor de la F terica con 2 y 12 grados de libertad, a un nivel de confianza
del 95% es 3,89. Por consiguiente se rechaza la hiptesis nula y se concluye
que los tres mtodos de entrenamiento producen diferencias significativas.

ENTRE GRUPOS
26, 8 3-1= 2 13, 4
EN LOS GRUPOS
17, 2 15- 3= 12 1, 43
EJERCICIO 6
Una compaa ofrece el servicio desde el edificio Toledo hasta el aeropuerto metro
(Detroit). El representante de la compaa est considerando dos rutas:
Ruta 1 Us 25
Ruta 2 Intertatal 75
Desea estudiar el tiempo necesario para llegar al aeropuerto por cada uno de estos
caminos y despus comparar resultados. Obtuvo los siguientes datos de muestra de
minuto. Utilizo el nivel de significativa del 0,005
Existe alguna diferencia en la variacin de los tiempos de recorrido de ambas rutas?








US 25 INTERSTATAL 75
52 59
67 60
56 61
45 51
70 56
54 63
64 57
65
408 472

= 880

US 25 INTERSTATAL 75
2704 3481
4489 3600
3136 3721
2025 2601
4900 3136
2916 3969
4096 3249
4225
24266 27982

= 52,248

SST =


SST =51.628,57 880
2
/ 15
SST = 51.628,57 51.628,67
SST = 1,9

SSE =


SSE = 52248 51.628,57
SSE = 619,43


FUENTE
VARIACION
SUMA DE
CUADRADOS
GRADOS DE
LIBERTAD
CUADRADO
MEDIO
Entre los grupos
SST 1,90 2 - 1 = 1 1,9
En los grupos
SST 619,43 15 - 2 = 13 47,64


F = 0,03

Valor Critico 4,67: Se rechaza la hiptesis nula debido a que el valor critico
es mayor al valor F .












ANGULO CERON DIANA
BERNAL CONSUEGRA CHRISTIAN
CHAVEZ ESTRELLA VALERIA
CHOEZ PLUAS KERLY
GALEAS VIVANCO MARIA
SANCHEZ PALACIOS MARIA FERNANDA

S-ar putea să vă placă și