Sunteți pe pagina 1din 4

El anlisis de Varianza (ANOVA): es un mtodo para probar la igualdad de dos o ms

medias de poblacin analizando varianzas de muestras




Panorama General

. El mtodo que usaremos se basa en un anlisis de las varianzas de muestra.

El ANOVA se usa en aplicaciones como 'las siguientes:

1- Si medimos el nivel de cotinina (un indicador de presencia de nicotina) en tres
diferentes grupos de personas (Como fumadores, no fumadores expuestos a humo
de tabaco ambiental y no fumadores expuestos), -podemos realizar pruebas para
determinar si tienen o no el mismo nivel.
2- Un ingeniero en ecologa aplica una medida correctiva a diferentes empresas,
podemos realizar pruebas para determinar si las empresas obtienen puntajes medios
diferentes.


La distribucin F

La distribucin de probabilidad que se utiliza en este captulo es la distribucin F. Recibi
este nombre en honor a sir Ronald Fisher, uno de los fundadores de la estadstica moderna.
Esta distribucin de probabilidad se usa como estadstica de prueba en varias situaciones.
Se emplea para probar si dos muestras provienen de poblaciones que poseen varianzas
iguales, y tambin se aplica cuando se trata de comparar simultneamente varias medias
poblacionales. La comparacin simultnea de varias medias poblacional se conoce como
anlisis de varianza (ANOVA). En ambas situaciones, las poblaciones deben ser normales y
los datos tener al menos la escala de los intervalos.

Cules son las caractersticas de la distribucin F?

1. Existe una "familia" de distribuciones F. Un miembro especfico de la familia
determina por dos parmetros: los grados de libertad en el numerador y en el de
denominador. La forma de la distribucin se ilustra mediante la grfica siguiente.
Existe una distribucin F para la combinacin de 29 grados de libertad en el
numerador y 28 el denominador. Existe otra distribucin F para 19 grados en el
numerador y 6 en el denominador. Observe que la forma de las curvas cambia a
medida que lo hacen los grados de libertad.
2. La distribucin F es una distribucin continua.
3. F no puede ser negativa.
4. La distribucin F tiene un sesgo positivo.
5. A medida que aumentan los valores, la curva se aproxima al eje X, pero nunca lo
toca.

1 Comparacin de dos varianzas poblacionales

En esta seccin se utiliza la distribucin F para probar la hiptesis de que la varianza de una
poblacin normal es igual a la varianza de otra poblacin normal. As, esta prueba es til
para determinar si una poblacin normal tiene una mayor variacin que otra. Los ejemplos
siguientes ilustran el uso de esta prueba:

1- Se calibran dos mquinas para producir barras de acero de la misma longitud. Por
lo tanto, las barras deben tener la misma longitud media. Se desea asegurar que,
adems de tener la misma longitud media, tienen una variacin similar.
2- La tasa media de infecciones de dos tipos de gusanos puede ser la misma, pero
puede haber mayor variacin en un tipo que en otro. Una muestra de diez
infecciones de gusanos conocidos y otros diez gusanos no conocidos, revelar la
misma tasa de infeccin, pero es probable que haya mayor variacin en la tasa de
infeccin de gusanos conocidos.

Del mismo modo, la distribucin F se usa para validar suposiciones de ciertas pruebas
estadsticas. Como ejemplo, recordar que la prueba t que se describi anteriormente se
emplea para determinar si las medias de dos poblaciones independientes son diferentes.
Para emplear esa prueba, es necesario suponer que las dos varianzas de la poblacin son
iguales.
Independientemente de que se desee determinar si una poblacin tiene mayor variacin que
otra, o bien para validar una suposicin para una prueba estadstica, primero se establece la
hiptesis nula. En este caso, la hiptesis nula es que la varianza de un poblacin normal,
2
1
s es igual a la varianza de la otra poblacin normal,
2
2
s . La hiptesis alterna podra ser
que las varianzas fueran distintas. Esta prueba de hiptesis se escribe:

2
2
2
1
2
2
2
1

: Ha
: o H




Para realizar la prueba, se selecciona una muestra aleatoria de n, observaciones de una
poblacin y una muestra de n
2
observaciones de la segunda poblacin. La estadstica de
prueba es,
2
2
2
1
s
s
, donde
2
1
s y
2
2
s son las respectivas varianzas muestrales. S la hiptesis
nula es verdadera
2
2
2
1
: o H el estadstico de prueba sigue la distribucin F con ,
n
1
-1 y n
2
- 1 grados de libertad. A fin de reducir el tamao de la tabla de valores crticos, la
mayor varianza muestral se coloca en el numerador; por lo tanto, el valor F de la tabla
siempre es mayor a 1.00. As, el valor crtico de la cola superior es el nico que se requiere.
El valor crtico de F se halla dividiendo a la mitad el nivel de significancia (/2) y luego
haciendo referencia a los nmeros apropiados de los grados de libertad en la tabla.
Un ejemplo ayudar a ilustrar.

Ejemplo 1:
Taxi 20 Negro ofrecen un servicio de transporte desde el edificio de rectora, al
aeropuerto. Liliana, gerente, considera dos rutas. Una es por la carretera a palestina y la
otra por la Av. Juan Pablo. Liliana desea estudiar el tiempo que se requiere para llegar al
aeropuerto utilizando ambas rutas y luego comparar los resultados. Para ello, recolect los
siguientes datos de muestra. Utilizando el nivel de significancia de 0.10, existe diferencia
en la variacin en los tiempos de recorrido utilizando las dos rutas?

Ruta Tiempo Medio
(minutos)
Desviacin estndar Tamao de la
muestra
Palestina 56 12 7
Juan Pablo 58 5 8


Solucin
Liliana observ que los tiempos medios parecen ser muy similares, pero hay mayor
variacin, medida por la desviacin estndar, en la ruta Palestina que por la Av. Juan Pablo.
Esto en cierto modo es consecuente, con el conocimiento que tiene Liliana de las dos rutas;
la ruta Palestina tiene ms semforos, en tanto que la Av. Juan Pablo es una carretera mas
libre Sin embargo, la Av. Juan Pablo es varias millas ms larga. Es importante que el
servicio que se ofrece sea oportuno y consistente, por lo que decide realizar una prueba
estadstica para determinar si existe una diferencia real en la variacin en ambas rutas.
Se emplear el procedimiento habitual de prueba de hiptesis de cinco pasos.
Paso 1: Se comienza estableciendo las hiptesis nula y alterna. La prueba tiene dos colas,
porque se busca una diferencia en la variacin en ambas rutas, No se trata de demostrar que
una ruta tiene una mayor variacin que la otra.
2
2
2
1
2
2
2
1

: Ha
: o H

Paso2. Se selecciona el nivel de significancia de 0.10
Paso3: El estadstico de prueba apropiada es
2
2
2
1
s
s
que sigue la distribucin F cuando Ho
es verdadera.
Paso 4: El valor crtico se obtiene con base en la tabla. Debido a que se utiliza una prueba
de dos colas, el nivel de significancia es 0.05, que se halla por /2 = 0. 1 0/2 = 0.05.
Existen n
1
- 1 = 7 - 1 = 6 grados de libertad en el numerador y n
2
- 1 = 8 - 1 = 7 grados de
libertad en el denominador. Para encontrar el valor critico, hay que moverse
horizontalmente por la parte superior para el nivel de significancia de 0.05 a 6 grados de
libertad en el numerador. Luego se baja por esa columna hasta el valor crtico que se
encuentra en la fila de 7 grados de libertad en el denominador. El valor crtico es 3.87. Por
lo tanto, la regla de decisin es: si la relacin de las varianzas de la muestra,
2
2
2
1
s
s
es
mayor a 3.87, la hiptesis nula se rechaza.

Paso 5: Determine el valor estadstico de prueba tomando la relacin de las dos varianzas
muestrales.

PRUEBA PARA VARLANZAS IGUALES
2
2
2
1
S
S
F
El valor calculado de la estadstica F es 5.76, que se encuentra por

76 . 5
5
12
2
2
2
2
2
1

S
S
F
Se rechaza la hiptesis nula y se acepta la alternativa. Se concluye que existe una
diferencia en las variaciones en el tiempo de recorrido en ambas rutas.

Como se observ, la prctica habitual es determinar la razn F colocando en el numerador
la mayor de las dos varianzas. Esto obligar a la razn F a ser mayor que 1. 00. Y esto
permite utilizar siempre la cola superior, o derecha, de la estadstica F, evitando con ello la
necesidad de tablas ms extensas de F.
Surge una pregunta lgica respecto de las pruebas de una cola. Por ejemplo, en el problema
previo, suponga que se sospechara que la varianza de los tiempos utilizando la ruta de
Palestina es mayor que la varianza de los tiempos sobre la ruta de la Av. Juan Pablo. Las
hiptesis nula y alternativa se estableceran como:

2
2
2
1
2
2
2
1

: Ha
: o H


La estadstica de prueba se calcula como
2
2
2
1
s
s
a razn F ser mayor que 1.00, de modo
que es posible utilizar la cola superior de la distribucin F Bajo estas condiciones no es
necesario dividir a la mitad el nivel de significancia. Debido a que la tabla slo da los
niveles de significancia 0.05 y 0.01, se est limitado a esos niveles para las pruebas de una
cola 0.10 y 0.02 para las pruebas de dos colas, a menos que se consulte una tabla ms
completa.

S-ar putea să vă placă și