Sunteți pe pagina 1din 21

ANALISIS DE VARIANZA

FQIQIA-UNMSM
NOV.2016

OBJETIVOS
ANALISIS DE VARIANZA
Permite comparar dos varianzas poblacionales para
probar la hiptesis de que la varianza de una poblacin
es igual a la varianza de otra poblacin.
Permite comparar simultneamente varias medias
poblacionales.La comparacin simultanea de varias
medias poblacionales se denomina Analisis de varianza
(ANOVA).

La distribucin F

La distribucin de probabilidad que se utilizara para estas


pruebas se denomina Distribucion F de Fisher ( en honor a Sir
Ronald Fisher).
CARACTERISTICAS
Existe una familia F , un miembro especifico de la familia queda
determinado por 2 parmetros, los grados de libertad en el
numerador y los grados de libertad en el denominador.
La distribucin F es continua puede tomar una cantidad infinita
de valores entre 0 e infinito.
La distribucin F no puede ser negativa el menor valor que
puede tomar es cero.
La distribucin F es positivamente sesgada conforme los grados
de libertad aumenta
La distribucin F es asinttica, conforme los valores de x
aumenta la curva se aproxima al eje x pero nunca lo toca.

Comparacion de 2 variables
poblacionales
Se
utiliza la distribucin F
La hiptesis nula de que la varianza de una poblacin es igual a
la variacin de otra poblacin normal.
=
Para realizar la prueba se toma de una poblacin una muestra
n1 y una muestra de n2 observaciones de una segunda
poblacin
Valor estadstico de prueba para la comparacin de 2 varianzas.

S1 y S2 con las desviaciones muestrales respectivas.


El estadstico de prueba F sigue la distribucin con n1-1
y n2-1 grados de libertad.
Para reducir el tamao y la variedad de las tablas F , la
varianza muestral mas grande se pone en el numerador
, por lo tanto F siempre ser mayor a 1.

ejemplo
Se tiene 2 mtodos de anlisis en un laboratorio y cada
uno requiere un tiempo determinado, se quiere probar
si las varianzas del mtodo 1 son diferentes a las del
mtodo 2. Se recolectan datos y son los siguientes:
tiempo(SEG)
M1
52
67
56
45
70
54
64
M2

59

S1=8,9947
S2=4,3753

60

61

51

56

63

57

65


Prueba de dos colas
En el numerador va el que tiene mayor valor.
F=/ = 4,23
Calculo del valor critico:
Fc= (gl numerador, gl denominador)0,05
Fc=(n1-1,n2-1)0,05

Fc=(7-1,8-1)0,05= Fc(6,7)0,05 = 3,87

Regla: si F > Fc entonces se rechaza Ho


4,3>3,87
Rechazar Ho y aceptar H1 , hay diferencia significativa
entre las varianzas de los tiempos de anlisis en los
mtodos 1 y 2.
Ejemplo 2
Se emplean dos mtodos para la fabricacin de un
equipo
M1
9
2
10
M2
promedio
desv.muestral
num.obs
8,5
1,5
10

Es posible concluir que hay mas variacin en el


metodo1 que el metodo2?

F=/= 1,7
Fcritico = F( 9,9)0,05 = 3,18
F<Fc entonces aceptamos Ho y rechazamos H1

Ejercicios
1.- cual es el valor de F para una muestra de 6
observaciones en el numerador y 4 en el denominador,
utilice una prueba de 2 colas y significacion de 0,10.
2.- aplicando una prueba de 1 cola y =0,01 , cual es el
valor critico de F para una muestra de 4 observaciones
en el numerador y 7 en el denominador?
3.- se dan las siguientes hiptesis

En una muestra aleatoria de 8 observaciones de la primera


poblacin, la desviacin estndar fue 10.En una muestra
aleatoria de 6 observaciones de la segunda observacin , la
desviacin estndar fue 7 , a nivel de significancia de
0,02 existe diferencia entre la variacin de ambas poblaciones?
4.- Se dan las siguientes hiptesis:

En una muestra aleatoria de 5 observaciones de la primera


poblacin la desv. Estandar fue 12.En una muestra aleatoria de
7 observaciones de la segunda poblacin la desviacin
estndar fue 7. Al nivel de significacin de 0,01 hay mas
variacin en la primera po blacion?

5.-la tasa media de rendimiento de una muestra de 10


acciones petroleras fue 12,6% con desviacin estndar
de 3,9.La tasa media de rendimiento en una muestra de
8 acciones bancarias fue 10,9% con una desviacin
estndar de 3,5 . A nivel de significancia de 0,05 es
posible concluir que hay mas variacin en las acciones
petroleras?

Analisis de varianza (ANOVA)


comparacin de 3 o mas medias
poblacionales.

Suposiciones:
1.-Las poblaciones estn distribuidas normalmente
2.-Las poblaciones tienen desviaciones estndar
iguales.
La muestras son independientes.
Se utiliza F como estadstico de prueba.
Ventajas de utilizar ANOVA frente a la comparacin de 2
a 2 de prueba de diferencias entre medias.

Supongamos que se quiere comparar 4 mtodos de


experimentacin
A B C D , si se quisiera comparar 2 a 2 con los mtodos
aprendidos se tendran que hacer 6 comparaciones si cada uno
de estas comparaciones tiene un nivel de significacin de 0,05
entonces la probabilidad de una decisin estadstica correcta
es de 0,95. entonces al asumir que estn son independientes
la probabilidad conjunta ser:
P(todas correctas)=(0,95)(0,95)(0,95)(0,95)(0,95)(0,95)=0,735
Luego la probabilidad de cometer un error de tipo 1 ser
1-0,735 =0,265
Que significa que la probabilidad de cometer un error de tipo 1
ha aumentado de 0,05 a 0,265 lo cual lo descalifica como
mtodo para probar este tipo de hiptesis.

Ejemplo de aplicacin:
Un granjero quiere probar cual de los tres abonos de
marcas A , B , C es el mejor para el cultivo de cierta
planta.Para lo cual decide hacer el siguiente
experimento :
Divide el campo de cultivo en 12 parcelas de igual
tamao despus siembra la semilla al mismo tiempo y
de la misma manera . Luego aplica aleatoriamente el
abono A a 4 parcelas , el abono B a otras 4 y el abono C
a las cuatro restantes , al final del ciclo de cosecha
registra el numero de kilos producidos en cada parcela ,
Abono A
Abono B
Abono C
en este ejemplo hay tres experimentos que arrojan los
55
66
47
siguientes resultados:
54

76

51

59

67

46

56

71

48

Hay alguna diferencia en el numero promedio de kilos


producido por el tipo de abono ?
Para resolver este tipo de problemas nos planteamos las
siguientes hiptesis:
Ho: 1=2=3

H1: Los promedios de la produccin no son todos


iguales
El mtodo usado ser la PRUEBA ANOVA.

Tabla anova

SS Total=

SSE=SS total-SST

Calculos necesarios

clculos
SS total= 41350 696^2/12
SS total= 1082
SST=992
SSE=SS total-SST
SSE=1082-992=90

Al insertar estos valores en una tabla ANOVA tenemos:

Calculo del valor critico


Grados de libertad en el numerador
K-1= 3-1=2
Grados de libertad en el denominador
n-K=12-3=9
A un nivel de significancia 0,01
Fc(2,9)0,01 = 8,02
el valor calculado de F es 49,6 que es mayor que el
valor critico 8,02 por lo tanto se rechaza la hiptesis
nula y si hay diferencias entre los promedios de semillas
producidas debidas a los diferentes abonos.

S-ar putea să vă placă și