Sunteți pe pagina 1din 12

Universidad de Oriente

Ncleo Bolvar
Escuela de Ciencias de la Tierra
Departamento de Ingeniera Industrial
Estadstica 2
Seccin 02

ANALISIS DE VARIANZA

Profesora:
Mariel Mora

Integrantes:
Jimnez Roberto C.I. 22.814.090

Ciudad Bolvar, Julio de 2014

ndice.

Introduccin............................................................................................................ 3
Anlisis de Varianza:................................................................................................. 4

Clculo de la varianza entre las medias mustrales:..................................................4

Clculo de la Varianza dentro de las muestras:........................................................5

Prueba de hiptesis F: clculo e interpretacin del estadstico F...................................6

Ejemplo de Anlisis de Varianza:.........................................................................6

Conclusin............................................................................................................ 10
Bibliografa........................................................................................................... 11

Introduccin.

En estadstica, el anlisis de la varianza (ANOVA, Analysis Of Variance, segn terminologa


inglesa) es una coleccin de modelos estadsticos y sus procedimientos asociados, en el cual la
varianza est particionada en ciertos componentes debidos a diferentes factores (variables).
El anlisis de varianza lo vamos a utilizar para verificar si hay diferencias estadsticamente
significativas entre medias cuando tenemos ms de dos muestras o grupos en el mismo
planteamiento.
El anlisis de varianza sirve para comparar si los valores de un conjunto son
significativamente distintos a los valores de otro o ms conjuntos de datos. El procedimiento para
comparar estos valores est basado en la varianza global observada en los grupos de datos
numricos a comparar. Tpicamente, el anlisis de varianza se utiliza para asociar una probabilidad
a la conclusin de que la media de un grupo de puntuaciones es distinta de la media de otro grupo
de puntuaciones

Anlisis de Varianza:
El anlisis de varianza es una tcnica que permite probar la significancia de las diferencias
entre ms de dos medias mustrales. Usando el anlisis de varianza, se pueden hacer inferencias
acerca de si nuestras muestras se tomaron de poblaciones que tienen la misma media.
El anlisis de varianza est basado en una comparacin de dos estimaciones diferentes de la
varianza,

, de nuestra poblacin total. En dado caso, se puede calcular una de esas

estimaciones examinando la varianza entre medias mustrales. La otra estimacin de la varianza de


la poblacin est determinada por la variacin dentro de las muestras mismas. Entonces
comparamos estas dos estimaciones de la varianza de la poblacin. Como ambas son estimaciones
de

, deben tener un valor aproximadamente igual, esta ltima afirmacin se establece como

una hiptesis nula, siendo la hiptesis alternativa el resultado opuesto a esta afirmacin. Entonces,
los tres pasos del anlisis de varianza son:
1. Determinar una estimacin de la varianza de la poblacin a partir de la varianza entre las medias
de las muestras.
2. Determinar una segunda estimacin de la varianza de la poblacin a partir de la varianza dentro
de las muestras.
3. Comparar estas dos estimaciones. Si su valor es aproximadamente igual, se acepta la hiptesis
nula.

Clculo de la varianza entre las medias mustrales:

El paso 1 en el anlisis de varianza indica que se debe obtener una estimacin de la varianza de
la poblacin a partir de la varianza entre las medias de las muestras. En lenguaje estadstico, esta
estimacin se conoce como varianza entre columnas.

s 2=

( x x )2

Varianza de la muestra

n1

Ahora bien, como estamos trabajando con medias mustrales y una gran media, sustituyamos
por x,

por

x , y k (el nmero de muestras) por n, para obtener una frmula para la

varianza entre las medias de las muestras:

s 2x =

( x x )2
k1

Varianza entre medias mustrales

De la frmula para derivar el error estndar de la media:

x =

Se puede simplificar:
2

= x n

Para el problema de los mtodos de capacitacin, no tenemos toda la informacin necesaria


para utilizar esta ecuacin y encontrar

2
2 . Especficamente, no conocemos x . Sin embargo,

podramos calcular la varianza entre las medias de las muestras,

s 2x en lugar de 2x

s x . As, por qu no sustituir

y calcular una estimacin de la varianza de la poblacin? Esto da:

^ 2=s 2x n=

n( x x )
k1

Quedando entonces:

^ 2b =

n j( x j x )2
k1

; Donde:

^ 2b Nuestra primera estimacin de la varianza de la poblacin, basada en la varianza entre las


medias de las muestras (la varianza entre columnas)

nj Tamao de la j-sima muestra

x j Media muestral de la j-sima muestra


x Gran media
K nmero de muestras

Clculo de la Varianza dentro de las muestras:

El paso 2 requiere una segunda estimacin de la varianza de la poblacin, basada en la


varianza dentro de las muestras. En trminos estadsticos, se le puede llamar varianza dentro de
columnas.
2
n( x x )

s=
2

n1

En trminos estadsticos, podemos obtener una mejor estimacin de la varianza de la poblacin


mediante un promedio ponderado de las varianzas de muestra. La frmula general para esta segunda
estimacin de

2 es:

nj1 2
^ 2w = (
)s
nT k j

Donde:

^ 2w Nuestra segunda estimacin de la varianza de la poblacin, basada en las varianzas dentro de


las muestras (la varianza dentro de columnas)

nj Tamao de la j-sima muestra

s 2j Varianza muestral de la j-sima muestra


k

Nmero de muestras

nT = nj Tamao de la muestra total

Prueba de hiptesis F: clculo e interpretacin del estadstico F.

En el paso 3 se comparan estas dos estimaciones de la varianza de la poblacin mediante el


clculo de su cociente como sigue:

F=

^ 2
Varianza entre columnas
= 2b
Varianza dentro de columnas ^ w

Como resultado, el denominador y el numerador deben ser aproximadamente iguales si la


hiptesis nula es verdadera. Cuanto ms cercano a 1 est el cociente F, ms nos inclinamos a
aceptar la hiptesis nula. Al contrario, conforme el cociente F crece, le inclinaremos ms a rechazar
la hiptesis nula y a aceptar la alternativa.
Si la hiptesis nula es verdadera, entonces el estadstico F tiene una distribucin de muestreo
especfica. Al igual que las distribuciones t y ji-cuadrada, la distribucin F es en realidad una
familia completa de distribuciones. Note que cada una est identificada por un par de grados de
libertad, a diferencia de las distribuciones t y ji-cuadrada, que solamente tienen un valor para el
nmero de grados de libertad. La primera cantidad se refiere a los grados de libertad del numerador
del cociente F; la segunda, a los grados de libertad del denominador.
La distribucin F tiene una sola moda. La forma especfica de una distribucin F depende del
nmero de grados de libertad tanto del numerador como del denominador del cociente F. Pero, en
general, la distribucin est sesgada a la derecha y tiende a hacerse ms simtrica conforme
aumenta el nmero de grados de libertad en el numerador y el denominador.
6

Grados de libertad en el numerador=(numero de muestras1)


Grados de libertad en el denominador = (nj1)=nT k

Ejemplo de Anlisis de Varianza:

Los datos siguientes indican el nmero de solicitudes de pago de seguro procesadas


diariamente por un grupo de cuatro empleados de aseguradoras observados durante cierto nmero
de das. Pruebe la hiptesis de que las solicitudes medias de los empleados por da son las mismas.
Utilice un nivel de significancia de 0.05.
Empleado 1
Empleado 2
Empleado 3
Empleado 4

15
12
11
13

17
10
14
12

14
13
13
12

12
17
15
14

12
10

Planteamiento de la hiptesis.

H 0 : 1=2=3= 4
H 1 : 1 , 2 , 3 , 4 no son todas iguales

Medias Mustrales:
Empleado 1
15
17
14
12

Empleado 2
12
10
13
17

Empleado 3
11
14
13
15
12

58
4
58/4 = 14.5

52
4
52/4 = 13

65
5
65/5 = 13

X
Gran Media:

4
4
5
6
X =
14.5 +
13 +
13 +
11.7 =12.9
19
19
19
19

)(

)(

)(

Estimacin de la Varianza entre columnas:


7

Empleado 4
13
12
12
14
10
9
70
6
70/6 = 11.7

^ 2b =

n j ( x j x ) 2
k1
2

X X

( X X )

14.5

12.9

1.6

2.56

10.24

13

12.9

0.1

0.01

0.04

13

12.9

0.1

0.01

0.05

11.7

12.9

-1.2

1.44

8.64

n ( X X )

n ( X X ) =18.97
18.97
2
^ b =
=6.323
41

Estimacin de la Varianza dentro de las columnas:


2
^ w =

n j1 2
s
ntk j

( )

Empleado 1

Empleado 2

X =14.5

X =13

n=4

X X

X X

0.25
6.25
0.25
6.25

12 13 = -1
10 13 = -3
13 13 = 0
17 13 = 4

15 14.5 = 0.5
17 14.5 = 2.5
14 14.5 = -0.5
12 14.5 = -2.5

( X X )

( X X )
s=
2

n1

( X X )

( X X ) =
s=

13
=
=4.33
41

1
9
0
16

( X X )

=13
2

n1

Empleado 3

= 26

26
=8.67
41

Empleado 4

X =13

X =11.7

n=5

X X

n=4

2
( X X )

n=6

X X

2
( X X )

( X X )

11 13 = -2
14 13 = 1
13 13 = 0
15 13 = 2
12 13 = -1

4
1
0
4
1

( X X )

( X X )
s=

n1

13 11.7 = 1.3
12 11.7 = 0.3
12 11.7 = 0.3
14 11.7 = 2.3
10 11.7 = -1.7
9 11.7 = -2.7

1.69
0.09
0.09
5.29
2.89
7.29

( X X )

=10

( X X )
s=

10
=
=2.5
51

n1

= 17.34

17.34
=3.468
61

41
41
51
61
([ 194
) 4.33]+[( 194
) 8.67 ]+[( 194
) 2.5]+[( 194
) 3.468]

^ 2w =

^ 2w =4.42

Estadstico F:

^ 2b 6.323
F= 2 =
=1.43
^ w 4.42

Grados de Libertad del numerador:

V 1=k 1=41=3

Grados de libertad del denominador:

V 2=nT k=204=16

Tabla F:

No Rechazamos la Hiptesis nula. La productividad de los empleados no es significativamente


diferente

Conclusin.

1.43

3.29
El anlisis de la varianza (o Anova: Analysis of variance) es un mtodo para comparar dos o
ms medias. Es necesario porque cuando se quiere comparar ms de dos medias es incorrecto
utilizar repetidamente el contraste basado en la t de Student.
En resumen, el anlisis de varianza sirve para comparar si los valores de un conjunto de datos
10

numricos son significativamente distintos a los valores de otro o ms conjuntos de datos. El


mtodo para comparar estos valores est basado en la varianza global observada en los grupos de
datos numricos a comparar. Tpicamente, el anlisis de varianza se utiliza para asociar una
probabilidad a la conclusin de que la media de un grupo de puntuaciones es distinta de la media de
otro grupo de puntuaciones.
El ANOVA parte de algunos supuestos que han de cumplirse:

La variable dependiente debe medirse al menos a nivel de intervalo.


Independencia de las observaciones.
La distribucin de la variable dependiente debe ser normal.
Homocedasticidad: homogeneidad de las varianzas.

Bibliografa.
LEVIN, Richard I.; RUBIN, David S. Estadstica para Administracin y Economa. Sptima
Edicin. Pearson Educacin. Mxico 2004.
11

12

S-ar putea să vă placă și