Sunteți pe pagina 1din 23

Análisis de Varianza

Clase 3
Dos muestras o más
• Varias pruebas de t-student

• Se pierde control del alfa.

• Prueba diseñada para comparar


2 o más muestras.
ANDEVA de una vía
• Prueba de hipótesis
– determina si dos o más muestras son
extraídas de una misma población
• Se utiliza para comparar dos o
más promedios
• Se analiza el efecto de un factor
sobre la variable respuesta
(continua)
Nomenclatura
• Grupos: Estos son grupos de
observaciones en un grupo,
condición o tratamiento. “a”
• Dentro de grupos: El número de
individuos dentro de cada grupo
(nij): individuo “j” en grupo “i”.
• Hay estimadores para cada grupo,
y para el total de observaciones.
n11 n21
n31
n12
n22

n32

Grupo 1 Grupo 2 Grupo 3


sxx11 sxx22 sxx33

sxx
Partición de
varianzas.
• Calcular varianzas entre grupos y
dentro de grupos
• “Dentro grupos” un grupo
• “Entre grupos” promedios de cada
grupo como una observación
i=a j =n
σD =
1
∑∑ ( x − x ) 2

a ( n − 1) i =1 j =1
ij i

i=a
n
σE =
( a − 1) ∑(x
i =1
i − x) 2
Hipótesis.

• El ANDEVA prueba las hipótesis:


– Ho: µ1 = µ2 = µ3 =…= µa
– HA: µ1 ≠ µ2 ≠ µ3 ≠ … ≠ µa

• Lo que se calculan son varianzas


• Para comprender el por qué uno
estudia varianzas para
comparar promedios:
TOTAL DENTRO ENTRE

(x
ij − x ) = ( xij − xi ) + ( xi − x )
x1 x2
x
• Factor no tiene efecto
– diferencias ‘entre grupos’ se deben al
azar
– Error más importante que efecto del
factor

• Esta varianza aleatoria es similar


en magnitud a la observada
dentro de cada grupo

• σ ≈σ
• Varianza ‘entre grupos’ mayor que
varianza dentro de grupos:
– muestras provienen poblaciones
distintas

• Caso contrario
– todos los datos pertenecen a la
misma población
– µ.
ENTRE

x1 x2
x
DENTRO
Varianza y suma de
cuadrados:
i =n

∑( x −x )
2
i
i =1
s =
2

n −1
i =n
SS = ∑( xi − x ) =
( ∑x )
2

∑x
2 i
2
i −
i =1 n

s2 =
SS
=
1 
∑xi2 −
( ∑ xi ) 2


n −1 n −1  n 
 
Suma de Cuadrados: SS
• Antes de calcular varianza se
calcula SS
• Las SS y los g.l. son aditivos:
• SST = SSE + SSD
• νT = νE + νD

• Existen fórmulas para SS y g.l.

• La varianza= SS /grados de
SSTotales.

a n1
SST = ∑∑ x − C 2
ij
i =1 j =1

C=
( ∑∑ x ) ij
2

N
υ = N −1
SSEntre

  ni 2 
  ∑ xij  
a  j =1 
SS E = ∑     −C
i =1 ni 
 
 

υ = a −1
SSDentro

SSD = SST - SSE

υ =N −a
Cuadrados Medios

• En ANDEVA varianza se denomina:


– Cuadrados Medios
– Mean Square (MS)

• Varianza entre y dentro


– Relación de varianzas
– Razón: F
Prueba F
• Prueba estadística compara dos
varianzas
–F
– Fisher
– Desviación significativamente de 1.

MSEntre
F=
MSDentro
Prueba hipótesis
• F calculado se comparar con
distribución teórica
– ¿Difiere de 1?

• Distribución dos grados de


libertad
– numerador y denominador

• Fcalculado > valor crítico F α, (a-1); (N-a)


Resultados.
• Resultados SIEMPRE se resumen en
tabla:
Fuente
variación g.l. SS MS F p

MSentre
Entre grupos a–1 Σ {[ (Σx)2 / n] – C} SS/g.l α
MSdentro.
Dentro grupos N-a Total - entre SS/g.l.

ΣΣx2 – C
Total N–1
Ejemplo y Ejercicio

Dieta 1 Dieta 2 Dieta 3 Dieta 4


60.8 68.7 102.6 87.9
57.0 67.7 102.1 84.2
35.0 74.0 100.2 83.1
58.6 66.3 96.5 85.7
61.7 69.8 90.3
Modelo lineal

S-ar putea să vă placă și