Sunteți pe pagina 1din 9

TALLER ANOVA

PRESENTADO POR:
JEISSON DAVID OLMOS ACEVEDO - 916042

UNIVERSIDAD NACIONAL DE COLOMBIA


SEDE MANIZALES
FACULTAD DE ADMINISTRACIÓN
ADMINISTRACIÓN DE SISTEMAS INFORMÁTICOS
2019
Supongamos que usted es un nutriólogo a quien se le ha pedido determine si existe
una diferencia en el contenido de azúcar de las tres principales

marcas de cereal para el desayuno (A, B y C). Para evaluar la cantidad de azúcar
que contienen los cereales, usted selecciona una muestra aleatoria de seis
paquetes de cada marca y lleva a cabo un examen químico del contenido de azúcar
de cada uno. Así midió los siguientes gramos de azúcar:

CEREAL PARA EL DESAYUNO


A B C
1 7 5
4 5 4
3 3 4
3 6 5
2 4 7
5 7 8

Creamos los tres vectores con las respuestas de medida de azucar, los
cuales representan las tres poblaciones.
 cerealA<-c(1,4,3,3,2,5)
 cerealB<-c(7,5,3,6,4,7)
 cerealC<-c(5,4,4,5,7,8)

VERIFICACIÓN DE LOS SUPUESTOS DE NORMALIDAD


 shapiro.test(cerealA)

Shapiro-Wilk normality test

data: cerealA
W = 0.98176, p-value = 0.96

 shapiro.test(cerealB)

Shapiro-Wilk normality test

data: cerealB
W = 0.91994, p-value = 0.505
 shapiro.test(cerealC)

Shapiro-Wilk normality test

data: cerealC
W = 0.86337, p-value = 0.201

VERIFICACIÓN DE LOS SUPUESTOS DE HOMOCEDASTICIDAD o varianza


constante
 var.test(cerealA,cerealB)

F test to compare two variances

data: cerealA and cerealB


F = 0.75, num df = 5, denom df = 5, p-value = 0.7599
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.1049482 5.3597864
sample estimates:
ratio of variances
0.75

 var.test(cerealA,cerealC)

F test to compare two variances

data: cerealA and cerealC


F = 0.74074, num df = 5, denom df = 5, p-value = 0.75
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.1036526 5.2936162
sample estimates:
ratio of variances
0.7407407

 var.test(cerealB,cerealC)

F test to compare two variances

data: cerealB and cerealC


F = 0.98765, num df = 5, denom df = 5, p-value = 0.9895
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.1382034 7.0581549
sample estimates:
ratio of variances
0.9876543

Obtención de la Tabla ANOVA


 cereal<-c(1,4,3,3,2,5,7,5,3,6,4,7,5,4,4,5,7,8)
 metodo<-
c("A","A","A","A","A","A","B","B","B","B","B","B","C","C","C","C","C","C")

Obteniendo las medias y sd de cada población


tapply(cereal, metodo, mean)
tapply(cereal, metodo, sd)

> tapply(cereal, metodo, mean)


A B C
3.000000 5.333333 5.500000
> tapply(cereal, metodo, sd)
A B C
1.414214 1.632993 1.643168
También es útil graficar la población estratificada por el factor:
boxplot(cereal~metodo)
Las hipótesis que se van a contrastar son:
H0: μA = μB= μC
H1: Al menos una media es diferente

 anova<-aov(cereal~metodo)
anova
Call:
aov(formula = cereal ~ metodo)

Terms:
metodo Residuals
Sum of Squares 23.44444 36.83333
Deg. of Freedom 2 15

Residual standard error: 1.567021


Estimated effects may be unbalanced

 summary(anova)

Df Sum Sq Mean Sq F value Pr(>F)


metodo 2 23.44 11.722 4.774 0.0249 *
Residuals 15 36.83 2.456
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Un investigador realiza un experimento para determinar si la pérdida del sueño
afecta la capacidad para mantener constante la atención. Quince individuos son
divididos de manera aleatoria entre los siguientes tres grupos de 5 sujetos cada uno:
el grupo 1, que duerme de manera normal (de 7 a 8 horas); el grupo 2, que no
duerme durante 24 horas, y el grupo 3, que no duerme durante 48 horas. A los tres
grupos se le somete a la misma prueba de percepción auditiva, la cual consiste en
hacerlos oír tonos de medio segundo a intervalos irregulares durante una hora. En
ciertas ocasiones, un tono es ligeramente más corto que los demás. La tarea del
sujeto consiste en detectar los tonos más cortos. Así se observaron los siguientes
porcentajes de percepciones correctas:

ANÁLISIS DE VARIANZA
sueño normal sin dormir 24 horas sin dormir 48 horas
85 60 60
83 58 48
76 76 38
64 52 47
75 63 50

Creamos los tres vectores con las respuestas de las pruebas , las cuales
representan las tres poblaciones.
 pruebaA<-c(85,83,76,64,75)
 pruebaB<-c(60,58,76,52,63)
 pruebaC<-c(60,48,38,47,50)
VERIFICACIÓN DE LOS SUPUESTOS DE NORMALIDAD
 shapiro.test(pruebaA)

Shapiro-Wilk normality test

data: pruebaA
W = 0.92401, p-value = 0.5561

 shapiro.test(pruebaB)

Shapiro-Wilk normality test

data: pruebaB
W = 0.9293, p-value = 0.5916
 shapiro.test(pruebaC)

Shapiro-Wilk normality test

data: pruebaC
W = 0.95269, p-value = 0.7564

VERIFICACIÓN DE LOS SUPUESTOS DE HOMOCEDASTICIDAD o varianza


constante
 var.test(pruebaA,pruebaB)

F test to compare two variances

data: pruebaA and pruebaB


F = 0.86237, num df = 4, denom df = 4, p-value = 0.8894
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.08978823 8.28269433
sample estimates:
ratio of variances
0.8623737

 var.test(pruebaA, pruebaC)

F test to compare two variances

data: pruebaA and pruebaC


F = 1.1052, num df = 4, denom df = 4, p-value = 0.9251
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.1150684 10.6147151
sample estimates:
ratio of variances
1.105178
 var.test(pruebaB,pruebaC)
F test to compare two variances

data: pruebaB and pruebaC


F = 1.2816, num df = 4, denom df = 4, p-value = 0.8158
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.1334322 12.3087179
sample estimates:
ratio of variances
1.281553
Obtención de la Tabla ANOVA
 prueba<-c (85,83,76,64,75,60,58,76,52,63,60,48,38,47,50)
 metodo<-c("A","A","A","A","A","B","B","B","B","B","C","C","C","C","C")

Obteniendo las medias y sd de cada población


 tapply(prueba, metodo, mean)
 tapply(prueba, metodo, sd)

> tapply(prueba, metodo, mean)


A B C
76.6 61.8 48.6
> tapply(prueba, metodo, sd)
A B C
8.264381 8.899438 7.861298

También es útil graficar la población estratificada por el factor:


boxplot(prueba~metodo)
Las hipótesis que se van a contrastar son:
H0: μA = μB= μC
H1: Al menos una media es diferente

 anova<-aov(prueba~metodo)
anova
Call:
aov(formula = prueba ~ metodo)

Terms:
metodo Residuals
Sum of Squares 1962.133 837.200
Deg. of Freedom 2 12

Residual standard error: 8.352644


Estimated effects may be unbalanced
 summary(anova)

Df Sum Sq Mean Sq F value Pr(>F)


metodo 2 1962.1 981.1 14.06 0.000716 ***
Residuals 12 837.2 69.8
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

S-ar putea să vă placă și