Sunteți pe pagina 1din 25

EJEMPLOS DE APLICACIONES CHI-CUADRADO

Prueba de Bondad de Ajuste: Frecuencias esperadas iguales


EJEMPLO 1
Jefes Dpto Seguridad e Higiene Ocupacional de la Empresa XYZ recopilan informacin sobre los
accidentes de trabajo y los clasifican de acuerdo a la hora de ocurrencia
Determinar si los accidentes estn distribuidos de manera uniforme durante la jornada laboral.
Con un nivel de significancia de 5%
Hora N ACCIDENTES
8 a 9 am 6
9 a 10 am 6
10 a 11 am 20
11 a 12 pm 8
1 a 2 pm 7
2 a 3 pm 8
3 a 4 pm 19
4 a 5 pm 6

Solucin:
Mtodo Tradicional
Ho: Los accidentes estn distribuidos de manera uniforme
Ha: Los accidentes NO estn distribuidos de manera uniforme


Contribucin Chi-Cuadrado
Frec. Obs Frec Esperada=N*pi (Frec Obs-Frec Esp)^2/Frec Esp
CATEGORIAS Hora N ACCIDENTES PROBAB. N*pi
1 8 a 9 am 6 0.125 10 1.6
2 9 a 10 am 6 0.125 10 1.6
3 10 a 11 am 20 0.125 10 10
4 11 a 12 pm 8 0.125 10 0.4
5 1 a 2 pm 7 0.125 10 0.9
6 2 a 3 pm 8 0.125 10 0.4
7 3 a 4 pm 19 0.125 10 8.1
8 4 a 5 pm 6 0.125 10 1.6
TOTALES 80 1 80 24.6 Valor Chicuadrado

Se Rechaza Ho, se acepta Ha es decir los datos no son uniformes.
METODO con el MINITAB:
Estadsticas / Tablas / Prueba chi-cuadrada de bondad de ajuste(una variable)

Valor Terico 14.07
Regin Rechazo
14.6 24.6
valor p 0.001

Ho: Los accidentes estn distribuidos de manera uniforme
Ha: Los accidentes NO estn distribuidos de manera uniforme

Prueba chi-cuadrada de bondad de ajuste para conteos observados en variable: N

Proporcin Contribucin
Categora Observado de prueba Esperado a Chi-cuad.
1 6 0.125 10 1.6
2 6 0.125 10 1.6
3 20 0.125 10 10.0
4 8 0.125 10 0.4
5 7 0.125 10 0.9
6 8 0.125 10 0.4
7 19 0.125 10 8.1
8 6 0.125 10 1.6


N GL Chi-cuad. Valor P
80 7 24.6 0.001

Categora 8 7 6 5 4 3 2 1
20
15
10
5
0
V
a
l
o
r
Esperado
Observado
Grfica de valores observados y esperados

Valor P (0.01) < Alfa (0.05)
Se Rechaza la Hiptesis Nula entonces Ha
El nmero de accidentes NO SE DISTRIBUYEN DE MANERA UNIFORME.

EJEMPLO 2
Un grupo de compradores en tiendas de departamento vieron un nuevo artculo y opinaron al
respecto, los resultaron fueron los siguientes:
Opinin N Compradores
Sobresaliente 47
Excelente 45
Muy Bueno 40
Bueno 39
Regular 35
Indeseable 34

Probar con un nivel de significancia de 0.01 si no hay diferencia relevante entre las opiniones de
los compradores.


Solucin
Ho: No hay diferencia relevante entre las opiniones de los
compradores (son similares)
Ha: Existe diferencia relevante entre las opiniones de los
compradores


Prueba chi-cuadrada de bondad de ajuste para conteos observados en variable: N

Proporcin Contribucin
Categora Observado de prueba Esperado a Chi-cuad.
1 47 0.166667 40 1.225
2 45 0.166667 40 0.625
3 40 0.166667 40 0.000
4 39 0.166667 40 0.025
5 35 0.166667 40 0.625
6 34 0.166667 40 0.900


N GL Chi-cuad. Valor P
240 5 3.4 0.639


Valor P > alfa
0.639 > 0.01
Acepta Ho es decir no hay diferencia en la opinin de los compradores

Categora 6 5 4 3 2 1
50
40
30
20
10
0
V
a
l
o
r
Esperado
Observado
Grfica de valores observados y esperados


Prueba de Bondad de Ajuste : Frecuencias esperadas desiguales

Ejemplo 3.- El Ministerio de Salud reporta la siguiente informacin respecto del nmero de veces
que los adultos mayores son admitidos en un hospital durante el periodo de un ao. 40% no es
admitido, 30% es admitido una vez; 20% son admitidos dos veces y el 10% restante es admitido
tres o ms veces.

Una encuesta de 150 personas en una zona donde la poblacin es principalmente adulto mayor
revel que 55 no fueron admitidos, 50 fueron admitidos una vez, 32 fueron admitidos dos veces y
el resto en la encuesta fueron admitidos 3 o ms veces. Es Posible concluir que la encuesta es
consistente con la informacin sugerida por el Ministerio de Salud? Utilice un nivel de significancia
de 0.05


Solucin
Las hiptesis

Ho: No hay una diferencia entre la encuesta y los resultados del MINSA
Ha: Existe una diferencia entre la encuesta y los resultados del MINSA
Con nivel de significancia 0.05

Mtodo Tradicional


Pi N*pi

Contribucin
Chi-cuadrado

Variable X Encuesta Porcentaje
Frec
Esperada


Nmero Admisiones
Frec
Observ MINSA fe

0 55 0.4 60 0.4167

1 50 0.3 45 0.5556

2 32 0.2 30 0.1333

3 o ms 13 0.1 15 0.2667

N 150 1 150
1.3722
Estadstico Valor Chicuadrado

K (CATEGORIAS)

4

m (parametros)

0

grados libertad

3

alfa 0.05

Valor Terico Chicuadrado
7.81
0.050


0.25
0.20
0.15
0.10
0.05
0.00
X
D
e
n
s
i
d
a
d
7.81
0.05
0
Grfica de distribucin
Chicuadrado, df=3


El valor Calculado cae en la regin de ACEPTACIN SE ACEPTA HO ES DECIR:
No hay una diferencia entre la encuesta y los resultados del MINSA

METODO con el MINITAB:
Estadsticas / Tablas / Prueba chi-cuadrada de bondad de ajuste(una variable) :




Prueba chi-cuadrada de bondad de ajuste para conteos observados en variable: Fr

Proporcin Contribucin
Categora Observado de prueba Esperado a Chi-cuad.
1 55 0.4 60 0.416667
2 50 0.3 45 0.555556
3 32 0.2 30 0.133333
4 13 0.1 15 0.266667


N GL Chi-cuad. Valor P
150 3 1.37222 0.712

Valor p > Alfa Se ACEPTA HO
No hay una diferencia entre la encuesta y los resultados del MINSA

Categora 4 3 2 1
60
50
40
30
20
10
0
V
a
l
o
r
Esperado
Observado
Grfica de valores observados y esperados



EJERCICIOS SOBRE PUEBA DE INDEPENDENCIA Y HOMOGENIEDAD
Ejer1.- Una socilogo quiere determinar si hay alguna relacin entre el tamao de la familia y el
nivel de educacin del padre. Para esto, seleccion una muestra de 500 hogares y los clasifico de
acuerdo con 2 criterios: por el tamao de la familia y por el nivel de educacin. Las frecuencias
observadas estn registradas en tabla siguiente:
Nmero de hijos
Nivel de educacin Menos de 3 De 3 a 5 Ms de 5
Primaria 40 90 70
Secundaria 50 60 60
Superior 60 50 20
Se puede concluir con un nivel de significacin de 0.05 que el tamao de la familia es
independiente del nivel de educacin del padre?
Solucin
Aplicando una prueba Independencia Chicuadrado
Ho: El tamao de la familia es independiente del nivel de educacin del padre
Ha: El tamao de la familia es dependiente del nivel de educacin del padre.
=0.05
Estadstico de Prueba:


Sigue una Chicuadrado con v grados libertad donde v= (r-1)*(c-1)
r: nmero de filas
c: nmero de columnas
FRECUENCIAS OBSERVADAS

Nmero de hijos

Nivel de
educacin
Menos de 3 De 3 a 5 Ms de 5 total

Primaria 40 90 70
200
Secundaria 50 60 60
170
Superior 60 50 20
130
total
150 200 150 500






FRECUENCIAS ESPERADAS
Nmero de hijos

Nivel de
educacin
Menos de 3 De 3 a 5 Ms de 5 total

Primaria 60 80 60
200
Secundaria 51 68 51
170
Superior 39 52 39
130
total
150 200 150 500






Nmero de hijos

Nivel de
educacin
Menos de 3 De 3 a 5 Ms de 5 total

Primaria 6,66666667 1,25 1,66666667
9,58333333
Secundaria 0,01960784 0,94117647 1,58823529
2,54901961
Superior 11,3076923 0,07692308 9,25641026
20,6410256
total
17,9939668 2,26809955 12,5113122
32,77
Chi Cuadrado Calculado
Filas 3
Columnas 3
grados libertad 4 alfa 0,05
Valor Terico Chicuadrado
9,49


Se concluye que Chicuadrado Terico Es Menor que el Chicuadrado Calculado



9.49 < 32,77 Cae en la regin de Rechazo
Se rechaza la hiptesis nula y se acepta la alternativa
Conclusin: El tamao de la familia es dependiente del nivel de educacin del padre.
0,20
0,15
0,10
0,05
0,00
X
D
e
n
s
i
d
a
d
9,49
0,05
0
Grfica de distribucin
Chicuadrado; df=4

Mediante MINITAB






Prueba chi-cuadrada: Menos 3; de 3 a 5; Mas de 5

Los conteos esperados se imprimen debajo de los conteos observados
Las contribuciones chi-cuadradas se imprimen debajo de los conteos esperados

Menos 3 de 3 a 5 Mas de 5 Total
1 40 90 70 200
60,00 80,00 60,00
6,667 1,250 1,667

2 50 60 60 170
51,00 68,00 51,00
0,020 0,941 1,588

3 60 50 20 130
39,00 52,00 39,00
11,308 0,077 9,256

Total 150 200 150 500

Chi-cuadrada = 32,773; GL = 4; Valor P = 0,000

Valor P < alfa Se rechaza la Hiptesis Nula y se acepta la Ha.

Ejercicio 2.- El Departamento mdico de la UAP estudia el nivel de efectividad de 3 medicamentos
para la alergia: R1, R2 y R3. Cada medicamento se suministr a 60 alumnos. Los Resultados del
experimento se muestran a continuacin:

Medicamentos para la Alergia
Efectividad R1 R2 R3
Sin Alivio 10 20 15
Cierto Alivio 40 30 20
Alivio Total 10 10 25
Podemos concluir con un nivel de significacin de 0.01, que los 3 medicamentos son igualmente
efectivos?
Solucin:
Ho: Los 3 medicamentos para la alergia son igualmente efectivos
Ha: Los 3 medicamentos para la alergia NO son igualmente efectivos
Nivel de significacin = 0.01
Estadstico de Prueba:


Sigue una Chicuadrado con v grados libertad donde v= (r-1)*(c-1)
r: nmero de filas
c: nmero de columnas

FRECUENCIAS OBSERVADAS

Medicamentos para la Alergia

Efectividad R1 R2 R3 total

Sin Alivio 10 20 15
45
Cierto Alivio 40 30 20
90
Alivio Total 10 10 25
45
total
60 60 60 180


FRECUENCIAS ESPERADAS

Medicamentos para la Alergia

Efectividad R1 R2 R3 total

Sin Alivio 15 15 15
45
Cierto Alivio 30 30 30
90
Alivio Total 15 15 15
45
total
60 60 60 180







Medicamentos para la Alergia

Efectividad R1 R2 R3 total

Sin Alivio 1,6666666
7
1,66666667 0
3,33333333
Cierto Alivio 3,3333333
3
0 3,33333333
6,66666667
Alivio Total 1,6666666
7
1,66666667 6,66666667
10
total 6,6666666
7 3,33333333 10
20,000
Chi Cuadrado Calculado


Filas 3
Columnas 3
grados libertad 4 alfa 0,01
Valor Terico Chicuadrado
13,28


Se concluye que Chicuadrado Teorico Es Menor que el Chicuadrado Calculado

13,28 < 20 Cae en la regin de
Rechazo
Se rechaza la hiptesis nula y se acepta la alternativa
Conclusin: Los 3 medicamentos para la alergia NO son igualmente efectivos.
0,20
0,15
0,10
0,05
0,00
X
D
e
n
s
i
d
a
d
13,3
0,01
0
Grfica de distribucin
Chicuadrado; df=4

Mediante MINITAB:
Prueba chi-cuadrada: R1; R2; R3

Los conteos esperados se imprimen debajo de los conteos observados
Las contribuciones chi-cuadradas se imprimen debajo de los conteos esperados

R1 R2 R3 Total
1 10 20 15 45
15,00 15,00 15,00
1,667 1,667 0,000

2 40 30 20 90
30,00 30,00 30,00
3,333 0,000 3,333

3 10 10 25 45
15,00 15,00 15,00
1,667 1,667 6,667

Total 60 60 60 180

Chi-cuadrada = 20,000; GL = 4; Valor P = 0,000


Valor P < alfa (0.01) Se rechaza la Hiptesis Nula y se acepta la Ha.

Ejercicio 3.- El Gerente Logstica de una fbrica debe decidir por la compra de 4 marcas de
mquinas que existen en el mercado. Para probar si existe diferencia significativa en la calidad de
las mquinas, obtiene una muestra de la produccin de 150 artculos para cada de ellas y observa
el nmero de artculos defectuosos. Los resultados se muestran en la siguiente Tabla:

Mquinas
Calidad A B C D
Defectuosos 21 12 15 18
Buenos 129 138 135 132

Qu conclusin obtiene sobre la calidad de las mquinas.
Solucin
Ho: Las 4 mquinas tienen la misma calidad
Ha: Las 4 mquinas NO tienen la misma calidad
Nivel de significacin = 0.05
Estadstico de Prueba:


Sigue una Chicuadrado con v grados libertad donde v= (r-1)*(c-1)
r: nmero de filas
c: nmero de columnas
v=(4-1)*(2-1)=3

FRECUENCIAS OBSERVADAS

Mquinas

Calidad A B C D total

Defectuosos 21 12 15 18
66
Buenos 129 138 135 132
534
total
150 150 150 150 600


FRECUENCIAS ESPERADAS

Mquinas

Calidad A B C D total

Defectuosos 16,5 16,5 16,5 16,5
66
Buenos 133,5 133,5 133,5 133,5
534
total
150 150 150 150 600







Mquinas

Calidad A B C D total

Defectuosos 1,22727273 1,22727273 0,13636364 0,13636364
2,72727273
Buenos 0,15168539 0,15168539 0,01685393 0,01685393
0,33707865
total
1,37895812 1,37895812 0,15321757 0,15321757
3,064
Chi Cuadrado Calculado


Filas 2
Columnas 4
grados libertad 3 alfa 0,05
Valor Terico Chicuadrado
7,81


Se concluye que Chicuadrado Teorico Es Mayor que el Chicuadrado Calculado

3,064 < 7,81 Cae en la regin de Aceptacin
Se Acepta la hiptesis nula

0,25
0,20
0,15
0,10
0,05
0,00
X
D
e
n
s
i
d
a
d
7,81
0,05
0
Grfica de distribucin
Chicuadrado; df=3


Prueba chi-cuadrada: A; B; C; D

Los conteos esperados se imprimen debajo de los conteos observados
Las contribuciones chi-cuadradas se imprimen debajo de los conteos esperados

A B C D Total
1 21 12 15 18 66
16,50 16,50 16,50 16,50
1,227 1,227 0,136 0,136

2 129 138 135 132 534
133,50 133,50 133,50 133,50
0,152 0,152 0,017 0,017

Total 150 150 150 150 600

Chi-cuadrada = 3,064; GL = 3; Valor P = 0,382

Valor p (0.382) > alfa (0.05) Se Acepta Ho.

Ejercicio 4.- La Compaa de cerveza Dorada est interesada en saber si el consumo de su
marca de cerveza depende de una localizacin geogrfica en especial. Para responder esta
pregunta la compaa solicit a una empresa de investigacin de mercados realizar un estudio
entre los consumidores de 4 regiones principales del pas. Los resultados se muestran a
continuacin:
Regiones
Consumos anual
por persona
Sur Centro Norte Oriente
Ms de 10 cajas 200 120 100 90
De 5 a 10 cajas 150 100 150 200
Menos de 5 cajas 100 230 200 160
Al nivel de significancia del 5% La localizacin geogrfica es un factor significativo en el consumo
de cerveza?
Solucin
Ho: La localizacin geogrfica es independiente del consumo de cerveza
Ha: La localizacin geogrfica es dependiente del consumo de cerveza
Nivel de significacin = 0.05
Estadstico de Prueba:


Sigue una Chicuadrado con v grados libertad donde v= (r-1)*(c-1)
r: nmero de filas
c: nmero de columnas
v=(3-1)*(4-1)=6


Prueba chi-cuadrada: Sur; Centro; Norte; Oriente

Los conteos esperados se imprimen debajo de los conteos observados
Las contribuciones chi-cuadradas se imprimen debajo de los conteos esperados

Sur Centro Norte Oriente Total
1 200 120 100 90 510
127,50 127,50 127,50 127,50
41,225 0,441 5,931 11,029

2 150 100 150 200 600
150,00 150,00 150,00 150,00
0,000 16,667 0,000 16,667

3 100 230 200 160 690
172,50 172,50 172,50 172,50
30,471 19,167 4,384 0,906

Total 450 450 450 450 1800

Chi-cuadrada = 146,888; GL = 6; Valor P = 0,000


P<ALFA; SE RECHAZA LA HIPOTESIS NULA
Es decir se Acepta la Hiptesis Alternativa:
La localizacin geogrfica es dependiente del consumo de cerveza.

Ejercicio 5.- El Gerente de ventas de la firma Group desea determinar si las ventas de 4
productos dependen de la clase de clientes clasificados en 4 grupos. Una muestra aleatoria de las
ventas suministr la siguiente informacin:
Productos
Grupo de Clientes A B C D
Profesionales 30 35 55 40
Comerciantes 155 50 125 80
Obreros 130 30 105 50
Amas de Casa 35 15 20 45

Se puede concluir que las ventas de los 4 productos es homognea entre los 4 grupos de
clientes? Use un nivel de significacin 0.05
Solucin
Ho: Las ventas de los 4 productos es homognea entre los 4 grupos de clientes
Ha: Las ventas de los 4 productos NO es homognea entre los 4 grupos de clientes
Nivel de significacin = 0.05
Estadstico de Prueba:


Sigue una Chicuadrado con v grados libertad donde v= (r-1)*(c-1)
r: nmero de filas
c: nmero de columnas
v=(4-1)*(4-1)=9
Prueba chi-cuadrada: A_1; B_1; C_1; D_1

Los conteos esperados se imprimen debajo de los conteos observados
Las contribuciones chi-cuadradas se imprimen debajo de los conteos esperados

A_1 B_1 C_1 D_1 Total
1 30 35 55 40 160
56,00 20,80 48,80 34,40
12,071 9,694 0,788 0,912

2 155 50 125 80 410
143,50 53,30 125,05 88,15
0,922 0,204 0,000 0,754

3 130 30 105 50 315
110,25 40,95 96,08 67,72
3,538 2,928 0,829 4,639

4 35 15 20 45 115
40,25 14,95 35,08 24,73
0,685 0,000 6,479 16,626

Total 350 130 305 215 1000

Chi-cuadrada = 61,069; GL = 9; Valor P = 0,000

Valor P < alfa se rechaza Ho se acepta Ha es decir Las ventas de los 4 productos NO es homognea
entre los 4 grupos de clientes

Prueba chi-cuadrada de bondad de ajuste para distribuciones de probabilidad
Binomial, Poisson y Normal.

Ejemplo 5.- El nmero de computadoras vendidas en una tienda tienen la siguiente
distribucin:






Probar con nivel de significancia de 0.01 si los datos siguen una distribucin binomial.

Solucin:
HO: Los datos siguen una distribucin Binomial
Ha: Los datos NO siguen una distribucin Binomial

Funcin de Distribucin Binomial es:





Categoras
N PCs N Das
1
0 1
2
1 16
3
2 55
4
3 228


X: Nmero de PCs que se venden (Rx = 0,1,2,3) donde n=3
Estimar el parmetro p
(X) N PCs N Das P(x): (hi) E(x)=xp(x)

0 1 0.00333 0.0000

1 16 0.05333 0.0533

2 55 0.18333 0.3667

3 228 0.76000 2.2800


300

2.7 E(X)





Reemplazando en la funcin Binomial:






Frec Observa

Categorias N PCs N Das Prob Binomial
Fre Esperada
=N*pi
(300*Prob
Binomial)

1
0

1 0.001

0.3
8.8048

1 16 0.027 8.1

2 2 55 0.243 72.9 4.3952

3 3 228 0.729 218.7 0.3955


300 1

13.60 Chicuadrado



K (CATEGORIAS) 3


m (parmetros) 1
Se ha
estimado la
probabilidad
p=0.9


grados libertad (K-m-1) 1

alfa 0.01
Valor Terico Chicuadrado (alfa=0.01)
6.63

alfa 0.05

17 8.4
Valor Terico Chicuadrado (alfa=0.05)
3.84




Valor P
para 13.60

0.000226 < Alfa

Rechaza Hiptesis Nula

Los datos no siguen una
distribucin Binomial


1.6
1.4
1.2
1.0
0.8
0.6
0.4
0.2
0.0
X
D
e
n
s
i
d
a
d
6.63
0.01
0
Grfica de distribucin
Chicuadrado, df=1

1.6
1.4
1.2
1.0
0.8
0.6
0.4
0.2
0.0
X
D
e
n
s
i
d
a
d
3.84
0.05
0
Grfica de distribucin
Chicuadrado, df=1




1.6
1.4
1.2
1.0
0.8
0.6
0.4
0.2
0.0
X
D
e
n
s
i
d
a
d
13.6
0.000226
0
Grfica de distribucin
Chicuadrado, df=1











Ejemplo.- El gerente de personal de una empresa estudia la siguiente distribucin de los
nmero de ausencia en un mes determinado









Verificar si los datos siguen una distribucin Binomial con un nivel de significancia de 0.05

Solucin:
HO: Los datos siguen una distribucin Binomial
Ha: Los datos NO siguen una distribucin Binomial

N
ausencias
Frec
Observadas
0 80
1 40
2 38
3 12
4 10







X: Nmero de PCs que se venden (Rx = 0,1,2,3,4) donde n=4
Estimar el parmetro p
N
ausencias
Frec
Observadas pi E(x)=xp(x)

0 80 0.44444 0.0000

1 40 0.22222 0.2222

2 38 0.21111 0.4222

3 12 0.06667 0.2000

4 10 0.05556 0.2222


180

1.067 E(X)
n=4


p 0.267

S-ar putea să vă placă și