Sunteți pe pagina 1din 33

ESTADÍSTICA GENERAL

PRUEBA DE CHI CUADRADO

Dr. Francisco Suárez Aranda

2010 - I
PRUEBA DE CHI CUADRADO
La prueba de Chi cuadrado es la técnica
estadística más usada para el análisis de conteo o
datos en frecuencias y constituye una prueba útil
de significación para muchos problemas en
estadística médica.
Las aplicaciones de la distribución Chi cuadrado
están constituidas por contrastes de hipótesis,
donde los datos disponibles para el análisis, se
encuentran en forma de frecuencias (recuento de
casos). Estos contrastes toman los nombres de
prueba de bondad de ajuste, prueba de
independencia y prueba de homogeneidad.

Dr. Francisco Suárez Aranda


ALGUNAS CARACTERÍSTICAS DE LA
DISTRIBUCIÓN CHI CUADRADO
 El valor de Chi cuadrado (x2) es siempre
positivo porque es una suma de cuadrados.
 Varía de cero a infinito.
 Es una familia de distribuciones que
dependen de un parámetro: grados de
4
libertad.
 Para poder aplicarse la prueba de Chi
cuadrado, el tamaño de muestra debe ser lo
suficientemente grande para que el número
esperado en cada categoría sea por lo menos
de cinco, para así asegurar que x2 se
aproxime a la distribución real.
Dr. Francisco Suárez Aranda
 Para cumplir la exigencia anterior puede
unirse categorías contiguas (celdas) con
valores esperados menores de cinco.
 La distribución tiene sesgo positivo y cuando
los grados de libertad aumentan se aproxima
a la distribución normal.

gl=2

gl=3
gl=4
gl=5

0 2 Chi2 6 8

Dr. Francisco Suárez Aranda


1. PRUEBA DE BONDAD DE AJUSTE
 Es apropiada cuando se desea decidir si una
distribución observada de frecuencias es
incompatible o no con una distribución teórica o
preconcebida, que se supone describe a la
población de donde se extrajo la muestra.
 Es unidimensional.
 Los n datos considerados deben estar
distribuidos en categorías.
 La hipótesis nula (Ho) se basa en la distribución
teórica que se espera en la población.
 Las frecuencias esperadas están en función de
la Ho planteada.

Dr. Francisco Suárez Aranda


Ejemplo
Al lanzar un dado 48 veces, se obtuvieron los
siguientes resultados: el número uno salió siete
veces; el número dos, seis veces; el número tres,
diez veces; el número cuatro, nueve veces; el
número cinco, diez veces y el número seis, seis
veces. Con un nivel de significación del 5%, pruebe
la hipótesis de que el dado es “honesto” (no está
cargado).
Ho: P  1/6 g.l. : k  1
Ha: P  1/6 g.l. : 6  1  5
 : 0.05 x20.05 : 11.1
(O – E)2
x2 =  
E
Dr. Francisco Suárez Aranda
Dr. Francisco Suárez Aranda
Las frecuencias “esperadas”, se determinan
de acuerdo a la hipótesis nula planteada.
1
p
6
1
Frecuencia esperada   x 48  8
6

NÚMERO 1 2 3 4 5 6
Observado 7 6 10 9 10 6
Esperado 8 8 8 8 8 8

Dr. Francisco Suárez Aranda


(O  E) 2
x2   
E

(7  8) 2 (6  8)2 (10  8)2 (6  8) 2


x2        …  
8 8 8 8

x2  2.25

Dr. Francisco Suárez Aranda


DECISIÓN ESTADÍSTICA
Como 2.25 < 11.1 no se encuentran evidencias
muestrales para rechazar la Ho al nivel de
significación de 0.05.

DECISIÓN SOBRE EL PROBLEMA


Se concluye que el dado es “honesto”.

Dr. Francisco Suárez Aranda


Ejemplo
Un criador de bovinos lecheros concluyó después de
muchos años de estudio, que anualmente el 40% de
vacunos vendidos fueron de raza Holstein, el 40%
Brown Swiss y el 20% Criollos. El criador desea
saber si el presente año dicha distribución
porcentual se mantendrá, sabiendo que una muestra
de los animales vendidos arrojó las siguientes cifras.
Holstein  55 bovinos.
Brown Swiss  35 bovinos.
Criollos  10 bovinos.
¿Qué le diría usted al criador sobre el asunto, con un
nivel de significación de 5%?.

Dr. Francisco Suárez Aranda


Ho: P  0.4, 0.4, 0.2
Ha: P  0.4, 0.4, 0.2
 : 0.05
g.l. : k  1
g.l. : 3  1  2
x20.05 : 5.99

FRECUENCIA Holstein Brown Swiss Criollos TOTAL


Observada 55 35 10 100
Esperada 40 40 20 100

Dr. Francisco Suárez Aranda


(O  E) 2
x2   
E

(55  40) 2 (35  40)2 (10  20)2


x2      
40 40 20

x2  11.25

Dr. Francisco Suárez Aranda


DECISIÓN ESTADÍSTICA
Como 11.25  5.99 hay evidencias muestrales
para rechazar la Ho al nivel de significación de
0.05.

DECISIÓN SOBRE EL PROBLEMA


Se concluye que las ventas el presente año no
siguen la distribución porcentual de años
anteriores.

Dr. Francisco Suárez Aranda


2. PRUEBA DE INDEPENDENCIA
 Se usa cuando se desea contrastar la hipótesis
nula de que dos criterios de clasificación
aplicados al mismo conjunto de entidades, son
independientes. Se dice que dos clasificaciones
son independientes, si la distribución de una de
ellas es la misma, sin importar cual sea la
distribución de la otra clasificación.
 El único valor que controla el investigador es el
tamaño de muestra. Se extrae una muestra de
tamaño n de UNA población y cada elemento se
clasifica de acuerdo a las dos variables de
estudio. No se conocen de antemano las
frecuencias de las celdas, ni los totales
marginales, todos estos valores son por lo tanto,
aleatorios.
Dr. Francisco Suárez Aranda
 Las observaciones son clasificadas según dos
criterios (dos factores), por lo que los datos pueden
resumirse en una tabla de doble entrada (tabla de
contingencia); así por ejemplo, número de
estudiantes según sexo y colegio de procedencia.
 La hipótesis de nulidad plantea que las dos
variables o criterios de clasificación son
independientes cuando se aplican a un conjunto de
individuos (unidades de observación); mientras que
la hipótesis alternativa plantea que hay asociación o
dependencia entre las dos variables.
 La interrogante en esta prueba es: ¿son
independientes los criterios de clasificación?.
 Por lo tanto, la prueba de independencia se efectúa
para probar si hay asociación entre las variables.

Dr. Francisco Suárez Aranda


Ejemplo
Entre los estudiantes de la U. Científica del Sur
se realizó una encuesta con la finalidad de
evaluar la posible asociación entre el sexo y el
deseo de seguir estudios de posgrado. Luego de
encuestar a 500 estudiantes, se revisaron las
respuestas, estableciéndose que 250 pertenecían
a varones, 130 de los cuales deseaban seguir
estudios de posgrado y de las 250 mujeres, 170
afirmaron el mismo deseo. Si todos los
encuestados respondieron, realice usted la
prueba adecuada y concluya con un nivel de
significación de 5%.

Dr. Francisco Suárez Aranda


Ho: Independencia g.l. : (F – 1)(C – 1)
Ha: Asociación g.l. : (2 – 1)(2 – 1)  1
 : 0.05 x20.05 : 3.84

OBSERVADOS
ESTUDIOS DE POSGRADO
SEXO TOTAL
Sí No
Masculino 130 120 250
Femenino 170 80 250
TOTAL 300 200 500

Los esperados se calculan en base de la Ho.

Dr. Francisco Suárez Aranda


ESPERADOS
ESTUDIOS DE POSGRADO
SEXO TOTAL
Sí No
Masculino 150 100 250
Femenino 150 100 250
TOTAL 300 200 500

(O  E)2
x2   
E
(130 – 150)2 (120 – 100)2 (80 – 100)2
x2   +  +  + 
150 100 100

x2  13.33
Dr. Francisco Suárez Aranda
Cuando se tiene una tabla de 2 x 2 se puede hallar
el valor de x2, sólo con los observados, aplicando
al siguiente fórmula:

CRITERIO I
CRITERIO II TOTAL
Presente Ausente
Presente a b a+b
Ausente c d c+d
TOTAL a+c b+d n

( ad – bc ) 2 n
x2 = 
(a+b)(c+d)(a+c)(b+d)

Dr. Francisco Suárez Aranda


[ (130 x 80) – (120 x 170) ]2 x 500
x2    13.33
250 x 250 x 300 x 200

DECISIÓN ESTADÍSTICA
Como 13.33  3.84 se encuentran evidencias
muestrales suficientes para rechazar Ho al
nivel de significación de 0.05.
DECISIÓN SOBRE EL PROBLEMA
Se concluye que existe asociación entre el
sexo y el deseo de seguir estudios de
posgrado, entre los estudiantes de la UCSur.

Dr. Francisco Suárez Aranda


Ejemplo
Con la finalidad de verificar si las calificaciones
obtenidas por los estudiantes en el curso de
estadística se relacionan a las calificaciones
obtenidas en matemática, se seleccionaron
aleatoriamente 528 reportes de notas de los
estudiantes de nuestra Universidad,
obteniéndose los siguientes resultados:
NOTAS DE NOTAS DE MATEMÁTICA
TOTAL
ESTADÍSTICA Altas Medias Bajas
Altas 56 71 12 139
Medias 47 163 38 248
Bajas 14 42 85 141
TOTAL 117 276 135 528

Aplique la prueba adecuada y concluya usando


un nivel de significación de 0.05.
Dr. Francisco Suárez Aranda
Ho: Independencia g.l. : (F – 1)(C – 1)
Ha: Asociación g.l. : (3 – 1)(3 – 1)  4
 : 0.05 x20.05 : 9.49
ESPERADOS
NOTAS DE NOTAS DE MATEMÁTICA
TOTAL
ESTADÍSTICA Altas Medias Bajas
Altas 30.80 72.66 35.54 139.00
Medias 54.95 129.54 63.41 248.00
Bajas 31.24 73.70 36.05 141.00
TOTAL 117.00 276.00 135.00 528.00

(O  E)2
x2   
E
(56 – 3080)2 (85 – 36.05)2
x2   +  +   145.78
30.80 36.05
Dr. Francisco Suárez Aranda
DECISIÓN ESTADÍSTICA
Como 145.78  9.49 se encuentran evidencias
muestrales suficientes para rechazar Ho al
nivel de significación de 0.05.
DECISIÓN SOBRE EL PROBLEMA
Se concluye que las notas de estadísitica se
encuentran relacionadas a las notas de
matemática.

Dr. Francisco Suárez Aranda


3. PRUEBA DE HOMOGENEIDAD
 Se aplica cuando se desea investigar si dos o
más muestras independientes pertenecen a
poblaciones homogéneas, con respecto a algún
criterio de clasificación.
 En este caso, un conjunto de totales marginales
es manipulado por el investigador, por lo tanto
su valor es fijo, mientras que el otro conjunto de
totales marginales es aleatorio. En este caso por
lo tanto, hay DOS O MÁS poblaciones de estudio
y se está interesado en una característica
particular.
 Trata de probar si para cada nivel de una de las
variables (A), la proporción con respecto a cada
nivel de la otra variable (B) es la misma.

Dr. Francisco Suárez Aranda


 Es una generalización de la prueba de
igualdad de dos proporciones.

 La interrogante en esta prueba es: ¿las


muestras provienen de poblaciones
homogéneas respecto a algún criterio de
clasificación?.

 La hipótesis de nulidad plantea que las


proporciones de cada categoría de una de
las variables (A), son iguales en cada
categoría de la otra variable (B); mientras
que la hipótesis alternativa plantea que al
menos una de las proporciones es diferente.

Dr. Francisco Suárez Aranda


Ejemplo
El Decano de la Facultad de Medicina Humana de
la UCSur desea saber si durante los tres últimos
años la proporción de mujeres ingresantes se ha
mantenido o ha sufrido variación. Para este fin,
se seleccionan aleatoriamente sesenta fichas de
ingreso del año 2008, sesenta del año 2009 y
ochenta del año 2010, y luego de analizar las
fichas se obtienen los siguientes resultados:
AÑO DE INGRESO
SEXO TOTAL
2008 2009 2010
Femenino 23 28 39 90
Masculino 37 32
276.00 41 110
TOTAL 60 60 80 200

Use un nivel de significación de 0.05 y concluya.

Dr. Francisco Suárez Aranda


Ho: Poblaciones homogéneas g.l. : (F – 1)(C – 1)
Ha: Poblaciones no homogéneas g.l. : (3 – 1)(2 – 1)  2
 : 0.05 x20.05: 5.99

ESPERADOS
AÑO DE INGRESO
SEXO TOTAL
2008 2009 2010
Femenino 27 27 36 90
Masculino 33 33
276.00 44 110
TOTAL 60 60 80 200

(23 – 27)2 (28 – 27)2 (41 – 44)2


x2   +  + ... +   1.60
27 27 44

Dr. Francisco Suárez Aranda


DECISIÓN ESTADÍSTICA
Como 1.60  5.99 no se observan evidencias
muestrales suficientes para rechazar Ho al
nivel de significación de 0.05.
DECISIÓN SOBRE EL PROBLEMA
Se concluye que la proporción de mujeres
ingresantes no ha sufrido modificación en
relación a los años anteriores.

Dr. Francisco Suárez Aranda


Ejemplo
Se sospecha que la asistencia a gimnasios los
fines de semana se encuentra relacionada al
sexo. Para salir de dudas, se realizó un estudio,
obteniéndose los siguientes resultados: de las 17
persona que asisten a gimnasios 11 eran
mujeres, mientras que de las 16 personas que no
asisten a gimnasios cuatro eran mujeres. Analice
usted los datos y concluya con un nivel de
significación de 0.05.
Ho: Poblaciones homogéneas
Ha: Poblaciones no homogéneas
 : 0.05

Dr. Francisco Suárez Aranda


g.l. : (F – 1)(C – 1)
g.l. : (2 – 1)(2 – 1)  1
x20.05: 3.84
ASISTENCIA A GIMNASIOS
SEXO TOTAL
Sí No
Femenino 11 4 15
Masculino 6 12 18
TOTAL 17 16 33

( ad – bc ) 2 n
x2 = 
(a+b)(c+d)(a+c)(b+d)
[ (11 x 12) – (4 x 6) ]2 x 33
x2    5.24
15 x 18 x 17 x 16
DECISIÓN ESTADÍSTICA
Como 5.24  3.84 se observan evidencias
muestrales suficientes para rechazar Ho al
nivel de significación de 0.05.
DECISIÓN SOBRE EL PROBLEMA
Se concluye que las poblaciones de mujeres y
varones no son homogéneas respecto a la
asistencia a gimnasios.

Dr. Francisco Suárez Aranda


"Más vale un toma que dos te daré".
Miguel de Cervantes Saavedra

Dr. Francisco Suárez Aranda

S-ar putea să vă placă și