Sunteți pe pagina 1din 9

PRUEBAS CHI CUADRADO

Las pruebas Chi-cuadrado se utilizan para probar hipótesis referidas a los patrones de comportamiento
de frecuencias relacionadas con variables ya sean cuantitativas o cualitativas. En este sentido, entre
las pruebas más comunes se encuentran la de Bondad del Ajuste, la de Independencia y la de
Homogeneidad.
En general, el procedimiento de prueba comienza con la formulación de las hipótesis; en la hipótesis
nula se plantea el modelo teórico que determinaría el comportamiento de las frecuencias. Luego, se
comparan con los datos efectivamente obtenidos y se cuantifican las diferencias numéricas
efectivamente halladas. Ahora bien, para juzgar la significancia de las diferencias halladas, Karl
Pearson (1900) propuso el estadístico de prueba Chi - Cuadrado, una prueba cuyos detalles de
implementación se presentan a continuación.
En esencia, la prueba consiste en determinar si esas diferencias se deben a variaciones al azar y por lo
tanto no son significativas o si por el contrario son significativas. En el primer caso no se rechaza la
hipótesis nula planteada, mientras que en el segundo se rechaza.

a. Prueba de bondad de ajuste.-


Esta es una prueba para decidir, a partir de una muestra particular, si se rechaza o no la
hipótesis de que una variable aleatoria se ajusta o no a una distribución probabilística
especifica. Por ejemplo, muchos de los métodos que se aplicarán se basan en el supuesto de
que los datos provienen de una población con distribución normal.
Un procedimiento adecuado para verificar ese supuesto es aplicar una prueba de bondad del
ajuste, debiendo aclararse que no es en el único caso en que se puede aplicar esta prueba ya
que, esta es susceptible de utilizarse cualquiera sea la distribución especificada: uniforme,
Poisson, exponencial, normal, entre otras.
El procedimiento comienza con el planteo de la hipótesis nula de que la variable aleatoria bajo
estudio tiene una distribución específica. Luego se toma una muestra aleatoria de la
población, la cual provee las frecuencias observadas. Seguidamente se compara con la
distribución teórica. Los valores de las probabilidades teóricos cuando se los multiplica por el
tamaño de la muestra, se transforman en las frecuencias esperadas.
El estadístico de prueba es:

Donde:
Frecuencia observada en la categoría
Frecuencia esperada de la categoría
Número de parámetros estimados en la distribución teórica.
Número de categorías en que se agrupan los datos.
Ejemplos:

Prueba para un ajuste uniforme.

El director de mercadeo de Seven Seas Inc., tiene la responsabilidad de controlar el


nivel de existencias para cuatro tipos de botes vendidos para su firma. En el pasado ha
ordenado nuevos botes bajo la premisa de que los cuatro tipos son igualmente
populares y la demanda de cada tipo es la misma. Sin embargo, recientemente las
existencias se han vuelto más difíciles de controlar y el director considera que debería
verificar su hipótesis respecto a una demanda uniforme. Sus hipótesis son:

La demanda es uniforme para los cuatro tipos de botes.


La demanda no es uniforme para los cuatro tipos de botes
Prueba de ajuste a un patrón específico.

Un banco de Nueva York trata de seguir una política de extender un 60% de sus
créditos a empresas comerciales, un 10% a personas naturales y un 30% a prestatarios
extranjeros.
Para determinar si la política se estaba siguiendo, el vicepresidente de mercadeo
selecciona aleatoriamente 85 créditos que se aprobaron recientemente. Encuentra 1ue
62 de tales créditos se otorgaron a negocios, 10 a personas naturales, y 13 a personas
extranjeras. A un nivel de significancia de 0,10 ¿parece que el patrón de cartera
deseado se preserva?

Se mantuvo el patrón deseado.


El patrón deseado no se mantuvo.

Prueba de normalidad.

Las especificaciones para la producción de tanques de aire utilizados en inmersión


requieren que los tanques se llenen a una presión promedio de 600 libras por pulgada
cuadrada (psi) se permite una desviación estándar de 10 psi. Las especificaciones de
seguridad permiten una distribución normal en los niveles de llenado. Usted acaba de
ser contratado por AquaLung un importante fabricante de equipos de inmersión. Su
primera tarea es determinar si los niveles de llenado se ajustan a una distribución
normal. AquaLung está seguro de que la media de 600 psi y la desviación estándar de
10 psi prevalecen. Solo queda por probar la naturaleza de la distribución. En este
esfuerzo se miden 1000 tanques y se halla la siguiente distribución:

PSI Frecuencia

0 - 579 20
580 - 589 142
590 - 599 310
600 - 609 370
610 - 619 128
Mayor a 620 30

Los niveles de llenado están distribuidos normalmente.


Los niveles de llenado no están distribuidos normalmente.

b. Prueba de homogeneidad.
La prueba Chi-cuadrado se puede aplicar para determinar si dos o más muestras aleatorias
independientes se extraen de la misma población. Para ello se clasifica a la población en
términos de una variable cualitativa en k grupos (categorías de la variable) o niveles de un
factor, con el objeto de evaluar si las proporciones poblacionales son homogéneas. Por
ejemplo, podríamos querer verificar si las opiniones (de acuerdo, en desacuerdo), respecto a la
política del Presidente Regional de Lambayeque, son homogéneas en tres ciudades como
pueden ser Lambayeque, Ferreñafe y Chiclayo, de las cuales se obtuvieron tres muestras
independientes.
También este tipo de prueba se puede aplicar para realizar un análisis confirmatorio de los
datos que se poseen de una encuesta ya efectuada. En este último caso, entonces, de acuerdo a
las dos variables categóricas podremos armar una tabla de contingencia con las frecuencias
asociadas a lo que definiremos como éxito y fracaso para cada grupo.
El estadístico de prueba es:

Donde:
Frecuencia observada en la categoría
Frecuencia esperada de la categoría
Número de categorías para la variable Y.
Número de categorías para la variable X.
Ejemplo
Estamos interesados en estudiar la fiabilidad de cierto componente informático con relación al
distribuidor que nos lo suministra. Para realizar esto, tomamos una muestra de 100 componentes de
cada uno de los 3 distribuidores que nos sirven el producto comprobando el número de defectuosos en
cada lote. La siguiente tabla muestra el número de defectuosos en para cada uno de los distribuidores.

Componetes Componentes
Distribuidor
Defectuosos Correctos
A 6 94
B 24 76
C 19 81
Solución:

1. Formulación de hipótesis:

H0 : No existen diferencias entre los tres distribuidores con respecto al número de


componentes defectuosos.
H1 : Existen diferencias entre los tres distribuidores con respecto al número de componentes
defectuosos.

2. Establecer un nivel de significancia: 0.05


3. Elección del estadístico de prueba:

4. Decisión: como entonces rechazamos H0


5. Conclusión: Existen diferencias entre los tres distribuidores con respecto al número de
componentes defectuosos, a un nivel de significancia de 0,05.

Ejemplo:
En un proceso de fabricación de tornillos, el fabricante quiere determinar si la proporción de tornillos
defectuosos producidos por tres máquinas variaba de una máquina a otra. Para verificar esto se
seleccionaron muestras de 400 tornillos de la producción de cada máquina y se contó el número de
tornillos defectuosos en cada una obteniéndose los siguientes datos.
Máquina
Calidad
1 2 3

Defectuosos 16 24 9
No defectuosos 384 376 391

Verifique si la proporción de tornillos defectuosos no difiere entre las siguientes máquinas.

Ejemplo:

Con el propósito de decidir si la opinión sobre el nivel de las carreras de ingeniería, que tienen los
académicos y los alumnos son concordantes, se procede a encuestar a 100 académicos y a 200
alumnos, obteniéndose los siguientes resultados:

Carrera de Opinión
ingeniería Deficiente Regular Bueno

Académicos 36 55 4
Alumnos 80 93 14

Pruebe la hipótesis que la distribución proporcional de la opinión entre los académicos y los alumnos
es la misma, utilizando un nivel de significancia de 0,05.

a) Prueba de independencia.-

En este caso, se trata de una situación en la que interesa poner a prueba si existe o no
independencia entre dos variables cualitativas (atributos) de una población. Para ello se toma
una muestra, se construye una tabla de contingencia con las dos variables cualitativas de
interés, y en base a la distribución de frecuencias conjunta observada en esa tabla de
contingencia y la frecuencia esperada, que se calcula de acuerdo a la hipótesis nula planteada,
se construye el estadístico Chi-cuadrado para evaluar las diferencias entre ambas. Si la
diferencia es significativa, concluimos que las variables están relacionadas o son dependientes.

El estadístico de prueba es:


Donde:
Frecuencia observada en la categoría
Frecuencia esperada de la categoría
Número de categorías para la variable Y.
Número de categorías para la variable X.

Ejemplo:

Para estudiar la dependencia entre la práctica de algún deporte y la depresión, se seleccionó una
muestra aleatoria simple de 100 jóvenes, con los siguientes resultados:

Sin Con
Deprotista
Depresión Depresión
Si 38 9
No 31 22

Determinar si existe asociación entre la actividad del sujeto y su estado de ánimo. Utilice un nivel de
significancia de 0,05

1. Formulación de hipótesis:

H0 : No existe asociación entre la actividad del sujeto y su estado de ánimo.


H1 : Existe asociación entre la actividad del sujeto y su estado de ánimo.

2. Establecer un nivel de significancia: 0.05

3. Elección del estadístico de prueba:

4. Decisión: como entonces rechazamos H0


5. Conclusión: Existe asociación entre la actividad del sujeto y su estado de ánimo, a un nivel de
significancia de 0,05.
Ejemplo:

Una empresa minera hizo un estudio para verificar si el tipo de trabajo se relaciona con el grado de
silicosis de los trabajadores. Para ello se extrae una muestra aleatoria de 300 trabajadores y se
clasifican según se muestra en la siguiente tabla.

Tipo de Grado de silicosis


trabajo I II III

Oficina 42 24 30
Terreno 54 78 72

Pruebe la hipótesis de que el tipo de trabajo afecta el grado de silicosis del trabajador con un
nivel de significancia de 0,05.

Ejemplo.

Una institución ambiental hizo un estudio para determinar si el sector habitacional se relaciona con el
grado de contaminación por plomo. Una muestra aleatoria de 300 personas a las que se les examinó
arrojó los siguientes resultados:

Sector Grado de contaminación


Habitacional Alto Medio Bajo

Gran vía 18 6 12
Coviefi 42 24 30

¿Cree usted que el sector habitacional se relaciona con el grado de contaminación por plomo? Use un
nivel de significancia de 0,05.
Pruebas para una Muestra

1. Prueba Chi cuadrado de bondad de ajuste

La prueba Chi cuadrado de bondad de Ajuste consiste en determinar si los datos de


cierta muestra corresponden a cierta distribución poblacional. En este caso es
necesario que los valores de la variable en la muestra y sobre la cual queremos realizar
la inferencia esté dividida en clases de ocurrencia, o equivalentemente, sea cual sea la
variable de estudio, deberemos categorizar los datos asignado sus valores a diferentes
clases o grupos.

Ejemplo.
Estamos interesados en comprobar la perfección de un dado cúbico (un dado normal
de 6caras). Para esto realizamos 100 lanzamientos del dado anotando los puntos
obtenidos encada lanzamiento. A la vista de los resultados obtenidos, ¿podemos
concluir que el dadono es perfecto? Utilice un nivel de significancia de 0,05.

Puntuación Veces

1 14
2 22
3 18
4 17
5 20
6 9

Planteamiento de Hipótesis:

H0 : La distribución del dado es uniforme.


H1 : La distribución del dado no es uniforme.
Elegimos un nivel de significancia de 0,05,

Para la Prueba Chi cuadrado se procede de la siguiente manera:

Analizar Pruebas no paramétricasChi cuadrado…


2. Prueba de Rachas

La prueba de rachas sirve para evaluar si una determinada secuencia de observaciones


es aleatoria, es decir, para estudiar si las observaciones de una determinada muestra
son independientes entre sí.
El concepto de racha hace referencia a una secuencia de observaciones de un mismo
tipo. Supongamos que se lanza una moneda al aire 10 veces y se obtiene el siguiente
resultado: CCCXCCXXXC. En este resultado hay 5 rachas: CCC, X, CC, XXX y C. a
simple vista el resultado obtenido es aleatorio.
Pues bien, la prueba de las rachas permite determinar si el número de rachas
observado en una determinada muestra de tamaño n es lo suficientemente grande o lo
suficientemente pequeño como para poder rechazar la hipótesis de independencia (o
aleatoriedad) entre las observaciones.

Ejemplo.
Verificar si los elementos correspondientes a una muestra de 7 elementos pueden
considerarse una secuencia aleatoria. Utilice un nivel de significancia de 0,05.
505 495 496 497 501 502 520

Planteamiento de Hipótesis:

H0 : La secuencia de observaciones es aleatoria


H1 : La secuencia de observaciones no es aleatoria

Elegimos un nivel de significancia del 0,05,

Procedimiento a seguir con el SPSS

Para la Prueba Chi cuadrado se procede de la siguiente manera:

Analizar Pruebas no paramétricasRachas…

S-ar putea să vă placă și