Sunteți pe pagina 1din 9

TABLAS DE CONTINGENCIA CON CHI CUADRADA

TABLAS DE CONTINGENCIA

Pgina 1 de 9

TABLAS DE CONTINGENCIA CON CHI CUADRADA

TABLAS DE CONTINGENCIA
1. TABLAS DE CONTINGENCIA
2

La tabla ji- cuadrada ( 2 ) se utiliza principalmente : Para probar si una serie de datos observada, concuerda con el modelo (serie esperada) de la informacin. Para probar las diferencias entre las proporciones de varios grupos (tabla de contingencia).

Para todos los casos, Ho: No hay diferencia o no hay dependencia entre variables H1: Hay diferencia o si hay dependencia entre variables Pasos para realizar la tabla de contingencias 2 1) Plantear las hiptesis:
Ho = p1 = p 2 = p3 ... = p k

H1: al menos dos proporciones son diferentes. 2) Construir una tabla que contenga los valores observados. 3) Sumar los totales de los renglones y columnas de los valores observados. 4) Debajo de cada valor observado poner el valor esperado utilizando la frmula:
Eij =

( total de i simo rengln total de j sima columna )

n 5) Calcular el valor del estadstico de prueba 2 usando la frmula: (Oij Eij ) 2 = Eij

donde: Oij = Valor observado de la celda i,j. Eij = Valor esperado de la celda i,j 6) Determinar los grados de libertad mediante: gl = ( r 1)( c 1) donde r = nmero de renglones c = nmero de columnas 7) Calcular el valor crtico en la tabla 2 8) Criterio de decisin: si el valor crtico < valor del estadstico de prueba rechazamos Ho

Pgina 2 de 9

TABLAS DE CONTINGENCIA CON CHI CUADRADA

Ejemplo: Al final de un semestre, las calificaciones de matemticas fueron tabuladas en la siguiente tabla de contingencia de 3 2 para estudiar la relacin entre la asistencia a clase y la calificacin obtenida. No Ausencias Aprobado aprobado 0-3 135 110 4-6 36 4 7 - 45 9 6 Con = 0.05 , indican los datos que son distintas las proporciones de estudiantes que pasaron en las tres categoras de ausencias? H0 : p 1 = p 2 = p 3 H1 : al menos dos proporciones son diferentes.
Nmero de ausencias Aprobado No aprobado 0-3 135 110 ( ) ( ) 4-6 36 4 ( ) ( ) 7-45 9 6 ( ) ( ) Total 180 120 Total 245 ( ) 40 ( ) 15 ( ) 300

Los valores Oij = 135, 110... corresponden a los valores observados, los valores esperados se colocan en las celdas con parntesis, para calcular los utilizamos la frmula:
E ij =

( total de i simo rengln total de j sima columna )


n
Total 245 40 15 300

Nmero de ausencias Aprobado No aprobado 0-3 135 110 (147) (98) 4-6 36 4 (24) (16) 7-45 9 6 (9) (6) Total 180 120

Calculamos el valor del estadstico de prueba 2 usando la frmula:


2 =

(O

ij

Eij ) 2 Eij

La tabla siguiente nos ayuda a organizar los clculos para el estadstico.

Pgina 3 de 9

TABLAS DE CONTINGENCIA CON CHI CUADRADA


Celda (1,1) (1,2) (2,1) (2,2) (3,1) (3,2) Oij 135 110 36 4 9 6 Eij 147 98 24 16 9 6 (Oij-Eij)^2 (Oij -Eij)^2/Eij 144 0.98 144 1.47 144 6.00 144 9.00 0 0.00 0 0.00 17.45

Tabla. Clculos para el estadstico Chi cuadrada Para determinar el valor crtico del estadstico de prueba procedemos de la siguiente manera: Determinar los grados de libertad usando la frmula: gl = ( r 1)( c 1) ,gl = (3-1)(2-1) = 2 2 El valor critico del estadstico ji-cuadrada para = 0.05 y g.l. = 2 se denota 0.05 (2) , En la tabla ji- cuadrada encontramos que vale 5.991, el valor del estadstico de prueba es 2 =17.44. Conclusin: Como este estadstico est localizado en la regin de rechazo (a la derecha del valor crtico) , rechazamos Ho por lo cual aceptamos la hiptesis alternativa H 1: al menos dos proporciones son diferentes. La tasa de aprobacin si depende de las asistencias. Conclusin: Como el estadstico calculado Chi cuadrado es mayor al Chi de alfa y el valor P es menor a Alfa, se rechaza Ho indicando que si hay dependencia de los aprobados y asistencias.

Ejercicio 1. Se trata de ver si el nmero de reclamaciones depende de la marca para un 5% de nivel de significancia. Ho: Los rechazos son independientes de la marca. Ha: los rechazos dependen de la marca
marca 1 2 3 OK 200 150 210 Rech 35 24 40

Ejercicio 2. Los datos de 3 proveedores en relacin a partes defectuosas es como sigue: Probar a un 5% de significancia si los defectos dependen del tipo de proveedor.
Proveedor A B C Buenos 90 170 135 Con Def menores 3 18 6 Con def graves 7 7 9

Pgina 4 de 9

TABLAS DE CONTINGENCIA CON CHI CUADRADA

Procedimiento de tablas de contingencia con SPSS


Las tablas de contingencia nos permiten realizar comparaciones de Relacin / Independencia entre dos o ms variables categricas, ya sean de tipo Nominal u Ordinal. En este tipo de tablas se definen las categoras de una variable a travs de la frecuencia o el porcentaje de las categoras de una segunda variable. Para comprender el concepto nos apoyaremos en los resultados de la encuesta piloto realizada a 20 personas cuyas preguntas son Gnero del encuestado? y Tiene telfono celular?. Los resultados de estas preguntas se plasman en las tablas de la figura. Si nos fijamos en los resultados de la tabla del Gnero, notaremos que el 35% de los encuestados corresponde a los hombres, mientras el 65% restante corresponde a las mujeres. As mismo, si nos fijamos en la tabla de tenencia de telfono celular, observaremos que el 40% de los encuestados si tiene, mientras el 60% no tiene. A travs de una tabla de contingencia podemos obtener la relacin de estas dos preguntas, identificando aspectos como cuntos hombres tienen telfono celular? o cuantas mujeres no tienen telfono celular?.

Figura

Para generar una tabla de contingencia, es necesario vincular las categoras de una de las variables en las Filas y las categoras de la segunda variable en las Columnas. Si introducimos las categoras de la variable Gnero en las Filas y las categoras de la variable Telfono celular en las Columnas obtendramos la tabla de la figura [6-2], en donde la posicin uno (1) representa a los hombres que tienen telfono, la posicin dos (2) representa a los hombres que No tienen telfono; la posicin tres (3) representa a las mujeres que tienen telfono y la posicin cuatro (4) a las mujeres que No tienen telfono. Para hallar la frecuencia de cada una de estas opciones, es necesario acudir a los datos y verificar cuantos de los hombres y mujeres tienen telfono y cuantos no. Los resultados de este procedimiento son expuestos en la figura siguiente. Adems de las frecuencias de cada uno de los cruces de categoras, tambin se acostumbra introducir Totales en las filas y columnas, con el fin de obtener la mayor cantidad de informacin posible de las variables.

Figuras

Si nos fijamos en la tabla de la figura [6-3], notaremos que los dos totales dan como resultado final, el nmero de encuestados (que para el caso corresponde a 20). La nica condicin que debe cumplir un caso (Respuestas de un encuestado) para ser incluido en la tabla de contingencia, es tener una respuesta o valor valido en las dos o ms variables que compongan la tabla de lo contrario, el caso ser excluido. Por ejemplo, si uno de los encuestados no responde la pregunta del Gnero, pero si la del Telfono o viceversa, el caso ser excluido al momento de generar la tabla de contingencia.

Pgina 5 de 9

TABLAS DE CONTINGENCIA CON CHI CUADRADA

Las tablas de contingencia pueden servir a diferentes propsitos como el anlisis descriptivo, en cuyo caso el objetivo es proporcionar informacin condensada que describa las categoras de las variables involucradas, sin realizar comparaciones explicitas que generen conclusiones de una poblacin. A su vez este tipo de tablas tambin pueden ser empleadas para la generacin de anlisis de Inferencia, en donde se intenta extraer conclusiones sobre las relaciones de las variables que puedan ser aplicadas a una poblacin. Para este objetivo se emplean pruebas estadsticas a los datos de una muestra (por lo general la prueba de independencia de Chi-cuadrado). Para generar una tabla de contingencia es necesario tener un archivo de datos abierto en el Editor de datos de SPSS. Los ejemplos de este captulo se realizarn con los datos del archivo Cruces.sav incluido en la carpeta Captulo6 del CD adjunto, por lo que debemos ir al men Archivo..Abrir..Datos y por medio de la ventana de navegacin ubicar el archivo en la unidad de CD ROM. Una vez abierto el archivo, podemos ejecutar el procedimiento, el cual se encuentra en el men Analizar... Estadsticos descriptivos...Tablas de contingencia [Fig.A]; al hacer clic sobre el procedimiento aparece el cuadro de dilogo correspondiente [Fig.B]. Este cuadro de dilogo esta dividido en cuatro secciones (Lista de variables, Casillas de seleccin, Opciones de resultados y Botones de opcin).

Figuras A y B

En la seccin Casillas de seleccin, encontramos las tres ubicaciones que podemos emplear para las variables de la tabla (Filas, Columnas o Capas); al ingresar una variable a la casilla Filas, sus categoras definen cada una de las filas de datos de la tabla; a su vez al ingresar una variable en la casilla Columnas, sus categoras definen cada una de las columnas de la tabla. Si se ingresan mltiples variables a una de las casillas, el programa genera una tabla de contingencia para cada combinacin de variables de fila y columna. Por ltimo encontramos la casilla de Capa; al ingresar una variable en esta casilla, el programa genera una tabla de contingencia para cada una de las categoras de la variable de Capa. Para comprender mejor la metodologa empleada en las tablas de contingencia y los elementos que nos facilita el procedimiento, en las siguientes lecciones vamos a generar una serie de ejemplos, intentando aumentar la complejidad de forma gradual. Todas las pruebas con que cuenta las tablas de contingencia se encuentran ubicadas dentro de las opciones del botn Estadstico. Al hacer clic en l aparece el cuadro de dilogo correspondiente.

Pgina 6 de 9

TABLAS DE CONTINGENCIA CON CHI CUADRADA

Dentro de las diferentes pruebas estadsticas de asociacin que nos ofrece el procedimiento encontramos el Chi-cuadrado de Pearson, Chi-cuadrado de la razn de verosimilitud, prueba de asociacin lineal por lineal, prueba exacta de Fisher, Chi-cuadrado corregido de Yates, r de Pearson, rho de Spearman, coeficiente de contingencia, phi, V de Cramer, lambdas simtricas y asimtricas, tau de Kruskal y Goodman, coeficiente de incertidumbre, gamma, d de Somers, tau-b de Kendall, tau-c de Kendall, coeficiente eta, kappa de Cohen, estimacin de riesgo relativo, razn de ventajas, prueba de McNemar, estadsticos de Cochran y Mantel-Haenszel. La mayora de estas pruebas nos permiten comprobar si existe alguna relacin entre las variable, generando un nmero para representar la fuerza de la relacin. Por el momento slo haremos nfasis en el Chi-cuadrado de Pearson, la cual es la ms utiliza. Esta prueba nos permite determinar si el comportamiento de las categoras de una variable presentan diferencias Estadsticamente significativas. Para establecer la diferencia a travs de SPSS, debemos partir de la teora que no existe relacin entre las variables de la tabla de contingencia (Hiptesis nula); es decir, debemos asumir que los resultados de las categoras de una variable no se ven afectados o influenciados por las categoras de la segunda variable. El clculo del Chi-cuadrado arroja como resultado un valor numrico denominado alfa (a), el cual debe ser comparado con el valor terico de 0.05. Cuando el valor calculado es menor que el 0.05 se rachaza la hiptesis nula, con lo cual podemos concluir que si existe una relacin entre las variables; por el contrario si el valor calculado es mayor que 0.05 no se rechaza la hiptesis nula aceptando que no existe ninguna relacin entre las variables. A manera de ejemplo vamos a generar la prueba de asociacin del Chi-cuadrado para las variables Gnero y Estado civil; para lograrlo debemos volver al cuadro de dilogo y hacer clic en el botn Restablecer de manera que se retome la configuracin inicial del procedimiento. Una vez se habilita el cuadro, ubicamos en el listado la variable Estado civil y la ingresamos en la casilla Filas; sucesivamente ubicamos la variable Gnero y la ingresamos en la casilla Columnas. A continuacin seleccionamos el botn Estadsticos y activamos la opcin Chi-cuadrado, haciendo clic sobre la opcin. Para finalizar hacemos clic en Continuar y luego en Aceptar con lo que los resultados son creados en el visor (figura siguiente)

Pgina 7 de 9

TABLAS DE CONTINGENCIA CON CHI CUADRADA

Figura 6-24

Como de costumbre el programa genera la tabla del resumen del procesamiento y la tabla de contingencia, pero adicionalmente genera una tercera tabla denominada Pruebas de Chi-cuadrado. En ella aparecen los valores del Chi-cuadrado y la razn de verosimilitud los cuales son calculados con base a la diferencia entre las frecuencias observadas y las esperadas. De todos los valores que se incluyen en la tabla, slo hay uno que realmente nos interesa y es el valor correspondiente a la significacin asinttica (Bilateral) de la prueba Chi-cuadrado de Pearson; este valor es el resultado de la prueba y es el que se emplea para realizar la comparacin. De acuerdo al resultado podemos concluir que las variables Estado civil y Gnero si tienen relacin ya que el valor obtenido es menor que [0.05]. Existen tres factores que pueden alterar el resultado de las pruebas de asociacin e independencia como lo son el tamao de la muestra, la fidelidad de los datos y el sesgo muestral; antes de sacar alguna conclusin es necesario revisar estos factores ya que cualquiera de ellos puede distorsionar severamente el resultado. Para concluir con las tablas de contingencia vamos a revisar el ltimo botn de opcin que podemos encontrar en el cuadro de dilogo, el cual corresponde a Exactas (Este botn slo est disponible si se ha instalado el mdulo de pruebas exactas). Al seleccionar este botn, aparece el cuadro de dilogo correspondiente [Fig.]; a travs de sus opciones se proporcionan dos mtodos adicionales para calcular los niveles de significacin de los estadsticos disponibles en los procedimientos Tablas de contingencia y Pruebas no paramtricas. Estos mtodos (el mtodo exacto y el de Monte Carlo), proporcionan el medio para obtener resultados exactos cuando los datos no cumplen alguno de los supuestos subyacentes necesarios para obtener resultados fiables.

Figura

Pgina 8 de 9

TABLAS DE CONTINGENCIA CON CHI CUADRADA

Las pruebas exactas permiten obtener un nivel de significacin exacto sin confiar en supuestos que los datos podran no cumplir. Por ejemplo, los resultados de un examen de calidad de 20 empaques en una fbrica muestran que los cinco empaques plsticos superaron la prueba, mientras que los resultados de los empaques de papel son diversos. Una prueba de Chi-cuadrado de Pearson, que contrasta la hiptesis nula de que los resultados son independientes del material, produce un nivel de significacin asinttico del 0,07. Este resultado lleva a la conclusin de que los resultados del examen son independientes del material del empaque. Sin embargo, dado que los datos incluyen slo 20 casos y las casillas tienen frecuencias esperadas menores que 5, este resultado no es fidedigno. Al realizar una prueba exacta a la muestra obtenemos que el Chi-cuadrado de Pearson es de 0,04, lo que conduce a la conclusin contraria. Segn la significacin exacta, se concluir que los resultados del examen y el material del empaque estn relacionados. Esto demuestra la importancia de la obtencin de resultados exactos cuando no se pueden cumplir los supuestos del mtodo asinttico. La significacin exacta es siempre fiable, independientemente del tamao, la distribucin, la dispersin o el equilibrio de los datos. En conclusin, el procedimiento Tablas de contingencia nos permite realizar tablas en las que se describan las categoras de una variable a travs de las categoras de una segunda variable. Para efectuar la descripcin se pueden emplear diferentes medidas como el recuento, el porcentaje de fila, el porcentaje de columna o el porcentaje de tabla. Adicionalmente este procedimiento nos permite generar grficos de barras con las variables involucradas en la tabla, as como tambin pruebas estadsticas de independencia como el Chi-cuadrado de Pearson e incluso generar pruebas estadsticas de precisin como el mtodo de Monte Carlo o el mtodo Exacto

Pgina 9 de 9

S-ar putea să vă placă și