Sunteți pe pagina 1din 32

PRUEBA DE SIGNIFICANCIA

CHI CUADRADO

Qu es la Chi Cuadrada?
Es una prueba estadstica para evaluar hiptesis acerca de la relacin entre dos variables categricas Se simboliza por 2

Hiptesis a probar : Correlacinales ( H0 : no hay asociacin y H1 hay asociacin)


Variables involucradas: Dos, esta prueba no considera relaciones causales Nivel de medicin de las variables: Nominal u ordinal

Otras caractersticas
Es una distribucin asimtrica
Slo toma valores positivos y es asinttica con respecto al eje de las x positivas ( 0 < 2 < +) Est caracterizada por un nico parmetro n llamado grados de libertad adoptando formas distintas segn el valor de n El rea comprendida entre la curva y el eje de las x es 1 100%

Aplicaciones
Entre las aplicaciones ms frecuentes de distribucin en el rea de salud, podemos sealar:
1.

esta

La prueba de asociacin, la cual permite al investigador determinar si existe asociacin entre dos variables en escala de medicin nominal u ordinal. Tambin aparece en la literatura con el nombre de tablas de contingencia La prueba de bondad de ajuste

2.

PROCEDIMIENTO
Se calcula a travs de una tabla de contingencia o tabulacin cruzada. Es una tabla de dos dimensiones y cada dimensin contienen una variable Cada variable se subdivide en dos o ms categoras.

Ejemplo: tabla 2x2 => cada dgito indica una variable y el valor de este indica el nmero de categoras de la variable

Ejemplo de una Tabla de Contingencia


Dos variables : voto y sexo
Cada variable con dos categoras VOTO
CANDIDATO B

CANDIDATO A

MASCULINO

SEXO
FEMENINO

Ejemplo Tabla 2x3

Norte
Partido 1

Sur
100 280 120

180 190 170

Identificacin politica

Partido 2

Partido 3

Zona Distrito electoral

En esencia la prueba de Chi Cuadrado es .......

es una prueba que parte del supuesto de no relacin entre las variables
una comparacin entre la tabla de frecuencias observadas y la denominada tabla de frecuencias esperadas La lgica es Si no hay relacin entre las variables debe tenerse una tabla como la de frecuencias esperadas, si la hay la tabla que obtengamos como resultado de nuestra investigacin debe ser muy diferente respecto de la tabla de frecuencias esperadas

Paso a paso....................
1. En la tabla de contingencia se anotan las frecuencias observadas en la muestra de la investigacin.
Se calculan las frecuencias esperadas para cada celda

2.

fe = (total marginal de rengln)*(total marginal de columna)


N donde N= nmero total de frecuencias observadas

Paso a paso....................
3. Se aplica la siguiente frmula de Chi Cuadrada:

2 = (O E) / E
donde O = frecuencia observada en cada celda E = frecuencia esperada en cada celda
Es decir: Se calcula la diferencia entre la frecuencia observada y la esperada, esta diferencia se eleva al cuadrado y se divide entre la frecuencia esperada. Finalmente, se suman estos resultados y la sumatoria es el valor de la 2 obtenida

Otra forma de calcular Chi Cuadrado es.............

Procedimiento para calcular la Chi Cuadrada O E OE ( O E ) ( O E ) / E

Celda
Zona Norte / P 1
Zona Norte / P 2 Zona Norte / P3 Zona Sur / P 1 Zona Sur / P 2 Zona Sur/ P 3

180
190 170 100 280 120

145,4
244,4 150,6 134,6 226,0 139,4

34,6
-54,4 19,4 -34,6 54,0 -19,4

1.197,16
2.959,36 376,36 1.197,16 2.916,00 376,33

8,23
12,11 2,50 8,89 12,90 2,7

2 = 47,33

Paso a paso.................
4. Clculo del Ji cuadrada crtico: el cual se obtiene de una tabla especfica, en donde se busca la interseccin entre los grados de libertad y el nivel de significacin gl = ( r-1)*(c-1) donde r = n de renglones de la tabla de contingencia c = n de columnas
Ejemplo => gl = ( 3 1 ) * ( 2 1 ) = 2

Con un nivel de confianza de 0,05 0,01 y con los grados de libertad vamos a la tabla y obtenemos el valor 2

Paso a paso....................
5. Regin de rechazo R: est constituida por todos los valores del Ji cuadrado iguales o mayores que el Ji Cuadrado crtico Si nuestro valor calculado de 2 es igual o superior al de la tabla, decimos que las variables estn relacionadas ( 2 fue significativa En nuestro ejemplo => 2 tabla es 5,991 2 calculado es 47,33

El valor calculado por nosotros es muy superior al de la tabla : 2 es significativa, es decir estn relacionadas .

Observaciones
Mientras mayor sea la diferencia entre los valores observados y los esperados, mayor ser el valor de 2 y aumentar por tanto la probabilidad de rechazar la hiptesis de nulidad No se puede usar la prueba de 2 cuando el valor esperado en alguna celda es menor que 5, en ese caso debe usarse la probabilidad exacta de Fisher La suma de las frecuencias observadas debe coincidir con la suma de las frecuencias esperadas.

TABLAS DE CONTINGENCIAS OTRO USO

Qu otra utilizacin tienen las tablas de contingencia?

Son tiles para describir conjuntamente a dos o ms variables. Esto se hace convirtiendo las frecuencias observadas en frecuencias relativas o porcentajes

Qu otra utilizacin tienen las tablas de contingencia?


En una tabulacin cruzada puede haber tres tipos de porcentajes respecto a cada celda: Porcentaje en relacin al total de frecuencias observadas (N) Porcentaje en relacin al total marginal de la columna Porcentaje en relacin al total marginal del rengln Veamos un ejemplo: sexo
Preferencia por el conductor

Masc A B 25 40

Fem 25 60

Frecuencias observadas
25

En relacin a N En relacin a a + b En relacin a a + c

25,00%
38,46% 50,00%

a + c = 50

b
d

b+d

a + b = 65

c+d

N=100

Tabla N 1.- Tabla de contingencia para describir conjuntamente dos variables Sexo
Masculino Femenino

A
Preferencia por el conductor

25 25,0% 38,5% 50,0% 40 40,0% 61,5% 80,0%

25 25,0% 71,4% ,50,0% 10 10,0% 28,6% 20,0%

50

50

65

35

Comentario final
Una cuarta parte de la muestra est constituida por hombres que prefieren al conductor A, el 10 % son mujeres que prefieren al conductor B. Ms del 60% de los hombres pprefieren a B, etc..

EL TEST EXACTO DE FISHER

El test exacto de Fisher permite analizar si dos variables dicotmicas estn asociadas cuando la muestra a estudiar es demasiado pequea.

El test exacto de Fisher se basa en evaluar la probabilidad asociada a cada una de las tablas 2 x 2 que se pueden formar manteniendo los mismos totales de filas y columnas que los de la tabla observada. Cada una de estas probabilidades se obtiene bajo la hiptesis nula de independencia de las dos variables que se estn considerando.

La probabilidad exacta de observar un conjunto concreto de frecuencias a, b, c y d en una tabla 2 x 2 cuando se asume independencia y los totales de filas y columnas se consideran fijos viene dada por la distribucin hipergeomtrica:

a b ! c d !a c !b d ! p
n!a!b!c!d!
Esta frmula se obtiene calculando todas las posibles formas en las que podemos disponer n sujetos en una tabla 2 x 2 de modo que los totales de filas y columnas sean siempre los mismos, (a+b), (c+d), (a+c) y (b+d).

La probabilidad anterior deber calcularse para todas las tablas de contingencia que puedan formarse con los mismos totales marginales que la tabla observada. Posteriormente, estas probabilidades se usan para calcular valor de la p asociado al test exacto de Fisher.
Este valor de p indicar la probabilidad de obtener una diferencia entre los grupos mayor o igual a la observada, bajo la hiptesis nula de independencia.

Si esta probabilidad es pequea (p<0.05) se deber rechazar la hiptesis de partida y deberemos asumir que las dos variables no son independientes, sino que estn asociadas. En caso contrario, se dir que no existe evidencia estadstica de asociacin entre ambas variables.

Supongamos que el suceso investigado es, si una enfermedad es ms frecuente en el grupo de expuestos que en el de los no expuestos a un posible factor causal .tendremos la siguiente tabla

Grupo Expuesto

Si A

No B D

Total A+B C+D

No expuesto C

Total

A+C

B+D

El test exacto de Fisher


Ejemplo:
Supngase que un grupo de 16 personas se reuni a comer en un restaurante. Diez comieron pastel de mariscos y 6 comieron carne. Al da siguiente, 11 de los comensales amanecieron enfermos de gastroenteritis La tabla adjunta muestra las frecuencia de enfermos en los que comieron mariscos y en los que comieron carne. Lo que se quiere averiguar, es si la asociacin entre el tipo de comida y enfermar, es estadsticamente significativa
Enfermos Comida Mariscos Carne Total Si 9 2 11 No 1 4 5 Total 10 6 16

Procedimiento
La Ho = frecuencia de enfermos entre los que comieron mariscos es la misma que la de los que enfermaron despus de comer carne 11/16 =0,6875, la frecuencia de enfermos en el grupo total. Las probabilidades se pueden obtener en forma aproximada de la Tabla de Valores Crticos de D o C en la prueba de Fisher *,

Se busca la seccin de la tabla en que los totales del margen derecho son A + B ( 10) y C + D = 6.
Buscamos en la columna B o (A) si aparece 1, que es el valor de B en nuestro ejemplo. Dado que no se encuentra, se debe utilizar el valor de A=9

Procedimiento
Dado que tuvimos que buscar la fila del valor A = 9, lo que corresponde es buscar el valor de C en la tabla , que corresponde al valor 2. Valor observado es mayor o igual que el valor crtico indica asociacin => 2 2 para 5% de significancia. => se declara significativa la asociacin Si es valor observado es menor que el crtico , entonces no existe asociacin y se acepta la Ho Un valor 2 es suficiente para declarar significativa la asociacin entre el consumo de alimentos y la enfermedad a nivel de 5% pero no a nivel 2,5% o 1%

COEFICIENTES DE CORRELACION

Qu son los coeficientes de correlacin e independencia para tabulaciones cruzadas?


Son coeficientes que tambin sirven para evaluar si las variables incluidas en la tabla de contingencia o tabulacin cruzada estn correlacionadas

Algunos de estos coeficientes se pueden observar en la siguiente tabla resumen:

Coeficiente

Para tablas de contingencia 2x2

Nivel de medicin de las variables Nominal

Interpretacin

Phi ()

Vara de 0 a +1, donde 0 implica ausencia de correlacin entre las variables y +1 significa correlacin de manera perfecta Su valor mnimo es 0 ( ausencia de correlacin). Su valor mximo depende del tamao de la tabla de contingencia = > 2x2 ( 0 y 0,707) 3x3 ( 0 y 0,816) Vara de 0 a +1 ; donde 0 es nula correlacin y +1 es perfecta correlacin. Vara de 0 a +1 ; +1 significa que puede predecirse sin error a la variable dependiente definida en la tabla, sobre la base de la independiente

Coef. de Pearson

Cualquier tamao

Nominal

V de Cramer

Mayores de 2x2 Cualquier tamao

Nominal

Lambda (b)

Nominal

Coeficiente

Para tablas de contingencia

Nivel de medicin de las variables

Interpretacin

Gamma ( r)

Cualquier tamao

Ordinal

Vara de 1 a +1 , donde 1 es una relacin negativa perfecta y +1 una relacin positiva perfecta)

Tau-b de Kendall (Tau-b)

Cualquier tamao, pero ms apropiado para tablas con igual nmero de renglones y columnas

Ordinal

Vara de 1 a +1

D. De Somers

Cualquier tamao

Ordinal

Vara de 1 a +1