Sunteți pe pagina 1din 20

Universidad de Santiago de Chile Facultad de Ciencia Departamento de Matemtica y Ciencias de la Computacin Ingeniera Estadstica

Medidas de asociacin y sus pruebas de significancia.

Integrantes: Yeniffer Carreo Baeza. Alonso Pacheco Arru. Victor Guzmn Agurto. Profesor: Rodolfo Barra. Fecha: 22 de Noviembre 2010.

ndice.
Tema Introduccin Coeficiente C de Cramer Coeficiente Phi Coeficiente T de Kendall para rangos ordenados Coeficiente T de kendall por correlaciones parciales Ejemplos Conclusin Bibliografa Anexo 1 Anexo 2 Pgina 3 4 6 7 9 11 18 18 19 20

Introduccin.
Frecuentemente deseamos conocer si dos series de puntuaciones estn relacionadas y, si es as, el grado de su asociacin. Adems de presentar medidas de asociacin presentaremos pruebas estadsticas que determinan la significacin de la asociacin observada. El problema de medir el grado de asociacin entre dos series de puntuaciones es ms general que el de probar existencia de algn grado de asociacin en alguna poblacin. En el caso paramtrico, la medida usual de correlacin es el coeficiente de correlacin producto-momento r de Pearson. Si, para un conjunto determinado de datos la suposicin asociada con el coeficiente de correlacin producto-momento r de Pearson no es sostenible o no realista, entonces se debe usar uno de los coeficientes de correlacin y las pruebas estadsticas no paramtricas asociadas, las que estn disponibles tanto para datos tanto categricos como ordenados. El investigador encontrar que, especialmente con muestras pequeas, el cmputo de las medidas de asociacin y las pruebas de significacin no paramtricas no es ms difcil y frecuentemente es ms fcil que el cmputo de la r de Pearson.

Coeficiente C de Cramer.
El coeficiente C de Cramer es una medida del grado de asociacin o relacin entre dos series de atributos o variables. Se usa cuando tenemos slo informacin categrica (escala nominal). Para usar este coeficiente no es necesario suponer continuidad para las diferentes categoras usadas al medir uno o ambos conjuntos de atributos. Mtodo. Tenemos datos en dos series de variables categricas no ordenadas. Denotaremos estas variables como A y B, donde A tiene k categoras y B tiene r categoras, arreglamos las frecuencias conjuntas de la siguiente tabla de contingencia:

B1 B2

A1 n11 n21

A2 L n12 L n22 L

Ak n1 k n2 k

Total R1 R2 M Rr N

M M M O M Br nr 1 nr 2 L nrk Total C1 C2 L Ck

Se puede calcular el coeficiente de cramer de una tabla de 2x2, 2x4 o cualquier tabla de rxk, De tal tabla podemos obtener las frecuencias esperadas para cada celda (Eij). Mientras mayor sea la discrepancia entre esos valores esperados y los valores observados, ms alto es el grado de asociacin entre dos variables y, por lo tanto, ms grande el valor del coeficiente de Cramer. El grado de asociacin entre dos conjuntos de atributos al medirse por medio del coeficiente de Cramer, aunque sean o no ordenables, con variables continuas o discretas, con cualquier distribucin, se calcula por:

C= donde

X2 N ( L 1)
r k

X 2 =
i =1 j =1

(nij Eij ) 2 Eij


2 nij

X =
2 i =1 j =1 r k

Eij

L: es el nmero mnimo del nmero de filas o columnas de la tabla de contingencia. nij: frecuencia conjunta observada. Eij: frecuencia conjunta esperada. El coeficiente de Cramer tiene un valor mximo de 1 y ser igual a 0 cuando las variables o atributos sean independientes. El coeficiente Cramer no puede tomar valores negativos.

Resumen del procedimiento. 1- Arreglar las frecuencias observadas en una tabla de contingencia de rxk, donde r es la cantidad de categoras de una variable y k las categoras de la otra variable. 2- Determinar frecuencias esperadas para cada celda. Si ms cerca del 20% de las celdas tiene frecuencias esperadas menores que cinco o si cualquiera de las celdas tiene una frecuencia esperada menor que 1, combine las categoras (ya sea filas o columnas) para incrementar las frecuencias esperadas que sean deficientes. 3- Calcule el valor de X2 para los datos. 4- Use el valor de X2 para calcular el valor de C. (coeficiente de Cramer) Para probar si el valor observado de C indica que existe una asociacin significativa entre dos variables, determine la probabilidad asociada segn la hiptesis nula de un valor tan grande como el observado X2 con gl=(r-1)(k-1), consultando la tabla. Limitaciones del coeficiente de Cramer. Un ndice de correlacin muestra al menos una de las siguientes caractersticas: 1 cuando las variables sean independientes y exista una carencia completa de asociacin entre las variables, el valor del ndice debe ser 0. 2 cuando las variables muestren completa dependencia una de la otra, esto es, cuando estn perfectamente correlacionadas, el ndice debe ser 1. El coeficiente de Cramer tiene slo la primera caracterstica: que si no hay asociacin el valor de C es 0, sin embargo cuando es igual a la unidad, pudiera no ser una correlacin perfecta entre las variables. Esta es la primera limitacin de C. Cuando C=1, eso indica que las variables estn perfectamente correlacionadas cuando la tabla de contingencia asociada es cuadrada, esto es, cuando r=k, si la tabla de contingencia no es cuadrada, es aun posible que C sea igual a la unidad. Sin embargo, en este caso existe asociacin perfecta entre las variables en solamente una direccin. En el caso de que r<k, entonces, si C=1, existe una perfecta asociacin de la variable columna a la variable fila, pero no existe la perfecta asociacin en el sentido contrario. Una segunda limitacin es que los datos deben ser fciles de usar con el estadstico X2, con el propsito de que su significacin pueda ser interpretada aproximadamente. En la prctica, la regla comn concerniente a los valores esperados, es que la prueba pueda aplicarse aproximadamente slo si menos del 20% de las celdas en la tabla de contingencia tienen frecuencias esperadas menores que 5 y ninguna celda tiene una frecuencia esperada menor que 1. Una tercera limitacin de C es que no resulta directamente comparable con cualquier otra medida de correlacin. Cramer es apropiado para usarse con variables categricas (escala nominal). Podemos interpretar valores mayores de C como indicadores de un grado de relacin ms grande que los indicados por valores menores, las diferencias en la magnitud no tienen interpretacin directa. Ventajas. El coeficiente de Cramer no debe hacer suposiciones acerca de la forma de las distribuciones poblacionales de donde provienen las variables que estn siendo evaluadas, y no requiere continuidad en las variables, sino slo mediciones categricas de las mismas. Debido a esta libertad en las suposiciones, C puede usarse frecuentemente para indicar el grado de asociacin de dos conjuntos de variables, a las cual ninguna otra medida de asociacin es aplicable. Otra ventaja del coeficiente de Cramer es que permite al investigador comparar tablas de contingencia de diferentes tamaos y, lo ms importante, tablas basadas en diferentes tamaos de muestra. Aunque es estadstico X2, no mide la independencia de dos variables y es sensible al tamao de la muestra.

Coeficiente Phi para tablas de 2x2.


El coeficiente Phi es una evaluacin de la asociacin o relacin entre dos conjuntos de atributos medidos en una escala nominal, cada uno de los cuales puede tomar slo dos valores. Mtodo. Para calcular el coeficiente Phi, es conveniente arreglar los datos en una tabla de 2x2. Ya que los datos son dicotmicos, supondremos que son codificados como 0 y 1 para cada variable, aunque pueda ser usada cualquier asignacin de valor binario. Variable Y 1 0 Total Variable X 0 1 A C A+ C B D B+ D Total A+B C+D N

El coeficiente Phi, se calculara de la siguiente manera:

r =

| AD BC | ( A + B )(C + D)( A + C )( B + D)

Cuyo rango puede ser desde 0 hasta 1. El coeficiente phi est relacionado con el estadstico X2 que se usa para probar la independencia de variables categricas (medidas nominalmente). De aqu que la significacin del coeficiente Phi pueda probarse al usar el estadstico X2 de la siguiente manera:

N N | AD BC | 2 X2 = ( A + B )(C + D)( A + C )( B + D)
Comparando este valor con X2 con un grado de libertad. Se advierte que si el tamao de la muestra es pequeo, la significacin de Fisher. Resumen del procedimiento. 1- Arregle las observaciones en una tabla de contingencia de 2x2.

r puede probarse mediante la prueba exacta de

2- Use las frecuencias para calcular el coeficiente Phi. ( r ) 3- Para probar si el valor observado de r indica que existe una asociacin significativa
entre las dos variables en la poblacin muestreada, determine el estadstico asociado a la chi cuadrada X2.

Coeficiente de correlacin T de Kendall de rangos ordenados.


El coeficiente de correlacin de T de Kendall para rangos ordenados es adecuado como una medida de correlacin con la misma clase de datos para los cuales es til. Esto es, si al menos se han logrado medidas ordinales de ambas variables X e Y, tal que a cada sujeto pueda serle asignado un rango tanto en X como en Y, entonces TXY, proporcionar una medida del grado de asociacin o correlacin entre los dos conjuntos de rangos. Una ventaja de la correlacin de T de Kendall respecto a la correlacin de Spearman es que la T de Kendall puede ser generalizada a un coeficiente de correlacin parcial. Mtodo. En primera instancia, se deben tomar los valores de X y ordenarlos de forma natural (creciente), parendolas con sus respectivas observaciones de Y. Luego se toma, en orden, el primer valor de Y, y se compara con todos los valores siguientes (ubicados hacia la derecha). Cuando el valor de la derecha es menor al valor fijo, se le asigna el valor -1 (desacuerdo), en el caso en que el valor de la derecha sea mayor, se le asigna el valor +1 (acuerdo), en el caso en que sean iguales, se le asigna el valor 0. Luego, se define T como:

T=

# de acuerdos - # de desacuerdos nmero total de pares N , que puede ser expresado como 2

En general, el nmero mximo posible total ser

N ( N 1) . Esta expresin es el denominador del estadstico T. Para el numerador, 2


denotaremos la suma observada de puntuaciones +1 como acuerdos y puntuaciones -1 como desacuerdos para todos los pares posibles. Entonces:

T=

2S N ( N 1)

Donde N es el nmero de objetos o individuos colocados en rangos tanto para X como para Y. Observaciones empatadas. Cuando dos o ms observaciones estn empatadas ya sea en la variable X o Y, utilizaremos nuestro procedimiento usual en colocar rangos a las puntuaciones empatadas; se les da a las observaciones ligadas el promedio de los rangos que deberan haber recibido si no hubiese habido empates. El estadstico se calcula de la siguiente forma:

T=
Donde:

2 S N ( N 1) Tx N ( N 1) TY

en la variable X. en la variable Y.

Tx = t (t 1) , siendo t el nmero de observaciones empatadas en cada grupo de empates Ty = t (t 1) , siendo t el nmero de observaciones empatadas en cada grupo de empates

Para la prueba de significancia, si N 10, existe una tabla para determinar la probabilidad exacta asociada a la ocurrencia. (ANEXO 1). Cuando N>10, la distribucin muestral T de Kendall se aproxima a la distribucin normal estndar, donde el estadstico queda como:

z=

3T N ( N 1) 2 (2 N + 5)

Resumen del procedimiento. 1- Arregle la lista de N sujetos de manera tal que los rangos de los sujetos en la variable X queden en su orden natural; esto es 1,, N. 2- Observe los rangos de Y en el orden en que ocurrieron cuando los rangos de X estn en el orden natural. Determine los valores de S, para los rdenes observados de Y. 3- Calcular el estadstico T, analizando cual usar dependiendo si hay o no empates. 4- Si los N sujetos constituyen una muestra aleatoria de alguna poblacin, se puede probar la hiptesis de que las variables son independientes en esa poblacin. El mtodo depende del tamao de la poblacin, esto es: a) Para N 10, ocuparemos la tabla del ANEXO 1. b) Para N>10, se har una aproximacin a una distribucin normal. Si la probabilidad resultante por el mtodo apropiado es igual o menos que un , H0 puede ser rechazado a favor de H1.

Coeficiente de correlacin parcial Txy.z de Kendall para rangos ordenados.


Cuando se observa correlacin entre dos variables, existe siempre la posibilidad de que la correlacin se deba a la asociacin entre cada una de las dos variables y una tercera variable. Estadsticamente, este problema puede ser atacado por mtodos de correlacin parcial, que es lo que veremos a continuacin. Para usar este mtodo no-paramtrico, debemos tener datos que estn medidos en al menos una escala ordinal. No necesita hacer suposiciones acerca de la forma de la distribucin de puntuaciones observadas en la poblacin.

X par / Y par + + A C Total A+C

B D B+D

Total A+ B C+D N

+ : Signo de acuerdo con el signo de Z; - : Signo de desacuerdo con el signo de Z. El coeficiente de correlacin parcial Txy.z de Kendall de rangos ordenados (la correlacin entre X e Y manteniendo Z constante), se define como:

Txy. z =
Mtodo.

AD BC ( A + B )(C + D)( A + C )( B + D)

Aunque el mtodo mostrado para calcular Txy.z es til para revelar la naturaleza del coeficiente de correlacin parcial, al incrementar el valor de

observaciones, podemos expresar la ecuacin de Kendall de la siguiente manera:

N , el nmero de pares de N 2

Txy. z =

Txy Txz Tyz


2 2 (1 Txz ) (1 Tyz )

Para usarla primero se deben calcular las correlaciones de T de Kendall entre X e Y, X y Z, e Y y Z. Para la prueba de significancia, en el caso N20, se ocupar la tabla del ANEXO 2. Cuya hiptesis es: fija. Para grandes valores de N, la distribucin Txy.z es complicada, pero se aproxima a una distribucin normal estndar, quedando el estadstico de la siguiente forma:

xy .z = 0 que las variables X e Y son independientes para una variable Z

z=

3 Txy. z N ( N 1) 2 (2 N + 5)

Resumen del procedimiento. Sean X e Y las dos variables cuya relacin se desea determinar, y sea Z cuyo efecto sobre X e Y se va a mantener constante. 1- Ordene las variables desde 1 hasta N 2- Calcular Txy, Txz y Tyz, para luego poder calcular Txy.z 3- Para probar la significancia del estadstico, el valor obtenido de Txy.z se compara con los valores crticos del estadstico proporcionado por la tabla (ANEXO 2). Para valores grandes de N se aproximar a una distribucin normal estndar.

10

Ejemplos.
1. COEFICIENTE C DE CRAMER. Un investigador desea saber si la cantidad de nacimientos ocurridos en hospitales pblicos o privados, estn asociados (y su grado de asociacin) con la escolaridad de la madre. El total de nacimientos ocurridos es de 63 y los datos obtenidos estn agrupados en la siguiente tabla: Escolaridad Bsica Media Universitaria Total 2. COEFICIENTE PHI. Se pretende conocer la relacin que existe entre la zona residencial y la opinin sobre condena de pena de muerte como reductor de criminalidad. Se tom la opinin de 220 personas, distribuidas por zona residencial urbano-rural, sobre si la pena de muerte debe aplicarse como reductor de criminalidad. Los resultados conseguidos estn en la siguiente tabla: Opinin sobre pena de muerte SI NO Total 3. T DE KENDALL. Una macroempresa selecciona graduados para puestos de trabajo aplicando una entrevista y un examen psicolgico. A la oficina del personal le interesaba determinar si las calificaciones del examen tenan alguna correlacin con los resultados de la entrevistas. 10 candidatos fueron evaluados en entrevista y entonces se les aplic el examen. La siguiente tabla contiene los resultados pareados. Individuo 1 2 3 4 5 6 7 8 9 10 Calificacin de la entrevista 8 5 10 3 6 1 4 7 9 2 Calificacin del examen 74 81 65 83 66 94 96 70 61 86 Zona Urbana 90 10 100 Zona Rura l 7 113 120 Total 97 123 220 Hospital Pblico 19 12 7 38 Hospital Privado 2 5 18 25 Total 21 17 25 63

4. T DE KENDALL CORRELACIONES PARCIALES.

11

Un investigador est interesado en conocer la asociacin entre el desarrollo mental de nios con respecto a la educacin formal de sus madres. En esta ocasin desea conocer si los aos de escolaridad de la madre actan en el desarrollo mental de los hijos. Adems se midi la estimulacin en el hogar, con base a aspectos diferentes, como reas fsicas disponibles para que el nio explore, diversificacin de juguetes, afecto de los padres hacia el nio, sensibilidad de los padres frente a las necesidades del hijo, etc. Los resultados son los siguientes: Aos de escolaridad materna 0 0 1 2 2 3 4 5 6 6 6 6 9 10 10 11 12 13 14 17 Solucin. 1. Con los resultados, lo primero que debemos hacer es determinar las frecuencias esperadas, las cuales seran: Escolaridad Bsica Media Universitaria Total Hospital Pblico 12.6666 10.2539 15.0793 38 Hospital Privado 8.3333 6.746 9.9206 25 Total 21 17 25 63 Estimulacin en el hogar 50 52 40 60 56 64 70 71 71 54 69 93 85 80 125 115 105 110 74 98 Desarrollo mental del nio 75 76 80 82 84 83 85 81 79 85 79 85 83 88 86 87 91 89 90 92

Ahora debemos calcular el estadstico X2:

2 =
=

(O

ij

Eij ) Eij

(19 12.6666)2 (12 10.2539)2 (7 15.0793)2 (2 8.3333)2 (5 6.746)2 (18 9.9206)2 + + + + + 12.6666 10.2539 15.0793 8.3333 6.746 9.9206

= 19.6376
Y por ltimo, calcular el coeficiente de Cramer. Para esto determinamos el valor de L, que es 2, ya que es el menor nmero entre el total de filas (3) y el total de columnas (2). Luego el coeficiente es:

12

C=

2 19.6376 = = 0.5583 N ( L 1) 63

De este resultado, se puede decir que existe una relacin dbil entre la escolaridad de las madres que tuvieron hijos y el lugar, hospital pblico o privado, donde llevaron a cabo su embarazo. Ahora se llevar a cabo el test para la significancia del coeficiente de Cramer. H0: C=0 vs H1: C0 =0.05 X2obs=19.6376 Este valor se debe comparar con el valor de tabla de X2 con gl=(2-1)(3-1)=2, con una significancia de 5%. X22=5.991 Por lo tanto, como X2obs>5.991, existe evidencia suficiente para rechazar la hiptesis nula de no-existencia de asociacin. 2. Con los resultados de la tabla procedemos a calcular el coeficiente como:

90 113 7 10 97 123 100 120

= 0.844

Este resultado nos dice que existe una relacin de carcter fuerte entre la opinin de las personas con respecto a que la pena de muerte debe aplicarse como reductor de criminalidad y la zona residencial donde viven. Para resolver su significancia, se procede a calcular el estadstico X2 asociado al coeficiente Phi. H0: =0 vs H1: 0 =0.05

220 220 90 113 7 10 2 2 obs = 97 123 100 120 = 153.3542

Este valor se compara con un X2 de un grado de libertad, el que sera igual, con una significancia del 5%, a 3.841. Por lo tanto, como nuestro valor observado es mucho mayor a 3.841, existe evidencia suficiente para rechazar la hiptesis nula de no-existencia de asociacin. 3. X: Calificacin de la entrevista = {0, 1,2,} Y: Calificacin del examen = {0, 1,2,} N=10

Luego, se deben ordenar las observaciones de X de menor a mayor y parearlas segn la tabla. Quedando: X Y 1 94 2 86 3 83 4 96 5 81 6 66 7 70 8 74 9 61 10 65

13

Luego se grafican las observaciones de tal forma de comparar todos los pares posibles, y para todos los valores mayores a la observacin fija, se le asigna un +1, si es menor, un -1 y si es igual un 0. Estos valores posteriormente se sumarn para formar el valor de S. Lo anterior queda como:

X 1 2 3 4 5 6 7 8 9 10 Luego el valor de T es:

Y 94 86 83 96 81 66 70 74 61 65 S

94 -1 -1 +1 -1 -1 -1 -1 -1 -1 -7

86 -1 +1 -1 -1 -1 -1 -1 -1 -6

83 +1 -1 -1 -1 -1 -1 -1 -5

96 -1 -1 -1 -1 -1 -1 -6

81 -1 -1 -1 -1 -1 -5

66 +1 +1 -1 -1 0

70 +1 -1 -1 -1

74 -1 -1 -2

61 -1 -1

65 31

T=

2S 2 31 = = 0.6888 N ( N 1) 10 9

Con el valor de T podemos decir que existe una correlacin fuerte, de carcter inverso, es decir, mientras mayor sea la calificacin en la entrevista, menor es la calificacin en el examen, y viceversa. Para su prueba de significacin, al ser N=10, se compara con el valor de la tabla del Anexo 1, que tiene el p-valor asociado al T observado. H0: T=0 vs H1: T0 =0.05 Luego, el p-valor asociado al valor absoluto del T observado, 0.6888, es 0.02, y al ser bidireccional la regin de rechazo, este valor se debe multiplicar por 2, resultando 0.04. Por lo tanto, como el p-valor es menor a 0.05, existe evidencia suficiente para rechazar la hiptesis de no-existencia de asociacin entre las variables. 4. X: Aos de escolaridad de la madre = {0, 1,2,} Y: Desarrollo mental del nio = {0, 1,2,} Z: Estimulacin en el hogar = {0, 1,2,} N=20

Ahora, para cada combinacin necesaria, es decir, XY, XZ e YZ, necesitamos ordenarlas de la misma manera del ejercicio anterior. Primero, calcularemos T para la combinacin XY. Por lo tanto ordenamos:
X Y 0 75 0 76 1 80 2 82 2 84 3 83 4 85 5 81 6 79 6 85 6 79 6 85 9 83 10 88 10 86 11 87 12 91 13 89 14 90 17 92

Y ordenamos y sumamos tal como el ejercicio anterior, pero para esta combinacin:

14

X 0 0 1 2 2 3 4 5 6 6 6 6 9 10 10 11 12 13 14 17

Y 75 76 80 82 84 83 85 81 79 85 79 85 83 88 86 87 91 89 90 92 S

75 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 19

76 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 18

80 +1 +1 +1 +1 +1 -1 +1 -1 +1 +1 +1 +1 +1 +1 +1 +1 +1 13

82 +1 +1 +1 -1 -1 +1 -1 +1 +1 +1 +1 +1 +1 +1 +1 +1 10

84 -1 +1 -1 -1 +1 -1 +1 -1 +1 +1 +1 +1 +1 +1 +1 5

83 +1 -1 -1 +1 -1 +1 0 +1 +1 +1 +1 +1 +1 +1 7

85 -1 -1 0 -1 0 -1 +1 +1 +1 +1 +1 +1 +1 3

81 -1 +1 -1 +1 +1 +1 +1 +1 +1 +1 +1 +1 8

79 +1 0 +1 +1 +1 +1 +1 +1 +1 +1 +1 10

85 -1 0 -1 +1 +1 +1 +1 +1 +1 +1 5

79 +1 +1 +1 +1 +1 +1 +1 +1 +1 9

85 -1 +1 +1 +1 +1 +1 +1 +1 6

83 +1 +1 +1 +1 +1 +1 +1 7

88 -1 -1 +1 +1 +1 +1 2

86 +1 +1 +1 +1 +1 5

87 +1 +1 +1 +1 4

91 -1 -1 +1 -1

89 +1 +1 2

90 +1 1

92 133

Luego, notamos que en las observaciones tanto de X como de Y existen empates, por lo tanto debemos calcular TX y TY. En las observaciones de X tenemos que el 0, 2 y 10, se repiten dos veces cada uno, y el 6 se repite 4 veces. En las observaciones de Y tenemos que los valores 83 y 79 se repiten dos veces cada uno y el 85 se repite tres veces. Quedando:

TX = 2(2 1) + 2(2 1) + 4(4 1) + 2(2 1) = 18 TY = 2(2 1) + 3(1) + 2(2 1) = 10


Luego, el valor de TXY es:

TXY =

2S

[ N ( N 1) TX ] [ N ( N 1) TY ]
0 5 2 1 4 0 2 6 0 2 5 6 3 6 4 4 7 0 5 7 1 6 7 1 6 5 4

2 133 = 0.7268 20 19 18 20 19 10

Ahora se calcular T para la combinacin XZ. Ordenamos:


X Z 0 5 0 6 6 9 6 9 3 9 8 5 1 0 8 0 10 12 5 11 11 5 12 10 5 13 11 0 1 4 7 4 17 98

Luego creamos la tabla:


X 0 0 1 2 2 3 4 5 6 6 6 6 9 Z 50 52 40 60 56 64 70 71 71 54 69 93 85 50 +1 -1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1

52 -1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1

40 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1

60 -1 +1 +1 +1 +1 -1 +1 +1 +1

56 +1 +1 +1 +1 -1 +1 +1 +1

64 +1 +1 +1 -1 +1 +1 +1

70 +1 +1 -1 -1 +1 +1

71 0 -1 -1 +1 +1

71 -1 -1 +1 +1

54 +1 +1 +1

69 +1 +1

93 -1

85

15

10 10 11 12 13 14 17

80 125 115 105 110 74 98 S

+1 +1 +1 +1 +1 +1 +1 17

+1 +1 +1 +1 +1 +1 +1 16

+1 +1 +1 +1 +1 +1 +1 17

+1 +1 +1 +1 +1 +1 +1 12

+1 +1 +1 +1 +1 +1 +1 13

+1 +1 +1 +1 +1 +1 +1 12

+1 +1 +1 +1 +1 +1 +1 9

+1 +1 +1 +1 +1 +1 +1 7

+1 +1 +1 +1 +1 +1 +1 7

+1 +1 +1 +1 +1 +1 +1 10

+1 +1 +1 +1 +1 +1 +1 9

-1 +1 +1 +1 +1 -1 +1 2

-1 +1 +1 +1 +1 -1 +1 3

80 +1 +1 +1 +1 -1 +1 4

125 -1 -1 -1 -1 -1 -5

115 -1 -1 -1 -1 -4

105 +1 -1 -1 -1

110 -1 -1 -2

74 + 1

98 127

Y notamos que existen empates igualmente. En X estn los mismos empates anteriores y en Z el valor 71 se repite dos veces. Por lo tanto los valores de Tx y TZ son:

TX = 18 TZ = 2(2 1) = 2
Ahora, el valor para TXZ es:

TXZ =

2S

[ N ( N 1) TX ] [ N ( N 1) TZ ]
7 6 5 2 7 9 7 1 7 9 6 9 8 0 4 0 8 1 7 1 8 2 6 0 8 3 6 4 8 3 8 5 8 4 5 6

2 127 = 0.6866 20 19 18 20 19 2

Ahora, nos falta el clculo de T para la combinacin YZ. Nuevamente ordenamos:


Y Z 7 5 5 0 8 5 7 0 8 5 5 4 8 5 9 3 86 12 5 87 11 5 8 8 8 0 89 11 0 9 0 7 4 91 70 5 92 98

La tabla para este caso:


Y 75 76 79 79 80 81 82 83 83 84 85 85 85 86 87 88 89 90 91 92 Z 50 52 71 69 40 71 60 64 85 56 70 54 93 125 115 80 110 74 105 98 S 50 +1 +1 +1 -1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 17

52 +1 +1 -1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 16

71 -1 -1 0 -1 -1 +1 -1 -1 -1 +1 +1 +1 +1 +1 +1 +1 +1 2

69 -1 +1 -1 -1 +1 -1 +1 -1 +1 +1 +1 +1 +1 +1 +1 +1 6

40 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 15

71 -1 -1 +1 -1 -1 -1 +1 +1 +1 +1 +1 +1 +1 +1 4

60 +1 +1 -1 +1 -1 +1 +1 +1 +1 +1 +1 +1 +1 9

64 +1 -1 +1 -1 +1 +1 +1 +1 +1 +1 +1 +1 8

85 -1 -1 -1 +1 +1 +1 -1 +1 -1 +1 +1 1

56 +1 -1 +1 +1 +1 +1 +1 +1 +1 +1 8

70 -1 +1 +1 +1 +1 +1 +1 +1 +1 7

54 +1 +1 +1 +1 +1 +1 +1 +1 8

93 +1 +1 -1 +1 -1 +1 +1 3

125 -1 -1 -1 -1 -1 -1 -6

115 -1 -1 -1 -1 -1 -5

80 +1 -1 +1 +1 2

110 -1 -1 -1 -3

74 +1 +1 2

105 -1 -1

98 93

Para este par de variables tambin existen empates, los cuales hemos denotado en los dos clculos anteriores, por lo tanto los valores de TY y TZ ya vienen dados y son:

TY = 10 TZ = 2
Quedando el valor de TYZ como:

TYZ =

2S

[ N ( N 1) TY ] [ N ( N 1) TZ ]

2 93 = 0.4973 20 19 10 20 19 2

16

Ahora, una vez teniendo todos los valores pedidos, calculamos TXY.Z, el cual queda como:

TXY |Z =

(1 T ) (1 T )
2 XZ 2 YZ

TXY TXZ TYZ

( 1 0.6866 ) ( 1 0.4973 )
2 2

0.7268 0.6866 0.4973

= 0.6111

De lo cual se puede decir que, dado la condicin de la estimulacin del nio en el hogar, la relacin entre la escolaridad de la madre y el desarrollo mental de sus hijos es fuerte y es directa, lo que quiere decir que a mayor escolaridad de la madre, mayor desarrollo mental del hijo. Ahora bien, se puede decir que la relacin entre la escolaridad de la madre y el desarrollo mental del nio (sin condicionar) es ms fuerte que condicionando a la estimulacin del hogar y de carcter directo (mayor escolaridad de la madre, mayor desarrollo mental del nio), y que la relacin entre la el desarrollo mental del nio con la estimulacin en el hogar es de magnitud media y directa. Para este caso, N=20, por lo tanto se debe utilizar la tabla del Anexo 2. H0: TXY.Z=0 vs H1: TXY.Z0 =0.05 Nuestro valor T crtico proporcionado por la tabla del Anexo 2, con una significancia de 2.5%, es 0.318, el cual, contrastndolo con nuestro valor observado, 0.6111, resulta ms pequeo, por lo tanto existe evidencia suficiente para rechazar la hiptesis de que las variables X e Y no estn correlacionadas en presencia de una variable fija Z.

17

Conclusin.
Determinar el grado de correlato entre dos o ms series de puntuaciones, es una situacin que la estadstica no paramtrica ha sabido plantear y resolver de manera adecuada, amoldndose a las diversas situaciones que puede enfrentar un experimentador frente a las diversas escalas de medicin, sin variar su interpretacin respecto a la popular r de Pearson del caso paramtrico. Adems, presentan la ventaja de poder determinar un grado de significancia ante una medida de asociacin observada y un menor nmero de supuestos para el clculo de sta, destacando la no suposicin de continuidad en los datos observados, en ciertos casos, y una nula distribucin de probabilidad en ellos. Para la asociacin de variables en escalas nominales destacan el coeficiente C de Cramer y el coeficiente Phi, en el caso en que las variables medidas tengan a lo menos una escala ordinal, el coeficiente T de Kendall para rangos ordenados es el adecuado en esta situacin, destacando el caso de la medida de asociacin entre dos variables cuando una tercera permanece constante (caso de la correlacin TXY.Z de Kendall para rangos ordenados).

Bibliografa.
Estadstica no paramtrica: aplicada a las ciencias de la conducta, Sidney Siegel y N. John Castelln, cuarta edicin, editorial Trillas, Mxico, 1995. Estadstica matemtica con aplicaciones, Dennis D. Wackerly, William Mendenhall III y Richard L. Scheaffer, sexta edicin, editorial Thomson, 2002.

18

Anexo 1. Tabla T de Kendall.


N 4 T 0.000 0.333 0.667 1.000 0.000 0.200 0.400 0.600 0.800 1.000 0.067 0.200 0.333 0.467 0.600 0.733 0.867 1.000 0.048 0.143 0.238 0.333 0.429 0.524 0.619 0.714 0.81 0.905 1.000 0.000 0.071 0.143 0.214 0.286 0.357 0.429 0.500 0.571 0.643 0.714 0.786 0.857 0.929 1.000 p-valor 0.625 0.375 0.167 0.042 0.592 0.408 0.242 0.117 0.042 0.008 0.500 0.360 0.235 0.136 0.068 0.028 0.008 0.001 0.500 0.386 0.281 0.191 0.119 0.068 0.035 0.015 0.005 0.001 0.000 0.548 0.452 0.360 0.274 0.199 0.138 0.089 0.054 0.031 0.016 0.007 0.003 0.001 0.000 0.000 N 9 T 0.000 0.056 0.111 0.167 0.222 0.278 0.333 0.389 0.444 0.500 0.556 0.611 0.667 0.722 0.778 0.833 0.944 1.000 0.022 0.067 0.111 0.156 0.200 0.244 0.289 0.333 0.378 0.422 0.467 0.511 0.556 0.600 0.644 0.689 0.733 0.778 0.822 0.867 0.911 0.956 1.000 p-valor 0.540 0.460 0.381 0.306 0.238 0.179 0.130 0.090 0.060 0.038 0.022 0.012 0.006 0.003 0.001 0.000 0.000 0.000 0.500 0.431 0.364 0.300 0.242 0.190 0.146 0.108 0.078 0.054 0.036 0.023 0.014 0.008 0.005 0.002 0.001 0.000 0.000 0.000 0.000 0.000 0.000

10

19

Anexo 2. Tabla T de Kendall por correlaciones parciales.


N 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 0.25 0.500 0.447 0.333 0.277 0.233 0.206 0.187 0.170 0.162 0.153 0.145 0.137 0.133 0.125 0.121 0.117 0.114 0.111 0.20 1.000 0.500 0.408 0.327 0.282 0.254 0.230 0.215 0.202 0.190 0.180 0.172 0.166 0.157 0.151 0.147 0.141 0.139 0.10 0.000 0.707 0.534 0.472 0.421 0.382 0.347 0.325 0.305 0.288 0.273 0.260 0.251 0.240 0.231 0.222 0.215 0.210 0.05 0.000 0.707 0.667 0.600 0.527 0.484 0.443 0.413 0.387 0.465 0.347 0.331 0.319 0.305 0.294 0.284 0.275 0.268 0.025 0.000 1.000 0.802 0.667 0.617 0.565 0.515 0.480 0.453 0.430 0.410 0.391 0.377 0.316 0.348 0.336 0.326 0.318 0.01 0.000 0.000 0.816 0.764 0.712 0.648 0.602 0.562 0.530 0.505 0.481 0.458 0.442 0.423 0.410 0.395 0.382 0.374 0.005 0.000 0.000 1.000 0.866 0.761 0.713 0.660 0.614 0.581 0.548 0.527 0.503 0.485 0.466 0.450 0.434 0.421 0.412 0.001 0.000 0.000 0.000 1.000 0.901 0.807 0.757 0.718 0.677 0.643 0.616 0.590 0.570 0.549 0.532 0.514 0.498 0.488

20

S-ar putea să vă placă și