Sunteți pe pagina 1din 7

PRUEBA DE INDEPENDENCIA

Definicin
La estadstica de prueba que ser utilizada en la toma de una decisin acerca de la hiptesis nula es ji cuadrado, X2 (X es la letra griega ji minscula. Los valores de ji cuadrado se obtienen con las siguiente formula:

X2 = i

(Oi ei)2 ei

Grados de libertad

V = (r-1)*(c-1)

Frecuencia Esperada = Total de la columna * Total del rengln Gran total

Aplicaciones
 Para la ocurrencia de dos eventos, en la cual se desea observar si son dependientes o independientes.  La distribucin ji cuadrada sirve para todas las inferencias sobre la variancia de una poblacin.  Existen muchos problemas para los cuales los datos son categorizados y los resultados expuestos en forma de conteos o cuentas.

 Se pueden aplicar en: un conjunto de calificaciones de un examen final puede ser representado como una distribucin de frecuencias. Estos valores son cuentas: l numera de datos que caen en cada celda.  En una encuesta determinada se podra preguntar a unas personas si votaran por los candidatos A, B o C, por lo general, los resultados se indican en una grafica que informa acerca del numero de votantes para cada categora posible.

Caractersticas
 X2 toma valores no negativos; es decir, puede ser cero o positiva.  X2 no es simtrica; es asimtrica hacia la derecha.  Existen muchas distribuciones X2 como en el caso de la distribucin t, hay una distribucin, X2 diferente para cada valor de los grados de libertad.  Nos dan una tabla de contingencia.
Una tabla de contingencia es una disposicin de datos en una clasificacin de doble entrada. Los datos se ordenan en celdas y se reporta l numero de datos en cada una. En la tabla de contingencia estn implicados dos factores (o variables), y la pregunta comn en relacin con tales tablas es si los datos indican que las dos variables son independientes o dependientes.

Para ilustrar la utilizacin y anlisis de una tabla de contingencia, considrese la clasificacin por sexo de los estudiantes de una escuela y su rea acadmica favorita.

Ejemplo No.1 Cada persona de un grupo de 300 estudiantes fue identificada como hombre o mujer, preguntndosele si prefera recibir cursos en el rea de matemticas, ciencias sociales o humanidades. La siguiente tabla es una de contingencia que indica las frecuencias encontradas para esas categoras.

Presenta esta tabla la evidencia suficiente para rechazar la hiptesis nula la preferencia por las matemticas, ciencias sociales o humanidades es independiente del sexo de un alumno , al nivel de significan ca del 0.05?

Solucin: Paso 1 Ho: La preferencia por matemticas, ciencias sociales o humanidades es independiente del sexo de los estudiantes de la escuela.

Ha: La preferencia por las reas es no independiente del sexo de los estudiantes.

Paso 2 Para determinar el valor critico de la ji cuadrada debe conocerse los grados de libertad, implicado. En el caso de tablas de contingencia, este numero es exactamente el numero de celdas en la tabla que puede ser llenadas libremente cuando se conocen los totales. Estos ltimos se indican en la tabla siguiente.
122 178

72

113

115

300

Dados estos totales, solo pueden llenarse dos celdas antes que las restantes queden determinadas. (por supuesto, los totales deben ser los mismos.) Por ejemplo, una vez que se seleccionen dos valores arbitrarios (por ejemplo, 50 y 60) para las dos primeras celdas de la primera fila (vase la tabla siguiente), quedan fijos los otros cuatro valores.
50 D 72 60 E 113 C F 115 122 178

300

Dichos valores deben ser C=12, D=22, E=53 y F=103. De otra manera los totales no sern correctos. En consecuencia, para este problema existen dos selecciones libres. Cada una de estas corresponde a un grado de libertad. As, el numero de grados de libertada en este ejemplo es 2 (v=2). Por esta razn, si se utiliza =0.05, el valor critico es X2 (2, 0.05) = 6. vase la siguiente figura.

Paso 3 Antes de poder hallar el valor calculado de ji cuadrada, es necesario examinar los valores esperados E para cada celda. Para tal fin debe recordarse la hiptesis nula, la cual asevera que estos factores son independientes. En consecuencia, se espera que los valores esten distribuidos en proporcin a los totales marginales. Hay 122 hombres; se espera que estn distribuidos entre M, CS y H proporcionalmente a los totales 72, 113 y 115. as, para los hombres las cuentas esperadas de celda son:

72/300 x 122

113/300 x 122

115/300 x 122

Similarmente, se esperan:

72/300 x 178

113/300 x 178

115/300 x 178

para las mujeres.

Entonces los valores esperados son como se indica en la tabla siguiente (siempre verifquense los totales nuevos contra los antiguos.)

M 29.28 42.72 Total 72.00

CS 45.95 67.05 113.00

H 46.77 68.23 115.00

Total 122 178 300.00

Nota El calculo de los valores esperados pueden verse de manera alternativa. Recurdese que la hiptesis nula se supone cierta en tanto no haya evidencia para rechazarla. Habiendo hecho este supuesto en el ejemplo, de hecho s esta afirmando que son independientes los eventos un estudiante seleccionado aleatoriamente es hombre, y un estudiante elegido al azar prefiere cursos de matemticas. El estimador puntual para la probabilidad de que un estudiante sea hombre es 122/300, y para la probabilidad de que un estudiante prefiera los cursos de matemtica es 72/300. en consecuencia, la probabilidad de que ocurran ambos eventos es el producto de las probabilidades.
Ejemplo de Aplicacin Para estudiar la dependencia entre la prctica de algn deporte y la depresin, se seleccion una muestra aleatoria simple de 100 jvenes, con los siguientes resultados: Sin depresin Con depresin total Deportista 38 No deportista 31 22 53 9 47

69

31

100

L = (38 32,43)2/32,43 + (31 36,57)2/36,57 + (9 14,57)2/14,57 + (22 16,43)2/16,43 = 0,9567 + 0,8484 + 2,1293 + 1,8883 = 5,8227 El valor que alcanza el estadstico L es 5,8227. Buscando en la tabla terica de Chi Cuadrado para 1 grado de libertad se aprecia Lt = 3,84146 < 5,8227 lo que permite rechazar la hiptesis de independencia de caracteres con un nivel de significacin del 5%, admitiendo por tanto que la prctica deportiva disminuye el riesgo de depresin.

S-ar putea să vă placă și