Sunteți pe pagina 1din 3

Prueba de Hipótesis

ANALISIS DE DATOS CATEGORICOS

UNA DESCRIPCION DEL EXPERIMENTO

Numerosos experimentos resultan en mediciones que son cualitativas o categóricas en lugar de


cuantitativas; esto es, una cualidad o característica (mas que un valor numérico) se mide para cada
unidad experimental. Se puede resumir este tipo de datos al crear una lista de las categorías o
características e informar de una cantidad del número de mediciones que caen en cada categoría.
A continuación veamos algunos ejemplos:

 Las personas se pueden clasificar en cinco categorías de ingreso


 Un ratón puede responder en una de tres formas a un estimulo
 Un dulce M&M’S puede tener uno de seis colores
 Un proceso industrial manufactura artículos que pueden ser clasificados como
“aceptables”. “de segunda categoría” o “defectuosos”
Estas son algunas de las muchas situaciones en las que el conjunto de datos tiene características
apropiadas para el experimento multinominal

El EXPERIMENTO MULTINOMINAL

 El experimento consta de n intentos idénticos


 El resultado de cada intento cae en una de k categorías
 La probabilidad de que el resultado de un solo intento caiga en una categoría particular,
por ejemplo i , es pi y permanece constante de un intento a otro. Esta probabilidad
debe ser entre 0 y 1, para cada una de las k categorías y la suma de todas las k
probabilidad es  pi  1
 Son intentos son independientes
 El experimentador cuenta el número observado de resultados en cada categoría, escrito
como O1 , O2 ,..., Ok con O1  O2  ..., Ok  n
Se puede visualizar el experimento multinomial si se considera un numero k cajas o celdas en las
que n pelotas se lanzan. Los n tiros son independientes y en cada tiro la probabilidad de hacer
blanco en la i casa es la misma. Pero, esta probabilidad puede variar de una caja a otra; podría ser
más fácil hacer blanco en la caja 1 que en la caja 3 en cada tiro. Una vez que todas las n pelotas se
hayan tirado, se cuenta el número de cada caja o celda O1 , O2 ,..., Ok

Es probable que haya notado la similitud entre el experimento multinomial y el experimento


binomial. De hecho, cuando hay k  2 categorías, los dos experimentos son idénticos, excepto
por la notación. En lugar de p y q , escribimos p1 y p2 para representar las probabilidades

1 Lic. Est. Sandra Cecilia Loaiza Chumacero


Prueba de Hipótesis
para las dos categorías, “éxito” y “fracaso”. En lugar de x y (n  x ) , escribimos O1 y O2 para
representar el numero observado de “éxitos” y “fracasos”

Cuando presentamos la variable aleatoria binomio, hicimos inferencias acerca del parámetro
binomial p (y por default, q  1  p ) usando métodos de muestra grande basados en la
estadística z . En este capitulo, extendemos esta idea para hacer inferencias acerca de los
parámetros multinomiales, p1 , p2 ,..., pk , usando un tipo diferente de estadística. Esta
estadística, cuya distribución de muestreo aproximada fue derivada por un estadístico ingles
llamado Karl Pearson en 1900, se llama estadística ji cuadrada (o a veces ji cuadrada de Pearson)

La Prueba Chi – Cuadrado

La prueba Chi- Cuadrado o Ji- Cuadrado es una de las más utilizadas en estadística, tiene usos
adicionales con mayor frecuencia para el análisis o conteo de frecuencias. Por ejemplo es posible
saber para una muestra de pacientes hospitalizados cuantos son varones y cuántos son mujeres.
Para la misma muestra, también es posible saber cuántos tiene seguro de vida particular, cuantos
tienen seguros para gastos médicos y cuantos tienen asistencia médica.

Es posible saber, para la población de la que se extrajo la muestra, si el tipo de seguro de vida es
diferente de acuerdo con el sexo.

Otro uso, quizá el mas frecuente, de la distribución Ji- cuadrado es el de probar la hipótesis nula
que indican que dos criterios de clasificación son independientes cuando se aplican al mismo
conjunto de entidades.

Se dice que dos criterios de clasificación son independientes si la distribución de un criterio es la


mima, sin importar cual se la distribución del otro.

Por ejemplo, si el nivel socioeconómico y el área de residencia de los habitantes de cierta ciudad
son independientes, se esperaría encontrar la misma proporción de familias en los grupos
socioeconómicos bajo, medio y alto en todas las aéreas de la ciudad.

Planteamiento de la hipótesis

H0: Suposición de que los criterios o variables son estadísticamente independientes.

r c (Oij  Eij ) 2
 
2

i j Eij

Donde ri es el total para el renglón i y cj es el total para la columna j.

2 Lic. Est. Sandra Cecilia Loaiza Chumacero


Prueba de Hipótesis
Y puede mostrarse que tiene una distribución ji cuadrada aproximada con:

Df=(r-1) (c-1)

Si el valor observado de  2 es demasiado grande, entonces la hipótesis nula de independencia es


rechazada.

Dada la hipótesis de independencia de las dos variables, la frecuencia esperada relacionada con
cada casilla de una tabla de contingencia debería ser proporcional al total de frecuencias
observadas incluidas en la fila y columna en la que está ubicada la casilla, e relación con el tamaño
total de la muestra.

Tabla de contingencia 2 x 2
Una tabla de contingencia con dos filas y dos columnas es un caso particular de independencia de
criterios se presenta cuando los sujetos se categorizan según 2 factores o criterios, cada uno de los
cuales ocurre en dos niveles.

Como gl =1 la aproximación de la distribución de  2 puede mejorarse mucho aplicando la


corrección siguiente:

 
2
 ad  bc  0.5n n  2

 a  b  a  c  b  d  c  d 

Primer criterio de
Segundo criterio clasificación Total
de clasificación
1 2
1 a b a+b
2 c d c+d
Total a+c b+d a+b+c+d

La frecuencia teórica mínima par la tabla de 2x2 no debe ser menor de 5 y no debe emplearse  2
cuando n es menor que 40. La corrección por continuidad puede omitirse si n≥ 50 y usar como
función

r s (Oij  Eij ) 2
2    con 1 gl.
i j Eij

3 Lic. Est. Sandra Cecilia Loaiza Chumacero

S-ar putea să vă placă și