Sunteți pe pagina 1din 83

El estadstico Chicuadrado y contrastes

asociados

ING. RAL ALVAREZ GUALE, MPC

Estimacin de Intervalos y
Prueba de Hiptesis para
Varianzas Poblaciones
ING. RAL ALVAREZ GUALE, MPC

Estimacin y prueba de hiptesis de dos medias o


proporciones poblacionales

Anlisis del valor de una varianza poblacional o de la


relacin entre dos varianzas poblacionales

Ejemplos
Conocer el volumen promedio que una mquina llena las botellas
de soda puede no ser suficiente para el gerente de produccin.
La variabilidad del contenido puede ser tambin de alta
importancia:

Una alta variabilidad implicar un alto nmero de botellas con bajo


contenido, las cuales producen molestias y reclamos de los clientes; as
como un alto nmero de botellas con exceso de soda, en perjuicio de la
empresa.

Se requiere controlar tanto la media como la variabilidad del


volumen de llenado de las botellas.
Un gerente puede requerir conocer si hay diferencias en la
variabilidad de las ventas entre dos reas geogrficas distintas.
Se puede requerir saber si un proceso genera una produccin de
mayor variabilidad que otro.

Se presentarn mtodos que pueden ser usados para


efectuar inferencias respecto de una o dos varianzas
poblacionales.
Se presentarn dos nuevas distribuciones:

Chi-cuadrado

Objetivos
Formular y probar hiptesis para una varianza
poblacional
Hallar el(los) valor(es) crtico(s) chi-cuadrado(s)
de la tabla Chi-cuadrado

Prueba de Hiptesis para


Varianzas
Prueba de Hiptesis
para Varianzas

Prueba para Una


Varianza Poblacional

Prueba para Dos


Varianzas Poblacionales

Estadstico de prueba
Chi-cuadrado

Estadstico de prueba F

Caso de una Varianza


Poblacional

Los casos que involucran una varianza


poblacional emplean uno de dos procedimientos
estadsticos:
Prueba de hiptesis
Estimados de intervalos de confianza
El gerente de un banco puede creer que la
varianza poblacional del tiempo de servicio al
cliente es no mayor a 36 minutos al cuadrado.
Se plantea la hiptesis nula que la varianza es
mayor o igual a 36 min2 y, en base a data
muestral, se debe estar en capacidad de
rechazar o no la hiptesis nula.

Caso de una Varianza


Poblacional
Un gerente requiere tomar una muestra de los
clientes del restaurante para determinar el
nmero de veces al mes que cenan fuera de
casa. Para esto requiere determinar el tamao
de la muestra, lo cual depende de la varianza
poblacional. Puede tomar una muestra piloto y
construir un intervalo de confianza para la
estimacin de la varianza poblacional.

Lo ideal seran pruebas sobre la desviacin estndar, sin


embargo no se disponen de las mismas, se debe recurrir a
pruebas sobre la varianza para a partir de las mismas
inferir sobre la desviacin estndar.
Interrogantes como 2 36? Pueden analizarse a travs
de pruebas de hiptesis con los procedimientos llamados
Pruebas Chi-cuadrado.
Cuando una muestra aleatoria proviene de una
poblacin distribuida normalmente, la distribucin
de la varianza muestral estandarizada es una
distribucin chi-cuadrado.

Distribucin Chi-cuadrada
Una variable continua X tiene una
distribucin chi cuadrada, con v grados
de libertad, si su funcin de densidad
es dada por

Teorema

S2 es la varianza de una muestra aleatoria de


Si
tamao n que se toma de una poblacin normal que
tiene la varianza , entonces el estadstico

Prueba de Hiptesis para Una Varianza:


Estadstico de Prueba Chi-cuadrado
El estadstico de prueba chi-cuadrado para una varianza poblacional
como se mencion es:

(n 1)s

2

Donde
2 = Variable chi-cuadrada estandarizada
n = Tamao de muestra
s2 = Varianza muestral
2 = Varianza (supuesto)

El estadstico de prueba estandariza


la varianza muestral (similar a los
estadsticos z y t de los captulos
anteriores)

Grfico de la Distribucin
Chi Cuadrado

Hallando el Valor Crtico

El valor crtico,

, puede obtenerse de la Tabla Chi-cuadrado


2

Prueba Unilateral
Derecha:

H0: 2 02
HA: 2 > 02

0
No rechazar H0

Rechazar H0

Distribucin Chi-cuadrado

La distribucin chi-cuadrado es una familia de distribuciones, que


depende de los grados de libertad:

g.l. = n 1

Supuesto: La poblacin es normal

0 4 8 12 16 20 24 28

g.l. = 1

0 4 8 12 16 20 24 28

g.l. = 5

0 4 8 12 16 20 24 28

g.l. = 15

Problemas para obtener


el valor de con un nivel de significancia del 5% de
Obtener

una cola a la derecha y n =14

v=14-1=13

Obtener el valor de con un nivel de significancia del 5% de


una cola a la izquierda y n =14
v=14-1=13

Obtener el valor de con un nivel de significancia del 5% de


dos colas y n =14

v=14-1=13

Problemas para obtener

Obtener el valor de con un nivel de significancia del


1% de una cola a la derecha y v =7

Obtener el valor de con un nivel de significancia del


5% de una cola a la izquierda y n =17
v=17-1=16

Obtener el valor de con un nivel de significancia del


10% de dos colas y v =27

Teorema

Si S2 es la varianza de una muestra aleatoria de


tamao n, se puede escribir:

Prueba de Hiptesis de Una


Varianza, Chi-cuadrado
1.

Formular las hiptesis en trminos de 2

2.

Fijar el nivel de significancia

3.

Construir la regin de rechazo

4.

Calcular el estadstico de prueba,

5.

Tomar una decisin

6.

Interpretar los resultados

Hiptesis concernientes a
una varianza

Regiones crticas para


probar (poblacin normal)
Hiptesis
Rechazar la
Hiptesis
Rechazar la
alternativa
hiptesis nula
alternativa
hiptesis nula
si:
si:

O bien

Ejemplo: Solucin
Hiptesis: H0: 2 16, HA: 2 > 16
Regin de rechazo: Usar la tabla Chi-cuadrado para hallar el valor crtico:
2 = 24.9958 ( = 0.05 y 161=15 g.l.)
2 = 24.9958
= 0.05

0
Estadstico de prueba:

No rechazar H0

Rechazar H0

(n 1)s 2 (16 1)24


22.5
2

16
2

2
Decisin: Como = 22.5 < 24.9958 =

, no rechazamos H0

Conclusin: No hay evidencia significativa al nivel = 0.05 para concluir


que la varianza excede a 16 grados2.

Prueba de Hiptesis de Una Varianza, Chi-cuadrado:


Unilateral y Bilateral
Prueba Unilateral Izquierda:

Prueba Bilateral:

H0: 2 02
HA: 2 < 02

H0: 2 = 02
HA: 2 02

/2
/2

0
Rechazar
H0

21-

No rechazar H0

0
Rechazar No rechazar
H0
H0

21-/2
( 2L)

Rechazar H0

2/2
( 2U)

Ejemplo
Una congeladora comercial debe mantener la
temperatura seleccionada con poca variacin.
Las especificaciones indican que la desviacin
estndar no debe ser mayor a 4 grados (o la
varianza a 16 grados2).
Una muestra de 16 datos
es evaluada y da una varianza muestral de s2 = 24. Evale
si la desviacin estndar especificada ha sido excedida. Use
= 0.05.

Problema 1

Un fabricante de bateras para automvil garantiza que su


producto durar, en promedio 3 aos con una desviacin
estndar de 1 ao. Si cinco de estas bateras tienen
duraciones de 1.9, 2.4, 3.0, 3.5 y 4.2, el fabricante
continuar convencido de que sus bateras tienen una
desviacin estndar de 1 ao? Suponga que las
duraciones de las bateras tienen una distribucin normal.

Solucin
Datos:

Solucin: Problema 1

Se declaran las hiptesis

Ho: =1
H1: 1

Se determinan los estadsticos-comprobacin

Solucin: Problema 1

Con un nivel de significancia del 5%: No existe


evidencia de que la duracin de las bateras no sea
de un ao

Problema 2

El proceso de bruido (que se utiliza para desbastar

ciertas obleas de silicio al grosos adecuado) es


aceptable solo si , la desviacin estndar poblacional
del grosor del cubo cortado de las obleas, es cuando
mucho 0.50 mil. Use el nivel de significancia de 0.05
para probar la hiptesis nula =0.50 contra la hiptesis
alternativa >0.50, si el grosor de 15 cubos cortados de
tales obleas tienen una desviacin estndar de 0.64
mil.
Solucin
Datos:

Solucin: problema 2

Se declaran las hiptesis

Ho: =0.50
H1: >0.5
Se determinan los lmites de confianza
Se rechaza la hiptesis nula si X2>23.685 para un para
14 grados de libertad

Solucin: problema 2

Solucin: problema 2

Se determinan los estadsticos-comprobacin

Se toma la decisin Se acepta Ho

Solucin Problema 2
Al 10% de nivel de significancia, se rechaza Ho

Hiptesis respecto a varias


proporciones

Cuando

se compara la respuesta del


consumidor (porcentaje favorable y
porcentaje desfavorable) a dos productos
diferentes, cuando se decide si la proporcin
de defectuosos de un proceso dado
permanece constante de un da a otro,
cuando se juzga si hay diferencia en
persuasin poltica entre varios grupos de
nacionalidad y muchas situaciones similares,
se est probando si dos o ms poblaciones
binomiales tienen el mismo parmetro p. DE
hecho se est interesado probar la hiptesis
nula:

Tabla de varias
proporciones
xitos

Muestra Muestra
1
2 Muestr
Muestr
a1
a2

Fracasos

xitos

Total

Fracaso
s
Total

Muestra
Total
k
Muestr
Total
ak

Problema 3:

Muestras

de tres tipos de materiales,


sometidos a cambios extremos de
temperatura, dieron los resultados que se
presentan en la siguiente tabla:
Materia
lA

Desmonoram
iento
Permanece
Intacto
Total
Total

Mater
ial B

Material
C

Total

Solucin Problema 3:

Se plantean las hiptesis

Establecer los lmites de confianza


Rechazar la hiptesis nula
Si
Se determinan los nmero esperados de xito y fracasos

Se determina el estadstico

Se toma una decisin: dados que =4.575 no supera


5.991, la hiptesis nula no puede rechazarce.

Forma resumida de Clculos


Materi
al A

Mater
ial B

Materi
al C

Total

Desmonoramiento

Tabla
Real

Permanece Intacto
Total
Material
A

Materi
al B

Desmonoramiento
Permanece Intacto
Total
Suma total

Materi
al C

Total
Tabla
Esperada

Problema 4:
Estn en desarrollo cuatro mtodos para fabricar
discos de un material superconductor. Se elaboran
cincuenta discos con cada mtodo y se comprueba su
superconductividad cuando se enfran con nitrgeno
lquido:
Mto
do 1

Mtod Mtod
o2
o3

Mto
do 4

Total

Supercond
uctores
Fallas
Total

Realice una prueba chi cuadrada con un nivel de


significancia del 5%. Si hay diferencia significativa entre
las proporciones de los superconductores fabricados,
grafique los intervalos de confianza.

Solucin Problema 4:

Se

plantean las hiptesis

Establecer los lmites de confianza


Rechazar la hiptesis nula
Si
Se determinan los nmero esperados de xito y
fracasos

Se

determina el estadstico

Se toma una decisin: dados que =4.575 no supera


5.991, la hiptesis nula no puede rechazarce.

Forma resumida de Clculos


Materia
lA

Materia
lB

Materia
lC

Total

Desmonoramiento

Tabla
Real

Permanece Intacto
Total
Materia
lA

Materi
al B

Desmonoramiento
Permanece Intacto
Total
Suma total

Materi
al C

Total
Tabla
Esperada

Estimacin del Intervalo de Confianza para


una Varianza Poblacional

Intervalo de Confianza para 2

El intervalo de confianza para 2 es:

/2
/2

21-/2
( 2L)

2/2
( 2U)

Donde 2L y 2U pertenecen a la
distribucin 2 con n -1 grados de
libertad

2
2
(n 1)s 2
(n

1)s
2

2
U
L2

Intervalo de Confianza: Ejemplo

Una muestra de 16 datos de una congeladora da una


varianza muestral de s2 = 24.

Formar un intervalo de confianza al 95% para la varianza


poblacional.

Intervalo de Confianza: Ejemplo


(Solucin)
Usar la tabla chi-cuadrado para hallar 2L y 2U:
( = 0.05 y 16 1 = 15 g.l.)
/2=0.025

/2=0.025
20.975
( 2L) 6.2621
(n 1)s 2
(n 1)s 2
2

U2
L2

20.025
27.4884 ( 2U)

(16 1)24
(16 1)24
2
27.4884
6.2621

13.096 2 57.489

Estamos 95% seguros que la varianza poblacional est entre 13.096 y


57.489 grados2. (Tomando la raz cuadrada, estamos 95% seguros que la
desviacin estndar poblacional est entre 3.619 y 7.582 degrees).

Prueba de Bondad de Ajuste y


Anlisis de Contingencia

Bondad de Ajuste
Distintos procedimientos estadsticos
requieren que la data muestral provengan
de poblaciones normalmente distribuidas.
Cuando se emplea la distribucin t en
la estimacin de intervalos de
confianza o en pruebas de hiptesis
sobre una o dos medias poblacionales,
las poblaciones de inters se asumen
normalmente distribuidas.
En distintos procedimientos ANOVA se
asumen poblaciones normalmente
distribuidas.

Bondad de Ajuste
Cmo se puede verificar que estos supuestos son
satisfechos?
En diversas situaciones se requiere conocer si la
data muestral proviene o no de una determinada
distribucin probabilstica.
Cmo proceder?

Bondad de Ajuste

La prueba de bondad de ajuste Chi-cuadrado es una


prueba estadstica que permite determinar si una
data muestral proviene o no de una hipottica
distribucin.

Objetivos
Usar la prueba chi-cuadrado de bondad de
ajuste para determinar si los datos se
ajustan a una distribucin especfica.
Desarrollar una tabla de anlisis
contingencia y evaluar la independencia a
travs de la prueba chi-cuadrado.

Prueba Chi-cuadrado de Bondad


de Ajuste
Los datos de la muestra son coherentes
con una distribucin supuesta?
Ejemplos:
Las llamadas al soporte tcnico tienden a
ser iguales todos los das de la semana?
(Las llamadas siguen una distribucin
uniforme?)
Las medidas en un proceso de produccin
siguen una distribucin normal?

Prueba Chi-cuadrado de Bondad


de Ajuste
(continuacin)
Las llamadas al soporte tcnico tienden a ser
iguales todos los das de la semana? (Es decir: Las
llamadas siguen una distribucin uniforme?).
Para cada da de la semana se tom una muestra de
10 das:
Total de llamadas (muestra):

Lunes

290

Martes

250

Miercoles
Jueves
Viernes

238
257
265

Sbado

230

Domingo

192

Total = 1722

Lgica de la Prueba Chi-cuadrado


de Bondad de Ajuste
Si las llamadas estuvieran uniformemente distribuidas, se esperara que las 1,722 llamadas se
distribuyan equitativamente en los 7 das:

1,722
246 llamadas esperadas por da
7
Prueba chi-cuadrado de bondad de ajuste: Evala
si los resultados muestrales son consistentes con
los resultados esperados.
(Es decir, datos observados = datos esperados)

Frecuencias Observadas vs.


Esperadas
Lunes
Martes
Miercoles
Jueves
Viernes
Sbado
Domingo
Total

Observado
oi

Esperado
ei

290
250
238
257
265
230
192

246
246
246
246
246
246
246

1,722

1,722

Estadstico de prueba chicuadrado


H0: La distribucin de llamadas es uniforme respecto
a los das de la semana (observado = esperado)
HA: La distribucin de llamadas no es uniforme

El estadstico de prueba es:

(o i e i )

ei
2

(gl k 1)

Donde:
k = Nmero de categoras
oi = Frecuencia observada en la categora i
ei = Frecuencia esperada en la categora i


22

Regin de Rechazo

H0: La distribucin de llamadas es uniforme


respecto a los das de la semana

HA: La distribucin de llamadas no es uniforme


2
(
o

e
)
i
2 i
ei

No rechazar H0

Rechazar H0

(con k-1 grados de libertad)

Rechazar H0
si

Estadstico de Prueba ChiCuadrado


H0: La distribucin de llamadas es uniforme respecto a los das de la semana
HA: La distribucin de llamadas no es uniforme

20.05 = 12.5916 (gl = k 1 = 6)


= 0.05
Estadstico de prueba:

No rechazar H0

Rechazar H0

(290 246)2 (250 246)2


(192 246)2

...
23.05
246
246
246
2

Decisin: Como 2 = 23.05 > 2 = 12.5916 entonces se rechaza H0


Conclusin: Hay suficiente evidencia para concluir que la distribucin no sea uniforme

Prueba Chi-cuadrado de Bondad


de Ajuste: Pasos
1. Formular hiptesis
2. Fijar el nivel de significancia
3. Determinar el valor crtico
4. Calcular el estadstico de prueba, 2
5. Tomar una decisin
6. Interpretar el resultado

Ejemplo: Distribucin Normal


Las medidas obtenidas de un proceso de
produccin siguen una distribucin normal con
= 50 y = 15?, = 0.05.
Proceso:
Obtener datos muestrales.
Agrupar los datos muestrales en clases
(celdas). La frecuencia esperada en cada
celda debe ser al menos 5.
Comparar las frecuencias observadas
(datos muestrales) con las frecuencias
esperadas.

Ejemplo: Distribucin Normal


(continuacin)

Datos muestrales y agrupados en clases:


150 medidas
muestrales
80
65
36
66
50
38
57
77
59
etc

Clase

Frecuencia

Menos de 30

10

[30 40>

21

[40 50>

33

[50 60>

41

[60 70>

26

[70 80>

10

[80 90>

De 90 a ms

Total

150

Ejemplo: Distribucin Normal


(continuacin)

Cules son las frecuencias esperadas para las clases


si se asume distribucin normal con = 50 y = 15?
Clase

Frecuencia
Observada

Menos de 30

10

[30 40>

21

[40 50>

33

[50 60>

41

[60 70>

26

[70 80>

10

[80 90>

De 90 a ms

Frecuencia
Esperada

Ejemplo: Distribucin Normal


(Frecuencias Esperadas)
Clase

P(X clase)

Frecuencia
esperada

Menos de 30

0.09121

13.68

[30 40>

0.16128

24.19

[40 50>

0.24751

37.13

[50 60>

0.24751

37.13

[60 70>

0.16128

24.19

[70 80>

0.06846

10.27

[80 90>

0.01892

2.84

De 90 a ms

0.00383

0.57

Total

1.00000

150.00

Frecuencias esperadas para un tamao


muestral n=150 de
una distribucin normal con =50 y =15
Ejemplo:
30 50

P(x 30) P z

15

P(z 1.3333)
0.0912

(0.0912)(1 50) 13.68

22

Ejemplo: Distribucin Normal


(Estadstico de Prueba)
Clase

Frecuencia
observada, oi

Frecuencia
esperada, ei

Menos de 30

10

13.68

[30 40>

21

24.19

[40 50>

33

37.13

[50 60>

41

37.13

[60 70>

26

24.19

[70 80>

10

10.27

[80 90>

2.84

De 90 a ms

0.57

Total

150

150.00

Estadstico de prueba:
2
(
o

e
)
i
2 i
ei

Rechazar H0
si

(con k 1 grados de
libertad)

Ejemplo: Distribucin Normal


(Regin de Rechazo)
H0: La distribucin de las medidas es normal con = 50 y = 15
HA: La distribucin no es normal con = 50 y = 15
Regin de Rechazo:

14.0671 =

0.05

(7 g.l., 8 clases)

=0.05

No rechazar H0

Rechazar H0

Estadstico de prueba:
(oi ei ) 2 (10 13.68) 2
(2 0.57) 2

...
12.057
ei
13.68
0.57
2

Decisin: Como 2 = 12.097 < 2 = 14.0671 entonces no se rechaza H0


Conclusin: No hay suficiente evidencia para concluir que la distribucin de
las medidas no es normal con = 50 y = 15

Ejemplo: Distribucin
Normal
Importante:

13-66

En el ejemplo desarrollado, la hiptesis especificaba


tanto la media, como la desviacin estndar, las
probabilidades de la distribucin normal se
calcularon empleando esos valores.
Si la media y/o la desviacin estndar no fuesen
especificadas, se usaran los datos de la muestra
para su clculo, en cuyo caso se perderan unidades
adicionales de grados de libertad, una por cada
parmetro estimado a partir de la muestra.

Anlisis de Contigencia

Se ha visto pruebas de hiptesis referidas a una o


dos proporciones poblacionales,
Qu de las situaciones que involucran mltiples
proporciones poblacionales?

Ejemplos
Una compaa de fondos mutuos ofrece 6 tipos diferentes de fondos.
Se desea determinar si la proporcin de clientes que selecciona
cada fondo est vinculada o no a las 4 regiones de venta en que
opera la compaa.
El administrador de un hospital recolecta data de satisfaccin con el
servicio de los pacientes a travs de ratings por departamento y
desea saber si hay diferencias significativas entre los mismos.
Un gerente de personal est interesado en determinar si hay una
relacin entre el nivel de satisfaccin del trabajador con su trabajo y
el tipo de trabajo.
En estos tres casos las proporciones se refieren a caractersticas
categricas de la variable de inters.

Anlisis de Contingencia
El procedimiento estadstico de Anlisis de
Contingencia puede ser adecuado para la toma de
decisiones en contextos de mltiples proporciones,
con data de tipo nominal u ordinal y valores
determinados por conteo de nmero de ocurrencias
en cada categora.

Anlisis de Contingencia

Se aplica en situaciones que involucran propor-ciones


poblacionales mltiples.

Los datos deben ser categricos.

Usado para clasificar observaciones muestrales de acuerdo a dos


o ms caractersticas.

Usa el estadstico Chi-cuadrado para determinar independencia de


las caractersticas de inters.

Los datos son resumidos en una tabla de contingencia (tambin


llamada tabla cruzada).

Anlisis de Contingencia:
Ejemplo
Preferencia manual vs. Gnero (dos
variables), =0.05.
Preferencia manual: Izquierda vs. Derecha
Gnero: Masculino vs. Femenino
H0: La preferencia manual es independiente del
gnero
HA: La preferencia manual no es independiente
del gnero

Anlisis de Contingencia:
Ejemplo
(continuacin)

Los resultados muestrales se encuentran


organi-zados en una tabla de contingencia:
Preferencia manual

Tamao muestral n =300

De 120 mujeres, 12
son zurdas
De 180 hombres, 24
son zurdos

Gnero

Izquierda

Derecha

Femenino

12

108

120

Masculino

24

156

180

36

264

300

Lgica de la Prueba

H0: La preferencia manual es independiente del gnero


HA: La preferencia manual no es independiente del gnero

Si H0 es verdadera, entonces la proporcin de


mujeres zurdas debera ser la misma como la
proporcin de hombres zurdos
Las dos proporciones anteriores deberan ser las
mismas como la proporcin de zurdos (femenino
y masculino) del total

Hallando Frecuencias Esperadas


De 120 mujeres, 12
son zurdas

Total:

De 180 hombres, 24
son zurdos

P(Zurdos)
= 36/300 = 0.12

Si fueran independientes, entonces


P(Zurdas | Femenino) = P(Zurdos | Masculino) = 0.12
Se esperara que el 12% de 120 (femenino) y el 12% de 180
(masculino) sean zurdos
Es decir:

(120)(0.12) = 14.4 mujeres seran zurdas


(180)(0.12) = 21.6 hombres seran zurdos

Hallando Frecuencias Esperadas


(continuacin)

Frecuencias esperadas:

(Total de la fila i ma )(Total de la columna j ma )


eij
Tamao muestral total
Ejemplo:

Total de mujeres

Total de zurdos

(120)(36)
e11
14.4
300
Total muestral

Frecuencia
esperada de
mujeres
zurdas

Frecuencias Observadas vs.


Esperadas
Preferencia manual
Gnero
Femenino
Masculino

Izquierda

Derecha

Observado = 12
Esperado = 14.4
Observado = 24
Esperado = 21.6
36

Observado = 108
Esperado = 105.6
Observado = 156
Esperado = 158.4
264

(Total de la fila i ma )(Total de la columna j ma )


eij
Tamao muestral total

120
180
300

Frecuencias Marginales
Una frecuencia marginal es la suma de las
celdas de una fila o columna
Ejemplo, la frecuencia marginal
(femenino) en el estudio fue 12+108=120
La frecuencia marginal esperada para una
categora DEBE SER IGUAL a la frecuencia
marginal observada de la misma categora
Es decir, la frecuencia marginal esperada
(femenino) en el estudio debe tambin
ser 120

Estadstico de Prueba Chicuadrado


El estadstico de prueba Chi-cuadrado es:
r

(oij eij )2

i1 j 1

eij

con

g.l. (r 1)(c 1)

Donde:
oij = Frecuencia observada en la celda (i, j)
eij = Frecuencia esperada en la celda (i, j)
r = Nmero de filas
c = Nmero de columnas

NOTA: Todas las


filas y columnas
deben ser usadas

Estadstico de Prueba
Chi-cuadrado

(continuacin)

Preferencia manual
Gnero
Femenino
Masculino

Izquierda

Derecha

Observado = 12
Esperado = 14.4
Observado = 24
Esperado = 21.6
36

Observado = 108
Esperado = 105.6
Observado = 156
Esperado = 158.4
264

120
180
300

(12 14.4) 2 (108 105.6) 2 (24 21.6) 2 (156 158.4) 2


0.7576
14.4
105.6
21.6
158.4
2

Anlisis de Contingencia

Regla de decisin:
Si 2 > 3.841,
rechazar H0;

3.841= 20.05, g.l.=(r-1)(c-1)=1

en otro caso,
no rechazar H0

= 0.05
No rechazar H0

Rechazar H0

Estadstico de prueba: 0.7576


Decisin: Como 2 = 0.7576 < 3.841, no se rechaza H0
Conclusin: No hay suficiente evidencia para concluir que el gnero y la
preferencia manual no son independientes

Prueba Chi-cuadrado:
Consideraciones
La distribucin chi-cuadrado es solamente una
aproximacin de la verdadera distribucin
Pero es aceptable cuando todas las frecuencias esperadas son
mayores que o iguales a 5
Cuando las frecuencias son menores que 5, el valor del
estadstico de prueba chi-cuadrado podra incrementar la
probabilidad del error tipo I
Como regla, si la hiptesis nula no es rechazada, acepte el
resultado as se tenga celdas con frecuencias esperadas
menores a 5.9.

Si las frecuencias esperadas son pequeas:


Primero, incrementar el tamao muestral
Si es necesario, combinar las categoras de las variables

Resumen

Se us la prueba chi-cuadrado de bondad de


ajuste para determinar si los datos se ajustan a
una distribucin especfica:

Ejemplo de una distribucin uniforme (discreta)

Ejemplo de una distribucin normal (continua)

Se us la prueba chi-cuadrado en tablas de


contingencia para evaluar independencia (anlisis
de contingencia)

Se compar las celdas de frecuencias observadas con


las esperadas.

Gracias

S-ar putea să vă placă și