Documente Academic
Documente Profesional
Documente Cultură
Chi Cuadrado
Las
distribucin
Chi
cuadrado, se derivan de
la distribucin Normal y
estn relacionadas con la
teora
del
muestreo
pequeo n< 30.
Son muy importantes
pues son la base de
metodologas
inferenciales, tales como
Intervalos de Confianza y
Pruebas de Hiptesis.
Distribucin
Chi-cuadrado
Definicin: Sea
Sea
k variables aleatorias normales e
independientes, cada una con media 0 y
desviacin tpica 1. entonces, la variable
aleatoria
chi
2
(
f
f
)
o e
fe
Hiptesis:
Si un contraste de hiptesis proporciona un valor P inferior a
, la hiptesis nula es rechazada, siendo tal resultado
denominado estadsticamente significativo. Cuanto menor
sea el nivel de significancia, ms fuerte ser la evidencia de
que un hecho no se debe a una mera coincidencia (al azar).
Distribucin
Chi-cuadrado
Distribucin
Chi-cuadrado
La Regla de Decisin
Ch observado < Ch
critico
Si
Aceptar Ho
No
Rechazar
Ho
Aplicaciones
de
Cuadrado
2
Chi
Prueba
de Chi
Cuadrado
Dos
Variables
Prueba de
Homogeneid
ad
Prueba de
Independen
cia
Una Variable
Prueba de
Bondad de
Ajuste
Prueba de Bondad de
Ajuste
Se utiliza para la comparacin de la distribucin de
una muestra con alguna distribucin terica que se
supone describe a la poblacin de la cual se extrajo.
Ho : La variable tiene comportamiento normal se
distribuye de manera uniforme
H1 : La variable no tiene comportamiento normal,
no se distribuye de manera uniforme.
( f
fe
fe )
Ejemplo 1:
Un gerente de ventas que tiene su mercado
dividido en cuatro zonas le indica a sus vendedores
que las zonas tienen el mismo potencial de ventas.
Ante la duda de los vendedores sobre el potencial
de sus zonas el gerente hace el siguiente
procedimiento :Se extrae una muestra de los
archivos de la empresa de 40 ventas realizadas el
ao pasado y encuentra que el numero de ventas
por zona son: zona 1 = 6, Zona 2 = 12, Zona 3 =
14 y zona 4 = 8 . En vista de esos resultados se
realiza una prueba de bondad de ajuste.
Solucin:
Planteamiento de Hiptesis
H0 : las ventas estn igualmente distribuidas.
H1: las ventas no estn igualmente distribuidas
Nivel de Significancia
= 5% = 0.05
Clculos
GL= k-1 = 4-1 = 3
2
El
critico = 7.81 (Segn Tabla)
Solucin:
Elaborar la tablaf ode f e
y calcular el
ZONAS
A
Frecuencia
observada (fo)
Frecuencia
esperada (fe)
12
14
40
10
10
10
10
40
Ch
1.6
0.4
1.6
0.4
( fo fe )
fe
Los
individuales se calculan
con la formula; y luego se suman:
Este valor es el
2 observado = 4
La decisin:
observado <
Como:
2
2 observado (4)
<
2
Critico
critico (7.81)
Si se
Cumple
entonces, no rechazamos Ho.
Es decir que la Ho de que las ventas se
encuentran igualmente distribuidas en las cuatro
zonas no se puede rechazar para un nivel de
significancia de 5%.
Prueba de Independencia
Se usa para analizar la frecuencia de dos
variables
con
categoras
mltiples
para
determinar
si
las
dos
variables
son
independientes o no.
Hiptesis nula (H0) : Las variables X e Y son
independientes, ( X e Y no estn relacionadas)
Hiptesis alternativa (H1): Las variables X e Y
2
no son independientes,
e Y estn
F C (O E (X
)
ij
ij
2
( F 1)( C 1)
relacionadas)
Eij
i 1 j 1
Tablas de contingencias
Grados de libertad GL= (m-1)(n-1)
Calculo de frecuencia esperado.
suma( fila ) suma(columna )
fe
(total)
Donde:
Oi j : es el nmero de sujetos que tienen las
caractersticas Ai y Bj a la vez.
Ri : (i = 1,,r) es la suma de la i-sima fila de la
tabla. Es decir, es el total de sujetos que poseen la
caracterstica Ai.
Cj :(j = 1,,c) es la suma de la j-sima columna de
la tabla. Es decir, es el total de sujetos que poseen
la caracterstica Bj.
2
(
O
E
)
n : representa2 el total de observaciones
tomadas.
ij
ij
( F 1)( C 1)
Eij
i 1 j 1
F
Ejemplo 2:
El uso de bebida ordenado con alimentos en
un restaurante es independiente de la edad del
consumidor? Se toma una muestra aleatoria de
309 clientes del restaurante de donde resulta el
siguiente cuadro de valores observados. Utilice
= 1% para determinar si las dos variedades
son independientes.
EDAD
CAF (T)
REFRESC
O
LECHE
21 34
26
95
18
35 55
41
40
20
>55
24
13
32
Solucin:
Planteamiento de Hiptesis
H0 : El tipo de bebida preferida es independiente de la edad
H1 : El tipo de bebida preferida no es independiente ,esta
relacionada con la edad
Nivel de significancia
= 0.01
Clculos
Grados de Libertad GL = (m-1)(n-1)
Tenemos 3 filas y tres columnas, es decir
GL = (3-1)(3-1) = 4
2
critico = 13.27 (Segn Tabla)
El
Solucin:
suma( fila ) suma(columna)
(total)
f
Calculo de frecuencia esperado.
e
EDAD
CAF
CAF
(T)
(T)
REFRESC
REFRESC
O
O
LECHE
LECHE
TOTAL
TOTAL
21 34
26
26
43,8
43.8
95
95
71,2
71.2
18
18
139
139
24.0
139,0
41
41
31.8
40
40
51.7
20
20
17.5
101
101
101,1
24
13
32
49
15.4
24
25.1
13
8.5
32
49,0
49
91
148
50
289
91.0
148.0
50,0
289,0
Frecuencia
Frecuenci
Esperada
a
Esperada
35 55
35 55
Frecuencia
Esperada
Frecuenci
a
55
Esperada
Frecuencia
55
Esperada
Frecuenci
Total fo
a
Total fe
Esperada
La Decisin
2
2
(97,93) <
observado
critico
(13,27)
No se Cumple
entonces, rechazamos H0, es decir se acepta la
hiptesis alternativa H1
Las dos variables, bebida preferida y edad, no
son independientes. El tipo de bebida que un
cliente ordena con alimentos est relacionada con
la edad y depende de est.
Prueba de
Homogeneidad
Se extraen Muestras Independientes de varias
poblaciones y se prueban para ver si son
homogneas con respecto a algn criterio de
clasificacin.
H0 = Las Poblaciones son Homogneas
son Homogneas
H1 = Las PoblacionesF no
C (O E ) 2
ij
2 ( F 1)( C 1) ij
Eij
i 1 j 1
Ejemplo 3:
La siguiente tabla indica las familias de cuatro
distritos y el nmero de personas que vieron un
programa especial de poltica econmica
nacional. Use =1%
A
TOTA
L
10
15
18
48
40
35
45
32
152
50
50
50
50
200
Solucin:
Planteamiento de Hiptesis
H0: todos vieron el programa
H1: No todos vieron el programa
Nivel de Significancia
= 0.011
Clculos
GL2 = (m-1)(n-1) = (2-1)(4-1) = 3
= 11.35
Calcular las frecuencias esperadas y el Ch 2
observado.
Solucin:
A
TOTAL
VEN EL PROGRAMA
0.33
0.75
4.08
3.00
NO VEN EL PROGRAMA
0.11
0.24
1.29
0.95
TOTAL
10.75
Ejercicios:
1.Suponga que los tiempos requeridos
por un cierto autobs para alcanzar un
de sus destinos en una ciudad grande
forman una distribucin normal con
una desviacin estndar=1 minuto. Si
se elige al azar una muestra de 17
tiempos, encuentre la probabilidad de
que la varianza muestral sea mayor
que 2.
MUCHAS GRACIAS