Sunteți pe pagina 1din 29

Distribucin de

Chi Cuadrado

Las
distribucin
Chi
cuadrado, se derivan de
la distribucin Normal y
estn relacionadas con la
teora
del
muestreo
pequeo n< 30.
Son muy importantes
pues son la base de
metodologas
inferenciales, tales como
Intervalos de Confianza y
Pruebas de Hiptesis.

Distribucin

Chi-cuadrado

Definicin: Sea
Sea
k variables aleatorias normales e
independientes, cada una con media 0 y
desviacin tpica 1. entonces, la variable
aleatoria

Se llama la variable aleatoria


cuadrado con k grados de libertad.

chi

Definicin de los Trminos


Frmula de Chi Cuadrado
2
= Nivel de Significancia:

2
(
f

f
)
o e

fe

En estadstica, un resultado se denomina


estadsticamente significativo cuando no es
probable que haya sido debido al azar.
Son comunes los niveles de significancia del
0,05, 0,01 y 0,1. En algunas situaciones es
conveniente expresar la significancia estadstica
como percentil 1.
Este valor hace referencia al nivel de confianza
que deseamos que tengan los clculos de la
prueba; es decir, si queremos tener un nivel de
confianza del 95%, el valor de alfa debe ser del
0.05, lo cual corresponde al complemento

Hiptesis:
Si un contraste de hiptesis proporciona un valor P inferior a
, la hiptesis nula es rechazada, siendo tal resultado
denominado estadsticamente significativo. Cuanto menor
sea el nivel de significancia, ms fuerte ser la evidencia de
que un hecho no se debe a una mera coincidencia (al azar).

Grados de Libertad: GL=k-1


En estadstica, grados de libertad es un estimador del
nmero de categoras independientes en una prueba
particular o experimento estadstico. Se encuentran
mediante la frmula n r, donde n=nmero de sujetos en
la muestra, tambin pueden ser representados por k r,
k=nmero de grupos, cuando se realizan operaciones con
grupos y no con sujetos individuales
r=nmero de sujetos o grupos estadsticamente dependientes

Distribucin

Chi-cuadrado

Distribucin

Chi-cuadrado

La Regla de Decisin

Ch observado < Ch
critico

Si

Aceptar Ho

No
Rechazar
Ho

Para que utilizamos una Prueba de


2 Chi Cuadrado?
Para determinar si la muestra se ajusta o no se
ajusta a una distribucin terica.
Para saber si la(s) poblacione(s) son
homognea(s) o no.
Para determinar la dependencia e independencia
la(s) variable(s) a analizar.

Aplicaciones
de
Cuadrado
2

Chi

Prueba
de Chi
Cuadrado

Dos
Variables

Prueba de
Homogeneid
ad

Prueba de
Independen
cia

Una Variable

Prueba de
Bondad de
Ajuste

Prueba de Bondad de
Ajuste
Se utiliza para la comparacin de la distribucin de
una muestra con alguna distribucin terica que se
supone describe a la poblacin de la cual se extrajo.
Ho : La variable tiene comportamiento normal se
distribuye de manera uniforme
H1 : La variable no tiene comportamiento normal,
no se distribuye de manera uniforme.

( f

fe

fe )

Ejemplo 1:
Un gerente de ventas que tiene su mercado
dividido en cuatro zonas le indica a sus vendedores
que las zonas tienen el mismo potencial de ventas.
Ante la duda de los vendedores sobre el potencial
de sus zonas el gerente hace el siguiente
procedimiento :Se extrae una muestra de los
archivos de la empresa de 40 ventas realizadas el
ao pasado y encuentra que el numero de ventas
por zona son: zona 1 = 6, Zona 2 = 12, Zona 3 =
14 y zona 4 = 8 . En vista de esos resultados se
realiza una prueba de bondad de ajuste.

Solucin:
Planteamiento de Hiptesis
H0 : las ventas estn igualmente distribuidas.
H1: las ventas no estn igualmente distribuidas
Nivel de Significancia
= 5% = 0.05
Clculos
GL= k-1 = 4-1 = 3
2

El
critico = 7.81 (Segn Tabla)

Solucin:
Elaborar la tablaf ode f e

y calcular el

ZONAS
A

Frecuencia
observada (fo)
Frecuencia
esperada (fe)

12

14

40

10

10

10

10

40

Ch

1.6

0.4

1.6

0.4

( fo fe )
fe

Los

individuales se calculan
con la formula; y luego se suman:
Este valor es el

2 observado = 4

La decisin:

observado <
Como:
2
2 observado (4)
<
2

Critico
critico (7.81)

Si se

Cumple
entonces, no rechazamos Ho.
Es decir que la Ho de que las ventas se
encuentran igualmente distribuidas en las cuatro
zonas no se puede rechazar para un nivel de
significancia de 5%.

Prueba de Independencia
Se usa para analizar la frecuencia de dos
variables
con
categoras
mltiples
para
determinar
si
las
dos
variables
son
independientes o no.
Hiptesis nula (H0) : Las variables X e Y son
independientes, ( X e Y no estn relacionadas)
Hiptesis alternativa (H1): Las variables X e Y
2
no son independientes,
e Y estn
F C (O E (X
)
ij
ij
2
( F 1)( C 1)
relacionadas)
Eij
i 1 j 1

Tablas de contingencias
Grados de libertad GL= (m-1)(n-1)
Calculo de frecuencia esperado.
suma( fila ) suma(columna )
fe
(total)

Una Tabla de contingencia con r filas y c


columnas tiene la siguiente forma:
Los datos de variables cualitativa o categricas
representan atributos o categoras y se organizan
en tablas llamadas tablas de contingencia o
tablas de clasificacin cruzada.

Donde:
Oi j : es el nmero de sujetos que tienen las
caractersticas Ai y Bj a la vez.
Ri : (i = 1,,r) es la suma de la i-sima fila de la
tabla. Es decir, es el total de sujetos que poseen la
caracterstica Ai.
Cj :(j = 1,,c) es la suma de la j-sima columna de
la tabla. Es decir, es el total de sujetos que poseen
la caracterstica Bj.
2
(
O

E
)
n : representa2 el total de observaciones
tomadas.
ij
ij
( F 1)( C 1)
Eij
i 1 j 1
F

Ejemplo 2:
El uso de bebida ordenado con alimentos en
un restaurante es independiente de la edad del
consumidor? Se toma una muestra aleatoria de
309 clientes del restaurante de donde resulta el
siguiente cuadro de valores observados. Utilice
= 1% para determinar si las dos variedades
son independientes.
EDAD

CAF (T)

REFRESC
O

LECHE

21 34

26

95

18

35 55

41

40

20

>55

24

13

32

Solucin:
Planteamiento de Hiptesis
H0 : El tipo de bebida preferida es independiente de la edad
H1 : El tipo de bebida preferida no es independiente ,esta
relacionada con la edad
Nivel de significancia
= 0.01
Clculos
Grados de Libertad GL = (m-1)(n-1)
Tenemos 3 filas y tres columnas, es decir
GL = (3-1)(3-1) = 4
2
critico = 13.27 (Segn Tabla)
El

Chi Cuadrado Crtico

Solucin:
suma( fila ) suma(columna)
(total)

f
Calculo de frecuencia esperado.
e

EDAD

CAF
CAF
(T)
(T)

REFRESC
REFRESC
O
O

LECHE
LECHE

TOTAL
TOTAL

21 34

26
26
43,8
43.8

95
95
71,2
71.2

18
18

139
139

24.0

139,0

41
41
31.8

40
40
51.7

20
20
17.5

101
101
101,1

24

13

32

49

15.4
24

25.1
13

8.5
32

49,0
49

91

148

50

289

91.0

148.0

50,0

289,0

Frecuencia
Frecuenci
Esperada
a
Esperada
35 55
35 55
Frecuencia
Esperada
Frecuenci
a
55
Esperada
Frecuencia
55
Esperada
Frecuenci
Total fo
a
Total fe
Esperada

La Decisin

2
2

Como: 2 observado < 2 Critico

(97,93) <
observado

critico

(13,27)

No se Cumple
entonces, rechazamos H0, es decir se acepta la
hiptesis alternativa H1
Las dos variables, bebida preferida y edad, no
son independientes. El tipo de bebida que un
cliente ordena con alimentos est relacionada con
la edad y depende de est.

Prueba de
Homogeneidad
Se extraen Muestras Independientes de varias
poblaciones y se prueban para ver si son
homogneas con respecto a algn criterio de
clasificacin.
H0 = Las Poblaciones son Homogneas
son Homogneas
H1 = Las PoblacionesF no
C (O E ) 2
ij
2 ( F 1)( C 1) ij
Eij
i 1 j 1

Ejemplo 3:
La siguiente tabla indica las familias de cuatro
distritos y el nmero de personas que vieron un
programa especial de poltica econmica
nacional. Use =1%
A

TOTA
L

Nmero de personas que


si vio

10

15

18

48

Nmero de personas que


no vio

40

35

45

32

152

50

50

50

50

200

Solucin:
Planteamiento de Hiptesis
H0: todos vieron el programa
H1: No todos vieron el programa
Nivel de Significancia
= 0.011
Clculos
GL2 = (m-1)(n-1) = (2-1)(4-1) = 3

= 11.35
Calcular las frecuencias esperadas y el Ch 2
observado.

Solucin:
A

TOTAL

VEN EL PROGRAMA

0.33

0.75

4.08

3.00

NO VEN EL PROGRAMA

0.11

0.24

1.29

0.95

TOTAL

10.75

Como el valor observado (10.75) es menor


que el valor critico (11.35). No podemos
rechazar H0 para un nivel del 1%. La diferencia
de las proporciones no es suficientemente
grande para rechazar H0.

Ejercicios:
1.Suponga que los tiempos requeridos
por un cierto autobs para alcanzar un
de sus destinos en una ciudad grande
forman una distribucin normal con
una desviacin estndar=1 minuto. Si
se elige al azar una muestra de 17
tiempos, encuentre la probabilidad de
que la varianza muestral sea mayor
que 2.

2. Encuentre la probabilidad de que


una muestra aleatoria de 25
observaciones, de una poblacin
normal con varianza
, tenga una
varianza muestral:
Mayor que 9.1
Entre 3.462 y 10.745

MUCHAS GRACIAS

S-ar putea să vă placă și