Sunteți pe pagina 1din 27

BIOESTADISTICA

Aplicaciones de la distribucin 2

CHI CUADRADO 2
OBJETIVOS
Describir situaciones donde es
adecuado la utilizacin de la prueba
de Chi Cuadrado ( 2)
Formular Hiptesis para diferentes
situaciones.
Calcular la Prueba de Chi Cuadrado e
interpretar los resultados.
Evaluacin de muestras

CARACTERSTICAS DE LA
DISTRIBUCIN DE 2
2 es siempre positivo porque es una
suma de cuadrados.
Varia desde 0 a (no tiene valores
negativos)
Familia de distribuciones que dependen
de 1 parmetro (gl=grados de
libertad)
Media de la Distribucin = gl
Varianza de la Distribucin=2gl
La distribucin tiene sesgo positivo y
cuando los gl aumentan se aproxima a

gl=2
gl=3
gl=4

Chi2

gl=5

PRUEBAS DE 2
BONDAD DE AJUSTE
Se utiliza para la comparacin de la distribucin de
una muestra con alguna distribucin terica que se
supone describe a la poblacin de la cual se extrajo.

INDEPENDENCIA
La Ho indica que 2 variables o criterios de
clasificacin son independientes cuando se aplican a
un conjunto de individuos (unidades de observacin)
Totales Marginales Aleatorios

HOMOGENEIDAD
Se extraen Muestras Independientes de varias
poblaciones y se prueban para ver si son
homogneas con respecto a algn criterio de
clasificacin.
Un conjunto de Totales Marginales Son Fijos mientras
que los otros marginales son Aleatorios.

PRUEBAS DE 2
Bondad de Ajuste
Uni-Dimesional
Se basa en la Distribucin de
Probabilidad Multinomial.

Propiedades de la
Distribucin de Probabilidad
Multinomial
El experimento consiste en n ensayos
idnticos.
Hay k posibles resultados de cada
ensayo.
La probabilidad de los k resultados son
p1, p2, ...... pk y se mantienen
constantes de ensayo en ensayo
donde p1 + p2 + .... + pk = 1
Los ensayos son independientes.

Prueba de Bondad de Ajuste


Se trata de probar si los datos de una muestra
tomada difieren de cierta distribucin
predeterminada.
Los n datos tomados deben estar divididos en
Categora
1
2
3

K
categoras
Frecuencia
observada

Obs1

Obs2

Obs3

Obsk

Las probabilidades pi, de caer en la categora i estn


dadas por la H0, son constantes entre ensayos y
suman 1.
La hiptesis nula es H0: pi = valores dados, es decir los
datos siguen una distribucin determinada con la cual
se calcularn las frecuencias esperadas.
La hiptesis alternativa H1: al menos una de las pi es

SUPUESTOS PARA LA PRUEBA DE


2
Experimento multinomial.
El tamao de muestra es lo
suficientemente grande para que el
nmero esperado en las categoras sea
5, para asegurar que 2 se aproxime
a la distribucin multinomial.
Se puede recurrir a colapsar categoras
contiguas (celdas) con valores esperados
menores de 5.

La prueba estadstica es:


Donde pi representa la probabilidad (por H0) porcin
deseada en la i-sima categora, Obsi la frecuencia
observada en la categora i y n es el tamao de la
muestra.
La prueba estadstica se distribuye como una Ji-Cuadrado
con k-1 grados de libertad donde, k es el nmero de
categoras.
Si el valor de la prueba estadstica (2 calculado) es mayor
que el valor crtico (2 de la tabla) se rechaza la hiptesis
nula
2
Ei: frec. Esperada de la i-sima clase
O

ij
c2
n
Oi: frec. Observada de la i-sima clase
E ij

gl N k 1

N: nmero de clases

k: nmero de parmetros estimados a partir de


la muestra

Tabla 1. Distribucin de frecuencias del peso de 35 novillos.

Bondad de Ajuste con la Distribucin Normal

Clases
330-344
345-359
360-374
375-389
390-404
405-419
420-434

fo
3
3
4
12
7
4
2
35

Xi
z
337 -1,61
352 -0,97
367 -0,33
382 0,30
397 0,94
412 1,58
427 2,21

X 382.86; S 23.56

Pz
0,055
0,166
0,371
0,618
0,826
0,943
0,986

P
0,055
0,111
0,205
0,247
0,209
0,117
0,043

fe
1,9
3,9
7,2
8,7
7,3
4,1
1,5
2

0,610
0,204
1,398
1,296
0,012
0,001
0,158
3,679

Parmetros estimados=2
gl=2
gl k 1 N parametros _ estimados

Tabla 1. Distribucin de frecuencias del peso de 35 novillos.

Bondad de Ajuste con la Distribucin Uniforme

gl k 1 N parametros _ estimados

gl=6

Tablas de Contingencia
INDEPENDENCIA
Experimento multinomial con clasificacin con 2
criterios (2 factores). Los datos se pueden resumir en
una tabla de 2 vas (dimensiones). (Ejemplo nmero
de animales enfermos por condicin corporal).
La Ho indica que 2 variables o criterios de
clasificacin son independientes cuando se aplican a
un conjunto de individuos (unidades de observacin)
Totales Marginales Aleatorios

HOMOGENEIDAD
Se extraen Muestras Independientes de varias
poblaciones y se prueban para ver si son
homogneas con respecto a algn criterio de
clasificacin. (Ejemplo prevalencia de enfermos por
regin)
Un conjunto de Totales Marginales Son Fijos mientras

La prueba de Independencia se efecta para


probar si hay asociacin entre las variables
categricas A y B
La prueba de Homogeneidad es una
generalizacin de la prueba de igualdad de dos
proporciones.
Se trata de probar si para cada nivel de la
variable B, la proporcin con respecto a cada
nivel de la variable A es la misma.

Hipte
sis
Las hiptesis de Independencia:
H0: Las variables A y B son independientes
P(AB)=P(A) P(B)
H1: Las variables A y B estn asociadas
P(AB)P(A) P(B)
Las hiptesis de Homogeneidad:
H0: Las proporciones de cada valor de la variable A son
iguales en
cada categora de la variable B. Ha: Al menos una de las
proporciones es diferente.
H0: i Pi=P

H 1: i | P i P

Ambas hiptesis se prueban usando una prueba de Chi-

Pruebas de Independencia y
Homogeneidad

Ambas hiptesis se prueban usando una prueba de JiCuadrado:


r

2
i 1 j 1

(Oij Eij ) 2
Eij


2
c

2
O
ij

Eij

gl ( r 1) * (c 1)

donde Oij es lac frecuencia


observada de la celda que est en
j ri
la fila i, Eij
n
columna j,
es la frecuencia esperada de la
celda (i, j).
La frecuencia esperada es aquella que sera esperable
encontrar si la hiptesis nula es verdadera.

gl (r 1) (c 1)

El estadstico de la prueba 2se distribuye


como una Ji2

cal 1
Cuadrado con
(r-1)(c-1) grados de libertad.

Tablas de
Contingencia

VARIABLE DE CLASIFICACIN COLUMNAS

V
A
R
I
A
B
L
E

C
L
A
S
I
F
I
C
A
C
I

1
2
3
.
.
r
Total

F
I
L
A
S

i 1 j 1

1
O11
O21
O31
.
.
Or1
c1

(Oij Eij ) 2
Eij

2
O12
O22
O32
.
.
Or2
c2

3
O13
O23
O33
.
.
Or3
c3

Eij

..........
..........
..........
..........
.
.
..........
..........

c j ri
n

c
O1c
O2c
O3c
.
.
Orc
cc

Total
r1
r2
r3
.
.
rr
n

gl (r 1) (c 1)

PRUEBA DE INDEPENDENCIA
Un veterinario sostiene que la castracin de las
perras es un factor que est asociado a la
incontinencia urinaria (IU) de las mismas. A los
efectos de comprobarlo realiz un estudio en un
hospital donde a las hembras que ingresaban las
clasific como castradas (C) y enteras (NC) y con
incontinencia (IU) y sin incontinencias (NIU) urinarias
obteniendo los siguientes
IU NIUresultados.
Total

C 34 757 791
NC
7 2427 2434
Total 41 3184 3225
Pruebe a un nivel de significacin de 0.05 si estas
variables estn asociadas?

c2

2
O
ij

Eij

gl ( filas 1)(columnas 1)

Prueba de Homogeneidad
Con el fin de probar la proteccin de 2 vacunas
contra los abortos producidos por una
enfermedad X se seleccionaron 3 lotes de 150
vacas cada uno de un establecimiento con la
enfermedad. Esto lotes fueron vacunados con:
Lote 1 = Placebo, Lote 2 = Vacuna 1 y Lote 3
= Vacuna 2. En el primer lote hubo 20 abortos
en el "lote 2" 10 abortos y en el "lote 3" 5
abortos.
Probar a un nivel de significacin de 0,01 si la
respuesta a la vacunacin fue homognea.

|
col
row |
1
2
3 |
Total
-----------+---------------------------------+---------138.33
138.33
138.33
1 |
130
140
145 |
415
2 |
35
11.67 20
11.67 5 |
11.67 10
-----------+---------------------------------+---------Total |
150
150
150 |
450
Pearson chi2(2) =

10.8434

Pr = 0.004

2=[1302/138.33+1402/138.33+1452/138.33+202/11.67+102/11.67+52/11.67]-450