Sunteți pe pagina 1din 32

Distribucin Chi Cuadrado: pruebas de

Independencia y Homogeneidad
Asociacin entre dos variables
I. CUALITATIVAS

Uso del Chi
2
: Pruebas de
Independencia y Homogeneidad

II. CUANTITATIVAS
Anlisis de Correlacin Lineal Simple
Anlisis de Regresin Lineal Simple
Distribucin Chi-cuadrada (
2
)
CARACTERSTICAS

1. Se lee con grados de libertad
g.l = (fila-1)(columna-1)

2. No tiene valores negativos (
2
). El valor mnimo es
CERO.

3. Todas las curvas son asimtricas

4. Cuando aumentan los grados de libertad las
curvas son menos elevadas y ms extendidas a la
derecha.

5. Se utiliza para variables medidas en escala
nominal u ordinal.
n > 30
1. Se lee con grados de libertad
g.l. = (fila-1)(columna-1)
g.l. = (fila-1)(columna-1)
= (4-1)(5-1) = (3)(4) = 12
Clase Desarrollo fsico del nio
Social 1 2 3 4 5
1 2 14 28 40 18
2 1 21 25 25 9
3 1 12 12 12 2
4 6 17 34 33 6
Aos con Fontain (I nsuf Vasc Perif)
Diabetes 1 2 3 4
10 2 14 28 40
20 1 21 25 25
30 1 12 12 12
(4-1)(3-1) = (3)(2) = 6 gl = 6
2. No tiene valores negativos
El valor mnimo es 0
0

3. Todas las curvas son
asimtricas
4. Cuando aumentan los grados de libertad las
curvas son menos elevadas y ms extendidas a
la derecha.
.gl = pequeo
.gl = grande
5. Se utiliza para variables medidas en escala
nominal u ordinal.
Variables cualitativas
ordinal
nominal
Variables cuantitativas
discreta
continua
Distribucin Chi-cuadrada (
2
)
Frmula de trabajo:






Grados de libertad = (fila-1) (columna-1)

Mide el grado de concordancia entre los pares de
frecuencias observadas y esperadas de las celdas,
dado que la Ho sea verdadera
E
i
= (Total de fila)(Total columna)
Gran total
.gl = 1
Hipertensin Arterial Total
Si No
No Deportista
38 / 9 / 47
Deportista
31 / 22 / 53
Total
69 31 100
Frecuencia Observada: Nmero de objetos o
individuos en la muestra que caen dentro de
cada categora de la variable de inters.
Frecuencia Esperada: Nmero de objetos o
individuos en la muestra que se espera observar
si la hiptesis nula respecto a la variable de
inters es verdadera.

.gl = 1
Hipertensin Arterial Total
Si No
No Deportista
38 / 9 / 47
Deportista
31 / 22 / 53
Total
69 31 100
Frecuencias Observadas (en la muestra)
E
i
= (Total de fila) (Total columna)
Gran total
32.43 14.57
36.57
16.43
Frecuencias Esperadas si Ho fuera verdadera
Cada Oi tiene
una Ei
equivalente
Chi
2
calculado X
2
c

11
12
21
22
2 2 2 2
2
2
47 69
32.43
100
47 31
14.57
100
53 69
36.57
100
53 31
16.43
100
38 32.43 31 36.57 9 14.57 22 16.43
32.43 36.57 14.57 16.43
5,8227
c
c
x
E
x
E
x
E
x
E

Hipertensin
Arterial
Total
Si No
No
Deportista
38 9 47
Deportista 31 22 53
Total 69 31 100
APLICACIONES DE
CHI
2
1. PRUEBA DE
INDEPENDENCIA

2. PRUEBA DE
HOMOGENEIDAD
Conocer si dos criterios de clasificacin son independientes
(no asociacin o no relacin) cuando se aplican al mismo
conjunto de datos.

Se aplica cuando hay dos criterios de clasificacin (dos
variables cualitativas) en una muestra de estudio

Los totales marginales no estn controlados por el investigador
(muestra aleatoria).

Tipo de estudio Transversal.
Prueba de independencia
Hipertensin
Arterial
Total
Si No
No
Deportista
38 9 47
Deportista 31 22 53
Total 69 31 100
Hipertensin Arterial Total
Si No
No
Deportista
38 9 47
Deportista 31 22 53
Total 69 31 100
Ejemplo:Para estudiar la dependencia entre la
prctica de algn deporte y la hipertensin, se
seleccion una muestra aleatoria simple de 100
personas, con los siguientes resultados:
Prueba de independencia
1. Verificar que sean variables cualitativas
2. Planteamiento de hiptesis
H
0
: La Hipertensin Arterial es independiente de la
prctica de algn deporte
H
1
: La Hipertensin Arterial est asociada a la prctica de
algn deporte
3. Determinacin del nivel de significacin
p< 0.05 para rechazar la H
0
Prueba de independencia
H
0
No hay relacin entre V
1
y V
2
H
1
Hay relacin entre V
1
y V
2
4. Clculo de frecuencias esperadas y
2
:
Prueba de independencia

11
12
21
22
2 2 2 2
2
2
47 69
32.43
100
47 31
14.57
100
53 69
36.57
100
53 31
16.43
100
38 32.43 31 36.57 9 14.57 22 16.43
32.43 36.57 14.57 16.43
5,8227
c
c
x
E
x
E
x
E
x
E

5.
X
2
c

6. Valor de p:
Consultando la tabla de
2
con g.l.=1 se observa:



7. Decisin y conclusin:
Decisin: Siendo p < 0.05, se rechaza Ho.

Conclusin: La Hipertensin Arterial est
asociada con la prctica deportiva.
Prueba de independencia
Hipertensin Arterial Total
Si No
No
Deportista
38 9 47
Deportista 31 22 53
Total 69 31 100
X
2
c
= 5.8227
p: ?
0.01<p<0.02
H1 Hay relacin entre V1 y V2
PRACTICANDO LA TABLA
El Dr. Bejarano est estudiando la relacin
entre consumo de vitamina C y accin
antioxidante.
Aplicando la prueba de X
2
encontr un valor
de X
2
c
= 7.36 con g.l=1:
Indicar el valor p:

0.005<p<0.01
p< 0.05 Rechazo H
0

Se aplica cuando se desea conocer si dos o ms
muestras provienen de poblaciones
homogneas con respecto a algn criterio de
clasificacin (o la misma poblacin).

Tiene mayor posibilidad de uso cuando se
desarrollan estudios de tipo experimental.

La hiptesis nula establece que las muestras se
extraen de la misma poblacin.
Prueba de homogeneidad
Hipertensin Distrito Total
Parias El Alto La Brea
Si 75 25 70 170
No 15 45 10 70
Total 90 70 80 240
Ejemplo:
Evaluar la presencia de hipertensin arterial en
pacientes provenientes de tres distritos de la ciudad
de Talara (Diciembre del 2013).
Prueba de homogeneidad
Los 3 distritos son homogneos respecto a la HTA?
1. Planteamiento de la hiptesis
Ho: Las muestras provienen de
poblaciones homogneas segn la presencia
de hipertensin arterial.
H1: Las muestras no provienen de
poblaciones homogneas segn la presencia
de hipertensin arterial.

2. Nivel de significacin:
p < 0.05
Prueba de homogeneidad
3. Frecuencias esperadas y
4. clculo de
2
:
Prueba de homogeneidad

11 12
13 21
22 23
2 2 2
2
2
170 90 170 70
63.75 49.58
240 240
170 80 70 90
56.67 26.25
240 240
70 70 70 80
20.42 23.34
240 240
75 63.75 25 49.58 10 23.34
...
63.75 49.58 23.34
59.34
c
c
x x
E E
x x
E E
x x
E E

5. Valor de p.
Consultando la tabla de 2 = 59.34
con g.l.= 2
se observa p = ? :
p < 0.001
6. Decisin y conclusin:
Decisin: Siendo p 0.05 H
0
?

se rechaza la hiptesis nula.
Conclusin: las muestras no provienen de
poblaciones homogneas.
Es decir, la presencia de hipertensin arterial es
distinta en los tres distritos de la ciudad.
Prueba de homogeneidad
EJEMPLO 1
En un estudio se estudia la relacin entre
consumo de tabaco y cncer pulmonar n=50

Cncer Pulmonar TOTAL
Consumo
de
Tabaco
SI NO
SI 20 9 29
NO 10 21 16
TOTAL

30 20 50
Cul caso es?
Independencia
1 muestra, 2 variables

Homogeneidad
2 muestras

Cncer Pulmonar TOTAL
Consu
mo de
Tabaco
SI NO
SI 20 9 29
NO 10 21 16
TOTAL

30 20 50
20 14.5 9 14.5 29
10 15.5 21 15.5 31
30 30 60
(20-14.5)
2
/ 14.5 +
(9- 14.5)
2
/ 14.5 +
(10- 15.5)
2
/ 15.5 +
(21- 15.5)
2
/ 15.5
X
2
c


=8.074

g.l.= 1 p? H
0
?
0.001<p < 0.005
rechazo H
0
H
0
V1 y V2 no estn
relacionadas
al rechazarla
Si hay una relacin entre el
consumo de tabaco y la
presencia de cncer pulmonar.

Ei = ?
20 9 29
10 21 31
30 30 60
EJEMPLO 2
Evaluar el grado de consumo de frmacos en
4to y 5to ao de un colegio secundaria

Consumo de frmacos TOTAL
Ao Experimental Casual Moderado
4to 56 45 24 125
5to 46 22 33 101
TOTAL 102 67 57 226
INDEPENDENCIA? HOMOGENEIDAD?
VARIABLE
CUALITATIVA?
1. Planteamiento de la hiptesis
Ho: Las muestras provienen de
poblaciones homogneas segn el grado de
consumo de FRMACOS

H1: Las muestras no provienen de
poblaciones homogneas segn el grado de
consumo de FARMACOS.

2. Nivel de significacin:
p < 0.05
Prueba de homogeneidad
Prueba de homogeneidad
E1: 56.4 E2: 37.1 E3: 31.5
E4: 45.6 E5: 29.9 E6: 25.5
7.8

5. Valor de p.
Consultando la tabla de 2 = 7.8
con g.l.= 2
se observa p = ? :
0.01 < p < 0.02
6. Decisin y conclusin:
Decisin: Siendo p 0.05 H
0
?

se rechaza la hiptesis nula.
Conclusin: las muestras no provienen de
poblaciones homogneas con respecto al grado de
uso de frmacos.
Prueba de homogeneidad

S-ar putea să vă placă și