Documente Academic
Documente Profesional
Documente Cultură
datos
+
categricos
+
Anlisis de
proporciones de una
poblacin
CONTENIDO:
1.
2.
3.
4.
5.
6.
Tablas de contingencia:
Pruebas para independencia y
Homogeneidad.
DISTRIBUCION BINOMAIL
Es una distribucin de
probabilidad discreta que
cuenta el nmero de xitos
en una secuencia de n
ensayos independientes
entre s, con una
probabilidad fija p de
ocurrencia del xito entre
los ensayos.
Los experimentos se los
conoce como Bernoulli
(experimento aleatorio en la
que se puede obtener solo
dos resultados) =
dicotmico.
(1- )
Probabilidad de xito
Probabilidad de falla
proporcin,
Si:
y = nmero de xitos.
n = nmero de ensayos.
proporcin,
90%
90%
90%
90%
=
=
=
=
0.25
0.25
0.25
0.25
1.645 (0.03)
0.049
+ 0.049 = 0.29
0.049 = 0.20
Cuando la muestra no es
representativa el IC puede
ser no certero.
2. Inferencia sobre
+ diferencia entre dos
proporciones, 1 y 2
Introduccin
Si:
y1 = random xitos observados de una muestra random n1
de la poblacin 1.
y2 = random xitos observados de una muestra random n2
de la poblacin 2.
,
2. Inferencia sobre
diferencia entre dos
proporciones
ser
2
Esta distribucin puede
a una
1 ,aproximada
distribucin normal con una media y estndar
error.
+ 2. Inferencia sobre
Activa
Inactiva
80
34
120
105
= 80/120 = 0.66
= 34/105 = 0.32
Ha:
1 2 0
1 2 > 0
1 2 0
1 2 < 0
1 2 = 0
1 2 0
AR : Z > Z
Alimento tipo
1
Alimento tipo
2
Mejora
92
118
No mejora
28
62
120
180
Total
Ha:
1 2 0
1 2 > 0
Tamao
muestra
!
AR : Z > Z = 1.96
= 92/120 = 0.766
= 118/180 = 0.655
= 2.13 > 1.96, Ho rechazada.
Otra
prueba !
Bajo la Ho de independencia
(no asociacin) sigue una
distribucin hipergeomtrica.
Categor
a
1
Total
n11
n12
n1
n21
n22
n2
Total
n.1
n.2
Poblaci
n
+
4. Prueba exacta de Fisher
Caractersticas:
+
4. Prueba exacta de Fisher
Caractersticas
Tratamient
o
Total
38
42
14
21
Total
52
11
63
+
4. Prueba exacta de Fisher
Categor
a
Poblacin
Total
Yersey
12
13
Holstein
13
Total
20
26
Categor
a
Poblaci
n
Total
Yersey
12
13
Holstein
13
Total
20
26
+ 5. Prueba de Chi-cuadrada
Generalidades:
+
5. Prueba de Chi-cuadrada
Clasificacin
Caractersticas:
Consiste en n idnticos ensayos.
Experiment
o
Multinomial
Probabilidad distribucin
multinomial = n ensayos
resultan en una de K posibles
resultados - probabilidades, p1
.. Pk, donde p1 + + pk = 1.
Modelo de probabilidades: Se
puede hipotetizar valores
especficos para
probabilidades y luego
determinar si los datos de las
muestras concuerdan con las
valores hipotetizados.
ni = es el nmero de observaciones
por cada categora.
Bajo Ho, X2 sigue una distribucin chicuadrado, con (K-1) grados de libertad.
Gl= k-1
Porcetaje
N. casos
Ausente
50
120
Leve
25
60
200 * 0.25 = 50
Moderado
10
10
200 * 0.10 = 20
Severo
15
10
200 * 0.15 = 30
Esperados
200 * 0.50 = 100
= 0.05
Gl= k-1 = 3
Se rechaza Ho si X2 es
mayor al valor de la
tabla.
Test Statistics
CATEGORY
1
2
3
4
Total
Observed N
120
60
10
10
200
Expected N
100.0
50.0
20.0
30.0
Residual
20.0
10.0
-10.0
-20.0
Chi-Square a
df
Asymp. Sig.
Exact Sig.
Point Probability
CATEGORY
24.333
3
.000
.000
.000
+
5.1 Prueba de bondad de ajuste Chi-cuadrada
+
5.1 Prueba de bondad de ajuste Chi-cuadrada
Categora
Poblaci
n
Tota
l
n11
n1j
n1c
n1
ni1
nij
nic
ni
nr1
nrj
nrc
nr
Total
n.1
n.j
n.c
Prueba de independencia:
Bajo la Ho de independencia
(no asociacin), los valores
esperado para f y c es:
Gl= (f-1)(c-1).
Ejemplo:
Cuando r y c no estn
asociados
(independientes), la
probabilidad para calidad
de leche i y edad j es el
producto de las
probabilidades separadas.
Categora de
Edades
Calidad
de
leche
Total
Buena
15
32
18
70
Regular
29
23
18
78
Mala
20
25
22
68
Total
24
81
66
45
216
+ 6. Tablas de contingencia:
Pruebas de independencia
FF
FF
IIC
C
EE
O
O
PP
11
22
33
TT
22
LL 1
C
C
1
22E
77
E
C
C
22E
8E
8
C
C
22E
77
E
oo C
2C
2
88E
44
E
C
C
FF
AA 33o
5o
5
2266x.8.8
x
22oo88
2299x.7x.7
22oo11
2255x.6x.6
tata 88o
4o
4
6611xx.0.0
11
FF
22
N
N1122uu
1111.3.3pp
2299uu
1133.3.3pp
2200uu
1100.5.5pp
ll 6611uu
224466.0.0pp
(24 x 70)/216
rro
o
IIC
C
33
88 nn
7744 .4.4ee
1133 nn
7766 .8.8ee
2255 nn
6644 .8.8ee
224466 nn
1155 .0.0ee
ss
ss
EE
TT44
77 55 tt
00 .6.6 cc
7788 tt
88 .3.3 cc
6622 tt
88 .2.2 cc
1155 tt
66 .0.0 cc
00
.0.0
88
.0.0
88
.0.0
66
.0.0
oo
tta
a
Pearson Chi-Square
Likelihood Ratio
Fisher's Exact Test
Linear-by-Linear
Association
N of Valid Cases
26.014
Exact Sig.
(2-sided)
.000
.000
.000
Exact Sig.
(1-sided)
6
6
Asymp. Sig.
(2-sided)
.000
.000
.000
.000
.000
df
216
a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 7.56.
b. The standardized statistic is 5.100.
ll
tte
e
dd
tte
e
dd
tte
e
dd
tte
e
dd
Chi-Square Tests
Value
27.135a
30.586
28.801
tta
a
Point
Probability
.000
+ 6. Tablas de contingencia:
Pruebas de homogenidad
Homogenidad de distribuciones
Categora de
Edades
Calidad
de
leche
Total
Buena
15
32
18
70
Regular
29
23
18
78
Mala
20
25
22
68
Total
24
81
66
45
216
Total
Buena
15
32
18
70
Regular
29
23
18
78
Mala
20
25
22
68
Regla: 1 o no ms
del 20% de los
valores esperados
puede ser menos
de 5, con la
finalidad de
obtener un p-valor
razonable.
Total
24 81 66 45 216
Ho: la calidad de leche es
independiente a la edad de la vaca.
Ha: la calidad de leche depende de la
edad de lo vaca.
X2 = 27.13 > 12.59, Ho rechazada.
+
Conclusiones
Referencias
https://www.youtube.com/watch?v=MKdmkAItQP4
https://www.youtube.com/watch?v=-osaBBWFIDk