Documente Academic
Documente Profesional
Documente Cultură
0.0237<P<0.0376
Se sabe con un nivel de confianza del 90% que la proporcin de discos
defectuosos que no pasan la prueba en esa poblacin est entre 0.0237 y 0.0376.
Ejemplo: En una muestra de 400 pilas tipo B fabricadas por la
EverlastCompany, se encontraron 20 defectuosas. Si la proporcin p de
pilas defectuosas en esa muestra se usa para estimar P, que vendr a ser
la proporcin verdadera de todas las pilas defectuosas tipo B fabricadas por
la EverlastCompany, encuentre el mximo error de estimacin tal que se
pueda tener un 95% de confianza en que P dista menos de de p.
Solucin:
p=x/n = 20/400=0.05
z (0.95)=1.96
Esto da por resultado dos valores, (0.029, 0.071). Con un nivel de confianza del
95% se sabe que la proporcin de pulas defectuosas de esta compaa est entre
0.029 y 0.071.
Si se requiere un menor error con un mismo nivel de confianza slo se necesita
aumentar el tamao de la muestra.
2
Tema 5.2 Prueba de independencia CH
Variable 2 Si
No
(B)
Total p .1 p .2 1
Se sabe que, para que dos sucesos sean independientes, la probabilidad de que
ocurran ambos a la vez debe ser igual al producto de las probabilidades de que
cada suceso ocurra individualmente.
P [A y B] = P [A] P [B]
O
p 11 = p .1 p 1.
La relacin debe cumplirse para cada celda. Por tanto, la hiptesis nula de
independencia se expresa matemticamente como
i = 1, 2
H 0: p ij = p i. P .j
j = 1, 2
i = 1, 2
H 1: p ij ? p i. P .j
j = 1, 2
Comparamos el nmero de observaciones en cada celda con el nmero esperado,
si H0 es cierta. Si estos nmeros difieren poco, no hay razn para rechazar H 0; si
hay una gran discrepancia entre los valores observados y esperados, entendemos
esto como evidencia de que H0 no es cierta. Entonces se calcula el valor
esperado as:
Eij = np ij
n 1. n .1
11 = ________________________
N
_________________________
tamao de la muestra
1=
)
(nij Eij
E ij
Para que las pruebas de Ji-cuadrado sean vlidas, es necesario que las muestras
sean grandes. Es decir que las frecuencias esperadas no sean menores de 5. Si
esto no se cumple, puede utilizarse una prueba para pequeas muestras llamada
prueba exacta de Fischer para contrastar independencia.
Ejemplo: Se realiza una investigacin para determinar si hay
alguna asociacin aparente entre la altura de los estudiantes de posgrado y
el xito en sus clases, a juicio de sus profesores. Se selecciona una
muestra aleatoria consistente en 500 estudiantes. Se clasifica a cada
estudiante de acuerdo a dos criterios, la altura y el xito. La tabla de
contingencia generada es la siguiente:
Mayor altura que el promedio poblacional
Si
No
Si
162
263 425
No
38
37
200
300 500
xito
75
Si
No
Si
162 (170)
263 (255)
425
No
38 (30)
37 (45)
75
200
300
500
xito
X1 =
2
(nij E ij)
Eij
Caracterstic
aB
Presente
Ausente
Total
Caracterstica A
Presente
Ausente
a
c
a+c
b
d
b+d
Total
a+b
c+d
n
Esta frmula se obtiene calculando todas las posibles formas en las que podemos
disponer n sujetos en una tabla 2 x 2 de modo que los totales de filas y columnas
sean siempre los mismos, (a+b), (c+d), (a+c) y (b+d).
La probabilidad anterior deber calcularse para todas las tablas de contingencia
que puedan formarse con los mismos totales marginales que la tabla observada.
Posteriormente, estas probabilidades se usan para calcular valor de la p asociado
al test exacto de Fisher. Este valor de p indicar la probabilidad de obtener una
diferencia entre los grupos mayor o igual a la observada, bajo la hiptesis nula de
independencia. Si esta probabilidad es pequea (p<0.05) se deber rechazar la
hiptesis de partida y deberemos asumir que las dos variables no son
independientes, sino que estn asociadas. En caso contrario, se dir que no existe
evidencia estadstica de asociacin entre ambas variables.
En la literatura estadstica, suelen proponerse dos mtodos para el cmputo del
valor de la p asociado al test exacto de Fisher. En primer lugar, podremos
calcularlo sumando las probabilidades de aquellas tablas con una probabilidad
asociada menor o igual a la correspondiente a los datos observados. La otra
posibilidad consiste en sumar las probabilidades asociadas a resultados al menos
tan favorables a la hiptesis alternativa como los datos reales. Este clculo
proporcionara el valor de p correspondiente al test en el caso de un planteamiento
unilateral. Duplicando este valor se obtendra el p-valor correspondiente a un test
Ejemplo: Supongamos que en una determinada poblacin se desea
averiguar si existen diferencias en la prevalencia de obesidad entre
hombres y mujeres o si, por el contrario, el porcentaje de obesos no vara
entre sexos. Tras ser observada una muestra de 14 sujetos se obtuvieron
los resultados que se muestran en la Tabla
Tabla 1. Tabla de contingencia para estudiar las diferencias en
la prevalencia de obesidad entre sexos. Estudio de prevalencia
sobre 14 sujetos.
Obesidad
Sexo
S
No
Total
Mujeres
1 (a)
4 (b)
5 (a+b)
Hombres
7 (c)
2 (d)
9 (c+d)
Total
8 (a+c)
6 (b+d)
14 (n)
En esta tabla a=1, b=4, c=7 y d=2. Los totales marginales son as a+b=5, c+d= 9,
a+c=8 y b+d=6. La frecuencia esperada en tres de las cuatro celdas es menor de
5, por lo que no resulta adecuado aplicar el test
, aunque s el test exacto de
Fisher. Si las variables sexo y obesidad fuesen independientes, la probabilidad
asociada a los datos que han sido observados vendra dada por:
(i)
(ii)
(iii)
Obesidad
Obesidad
Si
No
Si
No
Mujeres
Mujeres
Hombres
Hombres
14
14
Mujeres
Mujeres
Hombres
Hombres
14
14
Mujeres
Mujeres
Hombres
Hombres
14
14
(iv)
(v)
(vi)
(v)
(vi)
4
5
1
0
4
3
5
6
0,2098
0,0280
Como se puede observar, las dos formas de clculo propuestas no tienen por qu
proporcionar necesariamente los mismos resultados. El primer mtodo siempre
resultar en un valor de p menor o igual al del segundo mtodo. Si recurrimos a un
programa estadstico como el SPSS para el cmputo del test, ste utilizar la
primera va para obtener el p-valor correspondiente a la alternativa bilateral y el
segundo mtodo de clculo para el valor de p asociado a un planteamiento
unilateral. En cualquier caso, y a la vista de los resultados, no existe evidencia
estadstica de asociacin entre el sexo y el hecho de ser obeso en la poblacin de
estudio.
Tema 5.4 Prueba de bondad de ajuste.
Las pruebas de bondad de ajuste tienen por objetivo determinar si los datos se
ajustan a una determinada distribucin, esta distribucin puede estar
completamente especificada (hiptesis simple) o perteneciente a una clase
paramtrica (hiptesis compuesta).
Una hiptesis estadstica se defini como una afirmacin o conjetura acerca de la
distribucin f(x,q) de una o ms variables aleatorias. Igualmente se plante que la
distribucin poda tener uno o ms parmetros desconocidos, que denotamos por
q y que la hiptesis se relaciona con este parmetro o conjunto de parmetros En
otros casos, se desconoce por completo la forma de la distribucin y la hiptesis
entonces se relaciona con una distribucin especfica f(x,q) que podamos
PRUEBA JI-CUADRADO
Esta prueba es aplicable para variables aleatorias discretas o continuas.
Sea una muestra aleatoria de tamao n tomada de una poblacin con una
distribucin especificada f0(x) que es de inters verificar.
Suponer que las observaciones de la muestra estn agrupadas en k clases,
siendo oi la cantidad de observaciones en cada clase i = 1, 2,..., k
Con el modelo especificado f0(x) se puede calcular la probabilidad pi que un dato
cualquiera pertenezca a una clase i.
Con este valor de probabilidad se puede encontrar la frecuencia esperada ei para
la clase i, es decir, la cantidad de datos que segn el modelo especificado
deberan estar incluidos en la clase i:
ei = pi n
i = 1, 2, ..., k
x =
2
i=1
Nro. De plantas
10
14
Podran estos datos ajustarse a una distribucin de Poissn? Utilice un nivel 0,05
de significancia.
Solucin
El valor de en este caso debe estimarse
=
xioi =2.10
n
2) Ha: no H0
3) = 0.05
Clculo de la probabilidad correspondiente a cada intervalo
0
e2.1(2.1)
=e2.1
0!
p1 = P(X=0) =
e
p2 = P(X=1)=
2.1
(2.1)
=0.25725
1!
2
e2.1 (2.1 )
=0.2700
2!
p3 = P(X=2)=
e1 = p1 n = e
( 48 )=5.88
e2 = p2 n = (0,25725)(48) = 12,34
e3 = p3 n = 12,96... (etc.)
Resumen de resultados
i
Nro. De plantas
5.88
12.34
10
12.96
14
9.07
>= 4
7.75
x 0.05=7.815
(Tabla 2)
ei
5.88
9
7.75
6
x =
i=1
6) Decisin
Como 6,31 no es
dice que no hay
suficiente
para
propuesto para la
modo que al nivel
distribucin
de
ajuste razonable
mayor a 7.815, se
evidencia
rechazar el modelo
poblacin,
de
de
5%,
la
Poisson da un
a los datos.
Grupo: 406-A