Documente Academic
Documente Profesional
Documente Cultură
Una manera de hacer esto para poblaciones finitas es asegurar que cada miembro de la
poblacin tenga la misma probabilidad de estar en la muestra, lo cual se denomina,
muestra aleatoria. Una muestra aleatoria puede lograrse para muestras de poblaciones
relativamente pequeas extrayendo lotes, o de manera equivalente, usando una tabla de
nmeros aleatorios, especialmente construida para tales propsitos.
Ejercicio.
a) n=2 y N=12
b) n=3 y N=100 ?
100.99.98
Hay (100
23 )=
3!
=161,700 muestras distintas.
1
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
Una muestra de tamao n de una poblacin finita de tamao N es una variable aleatoria si
se selecciona de manera tal que cada una de las ( Nn ) muestras posibles tiene la
1
,
misma probabilidad,
()
N
n
de ser seleccionada.
Ejercicio.
046 230 079 022119 150 056 064 193 232 040 146
Donde ignoramos los nmeros mayores que 247; si cualquier nmero se hubiera repetido,
tambin lo habramos ignorado. Los doce nmeros que tenemos aqu son los nmeros
asignados a las farmacias; las cifras de impuestos sobre las ventas correspondientes
constituyen la muestra aleatoria deseada.
3.1.2 SISTEMTICO.
Ejercicio.
2
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
Si tenemos una poblacin formada por 100 elementos y queremos extraer una
muestra de 25 elementos, en primer lugar debemos establecer el intervalo de
seleccin que ser igual a 100/25=4 . A continuacin elegimos el elemento
2, 6, 10, 14,..., 98
3.1.3 ESTRATIFICADO.
Ejercicio.
Se debe tomar una muestra estratificada de tamao n=60 de una muestra de tamao
Si la distribucin debe ser proporcional, cun grande debe ser la muestra tomada de
cada estrato?
3
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
Ejercicio.
Ejercicio.
Si estadistas del gobierno quieren estudiar la opinin de los profesores de las escuelas
primarias estadounidenses hacia ciertos programas federales, podran estratificar primero
el pas por estados o algunas otras subdivisiones geogrficas. Para tomar medida de
cada estrato, podran usar el muestreo de conglomerados subdividiendo cada estrato en
un nmero determinado de subdivisiones geogrficas ms pequeas y finalmente podran
usar un muestreo aleatorio simple o un muestreo sistemtico para seleccionar una
muestra de profesores de educacin primaria de cada conglomerado.
3.2.1 PROPIEDADES.
4
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
esperado de (T )2 .
T
as lo ser tambin la diferencia ), lo que quiere decir que T tiende a producir
TEOREMA
3.2.1.1 INSESGADO.
5
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
Ejercicio.
S^
2
denominan estimadores insesgados. Sin embargo, es un estimador sesgado de
, ya que, en general , E ( S^ 2 ) 2 .
3.2.1.2 CONSISTENTE.
Una estadstica es un estimador coherente de un parmetro de poblacin, si al aumentar
el tamao de la muestra se tiene casi la certeza de que el valor de la estadstica se
aproxima bastante al valor del parmetro de la poblacin. Si un estimador es coherente se
vuelve ms confiable si tenemos tamaos de muestras ms grandes.
Ejercicio.
6
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
dispersiones de las distribuciones alrededor del valor verdadero pueden ser diferentes.
Entre todos los estimadores de que son insesgados, seleccione al que tenga
Tiene sentido pensar que un estimador con un error estndar menor tendr una mayor
oportunidad de producir una estimacin ms cercana al parmetro de poblacin que se
est considerando.
Como se puede observar las dos distribuciones tienen un mismo valor en el parmetro
slo que la distribucin muestral de medias tiene una menor varianza, por lo que la media
se convierte en un estimador eficiente e insesgado.
Ejercicio.
Si decimos que una distancia es de 5.28 metros, estamos dando un estimador puntual. Si,
por otro estamos dando una estimacin por intervalo.
7
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
z
= x
n
De esta frmula se puede observar que tanto el tamao de la muestra como el valor de z
se conocern. Z se puede obtener de la tabla de la distribucin normal a partir del nivel de
confianza establecido. Pero en ocasiones se desconoce por lo que en esos casos lo
correcto es utilizar otra distribucin llamada "t" de student si la poblacin de donde
provienen los datos es normal.
Para el caso de tamaos de muestra grande se puede utilizar una estimacin puntual de
la desviacin estndar, es decir igualar la desviacin estndar de la muestra a la de la
poblacin (s= ).
Ejercicio.
Las medidas de los dimetros de una muestra aleatoria de 200 balineras hechas por
cierta maquina durante una semana mostraron una media de 0.824 centmetros y
desviacin estndar 0.042 centmetros. Encuentre los lmites de confianza del a) 95% y
b) 99% para el dimetro medio de todas las balineras.
8
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
s^ 0.042
X 1.96 =x 1.96 =0.824 1.96 =0.824 0.0058 cm 0.824 0.006 cm
n n 200
s^ 0.042
X 2.58 =x 2.58 =0.824 2.58 =0.824 0.0077 cm 0.824 0.008 cm
n n 200
S^
X t c
n
Ejercicio.
Una muestra de 10 medidas del dimetro de una esfera dio una media x =4.38
9
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
Entonces, usando x =4.38 y s=0.06 , los limites de confianza del 95% requeridos
son
0.06
4.38 2.26 =4.38 0.0452 cm
101
Por consiguiente, podemos tener el 95% de confianza de que las verdaderas medias
estarn entre 4.380.045=4.335 cm y 4.38+ 0.045=4.425 cm .
3.3.3 DE LA VARIANZA.
ejemplo, si x 20.025 y x 20.975 son valores de X2 para los cuales 2.5% del rea esta
en cada cola de la distribucin, entonces el 95% del intervalo de confianza es
n S2
x 20.025 2
x20.975
O de manera equivalente
(n1)S 2
x 20.025 2
x 20.975
S n
S n
X 0.975 X 0.025
O de manera equivalente
10
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
S^ n1 S^ n1
X 0.975 X 0.025
Ejercicio.
Se calcul que la desviacin estndar de los tiempos de vida de una muestra de 200
bombillas elctricas es 100 hrs. Encuentre los lmites de confianza del a) 95%, para la
desviacin estndar de todas esas bombillas elctricas.
En este caso se aplica la teora de muestreo grande. Por consiguiente los lmites de
zc
donde indica el nivel de confianza. Usamos la desviacin muestral estndar para
calcular .
Los lmites de confianza del 95% son 100 1.96(100)/ 400=100 9.8 .
Por consiguiente, podemos tener confianza del 95% de que la desviacin estndar de la
poblacin estar entre 90.2 y 109.8 hrs .
3.3.4 DE LA PROPORCIN.
P z c
pq
n
=P z c
p( 1 p)
n
11
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
P z c
pq
n
N n
N 1
Ejercicio.
Una encuesta de 100 votantes, escogidos al azar de todos los votantes en un distrito
dado, indico que el 55% est a favor de un candidato en particular. Encuentre los limites
de confianza del a) 95%, b) 99%.
S 1 y S2
Si son dos estadsticos muestrales cuya distribucin muestral es
aproximadamente normal, los limites de confianza para las diferencias de los parmetros
S 1 y S2 , estn dados por
poblacionales correspondientes a
S 1S2 z c S =S 1S 2 z c 2S + 2S
1S2 1 2
Mientras que los limites de confianza para la suma de los parmetros de la poblacin
estn dados por
S 1 +S 2 z c S =S1 + S2 z c 2S + 2S
1S 2 1 2
12
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
P1P2 z c
P 1(1P1) P2 (1P2)
n1
+
n2
P1 y P2 n1n2
Donde son las dos proporciones muestrales y son los tamaos de
las dos muestras obtenidas de la poblacin.
Ejercicio.
En una muestra aleatoria de 400 adultos y 600 adolescentes que vean cierto programa
de televisin, 100 adultos y 300 adolescentes dijeron que les gusto. Construya los limites
de confianza del 95% para la diferencia en proporciones de todos los adultos y
adolescentes que vieron el programa y lo encontraron de su agrado.
Los limites de confianza para la diferencia en proporciones de los dos grupos estn dados
por
P1P2 z c
P 1 Q 1 P2 Q 2
n1
+
n2
Por consiguiente, podemos tener confianza del 95% de que la diferencia verdadera de
proporciones este entre 0.19 y 0.31.
13
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
2 2
1 2 1 2 ,
Si se tienen dos poblaciones con medias y y varianzas y
x 1x 2 .
la estadstica
1 2 se seleccionan dos
Por tanto. Para obtener una estimacin puntual de
n1 y n 2 , se
muestras aleatorias independientes, una de cada poblacin, de tamao
( x1 x2 ) ( 1 2 )
z=
21 22
+
n1 n2
1= 2= .
Supongamos ahora que las varianzas son desconocidas pero iguales ( La
distribucin de la diferencia de medias muestrales es ahora
( x1 x2 ) ( 1 2 )
z=
21 22
+
n1 n2
( x 1x 2 )
t= =t n +n 2
1 1 1 2
s +
n1 n2
14
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
Los dos estadsticos toman exactamente el mismo valor por lo que pueden utilizarse
indistintamente. Usaremos el calculado a partir de la cuasi-varianzas porque son
estimadores insesgados de la varianza poblacional. En este caso es necesario que las
varianzas sean iguales para poder despejarlas y eliminarlas en el clculo del estadgrafo
de contraste. La comprobacin de la igualdad de varianzas se har posteriormente
aunque sea un paso previo a la decisin del tipo de contraste.
Ejercicio.
Un artculo publicado dio a conocer los resultados de un anlisis del peso de calcio en
cemento estndar y en cemento contaminado con plomo. Los niveles bajos de calcio
indican que el mecanismo de hidratacin del cemento queda bloqueado y esto permite
que el agua ataque varias partes de una estructura de cemento. Al tomar diez muestras
de cemento estndar, se encontr que el peso promedio de calcio es de 90 con una
desviacin estndar de 5; los resultados obtenidos con 15 muestras de cemento
contaminado con plomo fueron de 87 en promedio con una desviacin estndar de 4.
Supngase que el porcentaje de peso de calcio est distribuido de manera normal y que
las dos poblaciones normales tienen la misma desviacin estndar.
a) Encuentre un intervalo de confianza del 95% para la diferencia entre medias de los dos
tipos de cemento.
Para hacer inferencias estadsticas sobre dos poblaciones, se necesita tener una muestra
de cada poblacin. Las dos muestras sern dependientes o independientes de acuerdo a
la forma de seleccionarlas. Si la seleccin de los datos de una poblacin no est
relacionada con la de los datos de la otra, son muestras independientes. Si las muestras
se seleccionan de manera que cada medida en una de ellas pueda asociarse
naturalmente con una medida en la otra muestra, se llaman muestras dependientes. Cada
dato sale de alguna fuente; una fuente es algo, una persona o un objeto, que produce
datos. Si dos medidas se obtienen de la misma fuente, se puede pensar que las medidas
estn pareadas. En consecuencia dos medidas que se obtienen del mismo conjunto de
fuentes son dependientes. Note que si dos muestras son dependientes, entonces
necesariamente tienen el mismo tamao.
15
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
d d
Sd
n
Tiene una distribucin muestral que es una distribucin t con gl=n1 , donde S d
d d
t=
Sd
n
Sd
12= d t
n
Ejercicio.
Se hizo un estudio para definirse si los ejercicios aerbicos reducen el ritmo cardiaco de
una persona durante el descanso, y al examinar a diez voluntarios antes y despus de
16
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
seguir un programa de ese tipo durante seis meses, sus pulsaciones, en latidos por
minuto, dieron los siguientes registros:
Voluntario 1 2 3 4 5 6 7 8 9 10
Antes 73 77 68 62 72 80 76 64 70 72
Despus 68 72 64 60 71 77 74 60 64 68
Use =0.05 para calcular si los ejercicios aerbicos reducen el ritmo cardiaco durante
el reposo. Calcule el valor de P.
Ensayo de hiptesis:
H 0 ; A D =0
H 1 ; A D >0
Para calcular el valor de P se interpola entre 0.10 y 0.05, con 9 grados de libertad
obteniendo un rea de 0.0574, pero como el ensayo es bilateral este sera un valor de
P/2, por lo tanto el valor de P=(2)( 0.0574)=0.1148
17
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
SD 3.53
A D =d t =2 2.262
n 10
En este caso se trata de comparar dos mtodos o tratamientos, pero se quiere que las
unidades experimentales donde se aplican los tratamientos sean las mismas, lo ms
parecidas posibles, para evitar influencia de otros factores en la comparacin. Este es un
procedimiento de estimacin para la diferencia de dos medias cuando las
muestras son dependientes y las varianzas de las dos poblaciones no
necesariamente son iguales.
Otro mtodo para utilizar muestras pareadas a diferencia de la situacin que se describi
cuando las muestras son independientes, las condiciones de las dos poblaciones no se
signan de forma aleatoria a las unidades experimentales. Ms bien, cada unidad
experimental homognea recibe ambas condiciones poblacionales; como resultado, cada
unidad experimental tiene un par de observaciones, una para cada poblacin.
d i= X iY i
18
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
Ejercicio.
empleado empleado di d i2
5 d
d= =0.5 Estimador puntual insesgado de
10
Determinar la variable aleatoria funcin del estimador y del parmetro cuya distribucin
este definida.
19
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
d d
T= Con n1 grados de libertad.
sd / n
S d < D < d+
dt t Sd
2 n 2 n
0.736
d =5+ 1.8333 =0.073
10
0.736
d =5+ 1.8333 =0.0927
10
n1 n2 , respectivamente, sean
disponibles dos muestras aleatorias de tamaos y
20
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
2 2
S1 y S2 las dos varianzas muestrales. Se desea conocer un intervalo de confianza
Ejercicio.
m 2 16
s^ 21= s=
m1 1 15 ( )
( 24 )=25.2
m 2 10
s^ 22= s=
m1 2 9 ( )
( 18 )=20
( p1 p 2 )( P1P2 )
Z=
P1 q1 P2 q2
n1
+
n2
Aqu se tiene el mismo caso que en la estimacin de una proporcin, ya que al hacer el
despeje nos queda las dos proporciones poblacionales y es precisamente lo que
21
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
P1P2=( p1 p2 ) z
P1 q1 P2 q 2
n1
+
n2
Ejercicio.
P1 P2
Sean y las proporciones reales de defectuosos para los procesos actual y
uso de la tabla encontramos que z para un nivel de confianza del 90% es de 1.645.
P1P2=( p1 p2 ) z
P1 q1 P2 q 2
n1
+
n2
( 0.050.04 ) 1.645
( 0.05 )( 0.95 ) ( 0.04 ) ( 0.96 )
1500
+
2000
Como el intervalo contiene el valor de cero, no hay razn para creer que el nuevo
procedimiento producir una disminucin significativa en la proporcin de artculos
defectuosos comparada con el mtodo existente.
Si suponemos que cierta hiptesis es verdadera, pero encontramos que los resultados de
una muestra aleatoria difieren marcadamente de los esperados bajo la hiptesis sobre la
base del azar de la teora del muestreo, podremos decir que las diferencias observadas
22
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
Los procedimientos que nos permiten aceptar o rechazar hiptesis o determinar si las
muestras observadas difieren significativamente de los resultados esperados reciben el
nombre de pruebas de hiptesis, pruebas de significancia o reglas de decisin.
Es importante recordar que las hiptesis siempre son proposiciones sobre la poblacin o
distribucin bajo estudio, no proposiciones sobre la muestra. Por lo general, el valor del
parmetro de la poblacin especificado en la hiptesis nula se determina en una de tres
maneras diferentes:
23
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
Ejercicio.
H 0 ; =50 cm/s
H 1 ; 50 cm/s
hiptesis alternativa especifica valores de que pueden ser mayores o menores que
50 cm/s, tambin se conoce como hiptesis alternativa bilateral.
H 0 ; =50 cm/s
H 1 ; <50 cm/ s
Con el fin de llegar a una decisin es til hacer suposiciones o conjeturas sobre las
poblaciones involucradas. Tales suposiciones, que pueden ser o no ciertas, reciben el
nombre de hiptesis estadsticas y, en general, son planteamientos sobre la distribucin
de probabilidad de las poblaciones.
Por ejemplo, si vamos a decidir si cierta moneda esta cagada, formulamos la hiptesis de
que la moneda es balanceada, es decir, p=0.5 , donde p es la probabilidad de
obtener caras. De igual manera, si queremos decidir si un procedimiento es mejor que
otro formulamos la hiptesis de que no hay diferencia entre los procedimientos (as,
cualquier diferencia observada se debe a meras fluctuaciones en el muestreo de la misma
poblacin). Tales hiptesis se llaman hiptesis nulas o simplemente hiptesis, y se denota
24
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
p=0.7, p 0.5 o p>5 . Una hiptesis alterna de la hiptesis nula se denota por H1 .
Ejercicio.
> 0
Sol. a) El fabricante debera usar la hiptesis alternativa y comprar la maquina
nueva solo si se puede rechazar la hiptesis nula.
< 0
b) El fabricante debera usar la hiptesis alternativa y comprar la maquina nueva
a menos de que se rechace la hiptesis nula.
Al probar una hiptesis dada, la probabilidad mxima con la que queremos tomar el riesgo
de un error tipo I se llama nivel de significancia de la prueba. Esta probabilidad se
especifica antes de que se hayan tomado muestras, para que los resultados obtenidos no
influyan en nuestra decisin.
25
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
Nuestra eleccin del estndar mnimo para una probabilidad aceptable, o el nivel de
significancia, es tambin el riesgo que asumimos al rechazar una hiptesis nula cuando
es cierta. Mientras ms alto sea el nivel de significancia que utilizamos para probar una
hiptesis, mayor ser la probabilidad de rechazar una hiptesis nula cuando es cierta.
Ejercicio.
Una marca de nueces afirma que, como mximo, el 6% de las nueces estn
vacas. Se eligieron 300 nueces al azar y se detectaron 21 vacas. Con un nivel
de significacin del 1%, se puede aceptar la afirmacin de la marca?
H 0 : p 0 . 06 H 1 : p>0 . 06
Zona de aceptacin
=0 . 01 z =2 . 33 .
(; 0.06+2.33
)
( 0.06 ) ( 0.94 )
300
=( ; 0.092 )
21
Verificacin.
p= =0.07
300
26
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
Para que cualquier prueba de hiptesis o las reglas de decisin sean adecuadas, se
deben disear de manera que reduzcan los errores de la decisin. Esto es sencillo ya
que, para un tamao muestral dado, el intento de disminuir un tipo de error va
generalmente acompaado del incremento en el otro tipo de error, En la prctica, un tipo
de error puede ser ms grave que el otro, de manera que debemos inclinarnos a favor de
una limitacin del error ms grave. La nica manera de reducir ambos tipos de error es
incrementando el tamao de la muestra, lo cual puede o no ser posible.
Ejercicio.
a) =42. 5 minutos
b) =41. 2 minutos?
Ya que x =41 . 8 cae en el intervalo de 40.5 a 44.4, aceptaran la hiptesis nula de que
en promedio los automviles permanecen en el rea de estacionamiento momentneo
durante 42.5 minutos.
b) Puesto que la hiptesis nula es falsa pero se acepta, estarn cometiendo un error
tipo II
27
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
Las suposiciones para esta prueba son mnimas. La poblacin o distribucin de inters
2
tiene una media y una varianza , conocida. El estadstico de prueba se basa
distribuida de manera normal o que se aplican las condiciones del teorema del lmite
S= X s = X =
Aqu , la media muestral; , la media de la poblacin;
X
Z=
/n
Cuando es necesario, la desviacin estndar muestral, s o s^ , se utiliza para
H0
la prueba de dos colas, podemos aceptar (o al menos no rechazarla) al nivel de
x a
1.96 1.96
/n
28
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
x a
<1.645
/n
H0
Y rechazarla de otra manera. Para probar en contra de la hiptesis alterna de que
x a
>1.645
/n
Ejercicio.
Se calculo que el tiempo de vida medio de una muestra de 100 bombillas fluorescentes
producidas por una compaa es de 1570 horas con desviacin estndar de 120 horas. Si
es el tiempo de vida medio de todas las bombillas producidas por la compaa,
Se debe usar una prueba de dos colas ya que 1600 hrs incluye los valores
ms grandes y ms pequeos que 1600.
Para una prueba de dos colas con nivel de significancia de 0.05, tenemos la
siguiente regla de decisin:
H0 z
1) Rechazar la si el valor de la media muestral esta por fuera del
29
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
H0
2) De otra manera aceptar (o abstenerse a tomar la decisin).
X X = X = / n ,
muestral de tiene media y desviacin estndar
Z ( X1600)/12=(15701600)/12=2.50 se encuentran fuera del rango de
S=P , s = p= p , donde p es la
Aqu la proporcin de xitos en una muestra;
P p
Z=
pq/n
Xnp
Z=
npq
Se pueden hacer observaciones similares a las hechas atrs sobre pruebas de una y dos
colas para medias.
Ejercicio.
30
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
Tenemos dos grupos, A y B, cada uno de 100 personas que sufren una enfermedad. Se le
da un suero al grupo A, pero no al grupo B (grupo de control); para lo dems, ambos
grupos se manejan de manera idntica. Se encontr que en los grupos Ay B, 75 y 65
personas, respectivamente, se recuperaron de la enfermedad. Pruebe la hiptesis de que
el suero ayuda a curar la enfermedad usando un nivel de significancia de 0.01.
H 0 : p1 =p 2
. Y las diferencias observadas de deben al azar, es decir, el suero
H 1 : p1 > p2
no es efectivo y el suero es efectivo
H0 ,
Bajo la hiptesis
P P =0 ; P P = pq
1 2 1 2
( 1 1
)
+ = ( 0.70 ) (0.30)
n 1 n2
1
( +
1
100 100 )
=0.0648
P1P2 0.7500.650
Z= = =1.54
P P
1
0.0648
2
Con base en una prueba de una cola con nivel de significancia e 0.01, podemos
H0 z
rechazar la hiptesis si solo el valor fuera mayor que 2.33. Dado que
31
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
H0
2
Para probar la hiptesis de que una poblacin normal tiene varianza ,
consideramos las variables aleatorias
1
n S2 (n1) S
X 2= =
2 2
La cual tiene la distribucin chi cuadrado con n1 grados de libertad. Entonces, si una
2
muestra aleatoria de tamao n resulta tener varianza S , podemos, sobre la base
n S2
x 20.025 2
x20.975
Y rechazarla de otra manera. Se obtiene un resultado similar para el nivel de 0.01 u otro
H 1 de que la varianza de la poblacin es mayor que
nivel. Para probar la hiptesis de
2
H0
, podemos aun usar la hiptesis nula pero ahora emplearemos la prueba de
H0
una cola. As, podemos rechazar al nivel de 0.05 (y por consiguiente concluir que
n S2 2
> x 0.975
2
Ejercicio.
que los dimetros de estas piezas se distribuyen normalmente; con propsitos de control
de calidad, se obtuvo una muestra de 25 pernos de una lnea de produccin para estimar
2 2
la varianza de todos los dimetros, la cual result ser S =0.009 mm . Con un nivel de
32
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
Datos:
n=25
S 2=0.009 mm2
0.05
Establecer la hiptesis
la zona de rechazo.
g .l=24
36.415
( n1)S 2
X 2= Como la
2
esta bajo la hiptesis nula entonces tenemos
2
( 24 ) (0.009)
X 2= =21.6
0.01
33
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
Como 21.6 es menor que 36.415 no se rechaza la hiptesis nula con un nivel de
significancia de 0.05. Conclusin: Existe evidencia estadstica para decir que la varianza
n1 n2 1 2
y de poblaciones respectivas con media y y desviaciones
x x =0 x x =
1 2
21 22
+
n1 n2
1 2
s1
Donde podemos, si es necesario, usar las desviaciones estndar observadas y
1 X 2
X
Z=
x x1 2
Ejercicio.
34
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
1
Supongamos que los dos cursos vienen de dos poblaciones con medias respectivas
H 0 : 1=2
y la diferencia se debe al azar.
H 1 : 1 2
y hay una diferencia significativa entre ambos cursos.
21 22
2 2
8 7
x x =0 x x = + = + =1.606
1 2 1
n1 n2
2
40 50
1 2
Donde usamos las deviaciones estndar muestrales como estimadores de y
.Entonces:
1 X 2 7478
X
Z= = =2.49
x x
1 2
1.606
Para una prueba de dos colas, los resultados son significativos al nivel de 0.05 si Z
esta por afuera del rando 19.6 a 1.96 . Entonces concluimos que al nivel de 0.05
hay una diferencia significativa en el desempeo de los dos cursos y que probablemente
el segundo curso es mejor.
P1 P2
Sean y las proporciones muestrales obtenidas en muestras grandes de
n1 n2 p1 p2 .
tamaos y de las poblaciones respectivas con proporciones y
Considere la hiptesis nula de que no hay diferencia entre las proporciones de la
p1= p2 , y por lo tanto, de que las muestras se tomaron
poblacin, es decir,
realmente de la misma poblacin.
35
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
P P =0 P P = p ( 1p )
1 2 1 2
( n1 + n1 )
1 2
P1P2
Z=
P P
1 2
Ejercicio.
Una encuesta hecha a 300 votantes del distrito A y a 200 del distrito B mostro que 56% y
48%, respectivamente, estaban a favor de un candidato dado. Con el nivel de significancia
de 0.05 pruebe la hiptesis de que: Hay diferencia entre los distritos.
P1 P2
Sean y las proporciones de todos los votantes de los distritos A y B,
respectivamente, que estn a favor del candidato.
H 0 : P1 =P 2 , tenemos
Bajo la hiptesis
P P =0 P P = p ( 1p )
1 2 1 2
( n1 + n1 )=(0.528)( 0.472)( 3001 + 2001 )=0.0456
1 2
P1P2 0.5600.480
Z= = =1.75
P P
1
0.0456
2
Si solamente queremos determinar si hay una diferencia entre los distritos, debemos
H 0 ; P1 =P 2 y H 1 ; P1=P2 , lo que involucra una prueba de
decidir entre la hiptesis
dos colas. Con base en una prueba de dos colas con nivel de significancia de 0.05,
H 0 , si Z esta fuera del intervalo -1.96 a 1.96. Dado que Z =1.75
debemos rechazar
36
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
H0
esta dentro del intervalo, no podemos rechazar con este nivel de significancia, es
decir, no hay diferencia significativa entre los dos distritos.
s21 / 21
F= 2 2
s2 / 2
2 2
Donde 1 y 2 son las varianzas de dos poblaciones normales de las cuales se
H0
tomaron las muestras. Supongamos que denota la hiptesis nula de que no hay
2 2
diferencia entre las varianzas de las poblaciones, es decir 1= 2 . Entonces, bajo
s^ 21
F=
s^ 22
Para probar esta hiptesis al nivel de 0.10, por ejemplos, primero debemos observar que
F tiene la distribucin F con m1, n1 grados de libertad. Entonces, usando
H 0 al nivel de 0.10 si
una prueba de dos colas, podemos aceptar
^s21
F0.05 2 F0.95
^s2
Ejercicio.
37
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
9
12
2 n1 2 16
s^ 1= s=
n11 1 15
H 0 ; 1= 2
, y cualquier variacin se debe al azar
H 1 ; 2> 1
, y la variacin del curso B es mayor que la del A
Por lo tanto, la decisin de debe basar en una prueba de una cola de la distribucin F.
para las muestras en cuestin.
s^ 2 150
F= 22 = =1.74
s^ 1 86.4
r 2=251=24 ;
El nmero de grados de libertad asociados con el numerador es para
r 1=161=15 ;
el denominador, grados de libertad. Al nivel de 0.01 para 24, 15 grados
H 0 al nivel de 0.01.
no podemos rechazar
38
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
()
P ( X=r )=p r= n p r qn r
r
aproximarse por medio de una distribucin normal de tipo N (np , npq), que resulta
Para transformar una distribucin binomial (de variable discreta) en una normal (de
variable continua).
Ejercicio.
39
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
obtiene:
Y por tanto, en 100 cajas, las "tericas" apariciones de los valores 0,1,2,3,4 , seran:
65.6 , 29.2, 4.9 ,0.4 y 0 , que son muy similares a las encontradas en la muestra.
A partir de aqu, el empresario puede asumir que la probabilidad de que un juguete sea
defectuoso es del 10 , podr hacer previsiones para las 5000 cajas de que va a
40
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
x
e
Pr ( X =x )= x=0,1,2
x!
Ejercicio.
=0.05
2
(oe)
X =
2
e
otra manera, se seala que no hay ningn indicio de que los dgitos de la tabla no se
puedan considerar como aleatorios. (Aqu m=0 por que ninguno de los parametros de
la distribucin de la probabilidad se deba estimar apartir de los datos de la muestra).
41
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
2
2125
2825 2
3325 2
X 2=
Dado que X 2 7.92 no es mayor que 16.919, no se puede rechazar la hiptesis nula; en
otras palabras, no hay indicios de que no se puedan considerar los dgitos de la tabla XI
como aleatorios.
Xx
Z=
Ejercicio.
=0.05
42
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
2
Se rechaza la hiptesis nula si X 9.488 , donde
Xx
Z=
acepta la hiptesis nula o se reserva la opinin. (Aqu, k =6 por que se deban sumar
seis parmetros para obtener X 2 y m=1 por que p se tena que estimar a partir
1013.7 2
1919.6 2
2924.9 2
2621.6 2
1313 2
37.1 2
X 2=
2
Puesto que X =5 no es mayor que 9.488, no se debe rechazar la hiptesis nula; en
otras palabras, no hay ninguna evidencia real de que la variable aleatoria (el nmero de
autobuses que llegan retrasados por semana) no tenga una distribucin binomial.
43
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
justificarse o en las que hay duda de que aplican, como en el caso en que una poblacin
puede estar altamente sesgada. Debido a esto, los estadsticos han ideado diferentes
pruebas y mtodos que son independientes de las distribuciones de la poblacin y de sus
parmetros asociados. Estas se denominan pruebas no paramtricas. Las pruebas no
paramtricas se pueden usar como un mtodo abreviado para reemplazar pruebas ms
complejas. Son especialmente valiosas al tratar con datos no numricos, tales como los
que surgen cuando los consumidores ordenan cereales u otros productos en orden de
preferencia.
~
1 ~
2=d 0
Tambin se puede utilizar la prueba de signo para probar la hiptesis nula
d i , con un signo
para observaciones pareadas. Aqu se reemplaza cada diferencia,
d id 0 , es positiva o negativa. A lo
ms o menos dependiendo si la diferencia ajustada,
largo de esta seccin suponemos que las poblaciones son simtricas. Sin embargo, aun si
las poblaciones son asimtricas se puede llevar a cabo el mismo procedimiento de
prueba, pero las hiptesis se refieren a las medianas poblacionales en lugar de las
medias.
media son iguales. Solo ocasionalmente nos vemos en una situacin que nos
permite suponer la simetra de una poblacin. Los procedimientos que siguen por lo
~
regular se describirn en trminos de la mediana pero debemos recordar que en
ciertas situaciones la mediana y la media son iguales. Aunque la prueba del signo es
particularmente til para las muestras pareadas, tambin se puede usar para problemas
que involucran muestras sencillas.
Ejercicio.
44
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
H0
Con relacin a la tablas 10-1, pruebe la hiptesis la hiptesis de que no hay
X 12 X 12
( )( ) ( )
Pr ( X )= 12 1
X 2
1
2 ( )( )
= 12 1
X 2
H1
Dado que es la hiptesis de que hay una diferencia entre las maquinas, en contra
de la hiptesis de que la maquina I es mejor que la maquina II, usamos una prueba de
dos colas. Para el nivel de significancia de 0.05, cada cola tiene la probabilidad asociada
( 12 )( 0.05 )=0.025 . Ahora agregamos las probabilidades al lado izquierdo hasta que la
0, 1o 2
=0.00024+0.00293+ 0.01611=0.01928
Pr caras
0, 1,2 o 3
Pr caras =0.00024+0.00293+ 0.01611+0.05371=0.07299
Dado que 0.025 es mayor que 0.01928, pero menor que 0.07299, podemos rechazar la
H 0 si el numero de caras es 2 o menor (o por simetra, si el numero de caras
hiptesis
es 10 o mayor). Sin embargo, el numero de caras (los signos + de la secuencia) es 3. Por
H0
lo tanto, no podemos rechazar al nivel de 0.05 y debemos concluir que no hay
diferencia entre las maquinas a este nivel.
Se puede notar que la prueba de signo utiliza slo los signos ms y menos de las
0 en el caso de una muestra, o los signos ms y
diferencias entre las observaciones y
45
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
Esta prueba se aplica en el caso de una distribucin continua simtrica. Bajo esta
= 0 . Primero se resta 0
condicin se puede probar la hiptesis nula de cada
valor muestral y se descarta todas las diferencias iguales a cero. Se asigna un rango de 1
a la diferencia absoluta ms pequea, un rango de 2 a la siguiente ms pequea, y as
sucesivamente. Cuando el valor absoluto de dos o ms diferencias es el mismo, se asigna
a cada uno el promedio de los rangos que se asignaran si las diferencias se
distinguieran. Por ejemplo, si la quinta y sexta diferencia son iguales en valor absoluto, a
= 0
cada una se le asignara un rango de 5.5. Si la hiptesis es verdadera, el total
de los rangos que corresponden a las diferencias positivas debe ser casi igual al total de
los rangos que corresponden a las diferencias negativas. Se representan esos totales
+ +
como w y w , respectivamente. Se designa el menor de w y w con w .
+
Al seleccionar muestras repetidas esperaramos que variaran w y w , y por tanto
+
w . De esta manera se puede considerar a w y w , y w como valores de las
+ = 0
correspondiente variables aleatorias w , w , y W . La hiptesis nula
< 0
se puede rechazar a favor de la alternativa slo si w+ es pequea y w es
> 0 +
grande. Del mismo modo, la alternativa se puede aceptar slo si w es
H0
grande y w es pequea. Para una alternativa bilateral se puede rechazar a
H 1 si + o
favor de w w y por tanto w son suficientemente pequeas. No importa
cul hiptesis alternativa puede ser, rechazar la hiptesis nula cuando el valor de la
+
estadstica apropiada w , w , o W es suficientemente pequeo.
46
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
Para probar la hiptesis nula de que se muestrean dos poblaciones simtricas continuas
1=2 para el caso de una muestra pareada, se clasifican las diferencias de las
con
observaciones paradas sin importar el signo y se procede como en el caso de una
muestra. Los diversos procedimientos de prueba para los casos de una sola muestra y de
una muestra pareada se resumen en la siguiente tabla:
No es difcil mostrar que siempre que n<5 y el nivel de significancia no exceda 0.05
para una prueba de una cola 0.10 para una prueba de dos colas, todos los valores
+
posibles de w , w , o w conducirn a la aceptacin de la hiptesis nula. Sin
+
w y w para niveles de significancia iguales a 0.01, 0.025 y 0.05 para una prueba
de una cola, y valores crticos de W para niveles de significancia iguales a 0.02, 0.05 y
0.10 para una prueba de dos colas. La hiptesis nula se rechaza si el valor calculado
+
w , w o w es menor o igual que el valor de tabla apropiado. Por ejemplo,
,
+
cuando n=12 la tabla A .16 muestra que se requiere un valor de w 17
Ejercicio.
Los siguientes datos representan el nmero de horas que un compensador opera antes
de requerir una recarga: 1.5, 2.2, 0.9, 1.3, 2.0, 1.6, 1.8, 1.5, 2.0, 1.2 y 1.7. Utilice la prueba
de rango con signo para probar la hiptesis en el nivel de significancia de 0.05 que este
compensador particular opera con una media de 1.8 horas antes de requerir una recarga.
47
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
H 0 ; =1.8 H 1 ; 1.8
Se proceder a efectuar las diferencias y a poner rango con signo a los datos.
2.2 0.4 7
0.9 -0.9 10
1.3 -0.5 8
2.0 0.2 3
1.6 -0.2 3
1.8 0 Se anula
2.0 0.2 3
1.2 -0.6 9
48
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
1.7 -0.1 1
Regla de decisin:
Para una n=10, despus de descartar la medicin que es igual a 1.8, la tabla muestra
+=7+3+3=13
W
=5.5+10+ 8+3+5.5+9+1=42
W
+
Por lo que w=13 (menor entre W y W ).
Decisin y Conclusin:
49
ESQUIVEL REYES GEOVANNI ALEXIS
ESTADSTICA UNIDAD 3 ESTIMACIN Y PRUEBA DE HIPTESIS
juntas se ordenan y que las sumas de los rdenes para las k muestras son
R1 , R2 , , R k , respectivamente. Si definimos el estadstico:
12
k
R2j
H= 3( N +1)
N (N +1) j=1 N j
Ejercicio.
Se escogen al azar 3 muestras de una poblacin. Acomodando los datos segn rango
obtenemos la tabla 10-21. Determine si hay alguna diferencia al nivel de significancia de
0.05 entre las muestras.
Muestra 1 7 4 6 10
Muestra 2 11 9 12
Muestra 3 5 1 3 8 2
k =3, N 1 =4, N 2=3, N 3=5, N =N 1 + N 2 + N 3=12 , R 1=7+ 4+6 +10=27, R2=11+ 9+12=32,
R3=5+1+3+ 8+2=19. As
y
[ ]
k 2 2 2
12 Rj 12 27 32 19
H=
N ( N +1) j=1 N j
3 ( N +1 ) =
( 12 ) (13) 4
+
3
+
5
3 ( 13 )=6.83 .
2
Para k 1=31=2 grados de libertad, x 0.95=9.21 . As, dado que 6.83<9.21 no
podemos concluir que hay una diferencia significativa entre las muestras al nivel de 0.05.
50
ESQUIVEL REYES GEOVANNI ALEXIS