Documente Academic
Documente Profesional
Documente Cultură
INTRODUCCIN
A LA
INFERENCIA ESTADSTICA
El proceso de Inferencia Estadstica permite extraer conclusiones cientficamente
vlidas acerca de la poblacin a partir de los resultados mustrales (obtenidos a
travs de la estadstica descriptiva).
- Estimacin de Parmetros
- Contraste de Hiptesis
Estimacin de Parmetros
El mtodo de estimacin de un parmetro puede ser puntual o por intervalo.
Estimacin puntual de
En base al resultado de la muestra particular de tamao n, una estimacin puntual de
X
sera el valor numrico que toma
en dicha muestra.
En nuestro ejemplo, a partir de una muestra de n=50 planchas de acero. Daramos como
X
estimacin del peso medio poblacional o terico,
= 215 Kg.
Inconveniente(s):
X N ( , X ) Z
Donde:
N (0,1)
X N ( , sX ) T
Donde:
SX
X
tn 1
sX
x
Sx
conocida
Tamao de poblacin (N) demasiado grande o
infinita.
S
n
N n
N 1
conocida
Tamao de poblacin (N) conocido o finita.
desconocida, entonces
Tamao de poblacin (N) demasiado grande o
infinita.
Sx
S
n
N n
N 1
desconocida, entonces
Tamao de poblacin (N) conocida o finita.
o desconocida
se extrae una muestra de tamao n, entonces de la distribucin de la
X
media muestral se obtiene que, lleva asociado un error tpico de dicho estadstico de lo
que ha de tenerse en cuenta para valorar la precisin de una estimacin puntual.
Idea
X
Caso I: X N (, ), conocida
El Intervalo de confianza para es:
X Z1 / 2 * X X Z1 / 2 * X
X t1 / 2;n1 * S X X t1 / 2;n 1 * S X
Tamao de muestra
Se puede determinar que tan grande debe ser el tamao de la muestra, n, de manera que si
se estima por
1
2
e2
Z 2 * 2 * N
n
* 2 e 2 ( N 1)
Si la desviacin estndar (
) es
desconocida, se estima por la desviacin
estndar muestral (S) hallado a partir de una
muestra piloto.
Tamao de poblacin (N) conocida o
finita
Si la desviacin estndar (
) es
desconocida, se estima por la desviacin
estndar muestral (S) hallado a partir de
una muestra piloto.
Ejemplo 1: Una encuesta realizada a 25 empleados de un sector dio como resultados que
el tiempo medio de empleo era de 5,3 aos con una desviacin tpica de 1,2 aos.
a) Estimar, al 90% de confianza, el tiempo medio de empleo para el sector, suponiendo
Normalidad.
b) Si el margen de error hubiera sido de 1 ao qu grado de confianzase tendra?
c) Qu tamao muestral es necesario si se quisiera el margen de error del apartado
primero y el grado de confianza del apartado segundo?
Solucin: a)
Estimar, al 90% de confianza, el tiempo medio de empleo para el sector, suponiendo
Normalidad.
Datos:
X: Tiempo de empleo supuestamente Normal
Tamao de muestra
: n = 25 empleados
X
Tiempo medio de empleo
:
= 5,3 aos
Desviacin tpica muestral
Confianza
: S = 1,2 aos (
desconocido)
1
:
= 0,90
= 0,10
X t1 / 2;n 1 * S X X t1 / 2;n 1 * S X
Entonces:
SX
= 5,3
Reemplazando en la frmula:
5,3 1,711*0,24
5,3 0,411
4,889
(Buscar tabla)
S
1, 2
0, 24
n
25
5,3 + 1,711*0,24
5,3 + 0,411
5,711
Interpretacin: El tiempo medio de empleo de todos los empleados del sector se estima
en 4,9 a 5,7 aos, con una confianza del 90%.
Solucin:b)
Si el margen de error hubiera sido de 1 ao qu grado de confianza se tendra?
Error de estimacin: e =
z1 / 2 * S X
z1 / 2 *
1=
z1 / 2 4,17
s
n
z1 / 2 *
1=
1, 2
25
0,99999
0, 00002
2
1 0,99998
Solucin: c)
Qu tamao muestral es necesario si se quisiera el margen de error del apartado primero y
el grado de confianza del apartado segundo?
Tamao de muestra con margen de error de 0,411 y
Grado de confianza 0,99998
N=Tamao de poblacin de empleados desconocido de la entidad
Z2 *S2
1
e2
4, 09 2 *1, 2 2
0, 4112
n 142, 6 143
Ejemplo 2: El nmero de horas diarias que los empleados de cierta entidad bancaria de
mbito nacional trabajan delante del ordenador es una variable aleatoria normal con
varianza 1,5. Se toma una muestra al azar de 10 empleados y se anota el nmero de horas
que cierto da trabajaron con el ordenador:
6 3,4 5,6 6,3 6,4 5,3 5,4 5 5,2 5,5
a) Determina el intervalo de confianza al 95% para el nmero medio de horas diarias que se
trabaja en el ordenador en esa entidad. Explica claramente el resultado comentando que
significa el 95% de confianza.
b) Qu tamao muestral es necesario si se quisiera el margen de error del apartado primero
y el grado de confianza de 90%?
Solucin:a)
Datos:
X: Nmero de horas diarias variable Normal
Varianza poblacion :
= 1,5 conocido
Desviacin estndar
= 1,225
Tamao de muestra : n = 10 empleados
Nmero promedio de horas diarias se halla a partir de los valores numricos registrados de
10
los 10 empleados
Confianza
x
11
= 0,95
6 3, 4 5, 6 ... 5,5
10
= 5,41 horas
= 0,05
Z1 / 2 Z 0,975 1,960
= 5,41
5,41 1,96*0,387
(Buscar tabla)
5,41 + 1,96*0,387
1, 225
0,387
n
10
5,41 0,759
5,41 + 0,759
4,651
6,169
Interpretacin: El nmero medio de horas diarias que trabajan delante del ordenador
todos los empleados de cierta entidad bancaria se estima en 4,6 a 6,2horas, con una
confianza del 95%; el cual significa que de 100 muestras de empleados seleccionados de
toda la entidad bancaria, 95 de ellas estiman dicho parmetro.
Solucin:b)
Datos:
Margen de error
Varianza poblacional
: e = 0,759
:
= 1,5
1
Confianza
:
= 0,90
= 0,10
Tamao de la poblacin : N desconocido
En base a los datos corresponde utilizar la formula:
Z 2 * 2
2
1
Z 0,95
*1, 5
1, 6452 *1, 5
2
n
e2
0, 759 2
0, 759 2
n 7, 05 7
Ejercicios Propuestos
Ejercicio 1: La duracin aleatoria de las unidades producidas de un artculo, se
distribuye segn la ley normal, con desviacin tpica igual a seis minutos. Elegidas
al azar cien unidades, resulto ser la duracin media de 14,35 minutos. Elaborar el
intervalo de confianza del 99% para la duracin media de las unidades producidas.
Ejercicio 2: Se analizan 9 zumos de fruta y se ha obtenido un contenido medio de
fruta de 22 mg por 100 cc de zumo. La varianza poblacional es desconocida, por lo
que se ha calculado la cuasi desviacin tpica de la muestra que ha resultado ser 6,3
mg de fruta por cada 100 cc de zumo. Suponiendo que el contenido de fruta del
zumo es normal, estimar el contenido medio de fruta de los zumos tanto
puntualmente como por intervalos al 95% de confianza.
Ejercicio 3: Se desea estimar el nmero medio de libros que los estudiantes de
cierta titulacin adquieren en el ltimo curso de sus estudios. Suponiendo conocida
la dispersin (varianza igual a 36) y siendo Normal el comportamiento de la
variable,
a) qu tamao muestral hace falta para alcanzar un grado de confianza del 95% y
un margen de error no superior a 2 unidades?
b) Cul sera el tamao muestral si queremos reducir el intervalo a la mitad sin
perder fiabilidad?
Ejercicio 4: Queremos ajustar una mquina de refrescos de modo que el promedio
del lquido dispensado quede dentro de cierto rango. La cantidad de lquido vertido
por la mquina sigue una distribucin normal con desviacin estndar 0.15
decilitros. Deseamos que el valor estimado que se vaya a obtener comparado con el
verdadero no sea superior a 0.2 decilitros con una confianza del 95%. De qu
tamao debemos escoger la muestra?
Ejercicio 5: Es necesario estimar entre 10000 establos, el nmero de vacas lecheras por
establo con un error de estimacin de 4 y un nivel de confianza del 95%.Sabemos que la
varianza es 1000. Cuntos establos deben visitarse para satisfacer estos requerimientos?
12 / 2; n 1
) es:
( n 1) s 2
2 / 2;n 1
Solucin:
Datos:
Calculando la cantidad media de impurezas a partir de los valores numricos
10
11
S
2
S2
(X
i 1
X )2
n 1
2, 2 2,1
8 1
= 0,288
Confianza
Entonces el intervalo es:
( n 1) s 2
2
1 / 2; n 1
2, 016
2,016
2
18, 475
1, 239
Por lo tanto:
( n 1) s 2
/ 2; n 1
2
= 0,98
= 0,02
8 1 * 0, 288 2
2
0,99;7
8 1 * 0, 288
2
0,01;7
0,109 2 1, 627
0,330 1, 275
Ejercicios Propuestos
Ejercicio 1: Se sabe por experiencia que el tiempo que tarda el servicio de caja de
una empresa prestadora del servicio de agua de una regin para atender a los clientes
que llegan a efectuar el pago mensual del servicio se distribuye normalmente. Se
pide estimar el intervalo de confianza para la desviacin estndar poblacional del
tiempo requerido para atender los pagos que efectan los clientes, con un nivel de
confianza del 95%, si para el efecto se tom una muestra aleatoria de 25 clientes que
arroj una desviacin estndar de 1.8 minutos.
Ejercicio 2: El tiempo que transcurre para los obreros de una gran compaa entre el
momento del ingreso a la planta y el momento en que estn listos para recibir las
orientaciones de su jefe inmediato, se distribuye normalmente. Una muestra de 20
obreros arroja una desviacin estndar de 3.5 minutos. Se pide calcular el intervalo
de confianza del 99% para la desviacin estndar del tiempo transcurrido para todos
los obreros de la compaa.
1 2
12
22
X 2 Z1 / 2 * X1 X 2 1 2 X 1 X 2 Z1 / 2 * X1 X 2
X1 X 2
Donde:
12 22
n1
n2
12 22
X 2 t1 / 2;v * S X1 X 2 1 2 X 1 X 2 t1 / 2;v * S X1 X 2
v n1 n2 2
Donde:
es el grado de libertad.
n1 1 * s12 n2 1 * s22
S X1 X 2
n1 n2 2
1
1
n1 n2
12 22
X 2 t1 / 2;v * S X1 X 2 1 2 X 1 X 2 t1 / 2;v * S X1 X 2
Donde:
S12
S2
2
n1
n2
2
2
2
S12 S 22
n1
n2
n1 1
n2 1
redondeado entero.
S X1 X 2
s12 s22
n1 n2
Solucin:
Suponiendo normalidad las producciones de las dos semanas
Cada semana son muestras independientes
Varianzas poblacionales desconocidas (
Ahora
12 22
Hiptesis nula
:
H1 : 12 22
Hiptesis alterna
Estadstico de prueba
mx ( s12 , s22 )
F
mn( s12 , s22 )
Semana 1:
Calculo de la media
10
X1
x
11
93 86 90 ... 96
91, 50
8
X 1 91,50
Calculo de la varianza
n
S
2
1
(X
i 1
X )2
n 1
93 91, 50
S12 9,143
Semana 2:
Calculo de la media
10
X2
x
11
93 87 97 ... 93
89,88
8
X 2 89,88
Calculo de la varianza
n
S2
2
(X
i 1
X )2
n 1
93 89,88
s22
17, 839
1, 951
2
s1
9,143
Regiones crticas
2
S 2 17,839
0,200
4,99
ZR/-------------------Zona------------------/--------Zona--------Aceptacin
Rechazo
La zona de aceptacin para un nivel de significacin del 5% est delimitada por 0,200 y
4,990, correspondientes a las probabilidades /2 y (1 - /2) respectivamente.
Decisin
Como
Fc
= 1,951 se ubica en la zona de aceptacin cuyo intervalo es (0,200; 4,99) se
H0
acepta
2
2
: 1 = 2
Luego se concluye que no hay diferencias entre las varianzas poblacionales, lo que indica el
cumplimiento del supuesto de homogeneidad de varianzas
X 2 t1 / 2;v * S X1 X 2 1 2 X 1 X 2 t1 / 2;v * S X1 X 2
X1 X 2
Coeficiente de confianza
Grados de libertad
t1 / 2;n1 n2 2 t0,975;14
= 0,95
= 0,05
v n1 n2 2
= 8 + 8 2 = 14
= 2,145
S X1 X 2
8 1 *9,143 8 1 *17,839
882
1 1
8 8
S X1 X 2
= 1,8365
1,62 2,145*1,8365
1 2
-2,319
5,559
1,62 + 2,145*1,8365
Ejercicios Propuestos
Ejercicio 1: Un profesor de estadstica realiza un idntico cuestionario a dos grupos
de estudiantes de dos universidades diferentes de la misma ciudad. En una muestra
aleatoria de 9 estudiantes de la universidad A, el promedio de notas fue de 7.5 y
desviacin estndar de 0.4. En otra muestra aleatoria de 9 estudiantes de la
universidad B la media de las notas fue de 6.7 y desviacin estndar de 0.6. Calcular
los lmites de confianza del 95% para la diferencia de medias de las notas entre las
dos universidades. Se sabe que la escala de calificacin es de 0 a 10.
Ejercicio 2: Se quiere estimar la diferencia de los promedios de los salarios entre la
industria metalmecnica y la industria de los muebles en una ciudad. Para tal fin se
toma una muestra aleatoria de 200 operarios en la primera industria la cual arroja un
salario promedio de $535000 mensuales y desviacin estndar de $128000, mientras
que una muestra de 120 operarios en la segunda industria arroja un salario promedio
de $492000 y desviacin estndar de $75000. Se pide estimar el intervalo de
confianza para la diferencia de salarios entre las dos industrias con un nivel de
confianza del 90%.
Ejercicio 3: En una compaa se quiere estimar la diferencia de los promedios de
los rendimientos para producir cierta pieza por parte de los obreros en dos turnos
diferentes. Para tal fin el Jefe de produccin de la empresa toma muestras de 32
obreros para el turno 1 y encuentra que la media en la misma es de 20 minutos
mientras que la desviacin estndar es de 2.8 minutos. Por otra parte tom una
muestra de 35 obreros del turno 2 y encuentra que la media de la misma es de 22
minutos mientras que la desviacin estndar es de 1.9 minutos. Se pide calcular el
intervalo de confianza de la diferencia de las medias de los rendimientos en los dos
turnos con un nivel de confianza del 98%.
s2
1
2
10
10
160,4
165,6
65,3
67,9
X xi B n, p
i 1
x
n
Luego se cumple:
p E ( p ) p
a)
p2 V ( p )
b)
p (1 p )
n
c) Si el tamao muestral n es grande, el Teorema Central del Lmite nos asegura que:
z
p p
N (0,1)
pq
n
pq
n
p y q conocidos
Tamao de poblacin (N) demasiado grande o infinita.
pq N n
n N 1
p y q conocidos
Tamao de poblacin (N) conocido o finita.
S p
pq
n
S p
N n
pq
n N 1
p p
q q
p y q desconocidos, entonces
y
Tamao de poblacin (N) demasiado grande o infinita.
p p
q q
p y q desconocidos, entonces
y
Tamao de poblacin (N) conocida o finita.
Z1 / 2 * p p p
Z1 / 2 * p
p
Donde:
p
x
n
q 1 p
compradores, del nmero total observado 300 compraron los pastelillos. Calcule un
intervalo de confianza del 95% para la venta de la proporcin de compradores que prefieren
la marca de esta compaa.
Solucin:
x: Nmero de consumidores que prefieren los pastelillos.
n = 450 tamao de muestra grande
x = 300 son los que prefieren los pastelillos en la muestra
x 300
p
0, 67
n 450
Es la proporcin puntual muestral que prefieren los pastelillos
q 1 p 1 0, 67 0, 33
Es la proporcin puntual muestral de los que no prefieren los
pastelillos.
Coeficiente de confianza
= 0,95
= 0,05
Z1 / 2 Z 0,975
= 1,96
pq
0, 67 *0,33
p
0, 022
n
450
Reemplazando en el intervalo de confianza se tiene:
Z1 / 2 * p p p
Z1 / 2 * p
p
0,71
Tamao de muestra
Se puede determinar que tan grande debe ser el tamao de la muestra, n, de manera que si p
p
se estima por , el error de estimacin no sea mayor que un valor dado e. En efecto:
Z12 / 2 * pq
n
e2
2
1 / 2
* pq * N
Z12 / 2 * pq e 2 ( N 1)
Ejercicios Propuestos
a)
c)
d)
Vamos a considerar que tenemos dos poblaciones de modo que en cada una de ellas
p1
p2
estudiamos una v.a. dicotmica (Bernoulli) de parmetros respectivos
y
. De cada
n1 n2
poblacin vamos a extraer muestras de tamao
y .
Entonces
n1
x
p1 1
X 1 x1i B n1 , p1
n1
i 1
n2
X 2 x2i B n2 , p2
p 2
i 1
x2
n2
Luego se cumple:
p1 p 2 E ( p1 p 2 ) p1 p2
a)
p2
2
1 p
V ( p1 p 2 )
p1q1 p2 q2
n1
n2
b)
c) Si el tamao muestral n es grande, el Teorema Central del Lmite nos asegura que:
Z
( p1 p 2 ) ( p1 p2 )
p1 p 2
N (0,1)
1 p
2 Z1 / 2 * p1 p 2
p1 p2 p
p p
1
1q1
p
p q
2 2
n1
n2
Dnde:
Ejemplo 1: En un estudio sobre las relaciones prematrimoniales se encontr en la zona A
que, de 200 personas, 124 estaban a favor y en la zona B, de 266 personas, 133 tambin lo
Solucin:
Zona A
x1
: Nmero de personas que estn a favor de las relaciones prematrimoniales
x1
= 124
n1
= 200
x 124
p1 1
n1 200
q1 1 p1
p1
= 0,62
= 0,38
Zona B
x2
: Nmero de personas que estn a favor de las relaciones prematrimoniales
x2
= 133
n2
= 266
x
133
p 2 2
n2 266
= 0,90
q2 1 p 2
p 2
= 0,50
= 0,50
= 0,10
Z1 / 2 Z 0,95
= 1,645
p p
1
1q1 p
q
p
2 2
n1
n2
0, 62 * 0, 38 0, 50 * 0, 50
200
266
p1 p 2 0, 046
1 p
2 Z1 / 2 * p1 p 2
p1 p2 p
p1 p2
p1 p2
0,196
Ejercicios Propuestos
Ejercicio 1: Se est considerando cambiar el procedimiento de manufactura de
partes. Se toman muestras del procedimiento actual as como del nuevo para
determinar si este ltimo resulta mejor. Si 75 de 1000 artculos del procedimiento
actual presentaron defectos y lo mismo sucedi con 80 de 2500 partes del nuevo,
determine un intervalo de confianza del 90 % para la verdadera diferencia de
proporciones de partes defectuosas.
Ejercicio 2: Un productor decide cultivar dos variedades de tomate, valencia y
perita. De la variedad valencia planta 230 semillas y de la variedad perita planta 358.
Luego de tres semanas de cultivadas ambas variedades el productor recorre el campo
y registra que cantidad de semillas emergieron para cada variedad. Los resultados
son los siguientes:
Variedad
Cultivadas
Emergieron
Valenciano
230
126
Perita
358
293
a). Que modelo terico de probabilidad considera apropiado si la variable aleatoria
es "numero de plantas que emergieron de una variedad en el total que se cultivo
de la misma"? Cuales son los parmetros para cada una de las variedades?
b). Estime para cada variable la proporcin de emergencia.
c). Construya un intervalo de confianza al 95 % para la probabilidad de emergencia
de las plantas de cada variedad e interprete en trminos del problema
d). Que supuesto fue necesario para que el intervalo anterior sea valido?
e). Si comparamos ambas variedades con el tomate americano que tiene una
probabilidad de emergencia de 0.65, .que puede decir viendo los intervalos de
confianza?
f). Si el productor quiere saber si el tomate valenciano tiene la misma probabilidad
de emergencia que el tomate americano. Cual es el procedimiento a seguir?
Explquelo y concluya con el mismo.
H 0 : 0
H1 : 0
H 0 : 0
H1 : 0
Caso I: X N (, ), conocida
H 0 : 0
H1 : 0
N (0,1)
X
tn 1
sX
-- ZR-- /-------------ZA--------------/--ZR--
----------------ZA---------------/----ZR----
----ZR-----/-------------ZA----------------
Decisin:
Forma Tabular
Si el valor numrico del estadstico de prueba se ubica en la Zona de Aceptacin (ZA) se
H0
acepta la Hiptesis nula
.
Si el valor numrico del estadstico de prueba se ubica en la Zona de Rechazo (ZR) se
H0
rechaza la Hiptesis nula
.
Forma Mtodo p
Si el valor numrico de p es superior que el nivel de significancia fijado se acepta
H0
la Hiptesis nula
.
Solucin:
Formulacin de Hiptesis
H o : 2400
H1 : 2400
Nivel de significancia
0, 05
Estadstico de Prueba
Caso I: X N (, ), = 300 conocida
X X
X
n
2320 2400
300
100
Z 2, 67
Regiones crticas
-- ZR-- /----------------ZA---------------/---ZR--
Z 0,975
Z 0,975
-1,96
1,96
Decisin
En vista que el valor del estadstico de prueba (Z = -2,67) es inferior que el valor tabular (
Zt
H0
= -1,96) ubicndose en la zona de rechazo, entonces se rechaza la hiptesis nula
.
Esto significa que el nuevo proceso de fabricacin no es aceptable.
Ejemplo 2. Un fabricante de aparatos de TV afirma que se necesita a lo sumo 250
microamperes de corriente para alcanzar cierto grado de brillantez con un tipo de televisor
en particular. Una muestra de 20 aparatos de TV produce un promedio muestral de corriente
de 257,3 microemperes. Denotemos por m el verdadero promedio de corriente necesaria
para alcanzar la brillantez deseada con aparatos de este tipo, y supongamos que m es la
media de una poblacin con s = 15. Pruebe al nivel de significacin del 2,5% la hiptesis
nula de que m es a lo sumo 250 microamperes.
Solucin:
Formulacin de Hiptesis
H 0 : 250
H1 : 250
Nivel de significancia
0, 025
Estadstico de Prueba
Caso II: X N (, ),
X
X
s
sX
n
= 15 desconocida
257,3 250
15
20
T 2,176
Regiones crticas
----------------ZA---------------/-----ZR----t0,975;19
2,093
Decisin
T 2,176
. Esto
Ejercicios Propuestos
Ejercicio 1: La tasa actual para producir fusibles de 5 amp en Neary Electric Co. Es 250
por hora. Se compr e instal una mquina nueva que, segn el proveedor, aumentar la
tasa de produccin. Una muestra de 20 horas seleccionadas al azar el mes pasado indica que
la produccin media por hora en la nueva mquina es 256, con desviacin estndar de 6 por
0,05
hora. Con
de nivel de significancia, Puede Neary Electric concluir que la nueva
mquina es ms rpida?
Ejercicio 2: Un fabricante de lmparas elctricas sostiene que la duracin media de las
mismas (horas) es en promedio superior a 1300 h. Se toma una muestra de 17 lmparas
siendo el resultado de la inspeccin el siguiente:
980 1 350 1 020 1 140 1 520 1 390 1 205 1 180 970 1 420 1 850 1 300
1 305 1 040 1 050 1 520 1 320
Verificar el Ho del fabricante con un coeficiente de riesgo del 5% (suponiendo la
distribucin normal).
Ejercicio 3: Una empresa desea concursar para ganar un contrato con el gobierno como
proveedor de concreto; uno de los requisitos es la resistencia a la compresin del concreto a
los 28 das de haberse preparado la mezcla. La empresa ganadora dice que mantiene
excelentes controles de calidad en su concreto y como tal hay una varianza muy baja en
Kg 2f cm 4
resistencias a la compresin, del orden de 16
/
; pero al hacerle en la UNAM unas
Kg 2f cm4
pruebas de resistencia se detecta una varianza mas elevada de 25
/
a) hay evidencia estadstica suficiente para considerar que el proveedor est mintiendo y
Kg 2f cm 4
en realidad la desviacin estndar es DIFERENTE a 16
/
?
b) Redaccin de la prueba de hiptesis, indicando si debe ser prueba de una o dos colas
para responder la pregunta.
Ejercicio 4: Un vendedor de neumticos dice que la vida media de sus neumticos es de
28000 Km. Admitiendo para la desviacin tpica el valor 1348 Km. disear un test de
hiptesis al 99% de confianza, basado en muestras de 40 elementos que permita contrastar
la hiptesis nula de ser = 28000Km usando como hiptesis alternativa < 28000Km
Ejercicio 5: Se pretende disear una prueba de hiptesis con una muestra de 74
automviles para comprobar su capacidad de frenado. Para ello se medir en todos ellos la
distancia de frenado si el automvil parte de una velocidad inicial de 100 Km/h. Se quiere
saber si, tras un frenazo brusco, la distancia media recorrida antes de pararse es de 110
metros. Se supone que la distancia de frenado sigue una distribucin normal con desviacin
tpica conocida = 3 m. Supongamos ahora que hemos realizado efectivamente la prueba a
los 74 automviles y hemos obtenido las siguientes distancias de frenado.
98 102 105 113 123 126
Distancias
15 10 12 8 16 13
Total
Num. de autos
74
H0 :
2
H0 :
2
0
H1 : 2 02
2
0
H 0 : 2 02
H1 : 2 02
H1 : 2 02
Estadstico de prueba:
Si X N (, ), conocida
El estadstico de prueba es:
(n 1) s 2
2
2
Prueba Chi cuadrado ( ) para una muestra con n-1 grados de libertad (gl.)
Regiones crticas
Depende de las formas de contraste de las hiptesis.
Contraste Bilateral
---ZR--/----------ZA---------/--------ZR----------
Decisin:
----ZR--/-------------------ZA----------------------
------------------ZA---------/----------ZR----------
Forma Tabular
Si el valor numrico del estadstico de prueba se ubica en la Zona de Aceptacin (ZA) se
H0
acepta la Hiptesis nula
.
Si el valor numrico del estadstico de prueba se ubica en la Zona de Rechazo (ZR) se
H0
rechaza la Hiptesis nula
.
Solucin:
Formulacin de hiptesis
H 0 : 2 25
H1 : 2 25
Nivel de significancia
0,10
Estadstico de prueba
2
0
( n 1) s 2
02
= 16,86
Regiones crticas
(16 1) * 28,1
25
----ZR----/---------------ZA------------/-------------ZR------------2
0,05;15
2
0,95;15
7,261
24,996
Decisin
Como que el valor del estadstico de prueba se ubica entre los valores tabulares (7,261
02
= 16,86
24,996), es decir dentro de la zona de aceptacin, entonces se acepta la
H0
hiptesis nula
. Efectivamente se puede concluir con una confianza del 90% que la
varianza poblacional de las horas extras demandadas a la semana es
igual a 25.
Ejercicios propuestos
Ejercicio 1: Un supervisor de control de calidad en una enlatadora sabe que la cantidad
exacta en cada lata vara, pues hay ciertos factores imposibles de controlar que afectan a la
cantidad de llenado. El llenado medio por lata es importante, pero igualmente importante es
la variacin
de la cantidad de llenado. Si
es grande, algunas latas contendrn muy
poco, y otras, demasiado. A fin de estimar la variacin del llenado en la enlatadora, el
supervisor escoge al azar 10 latas y pesa el contenido de cada una, obteniendo el siguiente
pesaje (en onzas):
7,96 7,90 7,98 8,01 7,97 7,96 8,03 8,02 8,04 8,02
Suponga que las agencias reguladoras especifican que la desviacin estndar de la cantidad
de llenado debe ser menor que 0,1 onzas. Esta informacin proporciona pruebas
suficientes de que la desviacin estndar de las mediciones de llenado es menor que 0,1
onzas si el nivel de significacin queda fijado en un 5%?
Ejercicio 2: Se supone que los dimetros de cierta marca de vlvulas estn distribuidos
pu lg adas 2
normalmente con una varianza poblacional de 0,2
, pero se cree que
ltimamente ha aumentado. Se toma una muestra aleatoria de vlvulas a las que se les mide
su dimetro, obtenindose los siguientes resultados en pulgadas: 5,5 5,4 5,4 5,6 5,8
5,4 5,5 5,4 5,6 5,7
Con sta informacin pruebe si lo que se cree es cierto.
1 2
H1 : 1 2
H1 : 1 2
Estadstico de prueba
( X 1 X 2 ) ( 1 2 )
X1 X 2
X
Donde:
1 X2
12
n1
22
n2
N (0,1)
12
22
y
( X 1 X 2 ) ( 1 2 )
S X1 X 2
tn1 n2 2
v n1 n2 2
Donde:
es el grado de libertad.
n1 1 * s12 n2 1 * s22
S X1 X 2
1 1
n1 n2
n1 n2 2
( X 1 X 2 ) ( 1 2 )
S X1 X 2
tv
Donde:
S X1 X 2
S12
s12
s22
n1
n2
S2
2
n1
n2
2
2
2
S12 S 22
n1
n2
n1 1
n2 1
redondeado entero.
Usualmente las varianzas son desconocidas
Regiones crticas
Contraste Bilateral
-- ZR-- /-------------ZA--------------/--ZR--
----------------ZA---------------/----ZR----
----ZR-----/-------------ZA----------------
Decisin:
Forma Tabular
Si el valor numrico del estadstico de prueba se ubica en la Zona de Aceptacin (ZA) se
H0
acepta la Hiptesis nula
.
Si el valor numrico del estadstico de prueba se ubica en la Zona de Rechazo (ZR) se
H0
rechaza la Hiptesis nula
.
Forma Mtodo p
semillas. Usar
= 0,05.
Los resultados del ensayo son los siguientes:
Variedad
s2
1
2
10
10
160,4
165,6
65,3
67,9
Solucin:
H 0 : 12 22
H1 : 12 22
vs.
Nivel de significancia
= 0,05.
Estadstico de prueba
s12
65, 3
2
s2
67, 9
65, 3
0, 96
67, 9
Regiones crticas
Distribucin F de Snedecor
0.0 0.248
1.5
3.0
4.03
4.5
6.0
-ZR-/--------------------------ZA-------------------------/-----------ZR--------------
Decisin:
La regin de aceptacin para un nivel de significacin del 5% est delimitada por 0,248 y
4,03, correspondientes a las probabilidades /2 y (1 - /2) respectivamente.
vs.
H1: 1 2
Nivel de significancia
= 0,05.
Estadstico de prueba
X 2 1 2
1
1
n1 n2
S p2
s 2p
S p2
160, 4 165, 6 0
1
1
66, 6
10 10
Regiones crticas
1, 42
( n1 1) S12 ( n2 1) S 22
n1 n2 2
Distribucin T de Student
-4.0
-2.7
-2.101
-1.3
0.0
1.3
2.101
2.7
4.0
---------ZR-------/---------------------ZA-------------------/--------ZR---------
Decisin
La regin de aceptacin para un nivel de significacin del 5% est delimitada por -2,101 y
2,101, correspondientes a los probabilidades /2 y (1 - /2) respectivamente y 18 grados de
libertad
Como T = -1,42 est en el intervalo (-2,101; 2,101), es decir en la zona de aceptacin, se
acepta H0: 1= 2
Entonces se concluye que no hay diferencias entre el contenido promedio de aceites de las
semillas de dos variedades de man.
Solucin:
Datos
Primera comunidad
1
= $ 1,8
n1
= 30
X1
= $ 35,5
Formulacin de hiptesis
H 0 :1 2 1,5
Segunda comunidad
2
= $ 2,4
n2
= 40
X2
= $ 34,6
H1 : 1 2 1,5
Nivel de significancia
= 0,05
Estadstico de prueba
Segn los datos corresponden al CASO I: Muestras independientes con varianzas
poblacionales conocidas. Entonces:
Z
( X 1 X 2 ) ( 1 2 ) ( X 1 X 2 ) ( 1 2 )
X1 X 2
12 22
n1 n2
(35,5 34, 6) 1,5
1,82 2, 42
30
40
= - 1,195
Regiones crticas
----ZR-----/-------------ZA-----------------
z1
-1,645
Decisin
La regin de aceptacin para un nivel de significacin del 5% est delimitada por -1,645 y
+ , correspondientes a la probabilidad (1 - ).
Como Z = -1,195 est en el intervalo (H0
Ejercicios propuestos
Ejercicios 1. Un investigador desea averiguar si una industria est contaminando el agua
de un arroyo al cual evacua sus efluentes. A tal fin toma muestras de agua en dos sitios: 1)
aguas arriba del establecimiento y 2) aguas abajo del mismo. Los siguientes son valores de
concentracin de uno de los metales pesados encontrados en cada sitio.
Aguas arriba
8
10
6
4
8
7
8
6
6
5
12
12
9
9
5
9
4
8
6
5
7
11
9
12
5
8
7
8
12
6
10
7
8
12
6
7
7
9
8
10
8
8
6
6
7
10
4
8
12
6
5
5
9
9
6
4
8
9
7
11
Aguas abajo
9
12
9
14
12
13
12
15
8
10
10
11
15
10
12
9
12
13
9
7
10
12
12
12
7
12
7
10
12
15
13
14
10
11
15
7
14
9
10
13
12
9
9
15
13
12
14
10
10
8
10
12
15
10
9
12
13
12
10
12
Cree Ud. que existen diferencias en la concentracin de este metal pesado entre uno y otro
sitio? Evale su respuesta para un = 0,02
Ejercicio 2. Un fabricante que usa dos lneas de produccin 1 y 2 hizo un ligero ajuste a
la lnea 2 con la esperanza de reducir tanto la variabilidad como la cantidad promedio de
impurezas en la sustancia qumica. Muestras aleatorias en cada lnea arrojaron las
siguientes mediciones:
Lnea
n
Promedio
Varianza
1
16
3,2
1,04
2
16
3,0
0,51
Los datos aportan suficiente evidencia para concluir que la cantidad promedio de
impurezas de la lnea 1 es menor que la lnea 2?
Ejercicio 3. Una muestra de 80 alambres de acero producidos por la fbrica A presenta
una resistencia promedio a la ruptura de 1.230 lbs. con una desviacin estndar de 120 lbs
Una muestra de 100 alambres de acero producidos por la fbrica B presenta una resistencia
promedio a la ruptura de 1.110 lbs . con una desviacin estndar de 90 lbs .. Con base en
sta informacin pruebe si la resistencia promedio a la rotura de los alambres de acero de la
marca A es significativamente mayor que la de los alambres de acero de la marca B. Asuma
un nivel de confianza del 99 por ciento.
Ejercicio 4. El jefe de personal de una gran empresa afirma que la diferencia de los
promedios de antigedad entre los obreras y obreros de la compaa es de 3.5 aos. El
presidente de la compaa considera que sta diferencia es superior. Para comprobar dicha
situacin, se toma una muestra aleatoria de 40 obreras cuyo promedio de antigedad es de
12.4 aos con desviacin estndar de 1.5 aos y de un grupo de 45 obreros cuyo promedio
de antigedad es de 8.3 aos con desviacin estndar de 1.7 aos. Comprobar la hiptesis
con un nivel de significacin del 5%.
Los datos se obtienen de muestras que estn relacionadas, es decir, los resultados del primer
grupo no son independientes de los del segundo.
Por ejemplo, esto ocurre cuando se mide el nivel de un metabolito en cada uno de los
individuos de un grupo experimental antes y despus de la administracin de una droga.
El objetivo es comprobar si la droga produce efectos en el nivel del metabolito
Los pares de observaciones (antes y despus) obtenidas en cada individuo no son
independientes ya que el nivel posterior a la administracin de la droga depende del nivel
inicial.
Ejemplo
ANTES
8,69
7,13
7,79
7,93
7,59
7,86
9,06
9,59
DESPUES
7,24
7,10
7,80
7,95
7,50
7,79
9,00
9,48
DIF
1,45
0,03
-0,01
-0,02
0,09
0,07
0,06
0,11
Formulacin de Hiptesis
Prueba bilateral
H 0 : d = 0
H 0 : d = 0
H1 : d 0
H1 : d 0
D
d
S d2
~ t n 1
H 0 : d = 0
H1 : d 0
D
d
S d2
0, 22 0
1.26
0, 50
8
Regiones crticas
-- ZR-- /-------------ZA--------------/--ZR--
t / 2
t1 / 2
-2,365
2,365
H 0 : d = 0
tanto se acepta
Se concluye que la droga no causo efectos significativos, es decir que no existe diferencias
observadas entre los niveles de metabolitos por uno u otro individuo en forma significativa.
. De la
X xi B n, p
i 1
p(1 p)
p N p;
O bien:
z
p p
N (0,1)
pq
n
Donde:
p es la proporcin o el porcentaje de personas u objetos con la caracterstica de
p
es su estimador
Formulacin de Hiptesis
Prueba Bilateral
H 0 : p p0
H1 : p p0
H 1 : p p0
p - p0
p0q 0
Normal ( 0 , 1)
Donde:
q0 1 p0
p : Proporcin muestral de xitos
Regiones crticas
Contraste Bilateral
-- ZR-- /-------------ZA--------------/--ZR--
----------------ZA---------------/----ZR----
----ZR-----/--------------ZA----------------
Decisin
Forma Tabular
Si el valor numrico del estadstico de prueba se ubica en la Zona de Aceptacin (ZA) se
H0
acepta la Hiptesis nula
.
Si el valor numrico del estadstico de prueba se ubica en la Zona de Rechazo (ZR) se
H0
rechaza la Hiptesis nula
.
Forma Mtodo p
Solucin:
Formulacin de hiptesis
H 0 : p 0,18
H1 : p 0,18
Nivel de significancia
= 1%
Estadstico de prueba
Z
- p0
p
p0 q 0
n
0,30 0,18
0,18*0,82
120
= 3,43
Regiones crticas
------------------ZA--------------/----ZR-----
z1
2,33
Decisin
z1
Ejercicios propuestos
Ejercicio 1. Se conoce por experiencia que el 14% de la produccin de cierto artculo
resulta defectuosa. Se introducen algunos correctivos en el proceso y luego mediante una
muestra de 360 artculos escogidos aleatoriamente, se encuentra que el 13.33% resultan
defectuosos. Comprobar si los cambios mejoraron la calidad con un nivel de significacin
del 5%.
Ejercicio 2. Un propietario de un gran taller de reparacin de artculos electrodomsticos,
asegura que por lo menos en el 30% de las reparaciones se hacen posteriores reclamos. Uno
de sus empleados piensa que dicha proporcin es mayor y para probarlo toma una muestra
aleatoria de 120 rdenes de reparacin efectuadas anteriormente y encuentra que el 39.17%
de las mismas fueron objeto de reclamos. Quin tiene la razn? Nivel de significacin del
1%.
Ejercicio 3. Una compaa estima que tiene una participacin en el mercado de un 80%
para su producto estrella. Mediante una muestra aleatoria de 400 posibles consumidores se
encuentra que el 75% de los mismos consumen el referido producto. Con un nivel de
significacin del 1%, puede concluirse a travs de los resultados que dicha proporcin es
menor?
n1
n2
p1
p2
. De
n1
X 1 x1i B n1 , p1
i 1
n2
X 2 x2i B n2 , p2
i 1
Si las muestras son suficientemente grandes ocurre que una aproximacin para la
Formulacin de Hiptesis
Prueba bilateral
H 0 : p1 p2
H1 : p1 p2
(p 1 - p 2 )-(p1-p 2 )
1
pq
Normal ( 0 , 1)
n
2
1 n 2p
2
n1 p
n1 n 2
Regiones crticas
Contraste Bilateral
-- ZR-- /-------------ZA--------------/--ZR--
----------------ZA---------------/----ZR----
----ZR-----/--------------ZA----------------
Decisin
Forma Tabular
Si el valor numrico del estadstico de prueba se ubica en la Zona de Aceptacin (ZA) se
H0
acepta la Hiptesis nula
.
Si el valor numrico del estadstico de prueba se ubica en la Zona de Rechazo (ZR) se
H0
rechaza la Hiptesis nula
.
Forma Mtodo p
Ejemplo 1. Una firma distribuye dos marcas de detergente. En una encuesta se encuentra
que 56 de 200 amas de casa prefieren el detergente de la marca A y que 29 de 150 amas de
casa prefieren la marca B. Se puede concluir al nivel de significacin del 5% que la marca
A tiene mayor preferencia que la marca B?
Solucin:
Marca A
X1
: Nmero de amas de casa que
prefieren detergente marca A
X1
= 56
n1
= 200
X
56
p1 1
n1 200
Marca B
X2
: Nmero de amas de casa que
prefieren detergente marca B
X2
= 29
n2
= 150
X
29
p 2 2
n2 150
p1
p 2
q1
= 0,28
= 0,72
= 0,19
q2
Formulacin de hiptesis
H 0 : p1 p2
H1 : p1 p2
Nivel de significancia
= 5%
Estadstico de prueba
Z
1 - p
2 )-(p1-p 2 )
(p
pq
(0,280,19) 0
1
1
0,24*0,76
200 150
= 1,96
Calculando
1 n 2 p 2
n1 p
n1 n 2
= 0,81
q
= 0,24
= 0,76
Regiones crticas
----------------ZA---------------/-----ZR----
z1
1,645
Decisin
z1
Ejercicios propuestos
Ejercicio 1. Dos mquinas A y B, producen un mismo artculo. La mquina A produce
como trmino medio una proporcin de 14% de artculos defectuosos, mientras que la
mquina B, produce en trmino medio una proporcin de 20% de artculos defectuosos. Si
se obtiene una muestra aleatoria de 200 unidades del artculo que provengan de la mquina
A y una muestra aleatoria de 100 unidades provenientes de la mquina B. Demostrar que la
mquina B tenga una proporcin de defectuosos 8% o ms que A. Se supone que la
poblacin es infinita.
Ejercicio 2. Se seleccion una muestra aleatoria de 100 hombres y 100 mujeres de un
departamento de Colombia; se hall que de los hombres 60 estaban a favor de una ley de
divorcio y de las mujeres 55 estaban a favor de dicha ley. Con base en sta informacin,
pruebe que la proporcin de hombres que favorece sta ley es mayor que la proporcin de
mujeres. Asuma un nivel de confianza del 99 por ciento.
Ejercicio 3. La maqueta del nuevo automvil propuesto se mostr a dos grupos de 150
personas cada uno. Un grupo const de personas entre 18 y 25 aos de edad, y el otro de
personas mayores de 50 aos. El 80% de los integrantes del grupo ms joven aprob el
modelo, mientras que slo el 50% del grupo mayor en edad lo aprueba. Dentro de un 95%
de confiabilidad, puede decirse que ambos grupos tienen opiniones diferentes?
Ejercicio 4. Un profesor de Estadstica desea comparar el porcentaje de aprobados de la
seccin A contra el porcentaje de aprobados de la seccin B. En la seccin A se
tom una muestra de 26 estudiantes, de los cuales 16 haban aprobado, de la seccin B
una muestra de 28 estudiantes revel 25 aprobados. Utilice un 99% de confiabilidad para
comprobar si el porcentaje de aprobados de la seccin B es superior al de la seccin A.