Sunteți pe pagina 1din 12

PRUEBAS DE HIPÓTESIS

1.Un fabricante de pintura de secado rápido afirma que el tiempo de secado de la misma
es de 20 min. El comprador diseña el siguiente experimento: pinta 36 tableros y decide
rechazar el producto si el promedio de tiempo de secado de los mismos supera los 20.75
min. Si por experiencia =2.4 min, se pregunta cuál es la probabilidad de rechazar la
partida aún perteneciendo a una población con media de 20 min.

La probabilidad de que el promedio de las muestras exceda 20.75 min a causa


del azar se calcula del siguiente modo:

z x  20.75  20 1.875


 0.4
n

con esta abscisa, se calcula la probabilidad (área hacia la derecha), resultando 0.0304.
Gráficamente:

Este gráfico está hecho sobre valores reales, no normalizados. Para los cálculo se
usan estos últimos cuando se trabaja con tablas.

Entonces, la probabilidad de rechazar erróneamente la hipótesis =20 min es de


aproximadamente 0.03, o bien 3%.

Supóngase ahora que la media real del tiempo de secado es =21 min. Luego, la
probabilidad de obtener una media muestral menor o igual que 20.75 (y por lo tanto
equivocarse en la aceptación) está dada por:

lo que lleva a un área (hacia la izquierda) de 0.2660. Es decir: la probabilidad de


equivocarse al aceptar =20 (a pesar de ser =21) es del 26.6%. Gráficamente:
Como resumen se da la siguiente tabla:

2. La duración media de una muestra de 100 tubos fluorescentes producidos por una
compañía resulta ser de 1570 horas, con una desviación típica de 120 horas. Si
 es la duración media de todos los tubos producidos por la compañía, comprobar la
hipótesis = 1600 contra la hipótesis alternativa  horas con un nivel de
significación de 0.05.

Hipótesis Nula  = 1600 hr.


Hipótesis Alternativa  <> 1600 hr. (bilateral)
Nivel de significancia:  =0.05.
Para trabajar con tablas normalizadas, se usa z en lugar de :

x 
z

n

Por otro lado, será tal que el área bajo la normal a su derecha sea /2 y
será tal que el área bajo la normal a su izquierda sea /2. Estos dos valores
definen las zonas de aceptación y rechazo de la Hipótesis Nula. Según donde caiga el
valor de z calculado por la expresión anterior, se producirá la aceptación o rechazo.
Cálculos:
1570  1600
z 2.5
120
100

Dado que –2.5 < -z0.025 se Rechaza la Hipótesis Nula, luego la duración media de los
tubos es significativamente menor que 1600 horas. Como se puede apreciar en el
siguiente gráfico, la media muestral cae fuera de la zona de aceptación:

Es de nick
3- Una empresa de transportes desconfía de la afirmación de que la vida útil promedio de
ciertos neumáticos es al menos de 28000. Para verificar se colocan 40 neumáticos en
camiones y se obtiene una vida útil promedio de 27463 con unas =1348. ¿Qué se puede
concluir con ese dato si la probabilidad de Error Tipo I es a lo sumo 0.01?

1– Hipótesis Nula  < 28000


Hipótesis Alternativa  > 28000 (unilateral)
2- Nivel de significancia:  = 0.01.
3- Para trabajar con tablas normalizadas:
x 
z
s
n
además: z = 2.33

4 – Cálculos:
27463  28000
z 2.52
1348
40
5- Dado que –2.52 < -z0.01 se Rechaza la Hipótesis Nula, luego la vida útil de los
neumáticos es significativamente menor que 28000. Como se puede apreciar en el
siguiente gráfico, la media muestral cae fuera de la zona de aceptación:

Si el tamaño de la muestra es pequeño, se desconoce  y proviene de una


población normal, se debe utilizar el estadístico t-Student con =n-1 grados de libertad

4. La duración media de las bombillas producidas por una compañía han sido en el pasado
de 1120 horas con una desviación típica de 125 horas. Una muestra de 8 bombillas de la
producción actual dio una duración media de 1070 horas. Ensayar la hipótesis =1120
horas contra la hipótesis alternativa <1120 horas mediante un nivel de significancia de
=0.05.

1– Hipótesis Nula  = 1120 hs.


Hipótesis Alternativa  < 1120 hs. (unilateral)
2- Nivel de significancia:  =0.05.
4- Para trabajar con tablas normalizadas:
x 
t
s
n
con = n-1=8-1=7 grados de libertad. Además: t = -1.895 (=7).

4 – Cálculos:
1070  1120
t 1.131
125
8
5- Dado que –1.131 > -t0.05 se Acepta la Hipótesis Nula, luego la vida útil de los
neumáticos es significativamente igual a 1120 horas. Como se puede apreciar en el
siguiente gráfico, la media muestral cae dentro de la zona de aceptación:

Es nahomi

5. Para probar la afirmación de que la resistencia de un conductor eléctrico puede


reducirse en más de 0.050 ohms mediante aleaciones, 32 valores obtenidos de
alambre ordinario produjeron = 0.136 ohms y s1 = 0.004 ohms y 32 valores
obtenidos con alambre fabricado en base a aleaciones produjeron = 0.083 ohms y
s2 = 0.005 ohms. ¿Se apoya la afirmación con un nivel de significación de 0.05?

1– Hipótesis Nula 12 = 0.050


Hipótesis Alternativa 12 > 0.050 (unilateral)
2- Nivel de significancia:  =0.05. z = 1.65
5- Para trabajar con tablas normalizadas:

4 – Cálculos:

5- Dado que 2.65 > z0.05 se Rechaza la Hipótesis Nula, por lo tanto se acepta la
Hipótesis Alternativa, esto es se refrenda la afirmación 12 > 0.050. Vale decir, la
aleación reduce significativamente en más de 0.050 ohms la resistencia del conductor
6. La estatura media de 50 estudiantes de un colegio que tomaban parte en las pruebas
atléticas fue de 1.70 mts con desviación estándar de 0.0625 mts, mientras que 50 estudiantes
que no mostraban interés en tal participación tenían una estatura media de 1.687 mts con
desviación estándar de 0.07 mts. Ensayar la hipótesis de que los estudiantes que participan en
pruebas atléticas son más altos que los otros, con un nivel de significancia de 0.05.

1– Hipótesis Nula 12 = 0, no hay diferencia entre las estaturas medias


Hipótesis Alternativa 12 > 0 (unilateral), la estatura media del primer grupo
es significativamente mayor que la del segundo.
2- Nivel de significancia:  =0.05. z = 1.65
6- Para trabajar con tablas normalizadas:
7-

4 – Cálculos:

z 1.70  1.687 0.98


2 2
0.0625 0.007

50 50
5- Dado que 0.98 < z0.05 se Acepta la Hipótesis Nula 12 = 0. Vale decir, los
estudiantes que participan en pruebas atléticas no son significativamente más altos que
los otros.

Es de vanessa
1.- El peso (en gramos) de las cajas de cereales de una determinada marca sigue
una distribución N(μ, 5). Se han tomado los pesos de 16 cajas seleccionadas
aleatoriamente, y los resultados obtenidos han sido:
506, 508, 499, 503, 504, 510, 497, 512, 514, 505, 493, 496, 506, 502, 509, 496.
a) Obtener los intervalos de confianza del 90%, 95% y 99% para la media poblacional.

Solución.-

 Estamos situados en el caso de construir un intervalo de confianza para la media


poblacional μ de varianza conocida σ 2 = 25. Sabemos que el intervalo de confianza de
nivel 1 − α , viene dado por:

Error
media muestral 2z σ 2
muestral 64748 σ α2
} σ L
1−α
=2 z
α2 a n =
L = longitud o amplitud

z
I 1−α(μ) = [ x ± α2 ] n longitud
n σ
Error muestral = z α 2

n
16

∑x
i=1
i 1 − α = 0,90 α = 0,10 α 2 = 0,05 zα 2 = 1,645
x = 16 = 503,75 1 − α = 0,95 α = 0,05 α 2 = 0,025 zα 2 = 1,96
1 − α = 0,99 α = 0,01 α 2 = 0,005 z = 2,575
α2

Los intervalos de confianza solicitados serán:

5 5 5
I 0,90 (μ) = 503,75 ± 1,645 = 503,75 − 1,645 , 503,75 + 1,645
16 16 16

I 0,90 (μ) = [ 501,69 ; 505,81 ] ≡ P [ 501,69 ≤ μ ≤ 505,81 ] = 0,90 = 1 − α

5 5 5
I 0,95 (μ) = 503,75 ± 1,96 = 503,75 − 1,96 , 503,75 + 1,96
16 16 16

I 0,95 (μ) = [ 501,30 ; 506,20 ] ≡ P [ 501,30 ≤ μ ≤ 506,20 ] = 0,95 = 1 − α

5 5 5
I 0,99 (μ) = 503,75 ± 2,575 = 503,75 − 2,575 , 503,75 + 2,575
16 16 16

I 0,99 (μ) = [ 500,53 ; 506,97 ] ≡ P [ 500,53 ≤ μ ≤ 506,97 ] = 0,99 = 1 − α


2.- Una muestra aleatoria extraída de una población normal de varianza 100, presenta
una media muestral x = 160 . Con una muestra de tamaño 144, se pide:
% Calcular un intervalo de confianza del 95 por ciento para la media poblacional.
% Calcular un intervalo de confianza del 90 por ciento para la media poblacional.
% Comparar ambos intervalos, desde el punto de vista de la información que
generan.

Solución:

% Estamos situados en el caso de construir un intervalo de confianza para la media


2
poblacional μ de varianza conocida σ = 100 . Sabemos que el intervalo de confianza de
nivel 1 − α , viene dado por:

Error 2
media muestral σ 2z σ
muestral 64748 α2
} σ L
= 2 zα 2 an= L = longitud o amplitud
]
1−α

I1−α (μ) = [ x ±z
α2 n longitud
n σ
Error muestral = zα 2

n
tenemos que:

1 − α = 0,95 α = 0,05 α 2 = 0,025 zα 2 = 1,96


2
x = 160 σ = 100 σ = 10 n = 144

El intervalo de confianza es:

10 10
I0,95 (μ) = 160 − 1,96 ; 160 + 1,96 = [158,37 ; 161,63]
12 12

b) Es análogo su construcción; la única variación es el nivel de confianza:

1 − α = 0,90 α = 0,10 α 2 = 0,05 zα 2 = 1,645

con lo cual, I (μ) = 160 − 1,645 10 ; 160 + 1,645 10 = [158,63 ; 161,37 ]


0,90
12 12

c) Si calculamos la longitud de cada uno de los dos intervalos de confianza:

L0,95 = 161,63 − 158,37 = 3,26 L0,90 = 161,37 − 158,63 = 2,74

El segundo intervalo de confianza es de longitud menor, y, por tanto, podría


parecer más preciso, pero no olvidemos que su nivel de confianza es también menor
(el 90 por 100 frente al 95 por ciento del primer intervalo.
Es nick

3.- Se selecciona una muestra aleatoria de 600 familias, a las que se pregunta si tienen o
no ordenador en casa. Contestaron afirmativamente 240 familias. Obtener un intervalo de
confianza al nivel del 95% para la proporción real de familias que poseen ordenador en
casa.

Solución:

La característica en estudio es dicotómica, tenemos que construir un intervalo de


confianza para el parámetro p (proporción) de la variable aleatoria binomial asociada al
estudio de la característica. Como el tamaño de la muestra es suficientemente grande, n
= 600, se puede utilizar la aproximación normal.

ˆ
p (1 − p )
ˆ ˆ = 240 600 = 0, 4 ˆ ˆ n = 600
I 1− α (p) = pˆ ± z (α 2)
n 1− α = 0,95 α = 0,05 α 2 = 0,025 z α 2 = z 0,025 = 1, 96

0, 4 . 0,6
I (p) = 0, 4 ± (1,96) = [ 0,36 ; 0, 44 ]
0,95 600

I0,95(p) = [ 0,36 ; 0, 44 ] ≡ P[ 0,36 ≤ p ≤ 0, 44 ] = 0,95 = 1 − α

Con una confianza del 95% se puede afirmar que las familias poseen ordenador entre el
36% y el 44%.

4.- Según los dirigentes del partido A, la intención de voto del partido rival B, en
Andalucía, es la misma que la que tiene en Madrid. Se realiza una encuesta a 100
personas en Andalucía de los que 25 mostraron su apoyo al partido B, y a otras 100
personas en Madrid de las que 30 se inclinaron por el partido B.
a) Construir un intervalo de confianza del 90% para la proporción de personas que
votarían al partido B en Andalucía

Solución:

a) La característica en estudio en ambas comunidades es dicotómica, tenemos que


construir un intervalo de confianza para el parámetro p1 (proporción) de la variable
aleatoria binomial asociada al estudio de la característica en la comunidad de Andalucía.
Como el tamaño de la muestra es suficientemente grande, n 1 = 100, se puede utilizar la
aproximación normal.
ˆ ˆ ˆ = 25 100 = 0,25 qˆ ˆ = 0,75 n = 100
ˆ 1 1 1 1
p =1−p

p (1 − p )

I1−α (p) = p ± z (α 2)
n 1 − α = 0,90 α = 0,10 α 2 = 0, 05 z α 2 =z 0,05 = 1,645

I (p ) 0,25 . 0,75
0,90 1
= 0,25 ± (1,645) = [ 0,179 ; 0,321 ]
100

I0,90 (p1 ) = [ 0,179 ; 0,321 ] ≡ P [ 0,179 ≤ p 1 ]


≤ 0,321 = 0, 90 = 1 − α

En Andalucía la intención de voto del partido B se encuentra entre el 17,9% y


32,1%, con un nivel de confianza del 90%. Es nahomi

5.- Un instituto de investigaciones agronómicas siembra, en cinco parcelas diferentes,


dos tipos de maíz híbrido. Las producciones en quintales métricos por hectárea son:

1 2 3 4 5
Híbrido I 90 85 95 76 80
Híbrido II 84 87 90 92 90

a) Construir un intervalo de confianza para el cociente de varianzas con un error de


significación de 0,10.
b) Construir un intervalo de confianza del 90% para la diferencia entre
las producciones medias.

Solución:

a) Sea la variable aleatoria X1 = 'producción de maíz del híbrido I', que sigue una
distribución normal N(μ 1 , σ 1) . Análogamente, la variable aleatoria X 2 = 'producción
de maíz del híbrido II', sigue una distribución normal N(μ 2 , σ 2) .
Al construir un intervalo de confianza para el cociente de varianzas
podremos concluir si las varianzas poblacionales desconocidas son o no distintas.
2 2
De modo que, si el intervalo de confianza para el cociente de varianzas (σ 1 σ 2)
cubre al punto 1 podremos partir de que las varianzas son desconocidas pero iguales.

2 2 2 2
s 1 s 2 s 1s 2 1
I (σ
2 2
; donde F =
1− α
σ ) =
1 2 F F 1− α 2 ;(n 1 −1),(n 2 −1) F
α 2 ;(n 1 −1),(n 2 −1) 1− α 2 ;(n 1 −1) ,(n 2 −1) α 2 ;(n 2 −1),(n 1 −1)

2
x 1 = 85,20 s 1 = 57,7 n1 = 5
2
En nuestro caso, x 2 = 88,6 s 2 = 9,8 n2=5
2 2
s 1 s 2 = 57,7 9,8 = 5,89 1 − α = 0,90 α = 0,10 α 2 = 0,05
F 0,05; 4, 4 = 6,3883 F0,95; 4 , 4 = 1 F0,05; 4 , 4 = 1 6,3883 = 0,1565

5,89 ; 5,89 = [ 0,92 ; 37,64 ]


2
I 0,90(σ 1 2
σ 2) =
6,3883 0,1565
2
2 2
I 0,90(σ 1 σ 2) = [0,92 ; 37,64 ] ≡ P 0,92 ≤ σ1

2
≤ 37,64 = 0,90 = 1 − α

σ2

El intervalo cubre el uno, y concluimos que las varianzas poblacionales son


desconocidas e iguales, con una fiabilidad del 90%.
6.- Un equipo de investigación biológica está interesado en ver si una nueva
droga reduce el colesterol en la sangre. Con tal fin toma una muestra de diez
pacientes y determina el contenido de colesterol en la sangre antes y después
del tratamiento. Los datos muestrales expresados en miligramos por 100
mililitros son los siguientes:

Paciente 1 2 3 4 5 6 7 8 9 10
Antes 217 252 229 200 209 213 215 260 232 216
Después 209 241 230 208 206 211 209 228 224 203

Construir un intervalo de confianza del 95 por 100 para la diferencia del


contenido medio de colesterol en la sangre antes y después del
tratamiento.

Solución.-

Se trata de datos apareados, en los que no existe independencia entre las


muestras.
En este caso, como la muestra es pequeña (n = 10 < 30) el intervalo de confianza
es:

N
n 2
sd ∑ d ∑ (di − d)
i 2 i=1
I1−α(μ 1 − μ 2) = d ± t α 2,(n−1) d =x −y d = i=1 s d=
n i i i n n−1

donde d es la media de las diferencias y sd la desviación estándar de estas diferencias.

X = ‘Antes’ 217 252 229 200 209 213 215 260 232 216
Y = ‘Después’ 209 241 230 208 206 211 209 228 224 203
di=xi−yi 8 11 -1 -8 3 2 6 32 8 13

2
d = 7, 40 s = 112,1481 s = 10,59 n = 10
d d

t =t = 2,262
1 − α = 0,95 α = 0,05 α 2 = 0,025 α 2;(n−1) 0,025; 9

10,59
I 0,95(μ 1− μ 2) = 7, 40 ± (2,262) = [− 0,17 ; 14,97]
10

El intervalo abarca el cero, por lo que no existe diferencia significativa en la


diferencia del contenido medio del colesterol antes y después del tratamiento,
con una fiabilidad del 95%.
Es vanessa.