Sunteți pe pagina 1din 0

UNIVERSIDAD AUSTRAL DE CHILE

FACULTADDECS.ECONMICASYADMINISTRATIVAS
INSTITUTODEESTADISTICA

Mayo2011

BAIN052
ESTADSTICA Y PROBABILIDAD PARA INGENIERA

ASIGNATURADELCURRICULUMDELASCARRERASDEINGENIERADELA
FACULTADDECIENCIASDELAINGENIERA,DELAUNIVERSIDAD
AUSTRALDECHILE

APUNTES DE CLASES
Versin 2010
Profesores
VctorFigueroaArcila
OsvaldoRojasQuintanilla
MagalyMoragaCrdenas

62
U
N
I
D
A
D

D
E

A
P
R
E
N
D
I
Z
A
J
E

I
I
I
:

I
N
F
E
R
E
N
C
I
A

E
S
T
A
D

S
T
I
C
A

M
a
y
o

d
e

2
0
1
1




Unidad de
Aprendizaje

INFERENCIA
ESTADSTICA














3.1 INTRODUCCIN
3.2 ESTIMACIN
3.2.1 Estimacin de parmetros
3.2.1.1 Estimacin puntual
3.2.1.2 Estimacin por intervalos
3.2.1.3 Aplicaciones
3.3 PRUEBA DE HIPTESIS (PRIMERA PARTE)
3.3.1 HIPTESIS ESTADSTICAS
3.3.2. POSIBLES ERRORES EN EL CONTRASTE DE HIPTESIS
3.3.3 CRITERIOS DE DECISIN
3.3.4 CONTRASTES UNILATERALES Y BILATERALES
3.3.5 METODOLOGA PARA CONTRASTAR UNA HIPTESIS
3.3.6 APLICACIONES (EN ANEXO 2 ENCONTRAR UN RESUMEN
CON LOS PRINCIPALES CONTRASTES)
3.4 APLICACIONE EN EL MBITO DE LA INGENIERA
ANEXOS
III

63
B
A
I
N

0
5
2
.

E
S
T
A
D

S
T
I
C
A

P
R
O
B
A
B
I
L
I
D
A
D

P
A
R
A

I
N
G
E
N
I
E
R

D
r
.

c
t
o
r

F
i
g
u
e
r
o
a

A
r
c
i
l
a
.

3.1 INTRODUCCIN
A menudo necesitamos estudiar las propiedades de una determinada poblacin, pero nos encontramos con el
inconveniente de que sta es demasiado numerosa como para analizar a todos los individuos que la componen. Por
tal motivo, recurrimos a extraer una muestra de la misma y a utilizar la informacin obtenida para hacer inferencias
sobre toda la poblacin. La Inferencia estadstica persigue entonces la obtencin de conclusiones sobre toda una
poblacin, basndose en la observacin de una muestra obtenida de ella. Estas estimaciones sern vlidas slo si la
muestra tomada es representativa de la poblacin. As, el muestreo es una tcnica que utilizamos para
asegurarnos que las muestras seleccionadas de la poblacin sean realmente representativas. El muestreo puede
hacerse con o sin reposicin, y la poblacin de partida puede ser infinita o finita. Una poblacin finita en la que se
efecta muestreo con reposicin puede considerarse infinita tericamente. Tambin, a efectos prcticos, una
poblacin muy grande puede considerarse como infinita. En todo nuestro estudio vamos a limitarnos a una poblacin
de partida infinita o a muestreo con reposicin.

3.2 DISTRIBUCIONES MUESTRALES
El estudio de determinadas caractersticas de una poblacin se efecta a travs del anlisis de diversas muestras
que pueden extraerse de ella. Consideremos todas las posibles muestras de tamao n en una poblacin. Para cada
muestra podemos calcular un estadgrafo (media aritmtica, desviacin estndar, proporcin, entre otros), cuyo valor
variar de una muestra a otra. As obtenemos una distribucin de probabilidades del estadgrafo que se llama
distribucin muestral. Se presentarn ahora las distribuciones muestrales relacionadas con dos situaciones
comunes: Muestreo a partir de una poblacin y Muestreo a partir de dos poblaciones
3.2.1 Muestreo a partir de una poblacin
Vamos a suponer que deseamos estudiar el comportamiento que tiene una variable en una determinada poblacin.
Supondremos adems que dicha variable tiene una distribucin normal con parmetros y
2
(N(,
2
)), los cuales
habitualmente son desconocidos. Para realizar nuestro estudio extraemos de esta poblacin muestras de tamao n.
3.2.1.1 Distribucin muestral de la media muestral. Cada muestra de tamao n que podemos extraer de
una poblacin proporciona una media. Si consideramos cada una de estas medias como valores de una
variable aleatoria podemos estudiar su distribucin que llamaremos distribucin muestral de la media
muestral.
Caso 1. Si tenemos una poblacin donde la variable bajo estudio X tiene una distribucin normal, N(,
2
), y
extraemos de ella muestras aleatorias de tamao n, entonces la distribucin muestral de la media muestral sigue
tambin una distribucin normal.
N(0,1)
n

) X (
Z
n
2

, N X

=


Caso 2. Si tenemos una poblacin donde la variable bajo estudio X NO tiene una distribucin normal, pero el
tamao de la muestra n es mayor que 30 (n>30), entonces aplicando el llamado Teorema del lmite central la
distribucin muestral de la media se aproxima tambin a la distribucin normal anterior.
N(0,1)
n

) X (
Z
n
2

, N X

64
U
N
I
D
A
D

D
E

A
P
R
E
N
D
I
Z
A
J
E

I
I
I
:

I
N
F
E
R
E
N
C
I
A

E
S
T
A
D

S
T
I
C
A

M
a
y
o

d
e

2
0
1
1

Caso 3. El resultado del Caso 2 sigue siendo vlido en aquellos casos en que no se conozca la varianza poblacional

2
y n> 30. En tales casos es posible utilizar la varianza muestral S
2
, en reemplazo de la varianza poblacional
2
. El
resultado quedara como:
N(0,1)
n
S
) X (
Z
n
2
S
, N X


Caso 4. Si en el Caso 3, el tamao de la muestra es menor 30 (n < 30), entonces la estadstica,

n
S
) X (
t

=

Comentario: Los resultados anteriores son aplicables tambin a la estadstica suma, es decir, de acuerdo al
teorema del lmite central la distribucin de
=
n
1 i
i
X es aproximadamente normal, con media n y varianza n
2
, sin
importar la distribucin de la poblacin.
Ejemplo 1. Suponga que las notas obtenidas en la primera prueba parcial de la asignatura siguen una distribucin
normal con una media igual a 5,8 y una desviacin estndar, , igual 2,4. Encuentre la probabilidad de que la
media de una muestra tomada al azar de 16 estudiantes est comprendida entre 5 y 7.
Solucin: Como la variable NOTAS tiene una distribucin N(5,8; 2,4), con n=16, la distribucin muestral de la media
se distribuye N(5,8; 0,6). Si x es la media de la muestra hemos de calcular la probabilidad
P(5< x < 7)=P(-1.33 < z < 2)= (2) (-1,33) = 0,8854
3.2.1.2 Distribucin muestral de la proporcin muestral.
En numerosas ocasiones se plantea estimar una proporcin o porcentaje. En estos casos la variable aleatoria toma
solamente dos valores diferentes (xito o fracaso), es decir sigue una distribucin binomial y cuando la extensin de
la poblacin es grande la distribucin binomial B(n,p) se aproxima a la normal npq) N(np, . Luego, para muestras
de tamao n>30, la distribucin muestral de la proporcin sigue una distribucin normal )
n
pq
N(p, , donde p es la
proporcin de xitos en la poblacin y q=1-p.
N(0,1)
n
pq
p) p (
Z
n
pq
p, N p


Ejemplo 2. Si tiramos una moneda correcta 100 veces, cul es la probabilidad de que obtengamos ms de 55
caras?.
Solucin: En una moneda correcta la proporcin de caras es 0,5, con lo que p=0,5; q=0,5 y n=100. Entonces la
proporcin muestral tiene una distribucin muestral N(0,5; 0,05
2
). Si llamamos p a la proporcin en la muestra
hemos de calcular la probabilidad P( p > 0,55) = 1-0,8413 = 0,1587.
3.2.1.3 Distribucin muestral de la varianza muestral.
Supngase que X1, X2, X3, _ _ _,Xn es una muestra aleatoria de una distribucin N(,
2
). Entonces la variable
aleatoria:
tiene una distribucin t con (n-1) grados de libertad.

65
B
A
I
N

0
5
2
.

E
S
T
A
D

S
T
I
C
A

P
R
O
B
A
B
I
L
I
D
A
D

P
A
R
A

I
N
G
E
N
I
E
R

D
r
.

c
t
o
r

F
i
g
u
e
r
o
a

A
r
c
i
l
a
.

2
1)S (n
2

n
1 i
2
X
i
X


3.2.2. Muestreo a partir de dos poblaciones
Supongamos ahora que estamos estudiando el comportamiento de una variable en dos poblaciones independientes.
Supongamos adems que en ambas poblaciones dicha variable tiene una distribucin normal con parmetros
distintos y habitualmente desconocidos, es decir en la poblacin 1 la variable tiene una distribucin N(1,
2
1
) y en la
poblacin 2 tiene una distribucin N(2,
2
2
). De ambas poblaciones extraemos muestras de tamao n1 y n2
respectivamente. Sea X11, X12, X13, _ _ _,X1n1 una muestra aleatoria de n1 observaciones a partir de la primera
poblacin, y sea X
21
, X
22
, X
23
, _ _ _,X
2n2
una muestra aleatoria de tamao n
2
tomada de la segunda poblacin.
3.2.2.1 Distribucin muestral de la diferencia de medias muestrales.
Caso 1. Si las varianzas poblacionales son conocidas, entonces la diferencia de las medias muestrales tiene una
distribucin normal, sin importar los tamaos de n
1
y n
2
.

Caso 2. Si las distribuciones de la variable a nivel poblacional NO son normales y las varianzas son conocidas,
entonces si los tamaos muestrales son ambos mayores o iguales a 30 (n
1
30 y n
2
30), la diferencia de las
medias muestrales tiene una aproximadamente una distribucin normal.

Caso 3. Si las varianzas poblacionales son desconocidas y los tamaos muestrales son ambos mayores o iguales a
30 (n
1
30 y n
2
30), entonces el resultado anterior sigue siendo vlido, es decir, la diferencia de las medias
muestrales tiene una aproximadamente una distribucin normal, donde las varianzas poblacionales se reemplazan
por las varianzas muestrales.

Caso 4. Si las varianzas poblacionales son desconocidas, pero aproximadamente iguales, y los tamaos muestrales
son pequeos (n1 < 30 y/o n2 < 30), entonces la estadstica,
tiene una distribucin t con n1 + n2 2 grados de libertad, donde

Caso 5. Si las varianzas poblacionales son desconocidas y desiguales, y los tamaos muestrales son pequeos
(n
1
< 30 y/o n
2
< 30), entonces la estadstica,

tiene una distribucin Chi-cuadrado con n-1 grados de libertad.
) 1 , 0 (
) ( ) X (
Z )
n

, - N( ) X - X (
2
2
2
1
2
1
2 1 2 1
2
2
2
1
2
1
2 1 2 1
N
n n
X

+

= +



2
n
1
1
n
1
p
S
)
2
-
1
( - )
2
X -
1
X (
t
+
=
1 n n
1)S (n 1)S (n
S
2 1
2
2 2
2
1 1 2
p
+
+
=

2
n
2
2
S
1
n
2
1
S
)
2
-
1
( - )
2
X -
1
X (
t
+
= 2
1 1
2
2
2
2
2
2
1
1
2
1
2
2
2
2
1
2
1

+
=
n
n
S
n
n
S
n
S
n
S

tiene una distribucin t con grados de libertad, donde


) 1 , 0 (
) ( ) X (
Z )
n

, - N( ) X - X (
2 1 2 1
,
2
2
2
1
1
1
2 1 2 1
2
2
2
1
2
1
2 1
, n
2 1
N
n n
X
n n n

+

= +



) 1 , 0 (
) ( ) X (
Z )
n
S
n
S
, - N( ) X - X (
2 1 2 1
,
2
2
2
1
1
1
2 1 2 1
2
2
2
1
2
1
2 1
, n
2 1
N
n
S
n
S
X
n n n

+

= +

66
U
N
I
D
A
D

D
E

A
P
R
E
N
D
I
Z
A
J
E

I
I
I
:

I
N
F
E
R
E
N
C
I
A

E
S
T
A
D

S
T
I
C
A

M
a
y
o

d
e

2
0
1
1

Caso 5. Muestras pareadas


Si
D
S y D son la media y la desviacin estndar maestrales de la diferencia de n pares aleatorios de mediciones
normalmente distribuidas, entonces la estadstica
n
D
S
D
- D
t = tiene una distribucin t con n-1 grados de libertad.
3.2.2.2 Distribucin muestral de la diferencia de proporciones muestrales.
Si
1
p y
2
p son las proporciones muestrales de dos muestras aleatorias independientes de tamaos n
1
y n
2
,
respectivamente, entonces bajo la hiptesis de que se aplica la aproximacin normal de una distribucin binomial, la
diferencia de las proporciones muestrales tiene aproximadamente una distribucin normal,

3.1.2.2. Distribucin muestral del cuociente entre dos varianzas muestrales.


Supongamos que se tienen dos distribuciones normales independientes X
1
N(
1
,
1
2
) Y X
2
N(
2
,
2
2
). Sea X
11
,
X12, X13, _ _ _,X1n1 una muestra aleatoria de n1 observaciones a partir de la primera distribucin normal, y sea X21,
X22, X23, _ _ _,X2n2 una muestra aleatoria de tamao n2 tomada de la segunda distribucin. Si
2
1
S
y
2
2
S
son las
varianzas muestrales, entonces el cuociente:

2
1

2
2
S
2
2

2
1
S

3.3 ESTIMACIN
3.3.1 Estimacin de parmetros
Una variable aleatoria se caracteriza o describe mediante su distribucin de probabilidad, la cual depende de
parmetros, que usualmente son desconocidos, por ello es necesario disponer de procedimientos para estimarlos
a partir de datos muestrales.
3.3.1.1 Estimacin puntual
Un estimador puntual es una estadstica que produce un solo valor numrico como estimacin del parmetro
desconocido.
Por ejemplo la media aritmtica muestral es un estimador de la media poblacional, la proporcin observada en la
muestra es un estimador de la proporcin en la poblacin.
Un valor numrico particular de un estimador, calculado a partir de datos muestrales, se llama estimacin.
Los estimadores puntuales adecuados requieren cierto nmero de propiedades importantes, de las cuales dos de
las ms importantes son las siguientes:
1. El estimador puntual debe carecer de sesgo; es decir, el valor esperado del estimador puntual debe ser igual al
parmetro estimado.
2. El estimador debe tener varianza mnima. Cualquier estimador puntual es una variable aleatoria. por tanto, un
estimador puntual de varianza mnima tendr una menor varianza que cualquier otro estimador puntual del
parmetro.
Para determinar estimadores puntuales existen mtodos de estimacin, dentro de los cuales se destacan: El Mtodo
de los Momentos; El Mtodo de Mxima Verosimilitud y el Mtodo de Mnimos Cuadrados.

Tiene una distribucin F con n
1
- 1 grados de libertad en el numerador y n
2
- 1 grados de libertad en el
denominador
) 1 , 0 (
) ( ) (
)
n
q p
n
q p
, p - p N( ) p - p (
2 1 2 1
,
2
2 2
1
1 1
2 1 2 1
2
2 2
1
1 1
2 1
n , n
2 1
N
n
q p
n
q p
p p p p
Z
n n

+

= +

67
B
A
I
N

0
5
2
.

E
S
T
A
D

S
T
I
C
A

P
R
O
B
A
B
I
L
I
D
A
D

P
A
R
A

I
N
G
E
N
I
E
R

D
r
.

c
t
o
r

F
i
g
u
e
r
o
a

A
r
c
i
l
a
.

3.3.1.2 Estimacin por intervalos


Un estimador por intervalo es un intervalo aleatorio que incluye el valor real del parmetro, con cierto nivel de
probabilidad. Estos intervalos aleatorios se denominan normalmente intervalos de confianza. Una estimacin por
intervalo de un parmetro es el intervalo limitado por dos estadsticas, de manera que incluye el verdadero valor del
parmetro con cierta probabilidad.
Por ejemplo para elaborar un estimador por intervalo para un parmetro , es necesario encontrar dos estadsticas
L y U, tales que: P{L U} = 1- . El intervalo resultante: L U se denomina intervalo bilateral al (1- )% de
confianza para el parmetro desconocido , donde: L es el lmite inferior de confianza; U es el lmite superior de
confianza; 1- es el coeficiente o nivel de confianza y U - ( - L) se denomina exactitud del intervalo.
Interpretacin de un intervalo de confianza
Si se determinan un gran nmero de tales intervalos, cada uno a partir de una muestra aleatoria, entonces el (1- )%
de estos intervalos contendrn el verdadero valor del parmetro .
Nivel de confianza es la "probabilidad" de que el intervalo calculado contenga al verdadero valor del parmetro. Se
indica por 1- y habitualmente se da en porcentaje (1-)100%. Hablamos de nivel de confianza y no de
probabilidad ya que una vez extrada la muestra, el intervalo de confianza contendr al verdadero valor del
parmetro o no, lo que sabemos es que si repitisemos el proceso con muchas muestras podramos afirmar que el
(1-)% de los intervalos as construidos contendra al verdadero valor del parmetro.
Intervalos de confianza unilaterales
Un intervalo unilateral inferior al (1- )% de confianza para estara dado por , L , donde L, el lmite inferior de
confianza, se escoge de manera que P{L } = 1- .
Un intervalo unilateral superior al (1- )% de confianza para estara dado por , U donde U, el lmite superior
de confianza, se escoge de manera que P{ U } = 1- .
Metodologa para construir intervalos de confianza
Para construir un intervalo de confianza para un parmetro determinado se requiere encontrar una estadstica que
cumpla dos condiciones:
1. Que involucre en su formulacin al parmetro que se desea estimar.
2. Que dicha estadstica tenga una distribucin de probabilidades conocida.
Una estadstica que cumpla con estas condiciones recibe el nombre de estadstica pivotal.
3.3.1.3 Aplicaciones (en anexo 1 encontrar un resumen con estadsticas pivotales)
Estudiaremos ahora cmo construir intervalos de confianza para la media, la varianza y la proporcin en una
poblacin. Para el caso de dos poblaciones estudiaremos cmo construir intervalos de confianza para la diferencia de
medias, el cuociente de varianzas y la diferencia de proporciones. En cada caso se trabaja con las estadsticas y
distribuciones maestrales ya estudiadas anteriormente.
A. Caso una poblacin
A.1 Estimacin de la media
Caso 1. Intervalo de confianza para ; con conocida
Si x

es la media de una muestra aleatoria de tamao n proveniente de una poblacin cuya variable de inters tiene
una distribucin normal con varianza conocida
2
, entonces un intervalo al (1 - )% de confianza para , la media
poblacional de la variable, esta dado por:

Teorema: Si se utiliza x como una estimacin de , se puede tener entonces una confianza de (1-)%
de que el error no exceder de:

n
z
n
z
)
2
1 ( )
2
1 (



+ x x
donde
) 1 (
2

z es el percentil (1-/2) de la distribucin normal estndar.

68
U
N
I
D
A
D

D
E

A
P
R
E
N
D
I
Z
A
J
E

I
I
I
:

I
N
F
E
R
E
N
C
I
A

E
S
T
A
D

S
T
I
C
A

M
a
y
o

d
e

2
0
1
1








Figura 1. Error al estimar por x
Teorema: Si se utiliza x como una estimacin de , se puede tener una confianza de (1 - )% de que el error ser
menor que una cantidad especificada e cuando el tamao de la muestra es:

Caso 2. I nt er val o de conf i anza para ; con
2
desconoci da ( muest ra gr ande)
Si x y s son la media y la desviacin estndar de una muestra aleatoria de tamao n > 30, tomada de una poblacin
cuya variable de inters tiene una distribucin normal con varianza desconocida
2
, entonces un intervalo al (1 - )%
de confianza para , la media poblacional de la variable, est dado por:

Caso 3. Interval o de conf i anza para ; con


2
desconoci da (muestra pequea)
Si x y s son la media y la desviacin estndar de una muestra aleatoria de tamao n 30, tomada de una poblacin
cuya variable de inters tiene una distribucin normal con varianza desconocida
2
, entonces un intervalo al (1 - )%
de confianza para , la media poblacional de la variable, est dado por:


A.2 Estimacin de una proporcin
Si es la proporcin muestral de una muestra aleatoria de tamao n, tomada de una poblacin cuya variable de
inters tiene una distribucin normal, entonces un intervalo al (1 - )% de confianza para P, la proporcin poblacional,
est dado por:


A.3 Estimacin de la varianza
Si S
2
es la varianza muestral de una muestra aleatoria de tamao n, tomada de una poblacin cuya variable de
inters tiene una distribucin normal con varianza desconocida
2
, un intervalo al (1 - )% de confianza para
2
, la
varianza poblacional, est dado por:


n
) p (1 p
z p P
n
) p (1 p
z p
)
2
1 ( )
2
1 (



p
x

e: error de estimacin
n
Z X
)
2
1 (

+
n
Z X
)
2
1 (

n
Z
)
2
1 (

n
Z
)
2
1 (

Ver Figura 1
2
e
z
n
)
2
1 (


n
S
z
n
S
z
)
2
1 ( )
2
1 (



+ x x
donde
) 1 (
2

z es el percentil (1-/2) de la distribucin normal estndar.



n
S
n
S
)
2
1 ( )
2
1 (



+ t x t x donde t(1-/2) es el percentil (1-/2) de la distribucin t con v = n 1
grados de libertad
2
2
2
2
2
)
2
1 (
2
S 1) - (n

S 1) - (n


donde y son los percentiles /2 y (1-/2), respectivamente


de la distribucin Chi-cuadrado con (n 1) grados de libertad.
2
) 1 (
2


2
)
2

donde
) 1 (
2

z es el percentil (1-/2) de la distribucin


normal estndar.

69
B
A
I
N

0
5
2
.

E
S
T
A
D

S
T
I
C
A

P
R
O
B
A
B
I
L
I
D
A
D

P
A
R
A

I
N
G
E
N
I
E
R

D
r
.

c
t
o
r

F
i
g
u
e
r
o
a

A
r
c
i
l
a
.

B. CASO DOS POBLACIONES


1. - Est i maci n de l a di f erenci a ent re dos medi as
Caso 1. Intervalo de confianza para 1 - 2; con
2
1
y
2
2
conocidas
Si
1
x y
2
x son las medias de muestras aleatorias independientes de tamaos n1 y n2 provenientes de poblaciones,
donde la variable de inters tiene una distribucin normal, con varianzas conocidas
2
1
y
2
2
, respectivamente,
entonces un intervalo al (1 - )% de confianza para
2 1
, la diferencia de medias poblacionales, est dado por:


Comentario:
El grado de confianza es exacto cuando las muestra provienen de poblaciones donde la variable de inters tiene una
distribucin normal. Para poblaciones donde la variable de inters no tiene una distribucin normal se obtiene un
intervalo de confianza aproximado que es muy bueno cuando tanto n
1
como n
2
exceden de 30.
Como antes, si
2
1
y
2
2
son desconocidos y los tamaos muestrales son suficientemente grandes, se puede
reemplazar, en la ecuacin precedente,
2
1
por
2
1
S y
2
2
por
2
2
S , sin afectar de manera significativa el intervalo de
confianza.
Caso 2. Intervalo de confianza en muestras pequeas para 1 - 2; con
2
1
=
2
2
pero desconocidas
Si
1
x y
2
x son las medias de muestras aleatorias pequeas independientes de tamaos n
1
y n
2
, respectivamente,
provenientes de poblaciones, donde la variable de inters tiene una distribucin normal, con varianzas
2
1
y
2
2
desconocidas pero aproximadamente iguales, entonces un intervalo al (1 - )% de confianza para
2 1
, la
diferencia de medias poblacionales, est dado por:



donde Sp es la estimacin conjunta de la desviacin estndar de la poblacin, y donde t(1-/2) es el percentil (1-/2) de
la distribucin t con v = n
1
+ n
2
1 grados de libertad.
Caso 3. Intervalo de confianza con muestras pequeas para
1
-
2
; con
2
1

2
2
y desconocidas
Si
1
x ,
2
1
S y
2
x ,
2
2
S , son las medias y las varianzas de muestras aleatorias pequeas independientes de tamaos
n1 y n2 respectivamente, provenientes de poblaciones donde la variable de inters tiene una distribucin normal, con
varianzas
2
1
y
2
2
desconocidas y desiguales, respectivamente, entonces un intervalo al (1 - )% de confianza
para
2 1
, la diferencia de medias poblacionales, est dado por:


2
n
2
2

1
n
2
1

z )
2
x -
1
x (
2
-
1

2
n
2
2

1
n
2
1

z )
2
x -
1
x (
)
2

1 ( )
2

1 (
+ + +

2
n
1
1
n
1
p
S t )
2
x -
1
x (
2
-
1

2
n
1
1
n
1
p
S t )
2
x -
1
x (
)
2

1 ( )
2

1 (
+ + +

2
n
2
2
S
1
n
2
1
S
t )
2
x -
1
x (
2
-
1

2
n
2
2
S
1
n
2
1
S
t )
2
x -
1
x (
)
2

1 (
)
2
1 (
+ + +

donde
) 1 (
2

z es el percentil (1-/2) de la
distribucin normal estndar.

70
U
N
I
D
A
D

D
E

A
P
R
E
N
D
I
Z
A
J
E

I
I
I
:

I
N
F
E
R
E
N
C
I
A

E
S
T
A
D

S
T
I
C
A

M
a
y
o

d
e

2
0
1
1

donde t
(1-/2)
es el percentil (1-/2) de la distribucin t con grados de libertad, y queda dado por la siguiente
expresin:




Caso 4. Intervalo de confianza para D = 1 - 2 en el caso de observaciones en pares
Si S y
d
d son la media y la desviacin estndar de las diferencias de n pares aleatorios de mediciones,
entonces un intervalo al (1 - )% de confianza para
2 1
=
D
, la diferencia de medias poblacionales, est
dado por:


2. - Est i maci n de l a di f er enci a ent r e dos pr opor ci ones
Intervalo de confianza para p1 - p2, a partir de muestras grandes
Si p
1
y p
2
son las proporciones de xitos en muestras aleatorias de tamaos n
1
y n
2
, respectivamente, y adems
1 1

p q = y
2 2

p q = , entonces un intervalo al (1 - )% de confianza para p1 p2, est dado por:





3.- Estimacin de la razn de dos varianza
Intervalo de confianza para 2
2
2
1


Si
2
1
S y
2
2
S son las varianzas de muestras aleatorias independientes de tamaos n1 y n2, respectivamente, tomadas
de poblaciones cuya variable de inters tiene una distribucin normal, entonces un intervalo al (1 - )% de confianza
para 2
2
2
1

est dado por:




donde
2
1

f y
2

f son los percentiles (1-/2) y /2, respectivamente, de la distribucin F con 1 = n1 1 y 2 = n2


1 grados de libertad.
3.4 PRUEBA DE HIPTESIS (PRIMERA PARTE)
3.4.1 HIPTESIS ESTADSTICAS
Una hiptesis estadstica es una afirmacin respecto a alguna caracterstica de una poblacin. Contrastar una
hiptesis es comparar las predicciones con la realidad que observamos. Si dentro del margen de error que nos
permitimos admitir, hay coincidencia, aceptaremos la hiptesis y en caso contrario la rechazaremos. La veracidad o
falsedad de una hiptesis estadstica nunca es conocida con certeza, a menos que se analice la poblacin completa.
Aun cuando es frecuente utilizar los trminos aceptar o rechazar, es importante comprender que rechazar una
n d n
d
)
2
1 (
d
)
2
1 (
S
t d
S
t d



+
2
2
2
2
1
2
2
2
1
)
2
1 (
2
2
2
1

S


S

f S f S

2
2
q
2
p
1
1
q
1
p

)
2
1 (
z )
2
p -
1
p (
2
P -
1
P
2
2
q
2
p
1
1
q
1
p

)
2
1 (
z )
2
p -
1
p (
n n n n
+

+ +


2
2
2
2
2
2
1
1
2
1
2
2
2
2
1
2
1
1 1

+
=
n
n
S
n
n
S
n
S
n
S

donde
) 1 (
2

z es el percentil (1-/2)
de la distribucin normal estndar.
donde t(1-/2) es el percentil (1-/2) de la distribucin t con v = n 1
grados de libertad.

71
B
A
I
N

0
5
2
.

E
S
T
A
D

S
T
I
C
A

P
R
O
B
A
B
I
L
I
D
A
D

P
A
R
A

I
N
G
E
N
I
E
R

D
r
.

c
t
o
r

F
i
g
u
e
r
o
a

A
r
c
i
l
a
.

hiptesis significa concluir que es falsa, mientras que aceptar una hiptesis solamente implica que no se tiene
suficiente informacin como para creer otra cosa.
La hiptesis emitida se suele designar por Ho y se llama Hiptesis nula porque parte del supuesto que la diferencia
entre el valor verdadero del parmetro y su valor hipottico es debida al azar, es decir no hay diferencia. Llamaremos
hiptesis nula, Ho, a la hiptesis que se contrasta. El nombre de nula proviene de que Ho representa la hiptesis
que mantendremos a no ser que los datos indiquen su falsedad, y debe entenderse, por tanto, en el sentido de
neutra. La hiptesis Ho nunca se considera probado, aunque puede ser rechazada por los datos. El rechazo de Ho
conduce a la aceptacin de la hiptesis alternativa, H1. La hiptesis contraria se designa por H1 y se llama Hiptesis
alternativa.
3.4.2 POSIBLES ERRORES EN EL CONTRASTE DE HIPTESIS
El contraste de hiptesis no establece la verdad de la hiptesis, sino un criterio que nos permite decidir si una
hiptesis se acepta o se rechaza, o el determinar si las muestras observadas difieren significativamente de los
resultados esperados. En este proceso podemos incurrir en dos tipos de errores segn sea la situacin real y la
decisin que tomemos.
Si rechazamos una hiptesis cuando debiera ser aceptada, cometemos un error de tipo I, mientras que si la
aceptamos debiendo ser rechazada diremos que hemos cometido un error de tipo II. Minimizar los errores no es una
cuestin sencilla, un tipo suele ser ms grave que otro y los intentos de disminuir uno suelen producir el aumento del
otro. La nica forma de disminuir ambos a la vez es aumentar el tamao de la muestra.
Ho verdadera Ho falsa
DECISIN:Mantener Ho
Decisin correcta
Decisin incorrecta
Error de tipo II
DECISIN:Rechazar Ho
Decisin incorrecta
Error de tipo I
Decisin correcta
La probabilidad de cometer un error de tipo I es el nivel de significacin , la probabilidad de cometer un error de
tipo II depende del verdadero valor de y del tamao de la muestra.
Ejercicio 1: Compruebe que la probabilidad de cometer un error de tipo II disminuye al aumentar el tamao de la
muestra (n).
Ejercicio 2:Compruebe tambin lo que ocurre al variar la diferencia entre la media hipottica de la poblacin (o) y la
verdadera ().
3.4.3 CRITERIOS DE DECISIN
Puesto que la eleccin entre H
0
y H
1
ha de hacerse basndose en datos provenientes de una muestra, es necesario
escoger una funcin de las n observaciones de la muestra que permita tomar esta decisin. A tal funcin de la
muestra se le llama estadstica de prueba. En general, la estadstica de prueba debe ser una cuya distribucin
muestral sea conocida en el supuesto que la hiptesis nula es cierta. La estadstica de prueba generalmente se
obtiene a partir del estimador convencional del parmetro previsto en H
0
.
El conjunto donde toma valores la estadstica de prueba, se divide en dos subconjuntos, la regin de rechazo o
regin crtica , R, que contiene los resultados menos favorables de H0, y la regin de aceptacin, A, que contiene
los resultados ms favorables a H
0
. Luego si el valor calculado de la estadstica de prueba perteneces a R,
rechazamos H0, en cambio si pertenece a A, aceptamos H0. El valor (o los valores) de la estadstica de prueba que
separa (o separan) a la regin R de la regin A se llama valor crtico (o valores crticos).
3.4.4 CONTRASTES UNILATERALES Y BILATERALES
Los contrastes pueden ser unilaterales o bilaterales (tambin llamados de una o dos colas) segn establezcamos
las hiptesis, si las definimos en trminos de igual y distinto estamos ante una hiptesis unilateral, si suponemos una
direccin (en trminos de mayor o menor) estamos ante uno unilateral.

72
U
N
I
D
A
D

D
E

A
P
R
E
N
D
I
Z
A
J
E

I
I
I
:

I
N
F
E
R
E
N
C
I
A

E
S
T
A
D

S
T
I
C
A

M
a
y
o

d
e

2
0
1
1

A una prueba de cualquier hiptesis estadstica, en la que la hiptesis alternativa es unilateral, tal como:
H
0
: =
0
versus

H
1
: >
0
o bien, H
0
: =
0
versus

H
1
: <
0

Se le denomina prueba de una cola o unilateral.
La regin crtica de la hiptesis alternativa H
1
: >
0
se ubica por completo en la cola derecha de la distribucin,
mientras que la regin crtica de la hiptesis alternativa H
1
: <
0
se ubica por completo en la cola izquierda. En
cierto sentido el smbolo de desigualdad seala la direccin en la cual se ubica la regin crtica.
A una prueba de cualquier hiptesis estadstica, en la que la hiptesis alternativa es bilateral, tal como:
H
0
: =
0
versus

H
1
:
0
Se le denomina prueba de dos colas o bilateral, ya que la regin crtica est dividida en dos partes igualmente
probables ubicadas en cada cola de la distribucin de la estadstica de prueba.
3.4.5 METODOLOGA PARA CONTRASTAR UNA HIPTESIS
Se trata pues, de extraer conclusiones a partir de una muestra aleatoria y significativa, que permitan aceptar o
rechazar una hiptesis previamente emitida, sobre el valor de un parmetro desconocido de la poblacin. El mtodo
que seguiremos es el siguiente:
1. Formulacin de las hiptesis.
2. Elegir un nivel de significacin
3. Escoger la estadstica de prueba.
4. Establecer el criterio en que se basar la decisin. Construir la zona de aceptacin, intervalo fuera del cual
slo se encuentran el 100% de los casos ms raros. A la zona de rechazo la llamaremos regin crtica, y su
rea es el nivel de significacin.
5. Verificar la hiptesis extrayendo una muestra cuyo tamao se ha decidido en el paso anterior y obteniendo de
ella el correspondiente estadstico (media o proporcin en nuestro caso).
6. Decidir. Si el valor calculado en la muestra cae dentro de la zona de aceptacin se acepta la hiptesis y si no se
rechaza.
3.4.6 APLICACIONES (EN ANEXO 2 ENCONTRAR UN RESUMEN CON LOS PRINCIPALES CONTRASTES)
Estudiaremos ahora hiptesis sobre la media, la varianza y sobre la proporcin en una poblacin. Para el caso de
dos poblaciones estudiaremos la comparacin de medias, comparacin de varianzas y comparacin de proporciones.
En cada caso se trabaja con un contraste bilateral y otro unilateral. Los contrastes unilaterales son de distinta
direccin en cada ejemplo, pero el mtodo a seguir es anlogo para ambos.
3.4.6.1 CASO UNA POBLACIN
A. Contraste de hiptesis para la media
A.1 Contraste bilateral
Ejemplo 1. Se sabe que la desviacin estndar de las notas de cierto examen es 2,4. Para una muestra de 36 estudiantes se
obtuvo una nota media de 5,6. Sirven estos datos para confirmar la hiptesis de que la nota media del examen fue de 6, a un nivel
de significacin de 0,05?
Ejemplo 2. En otra muestra de 81 estudiantes se obtuvo una nota media de 6,2. Se confirma la hiptesis anterior a un nivel de
significacin de 0,01?
A.2 Contraste unilateral
Ejemplo 3. Se cree que la altura media de los habitantes de cierta poblacin es como mucho 170 cm, con una desviacin tpica de
8 cm. En una muestra de 100 personas se observa una altura media de 172 cm. Podemos aceptar la hiptesis con un nivel de
significacin del 5%?. Si el nivel de significacin fuese 0,01 se aceptara la hiptesis anterior?
B. Contraste de hiptesis para la proporcin
Queremos contrastar una hiptesis acerca de la proporcin en una poblacin a partir de los datos extrados de una
muestra. Procederemos como en el apartado anterior:
B.1 Contraste bilateral

73
B
A
I
N

0
5
2
.

E
S
T
A
D

S
T
I
C
A

P
R
O
B
A
B
I
L
I
D
A
D

P
A
R
A

I
N
G
E
N
I
E
R

D
r
.

c
t
o
r

F
i
g
u
e
r
o
a

A
r
c
i
l
a
.

Ejemplo 4. Se realizan 200 lanzamientos de una moneda y salen 120 caras, podemos aceptar que la moneda no
est trucada con un nivel de significacin del 5%?. Aceptaramos que la moneda no est trucada con =0,01?
Ejemplo 5. Un partido poltico afirma que obtendr el 60% de los votos en las prximas elecciones. Encuestados
1000 votantes afirman su intencin de votar a dicho partido 540. Se puede aceptar la hiptesis del partido con un
nivel de significacin del 5%?
B.2 Contraste unilateral
Ejemplo 6.Una mquina fabrica piezas de precisin y se garantiza que la proporcin de piezas correctas producidas
es al menos del 97%. Un cliente recibe un lote de 200 piezas y aparecen 8 piezas defectuosas; a un nivel de
confianza del 95% rechazar el lote por no cumplir las condiciones de la garanta?
Si la muestra hubiese sido de 300 piezas con 285 correctas, se aceptara el lote al 10% de significacin?
C. Contraste de hiptesis para la varianza de una poblacin
Ejemplo 7.El peso de 12 latas de cerezas, en onzas, es:
11,9 12,3 12,6 11,8 12,1 11,5 12,7 11,3 11,9 12,0 11,8 12,1
La desviacin estndar especificada es de 1/2 onza. Se cumple esta especificacin? Use el nivel de significacin
del 1% y una prueba bilateral. Nota: 1 onza = 28,35 gramos.
3.4.6.2 Caso dos poblaciones
D. Contraste de hiptesis para la diferencia de medias
Ejemplo 8.Un inversionista est considerando dos lugares alternativos para un centro comercial regional. Como los
ingresos de los hogares de la comunidad son una consideracin importante en esa seleccin, desea probar la
hiptesis nula de que no existe diferencia entre el ingreso promedio por hogar en las dos comunidades. Consistente
con esta hiptesis supone que la desviacin estndar del ingreso por hogar es tambin igual en las dos
comunidades. Para una muestra de n = 30 hogares de la primera comunidad, encuentra que el ingreso diario
promedio es
1
x
= $35.500, con desviacin estndar muestral de s1 = $1.800. Para una muestra de n2 = 40 hogares
de la segunda comunidad,
2
x
= $34.600 s2 = $2.400. Probar la hiptesis nula en el nivel de significacin del 5%.
3.5 APLICACIONES (EN ANEXO 2 ENCONTRAR UN RESUMEN CON LOS PRINCIPALES CONTRASTES)
3.6 APLICACIONE EN EL MBITO DE LA INGENIERA
REFORZAMIENTO ESTIMACIN
1. Se sabe que la duracin, en horas, de una ampolleta utilizada a la luz testigo, tiene una distribucin
aproximadamente normal, con una desviacin estndar de = 25 horas. Se toma una muestra aleatoria de 20
ampolletas, la cual arroja una duracin promedio de 1014 horas.
a) Construya un intervalo de confianza bilateral del 95% para la duracin promedio.
b) Estudie el error de estimacin para niveles de confianza del 95% y del 99%. Qu relacin existe entre
longitud del intervalo, precisin de la estimacin y nivel de confianza?.
c) Supngase que se desea una confianza del 95% en que el error en la estimacin de la duracin promedio sea
menor que 5 horas. Qu tamao de muestra debe utilizarse?
d) Supngase que se desea el ancho total del intervalo de confianza bilateral sea de seis horas, con una
confianza del 95%. Qu tamao de muestra debe emplearse para este fin?
2. Una mquina produce piezas metlicas de forma cilndrica para ser utilizadas en la fabricacin de discos duros
para computadoras. Se toma una muestra de las piezas y los dimetros resultan de: 1.01, 0.97, 1.03, 1.04,
0.99, 1.01, y 1.03 centmetros, respectivamente:
a) Obtenga un intervalo de confianza de 99% para el dimetro medio de las piezas producidas por la mquina,
suponiendo una distribucin aproximadamente normal.
b) Estudie el error de estimacin para niveles de confianza del 95%. Qu relacin existe entre longitud del
intervalo, precisin de la estimacin y nivel de confianza?
c) Supngase que se desea que el error en la estimacin del dimetro medio de las piezas sea menor que 0.05
centmetros, con una confianza del 95%. Cul debera ser en este caso el tamao de la muestra?.
3. Una muestra aleatoria de tamao n1 = 16 que se tom de una poblacin con una desviacin estndar 1 = 5
tiene una media x1
= 80. Una segunda muestra aleatoria de tamao n
2
= 25 tomada de una poblacin normal

74
U
N
I
D
A
D

D
E

A
P
R
E
N
D
I
Z
A
J
E

I
I
I
:

I
N
F
E
R
E
N
C
I
A

E
S
T
A
D

S
T
I
C
A

M
a
y
o

d
e

2
0
1
1

diferente con una desviacin estndar


2
= 3, tiene media x2
= 75. Encuentre un intervalo de confianza del 95%
para
1
-
2
. De acuerdo con el intervalo hallado. hay evidencia de que las dos medias son iguales?
4. Una compaa tiene dos departamentos que producen el mismo producto. Se tiene la sensacin de que las
producciones por hora son diferentes en los dos departamentos. Al tomar una muestra aleatoria de horas de
produccin en cada departamento se obtuvieron los datos siguientes:
Departamento I Departamento II
Tamao de muestra n1 = 64 n2 = 49
Media muestral
1
x = 100 unid
2
x = 90 unidad.
Se sabe que las varianzas de las producciones por hora son
2
1
= 256,
2
2
= 196 para los dos
departamentos respectivamente. Obtenga e interprete un intervalo del 95% para la verdadera diferencia de la
produccin media. Qu puede decirse de la sospecha que exista acerca de la diferencia entre la produccin
promedio?
5. Se compara la resistencia de dos tipos de rosca de tornillo, utilizados en el armado de computadores, 50 piezas
con cada tipo de rosca se prueban en condiciones similares. Las piezas de la marca A tienen una resistencia
media a la tensin de 78,3 kg., con una desviacin estndar de 5.6 kg., en tanto que las de la marca B tienen
una resistencia media a la tensin de 87.2 g., con una desviacin estndar de 6.3 kilogramos.
a) Determine un intervalo de confianza de 95% para la diferencia de las medias poblaciones.
b) Con base en los resultados obtenidos en (a), Qu marca recomendara comprar?. Justifique.
6. Durante un periodo de 15 das se tomaron los tiempos gastados por dos estudiantes para transportarse de sus
casas a la universidad. Las medias y varianzas fueron:

1
x = 40.33
2
x = 42.54

s
2
1
= 1.53
s
2
2
= 2.96

a) Calcule e interprete un intervalo de confianza del 95% para la diferencia de medias.
b) De acuerdo con el intervalo hallado. qu puede decirse de la igualdad de las medias?
c) Calcule e interprete un intervalo del 90% de confianza para el verdadero cociente de varianzas.
d) De acuerdo con el intervalo hallado. qu puede decirse de la igualdad entre las varianzas poblacionales?.
7. Suponga que la escuela de Ingeniera Civil en Informtica debe comprar tubos para iluminar la sala de
computacin. Para ello tiene dos alternativas comprar tubos con filamento tipo A o con filamento tipo B. Con el
objetivo de tener mayores antecedentes, para tomar la decisin, someti a prueba 10 tubos de cada tipo,
obteniendo las siguientes duraciones en horas:

A: 1614, 1094, 1293, 1643, 1466, 1270, 1340, 1380, 1028, 1997
B: 1383, 1138, 1092, 1143, 1017, 1061, 1627, 1021, 1711, 1065
a) Suponiendo que las varianzas son iguales, encontrar un intervalo de confianza para la diferencia de medias.
b) Suponiendo que las varianzas son desiguales, encontrar un intervalo de confianza para la diferencia de
medias.
c) Con base en los resultados obtenidos en (a) y (b), qu tipo de tubo recomendara comprar usted, el con
filamento tipo A o el con filamento tipo B?. Justifique.
8. Un cientfico de la computacin estn investigando la utilidad de dos lenguajes de diseo para mejorar la tarea
de programacin. Se pide a doce programadores expertos, familiarizados con los dos lenguajes, que codifiquen
una funcin estndar en ambos lenguajes, anotando el tiempo, en minutos, que requieren para hacer esta
tarea. Los datos obtenidos son los siguientes:



75
B
A
I
N

0
5
2
.

E
S
T
A
D

S
T
I
C
A

P
R
O
B
A
B
I
L
I
D
A
D

P
A
R
A

I
N
G
E
N
I
E
R

D
r
.

c
t
o
r

F
i
g
u
e
r
o
a

A
r
c
i
l
a
.

TIEMPO
Programador Lenguaje de Diseo 1 Lenguaje de Diseo 2
1 17 18
2 16 14
3 21 19
4 14 11
5 18 23
6 24 21
7 16 10
8 14 13
9 21 19
10 23 24
11 13 15
12 18 20
a) Encuentre un intervalo de confianza del 95% para la diferencia en los tiempos de codificacin promedio.
b) Existe algo que indique una preferencia por alguno de los lenguajes?.
9. Un fabricante de calculadoras electrnicas est interesado en estimar la fraccin de unidades defectuosas
producidas. Se toma una muestra aleatoria de 800 calculadoras, de las cuales 10 resultan defectuosas. Calcule
un intervalo de confianza superior del 99% para la fraccin de calculadoras defectuosas.
10. Se lleva a cabo un estudio para determinar el porcentaje de hogares en Valdivia donde hay al menos un
computador. De qu tamao debe ser la muestra y se desea tener una confianza del 99% de que el error al
estimar esta cantidad es menor que 0.017?.
11. El jefe de personal de una empresa desea realizar una encuesta para determinar la proporcin de trabajadores
que est a favor de un cambio en el horario de trabajo. Como es imposible consultar a los N = 500 trabajadores
en un lapso razonable, procede a escoger aleatoriamente cierto nmero de trabajadores para entrevistarlos;
determine el nmero de trabajadores que debe entrevistarse si desea que la proporcin estimada presente un
error mximo del 5% y un nivel de confianza del 95%.
12. Se analiza la fraccin de productos defectuosos producidos por dos lneas de produccin. Una muestra
aleatoria de 100 unidades provenientes de la lnea 1 contiene 10 que son defectuosas, mientras que una muestra
aleatoria de 120 unidades de la lnea 2 tiene 25 que son defectuosa.
a) Encuentre un intervalo de confianza del 99% para la diferencia en fracciones de productos defectuosos
producidos por la dos lneas.
b) Qu conclusiones pueden obtenerse de los resultados obtenidos en (a)?
13. Considere los datos del problema 2. Construya lo siguiente:
a) Un intervalo de confianza bilateral del 95% para
2
?
b) Un intervalo de confianza inferior del 95% para
2
?
c) Un intervalo de confianza superior del 95% para
2
?
14. Considere los datos del problema 4. Construya lo siguiente:
a) Un intervalo de confianza bilateral del 90% para
2
1

/2
2

b) Un intervalo de confianza bilateral del 95% para
2
1

/2
2
. Compare el ancho de este intervalo con el del
obtenido en la parte (a).
c) Un intervalo de confianza inferior del 90% para
2
1

/2
2

d) Qu conclusiones se podran obtener, en el contexto del problema, de los resultados obtenidos en (a), (b) y
(c).
Ejercicios de Comprensin
30. Resuelva los problemas del captulo 14 del libro de Paul L. Meyer: Introductory Probability and Statistical
Applications.-

76
U
N
I
D
A
D

D
E

A
P
R
E
N
D
I
Z
A
J
E

I
I
I
:

I
N
F
E
R
E
N
C
I
A

E
S
T
A
D

S
T
I
C
A

M
a
y
o

d
e

2
0
1
1

REFORZAMIENTO PRUEBA DE HIPTESIS


Seccin 1:
31. Definir los siguientes conceptos tan completamente como sea posible:
a) Hiptesis estadstica
b) Prueba de hiptesis
c) Regin critica
d) Nivel de significacin
e) Hiptesis nula
f) Hiptesis alternativa
32. En qu situaciones se hace una prueba de dos colas?. Cmo se enuncia la hiptesis alternativa en una prueba de dos
colas?.
33. En qu casos se hace una prueba de una cola? Cmo se enuncia la hiptesis alternativa en una prueba de una cola?.

34. Distinga entre los siguientes conceptos:
a) Error de tipo I y Error de tipo II
b) Regin de rechazo y regin de aceptacin.
c) Estimacin estadstica y prueba de hiptesis.
35. Son aditivos los errores de tipo I y de tipo II, es decir, se verifica que + = 1 ?Explique.
36. Cmo se relacionada el error de Tipo I con el de Tipo II?. Explique completamente.
37. Si X es N (
1

2
) y una muestra de n observaciones da una media x , y si se desea contrastar la hiptesis nula H0 : =
0 con las alternativas:
a) Ha : >
0
b) H
a
: <
0

c) Ha : 0
Cul es la regla de decisin en cada uno de los casos?
38. Se admite que la velocidad promedio de las mecangrafas de una compaa es de 55 palabras por minuto. El jefe de personal
afirma que un programa de adiestramiento instituido hace poco ha aumentado la velocidad de las mecangrafas. Formule la
hiptesis nula y la hiptesis alternativa.
39. La resistencia a la traccin de los alambres de acero es cuando ms de 1.000 libras. El fabricante asegura que un nuevo
proceso de produccin ha aumentado la resistencia de los alambres. Formule la hiptesis nula y la hiptesis alternativa. Si se
sabe que la resistencia a la traccin es exactamente de 1.000 libras. cules son las hiptesis nula y alternativa?
Seccin 2:
40. Una fabrica de pilas garantiza que su producto tiene una vida media de 1.000 horas y una desviacin estndar de 50. Pruebe la
hiptesis de que = 1.000 en contraposicin de la alternativa 1.000 horas, si una muestra aleatoria de 30 bateras
tiene una duracin promedio de 950 horas. Utilice = 5%.
41. Una muestra aleatoria de 36 refrescos de un mquina despachadora tiene un contenido promedio de 19.8 decilitros, con una
desviacin estndar de 1.3 decilitros. Pruebe la hiptesis de = 20 decilitros en contraposicin a la hiptesis alternativa <
20. Use el nivel de significacin = 1%. Calcule el valor p de significacin.
42. Los siguientes datos representan el contenido de grasa en los cuerpos de 10 hombres: 4.22, 3.99, 5.41, 4.23, 4.29, 4.62, 4.55,
4.13, 423, 4.48. Evidencian estos datos que el contenido promedio de grasa en los hombres es menor de 4.464? Considere
= 5% y tome = 0.4. Calcule el valor p.
43. Se espera que dos operarios produzcan en promedio el mismo nmero de unidades terminadas en el mismo tiempo. Los
siguientes datos dan los nmeros de las unidades terminadas para ambos trabajadores en una semana de trabajo.
Operador 1 Operador 2
10 12
9 16
16 16
14 15
11 14
Si supone que el nmero de unidades terminadas diariamente por los trabajadores son variables aleatorias independientes
distribuidas normalmente con varianzas iguales, puede concluirse alguna diferencia entre las medias? Tome = 5%.

77
B
A
I
N

0
5
2
.

E
S
T
A
D

S
T
I
C
A

P
R
O
B
A
B
I
L
I
D
A
D

P
A
R
A

I
N
G
E
N
I
E
R

D
r
.

c
t
o
r

F
i
g
u
e
r
o
a

A
r
c
i
l
a
.

44. Las siguientes son las distancias en metros que cierto animal se aleja de su morada: 194, 202, 335, 515, 184, 369, 142, 552,
200, 344, 421, 590, 301, 439. podemos concluir que la distancia promedio en que se aleja es mayor de 338?. Suponga que
= 149 y tome = 5%.
45. Pruebe la hiptesis segn la cual el contenido promedio de un aceite comestible es de 5 litros. Si los contenidos de una muestra
aleatoria de 10 recipientes son: 5.2, 4.7, 5.3, 5.1, 4.8, 4.9, 5.4, 5.3, 4.8. Utilice un nivel de significacin de = 1% y suponga
que la distribucin de los contenidos es normal. Calcule el valor p para dicho nivel.
46. Se desea comparar dos mtodos para ensear estadstica. Para ello se tomaron 10 pares de estudiantes del mismo nivel de
aprovechamiento en estadstica. De cada par a uno se asigna al azar al mtodo A y el otro al mtodo B. Despus de un periodo
de cuatro semanas, cada estudiante se someti a un examen, con las puntuaciones siguientes:
Par 1 2 3 4 5 6 7 8 9 10
Mtodo A 36 37 41 42 36 35 42 33 40 38
Mtodo B 35 35 42 41 36 34 40 31 39 37
Proporcionan estos datos suficiente evidencia como para indicar que los niveles medios de aprovechamiento de los mtodos
son distintos? Sea = 5%.
47. Los siguientes datos son los tiempos que tardan dos grupos de estudiantes para responder a un examen de estadstica.
Grupo Tiempo mnimo
1 100 84 96 107 89
2 79 163 95 132 91 85
Considere que se trata de poblaciones normales de igual varianza y pruebe que el tiempo de duracin promedio para
responder el examen del grupo 1 es mayor que el promedio del grupo 2. Tome = 2%.
48. Los siguientes datos corresponden a los dimetros de dos muestras de arandelas producidas por dos mquinas
distintas.
Muestra 1 0.91 1.82 1.46 1.95 1.57 1.61 1.32
Muestra 2 1.03 1.99 1.65 2.07 1.66 1.76 1.28 2.01
Considere que los dimetros se distribuyen normalmente y que las varianzas respectivas son
2
1
= 0.12 y
2
2

= 0.13. Evidencian estos datos que los dimetros promedios de las arandelas producidas por las dos mquinas
son iguales? Tome = 5%.
49. Cinco personas con exceso de peso se pusieron a dieta durante tres meses. Fueron observados sus pesos al
comienzo y al final de la dieta. Estos se muestran en la tabla que sigue:
Individuo 1 2 3 4 5
Peso inicial 295 305 323 299 310
Peso final 251 259 267 265 263
Se puede concluir segn estos datos que la dieta es efectiva? Tome = 10%.
50. Suponga que se tienen dos poblaciones X, Y independientes, distribuidas normalmente y de igual varianza. De
cada una de estas poblaciones se extrae una muestra. En la tabla que sigue se dan los resultados.


Poblacin Media Desviacin estndar Tamao de muestra
X 4.52 1.4 5
Y 5.31 1.95 23
Se puede concluir, a partir de estos datos, que
x y
es mayor de 1? Tome = 5%.

78
U
N
I
D
A
D

D
E

A
P
R
E
N
D
I
Z
A
J
E

I
I
I
:

I
N
F
E
R
E
N
C
I
A

E
S
T
A
D

S
T
I
C
A

M
a
y
o

d
e

2
0
1
1

51. Suponga que la varianza de los cuocientes intelectuales de los estudiantes de enseanza secundaria media en una ciudad es
de 225. Una muestra aleatoria de 25 estudiantes arroja un cuociente intelectual de 106. Se puede concluir a partir de estos
datos que el cociente intelectual medio de los estudiantes es superior a 100? Tome = 5%.
52. Una muestra aleatoria de tamao n1 = 25, tomada de una poblacin normal con desviacin estndar de
1
= 4.8, tiene una
media
1
x = 75. Una segunda muestra aleatoria de tamao n2 = 36, tomada de una poblacin normal diferente con desviacin
estndar
2
= 3.5, tiene media
2
x = 70. Pruebe la hiptesis de
2 1
= , en contraposicin a la alternativa
2 1
> .
Tome % 5 = .
53. Se conduce una prueba sobre la potencia de friccin producida por ciertas mquinas lubricadas con dos aceites comerciales.
Los resultados fueron:
Marca 1 Marca 2
n1 = 9 n2 = 11
4 . 10
1
= x
2
x = 14.1
00 . 1
2
1
= S 9 . 0
2
2
= S
Considere que se trata de poblaciones normales con igual varianza. Evidencian estos datos que las potencias
promedios son iguales?. Tome % 2 = .
Seccin 3:
54. En una encuesta de 10.000 electores tomados al azar entre todos los votantes de una ciudad se encuentra que 5.180 estn a
favor de cierto candidato. Probar la hiptesis de que la proporcin de todos lo electores que estn a favor del candidato en
mencin es igual o menor al 50%. Sea %. 5 =
55. Se afirma que un dispensador de gaseosas est fuera de control si la varianza de los contenidos excede de 1.0 decilitros. Si
una muestra aleatoria de 16 vasos despachados por este dispensador dio una varianza muestral de 1.9 decilitros. qu puede
decirse del mismo acerca de si est bajo control? Sea % 5 = .
56. Con referencia al problema 49 de la Seccin 2. Proporcionan estos datos una igualdad entre las varianzas?.
57. Se sabe que el contenido de nicotina de una marca de cigarrillos tiene distribucin normal con varianza de 1.3 miligramos.
Pruebe la hiptesis de que . 3 . 1
2
= Si una muestra aleatoria que 8 de estos cigarrillos tiene una desviacin estndar S =
1.8. Use %. 5 =
58. En un estudio diseado para conocer los efectos secundarios de dos medicamentos a 100 animales se les administro el
medicamento A y a otros 100 el medicamento B. De los 100 que recibieron el medicamento A, 20 mostraron efectos
secundarios mientras que 15 de los que recibieron el medicamento B reaccionaron en forma similar. Evidencian estos datos
una diferencia entre las dos proporciones de los que tuvieron efectos secundarios? Sea %. 5 =
59. Con referencia al problema 51 de la Seccin 2. proporcionan estos datos una evidencia de que 16 . 0
2
= ?. Tome
%. 5 =
60. Se cree que al menos el 60% de los habitantes de una gran ciudad est a favor del adelanto de la hora local en 30 minutos. Se
tom una muestra de 200 habitantes de esta ciudad y 110 estuvieron de acuerdo en el adelanto. Qu puede decirse, segn
estos datos, del porcentaje real de los que estn a favor? Tome = 2%.
61. Se compara el nivel de colesterol en la sangre de pacientes seleccionados al azar y sometidos a dos dietas distintas; una baja
en grasa y la otra normal. Las varianza y tamaos de muestra se dan a continuacin.

Baja en grasas
198
2
1
= S 19
1
= n
Normal
435
2
2
= S 24
2
= n
Proporcionan estos datos suficiente evidencia que indique una diferencia en la variabilidad de las dos poblaciones de donde
se obtuvieron las muestras?. Tome %. 10 =
62. Una firma fabricante de detergentes elabora dos marcas. Si se encuentra que 56 amas de casa de 200 consultadas prefieren la
marca A; y que 29 de 150 la marca B. Es esto evidencia suficiente para sostener que la marca A es preferida a la B ?. Sea
%. 1 =

79
B
A
I
N

0
5
2
.

E
S
T
A
D

S
T
I
C
A

P
R
O
B
A
B
I
L
I
D
A
D

P
A
R
A

I
N
G
E
N
I
E
R

D
r
.

c
t
o
r

F
i
g
u
e
r
o
a

A
r
c
i
l
a
.

63. Se realiz una encuesta para determinar la diferencia que puede existir entre las fracciones de casados y solteros entre 20 y 30
aos que fuman. Se entrevistaron 200 personas de cada grupo y se encontraron 64 casados y 80 solteros que fuman.
Contienen los datos suficiente evidencia que indique que existe una diferencia entre las dos fracciones de fumadores para las
dos poblaciones?. Sea %. 10 =
64. Dos mquinas diferentes A y B se utilizan para producir pernos idnticos que se suponen de 2 pulgadas de longitud. Se toman
dos muestras aleatorias de 25 pernos cada una de la produccin de ambas mquinas y arrojan dos varianzas 03 . 0
2
1
= S
pulgadas para la mquina A, y
2
1
S = 0.04 pulgadas para la mquina B. Evidencian estos datos que las varianzas son iguales?
Tome % 5 = .
65. La desviacin estndar de cierto proceso de produccin es de 4 pulgadas. Se sospecha que la varianza se ha hecho demasiado
grande. Se toma una muestra de 9 partes producidas en dicho proceso y sus medidas son: 5, 7, 2, 4, 8, 9, 8, 6 y 5 pulgadas.
Pruebe la hiptesis de que el proceso conserva an la varianza . 4
2
= sea %. 1 =

80
U
N
I
D
A
D

D
E

A
P
R
E
N
D
I
Z
A
J
E

I
I
I
:

I
N
F
E
R
E
N
C
I
A

E
S
T
A
D

S
T
I
C
A

M
a
y
o

d
e

2
0
1
1

ANEXO 1
Tabla1:Estadsticaspivotalesparalaconstruccindeintervalosdeconfianzarelacionadosconmedias,varianzasy
proporciones.
INTERVALO DE CONFIANZA PARA: VALOR DE LA ESTADSTICA PIVOTAL

con
2
conocido

2
desconocido y n > 30

2
desconocido y n 30

1 - 2
con
2
1
y
2
2
conocidos

1 - 2
con
2
1
y
2
2
desconocidos; muestras
aleatorias independientes de tamaos n1 y n2,
ambos mayores que 30 (n
1
> 30
y
n
2
> 30)

1 - 2
con
2
1
y
2
2
desconocidos pero
aproximadamente iguales. Muestras aleatorias
pequeas independientes de tamaos n1 y n2
(n
1
30

y/o

n
2
30)

1 - 2
con
2
1
y
2
2
desconocidos y distintos.
Muestras aleatorias pequeas independientes
de tamaos n
1
y n
2
(n
1
30

y/o

n
2
30

D
Muestras pareadas

N(0,1)
n
-
=

x
Z
2) -
2
n
1
t(n
2
n
1
1
n
1
p
S
)
2
-
1
( - )
2
x -
1
x (
+
+
= t
) t(
2
n
2
2
S
1
n
2
1
S
)
2
-
1
( - )
2
x -
1
x (
t
+
=
1) - t(n
2
d
S
- d
t =
n
D

1) - t(n
n
-
=
S
x
t

) 1 , 0 (
2
n
2
2
1
n
2
1
)
2
-
1
( - )
2
x -
1
x (
Z N
+
=

) 1 , 0 (
2
n
2
2
1
n
2
1
)
2
-
1
( - )
2
x -
1
x (
Z N
S S

+
=
2
1 1
2
2
2
2
2
2
1
1
2
1
2
2
2
2
1
2
1

+
=
n
n
S
n
n
S
n
S
n
S

2 n n
1)S (n 1)S (n
S
2 1
2
2 2
2
1 1 2
p
+
+
=
N(0,1)
n
-
=
S
x
Z

81
B
A
I
N

0
5
2
.

E
S
T
A
D

S
T
I
C
A

P
R
O
B
A
B
I
L
I
D
A
D

P
A
R
A

I
N
G
E
N
I
E
R

D
r
.

c
t
o
r

F
i
g
u
e
r
o
a

A
r
c
i
l
a
.

Tabla 1: Estadsticas pivotales para la construccin de intervalos de confianza relacionados con medias,
varianzas y proporciones (Continuacin).
INTERVALO DE CONFIANZA PARA: VALOR DE LA ESTADSTICA PIVOTAL

2
2
2
1
/

2 1
p p






) 1 (
2
2
S 1) - (n

2 2
= n

) 1
2
n , 1
1
F(n

2
2
2
1
2
1
S
2
2
F =
S

N(0,1)
n
) p (1 p
p - p
P

=
N(0,1)
2
2
q
2
p
1
1
q
1
p
)
2
p -
1
(p )
2
p -
1
p (

+

=
n n
Z

82
U
N
I
D
A
D

D
E

A
P
R
E
N
D
I
Z
A
J
E

I
I
I
:

I
N
F
E
R
E
N
C
I
A

E
S
T
A
D

S
T
I
C
A

M
a
y
o

d
e

2
0
1
1

ANEXO 2
Tabla 2: Pruebas relacionadas con medias, varianzas y proporciones
H
0
VALOR DE LA ESTADSTICA DE
PRUEBA
H
1
REGIN CRTICA
= 0 < 0
z < -z


> 0
z > z



0
z < -z
/2
y z > -z
/2

= 0

2
desconocodo y n 30



< 0
t < -t


>
0

t > t


0 t < -z
/2 y z > -t
/2
=
0

2
desconocodo y n < 30




<
0

t < -t


>
0

t > t


0 t < -z
/2 y z > -t
/2
1 - 2 = d0
con
2
1
y
2
2
conocidos







1 - 2 < d0

z < -z



1 - 2 > d0

z > z

1
-
2
d
0


z < -z
/2
z > -z
/2

1
-
2
= d
0
con
2
1
y
2
2
desconocidos; muestras
aleatorias independientes de tamaos n
1
y n2, ambos mayores que 30 (n1> 30 y n2
> 30)

1 - 2 < d0

z < -z

1
-
2
> d
0


z > z



1 - 2 d0

z < -z
/2 z > -z
/2

1
-
2
= d
0
con
2
1
y
2
2
desconocidos pero
aproximadamente iguales. Muestras
aleatorias pequeas independientes de
tamaos n1 y n2 (n1 30 y/o n2 30)

1
-
2
< d
0

t < -t

1
-
2
> d
0

t > t

1
-
2
d
0

t < -z
/2
y z > -t
/2

N(0,1)
n
-
=

x
Z
N(0,1)
n
-
=
S
x
Z

) 1 , 0 (
2
n
2
2
1
n
2
1
)
2
-
1
( - )
2
x -
1
x (
Z N
+
=

2) -
2
n
1
t(n
2
n
1
1
n
1
p
S
)
2
-
1
( - )
2
x -
1
x (
+
+
= t
1 n n
1)S (n 1)S (n
S
2 1
2
2 2
2
1 1 2
p
+
+
=
) 1 , 0 (
2
n
2
2
1
n
2
1
)
2
-
1
( - )
2
x -
1
x (
Z N
S S

+
=
-1) t(n
n
-
=
S
x
t

83
B
A
I
N

0
5
2
.

E
S
T
A
D

S
T
I
C
A

P
R
O
B
A
B
I
L
I
D
A
D

P
A
R
A

I
N
G
E
N
I
E
R

D
r
.

c
t
o
r

F
i
g
u
e
r
o
a

A
r
c
i
l
a
.

Tabla 2: Pruebas relacionadas con medias, varianzas y proporciones (Continuacin).


1
-
2
= d
0
con
2
1
y
2
2
desconocidos y
distintos. Muestras aleatorias pequeas
independientes de tamaos n
1
y n
2
(n
1

30 y/o n2 30







1
-
2
< d
0

t < -t

1
-
2
> d
0

t > t

1
-
2
d
0


t < -z
/2
y z > -t
/2



D = d0
Muestras pareadas




D
< d
0

t < -t

D
> d
0 t > t


D d0 t < -z
/2 y z > -t
/2

2
0
2
=



2
0
2
<
2 2

<
2
0
2
>
2 2

>
2
0
2

2 2
2

< y
2 2
2

>


2
2
2
1
=





2
2
2
1
<
2 2

f f <
2
2
2
1
>
2 2

f f >
2
2
2
1

2 2
2

f f < y
2 2
2

f f >

p = p
0




p<p
0

z < -z


p>p
0

z < -z


pp
0

z < -z
/2
z > -z
/


p
1
p
2
= d
0






p
1
p
2
<d
0


z < -z


p
1
p
2
>d
0


z > z


p
1
p
2
d
0

z < -z
/2
z > -z
/2



) t(
2
n
2
2
S
1
n
2
1
S
)
2
-
1
( - )
2
x -
1
x (
t
+
=
2
1 1
2
2
2
2
2
2
1
1
2
1
2
2
2
2
1
2
1

+
=
n
n
S
n
n
S
n
S
n
S

1) - t(n
2
d
S
- d
t =
n
D

) 1 (
2
2
S 1) - (n

2 2
= n

) 1
2
n , 1
1
F(n

2
2
2
1
2
1
S
2
2
F =
S

N(0,1)
n
) p (1 p
p - p
P

=
N(0,1)
2
2
q
2
p
1
1
q
1
p
)
2
p -
1
(p )
2
p -
1
p (

+

=
n n
Z

S-ar putea să vă placă și