Inferencia Estadistica 2 Guillermo Ramirez

INFERENCIA ESTADISTICA
Guillermo Ramirez, Adelmo Fernández y Maura Vásquez*

2012
*
Escuela de Estadı́stica y Ciencias Actuariales de la Universidad Central de Venezuela
Índice general
2. Estimación por intervalo 45

2.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
2.2. Métodos de obtención de intervalos de confianza . . . . . . . . 48
2.2.1. Método de la cantidad pivotal . . . . . . . . . . . . . . 48
2.2.2. Método del estadı́stico . . . . . . . . . . . . . . . . . . 52
2.3. Intervalos de confianza en el caso de una población normal . . 55
2.3.1. Para la media . . . . . . . . . . . . . . . . . . . . . . . 55
2.3.2. Para la varianza . . . . . . . . . . . . . . . . . . . . . . 57
2.4. Intervalos de confianza en el caso de dos poblaciones normales 59
2.4.1. Para la diferencia de medias . . . . . . . . . . . . . . . 59
2.4.2. Para el cociente de varianzas . . . . . . . . . . . . . . . 62
2.5. Intervalos de confianza en el caso de
muestras grandes . . . . . . . . . . . . . . . . . . . . . . . . . 63
2.5.1. Distribución de Bernoulli . . . . . . . . . . . . . . . . . 63
2.5.2. Distribución de Poisson . . . . . . . . . . . . . . . . . . 63
2.5.3. Distribución Geométrica . . . . . . . . . . . . . . . . . 64
i
Capı́tulo 2
Estimación por intervalo
2.1. Introducción
En el capı́tulo anterior presentamos métodos para hallar estimadores,
definimos propiedades deseables para ellos y establecimos criterios para en-
contrar un “buen”estimador para un parámetro dado. Las estimaciones pun-
tuales proporcionadas por estos estimadores son muy útiles, pero resultan
insuficientes en el sentido de que no tienen asociadas una medida del posible
error que se comete en el proceso de estimación. No se tiene una idea clara
acerca de la distancia de esa estimación al verdadero valor del parámetro.
En el caso, por ejemplo, de un estimador insesgado de mı́nima varianza

sabemos que su distribución está centrada en θ, que su varianza es mı́nima
y que en promedio su valor estará cerca de θ. Hace falta, sin embargo, in-
troducir una medida de “confianza”en esa estimación, que obviamente debe
estar expresada en términos probabilı́sticos. Una manera de lograr esto es
hallando un intervalo alrededor de la estimación para el cual se conozca la
probabilidad de que contenga al parámetro. Este tipo de estimación se de-
nomina “estimación por intervalo”.
Al igual que en el caso de la estimación puntual nos debemos ocupar

de dos aspectos: primero encontrar estimadores tipo intervalo, y segundo
establecer criterios para determinar los mejores estimadores de este tipo.
45
Capı́tulo 2 Estimación por intervalo 46
Definicion 2.1 (Intervalo de confianza). Sea X1 , X2 , . . . Xn una muestra

aleatoria de una población f (x; θ). Se define como intervalo de confianza del
100r % para el parámetro τ (θ), al intervalo aleatorio I = (T1 , T2 ), donde T1
y T2 son estadı́sticos tales que:
i) P (T1 < T2 ) = 1
ii) P (T1 < τ (θ) < T2 ) = r donde r no depende de θ
A T1 y T2 se les denomina “lı́mites confidenciales”y a r se le denomina

“coeficiente de confianza”. Uno de los estadı́sticos T1 o T2 pudiera ser no
aleatorio, en cuyo caso se dice que se trata de intervalos unilaterales.
Es importante notar que cuando se obtiene un intervalo de confianza

para θ, puede hallarse fácilmente un intervalo de confianza para cualquier
función monótona τ (θ), ya que:
P (T1 < θ < T2 ) = P (τ (T1 ) < τ (θ) < τ (T2 )) = r si τ es creciente, y
P (T1 < θ < T2 ) = P (τ (T2 ) < τ (θ) < τ (T1 )) = r si τ es decreciente
La afirmación probabilı́stica P (T1 < θ < T2 ) debe leerse y entenderse

cuidadosamente. No debe interpretarse como la probabilidad de que θ tome
una valor entre T1 y T2 , sino como la probabilidad de que el intervalo (T1 , T2 )
contenga al parámetro. Por su parte, la confianza asociada con el intervalo
se interpreta en términos frecuentistas: si repitiésemos este procedimiento de
estimación un gran número de veces y construyésemos tantos intervalo de
confianza, aproximadamente el 100r % de estos intervalos contendrı́a a θ.
Resulta evidente el hecho de que un intervalo será más preciso mientras

su longitud sea menor, ya que da mayor información sobre el parámetro. En
ciertas ocasiones la longitud es una constante que depende de r y de n, en
cuyo caso trataremos de encontrar intervalos de mı́nima longitud. En otras
situaciones la longitud es aleatoria y se trata de hallar intervalos de mı́nima
longitud media.
Es importante advertir que las probabilidades que definen un intervalo

de confianza no son del tipo usual:
P (a < X < b) (Primer tipo)
que se calculan como FX (b) − FX (a), sino de la forma:
P (g(X) < a < h(X)) (Segundo tipo)
que habrı́a que convertir en una desigualdad del primer tipo para poder
evaluarla. El proceso de modificación de una desigualdad de un tipo para
convertirla en una desigualdad del otro tipo se denomina “pivoteo”.
Dos ideas importantes a tener en cuenta en este momento son las sigu-
ientes:
La longitud de un intervalo depende de la confianza r y del tamaño

muestral n.
Un intervalo de confianza será “mejor”mientras su longitud sea menor.
A continuación vamos a presentar algunos ejemplos en los cuales se da

un intervalo aleatorio, y se pide demostrar que es un intervalo de confianza
para un cierto parámetro.
Ejemplo 2.1. Sea X una muestra de tamaño 1 de una población exponencial

E(θ). Demuestre que I = (0, 1.61/X) es un intervalo de confianza para θ.
i) Como X > 0, resulta claro que 1.61X > 0.

(Más formalmente, P (1.61X > 0) = 1)
ii) P (0 < θ < 1.61/X) = P (0 < θX < 1.61) = P (0 < X < 1.61/θ) =
FX (1.61/θ) = 1 − e−1.61 = 1 − 0.20 = 0.80
que no depende de θ.
Ejemplo 2.2. Sea X1 , X2 , . . . X16 una muestra aleatoria de una población

normal N (θ, 16). Demuestre que I = (x̄ − 1.96, x̄ + 1.96) es un intervalo de
confianza para θ.
i) En primer lugar, resulta claro que x̄ − 1.96 < x̄ + 1.96

ii) P (x̄ − 1.96 < θ < x̄ + 1.96) = P (−1.96 < θ − x̄ < 1.96) =
P (−1.96 < x̄ − θ < 1.96) = φ(1.96) − φ(−1.96) = 2φ(1.96) − 1 = 0.95

uniforme U (0, θ). Demuestre que I = (Yn , 1.17Yn ) es un intervalo de confi-
anza para θ.
i) Como Yn > 0, entonces Yn < 1.17Yn
ii) P (Yn < θ < 1.17Yn ) = P (1 < θ/Yn < 1.17) = P (0.85 < Yn /θ < 1) =
P (0.85θ < Yn < θ) = 1 − FYn (0.85θ) = 1 − (0.85)n =
1 − 0.09 = 0.91
2.2. Métodos de obtención de intervalos de

confianza
En esta sección nos ocuparemos de dos métodos: el de la cantidad piv-
otal y el método estadı́stico.
2.2.1. Método de la cantidad pivotal

Definicion 2.2 (Cantidad pivotal). Sea X1 , X2 , . . . Xn una muestra aleatoria
de una población f (x; θ). Se define como cantidad pivotal a una función:
Q = q(X1 , X2 , . . . Xn ; θ)
cuya distribución no depende de θ.
Definicion 2.3 (Método de la cantidad pivotal). Sea X1 , X2 , . . . Xn una

muestra aleatoria de una población f (x; θ) y Q una cantidad pivotal. Si es
posible encontrar dos estadı́sticos T1 = t1 (X1 , X2 , . . . Xn ) y T2 = t2 (X1 , X2 , . . . Xn )
tales que:
P (q1 < Q < q2 ) = P (T1 < τ (θ) < T2 ) = r
donde r no depende de θ, entonces I = (T1 , T2 ) es un intervalo de confianza
del 100r % para τ (θ).
Para un valor fijo de r existen diferentes valores de q1 y q2 que cumplen

P (q1 < Q < q2 ) = r, los cuales darán lugar a diferentes intervalos de con-
fianza. Escogeremos aquéllos que hagan mı́nima la longitud del intervalo
L = T2 − T1 .
En el caso de poblaciones continuas estos se logra derivando respecto

de q2 (o de q1 ), haciendo uso de que:
d fQ (q2 )
(q1 ) =
dq2 fQ (q1 )
En efecto, como en el caso continuo:
Z q2
P (q1 < Q < q2 ) = fQ (q)dq = r
q1
entonces, al derivar respecto de q2 :

Z q2
d
fQ (q)dq = 0 ⇒
dq2 q1
Z q2
d d d
fQ (q2 ) (q2 ) − fQ (q1 ) (q1 ) + fQ (q)dq = 0 ⇒
dq2 dq2 q1 dq2
d
fQ (q2 ) = fQ (q1 ) (q1 ) ⇒
dq2
d fQ (q2 )
(q1 ) =
dq2 fQ (q1 )
Los pasos a seguir entonces para hallar un intervalo de confianza uti-

lizando este método son los siguientes:
1. Hallar una cantidad pivotal Q = q(X1 , X2 , . . . Xn ; θ).

(preferiblemente basada en un buen estimador de τ (θ))
2. Pivotear la desigualdad inicial q1 < Q < q2 hasta convertirla en

T1 < τ (θ) < T2 , donde T1 y T2 dependen de q1 y q2 .
3. Minimizar la longitud del intervalo. Es decir, hallar q1 y q2 que hagan

mı́nima la diferencia L = T2 − T1 . Tómese en cuenta que la variación
de q1 y q2 depende de la cantidad pivotal que se haya seleccionado.
Ejemplo 2.4. Sea X una muestra de tamaño 1 de una población exponencial

E(θ). Halle un intervalo de confianza del 100r % para θ.
1. En este caso una cantidad pivotal es Q = q(X; θ) = θX, ya que su

función de densidad:
fQ (q) = fX (q/θ)(1/θ) = e−q q > 0 (E(1))
no depende de θ.
2. Pivoteando:
q1 < Q < q2 ⇒ q1 < θX < q2 ⇒ q1 /X < θ < q2 /X ⇒
I = [q1/X; q2 /X] es un intervalo de confianza del 100r % para θ.
3. Debemos hallar q1 y q2 que minimicen la longitud:

L = q2 /X − q1 /X = (1/X)(q2 − q1 )
Para ello derivamos respecto de q1 :
d d fQ (q1 )
L = (1/X) ( q2 − 1) = (1/X) ( − 1)
dq1 dq1 fQ (q2 )
e−q1
= (1/X) ( −q2 − 1) = (1/Xe−q2 ) (e−q1 − e−q2 )
e
que es positiva, lo que quiere decir que L es una función creciente en
q1 y por tanto su mı́nimo se halla en el mı́nimo valor de q1 que es cero.
Para hallar el correspondiente valor de q2 hacemos uso de:
Z q2
P (q1 < Q < q2 ) = e−q dq = 1 − e−q2 = r
0
de donde q2 = −log(1 − r), ası́ que el intervalo de confianza del 100r %

para θ de mı́nima longitud es:
−log(1 − r)
I = 0;
X
Nótese que si r = 0.80, se obtiene el intervalo del ejemplo 2.1.

normal N (θ, 16). Halle un intervalo de confianza del 100r % para θ.
1. Una cantidad pivotal es Q = q(X1 , X2 , . . . Xn ; θ) = q(X̄; θ) = X̄ − θ,

ya que sigue una distribución normal N (0, 1), que no depende de θ.
2. Pivoteando:
q1 < Q < q2 ⇒ q1 < X̄ − θ < q2 ⇒ q1 − X̄ < −θ < q2 − X̄

⇒ X̄ − q2 < θ < X̄ − q1
⇒ I = [X̄ − q2 ; X̄ − q1 ] es un intervalo de confianza del 100r % para θ.
3. Hallaremos q1 y q2 que minimicen la longitud L = q2 − q1

Para ello derivamos respecto de q2 :
d d fQ (q2 )
L = (1 − q1 ) = (1 − )
dq2 dq2 fQ (q1 )
Al igualar a cero se obtiene que fQ (q2 ) = fQ (q1 ), en cuyo caso, por la

simetrı́a de fQ , se tiene que q2 = −q1 = z(1+r)/2 . Si r = 0.95, se obtiene
el intervalo del ejemplo 2.2.

uniforme U (0, θ). Halle un intervalo de confianza del 100r % para θ.
1. Una cantidad pivotal es:

Q = q(X1 , X2 , . . . Xn ; θ) = q(Yn ; θ) = Yn /θ, ya que su función de den-
sidad:
fQ (q) = fYn (θq)(θ) = nq n−1 0 < q < 1 (Beta B(n,1))
no depende de θ.
2. Pivoteando:
q1 < Q < q2 ⇒ q1 < Yn /θ < q2 ⇒ 1/q2 < θ/Yn < 1/q1

⇒ Yn /q2 < θ < Yn /q1
⇒ I = [Yn /q2 ; Yn /q1 ]
es un intervalo de confianza del 100r % para θ.

3. Debemos hallar q1 y q2 que minimicen la longitud:

L = Yn /q1 − Yn /q2 = Yn (1/q1 − 1/q2 )
Si derivamos respecto de q2 :
d 1 fQ (q2 ) 1 1 nq2n−1 ) 1
L = Yn (− 2 + 2 ) = Yn (− 2 n−1 + 2 )
dq2 q1 fQ (q1 ) q2 q1 nq1 ) q2
Yn
= 2 n+1 (q1n+1 − q2n+1 )
q2 q1
que es negativa, lo que quiere decir que L es una función decreciente
en q2 y por tanto su mı́nimo se halla en el máximo valor de q2 que es
uno. Para hallar el correspondiente valor de q1 hacemos uso de:
Z 1
P (q1 < Q < q2 ) = nq n−1 dq = 1 − q1n = r
q1
√
de donde q1 = n 1 − r, ası́ que el intervalo de confianza del 100r % para
θ de mı́nima longitud es:
Yn
I = Yn ; √
n
1−r
Si r = 0.91, se obtiene el intervalo del ejemplo 2.3.
2.2.2. Método del estadı́stico

Un método alternativo al de la cantidad pivotal lo constituye el método
del estadı́stico, denominado ası́ porque el punto de partida en el proceso
de construcción del intervalo es un estadı́stico y su función de densidad. Se
demuestra que los intervalos de menor longitud se obtienen cuando se utilizan
estadı́sticos suficientes.
Definicion 2.4 (Método del estadı́stico). Sea X1 , X2 , . . . Xn una muestra
aleatoria de una población f (x; θ) y T un estimador de θ (preferiblemente
suficiente). Sea fT la función de densidad de T y t0 el valor observado de
T . El intervalo I = (v1 , v2 ) es un intervalo de confianza del 100r % para θ,
donde v1 y v2 se obtienen resolviendo para θ cada una de las ecuaciones:
FT (t0 ; θ) = p1
1 − FT (t0 ; θ) = p2
Para un valor fijo de r existen diferentes valores de p1 y p2 tales que r =

1 − p1 − p2 , los cuales darán lugar a diferentes intervalos de confianza. Se
escogerán aquéllos que minimicen la longitud del intervalo L = v2 − v1 . En
el caso de poblaciones continuas esto se logra derivando respecto de p2 (o de
p1 ), y haciendo uso de que 0 ≤ p1 , p2 ≤ 1 − r.
Ejemplo 2.7. Sea X una muestra aleatoria de tamaño 1 de una población
exponencial E(θ). Halle un intervalo de confianza del 100r % para θ por el
método estadı́stico.
El estimador máximo verosı́mil en este caso es T = X, su función de
densidad es fT (t; θ) = θe−θ y su función de distribución FT (t; θ) = 1 − e−θt .
Resolvemos para θ las ecuaciones básicas:
FT (t0 ; θ) = 1 − e−θt0 = p1 ⇒ e−θt0 = 1 − p1

⇒ −θt0 = log(1 − p1 )
⇒ θ = −log(1 − p1 )/t0
⇒ θ = −log(p2 + r)/t0 = v1
1 − FT (t0 ; θ) = e−θt0 = p2 ⇒ −θt0 = log(p2 )
⇒ θ = −log(p2 )/t0 = v2
ası́ que I = [−log(p2 + r)/t0 ; −log(p2 )/t0 ] es un intervalo de confianza del

100r % para θ.
La longitud: L = (log(p2 + r) − log(p2 ))/t0 .
Si derivamos respecto de p2 :
d 1 1 −r
L = (1/t0 ) ( − ) = (1/t0 ) ( )
dp2 p2 + r p 2 p2 + r
que es negativa, lo que quiere decir que L es una función decreciente en p2 y
por tanto alcanza su mı́nimo en el máximo valor de p2 que es 1 − r, en cuyo
caso p1 = 0.
Ası́ que el intervalo de confianza del 100r % para θ de mı́nima longitud

es:
−log(1 − r)
I = 0;
t0
intervalo que coincide con el obtenido en el ejemplo 2.4.
Ejemplo 2.8. Sea X1 , X2 , . . . Xn una muestra aleatoria de una población

uniforme U (0, θ). Halle un intervalo de confianza del 100r % para θ por el
método estadı́stico.
Sabemos ya que T = Yn es el estimador máximo verosı́mil, que es
suficiente y que su función de densidad viene dada por:
ntn−1
fT (t; θ) = I(0,θ) (t)
θn
Para un valor fijo de r existen valores de p1 y p2 tales que:
t0 t0
ntn−1 tn0
Z Z
fT (t; θ)dt = n
dt = = p1
−∞ −∞ θ θn
Z ∞ Z ∞ n−1
nt tn0
fT (t; θ)dt = dt = 1 − = p2
t0 t0 θn θn
de donde:
t0
θ= √
n p
= v1
1
y:
t0 t0
θ= √ = √ = v2
n
1 − p2 n
p1 + r
por lo tanto:
t0 t0
I= √ ; √
n
p1 + r n p1
es un intervalo de confianza del 100r % para θ1 .
Escogeremos el valor de p1 que minimice la longitud:

t0 t0
L= √ n p
− √
1
n
p1 + r
Si derivamos respecto de p1 :
d d −1/n
− (p1 + r)−1/n

L = t0 p1
dp1 dp1
t0 1 1
= p − p
n n (p1 + r)n+1 n
pn+1
1
1
Nótese que se han invertido los lı́mites ya que en este caso v2 < v1 .
que es negativa, lo que quiere decir que L es una función decreciente en p1 y

por tanto su mı́nimo valor se hallará en el máximo valor de p1 que es 1 − r,
en cuyo caso p2 = 0. Ası́ que el intervalo de confianza del 100r % para θ de
mı́nima longitud es:
t0
I = t0 ; √n
1−r
intervalo que coincide con el obtenido en el ejemplo 2.6.
2.3. Intervalos de confianza en el caso de una

población normal
En las secciones 2.3.1 y 2.3.2 consideraremos una muestra aleatoria
X1 , X2 , . . . Xn de una población con distribución normal N (µ, σ 2 ) y hallare-
mos intervalos de confianza para µ y para σ 2 , utilizando el método de la
cantidad pivotal.
2.3.1. Para la media

Conocida la varianza
En este primer caso se utiliza la cantidad pivotal:
x̄ − µ
Q = q(x̄, µ) = √ ∼ N (0, 1)
σ/ n
y se obtiene el intervalo del 100r % para µ, y de mı́nima longitud:
σ
I = [ x̄ ± Z 1+r √ ]
2 n
Obsérvese que la longitud de este intervalo es:
σ
L = 2Z 1+r √ (que es un número)
2 n
de donde podemos despejar n:
4σ 2 2
n= Z 1+r
L2 2
obteniéndose el tamaño muestral requerido para que la longitud sea igual a

un valor particular L.
Desconocida la varianza
En este caso se utiliza la cantidad pivotal:
x̄ − µ
Q = q(x̄, µ) = √ ∼ tn−1
s/ n
y se obtiene el intervalo del 100r % para µ, y de mı́nima longitud promedio:
s
I = [ x̄ ± tn−1; 1+r √ ]
2 n
La longitud del intervalo:
s
L = 2tn−1; 1+r √ (que es una variable aleatoria)
2 n
No puede despejarse ahora n, pero puede hallarse la probabilidad de que en
una muestra de tamaño n obtengamos un intervalo de longitud menor a un
determinado múltiplo de σ:
s
P (L < aσ) = P (2tn−1; 1+r √ < aσ)
2 n
√
s a n
= P( < )
σ 2tn−1; 1+r
2
s2 na2
= P( 2 < 2 )
σ 4tn−1; 1+r
2
2
(n − 1)s n(n − 1)a2
= P( < )
σ2 4t2n−1; 1+r
2
n(n − 1)a2
= P (χ2n−1 < )
4t2n−1; 1+r
2
Ejemplo 2.9. Supóngase que la duración en horas de un componente eléctri-

co es una variable aleatoria con distribución normal N (µ, σ = 500). Se se-
lecciona una muestra aleatoria de 25 componentes y se obtiene un promedio
de x̄ = 1832.
i) Halle un intervalo de confianza del 95 % para µ.
En este caso: n = 25, σ = 500, r = 0,95, Z 1+r = Z0,975 = 1,96
2
Sustituyendo: I = [1832 ± 196] = [1636; 2028]
La longitud: L = 392
ii) ¿Cuál deberı́a ser el tamaño de la muestra para reducir la longitud del
intervalo a 300?
4(500)2
n= (1, 96)2 = 43
(300)2
iii) Supóngase ahora que σ fuese desconocida, y se hubiese hallado s = 497.

En este caso: tn−1;(1+r)/2 = t24;0.975 = 2.064
al sustituir: I = [1832 ± 205.16] = [1626.85; 2037.15]
iv) ¿Cuál es la probabilidad de que en una muestra de tamaño 25 se obtenga

un intervalo del 95 % para µ, de longitud menor que 0.8σ?
P (L < 0.8σ) = P (χ224 < 22.54) = 0.4527
2.3.2. Para la varianza

La cantidad pivotal en este caso:
(n − 1)s2
Q = q(s2 , σ 2 ) = ∼ χ2n−1
σ2
y se obtiene el intervalo del 100r % para σ 2 :
(n − 1)s2 (n − 1)s2
I= ;
χ2n−1; 1+r χ2n−1; 1−r
2 2
Resulta obvio que si tomamos raı́z cuadrada en ambos extremos obten-

emos un intervalo para σ. La longitud de ese intervalo:
√ 1 1
L=s n−1 q −q
χ2n−1; 1−r χ2n−1; 1+r
2 2
Ası́ que en este caso también puede hallarse la probabilidad de que en

una muestra de tamaño n obtengamos un intervalo de longitud menor a tan-
tas veces σ:
1 1 √
P (L < aσ) = P ( q −q s n − 1 < aσ)
χ2n−1; 1−r χ2n−1; 1+r
2 2
√ s 1 1 −1
= P ( n − 1 < a( q −q
σ χ2
χ2n−1; 1+r
n−1; 1−r
2 2
2
(n − 1)s 1 1 −2
= P( 2
< a2 ( q −q
σ χ2 χ2n−1; 1+r
n−1; 1−r
2 2
1 1 −2
= P (χ2n−1 < a2 ( q −q
χ2n−1; 1−r χ2n−1; 1+r
2 2
Ejemplo 2.10. Consideremos el mismo ejemplo anterior, pero asumiendo σ

desconocida.
i) Halle un intervalo de confianza del 95 % para σ 2 .

En este caso: n = 25, r = 0.95, s = 497, χ2n−1; 1+r = χ224;0.975 = 39.364
2
χ2n−1; 1−r = χ224;0.025 = 12.401
2
Sustituyendo, el intervalo de confianza para σ 2 :
I = [150599.58; 478037.90]
Para σ:
I = [388.07; 691.40]
La longitud:
L = 303.33
ii) ¿Cuál es la probabilidad de que en una muestra de tamaño 25 obteng-

amos un intervalo del 95 % para σ, de longitud menor que 0.5σ?
P (L < 0.5σ) = P (χ224 < 16.108) = 0.1158
Al igual que antes, existen tablas que permiten obtener el valor de n

necesario para asegurar con cierta probabilidad que la longitud del intervalo
para σ sea menor que aσ.
2.4. Intervalos de confianza en el caso de dos

poblaciones normales
2.4.1. Para la diferencia de medias
Consideraremos aquı́ dos casos según se trate de dos muestras indepen-
dientes o de muestras apareadas.
Muestras independientes
Dadas dos muestras independientes X1 , X2 , ...Xm y Y1 , Y2 , ...Yn de las
poblaciones normales N (µx , σx2 ) y N (µy , σy2 ) respectivamente, nuestro obje-
tivo es hallar un intervalo de confianza para la diferencia de medias µx − µy .
Distinguiremos dos casos según sean conocidas o no las varianzas.
Conocidas las varianzas

La cantidad pivotal:
(x̄ − ȳ) − (µx − µy )
Q = q(x̄ − ȳ, µx − µy ) = q ∼ N (0, 1)
σx2 σy2
m
+ n
obtieniéndose el intervalo:
r
σx2 σy2
I = [ (x̄ − ȳ) ± Z 1+r + ]
2 m n
Si las varianzas fuesen iguales:
r
1 1
I = [ (x̄ − ȳ) ± Z 1+r σ + ]
2 m n
Desconocidas las varianzas
Si asumimos que las varianzas desconocidas son iguales, la cantidad pivotal
adecuada:
(x̄ − ȳ) − (µx − µy )
Q = q(x̄ − ȳ, µx − µy ) = q ∼ tm+n−2
sp m1 + n1
siendo s2p la varianza combinada (pooled):

(m − 1)s2x + (n − 1)s2y
s2p =
m+n−2
El intervalo queda:
r
1 1
I = [ (x̄ − ȳ) ± tm+n−2; 1+r sp + ]
2 m n
Si se asume que las varianzas desconocidas son diferentes, sólo se dispone del
siguiente intervalo aproximado propuesto por Welch:
r
s2x s2y
I = [ (x̄ − ȳ) ± tg; 1+r + ]
2 m n
donde los grados de libertad de la distribución t:
(a + b)2
g= a2 b2
−2
m−1
+ n−1
siendo a = s2x /m y b = s2y /n

Ejemplo 2.11. Una compañı́a de transporte debe decidir cuál de dos marcas
de cauchos, A o B, compra para sus vehı́culos. Para ello experimenta con 16
cauchos de cada marca, probándolos bajo condiciones semejantes hasta que
se desgastan. Los resultados obtenidos fueron:
marca A: x̄ = 26000 kms, sx = 4200 kms
marca B: x̄ = 25000 kms, sx = 2800 kms
Halle un intervalo de confianza del 95 % para la diferencia de medias µx −µy .
¿Qué se puede concluir?
Si suponemos que el total de kilómetros recorridos por un neumático de
cada una de las marcas hasta que se desgasta es una variable aleatoria con
distribución normal, que las muestras se seleccionan en forma independiente
y que las varianzas son desconocidas pero iguales, tenemos que un intervalo
de confianza del 95 % para la diferencia de medias viene dado por:
r
1 1
I = [ (x̄ − ȳ) ± tm+n−2;0.975 sp + ]
m n
Como además m = n = 16:
s2x + s2y
s2p = = 12740000 ⇒ sp = 3569, 31
2
y:
tm+n−2;0.975 = t30;0.975 = 2.042
entonces:
I = [1000 ± 2577.23]
= [−1577.23; 3577.23]
Como este intervalo contiene al cero, podemos concluir que no hay difer-
encia significativa entre los kilometrajes promedio recorridos por los cauchos
de ambas marcas hasta que se desgastan.
Muestras apareadas
En este caso se considera una muestra de pares (X1 , Y1 ), (X2 , Y2 ), ...(Xn , Yn )
de una población normal bivariante con vector de medias y matriz de vari-
anzas y covarianzas:
2
µx σx σxy
µ= yV=
µy σxy σy2
Las variables definidas como:
di = Xi − Yi i = 1, 2 . . . n
son independientes, con media µd = µx − µy y varianza σd2 = σx2 + σy2 − 2σxy .
Utilizando la cantidad pivotal:
d¯ − µd
Q= √ ∼ tn−1
sd / n
siendo d¯ = x̄ − ȳ y s2d = (di − d)

¯ 2 /(n − 1).
P
En forma análoga a la sección 2.3.1, se obtiene el intervalo de confianza:

sd
I = [ d¯ ± tn−1; 1+r √ ]
2 n
Un ejemplo clásico de muestras apareadas es la situación experimental de-

nominada “antes y después”, en la cual un mismo individuo (o dos individuos
muy similares) es (son) evaluado(s) antes y después de un cierto tratamiento.
Ejemplo 2.12. Supóngase que se desea comparar dos métodos de enseñanza.

Los 50 estudiantes considerados se agrupan en parejas de acuerdo con su
coeficiente intelectual y su promedio de notas, y se asigna al azar uno de
cada par a cada uno de los grupos. Al final del curso se propone un examen
y se calculan las diferencias entre las calificaciones apareadas restando las
del método 2 a las del método 1. Los resultados fueron d¯ = 5.6 y sd = 9.6.
Halle un intervalo de confianza del 99 % para la diferencia de medias µ1 − µ2 .
¿Qué se puede concluir?
Si asumimos que la población de calificaciones con ambos métodos sigue

una distribución normal bivariante, tenemos que el intervalo de confianza del
99 % para la diferencia de medias viene dado por:
sd sd
I = [ d¯ ± tn−1; 1+r √ ] = [ d¯ ± t24;0.995 √ ]
2 n 25
= [ 5.6 ± (2.797)(9.6/5) ] = [ 5.6 ± 5.37 ]
= [0.23; 10.97]
Como este intervalo sólo contiene valores positivos, podemos concluir

que el método 1 produce mejores resultados que el método 2.
2.4.2. Para el cociente de varianzas

Consideremos dos muestras independientes X1 , X2 , ...Xm y Y1 , Y2 , ...Yn
de las poblaciones normales N (µx , σx2 ) y N (µy , σy2 ) respectivamente. Nuestro
objetivo es hallar un intervalo de confianza para el cociente de varianzas
σx2 /σy2 , para lo cual utilizaremos la cantidad pivotal:
s2y σx2
Q= ∼ Fn−1,m−1
s2x σy2
obteniéndose el intervalo:
s2x s2x
I=[ F 1−r ; F 1+r ]
s2y n−1,m−1; 2 s2y n−1,m−1; 2
Si el intervalo contiene al uno, podrı́a concluirse que no hay diferencias sig-

nificativas entre las varianzas σx2 y σy2 .
2.5. Intervalos de confianza en el caso de

muestras grandes
Este procedimiento de construcción de intervalos de confianza se basa
en el teorema 1.19, que afirma que el estimador máximo verosı́mil, en el caso
de una población que pertenezca a la clase exponencial, sigue una distribución
asintóticamente normal. Puede utilizarse entonces el método de la cantidad
pivotal, utilizando como cantidad pivotal aproximada:
Tn − τ (θ)
Qn = ∼ N (0, 1)
σn (θ)
El proceso de pivoteo se simplifica considerablemente si se sustituye

σn (θ) por σn (θ̂), obteniéndose el intervalo para τ (θ):
I = [ Tn ± z 1+r σn (θ̂) ] (2.1)

2
El procedimiento resulta particularmente útil, para hallar intervalos de

confianza en el caso de poblaciones discretas. Veremos a continuación los
casos particulares de las distribuciones Bernoulli, Poisson y Geométrica.
2.5.1. Distribución de Bernoulli

Ya se ha visto que la distribución de Bernoulli pertenece a la clase
exponencial, y que además τ (θ) = θ, Tn = x̄ y σn2 (θ) = θ(1−θ)
n
, por lo que
2 x̄(1−x̄)
σn (θ̂) = n , y en consecuencia el intervalo de confianza para θ queda:
r
x̄(1 − x̄)
I = [ x̄ ± z 1+r ]
r n
2
h p(1 − p)
= p ± z 1+r Bbig]
2 n
siendo p la proporción muestral.
2.5.2. Distribución de Poisson

La distribución de Poisson también pertenece a la clase exponencial,
con τ (θ) = θ, Tn = x̄ y σn2 (θ) = nθ , ası́ que σn2 (θ̂) = nx̄ y por tanto el intervalo
de confianza para θ queda:

r
h x̄ i
I= x̄ ± z 1+r
2 n
2.5.3. Distribución Geométrica

La distribución geométrica pertenece a la clase exponencial y se tiene
que τ (θ) = 1−θ
θ
, Tn = x̄ y la varianza σn2 (θ) = V ar(X)
n
= 1−θ
nθ2
. Para poder hallar
2
σn (θ̂) debemos despejar θ en función de τ (θ) y luego aplicar invarianza:
1−θ 1 1
τ (θ) = = − 1 ⇒ = 1 + τ (θ)
θ θ θ
1
⇒θ=
1 + τ (θ)
de allı́ que:
1
θ̂ =
1 + x̄
y por tanto:
1 x̄
1 − ( x̄+1 ) ( x̄+1 ) x̄(1 + x̄)
σn2 (θ̂) = 1 2 = 1 2 =
n( x̄+1 ) n( x̄+1 ) n
El intervalo de confianza para τ (θ) queda:

r
h x̄(1 + x̄) i
I = x̄ ± z 1+r
2 n
Ejercicios 2.1
1. Sea X una muestra aleatoria de tamaño 1 de una población exponencial

E(θ). Demuestre que I = (0, 1.61/X) es un intervalo de confianza para
θ.
2. Sea X una muestra aleatoria de tamaño 1 de una población beta

B(θ, 1). Demuestre que I = (0, −1.20/logX) es un intervalo de con-
fianza para θ.
3. Sea X1 , X2 una muestra aleatoria de una población normal N (µ, 1).

Demuestre que I = (Y1 , Y2 ) es un intervalo de confianza para µ.
4. Sea X1 , X2 , . . . X16 una muestra aleatoria de una población normal

N (µ, 16). Demuestre que I = (X̄ − 1.96, X̄ + 1.96) es un intervalo
de confianza para µ.
5. Sea X1 , X2 , . . . X5 una muestra aleatoria de una población uniforme

U (0, θ). Demuestre que I = (Yn , 1.17Yn ) es un intervalo de confianza
para θ.
6. Sea X1 , X2 , . . . Xn una muestra aleatoria de una población con función

de densidad:
f (x; θ) = e−(x−θ) I(θ,∞) (x)
Demuestre que I = (Y1 − 0.3, Y1 ) es un intervalo de confianza para θ.
Calcule su coeficiente de confianza para n = 10.
7. Sea X1 , X2 , . . . Xn una muestra aleatoria de una población uniforme

U (θ − 1/2, θ + 1/2). Demuestre que I = (Y1 , Yn ) es un intervalo de
confianza para θ. Calcule su coeficiente de confianza para n = 5.

N (θ, θ2 ). Demuestre que I = (0.9X̄, 1.15X̄) es un intervalo de confianza
para θ.
9. Sea X una muestra aleatoria de tamaño 1 de una población exponencial

E(θ). Halle un intervalo de confianza del 100r % para θ por el método
de la cantidad pivotal. Verifique que si r = 0.80 se obtiene el intervalo
del ejercicio 1.
10. Sea X una muestra aleatoria de tamaño 1 de una población beta

B(θ, 1). Halle un intervalo de confianza del 100r % para θ por el método
de la cantidad pivotal. Verifique que si r = 0.70 se obtiene el intervalo
del ejercicio 2.

U (0, θ). Halle un intervalo de confianza del 100r % para θ por el método
de la cantidad pivotal. Verifique que si r = 0.91 y n = 15 se obtiene el
intervalo del ejercicio 5.

N (µ, 16).
i) Halle un intervalo de confianza del 100r % para µ.

ii) Verifique que si r = 0.95 y n = 16 se obtiene el intervalo del ejercicio
4.
iii) ¿Cuál debe ser el valor de n para que I = (X̄ − 1, X̄ + 1) sea un
intervalo de confianza para µ del 90 %.

de densidad:
f (x; θ) = e−(x−θ) I(θ,∞) (x)
Halle un intervalo de confianza del 100r % para θ por el método de
la cantidad pivotal. Verifique que si r = 0.95 y n = 10 se obtiene el
intervalo del ejercicio 6.

de densidad:
2x
f (x; θ) = 2 I(0,θ) (x) θ>0
θ
Halle un intervalo de confianza del 100r % para θ por el método de la
cantidad pivotal.

de densidad:
θ
f (x; θ) = 2 I(θ,∞) (x) θ>0
x
Halle un intervalo de confianza del 100r % para θ por el método es-
tadı́stico.

U (0, θ). Halle un intervalo de confianza del 100r % para θ por el método
estadı́stico. Compare con el intervalo obtenido en el ejercicio 11.
17. Sea X1 , X2 , . . . Xn una muestra aleatoria de una población de bernoulli

B(θ). Halle un intervalo de confianza del 100r % para θ. Suponga n
grande.
18. Sea X1 , X2 , . . . Xn una muestra aleatoria de una población de poisson

P (θ). Halle un intervalo de confianza para θ del 100r %. Suponga n
grande.
19. Sea X1 , X2 , . . . Xn una muestra aleatoria de una población geométrica

G(θ). Halle un intervalo de confianza del 100r % para τ (θ) = (1 − θ)/θ.
Suponga n grande.
20. Sea X1 , X2 , . . . Xn una muestra aleatoria de una población exponen-

cial E(θ). Halle un intervalo de confianza del 100r % para τ (θ) = 1/θ.
Suponga n grande.

Inferencia Estadistica 2 Guillermo Ramirez

Încărcat de

Informații document

Descriere originală:

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Inferencia Estadistica 2 Guillermo Ramirez

Încărcat de

Drepturi de autor:

Formate disponibile

INFERENCIA ESTADISTICA

Guillermo Ramirez, Adelmo Fernández y Maura Vásquez*

2. Estimación por intervalo 45

Estimación por intervalo

En el caso, por ejemplo, de un estimador insesgado de mı́nima varianza

Al igual que en el caso de la estimación puntual nos debemos ocupar

Definicion 2.1 (Intervalo de confianza). Sea X1 , X2 , . . . Xn una muestra

ii) P (T1 < τ (θ) < T2 ) = r donde r no depende de θ

A T1 y T2 se les denomina “lı́mites confidenciales”y a r se le denomina

Es importante notar que cuando se obtiene un intervalo de confianza

P (T1 < θ < T2 ) = P (τ (T1 ) < τ (θ) < τ (T2 )) = r si τ es creciente, y

P (T1 < θ < T2 ) = P (τ (T2 ) < τ (θ) < τ (T1 )) = r si τ es decreciente

La afirmación probabilı́stica P (T1 < θ < T2 ) debe leerse y entenderse

Resulta evidente el hecho de que un intervalo será más preciso mientras

Es importante advertir que las probabilidades que definen un intervalo

P (a < X < b) (Primer tipo)

que se calculan como FX (b) − FX (a), sino de la forma:

P (g(X) < a < h(X)) (Segundo tipo)

La longitud de un intervalo depende de la confianza r y del tamaño

Un intervalo de confianza será “mejor”mientras su longitud sea menor.

A continuación vamos a presentar algunos ejemplos en los cuales se da

Ejemplo 2.1. Sea X una muestra de tamaño 1 de una población exponencial

i) Como X > 0, resulta claro que 1.61X > 0.

Ejemplo 2.2. Sea X1 , X2 , . . . X16 una muestra aleatoria de una población

i) En primer lugar, resulta claro que x̄ − 1.96 < x̄ + 1.96

Ejemplo 2.3. Sea X1 , X2 , . . . X15 una muestra aleatoria de una población

i) Como Yn > 0, entonces Yn < 1.17Yn

2.2. Métodos de obtención de intervalos de

2.2.1. Método de la cantidad pivotal

cuya distribución no depende de θ.

Definicion 2.3 (Método de la cantidad pivotal). Sea X1 , X2 , . . . Xn una

Para un valor fijo de r existen diferentes valores de q1 y q2 que cumplen

En el caso de poblaciones continuas estos se logra derivando respecto

entonces, al derivar respecto de q2 :

Los pasos a seguir entonces para hallar un intervalo de confianza uti-

1. Hallar una cantidad pivotal Q = q(X1 , X2 , . . . Xn ; θ).

2. Pivotear la desigualdad inicial q1 < Q < q2 hasta convertirla en

3. Minimizar la longitud del intervalo. Es decir, hallar q1 y q2 que hagan

Ejemplo 2.4. Sea X una muestra de tamaño 1 de una población exponencial

1. En este caso una cantidad pivotal es Q = q(X; θ) = θX, ya que su

fQ (q) = fX (q/θ)(1/θ) = e−q q > 0 (E(1))

3. Debemos hallar q1 y q2 que minimicen la longitud:

de donde q2 = −log(1 − r), ası́ que el intervalo de confianza del 100r %

Ejemplo 2.5. Sea X1 , X2 , . . . X16 una muestra aleatoria de una población

1. Una cantidad pivotal es Q = q(X1 , X2 , . . . Xn ; θ) = q(X̄; θ) = X̄ − θ,

q1 < Q < q2 ⇒ q1 < X̄ − θ < q2 ⇒ q1 − X̄ < −θ < q2 − X̄

⇒ I = [X̄ − q2 ; X̄ − q1 ] es un intervalo de confianza del 100r % para θ.

3. Hallaremos q1 y q2 que minimicen la longitud L = q2 − q1

Al igualar a cero se obtiene que fQ (q2 ) = fQ (q1 ), en cuyo caso, por la

Ejemplo 2.6. Sea X1 , X2 , . . . X15 una muestra aleatoria de una población

1. Una cantidad pivotal es:

fQ (q) = fYn (θq)(θ) = nq n−1 0 < q < 1 (Beta B(n,1))

q1 < Q < q2 ⇒ q1 < Yn /θ < q2 ⇒ 1/q2 < θ/Yn < 1/q1

es un intervalo de confianza del 100r % para θ.

3. Debemos hallar q1 y q2 que minimicen la longitud:

2.2.2. Método del estadı́stico

Para un valor fijo de r existen diferentes valores de p1 y p2 tales que r =

Resolvemos para θ las ecuaciones básicas:

FT (t0 ; θ) = 1 − e−θt0 = p1 ⇒ e−θt0 = 1 − p1

ası́ que I = [−log(p2 + r)/t0 ; −log(p2 )/t0 ] es un intervalo de confianza del

Ası́ que el intervalo de confianza del 100r % para θ de mı́nima longitud

Ejemplo 2.8. Sea X1 , X2 , . . . Xn una muestra aleatoria de una población

Escogeremos el valor de p1 que minimice la longitud: