Sunteți pe pagina 1din 25

INFERENCIA ESTADISTICA

Guillermo Ramirez, Adelmo Fernández y Maura Vásquez*


2012

*
Escuela de Estadı́stica y Ciencias Actuariales de la Universidad Central de Venezuela
Índice general

2. Estimación por intervalo 45


2.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
2.2. Métodos de obtención de intervalos de confianza . . . . . . . . 48
2.2.1. Método de la cantidad pivotal . . . . . . . . . . . . . . 48
2.2.2. Método del estadı́stico . . . . . . . . . . . . . . . . . . 52
2.3. Intervalos de confianza en el caso de una población normal . . 55
2.3.1. Para la media . . . . . . . . . . . . . . . . . . . . . . . 55
2.3.2. Para la varianza . . . . . . . . . . . . . . . . . . . . . . 57
2.4. Intervalos de confianza en el caso de dos poblaciones normales 59
2.4.1. Para la diferencia de medias . . . . . . . . . . . . . . . 59
2.4.2. Para el cociente de varianzas . . . . . . . . . . . . . . . 62
2.5. Intervalos de confianza en el caso de
muestras grandes . . . . . . . . . . . . . . . . . . . . . . . . . 63
2.5.1. Distribución de Bernoulli . . . . . . . . . . . . . . . . . 63
2.5.2. Distribución de Poisson . . . . . . . . . . . . . . . . . . 63
2.5.3. Distribución Geométrica . . . . . . . . . . . . . . . . . 64

i
Capı́tulo 2

Estimación por intervalo

2.1. Introducción
En el capı́tulo anterior presentamos métodos para hallar estimadores,
definimos propiedades deseables para ellos y establecimos criterios para en-
contrar un “buen”estimador para un parámetro dado. Las estimaciones pun-
tuales proporcionadas por estos estimadores son muy útiles, pero resultan
insuficientes en el sentido de que no tienen asociadas una medida del posible
error que se comete en el proceso de estimación. No se tiene una idea clara
acerca de la distancia de esa estimación al verdadero valor del parámetro.

En el caso, por ejemplo, de un estimador insesgado de mı́nima varianza


sabemos que su distribución está centrada en θ, que su varianza es mı́nima
y que en promedio su valor estará cerca de θ. Hace falta, sin embargo, in-
troducir una medida de “confianza”en esa estimación, que obviamente debe
estar expresada en términos probabilı́sticos. Una manera de lograr esto es
hallando un intervalo alrededor de la estimación para el cual se conozca la
probabilidad de que contenga al parámetro. Este tipo de estimación se de-
nomina “estimación por intervalo”.

Al igual que en el caso de la estimación puntual nos debemos ocupar


de dos aspectos: primero encontrar estimadores tipo intervalo, y segundo
establecer criterios para determinar los mejores estimadores de este tipo.

45
Capı́tulo 2 Estimación por intervalo 46

Definicion 2.1 (Intervalo de confianza). Sea X1 , X2 , . . . Xn una muestra


aleatoria de una población f (x; θ). Se define como intervalo de confianza del
100r % para el parámetro τ (θ), al intervalo aleatorio I = (T1 , T2 ), donde T1
y T2 son estadı́sticos tales que:

i) P (T1 < T2 ) = 1

ii) P (T1 < τ (θ) < T2 ) = r donde r no depende de θ

A T1 y T2 se les denomina “lı́mites confidenciales”y a r se le denomina


“coeficiente de confianza”. Uno de los estadı́sticos T1 o T2 pudiera ser no
aleatorio, en cuyo caso se dice que se trata de intervalos unilaterales.

Es importante notar que cuando se obtiene un intervalo de confianza


para θ, puede hallarse fácilmente un intervalo de confianza para cualquier
función monótona τ (θ), ya que:

P (T1 < θ < T2 ) = P (τ (T1 ) < τ (θ) < τ (T2 )) = r si τ es creciente, y

P (T1 < θ < T2 ) = P (τ (T2 ) < τ (θ) < τ (T1 )) = r si τ es decreciente

La afirmación probabilı́stica P (T1 < θ < T2 ) debe leerse y entenderse


cuidadosamente. No debe interpretarse como la probabilidad de que θ tome
una valor entre T1 y T2 , sino como la probabilidad de que el intervalo (T1 , T2 )
contenga al parámetro. Por su parte, la confianza asociada con el intervalo
se interpreta en términos frecuentistas: si repitiésemos este procedimiento de
estimación un gran número de veces y construyésemos tantos intervalo de
confianza, aproximadamente el 100r % de estos intervalos contendrı́a a θ.

Resulta evidente el hecho de que un intervalo será más preciso mientras


su longitud sea menor, ya que da mayor información sobre el parámetro. En
ciertas ocasiones la longitud es una constante que depende de r y de n, en
cuyo caso trataremos de encontrar intervalos de mı́nima longitud. En otras
situaciones la longitud es aleatoria y se trata de hallar intervalos de mı́nima
longitud media.
Capı́tulo 2 Estimación por intervalo 47

Es importante advertir que las probabilidades que definen un intervalo


de confianza no son del tipo usual:

P (a < X < b) (Primer tipo)

que se calculan como FX (b) − FX (a), sino de la forma:

P (g(X) < a < h(X)) (Segundo tipo)

que habrı́a que convertir en una desigualdad del primer tipo para poder
evaluarla. El proceso de modificación de una desigualdad de un tipo para
convertirla en una desigualdad del otro tipo se denomina “pivoteo”.

Dos ideas importantes a tener en cuenta en este momento son las sigu-
ientes:

La longitud de un intervalo depende de la confianza r y del tamaño


muestral n.

Un intervalo de confianza será “mejor”mientras su longitud sea menor.

A continuación vamos a presentar algunos ejemplos en los cuales se da


un intervalo aleatorio, y se pide demostrar que es un intervalo de confianza
para un cierto parámetro.

Ejemplo 2.1. Sea X una muestra de tamaño 1 de una población exponencial


E(θ). Demuestre que I = (0, 1.61/X) es un intervalo de confianza para θ.

i) Como X > 0, resulta claro que 1.61X > 0.


(Más formalmente, P (1.61X > 0) = 1)

ii) P (0 < θ < 1.61/X) = P (0 < θX < 1.61) = P (0 < X < 1.61/θ) =
FX (1.61/θ) = 1 − e−1.61 = 1 − 0.20 = 0.80
que no depende de θ.

Ejemplo 2.2. Sea X1 , X2 , . . . X16 una muestra aleatoria de una población


normal N (θ, 16). Demuestre que I = (x̄ − 1.96, x̄ + 1.96) es un intervalo de
confianza para θ.

i) En primer lugar, resulta claro que x̄ − 1.96 < x̄ + 1.96


Capı́tulo 2 Estimación por intervalo 48

ii) P (x̄ − 1.96 < θ < x̄ + 1.96) = P (−1.96 < θ − x̄ < 1.96) =
P (−1.96 < x̄ − θ < 1.96) = φ(1.96) − φ(−1.96) = 2φ(1.96) − 1 = 0.95
que no depende de θ.

Ejemplo 2.3. Sea X1 , X2 , . . . X15 una muestra aleatoria de una población


uniforme U (0, θ). Demuestre que I = (Yn , 1.17Yn ) es un intervalo de confi-
anza para θ.

i) Como Yn > 0, entonces Yn < 1.17Yn

ii) P (Yn < θ < 1.17Yn ) = P (1 < θ/Yn < 1.17) = P (0.85 < Yn /θ < 1) =
P (0.85θ < Yn < θ) = 1 − FYn (0.85θ) = 1 − (0.85)n =
1 − 0.09 = 0.91
que no depende de θ.

2.2. Métodos de obtención de intervalos de


confianza
En esta sección nos ocuparemos de dos métodos: el de la cantidad piv-
otal y el método estadı́stico.

2.2.1. Método de la cantidad pivotal


Definicion 2.2 (Cantidad pivotal). Sea X1 , X2 , . . . Xn una muestra aleatoria
de una población f (x; θ). Se define como cantidad pivotal a una función:

Q = q(X1 , X2 , . . . Xn ; θ)

cuya distribución no depende de θ.

Definicion 2.3 (Método de la cantidad pivotal). Sea X1 , X2 , . . . Xn una


muestra aleatoria de una población f (x; θ) y Q una cantidad pivotal. Si es
posible encontrar dos estadı́sticos T1 = t1 (X1 , X2 , . . . Xn ) y T2 = t2 (X1 , X2 , . . . Xn )
tales que:
P (q1 < Q < q2 ) = P (T1 < τ (θ) < T2 ) = r
donde r no depende de θ, entonces I = (T1 , T2 ) es un intervalo de confianza
del 100r % para τ (θ).
Capı́tulo 2 Estimación por intervalo 49

Para un valor fijo de r existen diferentes valores de q1 y q2 que cumplen


P (q1 < Q < q2 ) = r, los cuales darán lugar a diferentes intervalos de con-
fianza. Escogeremos aquéllos que hagan mı́nima la longitud del intervalo
L = T2 − T1 .

En el caso de poblaciones continuas estos se logra derivando respecto


de q2 (o de q1 ), haciendo uso de que:

d fQ (q2 )
(q1 ) =
dq2 fQ (q1 )
En efecto, como en el caso continuo:
Z q2
P (q1 < Q < q2 ) = fQ (q)dq = r
q1

entonces, al derivar respecto de q2 :


Z q2
d
fQ (q)dq = 0 ⇒
dq2 q1
Z q2
d d d
fQ (q2 ) (q2 ) − fQ (q1 ) (q1 ) + fQ (q)dq = 0 ⇒
dq2 dq2 q1 dq2
d
fQ (q2 ) = fQ (q1 ) (q1 ) ⇒
dq2
d fQ (q2 )
(q1 ) =
dq2 fQ (q1 )

Los pasos a seguir entonces para hallar un intervalo de confianza uti-


lizando este método son los siguientes:

1. Hallar una cantidad pivotal Q = q(X1 , X2 , . . . Xn ; θ).


(preferiblemente basada en un buen estimador de τ (θ))

2. Pivotear la desigualdad inicial q1 < Q < q2 hasta convertirla en


T1 < τ (θ) < T2 , donde T1 y T2 dependen de q1 y q2 .

3. Minimizar la longitud del intervalo. Es decir, hallar q1 y q2 que hagan


mı́nima la diferencia L = T2 − T1 . Tómese en cuenta que la variación
de q1 y q2 depende de la cantidad pivotal que se haya seleccionado.
Capı́tulo 2 Estimación por intervalo 50

Ejemplo 2.4. Sea X una muestra de tamaño 1 de una población exponencial


E(θ). Halle un intervalo de confianza del 100r % para θ.

1. En este caso una cantidad pivotal es Q = q(X; θ) = θX, ya que su


función de densidad:

fQ (q) = fX (q/θ)(1/θ) = e−q q > 0 (E(1))

no depende de θ.

2. Pivoteando:
q1 < Q < q2 ⇒ q1 < θX < q2 ⇒ q1 /X < θ < q2 /X ⇒
I = [q1/X; q2 /X] es un intervalo de confianza del 100r % para θ.

3. Debemos hallar q1 y q2 que minimicen la longitud:


L = q2 /X − q1 /X = (1/X)(q2 − q1 )
Para ello derivamos respecto de q1 :

d d fQ (q1 )
L = (1/X) ( q2 − 1) = (1/X) ( − 1)
dq1 dq1 fQ (q2 )
e−q1
= (1/X) ( −q2 − 1) = (1/Xe−q2 ) (e−q1 − e−q2 )
e
que es positiva, lo que quiere decir que L es una función creciente en
q1 y por tanto su mı́nimo se halla en el mı́nimo valor de q1 que es cero.
Para hallar el correspondiente valor de q2 hacemos uso de:
Z q2
P (q1 < Q < q2 ) = e−q dq = 1 − e−q2 = r
0

de donde q2 = −log(1 − r), ası́ que el intervalo de confianza del 100r %


para θ de mı́nima longitud es:
 −log(1 − r) 
I = 0;
X
Nótese que si r = 0.80, se obtiene el intervalo del ejemplo 2.1.

Ejemplo 2.5. Sea X1 , X2 , . . . X16 una muestra aleatoria de una población


normal N (θ, 16). Halle un intervalo de confianza del 100r % para θ.
Capı́tulo 2 Estimación por intervalo 51

1. Una cantidad pivotal es Q = q(X1 , X2 , . . . Xn ; θ) = q(X̄; θ) = X̄ − θ,


ya que sigue una distribución normal N (0, 1), que no depende de θ.

2. Pivoteando:

q1 < Q < q2 ⇒ q1 < X̄ − θ < q2 ⇒ q1 − X̄ < −θ < q2 − X̄


⇒ X̄ − q2 < θ < X̄ − q1

⇒ I = [X̄ − q2 ; X̄ − q1 ] es un intervalo de confianza del 100r % para θ.

3. Hallaremos q1 y q2 que minimicen la longitud L = q2 − q1


Para ello derivamos respecto de q2 :

d d fQ (q2 )
L = (1 − q1 ) = (1 − )
dq2 dq2 fQ (q1 )

Al igualar a cero se obtiene que fQ (q2 ) = fQ (q1 ), en cuyo caso, por la


simetrı́a de fQ , se tiene que q2 = −q1 = z(1+r)/2 . Si r = 0.95, se obtiene
el intervalo del ejemplo 2.2.

Ejemplo 2.6. Sea X1 , X2 , . . . X15 una muestra aleatoria de una población


uniforme U (0, θ). Halle un intervalo de confianza del 100r % para θ.

1. Una cantidad pivotal es:


Q = q(X1 , X2 , . . . Xn ; θ) = q(Yn ; θ) = Yn /θ, ya que su función de den-
sidad:

fQ (q) = fYn (θq)(θ) = nq n−1 0 < q < 1 (Beta B(n,1))

no depende de θ.

2. Pivoteando:

q1 < Q < q2 ⇒ q1 < Yn /θ < q2 ⇒ 1/q2 < θ/Yn < 1/q1


⇒ Yn /q2 < θ < Yn /q1
⇒ I = [Yn /q2 ; Yn /q1 ]

es un intervalo de confianza del 100r % para θ.


Capı́tulo 2 Estimación por intervalo 52

3. Debemos hallar q1 y q2 que minimicen la longitud:


L = Yn /q1 − Yn /q2 = Yn (1/q1 − 1/q2 )
Si derivamos respecto de q2 :
d 1 fQ (q2 ) 1 1 nq2n−1 ) 1
L = Yn (− 2 + 2 ) = Yn (− 2 n−1 + 2 )
dq2 q1 fQ (q1 ) q2 q1 nq1 ) q2
Yn
= 2 n+1 (q1n+1 − q2n+1 )
q2 q1
que es negativa, lo que quiere decir que L es una función decreciente
en q2 y por tanto su mı́nimo se halla en el máximo valor de q2 que es
uno. Para hallar el correspondiente valor de q1 hacemos uso de:
Z 1
P (q1 < Q < q2 ) = nq n−1 dq = 1 − q1n = r
q1

de donde q1 = n 1 − r, ası́ que el intervalo de confianza del 100r % para
θ de mı́nima longitud es:
 Yn 
I = Yn ; √
n
1−r
Si r = 0.91, se obtiene el intervalo del ejemplo 2.3.

2.2.2. Método del estadı́stico


Un método alternativo al de la cantidad pivotal lo constituye el método
del estadı́stico, denominado ası́ porque el punto de partida en el proceso
de construcción del intervalo es un estadı́stico y su función de densidad. Se
demuestra que los intervalos de menor longitud se obtienen cuando se utilizan
estadı́sticos suficientes.
Definicion 2.4 (Método del estadı́stico). Sea X1 , X2 , . . . Xn una muestra
aleatoria de una población f (x; θ) y T un estimador de θ (preferiblemente
suficiente). Sea fT la función de densidad de T y t0 el valor observado de
T . El intervalo I = (v1 , v2 ) es un intervalo de confianza del 100r % para θ,
donde v1 y v2 se obtienen resolviendo para θ cada una de las ecuaciones:

FT (t0 ; θ) = p1
1 − FT (t0 ; θ) = p2
Capı́tulo 2 Estimación por intervalo 53

Para un valor fijo de r existen diferentes valores de p1 y p2 tales que r =


1 − p1 − p2 , los cuales darán lugar a diferentes intervalos de confianza. Se
escogerán aquéllos que minimicen la longitud del intervalo L = v2 − v1 . En
el caso de poblaciones continuas esto se logra derivando respecto de p2 (o de
p1 ), y haciendo uso de que 0 ≤ p1 , p2 ≤ 1 − r.
Ejemplo 2.7. Sea X una muestra aleatoria de tamaño 1 de una población
exponencial E(θ). Halle un intervalo de confianza del 100r % para θ por el
método estadı́stico.
El estimador máximo verosı́mil en este caso es T = X, su función de
densidad es fT (t; θ) = θe−θ y su función de distribución FT (t; θ) = 1 − e−θt .

Resolvemos para θ las ecuaciones básicas:

FT (t0 ; θ) = 1 − e−θt0 = p1 ⇒ e−θt0 = 1 − p1


⇒ −θt0 = log(1 − p1 )
⇒ θ = −log(1 − p1 )/t0
⇒ θ = −log(p2 + r)/t0 = v1
1 − FT (t0 ; θ) = e−θt0 = p2 ⇒ −θt0 = log(p2 )
⇒ θ = −log(p2 )/t0 = v2

ası́ que I = [−log(p2 + r)/t0 ; −log(p2 )/t0 ] es un intervalo de confianza del


100r % para θ.
La longitud: L = (log(p2 + r) − log(p2 ))/t0 .
Si derivamos respecto de p2 :
d 1 1 −r
L = (1/t0 ) ( − ) = (1/t0 ) ( )
dp2 p2 + r p 2 p2 + r
que es negativa, lo que quiere decir que L es una función decreciente en p2 y
por tanto alcanza su mı́nimo en el máximo valor de p2 que es 1 − r, en cuyo
caso p1 = 0.

Ası́ que el intervalo de confianza del 100r % para θ de mı́nima longitud


es:
 −log(1 − r) 
I = 0;
t0
intervalo que coincide con el obtenido en el ejemplo 2.4.
Capı́tulo 2 Estimación por intervalo 54

Ejemplo 2.8. Sea X1 , X2 , . . . Xn una muestra aleatoria de una población


uniforme U (0, θ). Halle un intervalo de confianza del 100r % para θ por el
método estadı́stico.
Sabemos ya que T = Yn es el estimador máximo verosı́mil, que es
suficiente y que su función de densidad viene dada por:
ntn−1
fT (t; θ) = I(0,θ) (t)
θn
Para un valor fijo de r existen valores de p1 y p2 tales que:

t0 t0
ntn−1 tn0
Z Z
fT (t; θ)dt = n
dt = = p1
−∞ −∞ θ θn
Z ∞ Z ∞ n−1
nt tn0
fT (t; θ)dt = dt = 1 − = p2
t0 t0 θn θn
de donde:
t0
θ= √
n p
= v1
1
y:
t0 t0
θ= √ = √ = v2
n
1 − p2 n
p1 + r
por lo tanto:
 t0 t0 
I= √ ; √
n
p1 + r n p1
es un intervalo de confianza del 100r % para θ1 .

Escogeremos el valor de p1 que minimice la longitud:


t0 t0
L= √ n p
− √
1
n
p1 + r
Si derivamos respecto de p1 :
d d −1/n
− (p1 + r)−1/n

L = t0 p1
dp1 dp1
t0 1 1 
= p − p
n n (p1 + r)n+1 n
pn+1
1
1
Nótese que se han invertido los lı́mites ya que en este caso v2 < v1 .
Capı́tulo 2 Estimación por intervalo 55

que es negativa, lo que quiere decir que L es una función decreciente en p1 y


por tanto su mı́nimo valor se hallará en el máximo valor de p1 que es 1 − r,
en cuyo caso p2 = 0. Ası́ que el intervalo de confianza del 100r % para θ de
mı́nima longitud es:
 t0 
I = t0 ; √n
1−r
intervalo que coincide con el obtenido en el ejemplo 2.6.

2.3. Intervalos de confianza en el caso de una


población normal
En las secciones 2.3.1 y 2.3.2 consideraremos una muestra aleatoria
X1 , X2 , . . . Xn de una población con distribución normal N (µ, σ 2 ) y hallare-
mos intervalos de confianza para µ y para σ 2 , utilizando el método de la
cantidad pivotal.

2.3.1. Para la media


Conocida la varianza
En este primer caso se utiliza la cantidad pivotal:
x̄ − µ
Q = q(x̄, µ) = √ ∼ N (0, 1)
σ/ n
y se obtiene el intervalo del 100r % para µ, y de mı́nima longitud:
σ
I = [ x̄ ± Z 1+r √ ]
2 n
Obsérvese que la longitud de este intervalo es:
σ
L = 2Z 1+r √ (que es un número)
2 n
de donde podemos despejar n:
4σ 2 2
n= Z 1+r
L2 2

obteniéndose el tamaño muestral requerido para que la longitud sea igual a


un valor particular L.
Capı́tulo 2 Estimación por intervalo 56

Desconocida la varianza
En este caso se utiliza la cantidad pivotal:
x̄ − µ
Q = q(x̄, µ) = √ ∼ tn−1
s/ n
y se obtiene el intervalo del 100r % para µ, y de mı́nima longitud promedio:
s
I = [ x̄ ± tn−1; 1+r √ ]
2 n
La longitud del intervalo:
s
L = 2tn−1; 1+r √ (que es una variable aleatoria)
2 n
No puede despejarse ahora n, pero puede hallarse la probabilidad de que en
una muestra de tamaño n obtengamos un intervalo de longitud menor a un
determinado múltiplo de σ:
s
P (L < aσ) = P (2tn−1; 1+r √ < aσ)
2 n

s a n
= P( < )
σ 2tn−1; 1+r
2

s2 na2
= P( 2 < 2 )
σ 4tn−1; 1+r
2
2
(n − 1)s n(n − 1)a2
= P( < )
σ2 4t2n−1; 1+r
2

n(n − 1)a2
= P (χ2n−1 < )
4t2n−1; 1+r
2

Ejemplo 2.9. Supóngase que la duración en horas de un componente eléctri-


co es una variable aleatoria con distribución normal N (µ, σ = 500). Se se-
lecciona una muestra aleatoria de 25 componentes y se obtiene un promedio
de x̄ = 1832.
i) Halle un intervalo de confianza del 95 % para µ.
En este caso: n = 25, σ = 500, r = 0,95, Z 1+r = Z0,975 = 1,96
2
Sustituyendo: I = [1832 ± 196] = [1636; 2028]
La longitud: L = 392
Capı́tulo 2 Estimación por intervalo 57

ii) ¿Cuál deberı́a ser el tamaño de la muestra para reducir la longitud del
intervalo a 300?

4(500)2
n= (1, 96)2 = 43
(300)2

iii) Supóngase ahora que σ fuese desconocida, y se hubiese hallado s = 497.


En este caso: tn−1;(1+r)/2 = t24;0.975 = 2.064
al sustituir: I = [1832 ± 205.16] = [1626.85; 2037.15]

iv) ¿Cuál es la probabilidad de que en una muestra de tamaño 25 se obtenga


un intervalo del 95 % para µ, de longitud menor que 0.8σ?
P (L < 0.8σ) = P (χ224 < 22.54) = 0.4527

2.3.2. Para la varianza


La cantidad pivotal en este caso:

(n − 1)s2
Q = q(s2 , σ 2 ) = ∼ χ2n−1
σ2
y se obtiene el intervalo del 100r % para σ 2 :
 (n − 1)s2 (n − 1)s2 
I= ;
χ2n−1; 1+r χ2n−1; 1−r
2 2

Resulta obvio que si tomamos raı́z cuadrada en ambos extremos obten-


emos un intervalo para σ. La longitud de ese intervalo:
√ 1 1 
L=s n−1 q −q
χ2n−1; 1−r χ2n−1; 1+r
2 2

Ası́ que en este caso también puede hallarse la probabilidad de que en


una muestra de tamaño n obtengamos un intervalo de longitud menor a tan-
tas veces σ:
Capı́tulo 2 Estimación por intervalo 58

1 1  √
P (L < aσ) = P ( q −q s n − 1 < aσ)
χ2n−1; 1−r χ2n−1; 1+r
2 2
√ s 1 1 −1 
= P ( n − 1 < a( q −q
σ χ2
χ2n−1; 1+r
n−1; 1−r
2 2
2
(n − 1)s 1 1 −2 
= P( 2
< a2 ( q −q
σ χ2 χ2n−1; 1+r
n−1; 1−r
2 2

1 1 −2 
= P (χ2n−1 < a2 ( q −q
χ2n−1; 1−r χ2n−1; 1+r
2 2

Ejemplo 2.10. Consideremos el mismo ejemplo anterior, pero asumiendo σ


desconocida.

i) Halle un intervalo de confianza del 95 % para σ 2 .


En este caso: n = 25, r = 0.95, s = 497, χ2n−1; 1+r = χ224;0.975 = 39.364
2
χ2n−1; 1−r = χ224;0.025 = 12.401
2
Sustituyendo, el intervalo de confianza para σ 2 :
I = [150599.58; 478037.90]
Para σ:
I = [388.07; 691.40]
La longitud:
L = 303.33

ii) ¿Cuál es la probabilidad de que en una muestra de tamaño 25 obteng-


amos un intervalo del 95 % para σ, de longitud menor que 0.5σ?
P (L < 0.5σ) = P (χ224 < 16.108) = 0.1158

Al igual que antes, existen tablas que permiten obtener el valor de n


necesario para asegurar con cierta probabilidad que la longitud del intervalo
para σ sea menor que aσ.
Capı́tulo 2 Estimación por intervalo 59

2.4. Intervalos de confianza en el caso de dos


poblaciones normales
2.4.1. Para la diferencia de medias
Consideraremos aquı́ dos casos según se trate de dos muestras indepen-
dientes o de muestras apareadas.

Muestras independientes
Dadas dos muestras independientes X1 , X2 , ...Xm y Y1 , Y2 , ...Yn de las
poblaciones normales N (µx , σx2 ) y N (µy , σy2 ) respectivamente, nuestro obje-
tivo es hallar un intervalo de confianza para la diferencia de medias µx − µy .
Distinguiremos dos casos según sean conocidas o no las varianzas.

Conocidas las varianzas


La cantidad pivotal:
(x̄ − ȳ) − (µx − µy )
Q = q(x̄ − ȳ, µx − µy ) = q ∼ N (0, 1)
σx2 σy2
m
+ n
obtieniéndose el intervalo:
r
σx2 σy2
I = [ (x̄ − ȳ) ± Z 1+r + ]
2 m n
Si las varianzas fuesen iguales:
r
1 1
I = [ (x̄ − ȳ) ± Z 1+r σ + ]
2 m n
Desconocidas las varianzas
Si asumimos que las varianzas desconocidas son iguales, la cantidad pivotal
adecuada:
(x̄ − ȳ) − (µx − µy )
Q = q(x̄ − ȳ, µx − µy ) = q ∼ tm+n−2
sp m1 + n1

siendo s2p la varianza combinada (pooled):


(m − 1)s2x + (n − 1)s2y
s2p =
m+n−2
Capı́tulo 2 Estimación por intervalo 60

El intervalo queda:
r
1 1
I = [ (x̄ − ȳ) ± tm+n−2; 1+r sp + ]
2 m n
Si se asume que las varianzas desconocidas son diferentes, sólo se dispone del
siguiente intervalo aproximado propuesto por Welch:
r
s2x s2y
I = [ (x̄ − ȳ) ± tg; 1+r + ]
2 m n
donde los grados de libertad de la distribución t:
(a + b)2
g= a2 b2
−2
m−1
+ n−1

siendo a = s2x /m y b = s2y /n


Ejemplo 2.11. Una compañı́a de transporte debe decidir cuál de dos marcas
de cauchos, A o B, compra para sus vehı́culos. Para ello experimenta con 16
cauchos de cada marca, probándolos bajo condiciones semejantes hasta que
se desgastan. Los resultados obtenidos fueron:
marca A: x̄ = 26000 kms, sx = 4200 kms
marca B: x̄ = 25000 kms, sx = 2800 kms
Halle un intervalo de confianza del 95 % para la diferencia de medias µx −µy .
¿Qué se puede concluir?
Si suponemos que el total de kilómetros recorridos por un neumático de
cada una de las marcas hasta que se desgasta es una variable aleatoria con
distribución normal, que las muestras se seleccionan en forma independiente
y que las varianzas son desconocidas pero iguales, tenemos que un intervalo
de confianza del 95 % para la diferencia de medias viene dado por:
r
1 1
I = [ (x̄ − ȳ) ± tm+n−2;0.975 sp + ]
m n
Como además m = n = 16:
s2x + s2y
s2p = = 12740000 ⇒ sp = 3569, 31
2
y:
tm+n−2;0.975 = t30;0.975 = 2.042
Capı́tulo 2 Estimación por intervalo 61

entonces:

I = [1000 ± 2577.23]
= [−1577.23; 3577.23]

Como este intervalo contiene al cero, podemos concluir que no hay difer-
encia significativa entre los kilometrajes promedio recorridos por los cauchos
de ambas marcas hasta que se desgastan.

Muestras apareadas
En este caso se considera una muestra de pares (X1 , Y1 ), (X2 , Y2 ), ...(Xn , Yn )
de una población normal bivariante con vector de medias y matriz de vari-
anzas y covarianzas:
   2 
µx σx σxy
µ= yV=
µy σxy σy2

Las variables definidas como:

di = Xi − Yi i = 1, 2 . . . n

son independientes, con media µd = µx − µy y varianza σd2 = σx2 + σy2 − 2σxy .

Utilizando la cantidad pivotal:

d¯ − µd
Q= √ ∼ tn−1
sd / n

siendo d¯ = x̄ − ȳ y s2d = (di − d)


¯ 2 /(n − 1).
P

En forma análoga a la sección 2.3.1, se obtiene el intervalo de confianza:


sd
I = [ d¯ ± tn−1; 1+r √ ]
2 n

Un ejemplo clásico de muestras apareadas es la situación experimental de-


nominada “antes y después”, en la cual un mismo individuo (o dos individuos
muy similares) es (son) evaluado(s) antes y después de un cierto tratamiento.
Capı́tulo 2 Estimación por intervalo 62

Ejemplo 2.12. Supóngase que se desea comparar dos métodos de enseñanza.


Los 50 estudiantes considerados se agrupan en parejas de acuerdo con su
coeficiente intelectual y su promedio de notas, y se asigna al azar uno de
cada par a cada uno de los grupos. Al final del curso se propone un examen
y se calculan las diferencias entre las calificaciones apareadas restando las
del método 2 a las del método 1. Los resultados fueron d¯ = 5.6 y sd = 9.6.
Halle un intervalo de confianza del 99 % para la diferencia de medias µ1 − µ2 .
¿Qué se puede concluir?

Si asumimos que la población de calificaciones con ambos métodos sigue


una distribución normal bivariante, tenemos que el intervalo de confianza del
99 % para la diferencia de medias viene dado por:
sd sd
I = [ d¯ ± tn−1; 1+r √ ] = [ d¯ ± t24;0.995 √ ]
2 n 25
= [ 5.6 ± (2.797)(9.6/5) ] = [ 5.6 ± 5.37 ]
= [0.23; 10.97]

Como este intervalo sólo contiene valores positivos, podemos concluir


que el método 1 produce mejores resultados que el método 2.

2.4.2. Para el cociente de varianzas


Consideremos dos muestras independientes X1 , X2 , ...Xm y Y1 , Y2 , ...Yn
de las poblaciones normales N (µx , σx2 ) y N (µy , σy2 ) respectivamente. Nuestro
objetivo es hallar un intervalo de confianza para el cociente de varianzas
σx2 /σy2 , para lo cual utilizaremos la cantidad pivotal:

s2y σx2
Q= ∼ Fn−1,m−1
s2x σy2

obteniéndose el intervalo:
s2x s2x
I=[ F 1−r ; F 1+r ]
s2y n−1,m−1; 2 s2y n−1,m−1; 2

Si el intervalo contiene al uno, podrı́a concluirse que no hay diferencias sig-


nificativas entre las varianzas σx2 y σy2 .
Capı́tulo 2 Estimación por intervalo 63

2.5. Intervalos de confianza en el caso de


muestras grandes
Este procedimiento de construcción de intervalos de confianza se basa
en el teorema 1.19, que afirma que el estimador máximo verosı́mil, en el caso
de una población que pertenezca a la clase exponencial, sigue una distribución
asintóticamente normal. Puede utilizarse entonces el método de la cantidad
pivotal, utilizando como cantidad pivotal aproximada:

Tn − τ (θ)
Qn = ∼ N (0, 1)
σn (θ)

El proceso de pivoteo se simplifica considerablemente si se sustituye


σn (θ) por σn (θ̂), obteniéndose el intervalo para τ (θ):

I = [ Tn ± z 1+r σn (θ̂) ] (2.1)


2

El procedimiento resulta particularmente útil, para hallar intervalos de


confianza en el caso de poblaciones discretas. Veremos a continuación los
casos particulares de las distribuciones Bernoulli, Poisson y Geométrica.

2.5.1. Distribución de Bernoulli


Ya se ha visto que la distribución de Bernoulli pertenece a la clase
exponencial, y que además τ (θ) = θ, Tn = x̄ y σn2 (θ) = θ(1−θ)
n
, por lo que
2 x̄(1−x̄)
σn (θ̂) = n , y en consecuencia el intervalo de confianza para θ queda:
r
x̄(1 − x̄)
I = [ x̄ ± z 1+r ]
r n
2

h p(1 − p)
= p ± z 1+r Bbig]
2 n
siendo p la proporción muestral.

2.5.2. Distribución de Poisson


La distribución de Poisson también pertenece a la clase exponencial,
con τ (θ) = θ, Tn = x̄ y σn2 (θ) = nθ , ası́ que σn2 (θ̂) = nx̄ y por tanto el intervalo
Capı́tulo 2 Estimación por intervalo 64

de confianza para θ queda:


r
h x̄ i
I= x̄ ± z 1+r
2 n

2.5.3. Distribución Geométrica


La distribución geométrica pertenece a la clase exponencial y se tiene
que τ (θ) = 1−θ
θ
, Tn = x̄ y la varianza σn2 (θ) = V ar(X)
n
= 1−θ
nθ2
. Para poder hallar
2
σn (θ̂) debemos despejar θ en función de τ (θ) y luego aplicar invarianza:

1−θ 1 1
τ (θ) = = − 1 ⇒ = 1 + τ (θ)
θ θ θ
1
⇒θ=
1 + τ (θ)

de allı́ que:
1
θ̂ =
1 + x̄
y por tanto:
1 x̄
1 − ( x̄+1 ) ( x̄+1 ) x̄(1 + x̄)
σn2 (θ̂) = 1 2 = 1 2 =
n( x̄+1 ) n( x̄+1 ) n

El intervalo de confianza para τ (θ) queda:


r
h x̄(1 + x̄) i
I = x̄ ± z 1+r
2 n
Capı́tulo 2 Estimación por intervalo 65

Ejercicios 2.1

1. Sea X una muestra aleatoria de tamaño 1 de una población exponencial


E(θ). Demuestre que I = (0, 1.61/X) es un intervalo de confianza para
θ.

2. Sea X una muestra aleatoria de tamaño 1 de una población beta


B(θ, 1). Demuestre que I = (0, −1.20/logX) es un intervalo de con-
fianza para θ.

3. Sea X1 , X2 una muestra aleatoria de una población normal N (µ, 1).


Demuestre que I = (Y1 , Y2 ) es un intervalo de confianza para µ.

4. Sea X1 , X2 , . . . X16 una muestra aleatoria de una población normal


N (µ, 16). Demuestre que I = (X̄ − 1.96, X̄ + 1.96) es un intervalo
de confianza para µ.

5. Sea X1 , X2 , . . . X5 una muestra aleatoria de una población uniforme


U (0, θ). Demuestre que I = (Yn , 1.17Yn ) es un intervalo de confianza
para θ.

6. Sea X1 , X2 , . . . Xn una muestra aleatoria de una población con función


de densidad:
f (x; θ) = e−(x−θ) I(θ,∞) (x)
Demuestre que I = (Y1 − 0.3, Y1 ) es un intervalo de confianza para θ.
Calcule su coeficiente de confianza para n = 10.

7. Sea X1 , X2 , . . . Xn una muestra aleatoria de una población uniforme


U (θ − 1/2, θ + 1/2). Demuestre que I = (Y1 , Yn ) es un intervalo de
confianza para θ. Calcule su coeficiente de confianza para n = 5.

8. Sea X1 , X2 , . . . X100 una muestra aleatoria de una población normal


N (θ, θ2 ). Demuestre que I = (0.9X̄, 1.15X̄) es un intervalo de confianza
para θ.

9. Sea X una muestra aleatoria de tamaño 1 de una población exponencial


E(θ). Halle un intervalo de confianza del 100r % para θ por el método
de la cantidad pivotal. Verifique que si r = 0.80 se obtiene el intervalo
del ejercicio 1.
Capı́tulo 2 Estimación por intervalo 66

10. Sea X una muestra aleatoria de tamaño 1 de una población beta


B(θ, 1). Halle un intervalo de confianza del 100r % para θ por el método
de la cantidad pivotal. Verifique que si r = 0.70 se obtiene el intervalo
del ejercicio 2.

11. Sea X1 , X2 , . . . Xn una muestra aleatoria de una población uniforme


U (0, θ). Halle un intervalo de confianza del 100r % para θ por el método
de la cantidad pivotal. Verifique que si r = 0.91 y n = 15 se obtiene el
intervalo del ejercicio 5.

12. Sea X1 , X2 , . . . X16 una muestra aleatoria de una población normal


N (µ, 16).

i) Halle un intervalo de confianza del 100r % para µ.


ii) Verifique que si r = 0.95 y n = 16 se obtiene el intervalo del ejercicio
4.
iii) ¿Cuál debe ser el valor de n para que I = (X̄ − 1, X̄ + 1) sea un
intervalo de confianza para µ del 90 %.

13. Sea X1 , X2 , . . . Xn una muestra aleatoria de una población con función


de densidad:
f (x; θ) = e−(x−θ) I(θ,∞) (x)
Halle un intervalo de confianza del 100r % para θ por el método de
la cantidad pivotal. Verifique que si r = 0.95 y n = 10 se obtiene el
intervalo del ejercicio 6.

14. Sea X1 , X2 , . . . Xn una muestra aleatoria de una población con función


de densidad:
2x
f (x; θ) = 2 I(0,θ) (x) θ>0
θ
Halle un intervalo de confianza del 100r % para θ por el método de la
cantidad pivotal.

15. Sea X1 , X2 , . . . Xn una muestra aleatoria de una población con función


de densidad:
θ
f (x; θ) = 2 I(θ,∞) (x) θ>0
x
Halle un intervalo de confianza del 100r % para θ por el método es-
tadı́stico.
Capı́tulo 2 Estimación por intervalo 67

16. Sea X1 , X2 , . . . Xn una muestra aleatoria de una población uniforme


U (0, θ). Halle un intervalo de confianza del 100r % para θ por el método
estadı́stico. Compare con el intervalo obtenido en el ejercicio 11.

17. Sea X1 , X2 , . . . Xn una muestra aleatoria de una población de bernoulli


B(θ). Halle un intervalo de confianza del 100r % para θ. Suponga n
grande.

18. Sea X1 , X2 , . . . Xn una muestra aleatoria de una población de poisson


P (θ). Halle un intervalo de confianza para θ del 100r %. Suponga n
grande.

19. Sea X1 , X2 , . . . Xn una muestra aleatoria de una población geométrica


G(θ). Halle un intervalo de confianza del 100r % para τ (θ) = (1 − θ)/θ.
Suponga n grande.

20. Sea X1 , X2 , . . . Xn una muestra aleatoria de una población exponen-


cial E(θ). Halle un intervalo de confianza del 100r % para τ (θ) = 1/θ.
Suponga n grande.

S-ar putea să vă placă și