2014-I Estadística I - Notas de Intervalos de Confianza

1.
Estimaci on por intervalo

Ya se ha estudiado el problema de estimacion puntual. En esta parte, se abordara el tema rela-
cionada con la b usqueda de un margen de variacion para el parametro, es decir, el problema de
estimacion por intervalo.
La idea de estas notas es tener un breve material parcialmente autocontenido, con algunos ejem-
plos teoricos y otros practicos, algunos utilizando el software estadstico R.
Como se hace en la estimacion puntual, se utilizaran algunas familias parametricas para hacer
inferencia acerca de la distribucion acerca de la cual proviene la muestra.
1.1. Introducci on a los intervalos de conanza usando simulaci on
Para explorar de manera inicial los conceptos de intervalos de conanza de manera practica,
primero se considerara un ejemplo.
Ejemplo:
Supongase que en una poblacion hay 10,000 personas; cada una con una opinion (fuerte) acerca
de alguna armacion (por ejemplo la postura ante el aborto, ante los matrimonios entre personas
del mismo sexo, preferencia poltica, etc).
Se desea conocer la proporcion de la poblacion que esta en favor de la armacion. Generalmente,
suena un tanto irracional el querer preguntarle a cada una de las personas de la poblacion (tengan
en mente que 10,000 a un es accesible, pero 1,000,000,000 ya no). Por esto, se hara un muestreo
aleatorio de 100 personas. Se denotara por p a la proporcion muestral y a p a la proporcion real,
que se puede armar de p dado que p ya se conoce?
Para contextualizar un poco mas, en terminos de probabilidad, (ya que los probabilistas amamos
las urnas!!!) imagnese que se tienen 10,000 bolas dentro de una urna de tal manera que la proporcion
p esta etiquetada con el 1 y las restantes etiquetadas con el 0. En este contexto se seleccionan
100 bolas de manera aleatoria y se contaran los 1s (que sera la etiqueta para los que estan de
acuerdo con la armacion).
Con nes didacticos, primero se supondra que se conoce la proporcion real, supongase p = 0.56.
Esto es, 5600 personas estan a favor de la armacion y 4400 estan en contra.
En R, para hacer un muestreo sin reemplazo se utilizara la funcion sample().
> poblacion=rep(0:1,c(4400,5600)) #se creo un vector con 4400 ceros y 5600 unos
> muestreomedio=mean(sample(poblacion,100)) #se tomo una muestra de tama~no 100
y se obtuvo el promedio de los datos obtenidos
> muestreomedio # resultado de la simulacion
[1] 0.56
> muestreomedio=mean(sample(poblacion,100))
> muestreomedio # resultado de la simulacion de nuevo
[1] 0.58
[1] 0.55
[1] 0.44
NOTA: El 0.56, 0.58, 0.55 y 0.44 seguramente no saldran al momento que usted intente repro-
ducir el codigo anterior, pues se hicieron simulaciones aleatorias.
En este ejemplo, se uso de la funcion mean() para encontrar la proporcion. Si se hace esta
simulacion 1,000 veces se tendra un buen entendimiento de p. Para seguir con esta idea considerense
las siguientes instrucciones:
> poblacion=rep(0:1,c(4400,5600))
> result=c()
> for(i in 1:1000) result[i]=mean(sample(poblacion,100))
El vector result tiene 1000 entradas, donde en cada una de ellas tiene una simulacion de la
proporcion p, i.e. se tienen 1000 valores simulados para p. Ahora, se utilizara la funcion quantile()
para determinar intervalos con un nivel de conanza del 80 %, 90 % y 95 %, respectivamente.
> quantile(result,c(0.1,0.9)) # 80% del tiempo
10% 90%
0.49 0.63
5% 95%
0.48 0.65
2.5% 97.5%
0.46975 0.66000
Estos intervalos sugieren las siguientes probabilidades:
P(0.49 p 0.63), P(0.48 p 0.65) y P(0.46975 p 0.66)
Se interpreta esto imaginando que se selecciona una de entre 1,000 muestras aleatoriamente y
se hace preguntas acerca de la probabilidad de que en esta muestra aleatoria p se encuentre en este
rango. Y apelando a un razonamiento de muchas repeticiones esta probabilidad debe ser cercana
a la misma armacion con respecto al p real.
En este ejemplo se sabe que p = 0.56. Reescribiendo 0.49 = p 0.07 y 0.63 = p + 0.07, entonces
se puede reescribir la primera probabilidad de la siguiente manera:
P(p 0.07 p p + 0.07) = 0.08 o equivalentemente P(0.07 p p 0.07) = 0.08
Esto dice que la distancia entre p y p es menor que 0.07 con un 80 % de probabilidad. Se puede
armar esto para cualquier porcentaje, no solo para el 80 %. Entonces se puede establecer la sigu-
iente relacion: Para una probabilidad ja se puede encontrar una cantidad a traves de la cual la
distancia entre p y p sea menor que esta cantidad con la probabilidad dada.
Sin embargo, la probabilidad P(p 0.07 p p + 0.07) = 0.08 tambien se puede escribir como
P( p 0.07 p p +0.07) = 0.08. Esto es de un valor aleatoriamente seleccionado para p, se puede
encontrar un intervalo ( p 0.07, p +0.07) que contiene a p con un 80 % de conanza (notese que ya
no se puede hablar de probabilidad pues p no es aleatorio)
2
El analisis que se hizo para esta primera probabilidad, tambien se puede hacer de la misma man-
era para las probabilidades P(0.48 p 0.65) y P(0.46975 p 0.66) = 0.95. Si se selecciona una
probabilidad, se puede encontrar un intervalo alrededor de una valor muestral para p que contenga
a p con un nivel de conanza acorde con la probabilidad jada. Dicho intervalo es llamado intervalo
de conanza para p con cierto nivel de conanza.
Ahora, se introducira el concepto de intervalo de conanza de manera mas formal.
1.2. Intervalos de conanza
El problema consiste en lo siguiente: si y se quiere disminuir el grado de desconocimiento
de , se debe seleccionar un subconjunto
1
de en el cual pueda armarse con un margen de error
peque no que se encuentra el valor de que caracteriza la distribucion de la poblacion.
Ejemplo:
Sea X
1
, . . . , X
n
una muestra aleatoria de la distribucion N(,
2
) . Con desconocida y
2
conocida. La estadistica T(X) =

X tiene distribucion N(,
2
/n). Entonces,
Z :=
X
/
n
N(0, 1)
Notese que
P[1.96 < Z < 1.96] = (1.96)(1.96) = (1.96)(1(1.96)) = 2(1.96)1 = 2(0.9725)1 = 0.95
A partir de que se sabe que P[1.96 < Z < 1.96] = 0.95, se obtiene lo siguiente:
1.96 <
X
/
n
< 1.96
si y solo si
1.96

n
<

X < 1.96

n
si y solo si
X 1.96

n
< <

X + 1.96

n
De donde:
P
_
X 1.96

n
< <

X + 1.96

n
_
= 0.95
Denicion 1.1 Un intervalo en el que al menos uno de los extremos es una variable aleatoria se
llama intervalo aleatorio.
Lo que indica la expresion
P
_
X 1.96

n
< <

X + 1.96

n
_
= 0.95
es que hay una probabilidad de 0.95 de obtener una muestra tal que el intervalo
_
X 1.96

n
,

X + 1.96

n
_
incluya al valor de .
3
Una vez usada la distribucion de

X para establecer la conclusion anterior, se obtiene un valor
particular de x, con base en una muestra, y se determina el intervalo numerico
_
x 1.96

n
, x + 1.96

n
_
En este caso no tiene sentido hablar de la probabilidad de que el intervalo aleatorio contenga al
parametro, ya que no hay ninguna variable aleatoria. Ahora, el 0.95 expresa el margen de conanza
con el que se puede armar que el valor desconocido de esta entre los extremos del intervalo,
en el sentido de que repitiendo el muestreo, un gran n umero de veces, se obtendran intervalos dis-
tintos, entre los cuales aproximadamente el 95 % de estos intervalos contendran el valor correcto de .
Por lo tanto, el intervalo numerico
_
x 1.96

n
, x + 1.96

n
_
se llama intervalo de conanza
para con un nivel del 95 %.
Si se desea un intervalo del 99 % de conanza en el caso anterior, primero se debe observar que:
P[2.576 < Z < 2.576] = 0.99
Entonces,
_
x 2.576

n
, x + 2.576

n
_
es un intervalo del 99 % de conanza para .
Observese que a mayor nivel de conanza, mayor es la longitud del intervalo. Usualmente se ja
un nivel de conanza y se acepta el intervalo que resulte.
Observese tambien que en el primer ejemplo
_
x 1.96

n
, x + 1.96

n
_
no es el unico intervalo
del 95 % de conanza para , pues P[1.74 < Z < 2.37)] = (2.37) (1.74) = (2.37) 1 +
(1.74) = 0.95. Sin embargo, el de longitud mnima es el originado por P[1.96 < Z < 1.96] = 0.95.
En general, si se tiene para este problema que:
P
_
a <
X
/
n
< b
_
=
Entonces,
a <
X
/
n
< b a

n
<

X < b

n

X b

n
< <

X a

n
Y se quiere minimizar la longitud del intervalo, es decir: (b a)

n
con la restriccion de que
P[1.96 < Z < 1.96] = 0.95, es decir, F(b) F(a) = 0.95.
Se dene la funcion L = b a (F(b) F(a) 0.95). Entonces,
L
a
= 0 1 +f(a) = 0 f(a) = 1 y tambien
L
b
= 0 1 +f(b) = 0 f(b) = 1
De donde f(a) = f(b), por tanto a = b debido a la simetra de f
Z
. Es decir, la distancia b a
sera minimizada (para un area ja) cuando f(a) = f(b).
4
Denicion 1.2 Sea X
1
, . . . , X
n
una muestra aleatoria de la densidad f(x; ). Sean T
1
(X) y T
2
(X)
de forma que T
1
T
2
y P(T
1
< () < T
2
) = ( no depende de ). Entonces (T
1
, T
2
) es llamado
un intervalo aleatorio y (t
1
, t
2
) un valor del intervalo aleatorio es llamado un intervalo de conanza,
o un intervalo de (100 %) de conanza para ().
Notese que alguna de las dos estadsticas (pero no ambas) T
1
(X) o T
2
(X) puede ser constante;
es decir, alguno de los dos extremos del intervalo aleatorio (T
1
, T
2
) puede ser constante.
Denicion 1.3 Sea X
1
, . . . , X
n
una muestra aleatoria de la densidad f(x; ). Sean T
1
(X) una es-
tadstica para la cual P(T
1
< ()) = ; entonces T
1
induce el intervalo de conanza unilateral
inferior (t
1
(x), ) con un nivel de conanza . De manera analoga, si T
2
(X) es una estadstica
para la cual P(() < T
2
) = ; entronces T
2
induce el intervalo de conanza unilateral superior
(, t
2
(x)) con un nivel de conanza ( no depende de ).
Ejemplo:
Si X
1
, . . . , X
n
es una muestra aleatoria de la distribucion N(, 9). Sean T
1
(X) :=

X
6
n
y
T
2
(X) :=

X +
6
n
. Entonces (T
1
, T
2
) forma un intervalo de conanza para () = cuyo nivel de
conanza = P[

X
6
n
< <

X +
6
n
] = P[2 <

X
3/
n
< 2] = (2) (2) = 2 (2) 1 =
2(0.9972) 1 = 0.9544. Por ejemplo, si se tiene una muestra aleatoria de 25 observaciones, con una
media muestral de 17.5, entonces se dice que
_
17.5
6
25
, 17.5 +
6
25
_
es un intervalo del 95.44 %
de conanza para .
Nota:
Si ya se ha determinado un intervalo de conanza para , entonces, se puede determinar una
familia de intervalos de conanza. De manera mas especca, para un nivel de conanza del (100 %)
dado; si se tiene un intervalo de conanza para al (100 %) de conanza, entonces se puede obtener
un intervalo con el mismo nivel de conanza para () donde es una funcion creciente (estricta).
Por ejemplo, si es una funcion creciente y (T
1
, T
2
) es un intervalo de conanza para , entonces
((T
1
), (T
2
)) es un intervalo de conanza para () pues
= P[T
1
(X) < < T
2
(X)] = P[(T
1
(X)) < () < (T
2
(X))]
En la siguiente subseccion se describira un metodo para encontrar intervalos de conanza. Dicha
metodologa se conoce como el metodo de cantidades pivotales.
1.3. Metodo pivotal para encontrar intervalos de conanza
Denicion 1.4 Sea X
1
, . . . , X
n
una muestra aleatoria de la densidad f(x; ). Sea Q = q(X
1
, X
2
, ..., X
n
; )
(es decir, una funcion de la muestra aleatoria y de ). Si la distribuci on de Q no depende de , en-
tonces a Q se le llama cantidad pivotal.
Ejemplo:
Si X
1
, . . . , X
n
es una muestra aleatoria de la distribucion N(, 1), () = ,

X N(,
1
n
) En-
tonces, Q
1
:=
(

X)
1/
n
N(0, 1).Q
1
es una cantidad pivotal. Tambien Q
2
:=

X es una cantidad
pivotal pues Q
2
N(0,
1
n
) (su distribucion no depende de ). Pero Q
3
:=

X
no es una cantidad
pivotal, pues Q
3
N(1,
1
2
n
)
5
Sea Q = q(x
1
, . . . , x
n
; ) una cantidad pivotal. Entonces, para cualquier (0, 1), existiran q
1
y q
2
que dependen de tal que
P[q
1
< Q < q
2
] =
Si para cada posible muestra (x
1
, . . . , x
n
) se cumple que q
1
< q(x
1
, . . . , x
n
; ) < q
2
si y solo si
t
1
(x
1
, . . . , x
n
) < () < t
2
(x
1
, . . . , x
n
) para funciones t
1
y t
2
que no dependen de , entonces (t
1
, t
2
)
es un intervalo del (100) % de conanza para ().
En este metodo, la desigualdad q
1
< Q < q
2
se reescribe, invierte o pivotea como t
1
(x) < () <
t
2
(x).
1.4. Intervalo de conanza para una proporcion poblacional p
En el primer ejemplo de estas notas, si el muestreo se hace sin remplazo entonces la distribucion
exacta de 100 p es hipergeometrica (ya que se divide en la clase I al 1 y en la clase II al 0
y de un muestreo se esta interesado en el n umero de individuos 1 en la muestra). Sin embar-
go, si el muestreo se hiciese con reemplazo, entonces la distribucion de 100 p sera Bin(100, p) (el
n umero de 1s en 100 ensayos Bernoulli). Y apelando a la aproximacion normal de la distribucion
binomial (teorema de DeMoivre Laplace) se podra decir que 100 p tiene distribucion normal, inclu-
so si el muestreo se hace con o sin reemplazo (de nuevo la teora asintotica hace su estoica aparicion).
Si se sabe que p tiene distribucion normal (aproximadamente) se puede construir un intervalo
de conanza usando esta distribucion conocida en vez de una simulaciones. Esto permitira hacer
armaciones mas generales con respecto al intervalo de conanza y su longitud.
Ya en estos terminos Gaussianos, se necesitan hacer algunas suposiciones con respecto al muestreo:
se hara muestreo con reemplazo o la poblacion de la cual se esta haciendo el muestreo es grande de
tal manera que se puedan tomar muestras de tama nos adecuados. Tambien se supondra que np y
np(1 p)son mayores que 5 (aunque, cuidado: p es desconocido).
La suposicion de distribucion binomial implica que la media de p es p y que la desviacion estandar
de p es
_
np(1 p). Por tanto, si se desea un nivel de conanza 1 , se necesita encontrar un
cuantil z
de la distribucion normal estandar de tal manera que

P(z
Z z
) = 1
Como se esta suponiendo que p se distribuye normalmente, entonces, haciendo una estandarizacion
se tiene
P(z

p p
_
np(1 p)/n
z
) = 1
O equivalentemente
P( p z
_
p(1 p)/n p p +z
_
p(1 p)/n) = 1
Por tanto, con un nivel de conanza 1 , se puede armar que p esta en el intervalo
( p z
_
p(1 p)/n, p +z
_
p(1 p)/n)
Esto, casi especica un intervalo de conanza, excepto que
_
p(1 p)/n involucra el valor de-
sconocido de p (es justo lo que se quiere estimar). Es por esto, que en virtud del Teorema del Lmite
Central se supondra que
_
p(1 p)/n
_
p(1 p)/n si n es sucientemente grande. A
_
p(1 p)/n
6
se le conoce como el error estandar de p. Ahora s, se puede armar que, con un nivel de conan-
za 1, p esta en el intervalo ( pz
_
p(1 p)/n, p+z
_
p(1 p)/n) para n sucientemente grande.
La manera de encontrar z
para un (0, 1) jo, es encontrando z
para el cual

2
= P(Z z
)
o equivalentemente P(Z z
) = 1

2
, donde Z N(0, 1). En R,
> zestrella=-qnorm(alpha/2)
> zestrella=qnorm(1-alpha/2)
La relacion inversa puede encontrarse de la siguiente manera:
>alpha=2*pnorm(-zestrella)
Ejemplo:
En una encuesta de Zogby America participan 1013 posibles votantes elegidos al azar a traves
de los 48 estados contiguos de Estados Unidos con de n umeros telefonicos residenciales. El estudio
encontro que 466 electores calicaron el desempe no del trabajo del presidente como bueno o ex-
celente. Encuentre un intervalo de conanza del 95 % para la proporcion real.
Este tipo de encuestas es lo mas cercano a una muestra aleatoria cuando se cuenta recursos
limitados, sin embargo hay varias fuentes de posibles sesgos a considerar. Por ejemplo, no todo el
mundo en Estados Unidos tiene un n umero telefonico residencial, por lo que la muestra es solo de
las familias que lo tienen. Ademas, la falta de respuesta puede ser muy alta en tales encuestas,
introducciendo otro sesgo potencial. Para simplicar, se supondra que la muestra es una muestra
aleatoria de la poblacion de los posibles votantes y que n = 1013 es lo sucientemente grande como
para que la aproximacion normal se pueda utilizar.
Como p = 466/1013 el intervalo de conanza estara dado por p z
_
p(1 p)/n. En R
> n=1013
> p_gorro=466/n
> errorest=sqrt(p_gorro*(1-p_gorro)/n)
> alpha=0.05
> zestrella=-qnorm(alpha/2)
> zestrella
[1] 1.959964
> c(p_gorro-zestrella*errorest,p_gorro+zestrella*errorest)
[1] 0.4293281 0.4907114
La ultima lnea se puede simplicar de la siguiente manera
> p_gorro+c(-1,1)*zestrella*errorest
[1] 0.4293281 0.4907114
Ejemplo:
En algunos periodicos, los resultados de algunos estudios estadsticos aparecen en terminos de
las proporciones muestrales del tipo El 90 % de los mexicanos preere tal cosa, el 80 % de los
automovilistas ... y acompa nados de estas armaciones los periodicos serios muestran un margen
de error. Sin embargo, el nivel de conanza no aparece pero se puede encontrar a partir de tres
cantidades conocidas. Por ejemplo, si el estudio tiene p = 0.37, n = 1000 y un margen de error
del 3 %, cual es el valor de ? Suponiendo que el estudio se hizo con un muestreo aleatorio,
z
_
0.57(1 0.57)/1000 = 0.03. Resolver para z
y entonces para 1 en R se tiene:

7
> zestrella=0.03/sqrt(0.57*(1-0.57)/1000)
> zestrella
[1] 1.916239
> alpha=2*pnorm(-zestrella)
> alpha
[1] 0.05533472
> 1-alpha
[1] 0.9446653
Es decir, que hay un nivel de conanza del 95 % implicado en dicho estudio.
1.4.1. Funcion prop.test() para encontrar intervalos de conanza
Los ejemplos anteriores se hicieron para mostrar la metodologa general en la construccion de
intervalos de conanza para proporciones, sin embargo, R tiene una funcion prop.test() que facilita
la obtencion de dichos intervalos de conanza. La sintaxis general para esto es
prop.test(x, n, conf.level=0.95, conf.int=TRUE)
La frecuencia de la caracterstica medida por la proporcion es introducida en x, el tama no de la
muestra en n; y un nivel de conanza se ja con conf.level=, estos tres parametros deben incluirse
para la construccion de un intervalo de conanza. El nivel de conanza por default es el de 0.95; y
el comando conf.int=TRUE indica que el output del comando sera un intervalo.
Ejemplo:
En el ejemplo de la empresa Zogby, n = 1013, x = n p = 466 y 1 = 0.95. El intervalo de
conanza es encontrado con la instruccion
> prop.test(466,1013,conf.level=0.95)
1-sample proportions test with continuity correction
data: 466 out of 1013, null probability 0.5
X-squared = 6.3179, df=1, p-value = 0.01195
alternative hypothesis: true p is not equal to 0.5
95 percent confidence interval:
0.4290475 0.4912989
sample estimates:
p
0.4600197
Los resultados en R arrojan mas informacion de la que se puede interpretar hasta el momen-
to. Justo despues de la lnea que dice 95 % percent confidence interval: aparecen dos valores
0.4290475 y 0.4912989, que son los extremos del intervalo. Estos son ligeramente diferentes a los que
se obtuvieron anteriormente; esto se debe a que la funcion prop.test() resuelve numericamente la
ecuacion dada por
P
_
z

p p
_
p(1 p)n
z
_
= 1
8
en vez de hacer la aproximacion del teorema del lmite central.
NOTA: Se puede utilizar la funcion binom.test() con la misma sintaxis en el caso de que se
desee usar la distribucion binomial en lugar de la aproximacion normal.
1.5. Intervalos de conanza para parametros de una poblaci on normal
Primero se recordaran algunos resultados tecnicos para facilitar la construccion de dichos inter-
valos. La demostracion de dichos resultados se omitira en virtud de que el objetivo de estas notas
es el entendimiento intuitivo de la construccion de intervalos de conanza.
(a) Si X N(0, 1), entonces X
2

2
(1)
(b) Si X
1
, . . . , X
n
son variables aleatorias independientes tales que para cualquier j {1, . . . , n}
X
j

2
(m
j
), entonces X
1
+ +X
n

2
(m
1
+ +m
n
)
(c) Si X
1
, . . . , X
n
X
j
N(,
2
), entonces
n
j=1
(X
j
)
2
2

2
(n)
(d) Si X
1
, . . . , X
n
X
j
N(,
2
), entonces
n 1
2
S
2

2
(n 1)
(e) Si X, Y son variables aleatorias independientes tales que X N(0, 1) y Y
2
(k), entonces
X
_
Y/k
t(k)
(f) Si X
1
, . . . , X
n
es una muestra aleatoria de la distribucion N(,
2
), entonces
X
S/
n
t(n 1)
(g) Si U, V son variables aleatorias independientes tales que U
2
(n) y V
2
(m), entonces
X/n
Y/m
F(n, m)
Ahora, se encontraran intervalos de conanza para algunas cantidades relacionadas con pobla-
ciones Gaussianas.
1.5.1. Intervalos para la media
Caso 1:
2
conocida.
Sea X
1
, . . . , X
n
2
) con
2
conocida.
Se sabe que

X N(,
2
/n), entonces

X
/
n
N(0, 1).
9
La cantidad pivotal es Q =

X
/
n
. De aqu que Q N(0, 1).
Sean z
/2
, z
1/2
R tales que P(Q z
/2
) = /2 y P(Q z
1/2
) = 1 /2.
Notese que P(z
/2
< Q < z
1/2
) = P(Q z
1/2
) P(Q z
/2
) = (1 /2) /2 = 1 .
P(z
/2
< Q < z
1/2
) = 1
Tambien notese que por simetra de la densidad normal estandar z
/2
= z
1/2
.
Por ejemplo, si 1 = 0.95, entonces = 0.05, entonces 1 /2 = 0.975 y z
0.975
= 1.96.
Entonces,
P(z
1/2
< Q < z
1/2
) = 1 P
_
z
1/2
<
X
/
n
< z
1/2
_
= 1
P
_
z
1/2
n
<

X < z
1/2
n
_
= 1
P
_
z
1/2
n

X < < z
1/2
n

X
_
= 1
P
_
X z
1/2
n
< <

X +z
1/2
n
_
= 1
Un intervalo del 100(1 ) % de conanza para cuando
2
es conocida esta dado por
_
X z
1/2
n
,

X +z
1/2
n
_
Caso 2:
2
desconocida.
Sea X
1
, . . . , X
n
2
) donde y
2
son descono-
cidos.
Se sabe que

X
/
n
N(0, 1) y
(n1)S
2
2

2
(n 1). Entonces,
X
/
n
_
(n1)S
2
2
n1
t(n 1)
Pero,
X
/
n
_
(n1)S
2
2
n1
=
X
/
n
_
S
2
2
=
n(

X)
n(

X )
S
=
X
S/
n
, donde S :=
S
2

X
S/
n
t(n 1)
Es decir, la cantidad pivotal es Q =

X
S/
n
Entonces,
10
P
_
t
1/2
n1
< Q < t
1/2
n1
_
= 1 P
_
t
1/2
n1
<
X
S/
n
< t
1/2
n1
_
= 1
P
_
t
1/2
n1

S
n
<

X < t
1/2
n1

S
n
_
= 1
P
_
X t
1/2
n1

S
n
< <
X +t
1/2
n1

S
n
_
= 1
P
_
X t
1/2
n1

S
n
< <

X +t
1/2
n1

S
n
_
= 1
Un intervalo del 100(1 ) % de conanza para cuando
2
es desconocida esta dado por
_
X t
1/2
n1

S
n
,

X +t
1/2
n1

S
n
_
Donde t
1/2
n1
R es tal que P
_
Y t
1/2
n1
_
= 1 /2, donde Y t(n 1).
1.5.2. Intervalo para la varianza
Sea X
1
, . . . , X
n
2
) con y
2
desconocidos.
Se sabe que
(n1)S
2
2

2
(n 1).
Por tanto, la cantidad pivotal es Q =
(n1)S
2
2
.
Se necesita determinar los cuantiles x
/2
n1
, x
1/2
n1
R tales que
P(x
/2
n1
< Q < x
1/2
n1
) = 1
Es decir, P(Q x
1/2
n1
) P(Q x
/2
n1
) = (1 /2) (/2) = 1 .
Ahora, P(x
/2
n1
< Q < x
1/2
n1
) = 1 P(x
/2
n1
<
(n1)S
2
2
< x
1/2
n1
) = 1
P
_
1
x
/2
n1
>

2
(n 1)S
2
>
1
x
1/2
n1
_
= 1 P
_
(n 1)S
2
x
1/2
n1
<
2
<
(n 1)S
2
x
/2
n1
_
= 1
Un intervalo del 100(1 ) % de conanza para
2
esta dado por
_
(n 1)S
2
x
1/2
n1
,
(n 1)S
2
x
/2
n1
_
Por ejemplo, si n = 12 y 1 = 0.99, entonces = 0.01. Por tanto /2 = 0.005 y 1/2 = 0.995.
Luego entonces,
0.995
11
= 26.8 y x
0.005
11
= 2.60.
11
1.5.3. Intervalo para la diferencia de medias de poblaciones independientes
Sean X
1
, . . . , X
n
una muestra aleatoria de la distribucion N(
x
,
2
x
) y Y
1
, . . . , Y
m
una muestra
aleatoria de la distribucion N(
y
,
2
y
) donde Y
j
y X
i
son independientes.
Caso 1:
2
x
y
2
y
conocidas.
Se sabe que

X N(
x
,
2
x
/n) y

Y N(
y
,
2
y
/m), entonces

X

Y N
_
y
,

2
x
n
+

2
y
m
_
.
Por tanto,
X

Y (
x
y
)
_
2
x
n
+

2
y
m
N(0, 1)
Entonces, la cantidad pivotal esta dada por
Q =
X

Y (
x
y
)
_
2
x
n
+

2
y
m
De aqu que
P
_
z
1/2
< Q < z
1/2
_
= 1
P
_
_
z
1/2
<
X

Y (
x
y
)
_
2
x
n
+

2
y
m
< z
1/2
_
_
= 1
P
_
_
z
1/2
2
x
n
+
2
y
m
<

X

Y (
x
y
) < z
1/2
2
x
n
+
2
y
m
_
_
= 1
P
_
_
(

X

Y ) z
1/2
2
x
n
+
2
y
m
< (
x
y
) < (

X

Y ) +z
1/2
2
x
n
+
2
y
m
_
_
= 1
P
_
_
(

X

Y ) z
1/2
2
x
n
+
2
y
m
<
x
y
< (

X

Y ) +z
1/2
2
x
n
+
2
y
m
_
_
= 1
x

y
, cuando
2
x
y
2
y
son conocidas,
esta dado por
_
_
(

X

Y ) z
1/2
2
x
n
+
2
y
m
, (

X

Y ) +z
1/2
2
x
n
+
2
y
m
_
_
Caso 2:
2
x
y
2
y
desconocidas pero
2
x
=
2
y
=
2
Se sabe que
(n1)S
2
x
2

2
(n 1) y
(m1)S
2
y
2

2
(m 1), entonces
(n1)S
2
x
2
+
(m1)S
2
y
2

2
(n +
m2).
2
((n 1)S
2
x
+ (m1)S
2
y
)
2
(n +m2)
Y tambien se sabe que
X

Y (
x
y
)
_
2
_
1
n
+
1
m
_
N(0, 1)
12
Entonces,
Y (xy)
2
(
1
n
+
1
m
)
_
(n1)S
2
x
+(m1)S
2
y
2
(n+m2)
t
(m+n2)
Pero,
Y (xy)
2
(
1
n
+
1
m
)
_
(n1)S
2
x
+(m1)S
2
y
2
(n+m2)
=
X

Y (
x
y
)
_
_
1
n
+
1
m
_
(n1)S
2
x
+(m1)S
2
y
n+m2
=
X

Y (
x
y
)
_
_
1
n
+
1
m
_
S
2
p
Donde S
2
p
=
(n1)S
2
x
+(m1)S
2
y
n+m2
Entonces,
X

Y (
x
y
)
_
_
1
n
+
1
m
_
S
2
p
t
(m+n2)
De aqu que Q =

X
Y (xy)
(
1
n
+
1
m
)S
2
p
sea una cantidad pivotal tal que Q t
(m+n2)
Ahora,
P
_
t
1/2
n+m2
< Q < t
1/2
n+m2
_
= 1
P
_
_
t
1/2
n+m2
<
X

Y (
x
y
)
_
_
1
n
+
1
m
_
S
2
p
< t
1/2
n+m2
_
_
= 1
P
_
(

X

Y ) t
1/2
n+m2
_
1
n
+
1
m
_
S
2
p
< (
x
y
) < (

X

Y ) +t
1/2
n+m2
_
1
n
+
1
m
_
S
2
p
_
= 1
P
_
(

X

Y ) t
1/2
n+m2
_
1
n
+
1
m
_
S
2
p
<
x
y
< (

X

Y ) +t
1/2
n+m2
_
1
n
+
1
m
_
S
2
p
_
= 1
x

y
, cuando
2
x
y
2
y
son desconocidas
pero
2
x
=
2
y
=
2
, esta dado por
_
(

X

Y ) t
1/2
n+m2
_
1
n
+
1
m
_
S
2
p
, (

X

Y ) +t
1/2
n+m2
_
1
n
+
1
m
_
S
2
p
_
1.5.4. Intervalo para el cociente de varianzas de poblaciones independientes
Sean X
1
, . . . , X
n
una muestra aleatoria de la distribucion N(
x
,
2
x
) y Y
1
, . . . , Y
n
una muestra
aleatoria de la distribucion N(
y
,
2
y
) donde Y
j
y X
i
son independientes.
Se sabe que
(n1)S
2
x
2
x

2
(n 1) y
(m1)S
2
y
2
y

2
(m1), entonces
(n1)S
2
x
2
x
n1
(m1)S
2
y
2
y
m1
F(n 1, m1)
13
Pero
(n1)S
2
x
2
x
n1
(m1)S
2
y
2
y
m1
=
S
2
x
S
2
y
2
y
2
x
De aqu que Q =
S
2
x
S
2
y

2
y
2
x
sea una cantidad pivotal tal que Q F(n 1, m1).
Se necesita determinar los cuantiles f
/2
n1,m1
f
1/2
n1,m1
Ahora,
P
_
f
/2
n1,m1
< Q < f
1/2
n1,m1
_
= 1
P
_
f
/2
n1,m1
<
S
2
x
S
2
y
2
y
2
x
< f
1/2
n1,m1
_
= 1
P
_
f
/2
n1,m1
S
2
y
S
2
x
<
2
y
2
x
< f
1/2
n1,m1
S
2
y
S
2
x
_
= 1
P
_
1
f
1/2
n1,m1
S
2
x
S
2
y
<

2
x
2
y
<
1
f
/2
n1,m1
S
2
x
S
2
y
_
= 1

2
x
2
y
esta dado por
_
1
f
1/2
n1,m1
S
2
x
S
2
y
,
1
f
/2
n1,m1
S
2
x
S
2
y
_
14

2014-I Estadística I - Notas de Intervalos de Confianza

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

2014-I Estadística I - Notas de Intervalos de Confianza

Încărcat de

Drepturi de autor:

Formate disponibile

1.

Estimaci on por intervalo

de la distribucion normal estandar de tal manera que

para un (0, 1) jo, es encontrando z

y entonces para 1 en R se tiene:

S-ar putea să vă placă și