Sunteți pe pagina 1din 34

Intervalos de Confianza

Una Muestra

Inferencia Estadística
EAS201A
Segundo Semestre 2013
Introducción

Un segundo método que utilizaremos para estimar un


parámetro desconocido 𝜃 de una población Y con
distribución conocida 𝑓(𝑦; 𝜃) , son los llamados
Intervalos de Confianza (IC) .

Su construcción se sustenta en la siguiente propiedad.

“Todo estimador del parámetro desconocido 𝜃 es una


variable aleatoria, por lo cual debe tener asociada alguna
distribución de probabilidad”

Segundo Semestre 2013 EAS201A 2


Introducción

Las distribuciones muestrales más usuales son: Normal,


Chi-Cuadrado, t de Student, F de Fischer.

En base a dichas distribuciones, podemos calcular


probabilidades, y así entonces combinaremos las
probabilidades con las muestras aleatorias.

Segundo Semestre 2013 EAS201A 3


Ejemplo

Sea: 𝑌1, 𝑌2, 𝑌3, … , 𝑌𝑛 una muestra aleatoria de tamaño


n de la distribución Normal(𝜇, 2). Sabemos que el
EMV de 𝜇 es 𝑌, el cual tiene asociada una distribución
de probabilidades, tal que podemos hacer la siguiente
afirmación:
 
P   2       2    0,9544
 
  
P  2    2   0,9544  n n
 
 n 

Segundo Semestre 2013 EAS201A 4


Ejemplo

Dado que 𝑌 es una variable aleatoria entonces este


intervalo resulta ser un Intervalo Aleatorio. Además como
en la inferencia clásica se asume que 𝜇 es una constante,
entonces la interpretación dicha probabilidad es:

“La probabilidad que el intervalo aleatorio: contenga a la


𝒎𝒆𝒅𝒊𝒂 𝝁 es 95,44%”

   
Y  2 , Y  2 
 n n

Segundo Semestre 2013 EAS201A 5


Ejemplo

Bajo la interpretación frecuentista de la probabilidad,


Afirmamos que: Cualesquiera sea el verdadero valor de
𝜇, de cada 100 intervalos aleatorios generados en
forma equivalente al anterior, Aproximadamente el
95,44% de ellos deberían contener la media 𝜇.

En la realidad se selecciona una sola muestra aleatoria


de tamaño 𝑛.
Supongamos para el ejemplo que: 𝜎 = 3 ; 𝑛 = 36 ;
𝑦 = 12,1.

Segundo Semestre 2013 EAS201A 6


Ejemplo

En tal caso el intervalo resulta ser (11,1 - 13,1) el cual


es una realización del intervalo aleatorio
𝑌 − 1 ; 𝑌 + 1 de nuestro ejemplo.

En este último caso es INCORRECTO afirmar que 𝜇 esta


contenida en el intervalo (11,1 - 13,1) con una
probabilidad del 95,44%, ya que todo lo que se
encuentra en el argumento de dicha probabilidad es
constante.

Segundo Semestre 2013 EAS201A 7


Ejemplo

Sin embargo la probabilidad del 95,44% del intervalo


aleatorio induce una pseudo-probabilidad llamada
Probabilidad Fiducial, o, en su expresión más común,
Confianza. Así entonces, la siguiente afirmación es
comúnmente aceptada:

“Con una confianza del 95,44% se puede afirmar que el


intervalo ( 11,1 - 13,1) contiene a la media μ”

Segundo Semestre 2013 EAS201A 8


Definición

Sea 𝑌1, 𝑌2 , 𝑌3 , … , 𝑌𝑛 una muestra aleatoria de tamaño


𝑛 de la distribución 𝑓(𝑦; 𝜃).

Se llama Intervalo de Confianza 1– 𝛼 × 100 para el


parámetro desconocido 𝜃 , a una realización de un
Intervalo Aleatorio que con probabilidad (1– 𝛼)
contiene al parámetro 𝜃.

Segundo Semestre 2013 EAS201A 9


Ejemplo

Para el ejemplo anterior, el intervalo aleatorio


𝑌 − 1; 𝑌 + 1 contiene al parámetro 𝜇 con una
probabilidad del 95,44%.

Por lo tanto el intervalo (𝑦 − 1; 𝑦 + 1) es un Intervalo de


Confianza del 95,44% para el parámetro 𝜇, donde 𝑦
es una realización de la variable aleatoria 𝑌

Segundo Semestre 2013 EAS201A 10


Observaciones

• Niveles de confianza usuales son:

90%; 95%; 98%

• Interpretación de un IC: Es una realización o


estimación del correspondiente Intervalo Aleatorio, al
igual que en estimación puntual en que usualmente se
confunde Estimador con Estimación, al Intervalo
Aleatorio simplemente se le llama IC.

Segundo Semestre 2013 EAS201A 11


Observaciones

• Los IC pueden ser bilaterales o unilaterales, para el


caso que el parámetro 𝜃 representa la media de una
distribución entonces el formato de los respectivos
IdeC será de la siguiente forma:
 (𝜃 − 𝑒, 𝜃 + 𝑒) Bilateral Simétrico.
 (𝜃 − 𝑒, ∞) Unilateral Inferior (Izquierdo) o Cota
Inferior.
 (−∞, 𝜃 + 𝑒 ) Unilateral Superior (Derecho) o
Cota superior.
“e”: Error de estimación o Error de muestreo o
Margen de error
Segundo Semestre 2013 EAS201A 12
Construcción de un IC vía Pivote

Un método útil para construir los IC es el de la Cantidad


Pivotal.
Los Pivotes son variables aleatorias construidas a partir
de las distribuciones muestrales, los cuales tienen la
siguiente propiedad:
En el formato del Pivote explícitamente aparece el
parámetro 𝜃 y la muestra aleatoria, no obstante la
distribución de probabilidades no depende de dicho
parámetro.

Segundo Semestre 2013 EAS201A 13


Construcción de un IC vía Pivote

Definición: Sea 𝑌1, 𝑌2, 𝑌3, … , 𝑌𝑛 una muestra aleatoria


de tamaño 𝑛 de la distribución discreta o continua
𝑓(𝑦 ; 𝜃).

Sea la función 𝑄 = 𝑞(𝑌1, 𝑌2 , 𝑌3 , … , 𝑌𝑛; 𝜃), la cual


depende simultáneamente de la muestra aleatoria y del
parámetro 𝜃.

Si la distribución de probabilidades de 𝑄 es
independiente del parámetro 𝜃 , entonces 𝑄 es una
Cantidad Pivotal o Pivote.
Segundo Semestre 2013 EAS201A 14
Ejemplos de Pivotes

Sea 𝑌1, 𝑌2, 𝑌3, … , 𝑌𝑛 una muestra aleatoria de tamaño


𝑛 de la distribución Normal(𝜇, 2)

En este caso tres son los pivotes usuales:

Y−μ
• 𝑍=σ ≈ Normal(0, 1)
n

Es un Pivote para 𝜇 asumiendo que 𝜎 es conocido.

Segundo Semestre 2013 EAS201A 15


Ejemplos de Pivotes
(𝑛−1)𝑆 2
• 𝑊= ≈ 𝜒 2 (𝑛 − 1)
𝜎2

Es un Pivote para 𝜎 2 , con 𝜇 desconocido.

Y−μ
• 𝑇=𝑆 ≈ t − Student(𝑛 − 1)
n

Es un Pivote para 𝜇 asumiendo que 𝜎 es desconocido.

Segundo Semestre 2013 EAS201A 16


IC para 𝜇 con 𝜎 conocido

Sea 𝑌1, 𝑌2, 𝑌3, … , 𝑌𝑛 una muestra aleatoria de tamaño


𝑛 de la distribución Normal(𝜇, 2).

Segundo Semestre 2013 EAS201A 17


IC para 𝜇 con 𝜎 conocido

Entonces el IC al 1– 𝛼 × 100% para 𝜇 es:

𝜎 𝜎
𝑦 − 𝑧1−𝛼 2 ∗ ;𝑦 + 𝑧1−𝛼 2 ∗
𝑛 𝑛

𝛼
Donde 𝑧1−𝛼 es el percentil 1 – × 100% de una
2 2
Normal(0,1).

Segundo Semestre 2013 EAS201A 18


IC para 𝜇 con 𝜎 desconocido

Sea 𝑌1, 𝑌2, 𝑌3, … , 𝑌𝑛 una muestra aleatoria de tamaño


𝑛 < 30 de la distribución Normal(𝜇, 2).

Segundo Semestre 2013 EAS201A 19


IC para 𝜇 con 𝜎 desconocido

Entonces el IC al 1– 𝛼 × 100% para 𝜇 es:

𝑆 𝑆
𝑦 − 𝑡1−𝛼 2 𝑛 − 1 ⋅ ;𝑦 + 𝑡1−𝛼 2 𝑛 − 1 ⋅
𝑛 𝑛

𝛼
Donde 𝑡1−𝛼 (𝑛 − 1) es el percentil 1 – × 100% de
2 2
2 1 𝑛
una t-Student 𝑛 − 1 y 𝑆 = 𝑖=1 𝑌𝑖 − 𝑌 2 .
𝑛−1

Segundo Semestre 2013 EAS201A 20


Intervalos de Confianza Asintóticos

En el caso anterior la muestra sea grande, esto es


𝑛 ≥ 30 , la distribución t-Student tiende a la
Normal(0,1), por lo tanto el IC se transforma en:

𝑆 𝑆
𝑌 − 𝑍1− 𝛼 ⋅ ; 𝑌 + 𝑍1− 𝛼 ⋅
2 𝑛 2 𝑛

De acuerdo al TLC para 𝑛 ≥ 30 la normalidad de la


población no es necesaria, así en este caso podemos
extender el IC para la media 𝜇 para otros modelos
Segundo Semestre 2013 EAS201A 21
Intervalos de Confianza Asintóticos

Modelo Media (  ) ˆ Varianza( 2 ) ˆ 2 IdeC (  )


 p(1  p) p(1  p) 
B(1,  )  p  (1   ) p(1  p)  p  z1 * , p  z1 * 

 2 n 2 n 
 y y
P ( )  Y  Y y  z  , y  z1 
 1
* *
n 
 2 n 2

1 1  y y 
exp( ) Y Y2  y  z1 * , y  z1 * 
 2  2 n 2 n

Segundo Semestre 2013 EAS201A 22


Intervalos de Confianza Asintóticos

La fórmula genérica para un Intervalo Asintótico de


Confianza al 1– 𝛼 × 100% para una media 𝜇 es:

𝜇 − 𝑍1−𝛼 ⋅ Var 𝜇 ≤ 𝜇 ≤ 𝜇 + 𝑍1−𝛼 ⋅ Var 𝜇


2 2

Segundo Semestre 2013 EAS201A 23


Intervalos de Confianza Asintóticos

Una expresión alternativa que se tiene cuando se


construyen los intervalos de confianza y que podemos
destacar en este caso particular de muestras grandes es
la siguiente:
𝑃 𝜇 − 𝜇 ≤ 𝑍1−𝛼 ⋅ Var 𝜇 =1−𝛼
2
Una interpretación que podemos hacer en este caso es
que con una confianza del 1– 𝛼 × 100% podemos
afirmar que la distancia entre el estimador y la media
poblacional es a lo mas igual al error de estimación.

Segundo Semestre 2013 EAS201A 24


Observaciones

• La Amplitud de un IC es 𝐴 = 𝐿𝑆 – 𝐿𝐼 , así por


ejemplo en el caso de muestras grandes, la amplitud
para el IC para 𝜇 es:

𝐴 = 2 ⋅ 𝑧1−𝛼 ⋅ 𝜎 𝑛
= 2 ⋅ 𝑧1−𝛼 ⋅ 𝑆𝐸
2 2

• Nótese que el error de estimación es igual al


percentil multiplicado por error estándar (SE) del
estimador.

Segundo Semestre 2013 EAS201A 25


Observaciones

• Nótese que tanto la Amplitud como el error de


estimación son directamente proporcionales a la
confianza y la desviación estándar, e inversamente
proporcionales al tamaño de muestra.

Segundo Semestre 2013 EAS201A 26


Observaciones

• Si deseamos obtener los Intervalos de Confianza


Unilaterales o Cotas de Confianza, la regla
nemotécnica para obtenerlos fácilmente es eliminar el
límite que no interesa y en el e.e. eliminar el número 2
de 𝛼/2 , así entonces para la Cota de Confianza en el
caso de muestras pequeñas para la media 𝜇:
𝑆
 Unilateral Superior: 𝜇 ≤ 𝑦 + 𝑡1−𝛼 𝑛 − 1 ⋅ .
𝑛
𝑆
 Unilateral Inferior: 𝜇 ≥ 𝑦 − 𝑡1−𝛼 𝑛 − 1 ⋅ .
𝑛

Segundo Semestre 2013 EAS201A 27


Intervalo de Confianza para 𝜎

Sea 𝑌1, 𝑌2, 𝑌3, … , 𝑌𝑛 una muestra aleatoria de tamaño


𝑛 de la distribución Normal(𝜇, 2).

Segundo Semestre 2013 EAS201A 28


Intervalo de Confianza para 𝜎

Entonces el IC al 1– 𝛼 × 100% para 𝜎 2 es:

𝑛−1 ⋅𝑆 2 𝑛−1 ⋅𝑆 2
;
𝜒2 𝛼 𝜒2 𝛼
𝑛−1 ; 1− 𝑛−1 ;
2 2

Donde 𝜒 2𝑛−1 ;𝑝 es el percentil 𝑝 × 100% de una Chi-


1 𝑛
Cuadrado 𝑛 − 1 y 𝑆2 = 𝑖=1 𝑌𝑖 − 𝑌 2 .
𝑛−1

Segundo Semestre 2013 EAS201A 29


Intervalo de Confianza para 𝑔(𝜃)

Supongamos que conocemos el IC al 1– 𝛼 × 100%


para un parámetro 𝜃, esto es,
𝐿𝐼 ≤ 𝜃 ≤ 𝐿𝑆.
Consideremos una función monótona de 𝜃 digamos
𝑔(𝜃), entonces:

• Si 𝑔(𝜃) es monótona creciente, entonces:


𝑔 𝐿𝐼 ≤ 𝑔 𝜃 ≤ 𝑔 𝐿𝑆
Es un IC al 1– 𝛼 × 100% para el parámetro 𝑔(𝜃).

Segundo Semestre 2013 EAS201A 30


Intervalo de Confianza para 𝑔(𝜃)

• Si 𝑔(𝜃) es monótona creciente, entonces:


𝑔 𝐿𝑆 ≤ 𝑔 𝜃 ≤ 𝑔 𝐿𝐼
Es un IC al 1– 𝛼 × 100% para el parámetro 𝑔(𝜃).

Así por ejemplo si usted está interesado en obtener un


IC para la desviación estándar , entonces previamente
obtiene un IC para la varianza 2 y luego extrae raíz
cuadrada a ambos extremos del intervalo para obtener
el intervalo pedido, sin cambiar el orden de los límites
ya que la función raíz es creciente.

Segundo Semestre 2013 EAS201A 31


IC Asintótico para 𝜃 y 𝑔(𝜃)

Ya obtuvimos IC asintóticos o de muestras grandes en


base al TLC.

Las propiedades asintóticas de los EMV nos entregan


una alternativa que en muchos casos llega al mismo
intervalo ya obtenido por el TLC.

Recordemos que si 𝜃𝑀𝑉 es el EMV del parámetro θ,


entonces la distribución de dicho estimador para el
caso de muestras grandes será asintóticamente
Normal.
Segundo Semestre 2013 EAS201A 32
IC Asintótico para 𝜃 y 𝑔(𝜃)

Es decir es

𝜃𝑀𝑉 ≈ 𝑁 𝜃, 𝐶𝐶𝑅 𝜃

Usando esta propiedad se puede construir el Pivote


apropiado para obtener el IC para el parámetro 𝜃.

Segundo Semestre 2013 EAS201A 33


IC Asintótico para 𝜃 y 𝑔(𝜃)

Si se desea obtener un IC asintótico para una función


del parámetro, digamos 𝑔(𝜃) , entonces se debe
construir el pivote basándose en la siguiente propiedad
de los EMV:

2
𝜕𝑔(𝜃)
𝑔 𝜃𝑀𝑉 ≈ 𝑁 𝑔 𝜃 , 𝐶𝐶𝑅 𝜃 ∗
𝜕𝜃

Segundo Semestre 2013 EAS201A 34

S-ar putea să vă placă și