Documente Academic
Documente Profesional
Documente Cultură
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 1 / 115
1 Introducción
2 Método Pivotal
3 Intervalos de confianza para una muestra
I.C. para la media
I.C. para la varianza de una población normal
Trabajo práctico
I.C. para la proporción
Trabajo práctico
4 Intervalos de confianza para dos muestras
IC para la diferencia de medias
I.C. para la diferencia de medias con datos apareados
σ2
IC para el cociente de varianzas X2
σY
IC para poblaciones no normales
5 Desigualdad de Tchebychev
6 Método Bootstrap
7 Intervalos de confianza bayesianos
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 2 / 115
Introducción
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 3 / 115
Introducción
Ejemplo
Con el fin de garantizar la salubridad de cierto alimento se ha llevado a
cabo un análisis que cuenta el número de bacterias que se encuentran en 9
unidades del mismo. Los recuentos han dado los siguientes resultados:
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 4 / 115
Introducción
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 5 / 115
Introducción
Definición
La estimación por intervalos de confianza consiste en determinar un
posible rango de valores o intervalo, en los que pueda precisarse –con una
determinada probabilidad– que el valor de un parámetro se encuentra
dentro de esos lı́mites.
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 6 / 115
Introducción
Definición
Dada una muestra aleatoria X1 , . . . , Xn , se denomina Intervalo de
Confianza
para el parámetro θ con nivel 1 − α, a un intervalo aleatorio
θ1 , θ2 –cuyos lı́mites dependen de la muestra– de manera que:
b b
P θb1 (X1 , . . . , Xn ) ≤ θ ≤ θb2 (X1 , . . . , Xn ) = 1 − α,
para cada θ ∈ Θ.
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 7 / 115
Introducción
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 8 / 115
Introducción
15,00
IC
10,00
5,00
0,00
3
5
7
9
21
23
25
27
29
31
33
35
37
39
41
43
45
47
49
51
53
55
57
59
61
63
65
67
69
71
73
75
77
79
81
83
85
87
89
91
93
95
97
99
1
11
13
15
17
19
Muestra
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 9 / 115
Introducción
Observación
Como por lo general sólo vamos a disponer de una muestra, tenemos que
confiar (por ejemplo con un 95% de confianza) que la muestra que
tenemos pertenece al grupo de las muestras buenas (las que nos dan una
estimación del intervalo que contiene el verdadero valor del parámetro).
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 10 / 115
Método Pivotal
El método pivotal
Para construir un IC (Intervalo de Confianza) para un parámetro θ
usaremos el llamado Método Pivotal.
Definición
Se denomina estadı́stico pivotal T (X1 , . . . , Xn ; θ) al estadı́stico cuya
distribución en el muestreo no depende de θ.
Tipificando
X −µ
σ ∼ N (0, 1)
√
n
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 11 / 115
Método Pivotal
El método pivotal
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 12 / 115
Método Pivotal
El método pivotal
4. Con lo cual,
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 13 / 115
Método Pivotal
El método pivotal
X −µ
σ ∼ N (0, 1) .
√
n
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 14 / 115
Método Pivotal
El método pivotal
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 15 / 115
Método Pivotal
Ejemplo
Supongamos que la variable X representa el precio (en miles de euros) de
la vivienda de alquiler en Madrid y que se distribuye según una normal de
media desconocida y varianza conocida σ 2 = 202 .
Para determinar el precio del alquiler medio en Madrid se toma una
muestra de 70 viviendas obteniéndose que x = 82.5.
Se sabe que la variable
X −µ
√ ∼ N(0, 1)
σ/ n
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 16 / 115
Método Pivotal
Ejemplo
Si de esta expresión se despeja el valor µ, se obtiene el intervalo
probabilı́stico
σ σ
P X − 1.96 √ < µ < X + 1.96 √ = 0.95
n n
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 17 / 115
Método Pivotal
0.025
0.4
0.020
0.3
0.015
φ(x)
φ(x)
0.2
0.010
α 2 = 0.025 1 − α = 0.95 α 2 = 0.025
0.1
0.005
α 2 = 0.025 α 2 = 0.025
a = 77.81 b = 87.18
0.000
a = − 1.96 b = 1.96
0.0
x x
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 18 / 115
Método Pivotal
θbMV − θ
T = es asintóticamente N (0, 1)
σ θbMV
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 19 / 115
Método Pivotal
0.4
precisión será mayor.
Para ello la distribución del
0.3
estadı́stico pivote tiene que ser
conocida. Si ésta es unimodal y
φ(x)
simétrica, se tomará entonces el
0.2
I.C. centrado alrededor del valor
central, dejando α/2 de
0.1
probabilidad a ambos lados.
Si la distribución es asimétrica la α 2 = 0.025 α 2 = 0.025
x
caso anterior, dejando α/2 de
probabilidad a ambos lados.
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 20 / 115
Método Pivotal
¿Cómo elegir α?
N(0, 1)
0.4
Se elegirá α según el nivel de
0.3
confianza 1 − α deseado, teniendo
en cuenta que a menor α el
intervalo será más largo y por tanto
φ(x)
0.2
menos informativo.
Normalmente se suele tomar como
0.1
α uno de los siguientes valores: 1 − α = 0.99
1 − α = 0.95
0.1, 0.05 ó 0.01.
1 − α = 0.9
0.0
−4 −3 −2 −1 0 1 2 3
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 21 / 115
Intervalos para una muestra
σ 2 conocida
Población normal I .C . para la media µ
σ 2 desconocida
X ∼ N (µ, σ)
I .C . para la varianza σ 2
Población no normal
=⇒ I .C . para la proporción p
X ∼ Ber (p)
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 22 / 115
Intervalos para una muestra I.C. para la media
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 23 / 115
Intervalos para una muestra I.C. para la media
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 24 / 115
Intervalos para una muestra I.C. para la media
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 25 / 115
Intervalos para una muestra I.C. para la media
Se obtendrı́a finalmente
σ σ
P X − zα/2 √ < µ < X + zα/2 √ = 1 − α.
n n
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 26 / 115
Intervalos para una muestra I.C. para la media
Ejemplo
Supongamos que la variable X representa el precio (en miles de euros) de
la vivienda de alquiler en Madrid y que se distribuye según una normal de
media desconocida y varianza conocida σ 2 = 202 .
Para determinar el precio del alquiler medio en Madrid se toma una
muestra de 70 viviendas obteniéndose que x = 82.5.
Se sabe que la variable
X −µ
√ ∼ N(0, 1)
σ/ n
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 27 / 115
Intervalos para una muestra I.C. para la media
Ejemplo
Si de esta expresión se despeja el valor µ, se obtiene el intervalo
probabilı́stico
σ σ
P X − 1.96 √ < µ < X + 1.96 √ = 0.95
n n
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 28 / 115
Intervalos para una muestra I.C. para la media
0.025
0.4
0.020
0.3
0.015
φ(x)
φ(x)
0.2
0.010
α 2 = 0.025 1 − α = 0.95 α 2 = 0.025
0.1
0.005
α 2 = 0.025 α 2 = 0.025
a = 77.81 b = 87.18
0.000
a = − 1.96 b = 1.96
0.0
x x
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 29 / 115
Intervalos para una muestra I.C. para la media
N(µ, σ2)
0.025
Observación
0.020
La media X está en el centro
del intervalo.
0.015
φ(x)
0.010
σ σ
X − zα/2 √ , X + zα/2 √ α 2 = 0.025 1 − α = 0.95 α 2 = 0.025
n n
0.005
σ
= X ± z1−α/2 √
n a = 77.81 b = 87.18
0.000
20 40 60 80 100 120 140
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 30 / 115
Intervalos para una muestra I.C. para la media
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 31 / 115
Intervalos para una muestra I.C. para la media
X −µ
√ ∼ Tn−1
Ŝx / n
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 32 / 115
Intervalos para una muestra I.C. para la media
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 33 / 115
Intervalos para una muestra I.C. para la media
X −µ
√ ∼ Tn−1
Ŝx / n
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 34 / 115
Intervalos para una muestra I.C. para la media
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 35 / 115
Intervalos para una muestra I.C. para la media
Ejemplo
Supongamos de nuevo que X representa el precio de la vivienda de alquiler
en Madrid pero en este caso se desconoce tanto la media como la varianza
(caso más habitual que el anterior).
Con las mismas 70 viviendas se obtiene x̄ = 82.5 y una cuasivarianza
ŝx2 = 21.42 .
En este caso, se sabe que la variable
X −µ
√ ∼ Tn−1
ŜX / n
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 36 / 115
Intervalos para una muestra I.C. para la media
Ejemplo
Supongamos de nuevo que X representa el precio de la vivienda de alquiler
en Madrid pero en este caso se desconoce tanto la media como la varianza
(caso más habitual que el anterior).
Por tanto, (sabiendo que t69,0.025 = 2) como x̄ = 82.5 es la
realización particular de X y ŝx = 21.4 es la realización particular de
S
bx , el intervalo de confianza para µ es
21.4 21.4
82.5 − 2 √ , 82.5 + 2 √ = (77.38, 87.61)
70 70
Luego, el precio del alquiler medio en Madrid se encuentra en el
intervalo anterior con una confianza del 95%.
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 37 / 115
Intervalos para una muestra I.C. para la media
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 38 / 115
Intervalos para una muestra I.C. para la media
Ejemplo
En el ejemplo anterior, se desconoce tanto la media como la varianza, sin
embargo n = 70 > 30.
Por tanto, (sabiendo que z0.025 = 1.96) como x̄ = 82.5 es la
realización particular de X y ŝx = 21.4 es la realización particular de
S
bx , el intervalo de confianza para µ es
21.4 21.4
82.5 − 1.96 √ , 82.5 + 1.96 √ = (77.49, 87.51)
70 70
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 39 / 115
Intervalos para una muestra I.C. para la media
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 40 / 115
Intervalos para una muestra I.C. para la media
Caso σ desconocida:
Ŝ
L = b − a = 2tn−1,α/2 √ ,
n
siendo Ŝ y tn−1,α/2 desconocidos antes de tomar los datos. Una
forma de proceder es, supuesto el tamaño muestral a determinar es
suficientemente grande para aproximar tn−1,α/2 por zα/2 , se toma una
muestra preliminar para calcular Ŝ y se despeja n en la expresión
anterior:
Ŝ 4zα/2 Ŝ 2
L = b − a = 2tn−1,α/2 √ despejando n = .
n L2
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 41 / 115
Intervalos para una muestra I.C. para la media
Ejemplo
Los siguientes datos son los pesos (en gramos) de 16 pollos que se
seleccionaron en una granja con el propósito de verificar el peso promedio:
506, 508, 499, 503, 504, 510, 497, 512, 514, 505, 493, 496, 506, 502, 509,
496.
Si el peso de cada pollo es una variable normal con desviación tı́pica
de 5gr.
(a) Obtener los intervalos de confianza al 90, 95, 99% para la media del
peso de los pollos.
(b) Determinar el tamaño muestral necesario para que la precisión del
intervalo (longitud) sea menor que la unidad, con α = 0.05.
Si ahora σ fuese desconocido, recalcular el apartado (a) y (b)
anteriores.
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 42 / 115
Intervalos para una muestra I.C. para la media
Ejemplo
Los siguientes datos son los pesos (en gramos) de 16 pollos que se
seleccionaron en una granja con el propósito de verificar el peso promedio:
506, 508, 499, 503, 504, 510, 497, 512, 514, 505, 493, 496, 506, 502, 509,
496.
Consideramos la variable X =peso en gramos ∈ N(µ, 5). Tenemos la
siguiente información n = 16, x̄ = 503.76 y σ = 5
1−α zα/2 Intervalo
0.90 1.64 (501.7, 505.8)
(a) IC (µ) con σ conocida:
0.95 1.96 (501.3, 506.2)
0.99 2.58 (500.5, 506.9)
4zα/2 σ 2 4 · 1.962 · 52
n≥ = = 384.16
L2 1
En este caso, el tamaño de pollos debe ser mayor o igual que n ≥ 385.
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 43 / 115
Intervalos para una muestra I.C. para la media
Ejemplo
Los siguientes datos son los pesos (en gramos) de 16 pollos que se
seleccionaron en una granja con el propósito de verificar el peso promedio:
506, 508, 499, 503, 504, 510, 497, 512, 514, 505, 493, 496, 506, 502, 509,
496.
Consideramos la variable X =peso en gramos ∈ N(µ, σ). En este caso
consideramos σ desconocida. A partir de la muestra obtenemos la
siguiente información: n = 16, x̄ = 503.76 y ŝ = 6.2022.
1−α t15α/2 Intervalo
0.90 1.753 (501.03, 506.47)
(a) IC (µ) con σ desconocida:
0.95 2.131 (500.45, 507.05)
0.99 2.947 (499.18, 508.32)
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 45 / 115
Intervalos para una muestra I.C. para la varianza
b2
(n − 1) S
∼ χ2n−1 .
σ2
2. Planteamiento del enunciado probabilı́stico. Se procede como en los
anteriores casos, teniendo en cuentaque la distribución de χ2n no es
simétrica χ2n−1,α/2 6= −χ2n−1,1−α/2 :
!
(n − 1) Ŝ 2
P χ2n−1,1−α/2 < < χ2n−1,α/2 =1−α
σ2
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 46 / 115
Intervalos para una muestra I.C. para la varianza
tales que la probabilidad de que tomen valores entre los que quede
comprendido el verdadero valor de la varianza es 1 − α.
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 47 / 115
Intervalos para una muestra I.C. para la varianza
Ejemplo
Siguiendo con el ejemplo del precio del alquiler en Madrid se tenı́a que,
sX2 = 21.42 .
para 70 viviendas, x = 82.5 y b
Nos preguntamos ahora cuál será el intervalo de confianza al 95% para la
varianza σ 2 .
En este caso, se sabe que la variable
(n − 1) Ŝ 2
∼ χ2n−1
σ2
es una χ269 con 69 grados de libertad
Sabiendo que χ269,0.975 = 47.92 y χ269,0.025 = 93.86)
(n−1)ŜX2
0.95 = P 47.92 < σ2 < 93.86
(n−1)ŜX2 2 (n−1)ŜX2
=P 93.86 < σ < 47.92
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 48 / 115
Intervalos para una muestra I.C. para la varianza
Ejemplo
sX2 = 21.42 es la realización particular de ŜX2 .
Como b
el intervalo de confianza para σ 2 es
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 49 / 115
Intervalos para una muestra I.C. para la varianza
Ejemplo
Con el fin de garantizar la salubridad de cierto alimento se ha llevado a
cabo un análisis que cuenta el número de bacterias que se encuentran en 9
unidades del mismo. Los recuentos han dado los siguientes resultados:
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 50 / 115
Intervalos para una muestra I.C. para la varianza
Solución
Aceptando normalidad en la distribución del recuento bacteriano,
(a) Estimaciones para la media y la varianza: 168.9 es la estimación del
número medio de bacterias con una varianza de ŝ 2 = 109.86 o bien
s 2 = 97.65.
(b) El intervalo de confianza para la media y varianza a un nivel del 95%.
I El número medio de bacterias está entre 160.82 y 176.96, con un nivel
de confianza del 95%.
I Su varianza se encuentra entre 50.22 y 403.16, con un nivel de
confianza del 95%.
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 51 / 115
Intervalos para una muestra Trabajo práctico
Práctica en R:
Estamos interesados en conocer el contenido de cafeı́na del café y su
variabilidad. Para ello contamos con una muestra de 43 granos de café de
distintos paı́ses. Aplicando técnicas de inferencia estadı́stica estima el
contenido medio de cafeı́na y su varianza, con un nivel de confianza del
95%.
Repite el estudio para el contenido en agua, el peso de la semilla, las
grasas y el contenido en minerales del café.
Para cada variable estudiada compara el intervalo obtenido con el
calculado para un nivel de confianza del 90% y del 99%. ¿Qué
observas? ¿Cómo influye el nivel de confianza en la precisión del
intervalo?
¿Qué tamaño de muestra deberı́a tomarse para que el error cometido
en la estimación de la media no sea superior a 0.10?
Ejemplo
En un sondeo realizado sobre 50 alumnos de la facultad de Informática se
ha encontrado que 12 de ellos no están satisfechos con el funcionamiento
del Centro de Cálculo.
(a) Determinar un intervalo de confianza para la proporción de
descontentos, a un nivel de confianza del 99%.
(b) ¿Cuál es el tamaño muestral necesario para que, con el nivel de
confianza anterior, la longitud del intervalo de confianza sea menor o
igual que una centésima?
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 53 / 115
Intervalos para una muestra I.C. para la proporción
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 54 / 115
Intervalos para una muestra I.C. para la proporción
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 55 / 115
Intervalos para una muestra I.C. para la proporción
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 56 / 115
Intervalos para una muestra I.C. para la proporción
Observaciones
El intervalo anterior no es calculable (depende del valor desconocido p).
Para resolver dicho problema en la práctica:
(a) Sustituir p por su estimador p̂. El intervalo resultante es
q q
p̂(1−p̂) p̂(1−p̂)
p̂ − zα/2 n , p̂ + zα/2 n
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 57 / 115
Intervalos para una muestra I.C. para la proporción
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 58 / 115
Intervalos para una muestra I.C. para la proporción
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 59 / 115
Intervalos para una muestra I.C. para la proporción
Ejemplo
En un sondeo realizado sobre 50 alumnos de la facultad de Informática se
ha encontrado que 12 de ellos no están satisfechos con el funcionamiento
del Centro de Cálculo.
(a) Determinar un intervalo de confianza para la proporción de
descontentos, a un nivel de confianza del 99%.
(b) ¿Cuál es el tamaño muestral necesario para que, con el nivel de
confianza anterior, la longitud del intervalo de confianza sea menor o
igual que una centésima?
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 60 / 115
Intervalos para una muestra I.C. para la proporción
Ejemplo
(a) Determinar un intervalo de confianza para la proporción de
descontentos, a un nivel de confianza del 99%.
Teniendo en cuenta la información de la muestra: p̂ = 12/50 = 0.24,
el tamaño muestral n = 50. El nivel de confianza es
1 − α = 0.99 ⇒ α = 0.01 y zα/2 = 2.58.
Los IC para la proporción de descontentos son:
I Si reemplazamos p por p̂
q q
0.24(1−0.24) 0.24(1−0.24)
IC (p) = 0.24 − 2.58 50 , 0.24 + 2.58 50
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 61 / 115
Intervalos para una muestra I.C. para la proporción
Ejemplo
(a) Determinar un intervalo de confianza para la proporción de
descontentos, a un nivel de confianza del 99%.
El porcentaje de descontentos se sitúa entre el el 8.42% y el 39.58%
con un nivel de confianza del 99% o bien el 5.76% y el 42.24%, según
la aproximación utilizada.
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 62 / 115
Intervalos para una muestra I.C. para la proporción
Ejemplo
(b) ¿Cuál es el tamaño muestral necesario para que, con el nivel de
confianza anterior, la longitud del intervalo de confianza sea menor o
igual que una centésima?.
L ≤ 0.01, según sustituyamos p por p̂ = 0.24 o por p̂ = 1/2 en la
expresión
2 p(1 − p)
4zα/2
n≥ ,
L2
se obtiene respectivamente:
4·2.582 0.24(1−0.24)
I n≥ 0.012 = 48565.094, es decir, n ≥ 48566.
4·2.582 0.5·0.5
I n≥ 0.012 = 66564, es decir, n ≥ 66564.
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 63 / 115
Intervalos para una muestra Trabajo práctico
Práctica en R:
Estamos interesados en conocer la proporción de café arábigo que se
produce y de café robusto. Para ello se toma una muestra de 43 granos de
café anotando su procedencia y el tipo al que pertenecen. Aplicando
técnicas de inferencia estadı́stica haz un estudio de esta proporción:
Mediante técnicas de Estimación puntual.
Utilizando estimación por intervalos de confianza (para un nivel de
confianza del 90%, 95% y 99%).
¿Cuál es el error cometido en la estimación?
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 64 / 115
Intervalos para dos muestras
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 65 / 115
Intervalos para dos muestras
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 66 / 115
Intervalos para dos muestras
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 67 / 115
Intervalos para dos muestras
2 2
σx , σy conocidas
IC (µx − µy ) σx2 = σy2 desconocidas
Poblaciones normales independientes 2 2
X ∼ N (µx , σx ) , Y ∼ N (µy , σy ) σx , σy desconocidas
σ 2
IC x2
σ y
Poblaciones no normales
=⇒ IC (px − py )
X ∼ Ber (px ), Y ∼ Ber (py )
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 69 / 115
Intervalos para dos muestras IC para la diferencia de medias
Ejemplo
Interesa estudiar la diferencia de precio de la vivienda en alquiler entre
Madrid y Barcelona.
Supongamos que
X representa el precio de la vivienda de alquiler en Madrid.
Y representa el precio de la vivienda de alquiler en Barcelona.
Además, las varianzas .......
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 70 / 115
Intervalos para dos muestras IC para la diferencia de medias
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 71 / 115
Intervalos para dos muestras IC para la diferencia de medias
Por tanto
X − Y − (µX − µY )
T = q ∼ N (0, 1)
σX2 σY2
n + m
puede ser utilizado como estadı́stico pivote puesto que tiene una
distribución conocida independiente de µX y µY .
Con argumentos idénticos a los realizados en intervalos anteriores se
llega a que un intervalo de confianza para µX − µY con un nivel de
confianza 1 − α es
q q
σ2 σY2 σX2 σY2
(x − y ) − zα/2 nX + m , (x − y ) + zα/2 n + m
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 72 / 115
Intervalos para dos muestras IC para la diferencia de medias
Ejemplo
Supongamos que X representa el precio de la vivienda de alquiler en
Madrid e Y representa el precio de la vivienda de alquiler en Barcelona.
Supongamos que las varianzas σX2 y σY2 son conocidas. En este caso,
X − Y − (µX − µY )
T = q ∼ N (0, 1)
σX2 σY2
n + m
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 73 / 115
Intervalos para dos muestras IC para la diferencia de medias
Ejemplo
El intervalo de confianza al 95% para la diferencia de precios medios de
alquiler entre Madrid y Barcelona es
s s
σX2 σ 2 σX2 σ 2
(x − y ) − zα/2 + Y , (x − y ) + zα/2 + Y
n m n m
= (−11.2649, 5.4649)
Por tanto, al 95% de confianza no se puede concluir que los precios del
alquiler en Barcelona sean más altos que los precios en Madrid.
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 74 / 115
Intervalos para dos muestras IC para la diferencia de medias
b2 b2
b 2 = (n − 1) SX + (m − 1) SY
S
n+m−2
b2 y S
que es una ponderación de las dos cuasivarianzas muestrales S b2 .
X Y
Se puede demostrar que
X − Y − (µX − µY )
T = q ∼ tn+m−2
b 1+ 1
S n m
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 76 / 115
Intervalos para dos muestras IC para la diferencia de medias
Nota
Puesto que la construcción de este intervalo requiere suponer que las
varianzas, aunque desconocidas, son iguales, es necesario realizar
previamente un contraste de hipótesis para garantizar dicha suposició n.
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 77 / 115
Intervalos para dos muestras IC para la diferencia de medias
Ejemplo
Supongamos de nuevo que X representa el precio de la vivienda de alquiler
en Madrid e Y representa el precio de la vivienda de alquiler en Barcelona.
Supongamos que las varianzas σX2 y σY2 son desconocidas pero iguales. Se
sX2 = 21.42 , b
obtenı́an los siguientes datos: x = 82.5, y = 85.4, b sY2 = 24.32 ,
n = 70 y m = 50.
sX2 + (m − 1) b
(n − 1) b sY2 sX2 + 49 · b
69 · b sY2
s2 = = = 512.9936
n+m−2
b
118
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 78 / 115
Intervalos para dos muestras IC para la diferencia de medias
Ejemplo
Por tanto, el intervalo de confianza para la diferencia de precios en el
alquiler entre Madrid y Barcelona al 95% de confianza es
r !
1 1
(x − y ) ± tn+m−2,α/2bs + = (−11.2038, 5.4038)
n m
Tampoco se puede concluir con un 95% de confianza que los precios del
alquiler en Barcelona sean más altos que los de Madrid.
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 79 / 115
Intervalos para dos muestras IC para la diferencia de medias
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 80 / 115
Intervalos para dos muestras IC para la diferencia de medias
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 81 / 115
Intervalos para dos muestras IC para la diferencia de medias
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 82 / 115
Intervalos para dos muestras IC para la diferencia de medias
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 83 / 115
Intervalos para dos muestras IC para la diferencia de medias
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 84 / 115
Intervalos para dos muestras IC para la diferencia de medias
Ejemplo
En un estudio realizado sobre el tipo de sedimentos hallados en dos lugares
de perforación distintos, se han anotado los siguientes datos acerca del
porcentaje en volumen de arcilla presente en las muestras del sondeo:
X : 31, 18, 17, 16, 37, 16, 32, 13, 14, 49, 25, 19, 13, 32, 27.
Y : 15, 17, 13, 25, 22, 20, 24, 12, 23, 15, 20, 18.
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 85 / 115
Intervalos para dos muestras IC para la diferencia de medias
Ejemplo
A partir de los datos muestrales se obtienen los siguientes valores:
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 86 / 115
Intervalos para dos muestras IC para la diferencia de medias
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 87 / 115
Intervalos para dos muestras IC para la diferencia de medias
se obtiene
2 (σ 2 + σ 2 )
4zα/2 x y
n= .
L2
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 88 / 115
Intervalos para dos muestras IC para la diferencia de medias
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 89 / 115
Intervalos para dos muestras IC para la diferencia de medias
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 90 / 115
Intervalos para dos muestras IC para la diferencia de medias
Ejemplo
Queremos que la longitud del IC del 95% para la diferencia del precio en
alguiler de la vivienda entre Madrid y Barcelona sea inferior a 8 unidades.
Supuesto que m = n y que las varianzas son iguales, utilizando como
estimación preliminar el valor calculado en el ejemplo anterior
ŝ 2 = 512.9936, el tamaño muestral requerido es
2
8z0.025 b2
S 8 · 1.962 · 512.9936
n> = = 246.34.
L2 82
Es decir, n ≥ 247 y n = m.
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 91 / 115
Intervalos para dos muestras I.C. para la diferencia de medias con datos apareados
Muestreo Apareado
La principal caracterı́stica del muestreo apareado es que ambas muestras
son claramente dependientes, de modo que los estadı́sticos pivote usados
en caso de independencia no se pueden emplear en este caso, puesto que
los intervalos de confianza pueden salir excesivamente grandes o pequeños.
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 92 / 115
Intervalos para dos muestras I.C. para la diferencia de medias con datos apareados
Tipificando
D − µD
∼ N (0, 1)
σD
D − µD
∼ tn−1
S
bD
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 93 / 115
Intervalos para dos muestras I.C. para la diferencia de medias con datos apareados
La Solución
El I.C. para µX − µY equivale al intervalo para µD . Para ello
disponemos de una muestra aleatoria de la variable D sin más que
considerar los valores Di = Xi − Yi , obtenidos a partir de las muestras
apareadas {(Xi , Yi )}ni=1 .
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 94 / 115
Intervalos para dos muestras I.C. para la diferencia de medias con datos apareados
Ejemplo
Supongamos que X representa el salario de un ejecutivo antes de hacer un
MBA e Y representa el salario de un ejecutivo después de hacer un MBA.
La siguiente tabla muestra los salarios correspondientes a 7 ejecutivos (en
miles de euros mensuales):
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 95 / 115
Intervalos para dos muestras I.C. para la diferencia de medias con datos apareados
Ejemplo
En el caso de los 7 ejecutivos, se obtiene que D = −1.1894 y b sD2 = 0.2466.
Sabiendo que t6,0.025 = −t6,0.975 = 2.447, el intervalo de confianza para
µD = µX − µY es
sD sD
(x − y ) − tn−1,α/2 √ , (x − y ) + tn−1,α/2 √
b b
√n n √ !
0.2466 0.2466
= −1.1894 − 2.447 √ , −1.1894 + 2.447 √
7 7
=(−1.648, −0.730)
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 97 / 115
Intervalos para dos muestras IC para el cociente de varianzas
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 98 / 115
Intervalos para dos muestras IC para el cociente de varianzas
sX2 sX2
b b
sY2
b sY2
b
,
Fn−1,m−1,α/2 Fn−1,m−1,1−α/2
Nota
Con frecuencia se toma como extremo inferior del intervalo el 0. Ası́, el
intervalo de confianza a nivel 1 − α es
sX2
b
sY2
b
0,
Fn−1,m−1,1−α
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 99 / 115
Intervalos para dos muestras IC para el cociente de varianzas
Ejemplo
Siguiendo con el ejemplo de los alquileres en Madrid y en Barcelona,
vamos a obtener un intervalo de confianza para el cociente de varianzas.
sX2 = 21.42 ,
Se obtenı́an los siguientes datos: x = 82.5, y = 85.4, b
2 2
sY = 24.3 , n = 70 y m = 50. Si F69,49,0.975 = 0.5997 y
b
σ2
F69,49,0.025 = 1.7072, el intervalo de confianza para Y2 es el siguiente:
σY
sX2 sX2
b b21.42 21.42
sY2
b sY2
24.32 24.32
b
, =
1.7072 , 0.5997
Fn−1,m−1,α/2 Fn−1,m−1,1−α/2
0.7756 0.7756
= ,
1.7072 0.5997
= (0.4543, 1.2933)
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 100 / 115
Intervalos para dos muestras IC para poblaciones no normales
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 101 / 115
Intervalos para dos muestras IC para poblaciones no normales
pX − pX
∼ N (0, 1)
b
r
pX (1 − pX )
n
p − pY
r Y ∼ N (0, 1)
b
pY (1 − pY )
m
r !
pX (1 − pX ) pY (1 − pY )
⇒ p bX − bpY ∼ N pX − pY , +
n m
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 102 / 115
Intervalos para dos muestras IC para poblaciones no normales
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 103 / 115
Intervalos para dos muestras IC para poblaciones no normales
Ejemplo
Estamos ahora interesados en conocer si existen diferencias entre la
proporción p1 de hombres que fuman y la proporción p2 de mujeres que
fuman.
Sea X la variable que vale 1 si un hombre fuma y vale 0 si no, e Y la
variable que vale 1 si una mujer fuma y vale 0 si no.
Si dentro de los 344 estudiantes habı́a 160 hombres de los cuales 29
fumaban, y 184 mujeres de las cuales 54 fumaban,
el intervalo de confianza para la diferencia de proporciones al 90% de
confianza es el siguiente
r !
bX (1 − b
p pX ) b pY (1 − b
pY )
pX − b
(b pY ) ± z1−α/2 +
n m
v
u 29 29
54
54
t 160 1 − 160 1−
u
29 54
184 184
= − ± 1.645 +
160 184 160 184
=(−0.1868, −0.0377)
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 104 / 115
Intervalos para dos muestras IC para poblaciones no normales
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 105 / 115
Intervalos para dos muestras IC para poblaciones no normales
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 106 / 115
Intervalos para dos muestras IC para poblaciones no normales
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 107 / 115
Desigualdad de Tchebychev
Desigualdad de Tchebychev
Desigualdad de Tchebychev
Dada una variable aleatoria X, con media µ y desviación tı́pica σ, el
teorema o Desigualdad de Tchebychev afirma que para cualquier constante
positiva k se verifica:
1
P (|X − µ| ≤ kσ) ≥ 1 −
k2
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 108 / 115
Desigualdad de Tchebychev
Desigualdad de Tchebychev
En paticular,
Sea θb = T (X 1 , ..., Xn ) un estimador insesgado del parámetro θ, con
desviación tı́pica σ.
Entonces, dado que E θb = θ, tomado k = √1α (para que
1
1−α=1− k2
),
1 σ
P |θ − µ| ≤ kσ ≥ 1 − 2 ⇒ P |θ − θ| ≤ √
b b ≥ 1 − α.
k α
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 109 / 115
Método Bootstrap
Método Bootstrap
Sea (X1 , ..., Xn ) una m.a.s de la variable aleatoria X que tiene función
de distribución Fθ . El método bootstrap aproxima la distribución del
estadı́stico TFθ (X1 , ..., Xn ) por la de TFn (X1∗ , ..., Xn∗ ), siendo Fn la
función de distribución empı́rica obtenida de la muestra (X1 , ..., Xn ), y
(X1∗ , ..., Xn∗ ) una muestra aleatoria simple de una v.a. con función de
distribución Fn .
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 110 / 115
Método Bootstrap
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 111 / 115
Método Bootstrap
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 112 / 115
Intervalos de confianza bayesianos
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 113 / 115
Intervalos de confianza bayesianos
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 114 / 115
Intervalos de confianza bayesianos
M.J. Lombardı́a Cortiña (UDC) 3. Estimación por intervalos de confianza Curso 2010-2011 115 / 115