Documente Academic
Documente Profesional
Documente Cultură
5.1 INTRODUCCIÓN
Las conclusiones derivadas de este proceso inferencial siempre estarán sujetas a error
como consecuencia de la variabilidad aleatoria unida al propio procedimiento de
selección muestral.
Por ello, resulta necesario disponer no sólo de una estimación puntual, sino también
de un intervalo de confianza, que facilite un rango de valores verosímiles para el
parámetro poblacional, así como de una prueba de significación estadística, que
permita determinar el grado de compatibilidad de los datos muestrales con una
hipótesis predeterminada.
Como vimos en el tema 1, el error que se comete al utilizar una muestra que se extrae
a partir de una población se llama error de muestreo y es un error aleatorio, siempre
que la muestra se haya extraído al azar. El error aleatorio es impredecible y no puede
ser eliminado, pero sí reducido mediante diseños más eficientes (que proporcionen
mayor información sin necesitar observar a más sujetos) o aumentando el tamaño de
la muestra estudiada.
E ( x ) = µ y E (p) = π
Eficiente: aquel estimador muestral de igual valor a otros, pero que presenta la
mínima varianza. Interesa que las distintas estimaciones difieran lo menos
posible del parámetro poblacional; es decir, que la varianza muestral del
estimador sea mínima. De esta forma, se tendrá una mayor confianza en que la
estimación resultante de la muestra finalmente seleccionada esté próxima al
parámetro poblacional.
Siguiendo con el ejemplo anterior, si lo único que sabemos es que la media muestral
es x = 39 años, nuestra única posibilidad es confiar es que esta media muestral esté
entre ese 95% de medias muestrales situadas en el entorno de +2 errores estándar de
Si el I.C. es al nivel de confianza del 95% (en general, 1- ), implica que hay un 5%
de error (en general,) repartido en dos colas, una a cada lado. Cada cola valdría el
2.5% ( / 2 = 0.025); en este caso, z valdría1 1.96.
Figura 5.1.
1
Recordad lo estudiado en el tema 3 sobre la distribución Normal.
El llamado valor crítico, es aquel punto z2 tal que P (Z z) = ,
dónde Z es una variable N (0, 1).
Gráficamente:
Figura 5.2.
Para los niveles de confianza habituales, los valores críticos correspondientes son los
siguientes:
2
Recordad que q = (1-p)
p(1 p) pq
EEP
n n
pˆ qˆ
p pˆ z1 2
n
Ejemplo 5.1
24
Solución: Estimación puntual: pˆ 0.6 (60%)
40
pˆ (1 pˆ ) 0.6 0.4
Error estándar: 0.0775
n 40
pˆ (1 pˆ )
I.C. 95% de p: pˆ z / 2 0.60 1.96 0.0775 0.60 0.152
n
I.C. al 95%: (0.448, 0.752)
La confianza del 95% consiste en poder afirmar que si repitiésemos la estimación 100
veces, el intervalo que hemos obtenido sería uno de los 95 que de hecho contendrían
la proporción de individuos que fuman en la población. Confiamos en qué esté sea uno
de los 95 intervalos de cada 100 que incluyen a la proporción poblacional y no sea uno
de los 5 intervalos de cada 100 que no la incluyen.
Muchas veces, una vez fijado el nivel de confianza, nos marcaremos como objetivo dar
el valor del parámetro p con una cierta precisión. La única forma de obtener la
precisión deseada será modificando de forma adecuada el tamaño de la muestra.
Por ejemplo con una muestra de 100 individuos se realizó una estimación confidencial,
con un 95% de confianza, del porcentaje de votantes a una cuestión en un
referéndum, obteniéndose un margen de error de 9,3 puntos.
z 12 2
N pˆ qˆ.
error 2
Si en un principio no tenemos una idea sobre que valores puede tomar p, debemos
considerar el peor caso posible, que es en el que se ha de estimar el tamaño muestral
cuando p = q = 1/2.
Ejemplo 5.2
Como no se tiene una idea previa del posible resultado del referéndum, hay que tomar
un tamaño de muestra, N, que se calcula mediante:
2
1 z 0 , 985 0,25 2,17 2
N . 11.773
4 0,012 0,012
Así para tener un resultado tan fiable, el número de personas a entrevistar deber ser
muy elevado, lo que puede volver excesivamente costoso el sondeo.
Supongamos que la variable que queremos estudiar sigue una ley normal de media µ
(desconocida) y desviación típica σ conocida y que disponemos de una muestra
aleatoria simple de tamaño n y del valor de la media de la muestra x .
Para estimar μ, el estadístico que mejor nos va a ayudar es x , del que conocemos su
ley de distribución:
Figura 5.3.
La figura 5.3 nos muestra la distribución N(0,1) y el intervalo más pequeño posible
cuya probabilidad es 1 Por simetría, los cuartiles z2 y z1-2 sólo difieren en el
signo
Ejemplo 5.3
Suponemos que la distribución de las tallas al nacer de los niños de una determinada
población sigue una ley Normal de media 50 cm. y desviación estándar 1.5 cm. ¿Cuál
es el intervalo con probabilidad 0.95 de contener la media de las tallas de 100 niños
extraídos al azar de dicha población?
3
Por tanto, el margen de error es la mitad de la longitud del intervalo de confianza.
Interpretación: Podemos afirmar con una confianza del 95% que la media de las tallas
de 100 niños extraídos al azar se encuentra dentro del intervalo comprendido entre
49.71 y 50.29 cm. Confiamos en qué esté sea uno de los 95 intervalos de cada 100 que
incluyen a la media poblacional y no sea uno de los 5 intervalos de cada 100 que no la
incluyen.
Sˆ
X tn1,1 2
n
Ejemplo 5.4
Sabemos que el peso de los recién nacidos sigue una distribución Normal. Si en una
muestra aleatoria simple de 100 de ellos se obtiene una media muestral de 3 kg, y una
desviación típica de 0,5 kg., vamos a calcular un I.C. para la media poblacional que
presente una confianza del 95%.
X
Para calcular μ usamos el estadístico: T t n 1
Sˆ
n
Un I.C. al 95% se calcula teniendo en cuenta que T sigue una distribución tn-1.
Sˆ
x 1.98 3 0.1
n
Es decir, con una confianza del 95% tenemos que μ = 3 + 0.1 kg.
Interpretación: Podemos afirmar con una confianza del 95% que la media del peso de
100 recién nacidos extraídos al azar se encuentra dentro del intervalo comprendido
entre 2,9 y 3,1 Kg. Confiamos en qué esté sea uno de los 95 intervalos de cada 100
que incluyen a la media poblacional y no sea uno de los 5 intervalos de cada 100 que
no la incluyen.
Figura 5.4 Intervalos de confianza para los parámetros de una población normal,
a partir de una muestra aleatoria simple de la misma
4
Al igual que en la distribución Normal existen valores tabulados para la distribución t de Student
5
Encontraréis un ejemplo en la presentación disponible en material de apoyo