Sunteți pe pagina 1din 9

Intervalo de confianza para una proporción

Dada una variable aleatoria con distribución Binomial B(n, p), el objetivo es
la construcción de un intervalo de confianza para el parámetro p, basada en
una observación de la variable que ha dado como valor x. El mismo caso se
aplica si estudiamos una Binomial B(1, p) y consideramos el número de veces
que ocurre el suceso que define la variable al repetir el experimento n veces en
condiciones de independencia.

Existen dos alternativas a la hora de construir un intervalo de confianza


para p:

 Considerar la aproximación asintótica de la distribución Binomial en


la distribución Normal.
 Utilizar un método exacto.

Aproximación asintótica

Tiene la ventaja de la simplicidad en la expresión y en los cálculos, y es la


más referenciada en la mayoría de textos de estadística. Se basa en la
aproximación

que, trasladada a la frecuencia relativa, resulta

Tomando como estadístico pivote


que sigue una distribución N(0, 1), y añadiendo una corrección por
continuidad al pasar de una variable discreta a una continua, se obtiene el
intervalo de confianza asintótico:

Donde zα/2 es el valor de una distribución Normal estándar que deja a su


derecha una probabilidad deαpara un intervalo de confianza de (1 − α)
· 100 %Las condiciones generalmente aceptadas para considerar válida la
aproximación asintótica anterior son:

El intervalo obtenido es un intervalo asintótico y por tanto condicionado a la


validez de la aproximación utilizada.

Intervalos de confianza para proporciones


En la inferencia sobre una proporción el problema se concreta en estimar y contrastar la
proporción p de individuos de una población que presentan una determinada
característica A (proporción de votantes a un partido político, proporción de parados, ...). El
problema se noveliza mediante una variable dicotómica que toma el valor 1 si se presenta
la característica de interés y 0 en caso contrario, esto es, una variable de

Bernoulli, ,de la que se dispone de una muestra de tamaño n. Entonces, la


proporción poblacional p no es otra cosa que la media poblacional de dicha variable,
estimándose con la correspondiente proporción muestral o media muestral, .

En el caso de dos poblaciones, se trata de comparar la proporción en la que se presenta


una cierta característica A en las mismas (comparar la proporción de voto a un partido en
dos regiones, comparar la proporción de parados entre hombres y mujeres, ...). El
problema se modeliza mediante dos variables de Bernoulli independientes, de las que se
dispone de sendas muestras aleatorias de tamaño y , respectivamente.

Intervalo de confianza sobre la proporción poblacional


A partir del estadístico

Se construye el intervalo

Siendo el valor que en una distribución normal estándar deja a su derecha una
probabilidad de .

Véase en la hoja adjunta un ejemplo.

Cuando se va a realizar una encuesta para estimar una proporción, lo habitual es


plantearse a priori obtener una cierta fiabilidad y precisión en la estimación, buscando el
tamaño muestral necesario para conseguirlas. La longitud del intervalo de confianza
para p resulta:
De aquí podremos calcular el valor de n en función de la longitud del intervalo, L, y de su
fiabilidad, 1- :

Adviértase que llegamos a un resultado en principio incongruente: queremos saber


cuántas observaciones tenemos que realizar para estimar p y para ello necesitaremos
conocer su estimación, valor que conoceremos una vez hayamos realizado las
observaciones. ¿Cómo solucionar este problema? Existen tres posibles vías:

a) Si tuviésemos información (encuestas anteriores, opiniones de experto,...) sobre el


posible valor de la proporción a estimar, sustituiríamos este valor en la anterior expresión.
b) Podríamos realizar una pequeña encuesta (encuesta piloto) que nos proporcionase
una primera evaluación de la proporción muestral. Además, esta encuesta puede servir
para probar y reformar el cuestionario, organizar el trabajo de campo, etc.
c) Si no contásemos con información alguna ni tuviésemos la posibilidad de realizar la
encuesta piloto, nos pondríamos en la situación más desfavorable, esto es, la que da lugar
al tamaño muestral más grande para la fiabilidad y precisión deseadas. Esa situación se
produce cuando n alcanza su máximo, lo cual ocurre cuando p=q=0.5.

En este caso, por otro lado el más habitual, resulta:


En la hoja adjunta se obtiene el tamaño muestral para una fiabilidad y una precisión
determinada en el caso más desfavorable (p=q=0.5).

Intervalo de confianza sobre la diferencia de proporciones poblacionales

A partir del estadístico


Se construye el intervalo

Siendo el valor que en una distribución normal estándar deja a su derecha una
probabilidad de .

Véase en la hoja adjunta un ejemplo.

S-ar putea să vă placă și