Documente Academic
Documente Profesional
Documente Cultură
Nivel de
confianza % 99.70 99.00 98.00 96.00 95.45 95.00 90.00 80.00 68.27 50.00
Zc 3.00 2.58 2.33 2.05 2.00 1.96 1.645 1.28 1.00 0.6745
Ejemplo. Halar los lmites de confianza de 98% y 90%. Lo anterior tiene la solucin, sea Z =Z tal
que, al rea bajo la curva Normal a la derecha sea 1%, entonces, por simetra el rea del lado
izquierdo de Z=-Z. como el rea total bajo la curva es 1, Z =0.49 por tanto, Z =2.33, luego el limite
de confianza para el 98% es, 2.33
n
Ejemplo, Una poblacin a encuestar tiene 10000 personas y una varianza de 9.648. Trabajando
con un nivel de confianza de 0.95 y estando dispuestos a admitir un error mximo del 10%, cul
debe ser el tamao muestral para trabajar?
En las tablas de la curva Normal el valor de Z / 2 que corresponde con el nivel de confianza
elegido, Z / 2 1.96
n 1.96 2 9.648 / 0.12 3.706
Comprobamos que no se cumple, pues en este caso 10.000 < 3.706 (3.706 - 1); 10.000 <
13.730.730, por tanto, usamos
n 3.706 /(1 (3.706 / 10.000)) 2.704
Ejemplo: Si se quiere un porcentaje de confianza del 95%, entonces hay que considerar la proporcin
correspondiente, que es 0.95. Lo que se buscara en seguida es el valor z para la variable aleatoria z tal que el
rea simtrica bajo la curva normal desde -z hasta z sea igual a 0.95, es decir, P(-z<Z<z)=0.95.
Utilizando las tablas de la funcin de distribucin Normal se puede calcular el valor de z, que sera 1.96 (con
una aproximacin a dos decimales). Esto quiere decir que
P(-1.96<Z<1.96)=0.95.
Ejemplo: Un Colegio desea realizar una investigacin sobre los alumnos inscritos en primer y segundo aos,
para lo cual se aplicar un cuestionario de manera aleatoria a una muestra, pues los recursos econmicos y el
tiempo para procesar la informacin resultara insuficiente en el caso de aplicrsele a la poblacin estudiantil
completa. En primera instancia, suponiendo que no se conoce el tamao exacto de la poblacin, pero con la
seguridad de que sta se encuentra cerca a los diez millares, se aplicar la primera frmula.
Se considerar una confianza del 95%, un porcentaje de error del 5% y la mxima variabilidad por no existir
antecedentes en la institucin sobre la investigacin y porque no se puede aplicar una prueba previa. Primero
habr que obtener el valor de Z de tal forma que la confianza sea del 95%, es decir, buscar un valor de Z tal
que P(-z<Z<z)=0.95. Entonces, z=1.96. Resultando, n=384.16
Por ejemplo, hay que tomar una muestra de tamao 25 de un archivo que contiene 488 fichas;
luego, el cociente entre poblacin y muestra es 488 /25, aproximadamente 19. Notar que si se elige
20 el tamao muestral no llega a 25. Entonces, se cuentan las fichas y a llegar a la dcimo novena
se la extrae, se sigue hasta la nmero 38 que ser la segunda escogida, y as sucesivamente
hasta tener las 25 fichas necesarias. Es tambin el caso de los soldados que se numeran de 1 en
adelante y cada 5 (u otro nmero cualquiera) dan un paso al frente. Es un mtodo sencillo y rpido
de seleccin.
Si hemos de elegir 40 elementos de un grupo de 600, se comienza por calcular el cociente 600/40 que nos dice
que existen 40 grupos de 15 elementos entre los 600. Se elige un elemento de salida entre los 15 primeros, y
suponiendo que sea el k-simo, el resto de los elementos sern los k-simos de cada grupo. En concreto, si el
elemento de partida es el nmero 6, los restantes sern los que tengan los nmeros: 15+6 ,
2x15+6,......,39x15+6
Ejercicio, Calcule el tamao muestral de una encuesta realizada. El error terico era de + 2, con un intervalo
de confianza de 95,5% y P=Q en el supuesto de un muestreo aleatorio simple.
Utilizamos la frmula para muestras infinitas en la que intervienen los tres factores determinantes
del tamao muestral: la probabilidad con la que queremos trabajar (z), el grado de concentracin,
dispersin de la poblacin (pq) y el error que estamos dispuestos a asumir.
z 2 pq 2 2 0,5 0,5
n 2.500
e2 0,02 2
Ejemplo, Si queremos extraer n=10 muestras de una distribucin N(0,1) podemos recurrir a una tabla de
nmeros aleatorios de k=5cifras, en las que observamos las cantidades, por ejemplo, 76.293, 31.776,
50.803, 71.153, 20.271, 33.717, 17.979, 52.125, 41.330, 95.141
A partir de ellas podemos obtener una muestra de X~N(0,1) usando una tabla de la distribucin normal:
Ejemplo, Supongamos que realizamos un estudio sobre la poblacin de estudiantes de una Universidad, en el
que a travs de una muestra de 10 de ellos queremos obtener informacin sobre el uso de barras de
labios. En primera aproximacin lo que procede es hacer un muestreo aleatorio simple, pero en su
lugar podemos reflexionar sobre el hecho de que el comportamiento de la poblacin con respecto a
este carcter no es homogneo, y atendiendo a l, podemos dividir a la poblacin en dos estratos:
- Estudiantes masculinos (60% del total);
- Estudiantes femeninos (40% restante).
de modo que se repartan proporcionalmente ambos grupos el nmero total de muestras, en funcin
de sus respectivos tamaos (6 varones y 4 mujeres). Esto es lo que se denomina asignacin
proporcional.
Ejemplo, Consideremos una variable aleatoria de la que slo conocemos que su ley de distribucin es
gaussiana, X~N(), con 1= y 2=2 desconocidos
Para muestras aleatorias de tamao n=3, X1,X2,X3~N() un posible estimador del parmetro es
(X1 X 2 X 3 )
1 ( X 1 , X 2 , X 3 ) X N ,
3 3
La regin crtica de esta prueba est en c = 10.548, es decir, se rechaza H 0 = 10 si la media de la muestra es
mayor de 10.548. Para construir la curva OC se presentan en la tabla sigui ente diferentes valores
de la hiptesis alternativa con sus respectivas probabilidades de
aceptacin.
9.6 9.8 10.0 10.2 10.4 10.6 10.8 11.0 11.2 11.4 11.6
0.998 0.988 0.950 0.852 0.672 0.438 0.225 0.088 0.025 0.005 0.001
Si se tiene la hiptesis nula H o: = 0 contra la hiptesis alternativa H 1: = 1 el valor del error tipo II se
obtiene como una funcin de los valores alternativos de bajo H1, es decir, para cada valor de 1 se calcula ,
valor que a veces denotamos por (). La grfica vs () recibe, como ya se dijo, el nombre de Curva
Caracterstica Operativa, Curva OC, o curva CO.
Ejemplo. Si X es Binomial (n,), demostrar que X/n es un estimador insesgado del parmetro .
X X 1 1
Solucin. Sea P E( P) E (X) n por lo tanto es insesgado
n n n n
N
Ejemplo. Sea X1, X2,..., Xn una muestra aleatoria con E(X i)=. Demostrar que si i 1
a i 1 entonces T
= a1X1 + a2X2 +...+anXn es un estimador insesgado de .
Ejemplo: Si S es la varianza de una muestra tomada al azar de una poblacin infinita, entonces S es un
estimador insesgado de . Previamente habamos demostrado que E(S) = .
1 n
X i X , ser un estimador insesgado de ?. Se puede demostrar que
2
Ejemplo. Si V
2
n
i 1
n 1 2
E(V 2 )
n
1 n 2
Ejemplo. Sea W
2
i 1
X i , ser un estimador insesgado de si es un parmetro conocido?.
n
1
X i X , un estimador insesgado de la varianza de una poblacin
2
n
Ejemplo. Ser S
2
n 1 i 1
finita?. No, si la poblacin es finita de tamao N, se puede demostrar que el estimador insesgado de
Aunque S es un estimador insesgado de la varianza de una poblacin infinita, no es un estimador insesgado
de la varianza de una poblacin finita. En ningn caso S es un estimador insesgado de
Ejemplo. Suponga que X, el tiempo de reaccin a cierto estmulo, tiene una distribucin uniforme en el
intervalo de 0 a un lmite superior (desconocido). Es decir,
Se desea estimar el parmetro con base en una muestra aleatoria X1, X2, ..., Xn de tiempos de reaccin.
Como es el tiempo mximo de reaccin, para toda la poblacin, se cumple que (X1, X2, ..., Xn), por lo
cual podemos considerar como un primer estimador el siguiente estadstico:
T1 = Mximo(X1, X2, ..., Xn).
Ejemplo. Al calcular la media de una poblacin normal sobre la base de una muestra de tamao 2n+1, cul
es la eficiencia de la mediana con relacin a la media?
Se sabe que la varianza de la media X est dada por /(2n+1). Para una muestra aleatoria de tamao 2n+1
de una poblacin normal se sabe que el valor esperado y la varianza de la mediana estn dados por:
~ ~ ~ 2
E(X) V(X)
4n
La media requiere slo el 64% de las observaciones que requiere la mediana para estimar la media
poblacional con la misma confiabilidad. Estimador insesgado de mnima varianza. Para saber si un
estimador insesgado es de mnima varianza o con sesgo mnimo, se usa la desigualdad de Crmer-Rao, dada
en el siguiente teorema.
Ejemplo. Demuestre que X es el estimador insesgado de mnima varianza de la media de una poblacin
normal.
Por lo tanto se tiene que
Si estamos estimando una proporcin , entonces su mejor estimativo ser la proporcin muestral, es decir
Ejemplo. Demostrar que S es un estimador consistente de cuando se toman muestras de una poblacin
normal.
Solucin: Sabemos que:
E(S) =
Se observa que V(S) 0 cuando n .
(k )
Ejemplo. Sea X1, X2, ..., Xn una muestra aleatoria de tamao n de una distribucin de Poisson con parmetro
cuya funcin de densidad est dada por,
x e
f (t)
x!
Demostrar que el estimador eficiente para es a su vez un estimador suficiente. La funcin de verosimilitud
est dada por:
, donde
ESTIMACIN PUNTUAL
Ejemplo, para el valor medio de la distribucin normal con varianza conocida y un nivel de
confianza del 95%, tenemos, con 0,95, c 1,96 y calculamos el valor medio de la muestra
c
x1,...,xn de tamao n, y luego, k , quedando el nivel de confianza Conf {x k x k}
n
EL TAMAO DE LA MUESTRA
El teorema del limite central, sustenta la aproximacin a la normalidad para muchas distribuciones
discretas. Cuando el tamao de la muestra es grande, y dicha muestra es tomada de cualquier
distribucin con media , finita y varianza 2 finita, entonces la media aritmtica muestral tiene una
distribucin normal con media y varianza
Podemos entonces establecer intervalos de confianza para
,
: es denominado el nivel de significancia , si la significancia es por ejemplo, =0.05 entonces la
confiabilidad es del 0.95.
,
ahora bien , como los parmetros poblacional y son desconocidos, para muestras grandes
(n>30) la varianza muestral S2 es un buen estimador de la varianza poblacional 2 , podemos
afirmar con una confiabilidad predeterminada que la media aritmtica poblacional se halla en el
intervalo
esto es:
Se desea realizar una investigacin para analizar, cual es la resistencia promedio de una
produccin de baldosas. Si admitimos un error mximo 25 Kg/cm 2, cual debe ser el tamao de
muestra mnimo si exigimos una confiabilidad del 95%, y en una muestra piloto obtuvimos una
desviacin tpica de 140 Kg/cm2?
Con una confiabilidad del 90% se quiere estimar la proporcin de ciudadanos que votar en las
prximas elecciones. Cual debe ser el tamao de la muestra, si admitimos un error del 3% y se
sabe que en las pasadas elecciones hubo una abstencin del 70%?
Entonces
por consiguiente
Para obtener la frmula m se deben hacer los siguientes supuestos:
1. El mnimo de datos que amerita clasificacin en intervalos es 16.
2. El nmero de intervalos no debe ser inferior a (5).
3. Cada vez que se duplique la informacin se incrementa en uno (1) el nmero de intervalos.
As las cosas, se obtiene la siguiente correspondencia: