Sunteți pe pagina 1din 13

} muestran los niveles de confianza usados en la prctica.

Para niveles de confianza que no


aparecen en la tabla, los valores Z c se pueden encontrar gracias a las tablas de reas bajo la curva
Normal.

Nivel de
confianza % 99.70 99.00 98.00 96.00 95.45 95.00 90.00 80.00 68.27 50.00
Zc 3.00 2.58 2.33 2.05 2.00 1.96 1.645 1.28 1.00 0.6745

Ejemplo. Halar los lmites de confianza de 98% y 90%. Lo anterior tiene la solucin, sea Z =Z tal
que, al rea bajo la curva Normal a la derecha sea 1%, entonces, por simetra el rea del lado
izquierdo de Z=-Z. como el rea total bajo la curva es 1, Z =0.49 por tanto, Z =2.33, luego el limite

de confianza para el 98% es, 2.33
n

Ejemplo, Una poblacin a encuestar tiene 10000 personas y una varianza de 9.648. Trabajando
con un nivel de confianza de 0.95 y estando dispuestos a admitir un error mximo del 10%, cul
debe ser el tamao muestral para trabajar?
En las tablas de la curva Normal el valor de Z / 2 que corresponde con el nivel de confianza
elegido, Z / 2 1.96
n 1.96 2 9.648 / 0.12 3.706

Comprobamos que no se cumple, pues en este caso 10.000 < 3.706 (3.706 - 1); 10.000 <
13.730.730, por tanto, usamos
n 3.706 /(1 (3.706 / 10.000)) 2.704

Ejemplo: Si se quiere un porcentaje de confianza del 95%, entonces hay que considerar la proporcin
correspondiente, que es 0.95. Lo que se buscara en seguida es el valor z para la variable aleatoria z tal que el
rea simtrica bajo la curva normal desde -z hasta z sea igual a 0.95, es decir, P(-z<Z<z)=0.95.

Utilizando las tablas de la funcin de distribucin Normal se puede calcular el valor de z, que sera 1.96 (con
una aproximacin a dos decimales). Esto quiere decir que
P(-1.96<Z<1.96)=0.95.

Ejemplo: Un Colegio desea realizar una investigacin sobre los alumnos inscritos en primer y segundo aos,
para lo cual se aplicar un cuestionario de manera aleatoria a una muestra, pues los recursos econmicos y el
tiempo para procesar la informacin resultara insuficiente en el caso de aplicrsele a la poblacin estudiantil
completa. En primera instancia, suponiendo que no se conoce el tamao exacto de la poblacin, pero con la
seguridad de que sta se encuentra cerca a los diez millares, se aplicar la primera frmula.

Se considerar una confianza del 95%, un porcentaje de error del 5% y la mxima variabilidad por no existir
antecedentes en la institucin sobre la investigacin y porque no se puede aplicar una prueba previa. Primero
habr que obtener el valor de Z de tal forma que la confianza sea del 95%, es decir, buscar un valor de Z tal
que P(-z<Z<z)=0.95. Entonces, z=1.96. Resultando, n=384.16

Por ejemplo, hay que tomar una muestra de tamao 25 de un archivo que contiene 488 fichas;
luego, el cociente entre poblacin y muestra es 488 /25, aproximadamente 19. Notar que si se elige
20 el tamao muestral no llega a 25. Entonces, se cuentan las fichas y a llegar a la dcimo novena
se la extrae, se sigue hasta la nmero 38 que ser la segunda escogida, y as sucesivamente
hasta tener las 25 fichas necesarias. Es tambin el caso de los soldados que se numeran de 1 en
adelante y cada 5 (u otro nmero cualquiera) dan un paso al frente. Es un mtodo sencillo y rpido
de seleccin.
Si hemos de elegir 40 elementos de un grupo de 600, se comienza por calcular el cociente 600/40 que nos dice
que existen 40 grupos de 15 elementos entre los 600. Se elige un elemento de salida entre los 15 primeros, y
suponiendo que sea el k-simo, el resto de los elementos sern los k-simos de cada grupo. En concreto, si el
elemento de partida es el nmero 6, los restantes sern los que tengan los nmeros: 15+6 ,
2x15+6,......,39x15+6

TCNICAS DE MUESTREO SOBRE UNA POBLACIN

Ejercicio, Calcule el tamao muestral de una encuesta realizada. El error terico era de + 2, con un intervalo
de confianza de 95,5% y P=Q en el supuesto de un muestreo aleatorio simple.

Utilizamos la frmula para muestras infinitas en la que intervienen los tres factores determinantes
del tamao muestral: la probabilidad con la que queremos trabajar (z), el grado de concentracin,
dispersin de la poblacin (pq) y el error que estamos dispuestos a asumir.
z 2 pq 2 2 0,5 0,5
n 2.500
e2 0,02 2

Ejemplo, Si queremos extraer n=10 muestras de una distribucin N(0,1) podemos recurrir a una tabla de
nmeros aleatorios de k=5cifras, en las que observamos las cantidades, por ejemplo, 76.293, 31.776,
50.803, 71.153, 20.271, 33.717, 17.979, 52.125, 41.330, 95.141
A partir de ellas podemos obtener una muestra de X~N(0,1) usando una tabla de la distribucin normal:

Nmeros aleatorios Muestra U(0,1) Muestra N(0,1)


ti ui=ti/105 xi = F-1(ui)
76.293 0.76 0.71
31.776 0.32 (=1-0'68) -0.47
50.803 0.51 0.03
71.153 0.71 0.55
20.271 0.20(=1-0'80) -0.84
33.717 0.34(=1-0'66) -0.41
17.979 0.18(=1-0'82) -0.92
52.125 0.52 0.05
41.330 0.41(=1-0'59) -0.23
95.141 0.95 1.65

Ejemplo, Supongamos que realizamos un estudio sobre la poblacin de estudiantes de una Universidad, en el
que a travs de una muestra de 10 de ellos queremos obtener informacin sobre el uso de barras de
labios. En primera aproximacin lo que procede es hacer un muestreo aleatorio simple, pero en su
lugar podemos reflexionar sobre el hecho de que el comportamiento de la poblacin con respecto a
este carcter no es homogneo, y atendiendo a l, podemos dividir a la poblacin en dos estratos:
- Estudiantes masculinos (60% del total);
- Estudiantes femeninos (40% restante).
de modo que se repartan proporcionalmente ambos grupos el nmero total de muestras, en funcin
de sus respectivos tamaos (6 varones y 4 mujeres). Esto es lo que se denomina asignacin
proporcional.

Ejemplo, Consideremos una variable aleatoria de la que slo conocemos que su ley de distribucin es
gaussiana, X~N(), con 1= y 2=2 desconocidos
Para muestras aleatorias de tamao n=3, X1,X2,X3~N() un posible estimador del parmetro es
(X1 X 2 X 3 )
1 ( X 1 , X 2 , X 3 ) X N ,
3 3

LECCIN 26. CURVA CARACTERSTICA Y FUNCIN DE POTENCIA


Considrese la hiptesis alternativa de la siguiente manera:
Ho: = 0 = 10 H1: > 0 n = 9, = 0.05

La regin crtica de esta prueba est en c = 10.548, es decir, se rechaza H 0 = 10 si la media de la muestra es
mayor de 10.548. Para construir la curva OC se presentan en la tabla sigui ente diferentes valores
de la hiptesis alternativa con sus respectivas probabilidades de
aceptacin.
9.6 9.8 10.0 10.2 10.4 10.6 10.8 11.0 11.2 11.4 11.6
0.998 0.988 0.950 0.852 0.672 0.438 0.225 0.088 0.025 0.005 0.001

La siguiente es la Curva Caracterstica Operativa ( vs ) de la prueba de hiptesis planteada.

Si se tiene la hiptesis nula H o: = 0 contra la hiptesis alternativa H 1: = 1 el valor del error tipo II se
obtiene como una funcin de los valores alternativos de bajo H1, es decir, para cada valor de 1 se calcula ,
valor que a veces denotamos por (). La grfica vs () recibe, como ya se dijo, el nombre de Curva
Caracterstica Operativa, Curva OC, o curva CO.

Recordemos que ( es la probabilidad de aceptar la hiptesis nula H0 cuando la verdadera es la hiptesis


alternativa H1. Por lo tanto, 1-() representa la probabilidad de rechazar la hiptesis nula cuando la
verdadera es la hiptesis alternativa, es decir, representa la probabilidad de rechazar hiptesis falsas. Sin
embargo, en la mayora de estudios diferentes a los de control de calidad, en vez de la curva caracterstica
operativa se emplea la grfica denominada "Funcin de Potencia", donde se grafica vs 1-( ).

Considere la siguiente prueba de hiptesis:


Ho: = 0 = 10 H1: > 0 n = 9, = 0.05, = 1.

Considere tambin las siguientes regiones crticas:


A: Rechazar Ho si > 10.65 B: Rechazar Ho si > 10.45

Para calcular () es necesario darle valores a , y de ah calcular la potencia 1-().P() = P( >c/ = 1) =


1-()
Las tablas siguientes presentan los valores de los errores tipo II y de la potencia para las pruebas planteadas.

Potencia de la prueba P()


10.0 10.2 10.4 10.6 10.8 11.0 11.2 11.4 11.6 11.8
Prueba A 0.026 0.089 0.227 0.440 0.674 0.853 0.951 0.988 0.998 1.000
Prueba B 0.089 0.227 0.440 0.674 0.853 0.951 0.988 0.998 1.000 1.000
Error tipo II ()
10.0 10.2 10.4 10.6 10.8 11.0 11.2 11.4 11.6 11.8
Prueba A 0.974 0.911 0.773 0.560 0.326 0.147 0.049 0.012 0.002 0.000
Prueba B 0.911 0.773 0.560 0.326 0.147 0.049 0.012 0.002 0.000 0.000

PROPIEDADES DE LOS ESTIMADORES


Ejemplo. La media muestral es un estimador insesgado de la media poblacional ya que E( )=.

Ejemplo. T=X1 es un estimador insesgado de ya que E(X1)=

Ejemplo. Si X es Binomial (n,), demostrar que X/n es un estimador insesgado del parmetro .
X X 1 1
Solucin. Sea P E( P) E (X) n por lo tanto es insesgado
n n n n


N
Ejemplo. Sea X1, X2,..., Xn una muestra aleatoria con E(X i)=. Demostrar que si i 1
a i 1 entonces T
= a1X1 + a2X2 +...+anXn es un estimador insesgado de .

Ejemplo: Si S es la varianza de una muestra tomada al azar de una poblacin infinita, entonces S es un
estimador insesgado de . Previamente habamos demostrado que E(S) = .

1 n
X i X , ser un estimador insesgado de ?. Se puede demostrar que
2
Ejemplo. Si V
2

n
i 1

n 1 2
E(V 2 )
n

1 n 2
Ejemplo. Sea W
2
i 1
X i , ser un estimador insesgado de si es un parmetro conocido?.
n

1
X i X , un estimador insesgado de la varianza de una poblacin
2

n
Ejemplo. Ser S
2

n 1 i 1

finita?. No, si la poblacin es finita de tamao N, se puede demostrar que el estimador insesgado de
Aunque S es un estimador insesgado de la varianza de una poblacin infinita, no es un estimador insesgado
de la varianza de una poblacin finita. En ningn caso S es un estimador insesgado de

Ejemplo. Suponga que X, el tiempo de reaccin a cierto estmulo, tiene una distribucin uniforme en el
intervalo de 0 a un lmite superior (desconocido). Es decir,

Se desea estimar el parmetro con base en una muestra aleatoria X1, X2, ..., Xn de tiempos de reaccin.
Como es el tiempo mximo de reaccin, para toda la poblacin, se cumple que (X1, X2, ..., Xn), por lo
cual podemos considerar como un primer estimador el siguiente estadstico:
T1 = Mximo(X1, X2, ..., Xn).

Por ejemplo, si n = 5, y X = (12.4, 13.2, 15,7, 6.4, 10.7) = X3 = 15.7.


Es T1 un estimador insesgado de ?. S puede demostrar que
n
E(T1 )
n 1
n 1
El sesgo b est dado por . Considere T2 Max (X 1 , , X n ) . Es T2 un estimador
n 1 n
insesgado de? Si se tienen varios estimadores insesgados de un parmetro por lo general se escoge el que
tenga la menor varianza.

Ejemplo. Al calcular la media de una poblacin normal sobre la base de una muestra de tamao 2n+1, cul
es la eficiencia de la mediana con relacin a la media?
Se sabe que la varianza de la media X est dada por /(2n+1). Para una muestra aleatoria de tamao 2n+1
de una poblacin normal se sabe que el valor esperado y la varianza de la mediana estn dados por:
~ ~ ~ 2
E(X) V(X)
4n

La eficiencia relativa est dada por:

La eficiencia asinttica de la mediana con respecto a la media est dada por:

la media muestral es un estimador ms eficiente de la media poblacional que la mediana muestral.

La media requiere slo el 64% de las observaciones que requiere la mediana para estimar la media
poblacional con la misma confiabilidad. Estimador insesgado de mnima varianza. Para saber si un
estimador insesgado es de mnima varianza o con sesgo mnimo, se usa la desigualdad de Crmer-Rao, dada
en el siguiente teorema.

Ejemplo. Demuestre que X es el estimador insesgado de mnima varianza de la media de una poblacin
normal.
Por lo tanto se tiene que

Como sabemos que X es un estimador insesgado y su varianza es igual /n entonces X es el estimador


insesgado de mnima varianza de .

Ejemplo. Si la duracin de un servicio se distribuye normalmente, entonces X . Si = 2.5 minutos, y


se usan muestras de tamao 16, entonces T= 2.5/4 = 0.625 minutos. Si es desconocido y usamos como
estimador una desviacin estndar muestral de 2.8, entonces el error estndar estimado estar dado por 2.8/4
= 0.70 minutos.

Si estamos estimando una proporcin , entonces su mejor estimativo ser la proporcin muestral, es decir

y el error estndar ser

El error mximo ocurre cuando = 0.5, y ser

Si n = 50 el error mximo ser

Ejemplo. La media muestral es un estimador consistente de , y la proporcin muestral P = X/n es a su


vez un estimador consistente de la proporcin poblacional . (Ver Ley de los grandes nmeros).
La consistencia es una propiedad asinttica (propiedad lmite).

Ejemplo. Es T = X1 un estimador consistente de la media poblacional ?


Solucin. Tenemos que E(T) =E( X1) = , es decir es insesgado, y V(T) = V(X1) = 2. Como la varianza del
estimador no tiende a cero, entonces no es consistente, lo cual se puede verificar al aplicar la desigualdad de
Chebyshev, que expresa lo siguiente:

la cual no tiende a cero cuando n , es decir, que X1 no tiende a cuando n es grande.


Problema. Demostrar que la proporcin muestral P = X/n es un estimador consistente de la proporcin
poblacional .

Ejemplo. Demostrar que S es un estimador consistente de cuando se toman muestras de una poblacin
normal.
Solucin: Sabemos que:

E(S) =
Se observa que V(S) 0 cuando n .

Ejemplo. Demuestre que es un estimador consistente de .


Ejemplo. Sea X1, X2, ..., Xn una muestra aleatoria de tamao n de una distribucin gama, cuya funcin de
densidad est dada por,
(t ) k 1
f ( t ) e t , t0
(k )

La funcin de verosimilitud est dada por:


n n
nk e t i t i
L(X, ) i 1 i 1

(k )

Ejemplo. Sea X1, X2, ..., Xn una muestra aleatoria de tamao n de una distribucin de Poisson con parmetro
cuya funcin de densidad est dada por,
x e
f (t)
x!

Demostrar que el estimador eficiente para es a su vez un estimador suficiente. La funcin de verosimilitud
est dada por:

, donde

ESTIMACIN PUNTUAL
Ejemplo, para el valor medio de la distribucin normal con varianza conocida y un nivel de

confianza del 95%, tenemos, con 0,95, c 1,96 y calculamos el valor medio de la muestra

c
x1,...,xn de tamao n, y luego, k , quedando el nivel de confianza Conf {x k x k}
n

Si es grande, una observacin de X ser til para reducir la incertidumbre en la prediccin de Y

EL TAMAO DE LA MUESTRA
El teorema del limite central, sustenta la aproximacin a la normalidad para muchas distribuciones
discretas. Cuando el tamao de la muestra es grande, y dicha muestra es tomada de cualquier
distribucin con media , finita y varianza 2 finita, entonces la media aritmtica muestral tiene una
distribucin normal con media y varianza
Podemos entonces establecer intervalos de confianza para
,
: es denominado el nivel de significancia , si la significancia es por ejemplo, =0.05 entonces la
confiabilidad es del 0.95.

Si entonces el 95% de las muestras se encontrarn en el intervalo

,
ahora bien , como los parmetros poblacional y son desconocidos, para muestras grandes
(n>30) la varianza muestral S2 es un buen estimador de la varianza poblacional 2 , podemos
afirmar con una confiabilidad predeterminada que la media aritmtica poblacional se halla en el
intervalo

estamos admitiendo que la diferencia mxima entre y es de:

esto es:

entonces el tamao de muestra mnimo es


donde :
:
Valor crtico obtenido de la tabla normal, para una confiabilidad de
S2:Varianza muestral
e: Error mximo admitido
Sin embargo, n est en funcin de la varianza, la cual en la prctica es desconocida, ante lo cual
debemos hacer un muestreo piloto para estimar la varianza y proceder a reajustar el tamao de la
muestra mnimo.
Ejemplo:

Se desea realizar una investigacin para analizar, cual es la resistencia promedio de una
produccin de baldosas. Si admitimos un error mximo 25 Kg/cm 2, cual debe ser el tamao de
muestra mnimo si exigimos una confiabilidad del 95%, y en una muestra piloto obtuvimos una
desviacin tpica de 140 Kg/cm2?

Con una confiabilidad del 90% se quiere estimar la proporcin de ciudadanos que votar en las
prximas elecciones. Cual debe ser el tamao de la muestra, si admitimos un error del 3% y se
sabe que en las pasadas elecciones hubo una abstencin del 70%?

Dado que X es una distribucin binomial con x= np y

Entonces

por consiguiente
Para obtener la frmula m se deben hacer los siguientes supuestos:
1. El mnimo de datos que amerita clasificacin en intervalos es 16.
2. El nmero de intervalos no debe ser inferior a (5).
3. Cada vez que se duplique la informacin se incrementa en uno (1) el nmero de intervalos.
As las cosas, se obtiene la siguiente correspondencia:

Se llega a la siguiente igualdad:


n = 2m 1
Tomando logaritmo a ambos lados de la ecuacin

S-ar putea să vă placă și