Documente Academic
Documente Profesional
Documente Cultură
1. Introduccin.
2. Muestreo Aleatorio.
3. Diseo de Muestras.
4. Muestreo sistemtico.
5. Muestreo Estratificado.
6. Muestreo por conglomerados.
7. Distribuciones muestrales.
8. El error estndar de la media
9. El teorema Central del lmite.
12 12 11
66
2!
2
muestras distintas.
N
Con base en el resultado de que hay n muestras distintas de tamao n de una poblacin
finita de tamao N, podemos definir como muestra aleatoria o muestra aleatoria simple de
una poblacin finita:
Una muestra de tamao n de una poblacin finita de tamao N es una variable aleatoria
N
si se selecciona de manera tal que cada una de las n muestras posibles tienen la misma
1
N
probabilidad n de ser seleccionada.
pgina nmero 2
5
10
los ingresos anuales de cinco personas, los pesos de 5 vacas,.....) hay 3
muestras
1
N
n de ser
3- Diseos de muestras:
La nica clase de muestras estudiadas hasta ahora son las aleatorias, y no hemos
considerado siquiera la necesidad de que en ciertas condiciones pueda haber muestras que
sean mejores (digamos ms fciles de obtener, ms econmicas o mas formativas) que las
aleatorias, y no hemos entrado en detalles sobre la pregunta de cuando un muestreo
aleatorio es imposible.
En estadstica un diseo de una muestra es un plan definitivo, determinado por completo
antes de recopilar cualquier dato, para tomar una muestra de una poblacin de referencia.
Vamos a estudiar las mas comunes:
pgina nmero 3
n
N
n
N
.......
n
N
n
N
N
N n
i
para y=1,2,3,4,.... k
Esta seria una distribucin proporcional, pero hay otras formas de distribuir porciones de
una muestra entre los distintos estratos, que seran:
- Distribucin ptima.
- Estratificacin cruzada.
- Muestreo por cuotas.
Distribucin ptima:
En la Distribucin optima, no slo se maneja el tamao del estrato, como en la distribucin
proporcional, sino que tambin se maneja la variabilidad (o cualquier otra caracterstica
pertinente) del estrato.
pgina nmero 4
N 1 1
N 2 2
N 3 3
........
N k 1k
n N
n N N ....... N
i
para y=1,2,...., k
n= n1+n2+.......+nk
Estratificacin cruzada:
La estratificacin no se limita a una variable nica de clasificacin o una caracterstica y
las poblaciones a menudo se estratifican atendiendo a diversos criterios de ordenacin o
clasificacin. As por ejemplo si queremos realizar un estudio entre los alumnos de
distintos centros de EE. MM. podramos estratificar la muestra atendiendo al nivel de
estudios, al sexo, a la especialidad,.... As parte de la muestra se dedicara a los alumnos
de sexo femenino del 1 de Bachillerato tcnico, otra parte a los alumnos de sexo masculino
de 1 Bachillerato artstico, y as sucesivamente. As y hasta cierto punto una estratificacin
de este tipo, llamada estratificacin cruzada, incrementar la precisin de las estimaciones
y otras generalizaciones que se usan comnmente en el muestreo de opinin y las
investigaciones de mercado.
Muestreo por cuotas:
En el muestreo estratificado, el costo de la toma de muestras aleatorias de los estratos
individuales es tan alto, que a los encuestadores slo se les dan cuotas que deben cubrir de
los diferentes estratos, con alguna restricciones (si no es que ninguna) Por ejemplo si se
quiere hacer un sondeo sobre la mejora de los servicios de salud, por ejemplo se le pide que
encueste a 10 mujeres de entre 35 y 45 aos que sean asalariadas, 20 hombres de entre 30 y
45 aos que vivan en pisos de 3 o 4 habitaciones, a 3 hombres de mas de 60 aos que estn
jubilados.... esto es lo que se determina un muestreo por cuotas y es relativamente
econmico, lo nico es que las muestras resultantes no cumplen las caractersticas
esenciales de las muestras aleatorias. Por tanto estos muestreos, por cuotas en esencia son
muestras de opinin, pero no son vlidos para realizar un estudio estadstico formal.
3 5 7 9 11
7
5
y su desviacin tpica es:
(3 7) (5 7) (7 7) (9 7) (11 7)
5
2
5
10
Ahora si tomamos una muestra aleatoria de tamao n = 2 de esta poblacin hay 2
posibilidades:
n nuestra
1
2
Muestras
3
5
3
7
4
5
pgina nmero 6
Media
4
5
6
7
8
9
10
3
3
5
5
5
7
7
9
9
11
7
9
11
9
11
11
6
7
6
7
8
8
9
10
Probabilidad
1/10
1/10
2/10
2/10
2/10
1/10
1/10
pgina nmero 7
x
Media de la distribucin muestral de x
Error estndar de la media (desviacin tpica
x
de la muestra)
N n
N 1
N n
N 1 )
N n
N 1 de la segunda frmula de
El factor
x se conoce como factor de correccin de la
poblacin finita. En la prctica, este se omite a menos de que la muestra constituya al
pgina nmero 8
1
k
El teorema de Chebyshev se aplica a cualquier tipo de datos, pero slo nos indica por lo
menos que porcentaje debe caer entre ciertos lmites. Pero para casi todos los datos, el
porcentaje real de datos que cae entre esos limites es bastante mayor que el que especifica
el teorema de Chebyshev.
Para las distribuciones que tienen forma de campana puede hacerse una aseveracin ms
fuerte:
(1) alrededor del 68% de los valores caern dentro de una desviacin tpica de la
media esto es: entre X , X ;
(2) aproximadamente el 95% de los valores caern dentro de dos desviaciones tpicas
de la media, esto es : X 2, X 2 ;
(3) aproximadamente el 99,7% de los valores caern dentro de dos desviaciones
tpicas de la media, esto es : X 3, X 3 ;
Basndonos en el teorema de Chebyshev con k=2 Qu podemos decir del tamao de
nuestro error, si vamos a usar la media de una muestra aleatoria de tamao n=64 para
estimar la media de una poblacin infinita con =20?
Sustituyendo n=64 y =20 en la frmula apropiada para el error estndar de la media,
20
2,5
64
y por el teorema de Chebyshev podemos afirmar que
obtenemos que :
como mnimo 1 - 1/22 = 0,75 que el error ser menor que kx = 22,5= 5.
Es decir que tenemos una garanta de que en el 75% de los casos la media de la
poblacin estar entre la media calculada 5 .
Pero esto no es suficiente, cuando la probabilidad real de este caso puede estar entre
0,98 y el 0,999
pgina nmero 9
=y
para muestras aleatorias infinitas con media y desviacin tpica y n
grande, entonces:
x
/ n
Este teorema es muy importante, puesto que justifica el uso de los mtodos de la
curva normal en una gran cantidad de problemas. se utiliza para poblaciones infinitas
y para poblaciones finitas cuando n a pesar de ser grande representa una porcin muy
pequea de la poblacin.
Es difcil sealar con precisin qu tan grande debe ser n de modo que podamos
aplicar el Teorema Central del lmite, pero a no ser que la distribucin sea muy
Inusual, por lo general se considera que n =30 es lo suficientemente alto.
Veamos el mismo ejemplo anterior aplicando el Teorema Central del Lmite.
pgina nmero 10
539
257
393
402
116
707
Media
216
290
450
183
127
266
128
213
92
310
348
91
462
325
241
257
418
703
283
306
302
257
232
380
413
184
319
302
400
618
237
168
193
315
166
79
193
310
281
353
451
588
177
266
313
128
315
199
298,87
Nmero de muestras:
1
3
3
1
402
177
707
2
380
257
257
3
266
462
128
4
451
116
127
5
588
290
306
6
128
128
283
7
193
310
335
8
306
310
319
9
400
302
279
10
237
281
266
11
335
335
588
12
402
241
244
13
302
91
266
14
283
111
707
15
216
315
79
16
306
400
257
17
79
91
335
18
237
91
406
pgina nmero 11
19
40
18
38
295
290
193
588
184
451
116
Media 340,3
Desv 184,3
Tpi:
92
266
166
295
313
183
413
281
402
380
183
295
266
257
450
315
193
319
310
116
315
92
183
257
177
306
177
166
91
393
193
79
283
183
232
462
127
193
406
128
295
257
266
310
295
335
128
306
539
92
283
335
281
315
279
184
707
313
281
400
295
183
266
116
244
184
213
116
257
380
116
166
462
232
290
400
418
193
588
335
279
451
295
588
618
707
232
257
413
462
315
127
184
92
319
116
237
539
618
315
418
232
306
450
283
283
257
281
618
400
257
450
232
257
79
310
402
168
325
23
35
30
79
18
32
23
262,2
92,11
292
94,99
271,2
121,2
254,2
130,1
199,3
94,48
270,6
107
311,4
94,04
275
79,66
322,9
138,3
276,8
134,2
297,1
111,2
338,8
152,2
410,5
198
222,4
133,4
358,5
109,7
305,1
152,1
250,7
108,8
268
97,6
291,7
Como se puede observar las diferencias con respecto a los valores poblacionales son
importantes.
pgina nmero 12