Sunteți pe pagina 1din 28

1

Muestreo
Y sus aplicaciones
2
Poblacion y muestra
El objeto del estudio es:
Conocer en detalle las caracteristicas en la muestra o
Conocer algunas caracteristicas en la poblacion objeto de estudio
Poblacin
Muestra
Resultados
censo
muestra
muestreo
investigador
Inferencia de
resultados
3
La muestra debe ser:
Representativa: Porque a cada elemento de la
poblacion le corresponde una probabilidad diferente de
cero de ser seleccionada para integrar la muestra.
Viable: De facil aplicacin.
suficiente: Permite recolectar la mayor cantidad posible
de informacion al menor costo.
Inferencia estadistica: Permite elaborar conclusiones
probabilisticas acerca de una poblacion en base a una
muestra de dicha poblacion
4
Ventajas de un estudio mediante muestra:
1Economia:
En recursos de personal y materiales.
Tiempo: Que la informacion obtenida sea oportuna,
cuando se le quiera
2Calidad de la informacion obtenida,
la calidad de la informacion recogida en la muestra es
mejor que la obtenida en el censo, porque en el censo es
mas dificil capacitar y supervisar a los recursos humanos.
Por este motivo, casi la totalidad de estudios se realizan
mediante muestras
5
Definicion de terminos
a. Unidad de analisis.-
Tambien se le denomina el elemento de la poblacion y es
aquella unidad invisible de la cual se obtiene el dato
estadistico. Ejemplo: puede ser una persona, historia
clinica, vivienda, o un animal, etc.
b. Poblacion.-
Es el conjunto de personas, objetos o cosas con una
caracteristica o atributo especial cuantificable, en un
periodo y lugar determinado. Ejemplo: estudiantes del
Taller de Tesis de la EUPG UNFV del semestre del
2010. La caracteristica a estudiar es la estatura que
permite obtener los datos.
6
Tipo de poblacion
Poblacin homognea Poblacin heterognea
7
c. Marco de muestreo.-
Permite identificar a los elementos de la poblacion que
es objeto de estudio. Puede ser una lista de personas,
una relacion de viviendas, un archivo, o un croquis de
una determinada comunidad, etc. El marco debe estar
completamente actualizado porque de el se
seleccionara la muestra.
8
Poblacion
objetivo
Marco
muestral
1.
2.
3.
.
.
N(tamao de
poblacion)
Muestra
Listado de unidades
de la poblacion Cada
unidad es identificado
por un codigo
Unidad de anlisis
Inferencia estadstica
9
Parametro.-

Es un valor que describe una caracteristica o un atributo de la poblacion.Algunos
parametros de la poblacion de nios menores de 5 aos de edad que estamos
interesados en estudiar en base a la muestra son
i). Media aritmetica poblacional:
-Peso promedio
-Hemoglobina promedio
-Estatura promedio
ii). Proporcion poblacional:
-Proporcion de nios que estan desnutridos
-Proporcion de nios que estan
-Proporcion de nios que tuvieron solamente lactancia materna exclusiva
10
g. Estadistico
Es un valor que describe una caracteristica o atributo de una muestra y
esta en funcion de los datos muestrales. Por ejemplo se tiene la media,
razon o proporcion muestral

h. Error muestral.
Se refiere unicamente a la variabilidad o dispersion entre los resultados
de un estadistico de muestras sucesivas del mismo tamaoo diferente.
Lamedia apropiada para cuantificar este error es el error estandar

11
Seleccion de muestras de tamao n=100
Poblacion de
80 / p m =
personas de 40 a 50
aos de edad cuya FC
tiene y
2 / p m o =
Los estadisticos y Si se calculados en las diferentes muestras sellecionadas,
a veces seran iguales y en otras seran diferentes. Las diferencias que se
observan entre los estadisticos de las diferentes muestras seleccionadas se
debe a la presencia de los errores muestrales.
Para cuantificar la variabilidad atribuida a los errores muestrales se utiliza la
media del ERROR ESTANDAR. Con el error estandar recien se pueden realizar
las inferencias estadisticas respectivas.
i
x
Seleccionamos 1 muestra con
y
1
100 82 / n x p m = =
1
1.5 s =
Seleccionamos 1 muestra con
y
79 /
n
x p m = n=100
2
3 / s p m =
Seleccionamos 3muestras con
n=100 y
3.1
n
s =
80.5 /
n
x p m =
12
Muestreo probabilistico
El muestreo probabilistico se basa en que cada unidad de la poblacion tiene
probabilidad distinta de cero de ser elegida para integrar la muestra. Esta
premisa le da un carcter aleatorio a la eleccion de las unidades de la
poblacion para integrar la muestra. La probabilidad de seleccin de un
elemento para integrar la muestra sin reposicion es de n/N

Para disear una muestra probabilistica se tendr en cuenta las tres
operaciones basicas:
- Procesos de seleccin
- Procesos de estimacion
- Tamao de muestra
13
Tipos de muestreo probabilistico
Muestreo aleatorio simple
Muestreo sistematico
Muestreo estratificado
Muestreo por conglomerados
14
Muetreo empirico o no probabilistico

El muestreo no probabilistico se caracteriza por el hecho de que no es posible
determinar la probabilidad de inclusion de cada unidad de la poblacion en la
muestra. Generalmente, para la seleccin de las unidades interviene el criterio
subjetivo del investigador. Con este metodo no podemos elegir muestras
representativas porque no podemos cuantificar el error muestral.
El muestreo empirico o no
probabilistico no permite la
inferencia estadisticay solo
se le puede usar como
estudio preliminar, piloto o
exploratorio
Poblacion
Muestra
Investigador
15
Muestreo aleatorio simple.
Se aplica cuando la poblacion es finita y homogenea.
Una poblacion es finita cuando las unidades pueden ser enumeradas y podemos identificar
al ultimo de ellos.
En un muestreo aleatorio simple sin reposicion, a cada elemento de la poblacion le
corresponde la misma probabilidad de ser seleccionada para integrar la muestra y esto se
denotara asi:
P = n/N ( n= tamao de muestra)
(N =tamao de poblacion)
Ejemplo 1 Procedimiento: Una poblacion N=150 y una muestra n=10
P = 10/150 = 1/15
1. El procedimiento consiste en enumerar los elementos de la poblacion
2. Se usa la tabla de numeros aleatorios (tambien se puede usar programas
informaticos diseados para tal fin)
Si N = 150 en la tabla de numeros aleatorios se seleccionan 3 columnas porque pide 3
digitos, y se busca desde 001 a 150
La muestra tomada es sin reposicion, es decir si un numero se repite varias veces solo se
tomara una sola vez.
En este caso se encuentra: 102 009 043 025 142 104 059 150 092 016

16
Muestreo sistematico.
Es usada cuando la poblacion es finita y heterogenea
Procedimiento:
Arranque aleatorio que consiste en:
1. Enumerar los elementos de la poblacion
2. Determinar una relacion de muestreo denotado por K
K = N/n ( N= tamao de la poblacion)
( n= tamao de la muestra)
Por ejemplo si N = 150 y n = 10 entonces K = 150/10 = 15
Una vez identificado k se considera o genera un intervalo de seleccin que
esta comprendido entre 1 y k ( en el ejemplo entre 1 y 15) incluyendo 1 y k y
se seleccionara en forma aleatoria. Al numero seleccionado se considera el
arranque aleatorio (r)
Y la muestra estara integrada por r , r+k , r+2k , r+3k , r+4k..r+(n-1)k
Asi en el ejemplo ejemplo se elige el arranque n8 se tendr la siguiente
muestra:
8, 23, 38, 53, 68, 83, 98, 113, 128, 143

17
Tamao de muestra

Para determinar el tamao de muestra se tiene en cuenta el tipo de
poblacion, es decir:
Si la poblacion es homogenea se requiere pocos elementos en la
muestra y si la poblacion es heterogenea se requiere un mayor
numero de elementos.
Para establecer una formula del tamao de muestra se requiere
saber el tipo de parametro que se desea estimar, es decir, si el
interes es estimar una media aritmetica se requiere una formula
especifica y si se quiere estimar una proporcion se considera otra
formula
18
Formula de tamao de muestra para estimar una media aritmetica

2 2
2 2 2
( 1)
n
o
o
Z N
=
E N + Z
Donde:
N: Tamao de la poblacion que es objeto de estudio
Z: Es unas desviacion normal cuyo valor corresponde al grado de confianza
que se establece.
N:C : 90% 95% 99%
Z : 1.64 1.96 2.57
: Varianza poblacion de la poblacion que es objeto de estudio
En la practica, el valor a la varianza, hay que tener en cuenta las siguientes
recomendaciones:
-Recurrir a estudios similares que se han realizado y obtener el lvalor de la
varianza respectiva
-Realizar un estudio piloto para estimar
E: Error absoluto o precision de la estimacion deseada de la media.
2
o
2
o
19
Ejemplo
Inters: Conocer el colesterol promedio de los estudiantes de la facultad de
medicina (suponemos que son unos 1800 alumnos)
El estudio queremos realizarlo mediante una muestra y necesitamos calcular el
tamao de muestra n considerando:
Un grado de confianza 95%
Resultados de un estudio preliminar.
210 x =
Y s=30 error relativo del 6%
Solucin:
Por definicin de error relativo por consiguiente
Como el Grado de confianza es del 95%, nos indica que Z=1.96
Error absoluto E=6*210100 = 12.6; Varianza

Reemplazando valores en la formula se tiene n=


Por tanto, n=22 (para realizar el estudio se requiere como mnimo 22 estudiantes)
1
/ *100 E E X =
* /100 E Er X =
( )
2
2
30 o =
( ) ( ) ( )
( ) ( ) ( )
2 2
2
2 2
1.96 30 1800
12.6 1799 1.96 30 +
20
Determinacin del tamao de muestra para estimar una proporcin
( )
( ) ( )
2
2 2
1
1 1
Z P P N
n
E N Z P P

=
+
N: Tamao de la Poblacin
Z: Desviacin Normal
P: Proporcin de unidades que poseen el atributo de inters en la poblacin
E: Error absoluto o precisin de la estimacin de la proporcin. Por lo general
El valor que asume es de 0.05


En la practica, el valor de la proporcin P se desconoce, Para determinar dicho
Valor se recurre a las siguientes recomendaciones:

-Recurrir a estudios similares que hayan realizado y extraer el valor de P.
-En caso de no haber antecedentes, se recurre a un estudio piloto para conocer
P. En caso contrario se recurre a la mxima varianza cuando P=0.5.
21
Ejemplo
Interes: Conocer la proporcion de estudiantes que fuman cigarrillos en la
facultad de educacion de la UPSP. Numero de estudiantes N = 1800.
El estudio se realizara mediante una muestra. Calculamos el tamao de
muestra, considerando: Grado de confianza del 95%, por consiguiente, z=1.96.
De un estudio preliminar se ha determinado que la proporcion de alumnos que
fuman cigarrillos es de p = 0.30. El error absoluto que se toma en cuenta es de
E = 0.05
Reemplazando la infomracion en formula, se tiene:
2
2 2
(1.96) (0.3)(0.7)(1800)
274
(0.05) (1799) (1.96) (0.3)(0.7)
n = =
+
Por lo menos se requiere para ejecutar el estudio 274estudiante
22
En caso de que se desconozca el tamao de la poblacion N, las formulas
quedaran reducidas como:

-para estimar una medida aritmetica,




-para estimar una proporcion,
2 2
2
n
o Z
=
E
2
2
(1 )
n
Z P P
=
E
23
DISTRIBUCIONES MUESTRALES:
Cuando se realiza un trabajo de investigacin, se selecciona solo
una muestra de cada poblacion y a partir de ella se efectuan las
estimaciones pertinentes u otras tareas conducentes a conclusiones
acerca de la poblacion.
Asi por ejemplo:
De una poblacion de 10 personas, se quiere seleccionar una
muestra de 2 sujetos. cuntas muestras se podran obtener?
Como:

45
)! 2 10 ( ! 2
! 10
) 2 , 10 (
=

= C
24
Si hipotticamente seleccionramos todas las muestras posibles de una
poblacin cualquiera, seria posible tambin calcular para cada una de
ellas, su media, su varianza, su desviacin estndar, etc. y por tanto, seria
posible construir su distribucin muestral de medias, varianzas, de
desviaciones estndar, etc.

k
k
k
s s s
s s s
x x x
........ ,
,...... ,
,.......
2 1
2 2
2
2
1
2 , 1 Distribucin muestral de medias
Distribucin muestral de varianzas
Distribucin muestral de desviaciones
estandar.

Distribucin Muestral de Medias
En el anlisis estadstico de los resultados de las mediciones muestrales, se tiene
que realizar, entre otras tareas, la descripcin de la muestra, estimaciones de los
parmetros poblacionales, pruebas de hiptesis, etc. Todo generalmente utilizando la
media aritmtica obtenida en la muestra seleccionada.
Para ello, tenemos una poblacin muy pequea, a fin de que sea posible,
seleccionar las muestras de tamao n.
25
Ejemplo:
Sea la poblacion conformada por los siguientes datos
correspondiente a meses de edad de un grupo de nios:
2 , 4 , 3 , 7 , 8 , 6 . ( N= 6)
Procedemos del siguiente modo:
a.- Calculamos la media aritmtica ,( ) la varianza y la
desviacin estndar de la poblacin

2 -3 9
3 -2 4
4 -1 1
6 1 1
7 2 4
8 3 9
28
x
) (
2
x
c
) (
x
c
16 . 2
64 . 4
6
28 ) (
5
6
6 8 7 3 4 2
2
2
= c
= =

= c
=
+ + + + +
=

=
x
x
x
i
x
N
x
N
x

i
x
x i
x
2
) (
x i
x




26
b.- Seleccionamos muestras de tamao 2 (n=2) y calculamos la media, la varianza y la
desviacin estndar de las muestras
Como
2,3 2.5 -2.5 6.25
2,4 3 -2 4
2,6 4 -1 1
2,7 4.5 -0.5 0.25
2,8 5 0 0
3,4 3.5 -1.5 2.25
3,6 4.5 -0.5 0.25
3,7 5 0 0
3,8 5.5 0.5 0.25
4,6 5 0 0
4,7 5.5 0.5 0.25
4,8 6 1 1
6,7 6.5 1.5 2.25
6,8 7 2 4
7,8 7.5 2.5 6.25
75 28

Muestras ) (x
) (
x
x
2
) (
x
x
15
) 2 , 6 (
= C
37 . 1 87 . 1
87 . 1
15
28 ) (
5
15
75
) : ( ;
2
2
= = c
= =

= c
= =

=
x
x
x
x
i
x
k
x
muestras N k
k
x

27
Para este y cualquier caso se cumple que:
i.- La media de las medias muestrales es igual a
la media de la poblacin
ii.- El error estndar de la media, es menor que la
desviacin estndar de la poblacin
En general, el error estndar de la media se
calcula conociendo los valores de N, n, y
Mediante la formula:


x x
=
x x
c < c
x
c
37 . 1
1 6
2 6
2
16 . 2
1
=

= c

c
= c
x
x
x
N
n N
n
Con los datos del ejemplo anterior
28



El factor

Se llama Factor de correccin por poblacin finita, el cual es
aproximadamente igual a 1, cuando la muestra es 10% o menos de
la poblacin
En una investigacin, las muestras son pequeas con relacin a la
poblacin, por lo tanto, el error estndar de la media se calcula por
la formula:
EJEMPLO:
Dada la poblacin, formada por los elementos: 5,8,9,6,7,4,3
Calcular: a.-
b.- Seleccionar todas las muestras aleatorias posibles de tamao 3
c.- Calcular la media, la varianza y la desviacin estndar muestrales
1
c
= c
N
n N
n
x
x
1

N
n N
n
x
x
c
= c
x x x
c c ;.... ;...
2

S-ar putea să vă placă și