Sunteți pe pagina 1din 23

CAPTULO II.

TEORA DE MUESTREO

II.1 Muestreo

Actualmente el muestreo puede ser considerado como un instrumento organizado para
obtener hechos. Permite que se tomen decisiones que toman en cuenta factores de
importancia de los problemas que se desean resolver, adems de ocuparse de la adecuada
presentacin de los hechos individuales registrados y de la manera en que stos se
recopilan y resumen.

Algunas de las ventajas que se presentan, si se piensa en realizar una muestra, son
mencionadas a continuacin:

Costo reducido. Si los datos obtenidos provienen de una pequea fraccin de la poblacin,
los gastos asociados a su recopilacin sern mucho menores que si se intenta realizar un
censo. Cuando se trata con poblaciones grandes, resultados precisos pueden obtenerse de
muestras que solamente representan una pequea fraccin de la poblacin.
Mayor rapidez. Como consecuencia de lo anterior, los datos pueden recolectarse y
resumirse rpidamente con una muestra, siendo esto de vital importancia cuando se
requiere la informacin con urgencia.
Mayor alcance. Para la realizacin de algunos tipos de encuestas se cuenta con personal y
recursos limitados. Lo anterior conlleva a que la realizacin de un censo sea algo
imprctico, y por tanto se tiene mayor flexibilidad respecto a la informacin que se puede
llegar a obtener.
Mayor exactitud. Dado que se reduce el volumen de trabajo en gran medida, se puede
utilizar personal ms capacitado y someterlo a entrenamiento intensivo, con el fin de tener
una supervisin cuidadosa del trabajo de campo y procesamiento de los resultados.

En el diseo de una muestra hay que considerar dos aspectos; inicialmente un proceso de
seleccin, en la que se incluyen en la muestra algunos elementos de la poblacin; y
posteriormente un proceso de estimacin, en el que se llevan a cabos los clculos de las
estadsticas de la muestra, que son estimadores muestrales de valores de la poblacin.

El diseo de una muestra considera las tareas de seleccin y estimacin para realizar
inferencias que vayan del valor muestral al valor de la poblacin. Un valor de la poblacin
es una expresin numrica que sintetiza los valores de una o varias caractersticas de la
totalidad de la poblacin; en otras palabras, una medida resumen de una cualidad de la
distribucin de la variable o variables en la poblacin definida.

El valor de la muestra, o estadstica, es una estimacin que se calcula a partir de los
elementos que conforman la muestra. Por el contrario, el valor de la poblacin depende de
todos los elementos que forman parte de la poblacin.

Una de las desventajas al utilizar el muestreo, es que dentro de los valores muestrales que
se pueden obtener, es posible llegar a toparse con algunas deficiencias resultado de una
designacin de solo una fraccin de la poblacin total a ser observada en la muestra, sin
embargo, al realizar un buen diseo de muestra, se tiene como consecuencia que estos
errores tengan la menor presencia posible.

Dentro del muestreo se pueden distinguir varias formas.
1. Muestras casuales o fortuitas, en las cuales se sacan conclusiones solamente de
elementos que llegan por casualidad.
2. Seleccin experta, que se considera como un tipo de muestro no aleatorio, ya que
personas consideradas como expertas se encargan de escoger unidades que
consideran tpicas o representativas.
3. Muestreo de cuota que es aquel en el que de acuerdo a algunas variables
demogrficas, se construye una muestra relativamente proporcional a la poblacin.
4. Muestreo de poblaciones mviles. En el que la poblacin total es estimada de la
proporcin de individuos en la recaptura, que han sido capturados de manera previa
y fueron marcados.

En los tipos de muestreo anteriores, se llevan a cabo varias suposiciones acerca de las
distribuciones de las variables de encuesta en la poblacin. En un sentido contrario, en los
casos de muestreo probabilstico, se pueden llevar a cabo inferencias de la poblacin por
medio de mtodos estadsticos, sin tener que hacer suposiciones acerca de ella. En este
ltimo, cada uno de los elementos de la poblacin tiene una probabilidad conocida adems
de no nula, de ser seleccionado. El valor de tal probabilidad se determina de acuerdo al
diseo de la muestra.
Las muestras probabilsticas en general son diseadas para ser medibles, es decir, la
inferencia estadstica de los valores de la poblacin, resultado de la ejecucin de un
muestreo en una poblacin particular, pueda basarse en medidas de variabilidad.

El muestreo aleatorio simple es el proceso de seleccin bsico y los dems procedimientos
de seleccin de muestras pueden considerarse como modificaciones de l.
1. Mesip, es un mtodo de seleccin con igual probabilidad para todos los elementos
de la poblacin.
2. Muestreo de elementos, en este tipo los elementos son tambin las nicas unidades
de muestreo.
3. La estratificacin, se refiere a la seleccin de la muestra a partir de varias
subpoblaciones conocidas como estratos, en los que se ha divido la poblacin.
4. La seleccin sistemtica, se puede considerar como una alternativa de seleccin
aleatoria, en este caso se seleccionan las unidades de muestreo en secuencias
separadas en lista usando un intervalo de seleccin.
5. Muestreo en dos fases, en este caso se subselecciona la muestra final a partir de una
muestra preseleccionada ms grande, que contiene informacin que permite
mejorar la seleccin final.

Un buen diseo de muestra, requiere se equilibren en la medida de lo posible 4 criterios:
a. Orientacin haca la meta. El diseo completo, tanto al momento de realizar la
seleccin como la estimacin, debe estar orientado a los objetivos de la
investigacin. Estas consideraciones deben figurar al momento de seleccionar y
definir a la poblacin, en la medicin y procedimientos de muestreo.
b. La medibilidad es una caracterstica que permite calcular, a partir de la informacin
de la muestra, estimaciones vlidas o aproximaciones de su variabilidad de
muestreo. Esta es la base necesaria para que se pueda llevar a cabo inferencia
estadstica, y sirve como puente entre el resultado de la muestra, y el valor
desconocido de la poblacin.
c. Practicidad, que se refiere a los problemas que deben ser resueltos para poder llevar
a cabo el diseo como se propuso de manera inicial. La simplicidad siempre debe
encontrarse entre los objetivos, ya que se reduce el riesgo de errores, y se compensa
en gran medida la prdida de un poco de eficiencia terica. El arte del muestreo
consiste en llevar a cabo un diseo prctico que se comporte de la mejor manera
posible, an cuando no sea perfecto, y se adapte a un modelo.
d. Economa, que se refiere a cumplir los objetivos con un costo mnimo. Una muestra
ser demasiado pequea si los resultados que ofrece carecen de precisin suficiente
para contribuir a las decisiones. Por otro lado, una muestra ser demasiado grande
si sus resultados son ms precisos de lo que se requiere. Es necesario mediar estas
dos situaciones considerando el costo en el que se incurre al realizar el muestreo.

En general estos cuatro criterios suelen estar en conflicto, sin embargo, se deben equilibrar
y combinar para conseguir un buen diseo de muestreo.

A continuacin se exponen caractersticas deseables de una muestra, que sin embargo no
son por s mismos necesarios y suficientes para tener una buena muestra.
- Las muestras probabilsticas requieren de probabilidades no nulas y que sean conocidas.
- Las muestras medibles son muestras probabilsticas, diseadas para permitir estimar la
variabilidad de muestreo.
- Los muestreos mesip, que son clases especiales de muestreo probabilstico, requieren
probabilidades iguales para cada uno de los elementos.
- Los muestreos de rea usan segmentos de rea como unidades de muestreo.
- Las muestras insesgadas denotan a aquellos diseos en los que el valor esperado es igual
al valor de la poblacin.
- Las muestras precisas son aquellas que tienen errores estndar bajos.
- Las muestras econmicas tienen costos unitarios bajos para una varianza fija.
- Las muestras eficientes denotan una precisin alta, es decir, baja varianza por elemento.

II.2 Muestreo Aleatorio Estratificado

II.2.1 Descripcin.
En el muestreo estratificado a la poblacin que consta de N unidades se le divide de
manera primaria en subpoblaciones con N
1
, N
2
,, N
L
unidades respectivamente. Estas
poblaciones no deben contener ningn traslape, es decir, sus elementos deben ser
excluyentes, y al reunirlas deben comprender la totalidad de la poblacin, de tal manera
que:
N N N N
L
= + + + ...
2 1

A cada una de estas subpoblaciones se le denominar estrato. Para lograr el beneficio total
derivado de la estratificacin, los valores de las N
h
deben ser conocidos. Cuando los
estratos han sido determinados, se selecciona una muestra de cada uno de ellos, siendo esta
seleccin independiente en cada uno de los diferentes estratos. El tamao de las muestras
en cada uno de los estratos se denota por n
1
, n
2
,,n
L
, respectivamente.

En caso de que se haya tomado una muestra aleatoria simple en cada uno de los estratos, a
todo el procedimiento se le designar con el nombre de muestreo aleatorio estratificado.

De la muestra que se obtenga en cada uno de los estratos, se calcula la media
correspondiente, o cualquier otra estadstica, y sta se pondera apropiadamente para
obtener una estimacin combinada del total de la poblacin. Del mismo modo, se calculan
las varianzas dentro del estrato, son ponderadas adecuadamente y se suman para llegar a
una estimacin combinada para la poblacin.

La estratificacin es una tcnica empleada comnmente, debido a razones diversas entre
las que encontramos:

Existencia de una gran conveniencia administrativa, ya que si se cuenta con
diversas oficinas de campo, se pueden supervisar varias encuestas en distintas
partes de la poblacin.
Presencia de problemas de muestreo que no son homogneos para todas las partes
de la poblacin, por lo que al dividirla es posible conseguir estratos que compartan
caractersticas similares, lo cual es una caracterstica deseable al realizar la
estratificacin.
Se puede llegar a producir una ganancia en precisin para algunas caractersticas
que se quieran conocer de la poblacin. Es posible llegar a dividir una poblacin
heterognea en subpoblaciones que sean homogneas internamente. Si cada uno de
los estratos es homogneo, en el hecho de que las medidas de la poblacin varen
muy poco de una unidad a otra, se puede obtener un clculo preciso de la media de
cualquier estrato de una pequea muestra de ste. Estos clculos pueden entonces
combinarse para obtener una estimacin precisa del total de la poblacin.
La estratificacin es utilizada para reducir las varianzas de las estimaciones de la
muestra; las cuales van disminuyendo de acuerdo al grado en que las medias de los
estratos difieran entre ellas y a la homogeneidad que exista dentro de ellos.
Dentro de los diferentes estratos, se pueden utilizar diferentes mtodos y
procedimientos.
a. Si la distribucin fsica de algunas porciones de la poblacin difiere
radicalmente, puede resultar beneficioso realizar procedimientos diferentes
a las partes.
b. Puede existir contraste en las listas disponibles para diversos sectores de la
poblacin.
c. La existencia de naturaleza diversa en los elementos en algunas partes de la
poblacin podra requerir la utilizacin de procedimientos distintos.
Los estratos pueden construirse por que las subpoblaciones dentro de ellos mismos
tambin se consideran como dominios de estudio. Donde un dominio se define
como una parte de la poblacin para la cual se planean estimaciones separadas en el
diseo de la muestra.

La teora del muestreo estratificado se relaciona con las propiedades de las estimaciones de
una muestra estratificada y con la mejor opcin del tamao de la muestra n
h
para obtener la
mxima precisin posible.

II.2.2 Notacin
El sufijo h denota el estrato e i la unidad dentro del estrato.

N
h
Nmero total de unidades en el estrato h
n
h
Nmero de unidades en la muestra del estrato h
y
hi
Valor de la i-sima unidad
W
h
=N
h
/N Peso del estrato h
f
h
=n
h
/N
h
Fraccin de muestreo en el estrato h

h
N
i
hi
h
N
y
Y
h

=
=
1
_
Media poblacional

h
n
i
hi
h
n
y
y
h

=
=
1
_
Media muestral

( )
1
1
2
2

=

=
h
N
i
h
hi
h
N
Y y
s
h
Varianza poblacional

2
) 1 (
) ( S
n
f
y V

= Varianza de la media en m.a.s.

II.2.3 Propiedades de los estimadores
Para obtener la media global, el estimador utilizado en muestreo estratificado es
st
y ,
donde:
L
L
h
h h
L
h
h h
st
N N N N donde
y W
N
y N
y
+ + + =
= =

=
=
...
2 1
1
1
(2.1)
El estimador
st
y en general no es el mismo para la media muestral. Esta media
muestral, y , puede escribirse:
n
y n
y
L
h
h h
=
=
1
(2.2)
Es evidente que y coincide con
st
y , dado que en cualquier estrato se cumpla con lo
siguiente:
f f
N
n
N
n

N
N
n
n
h
h
h h h
= = =
Lo cual implica que la fraccin de muestreo sea la misma en cualquiera de los estratos.
Este tipo de estratificacin se conoce como estratificacin con asignacin proporcional de
n
h
.

A continuacin se describen las propiedades principales del estimador
st
y en los siguientes
teoremas:

Teorema 1. Si en cada estrato el estimador muestral
h
y es insesgado, entonces
st
y es un
estimador insesgado de la media poblacional
_
Y .
Demostracin:
( )

= =
=

=
L
h
h
h
L
h
h h st
Y W y W E y E
1 1

debido a que los estimadores son insesgados en los estratos individuales. La media
poblacional puede escribirse:


=
= = =
= = =
L
h
h
h
L
h
h
h
L
h
N
i
hi
Y W
N
Y N
N
y
Y
h
1
1 1 1

Lo cual completa la demostracin.

Teorema 2. Si las muestras se obtienen de manera independiente en los diferentes estratos:

=
=
L
h
h h st
y V W y V
1
2
) ( ) ( (2.3)
donde ) (
h
y V es la varianza de
h
y sobre muestras repetidas del estrato h.
Demostracin:

=
=
L
h
h h st
y W y
1
(2.4)
st
y es una funcin lineal de
h
y con sus respectivos pesos
h
W . Por tanto es posible
expresar el resultado estadstico para la varianza mediante la funcin lineal:

= = >
+ =
L
h
L
h
L
h j
j h j h h h st
y y Cov W W y V W y V
1 1
2
) ( 2 ) ( ) ( (2.5)
Sin embargo, debido a que las muestras entre estratos se eligieron de manera
independiente, los trminos de covarianza desaparecen. Lo cual da como resultado la
ecuacin (2.3).

Lo importante acerca de estos resultados es que la varianza de
st
y depende solo de las
varianzas de los estimadores de las medias de los estratos individuales h Y . Si fuera posible
fraccionar una poblacin altamente variable en estratos tales que todos los elementos
tengan el mismo valor dentro del estrato, sera posible estimar Y sin error alguno. La
ecuacin (2.4) muestra que el uso del peso correcto del estrato N
h
/N al estimar
st
y
permite alcanzar este propsito.

Teorema 3. Para muestreo aleatorio estratificado, la varianza del estimador
st
y es:

= =
= =
L
h
L
h
h
h
h
h
h
h
h h h st
f
n
S
W
n
S
n N N
N
y V
1 1
2
2
2
2
) 1 ( ) (
1
) ( (2.6)
Demostracin. Debido a que
h
y es un estimador insesgado de h Y , el teorema (2.2) puede
aplicarse. Adems aplicado a un estrato individual:
h
h h
h
h
h
N
n N
n
S
y V

=
2
) (
Por sustitucin en el resultado del teorema 2, se obtiene:

= =
= = =
L
h
L
h
h
h
h
h
h
h
h h h h h st
f
n
S
W
n
S
n N N
N
y V N
N
y V
1 1
2
2
2
2
2
2
) 1 ( ) (
1
) (
1
) (
Algunos casos particulares para esta frmula se exponen en los siguientes corolarios.

Corolario 1. Si las fracciones de muestro n
h
/N
h
son insignificantes para todos los estratos,

= =
h
h h
h
h h
st
n
S W
n
S N
N
y V
2 2 2 2
2
1
) ( (2.7)
Corolario 2. En el caso de asignacin proporcional, se hace la siguiente sustitucin en 2.6:
N
nN
n
h
h
=
Reducindose la varianza a:


=
2
2
1
) (
h h
h h
st
S W
n
f
N
n N
n
S
N
N
y V (2.8)
Corolario 3. Si el muestreo es proporcional y las varianzas en todos los estratos tienen el
mismo valor, S
w
2
, se obtiene el resultado siguiente:


=
N
n N
n
S
y V
w
st
2
) ( (2.9)
Teorema 4. Si
st
Y

=
st
y N es el estimador de la poblacin total Y, entonces:

=
h
h
h h h st
n
S
n N N Y V
2
) ( )

( (2.10)
Lo cual se demuestra fcilmente utilizando el teorema 3.

Si en cada uno de los estratos se toma una muestra simple aleatoria, un estimador
insesgado de
2
h
S es:
( )

=
h
n
i
h hi
h
h
y y
n
S
1
2
2
1
1
(2.11)
Lo que nos lleva al siguiente teorema.

Teorema 5. Con muestreo aleatorio estratificado, un estimador insesgado de la varianza es

=
= =
L
h h
h
h h h st st
n
s
n N N
N
y s y v
1
2
2
2
) (
1
) ( ) ( (2.12)
Con la siguiente alternativa para propsitos de clculo:

= =
=
L
h
L
h
h h
h
h h
st
N
s W
n
s W
y s
1 1
2 2 2
2
) ( (2.13)

II.2.4 Asignacin ptima
En muestreo estratificado la seleccin de tamaos de muestra n
h
en el estrato respectivo h,
puede llevarse a cabo para minimizar ) (
st
y V con un costo especfico para minimizar el
costo con un valor especfico de ) (
st
y V .

Considerando la funcin de costo ms simple

+ = =
h h
n c C C to
0
cos (2.14)
Entre estratos el costo es proporcional al tamao de la muestra, sin embargo, el costo por
unidad c
h
puede variar entre estratos. El trmino c
0
representa un costo fijo. Esta funcin de
costo resulta apropiada en los casos en que los costos de observar cada unidad en el estrato
respectivo tienen el mayor peso.

Teorema 6. Si consideramos la funcin de costo anterior, la varianza de la media estimada
st
y es mnima para un costo C, y el costo es mnimo para una varianza V(
st
y )
determinada, cuando n
h
es proporcional a
h h h
c S W / .

Demostracin. Teniendo lo siguiente:

=
+ =
L
h
h h
n c c C
1
0
(2.15)

= = =
= = =
L
h
L
h
L
h h
h h
h
h h
h
h
h h
st
N
S W
n
S W
f
n
S W
y V V
1 1 1
2 2 2 2 2 2
) 1 ( ) ( (2.16)
Los problemas a resolver son escoger n
h
para minimizar V con un determinado costo, y
posteriormente escoger n
h
tal que se minimice el costo con un valor determinado de V.
Ambos problemas resultan equivalentes a minimizar el producto
( ) ( )

+ =
h h
h
h h
h
h h
n c
n
S W
c C
N
S W
V C V
2 2
0
2 2
' ' (2.17)
Lo anterior puede minimizarse usando la desigualdad de Cauchy-Schwarz. Si a
h
, b
h
son
conjuntos de nmeros positivos:
( )( ) ( )

>
=
i i j
i j j i h h h h
b a b a b a b a
2
2
2 2
) ( (2.18)
Con la expresin anterior, la siguiente desigualdad es posible:
( )( ) ( )
2
2 2


h h h h
b a b a (2.19)
sucediendo la igualdad si y solo si b
h
/a
h
es constante para toda h. En el caso presente se
considera
h h h h h h h h
h
h h
h
c S W b a n c b
n
S W
a = = = , ,
haciendo uso de la desigualdad (2.19)
( ) ( )( ) ( )
2
2 2
2 2
) ' '

=

=
h h h h h h h
h
h h
c S W b a n c
n
S W
C V
por lo tanto, el valor de n
h
que hace VC mas pequeo es ( )
2
h h h
c S W . Ocurriendo un
mnimo cuando
h h
h h
h
h
S W
c n
a
b
= = k (2.20)
En trminos del tamao total de la muestra n
h
en el estrato, se tiene

= =
) / (
/
) / (
/
h h h
h h h
h h h
h h h
h
c S N
c S N
c S W
c S W
n
n
(2.21)
Para completar la asignacin es necesario obtener el valor de n. La solucin depender si
se escoger la muestra para obtener un costo determinado total C para obtener una
varianza determinada V para
st
y . En el caso de un costo fijo, se sustituyen los valores
ptimos de n
h
en la funcin de costo y se obtiene n.
( )
) (
) / (

=
h h h
h h h o
c S N
c S N c C
n (2.22)
Para el caso de V fija, sustituimos el valor ptimo de n
h
en la frmula para ) (
st
y V .
( )


+
=
2
) / 1 (
/
h h
h h h h h h
S W N V
c S W c S W
n (2.23)
El caso especial en el que c
h
= c conlleva a lo siguiente

= =
h h
h h
h h
h h
h
S N
S N
n
S W
S W
n n (2.24)
El resultado anterior, en general es conocido como asignacin de Neyman. Al sustituir el
valor de n
h
en la frmula general para ) (
st
y V
( )
N
S W
n
S W
y V
h h h h
st

=
2
2
min
) ( (2.25)

II.2.5 Precisin relativa de muestreo aleatorio estratificado y muestreo aleatorio
simple
Realizada de manera adecuada la estratificacin puede traer como resultado una menor
varianza para la media estimada o total que la proporcionada con una muestra aleatoria
simple. Sin embargo si los valores de n
h
se encuentran lejos de los ptimos, la
estratificacin puede tener como resultado una varianza mayor.

A continuacin se describe la manera en que se obtiene ganancia por medio de la
estratificacin, en comparacin con el muestreo aleatorio simple.
n
S
f V
mas
2
) 1 ( = (2.26)
N
S W
n
S W
S W
n
f
V
h h h h
h h prop

=
2 2
2
) 1 (
(2.27)
N
S W
n
S W
V
h h h h
opt

=
2 2
) (
(2.28)
De la identidad algebraica estndar para el anlisis de varianza de una poblacin
estratificada, se tiene
0 / 1 ) ( ) 1 (
) ( ) (
) ( ) (
) ( ) 1 (
2 2
2 2
2 2
2 2
+ =
+ =
+ =
= =




h
h
h
h
h
h h
h
h
h
h i
h
hi
h h i
h
i
h
hi
h i
hi
N si Y Y N S N
Y Y N Y y
Y Y Y y
Y y S N


+ =
2 2 2
) ( Y Y W S W S h
h h h
(2.29)
Por lo tanto

+ =

= =
2
2 2
2
) (
) 1 (
) (
) 1 ( ) 1 (
) 1 (
Y Y W
n
f
V
Y Y W
n
f
S W
n
f
n
S
f V
h
h prop
h
h h h mas
(2.30)
Por definicin de V
opt
, se debe tener V
prop
V
opt
. De las expresiones (2.27) y (2.28)
tenemos el siguiente resultado
( ) ( )
( )


=
=
2
2
2
) (
1
1
S S W
n
S W S W
n
V V
h h
h h h h opt prop
(2.31)
donde

=
h h
S W S es una media ponderada de las S
h.
Lo anterior se puede ver en el desarrollo siguiente
2
2
2 2
2
2
2
2
2 2
2
2
) 2 ( ) (
S S W S S S W
W S S W S S W
S S S S W S S W
h h h h
h h h h h
h h h h h
= + =
+ =
+ =




Al realizar algunas sustituciones

+ + =
2 2
) (
) 1 (
) (
1
Y Y W
n
f
S S W
n
V V h
h h h opt mas
(2.32)
Al analizar la ecuacin anterior, se puede notar que hay dos componentes que reducen la
varianza cuando se cambia de muestreo aleatorio simple a asignacin ptima. El primer
componente que la reduce, que es el trmino en la extrema derecha, se debe a la
eliminacin de las diferencias de las medias de los estratos; la segunda, es decir, el trmino
medio, proviene de la eliminacin del efecto de las diferencias entre las desviaciones
estndar de los estratos.

El desarrollo anterior lleva a lo siguiente cuando 1/N
h
es despreciable
mas prop opt
V V V
En caso que tal trmino no fuera despreciable, se obtendra

+ =

2 2
) (
1
) (
) 1 (
) 1 (
h h
h
h prop mas
S N N
N
Y Y N
N n
f
V V (2.33)
Lo cual induce a pensar que en algunos casos la estratificacin puede proporcionar una
varianza mayor que el muestro aleatorio simple cuando

<
2 2
) (
1
) (
h h
h
h
S N N
N
Y Y N

II.2.6 Ganancias en precisin gracias al uso de la estratificacin
La variable ideal para realizar estratificacin, es aquella que se va a medir en la encuesta
correspondiente. Si fuera posible hacer esto, no habra traslape entre estratos, y la varianza
dentro del estrato sera menor que la varianza global.

Prcticamente lo anterior no es posible, sin embargo, cumplindose las condiciones
siguientes, se puede tratar de conseguir tal situacin
1. La poblacin conste de conjuntos que varen considerablemente en tamao.
2. Las variables que se intentan conocer estn altamente relacionadas con el tamao
de tales conjuntos.
3. Se cuente con una buena medida de los tamaos de los distintos estratos.

La estratificacin geogrfica es muy comn y generalmente va acompaada por un
incremento en la precisin por la existencia de muchos factores que hacen que las personas
vivan o se renan en un rea comn, mostrando similitudes en sus caractersticas
principales. Lo cual genera estratos con mayor uniformidad.

En lo que concierne a la estratificacin proporcional respecto a la ptima, cuando se tienen
subpoblaciones con tamaos grandes y pequeos estratificadas por tamao, el muestreo
proporcional resulta ineficiente, ya que en una subpoblacin grande la varianza ser mucho
mayor que en una pequea. Por lo que utilizar una asignacin ptima, generar mejores
estimaciones de los valores que se quieran conocer.

II.2.7 Construccin de estratos
Para los casos en que se deseen reducciones grandes en la varianza, se buscar formar
estratos en los que las unidades de muestreo sean lo ms homogneas posibles respecto a
las variables que se desean conocer. Este objetivo se cumple cuando la variacin entre
unidades de muestreo dentro del estrato sea menor que la variacin de la poblacin total.

Sean y
0
, y
L
el valor menor y valor mayor de y en la poblacin que se encuentra en estudio.
El problema a resolver, es encontrar los lmites entre estratos y
1
, y
2
,, y
L-1
tales que

= =

=
L
h
h h
L
h
h h st
S W
N
S W
n
y V
1
2
2
1
1 1
) ( (2.34)
se minimice. Si se ignora el segundo trmino, resulta suficiente minimizar W
h
S
h
. Debido a
que y
h
solo aparece en la suma en los trminos W
h
S
h
y W
h+1
S
h+1
,se tiene lo siguiente
( ) ) ( ) (
1 1 . + +

h h
h
h h
h
h h
h
S W
y
S W
y
S W
y
(2.35)
Si se tiene que f(y) es la funcin de frecuencia de y,
) ( , ) (
1
h
h
h
y
y
h
y f
y
W
dt t f W
h
h
=

(2.36)
Adems

=
h
h
h
h
h
h
y
y
y
y
y
y
h h
dt t f
dt t tf
dt t f t S W
1
1
1
) (
) (
) (
2
2 2
(2.37)
Al derivar lo anterior
) ( ) ( 2 ) ( 2
2 2 2
h h h h h h h
h
h
h h
h
h
h
y f y f y y f y
y
S
S W
y
W
S + =


donde
h
es la media de y en el estrato h. Sumndose a ambos lados
2
h
S f(y
h
) y
posteriormente al dividir entre 2S
h

h
h h h
h
h
h
h
h
h
h
h
h h
S
S y
y f
y
S
W
y
W
S
y
S W
2 2
) (
) (
2
1 ) ( +
=



1
2
1
2
1 1 1
) (
) (
2
1 ) (
+
+ + + +
+
=

h
h h h
h
h
h h
S
S y
y f
y
S W
(2.38)
Lo que deriva en las ecuaciones de clculo para y
h

1 , , 2 , 1
) ( ) (
1
2
1
2
1
2 2
=
+
=
+
+
+ +
L h
S
S y
S
S y
h
h h h
h
h h h
K

(2.39)
No obstante, estas ecuaciones no son aplicables en la prctica, ya que
h
y
2
h
S dependen
de las fronteras. Por tanto, es necesario realizar una aproximacin que permita conseguir
los resultados deseados. Sea

=
y
y
dt t f y Z
0
) ( ) ( (2.40)
Si se consideran estratos numerosos y estrechos, f(y) debera ser aproximadamente
uniforme dentro de un estrato dado. Por lo que
) ( ) (
1
1

= =

h h h
y
y
h
y y f dt t f W
h
h
&

) (
12
1
1 .
=
h h h
y y S
&

) ( ) (
1 1
1

= =

h h h
y
y
h h
y y f dt t f Z Z
h
h
&

Al sustituir las aproximaciones anteriores

=

=

=
= =
L
h
h h
L
h
h h h
L
h
h h
Z Z y y f S W
1
2
1
1
2
1
1
) ( ) ( 12
& &
(2.41)
Debido a que (Z
L
-Z
0
) es fija, resulta fcil verificar que la suma de la derecha se minimiza
al hacer (Z
h
-Z
h-1
) constante. Dado f(y), la regla consiste en computar el acumulado de f(y)
y escoger y
h
de tal manera que se creen intervalos de amplitud similar en la escala del
acumulado de f(y).

II.2.8 Cantidad de estratos
El concepto general de estratificacin lleva a pensar que de una poblacin dividida en k
estratos, siempre ser posible mejorar la situacin llevando a cabo ms subdivisiones a los
estratos. De hecho, la estratificacin puede llevarse al grado de tener un nmero de estratos
igual nmero de unidades que sern seleccionadas. Sin embargo, al sobrepasar un nmero
prudente de estratos, el aumentar su cantidad no resulta en una reduccin considerable de
la varianza cuando la estratificacin para cierta variable y se hace con respecto a otra
llamada x, como se demuestra a continuacin de manera sencilla. Sea x una variable
uniforme de 0 a d, adems y = x + e, donde e y x no tienen correlacin alguna. Entonces
) ( ) ( ) ( e V x V y V + = . Supngase el caso en el que se tienen k estratos con la misma
amplitud. Entonces
k N
N
W
k
d
S
h
h xh
1
12
2
2
2
= = =
Si la asignacin de la muestra es la misma, la varianza estimada de la media poblacional es

+ =
n
S
nk
d
S W
n
k
e
yh h
2 2
2 2
12

Si el nmero de estratos aumentara a k, la varianza relacionada con tal nmero ser
n
S
nk
d
e
2
2
2
2
12
1
+


En este caso el primer componente disminuye al realizar un incremento en el nmero de
estratos, pero el segundo componente se mantiene constante. Debido a lo anterior, se
llegar a un punto en el que el segundo componente se convierte en parte importante de la
varianza y aunque haya incrementos en el nmero de estratos, no habr ganancias
significativas en la varianza.

II.3 Estratificacin con ms de una Variable

Dado que la mejor asignacin para una variable puede no ser la mejor para otra, se debe
llegar a un arreglo para encuestas con ms de una variable. El primer paso consiste en
reducir las variables consideradas en la asignacin a un nmero relativamente pequeo
donde se consideren las ms importantes. En el caso de que existan buenos datos previos,
se puede calcular la asignacin ptima de cada caracterstica y ver en que punto existen
desviaciones grandes. Puede darse el caso de variables que se encuentren tan
correlacionadas, que las asignaciones no difieran en gran medida.

S-ar putea să vă placă și