Documente Academic
Documente Profesional
Documente Cultură
ECONÓMICAS. Ed.2
INDICE
INDICE ......................................................................................................... 2
INTRODUCCIÓN Y OBJETIVOS
Se inicia este módulo haciendo una descripción general de las distintas fases una
encuesta por muestreo, definiciones de conceptos utilizados a lo largo del mismo y
se enumeran las distintas etapas del esquema de un diseño muestral, haciendo en
el último apartado un análisis de la falta de respuesta y su tratamiento.
En la tercera unidad, y como un paso previo del cual depende el diseño muestral,
se hace un análisis detallado sobre el marco de muestreo, las distintas fuentes
utilizadas, sus limitaciones y se estudia con detalle los procedimientos que se
aplican para mantener el marco actualizado.
En el estudio y análisis de una encuesta por muestreo es necesario fijar una serie
de conceptos que nos van a ayudar en el diseño de una buena muestra.
SABER + Las cuotas más utilizadas son las de edad y sexo, por ser
generalmente la información disponible de la población. Se utilizan en las
encuestas de opinión.
El diseño muestral en una encuesta comprende una serie de fases que van desde la
elección del método de muestreo hasta la formulación del procedimiento de
estimación y cálculo del nivel de precisión de las estimaciones.
En la toma de decisiones en las distintas fases, influyen diversos factores como son
la disponibilidad de marcos apropiados, grado de conocimiento de la población
investigada que permita disponer de variables adecuadas para la estratificación y
estimación; y finalmente, del presupuesto disponible.
1.4.2. Marco
SABER + Anteriormente los censos eran la única oportunidad para formar los
marcos y disponer de información desagregada a nivel de unidad primaria de
muestreo. Actualmente la existencia de Registros Administrativos, actualizados y
depurados ha facilitado esta tarea como se verá a lo largo del curso.
RESUMEN
En la práctica puede no ser conveniente seleccionar directamente las
unidades elementales de estudio, bien porque no se dispone de la lista de donde
realizar la selección o bien por razones de coste y tiempo. En estos casos debe de
utilizarse un muestreo en dos o más etapas, mediante la utilización de
conglomerados. En este tipo de muestreo la lista de unidades elementales solo es
necesario disponerla para los conglomerados seleccionados en la muestra.
1.4.6. Estimadores
Los errores que afectan a las encuestas se clasifican en dos grandes grupos:
Entre los errores ajenos al muestreo que afectan a las encuestas se presenta la
falta de respuesta en las unidades seleccionadas.
DEFINICIÓN:
Asimismo se analizará en cada encuesta los distintos tratamientos que se dan ante
la presencia de falta de respuesta y los procedimientos que se utilizan para reducir
la misma.
1.5 Resumen
Esta unidad sólo intenta ser una introducción para el resto de las unidades, tanto
de este módulo como de los siguientes. En ella se definen una serie de conceptos
necesarios en la utilización y entendimiento de las técnicas de muestreo, se
describen las diferentes etapas de una encuesta por muestreo, y finalmente se
describen los distintos apartados necesarios para llevar a cabo un diseño muestral.
Ahora vamos a desarrollar brevemente algunos de ellos junto con los diferentes
tipos de muestreo y sus estimadores.
El muestreo es un proceso utilizado desde hace muchos años para seleccionar una
parte representativa o muestra de un conjunto que llamamos población y, de esta
manera, obtener información sobre una característica definida en ésta. A partir de
la información proporcionada por la muestra, estimamos el valor del dato
poblacional que nos interesa.
A veces el marco de muestreo no es una simple lista que enumera las unidades de
muestreo, sino que contiene información sobre las mismas que podemos utilizar
para aplicar técnicas especiales de muestreo (estratificación, probabilidades
desiguales de selección,...) o de estimación (estimador de razón), que veremos a lo
largo del desarrollo de esta unidad.
En una población formada por 3 unidades (u1, u2, u3) vamos a seleccionar
una muestra de dos unidades, de manera que todas las unidades de la población
tienen la misma probabilidad de ser elegidas y no hay unidades repetidas.
Entonces, bajo este esquema de muestreo, el conjunto formado por todas las
Si utilizamos dos marcos, como en el ejemplo de las viviendas, los municipios son
las unidades de muestreo correspondientes a la primera etapa y las viviendas son
las unidades de muestreo correspondientes a la segunda etapa. Es decir el
muestreo lo hemos realizado en dos etapas. Podemos generalizar la idea a varias
etapas (muestreo polietápico) en el que seleccionamos conglomerados en una
primera etapa y submuestreamos los conglomerados en etapas posteriores hasta
seleccionar las unidades elementales en una última etapa.
πi = ∑ p(s)
u i ∈s
πij = ∑ p(s)
u i , u j ∈s
2.1.3. Estimador
∑x
1
por la media muestral definida por la expresión matemática i que, en la
2 i∈s
2+5
muestra seleccionada, proporciona la estimación dada por el valor = 3,5 .
2
()
estimador, E θ̂ , y de su varianza V θ̂ . ()
La esperanza del estimador es la media de todas las estimaciones posibles y la
varianza del estimador es una medida del grado de dispersión de éstas alrededor
de su media.
Fijaros que en este ejemplo ninguna de las dos estimaciones posibles coincide con
2+2+5
la media poblacional a estimar = 3.
3
Siempre que utilizamos una muestra para estimar datos de una población,
cometemos algo de error pues no podemos esperar que la muestra sea una
reproducción perfecta de la población de que procede. Este error es propio del
muestreo y no existen en los censos.
Veamos los siguientes gráficos que representan para tres situaciones diferentes, los
valores de las estimaciones posibles (azul), el valor de su media (verde) y el valor
del parámetro poblacional a estimar (rojo):
1)
2)
3)
() ()
pueden ocurrir dos cosas: E θ̂ = θ ó E θ̂ ≠ θ . En el primer caso decimos que θ̂ es un
() ()
decir, B θˆ = E θˆ − θ.
() 1 2
E θˆ = 2 + 3,5 = 3 que coincide con la media poblacional. Por lo tanto, en este caso,
3 3
la media muestral es un estimador insesgado de la media poblacional (aunque la
estimación sobre una determinada muestra no coincide con la media poblacional, la
media de las estimaciones sí coincide).
El error del estimador viene dado por la dispersión de las estimaciones posibles
alrededor del parámetro poblacional a estimar. A este error de carácter aleatorio se
le conoce como el error cuadrático medio del estimador (ECM) y se define
como la media de las desviaciones entre las estimaciones y el parámetro al
cuadrado:
() (
ECM θˆ = E θˆ − θ )
2
() () ()
ECM θˆ = V θˆ + B θˆ
2
()
ECM θˆ = (2 − 3) 2 + (3,5 − 3)2 =
1
3
2 1
3 2
que coincide con la varianza del estimador, lo que
Ahora bien, el error absoluto no nos proporciona una idea de la magnitud del
mismo en el sentido de si es grande o pequeño respecto al dato poblacional a
estimar (no es lo mismo un error absoluto de 1000 cuando el dato poblacional a
estimar vale 1000000 que cuando vale 10). Entonces, con el fin de limitar la
utilización de los datos estadísticos, es más útil el cociente entre el error absoluto y
el dato poblacional que estima, es decir, el error relativo de muestreo del
estimador o coeficiente de variación.
1
1 2
es = 0,707 y su error relativo es = 0,2357 , es decir, el coeficiente de variación
2 3
es del 23,57%.
Observar que, en este ejemplo, es posible calcular los errores porque conocemos
los datos poblacionales pero en el mundo real sólo vamos a conocer los datos de las
unidades investigadas en la muestra por lo que será imposible calcular su valor
exacto.
() ()
confianza θˆ − 2 V̂ θˆ , θˆ + 2 V̂ θˆ que cubrirá al verdadero valor de θ con una
()
normal y V̂ θ̂ es un estimador consistente para la varianza del estimador. Entonces
Con el primer método no hay unidades repetidas en la muestra mientras que con el
segundo puede haberlas.
2
En el último ejemplo π1 = π 2 = π 3 = y P1=P2=P3=1/3 ya que las tres
3
unidades de la población tienen la misma probabilidad de ser elegidas.
X=x1+... +xN
Por ejemplo, el total del gasto en educación generado por las familias.
X=
(x1 + + x N )
N
R=X =X
Y Y
La tasa (T) es el cociente entre dos totales de clase o entre dos proporciones,
es deciR, T = A ′ = P ′ .
A P
Por ejemplo la tasa de paro definida como el cociente entre el total de parados y
el total de activos (parados y ocupados).
X̂ = ∑w x
i∈s
i i es el estimador lineal insesgado para el total poblacional
ˆ
(X), entonces X = X̂
N es el estimador lineal insesgado para la media poblacional
(X ) si el valor de N es conocido.
Finalmente, el estimador de la razón R se construye de forma natural como el
cociente entre las estimaciones insesgadas del numerador y del denominador,
ˆ
X̂ X
R̂ = =
Ŷ ˆ
Y
proporción (P= X ). Igualmente podemos deducir que una tasa es una razón de
totales para variables cuantitativas que sólo toman los valores 1 ó 0 según la
unidad de la población posea o no la cualidad que define al total de clase del
numerador o del denominador.
( )
insesgada de una media poblacional X se puede derivar dividiendo la estimación
insesgada del total poblacional (X) por el valor de N que se supone conocido.
Entonces los estimadores lineales insesgados de la media, el total de clase o
de una proporción y su error se pueden deducir a partir del estimador
lineal insesgado del total y su error.
A partir de ahora y para los diferentes tipos de muestreo que vamos a estudiar,
Hasta ahora hemos visto que, dependiendo del método de selección de las
unidades, el tipo de muestreo puede ser sin reemplazamiento (SR) o con
reemplazamiento (CR).
Combinando los tres criterios obtenemos una gran variedad de tipos de muestreo.
Nosotros estudiaremos los casos SR, comenzando por el más sencillo que es la
selección de unidades elementales sin información auxiliar en el marco y
terminando con la selección de conglomerados en dos o más etapas. También
veremos cómo mejorar el estimador usual cuando disponemos de la necesaria
información auxiliar y, más concretamente, la estimación de una razón.
∑x
N
X̂ = i
n i∈s
()
La varianza de este estimador es V X̂ = N 2 (1 − f )
S2
n
donde f=n/N representa la
∑ (x )2
N
1
S2 = i −X .
N −1 i =1
∑x
1
x= i es la media muestral.
n i∈s
4.570,45
relativo de muestreo es del 10% ya que = 0,101 .
45.100
Si la selección de las unidades se hubiera realizado con m.a.s.(n) CR, entonces las
expresiones para el estimador del total poblacional y de su varianza son:
X̂ =
N
n ∑ xi y ()
V̂ X̂ = N 2
Ŝ2
n
i∈s
A cada unidad del marco la llamamos uhi con h=1, ..., L (representa el estrato al
que pertenece) e i=1,..., Nh (representa el lugar que ocupa dentro del estrato) y el
valor desconocido de la característica estudiada es xhi. El objetivo es estimar el total
poblacional X=x1+...+xN que ahora podemos expresar teniendo en cuenta los
( )
estratos como X = ( x11 + + x1N1 ) + + x L1 + x LN L = X1 + + X L , es decir, como la
En cada estrato, haciendo uso de los resultados del apartado anterior, construimos
∑ ∑x
N1 NL
los estimadores X̂1 = x1i ,..., X̂ L = Li insesgados para los totales
n1 i∈s nL i∈s L
1
∑ X̂ ∑x
Nh
X̂ st = h con X̂ h = hi
h =1
nh i∈s h
( ) ∑ V(X̂ )
L
Es decir, V X̂ st = h pero cada sumando o varianza, en la práctica, no lo
H =1
( )
construir V̂ X̂ h = N 2h (1 − f h )
Ŝ2h
nh
estimador insesgado de la varianza en el estrato h.
( ) ∑ V̂(X̂ ) ( )
L
Ŝ2h
V̂ X̂ st = h con V̂ X̂ h = N 2h (1 − f h )
h =1
nh
Con la afijación proporcional se simplifican los cálculos porque todos los estratos
tienen la misma fracción de muestreo (fh=n/N) y el mismo factor de elevación
(N/n). De esta manera el estimador del total poblacional es dicho factor común
por la suma de los valores observados en la muestra completa
N L
X̂ st = ∑∑ x hi . Se dice entonces que la muestra es autoponderada.
n h=1 i∈sh
∑W S
h =1
h h
Nh
donde S 2h =
1
Nh −1 ∑
(x hi − Xh )2 es la cuasivarianza poblacional de la
i =1
Wh S h ch
nh = n L
donde ch es el coste por cuestionario en el
∑W S
h =1
h h ch
estrato h.
S12 , , S2L , ¿sabías que entonces se suelen utilizar los valores conocidos asociados a
∑x ∑y
X̂ N N
R̂ = con X̂ = i , Ŷ = i
Ŷ n i∈s
n i∈s
método de la razón que viene dado por la expresión X̂ R = R̂Y . Este estimador
( )
L
método de la razón X̂ Rh = R̂ h Yh y sumamos. Es decir X̂ RS = ∑ X̂
h =1
Rh .
R̂ st = X̂ st y la multiplicamos por el total Y. Es decir X̂ RC = R̂ st Y .
Ŷst
A cada unidad elemental la llamamos uij con i=1, ..., K (representa el conglomerado
al que pertenece) y j=1, ..., M (representa el lugar que ocupa dentro del
conglomerado), y el valor desconocido de la característica estudiada es xij .
Deseamos estimar el total poblacional que, expresado teniendo en cuenta los
conglomerados, es X = (x11 + + x1M ) + + (x K1 + + x KM ) = X1 + + X K . Es decir, es la
∑X
K
total poblacional viene dado por X̂ = i . Existe una fórmula directa para el
n i∈s
() ( )[ (
VC X̂ = VMAS X̂ 1 + δ M − 1 )] donde el factor 1 + δ M − 1 ( ) representa el efecto del
∑π
Xi
Thompson X̂ = donde π i es la probabilidad de inclusión del conglomerado i
i∈s i
en la muestra de conglomerados.
∑ nP
Xi
estimador de Hansen-Hurwitz X̂ = donde Pi es la probabilidad de selección
i∈s i
∑π ∑ nP
X̂ i X̂ i
X̂ = (SR ) siendo πi = n
Mi
y X̂ = (CR ) con Pi=Mi/N
i∈s i N i∈s i
mi
∑x
Mi
donde X̂ i = ij es un estimador insesgado del total poblacional Xi en el
mi J =1
Para elegir una muestra de 100 viviendas de una lista de 2.000, el periodo
es k=20 y R ∈ {1,2, ,20} . Supongamos que R=7, entonces las viviendas numeradas
Por otra parte, si el marco tiene un orden creciente o decreciente según una
variable correlada con la estudiada, es probable que el muestreo sistemático sea
más preciso que el m.a.s. (n) SR y al utilizar la fórmula de la muestra aleatoria
simple para la estimación de la varianza, es posible que estemos dando una
sobreestimación del error.
Si la lista de unidades del marco tiene algún orden periódico o cíclico, el muestreo
sistemático no proporciona necesariamente una muestra representativa. Por
ejemplo, si los hombres y las mujeres se alternan en la lista y k es par, la muestra
sistemática sólo tendrá hombres o mujeres, lo que no es una parte representativa
de la población estudiada.
Cuando los conglomerados tienen tamaños muy diferentes siendo unos muy
grandes y otros muy pequeños, al sumar el periodo k al número correspondiente,
seguramente el número resultante sigue representando al mismo conglomerado si
éste es grande, por lo que estará repetido en la muestra.
Esta es la idea básica del método de la linearización por series de Taylor que
consiste en reemplazar el estimador por su aproximación lineal dada por el primer
término de la serie de Taylor. Posteriormente la varianza del estimador linearizado
se puede calcular con los métodos estándar.
replicaciones de • “ jackknife
(submuestreos replicados)
∑ θˆ
1
construido con la muestra completa verifica que θˆ = i . Así el estimador de la
n i =1
() ∑ (θˆ )
n
1 2
V̂ θˆ = − θˆ con n el número de conglomerados últimos.
n (n − 1)
i
i =1
()
n
∑ X̂ i − X̂
1
V̂ X̂ =
n (n − 1) P
i =1 i
( )
Por otra parte, se supone que V θˆ r = 2V θˆ lo cual es en general será cierto()
debido a la construcción de las semimuestra.
() ∑ (θˆ )
K
1 2
V̂ θˆ = r − θˆ
K r =1
Se trata de una técnica desarrollada fuera del ámbito de las encuestas por
muestreo. La primera aplicación fué realizada por Quenouille (1949) para reducir el
sesgo de un estimador en el contexto de poblaciones infinitas. Tukey (1958) sugirió
que esta técnica podría ser útil para estimar varianzas. Durban (1959) utilizó esta
técnica por vez primera en poblaciones finitas.
() ∑ (θ ) ∑ (θˆ ( ) − θˆ ( ) )
n n
1 ~ 2 n −1 2
V̂JK θˆ = j − θ JK
ˆ =
n (n − 1)
j .
j=1
n j=1
n n
∑ ∑ θˆ ( ) .
1 ~ 1
donde θˆ JK = θ n y θˆ (.) = j
n j=1
n j=1
Uno de los problemas de este método es la necesidad de repetir para cada una de
las muestras jackknife el proceso de estimación llevado a cabo sobre la muestra
completa. En muchos casos, ésto implica un proceso complejo de recalcular los
factores de elevación (correcciones de falta de respuestas, estimadores complejos,
calibrados...) y requiere una gran potencia de cálculo, por ello estos métodos eran
impensables hasta la llegada de ordenadores potentes y accesibles para los técnicos
de análisis de encuestas.
Para resolver la dificultad anterior una posibilidad es, en vez de recalcular los
nh
factores de elevación, multiplicar los factores originales por el factor en el
n h −1
B B
∑ ∑ θˆ
1 1
V̂BOOT (θˆ ) = (θˆ ∗b − θˆ ∗• ) 2 donde θˆ ∗• = ∗
b
B − 1 b =1 B b =1
Como hemos visto en los puntos anteriores, los procedimientos de cálculo de los
errores de muestreo requieren, en general, repetir un mismo procedimiento un
gran número de ocasiones. Por ello, se necesitan programas informáticos para su
cálculo. Por suerte, aparte de la posibilidad de programaciones adhoc, hay gran
variedad de software diseñado específicamente para el cálculo de errores de
muestreo en encuestas complejas. Entre los más usados podemos citar:
2.6. Resumen
RESUMEN
El marco en una encuesta por muestreo juega un papel fundamental,
hasta el punto de que de él puede depender el éxito o fracaso de la misma.
• Cada elemento debe estar presente una sola vez. El marco debe ser
depurado previamente para evitar que haya unidades duplicadas en él.
Las unidades del marco deben estar identificadas y ser localizadas si son
seleccionadas para la muestra.
RESUMEN
Como conclusión podemos decir que, sin un buen marco no se puede
diseñar una buena muestra. Por tanto, para la realización de una buena encuesta
es necesario disponer de un marco adecuado a la población objetivo, que esté
actualizado, o al menos que sea posible su actualización.
El uso de uno u otro tipo de marco viene determinado por la disponibilidad de los
mismos y por razones de coste.
A continuación hacemos una breve descripción del marco utilizado en las encuestas
económicas, y en el resto del tema se describe con detalle el marco utilizado en las
encuestas de hogares y su actualización.
3.4.1. Descripción
En principio, para realizar una encuesta dirigida a los hogares lo ideal sería disponer
de una lista de hogares actualizada, y utilizar para la selección de la muestra un
muestreo aleatorio simple. No obstante el coste de visitar estas unidades
elementales esparcidas por un área geográfica extensa, nos hace renunciar a este
tipo de muestreo y utilizar, en lugar de marcos de unidades elementales, listas de
conglomerados y éstos como unidades de muestreo.
A partir de la división anterior, el INE juntamente con los Ayuntamientos hace una
nueva subdivisión de los distritos municipales en secciones censales.
Las secciones se utilizan para todos los trabajos encomendados al INE en los que es
necesaria una división inframunicipal, entre otros para fines electorales como
secciones electorales, lo cual exige de acuerdo con la Ley Electoral que cada
sección incluya un máximo de 2.000 electores y un mínimo de 500.
SABER + Cualquier parte del territorio nacional pertenece a una sección censal.
Actualmente el número total de secciones censales existentes en el país es de
aproximadamente unas 36.000.
En España los electores, personas en edad legal para votar, son la población
con 18 y más años.
Actualmente este marco solo se utiliza para la EPA, encuesta continua cuyo diseño
muestral se analiza en detalle la unidad 5 de este curso. En el último apartado de
esta unidad se explican los procedimientos utilizados para mantener el marco
actualizado.
2. Es un fichero de personas.
Para ello, las unidades de primera etapa (secciones censales) se seleccionan con
probabilidad proporcional al número de viviendas familiares principales, según los
datos del último Censo o Padrón. Dentro de cada sección seleccionada en primera
etapa, se selecciona un número fijo, m, de viviendas familiares con igual
probabilidad mediante la aplicación de un muestreo sistemático con arranque
aleatorio.
V sh m m
P( V ish ) = P( Sh ) ⋅ P( V ish / Sh ) = K h ⋅ ⋅ = Kh ⋅
V h V sh Vh
tamaño de la sección es VS' .Para que la muestra siga siendo autoponderada, hay
'
que seleccionar m ⋅ V S viviendas.
VS
Vs'
m.
( ) . P(Vis / S) = K
P (Vis ) = P S .
Vs
.
Vs
=
K. m
V Vs' V
SABER +
Estas modificaciones se producen con motivo de las revisiones que a
1 de enero se realizan sobre el seccionado para cumplir con las exigencias legales
de la Ley Electoral General.
En cada uno de estos casos, y para mantener el modelo probabilístico que subyace,
es necesario realizar el cálculo de la probabilidad de selección de la nueva o nuevas
secciones, la selección de la nueva sección que va a formar parte de la muestra,
así como determinar el número de entrevistas a realizar en la misma.
siguiente:
Vs'
' m.
( )
P Vis1 = P S ( ) .P (S1 / S) P(Vis )
/ S1 = K .
Vs Vs1
.
V Vs'
.
Vs
=
K. m
Vs' 1 V
1
Donde: VS' son las viviendas actualizadas de la sección S, y VS' 1 las viviendas
actualizadas de la sección S1
2. Fusión de dos o más secciones. Debido a que algunas secciones, por los
movimientos migratorios y naturales de la población, van quedando vacías se
procede a su fusión con otra u otras, de forma que en caso de ser seleccionada
tengan unidades que investigar.
V 'S
entrevistar es m ⋅ siendo:
VS
C
VS Viviendas en S segun Censo C
PS = C
=
Vh Viviendas en el estrato h segun Censo C
C′
VS Viviendas en S segun Censo C′
P' S = =
C'
Vh Viviendas en el estrato h segun Censo C′
Se compara PS con P'S pudiendo ocurrir uno de los dos siguientes casos:
PS'
2) Si P'S< PS la sección permanece en la muestra con probabilidad y sale de la
PS
P'
muestra con probabilidad 1- S .
PS
actualizada PS' .
PS'
a. Permanece en la muestra con probabilidad
PS
P'
b. Sale de la muestra con probabilidad 1- S
PS
PS' − PS
proporcional a
∑ PS' − PS
S∈∆
P'
permanecer, es decir, PS ⋅ S = PS'
PS
• Ser seleccionada ahora sin haber sido seleccionada antes. Para que esto
ocurra, tienen que darse tres circunstancias:
1. Existencia en la muestra antigua de alguna sección S, seleccionada
con probabilidad PS y que disminuye de probabilidad.
P'
probabilidad 1- S .Que la sección S* sea seleccionada con la
PS
PS' − PS
.
∑ PS' − PS
S∈∆
P' P' ^ − P *
∑ PS 1 − S S S
= PS' * − PS*
S∈∂
PS
P ∑'
S * −P *
S
S∈∆
( )
PS* + PS' * − PS* = PS' *
3.7 Resumen
Todo ello hace que la carga estadística que soportan las empresas sea relevante y
que una de las preocupaciones de las oficinas de estadística sea reducirla.
A partir del DICOIN, se calculan diversas tablas que reflejan la carga estadística de
las empresas.
Distribución de las empresas por tamaño y número de encuestas en las que participa.
Porcentaje respecto al tamaño. Año 2012.
En los últimos años ha habido una gran demanda de información económica más
detallada que ha hecho aumentar los tamaños muestrales, o de nueva información
que ha dado lugar a nuevas encuestas. En el siguiente gráfico se muestra la
2000000
cuestionarios
1500000
1000000
500000
0
1 2 3 4 5 6 7 8 9 10 11 12
años
Cada año generamos un número aleatorio para cada una de las unidades del marco
(DIRCE). Este número será permanente durante el año. Además, construímos una
función de carga estadística que viene determinada por el tiempo estimado para
cumplimentar el cuestionario y por el número de encuestas que realiza la empresa
ese año.
Inicialmente todas las unidades del marco tienen carga (0,0). La primera muestra
se obtiene de manera independiente, utilizando un muestreo aleatorio simple
dentro de cada estrato. Las unidades que han sido seleccionadas en la muestra
pasan a tener una función de carga igual al tiempo necesario para cumplimentar el
cuestionario y al número de encuestas que realiza la empresa, que en este caso es
igual a 1.
Primera encuesta: tiempo para cumplimentar el cuestionario =60’
f(ui)=(0, 0) si ui ∉ s1
f(ui)=(x, y)=(60’,1) si u i ∈ s1
f(ui)=(x, y)=(120’,1) si ui ∈ s2
f(ui)=(0, 0) si u i ∉ s1, s2
En este caso, la función de carga estadística tiene una tercera componente a la que
se asigna 1 si la empresa lleva 2 o más años consecutivos en la misma encuesta y
0 en los demás casos. Antes de obtener la muestra, se ordenan las unidades en
orden creciente respecto a la tercera componente de la función de carga, a la
primera, a la segunda y al número aleatorio.
4.5 Resumen