Documente Academic
Documente Profesional
Documente Cultură
Este documento fue preparado por Juan Carlos Feres, Jefe de la Seccin de
Estadsticas Sociales de la Divisin de Estadstica y Proyecciones Econmicas, y
Fernando Medina, Asesor Regional en Estadsticas Sociales de la misma
Divisin. Una versin preliminar de este trabajo fue presentada al I Taller
regional del Programa para el Mejoramiento de las Encuestas y la Medicin de
las Condiciones de Vida en Amrica Latina y el Caribe (MECOVI), realizado
en Aguascalientes, Mxico, del 1 al 3 de abril de 1998.
Las opiniones expresadas en este documento, que no ha sido sometido a revisin
editorial, son de exclusiva responsabilidad de los autores y pueden no coincidir
con las de la Organizacin.
N 1
ndice
Resumen ....................................................................................... 5
Introduccin ..................................................................................... 7
I. Bases de un sistema integrado de encuestas de
hogares (SIEH) ......................................................................... 9
1. Elementos centrales .............................................................. 9
2. Ncleo bsico de encuestas a
incorporar en un SIEH........................................................ 17
3. Obstculos y desafos ......................................................... 20
4. Lineamientos de accin ...................................................... 22
II. Algunas consideraciones sobre el diseo
estadstico de las encuestas de hogares........................ 25
1. Marco de muestreo ............................................................. 25
2. Cartografa .......................................................................... 30
3. Seleccin de muestras......................................................... 33
III. Control de calidad en el diseo y ejecucin de
encuestas de hogares .......................................................... 35
1. Introduccin........................................................................ 35
2. mbito metodolgico ......................................................... 36
3. Levantamiento de la informacin ....................................... 42
4. Tratamiento de la informacin ........................................... 45
ndice de recuadros
Recuadro 1: Algunas ventajas de un sistema integrado de
encuestas de hogares (SIEH)........................................... 10
Recuadro 2: Diferencia entre un SIEH y una encuesta
multitemtica nica ..................................................... 15
Recuadro 3: Ncleo bsico de encuestas de un SIEH ........................ 17
3
N 1
Resumen
N 1
Introduccin
El propsito central del citado Programa, es contribuir a establecer y/o fortalecer los
Sistemas de Encuestas de Hogares, constituidos por un conjunto de encuestas debidamente
integradas, y que representan una de las principales fuentes de informacin para el anlisis,
evaluacin y seguimiento de la realidad social y las condiciones de vida de la poblacin. Con ello
se busca, al mismo tiempo, dotar al sector pblico y privado de los elementos informativos
necesarios que garanticen un adecuado monitoreo de las polticas en marcha y contribuyan al
diseo de programas eficientes orientados a la superacin de la pobreza y el mejoramiento de las
condiciones de vida de la poblacin.
En este contexto, la presente nota tiene por objeto, en primer lugar, formular de manera
sinttica y con carcter preliminar, algunos lineamientos generales acerca del denominado Sistema
Integrado de Encuestas de Hogares (SIEH), a efectos de incentivar la discusin orientada a
precisar sus bases conceptuales, describir sus bondades y limitaciones, e identificar los obstculos
que se enfrentan en los diferentes pases para el diseo y puesta en prctica de un sistema de este
tipo.
Por otra parte, y debido al auge que han tenido las encuestas de hogares en Amrica Latina y
el Caribe, para el diseo y seguimiento de polticas pblicas, en la segunda seccin del documento
se abordan aspectos inherentes a los procedimientos tcnicos asociados al diseo ptimo de
encuestas, poniendose nfasis en la necesidad de contar con marcos de muestreo y plataformas
cartogrficas apropiadas, sobre la base del apoyo que brindan para ello los modernos sistemas de
digitalizacin y georeferenciacin. A la vez, se describen los aspectos estadsticos vinculados con
la seleccin de la muestra, en las diferentes etapas que conlleva este proceso, y se destacan algunos
de los problemas que se pueden enfrentar en caso de que no se apliquen procedimientos adecuados.
En la ltima seccin, en tanto, se argumenta acerca de la necesidad de instrumentar
procedimientos de documentacin, que permitan conocer los detalles asociados a todas las etapas
involucradas en el diseo de una encuesta, desde la planeacin hasta su ejecucin en campo y el
anlisis de resultados, incluyendo aquellos aspectos de inters que pueden contribuir a generar un
acervo documental que incida en el conocimiento y amplia difusin de las buenas prcticas
relativas a las encuestas de hogares.
Con todo, este documento representa slo un primer esfuerzo, orientado a sistematizar los
elementos de carcter tcnico que se consideran esenciales en el diseo y puesta en operacin de un
Sistema Integrado de Encuestas en Hogares (SIEH). Por ende, se espera que las ideas que contiene
sean mejoradas y actualizadas, a la luz de las experiencias que se desarrollan en los pases y los
estudios que vienen realizando tanto organismos internacionales especializados, universidades y
centros de investigacin como tambin empresas privadas que participan en la ejecucin de
encuestas en hogares a gran escala.
N 1
I.
1.
Elementos centrales
1.1 Definicin
El Sistema Integrado de Encuestas de Hogares, es una estrategia
de produccin de informacin acerca de las caractersticas
demogrficas y socioeconmicas de los hogares y las personas, basada
en el diseo y ejecucin coordinada de un conjunto de encuestas que,
siendo diferentes entre s en cuanto a sus objetivos y alcances,
comparten un cierto marco conceptual y metodolgico, complementan
sus temas de investigacin, sincronizan su realizacin en el tiempo y
optimizan el uso de los recursos humanos y financieros.
Dada las aptitudes y restricciones propias de cada tipo de
encuesta, la variedad de las temticas que abordan y las mltiples
demandas que se proponen atender, el SIEH constituye un esquema de
trabajo que persigue recopilar informacin mediante diferentes
instrumentos y en distintos perodos del ao, conforme a una
estructura programtica que refleje las prioridades nacionales, los
temas de inters, la oportunidad en que se requieren los datos, los
recursos disponibles, as como el uso de los mtodos y procedimientos
estadsticos ms apropiados para generar la informacin, en el
contexto de un marco conceptual que integre y complemente las
distintas investigaciones.
9
1.2 Objetivos
La creacin, perfeccionamiento y consolidacin de un SIEH obedece, principalmente, a tres
propsitos bsicos:
a) Mejorar la calidad, cobertura, oportunidad, consistencia y complementariedad de la
informacin que se obtiene mediante un conjunto articulado de encuestas de hogares.
b) Atender adecuadamente a los diversos requerimientos de informacin del rea econmica y
social, tanto en lo relativo a la naturaleza y periodicidad de la misma, como a su pertinencia
para la formulacin, seguimiento y evaluacin de las polticas y programas sociales.
c) Aumentar la eficiencia en el uso de los recursos.
Recuadro 1
Seguimiento
a la
Coyuntura
M ayor
Frecuencia
Programa
Permanente de
Encuestas
M arco
M aestro de
Hogares
Diseos de
M uestra
Com plementarios
Incorporacin de
temas nuevos
Economas
de Escala
Complementariedad
Tem tica
10
N 1
Las encuestas cuentan con un marco muestral comn y las respectivas muestras se pueden
extraer, de estimarse conveniente, a partir de un marco maestro que evita las duplicidades y
reduce al mximo las visitas a los mismos hogares, incrementando las tasas de respuesta.
El diseo de algunas de las encuestas permite el anlisis "longitudinal", en virtud del esquema
de rotacin de la muestra o porque sta contempla expresamente una componente de "panel",
con traslape parcial de los hogares que se investigan.
Mortalidad y fecundidad
Salud y nutricin
Uso de tiempo
Normalmente los estudios se realizan por medio de investigaciones especficas para cada
tema, o bien -teniendo como base un tema central- se incorporan al cuestionario de la encuesta las
preguntas, o en ocasiones los mdulos, relativos al conjunto de fenmenos que se desea investigar.
En todos los casos, el diseo estadstico de la encuesta debiera prever esta situacin, a fin de que no
se produzcan sesgos en los datos y se afecte severamente la precisin de los resultados obtenidos,
ya que el error de muestreo est altamente correlacionado con el tamao de muestra y la varianza
de los estimadores.
A su vez, debe considerarse que las unidades de anlisis para los distintos temas son
diferentes. En efecto, a pesar que, por ejemplo, tanto en una encuesta de empleo como en una de
presupuestos familiares las unidades de seleccin de ltima etapa son las viviendas, en las
investigaciones sobre fuerza de trabajo los esfuerzos se centran en conocer las caractersticas de
ocupacin de la Poblacin Econmica Activa (PEA), mientras que en un estudio sobre ingresos y
gastos las unidades de anlisis son las familias. Asimismo, es necesario considerar que el tiempo de
entrevista y la duracin del trabajo de campo se incrementan de manera considerable en las
encuestas que tienen por objeto analizar las fuentes de ingreso y los hbitos de consumo de la
poblacin. Esta situacin se refleja en el diseo de un cuestionario amplio y detallado, que permita
registrar las distintas modalidades de ingreso y el destino del gasto de los hogares. No abundan los
estudios analticos que demuestren que a partir de un nmero reducido de preguntas sea posible
estimar con precisin aceptable la estructura del gasto de los hogares o la distribucin personal del
ingreso1.
Por otra parte, y como se seala en el captulo II en que se presentan algunas consideraciones
sobre el diseo estadstico de las encuestas de hogares, es importante identificar y seleccionar con
claridad las variables de estratificacin que resulten adecuadas para la conformacin del marco de
muestreo. Sobre el particular, cabe sealar las diferencias que existen en la variable que se utiliza
para la estratificacin del marco de muestreo cuando se trata, por ejemplo, de una encuesta de
empleo o de una orientada a investigar el presupuesto familiar. As, mientras en el primer caso la
variable adecuada puede ser la PEA, la categora ocupacional o la rama de actividad econmica de
los ocupados, en el caso de las encuestas de ingresos y gastos es claro que la variable de
estratificacin debe estar altamente correlacionada con el nivel socioeconmico de las unidades de
observacin y anlisis, el cual se puede aproximar a travs del ingreso o el gasto de las unidades de
consumo. Asimismo, en cada investigacin se debe identificar la variable de diseo que resulta
ms apropiada, y calcular el tamao de muestra ptimo, considerando el efecto de conglomeracin
(efd) de la variable de inters y la tasa de respuesta esperada para cada una de las variables sobre
12
Por el contrario, investigacines recientes realizadas por el Banco Mundial, han corroborado que la precisin de los estimadores
disminuye en la medida que se emplea un menor nmero de preguntas para indagar acerca del destino del gasto de los hogares o el
origen de sus ingresos (vase CEPAL, Medicin del gasto en las encuestas de hogares. Tercer taller regional del Mecovi, Resumen
y Conclusiones. CEPAL, LC/R.1914, septiembre de 1999).
N 1
las cuales se desea obtener estimacin2. Por ltimo, hay que determinar la correlacin que existe
entre la variable de diseo y las caractersticas de la poblacin que se desean estudiar con fines de
inferencia estadstica. Por ejemplo, las encuestas de empleo se disean para estimar con una
determinada precisin la tasa de desocupacin abierta (tda), pero no necesariamente para realizar
estimaciones de pobreza a partir del nivel de ingreso de los hogares, ni tampoco para estudiar el
total de empleo generado, el nmero de subempleados invisibles o el volumen de personas que
participan en el servicio domstico, entre otros estimadores que frecuentemente se construyen a
pesar de que no hayan sido considerados en el diseo estadstico de la muestra.
Para la descripcin de los procedimientos estadsticos que se aplican para este fin, vase Medina, F., Tamao ptimo de muestra en
encuestas de propsitos mltiples, en CEPAL, Planificacin y desarrollo de encuestas de hogares para la medicin de las
condiciones de vida, LC/R. 1826, julio de 1998.
13
14
Esta situacin es la que frecuentemente se enfrenta cuando se pretende disear una investigacin por muestreo que permita el
estudio de los niveles de vida de las familias. En la mayora de las aplicaciones prcticas se pretende obtener, en un slo ejercicio
estadstico, informacin sobre distintas variables relacionadas con las condiciones de pobreza de los hogares, as como con los
factores de carcter estructural que inciden en la distribucin del ingreso. Adems, es frecuente que se incorporen mltiples temas
adicionales, lo cual necesariamente incide en la precisin estadstica de los resultados, generando sesgos de estimacin que por lo
general se desconocen y no se avalan.
N 1
Recuadro 2
S IE H
C o n ju n t o d e e n c u e s t a s , d o n d e c a d a u n a t i e n e :
-
D i s e o e s t a d s t i c o p a r t i c u l a r
M e t o d o l o g a s d e i n v e s t i g a c i n a p r o p ia d a s a c a d a t e m a
D i s t i n t o s i n s t r u m e n t o s d e c a p t a c i n d e l o s d a t o s
T e m a s r e l a t iv a m e n t e a c o t a d o s
P e r io d ic id a d a ju s t a d a a l o s r e q u e r im ie n t o s d e c a d a r e a
E N C U E S T A P O L IT E M T IC A " A M P L I A "
P o r l o g e n e r a l u t ili z a :
-
U n D i s e o p a r a t o d a la i n v e s t i g a c i n
M e t o d o l o g a s e i n s t r u m e n t o s n ic o s p a r a c a s i t o d o s l o s T e m a s
T e m t i c a e x t r e m a d a m e n t e a m p lia y d iv e r s a
P e r io d ic id a d m s b i e n e s p o r d i c a
A m a y o r a m p lit u d t e m t ic a
M a y o r t a m a o d e m u e s t r a r e q u e r id o
p re c is i n d e lo s e s tim a d o r e s
c o s t o d e la i n v e s t i g a c i n
M a y o r tie m p o d e e n tre v is ta
c a l id a d d e la i n f o r m a c i n
c o s t o d e la e n t r e v i s t a
A m e n o r p e r io d ic id a d
M e n o r o p o r t u n id a d d e l d a t o
r e le v a n c i a p a r a l a t o m a d e d e c i s io n e s
c a p a c id a d d e a c c i n e n e l c o r t o p la z o
E n c u e s ta s in d e p e n d ie n te s
R e g i s t r o c o n i n f o r m a c i n l im i t a d a
P R E C IS IO N
COSTO
p la n t e a d e s a f o d e l a i n t e g r a c i n
a c o t a l a s p o s ib il id a d e s a n a lt i c a s
O P O R T U N ID A D
A L C A N C E A N A L I T IC O
Identificar unidades de muetreo comunes y recabar informacin sobre mltiples temas para
la misma unidad de observacin es una ventaja importante, ya que permite identificar las relaciones
de causalidad existentes entre diversas variables que inciden en el comportamiento de un
determinado fenmeno. Asimismo, el hecho que el levantamiento se concentre en un momento
especfico, puede llevar a reducir los costos de operacin -por unidad de observacin-, sin
desconocer que esta situacin obliga a disponer de la totalidad de los recursos para cuando se fija la
fecha en que se efectuar el operativo de campo, a parir del cual se generar la informacin de
inters. Sin embargo, con respecto al costo se debe tener presente, adems, que si en una encuesta
de este tipo el propsito fuera investigar en un slo ejercicio todos los temas con el rigor requerido,
es muy probable que tanto la amplitud del cuestionario, el tiempo de entrevista y el tamao de
muestra, se incrementaran en forma considerable, al punto de elevar su costo ms all que el de
cualquier encuesta continua que recabe datos sobre temas especficos.
De all que por el volumen de informacin que normalmente recopilan estas "encuestas
integradas" y los costos asociados a su diseo y operacin, es muy difcil darles un carcter
15
permanente o aplicarlas en forma continua, dado que la mayora de los pases no disponen de
recursos suficientes para financiarlas con el presupuesto regular con que cuentan las oficinas de
estadstica.
A su vez, desde un punto de vista tcnico, la generacin de informacin por esta va tambin
puede presentar algunos problemas, que no son menores. Debido a su carcter multitemtico, estas
encuestas enfrentan habitualmente un conflicto entre la precisin de los resultados y el tamao de
muestra utilizado. Como ha sido documentado por diferentes investigadores4, en una encuesta de
propsitos mltiples muy amplios, es difcil lograr una adecuada compatibilidad entre los objetivos
de la investigacin, el tamao de muestra ptimo y los recursos disponibles. Lo anterior significa
que para lograr similar precisin para todas las variables de inters, se tendra que incrementar de
manera considerable el tamao de muestra y, por ende, el presupuesto de la encuesta. En ese
sentido, la prctica comn indica que necesariamente se debe sacrificar la precisin estadstica de
muchas de las estimaciones y ,por ende, reconsiderar los objetivos de la investigacin, poniendo
nfasis en los verdaderos alcances del estudio, las restricciones del anlisis y la confiabilidad de la
informacin generada para dominios de estudio especficos.
Para ilustrar esta situacin, baste considerar el caso en que a partir de una encuesta de
empleo se pretenda estimar el ingreso y el consumo promedio de los hogares, con la misma
precisin estadstica con que se obtiene la tasa de desocupacin abierta (TDA). Una primera
consideracin que se debiera realizar durante la etapa de anlisis de los datos, es preguntarse cul
fue la variable utilizada para la determinacin del tamao de muestra: la TDA o el coeficiente de
variacin del ingreso (gasto) promedio del hogar; asimismo, tambin es importante conocer cul
fue el efecto de diseo y la tasa de respuesta que se utiliz para ajustar el tamao de muestra y
finalmente determinar el error de muestreo de los estimadores.
Al respecto, es conocido el hecho que el nmero de selecciones que se requieren para estimar
con una precisin determinada una proporcin o tasa, es menor que el requerido para calcular los
promedios o totales poblacionales5. De modo que si el tamao de muestra de una encuesta se
calcula a partir de la proporcin de poblacin desocupada, con un cierto nivel de confianza, es muy
probable que las estimaciones para los promedios de ingreso y gasto tengan una mayor variabilidad
y su error relativo sea superior al requerido por el investigador para realizar inferencias y adoptar
decisiones de poltica. Problema que se agudiza an ms cuando a partir de la muestra se desea
realizar inferencias para dominios de estudio con caractersticas especficas, y no definidos entre
los objetivos de la encuesta. Por ejemplo, es muy frecuente que con datos de una encuesta de
hogares que se registr el ingreso familiar, se determine el nmero de indigentes que estn
desempleados y que provienen, por ejemplo, del sector primario de la economa. En ese caso, es
muy probable que este segmento de poblacin no tenga una correlacin significativa con la variable
de diseo y, por lo tanto, la baja frecuencia de observaciones con esta caracterstica se refleje en el
elevado error de muestreo de los estimadores. Asimismo, es comn que los analistas procedan a
ajustar modelos economtricos para subpoblaciones con pocas observaciones, confiando en las
propiedades de normalidad de los estimadores para muestras pequeas. Sin embargo, en esas
circunstancia, adems de considerar el nmero de observaciones involucradas, es necesario evaluar
la consistencia del mtodo de estimacin utilizado, a efectos de garantizar que se cumplan los
supuestos del modelo y se logre la precisin estadstica deseada.
Por su parte, bajo el esquema del SIEH las mediciones que se efectan sobre temas
especficos tienen, por lo general, mayor precisin estadstica y menor costo de operacin, y por
tanto, generan informacin ms confiable y pueden efectuarse con mayor regularidad. Al mismo
tiempo, las encuestas permanentes tienen la capacidad de captar informacin sobre temas
4
5
16
Vase por ejemplo, Kish, L., Survey sampling, New York, Wiley & Sons, 1965, y Medina, F., op. cit.
Cochran, W., Sampling techniques, second edition, New York, Wiley, 1963.
N 1
adicionales al objetivo central para el que fueron diseadas, en la medida que se hagan las
modificaciones pertinentes en el tamao de muestra y la conformacin del marco de muestreo
guarde relacin con la temtica que se desea medir. Esto sin duda incrementa los costos de
operacin, pero de manera marginal, ya que existe una infraestructura para el trabajo de terreno que
se aprovecha con mayor intensidad. A su vez, mediante este tipo de estrategias es posible generar
informacin para estudios longitudinales, que permitan analizar la dinmica de determinados
fenmenos econmicos y sociales.
Sin embargo, a pesar de las bondades sealadas, las encuestas que se realizan en el marco de
un SIEH difcilmente se pueden integrar desde un punto de vista temtico, por lo que el principal
desafo -como se menciona ms adelante- consiste en disear mtodos adecuados para
complementar los datos obtenidos mediante las diferentes encuestas.
2.
TIPO DE ENCUESTA
PERIODICIDAD
Continua
COBERTURA
GEOGRFICA
Grandes ciudades o
reas metropolitanas
Trimestral
DE EMPLEO
rea rural
Semestral
NACIONAL
MEDICIN DE LAS
CONDICIONES DE VIDA
Cada 2 aos
INGRESOS Y GASTOS
Cada 10
aos
NACIONAL (con
representatividad a
nivel de
comunas o distritos)
NACIONAL
(Anual)
Cada 5 aos
(A mitad del decenio)
URBANA
(Trimestral)
17
Objetivos especficos
2.1.2
Contenido temtico
2.1.3
Periodicidad (mnima)
2.1.4
Cobertura geogrfica
Objetivos especficos
2.2.2
Contenido temtico
N 1
capacitacin, etc.) y a los servicios pblicos (salud, educacin, infraestructura bsica, saneamiento
ambiental, etc.). Ello permite medir el impacto de las polticas y evaluar el grado de focalizacin de
esos programas, conjuntamente con el anlisis de importantes atributos de los grupos beneficiarios,
a partir de informacin del hogar y de sus miembros recogida por la encuesta y no as por los
registros administrativos propios de cada programa.
2.2.3
Periodicidad
Cada dos aos, con una duracin del trabajo de campo de entre uno y tres meses.
2.2.4
Cobertura geogrfica
Objetivos especficos
Anlisis de la estructura del ingreso y el consumo de los hogares; clculo de las ponderaciones del
Indice de Precios al Consumidor; determinacin de las elasticidades de los diferentes bienes y servicios;
formacin del ingreso y; estudio del nivel y distribucin del ingreso y el gasto familiar.
2.3.2
Contenido temtico
2.3.3
Periodicidad
Cada cinco aos6. Eventualmente, la encuesta de mitad del decenio podra realizarse con una
duracin del trabajo de campo inferior a doce meses (por ejemplo un trimestre7), seleccionndose ese
perodo de acuerdo a criterios de representatividad de determinados promedios anuales.
Actualmente, en los pases de Amrica Latina y el Caribe estas encuestas se realizan, en general, cada 10 aos. Una excepcin
importante es Mxico, donde se ha conformado un programa de carcter permanente, que contempla el levantamiento de una
encuesta de este tipo cada dos aos.
19
2.3.4
Cobertura geogrfica
Nacional. De seguirse la modalidad sealada en el punto anterior, podra ser una encuesta nacional
(la de duracin anual) y otra de cobertura slo para las zonas urbanas.
3.
Obstculos y desafos
3.1 Mejorar los marcos de muestreo
20
En el caso de Mxico, este es el perodo de estudio definido y que coincide con el del trabajo de campo. Al respecto, debiera
profundizarse en el anlisis de las implicaciones tcnicas de esta opcin, especialmente en lo que se refiere a la calidad y
consistencia de la informacin generada, vis a vis aquella que se obtiene mediante la utilizacin de un perodo anual.
En las situaciones en que esto ocurre, se debiera tener la previsin tcnica necesaria para considerarlo en el clculo de los factores de
expansin y registrarlo en los documentos metodolgicos de la encuesta, con el fin de que los usuarios conozcan las restricciones en
el uso de la informacin.
N 1
De all que sea muy importante generar consenso respecto de la necesidad de actualizar el
marco de muestreo por lo menos una vez al ao, aprovechando para ello la infraestructura existente
para la realizacin del trabajo de campo de las encuestas peridicas. Por ejemplo, durante el
operativo de campo se puede adoptar la estrategia de asignar un da ms en el trabajo de los
enumeradores, a fin de que recorran su zona de trabajo y registren las diferencias que existan entre
el plano de lnea utilizado para identificar su rea de trabajo y la situacin observada en el
momento de realizar las visitas a los hogares. Del mismo modo, se debe actualizar el listado de
viviendas, como una actividad rutinaria previa a la seleccin de las viviendas que formarn parte de
la muestra.
Otra actividad a la cual se deben dedicar recursos suficientes, es la sistematizacin del marco
de muestreo y de la informacin que sirve de base para su conformacin y actualizacin. En ese
sentido, la digitalizacin de la cartografa se presenta como una tarea necesaria que permite
disponer de planos de lnea de alta calidad, que apoyan de manera eficaz las labores de
identificacin de los segmentos de viviendas y de las unidades de observacin, as como la
actualizacin inmediata de bases de datos georeferenciadas a partir de un Sistema de Informacin
Geogrfica (SIG), representando un insumo fundamental para el desarrollo de cualquier
investigacin por muestreo. A su vez, la sistematizacin de los procedimientos de estratificacin,
seleccin de la muestra, determinacin de las probabilidades de seleccin, y clculo y correccin de
los factores de expansin, permiten llevar un mejor control de las actividades de campo y reducir
los errores humanos en los procesos de trabajo, evitando manipulaciones innecesarias que pueden
conducir a sesgos de estimacin en los resultados.
21
los resultados para los efectos de la caracterizacin de fenmenos multivariados, como es el caso
del nivel de vida de los hogares9.
En efecto, sabemos de la conveniencia de interrelacionar las bases de datos de diferentes
encuestas de hogares que estudian distintos temas. No obstante, en el contexto de un SIEH
normalmente las encuestas que se realizan son diseadas con base en muestras independientes,
donde los hogares visitados difieren entre las distintas investigaciones. Ms an, incluso en el caso
en que se tratara de los mismos hogares, pero bajo esquemas de seleccin distintos, subsisten las
diferencias anotadas con respecto a la estratificacin del marco de muestreo, las variables de
diseo, los pesos relativos de las unidades de seleccin, los factores de expansin y la no respuesta,
que constituyen -entre otras limitantes- algunos de los problemas que impiden sobreponer dos bases
de datos para complementar el estudio de un determinado fenmeno.
De modo que, aun cuando el SIEH calendarize en un primer momento, por ejemplo, una
encuesta de fuerza de trabajo y luego una encuesta de ingresos y gastos, no es posible utilizar, al
menos en forma directa, la informacin de empleo de la primera para complementar la segunda, y
evitar as que nuevamente se tenga que captar informacin sobre las caractersticas ocupacionales
de la poblacin. Pese a que en los dos casos se trata de una encuesta de hogares, cuyas muestras
pueden haber sido seleccionadas a partir de un mismo marco de muestreo, las distintas
probabilidades de seleccin de las observaciones limitan la operacin deseada.
4.
Lineamientos de accin
En los ltimos tiempos, y como fruto de una creciente demanda de informacin del rea
social, en la regin se han evidenciado con mayor fuerza ciertos vacos con relacin especialmente
a la cobertura temtica y la periodicidad de las encuestas, como tambin respecto a la consistencia
de los datos generados por diferentes fuentes y a la aptitud de las mismas para responder a las
9
22
La razn fundamental es que en las diferentes encuestas los hogares en muestra son distintos, lo cual no permite integrar la
informacin. Por otra parte, y dado que los tamaos de muestra difieren segn el tipo de investigacin, se presenta un problema
adicional que se refiere a la definicin de las probabilidades de seleccin, y por ende al clculo de los factores de expansin que se
utilizan para ponderar las observaciones en muestra.
N 1
necesidades impuestas por las polticas y programas sociales. Esto ha llevado en algunos casos a la
proliferacin de encuestas, o bien a ampliar el contenido de los cuestionarios ms all de lo que
razonablemente permite la definicin de cada operativo y las caractersticas y limitaciones de los
instrumentos utilizados. Un ejemplo de ello es el intento de abordar la investigacin de los temas
propios de las encuestas de ingresos y gastos mediante procedimientos ms giles y baratos, pero
menos eficaces, a partir de las encuestas de propsitos mltiples.
De all que, teniendo presente que la situacin en que se encuentran los distintos pases de la
regin en materia de infraestructura de encuestas de hogares es muy diversa, para los prximos
aos se hace imprescindible impulsar acciones diferenciadas, acordes a la experiencia y grado de
avance en que se encuentra cada pas. Estas acciones, sin embargo, debieran apuntar en ltimo
trmino a establecer en el mediano y largo plazo sistemas integrados de encuestas de hogares, que
permitan aprovechar de manera simultnea y coherente las ventajas propias de cada relevamiento.
Desde el punto de vista regional, existen dos grandes reas de tareas tcnicas asociadas a este
esfuerzo. La primera comprende todas aquellas materias referidas al muestreo, en la perspectiva de
la construccin de un sistema integrado de encuestas (desarrollo y perfeccionamiento del marco
muestral, definicin de muestras maestras, diseo de muestras panel o semipanel, clculo apropiado
de tamaos de muesrta para encuestas multitemticas, etc.). La segunda, en tanto, abarca la
recopilacin y sistematizacin de experiencias acerca del diseo y contenido de los cuestionarios,
tcnicas de investigacin, organizacin del trabajo de campo, mtodos de evaluacin de la calidad
y confiabilidad de los resultados, integracin de productores y usuarios y pertinencia de las
diferentes encuestas en funcin de los objetivos perseguidos.
A su vez, el establecimiento y/o desarrollo de un sistema integrado de encuestas de hogares
supone introducir mejoramientos institucionales y tcnicos en los pases, que en gran medida son
funcionales al mejoramiento de las distintas investigaciones. Entre las tareas a asumir pueden
destacarse:
i) el fortalecimiento del nivel tcnico de los funcionarios de las oficinas de estadstica, tanto
a nivel central como regional, incluyendo la conformacin de un equipo permanente o parcialmente
permanente de encuestadores;
ii) la actualizacin o establecimiento de una muestra maestra, as como la definicin de los
procedimietnos tcnicos apropiados para la seleccin de submuestras;
iii) la incorporacin de una componente de panel en todos los relevamientos10;
iv) la conformacin de equipos de trabajo que incluyan la entrada de datos en campo y una
alta capacidad de reentrevista, acompaado de un intenso programa de supervisin;
v) la incorporacin de programas de suplementos (mdulos) preestablecidos y flexibles;
vi) en suma, el fortalecimiento institucional de las oficinas de estadstica, con la radicacin
en ellas de todos los operativos.
El estado general del sistema de encuestas de cada pas debiera servir de base para definir las
acciones conducentes a su mejoramiento. Con el fin de ilustrar algunos cursos de accin en
trminos de productos que pueden constituir los primeros resultados de un programa integrado, se
presentan a continuacin tres ejemplos.
10
Esto se aplica actualmente en la mayora de las encuestas de fuerza de trabajo que se realizan en los pases de la regin. Sin
embargo, es especialmente importante que tambin las encuestas orientadas a evaluar los niveles de vida, la evolucin de la pobreza,
la desigualdad y el desarrollo humano consideren un panel de rotacin apropiado, con el fin de darle seguimiento a la accin pblica
y su efecto en el bienestar de la poblacin.
23
En un primer caso, se debieran sentar las bases para el mejoramiento del sistema integrado
concentrando los esfuerzos en el fortalecimiento de la encuesta de hogares de propsitos mltiples.
Esto supone, en primer lugar, aumentar su frecuencia, llegando incluso a atribuirle un carcter
continuo, superando de esta manera la situacin que presentan algunos de los pases en cuanto a
levantar la encuesta slo una o dos veces al ao. En segundo lugar, ampliar el mbito geogrfico de
la encuesta, con el fin que del rea metropolitana o de algunas zonas urbanas se pase a cubrir a la
poblacin de la totalidad del territorio nacional. En tercer lugar, ampliar tambin la cobertura
temtica de la encuesta, a efectos de complementar la medicin del empleo y del desempleo con
informacin relevante para un abanico de temas sociales, que permitan establecer relaciones de
causalidad y medir el efecto de las polticas. En cuarto lugar, en el caso de los pases ms
avanzados de este grupo, se sugiere la incorporacin de mdulos especiales, con el objeto de
permitir explorar en mayor profundidad determinadas reas de la realidad social. Por ltimo,
progresar en los aspectos metodolgicos, operativos y de procesamiento de la informacin, con el
fin de ganar en calidad y oportunidad.
En un segundo caso, los esfuerzos de nuevos levantamientos debieran concentrarse en el
relevamiento de una encuesta del tipo caracterizacin socioeconmica, que apunte a complementar
la informacin de la encuesta continua con un anlisis ms pormenorizado de las familias afectadas
por situaciones de pobreza. Especial importancia tendra investigar el alcance geogrfico y por
estratos sociales de las polticas de gasto pblico, incluyendo el examen de los diversos programas
que los gobiernos vienen promoviendo en los ltimos aos en su lucha contra los rezagos sociales.
Se tratara de establecer un programa que contemple la realizacin de este tipo de encuestas cada
dos o tres aos. En este sentido, y recordando que se persigue mejorar la calidad de los datos, es
imprescindible aprovechar la experiencia que ya ha acumulado la regin en esta clase de encuestas.
Por ltimo, en un tercer caso, los esfuerzos de nuevos relevamientos debieran centrarse en
establecer un programa de encuestas de ingresos y gastos, en un modelo simplificado pero de
mayor periodicidad, con el fin de conseguir cifras de gran calidad en torno a la evolucin de los
ingresos y de los gastos y de la estructura del consumo de las familias. Se trata de un objetivo
ambicioso, pues requiere de mayores recursos y de una estructura institucional ms consolidada. A
la vez, permitira tener un conocimiento ms cabal de los efectos que los cambios estructurales en
la produccin, en la ocupacin y en la distribucin del ingreso vienen teniendo sobre la trama
social, en trminos de la distribucin de los frutos del crecimiento econmico en una nueva
modalidad de desarrollo.
24
N 1
1.
Marco de muestreo
1.1 Generalidades
Un marco de muestreo se define como una lista exhaustiva organizada en forma de base de datos- que contiene todos y cada uno
de los elementos de una poblacin de inters que participarn en las
distintas fases de seleccin de la muestra. A su vez, el marco est
formado por un conjunto de mapas y planos a diferentes escalas, que
permiten la delimitacin fsica de las diversas unidades de seleccin.
Asimismo, se considera parte fundamental de ste los registros fsicos
de las unidades de viviendas, as como los listados en que se detallan
las referencias que permiten a los encuestadores la plena identificacin
de las viviendas seleccionadas, as como de aquellas que sin ser parte
de la muestra pertenecen a la poblacin objeto de estudio.
El marco debiera contener informacin sobre la divisin
administrativa y geogrfica del pas -subdivisiones polticas o
zonificacin estadstica definida para efectuar la enumeracin del
censo de poblacin-, como tambin sobre los volmenes de viviendas
y de poblacin total, por grupos de edad y sexo, entre otras variables
necesarias para clasificar a los hogares de acuerdo a determinadas
caractersticas segn los objetivos especficos de la encuesta.
25
En un buen marco de muestreo, todos los miembros del universo de estudio deben tener una
probabilidad conocida, y distinta de cero, de formar parte de alguna muestra. Sin embargo, se debe
sealar que existen estudios en que deliberadamente se excluyen algunas zonas o regiones del pas,
o determinadas subpoblaciones, para fines de muestreo; estos casos no violan el principio sealado,
pero ello debe aclararse en los documentos que hacen referencia a la poblacin encuestada a fin de
que no se generalicen los resultados a sectores no considerados en el universo de estudio.
Por ltimo, el marco debe estar excento de duplicaciones y omisiones, y actualizarse de
manera permanente, con el objeto de reflejar los cambios estructurales que se van produciendo en
la geografa del pas, la conformacin de las unidades de seleccin, su distribucin fsica, el
surgimiento de nuevas edificaciones y las construcciones que se generan debido al crecimiento de
la poblacin, as como la bajas registradas debido a demoliciones, fenmenos naturales o por el
hecho de que algunas viviendas se hayan transformado en negocios comerciales.
26
N 1
de muestreo (UPMs). Segn las caractersticas de las unidades censales, es posible que stas
puedan utilizarse como conglomerados (teniendo presente que en cualquier encuesta la primera
etapa es la que genera la mayor contribucin a la varianza total del diseo).
Como ha sido ampliamente documentado en textos especializados y en diversos informes
tcnicos elaborados por la Divisin de Estadstica de las Naciones Unidas (vase United Nations),
las unidades de observacin agrupadas en conglomerados son muy distintas entre s (heterogneas)
y tienden a incrementar la varianza de los estimadores, ya que estos conglomerados son
generalmente pequeos en comparacin con el universo de estudio. Sin embargo, en la prctica del
muestreo es comn la formacin de conglomerados, ya que representan espacios geogrficos que se
constituyen como unidades de primera etapa para la seleccin de la muestra (en los documentos
tcnicos de Naciones Unidas a estas unidades se les denomina reas de enumeracin).
Al interior de las unidades de primera etapa existe una cierta afinidad entre los elementos
que las conforman, por lo que su contribucin a la varianza total (intraconglomerados) es menor
que aquella que aporta las diferencias entre las agrupaciones (variacin entre conglomerados).
Luego, al interior de los conglomerados se definen agrupaciones ms pequeas constituidas por
grupos de viviendas, que usualmente se conocen como segmentos compactos o reas de listado y
que se denominan unidades secundarias de muestreo (USMs). En esta etapa se requiere contar con
un listado exhaustivo de las agrupaciones, en el que se detallen las caractersticas del sector y
permitan a los entrevistadores la identificacin de las viviendas seleccionadas. Finalmente, al
interior de las USMs se listan todas las viviendas, las que son consideradas como unidades ltimas
o finales de muestreo (UUMs).
28
N 1
todos los temas incorporados en una encuesta y, por ende, a los distintos usuarios de la
informacin11.
Lo anterior es relevante en la medida que existen iniciativas que promueven la realizacin de
encuestas multitemticas que no siempre evalan, con el rigor tcnico del caso, la correlacin que
existe entre la estratificacin del marco muestral, la variable de diseo para la determinacin del
tamao de muestra y el error relativo de los diferentes indicadores que se construyen con base a las
preguntas contenidas en el cuestionario y asociadas a los diferentes temas que se investigan.
Es probable que estos estudios partan de la hiptesis que existe una posible relacin entre
algunos de los indicadores obtenidos, la estratificacin del marco y la variable de diseo. Sin
embargo, tambin es probable que esta correlacin no sea significativa desde el punto de vista
estadstico, en cuyo caso se comprometen o invalidan las inferencias que se puedan hacer sobre el
comportamiento de un fenmeno perteneciente a un determinado dominio de estudio. De modo que
resulta indispensable estimar los errores de muestreo y calcular el efecto de diseo de las variables,
con el propsito de evaluar si el tamao de muestra utilizado result apropiado para los fines de la
encuesta.
Por ltimo, es importante sealar que, a diferencia de la etapa de estratificacin que tiene un
fin especfico para cada encuesta, los trabajos que se realizan para la formacin de conglomerados
son de beneficio comn y se pueden compartir entre las diferentes encuestas de un programa
permanente o en el contexto de un SIEH. Esto significa que la definicin y formacin de los
conglomerados, la sistematizacin de la informacin de base, la elaboracin del material
cartogrfico y su actualizacin, son insumos que se pueden aprovechar para desarrollar varias
rondas de una misma encuesta o para realizar investigaciones independientes sobre distintos temas,
utilizando mecanismos de estratificacin apropiados que mantengan una correlacin significativa
con la variable de diseo. As, el costo que implica la administracin de los conglomerados,
conobjeto de mantenerlos actualizados, se amortiza entre las diferentes rondas o encuestas,
generando economas de escala que permiten la puesta en marcha de un programa integrado de
encuestas de hogares a costos razonables, que informe de manera peridica sobre una amplia gama
de temas de inters.
Esta consideracin es de especial inters sobretodo en las encuestas de propsitos mltiples, ya que es muy frecuente que ello se
pase por alto, sin que se midan sus consecuencias en la posible prdida de precisin de algunos estimadores.
29
2.
Cartografa
2.1 Cartografa automatizada y los Sistema de Informacin
Geogrfica (SIGs)
30
N 1
31
que las actividades en el mbito geogrfico suelen tener fines ms amplios que rebasan por mucho
los requerimientos de la elaboracin y administracin de un marco de muestreo.
32
N 1
Finalmente, los dispositivos para la salida de los mapas pueden ser plotters de plumas para
hojas de papel de 36 pulgadas e impresoras a color de inyeccin de tinta.
3.
Uno de los objetivos fundamentales del diseo muestral es definir el procedimiento que se
aplicar para seleccionar las unidades de observacin que formarn parte de la muestra. En
trminos generales, lo ms apropiado sera seleccionar directamente las unidades de observacin a
partir de un listado que considere a todas y cada una de las unidades objeto de estudio. Sin
embargo, proceder de esta manera incrementa apreciablemente el costo del trabajo de campo ya
que, en caso que existiera un listado que incorporara todos los elementos del universo de estudio, la
dispersin de la muestra implicara grandes desplazamientos de los entrevistadores para visitar las
distintas unidades seleccionadas, lo que incrementara los costos a un nivel que hara casi inviable
cualquier proyecto de encuesta.
Debido a esos altos costos asociados a la seleccin de una muestra aleatoria (en diseos
monoetpicos con seleccin por muestreo aleatorio simple), es una prctica habitual el que los
pases utilicen diseos polietpicos; vale decir, mtodos de seleccin en que las unidades de
observacin son elegidas luego de diversas fases que combinan procedimientos de conglomeracin
y estratificacin. A su vez, en estos casos es necesario construir un marco para cada una de las
etapas definidas para la seleccin de la muestra.
De esta manera, se busca formar unidades de marco de tamaos similares, a fin de reducir la
variabilidad de las probabilidades de seleccin. En el caso en que las unidades formadas no difieren
considerablemente en relacin al nmero de unidades que las forman, es posible aplicar un
procedimiento de seleccin que asigne igual probabilidad a todas las unidades. Sin embargo, es
frecuente que existan diferencias considerables en relacin al tamao, por lo que en estas
situaciones se sugiere que la asignacin de las unidades en muestra se efecte asignndoles una
probabilidad proporcional a su tamao, expresado por ejemplo en el total de viviendas que incluyen
o de alguna otra variable que est altamente correlacionada con las caractersticas de la poblacin
que se desea estimar.
Es necesario controlar cuidadosamente la aplicacin del procedimiento de seleccin
expresado en el esquema de muestreo adoptado, y llevar un registro detallado de las unidades
incluidas en la muestra y de sus probabilidades de seleccin, a efectos de que sea posible construir
en forma clara el factor de expansin que permitir extrapolar los resultados observados en la
muestra al total del universo de estudio.
Previo a la seleccin de la unidades de vivienda en los listados correspondientes, se debiera
depurar la lista disponible a partir de un recorrido de campo que permita conocer la situacin de las
viviendas que formarn parte de la investigacin. As, se debiera actualizar el listado identificando
bajas y altas de unidades de vivienda, poniendo especial nfasis en las de nueva creacin y en
aquellas que se dedican a una actividad econmica pero que a la vez operan como lugar de
residencia de las familias.
En la frmula aplicada para el clculo del factor de expansin, se debieran precisar las
diferencias entre los pesos asignados en gabinete a las unidades seleccionadas y aquellos
determinados como fruto de los recorridos de actualizacin en campo. Es habitual que existan
33
diferencias entre ambas mediciones, por lo que en el hecho resulta muy difcil preservar la
caracterstica de autoponderacin en el diseo de una encuesta12.
Cuando no se sigue este procedimiento, suele adoptarse el supuesto de que no han ocurrido
cambios significativos entre la fecha de elaboracin del marco de muestro y la de realizacin del
trabajo de campo, lo cual obviamente es incorrecto. A fin de intentar superar esta situacin, la
prctica cotidiana supone que el problema se resuelve, al menos en parte, expandiendo los
resultados de la encuesta a una proyeccin de poblacin que tome en cuenta la dinmica
demogrfica del pas, pero que pocas veces considera la distribucin espacial de la poblacin. Ello
permite reducir los errores en los estimadores nacionales, lo que no impide que en muchas
ocasiones se agudicen las diferencias regionales, generando tasas de crecimiento inconsistentes
entre dos o ms encuestas de un mismo programa13.
Otro elemento que tambin es importante sealar en este apartado, es el que se refiere a la
prctica, muy difundida en algunas oficinas de estadstica de la regin, de efectuar reemplazos de
viviendas en los casos de prdida de muestra por motivos de no respuesta. De hecho, es comn que
las altas tasas de respuesta que reportan algunas investigaciones por muestreo escondan prcticas
deliberadas de reemplazos efectuados a criterio del entrevistador y sin ningn control por parte de
los encargados del diseo estadstico de la encuesta. Como se sabe, estas sustituciones alteran las
probabilidades de seleccin de las viviendas e introducen sesgos en la informacin que son difciles
de evaluar. De modo que para lograr la precisin deseada en las estimaciones, se sugiere no
fomentar estas iniciativas, sino ms bien, alternativamente, ajustar el tamao de muestra por
motivos de no respuesta, con el objeto de obtener durante la ejecucin del trabajo de campo el
nmero mnimo de selecciones que garantice la confianza requerida.
An en la situacin en que los reemplazos se efectan previo a la ejecucin del trabajo de
campo, se deben extremar precauciones. Es bien sabido que en ocasiones se hacen selecciones
adicionales, con objeto de prever las prdidas de observaciones en terreno; sin embargo, cuando se
emplea esta prctica, se debe considerar que las probabilidades de seleccin de las viviendas que
funjirn como reemplazos son diferentes al resto, generando con ello sesgos de estimacin, adems
de no reflejar con fidelidad el comportamiento del informante ante la encuesta, as como los errores
inherentes a la posible falta de actualizacin del marco de muestreo.
12
13
34
Hay personas que creen que la autoponderacin es una caracterstica deseable en los diseos de muestra y que incluso esta cualidad
facilita el manejo de la base de datos y la expansin de los resultados. Sin embargo, debido a los cambios fsicos ocurridos en el
terreno, esta condicin difcilmente se puede preservar y la prctica comn indica que la mayor parte de las muestras no son
autoponderadas. Adems, el uso intensivo de microcomputadoras facilita enormemente el manejo de la informacin, por lo que la
existencia de mltiples factores de expansin no representa ningn problema.
La utilizacin de proyecciones de poblacin para la expansin de los resultados es comn en muchas de las encuestas de hogares
que se efectan en los pases de la regin. Sin embargo, a pesar de ser la solucin ms barata e idnea ante la ausencia de un marco
de muestreo previamente actualizado, a la larga puede generar graves problemas a los usuarios de la informacin y a las propias
oficinas de estadstica. Se debe considerar el hecho de que las proyecciones de poblacin en el mejor de los casos se efectan para el
contexto nacional, estatal, provincial o departamental, pero en muy pocas ocasiones para divisiones geogrficas menores. Esto
significa que a partir de ellas no es posible conocer los cambios de poblacin que se registran en el mbito de reas de muestreo, lo
cual puede traducirse en inconsistencias en las estimaciones generadas.
N 1
1.
Introduccin
35
2.
Ambito metodolgico
2.1 Diseo conceptual
Bajo la ptica de la calidad total, los objetivos de las encuestas se deben orientar
preferentemente a satisfacer, en tiempo y forma, las necesidades de los usuarios de la informacin:
analistas, diseadores de polticas y tomadores de decisiones. De modo que en la etapa de
definicin de los mtodos y procedimientos para llevar a cabo la investigacin, se debe dar
respuesta a preguntas tales como qu tipo de informacin se desea obtener; de qu manera se
alcanzarn los objetivos de la encuesta y cumplirn los plazos establecidos para la entrega de
resultados; cmo se relacionarn los datos generados con aquellos disponibles de otras fuentes y
cul es la precisin deseada para las estimaciones de inters.
a)
Requerimientos de informacin
Un primer requisito indispensable es definir con claridad el fenmeno a estudiar, con el fin
de identificar los objetivos generales y especficos de la encuesta. Son pocas las ocasiones en que
no existe ninguna informacin acerca del tema que se desea analizar, por lo que es aconsejable
hacer primeramente una revisin bibliogrfica y de los antecedentes disponibles de estudios
similares realizados en el pasado, en el pas y en el extranjero, as como efectuar consultas con
especialistas y usuarios de la informacin a efectos de precisar los alcances de la investigacin y
los indicadores que se desean obtener.
Asimismo, es necesario tener claro los usos que se harn de la informacin recopilada, lo que
permitir identificar los dominios de estudio, establecer las hiptesis de comportamiento, formular
posibles relaciones de causalidad entre las variables estudiadas y definir los niveles de
desagregacin y precisin requeridos para los datos. Esta ltima informacin constituye, a su vez,
un insumo fundamental para determinar el tamao de la muestra y definir los procedimientos para
la seleccin de las observaciones que formarn parte de la investigacin.
b)
Marco conceptual
N 1
El logro de los objetivos de una encuesta de propsitos mltiples se basa en gran medida en
la disposicin de los hogares a colaborar, as como en la calidad de los datos que proporcionan los
informantes. De manera que la etapa del diseo del cuestionario se puede considerar como una de
las ms crticas en la planeacin de una encuesta por muestreo, ya que su aceptacin por parte de
los informantes est condicionada a disponer de un instrumento de fcil entendimiento y
estructurado en trminos lgicos. Un cuestionario bien redactado y ordenado atrae la atencin del
informante y facilita su relacin con el entrevistador.
El cuestionario es el instrumento que permite conducir la entrevista y evita que el
empadronador elija el orden y redaccin de las preguntas, o las categoras de respuesta. A su vez,
establece el flujo adecuado de las preguntas e identifica a las subpoblaciones de inters en cada
tema. Por otra parte, para facilitar su manejo en campo el cuestionario debe tener un formato
adecuado y ser resistente a las inclemencias climticas y al constante manoseo de que son objeto.
Dado que el cuestionario representa la expresin operativa de los objetivos de la
investigacin, su diseo debe guardar estrecha relacin con los dems componentes de la encuesta.
Por ende, es muy recomendable que su confeccin est a cargo de un equipo interdisciplinario
integrado por especialistas en los temas de la encuesta, diseo estadstico, enfoque conceptual,
personas con experiencia en el trabajo de campo y los encargados del procesamiento de datos, entre
otros. En la actualidad es comn encontrar que tiendan a repetirse los estudios sobre diversos temas
en un mismo pas e incluso entre pases, por lo que la experiencia en el diseo de cuestionarios
debe entenderse como un proceso acumulativo. Sin embargo, esto no significa que un formato
elaborado con objetivos especficos pueda aplicarse en cualquier lugar o circunstancia sin que se
efecten las modificaciones pertinentes en atencin a las caractersticas del entorno cultural, el
nivel de instruccin de la poblacin objetivo, la calificacin del personal de campo o el grado de
desarrollo del sistema estadstico nacional.
Como se ha sealado en diversos documentos tcnicos, es importante tener consciencia que
las personas que redactan el cuestionario no son las mismas que van a responder la entrevista, por
lo que se debe pensar siempre en los informantes al momento de formular las preguntas. En este
sentido, deben omitirse al mximo los tecnicismos y las palabras de uso poco frecuente ya que su
inclusin seguramente contribuir a generar confusin y a desestimular la participacin de los
entrevistados.
El buen conocimiento del tema a investigar, as como las consultas a los usuarios, facilitan
una apropiada redaccin de las preguntas. Asimismo, las pruebas de campo en zonas geogrficas
diversas que presenten situaciones poco comunes y para diferentes estratos socioeconmicos,
14
Apoyndose en los mtodos modernos de comunicacin, es aconsejable que esta informacin se encuentre en lnea en una pgina
WEB, con el fin de que todo el personal de las oficinas regionales lo pueda consultar en cualquier momento.
37
38
N 1
de inters, a evaluar el impacto de las polticas pblicas o a determinar cules son las causas
asociadas a la evolucin de una varaible determinada.
Una prctica que se viene desarrollando frecuentemente, es poner a disposicin de los
usuarios discos magnticos o compactos con los tabulados de la encuesta. Esto constituye una
interesante y eficaz forma de incorporar el desarrollo tecnolgico a los procedimientos de difusin
de informacin estadstica, que facilita al usuario la consulta y almacenamiento de los datos. No
obstante, en ningn caso releva de la necesidad de agregar mayor valor a la informacin de la
encuesta, mediante los estudios analticos que normalmente se elaboran en los centros de
investigacin y de diseo de polticas, tanto pblicos como privados.
En ese sentido, cabe enfatizar que los usuarios especializados abocados a evaluar polticas o
a determinar relaciones de causalidad, requieren disponer esencialmente de las bases de
microdatos, con el fin de ampliar y profundizar sus posibilidades de anlisis. De modo que las
unidades ejecutoras debieran asumir que las actividades de la encuesta continan ms all de la
generacin de tabulados y la publicacin de resultados, y deben estar dispuestas a proporcionar a
los usuarios los archivos con los registros individuales, as como asesora estadstica para
garantizar el buen uso de los datos y preservar la confidencialidad de la informacin.
d)
Estructura funcional
Se requiere establecer con claridad los diferentes niveles de mando que intervienen en el
desarrollo de la encuesta, as como las funciones y responsabilidades asociadas a cada uno de ellos.
Para esto, es recomendable elaborar un organigrama que represente la estructura jerrquica y las
interrelaciones de las distintas reas que intervienen en el diseo y ejecucin de la encuesta.
Asimismo, debiera elaborarse un manual de operacin que defina los procedimientos
administrativos que corresponde cumplir para la solicitud y comprobacin de recursos, el envo y
recepcin de materiales, el uso de vehculos y combustible, los diversos gastos que se requieren
para la elaboracin y actualizacin del marco de muestreo, la impresin de materiales, la ejecucin
del trabajo de campo, etc.
De paso, esta informacin resulta esencial para futuras investigaciones, en la medida que los
diseos ptimos de encuestas requieren disponer de datos sobre los costos de ejecucin en las
diferentes fases, para determinar con exactitud el nmero ptimo de unidades de seleccin de
primera y segunda etapa y, en otro orden, permite tambin elaborar controles para la distribucin de
los materiales de trabajo (tiles de oficina, cuestionarios, manuales, etc.) y disear diversos
formatos para el manejo de las actividades de la encuesta15.
15
Tal vez una falencia importante de las oficinas nacionales de estadstica de los pases de la regin, es la escasa informacin que
registran con relacin a las etapas de planeacin y operacin en campo del proyecto. Son pocas las ocasiones en que se informa
acerca de los costos unitarios asociados a la encuesta, se hace una evaluacin pormenorizada de la calidad del marco de muestreo y
de las causas ms frecuentes de rechazo o se consignan las mejores prcticas observadas durante la entrevista, la supervisin, crtica
o registro de datos.
39
a)
Tamao de la muestra
Uno de los primeros requerimientos del diseo estadstico de una encuesta es identificar,
dentro del conjunto de variables para las que se propone generar informacin, cul(es) de ella(s) se
utilizar(n) para determinar el tamao de la muestra. Al mismo tiempo, se debe decidir si se
obtendrn estimaciones para proporciones, promedios o totales, as como la precisin y confianza
deseada para los resultados esperados.
Conocer la varianza de las variables de diseo es fundamental para calcular el nmero
ptimo de selecciones que permitan lograr estimaciones con la precisin establecida. No obstante,
es comn que en muchas encuestas (sobre todo las que estudian el mercado laboral y la fuerza de
trabajo y tambin las que estudian las condiciones de vida) el tamao de muestra se calcule como si
el objetivo de la encuesta se centrara exclusivamente en estimar proporciones, aunque
posteriormente la informacin sea utilizada para calcular promedios y totales. En este sentido, se
debe enfatizar que esta prctica tiene consecuencias en el error de muestreo, ya que ste se
incrementa necesariamente por el simple hecho que la muestra calculada no resulta suficiente para
garantizar la precisin esperada en estimaciones de promedios y totales. A su vez, tambin es
habitual que no se disponga de estimaciones acerca del error de muestreo de la variable de inters
para los diseos estratificados y de conglomerados. En este caso, comnmente el tamao de
muestra se determina como si se fuera a efectuar una seleccin con igual probabilidad, y
posteriormente el valor obtenido se incrementa por un factor de ajuste denominado efecto de diseo
(efd), as como por las posibles prdidas de observaciones que se puedan originar durante la
ejecucin del trabajo de campo, o tasa de no respuesta esperada (tnr).
Esta fase suele desarrollarse en forma rutinaria y la gran mayora de las veces no se le presta
la debida atencin. Como se sabe, un menor nmero de observaciones que las necesarias,
incrementa los errores de muestreo e introduce sesgos importantes en los datos.
Cuando no se dispone de valores actualizados sobre el efecto de conglomeracin del marco
(efd) y se utiliza alguno obtenido de una investigacin "similar", es muy probable que se subestime
el tamao de muestra requerido para obtener resultados con la precisin deseada. Asimismo, si se
sobreestima el valor de este factor de ajuste, el nmero de selecciones se incrementa
innecesariamente lo cual redunda en un desperdicio de recursos. Es importante recordar que cada
encuesta tiene caractersticas propias y que stas varan conforme a las circunstancias de la
investigacin, la participacin de los informantes, la calidad de los encuestadores, etc. En tal
sentido, se seala que deben actualizarse los coeficientes de variacin y efectos de diseo de las
variables, ya que el no hacerlo puede significar prdida de precisin por malos clculos en el
tamao de muestra16.
Por ltimo, para prever la prdida de observaciones en campo, por motivos de rechazo de los
informantes y defectos del marco, y preservar el grado de precisin, es recomendable introducir
ajustes en el tamao de la muestra. De modo que se considera una mala prctica incorporar
reemplazos de manera deliberada, ya que adems de alterar las probabilidades de seleccin de las
unidades de observacin, induce a un mal uso por parte de los entrevistadores e introduce sesgos de
estimacin difciles de evaluar.
b)
Marco de muestreo
Para seleccionar las unidades que formarn parte de la encuesta, se requiere disponer de una
relacin que identifique de manera inequvoca a cada una de ellas. Sin embargo, por lo general no
se dispone de un listado que permita la ubicacin y seleccin directa de las unidades de
16
40
De hecho, es preciso anotar que cada variable tiene asociado un efecto de diseo, por lo que el utilizar un solo valor en la
determinacin del tamao de muestra puede conducir a errores de clculo.
N 1
observacin, lo que hace necesario elaborar diseos polietpicos que suponen la confeccin de
marcos de muestreo para cada fase de seleccin.
A su vez, para minimizar los errores de seleccin e identificacin de las unidades se requiere
que el marco de muestreo est actualizado y no adolezca de duplicaciones u omisiones. En tal
sentido, y a pesar que el marco puede haberse elaborado con informacin reciente, es necesario
efectuar conteos que permitan actualizar el nmero de viviendas existentes en las unidades
seleccionadas, y luego listarlas, a fin de identificar aquellas que son susceptibles de ser
entrevistadas. En el caso en que se trate de una encuesta de hogares, se eliminan de este proceso los
establecimientos econmicos y las viviendas de uso colectivo, por no formar parte de la poblacin
objeto de estudio.
El listado de viviendas debiera contar con un croquis que permita ubicar fsicamente la
manzana o rea geogrfica seleccionada, as como el segmento donde se encuentran las viviendas
que se desea visitar. A fin de que los entrevistadores puedan identificarlas con precisin, se deben
describir los rasgos fsicos perdurables de la zona y de la vivienda, de tal suerte que sean fcilmente
identificables en el terreno.
Asimismo, para no incorporar distorsiones en la seleccin de la muestra, durante la etapa de
elaboracin del marco se deben asignar a las unidades definidas medidas de tamao (pesos)
actualizadas, con el objeto de diferenciar su importancia relativa tanto en el proceso de seleccin
como en la fase de generacin de resultados.
En todos los casos es deseable que los procedimientos utilizados tengan la capacidad de ser
replicables, en el sentido que si otra persona siguiera las instrucciones definidas necesariamente
debiera aproximarse al mismo resultado.
A fin de apoyar la consolidacin y resguardo de la informacin, es importante recurrir a
mtodos de automatizacin que permitan clasificar e indexar la base de datos en funcin a los
atributos de inters definidos por los usuarios, a fin de facilitar los procedimientos de
estratificacin y conglomeracin en el caso de las encuestas polietpicas.
c)
Seleccin de la muestra
41
d)
3.
Levantamiento de la informacin
3.1 Organizacin del trabajo de campo
Una de las etapas ms importante en el desarrollo de una encuesta es la ejecucin del trabajo
de campo. Es posible elaborar un buen cuestionario, o efectuar un ptimo diseo de muestra e
impartir una excelente capacitacin a los encuestadores; sin embargo, la falta de una adecuada
organizacin y supervisin del trabajo de campo puede llegar a invalidar los resultados de la
investigacin.
Por ende, es imprescindible que la unidad ejecutora confeccione un manual en el que se
especifiquen detalladamente los aspectos organizativos del levantamiento y las facultades,
atribuciones y responsabilidades del personal, as como las relaciones entre las diferentes instancias
que participan en la planeacin y ejecucin del trabajo de campo.
A su vez, se deben definir los controles necesarios para garantizar que se minimicen los
errores de muestreo y ajenos al muestreo, as como los sesgos involuntarios que se pueden
introducir producto de decisiones inadecuadas adoptadas por supervisores y/o entrevistadores. Al
respecto, es recomendable que el equipo de campo evite adoptar iniciativas sustantivas sin el previo
consentimiento de la coordinacin central del proyecto, y al mismo tiempo asegure que los criterios
aplicados para la clasificacin de las respuestas estn de acuerdo con los lineamientos entregados
en la etapa de capacitacin y consignados en el manual correspondiente.
Por otra parte, es conveniente elaborar bitcoras de problemas surgidos en las diferentes
zonas donde se est llevando a cabo la encuesta y de sus respectivas soluciones, a fin de dar a
conocer al personal especielmente al que est en campo- las decisiones adoptadas ante cada
situacin. Asimismo, y valindose de las facilidades que ofrecen los medios de comunicacin
42
N 1
modernos, como el correo electrnico, las oficinas regionales debieran estar permanentemente
informadas sobre los criterios asumidos por la coordinacin del proyecto, respecto a las dudas
surgidas durante el trabajo de campo en las distintas zonas geogrficas en donde se realiza la
investigacin.
estimacin, con el agravante que, como se ha dicho, es muy difcil evaluar su efecto en la calidad
de los resultados17.
18
44
Se debe insistir en la necesidad de efectuar peridicamente evaluaciones del trabajo de los encuestadores con el fin de conocer su
rendimiento y confiabilidad. Por ejemplo, es aconsejable definir indicadores de eficiencia en el llenado de las secciones del
cuestionario, en los tiempos definidos para tal fin, as como mediciones de su eficacia a partir de los reportes elaborados por los
supervisores en las viviendas que se decida volver a visistar como parte del programa regular de supervisin en terreno.
Recordemos que el sesgo de un estimador se define como la diferencia entre el valor generado del estimador y su valor esperado ( E()).
N 1
disminuirlos de manera significativa. En caso que existan errores en los datos, tales procedimientos
automatizados tendern ms bien a estandarizarlos pero no a eliminarlos. De modo que el propsito
de reducir el tiempo empleado en el procesamiento de la informacin no debe llevar a descuidar el
resto de la etapas. As, no sirve de mucho obtener resultados rpidos si los tamaos de muestra
utilizados no son apropiados para cumplir con los objetivos planteados y no se conocen los errores
de muestreo asociados a las estimaciones, ni la consistencia de la informacin con otras fuentes de
datos disponibles. Ms an, la pronta disponibilidad de resultados no elimina de por s las malas
prcticas en el uso de la informacin en el caso en que las investigaciones que se efecten apliquen,
por ejemplo, mtodos de anlisis que no consideren como es debido la estructura del diseo de la
muestra.
En la prctica, la mayora de las oficinas de estadstica de la regin asignan importantes
recursos a las tareas de supervisin y crtica-codificacin. Muchas de ellas incluso han diseado
sistemas de captura y consistencia de la informacin que les permiten depurar las bases de datos en
tiempo real, a medida que los datos se ingresan, con lo cual han reducido de manera apreciable el
tiempo que transcurre entre la realizacin del trabajo de campo y la entrega de resultados. Sin
embargo, corresponde insistir en que debe prestarse una mayor atencin a la congruencia interna de
los datos, la consistencia de la informacin generada por la encuesta con aquella otra disponible en
el sistema nacional de informacin, as como a su comparacin con los resultados de encuestas
similares realizadas en el pasado.
Esto no desestima, sino muy por el contrario refuerza, los intentos por entregar resultados
oportunos pero a la vez con mayor confiabilidad. El xito de una investigacin por muestreo no se
basa en disponer de computadores en el terreno, si acaso se olvida que los errores de los datos se
generan de hecho en diferentes instancias, y que un proceso automatizado no es suficiente por s
slo para eliminar los sesgos. De cualquier manera, se debe seguir propugnando que se reduzcan
los plazos para la entrega de resultados, ya que en ocasiones la informacin es conocida varios aos
despus de concluido el trabajo de campo, con lo que sta se incorpora al acervo histrico del pas
pero sin representar una contribucin efectiva al estudio de la coyuntura y, por ende, a la toma de
decisiones.
Por ltimo, es preciso sealar que la fase de supervisin y reentrevista a los hogares no debe
entenderse como una tarea que signifique volver a estudiar toda la muestra o seguir a los
entrevistadores por toda su rea de trabajo. Para cubrir satisfactoriamente esta etapa, basta con el
uso del muestreo de lotes, lo cual permite llevar un registro y evaluar el trabajo efectuado por los
entrevistadores, generar una calificacin de su desempeo en el terreno y controlar la calidad de la
informacin. De hecho, esta prctica se sugiere para las encuestas de panel donde los hogares son
visitados en ms de una ocasin. Adems, es recomendable rotar a los entrevistadores a fin de
minimizar las posibilidades de repeticin de informacin en forma deliberada o el autollenado de
cuestionarios. Esta prctica es frecuente, sobretodo cuando los entrevistadores visitan las mismas
viviendas durante diversas rondas de una misma encuesta (por ejemplo, en las encuestas continuas
de hogares que investigan el tema del empleo).
4.
Tratamiento de la informacin
4.1 Crtica y codificacin
En esta etapa se definen los cdigos vlidos para cada categora de respuesta y sus
correspondientes rangos, las subpoblaciones de inters para cada tema y las relaciones permitidas
entre las variables.
45
46
N 1
A su vez, la no respuesta por rechazo del informante se puede minimizar mediante revisitas a
los hogares por parte de los supervisores, o informando previamente sobre la realizacin de la
encuesta por medio de cartas dirigidas a los jefes de los hogares donde se expongan sus objetivos y
la fecha en que sern visitados por personal de la oficina de estadstica.
A partir de experiencias previas, es posible estimar la tasa de respuesta esperada e
incrementar en la fase de diseo estadstico el tamao de muestra, a fin de lograr el nmero mnimo
de entrevistas para obtener la precisin requerida en las estimaciones. Como se indic, no se
considera recomendable realizar sustituciones de las viviendas no entrevistadas por otras que hayan
sido preseleccionadas y definidas como reemplazos. Este procedimiento introduce sesgos y altera
las probabilidades de seleccin de las observaciones. En todo caso, como una actividad posterior a
la conclusin del trabajo de campo y antes de ajustar los factores de expansin, se sugiere efectuar
un anlisis de la no respuesta total, por causas, por entrevistador, por grupos de hogares y por zonas
geogrficas, a fin de evaluar posibles errores de omisin o subespecificacin. Mediante este
procedimiento se pueden identificar posibles sesgos u omisiones, determinar la calidad del marco y
evaluar la eficiencia de la labor realizada por los enumeradores. La concentracin de la no
respuesta en alguna zona o grupo social especfico puede distorsionar la calidad de la informacin,
y en ocasiones incluso invalidar los resultados de la investigacin.
Cuando el nmero de entrevistas no logradas es poco significativo o se encuentra dentro del
rango estimado en el clculo del tamao ptimo de muestra, la eliminacin de stas observaciones
no afecta la precisin estadstica de los datos. Sin embargo, ser necesario ajustar los factores de
expansin con el objeto que los resultados generados por medio de la muestra se aproximen a los
valores verdaderos del universo de estudio (post-estratificacin). Dependiendo de la magnitud y
distribucin de la no respuesta, los factores de expansin originales tendern a modificarse, por lo
que es casi un hecho que los diseos autoponderados perdern esa caracterstica al finalizar la etapa
del trabajo de campo. As, un buen registro y control de la falta de respuesta es un requisito para
garantizar la confiabilidad de los datos reportados.
Por otra parte, es tambin necesario prestar atencin a la no respuesta parcial, la cual ocurre
cuando algunas preguntas o secciones del cuestionario no son respondidas por el hogar o alguno de
sus miembros. Cuando la frecuencia de ocurrencia es baja, las observaciones que presentan esta
condicin pueden ser eliminadas sin que ello afecte la precisin de los resultados. De lo contrario,
es posible aplicar procedimientos automticos para imputar valores faltantes, lo que sin embargo no
necesariamente contribuye a mejorar la calidad de las estimaciones y puede llevar a incrementar el
error del estimador19.
En efecto, esta prctica permite reducir el nmero de preguntas sin respuesta, pero la
imputacin no siempre es el mtodo apropiado para reducir los errores de estimacin. A pesar de
que las observaciones ubicadas en una misma unidad muestral tienen una alta correlacin en
relacin con la variable de estratificacin, esto no necesariamente significa que sta se preservar
para cualquier caracterstica de la poblacin que se desee estimar.
La mayora de los mtodos estadsticos para la imputacin de datos parten del supuesto de normalidad de la variable de inters, o de
la premisa de que el esquema de muestreo que gener la muestra fue con la misma probabilidad para todas las observaciones, lo cual
no necesariamente se cumple para el caso de una encuesta compleja.
47
N 1
las etapas de la encuesta, pero sobre todo en la que se vincula en forma directa con el tratamiento
de la informacin y los procedimientos de ajuste e imputacin que se aplican para suplir los datos
faltantes.
En la medida que no se documenten las decisiones adoptadas sobre, por ejemplo, la
concentracin de la falta de respuesta total y parcial, los motivos y criterios para el ajuste de los
factores de expansin, los procedimientos utilizados para la correccin de los ingresos y la
imputacin de la condicin de actividad de la poblacin ocupada, los usuarios de la informacin
carecern de elementos para determinar si sus anlisis y las hiptesis en las que se basan los
modelos de comportamiento se cumplen en funcin de la naturaleza de los datos.
Adicionalmente, se debe enfatizar la conveniencia de proveer a los usuarios de todos los
elementos necesarios para que juzguen la calidad de la informacin y evalen la posibilidad de
utilizarla para la toma de decisiones. As, se debe mejorar el contenido de la ficha tcnica que
acompaa la documentacin de la encuestas. En el mejor de los casos, los documentos que se
ponen a disposicin de los usuarios contienen un resumen muy apretado del diseo estadstico de la
encuesta y de algunos de los parmetros que se utilizaron para determinar el tamao de la muestra.
Sin embargo, son muy pocas las ocasiones en que se divulga el esquema de seleccin de la muestra
y se identifican las unidades primarias y secundarias de seleccin, la distribucin geogrfica y por
estrato social de la no respuesta, el miembro del hogar que proporcion la informacin, el nmero
de preguntas que se tuvieron que imputar, etc.
Se debe recordar que una buena manera de sensibilizar al usuario sobre los malos usos de la
informacin es indicarle con claridad las limitaciones de los datos y las restricciones impuestas por
el tamao de muestra y los objetivos de la investigacin, en aquellos casos en que la informacin
no puede desagregarse para ciertos dominios de estudio. Adems, deben proporcionrsele los
insumos informativos que le permitan estimar el error de muestreo de las variables que le interesen.
49
Serie
Hacia un sistema integrado de encuestas de hogares en los pases de Amrica Latina, Juan
Carlos Feres y Fernando Medina (LC/L.1476-P), N de venta: S.01.II.G.7, (US$ 10.00), 2001.
www
El lector interesado en nmeros anteriores de esta serie puede solicitarlos dirigiendo su correspondencia a la Unidad de
Distribucin, CEPAL, Casilla 179-D, Santiago, Chile. No todos los ttulos estn disponibles.
Los ttulos a la venta deben ser solicitados a la Unidad de Distribucin, CEPAL, Casilla 179-D, Santiago, Chile, Fax (562) 210 2069,
Nombre: ...................................................................................................................................
Actividad:.................................................................................................................................
Direccin:.................................................................................................................................
Cdigo postal, ciudad, pas: .....................................................................................................
Tel.:............................ Fax:......................................E.mail: ....................................................