Documente Academic
Documente Profesional
Documente Cultură
Básico-Intermedio
REDATAM R+
5.Rev7
PRESENTACIÓN DE REDATAM R+
Por una parte, permite procesar información contenida en bases de datos comprimidas (creadas
para REDATAM) y muy extensas, como las provenientes de censos de población completos que
contienen datos sobre millones de personas, viviendas y hogares. Esto hace que normalmente una
base de datos REDATAM R+ contenga microdatos, es decir datos o variables referidas a individuos,
viviendas, hogares u otros elemento de información que permiten generar diversas tabulaciones
para cualquier área geográfica definida por el usuario. Estos datos, organizados jerárquicamente
para permitir un rápido acceso, son procesados en busca de resultados específicos para
determinadas áreas de interés geográfico. Pudiendo derivar nuevas variables y procesar
rápidamente tabulaciones y otros resultados estadísticos mediante ventanas gráficas y sin mayor
asistencia de un programador.
Sin embargo, es común que la información existente sea de carácter multisectorial y provenga de
fuentes distintas a las de los censos, como encuestas o bases de datos administrativas o
estadísticas. Al respecto, REDATAM R+ posee la capacidad de procesar su propia base de datos en
conjunto con bases de datos externas cuyo formato corresponda al universalmente conocido
como dBase, evitando así la necesidad de incluir bases de datos pequeñas y algunas veces
alteradas a la propia de REDATAM R+. Una característica esencial del programa, es su conexión
con Sistemas de Información Geográfica (SIG), permitiendo que el usuario despliegue y conduzca
análisis espaciales de las estadísticas agregadas que puedan producirse con él, y a cualquier nivel
de desagregación y área de interés que permita la base de datos que se esté utilizando.
Principales Características
Todos los procesos que se realicen en REDATAM R+ necesitan que el usuario defina en primer
lugar el área geográfica de interés para la cual se producirán las tabulaciones y otros resultados, lo
que es conocido como el conjunto o área de selección del usuario.
La estructura geográfica de la base de datos, cuyos distintos niveles se pueden expandir o abrir
hasta el nivel más bajo permitido (en el caso del censo de Chile esto corresponde al nivel de
sector). Se marcan las áreas de interés y finalmente se guarda la selección realizada con un
nombre apropiado para su posterior utilización.
Hecha la selección (esta vez en forma interna por el programa) se puede, igual que en el caso
anterior, guardar el resultado con un nombre apropiado y usarlo en procesos posteriores.
Desde 1835, y con intervalos de tiempo que abarcan aproximadamente los diez años, se han
levantado un total de dieciséis censos de población en nuestro país, a los que, desde 1952 en
adelante, se agregaron los censos de vivienda. Su objetivo general es el de proporcionar los
insumos necesarios para obtener las estadísticas que dan cuenta la magnitud, composición,
distribución y características básicas de los habitantes del país en un momento dado del tiempo.
El método utilizado por los Censos de Población y Vivienda para obtener la información es la
localización de las viviendas, en las que se identifica a los hogares y personas que las componen.
Para cada hogar que compone la vivienda se dispone de un cuestionario censal donde el
empadronador registrará los datos de la vivienda a la que pertenece el hogar; datos del hogar en
cuestión e información para cada una de las personas que lo integran, todo esto a partir de las
respuesta entregadas por el jefe de hogar o, en su defecto, otra persona calificada para responder
a las preguntas que se le formulen.
Código geográfico
Una información de vital importancia para la creación de la base de datos numérica que se
construirá después de recolectar y validar toda la información del país y para cada una de sus
divisiones político administrativas (regiones, provincias y comunas) y las que corresponden a la
organización operativa del evento censal (distritos, áreas urbano – rural, zonas, manzanas o
entidades pobladas, y sector), es la que da cuenta de la localización en un espacio geográfico
determinado, de cada una de las viviendas que fueron objeto de la aplicación del cuestionario. De
esta manera es posible, que una vez construida la base de datos censal, se pueda recuperar la
información recogida hasta el nivel más bajo de desagregación geográfica, que en el caso de
nuestro país corresponde al sector censal, mismo que se constituye por una agrupación de
viviendas tal que permitan ser empadronadas por un encuestador el día en que se lleva a cabo el
censo. Por razones de ley y de protección del secreto estadístico que asegura la inviolabilidad de la
intimidad de las personas, la base de datos no permite la individualización de una vivienda, hogar
y personas en particular. Esta información compuesta de códigos numéricos es la que da origen al
código geográfico que, según se verá más adelante, posee una relevancia especial al momento de
trabajar con dicha base de dato
REDATAM R+ hace un uso total de las propiedades que presenta la estructura jerárquica del Censo
de Población y Vivienda, posibilitando por ejemplo determinar la distribución de la población
según sexo, de acuerdo a características de la vivienda o del hogar, de tal manera que es muy
rápido y sencillo conocer cuántos hombres y mujeres habitan en viviendas cuyo origen del agua
que usan para beber corresponda a “pozo o noria”. El aprovechamiento de esta particular
organización de los datos censales con fines de análisis estadísticos depende del conocimiento y
manejo que los usuarios tengan de las variables y categorías que forman parte de cada entidad
ubicada en la estructura jerárquica.
INICIANDO REDATAM R+
Para trabajar con REDATAM R+ es necesario abrir un diccionario de datos, en esta caso vamos
utilizar la base de datos o diccionario de datos Censo 2002 para ello se debe seleccionar el menú
“Archivo” y luego la opción “Abrir Diccionario”.
Una vez seleccionada la opción aparece la ventana de dialogo para seleccionar el diccionario.
Una vez seleccionado el diccionario se carga en la ventana principal de REDATAM R+.
Diccionario
Composición de mapas: Aquí el sistema guarda todas las indicaciones que le entrega el
usuario con el fin de utilizar la capacidad de REDATAM R+ para vincular o empalmar la
información de la base de datos con un mapa, permitiendo la obtención de mapas temáticos
que faciliten la focalización de sectores o áreas geográficas que presenten características de
interés para el investigador. La composición de mapas se guarda en un archivo con la
extensión .mxp.
SELECCIÓN DE AREAS
Selección geográfica
Existe la posibilidad de guardar las selecciones que se realicen, REDATAM R+ genera un archivo
con la extensión .sel el cual se almacena donde el usuario defina, con el fin de que puedan ser
utilizados cuando se requieran y sin necesidad de repetir el mismo proceso de selección.
Para definir una selección se debe abrir la ventana de selección mediante la opción
“Archivo>Nuevo>Selección”.
En la ventana aparece la estructura de base de datos, empezando por la rama superior.
Utilizando la opción expandir, ubicada en el menú contextual, activado con el botón derecho
del mouse abre esta rama en su segundo nivel.
Los elementos de este segundo nivel (por lo general corresponden a entidades geográficas),
son desplegados a través de su código numérico, o si corresponde, a través de su nombre.
Marque la selección haciendo doble clic con el mouse. El cuadrado al lado del nombre de la
entidad seleccionada se debe poner de color amarillo.
Repita el proceso de selección en todos aquellos elementos que desee incluir en el nuevo
conjunto de selección.
Para contraer una rama expandida junto con todos los elementos que contiene, localice el
puntero del mouse sobre la esquina del árbol que presenta un signo y haga un clic sobre
él.
Para guardar los elementos seleccionados, desde la selección, haga clic con el botón derecho
del mouse y selecciones la opción “Guardar Como…. “
Dentro de la ventana de diálogo que se despliega reemplace el “*.slw” por el nombre del
archivo elegido y presione el botón Guardar.
UNIVERSO POR DEFECTO
A través de una expresión lógica se define el universo, el cual afectara a todos las consultas
realizadas a la base de datos.
Para ello debemos seleccionar del menú “Procesador Estadístico” la opción “Universo”.
Por ejemplo para indicar que los resultados que se desean obtener es para el sexo
masculino, debe hacer lo siguiente: clic en la Categorías de Datos Censales “PERSONA”,
esta acción carga al lado derecho de las Categorías de Datos Censales “PERSONA” las
variables que componen dicha categoría.
De la lista de variables seleccionamos SEXO, al lado derecho de la lista de variables se
cargan los valores de la variable seleccionada (1-Hombre y 2-Mujer).
Para construir la expresión de Filtro Universal se debe hacer doble clic en la variable SEXO
apareciendo está en el cuadro de expresiones como PERSONA.SEXO.
Luego debe hacer clic en el botón igual de la botonera de operadores lógicos y seleccionar
con un doble clic el valor “2-Mujer” de la lista de valores.
Ya construido el filtro este debe ser guardado con el botón “Guardar la expresión” para
que tenga efecto en la consulta.
Una vez presionado el botón “Guardar la expresión”, se cierra la ventana del constructor
de Expresiones y aparece la expresión de filtro construida.
Con esta opción se define la zona geográfica que se aplicara por defecto a todas las consultas a la
base de datos.
Para ello debemos tener ya definido el área y guardado como archivo para luego
seleccionarlo de la siguiente forma, del menú “Procesador Estadístico” se debe seleccionar
la opción “Selección”
Y carga la ventana de Selección por defecto
Una vez seleccionado este debe ser guardado para que tenga efecto
Ahora puede trabajar con la base de datos y todas las consultas realizadas estarán referida a la
selección geográfica seleccionada como por defecto.
REDATAM R+ incluye unas cuantas herramientas, fáciles de usar, que proveen de una sencilla y
rápida forma para realizar tabulaciones básicas tales como ESTADISTICAS, FRECUENCIAS, CRUCES
DE VARIABLES, PROMEDIOS, MEDIANA y CONTEOS simples.
Estas herramientas se pueden utilizar sin tener la necesidad de definir, verificar y ejecutar un
programa.
Cada una de estas herramientas es en efecto una interfaz que genera automáticamente un
programa “detrás de escena”. El programa se ejecuta y retorna automáticamente los resultados.
Para cargar la herramienta apropiada ya sea para calcular estadísticas, frecuencia, cruce de
variables, promedio, mediana o un simple conteo, haga un clic en el menú de “Procesador
Estadístico” de la ventana de principal.
Demostración
Calcular las estadísticas básicas (máximo, mínimo, promedio, mediana, desviación estándar, etc.)
para la variable estado civil.
Espere que el proceso finalice y revise los resultados presentados en la ventana de salida.
Identificar como se distribuye la población de la comuna según su estado civil, edad, y sexo.
Desde la ventana del diccionario seleccione con el mouse la variable que desea procesar,
tome la variable (el nombre) y arrástrela hacia el casillero en blanco dentro de la ventana de
“Proceso Estadístico-Frecuencia” en la opción “Espec. de Tabla” (Especificación de Tabla).
Espere que el proceso finalice y revise los resultados presentados en la ventana de salida.
Además de especificar las variables a consultar, existen dos opciones más en la ventana de
“Proceso Estadístico”:
Por ultimo debe hacer clic en el botón ejecutar, para extraer los datos de la
selección geográfica indicada.
Avanzado: en esta opción se puede especificar un “Filtro Universal” y el “Quiebre
de Área”.
Filtro Universal
El Filtro Universal, es para especificar ciertas condiciones que debe
cumplir una o varias variables afectando al resultado global estadístico
final.
Demostración
Extraer el estado civil de las personas de la Región del Maule, de sexo
femenino.
Para ello debe presionar el botón “Construir la expresión del Universo” en
la sección de Filtro Universal
Por último debe hacer clic en el botón ejecutar para que entregue el
estado civil de las Personas de sexo femenino.
Quiebre de Área
El Quiebre de Área, son zonas geográficas predefinidas, para facilitar la
extracción de datos de las distintos niveles geográficos de una Región
(Región, Provincias, Comunas, Distritos, Áreas, Zona/Localidad, Manzana y
Sector). Por defecto tiene el valor “NINGUNO” esto quiere decir que se
trabajara en la Base de Datos completa.
Demostración
Extraer el estado civil de las personas de las comunas de la Región del
Maule.
Para ello debe seleccionar de la lista desplegable el nivel de área de salida
del dato estadístico a consultar.
Demostración
Tome la variable (el nombre) y arrástrela hacia el casillero en blanco dentro de la ventana de
“Proceso Estadístico-Cruce de Variables”.
Llene el (los) casillero (s) con la(s) variable(s) que desee procesar.
Ejecute el proceso estadístico haciendo un clic sobre el botón desde la barra de iconos.
Espere que el proceso finalice y revise los resultados presentados en la ventana de salida.
B) Determinar el promedio de edad de las personas, según su estado civil actual separados por
hombre y mujer.
Llene los otros casilleros con la variable que desea controlar el promedio (no puede ir una
variable sola). Por ejemplo: promedio de edad por la variable estado civil actual y cruzada por
la variable sexo, el cruce es opcional.
Ejecute el proceso estadístico haciendo un clic sobre el botón desde la barra de iconos.
Espere que el proceso finalice y revise los resultados presentados en la ventana de salida.
C) Determinar la mediana de edad de las personas, según su estado civil actual separados por
hombre y mujer.
Llene los otros casilleros con la variable que desea controlar el promedio (no puede ir una
variable sola). Por ejemplo: promedio de edad por la variable estado civil actual y cruzada por
la variable sexo, el cruce es opcional.
Ejecute el proceso estadístico haciendo un clic sobre el botón desde la barra de iconos.
Espere que el proceso finalice y revise los resultados presentados en la ventana de salida.
CONTEO
Este proceso nos entrega el conteo del elemento que se indique, los cuales pueden ser contados
desde un nivel geográfico específico.
Para realizar el conteo se debe seleccionar del menú de Procesos Estadísticos la opción
“Conteo”.
Una vez seleccionada la opción “Conteo” carga la ventana de Proceso Estadístico-Conteo.
Para obtener el conteo de un elemento primero debe elegir el “Nivel de Salida” el cual puede
ser Región, Provincias, Comunas, Distritos, Área, Zona/Localidad (ZONALOC), Manzana
(MANZANET) y Sector. Además se puede indicar que incluya los nombres del área de salida
haciendo un clic en el checklist “Incluir Nombres del Área de Salida”.
Por ejemplo vamos a seleccionar el AREA como nivel de salida, luego se debe seleccionar el
elemento a contar en lasta desplegable “Elemento a ser Contado” (Zona/Localidad
(ZONALOC), Manzana (MANZANET), Sector, Vivienda, Hogar y Persona). En este caso la
VIVIENDA, luego se debe hacer clic en el botón para obtener el resultado de la selección.
Este proceso nos entrega una lista del área seleccionada con los valores de olas variables
seleccionadas.
Para realizar la lista de área se debe seleccionar del menú de Procesos Estadísticos la opción
“Lista por Área”.
Una vez seleccionada la opción “Lista por Área” carga la ventana de Proceso Estadístico-Lista
por Área.
Para obtener la lista por área de un elemento primero debe elegir el “Nivel de Salida” el cual
puede ser Región, Provincias, Comunas, Distritos, Área, Zona/Localidad (ZONALOC), Manzana
(MANZANET) y Sector. Además se puede indicar que incluya los nombres del área de salida
haciendo un clic en el checklist “Incluir Nombres del Área de Salida”.
Por ejemplo vamos a seleccionar “PROVINCI”, luego se debe seleccionar las variables a listar.
Para ello desde la ventana del diccionario seleccione con el mouse la o las variables que desea
procesar, tome la variable (el nombre) y arrástrela hacia la vista de lista dentro de la ventana
de “Proceso Estadístico-Lista por Áreas” en la opción “Espec. de Tabla” (Especificación de
Tabla).
En este caso “ECIVIL”, luego se debe hacer clic en el botón para obtener el resultado de la
selección.
Esta lista por área además de entregarnos información en formato de tabla, sirve para relacionar
los datos censales con los mapas del CENSO y mostrar a nivel geoespacial la información.
Por ejemplo vamos a vincular la variable estado civil con el mapa de la comuna de Talca, para ello
debemos generar la lista por área de la variable mencionada para la comuna de Talca por
manzana.
Luego en la lista por área seleccionamos MANZENT el nivel de salida y arrastramos la variable
estado civil a la cuadricula.
Una vez obtenido el resultado este debe ser exportado a una planilla Excel, para ello al lado
izquierdo de la pantalla se debe hacer clic con el botón derecho del mouse sobre el nombre de
tabla que genera automáticamente el sistema en este caso “TABLE2 …”
Luego ir a “Guardar Grupo” y seleccionar “Todo”
Al hacer clic en “Todo” aparece el cuadro de dialogo para guardar la tabla en formato Excel
Después de haber guardado los datos en Excel se debe abrir para realizar una corrección de
formato, se deben eliminar algunas filas y columnas; y eliminar un cero que se antepone del
código de manaza.
Una vez corregido el formato y guardado el documento, con el ArcGIS 9 (en este caso) u otro
software GIS se debe abrir el mapa de la comuna de Talca del CENSO 2002, agregar capas de
Manzanas y de direcciones (Annotiaton).
Se debe seleccionar de la lista de capas la capa de Manzanas con el botón derecho del mouse,
aparece un menú contextual y se debe seleccionar “Open Attribute Table”
Y se cargara la tabla de atributos el cual contiene la información geoespacial del mapa
En opciones “Options” se debe seleccionar del submenú “Joins and Relates” la opción “Join…”
Una vez seleccionada la opción se carga la venta para relacionar los datos censales con el
mapa “Join Data”
En esta interfaz se debe seleccionar el campo del mapa con el cual se va a relacionar con la
tabla en este caso MANZENT
Luego se debe escoger la tabla con la cual se va a relacionar la información del mapa.
Al presionar Add se abre la planilla de cálculo y nos muestra el nombre de la hoja de cálculo
con información
Luego de haber seleccionado el origen de los datos, se debe seleccionar el campo por el cual
se va relacionar los datos de la tabla con los datos del mapa
Una vez realizado lo anterior se presiona OK y en forma inmediata muestra los datos de la
tabla relacionados con el mapa
Cada ventana (Frecuencias, Cruces, etc.) es de hecho una forma visual para crear un programa en
lenguaje REDATAM+SP. El mismo resultado puede obtenerse a través de un programa escrito.
Cuando se crea un programa directamente lo que hace es definir el alcance de los resultados que
espera obtener (por medio del área de selección) y fija los requerimientos que deberá tener su
tabla de salida (variables y parámetros) , para luego verificar la sintaxis (escritura) de su programa
y, finalmente, ejecutar y obtener los resultados que desea revisar
RUNDEF: Define el ambiente dentro del cual ocurrirá el proceso, que incluye la selección
geográfica que se ocupará.
Cada una de estos comandos básicos posee un conjunto de instrucciones. Por ejemplo, al derivar
una nueva variable con el comando DEFINE requiere determinar las características que ésta
tendrá, así como la información que indica su procedencia. Para estos efectos el sistema le provee
de las cláusulas AS, TYPE, RANGE, VARLABEL, VALUELABEL; además puede determinar que los
valores de la nueva variable provengan de la recodificación de una variable preexistente en la base
de datos haciendo uso de la cláusula RECODE, o de la cuantificación de elementos de
pertenecientes a una entidad, en cuyo caso usted hará uso de la cláusula COUNT, etc.
Además, se puede verificar cada grupo de comandos (RUNDEF, DEFINE o TABLE) utilizando los
asistente locales para cada cláusula.
Ejercicio:
4. Compile el programa para estar seguro que no existen errores. Corrija si es necesario.
5. Ejecute el programa
Sintaxis:
TABLE tabla1
AS FREQUENCY
OF <lista de variables>
OPTIONS <lista de opciones>
TABLE tabla2
AS CROSSTABS
OF <lista de variables> BY <lista de variables> BY <lista de variables>
[ BY <lista de variables> ] ]
OPTIONS <lista de opciones>
TABLE tabla3
AS AVERAGE
OF <variable list> BY <lista de variables> [ BY <lista de variables> [BY <lista de variables> ]
]
OPTIONS <lista de opciones>
Notas:
3. El FREQUENCY permite listar varias variables al mismo tiempo. Se genera una tabla por cada
variable.
Demostración:
RUNDEF ejemplo1
SELECTION ALL
TABLE tabla1
AS FREQUENCY
OF PERSONA.GIRO,PERSONA.SEXO
TABLE tabla2
AS CROSSTABS
OF VIVIENDA.TIPOVIV BY PERSONA.TIPOER
Tabla 11
Tabla 12
Tabla 2
REDATAM+SP COMO UNA HERRAMIENTA DE PROCESAMIENTO ESTADÍSTICO
La cláusula FOR es una expresión lógica de tipo BOLEANO, cuyo resultado se evalúa como
VERDADERO o FALSO (0 ó 1). REDATAM+SP evalúa el resultado de la expresión para cada caso al
que hace referencia y lo incluirá en la tabla de salida sólo si dicha condición es cumplida o resulta
ser verdadera.
= igual
> mayor que
< menor que
<> distinto de
>= mayor o igual que
<= menor o igual que
NOT, AND, OR operadores de relación
Sintaxis:
TABLE t1
AS FREQUENCY
OF <lista de variables>
OPTIONS <lista de opciones>
FOR <expresión lógica>
TABLE t2
AS CROSSTABS
OF < lista de variables > BY < lista de variables > [ BY < lista de variables > [ BY < lista de variables
>]]
OPTIONS < lista de opciones >
FOR < expresión lógica >
Ejemplo:
RUNDEF Media
SELECTION ALL
TABLE t1
AS AVERAGE
OF PERSON.EDAD BY PERSON.SEXO
FOR PERSON.PARENT = 1
UTILIZANDO FILTROS: UNIVERSE
La cláusula UNIVERSE, puede ser usada sólo en el comando RUNDEF y su función es la de restringir
el total de casos a ser considerados. Tal restricción afecta a TODOS los comandos y salidas
incorporadas en la ejecución del programa.
Sintaxis
RUNDEF <nombre>
SELECTION <selection>
UNIVERSE <expresión lógica>
TABLE table1
AS FREQUENCY
OF <lista de variables>
TABLE table2
AS CROSSTABS
OF < lista de variables > BY < lista de variables > [ BY < lista de variables > [ BY < lista de variables >
]]
TABLE table3
AS AVERAGE
OF < lista de variables > BY < lista de variables > [ BY < lista de variables > [ BY < lista de
variables > ] ]
Notas
1. La expresión UNIVERSE sólo puede ser usada para variables que existen en la base de datos,
sea porque provienen de la boleta censal o porque han sido previamente incorporadas a la
base de datos haciendo uso del comando DEFINE. No aplica para variables creadas con DEFINE
en la misma ventana de comandos.
2. Si además del UNIVERSE usted incorpora la cláusula FOR en uno de los comandos que no sea
el RUNDEF, entonces el FOR actúa como una restricción adicional local a la establecida por el
UNIVERSE.
Ejemplo
Determine la distribución por sexo, sólo de la población que se encontraba trabajando la semana
previa al censo en la comuna.
RUNDEF CMD22
SELECTION ALL
UNIVERSE PERSON.TIPOAC< 4
TABLE t1
AS FREQUENCY
OF PERSON.SEXO
LA CLÁUSULA AREABREAK
La cláusula AREABREAK establece un punto de quiebre en la salida de los resultados para cada
nivel geográfico incluido en la selección. Si la selección comprende toda la provincia, usted puede
hacer que se desplieguen resultados para cada zona censal y un resultado final para toda la
provincia.
Ejemplo
RUNDEF ejemplo
SELECTION ALL
TABLE t1
AS CROSSTABS OF PERSON.PARENT BY PERSON.SEXO
AREABREAK DISTRITO
TABLE t2
AS FREQUENCY OF PERSON.SEXO
AREABREAK MANZAN
TABLE t3
AS AVERAGE OF PERSON.EDAD BY PERSON.ECIVIL BY PERSON.PARENT
AREABREAK DISTRITO
T1
T2
T3
MANEJO DE LOS RESULTADOS
En dicho módulo tiene la opción de exportar los resultados a formato Excel. Para hacer uso de esta
opción se debe seleccionar la alternativa SAVE WORKBOOK desde el menú que ser despliega con
el botón derecho del mouse.
Ejercicio:
Realizar un cruce de edad por sexo y pedir la pirámide etárea (Elegir la opción gráfico bajo el menú
y luego elegir la Pirámide Etárea)
RUNDEF Job
SELECTION ALL