Documente Academic
Documente Profesional
Documente Cultură
DATOS APLICADO A LA
VINCULACION DE LA INFORMACION
CATASTRAL Y REGISTRAL
Septiembre de 2012
Presentacin
Las organizaciones, ya sean pblicas o privadas, se preocupan cada vez de de la calidad de los
datos de los que disponen, pues saben que de datos con niveles adecuados de calidad se puede
obtener informacin til para los procesos de negocio.
Una situacin en la que las organizaciones utilizan datos con niveles inadecuados de calidad, lleva
a un desperdicio de recursos, as como a otros perjuicios significativos en el cumplimiento de la
legislacin vigente.
Un elemento fundamental que afecta a este proceso de vinculacin es la diversidad de las fuentes
de informacin (registral y catastral), por lo cual es necesaria la aplicacin de un proceso de
calidad de datos a cada una de las fuentes.
Lo que a la vez nos permitir dar cumplimiento a lo establecido en la Ley Orgnica del instituto
Nacional de Estadstica y Geografa, la cual establece es su Artculo 27.- Son atribuciones
especficas de la Direccin General Adjunta de Informacin Catastral y Registral, las siguientes:
IV. Coordinar y concertar con las Unidades del Estado, acciones de organizacin, modernizacin y
vinculacin de los catastros y registros pblicos de la propiedad para la generacin, higiene,
estandarizacin, cruce e integracin de informacin catastral y registral de los bienes inmuebles,
en bases de datos compartidas bajo el principio de confidencialidad y seguridad informtica;
El presente documento describe la aplicacin del proceso de calidad de datos a la vinculacin de la
informacin catastral y registral.
Contenido
Contenido ............................................................................................................................................ 3
Introduccin a la Calidad de Datos ..................................................................................................... 4
Proceso de Vinculacin de la Informacin Catastral y Registral ......................................................... 5
Frecuencia
NNNN-NN-NN
NN-NN-NNNN
NN/NN/NN
346,289
234
65
Frecuencia
85,245
12,221
115
1,850
1
Expansin de abreviaturas.
Estas acciones de transformacin sern regidas por una serie de reglas de higienizacin,
las cuales sern definidas dentro de esta fase. Las reglas de higienizacin especifican los
nuevos estndares de datos para la limpieza y transformacin.
Algunos ejemplos de los datos resultantes de esta etapa as como de las reglas de
higienizacin se muestran a continuacin:
Dato Original
Dato Higienizado
Regla
Descripcin
Transformar a maysculas.
10
11
12
13
C. Estandarizacin y Estructuracin.
La estandarizacin de datos se refiere a todas las operaciones necesarias para estructurar
informacin semi-estructurada, es decir, distribuir, estructurar y ubicar a cada elemento
de datos en su campo correspondiente para poder ser identificado y categorizado de
acuerdo a su contenido.
Las acciones realizadas en esta etapa se basan en la definicin de un conjunto de reglas de
estandarizacin como se ejemplifica a continuacin:
Campo
Palabras a Sustituir
Sustitucin
Nombre
TEQUESQUITENGO S A TEQUESQUITENGO SA
Nombre
TQUESQUITENGO S A
TEQUESQUITENGO SA
Nombre
TEQUESQUTENGO S A
TEQUESQUITENGO SA
Domicilio
CALLE SN
Domicilio
C SN
Domicilio
C S NOMBRE
Domicilio
SN
S/N
Domicilio
SN
S/N
Domicilio
SN
S/N
Superficie
NNNNNNNN
NNNNNNNN.00
Superficie
NNNNNN.N
NNNNNN.N0
Superficie
NNNNNNN
NNNNNNN.00
Superficie
NNNNN.N
NNNNN.N0
UnidadSup
Domclio
M2
A LOPEZ MATEO
Dato Estandarizado
Nombre(s)
JUAN ARTURO DAZ DE LEN
CASTA#EDA
Paterno
DAZ DE LEN
Materno
CASTAEDA
Nombre(s)
JUAN ARTURO
Dato Domicilio
Dato Original
Domicilio
Plaza Cristal 2do nivel 204, Avenida Lpez Mateos 1501, manzana 24 lote 1 Colonia Hroes
20230
Dato Estandarizado
Tipo de
va
pblica
Avenida
Nombre
de calle
Nmero
exterior
Manzana
Lote
Edificio
Nivel
Nmero
interior
Lpez
Mateos
1501
24
Plaza
Cristal
204
Colonia
Tipo
Nombre
Colonia
Hroes
Cdigo
postal
20230
10
D. Vinculacin.
El subproceso de Vinculacin se refiere a la utilizacin de diferentes algoritmos y
ponderaciones para identificar y relacionar cada registro que pertenece a la fuente
catastral con otro registro que pertenece a la fuente registral siendo el objetivo principal
de este proyecto.
Para este ejercicio de vinculacin se debern considerar los campos que nos proporcionen
un mayor grado de certeza en la identificacin de estos registros, como pudiera ser clave
catastral, nombre, domicilio.
La construccin de diferentes escenarios con combinaciones de campos nos podr dar aun
un mayor grado confiabilidad en el proceso de vinculacin, el nmero de escenarios y
combinaciones depender de la informacin.
Por ejemplo:
Escenario
Campos Involucrados
Clave catastral
Clave catastral, Nombre
Clave catastral, Nombre, Direccin
Nombre, Domicilio, Superficie
2
3
4
E. Validacin.
Este es el subproceso que permitir medir la calidad de los resultados y determinar el
porcentaje de error del proceso, ello permitir aceptar o rechazar el trabajo realizado
durante los diferentes procesos (anlisis, higiene, estandarizacin, vinculacion) y en lo
general aceptar o rechazar el trabajo de vinculacin. Este proceso se realizar mediante la
verificacin puntual de una muestra de registros vinculados.
Para la validacin se deben definir algunos elementos como son:
Criterios para seleccionar la muestra
-
Reglas de validacin
Patrones aplicados en las reglas de validacin
Procedimiento empleado para la verificacin
11