Sunteți pe pagina 1din 10

SADIO 1981 IDENTIFICACION DE LA POBLACION Lic.

Espedito Passarello

IDENTIFICACION DE PERSONAS CODIGO AUTOGENERADO

SADIO 1981 IDENTIFICACION DE LA POBLACION Lic. Espedito Passarello

RESUMEN DEL TRABAJO El presente estudio trata sobre el relevamiento, anlisis, diseo y simulacin de un modelo que permita la identificacin nica de las personas. Sobre la base de la tcnica conocida como autogenerada, basada en datos fijos del individuo a lo largo de su vida. Se procede a realizar una simulacin del modelo utilizando una base de informacin de un milln de registros, o sea personas. Se explicitan los resultados de este estudio, los que nos enuncian la necesidad de seguir realizando investigaciones a fin de cumplimentar el objetivo general de identificacin nica.

Introduccin En este estudio se realiza una experiencia prctica, sobre las reales posibilidades de implantacin de un sistema de codificacin autogenerada.

Cdigo autogenerado Entendemos por cdigo autogenerado aquel, compuesto de caracteres ya sean alfabticos o numricos, basados en datos fijos e invariables.

Objetivos El objetivo de este identificador basado en datos naturales de la persona, es que sea de utilidad para los organismos gubernamentales. Una persona al nacer, estara munido del mencionado cdigo para toda su documentacin: - Documento de identidad - Nmero de contribuyente - Caja de jubilacin - Carnet de conductor - Etc. Sin necesidad de recurrir a distintos entes para su obtencin, siendo de fcil memorizacin al estar basado el cdigo en datos propios del individuo. El nmero autogenerado como nmero nico El objetivo final de todo cdigo propuesto como ptimo es que, se aplique lo ms universalmente posible. En nuestro caso el objetivo final es que sea el nmero nico de identificacin de las personas. Ello implicara que, para toda la documentacin de una persona a lo largo de su vida

SADIO 1981 IDENTIFICACION DE LA POBLACION Lic. Espedito Passarello

se requerir un solo nmero. Tal el caso para cdula de identidad, libreta de enrolamiento, licencia de conductor, nmero de jubilacin, etc. Un solo nmero y que sea autogenerado implica mltiples beneficios tanto para la persona como para el ente encargado de proporcionarlo. El ciudadano vera as simplificado el conocimiento del nmero de toda su documentacin, a lo largo de su vida. Anlogamente las tramitaciones para sus diferentes empadronamientos requerirn procedimientos administrativos sencillos y con mnimos tiempos de respuesta. Los entes empadronadores podran as contar con bases de informacin de personas depurados y controlados. Podra solo as realizarse la transmisin e intercambio de datos y sistemas entre organismos gubernamentales. Ello adems potencializara el concepto de sistemas como servicio, ya que, los procesos de actualizaciones de los datos del ciudadano se podran centralizarse, y de all automticamente actualizar otras bases interrelacionadas. Los sistemas de explotacin que podran montarse a partir de esta base de informacin, serian de primordial importancia para la optima gestin de un Estado. Se trata en definitiva de unificar e interconectar los mltiples sistemas montados sobre la misma base: Las personas. Modelo Operacional Sobre la base de la siguiente estructura es realizar el diseo y desarrollo del sistema: a) Dgitos primarios a.1) Nombre de la persona Se seleccion de este dato solo dos letras, la primera y la tercera. Constituyendo estos los dos primeros dgitos del cdigo. Se tom en cuenta el primer nombre de la persona. a.2) Apellido de la persona Anlogamente el caso del nombre se tom la primera y tercera letra. Constituyendo estos los dgitos terceros y cuarto del cdigo. Se tom el apellido paterno, en el caso de ser compuesto el primero de ellos. a.3) Fecha de nacimiento En la estructura se propone seis dgitos: * dos para da de nacimiento * dos para mes * dos para ao
3

SADIO 1981 IDENTIFICACION DE LA POBLACION Lic. Espedito Passarello

Constituyen estos los dgitos quintos al dcimo inclusive.

a.4.) Sexto Le corresponde un dgito: * cero para mujeres * uno para varones Constituyen este el undcimo dgito del cdigo.

b) Dgitos secundarios b.1) Cdigo de distingo En la estructura se prev para el caso de tener dos personas distintas, el mismo nmero autogenerado. En estos casos se numera en forma secuencial los iguales, no en forma anticipada sino cuando ellos se presenten. b.2.) Dgitos de control Se utiliz la tcnica conocida como mdulo once, con las consiguientes consideraciones. Se presentan dos posibilidades para los nmeros incompatibles que se generan con ste sistema: - Dgitos de control de una posicin En este caso los nmeros incompatibles se eliminaran haciendo coincidir los casos que se presentan en el cdigo de distingo. - Dgitos de control de dos posiciones Aqu los nmeros incompatibles no existiran, ya que se tomaran directamente dos posiciones, distinguiendo claramente los casos en que el resto de la divisin sea cero o diez.

Contexto de simulacin del Sistema Para realizar la simulacin del Sistema se utiliz una base de informacin de personas representativa, no solo por el aspecto cuantitativo, un milln de individuos, sino por la variabilidad geogrfica de la generacin de los datos.

Interpretacin de los resultados obtenidos A continuacin caracterizaremos una serie de posibilidades que nos permitirn evaluar correctamente las salidas del sistema.

Sinnimos
4

SADIO 1981 IDENTIFICACION DE LA POBLACION Lic. Espedito Passarello

Estos casos son aquellos en que el cdigo es el mismo para dos personas, cuyos datos bases para la construccin del cdigo son distintos. Dobles Aqu se presentan dos ms cdigos iguales para datos bases idnticos.

Homnimos En el proceso de recuento de los casos de sinnimos y dobles, denominamos a la cantidad de repeticiones, CANTIDAD DE HOMONIMOS producidos.

Metodologa utilizada para la simulacin a) Construccin del cdigo autogenerado Este paso implica la lectura de la base de informacin, consistencia y validacin de los datos requeridos. b) Proceso de evaluacin de homnimos a nivel alfanumrico Se realiza un anlisis de los homnimos producidos y su listado detallado por los diferentes casos. c) Calculo probabilstico de los caracteres alfabticos Esto implica el anlisis de las frecuencias con que cada letra del alfabeto se presenta en cada una de las posiciones. d) Determinacin de las tablas de conversin En base a las distribuciones obtenidas del punto anterior se definen diferentes criterios (b), para reemplazar los caracteres alfabticos por numricos. e) Proceso de reemplazo de nmeros por letras Se realiza el reemplazo segn tres tipos de tablas de conversin definidas. f) Proceso de evaluacin del cdigo a nivel numrico Idem punto b).

Proceso por computador


5

SADIO 1981 IDENTIFICACION DE LA POBLACION Lic. Espedito Passarello

Se divide en dos partes, la primera se evala el cdigo a nivel alfanumrico. Obtenindose adems datos probabilisticos para la construccin de tablas de conversin de letras a nmeros. En la segunda parte, se evala el cdigo a nivel numrico. La evaluacin responde a la necesidad de conocer las repeticiones que se producen al construir el cdigo. La primera parte consta de cuatro programas, la segunda de tres programas. Codificados todos ellos en assembler/360. El volumen de registros que se procesa en todos los pasos llega a 1.000.000 estimativamente, los listados nos darn la cantidad exacta. Se evaluaran tres tablas de conversin de letras a nmeros.

Tablas de conversin de cdigo alfanumrico a numrico Para el reemplazo de las letras por nmeros, se ha seguido en forma paralela tres criterios. a) Secuencial En este caso se realizo en forma directa el reemplazo. Ej. A............1 B

al llegar a la undcima letra se comienza nuevamente con 1,2,...... b) Azar Se utiliz una rutina de generacin de nmeros al azar entre 0 y 9 y se asign directamente. c) Rangos de posibilidades Se realiz sobre base de un estudio probabilstico en lo que se refiere a la aparicin de cada letra del alfabeto discriminado por posicin. Asignando segn esa distribucin de probabilidades a un nmero determinado.

Evaluacin del nmero autogenerado a nivel alfanumrico Universo estudiado: Cantidad de homnimos: 990.716 6.753

Distribucin de los homnimos:


6

SADIO 1981 IDENTIFICACION DE LA POBLACION Lic. Espedito Passarello

4 4

5 1

6 -

6.640 113 Datos naturales e invariables:

Nombre; primer y tercer letra. Apellido, primer y tercer letra. Fecha de nacimiento: seis dgitos. Sexto: un dgito. Datos secundarios de control y verificacin: Dgito de verificacin; un dgito. Dgito de distingo: un dgito.

Tabla de conversin Tabla secuencial Letras A B,C D,E,F, G,H,I, J,K,L, M,N, ,O,P,Q R S,T U,V,W,X Y,Z,Y0 Nmeros 0 1 2 3 4 5 6 7 8 9 Probabilidad 0,0966 0,1127 0,1124 0,1017 0,1111 0,1196 0,0622 0,1250 0,0947 0,0560

Tablas al azar

Letras A B,J,Z, C,V,K, D,T,O, E,U,P,N F,S, R,


7

Nmeros 0 1 2 3 4 5 6

Probabilidad 0,966 0,0983 0,0944 0,0960 0,0940 0,0947 0,1250

SADIO 1981 IDENTIFICACION DE LA POBLACION Lic. Espedito Passarello

G,N M,H, X Y,Q,Y0 I,L,

7 8 9 0,0933

0,0958

0,1013

Tablas por rangos

Letras R A M S,L,C, N,J,G E,D,B T,P,I,F V,O U,H, Z,Y,X,Q K,,W,Y0

Nmeros rangos 0 1 2 3 4 5 6 7 8 9

Probabilidades divididas en mayor de 0,1001 de 0,0901 a 0,1 de 0,0701 a 0,08 de 0,0601 a 0,07 de 0,0401 a 0,05 de 0,0401 a 0,05 de 0,0301 a 0,04 de 0,0201 a 0,03 de 0,0101 a 0,02 de 0,0 a 0,01

Nota: Y0 se denota as al carcter blanco.

Probabilidades por letra En funcin del clculo de probabilidad por letra y por posicin, las tablas anteriormente enunciadas se basaron en;

P(A)= 0,0966 P(D)= 0,0402 P(G)= 0,0470 P(J)= 0,0434 P(M)= 0,0708 P(O)= 0,0248 P(R)= 0,1250 P(U)= 0,0171 P(X)= 0,0006 P(Y0)= 0,0001

P(B)= 0,0461 P(E)= 0,0411 P(H)= 0,0169 P(K)= 0,0042 P(N)= 0,0488 P(P)= 0,0338 P(S)= 0,0636 P(V)= 0,0336 P(Y)= 0,0031

P(C)= 0,0666 P(F)= 0,0311 P(I)= 0,0378 P(L)= 0,0635 P()= 0,0013 P(Q)= 0,0023 P(T)= 0,0311 P(W)= 0,0027 P(Z)= 0,0088

SADIO 1981 IDENTIFICACION DE LA POBLACION Lic. Espedito Passarello

Distribucin probabilstica de los caracteres alfabticos

Letras

Nombre

Apellido

Primera

Tercera

Primera

Tercera

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z Y0

0,1454 0,0201 0,0551 0,0309 0,0764 0,0457 0,0231 0,0389 0,0178 0,1608 0,0009 0,0467 0,0956 0,0268 0,0 0,0298 0,0338 0,0003 0,0762 0,0355 0,0105 0,0016 0,0209 0,0029 0,0 0,0010 0,0018 0,0

0,1127 0,0479 0,0682 0,0449 0,0299 0,0190 0,0473 0,0009 0,0714 0,0005 0,0003 0,0598 0,0451 0,0566 0,0 0,0230 0,0021 0,0032 0,1682 0,0943 0,0464 0,0343 0,0144 0,0003 0,0020 0,0034 0,0024 0,0001

0,0610 0,0906 0,1002 0,0641 0,0157 0,0518 0,0853 0,0140 0,0122 0,0075 0,0129 0,0506 0,0988 0,0156 0,0 0,0165 0,0733 0,0035 0,0644 0,0785 0,0307 0,0044 0,0345 0,0065 0,0 0,0031 0,0129 0,0

0,0673 0,0261 0,0430 0,0309 0,0425 0,0082 0,0325 0,0138 0,0501 0,0048 0,0029 0,0970 0,0438 0,0965 0,0052 0,0300 0,0261 0,0222 0,1915 0,0663 0,0368 0,0292 0,0249 0,0014 0,0005 0,0072 0,0181 0,0006

Evaluacin del nmero autogenerado a nivel numrico

SADIO 1981 IDENTIFICACION DE LA POBLACION Lic. Espedito Passarello

Evaluaciones

Tablas de conversin Secuencial Rangos Azar

Cantidad de Homnimos 12.534 19.822 12.080

Universo Estudiado 990.716 990.716 990.716

Nmeros Autogenerados Distintos 978.182 970.894 978.636

Distribucin de homnimos

1 965.949 951.922 966.848

2 11.949 18.203 11.511

3 271 700 263

4 10 58 13

5 2 10 1

6 1 1 -

10

S-ar putea să vă placă și