Documente Academic
Documente Profesional
Documente Cultură
PORTADA
CALIDAD DE INFORMACIN
CALIDAD DE INFORMACIN
NDICE
- INTRODUCCIN
- APROXIMACIONES A LA CALIDAD - MEDICIN DE MODELOS CONCEPTUALES - MEDICIN DE MODELOS LGICOS
CALIDAD DE INFORMACIN
NDICE
- INTRODUCCIN
- APROXIMACIONES A LA CALIDAD - MEDICIN DE MODELOS CONCEPTUALES - MEDICIN DE MODELOS LGICOS
CALIDAD DE INFORMACIN
INTRODUCCIN
PROBLEMAS DE POLUCIN DE DATOS Facilidad y bajo coste para registrar datos Redundancia no controlada Grandes cantidades de datos histricos caducados
la mitad del coste total de implementar un almacn de datos (datawarehouse) puede deberse a una pobre calidad de datos
Celko (1995)
la pobre calidad de datos ha sido una de las causas de fracaso ms importantes en los proyectos de reingeniera
Gartner Group
4
CALIDAD DE INFORMACIN
INTRODUCCIN
Strong et al. (1997) Si los datos no tienen suficiente calidad, entonces, se pueden convertir en fuentes de problemas: Datos no usados
CALIDAD DE INFORMACIN
INTRODUCCIN
gestionar la informacin como un producto importante, capitalizar el conocimiento como un activo principal y, de esta manera, sobrevivir y prosperar en la economa digital
Huang et al. (1999)
Datos
Informacin
Conocimiento
CALIDAD DE INFORMACIN
INTRODUCCIN
CALIDAD DE LA INFORMACIN
CALIDAD DE LA BD
CALIDAD DE LA PRESENTACIN
CALIDAD DE INFORMACIN
INTRODUCCIN
MUNDO REAL
Valores
MODELADO CONCEPTUAL
Esquema conceptual
DISEO LOGICO
MODELO CONCEPTUAL
SGBD MODELO DE BD
Esquema interno
MODELO INTERNO
CALIDAD DE INFORMACIN
INTRODUCCIN
Escribe N:M
Identificativo (1,n) EJEMPLAR EJEMPLAR (0,n)
Nombre_t
1:1 (1,1) Tiene Tiene LIBRO LIBRO (0,n) Edita Edita (1,1) EDITORIAL EDITORIAL Nombre_e (1,n) N:M (0,n) Trata Trata Cod_libro 1:N (1,n) TEMA TEMA (0,n)
Fecha_p
BD
9
CALIDAD DE INFORMACIN
NDICE
- INTRODUCCIN
- APROXIMACIONES A LA CALIDAD - MEDICIN DE MODELOS CONCEPTUALES - MEDICIN DE MODELOS LGICOS
10
CALIDAD DE INFORMACIN
APROXIMACIONES
Autor(es) Lindland, Sindre y Solvberg (1994) Krogstie, Lind land y Sindre (1995) Pohl (1994)
Propsito Caractersticas Tipo Entender la calidad en Base lingstica. Marco de el modelado conceptual Separacin de objetivos referencia y medios Definir objetivos y dimensiones de proceso para modelado de req. Evaluar la calidad de modelos E/R Especificacin, representacin y acuerdo Factores de calidad, Estrategias y mtodos de evaluacin Diseo y evaluacin de esquemas alternativos Marco de referencia Marco de referencia Lista
Enfoque Terico
Terico
Prctico
Ro man (1985)
Definir caractersticas de calidad para esquemas E/ R Mejorar la calidad de Caractersticas de un esquema de bases de calidad de un buen datos esquema, transformaciones de esquemas Definir propiedades Propiedades asociadas para especificaciones a su utilizacin en el de requisitos proceso de diseo Construir modelos Caractersticas de un conceptuales de calidad buen esquema
Prctico
Lista
Prctico
Lista
Terico
Lista
Prctico
11
CALIDAD DE INFORMACIN
APROXIMACIONES
CALIDAD DE INFORMACIN
APROXIMACIONES
Legibilidad Autoexplicacin
Extensibilidad Normalidad
13
CALIDAD DE INFORMACIN
APROXIMACIONES
Complecin: un esquema es completo cuando representa todas las caractersticas relevantes del dominio de aplicacin: respecto a los requisitos respecto al esquema Correccin: un esquema es correcto cuando utilizan de forma apropiada los conceptos del modelo E/R. sintctica semntica Minimalidad: un esquema es minimal cuando todo aspecto de los requisitos aparece slo una vez en el esquema Expresividad: un esquema es expresivo cuando representa los requisitos de una manera natural,sin necesidad de explicaciones adicionales.
14
CALIDAD DE INFORMACIN
APROXIMACIONES
Legibilidad: Es una propiedad del diagrama que representa al esquema. Un diagrama tiene buena legibilidad cuando respeta ciertos criterios estticos que hacen al diagrama elegante.
Autoexplicacin: Un esquema es autoexplicativo cuando un gran nmero de propiedades puede representarse utilizando el propio modelo conceptual, sin otros formalismos. Extensibilidad: Un esquema es fcilmente adaptado a cambios en los requisitos cuando se descompone en partes (mdulos, vistas). Normalidad: pretende conservar los datos en una forma limpia, purificada. (Aplicacin de la teora de la normalizacin del modelo relacional).
15
CALIDAD DE INFORMACIN
APROXIMACIONES
- Muchas definiciones son vagas, complicadas e, incluso, inexistentes - La lista no es estructurada y las propiedades se solapan parcialmente
- Se mezclan propiedades de la especificacin con las propiedades del mtodo y del lenguaje - Presuponen la existencia de diseo/implementacin
CALIDAD DE INFORMACIN
APROXIMACIONES
CALIDAD SEMNTICA
DOMINIO
Nombre_a
Identificativo (1,n) EJEMPLAR EJEMPLAR (0,n) Presta Presta (0,n) SOCIO SOCIO
Nombre_t 1:1 (1,1) Tiene Tiene LIBRO LIBRO (0,n) Edita Edita Fecha_s Num_s (1,1) EDITORIAL EDITORIAL Nombre_e 1:N (1,n) (0,n) Trata Trata N:M (1,n) TEMA TEMA (0,n) Fecha_p Cod_libro (0,n) Consta Consta N:M
CALIDAD SINTCTICA
N:M
LENGUAJE
CALIDAD PRAGMTICA
CALIDAD SOCIAL
INTERPRETACIN DE LA AUDIENCIA
17
CONOCIMIENTO PARTICIPANTE
CALIDAD DE INFORMACIN
APROXIMACIONES
OBJETIVOS
Separar las propiedades directas de la especificacin de las del lenguaje y del mtodo
Separar los objetivos de calidad de los medios para alcanzarlos (viabilidad) Disponer de un fundamento matemtico Tener propiedades relacionadas directamente con la especificacin
18
CALIDAD DE INFORMACIN
APROXIMACIONES
ELEMENTOS
Audiencia: unin del conjunto de actores individuales, el conjunto de actores sociales organizacionales y el conjunto de actores tcnicos que necesitan relacionarse con el modelo
Modelo: conjunto de todas las sentencias expresadas explcita o implcitamente Lenguaje: conjunto de todas las sentencias que se pueden expresar de acuerdo al vocabulario y la gramtica de los lenguajes de modelado utilizados Dominio: conjunto de todas las sentencias seran correctas y relevantes acerca del problema Interpretacin de la audiencia: conjunto de todas las sentencias de las que la audiencia piensa que consta el modelo Conocimiento de los participantes: unin de los conjuntos de sentencias de todos los actores sociales individuales
19
CALIDAD DE INFORMACIN
APROXIMACIONES
CALIDAD
Sintctica: correccin sintctica Semntica: validez y complecin (viables) percibidas Pragmtica: comprensin (viable) Social: acuerdo (viable), conforme a 2 dimensiones: . Conocimiento vs. acuerdo en la interpretacin del modelo . Acuerdo relativo vs. acuerdo absoluto
20
CALIDAD DE INFORMACIN
APROXIMACIONES
Medios Propiedades modelo Actividades Sintaxis formal Verif. sintctica Semntica formal Verif. Consistencia Modificabilidad Insercin sentencias Borrado sentencias Entrenamiento Economa expresiva Inspeccin Esttica Visualizacin Filtrado Presentacin diag. Parafrasear Explicacin Entrenamiento Ejecutabilidad Ejecucin Animacin Simulacin Modelado conflicto Anlisis punto vista Resolucin conflicto Fusin de modelos
21
Objetivos Correccin sintctica Validez viable Complecin viable Percibida Comprensin viable
PRAGMTICA
SOCIAL
Acuerdo viable
CALIDAD DE INFORMACIN
APROXIMACIONES
STAKEHOLDER
MODELO
N:M (1,n) Nombre_a AUTOR AUTOR (0,n) Escribe Identificativo N:M Nombre_t 1:1 (1,1) Tiene Tiene LIBRO LIBRO (0,n) Edita Edita Fecha_s Num_s (1,1) EDITORIAL EDITORIAL Nombre_e 1:N (1,n) (0,n) Trata Trata N:M (1,n) TEMA TEMA (0,n) (0,n) Presta Presta (0,n) SOCIO SOCIO Fecha_p N:M Cod_libro (0,n) Consta Consta N:M Trabaja (0,n) INSTITUCION INSTITUCION Nombre_i
FACTOR DE CALIDAD
PESO
VALORACIN
ESTRATEGIA DE MEJORA
22
CALIDAD DE INFORMACIN
APROXIMACIONES
ELEMENTOS
Factor de calidad: propiedad deseable de un modelo de datos
Stakeholder: personas involucradas en la construccin o utilizacin del modelo Estrategias de mejora: Tcnicas para mejorar la calidad de los modelos de datos Mtodo de evaluacin: modo sistemtico de evaluar factores de calidad Peso: define la importancia relativa de los factores de calidad
Valores: representan la valoracin de un factor de calidad por un stakeholder
23
CALIDAD DE INFORMACIN
APROXIMACIONES
FACTORES DE CALIDAD
Moody (1998)
usuario
complecin
usuario
integridad
usuario
flexibilidad
usuario
comprens.
MODELO DE CALIDAD
correccin
simplicidad
integracin
implem.
analista
analista
admin. datos
desarrollador
24
CALIDAD DE INFORMACIN
APROXIMACIONES
Complecin: capacidad del modelo de tener toda la informacin requerida para cumplir los requisitos del usuario Integridad: grado en el que las reglas del negocio que se aplican a los datos estn definidas en el modelo de datos
Flexibilidad: facilidad con la que el modelo de datos se puede adaptar a los cambios en los requisitos
Comprensibilidad: facilidad con la que el modelo de datos puede ser entendido (perceptual y operacional)
25
CALIDAD DE INFORMACIN
APROXIMACIONES
Correccin: se refiere a si el modelo cumple las reglas de las tcnicas de modelado utilizadas
Simplicidad: significa que el modelo contiene los mnimos constructores posibles Integracin: nivel de consistencia del modelo de datos con el resto de los datos de la organizacin
Implementabilidad: facilidad con la que el modelo de datos puede ser implementado dentro de las restricciones de tiempo, presupuesto y tecnologa del proyecto
26
CALIDAD DE INFORMACIN
APROXIMACIONES
COMPREN SIMPLIC FLEXIB COMPLEC IMPLEM INTEGR COMPREN. SIMPLIC. FLEXIB. COMPLEC. IMPLEM. INTEGR.
+ + + + + +
27
CALIDAD DE INFORMACIN
APROXIMACIONES
28
CALIDAD DE INFORMACIN
APROXIMACIONES
DOMAIN
appropriate for has knowledge of
QUALITY TYPE
classifies represents
Theory Based
is achieved by
MEANS
contains
LANGUAGE
used in appropriate for interprets concerned with is assigned assigns used for
GOAL
PROPERTY
AUDIENCE
MODEL
maps to OR
maps to
ACTIVITY
is achieved by
WEIGHTING
QUALITY FACTOR
is assigned valued by
RATING
scores
EVALUATION METHOD
Practice Based
29
CALIDAD DE INFORMACIN
APROXIMACIONES
ENFOQUE ONTOLGICO
Kesh (1995)
calidad
Funcionamiento Ontologa
Usabilidad (usuario)
Usabilidad (diseador)
Mantenibilidad
Precisin
Rendimiento
30
CALIDAD DE INFORMACIN
APROXIMACIONES
USABIL. (usuario) X
USABIL. (diseador)
MANTENIB. X
EXACT
RENDIM.
X X X
X X X X X
X
X
X X
X X
31
CALIDAD DE INFORMACIN
NDICE
- INTRODUCCIN
- APROXIMACIONES A LA CALIDAD - MEDICIN DE MODELOS CONCEPTUALES - MEDICIN DE MODELOS LGICOS
32
CALIDAD DE INFORMACIN
MODELOS CONCEPTUALES
MUNDO REAL
Valores
E/R
MODELADO CONCEPTUAL
Esquema conceptual
DISEO LOGICO
MODELO CONCEPTUAL
SGBD MODELO DE BD
UML
Esquema interno
MODELO INTERNO
33
CALIDAD DE INFORMACIN
MODELOS CONCEPTUALES
-Definir slo propiedades deseables no es suficiente para evaluar la calidad, ... por lo que es necesario contar con medidas que permitan evaluar la calidad de los modelos conceptuales de datos de forma cuantitativa y objetiva, ... Moody et al. (1998)
aspectos del modelo de datos durante el proceso de desarrollo software (MacDonell et al., 1997)
34
CALIDAD DE INFORMACIN
MODELOS CONCEPTUALES
Moody (1998)
Complecin N de elementos del modelo de datos que no corresponden con requisitos de usuario N de requisitos de usuario no representados en el modelo de datos N de elementos de datos que corresponden a requisitos de usuario pero definidos de forma inexacta N de inconsistencias con el modelo de procesos
Integridad N de reglas del negocio que no se hacen cumplir por el modelo de datos N de restricciones de integridad incluidas en el modelo de datos que no corresponden a polticas del negocio
Flexibilidad N de elementos en el modelo que estn sujetos a cambios en el futuro Costes estimados de los cambios Importancia estratgica de los cambios
35
CALIDAD DE INFORMACIN
MODELOS CONCEPTUALES
Moody (1998)
Comprensibilidad Valoracin de los usuarios sobre la comprensibilidad del modelo Capacidad de los usuarios de interpretar el modelo correctamente Valoracin de los desarrolladores de aplicaciones sobre la comprensibilidad del modelo
Correccin N de violaciones de las convenciones de modelado de datos N de violaciones a las formas normales N de instancias de redundancia en el modelo Simplicidad N de entidades N de entidades e interrelaciones Suma ponderada de constructos (aNE + bNR + cNA)
36
CALIDAD DE INFORMACIN
MODELOS CONCEPTUALES
Moody (1998)
Integracin N de conflictos con el modelo de datos corporativo N de conflictos con los sistemas existentes Valoracin de los representantes de todas las reas de negocio Implementabilidad Valoracin de riesgo tcnico Valoracin de riesgo de planificacin Estimacin del coste de desarrollo N de elementos fsicos incluidos en el modelo de datos
37
CALIDAD DE INFORMACIN
MODELOS CONCEPTUALES
Kesh (1995) Calcular la puntuacin de los componentes ontolgicos individuales Combinar las puntuaciones de los componentes ontolgicos relevantes a cada comportamiento Combinar las puntuaciones de los componentes para calcular la puntuacin de la calidad
Q = w1 . s1 + w2 . s2 + w3 . s3 + w4 . s4 + w5 . s5
38
CALIDAD DE INFORMACIN
USABIL. (usuario) X X X X USABIL. (diseador) X X X X X
MODELOS CONCEPTUALES
MANTENIB. X X X X X X X EXACT RENDIM.
s1 = (o1 + o3 + o4 + o5) / 4 s2 = (o2 + o3 + o5 + o6 + o7) / 5 s3 = (o2 + o4 + o6) / 3 s4 = (o3 + o5) / 2 s5 = (o4 + o5) / 2
39
CALIDAD DE INFORMACIN
MODELOS CONCEPTUALES
o1 (adecuacin de la estructura): valorada por los usuarios en una escala de 5 puntos o2 (solidez de la estructura): valorada por un grupo de tcnicos o3 (consistencia de la estructura): o3 = M D1 donde M = Mximo de puntos posibles (5) y D1 est basado en el ratio R = (nmero de inconsitencias/nmero de implicacions), dado por 4n1, donde n1 es el nmero de interrelaciones o4 (concisin de la estructura): Si n es el nmero de entidades, el mnimo de interrelaciones ser (n-1), en cuyo caso o4 = 5. La peor situacin posible es c2n, en cuyo caso o4 = 0. En general: o4 = M ((c2n n1) / (c2n (n-1)). o5 (complecin del contenido): se deduce de un mximo M los datos que faltan segn los informes y consultas que se deben generar de la base de datos. o6 (cohesin del contenido): para cada entidad se mide el tamao de su clave primaria. Si es simple se punta el mximo. Si utiliza todos los atributos de la entidad se punta o6i = 0, donde i es el nmero de la entidad. En general o6i= M ((ne np) / (ne 1)) donde ne es el nmero de atributos de la entidad y n p el nmero de atributos que forman la clave primaria. La cohesin total es: o6 = o6i / n o7 (validez del contenido): se asigna M si todos los atributos son vlidos. En general: o7 = M (1 ni / ne) siendo ni los atributos incorrectos.
40
CALIDAD DE INFORMACIN
MODELOS CONCEPTUALES
41
CALIDAD DE INFORMACIN
MODELOS CONCEPTUALES
Gray (1991)
c n E Ei i 1
Ae E e R e Ae R e E e M A3 E 3 R 3 A3 R 3 E 3
( )
42
CALIDAD DE INFORMACIN
MODELOS CONCEPTUALES
Eick (1991)
1 3 * qu 3 * qu qu3 qu 4 qu
1 2
qu1, nmero de dependencias funcionales que se dan en U no expresadas en Si qu2, nmero de dependencias en existencia que se dan en U no expresadas en Si qu3, nmero de atributos y conexiones de subtipos en Si.
qu4, nmero de clases en Si
43
CALIDAD DE INFORMACIN
MODELOS CONCEPTUALES
ISO 9126
Efficiency Functionality
Portability
SOFTWARE QUALITY
Reliability Maintainability
Usability
44
MODELOS CONCEPTUALES
Maintainability
Understandability
Modifiability
Analysability
Stability
Testability
Compliance
Complexity
45
CALIDAD DE INFORMACIN
MODELOS CONCEPTUALES
Henderson-Sellers (1994)
COMPLEXITY
Computational
Psychological
Representational
Problem Complexity
Cognitive Complexity
46
CALIDAD DE INFORMACIN
MODELOS CONCEPTUALES
GOAL
Analyse for the purpose of with respect to their from the point of view of the in the context of ER diagrams Evaluating Maintainability Software designers Software delevopment organisations
47
CALIDAD DE INFORMACIN
MODELOS CONCEPTUALES
Number of entities (NE) Number of attributes (NA) Number of derived attributes (NDA)
Number of composite attributes (NCA) Number of multivalued attributes (NMVA) Number of relationships (NR) Number of M:N relationships (NM:NR)
CALIDAD DE INFORMACIN
MODELOS CONCEPTUALES
49
CALIDAD DE INFORMACIN
NDICE
- INTRODUCCIN
- APROXIMACIONES A LA CALIDAD - MEDICIN DE MODELOS CONCEPTUALES - MEDICIN DE MODELOS LGICOS
50
CALIDAD DE INFORMACIN
MODELOS LGICOS
aspectos del modelo de datos durante el proceso de desarrollo software (MacDonell et al., 1997) - Un enfoque ms riguroso para asegurar la calidad de las bases de datos
51
CALIDAD DE INFORMACIN
MODELOS LGICOS
MUNDO REAL
Valores
MODELADO CONCEPTUAL
Esquema conceptual
DISEO LOGICO
MODELO CONCEPTUAL
relacional
SGBD MODELO DE BD
activa obj-rel
Esquema interno
MODELO INTERNO
52
CALIDAD DE INFORMACIN
MODELOS LGICOS
53
CALIDAD DE INFORMACIN
MODELOS LGICOS
Mtricas propuestas para programas tradicionales Lneas de cdigo Nmero de sentencias de programacin SIZE1. Definida como el nmero de ;.
Li y Henry (1993)
Mtricas de la Ciencia del Software (Software Science). Halstead (1977) Puntos Funcin. Albrecht y Gaffney (1983) Complejidad ciclomtica. McCabe (1976) Fan-in y fan-out. Henry y Kafura (1981)
54
CALIDAD DE INFORMACIN
MODELOS LGICOS
CALIDAD DE INFORMACIN
MODELOS LGICOS
OBJETIVO (Goal)
Propsito: Asunto: Objeto: Punto de vista: Asegurar la mantenibilidad de las bases de datos relacionales desde el punto de vista del diseador de la base de datos
56
CALIDAD DE INFORMACIN
MODELOS LGICOS
PREGUNTAS (Question)
1. Cmo influye la complejidad de las tablas en la mantenibilidad de las bases de datos relacionales? 2. Cmo influye la complejidad entre tablas en la mantenibilidad de las bases de datos relacionales?
57
CALIDAD DE INFORMACIN
MODELOS LGICOS
CALIDAD DE INFORMACIN
MODELOS LGICOS
BASE DE DATOS
NIVEL
MTRICA
ZUSE (1998)
TABLA
RELACIONAL ESQUEMA
TAMAO COMPLEJIDAD LONGITUD NO CLASIFICABLE TAMAO COMPLEJIDAD LONGITUD NO CLASIFICABLE TAMAO NO CLASIFICABLE NO CLASIFICABLE
ENCIMA ORDINAL ENCIMA ORDINAL ORDINAL ABSOLUTA ENCIMA ORDINAL ENCIMA ORDINAL ORDINAL ABSOLUTA RATIO ABSOLUTA RATIO
59
CALIDAD DE INFORMACIN
MODELOS LGICOS
INTER ELEMENTO
NAn BASES DE DATOS ACTIVAS D
INTRA ELEMENTO
NO NS
TP
60
CALIDAD DE INFORMACIN
CALIDAD DE DATOS
- INTRODUCCIN
- APROXIMACIONES A LA CALIDAD - MEDICIN DE MODELOS CONCEPTUALES - MEDICIN DE MODELOS LGICOS
61
CALIDAD DE DATOS
requisitos de calidad
VISTA DE APLICACIN
atributos de calidad
DETERMINAR PARMETROS
VISTA DE PARMETROS
62
CALIDAD DE DATOS
ALUMNO
Mat.
CURSO
nm. nombre
fecha
nm. nombre
nota
direc tel.
precio descr.
63
CALIDAD DE DATOS
INSPECCIN
ALUMNO
Mat.
QUIN, CUNDO
CURSO
nm.
fecha
nm.
FORMATO.
CALIDAD DE DATOS
VISTA DE PARMETROS
DETERMINAR INDICADORES
VISTA DE CALIDAD
ESQUEMA DE CALIDAD
65
CALIDAD DE DATOS
QUIN
RESULTADO
ALUMNO
Mat.
ID. FECHA USUARIO
CURSO
nm. fecha nombre EDAD direc EDAD tel. MTODO RECOGIDA MEDIO nota
nm.
CALIDAD DE DATOS
Gene Hackman
9 <30/10/90, MEC>
...
67
CALIDAD DE DATOS
Caballero (2004)
Marco de Trabajo para la Mejora de la Gestin de la Calidad de los Datos y de la Informacin, con dos componentes: CALDEA. Modelo de referencia de gestin de calidad de datos e informacin basado en niveles de madurez. EVAMECAL. Metodologa de evaluacin y mejora del PGI basada en CALDEA.
68
CALIDAD DE DATOS
Optimizante (GPD) Anlisis Causal para la prevencin e identificacin de defectos (GIDO) Innovacin y desarrollo organizacional.
Gestionado Cuantitativamente (GPM) Gestin de Planes de medicin para los componentes del PGI. (GAPM) Gestin de la Automatizacin de los Planes de Medida
Integracin (VV) Validacin y Verificacin de los productos de datos. (GIR) Gestin del impacto de riesgos y de la pobre calidad de datos. (GE) Gestin de la estandarizacin de la calidad de datos (GPO) Gestin de polticas de calidad de datos organizacionales. Definicin (GEGCDI) Gestin de un Equipo de Calidad de Datos (GP) Gestin de un Proyecto para el Proceso de Gestin de Informacin (PyPGI) (GR) Gestin de Requisitos de Usuario. (GCI) Gestin de la Calidad de Datos en los componentes del PGI. (FS) Gestin de fuentes y destinos (sumideros) de datos (ADM) Gestin de proyecto para la adquisicin, el desarrollo o el mantenimiento de una base o almacn de datos. Inicial
69
CALIDAD DE DATOS
OBJETIVO
Organizar un equipo que se encargue de todas las iniciativas de evaluacin y mejora de los PGI. Elaborar un proyecto que permita definir todo s los aspectos de cada uno de los PGI que integran el Sistema de Informacin. Recoger y elaborar los documentos pertinentes a los requisitos de usuario para cada uno de los PGI y las caractersticas de calidad de dat os que tienen que tener cada uno de sus componentes.
(GCI) Gestin de la Calidad de Datos en los componentes del PGI y en el producto de informacin.
Definir y documentar los aspectos cuantitativos y cualitativos de calidad de datos para cada uno de los componentes de los PGI expresados en trminos de dimensiones y mtricas de calidad de datos.
Identificar y documentar las fuentes y sumideros de datos y productos de informacin, as como los formatos en que se intercambiarn los datos con ellos. Asegurar que el lugar donde se va a almacenar los datos responde a los requisitos establecidos tanto a nivel tcnico del producto comercial elegido, como al esquema diseado para albergar los datos. 70
(FS) Gestin de fuentes de datos y de los destinos (sumideros) de los productos de informacin. (ADM) Gestin de proyecto para la adquisicin, el desarrollo o el mantenimiento de una base de datos o de un almacn de datos.
CALIDAD DE DATOS
Optimizante (GPD) Anlisis Causal para la prevencin e identificacin de defectos (GIDO) Innovacin y desarrollo organizacional.
Gestionado Cuantitativamente (GPM) Gestin de Planes de medicin para los componentes del PGI. (GAPM) Gestin de la Automatizacin de los Planes de Medida
Integracin (VV) Validacin y Verificacin de los productos de datos. (GIR) Gestin del impacto de riesgos y de la pobre calidad de datos. (GE) Gestin de la estandarizacin de la calidad de datos (GPO) Gestin de polticas de calidad de datos organizacionales. Definicin (GEGCDI) Gestin de un Equipo de Calidad de Datos (GP) Gestin de un Proyecto para el Proceso de Gestin de Informacin (PyPGI) (GR) Gestin de Requisitos de Usuario. (GCI) Gestin de la Calidad de Datos en los componentes del PGI. (FS) Gestin de fuentes y destinos (sumideros) de datos (ADM) Gestin de proyecto para la adquisicin, el desarrollo o el mantenimiento de una base o almacn de datos. Inicial
71
CALIDAD DE DATOS
OBJETIVO
Elaborar un plan para la validacin y verificacin de los productos de datos desarrollados en el PGI. Delimitar, acotar y documentar todos los posibles impactos y riesgos derivados de tener una pobre calidad de datos en los componentes del PGI. Ir creando una cultura organizacional de calidad de datos a travs de las experiencias propias y/o ajenas. A partir del conocimiento de calidad de datos y de las necesidades de la organizacin con respecto a los productos de datos establecer y documentar polticas de calidad de datos que incidan sobre los componentes del PGI.
72
CALIDAD DE DATOS
Catlogo de Definicin del estndares de PGI. calidad de datos y de informacin. Catlogo de polticas organizacionales.
Lista con las caractersticas observadas en cada uno de los componentes del PGI o del producto de informacin que son modificadas por los estndares elegidos.
Lista con las caractersticas observadas en cada uno de los componentes del PGI o del producto de informacin que son modificadas por las polticas de calidad elegidas.
73
CALIDAD DE DATOS
Sesiones de Trabajo.
Inspeccin de los estndares. EGCDI. Especialistas o Consultores en estndares de calidad de datos. Todas aquellas personas que desempeen un rol relacionado con los estndares de calidad de datos y de informacin e elegidos Cuando se tenga definido el PGI. 74
CALIDAD DE DATOS
Optimizante (GPD) Anlisis Causal para la prevencin e identificacin de defectos (GIDO) Innovacin y desarrollo organizacional.
Gestionado Cuantitativamente (GPM) Gestin de Planes de medicin para los componentes del PGI. (GAPM) Gestin de la Automatizacin de los Planes de Medida
Integracin (VV) Validacin y Verificacin de los productos de datos. (GIR) Gestin del impacto de riesgos y de la pobre calidad de datos. (GE) Gestin de la estandarizacin de la calidad de datos (GPO) Gestin de polticas de calidad de datos organizacionales. Definicin (GEGCDI) Gestin de un Equipo de Calidad de Datos (GP) Gestin de un Proyecto para el Proceso de Gestin de Informacin (PyPGI) (GR) Gestin de Requisitos de Usuario. (GCI) Gestin de la Calidad de Datos en los componentes del PGI. (FS) Gestin de fuentes y destinos (sumideros) de datos (ADM) Gestin de proyecto para la adquisicin, el desarrollo o el mantenimiento de una base o almacn de datos. Inicial
75
CALIDAD DE DATOS
OBJETIVO
ACP
Elaborar planes para la medicin de los aspectos de calidad de datos definidos en la actividad (GCD) Gestin de la Calidad de Datos en los componentes del PGI del nivel de Definicin, as como los formatos de presentacin de resultados. Establecer los mecanismos necesarios para automatizar los procesos de medicin.
(GAPM). Gestin de la Auto matizacin de Planes de Medidas para Componentes del PGI.
76
CALIDAD DE DATOS
Optimizante (GPD) Anlisis Causal para la prevencin e identificacin de defectos (GIDO) Innovacin y desarrollo organizacional.
Gestionado Cuantitativamente (GPM) Gestin de Planes de medicin para los componentes del PGI. (GAPM) Gestin de la Automatizacin de los Planes de Medida
Integracin (VV) Validacin y Verificacin de los productos de datos. (GIR) Gestin del impacto de riesgos y de la pobre calidad de datos. (GE) Gestin de la estandarizacin de la calidad de datos (GPO) Gestin de polticas de calidad de datos organizacionales. Definicin (GEGCDI) Gestin de un Equipo de Calidad de Datos (GP) Gestin de un Proyecto para el Proceso de Gestin de Informacin (PyPGI) (GR) Gestin de Requisitos de Usuario. (GCI) Gestin de la Calidad de Datos en los componentes del PGI. (FS) Gestin de fuentes y destinos (sumideros) de datos (ADM) Gestin de proyecto para la adquisicin, el desarrollo o el mantenimiento de una base o almacn de datos. Inicial
77
CALIDAD DE DATOS
ACP
OBJETIVO
(GPD) Anlisis causal para la prevencin e identificacin de defectos. (GIDO) Innovacin y desarrollo organizacional.
A partir de los indicadores de calidad obtenidos en la actividad (GPM) Gestin de Planes de Medicin para componentes del PGI se trata de identificar las causas de los defectos. Esta actividad tiene como objetivo elaborar propuestas de mejora para el PI o los componentes del PGI.
78
CALIDAD DE DATOS
EVAMECAL
Metodologa de evaluacin y mejora basada en el modelo de referencia CALDEA y orientada a la mejora continua de los PGI Al estilo de SCAMPI, ISO/IEC 15504
79
CALIDAD DE DATOS
Situacin Actual
PGI
del PGI
PLAN
DO
PM -PGI
CHECK
ACT
ECM -A.2. E STANDARI ZAR EL CONOCIMIENTO OBTENIDO
80
CALIDAD DE INFORMACIN
NDICE
- INTRODUCCIN
- APROXIMACIONES A LA CALIDAD - MEDICIN DE MODELOS CONCEPTUALES - MEDICIN DE MODELOS LGICOS
81
CALIDAD DE INFORMACIN
ASPECTOS DE GESTIN
Mltiples fuentes de la misma informacin producen diferentes valores La informacin se produce utilizando juicios subjetivos, producindose sesgos Errores sistemticos en la produccin de la informacin produce prdida de informacin Grandes volmenes de informacin almacenada hace difcil el acceso en tiempo razonable Sistemas distribuidos heterogneos producen definiciones, formatos y valores inconsistentes La informacin no numrica es difcil de indexar No se dispone todava de anlisis automtico a lo largo de colecciones de datos Al cambiar las tareas de los consumidores de informacin y el entorno organizacional, la informacin que es relevante y til tambin cambia La facilidad de acceso a la informacin puede entrar en conflicto con los requisitos de seguridad, privacidad y confidencialidad La falta de suficientes recursos de computacin limita el acceso
82
CALIDAD DE INFORMACIN
ASPECTOS DE GESTIN
POLTICA DE CALIDAD
Redman (1996)
Todos los empleados de la empresa tienen que asumir que los datos y la informacin as como los procesos de negocio que los crean, almacenan, procesan y utilizan son propiedad de la empresa y que su comparticin dentro de la empresa, as como con terceros deber estar sometida a consideraciones legales o de privacidad. El director de informtica (CIO) ser el responsable de mantener un inventario actualizado de datos, de su disponiblidad, as como de informar sobre la calidad de los mismos. Los suministradores y creadores de datos deben comprender quin usa los datos y con qu propsitos, implementar las medidas de calidad de datos para asegurar que se satisfacen los requisitos de los usuarios e implementar la gestin del proceso para los datos que crean.
83
CALIDAD DE INFORMACIN
ASPECTOS DE GESTIN
POLTICA DE CALIDAD
Redman (1996)
Los que almacenan y procesan datos deben proporcionar arquitecturas y bases de datos que minimicen la redundancia innecesaria, salvaguardar los datos de daos o accesos no autorizados y disear las nuevas tecnologas con el fin de promover la calidad de los datos. Los usuarios deben trabajar con los suministradores de datos, proporcionar retroalimentacin, asegurar que los datos se intepretan correctamente, asegurar que los datos se utilizan slo para propsitos empresariales legtimos, proteger los derechos de los clientes, empleados, etc. sobre privacidad.
84
CALIDAD DE INFORMACIN
ASPECTOS DE GESTIN
1) Identificar un grupo de informacin que tenga un impacto significativo con el fin de aportar un mayor valor aadido. 2) Establecer objetivos y medidas de la calidad de la informacin, por ejemplo: asegurar la oportunidad de la informacin, midiendo el tiempo que pasa desde que se conoce un dato hasta que se encuentra disponible para un determinado proceso. 3) Identificar la cadena de valor y de costes de la informacin, que consiste en una cadena de valor de negocio extendida y centrada en un grupo de datos. Esta cadena comprender todos los ficheros, documentos y bases de datos, procesos de negocio, programas y roles que tengan relacin con el grupo de datos. 4) Determinar los ficheros o procesos a evaluar. 5) Identificar las fuentes de validacin de datos para evaluar la precisin. 6) Extraer muestras de datos aleatorias, aplicando las tcnicas estadsticas adecuadas 7) Medir la calidad de la informacin, con el fin de determinar su nivel de fiabilidad y descubrir los defectos. 8) Interpretar e informar sobre la calidad de la informacin.
85
CALIDAD DE INFORMACIN
ASPECTOS DE GESTIN
Son todava vlidas las percepciones de nuestras necesidades de calidad de informacin que tenamos ayer? Cmo se traducen las necesidades de calidad en requisitos tecnolgicos?
86
CALIDAD DE INFORMACIN
ASPECTOS DE GESTIN
empresa
CALIDAD DE INFORMACIN
ASPECTOS DE GESTIN
88