Sunteți pe pagina 1din 88

CALIDAD DE INFORMACIN

PORTADA

CALIDAD DE INFORMACIN

CALIDAD DE INFORMACIN

NDICE

- INTRODUCCIN
- APROXIMACIONES A LA CALIDAD - MEDICIN DE MODELOS CONCEPTUALES - MEDICIN DE MODELOS LGICOS

- CALIDAD DE DATOS - ASPECTOS DE GESTIN

CALIDAD DE INFORMACIN

NDICE

- INTRODUCCIN
- APROXIMACIONES A LA CALIDAD - MEDICIN DE MODELOS CONCEPTUALES - MEDICIN DE MODELOS LGICOS

- CALIDAD DE DATOS - ASPECTOS DE GESTIN

CALIDAD DE INFORMACIN

INTRODUCCIN

PROBLEMAS DE POLUCIN DE DATOS Facilidad y bajo coste para registrar datos Redundancia no controlada Grandes cantidades de datos histricos caducados
la mitad del coste total de implementar un almacn de datos (datawarehouse) puede deberse a una pobre calidad de datos
Celko (1995)

la pobre calidad de datos ha sido una de las causas de fracaso ms importantes en los proyectos de reingeniera
Gartner Group
4

CALIDAD DE INFORMACIN

INTRODUCCIN

Strong et al. (1997) Si los datos no tienen suficiente calidad, entonces, se pueden convertir en fuentes de problemas: Datos no usados

Barreras en la accesibilidad de los datos Dificultades en la utilizacin de los datos y de la informacin

CALIDAD DE INFORMACIN

INTRODUCCIN

Las empresas deben

gestionar la informacin como un producto importante, capitalizar el conocimiento como un activo principal y, de esta manera, sobrevivir y prosperar en la economa digital
Huang et al. (1999)

Datos

Informacin

Conocimiento

CALIDAD DE INFORMACIN

INTRODUCCIN

CALIDAD DE LA INFORMACIN

CALIDAD DE LA BD

CALIDAD DE LA PRESENTACIN

CALIDAD DEL SGBD

CALIDAD MODELO DE DATOS

CALIDAD DE LOS DATOS

CALIDAD DE INFORMACIN

INTRODUCCIN

MUNDO REAL
Valores

objetos y asociaciones con sus propiedades y reglas

MODELADO CONCEPTUAL

Estrutura percibida (no formalizada)

Esquema conceptual
DISEO LOGICO

MODELO CONCEPTUAL

Esquema de base de datos


DISEO FISICO

SGBD MODELO DE BD

Esquema interno

MODELO INTERNO

BASE DE DATOS FISICA

CALIDAD DE INFORMACIN

INTRODUCCIN

Calidad del proceso

(1,n) Nombre_a AUTOR AUTOR (0,n)

N:M Nombre_i (0,n) Trabaja INSTITUCION INSTITUCION

Calidad del producto

Escribe N:M
Identificativo (1,n) EJEMPLAR EJEMPLAR (0,n)

Nombre_t
1:1 (1,1) Tiene Tiene LIBRO LIBRO (0,n) Edita Edita (1,1) EDITORIAL EDITORIAL Nombre_e (1,n) N:M (0,n) Trata Trata Cod_libro 1:N (1,n) TEMA TEMA (0,n)

Fecha_p

(0,n) Consta Consta N:M

BD
9

Presta N:M Presta (0,n) SOCIO SOCIO Fecha_s Num_s

CALIDAD DE INFORMACIN

NDICE

- INTRODUCCIN
- APROXIMACIONES A LA CALIDAD - MEDICIN DE MODELOS CONCEPTUALES - MEDICIN DE MODELOS LGICOS

- CALIDAD DE DATOS - ASPECTOS DE GESTIN

10

CALIDAD DE INFORMACIN

APROXIMACIONES

Autor(es) Lindland, Sindre y Solvberg (1994) Krogstie, Lind land y Sindre (1995) Pohl (1994)

Propsito Caractersticas Tipo Entender la calidad en Base lingstica. Marco de el modelado conceptual Separacin de objetivos referencia y medios Definir objetivos y dimensiones de proceso para modelado de req. Evaluar la calidad de modelos E/R Especificacin, representacin y acuerdo Factores de calidad, Estrategias y mtodos de evaluacin Diseo y evaluacin de esquemas alternativos Marco de referencia Marco de referencia Lista

Enfoque Terico

Terico

Moody and Shanks (1994) Moody (1998) Simsion (1994)

Prctico

Batin i, Ceri and Navathe (1992)

Ro man (1985)

Bo man et al. (1997)

Definir caractersticas de calidad para esquemas E/ R Mejorar la calidad de Caractersticas de un esquema de bases de calidad de un buen datos esquema, transformaciones de esquemas Definir propiedades Propiedades asociadas para especificaciones a su utilizacin en el de requisitos proceso de diseo Construir modelos Caractersticas de un conceptuales de calidad buen esquema

Prctico

Lista

Prctico

Lista

Terico

Lista

Prctico

11

CALIDAD DE INFORMACIN

APROXIMACIONES

ROMAN (1985) Conveniencia Limpieza conceptual Eficiencia computacional Facilidad de construccin

Estructuracin Precisin, falta de ambigedad, complecin, consistencia Analizabilidad ...


12

CALIDAD DE INFORMACIN

APROXIMACIONES

BATINI, CERI y NAVATHE (1992) Complecin Correccin Minimalidad Expresividad

Legibilidad Autoexplicacin
Extensibilidad Normalidad
13

CALIDAD DE INFORMACIN

APROXIMACIONES

Complecin: un esquema es completo cuando representa todas las caractersticas relevantes del dominio de aplicacin: respecto a los requisitos respecto al esquema Correccin: un esquema es correcto cuando utilizan de forma apropiada los conceptos del modelo E/R. sintctica semntica Minimalidad: un esquema es minimal cuando todo aspecto de los requisitos aparece slo una vez en el esquema Expresividad: un esquema es expresivo cuando representa los requisitos de una manera natural,sin necesidad de explicaciones adicionales.
14

CALIDAD DE INFORMACIN

APROXIMACIONES

Legibilidad: Es una propiedad del diagrama que representa al esquema. Un diagrama tiene buena legibilidad cuando respeta ciertos criterios estticos que hacen al diagrama elegante.
Autoexplicacin: Un esquema es autoexplicativo cuando un gran nmero de propiedades puede representarse utilizando el propio modelo conceptual, sin otros formalismos. Extensibilidad: Un esquema es fcilmente adaptado a cambios en los requisitos cuando se descompone en partes (mdulos, vistas). Normalidad: pretende conservar los datos en una forma limpia, purificada. (Aplicacin de la teora de la normalizacin del modelo relacional).
15

CALIDAD DE INFORMACIN

APROXIMACIONES

CARACTERSTICAS DE LAS LISTAS


Lindland et al. (1994)

- Muchas definiciones son vagas, complicadas e, incluso, inexistentes - La lista no es estructurada y las propiedades se solapan parcialmente
- Se mezclan propiedades de la especificacin con las propiedades del mtodo y del lenguaje - Presuponen la existencia de diseo/implementacin

- Algunos objetivos son poco realistas, o imposibles


16

CALIDAD DE INFORMACIN

APROXIMACIONES

Lindland et al. (1994, 1995)


MODELO
N:M (1,n) (0,n) Trabaja INSTITUCION INSTITUCION Nombre_i

CALIDAD SEMNTICA
DOMINIO

Nombre_a

AUTOR AUTOR (0,n) Escribe N:M

Identificativo (1,n) EJEMPLAR EJEMPLAR (0,n) Presta Presta (0,n) SOCIO SOCIO

Nombre_t 1:1 (1,1) Tiene Tiene LIBRO LIBRO (0,n) Edita Edita Fecha_s Num_s (1,1) EDITORIAL EDITORIAL Nombre_e 1:N (1,n) (0,n) Trata Trata N:M (1,n) TEMA TEMA (0,n) Fecha_p Cod_libro (0,n) Consta Consta N:M

CALIDAD SINTCTICA

N:M

LENGUAJE

CALIDAD SEMNTICA PERCIBIDA

CALIDAD PRAGMTICA
CALIDAD SOCIAL
INTERPRETACIN DE LA AUDIENCIA
17

CONOCIMIENTO PARTICIPANTE

CALIDAD DE INFORMACIN

APROXIMACIONES

OBJETIVOS
Separar las propiedades directas de la especificacin de las del lenguaje y del mtodo
Separar los objetivos de calidad de los medios para alcanzarlos (viabilidad) Disponer de un fundamento matemtico Tener propiedades relacionadas directamente con la especificacin

18

CALIDAD DE INFORMACIN

APROXIMACIONES

ELEMENTOS
Audiencia: unin del conjunto de actores individuales, el conjunto de actores sociales organizacionales y el conjunto de actores tcnicos que necesitan relacionarse con el modelo
Modelo: conjunto de todas las sentencias expresadas explcita o implcitamente Lenguaje: conjunto de todas las sentencias que se pueden expresar de acuerdo al vocabulario y la gramtica de los lenguajes de modelado utilizados Dominio: conjunto de todas las sentencias seran correctas y relevantes acerca del problema Interpretacin de la audiencia: conjunto de todas las sentencias de las que la audiencia piensa que consta el modelo Conocimiento de los participantes: unin de los conjuntos de sentencias de todos los actores sociales individuales
19

CALIDAD DE INFORMACIN

APROXIMACIONES

CALIDAD
Sintctica: correccin sintctica Semntica: validez y complecin (viables) percibidas Pragmtica: comprensin (viable) Social: acuerdo (viable), conforme a 2 dimensiones: . Conocimiento vs. acuerdo en la interpretacin del modelo . Acuerdo relativo vs. acuerdo absoluto

20

CALIDAD DE INFORMACIN

APROXIMACIONES
Medios Propiedades modelo Actividades Sintaxis formal Verif. sintctica Semntica formal Verif. Consistencia Modificabilidad Insercin sentencias Borrado sentencias Entrenamiento Economa expresiva Inspeccin Esttica Visualizacin Filtrado Presentacin diag. Parafrasear Explicacin Entrenamiento Ejecutabilidad Ejecucin Animacin Simulacin Modelado conflicto Anlisis punto vista Resolucin conflicto Fusin de modelos
21

Tipos de calidad SINTCTICA SEMNTICA

Objetivos Correccin sintctica Validez viable Complecin viable Percibida Comprensin viable

PRAGMTICA

SOCIAL

Acuerdo viable

CALIDAD DE INFORMACIN

APROXIMACIONES

Moody y Schanks (1994, 1998)


MTODO DE EVALUACIN

STAKEHOLDER

MODELO
N:M (1,n) Nombre_a AUTOR AUTOR (0,n) Escribe Identificativo N:M Nombre_t 1:1 (1,1) Tiene Tiene LIBRO LIBRO (0,n) Edita Edita Fecha_s Num_s (1,1) EDITORIAL EDITORIAL Nombre_e 1:N (1,n) (0,n) Trata Trata N:M (1,n) TEMA TEMA (0,n) (0,n) Presta Presta (0,n) SOCIO SOCIO Fecha_p N:M Cod_libro (0,n) Consta Consta N:M Trabaja (0,n) INSTITUCION INSTITUCION Nombre_i

FACTOR DE CALIDAD

(1,n) EJEMPLAR EJEMPLAR

PESO

VALORACIN
ESTRATEGIA DE MEJORA
22

CALIDAD DE INFORMACIN

APROXIMACIONES

ELEMENTOS
Factor de calidad: propiedad deseable de un modelo de datos

Stakeholder: personas involucradas en la construccin o utilizacin del modelo Estrategias de mejora: Tcnicas para mejorar la calidad de los modelos de datos Mtodo de evaluacin: modo sistemtico de evaluar factores de calidad Peso: define la importancia relativa de los factores de calidad
Valores: representan la valoracin de un factor de calidad por un stakeholder

23

CALIDAD DE INFORMACIN

APROXIMACIONES

FACTORES DE CALIDAD
Moody (1998)

usuario
complecin

usuario
integridad

usuario
flexibilidad

usuario
comprens.

MODELO DE CALIDAD

correccin

simplicidad

integracin

implem.

analista

analista

admin. datos

desarrollador
24

CALIDAD DE INFORMACIN

APROXIMACIONES

Complecin: capacidad del modelo de tener toda la informacin requerida para cumplir los requisitos del usuario Integridad: grado en el que las reglas del negocio que se aplican a los datos estn definidas en el modelo de datos

Flexibilidad: facilidad con la que el modelo de datos se puede adaptar a los cambios en los requisitos
Comprensibilidad: facilidad con la que el modelo de datos puede ser entendido (perceptual y operacional)

25

CALIDAD DE INFORMACIN

APROXIMACIONES

Correccin: se refiere a si el modelo cumple las reglas de las tcnicas de modelado utilizadas
Simplicidad: significa que el modelo contiene los mnimos constructores posibles Integracin: nivel de consistencia del modelo de datos con el resto de los datos de la organizacin

Implementabilidad: facilidad con la que el modelo de datos puede ser implementado dentro de las restricciones de tiempo, presupuesto y tecnologa del proyecto

26

CALIDAD DE INFORMACIN

APROXIMACIONES

INTERACCIONES ENTRE FACTORES


Moody y Schanks (1994)

COMPREN SIMPLIC FLEXIB COMPLEC IMPLEM INTEGR COMPREN. SIMPLIC. FLEXIB. COMPLEC. IMPLEM. INTEGR.

+ + + + + +

27

CALIDAD DE INFORMACIN

APROXIMACIONES

MARCO INTEGRADO PARA LA CALIDAD


Shanks y Darke (1997)

- AMBOS MARCOS COMPARTEN CONCEPTOS


AUDIENCIA = STAKEHOLDER OBJETIVO, PROPIEDAD = FACTOR DE CALIDAD ACTIVIDAD = ESTRATEGIA

- CONSIDERACIONES TERICAS Y PRCTICAS - VLIDO PARA EL PRODUCTO Y EL PROCESO

28

CALIDAD DE INFORMACIN

APROXIMACIONES

DOMAIN
appropriate for has knowledge of

QUALITY TYPE
classifies represents

Theory Based
is achieved by

MEANS

contains

LANGUAGE
used in appropriate for interprets concerned with is assigned assigns used for

GOAL

PROPERTY

AUDIENCE

MODEL

maps to OR

maps to

ACTIVITY

is achieved by

WEIGHTING

QUALITY FACTOR
is assigned valued by

RATING

scores

EVALUATION METHOD

Practice Based

29

CALIDAD DE INFORMACIN

APROXIMACIONES

ENFOQUE ONTOLGICO
Kesh (1995)

calidad
Funcionamiento Ontologa

Usabilidad (usuario)

Usabilidad (diseador)

Mantenibilidad

Precisin

Rendimiento

Estructura adecuacin al problema validez consistencia concisin

Contenido complecin cohesin validez

30

CALIDAD DE INFORMACIN

APROXIMACIONES

Adecuacin Solidez Consistencia Concisin Complecin Cohesin Validez

USABIL. (usuario) X

USABIL. (diseador)

MANTENIB. X

EXACT

RENDIM.

X X X

X X X X X

X
X

X X

X X

31

CALIDAD DE INFORMACIN

NDICE

- INTRODUCCIN
- APROXIMACIONES A LA CALIDAD - MEDICIN DE MODELOS CONCEPTUALES - MEDICIN DE MODELOS LGICOS

- CALIDAD DE DATOS - ASPECTOS DE GESTIN

32

CALIDAD DE INFORMACIN

MODELOS CONCEPTUALES

MUNDO REAL
Valores

objetos y asociaciones con sus propiedades y reglas

E/R
MODELADO CONCEPTUAL

Estrutura percibida (no formalizada)

Esquema conceptual
DISEO LOGICO

MODELO CONCEPTUAL

Esquema de base de datos


DISEO FISICO

SGBD MODELO DE BD

UML

Esquema interno

MODELO INTERNO

BASE DE DATOS FISICA

33

CALIDAD DE INFORMACIN

MODELOS CONCEPTUALES

-Definir slo propiedades deseables no es suficiente para evaluar la calidad, ... por lo que es necesario contar con medidas que permitan evaluar la calidad de los modelos conceptuales de datos de forma cuantitativa y objetiva, ... Moody et al. (1998)

- Medir datos puede ayudar a controlar y predecir

aspectos del modelo de datos durante el proceso de desarrollo software (MacDonell et al., 1997)

34

CALIDAD DE INFORMACIN

MODELOS CONCEPTUALES

Moody (1998)
Complecin N de elementos del modelo de datos que no corresponden con requisitos de usuario N de requisitos de usuario no representados en el modelo de datos N de elementos de datos que corresponden a requisitos de usuario pero definidos de forma inexacta N de inconsistencias con el modelo de procesos

Integridad N de reglas del negocio que no se hacen cumplir por el modelo de datos N de restricciones de integridad incluidas en el modelo de datos que no corresponden a polticas del negocio
Flexibilidad N de elementos en el modelo que estn sujetos a cambios en el futuro Costes estimados de los cambios Importancia estratgica de los cambios
35

CALIDAD DE INFORMACIN

MODELOS CONCEPTUALES

Moody (1998)
Comprensibilidad Valoracin de los usuarios sobre la comprensibilidad del modelo Capacidad de los usuarios de interpretar el modelo correctamente Valoracin de los desarrolladores de aplicaciones sobre la comprensibilidad del modelo
Correccin N de violaciones de las convenciones de modelado de datos N de violaciones a las formas normales N de instancias de redundancia en el modelo Simplicidad N de entidades N de entidades e interrelaciones Suma ponderada de constructos (aNE + bNR + cNA)
36

CALIDAD DE INFORMACIN

MODELOS CONCEPTUALES

Moody (1998)
Integracin N de conflictos con el modelo de datos corporativo N de conflictos con los sistemas existentes Valoracin de los representantes de todas las reas de negocio Implementabilidad Valoracin de riesgo tcnico Valoracin de riesgo de planificacin Estimacin del coste de desarrollo N de elementos fsicos incluidos en el modelo de datos

37

CALIDAD DE INFORMACIN

MODELOS CONCEPTUALES

Kesh (1995) Calcular la puntuacin de los componentes ontolgicos individuales Combinar las puntuaciones de los componentes ontolgicos relevantes a cada comportamiento Combinar las puntuaciones de los componentes para calcular la puntuacin de la calidad

Q = w1 . s1 + w2 . s2 + w3 . s3 + w4 . s4 + w5 . s5

38

CALIDAD DE INFORMACIN
USABIL. (usuario) X X X X USABIL. (diseador) X X X X X

MODELOS CONCEPTUALES
MANTENIB. X X X X X X X EXACT RENDIM.

Adecuacin Solidez Consistencia Concisin Complecin Cohesin Validez

s1 = (o1 + o3 + o4 + o5) / 4 s2 = (o2 + o3 + o5 + o6 + o7) / 5 s3 = (o2 + o4 + o6) / 3 s4 = (o3 + o5) / 2 s5 = (o4 + o5) / 2
39

CALIDAD DE INFORMACIN

MODELOS CONCEPTUALES

o1 (adecuacin de la estructura): valorada por los usuarios en una escala de 5 puntos o2 (solidez de la estructura): valorada por un grupo de tcnicos o3 (consistencia de la estructura): o3 = M D1 donde M = Mximo de puntos posibles (5) y D1 est basado en el ratio R = (nmero de inconsitencias/nmero de implicacions), dado por 4n1, donde n1 es el nmero de interrelaciones o4 (concisin de la estructura): Si n es el nmero de entidades, el mnimo de interrelaciones ser (n-1), en cuyo caso o4 = 5. La peor situacin posible es c2n, en cuyo caso o4 = 0. En general: o4 = M ((c2n n1) / (c2n (n-1)). o5 (complecin del contenido): se deduce de un mximo M los datos que faltan segn los informes y consultas que se deben generar de la base de datos. o6 (cohesin del contenido): para cada entidad se mide el tamao de su clave primaria. Si es simple se punta el mximo. Si utiliza todos los atributos de la entidad se punta o6i = 0, donde i es el nmero de la entidad. En general o6i= M ((ne np) / (ne 1)) donde ne es el nmero de atributos de la entidad y n p el nmero de atributos que forman la clave primaria. La cohesin total es: o6 = o6i / n o7 (validez del contenido): se asigna M si todos los atributos son vlidos. En general: o7 = M (1 ni / ne) siendo ni los atributos incorrectos.
40

CALIDAD DE INFORMACIN

MODELOS CONCEPTUALES

Gray et al. (1991) Complejidad de una entidad i:


Ei Di * Fi

Di = Complejidad de la arquitectura de datos Fi = Complejidad funcional

Complejidad de la arquitectura de datos:


Di Ri * ( a * FDAi b * NFDA i ) 0<a<=b

Ri = nmero de interrelaciones FDAi = n de atributos funcionalmente dependientes NFDAi = n atributos no dependientes

41

CALIDAD DE INFORMACIN

MODELOS CONCEPTUALES

Gray (1991)

c n E Ei i 1
Ae E e R e Ae R e E e M A3 E 3 R 3 A3 R 3 E 3

( )

42

CALIDAD DE INFORMACIN

MODELOS CONCEPTUALES

Eick (1991)

1 3 * qu 3 * qu qu3 qu 4 qu
1 2

qu1, nmero de dependencias funcionales que se dan en U no expresadas en Si qu2, nmero de dependencias en existencia que se dan en U no expresadas en Si qu3, nmero de atributos y conexiones de subtipos en Si.
qu4, nmero de clases en Si

qu5, nmero de etiquetas en Si

43

CALIDAD DE INFORMACIN

MODELOS CONCEPTUALES

ISO 9126
Efficiency Functionality
Portability

SOFTWARE QUALITY

Reliability Maintainability

Usability

44

CALIDAD DE BASES DE DATOS

MODELOS CONCEPTUALES

Maintainability

Understandability

Modifiability

Analysability

Stability

Testability

Compliance

Complexity
45

CALIDAD DE INFORMACIN

MODELOS CONCEPTUALES

Henderson-Sellers (1994)
COMPLEXITY

Computational

Psychological

Representational

Problem Complexity

Product or Structural Complexity

Cognitive Complexity

46

CALIDAD DE INFORMACIN

MODELOS CONCEPTUALES

GOAL
Analyse for the purpose of with respect to their from the point of view of the in the context of ER diagrams Evaluating Maintainability Software designers Software delevopment organisations
47

CALIDAD DE INFORMACIN

MODELOS CONCEPTUALES

Number of entities (NE) Number of attributes (NA) Number of derived attributes (NDA)
Number of composite attributes (NCA) Number of multivalued attributes (NMVA) Number of relationships (NR) Number of M:N relationships (NM:NR)

Number of 1:N relationships (N1:NR)


48

CALIDAD DE INFORMACIN

MODELOS CONCEPTUALES

Number of N-Ary relationships (NN-AryR) Number of binary relationships (NBinaryR)


Number of IS_A relationships (NIS_AR) Number of reflexive relationships (NRefR) Number of redundant relationships (NRR)

49

CALIDAD DE INFORMACIN

NDICE

- INTRODUCCIN
- APROXIMACIONES A LA CALIDAD - MEDICIN DE MODELOS CONCEPTUALES - MEDICIN DE MODELOS LGICOS

- CALIDAD DE DATOS - ASPECTOS DE GESTIN

50

CALIDAD DE INFORMACIN

MODELOS LGICOS

- Prcticamente no existen mtricas para bases de datos


- Sneed y Foshag (1998) metrics for databases have been neglected in the metric community - Medir datos puede ayudar a controlar y predecir

aspectos del modelo de datos durante el proceso de desarrollo software (MacDonell et al., 1997) - Un enfoque ms riguroso para asegurar la calidad de las bases de datos

51

CALIDAD DE INFORMACIN

MODELOS LGICOS

MUNDO REAL
Valores

objetos y asociaciones con sus propiedades y reglas

MODELADO CONCEPTUAL

Estrutura percibida (no formalizada)

Esquema conceptual
DISEO LOGICO

MODELO CONCEPTUAL

relacional
SGBD MODELO DE BD

Esquema de base de datos


DISEO FISICO

activa obj-rel

Esquema interno

MODELO INTERNO

BASE DE DATOS FISICA

52

CALIDAD DE INFORMACIN

MODELOS LGICOS

Bases de datos relacionales


Las ms implantadas en la actualidad
(Leavit, 2000)

Bases de datos activas


Muchos productos comerciales incluyen actividad
(Ceri y Widom, 1996; Paton y Daz, 2000)

Bases de datos objeto-relacionales


En el ao 2003 sustituirn a las relacionales
(Leavit, 2000)

53

CALIDAD DE INFORMACIN

MODELOS LGICOS

Mtricas propuestas para programas tradicionales Lneas de cdigo Nmero de sentencias de programacin SIZE1. Definida como el nmero de ;.
Li y Henry (1993)

Mtricas de la Ciencia del Software (Software Science). Halstead (1977) Puntos Funcin. Albrecht y Gaffney (1983) Complejidad ciclomtica. McCabe (1976) Fan-in y fan-out. Henry y Kafura (1981)
54

CALIDAD DE INFORMACIN

MODELOS LGICOS

Mtricas para modelos lgicos


Bases de datos relacionales

Ratio de normalidad (Gray et al., 1991)

Bases de datos activas

Bases de datos objeto-relacionales

Adaptacin de mtricas para sistemas OO


55

CALIDAD DE INFORMACIN

MODELOS LGICOS

DEFINICIN DE MTRICAS Bases de Datos Relacionales

OBJETIVO (Goal)
Propsito: Asunto: Objeto: Punto de vista: Asegurar la mantenibilidad de las bases de datos relacionales desde el punto de vista del diseador de la base de datos
56

CALIDAD DE INFORMACIN

MODELOS LGICOS

PREGUNTAS (Question)
1. Cmo influye la complejidad de las tablas en la mantenibilidad de las bases de datos relacionales? 2. Cmo influye la complejidad entre tablas en la mantenibilidad de las bases de datos relacionales?

57

CALIDAD DE INFORMACIN

MODELOS LGICOS

INTRA ELEMENTO NA(T) NFK(T) BASES DE DATOS RELACIONALES DRT(T) RFK(T)

INTER ELEMENTO NA NFK DRT RFK NT NR COS


58

CALIDAD DE INFORMACIN

MODELOS LGICOS

BASE DE DATOS

NIVEL

MTRICA

BRIAND ET AL. (1996)

ZUSE (1998)

TABLA

RELACIONAL ESQUEMA

NA NFK DRT RFK NA NFK DRT RFK NT NR COS

TAMAO COMPLEJIDAD LONGITUD NO CLASIFICABLE TAMAO COMPLEJIDAD LONGITUD NO CLASIFICABLE TAMAO NO CLASIFICABLE NO CLASIFICABLE

ENCIMA ORDINAL ENCIMA ORDINAL ORDINAL ABSOLUTA ENCIMA ORDINAL ENCIMA ORDINAL ORDINAL ABSOLUTA RATIO ABSOLUTA RATIO

59

CALIDAD DE INFORMACIN

MODELOS LGICOS

DEFINICIN DE MTRICAS Bases de Datos Activas

INTER ELEMENTO
NAn BASES DE DATOS ACTIVAS D

INTRA ELEMENTO
NO NS

TP

60

CALIDAD DE INFORMACIN

CALIDAD DE DATOS

- INTRODUCCIN
- APROXIMACIONES A LA CALIDAD - MEDICIN DE MODELOS CONCEPTUALES - MEDICIN DE MODELOS LGICOS

- CALIDAD DE DATOS - ASPECTOS DE GESTIN

61

CALIDAD DE BASES DE DATOS

CALIDAD DE DATOS

Wang et al. (1993) y (1995) requisitos de la aplicacin

DETERMINAR LA VISTA DE DATOS

requisitos de calidad

VISTA DE APLICACIN

atributos de calidad

DETERMINAR PARMETROS

VISTA DE PARMETROS

62

CALIDAD DE BASES DE DATOS

CALIDAD DE DATOS

ALUMNO

Mat.

CURSO

nm. nombre

fecha

nm. nombre

nota

direc tel.

precio descr.

63

CALIDAD DE BASES DE DATOS

CALIDAD DE DATOS

INSPECCIN

ALUMNO

Mat.
QUIN, CUNDO

CURSO

nm.

fecha

nm.

nombre OPORT. direc OPORT. tel. PRECISIN nota

nombre OPORT. precio COSTE eval. CREDIBILIDAD OPORTUNIDAD


64

FORMATO.

CALIDAD DE BASES DE DATOS

CALIDAD DE DATOS

VISTA DE PARMETROS

DETERMINAR INDICADORES

VISTA DE CALIDAD

INTEGRAR VISTAS DE CALIDAD

ESQUEMA DE CALIDAD

65

CALIDAD DE BASES DE DATOS

CALIDAD DE DATOS

QUIN

CUNDO PROC. INSPEC.

RESULTADO

ALUMNO

Mat.
ID. FECHA USUARIO

CURSO

nm. fecha nombre EDAD direc EDAD tel. MTODO RECOGIDA MEDIO nota

nm.

nombre EDAD precio COSTE eval. NOMBRE EVAL FECHA


66

CALIDAD DE BASES DE DATOS

CALIDAD DE DATOS

ALUMNO William Smith

NOTA SELECTIVIDAD 8 <30/10/90, MEC>

NOTA MEDIA CARRERA 7 <30/7/95, Esc. Inf.>

Gene Hackman

9 <30/10/90, MEC>
...

6 <10/9/96, Esc. Inf.>


...

67

CALIDAD DE BASES DE DATOS

CALIDAD DE DATOS

Caballero (2004)

Marco de Trabajo para la Mejora de la Gestin de la Calidad de los Datos y de la Informacin, con dos componentes: CALDEA. Modelo de referencia de gestin de calidad de datos e informacin basado en niveles de madurez. EVAMECAL. Metodologa de evaluacin y mejora del PGI basada en CALDEA.
68

CALIDAD DE BASES DE DATOS


ACTIVIDADES DE CALDEA ORGANIZADAS POR NIVELES DE MADUREZ

CALIDAD DE DATOS

Optimizante (GPD) Anlisis Causal para la prevencin e identificacin de defectos (GIDO) Innovacin y desarrollo organizacional.

Gestionado Cuantitativamente (GPM) Gestin de Planes de medicin para los componentes del PGI. (GAPM) Gestin de la Automatizacin de los Planes de Medida

Integracin (VV) Validacin y Verificacin de los productos de datos. (GIR) Gestin del impacto de riesgos y de la pobre calidad de datos. (GE) Gestin de la estandarizacin de la calidad de datos (GPO) Gestin de polticas de calidad de datos organizacionales. Definicin (GEGCDI) Gestin de un Equipo de Calidad de Datos (GP) Gestin de un Proyecto para el Proceso de Gestin de Informacin (PyPGI) (GR) Gestin de Requisitos de Usuario. (GCI) Gestin de la Calidad de Datos en los componentes del PGI. (FS) Gestin de fuentes y destinos (sumideros) de datos (ADM) Gestin de proyecto para la adquisicin, el desarrollo o el mantenimiento de una base o almacn de datos. Inicial

69

CALIDAD DE BASES DE DATOS


ACP
(GEGCDI) Gestin de un Equipo de un Equipo de Aseguramiento de Calidad de Datos y de Informacin.

CALIDAD DE DATOS
OBJETIVO

Organizar un equipo que se encargue de todas las iniciativas de evaluacin y mejora de los PGI. Elaborar un proyecto que permita definir todo s los aspectos de cada uno de los PGI que integran el Sistema de Informacin. Recoger y elaborar los documentos pertinentes a los requisitos de usuario para cada uno de los PGI y las caractersticas de calidad de dat os que tienen que tener cada uno de sus componentes.

(GP) Gestin de un Proyecto para el PGI.


(GR) Gestin de Requisitos de Usuario.

(GCI) Gestin de la Calidad de Datos en los componentes del PGI y en el producto de informacin.

Definir y documentar los aspectos cuantitativos y cualitativos de calidad de datos para cada uno de los componentes de los PGI expresados en trminos de dimensiones y mtricas de calidad de datos.
Identificar y documentar las fuentes y sumideros de datos y productos de informacin, as como los formatos en que se intercambiarn los datos con ellos. Asegurar que el lugar donde se va a almacenar los datos responde a los requisitos establecidos tanto a nivel tcnico del producto comercial elegido, como al esquema diseado para albergar los datos. 70

(FS) Gestin de fuentes de datos y de los destinos (sumideros) de los productos de informacin. (ADM) Gestin de proyecto para la adquisicin, el desarrollo o el mantenimiento de una base de datos o de un almacn de datos.

CALIDAD DE BASES DE DATOS


ACTIVIDADES DE CALDEA ORGANIZADAS POR NIVELES DE MADUREZ

CALIDAD DE DATOS

Optimizante (GPD) Anlisis Causal para la prevencin e identificacin de defectos (GIDO) Innovacin y desarrollo organizacional.

Gestionado Cuantitativamente (GPM) Gestin de Planes de medicin para los componentes del PGI. (GAPM) Gestin de la Automatizacin de los Planes de Medida

Integracin (VV) Validacin y Verificacin de los productos de datos. (GIR) Gestin del impacto de riesgos y de la pobre calidad de datos. (GE) Gestin de la estandarizacin de la calidad de datos (GPO) Gestin de polticas de calidad de datos organizacionales. Definicin (GEGCDI) Gestin de un Equipo de Calidad de Datos (GP) Gestin de un Proyecto para el Proceso de Gestin de Informacin (PyPGI) (GR) Gestin de Requisitos de Usuario. (GCI) Gestin de la Calidad de Datos en los componentes del PGI. (FS) Gestin de fuentes y destinos (sumideros) de datos (ADM) Gestin de proyecto para la adquisicin, el desarrollo o el mantenimiento de una base o almacn de datos. Inicial

71

CALIDAD DE BASES DE DATOS


ACP
(VV) Validacin y Verificacin de los productos de datos. (GIR) Gestin del impacto de riesgos y de la pobre calidad de datos. (GE) Gestin de la estandarizacin de la calidad de datos (GPO) Gestin de polticas de calidad de datos organizacionales.

CALIDAD DE DATOS
OBJETIVO

Elaborar un plan para la validacin y verificacin de los productos de datos desarrollados en el PGI. Delimitar, acotar y documentar todos los posibles impactos y riesgos derivados de tener una pobre calidad de datos en los componentes del PGI. Ir creando una cultura organizacional de calidad de datos a travs de las experiencias propias y/o ajenas. A partir del conocimiento de calidad de datos y de las necesidades de la organizacin con respecto a los productos de datos establecer y documentar polticas de calidad de datos que incidan sobre los componentes del PGI.

72

CALIDAD DE BASES DE DATOS

CALIDAD DE DATOS
Catlogo de Definicin del estndares de PGI. calidad de datos y de informacin. Catlogo de polticas organizacionales.

Definicin del PGI.

Gestin de la Estandarizacin de la Calidad de la Informacin

GE.1. Eleccin de Estndares de Calidad de Datos y de Informacin

GE2. Eleccin de Polticas Organizacionales

Lista con las caractersticas observadas en cada uno de los componentes del PGI o del producto de informacin que son modificadas por los estndares elegidos.

Lista con las caractersticas observadas en cada uno de los componentes del PGI o del producto de informacin que son modificadas por las polticas de calidad elegidas.

ERU PGI, ERU-CDI ERU PI. -

GE.3. Revisin y complecin de las ERU

Definicin PGI con modelos de datos y procesos

Definicin revisada del PGI con modelos de datos y de procesos

73

CALIDAD DE BASES DE DATOS

CALIDAD DE DATOS

GE.1.Eleccin de estndares y dimensiones de calidad de datos y de informacin


Entrada Productos Salida Tcnicas y Herramientas Participantes

Catlogo de estndares de calidad de datos y de informacin.


Definicin del PGI. Lista con las caractersticas observadas en cada uno de los componentes del PGI o del producto de informacin que son modificadas por los estndares elegidos.

Sesiones de Trabajo.
Inspeccin de los estndares. EGCDI. Especialistas o Consultores en estndares de calidad de datos. Todas aquellas personas que desempeen un rol relacionado con los estndares de calidad de datos y de informacin e elegidos Cuando se tenga definido el PGI. 74

Momento de Realizacin de Actividad

CALIDAD DE BASES DE DATOS


ACTIVIDADES DE CALDEA ORGANIZADAS POR NIVELES DE MADUREZ

CALIDAD DE DATOS

Optimizante (GPD) Anlisis Causal para la prevencin e identificacin de defectos (GIDO) Innovacin y desarrollo organizacional.

Gestionado Cuantitativamente (GPM) Gestin de Planes de medicin para los componentes del PGI. (GAPM) Gestin de la Automatizacin de los Planes de Medida

Integracin (VV) Validacin y Verificacin de los productos de datos. (GIR) Gestin del impacto de riesgos y de la pobre calidad de datos. (GE) Gestin de la estandarizacin de la calidad de datos (GPO) Gestin de polticas de calidad de datos organizacionales. Definicin (GEGCDI) Gestin de un Equipo de Calidad de Datos (GP) Gestin de un Proyecto para el Proceso de Gestin de Informacin (PyPGI) (GR) Gestin de Requisitos de Usuario. (GCI) Gestin de la Calidad de Datos en los componentes del PGI. (FS) Gestin de fuentes y destinos (sumideros) de datos (ADM) Gestin de proyecto para la adquisicin, el desarrollo o el mantenimiento de una base o almacn de datos. Inicial

75

CALIDAD DE BASES DE DATOS

CALIDAD DE DATOS
OBJETIVO

ACP

(GPM) Gestin de Planes de Medicin para componentes del PGI

Elaborar planes para la medicin de los aspectos de calidad de datos definidos en la actividad (GCD) Gestin de la Calidad de Datos en los componentes del PGI del nivel de Definicin, as como los formatos de presentacin de resultados. Establecer los mecanismos necesarios para automatizar los procesos de medicin.

(GAPM). Gestin de la Auto matizacin de Planes de Medidas para Componentes del PGI.

76

CALIDAD DE BASES DE DATOS


ACTIVIDADES DE CALDEA ORGANIZADAS POR NIVELES DE MADUREZ

CALIDAD DE DATOS

Optimizante (GPD) Anlisis Causal para la prevencin e identificacin de defectos (GIDO) Innovacin y desarrollo organizacional.

Gestionado Cuantitativamente (GPM) Gestin de Planes de medicin para los componentes del PGI. (GAPM) Gestin de la Automatizacin de los Planes de Medida

Integracin (VV) Validacin y Verificacin de los productos de datos. (GIR) Gestin del impacto de riesgos y de la pobre calidad de datos. (GE) Gestin de la estandarizacin de la calidad de datos (GPO) Gestin de polticas de calidad de datos organizacionales. Definicin (GEGCDI) Gestin de un Equipo de Calidad de Datos (GP) Gestin de un Proyecto para el Proceso de Gestin de Informacin (PyPGI) (GR) Gestin de Requisitos de Usuario. (GCI) Gestin de la Calidad de Datos en los componentes del PGI. (FS) Gestin de fuentes y destinos (sumideros) de datos (ADM) Gestin de proyecto para la adquisicin, el desarrollo o el mantenimiento de una base o almacn de datos. Inicial

77

CALIDAD DE BASES DE DATOS

CALIDAD DE DATOS

ACP

OBJETIVO

(GPD) Anlisis causal para la prevencin e identificacin de defectos. (GIDO) Innovacin y desarrollo organizacional.

A partir de los indicadores de calidad obtenidos en la actividad (GPM) Gestin de Planes de Medicin para componentes del PGI se trata de identificar las causas de los defectos. Esta actividad tiene como objetivo elaborar propuestas de mejora para el PI o los componentes del PGI.

78

CALIDAD DE BASES DE DATOS

CALIDAD DE DATOS

EVAMECAL
Metodologa de evaluacin y mejora basada en el modelo de referencia CALDEA y orientada a la mejora continua de los PGI Al estilo de SCAMPI, ISO/IEC 15504

Basada en Ballou y Tayi (1996) y adaptada al ciclo PDCA de Deming (1986)

79

CALIDAD DE BASES DE DATOS

CALIDAD DE DATOS
Situacin Actual

PGI

del PGI

PLAN

EMC -P.1. D EFINICIN DE LA SITUACIN ACTUAL

EMC -P.2. D EFINICIN DE OBJETIVOS DE MEJORA

Informe con Objetivos de Mejora


PM PGI -

DO

EMC -D.2. E JECUCIN DEL PM -PGI

EMC -D.1. A NLISIS DE


CAUSAS Y DESARROLLO DE

PM -PGI

Informe de realizacin del Plan

CHECK

EMC - C.1. C OMPROBA CIN DE LA EFICACIA ACCIONES CORRECTORAS

ACT
ECM -A.2. E STANDARI ZAR EL CONOCIMIENTO OBTENIDO

Informe Listado de Comprobaciones Conocimiento sobre PGI


ECM -A.1. O BTENER CONCLUSIONES

80

CALIDAD DE INFORMACIN

NDICE

- INTRODUCCIN
- APROXIMACIONES A LA CALIDAD - MEDICIN DE MODELOS CONCEPTUALES - MEDICIN DE MODELOS LGICOS

- CALIDAD DE DATOS - ASPECTOS DE GESTIN

81

CALIDAD DE INFORMACIN

ASPECTOS DE GESTIN

CAUSAS DE LOS PROBLEMAS DE CALIDAD


Strong et al. (1997)

Mltiples fuentes de la misma informacin producen diferentes valores La informacin se produce utilizando juicios subjetivos, producindose sesgos Errores sistemticos en la produccin de la informacin produce prdida de informacin Grandes volmenes de informacin almacenada hace difcil el acceso en tiempo razonable Sistemas distribuidos heterogneos producen definiciones, formatos y valores inconsistentes La informacin no numrica es difcil de indexar No se dispone todava de anlisis automtico a lo largo de colecciones de datos Al cambiar las tareas de los consumidores de informacin y el entorno organizacional, la informacin que es relevante y til tambin cambia La facilidad de acceso a la informacin puede entrar en conflicto con los requisitos de seguridad, privacidad y confidencialidad La falta de suficientes recursos de computacin limita el acceso
82

CALIDAD DE INFORMACIN

ASPECTOS DE GESTIN

POLTICA DE CALIDAD
Redman (1996)

Todos los empleados de la empresa tienen que asumir que los datos y la informacin as como los procesos de negocio que los crean, almacenan, procesan y utilizan son propiedad de la empresa y que su comparticin dentro de la empresa, as como con terceros deber estar sometida a consideraciones legales o de privacidad. El director de informtica (CIO) ser el responsable de mantener un inventario actualizado de datos, de su disponiblidad, as como de informar sobre la calidad de los mismos. Los suministradores y creadores de datos deben comprender quin usa los datos y con qu propsitos, implementar las medidas de calidad de datos para asegurar que se satisfacen los requisitos de los usuarios e implementar la gestin del proceso para los datos que crean.
83

CALIDAD DE INFORMACIN

ASPECTOS DE GESTIN

POLTICA DE CALIDAD
Redman (1996)

Los que almacenan y procesan datos deben proporcionar arquitecturas y bases de datos que minimicen la redundancia innecesaria, salvaguardar los datos de daos o accesos no autorizados y disear las nuevas tecnologas con el fin de promover la calidad de los datos. Los usuarios deben trabajar con los suministradores de datos, proporcionar retroalimentacin, asegurar que los datos se intepretan correctamente, asegurar que los datos se utilizan slo para propsitos empresariales legtimos, proteger los derechos de los clientes, empleados, etc. sobre privacidad.

84

CALIDAD DE INFORMACIN

ASPECTOS DE GESTIN

TQdM (Total Quality data Management)


English (1999)

1) Identificar un grupo de informacin que tenga un impacto significativo con el fin de aportar un mayor valor aadido. 2) Establecer objetivos y medidas de la calidad de la informacin, por ejemplo: asegurar la oportunidad de la informacin, midiendo el tiempo que pasa desde que se conoce un dato hasta que se encuentra disponible para un determinado proceso. 3) Identificar la cadena de valor y de costes de la informacin, que consiste en una cadena de valor de negocio extendida y centrada en un grupo de datos. Esta cadena comprender todos los ficheros, documentos y bases de datos, procesos de negocio, programas y roles que tengan relacin con el grupo de datos. 4) Determinar los ficheros o procesos a evaluar. 5) Identificar las fuentes de validacin de datos para evaluar la precisin. 6) Extraer muestras de datos aleatorias, aplicando las tcnicas estadsticas adecuadas 7) Medir la calidad de la informacin, con el fin de determinar su nivel de fiabilidad y descubrir los defectos. 8) Interpretar e informar sobre la calidad de la informacin.
85

CALIDAD DE INFORMACIN

ASPECTOS DE GESTIN

Cuestiones para los directivos


Miller (1996)

Son todava vlidas las percepciones de nuestras necesidades de calidad de informacin que tenamos ayer? Cmo se traducen las necesidades de calidad en requisitos tecnolgicos?

Es nuestra estrategia tecnolgica consistente con nuestras necesidades de calidad?


Estn la coleccin, diseminacin y procedimientos de verificacin internos a la altura de los requisitos de calidad?

86

CALIDAD DE INFORMACIN

ASPECTOS DE GESTIN

empresa

satisfaccin del personal

satisfaccin del cliente calidad de la informacin


87

CALIDAD DE INFORMACIN

ASPECTOS DE GESTIN

88

S-ar putea să vă placă și