Documente Academic
Documente Profesional
Documente Cultură
Código: GIN-GI-PD12
Comunicaciones
Subproceso: Sistemas de Información Versión: 0
Nombre del
documento: Procedimiento de Gestión y Minería de
Datos Página: Página 1 de 5
FO-PCA-05
1. OBJETIVO
Establecer las actividades y los responsables de la obtención de información oportuna, veraz, clara
y conciliada a través del análisis, implementación, socialización y seguimiento de la información por
medio de descubrimiento de conocimiento en bases de datos – KDD, en la plataforma tecnológica
del Hospital Universitario San José de Popayán E.S.E.
2. ALCANCE
3. RESPONSABLES
4. REQUERIMIENTOS
Legales:
Manual de Acreditación en Salud Ambulatorio y Hospitalario Colombia (Res. 123).
Registro Nacional de Bases de Datos (Decreto 886 de 2014).
En el artículo 10 del Decreto 1377 de 2013. Expedido por el Ministerio de Comercio,
Industria y Turismo.
Protección de datos Personales (Ley 1581 de 2012).
Por la cual se dictan las disposiciones generales del hábeas data y se regula el manejo de
la información contenida en bases de datos personales, en especial la financiera, crediticia,
comercial, de servicios y la proveniente de terceros países y se dictan otras disposiciones.
(Ley 1266 de 2008).
Por la cual se regula la realización de los Censos de Población y Vivienda en todo el
territorio nacional. (Ley 79 de 1993).
5. DEFINICIONES
5.1 Bodega de Datos (Data warehouse): Es una base de datos corporativa que se caracteriza por
integrar y depurar información de una o más fuentes distintas, para luego procesarla
permitiendo su análisis desde infinidad de perspectivas y con grandes velocidades de
respuesta. La creación de un datawarehouse representa en la mayoría de las ocasiones el
primer paso, desde el punto de vista técnico, para implantar una solución completa y fiable de
Business Intelligence.
5.3 Sistema Gestor de Base de Datos (SGBD): Es el software que permite la utilización y/o la
actualización de los datos almacenados en una (o varias) base(s) de datos por uno o varios
usuarios desde diferentes puntos de vista. El objetivo fundamental consiste en suministrar al
usuario las herramientas que le permitan manipular, en términos abstractos, los datos, o sea,
de forma que no le sea necesario conocer el modo de almacenamiento de los datos en la
computadora, ni el método de acceso empleado.
5.6 Base de Datos: Conjunto integrado de conceptos relacionados entre ellos y sus restricciones
entre ellos. Las bases de datos incluyen atributos, entidades, relaciones.
Atributos: son campos de datos que pertenecen a una entidad.
Entidades: es la representación de un objeto o concepto del mundo real que se describe en
una base de datos.
Relaciones: En bases de datos, una relación o vínculo entre dos o más entidades describe
alguna interacción entre las mismas.
5.7 Lenguaje de Consulta Estructurado -Structured Query Language -Sql: se utiliza para definir,
consultar y actualizar la base de datos, y es el más popular de su estilo. La estructura básica
para consultas en SQL es select-from-where. Conceptualmente, SQL es un lenguaje de
definición de datos (LDD), un lenguaje de definiciones de vistas (LDV) y un lenguaje de
manipulación de datos (LMD), que posee también capacidad para especificar restricciones y
evolución de esquemas.
Selección:
Que datos se van a realizar para el proceso de descubrimiento. Identificación e integración
de fuentes internas y externas de datos.
Preprocesamiento:
- Limpieza de datos/data cleaning.
- Datos Ruidosos/noisy data: Valores que están significativamente fuera del rango de valores
esperado (outliers) por errores humanos, cambios en el sistema, información no disponible
a tiempo, fuentes heterogéneas de datos. Se ignoran o eliminan y se usan técnicas
estadísticas para el reemplazo (media, moda, mediana, desviación estándar, etc).
- Datos Faltantes o Perdidos: Datos empty: No le corresponde un valor en el mundo real. Ej.
La cesárea en hombres. Datos missing: Tiene un valor que no fue capturado. En el
proceso de limpieza se ignoran o eliminan, se reemplazan por defecto, se usan métricas
(media, mínimo, varianza, etc).
Transformación:
Construcción de nuevos atributos a partir de los originales por binarización, transformación
de valores numéricos en atributos discretos o nominales, reducciones horizontales y
verticales de datos, eliminación de duplicados, eliminación de llaves, eliminación de
columnas que dependan funcionalmente. Ej edad y fecha de nacimiento.
Minería de Datos(Data Mining):
- Descubrimiento de patrones insospechados.
- Determinar qué tipo de tarea de minería de datos es el más apropiado.
- Elegir el tipo de modelo
- Elegir el algoritmo de minería que resuelva la tarea y construya el modelo buscado.
- Un patrón: “Las personas que compran productos de buceo son candidatas a vacaciones
en Australia”.
Interpretación/Evaluación:
- Interpretación de los patrones y posible retorno a alguno de las etapas anteriores para una
adicional iteración.
- Consolidación del conocimiento descubierto.
- Incorporar este conocimiento al rendimiento del sistema.
- Documentarlo en un reporte para las partes interesadas.
- Contrastar potenciales conflictos con conocimiento previamente obtenido.
6. RECOMENDACIONES GENERALES
Las solicitudes que se responderán por medio de la minería de datos están relacionadas con
tendencias, patrones de comportamiento, causalidad.
7. DESARROLLO DE ACTIVIDADES
Proceso: Gestión de la Información y
Código: GIN-GI-PD12
Comunicaciones
Subproceso: Sistemas de Información Versión: 0
Nombre del
documento: Procedimiento de Gestión y Minería de
Datos Página: Página 4 de 5
FO-PCA-05
DESCRIPCIÓN DE ACTIVIDADES
QUIEN LO DEBE CUANDO LO DOCUMENTO
NO DIAGRAMA DE FLUJO COMO SE HACE
HACER DEBE HACER GENERADO
1 INICIO 1.1.Analizando indicadores, Ingeniero Cuando se N/A
reportes y demás conjunto de Sistemas de detectan
datos. Información. desviaciones de
Identificar el patrón de
comportamiento de la información
información detectado.
FIN
Proceso: Gestión de la Información y
Código: GIN-GI-PD12
Comunicaciones
Subproceso: Sistemas de Información Versión: 0
Nombre del
documento: Procedimiento de Gestión y Minería de
Datos Página: Página 5 de 5
FO-PCA-05
-Leandro Rosero
-Yuli Ibeth potosí
-Ing. Viviana Chávez -Dr. Andrés Alberto
Elaboró Burbano. Revisó Aprobó
Muñoz. Narváez Sánchez.
-Arvey Campo
-Jorge Rivera
-Coordinador de
sistemas
Contratista.
-Auditora
Aseguramiento de
la Calidad. -Coordinadora
Cargo Contratista Cargo Aseguramiento de la Cargo Gerente
-Ing. contratista de Calidad. Contratista.
Sistemas.
Contratista.
-Contratista
Sistemas.