Sunteți pe pagina 1din 5

Proceso: Gestión de la Información y

Código: GIN-GI-PD12
Comunicaciones
Subproceso: Sistemas de Información Versión: 0
Nombre del
documento: Procedimiento de Gestión y Minería de
Datos Página: Página 1 de 5
FO-PCA-05

1. OBJETIVO

Establecer las actividades y los responsables de la obtención de información oportuna, veraz, clara
y conciliada a través del análisis, implementación, socialización y seguimiento de la información por
medio de descubrimiento de conocimiento en bases de datos – KDD, en la plataforma tecnológica
del Hospital Universitario San José de Popayán E.S.E.

2. ALCANCE

Desde: Identificar el patrón de comportamiento de la información detectado.

Hasta: Brindar soluciones y descubrir información novedosa e innovadora.

3. RESPONSABLES

 Ingenieros del proceso de Sistemas de Información


 Coordinador de Sistemas de Información

4. REQUERIMIENTOS

Legales:
 Manual de Acreditación en Salud Ambulatorio y Hospitalario Colombia (Res. 123).
 Registro Nacional de Bases de Datos (Decreto 886 de 2014).
 En el artículo 10 del Decreto 1377 de 2013. Expedido por el Ministerio de Comercio,
Industria y Turismo.
 Protección de datos Personales (Ley 1581 de 2012).
 Por la cual se dictan las disposiciones generales del hábeas data y se regula el manejo de
la información contenida en bases de datos personales, en especial la financiera, crediticia,
comercial, de servicios y la proveniente de terceros países y se dictan otras disposiciones.
(Ley 1266 de 2008).
 Por la cual se regula la realización de los Censos de Población y Vivienda en todo el
territorio nacional. (Ley 79 de 1993).

5. DEFINICIONES

5.1 Bodega de Datos (Data warehouse): Es una base de datos corporativa que se caracteriza por
integrar y depurar información de una o más fuentes distintas, para luego procesarla
permitiendo su análisis desde infinidad de perspectivas y con grandes velocidades de
respuesta. La creación de un datawarehouse representa en la mayoría de las ocasiones el
primer paso, desde el punto de vista técnico, para implantar una solución completa y fiable de
Business Intelligence.

5.2 Inteligencia Empresarial, o Inteligencia de Negocios (Business Intelligence): Uso de la


información partiendo de los datos de una organización para facilitar la toma de decisiones,
con anticipación; ayuda a la organización en:
Proceso: Gestión de la Información y
Código: GIN-GI-PD12
Comunicaciones
Subproceso: Sistemas de Información Versión: 0
Nombre del
documento: Procedimiento de Gestión y Minería de
Datos Página: Página 2 de 5
FO-PCA-05

 Minimizar el tiempo requerido para recolectar toda la información de negocios


importante.
 Descubrir información no evidente a partir de sus datos operativos.
 Proporcionar herramientas de análisis para hacer comparaciones y tomar decisiones
inteligentes.
 Cerrar el circuito de la decisión a la acción.

5.3 Sistema Gestor de Base de Datos (SGBD): Es el software que permite la utilización y/o la
actualización de los datos almacenados en una (o varias) base(s) de datos por uno o varios
usuarios desde diferentes puntos de vista. El objetivo fundamental consiste en suministrar al
usuario las herramientas que le permitan manipular, en términos abstractos, los datos, o sea,
de forma que no le sea necesario conocer el modo de almacenamiento de los datos en la
computadora, ni el método de acceso empleado.

5.4 Software: es un programa o conjunto de programas de cómputo que incluye datos,


procedimientos y pautas, que permite realizar distintas tareas en un sistema informático.

5.5 El DBMS : Database management system (DBMS): es un conjunto de programas que se


encargan de manejar la creación y todos los accesos a las bases de datos, está compuesto
por:

DDL: Lenguaje de Definición de Datos


DML: Lenguaje de Manipulación de Datos
SQL: Lenguaje de Consulta.

5.6 Base de Datos: Conjunto integrado de conceptos relacionados entre ellos y sus restricciones
entre ellos. Las bases de datos incluyen atributos, entidades, relaciones.
 Atributos: son campos de datos que pertenecen a una entidad.
 Entidades: es la representación de un objeto o concepto del mundo real que se describe en
una base de datos.
 Relaciones: En bases de datos, una relación o vínculo entre dos o más entidades describe
alguna interacción entre las mismas.

5.7 Lenguaje de Consulta Estructurado -Structured Query Language -Sql: se utiliza para definir,
consultar y actualizar la base de datos, y es el más popular de su estilo. La estructura básica
para consultas en SQL es select-from-where. Conceptualmente, SQL es un lenguaje de
definición de datos (LDD), un lenguaje de definiciones de vistas (LDV) y un lenguaje de
manipulación de datos (LMD), que posee también capacidad para especificar restricciones y
evolución de esquemas.

5.8 Descubrimiento de Conocimiento en Bases de Datos –KDD-Knowledge Discovery in


Databases: es un proceso no trivial de identificación de patrones válidos, novedosos,
potencialmente útiles y entendibles al usuario a partir de los datos.

5.9 Etapas del Proceso KDD:


Proceso: Gestión de la Información y
Código: GIN-GI-PD12
Comunicaciones
Subproceso: Sistemas de Información Versión: 0
Nombre del
documento: Procedimiento de Gestión y Minería de
Datos Página: Página 3 de 5
FO-PCA-05

 Selección:
Que datos se van a realizar para el proceso de descubrimiento. Identificación e integración
de fuentes internas y externas de datos.
 Preprocesamiento:
- Limpieza de datos/data cleaning.
- Datos Ruidosos/noisy data: Valores que están significativamente fuera del rango de valores
esperado (outliers) por errores humanos, cambios en el sistema, información no disponible
a tiempo, fuentes heterogéneas de datos. Se ignoran o eliminan y se usan técnicas
estadísticas para el reemplazo (media, moda, mediana, desviación estándar, etc).
- Datos Faltantes o Perdidos: Datos empty: No le corresponde un valor en el mundo real. Ej.
La cesárea en hombres. Datos missing: Tiene un valor que no fue capturado. En el
proceso de limpieza se ignoran o eliminan, se reemplazan por defecto, se usan métricas
(media, mínimo, varianza, etc).
 Transformación:
Construcción de nuevos atributos a partir de los originales por binarización, transformación
de valores numéricos en atributos discretos o nominales, reducciones horizontales y
verticales de datos, eliminación de duplicados, eliminación de llaves, eliminación de
columnas que dependan funcionalmente. Ej edad y fecha de nacimiento.
 Minería de Datos(Data Mining):
- Descubrimiento de patrones insospechados.
- Determinar qué tipo de tarea de minería de datos es el más apropiado.
- Elegir el tipo de modelo
- Elegir el algoritmo de minería que resuelva la tarea y construya el modelo buscado.
- Un patrón: “Las personas que compran productos de buceo son candidatas a vacaciones
en Australia”.
 Interpretación/Evaluación:
- Interpretación de los patrones y posible retorno a alguno de las etapas anteriores para una
adicional iteración.
- Consolidación del conocimiento descubierto.
- Incorporar este conocimiento al rendimiento del sistema.
- Documentarlo en un reporte para las partes interesadas.
- Contrastar potenciales conflictos con conocimiento previamente obtenido.

6. RECOMENDACIONES GENERALES

 Las solicitudes que se responderán por medio de la minería de datos están relacionadas con
tendencias, patrones de comportamiento, causalidad.

 Analizando indicadores, reportes y demás conjunto de datos se detectan cambios o


desviaciones no esperadas en la información.

7. DESARROLLO DE ACTIVIDADES
Proceso: Gestión de la Información y
Código: GIN-GI-PD12
Comunicaciones
Subproceso: Sistemas de Información Versión: 0
Nombre del
documento: Procedimiento de Gestión y Minería de
Datos Página: Página 4 de 5
FO-PCA-05

DESCRIPCIÓN DE ACTIVIDADES
QUIEN LO DEBE CUANDO LO DOCUMENTO
NO DIAGRAMA DE FLUJO COMO SE HACE
HACER DEBE HACER GENERADO
1 INICIO 1.1.Analizando indicadores, Ingeniero Cuando se N/A
reportes y demás conjunto de Sistemas de detectan
datos. Información. desviaciones de
Identificar el patrón de
comportamiento de la información
información detectado.

2 Seleccionar los 2.1.Identificando las variables a Ingeniero Cuando se N/A


trabajar Sistemas de identifiquen los
conjuntos de datos
Información. datos a trabajar
3 Analizar las 3.1.Por medio de un sistema Ingeniero Cuando se Script SQL
propiedades de los para la gestión de base de Sistemas de analizan los datos
datos. datos. Información.
Script SQL

4 4.1.A través de una limpieza de Ingeniero Cuando se Base de datos


Pre-procesar el datos buscando datos nulos, Sistemas de procesen los depurada.
conjunto de datos. datos ruidosos que se Información. datos.
Base de datos encuentran fuera de rango, que
depurada.
no corresponden o digitados
incorrectamente por el usuario.
5 5.1.Por medio de eliminación de Ingeniero Cuando se Base de datos
Transformar el conjunto datos duplicados, llaves y Sistemas de encuentren datos depurada.
de datos de entrada. columnas que dependan Información. que dependan
Base de datos funcionalmente. funcionalmente.
depurada.

6 6.1.Para el análisis de los datos Ingeniero Cuando se N/A


Seleccionar y aplicar dependerá del tipo de dato Sistemas de obtienen datos
la técnica de minería (numérico, categórico). Se Información. limpios y listos
de datos. selecciona un método y un para aplicarle las
modelo a aplicar en la técnicas y
búsqueda de patrones en los algoritmos.
datos.
7 7.1.Identificando un modelo de Ingeniero Cuando se aplique N/A
Extraer conocimiento. conocimiento que permita Sistemas de la técnica de
identificar patrones de Información. minería de datos
comportamiento observados en
las variables del problema.
8 Interpretar y evaluar 8.1.Se da una interpretación a Ingeniero Cuando los datos N/A
los datos. las conclusiones que arroja el Sistemas de son los correctos.
modelo si son válidas y Información.
satisfactorias; y si no se alcanza
el resultado esperado es
necesario retomar alguna de las
etapas anteriores.
9 Analizar el modelo 9.1.Implementando un informe, Ingeniero Cuando la Informe,
obtenido para su reporte o indicador en el tablero Sistemas de información está reporte o
integración con el de mando con los filtros Información. completa. indicador en el
sistema de información deseados para agilizar la tablero de
institucional. búsqueda y tener una mejor mando.
Informe de reporte visualización de la información.
de indicadores

FIN
Proceso: Gestión de la Información y
Código: GIN-GI-PD12
Comunicaciones
Subproceso: Sistemas de Información Versión: 0
Nombre del
documento: Procedimiento de Gestión y Minería de
Datos Página: Página 5 de 5
FO-PCA-05

-Leandro Rosero
-Yuli Ibeth potosí
-Ing. Viviana Chávez -Dr. Andrés Alberto
Elaboró Burbano. Revisó Aprobó
Muñoz. Narváez Sánchez.
-Arvey Campo
-Jorge Rivera
-Coordinador de
sistemas
Contratista.
-Auditora
Aseguramiento de
la Calidad. -Coordinadora
Cargo Contratista Cargo Aseguramiento de la Cargo Gerente
-Ing. contratista de Calidad. Contratista.
Sistemas.
Contratista.
-Contratista
Sistemas.

Firma Firma Firma

Fecha Fecha Fecha


GESTIÓN DOCUMENTAL
Sandra Ximena Ingeniera Industrial
Nombre: Montilla Díaz. Cargo Contratista Oficina de Firma:
Planeación.

S-ar putea să vă placă și