Sunteți pe pagina 1din 40

PROYECTO DE GRADO

Presentado ante la ilustre UNIVERSIDAD DE LOS ANDES como requisito parcial para
obtener el Ttulo de INGENIERO DE SISTEMAS

IMPLEMENTACIN DE UN SISTEMA DE INTELIGENCIA DE NEGOCIOS,


BASADO EN MINERA DE DATOS, PARA LA GERENCIA DE UNA PYME
Por
Br. Ivany Arelln Lozano
Tutor: Profesor Lus Alfonso Dvila
Octubre 2006

2006 Universidad de Los Andes Mrida, Venezuela

ii

Implementacin de un Sistema de Inteligencia de Negocios, basado en


minera de datos, para la Gerencia de una PyME
Br. Ivany Arelln Lozano
Proyecto de Grado Investigacin de operaciones 173 pginas
Resumen: En este proyecto se presenta el desarrollo e implementacin de un Sistema de
Inteligencia de Negocios basado en Minera de Datos para la gerencia de una PyME del rea de la
Construccin. Utilizando tcnicas de Minera de Datos en un DataWarehouse (bodega de datos con
hechos histricos y transacciones rudimentarias de la PyME, Caso de Estudio) se obtuvieron modelos
descriptivos para la representacin de la situacin actual de la empresa y modelos predictivos para la
clasificacin de clientes, productos y vendedores de la empresa. Se utilizaron tcnicas de Anlisis
Multivariante (cluster Anlisis) y Mquina de Vector Soporte aportadas por la herramienta Weka 3.4 y
Redes Neuronales entrenadas con Algoritmos Genticos utilizando el software NeuroSolutions 5.0. El
Sistema de Inteligencia de Negocios desarrollado utilizando el software Infomaker 8.0, facilita a usuarios
de los Niveles Gerenciales Operativo, Tctico y Estratgico, la consulta a travs de formularios,
grficos, reportes de resultados de la aplicacin de Minera de datos para dar soporte a la toma de
decisiones en la aprobacin de crditos de sus clientes, rotacin del inventario de sus productos y
calificacin del desempeo de sus vendedores.
Palabras clave: Inteligencia de Negocios, Minera de Datos, Sistemas de Soporte a las Decisiones

ii

iii

ndice
ndice..................................................................................................................... ii
ndice de Figuras.vii
ndice de Pantallas.x
ndice de Tablas..xii
Introduccin......xv
Captulo 1

Identificacin del Proyecto

1.1

Antecedentes y motivacin.....2

1.2

Identificacin de la organizacin caso en estudio


1.2.1. Qu es una Pyme?.............................................................................3
1.2.2. Determinacin de la clasificacin de la empresa en estudio.....4
1.2.3. Importancia de Pyme en el sector construccin..5

1.3

Objetivos
1.3.1. Objetivo general del proyecto..6
1.3.2. Objetivos Especficos del proyecto...6
1.3.3. Factibilidad Tecnolgica..7
1.4.1. Sistema manejador de base de datos .....7
1.4.2. Sistema o Software para realizar las tareas de minera de datos.7
1.4.3. Sistema o Software para realizar inteligencia de negocios.......9

1.4

Delimitacin del proyecto.11

Captulo 2
2.1

Marco Terico

Inteligencia de Negocios....12
2.1.1 Definiciones..12

iii

iv
2.1.1.1 Que son datos?....................................................................12
2.1.1.2 Qu es informacin?..............................................................13
2.1.2

2.2

Sistemas de informacin...13
2.1.2.1

Qu son los sistemas de informacin?.........................................13

2.1.2.2

Tipos de sistemas de informacin13

2.1.2.3

Administracin de datos.16

2.1.3

Administracin del conocimiento16

2.1.4

Apoyo a los sistemas de toma de decisiones.16

2.1.5

Inteligencia de Negocios...17
2.1.6.1

Qu es Inteligencia de Negocios?...............................................17

2.1.6.2

Impacto de la Inteligencia de Negocios en Las empresas...19

2.1.6.3

Ventajas para el negocio y la Inteligencia de Negocios..20

2.1.6.4

Visualizacin de datos para la Inteligencia de Negocios.21

2.1.6.5

Futuro de la Inteligencia de Negocios..22

Minera de Datos
2.2.1

Qu es minera de datos?..................................................................23

2.2.2

Arquitectura de aplicacin............................25
2.2.2.1. Que es DataWarehouse?........................................................25
2.2.2.2. Que es un Sistema OLTP?.....................................................26
2.2.2.3. Diferencias entre un Sistema de OLTP y un DataWarehouse27
2.2.2.4. Qu se entiende por Sistemas OLAP?........................................27

2.2.3

Fases de un proceso de minera de datos.28


2.2.3.1. Fase definicin del alcance y objetivos29
2.2.3.2. Fase integracin y recopilacin..30
2.2.3.3. Fase seleccin de los datos relevantes.30
2.2.3.4. Fase preprocesado y limpieza de datos...31
2.2.3.4.1.Identificacin y conversin de atributos..............31
2.2.3.4.2. Conversin de tipos de variables32
2.2.3.5. Fase de transformacin de los datos...32

iv

v
2.2.3.6. Fase del uso de los algoritmos de minera de datos.....................33
2.2.3.7. Fase interpretacin de los resultados35
2.2.3.8. Fase de difusin, uso y monitorizacin.36
2.2.4

Dificultades en la aplicacin de minera de datos.36

2.2.5

Tcnicas y algoritmos de minera de datos.............................37

2.3 Algoritmos y tcnicas de Minera de Datos utilizados en la realizacin del proyecto38


2.3.1

Cluster38

2.3.2

Seleccin de atributos..39

2.3.3

Reglas de asociacin.39

2.3.4

Redes neuronales biolgicas..40


2.3.4.1

Redes Neuronales Artificiales. Analoga con las Redes Biolgicas..41

2.3.4.2

Estructura y formas de interconexin....44

2.3.4.3

Mecanismos de aprendizaje...45

2.3.5 Mquinas de Vectores Soporte46


2.4 Parmetros utilizados en la seleccin del modelo predictivo y descriptivo de las variables
objetivo en la Minera de Datos.48
Capitulo 3 Desarrollo de la Aplicacin
3.1 Aplicacin de Minera de Datos.........51
3.1.1

Fase integracin y recopilacin de datos..52

3.1.2

Fase seleccin de los datos relevantes..53

3.1.3

Reconocimiento y exploracin de los datos.55

3.1.4

3.1.3.1

Productos.56

3.1.3.2

Clientes...59

3.1.3.3

Vendedores..62

3.1.3.4

Grficos de dispersin...64

Fase preprocesado y limpieza de datos66

vi
3.1.5

3.1.6

Fase de transformacin de los datos....67


3.1.5.1

Creacin de Datos derivados necesarios para realizar el estudio.67

3.1.5.2

Transformacin de la distribucin de los datos.67

3.1.5.3

Discretizacin de atributos del DataWarehouse...68

3.1.5.4

Cluster de atributos del DataWarehouse....75

3.1.5.5

Seleccin de atributos......75

Fase del uso de los algoritmos de Minera de Datos.....81


3.1.6.1 Aplicacin de algoritmos para obtencin de modelos descriptivos...81
3.1.6.2 Aplicacin de algoritmos para obtencin de modelos predictivos.86

3.2 Fase de implementacin del Sistema de Inteligencia de Negocios.........101


Capitulo 4 Fase de Anlisis de Resultados del Proceso de Minera de Datos
4.1 Datos...109
4.2 Minera de Datos..110
4.2.1 Modelos Descriptivos..110
4.2.2 Modelos Predictivos115
4.3 Requerimientos Tecnolgicos para Implementacin del Sistema...119
Capitulo 5 Descripcin del Sistema de Inteligencia de Negocios
5.1 Acceso a la Aplicacin.120
5.1.1 Nivel Operativo............121
5.1.1.1 CLIENTES....122
5.1.1.2 PRODUCTOS...123
5.1.1.3 VENDEDORES.....125
5.1.2 Nivel Tctico.....127
5.1.2.1 CLIENTES...........127
5.1.2.2 PRODUCTOS...130
5.1.2.3 VENDEDORES..133

vi

vii
5.1.3 Nivel Estratgico136
5.1.3.1 CLIENTES.........136
5.1.3.2 PRODUCTOS.141
5.1.3.3 VENDEDORES145
Conclusiones

Recomendaciones......150
Refetencias Bibliografcas................................................................................................ 152

vii

viii

ndice de Figuras
Figura 2.1

Clasificacin de Sistemas, atendiendo al nivel organizacional

15

Figura 2.2

Proceso de Inteligencia de Negocios..

17

Figura 2.3

Descubrimiento de Conocimiento en Bases de Datos KDD.

24

Figura 2.4

Datawarehouse. 25

Figura 2.5

Diferencia DataWarehouse y OLTP...

26

Figura 2.6

Fases de un Proceso de Minera de Datos

28

Figura 2.7

Neurona y conexiones sinpticas

40

Figura 2.8

Activacin y disparo de una neurona..

41

Figura 2.9

Unidad de proceso tpica..

42

Figura 2.10

Funcin sigmoidal con s = 1..

43

Figura 2.11

Modelo de red en cascada de 3 capas..

45

Figura 2.12

Transformacin del espacio de caractersticas..

46

Figura 2.13

La frontera de decisin .

47

Figura 2.14

Vectores Soporte.

47

Figura 3.1

Almacenamiento del DataWarehouse

52

Figura 3.2

Ventana exploracin de la variable precio del producto..

56

Figura 3.3

Matriz de dispersin de atributos de producto

64

Figura 3.4

Matriz de dispersin de atributos de cliente

65

Figura 3.5:

Matriz de dispersin de atributos de vendedores.

66

Figura 3.6

Intervalos de discretizacin precio producto

68

Figura 3.7

Intervalos de Discretizacin Costo producto...

69

Figura 3.8

Intervalos de Discretizacin promedio producto.

69

Figura 3.9

Intervalos de Discretizacin precio mnimo producto de la competencia

70

Figura 3.10

Intervalos de Discretizacin precio mximo producto de la competencia

70

Figura 3.11

Intervalos de Discretizacin morosidad promedio del cliente..

71

Figura 3.12

Intervalos de Discretizacin referencia bancaria del cliente.

71

viii

ix
Figura 3.13

Intervalos de Discretizacin crdito bancario del cliente..

72

Figura 3.14

Intervalos de Discretizacin referencia comercial del cliente

72

Figura 3.15

Intervalos de Discretizacin deuda del cliente.

73

Figura 3.16

Intervalos de Discretizacin deuda del cliente

73

Figura 3.17

Intervalos de Discretizacin pronto pago del cliente

73

Figura 3.18

Intervalos de Discretizacin Antigedad del cliente

74

Figura 3.19

Intervalos de Discretizacin Volumen de ventas.

74

Figura 3.20

Intervalos de Discretizacin Aos de experiencia ingreso del vendedor.

74

Figura 3.21

Intervalos de Discretizacin Aos de antigedad del vendedor.

75

Figura 3.22

Seleccin de Atributos en WEKA.

88

Figura 3.23

Archivo de salida de WEKA de Seleccin de Atributos. 89

Figura 3.24

Arquitectura Red Neuronal modelo WEKA

90

Figura 3.25

Pesos de la Red WEKA entrenada..

91

Figura 3.26

Red Neuronal final ..

91

Figura 3.27

Inspector capa entrada a la red en Neurosolutions

92

Figura 3.28

Inspector capa salida de la red en Neurosolutions

92

Figura 3.29

Proceso de Simulacin..

93

Figura 3.30

Funcin de Transferencia.

93

Figura 3.31

Arquitectura red Neuronal de clientes..

94

Figura 3.32

Arquitectura red neuronal en WEKA para variable producto..

95

Figura 3.33

Red Neuronal final para variable Productos

96

Figura 3.34

Clasificador cliente actual y deseado en mquina de vector soporte..

98

Figura 3.35

Clasificador cliente en mquina de vector soporte..

99

Figura 3.36

Proceso de implementacin del Sistema de Inteligencia de Negocios.

101

Figura 3.37

Interfaz grfica del sistema de Inteligencia de Negocios

102

Figura 3.38

Aplicacin Formulario Variable Producto...

106

Figura 4.1

Datos almacenados por la PyME

109

Figura 4.2

Parmetros de Salida del Modelos seleccionado..

116

Figura 4.3

Funcin de Costo.

117

Figura 4.4

Funcin de Optimizacin o Fitness.

117

Figura 4.5

Parmetros de Salida del Modelos seleccionado..

118

ix

x
Figura 4.6

Funcin Fitness

118

Figura 4.7

Funcin costo.

118

Figura 4.8

Medidas obtenidas del modelo.

119

Figura 4.9

Funcin costo..

119

Figura 4.10

Funcin Fitness

119

xi

ndice de Pantallas
Pantalla 5.1

Panel inicial de Interfaz grfica del sistema de Inteligencia de Negocios 120

Pantalla 5.2

Panel nivel Operativo...121

Pantalla 5.3

Panel Clientes nivel Operativo..122

Pantalla 5.4

Formulario de Clientes a nivel Operativo122

Pantalla 5.5

Reporte Decisin Tomada a nivel Estratgico.....123

Pantalla

5.6

Panel

Productos

Nivel

Operativo...123
Pantalla 5. 7

Formulario Productos Nivel Operativo.124

Pantalla 5.8

Informacin a nivel operativo de la clasificacin de productos..124

Pantalla 5.9

Informacin a nivel operativo de la Toma de Decisiones en los productos.124

Pantalla 5.10

Calidad Vs. Clase..125

Pantalla 5.11

Panel Vendedores Nivel Operativo.........126

Pantalla 5.12

Formulario Vendedores Nivel Operativo..126

Pantalla 5.13

Informacin Clasificacin de Vendedores..127

Pantalla 5.14

Informacin Toma de Decisiones acerca de Vendedores.127

Pantalla 5.15

Panel Clientes Nivel Tctico.......128

Pantalla 5.16

Panel Formulario a Nivel Tctico128

Pantalla 5.17

Panel Clasificador a Nivel Tctico129

Pantalla 5.18

Porcentaje de clientes en cada clase..129

Pantalla 5.19

Formulario Productos a Nivel Tctico..130

Pantalla 5.20

Formulario Clasificador de Productos a Nivel Tctico131

Pantalla 5.21

Calidad Vs. Clase..131

Pantalla 5.22

Porcentaje de Productos en cada Clase.132

Pantalla 5.23

Porcentaje de Productos en cada Clase segn la Preferencia133

Pantalla 5.24

Formulario Vendedores Nivel Tctico..134

Pantalla 5.25

Formulario Clasificador de Vendedores134

Pantalla 5.26

Porcentaje de Vendedores por Grado de Instruccin en cada Clase 135

Pantalla 5.27

Porcentaje de Vendedores en cada Clase..135

xi

xii
Pantalla 5.28

Panel Inicial Clientes Nivel Estratgico.136

Pantalla 5.29

Formulario Clientes a Nivel Estratgico137

Pantalla 5.30

Reporte de Clientes perteneciente a la clase de Alto Riesgo.......137

Pantalla 5.31

Reporte de Clientes perteneciente a la clase de Bajo Riesgo138

Pantalla 5.32

Reporte de Clientes perteneciente a la clase de Medio Riesgo.138

Pantalla 5.33

Compra Promedio de los clientes en la PyME139

Pantalla 5.34

Fidelidad del cliente en la PyME..140

Pantalla 5.35

Referencia Bancaria del Cliente140

Pantalla 5.36

Formulario Productos a nivel estratgico.....141

Pantalla 5.37

Porcentaje de Productos segn la calidad y la Preferencia...143

Pantalla 5.38

Reporte caractersticas de los Productos...143

Pantalla 5.39

Reporte del Costo y el Precio de los Productos.144

Pantalla 5.40

Reporte de Productos de Bajo ndice de Rotacin..144

Pantalla 5.41

Reporte de Productos de Alto ndice de Rotacin.145

Pantalla 5.42

Reporte de Productos de Medio ndice de Rotacin..146

Pantalla 5.43

Formulario Vendedores a nivel estratgico146

Pantalla 5.44

Porcentaje de Vendedores por Grado de Instruccin .147

Pantalla 5.45

Porcentaje de Vendedores segn al trato el cliente en cada clase.148

Pantalla 5. 46

Reporte de Vendedores Grado de Instruccin..148

Pantalla 5.47

Reporte Vendedores de Alto Desempeo.148

Pantalla 5.48

Reporte Vendedores de Desempeo Medio..149

Pantalla 5.49 Reporte Vendedores de Bajo Desempeo..149

xii

xiii

ndice de Tablas
Tabla 1.1

Inversiones requeridas segn la CVC para el 2005-2009

Tabla 3.1

Atributos relevantes de la variable producto.

53

Tabla 3.2

Atributos relevantes de la variable vendedor

54

Tabla 3.3

Atributos relevantes de la variable cliente

55

Tabla 3.4

Histograma variable Precio Producto..

57

Tabla 3.5

Caractersticas de los atributos numricos de la variable Producto.

57

Tabla 3.6

Histograma variable Costo Producto...

57

Tabla 3.7

Histograma variable Pedido Promedio del Producto..

58

Tabla 3.8

Histograma variable Precio Mnimo de la Competencia.

58

Tabla 3.9

Histograma variable Precio Mximo de la Competencia

58

Tabla 3.10

Caractersticas de los atributos categricos de la variable producto.

58

Tabla 3.11

Frecuencia Variable Calidad del Producto.

59

Tabla 3.12

Frecuencia Variable Preferencia del Producto

59

Tabla 3.13

Caractersticas de la variable Moro Promedio del Cliente

50

Tabla 3.14

Histograma variable Promedio del Cliente

60

Tabla 3.15

Histograma variable Referencia Bancaria del Cliente..

60

Tabla 3.16

Histograma variable crdito bancario del cliente

60

Tabla 3.17

Histograma variable Referencia Comercial del Cliente

61

Tabla 3.18

Histograma variable deuda del Cliente..

61

Tabla 3.19

Histograma variable Compra Promedio del Cliente

61

Tabla 3.20

Histograma variable Pronto Pago del Cliente.

62

Tabla 3.21

Caractersticas de los atributos numricos de la variable vendedor...

62

xiii

xiv
Tabla 3.22

Histograma variable Pronto sueldo base del vendedor

62

Tabla 3.23

Histograma variable aos de experiencia del vendedor..

62

Tabla 3.24

Histograma variable Volumen de ventas del vendedor...

63

Tabla 3.25

Caractersticas de los atributos categricos de la variable vendedores..

63

Tabla 3.26

Frecuencia Variable Grado de Instruccin del vendedor..

63

Tabla 3.27

Frecuencia Variable Trato Cliente vendedor.

68

Tabla 3.28

Discretizacin precio producto..

69

Tabla 3.29

Discretizacin Costo producto

69

Tabla 3.30

Discretizacin promedio producto..

70

Tabla 3.31

Discretizacin precio mnimo producto de la competencia ..

70

Tabla 3.32

Discretizacin precio mximo producto de la competencia

70

Tabla 3.33

Discretizacin moro promedio del cliente.

71

Tabla 3.34

Discretizacin referencia bancaria del cliente.

71

Tabla 3.35

Discretizacin referencia crdito bancario del cliente.

72

Tabla 3.36

Discretizacin referencia comercial del cliente

72

Tabla 3.37

Discretizacin deuda del cliente..

72

Tabla 3.38

Discretizacin compra promedio del cliente del cliente..

73

Tabla 3.39

Discretizacin pronto pago del cliente..

73

Tabla 3.40

Discretizacin Antigedad del cliente

73

Tabla 3.41

Discretizacin Volumen de ventas

74

Tabla 3.42

Discretizacin Aos de experiencia ingreso del vendedor

74

Tabla 3.43

Discretizacin Aos de antigedad del vendedor

75

Tabla 3.44

Seleccin de atributos de la variable producto por mtodos evaluadores de 76


subconjuntos

Tabla 3.45

Seleccin de atributos de la variable producto por mtodos prorrateadotes..

77

Tabla 3.46

Seleccin de atributos de la variable vendedores por mtodos evaluadores de 78


subconjuntos..

Tabla 3.47

Seleccin de atributos de la variable vendedores por mtodos prorrateadotes

78

Tabla 3.48

S Seleccin de atributos de la variable clientes por mtodos evaluadores de

79

subconjuntos.
Tabla 3.49

Seleccin de atributos de la variable clientes por mtodos envolventes

80

Tabla 3.50

Modelo Red Neuronal con Algoritmos Genticos .

96

Tabla 3.51

Caractersticas de la Red Neuronal Obtenida en WEKA.

97

xiv

xv
Tabla 3.52

Caractersticas de la Red Neuronal Obtenida en NeuroSolutions.

97

Tabla 3.53

Neuronas de salida para clasificacin de vendedores.

97

Tabla 3.54

Informacin de Clientes

103

Tabla 3.55

Informacin de Productos

103

Tabla 3.56

Informacin de Vendedores ..

103

Tabla 5.57

Distribucin Informacin nivel operativo

106

Tabla 5.58

Distribucin Informacin nivel tctico

107

Tabla 5.59

Distribucin Informacin nivel estratgico..

107

Tabla 4.1

Discretizacin precio producto..

110

Tabla 4.2

Discretizacin Costo producto.

110

Tabla 4.3

Discretizacin pedido promedio producto.

111

Tabla 4.4

Discretizacin precio mnimo producto de la competencia .

111

Tabla 4.5

Discretizacin precio mximo producto de la competencia.

111

Tabla 4.6

Discretizacin Aos de experiencia ingreso del vendedor.

112

Tabla 4.7

Discretizacin volumen de ventas del vendedor.

112

Tabla 4.8

Discretizacin antigedad del vendedor..

112

Tabla 4.9

Discretizacin sueldo base del vendedor.

112

Tabla 4.10

Discretizacin moro promedio del cliente..

113

Tabla 4.11

Discretizacin referencia bancaria del cliente..

113

Tabla 4.12

Discretizacin referencia crdito bancario del cliente

113

Tabla 4.13

Discretizacin referencia comercial del cliente.

114

Tabla 4.14

Discretizacin deuda del cliente.

114

Tabla 4.15

Discretizacin compra promedio del cliente del cliente

114

Tabla 4.16

Discretizacin pronto pago del cliente

114

Tabla 4.17

Discretizacin Antigedad del cliente.

115

Tabla 4.18

Comparacin de los modelos predictivos..

116

Tabla 4.19

Comparacin de los modelos predictivos para la variable producto

117

Tabla 4.20

Comparacin de los modelos predictivos para la variable producto

118

xv

xvi

Introduccin
El anlisis de datos en las empresas, ha sido desde el inicio de stas, una prctica cotidiana. El
proceso de toma de decisiones dentro de las organizaciones ha tenido significativos cambios en las
ltimas dcadas. La llegada de herramientas tecnolgicas para el soporte a la toma de decisiones ha
facilitado esta tarea a los niveles intermedios y estratgicos de la organizacin.
Actualmente el uso de los sistemas de soporte a las decisiones gerenciales se ha extendido por
su capacidad para analizar grandes volmenes de datos y presentar en resumen esta informacin. La
informacin que tpicamente puede recopilar y mostrar una aplicacin de soporte a la decisin incluye
todos los datos almacenados en la empresa que van desde fuentes externas hasta bases de datos
relacionales, DataWarehouse o almacenes de datos. La informacin resultado es presentada en
esquemas grficos de tal manera que sean de fcil comprensin an para los usuarios que no estn muy
familiarizados con sistemas computacionales.
Hoy en da surgen sistemas de informacin que soportan la toma de decisiones conocida como
Inteligencia de Negocios o BI por sus siglas en ingls (Business Intelligence) que puede ser definida
como "una combinacin de tecnologas de coleccin de datos y manejo de informacin, que
implementa soluciones orientadas al usuario final para apoyar la toma de decisiones, aprovechando la
informacin estratgica disponible en cualquier parte de la organizacin." [Mendoza A., 2006. BITAM].
A lo largo del tiempo, en el desarrollo de sistemas, se ha tratado de dar solucin a esa necesidad
intrnseca de los altos mandos gerenciales, acerca de poseer la informacin de manera resumida o
digerida, que permita de un modo corto y rpido, darse cuenta de todo lo que pasa en los sistemas
transaccionales de los niveles bajos de la empresa. Sin embargo, esto ya no es suficiente ya que
actualmente se requiere conocer lo que sucede en todos y cada uno de los procesos, tanto crticos como

xvi

xvii
triviales, que se originan en una empresa o negocio, ya que es el conocimiento de stos lo que da una
visin clara de lo que ocurre en ella.
El presente proyecto tiene como objetivo implementar un Sistema de Inteligencia de Negocios
como mecanismo de soporte a la tarea de toma de decisiones y planeamiento estratgico empresarial en
la gerencia de una PyME, utilizando tcnicas de Minera de Datos, para el procesamiento de los datos
almacenados en un DataWarehouse que permita obtener informacin sobre patrones de
comportamiento de sus clientes, vendedores y productos, para convertirla en conocimiento til para el
anlisis de crditos, rotacin del inventario y promocin de vendedores.
En el captulo 1, se presentan los antecedentes y los hechos que motivaron a la realizacin de
este proyecto, una breve descripcin de la empresa Pyme en estudio, la importancia del sector
Construccin en la sociedad venezolana, los objetivos, factibilidad tecnolgica y delimitacin del
proyecto.
En el captulo 2, se presenta un resumen de la teora referente a Inteligencia de Negocios y
Minera de datos. El propsito del captulo es proveer los conocimientos tericos necesarios, algoritmos
y tcnicas utilizadas para la realizacin de este proyecto.
En el captulo 3 se explica el desarrollo del Sistema de Inteligencia de Negocios en dos partes;
una primera referente a la aplicacin de la fases del proceso de minera de datos en la PyME para la
obtencin de modelos descriptivos y predictivos. Una Segunda parte referente al desarrollo de la
aplicacin informtica y su implementacin en la PyME.
En el captulo 4 se presentan y analizan los resultados alcanzados en el proceso de obtencin de
datos, aplicacin de tcnicas de minera de datos.
En el captulo 5 se presenta la aplicacin final obtenida durante la realizacin del proyecto,
herramienta que se ofrece como un sistema de soporte a la tarea de toma de decisiones en los diversos
niveles gerenciales de la PyMe en estudio.
Finalmente se presentan las Conclusiones y Recomendaciones.

xvii

Captulo 1
Identificacin del Proyecto
En el presente captulo se identifica el proyecto presentando los antecedentes y motivacin para su
realizacin, se identifica la empresa caso de estudio seleccionada, as como los objetivos del trabajo, la
factibilidad tecnolgica de desarrollo del sistema y la delimitacin del proyecto.

1.1 Antecedentes y Motivacin


Vivimos en una poca en que la informacin es la clave para obtener una ventaja competitiva en el
mundo de los negocios. Para que una empresa se mantenga competitiva, los gerentes requieren de un
acceso rpido y fcil a informacin til y valiosa de la misma. Los principales problemas que afronta la
toma de decisiones en el mbito de los negocios, es la alta complejidad de informacin que est inmersa
en ella. Adems, el escaso tiempo para el anlisis de esta informacin, complica el hecho de tomar
decisiones adecuadas en un entorno sujeto a constantes cambios, ms an cuando la empresa se ve
enfrentada a situaciones, en las que se deben tomar decisiones con acierto y rapidez, que determinarn
el futuro prximo de la organizacin. Para realizar a tiempo la toma de decisiones y ser partcipes
eficaces y rentables en los mercados, las empresas requirieron de sistemas de informacin y
comunicaciones poderosos.
El presente proyecto de grado, surge de una inquietud formulada por los directivos de una PyME,
ubicada en la ciudad de Valencia, Estado Carabobo, donde bajo la direccin del profesor tutor, se han
realizado pasantas industriales, visitas tcnicas, proyectos del Seminario de Investigacin de
Operaciones y tesis de grado, as como otras actividades de consultora y asesora para el mejoramiento
del desempeo gerencial en la toma de decisiones. Entre estos trabajos podemos citar: Desarrollo de un
Sistema de Inteligencia Gerencial Competitiva (Caschetto, 2001), Modelado y Simulacin del Proceso
Productivo (Seminario de Investigacin de Operaciones, 2002), Anlisis Multivariante de Datos del

rea de Ventas (Lilimar Rusa, 2004). Estas experiencias motivaron la evaluacin de nuevas formas de
administracin y estrategias empresariales, basadas en sistemas inteligentes, como lo son los Sistemas de
Inteligencia Comercial, Sistemas de Inteligencia de Negocios y Sistemas de Inteligencia Competitiva, de
los cuales son de nuestro inters los Sistemas de Inteligencia de Negocios.
La Inteligencia de Negocios, es una alternativa tecnolgica y de administracin de negocios, que
permite manejar la informacin para la toma de decisiones acertadas en todos los niveles de la
organizacin, desde la extraccin, depuracin y transformacin de datos, hasta la explotacin y
distribucin de la informacin mediante herramientas de fcil uso para los usuarios. (Abits Colombia.
2006).
Los mtodos tradicionales de Anlisis de Datos incluyen el trabajo con variables estadsticas, varianza,
desviacin estndar, covarianza y correlacin entre los atributos; anlisis de componentes principales,
anlisis de factores, anlisis de clusters, anlisis de regresin, anlisis de los discriminantes [Michalski et
al., 1982]. Todos estos mtodos estn orientados numricamente. Son esencialmente cuantitativos.
En contraposicin, sistemas inteligentes, como los Sistemas de Inteligencia de Negocios, basados en
DataWarehouse permiten obtener resultados de anlisis de la masa de datos que los mtodos
convencionales no logran, entre ellos se encuentran:
La Minera de Datos: proceso de extraer conocimiento til y comprensible, previamente
desconocido, de cantidades de datos almacenados en distintos formatos. [Witten & Frank 2000]. Es la
bsqueda de patrones interesantes y de regularidades importantes en grandes bases de datos [Fayad
1996; Grossman 1999]. Al hablar de minera de datos inteligente [Evangelos, 1996, Michalski 1998] nos
referimos especficamente a la aplicacin de mtodos de aprendizaje automtico u otros mtodos
similares, para descubrir y enumerar patrones presentes en los datos. Entre los problemas abordados en
este campo, est el de inducir conocimientos a partir de datos o ejemplos [Michalski, 1983; Michie,
1988; Michalski, 1991; Garca Martnez, 1994]. Esto resulta una alternativa de solucin a problemas
que no pueden ser resueltos mediante algoritmos tradicionales, entre los cuales podemos mencionar
identificacin de caractersticas que permitan reconocimiento visual de objetos, descubrimiento de
patrones o regularidades en estructuras de informacin (en particular en bases de datos de gran
tamao), entre otros.

1.2 Identificacin de la Organizacin caso en estudio


La empresa seleccionada para la implementacin del Sistema de Inteligencia de Negocios, es una PyME
dedicada a la produccin y venta de insumos para el sector construccin, est ubicada en la ciudad de
Valencia y se identifica a travs del nombre de Corporacin Ferro-industrial Venezolana Compaa
Annima. La organizacin caso de estudio pertenece al grupo de empresas PyME por lo que se
consider apropiado definir La Pequea y Mediana Empresa (PYME) con sus respectivas caractersticas
e importancia social.

1.2.1 Qu es una PyME?


No es fcil especificar que empresa es exactamente una PyME. Generalmente los criterios para definir
una PyME se han relacionado al nmero de trabajadores, tamao de la produccin, volumen de las
ventas, origen de capital, organizacin del trabajo, destino de los productos, redes de produccin, uso
de tecnologa, tipo de gestin, giro de actividad, impacto en la economa, etc. Estos factores o criterios
son establecidos en el marco legal del pas. En general tienen un nmero reducido de trabajadores, y
cuya facturacin es moderada. (Tunal S., Gerardo. 2001).
Generalmente son proveedoras de servicios y productos o insumos para grandes empresas o
directamente abastecedoras de parte del mercado interno. Segn sean las polticas econmicas de un
pas podrn tambin participar del desafo de llevar sus bienes y servicios ms all de las fronteras.
(PortalBIOCENICO,2006).
Las diversas definiciones existentes para delimitar a las empresas segn su tamao, se basan en dos tipos
de criterios: cualitativos y cuantitativos. (J. Moneva 1993, C. Mndez 1982, J. Serra 1996, P.A. Julien
1996).
Criterios de carcter cualitativos:
Responden a caractersticas que poseen las entidades a ser clasificadas, cuyas cualidades son difciles de
valorar numricamente, entre stas podemos mencionar las siguientes:
Grado de identificacin o independencia entre la propiedad y los gestores, en

el caso de la PYME existe una estrecha relacin entre los propietarios y los dirigentes, es muy
comn encontrar situaciones donde los mismos dirigentes son a su vez los propietarios. Esta
situacin conlleva a una relacin muy directa entre la empresa y sus dueos.
Cuota de participacin de mercado, para la PyME en forma individual esta

participacin es insignificante, es decir, no posee gran presencia en mercados especficos.

Control organizativo, este tipo de cualidad se presenta poco desarrollada, en especial

en las entidades de menor tamao.


Sistema de informacin interno y externo, en este sentido la PyME suele poseer

rudimentarios sistemas de informacin, es por esto, que sus decisiones se basan ms en la


intuicin que en fundamentos formales, adems proporcionan informacin externa muy
simple.
Criterios de carcter cuantitativos:
La particularidad de estos criterios es la capacidad que poseen para ser medidos, en este sentido existen
dos grupos: uno relativo a personas y otro relativo a factores monetarios. (J. Moneva. 1993). Del
primer grupo podemos indicar los siguientes:
Nmero de empleados, accionistas o socios y nmero de clientes.
Referente a los factores monetarios podemos indicar:
Cifras de ventas o negocio.
Total de inversin.
Beneficio obtenido.
Valor aadido.

1.2.2 Determinacin de la Clasificacin de la Empresa en Estudio


En sta fase verificamos los parmetros establecidos en el marco legal para la clasificacin de la empresa
en estudio como una PyME:
Nmero Promedio Anual de Trabajadores: La empresa cuenta con una cantidad de personal
entre 50 y 80 trabajadores para la produccin y venta de insumos al sector construccin.
Ventas anuales: Aproximadamente dos billones novecientos mil bolvares (2.900.000.000 Bs.).
Tomando como base el ao 2001, en el que la unidad tributaria costaba once mil seiscientos bolvares,
(11.600 Bs.), se calcul el equivalente de las ventas anuales promedio de la empresa para ese ao, se
obtuvo que la empresa caso de estudio realiz ventas anuales entre 200.000 y 250.000 unidades tributarias.
Con estas caractersticas de la empresa, la podemos clasificar como una mediana empresa, ya que
cumple con los requisitos exigidos para catalogarla en este nivel segn el marco legal establecido.

1.2.3 Importancia de PyME en el Sector Construccin


La empresa seleccionada para la implementacin del Sistema de Inteligencia de Negocios, como se
mencion anteriormente pertenece al tipo de empresas PyME dedicada a la produccin y ventas de
insumos para el sector construccin.
La Cmara Venezolana de la Construccin (CVC) indica que en el pas se registra un dficit de
materiales para la construccin, que influye directamente en el hecho de que el sector construccin no
satisface la demanda requerida por el sector vivienda.
Segn la CVC hoy en da existen oportunidades para este sector, por varios factores entre los que cabe
destacar:
Sector vivienda en agenda
Dficit habitacional de 1.600.000 nuevas viviendas y 1.100.000 viviendas que requieren
mejoramiento
Necesidades de inversin en infraestructura: servicios pblicos y petrleo.
Las inversiones relevantes de infraestructura requeridas en el pas durante el perodo del 2004-2009 (en
miles de millones de US Dlares) son:
Tabla 1.1: Inversiones requeridas segn la CVC para el 2005-2009

De la tabla anterior podemos observar que las inversiones requeridas en el pas para el lapso 2005-2009,
se encuentran centradas en la construccin de viviendas e infraestructura social.
Hoy en da existe un dficit en el sector vivienda, de las que se necesitan:
1.600.000 viviendas nuevas 7.200.000 personas
1.100.000 viviendas que requieren mejoramiento

4.950.000 personas

Para cubrir este dficit de mejoramiento y construccin de viviendas para los ciudadanos, se requiere de
disponibilidad de materiales y recursos entre otros factores.
Exponemos lo anterior con la finalidad de mostrar en general la importancia que tienen las empresas
generadoras de insumos para el sector construccin. La empresa PyME seleccionada, genera recursos
para ste y la implementacin de un sistema de inteligencia de Negocios que le permita mejorar la tarea
de toma de decisiones y planeamiento estratgico, de una forma ms objetiva, precisa, conveniente y
concreta es lo que se pretende en el proyecto.

1.3 Objetivos
1.3.1Objetivo General del Proyecto
Implementar un Sistema de Inteligencia de Negocios como herramienta computacional de soporte a la
tarea de toma de decisiones y planeamiento estratgico empresarial en la gerencia de una PyME,
utilizando tcnicas de Minera de Datos, para el procesamiento de los datos almacenados en un
DataWarehouse que permita obtener no slo informacin o conocimiento til, sino una verdadera
inteligencia empresarial que le confiera a la organizacin ventaja competitiva en el anlisis crediticio,
rotacin de sus inventarios y calificacin del desempeo de sus vendedores.

1.3.2 Objetivos Especficos del Proyecto

Definir un marco terico que permita determinar de qu manera, los sistemas de inteligencia
de negocios pueden utilizarse para descubrir descripciones cualitativas de distintas fuentes de
informacin.

Recopilar y depurar datos de la PYME seleccionada como Empresa caso de estudio.

Aplicar las tcnicas adecuadas de Minera de Datos.

Buscar y Seleccionar Software para desarrollar un Sistema de Inteligencia de Negocios.

Implementar el Sistema de Inteligencia de Negocios utilizando Minera de Datos.

Evaluar el Sistema de Inteligencia de Negocios Implementado.

1.4

Factibilidad Tecnolgica

Los requisitos para el desarrollo e implementacin de un Sistema de Inteligencia de Negocios, basado en


Minera de Datos, para la Gerencia de una PyME se listan a continuacin, con la finalidad de exponer a
los gerentes la manera en que estos sistemas de soporte a las decisiones estn al alcance de la pequea y
mediana empresa.

Contar con informacin histrica y actual de las operaciones del negocio.

Conviccin del administrador de la empresa para Implementar un Sistema de Inteligencia de


Negocio.

Poseer un sistema manejador de base de datos.

Obtener un Sistema o Software para realizar las tareas de Minera de Datos.

Adquirir un sistema (interfaz) que exponga la informacin necesaria para que el soporte de
toma de decisiones sea tarea fcil, sencilla, resumida y amigable.

Contar con capital de inversin para desarrollo o compra del sistema.

A continuacin se especifica la tecnologa utilizada en la realizacin del proyecto.

1.4.1 Sistema manejador de base de datos:


La PyME en estudio tiene como Sistema manejador de datos el Sybase SQL AnyWhere, este software
permite compartir informacin entre distintos grupos de trabajo en la empresa y administrar sistemas
de datos a lo largo de toda la organizacin. Admite el trabajo con base de datos relacionales y trabaja en
conjunto con otras aplicaciones Sybase que permiten el fcil manejo de la informacin a travs de la
realizacin de elegantes consultas SQL, grficos y repotes. (SyBASE SQL AnyWhere Help. 2001).

1.4.2 Sistema o Software para realizar las tareas de Minera de Datos:


Para la elaboracin de las tareas de Minera de Datos, se revisaron diversos software, entre ellos
podemos mencionar:

: R es un sistema para anlisis estadsticos y grficos creado por Ross Ihaka y Robert
Gentleman. R tiene una naturaleza doble de programa y lenguaje de programacin y es considerado
como un dialecto del lenguaje S creado por los Laboratorios AT&T Bell. .
R se distribuye gratuitamente bajo los trminos de la GNU General Public Licence; su desarrollo y
distribucin son llevados a cabo por varios estadsticos conocidos como el Grupo Nuclear de Desarrollo de
R.
R est disponible en varias formas: el cdigo fuente escrito principalmente en C, esencialmente para
mquinas Unix y Linux, o como archivos binarios precompilados para Windows, Linux, Macintosh y
Alpha Unix.
Los archivos necesarios para instalar R, ya sea desde las fuentes o binarios pre-compilados, se
distribuyen desde el sitio de Internet Comprehensive R Archive Network (CRAN)

junto con las

instrucciones de instalacin.
R posee muchas funciones para anlisis estadsticos y grficos; estos ltimos pueden ser visualizados de
manera inmediata en su propia ventana y ser guardados en varios formatos. Los resultados de anlisis
estadsticos se muestran en la pantalla, y algunos resultados intermedios se pueden guardar, exportar a
un archivo, o ser utilizados en anlisis posteriores. R guarda estos resultados como un objeto, de tal
manera que se puede hacer un anlisis sin necesidad de mostrar su resultado inmediatamente. Esto
puede ser un poco extrao para el usuario, pero esta caracterstica suele ser muy til. De hecho, el
usuario puede extraer solo aquella parte de los resultados que le interesa. (Emmanuel Paradis.2005).
Lenguaje R se ha convertido en un proyecto de colaboracin entre investigadores a lo largo
del mundo, actualmente en desarrollo

WEKA: Esta ave da nombre a una extensa coleccin de algoritmos de Mquinas de


conocimiento desarrollados por la Universidad de Waikato (Nueva Zelanda) implementados en Java;
tiles para ser aplicados sobre datos mediante los interfaces que ofrece o para implantarlos dentro de
cualquier aplicacin. Weka contiene las herramientas necesarias para realizar transformaciones sobre los
datos, tareas de clasificacin, regresin, clustering, asociacin y visualizacin y muchas otras tareas

pertenecientes a las tcnicas de minera de datos. Weka est diseado como una herramienta orientada a
la extensibilidad por lo que aadir nuevas funcionalidades es una tarea sencilla.
La licencia de Weka es GPL*, lo que significa que este programa es de libre distribucin y difusin.
Adems, ya que Weka est programado en Java, es independiente de la arquitectura, ya que funciona en
cualquier plataforma sobre la que haya una mquina virtual Java disponible. (Richard Kirskby.2002).

NeuroSolutions es una herramienta grfica para el desarrollo de redes neuronales,


que combina una interfaz de diseo modular y basada en iconos con la implementacin de
procedimientos de aprendizaje avanzados y optimizacin gentica. El resultado es un entorno
prcticamente ilimitado para el diseo de redes neuronales en la investigacin y resolucin de
problemas reales. (NeuroSolution Help. 2000).
De los software anteriormente mencionados, para la realizacin de las tareas de minera de datos del
proyecto, se seleccionaron Weka y NeuroSolutions; Weka por ofrecer una biblioteca de clases de
aprendizaje en Java, muy sencilla de utilizar, de libre distribucin y difusin, que permite realizar
mltiples tareas de minera de datos a travs de una interfaz grfica sencilla e incluso permite el
desarrollo de nuevas aplicaciones. Posee una gran cantidad de libreras que se van actualizando da a da
y que pueden adquirirse directamente en el sitio Web del software desarrollado en la Universidad de
Waikato y, NeuroSolutions por ser de fcil uso y entendimiento que provee su interfaz grfica y la
posibilidad de fusionar las redes neuronales con los algoritmos genticos. Este software puede ser
utilizado

para resolver problemas tanto de

prediccin como de clasificacin a travs de la

implementacin de Redes Neuronales.

1.4.3 Sistema o Software para realizar Inteligencia de Negocios.


La plataforma de inteligencia de negocios de MicroStrategy
es una plataforma abierta, poderosa y de alto desempeo que provee una mejor comprensin acerca de
la operacin del negocio a travs de slidos anlisis de la informacin almacenada en un sistema. Es una
plataforma nica de arquitectura de inteligencia de negocios en la industria completamente integrada,

10

accesible a travs de una interfase unificada va Web extendiendo reportes y anlisis corporativos a las
masas. Provee escalabilidad de datos ilimitada permitiendo a las compaas reportar y analizar todos los
datos de la compaa pudiendo manejar terabytes de datos. Las compaas pueden llevar reportes y
anlisis haca los niveles ms bajos de transacciones y detalle. MicroStrategy le brinda a las compaas
el rango completo de funcionalidad en inteligencia de negocios y la capacidad de proveer cualquier o
todas las funciones a la poblacin corporativa de usuarios con control completamente centralizado y
economas en la administracin. (MicroStrategy. 2006).
Cognos Business Intelligence ofrece a las personas encargadas de tomar
decisiones en todos los niveles de la empresa capacidades sin precedentes para un mejor manejo del
desempeo proporcionando una visin precisa y consistente de toda la informacin de negocios. Como
producto completo y flexible, Cognos BI se integra fcilmente en infraestructuras existentes con
mltiples sistemas y fuentes de datos. Su entorno de inteligencia de negocios simplificado facilita la
interaccin del sistema con los usuarios, permite una mejor toma de decisiones y proporciona una base
slida para la inteligencia de negocios departamental y de toda la empresa. (InfonoNews. 2005)

INFOMAKER
Alcanzando ms que herramientas tradicionales de acceso a datos, InfoMaker es la herramienta completa
para acceso, administracin y reporte de datos para desarrolladores y usuarios finales. InfoMaker
permite la creacin de reportes con alta calidad de presentacin y poderosas consultas sin la
complejidad de la programacin, ste combina lo ltimo en tecnologa de acceso a informacin para una
generacin potente y flexible de reportes. Proporciona las facilidades para construir rpidamente
formatos de entrada de datos, desempea funciones de edicin y mantenimiento de la base de datos,
permite la migracin de datos de una base de datos a otra, con tan solo unos "clicks" del ratn.
InfoMaker trabaja en conjunto con el manejador de base de datos de Sybase SQL Anywhere. (SyBASE
SQL AnyWhere Help. 2001 )

10

11

1.5

Delimitacin del Proyecto

El Sistema de Inteligencia de Negocios a implementar en la empresa PyME seleccionada dedicada a la


produccin y venta de materiales para el sector construccin, englobar informacin para el soporte a la
toma de decisiones gerenciales en el mbito de segmentacin y anlisis de clientes, deteccin de clientes
importantes, anlisis de productos, anlisis de ventas y vendedores. Cabe destacar que en el proyecto no
se desarrollar un software como tal, se utilizarn software existentes; Weka y NeuroSolutions para
tareas de minera de datos e Infomaker para organizar y presentar la informacin para soporte a
decisiones.

11

12

Captulo 2
Marco Terico
En este captulo se presenta un resumen de la teora referente a Sistemas de Informacin, Inteligencia
de Negocios y Minera de datos. El propsito del captulo es proveer los conocimientos tericos
necesarios, algoritmos y tcnicas utilizadas a lo largo de la realizacin de este proyecto.

2.1 Inteligencia de Negocios


La actual revolucin tecnolgica y cientfica ha generado una disponibilidad casi infinita de informacin,
y ha hecho que sta se convierta en un elemento fundamental dentro de las organizaciones, que
persiguen alcanzar con eficacia y efectividad los objetivos que se han propuesto. Es as como hoy en da
surgen nuevas formas de administracin y estrategias de negocios, basadas en la Gestin del
Conocimiento. En realidad, lo que subyace detrs de este concepto es la bsqueda constante de
soluciones para la gestin de las organizaciones en ambientes empresariales cambiantes.

2.1.1 Definiciones
2.1.1.1

Qu son Datos?

Los datos son un conjunto de hechos discretos y objetivos relacionados con acontecimientos. En el
contexto de una organizacin, habitualmente, los datos son descritos como registros estructurados de
transacciones. Los datos slo describen una parte de lo que ha sucedido; no incluyen opiniones ni
interpretaciones, as como tampoco, bases slidas para la adopcin de medidas. Aunque la materia
prima de la adopcin de decisiones puede incluir datos, stos no tienen la capacidad de determinar
acciones a realizar en funcin de ellos. Los datos no indican nada sobre su propia importancia o

12

13

irrelevancia, sin embargo, son importantes para las organizaciones, en gran medida, porque son la
materia prima fundamental para la creacin de informacin. (Revilla H. 2004).
2.1.1.2

Qu es Informacin?

La informacin es un mensaje, generalmente en forma de documento o de una comunicacin audible o


visible, como todo mensaje tiene un emisor y un receptor. La informacin apunta a cambiar la manera
en que el receptor percibe algo, modifica su criterio y su conducta. As la informacin est destinada a
formar a la persona que la recibe, por esto es que, a diferencia de los datos, la informacin tiene
importancia. (Revilla H. 2004).
Un problema comn es la confusin entre informacin y el conocimiento con la tecnologa que la
proporciona, por ello debe quedar en claro que el medio no es el mensaje, aunque puede afectar
considerablemente a ste. El mensaje, lo que es transmitido, es ms importante que el vehculo de esa
transmisin.
Las organizaciones hoy deben aprender a tratar la informacin como un recurso fundamental, adems
de, aumentar la interaccin informacional con los clientes y propiciar una cultura de comunicacin y
compartimiento de la informacin, en donde sus miembros sean conscientes de su derecho a la
informacin y de su deber de informar al resto. (Revilla H. 2004).

2.1.2 Sistemas de Informacin


2.1.2.1

Qu son los Sistemas de Informacin?

Conjunto de componentes interrelacionados que capturan, almacenan, procesan y suministran


informacin, para que sta sea utilizada eficientemente y de esta forma soporte la toma de decisiones, el
control, anlisis y visin integral en una institucin. (Cubillos J. 2002).
2.1.2.2

Tipos de Sistemas de Informacin

En el mbito empresarial, las decisiones se toman en alguno de los tres niveles organizacionales:
estratgico, tctico u operativo. Las decisiones estratgicas se centran en la direccin del negocio a largo
plazo siendo labor de los ejecutivos de alta gerencia. Las decisiones tcticas corresponden a los gerentes
de nivel medio y se enfocan en la planeacin, anlisis y produccin de proyectos; a nivel operativo los
empleados toman decisiones cotidianas que se requieren para convertir los planes en accin.

13

14

Segn los requerimientos de informacin y su funcionalidad, las herramientas de Inteligencia de


Negocios, aplican en cada uno de los niveles de la organizacin. (Abits Colombia LTDA.2006).
Sistemas de nivel operativo:
Registran y procesan las operaciones bsicas y de rutina necesarias para el funcionamiento de la empresa
como contabilidad, inventarios, etc. Las razones del procesamiento son: registro, orden, clculo,
sntesis, almacenamiento y visualizacin de los resultados.
El nivel operativo de la organizacin es responsable de acceder a informacin crtica del negocio y tener
la capacidad de distribuir dicha informacin a los diferentes niveles de la organizacin y usuarios, para
asegurar la toma de decisiones basada en informacin exacta, confiable y oportuna que puede impactar
el desarrollo y el xito del negocio.
Los requerimientos de informacin en este nivel de la organizacin, en las diferentes reas funcionales,
estn basados en reportes operativos que respondan bsicamente preguntas predefinidas de la actividad
del negocio en un periodo determinado de tiempo. (Abits Colombia LTDA.2006).
Sistemas de nivel Tctico:
Las soluciones de Inteligencia de Negocios tiles a nivel tctico de la compaa son bsicamente
herramientas de consulta y anlisis, que permiten a los analistas y cargos medios interactuar con
informacin y responder preguntas de negocio por si mismos, sin intervencin del departamento de
Sistemas, con un mnimo conocimiento de las fuentes y estructura de datos empresariales. Un gran
segmento de usuarios empresariales, desde analistas experimentados hasta usuarios de negocio, pueden
fcilmente crear consultas y desarrollar clculos sin tener que entender los complejos lenguajes de
desarrollo de informes y sus estructuras; y luego pueden compartir esta informacin con otros a lo largo
de la organizacin y ms all de sta.
Con las herramientas de Consulta y Anlisis los directivos en cargos medios de la organizacin, pueden
acceder a un anlisis ms detallado e interactivo de las actividades del negocio que combinan mltiples
variables de acuerdo a los objetivos del rea funcional de la empresa y le ayudan a optimizar sus
procesos de negocio. (Abits Colombia LTDA.2006).

14

15

Sistemas de Nivel Estratgico:


A nivel estratgico de la compaa (los ejecutivos de alta gerencia) pueden analizar y evaluar tendencias,
patrones y relaciones del negocio, anticipar problemas potenciales y hacer los correctivos necesarios,
convirtiendo las decisiones inteligentes en una ventaja competitiva.
En el nivel estratgico estas herramientas comprenden mtricas, indicadores de desempeo y tableros
de control, entre otros, que ayudan al mejoramiento del desempeo de la empresa a travs de: la
alineacin de la planeacin estratgica de la empresa con la actividad real del negocio, la visualizacin y
el rastreo del cumplimiento de indicadores, la asignacin de metas a usuarios y la comunicacin de
resultados a lo largo de las reas funcionales de la empresa. (Abits Colombia LTDA.2006).

Nivel Estratgico
Nivel

Nivel Operativo
Figura 2.1: Clasificacin de Sistemas, atendiendo al nivel organizacional

Con el tiempo y la evolucin de la tecnologa (Sistemas de Informacin), las reas de sistemas, han
evolucionado y juegan un papel determinante en el crecimiento y apoyo a la empresa, clientes,
empleados, accionistas, entre otros, logrando una unin entre los diferentes departamentos,
comunicando los objetivos que sta persigue.
La Tecnologa de Informacin est involucrada en las estrategias de negocios, debido a la exigencia
constante de calidad y buen servicio para la administracin de datos y extraccin de conocimiento que
estos requieren.

15

16

2.1.3

Administracin de Datos

La disminucin del tiempo transcurrido entre la obtencin de datos y la toma de decisiones, supone una
ventaja empresarial. Cuanta ms informacin se disponga sobre los clientes y socios, mejores servicios y
ms personalizados, podr ofrecer la organizacin, adems de establecer unas relaciones mejores y ms
productivas. Slo si se posee un adecuado acceso a la informacin de la organizacin, se podr conseguir
que un negocio sea ms eficaz y detectar los problemas antes de que estn fuera de control.

2.1.4

Administracin del Conocimiento

El conocimiento es una mezcla fluida de experiencia estructurada, valores, informacin contextual e


internalizacin experta que proporciona un marco para la evaluacin e incorporacin de nuevas
experiencias e informacin. A nivel organizacin queda registrado el conocimiento no solo en
documentos

sino

tambin

en

procedimientos,

rutinas

normas

institucionales.

A su vez el conocimiento es transmitido mediante medios estructurados como libros y documentos y


mediante contactos persona a persona.
El conocimiento deriva de la informacin, as como la informacin deriva de los datos. Si la informacin
se transforma en conocimiento, las personas son la que hacen prcticamente todo el trabajo. (Revilla H.
2004).
El conocimiento se puede usar para adoptar decisiones ms sensatas sobre estrategia, competidores,
clientes, canales de distribucin y ciclos vitales de productos y servicios. Tambin, ste puede
descender por la cadena de valor, y convertirse nuevamente en informacin y datos.

2.1.5

Apoyo a los Sistemas de Toma de Decisiones

Hoy en da, las organizaciones estn buscando mejorar sus sistemas de toma de decisiones, ya que
pueden ser desbordados por el volumen y la complejidad de los datos disponibles, provenientes de sus
sistemas de produccin y transaccionales.
A lo largo del tiempo, en el desarrollo de sistemas, se ha tratado de dar solucin a esa necesidad
intrnseca de los altos mandos gerenciales, acerca de poseer la informacin de manera resumida o
digerida, que permita de un modo corto y rpido, darse cuenta de todo lo que pasa en los sistemas
transaccionales de los niveles bajos de la empresa. Sin embargo, esto ya no es suficiente ya que

16

17

actualmente se requiere conocer lo que sucede en todos y cada uno de los procesos, tanto crticos como
triviales, que se originan en una empresa o negocio, ya que es el conocimiento de stos lo que da una
visin clara de lo que ocurre en ella.
Los requerimientos de informacin no son difciles de resolver, dado que sta se encuentra,
efectivamente, en los sistemas operacionales; pero, la complicacin surge debido a que difcilmente ella
est disponible en el tiempo y estructura correcta. Dado el caso y, buscando la administracin de ese
conocimiento tan importante en nuestros das, surge una de las opciones que se han implementado para
cubrir esta necesidad de las empresas, los denominados DataWarehouse o Sistemas de Informacin
Integrados, es decir sistemas que, con el objetivo de facilitar la integracin de los datos organizativos,
extraen datos de diferentes sistemas o bases de datos, funciones y lugares de la empresa, segn se van
generando, los almacenan conforme a un lenguaje comn y los hacen ampliamente disponibles. El
DataWarehouse se explicar en mayor detalle en la seccin posterior correspondiente a Minera de
Datos.
Para obtener la informacin, es importante determinar cul va acorde con la necesidad de la empresa, y
extraerla de las fuentes disponibles para acumularla en un repositorio central (DataWarehouse). De esta
manera se obtiene una sola versin de la verdad, y los datos son transformados en informacin limpia
siguiendo unas reglas de negocio que dicte la organizacin. (Rivera F. Luis. 2004).
Las herramientas para acceder a la informacin pueden ser generadores de reportes, o de minera de
datos, hacindose pertinente el concepto de Inteligencia de Negocios.

2.1.6

Inteligencia de Negocios
2.1.6.1

Qu es Inteligencia de Negocios?

Es una alternativa tecnolgica y de administracin de negocios, que apoya a los tomadores de decisiones
ofrecindoles la informacin correcta, en el momento y lugar correcto, lo que les permite tomar
mejores decisiones de negocios, para mejorar las utilidades de la empresa.
Business Intelligence es la habilidad de consolidar informacin y analizarla con la suficiente velocidad y
precisin para descubrir ventajas y tomar mejores decisiones de negocios. (Carrasco R. 2002).
Los sistemas de soporte de decisiones constituyen una tendencia creciente en empresas medianas y
grandes que desean una gerencia eficiente. Mejorar la tarea de toma de decisiones y planeamiento
estratgico, transformando miles de datos en conocimiento til, es la razn por la que la inteligencia de

17

18

negocios es manejada como: la solucin de sistemas para integracin de informacin y de tecnologa


inteligente para el soporte a la toma de decisiones gerenciales.
La tecnologa que apoya a Inteligencia de Negocios, se basa en los siguientes conceptos:
1. Procesos Analticos en Lnea (Online Analytic Processing, OLAP).
2. Almacenes de Datos (DataWarehouse)
3. Minera de Datos.
Inteligencia de Negocios se compone de todas las actividades relacionadas a la organizacin y entrega de
informacin as como el anlisis del negocio. Esto incluye Minera de Datos, Administracin del
Conocimiento, Aplicaciones Analticas, Sistemas de Reportes y principalmente DataWarehouse.
(Hackney, 2001).
Inteligencia de Negocios (Business Intelligence) es la habilidad de consolidar informacin y analizarla
con la suficiente velocidad y precisin para descubrir ventajas y tomar mejores decisiones de negocios.
Definicin compatible con la necesidad actual de los negocios que ante la presin de ser cada da ms
competitivos, para mantenerse tienen la doble tarea no slo de permanecer sino de ser lucrativos
(Cano, 1999).
La Inteligencia de Negocios (BI) se puede definir como el proceso de analizar los bienes o datos
acumulados en la empresa y extraer una cierta inteligencia o conocimiento de ellos. Dentro de la
categora de bienes se incluyen las bases de datos de clientes, informacin de la cadena de suministro,
ventas personales y cualquier actividad de marketing o fuente de informacin relevante para la empresa.
BI apoya a los tomadores de decisiones con la informacin correcta, en el momento y lugar correcto, lo
que les permite tomar mejores decisiones de negocios. (Jonathan T. Seplveda 2002)
La informacin es el activo ms importante en los negocios actuales. Esto debido a que el xito de un
negocio depende de que tan bien conozca a sus clientes, que tan bien entienda sus procesos internos y
que tan efectivo sea para realizar todas sus operaciones. (Annimo, 2001).

18

19

Figura 2.2 Proceso de Inteligencia de Negocios.

2.1.6.2

Impacto de la Inteligencia de Negocios en Las Empresas

El responsable de las decisiones de la empresa, al apoyarse en esta herramienta de anlisis, puede


disponer de una gran cantidad de datos, lo que permite y facilita las siguientes actividades: formulacin
de hiptesis para detectar tendencias ocultas, anticipacin al cambio del entorno del negocio y
transformacin de stos en oportunidades, y por ltimo, conocimiento cabal de sus clientes.
Desde el punto de vista organizacional, el valor de este modelo reside en la capacidad de resumir los
pasos y acortar el tiempo necesario para tomar las decisiones correctas, gracias a una mayor capacidad
de uso de los archivos, lo cual cumple con la necesidad de generar respuestas rpidas a requerimientos
especficos.
En sntesis, se puede afirmar que el Business Intelligence, se ha convertido en la ruta crtica del negocio,
ya que minimiza el tiempo requerido para recoger toda la informacin de negocio relevante y convierte
datos simples y dispersos, en informacin que cobra un sentido lgico, coherente y ms significativo. Lo
anterior, conlleva al desarrollo del conocimiento, proporcionando herramientas de anlisis para el
soporte a la toma de decisiones ms objetivas, precisas, convenientes y concretas.
Al enfocarlo as, puede parecer que los sistemas hacen milagros y van a tomar las decisiones solos, pero
no ocurre de esta manera, puesto que las decisiones siguen en manos de las personas, slo que a partir
de la instalacin de un sistema Business Intelligence, stas cuentan con un apoyo, para tomar las
decisiones correctas de una forma integral, pues el modelo tiene alguna relacin con cada uno de los
sistemas preexistentes.

19

20

Todas las soluciones de BI tienen funciones parecidas, pero deben reunir al menos los siguientes
componentes:
Multidimensionalidad: La informacin multidimensional se puede encontrar en hojas de clculo, bases
de datos, entre otros. Una herramienta de BI debe ser capaz de reunir informacin dispersa en toda la
empresa e incluso en diferentes fuentes, para as proporcionar a los departamentos la accesibilidad,
poder y flexibilidad que necesitan para analizar la informacin.
Minera de Datos: Las empresas suelen generar grandes cantidades de informacin sobre sus procesos
productivos, desempeo operacional, mercados y clientes, pero el xito de los negocios depende, por
lo general, de la habilidad para ver nuevas tendencias o cambios en las tendencias actuales. Las
aplicaciones o tcnicas de Minera de Datos, pueden identificar tendencias y comportamientos, no slo
para extraer informacin, sino tambin, para descubrir las relaciones que contienen bases de datos,
permitiendo obtener y reconocer, comportamientos no muy evidentes, esto se presentar y explicar
mas adelante en el capitulo correspondiente a Minera de datos.
Agentes: Los agentes son programas que "piensan". Ellos pueden realizar tareas a un nivel muy bsico,
sin necesidad de intervencin humana.
DataWarehouse: Es la respuesta de la tecnologa de informacin a la descentralizacin en la toma de
decisiones, destinando informacin de todas las reas funcionales de la organizacin, en manos de
quienes toman las decisiones. Tambin proporciona herramientas para bsqueda y anlisis.
2.1.6.3

Ventajas empresarial que ofrece la Inteligencia de Negocios

Las aplicaciones basadas en el concepto de Inteligencia de Negocios (BI), permiten a las empresas tomar
decisiones estratgicas y tcticas en su negocio. Algunas de las ventajas que ofrece la utilizacin del BI,
son las siguientes:
Seguridad y acceso a informacin de diversas fuentes, bajo un formato nico: Provee de informacin consolidada
y confiable, estandarizndola, a travs de reportes, indicadores, etc. En el caso de seguridad, estas
aplicaciones actualizan constantemente la informacin y permiten conocer patrones.
Cruzar datos: El empleo de esta solucin, proporciona una visin global y capacidad de llegar al detalle,
permitiendo aprovechar toda la informacin que dispone la organizacin, cruzando los datos, para
responder a preguntas especficas, medir metas fijadas y para conocer la situacin en la que se encuentra
la organizacin.

20

21

En la toma de decisiones: Permite a las empresas conseguir oportunidad y rapidez al obtener informacin,
para establecer estrategias y tcticas, es decir, definir los modelos conforme a predicciones a corto
plazo, porque no necesariamente involucra la visin de la empresa a largo plazo.
Seguimiento de relacin con clientes, tendencias de los negocios y mejorar los procesos: Otorga capacidad de
prediccin, ayudando a los empleados a identificar tendencias que les permitan evitar problemas o
reclamos similares por parte de clientes.
La Inteligencia de negocios puede ayudar a resolver algunos de los ms comunes desafos que deben
enfrentar las empresas hoy en da, entre ellos:
Anlisis de datos: La medida de cualquier solucin de inteligencia de negocios, es la habilidad para
sacar conocimiento de los datos, la capacidad de procesar volmenes de informacin e identificar
patrones, tendencias, reglas y relaciones que son demasiado grandes, para manejarse a travs de un
simple anlisis humano. Para ello, se necesitan herramientas de anlisis poderosas, flexibles, fciles de
manejar y que estn disponibles cuando se necesiten. Las herramientas de anlisis efectivas deben
proporcionar lo siguiente:
Accesibilidad. En una compaa el anlisis es una parte rutinaria de la labor de cualquier trabajador. Por
esto, todos en la organizacin necesitan acceso, no slo a los datos, sino a herramientas intuitivas, fciles
de manejar, que sean diseadas para sus necesidades y las necesidades del negocio. Las herramientas de
inteligencia de negocios, deben enlazar el escritorio con el almacn de datos y, al mismo tiempo,
permitir que los empleados se enfoquen en procesos de negocios en vez de procesamiento de datos.
Anlisis flexible. Los resultados de los reportes estadsticos son slo el comienzo. Adems de informes
predefinidos, que capturan los indicadores claves del desempeo del negocio, se necesitan herramientas
que permitan a los empleados conducir consultas y anlisis por si mismos, sin intervencin de la
administracin, herramientas que soporten tanto consultas improvisadas como anlisis guiados.
2.1.6.4

Visualizacin de datos para la Inteligencia de Negocios

La habilidad para ver representaciones graficas de los datos de la empresa, entrega el poder de tomar
mejores decisiones de negocio ms rpidamente.
El aplicar metforas visuales a datos abstractos, permite que los complejos datos de negocios sean fciles
de entender. En lugar de utilizar tablas con dimensiones mltiples e informes que incluyan lo que
parecen ser interminables columnas y renglones, se pueden utilizar las herramientas de visualizacin,
para comunicar los enfoques de negocio ms rpidamente.

21

22

La simple visualizacin puede acelerar la toma de decisiones, ayudando a los empleados a ver
tendencias, hacer comparaciones y encontrar conexiones ocultas, entre las dimensiones de negocios.
Adems, la flexibilidad para presentar datos complejos en una variedad de formas, como grficas, tablas
y mapas, ayuda a los usuarios a escoger la presentacin ms apropiada, para el problema de negocios o
el mtodo que mejor le acomode. Esta capacidad, extiende el alcance de la solucin de inteligencia de
negocios a todos los niveles de la organizacin.
La visualizacin de los datos para una plataforma de inteligencia de negocios, otorga los siguientes
beneficios:
Fcil anlisis: Para obtener el mayor beneficio de la informacin, hay herramientas que permiten al
mayor nmero de usuarios conducir anlisis significativos, facilitando el realizar comparaciones y
detectar tendencias o anomalas.
Comunicacin clara: Las grficas efectivas de datos, pueden comunicar volmenes con solo un vistazo. Las
vistas de diversas herramientas, proporcionan grficas generadas por la informacin del negocio y
debido a que estas herramientas estn integradas, los usuarios pueden compartir sus enfoques
fcilmente, colocando grficas o vistas en presentaciones, en informes, en pginas o en portales Web.
2.1.6.5

El Futuro de la Inteligencia de Negocios

En aproximadamente cinco aos, veremos un incremento dramtico del 40% en el nmero de usuarios
finales que utilicen herramientas de BI. (Frank Gelbart, CEO, Affluent Technology Inc, 2005).
En pocos aos, las ventajas competitivas vendrn del uso de BI para entender el comportamiento y
preferencias del consumidor a un nivel de segmentacin angosto, incluso individual para hacer ofertas a
la medida. (Fair Isaac, Vice President, Seurat Co., Boulder, Colo.2005).
Dentro de dos o tres aos, las compaas abandonarn el mtodo tradicional de hacer negocios con
ajustes trimestrales. En vez de eso, utilizarn la BI y desarrollarn herramientas administrativas como
estrategia para responder a cambios en tiempo real en el mercado. (Rob Ashe, President & Chief
Operating Officer, Cognos Inc., Burlington, Mass.2003).
Los usuarios demandarn mayor integracin entre los nmeros y su interpretacin. As mismo, todas las
aplicaciones de BI incluirn herramientas de administracin de contenido o bien administracin de
conocimiento. (Brian Hartlen, Senior Vice President, Comshare Inc.,Ann Arbor, Mich.2003).
Los negocios son una guerra! Como en cualquier guerra, sobrevivir depende de la capacidad para actuar
rpidamente en un ambiente cambiante. BI ser como un comando de control central para rastrear

22

23

variables como el desarrollo operacional, las condiciones del mercado y el desarrollo de los
competidores, todas ellas en tiempo real. (Sol Klinger, Director, Sterling Management Solutions Inc.,
Princetown, N.J.2003).

2.2

Minera de Datos

2.2.1 Qu es Minera de Datos?


La Minera de Datos es un trmino relativamente moderno que integra diversas tcnicas de anlisis de
datos y extraccin de modelos; a travs de ella es posible extraer patrones, describir tendencias y
regularidades, predecir comportamientos, y en general extraer conocimiento til de los grandes
volmenes de informacin generalmente heterognea y en grandes cantidades que nos rodea hoy en da.
Permite a las organizaciones y empresas comprender y modelar de una manera ms eficiente y precisa el
contexto en el que deben actuar y tomar decisiones.
Para alcanzar buenos resultados es necesario comprender que la minera de datos no se basa en una
metodologa estndar y genrica que resuelve todo tipo de problemas, sino que consiste en una
metodologa dinmica e iterativa que va a depender del problema planteado, de la disponibilidad de la
fuentes de datos, de las aptitudes de las personas que la realizan, del conocimiento y eficiencia de las
tcnicas necesarias y de los requerimientos y recursos de la empresa.
Dentro de los Conceptos de Minera de Datos algunos de los ms significativos son:
La minera de datos es un conjunto de metodologas y herramientas que permiten, generalmente a
partir de grandes cantidades de datos, extraer el conocimiento til -ya sea patrones de comportamiento,
modos de operacin, informacin til para descubrir fallos, tendencias ocultas, etc.- que sirva de ayuda
en la toma de decisiones, comprensin y mejora de sistemas o procesos, mejora de calidad, reduccin
de gastos, optimizacin, etc. (Martnez de Pisn. 2003).
El trmino se puede comprender como un proceso de extraccin de conocimiento til y comprensible,
previamente desconocido, desde grandes cantidades de datos almacenados en distintos formatos.
(Witten. Frank. 2000).
Data Mining es el proceso analtico diseado para explorar grandes cantidades de datos (tpicamente
relacionados con el mercado o los negocios) con el fin de investigar patrones consistentes y/o relaciones

23

S-ar putea să vă placă și