Sunteți pe pagina 1din 51

UNIVERSIDAD NACIONAL DE TRUJILLO

FACULTAD DE CIENCIAS FISICAS Y MATEMATICAS


ESCUELA ACADEMICO PROFESIONAL DE INFORMTICA

Desarrollo de un Modelo de Minera de Datos para la Toma de


Decisiones en la Gestin de Inventarios en Empresas Comerciales.
Informe Final de Trabajo de Graduacin

PROPUESTO POR:

Ing. Christian Araujo Gonzlez

charaujo2001@yahoo.es

ELABORADO POR:

Mendoza Castillo, Sandra Jaqueline


Zavaleta Henrriquez, Fernando

jaque_17_8@hotmail.com
nando_23.07@hotmail.com

AREA DEL PROYECTO: Administracin de la Informacin

Trujillo, 17 de Diciembre de 2013

Tabla de contenido
Lista de Tablas o Cuadros ..............................................................................................................iv
Lista de Figuras ................................................................................................................................ v
Introduccin....................................................................................................................................... 1
Planteamiento del Estudio ................................................................................................................ 2
1.1.

Realidad Problemtica ................................................................................................... 2

1.2.

Formulacin del Problema ............................................................................................ 3

1.3.

Hiptesis ........................................................................................................................... 3

1.4.

Objetivos ........................................................................................................................... 3

Objetivo General .............................................................................................................. 3

Objetivos Especficos ...................................................................................................... 4

1.5.

Justificacin del Problema ............................................................................................. 4

Desde el punto de vista de la ciencia computacional ............................................... 4

Desde el punto de vista organizacional ...................................................................... 4

1.6.

Limitaciones del Estudio ................................................................................................ 4

Marco Terico .................................................................................................................................... 5


2.1.

Gestin de Inventarios ................................................................................................... 5

2.1.1.

Definicin .................................................................................................................. 5

2.1.2.

Clasificacin Funcional de Inventarios. .............................................................. 5

2.1.3.

Factores de Importancia para la Toma de Decisiones en Inventarios. ......... 7

2.2.

Minera de Datos. ........................................................................................................... 10

2.2.1.

Definicin. ............................................................................................................... 10

2.2.2.

Proceso de Descubrimiento de Conocimiento ................................................. 11

2.2.3.

Modelos y Tareas de Minera de Datos.............................................................. 13

2.2.4.

Tcnicas de Minera de Datos. ............................................................................ 15

2.3.

Toma de Decisiones Empresariales ........................................................................... 23

2.3.1.

Definicin. ............................................................................................................... 23

2.3.2.

Elementos de Toma de Decisiones. .................................................................... 23

2.3.3.

Tipos de Toma de Decisiones .............................................................................. 24

2.3.4.

Proceso de la Toma de Decisiones. .................................................................... 25

2.3.5.

Barreras para la Toma Efectiva de Decisiones. ............................................... 25

2.4.

Empresas Comerciales ................................................................................................. 27


ii

2.4.1.

Definicin. ............................................................................................................... 27

2.4.2.

Clasificacin ............................................................................................................ 27

2.4.3.

Inventarios en Empresas Comerciales. ............................................................. 28

Materiales y Mtodos ...................................................................................................................... 29


3.1.

Diseo de la Investigacin. .......................................................................................... 29

3.2.

Poblacin y Muestra...................................................................................................... 29

Poblacin......................................................................................................................... 29

Muestra............................................................................................................................ 29

3.3.

Variables de Estudio. .................................................................................................... 30

3.3.1.

Variable Dependiente ........................................................................................... 30

3.3.2.

Variable Independiente ....................................................................................... 30

3.4.

Tcnicas e Instrumentos. ............................................................................................. 30

Resultados ........................................................................................................................................ 31
4.1.

Anlisis Comparativo de Tcnicas de Minera de Datos ........................................ 31

4.1.1.

Anlisis de las Tcnicas Segn Criterios. .......................................................... 31

4.1.2.

Resultados de Anlisis de las Tcnicas. ............................................................ 33

4.2.

Diseo del Modelo Propuesto. .................................................................................... 34

4.2.1.

Enfoque del Modelo............................................................................................... 34

4.2.2.

Arquitectura del Modelo. ..................................................................................... 35

4.2.3.

Formalizacin del Modelo. .................................................................................. 37

Conclusiones .................................................................................................................................... 44
Referencias Bibliogrficas............................................................................................................... 45

iii

Lista de Tablas o Cuadros


Tabla 1. Clasificacin de tcnicas de Minera de Datos. ................................................................................. 16
Tabla 2. Resultados de Comparacin de Tcnicas de Minera de Datos. ....................................................... 33

iv

Lista de Figuras
Figura
Figura
Figura
Figura
Figura
Figura
Figura
Figura
Figura

1. Descripcin Grfica de la Realidad Problemtica ........................................................................... 3


2. Asociacin de las diversas disciplinas relacionadas a la Minera de Datos. .................................. 11
3. Proceso de Descubrimiento de Conocimiento (KDD). .................................................................... 11
4. Representacin general de los modelos y tareas de Minera de Datos. ......................................... 14
5. rbol de Decisin ............................................................................................................................. 18
6. Agrupamiento (Clustering) ............................................................................................................. 22
7. Proceso de Toma de Decisiones. ..................................................................................................... 25
8. Enfoque del Modelo Propuesto. ...................................................................................................... 35
9. Arquitectura Del Modelo Propuesto. .............................................................................................. 36

Introduccin

La gestin de inventarios es una de las actividades ms complejas dentro de una empresa y la


toma de decisiones en sta genera un gran impacto en la productividad de la empresa. Es por
esto que tanto investigadores como empresarios, han trabajado por aos en la solucin a dicha
complejidad, apoyndose en tcnicas matemticas y estadsticas, desarrollando modelos para
la correcta gestin del inventario.
Sin embargo se evidencia que la mayor proporcin de las empresas, toman sus decisiones en
base a criterios o experiencia y no estn fundamentando esas decisiones en datos reales, pero
hoy en da estamos en un mundo comercial tan competitivo que no se puede dar el lujo de
equivocarse en una decisin por ms pequea que sta sea.
Es por ello que se propone el desarrollo de un modelo de minera de datos, que ayude a los
encargados de sta rea a hacer un mejor uso de los datos almacenados que generalmente no
se aprovecha, pero que son de vital importancia como apoyo al proceso de toma de decisiones.

Planteamiento del Estudio


1.1. Realidad Problemtica
Los sistemas para la gestin y control de inventarios que se encuentran en el mercado,
raramente contienen herramientas que apoyen y soporten el proceso de toma de decisiones,
que permitan definir mejores polticas de control. Los administradores de los inventarios
deben convivir con esta realidad y se ven obligados a tomar decisiones sobre la cantidad de
productos a pedir, el nivel de inventario a mantener y la capacidad de almacenamiento
requerida, con base en supuestos. Esto conlleva a tener exceso de inventario de algunas
referencias y faltantes en otras, afectando el nivel de servicio de la compaa, el capital de
trabajo y el almacenamiento disponible, por mencionar algunos de los posibles efectos
negativos. Para intentar superar estas limitaciones, los administradores de los inventarios
recurren a las hojas de clculo para apoyar el proceso de toma de decisiones, pero muchas
veces las decisiones se toman aplicando modelos equivocados o con informacin irreal.
La posibilidad de mejorar la competitividad de una empresa a travs de una adecuada gestin
de sus inventarios, es una alternativa que muchas empresas y consultores han venido
explorando desde hace aos; pero para ello, se requiere de un adecuado anlisis de sus datos
histricos, que permitan obtener informacin relevante y fundamental como soporte a la toma
de decisiones en la gestin de inventarios dentro de la organizacin comercial.
En la Figura 1, se concretiza la realidad problemtica de una forma grfica.

Figura 1. Descripcin Grfica de la Realidad Problemtica


[Elaboracin propia]

1.2. Formulacin del Problema


Cmo mejorar el proceso de toma de decisiones en la gestin de inventarios en las empresas
comerciales?
1.3. Hiptesis
Un modelo de minera de datos permitir mejorar el proceso de toma de decisiones en la
gestin de inventarios en empresas comerciales.
1.4. Objetivos

Objetivo General
Desarrollar un modelo de minera de datos para mejorar el proceso de toma de decisiones
en la gestin de inventarios en las empresas comerciales.

Objetivos Especficos
Realizar una investigacin bibliogrfica referente al tema de investigacin propuesto.
Analizar las diferentes tcnicas de la minera de datos para determinar la tcnica a
utilizar.
Disear un modelo de minera de datos, basada en el anlisis de las tcnica
seleccionadas.
Implementar el modelo de minera de datos diseado.
Analizar la mejora en el proceso de la toma de decisiones en la gestin de inventarios al
aplicar el modelo de minera de datos implementado.
1.5. Justificacin del Problema

Desde el punto de vista de la ciencia computacional


El resultado de la investigacin aportara en el rea de administracin de la informacin,
un modelo computacional de minera de datos prctico enfocado a inventarios y un
anlisis comparativo de tcnicas de minera de datos aplicadas a este enfoque, que
servir en investigaciones futuras.

Desde el punto de vista organizacional


El modelo de minera de datos permitir mejorar la eficiencia del proceso de toma de
decisiones en la gestin del inventario, de manera que esta sea ms racional y menos
intuitiva con menos posibilidades de equivocacin, con el fin de facilitar el logro de
ventajas competitivas.
1.6. Limitaciones del Estudio
El modelo est enfocado slo para empresas comerciales del tipo mayorista, as mismo se
sustenta slo a la gestin de inventarios de producto, no de bienes.

Marco Terico
2.1. Gestin de Inventarios
2.1.1. Definicin
Segn Caldentey, E. y Pizarro, C. [4], se le define como la administracin de existencias
de todo producto o artculo que es utilizado para la comercializacin dentro de una
organizacin. Es decir, todo lo relativo al control y manejo de las existencias de
determinados bienes, en la cual se aplican mtodos y estrategias que pueden hacer
rentable y productivo la tenencia de estos bienes y a la vez sirve para evaluar los
procedimientos de entradas y salidas de dicho producto.
2.1.2. Clasificacin Funcional de Inventarios.
Silver et al. [7], definen seis tipos funcionales de inventarios, a saber: inventario cclico,
inventario de congestin, inventario de seguridad, inventario de anticipacin, inventario
en trnsito e inventario de separacin. stos de describen a continuacin:

Inventario Cclico
Los inventarios cclicos resultan del hecho de producir u ordenar en lotes en vez de
unidad por unidad. La cantidad de inventario disponible en cualquier momento como
resultado de dichos lotes se denomina inventario cclico. Las principales razones
para utilizar produccin u rdenes por lotes son las siguientes:
Lograr economas de escala al evitar altos costos de alistamiento u ordenamiento.
Lograr descuentos por cantidad en costos de compra y/o transporte
Satisfacer restricciones tecnolgicas de produccin por lotes.

Inventario de Congestin
Cuando existen productos que compiten por capacidad limitada, se generan los
denominados inventarios de congestin. stos se forman cuando varios tems
comparten el mismo equipo de produccin o cuando existen tiempos de alistamiento
grandes, ya que los tems deben esperar a que el equipo est disponible.
5

Inventario de Seguridad
El inventario de seguridad es el inventario que se conserva disponible para
responder a todas las fluctuaciones aleatorias que puedan existir en el sistema. Las
ms importantes son la variabilidad de la demanda y de los tiempos de reposicin
(Lead Times). El inventario de seguridad afecta directamente el nivel del servicio al
cliente, el cual puede definirse como la frecuencia con la que la demanda del cliente
es satisfecha del inventario disponible. El inventario de seguridad es un tema
fundamental.

Inventario de Anticipacin
Este es el inventario acumulado con anterioridad para responder a picos de
demanda. Se maneja en empresas para las cuales es ms costoso satisfacer picos de
demanda a partir de la contratacin adicional de personal, a la programacin de
horas extras y/o a la compra a proveedores externos durante los periodos de alta
demanda. Tambin ocurre en empresas donde la naturaleza del producto as lo
determina, como por ejemplo en la produccin de salsa de tomate en pases donde la
cosecha ocurre en un tiempo relativamente corto del ao, y las empresas que
fabrican adornos de navidad.

Inventario en Trnsito ( o en proceso)


Este tipo de inventario incluye productos que se encuentran en trnsito entre
diversas estaciones de produccin (inventario en proceso), o en los sistemas de
transporte entre una instalacin y otra de la cadena de abastecimiento. Este
inventario es proporcional al nivel de utilizacin del producto y al tiempo de
transporte entre las instalaciones del sistema y se constituye en un elemento
importante para seleccin de los modos de transporte en una cadena de
abastecimiento, especialmente internacional.

Inventario de Separacin
Se utiliza este trmino en sistemas de varios puntos de almacenamiento (sistemas de
produccin/distribucin en etapas o cascadas). Su funcin es la de separar los
procesos decisorios relacionados con inventarios en las diferentes etapas del sistema
mediante estos inventarios, por ejemplo, una bodega secundaria menor puede tomar
sus propias decisiones sin detrimento de lo que ocurra en la bodega central.

2.1.3. Factores de Importancia para la Toma de Decisiones en Inventarios.


a. Factores de Costo

El valor unitario del tem, v


El valor unitario de cada tem est expresado en s/unidad. Para que un
comerciante (no-productor), este costo corresponde al precio del articulo pagado
al proveedor incluyendo los fletes y costos relacionados. Puede depender del
tamao de pedido, de acuerdo con los descuentos por cantidad.
Para productores, este valor es ms difcil de determinar. Sin embargo, rara vez se
utiliza el valor en libros del tem. Se prefiere, en cambio, medir el valor real del
dinero invertido en el tem (costo variable de produccin) para hacerlo apto para
su utilizacin, bien sea como producto terminado para el consumidor final, o
como componente para otro proceso dentro de la planta. Este costo es muy
importante, ya que el costo de llevar el inventario depende de l.

El costo de llevar o mantener el inventario, r


El costo de llevar o mantener el inventario comprende los costos de
almacenamiento y manejo, el costo del espacio utilizado, los costos de capital, los
seguros e impuestos, y los costos de riesgo en los que se incurre por el hecho de
tener almacenados los tems, esperando a ser demandados por los clientes.
Ballou (1999) describe con detalle cada uno de estos costos. A continuacin se
presentan sus principales caractersticas.
Los costos de almacenamiento y manejo se refieren a los costos de operar la
bodega, teniendo en cuenta la mano de obra utilizada, las actividades
desarrolladas, tales como recepcin, almacenamiento, inspeccin y despacho.
Si la bodega es arrendada, estos costos formarn parte del costo global de
espacio dado por el arrendatario y descrito a continuacin.

El costo de espacio es el reflejo del uso del volumen dentro del edificio de la
bodega. Si la bodega es arrendada, estos costos se expresan generalmente por
unidad de peso por cada perodo de tiempo, por ejemplo en S/(ton x mes). Si
el espacio es propio de la empresa, los costos de espacio se determinan de
acuerdo con los costos de operacin asociados con dicho espacio, tales como
climatizacin e iluminacin, y costos fijos, tales como los costos del edificio y
del equipo, basados en el volumen que se maneja en la bodega. Los costos de
espacio no se incluyen en el clculo de inventarios en trnsito.
Los costos de capital o costos de oportunidad representan la mayor
proporcin de los costos de llevar el inventario. A pesar de esto, es el costo
menos tangible de todos los componentes del costo de inventario. Su
determinacin no es fcil, ya que depende de muchos factores. Primero, los
inventarios pueden tratarse de activos a corto plazo o de activos a largo plazo,
dependiendo de su funcin. Segundo, el costo de capital puede determinarse
de un rango amplio de valores que van desde las tasas de inters del mercado
hasta el costo de oportunidad del capital, que puede estar representado en el
promedio de las tasas mnimas de retorno de la empresa o en las inversiones
ms rentables a las que la empresa tiene acceso.
Los seguros e impuestos dependen del inventario disponible y por ello forman
parte del costo de llevar el inventario. Los seguros se toman como prevencin
contra incendio, robo, daos, etc. Los impuestos se pagan dependiendo de los
sistemas contables particulares de cada regin y generalmente se cobran de
acuerdo con los valores en libros de los inventarios. El tema de valoracin de
los inventarios para efectos contables no se considera en esta publicacin.
Los costos de riesgo representan los costos de obsolescencia, deterioro y
depreciacin del inventario. El deterioro puede deberse a condiciones
naturales de los tems en inventario, especialmente si se trata de artculos
perecederos. Estos costos pueden determinarse del costo de tems perdidos, o
del costo de actualizacin mediante trabajo adicional para recobrar el estado
normal del producto, o de reponer el producto desde otra localizacin.

El Costo de Ordenamiento, A
Cada orden para reponer el inventario tiene varios costos asociados, los cuales en
general son fijos y no dependen del tamao de la orden. Estos costos
corresponden al procesamiento, transmisin, manejo y compra de la orden.
Especficamente, para un comerciante (n-productor), el costo de ordenamiento
puede comprender:
Costo de preparacin de los formatos de las rdenes.
Costos de correo (o de cualquier sistema que utilice para la transmisin de
rdenes, incluyendo fax, EDI, etc.).
Costos de llamadas telefnicas relacionadas con el pedido.
Costos de autorizacin del pedido.
Costos de recepcin e inspeccin.
Costos de manejo de las facturas del proveedor.
Otros costos relacionados con el procesamiento de la orden.
Para un productor este costo puede incluir los costos relacionados con el montaje
de maquinaria fija, los costos de alistamiento para preparar las mquinas para
procesar la orden, la transmisin y control de la orden en la planta. En este caso
se prefiere utilizar el trmino costo de preparacin.

El costo de falta de Inventario, B


Este costo se produce cuando se recibe una orden y no hay suficiente inventario
disponible para cubrirla. Generalmente se expresa como un porcentaje del costo
del tem. Pueden ocurrir entonces tres posibilidades: se genera una orden
pendiente, se pierde la venta o se produce una combinacin de ambas, por
ejemplo cuando el cliente decide aceptar una orden pendiente parcial. Cualquiera
de las tres posibilidades que ocurra, genera un costo, el cual es muy difcil de
estimar debido a su naturaleza intangible.

2.2. Minera de Datos.


2.2.1. Definicin.
En la literatura se cuenta con varias definiciones para la minera de datos, una de ellas
es:
Witten, I.H. & Frank, E. [16], La minera de datos es el proceso de descubrir patrones en
los datos. Los datos se presentan en grandes cantidades. Los patrones descubiertos
deben ser significativos de manera que se permitan ventajas, por lo general, de tipo
econmicas.
Otras definiciones consideran adems del proceso de descubrir patrones vlidos, la
exploracin y anlisis de series extensas de datos.
Debido a las diversas formas de definir la minera de datos, Hernndez et al. [1], resume
el objetivo de la minera de datos como el proceso de convertir datos extrados de
grandes volmenes de datos en conocimiento til.
La minera de datos se considera como un campo interdisciplinario. El cual es
desarrollado de manera conjunta o como apoyo de otras disciplinas como: tecnologa de
bases de datos, sistemas para la toma de decisiones, estadstica, inteligencia artificial,
aprendizaje automtico, redes neuronales, reconocimiento de patrones, visualizacin de
datos, computacin paralela, entre otras. Hernndez et al. 2004 [1].
En la Figura 2, se observa la asociacin de las diversas disciplinas relacionadas a la
minera de datos.

10

Tecnologa de
base de datos
Reconocimiento
de patrones

Estadstica

Redes
neuronales
artificiales

Minera
de Datos

Inteligencia
Artificial

Computacin
paralela

Aprendizaje
automtico

Otras
disciplinas

Figura 2. Asociacin de las diversas disciplinas relacionadas a la Minera de Datos.


Hernndez et al. [1]

2.2.2. Proceso de Descubrimiento de Conocimiento


Para Hernndez et al. [1], el KDD es un proceso general de descubrir conocimiento desde
bases de datos, mientras que la minera de datos viene a ser la aplicacin de los mtodos
de aprendizaje y estadsticos. Asimismo, Fayyad et al. (1996) consideran que el KDD es
un proceso iterativo e interactivo dividido en una secuencia de pasos (Figura 3), de los
cuales la minera de datos es considerada como uno de los pasos ms importantes en
todo el proceso, esto es, el corazn del proceso KDD mismo.

Integracin y
recopilacin

Datos
Iniciales

Almacn de
Datos

Seleccin, Limpieza
y transformacin

Datos
Seleccionados

3
Minera de
Datos

Patrones

Evaluacin e
interpretacin

Difusin y
uso

Conocimiento

Acciones

Figura 3. Proceso de Descubrimiento de Conocimiento (KDD).


Hernndez et al. [1]

11

En trminos generales, el KDD es un proceso que incluye el pre-procesamiento de datos,


bsqueda de patrones y evaluacin de conocimiento extrado. Estas etapas se presentan
en una serie de pasos que a continuacin se resumen:
a. Integracin y Recopilacin.
En esta fase inicial se determinan las fuentes de informacin a utilizarse para la
investigacin. En ocasiones, este paso es uno de los que ms tiempo requiere, puesto
que comnmente se recopila gran cantidad de datos, los cuales pueden ser obtenidos
de bases de datos y/o almacenes de datos.
b. Seleccin, Limpieza y Transformacin.
En ocasiones, dado que los datos provienen de diferentes fuentes, estas por lo
general contienen ruido o valores atpicos. Conocidos los objetivos y requerimientos
del proyecto, en este paso se selecciona el nmero efectivo de variables, se eliminan
redundancias en los datos y, de ser necesario, se filtran aquellos que son
considerados relevantes para el proceso de la minera de datos. Asimismo, se
transforman los datos para la aplicacin de alguna tcnica en particular.
c. Minera de Datos.
En este paso se decide la tcnica a utilizar, la cual debe ser cotejada con los objetivos
del proyecto. Posterior a la seleccin y aplicacin de la tcnica sobre los datos
previamente preparados, ste debe ser validado de acuerdo al conocimiento y
dominio existente. Puesto que los resultados obtenidos en este paso dependen
considerablemente de los anteriores, existe la posibilidad de volver a iniciar desde
alguno de los pasos precedentes, debido a la necesidad de requerir nuevos datos o
incluso en caso de que se modifique la definicin del problema.

12

d. Evaluacin e Interpretacin.
Los patrones extrados en el paso anterior son interpretados y evaluados de acuerdo
a mediciones que garanticen la identificacin de patrones verdaderamente
significativos (patrones que representen conocimiento). Algunas de estas mediciones
podran ser : validacin cruzada, la cual divide los datos en dos conjuntos
(entrenamiento y prueba); matrices de confusin (empleadas generalmente en
problemas de clasificacin), la cual indica cuantas clasificaciones se han hecho
correctamente para cada tipo; entre otras.
e. Difusin y uso del Conocimiento.
En esta parte, el conocimiento extrado es incorporado en algn sistema o
procedimiento para su difusin y uso de los usuarios finales. Este resultado debe ser
examinado para descartar posibles errores en la representacin del conocimiento.
Por lo general, en los modelos predictivos se deben comprobar continuamente las
prestaciones del mismo, puesto que los patrones podran cambiar con el tiempo, de
ser as, se tendra que reevaluar, reentrenar y posiblemente completamente el
modelo.
2.2.3. Modelos y Tareas de Minera de Datos.
Al ser la minera de datos un mtodo para extraer conocimiento til mediante el anlisis
de los datos, sta recurre a modelos que permitan encontrar relaciones, patrones o
reglas inferidas previamente desconocidas (Hernndez et al. [1]). Los modelos
empleados en la minera de datos son el descriptivo y el predictivo.
a. Modelo Descriptivo.
En el modelo descriptivo se identifican patrones que describen los datos mediante
tareas, ej. Agrupamiento y reglas de asociacin. Hernndez et al. Destacan

que

mediante este modelo se identifican patrones que explican o resumen el conjunto de


datos, siendo estos tiles para explorar las propiedades de los datos examinados. Los
modelos descriptivos siguen un tipo de aprendizaje no supervisado, que consiste en
adquirir conocimiento desde los datos disponibles, sin requerir influencia externa
que indique un comportamiento deseado al sistema.

13

b. Modelo Predictivo.
Este modelo se emplea para estimar valores futuros de variables de inters. El
proceso se basa en la informacin histrica de los datos mediante las cuales se
predice un comportamiento de los datos, ya sea mediante clasificaciones,
categorizaciones o regresiones. Los modelos predictivos siguen un aprendizaje
supervisado, que consiste en aprender mediante el control de un supervisor o
maestro que determina la respuesta que se desea generar del sistema. El atributo a
predecir se conoce como variable dependiente u objetivo, mientras que los atributos
utilizados para realizar la prediccin se llaman variables independientes o de
exploracin.
c. Tareas de Minera de datos.
Dentro de los modelos descriptivos y predictivos se encuentran diferentes tareas
especficas como: agrupamiento, reglas de asociacin, clasificacin, regresin, entre
otras. Estas tareas corresponden a un tipo de problema especfico en el proceso de
minera de datos.
En la Figura 4, se muestra una representacin general de los modelos y tareas
halados en el proceso de minera de datos.
Modelos de Minera
de Datos

Agrupamiento

Descriptivos

Predictivos
Clasificacin
Reglas de Asociacin

Regresin

Correlaciones

Figura 4. Representacin general de los modelos y tareas de Minera de Datos.


Hernndez et al. [1]

14

2.2.4. Tcnicas de Minera de Datos.


Segn Moreno, M. & Quintales, L. & Polo, M. [2]. La minera de datos ha dado lugar a una
paulatina sustitucin del anlisis de datos dirigido a la verificacin por un enfoque de
anlisis de datos dirigido al descubrimiento del conocimiento. La principal diferencia
entre ambos se encuentra en que en el ltimo se descubre informacin sin necesidad de
formular previamente una hiptesis. La aplicacin automatizada de algoritmos de
minera de datos permite detectar fcilmente patrones en los datos, razn por la cual
esta tcnica es mucho ms eficiente que el anlisis dirigido a la verificacin cuando se
intenta explorar datos procedentes de repositorios de gran tamao y complejidad
elevada. Dichas tcnicas emergentes se encuentran en continua evolucin como
resultado de la colaboracin entre campos de investigacin tales como bases de datos,
reconocimiento de patrones, inteligencia artificial, sistemas expertos, estadstica,
visualizacin, recuperacin de informacin, y computacin de altas prestaciones.
Los algoritmos de minera de datos se clasifican en dos grandes categoras: Supervisados
o predictivos y no supervisados o de descubrimiento del conocimiento.
Los algoritmos supervisados o predictivos predicen el valor de un atributo (etiqueta) de
un conjunto de datos, conocidos otros atributos (atributos descriptivos). A partir de
datos cuya etiqueta se conoce se induce una relacin entre dicha etiqueta y otra serie de
atributos. Esas relaciones sirven para realizar la prediccin en datos cuya etiqueta es
desconocida. Esta forma de trabajar se conoce como aprendizaje supervisado y se
desarrolla en dos fases: Entrenamiento (construccin de un modelo usando un
subconjunto de datos con etiqueta conocida) y prueba (prueba del modelo sobre el resto
de los datos).
Cuando una aplicacin no es lo suficientemente madura no tiene el potencial necesario
para una solucin predictiva, en ese caso hay que recurrir a los mtodos no
supervisados o de descubrimiento del conocimiento que descubren patrones y
tendencias en los datos actuales (no utilizan datos histricos). El descubrimiento de esa
informacin sirve para llevar a cabo acciones y obtener un beneficio (cientfico o de
negocio) de ellas. En la Tabla 1 se muestran algunas de las tcnicas de minera de ambas
categoras.

15

SUPERVISADOS

NO SUPERVISADOS

Arboles de Decisin

Deteccin de Desviaciones

Induccin Neuronal

Segmentacin

Regresin

Clustering (Agrupamiento)

Series Temporales

Reglas de Asociacin

Algoritmos Genticos

Patrones Secuenciales

Tabla 1. Clasificacin de tcnicas de Minera de Datos.


Moreno, M. et al.[2].

a. Supervisados

Arboles de Decisin.
Segn Calleja, A. [23]. Un rbol de decisin se utiliza como clasificador para
determinar una accin o decisin apropiada (de entre un conjunto
predeterminado de acciones) para una situacin determinada. Un rbol de
decisin nos ayuda a identificar correctamente los factores que se deben
considerar y como cada uno de estos factores se ha asociado histricamente a los
resultados de la decisin. La visin esquemtica de este mtodo lo hace uno de los
mtodos ms sencillos de interpretar y asimilar la informacin que contienen. Se
denomina rbol de decisin debido a que el resultado del modelo est
representado en forma de rbol.
Los rboles de decisin son un mtodo de los clasificados como mtodos de
aprendizaje supervisados, pues deben ser entrenados con informacin que
contiene un histrico de los propios datos y los resultados que han sido
consecuencia de dichos datos para poder utilizarse con el fin de crear
predicciones.
Para verificar estas predicciones obtenidas como resultado y comprobar la
precisin, podemos ejecutar el modelo entrenado contra otra coleccin de datos
conocida para evaluar dicha precisin del modelo entrenado.

16

Los pasos serian:


1. Entrenamiento. Se modeliza el rbol para representar los patrones detectados
en el historial de los datos lo mejor posible.
2. Evaluacin. En este paso, totalmente opcional no obstante, podemos probar la
validez del modelo entrenado enfrentndolo a otra coleccin de datos
diferente (misma temtica y mismo contenido, pero diferente en si). Si la
precisin alcanzada no es la deseada, deberemos redisear el modelo y
repetir el proceso.
3. Prediccin. Por ltimo, obtenemos el resultado predicho a partir del modelo
disead, esto es, el valor o valores, o la decisin que buscamos tomar, para un
determinado caso dado para nuestro conjunto.
Con esto podemos generar la representacin grfica del rbol. El rbol se
construye con los siguientes componentes:
Nodo Raz: Como nodo nico, forma el punto de entrada del rbol
normalmente en el punto mal alto.
Nodos de Decisin: Estos actan como enrutadores para decidir que rama
debemos tomar mientras recorremos el rbol de arriba abajo.
Nodos Hoja: Estos nodos son los que no contienen ningn nodo con xito, es
decir, nodos donde se cumple el objetivo, o donde se hace positivo el valor que
intentamos predecir.
Ejemplo: En la Figura 5 podemos observar un sencillo rbol de decisin. Este
rbol se pretende predecir si un individuo compra o no un determinado producto
en base a la edad, el salario y la ocupacin del mismo.

17

Edad

>= 35

< 35

Comprara

Salario

<= $ 50.00

> $ 50.00

No comprara

Ocupacin

Contable
No comprara

Consultor
Comprara

Figura 5. rbol de Decisin


Calleja, A. [23].

Regresin
Segn Calleja, A. [23]. El anlisis regresivo es una tcnica utilizada para inter y
extrapolar las observaciones, las cuales pueden clasificarse como regresin lineal
o no lineal. Hablamos de modelo de regresin cuando la variable de respuesta y
las variables explicativas son todas ellas cuantitativas. Si slo disponemos de una
variable explicativa hablamos de regresin simple, mientras que si disponemos
de varias variables explicativas se trata de un problema de regresin mltiple.
Para visualizar la relacin entre la variable de respuesta y una variable
explicativa, obtendremos el diagrama bivariante entre ambas variables. La forma
de dicho diagrama aporta informacin sobre el tipo de relacin entre la variable
de respuesta y la variable explicativa.

18

Regresin Lineal.
Segn Calleja, A. [23]. La regresin lineal es una tcnica estadstica que intenta
construir un modelo para los datos analizados, y a travs de ste predecir los
datos futuros. Este modelo cuantifica la relacin entre dos variables continuas:
la variable dependiente o la variable que intentamos predecir y la variable
independiente o la variable predecible. Funciona encontrando una lnea a
travs de los datos que minimiza el valor del error cuadrtico de cada punto.
La frmula de regresin lineal es la siguiente:

Dnde:
: Variable dependiente auxiliar; =1 si el evento sucede, =0 si no sucede.
: El coeficiente del trmino constante.
: El coeficiente en la variable dependiente.
La variable dependiente.
El termino de error.
Regresin no lineal.
Segn Calleja, A. [23]. La relacin entre dos variables puede no ser lineal, para
resolver este tipo de problemas surgen las diferentes tcnicas que existen de
regresin no lineal. La relacin puede ser curvilnea o de mltiples lneas.
Entre las curvilneas se encuentra la regresin logartmica, este modelo es
simplemente una transformacin no lineal de la regresin lineal. La diferencia
fundamental entre la regresin lineal y la logartmica reside en el hecho de que
en la regresin lineal, la variable dependiente es continua, sin embargo, en la
logartmica es discreta o categrica.
La frmula que describe esta funcin puede formularse como sigue:

19

Dnde:
: Probabilidad de que el evento Y ocurra, p (Y =1).
: El coeficiente en la variable dependiente.
El termino de error.
Rango de probabilidades.
[

] Rango de probabilidades logartmicas.

Algoritmos Genticos.
El algoritmo gentico permite obtener soluciones a un problema que no tiene
ningn mtodo de resolucin descrito de forma precisa, o cuya solucin exacta, si
es conocida, es demasiado complicada para ser calculada en un tiempo aceptable.
Es el caso particular de cuando se encuentran restricciones mltiples y complejas,
e incluso contradictorias, que deben ser satisfechas simultneamente como, por
ejemplo, para formar equipos de trabajo, planificar rondas de entregas, implantar
puntos de venta de manera ptima, construir modelos estadsticos.
Segn el algoritmo gentico, numerosas soluciones ms o menos correctas
inherentes a dicho problema son creadas al azar, segn una forma ya definida:
itinerario, horarios, base de reglas de decisin, evaluacin por puntuacin, red
neuronal, etc. Cada solucin ser representada a travs de una cadena de 0 y de 1
en cromosomas que se vern entonces sometidos a una imitacin de la evolucin
de las especies: mutaciones y reproduccin por hibridacin. Al favorecer la
supervivencia de los ms aptos (las soluciones ms correctas), se provoca la
aparicin de hbridos cada vez mejores que sus padres. La poblacin inicial da
paso de esta manera a generaciones sucesivas mutadas y procreadas por
hibridacin a partir de sus padres. Al despejar los elementos ms aptos presin de
la evolucin se garantiza que las generaciones sucesivas sern cada vez ms
adaptadas a la resolucin del problema. Este mecanismo sorprendente de
clasificacin ha sido validado matemticamente con el rigor que le corresponde.

20

El mecanismo de evolucin y de seleccin es independiente del problema por


resolver: slo varan la funcin que descodifica el genotipo en una solucin
posible (cualquier tipo de descodificacin tiene la posibilidad de ser utilizado de
la manera ms sencilla posible) y la funcin que evala la justeza de la solucin
(en el caso de los previsores probndolos en unas cuantas centenas de casos).
Esta tcnica es de aplicacin general. El algoritmo gentico puede aplicarse a la
produccin de una variedad de objetos mientras sea posible obtener una
calificacin que represente la justeza de la solucin. En particular, es posible
fabricar previsores estadsticos no a travs de clculos de datos como en la
estadstica clsica sino haciendo evolucionar los datos por algoritmo gentico
(induccin. Por problemas de clasificacin o de segmentacin, la justeza significa
simple y llanamente la tasa de reordenacin del previsor con respecto a un
conjunto dado de ejemplos. El mecanismo de estimulacin de lo ms apto permite
entonces la aparicin del previsor que reordenar los datos lo mejor posible. Este
tipo de construccin de previsor forma parte de las tcnicas de algoritmo gentico
utilizadas en DM.
La tcnica del algoritmo gentico da enfoque un poco brutal que necesita un gran
poder de clculo pero que posee la inmensa ventaja de proporcionar soluciones
no muy lejos de lo ptimo incluso sin conocer mtodos de soluciones. El algoritmo
gentico no exige ningn conocimiento acerca de la manera ms idnea de
resolver el problema; slo es necesaria la capacidad de evaluar la calidad de una
solucin. Tambin es muy ligero para ponerlo en prctica (el motor es comn, no
hay mucha programacin especfica que hacer). En la resolucin de un mismo
problema el enfoque algortmico es especfico, muy rpido, mientras el algoritmo
gentico se caracteriza por ser general pero muy lento.

21

b. No Supervisados.

Clustering (Agrupacin)
Segn Calleja, A. [23]. El clustering se utiliza para agrupar los datos en conjunt
bien cohesionados y definidos. Podemos diferenciarlo de los mtodos de
clasificacin normales en el hecho siguiente: las clases en las que se agrupan los
datos no estn predefinidas como en las clasificaciones normales, si no que se
determinan a partir de los datos. Se trata de un mtodo de aprendizaje sin
supervisin.
Los resultados que podemos obtener al aplicar este mtodo pueden utilizarse
para resumir y analizar los contenidos de una coleccin de datos dada
considerando las caractersticas de cada conjunto ms que las caractersticas de
cada registro. Este mtodo puede utilizarse de manera descriptiva como
predictiva (a qu grupo pertenecer un nuevo dato).
Ejemplo: En la Figura 6, podemos observar como en la grfica obtenida al
representar una serie de datos, segn las caractersticas por las que estemos
representando dichos datos, se puede ver cmo, si elegimos los atributos
adecuados, se forman estos agrupamientos de los datos al coincidir
caractersticas similares unos con otros.

Figura 6. Agrupamiento (Clustering)


Calleja, A. [23].

22

2.3. Toma de Decisiones Empresariales


2.3.1. Definicin.
Koontz, H. & Weihrich, H. [21], definen la Toma de Decisiones como la seleccin de un
curso de accin entre distintas alternativas.
2.3.2. Elementos de Toma de Decisiones.
Segn Peter, F. [22], Los elementos relevantes en la toma de decisiones son:

Se debe verificar si la decisin a tomar es programada o no programada. En el primer


caso nos referimos a decisiones que se toman sobre problemas estructurados o
rutinarios, problemas comunes en la organizacin, por lo cual estas decisiones se
toman basndose en los conocimientos previos y criterios previamente definidos,
reglas, pautas o principios.
Por otro lado, las decisiones no programadas son aquellas que se toman frente a
problemas sin estructurar, problemas nuevos, no rutinarios, que requieren una
solucin especfica. La mayora de las decisiones no son ni completamente
programadas ni completamente no programadas, sino una combinacin de ambas
cosas. Las decisiones no programadas se toman mayoritariamente en los niveles
altos de la organizacin, mientras que las decisiones programadas son tomadas
bsicamente en los niveles ms bajos de la misma.

Se deben definir las condiciones lmites, estas son: los fines, metas y condiciones que
debe satisfacer la decisin. Cuanto ms claramente estn stas definidas ms
probable es que se llegue a una buena decisin y se alcancen los fines buscados. Si
por otro lado las condiciones lmites no estn bien establecidas, es probable que la
decisin que se alcance no sea efectiva.

Se debe confirmar que la decisin a la cual se lleg es la correcta antes de ponerla en


prctica. Por correcta entendemos que la decisin que se tom va a cumplir las
condiciones lmite y que se ajusta a las especificaciones del problema.

23

Llevar la decisin a la prctica. Esta es la parte que exige ms tiempo. El curso de


accin para poner en prctica la decisin debe estar adecuada a quienes vayan a
ponerla en prctica. Un problema comn en la toma de decisiones es que los planes
no tienen compromisos de accin, y no le adjudican a nadie ni la realizacin de la
tarea, ni la responsabilidad por sta realizacin.

La retroalimentacin. Es muy importante que luego de poner en prctica la decisin


se analice si la misma est llevando a los resultados buscados.
2.3.3. Tipos de Toma de Decisiones
Segn Benjamn, E. [20]. Nos dice que de acuerdo con la magnitud y/o complejidad de lo
que hay que resolver, las empresas pueden adoptar distintos tipos de soluciones, que
van desde las conocidas y bien definidas hasta las poco comunes y ambiguas, las cuales
sirven como punto de partida para clasificar las decisiones: de rutina, de adaptacin e
innovadoras.
a. Decisiones de Rutina.
Las decisiones de rutina son aquellas elecciones que se toman ante circunstancias
relativamente comunes, si mayor complicacin. Por lo mismo, de una manera u otra,
estn contempladas en las normas, procedimientos o criterios operativos que las
empresas siguen cotidianamente.
b. Decisiones de Adaptacin.
Las decisiones de adaptacin se refieren a las elecciones que se hacen ante una
combinacin de factores que se salen un poco de lo habitual. De all que implican una
mejora o modificacin de las rutinas habituales.
c. Decisiones Innovadoras.
Las decisiones innovadoras son elecciones que se basan en el descubrimiento, la
identificacin y el diagnstico de problemas inusuales y ambiguos y/o el desarrollo
de soluciones alternativas nicas o creativas.
Por su naturaleza, estas decisiones entraan una ruptura con el pasado casi nunca se
presentan en secuencia lgica y ordenada. Normalmente se basan en informacin
24

que cambia a gran velocidad. Es ms, tal vez se tomen antes de que los problemas
hayan sido definidos y entendidos a fondo. Por lo tanto, para que las personas tomen
decisiones efectivas deben poner especial atencin en definir correctamente los
problemas y en reconocer que las primeras acciones afectan de forma ostensible las
decisiones posteriores.
2.3.4. Proceso de la Toma de Decisiones.
La Figura 7, nos muestra el proceso de toma de decisiones como una serie de ocho pasos
que comienza con la identificacin de problema, los pasos para seleccionar una
alternativa que pueda resolver el problema, y concluyen con evaluacin de la eficacia de
la decisin. Este proceso se puede aplicar tanto a sus decisiones personales como a una
accin de una empresa, a su vez tambin se puede aplicar tanto a decisiones individuales
como grupales.

Identificacin
de un
problema

Identificacin de
los criterios de
decisin

Evaluacin de
eficacia de la
decisin

Implantacin de la
alternativa

Asignacin de
pesos
(ponderados) a los
criterios

Seleccin de una
alternativa

Desarrollo
de
alternativas

Anlisis de
alternativas

Figura 7. Proceso de Toma de Decisiones.


Robbins, S.P. [11]

2.3.5. Barreras para la Toma Efectiva de Decisiones.


Segn Benjamn, E. [20]. La implementacin de los siete pasos del proceso de toma de
decisiones constituye una excepcin, no una regla. Es posible que se tome una decisin
que satisfaga y que no maximice o que optimice y no satisfaga. Este comportamiento
depende de una serie de factores entre los que sobresalen: los prejuicios psicolgicos,
presiones de tiempo y realidades sociales.

25

a. Prejuicios psicolgicos: Los responsables de tomar las decisiones no son objetivos


en la forma en que perciben, evalan y aplican la informacin para elegir, esto es,
tienen prejuicios que interfieren con una racionalidad objetiva. Los prejuicios ms
significativos son:

La ilusin de controles la creencia de que se puede influir en los acontecimientos


aun cuando no se tiene control sobre lo que suceder.

Los efectos de encuadre son la manera en que los problemas o las alternativas de
solucin se formulan y a la forma en que esta percepcin subjetiva puede
imponerse sobre hechos objetivos.

Desestimar el futuro que corresponde al peso que se adjudica a los costos y


beneficios a corto plazo relegando los de largo plazo.
b. Presiones de tiempo: Los responsables de tomar las decisiones reaccionan ms en
funcin de las presiones de tiempo que de la consistencia de su estructura. Ante esto,
las empresas tratan de centrarse en informacin de tiempo real e involucrar a
expertos en el proceso de toma de decisiones.
c. Realidades sociales: Los responsables de tomar decisiones tienen que hacerlo
inmersos en un contexto social cuyos factores interpersonales, de lento movimiento,
disminuyen la efectividad del proceso en su conjunto.

26

2.4. Empresas Comerciales


2.4.1. Definicin.
Las empresas comerciales son las intermediarias entre productor y consumidor, su
funcin primordial es la compra y venta de productos terminados.
Segn Lpez, F. [8], en una empresa comercial las actividades logsticas son menos
numerosas que en el caso de las empresas industriales, debido a que estas empresas
transforman los productos que reciben de sus proveedores.
Estas actividades se resumen de la siguiente manera:

Compra de Mercadera: pedidos, transporte, almacenamiento. Su misin principal es


conseguir unas buenas condiciones de compra de los proveedores, mantener un nivel
de stock suficiente para atender los pedidos de los clientes, sin que este stock sea
excesivo.

Distribucin: implica procesar y transportar los pedidos de los clientes.


2.4.2. Clasificacin
Segn Godas, L. [9], las empresas comerciales se clasifican en:
a. Comercio Mayorista: Este tipo de comercio es el componente de la cadena de
distribucin, en el cual se pone en contacto con consumidores finales de los
productos. Es decir, el mayorista es un intercambio entre fabricantes (o productor) y
usuario final. Compra a un productor o intermediario y vende a un fabricante, pero
nunca al consumidor. Los distribuidores mayoristas son especiales en los grandes
volmenes de venta.
b. Comercio Minorista: El comercio minorista compra productos a grandes cantidades
a fabricantes o importadores, bien directamente o a travs de un mayorista. Sin
embargo vende unidades individuales o pequeas cantidades al pblico en general,
normalmente, en un espacio fsico llamado tienda. Los minoristas se encuentran a la
final de la cadena de suministro.

27

c. Comercio Comisionista: Como su nombre lo dice, se encarga de vender productos,


recibiendo una comisin, la cual puede depender del precio previamente fijado por el
proveedor o por el precio dado por el comisionista.
2.4.3. Inventarios en Empresas Comerciales.
Las operaciones de compra y venta es la actividad principal de una empresa comercial.
Las ventas son la fuente principal de ingresos, pero la mercanca que se vende tiene por
supuesto un costo, a ese costo lo llamamos Costo de venta. La ganancia que se obtiene al
deducir el costo de venta de las ventas, se conoce como Utilidad bruta en ventas
El inventario de mercancas es una cuenta importante del activo circulante de una
empresa. Cuando se compra mercancas con el fin de venderla, la compra se registra al
precio de costo que incluye los fletes pagados, los seguros de compras, y otros gastos
ligados a la compra.
La existencia de mercancas que hay al inicio de un periodo econmico es diferente a la
que hay al final. Por lo tanto, hay un inventario inicial y hay un inventario final.
Existen dos mtodos que nos ayudan a calcular el inventario final:

Inventario Peridico (o fsico): Cada vez que hacemos una compra, cargamos a
Compras y abonamos a Cuentas por Pagar o Efectivo en caja o banco y cuando
hacemos una venta cargamos a Cuentas por Cobrar o Efectivo en Caja o Banco y
abonamos a Venta. El inventario slo podr determinarse por medio de un conteo
fsico de la mercanca existente al final del perodo. As se maneja el Sistema de
inventario peridico. Es muy apropiado para supermercados, ferreteras u otros
negocios por el estilo, que tiene un gran volumen de ventas y costos bajos.

Inventario Permanente (o continuo): Consiste en llevar un registro que muestra


en todo momento la cantidad e importe del inventario en existencia. Es conveniente
para los negocios que venden pocos productos con costos altos. Los cambios en el
inventario se registran a medida que ocurren, mediante cargos y crditos en la
cuenta de Inventario. En este mtodo no se utiliza la cuenta Compras. Cuando se
vende una mercanca , se requieren dos asientos contables:
Por la venta (registrada al precio de venta)
Por la reduccin en el inventario(registrada al costo)
28

Materiales y Mtodos
3.1. Diseo de la Investigacin.
Para el anlisis se aplicar el diseo con Post-Prueba nicamente y grupo de control.
Este diseo incluye dos grupos: Uno (G1) recibe el tratamiento experimental y el otro no (G 2
Grupo de control). Los sujetos se asignan a los grupos de manera aleatoria, Cuando concluye la
manipulacin, a ambos grupos se les administra una medicin sobre la variable dependiente en
estudio.
El diseo se diagrama de la siguiente manera:

Dnde:
X: Modelo de minera de datos aplicado al proceso de toma de decisiones en la gestin de
inventarios.
G1: Grupo experimental.
G2: Grupo Control.
O1: Medicin al aplicar X a G1.
O2: Medicin sin aplicar X a G2.
3.2. Poblacin y Muestra.

Poblacin
Los procesos de toma de decisiones para el reabastecimiento de productos en la gestin de
inventarios que manejan las distintas empresas comerciales de Trujillo.

Muestra
El proceso de toma de decisiones para el reabastecimiento de productos en la gestin de
inventarios que manejan 2 empresas comerciales mayoristas de Trujillo.

29

3.3. Variables de Estudio.


3.3.1. Variable Dependiente
Mejorar el proceso de toma de decisiones en la gestin de inventarios de empresas
comerciales basndose en el modelo propuesto.
3.3.2. Variable Independiente
Un modelo de minera de datos.
3.4. Tcnicas e Instrumentos.
Las tcnicas que se utilizaran para la recoleccin de datos son:

Recopilacin Documental: Esta tcnica se apoya en la recopilacin de antecedentes a


travs de documentos, papers, libros y grficos. Para este proyecto las fuentes sern de tipo
bibliogrficas, la cual ser la base tanto de fundamentos como de complemento para la
investigacin.

Recopilacin a travs de la observacin: Consiste en el estudio de caractersticas y


comportamiento de un fenmeno, dentro del medio en donde se desenvuelve. Esta tcnica
la utilizaremos para estudiar el proceso de toma de decisiones en la gestin de inventarios
dentro de las empresas, lo que nos permita obtener un informe de estudio de campo, que
servir para un anlisis posterior.

Recopilacin de datos experimentales: Se basa en la experimentacin que consiste en la


observacin dedicada y constante que se hace a un fenmeno, al que se le van modificando
sistemticamente sus variables conforme a un plan determinado. Esta tcnica permitir
recolectar datos de la experimentacin sobre el diseo del modelo propuesto y de la
implementacin del mismo, que luego servirn para contrastar y analizar resultados con
respecto a la hiptesis.

30

Resultados
4.1. Anlisis Comparativo de Tcnicas de Minera de Datos
En ste captulo se realizara un anlisis de las tcnicas de minera de datos ms usadas; las
tcnicas son:
a)
b)
c)
d)
e)

rboles de Decisin.
Regresin Lineal Mltiple.
Redes Neuronales
Algoritmos Genticos.
Clustering.

Para este anlisis comparativo se tomara en cuenta los siguientes criterios de comparacin
definidos por Galvis, M. & Martnez, F [24]:
Velocidad de Ejecucin: Se refiere al costo computacional involucrado en general el modelo
as como la rapidez con la que la tcnica es capaz de extraer un modelo exitosamente a partir
de los datos de entrenamiento suministrados.
Clasificacin de Datos de Origen: Se refiere a la capacidad de la tcnica para lograr clasificar
los registros suministrados, a partir de la o las reglas creadas.
Prediccin de Datos Futuros: Se refiere a que el conjunto de reglas generadas por la tcnica,
sea capaz de clasificar registros cuyo valor se desea predecir.
Escalabilidad: Se refiere a la habilidad que tiene una determinada tcnica para construir un
modelo eficiente dadas grandes cantidades de datos.
Robustez: Se refiere a la habilidad de la tcnica para realizar predicciones correctas en bases
de datos con ruidos o datos con valores faltantes.
4.1.1. Anlisis de las Tcnicas Segn Criterios.
A continuacin se analizara cada una de las tcnicas seleccionadas en base a los criterios
de comparacin definidos en el punto anterior:
a. rboles de Decisin

Velocidad de Ejecucin: Costosos en trminos computacionales.


Clasificacin de Datos de Origen: Son capaces de llevar a cabo la clasificacin
multi-clase en un conjunto de datos.

Predecir Datos Futuros: Obtiene un conjunto de patrones y estadsticas que se


pueden usar para explorar las relaciones o para predecir eventos futuros.
31

Escalabilidad: Depende del nmero de variables y del tipo de dato.


Robustez: Son capaces de manejar ruido en datos de entrenamiento
b. Regresin Lineal Mltiple

Velocidad de Ejecucin: Costo computacional bajo.


Clasificacin de Datos de Origen: No clasifica.
Predecir Datos Futuros: Predice valores cuantitativos.
Escalabilidad: Cuanto mayor sea la cantidad de datos, el resultado ser ms
fiable.

Robustez: Trabaja muy bien con datos faltantes o en blanco, garantizando un


resultado ptimo.
c. Redes Neuronales

Velocidad de Ejecucin: Presentan un elevado tiempo computacional.


Clasificacin de Datos de Origen: Son capaces de clasificar los datos de entrada
en clases de mxima similaridad.

Predecir Datos Futuros: Tiene la capacidad de generar resultados predictivos y


descriptivos.

Escalabilidad: Estn diseados para trabajar con grandes cantidades de datos.


Robustez: Son capaces de trabajar con datos incompletos e incluso paradjicos.
d. Algoritmos Genticos

Velocidad de Ejecucin: lentos


Clasificacin de datos de origen: Mecanismo sorprendente de clasificacin.
Prediccin de datos futuros: predictivo
Escalabilidad: Hay un lmite a partir del cual es ineficiente elevar el tamao de la
poblacin puesto que no se consigue una mayor velocidad en la resolucin del
problema.

Robustez: Algoritmo robusto, al resultar til en cualquier mbito de accin, pero


a la vez dbil, pues no est especializado en ninguno.
e. Clustering

Velocidad de Ejecucin: Costo computacional medio.


Clasificacin de datos de origen: Alta precisin para clasificar datos.
Prediccin de datos futuros: Esta tcnica no predice, solo clasifica.
32

Escalabilidad: No escala bien para grandes volmenes de datos.


Robustez: Puede no funcionar adecuadamente en presencia de ruido.
4.1.2. Resultados de Anlisis de las Tcnicas.
En este captulo se analiz cinco tcnicas de minera de datos, de las cuales se ha
descrito las principales caractersticas basadas en los criterios de comparacin
definidos, se hizo una comparacin en forma tabular cuyos resultados obtenidos se
muestran en la Tabla 2.
Para la presentacin de los resultados se considerara las siguientes valorizaciones y sus
smbolos correspondientes:

Cumple o Nivel Bajo.

Cumple Parcialmente o Nivel Medio.

No cumple o Nivel Alto.

rbol de
Decisin
Regresin
Lineal
Mltiple
Redes
Neuronales
Algoritmos
Genticos
Clustering

Velocidad
ejecucin

Clasificacin de
datos de origen

Prediccin de
datos futuros

Escalabilidad

Robustez

Tabla 2. Resultados de Comparacin de Tcnicas de Minera de Datos.


Fuente: Elaboracin Propia

33

De la Tabla 2, podemos resumir lo siguiente:

Redes Neuronales cumple con la mayora de los criterios para ser una tcnica
adecuada para el desarrollo del modelo propuesto, sin embargo posee un costo
computacional elevado convirtindola en una tcnica inapropiada para nuestra
investigacin.

Clustering presenta debilidades en la mayora de los criterios seleccionados, por lo


tanto queda descartada en la seleccin de la tcnica.

Algoritmos Genticos presenta debilidades en cuanto a costo computacional,


escalabilidad y robustez, lo cual no garantiza que el algoritmo encuentra la solucin
ptima del problema, por lo cual queda descartado.
4.2. Diseo del Modelo Propuesto.
La presente investigacin se orienta al uso de tcnicas de minera de datos para lograr un
modelo predictivo, que nos permita tomar decisiones sobre el inventario. El modelo usar el
conocimiento adquirido de los datos, que se vayan a extraer de las empresas, informacin
relacionada a la gestin de inventarios, y as tener como resultado un modelo til que ayude a
resolver el problema planteado.
En el diseo del modelo de minera de datos se han definido los siguientes elementos
necesarios para la generacin de ste, como son: las variables que influyen en el problema para
determinar la prediccin y la herramienta de minera de datos que implementa las tcnicas
necesarias para analizar los datos de las variables establecidas.
4.2.1. Enfoque del Modelo.

El modelo de minera de datos, parte de la identificacin de los elementos que aportan


caractersticas al desarrollo de un modelo de gestin de inventarios, tomando en cuenta
las reglas del negocio y la identificacin de los objetos involucrados, todo esto apoyado
de un enfoque orientado a objetos.
El modelo propuesto utilizar las tcnicas de minera de datos elegidas en el anlisis
comparativo, aportando conceptos estadsticos y algoritmos de rboles de decisin, para
encontrar patrones entre los datos que se puedan definir como un modelo predictivo.

34

As mismo, el modelo posibilitar las consultas sobre los elementos formales bajo
lenguajes de consultas dentro del enfoque de minera de datos, que permita la gestin
del conocimiento adquirido.
En la Figura 8, resumimos de forma grfica estos enfoques.

Enfoque Orientado a
Objetos

Minera de datos:
-Metodologa de DM.
-Arboles de Decisin y
Regresin.
-Modelo predictivo

Investigacin Operativa:
-Apoyo a la Toma de
Decisiones.
-Modelos De Gestin de
Inventarios.

Modelo Propuesto

Figura 8. Enfoque del Modelo Propuesto.


Fuente: Elaboracin Propia

4.2.2. Arquitectura del Modelo.

Para la Arquitectura del modelo de minera de datos, se propone una arquitectura por
niveles, en la que cada nivel se describe como una serie de tareas, herramientas y
objetos que se relacionan utilizando los conceptos de minera de datos.
A continuacin en la Figura 9, representamos grficamente el resultado de nuestra
arquitectura para el modelo propuesto.

35

Herramientas de consulta
y anlisis

Patrones

Nivel de
Presentacin

Consultas
Reportes

Herramientas de D.M

Nivel de Minera
de Datos

Arboles de Decisin
Regresin
Bodega de Datos

Nivel de
Integracin de
Datos

Nivel de Datos

Transformacin

Extraccin

Carga

Reglas del Negocio

Diagramas de clase

Base de Datos
Transaccional

Figura 9. Arquitectura Del Modelo Propuesto.


Fuente: Elaboracin Propia

36

Nivel de Datos
El Nivel de Datos es la abstraccin del proceso de gestin de inventarios dentro de la
empresa, consiste en la recopilacin de datos desde una base de datos externa o interna.
Este nivel incluye las Reglas del Negocio, los Diagramas de Clases y las Bases de datos
transaccionales.
Nivel de Integracin de Datos
Este nivel define el proceso que permite mover los datos ms representativos desde la
base de datos transaccional con el fin de crear una nueva base de datos con informacin
en funcin a las variables de la investigacin .Incluye los subprocesos de extraccin,
transformacin y carga de la informacin, todo esto apoyado de una herramienta de
ETL.
Nivel de Minera de Datos
Este nivel consiste en la explotacin de la Base de Datos con vista al descubrimiento de
informacin que pueda servir de ayuda al proceso de toma de decisiones, aplicando a
ella los algoritmos de minera de datos basados en arboles de Decision y Regresin,
estos a su vez implementados en una herramienta de minera de datos.
Nivel de Presentacin
Este nivel es el encargado de establecer un formato de presentacin de los datos y una
apariencia grafica de fcil interpretacin a travs de la cual se pueden visualizar los
resultados de los patrones obtenidos en el nivel anterior y adems permite la ejecucin
de consultas para la recuperacin del conocimiento.

4.2.3. Formalizacin del Modelo.


El Modelo de Minera de Datos para la Gestin de Inventario (MGI), es la unin entre
Informacin Interna y un Esquema de Minera de Datos, as tenemos:

Dnde:
II
EMD

:
:

Informacin Interna.
Esquema de Minera de Datos.

37

Informacin Interna
La Informacin Interna (II) se define como la unin de las Reglas del Negocio (RN),
Diagramas de Clase (DC) y las Bases de Datos Transaccionales (BDT) que se manejan
dentro de la organizacin. Es decir

Donde,

Donde,
P, es el conjunto de Polticas de Inventario.
O, es el conjunto de Operaciones de la Gestin de Inventarios
A, es el conjunto de Actores del Negocio.
R, es el conjunto de Restricciones de la organizacin.

Polticas de Inventario
Su representacin formal es:

Operaciones de la Gestin de Inventarios


Su representacin formal es:

38

Actores del Negocio


Su representacin formal es:

Restricciones de la Organizacin
Su representacin formal es:

Adems Los Diagramas de Clase (DC), se define:

Donde,
NC, es el Nombre de la Clase.
AC, es el conjunto de Atributos de la Clase.
OC, es el conjunto de Operaciones de la Clase.
Donde,

39

Atributos de la Clase
Los atributos o caractersticas de una Clase pueden ser de tres tipos, los que definen
el grado de comunicacin y visibilidad de ellos con el entorno.

Su representacin formal es:

Donde,

Operaciones de la Clase
Las Operaciones de la Clase, representan la forma como esta interacta con su
entorno.

Su representacin formal es:

Donde,

40

Y por ltimo, las Bases de Datos Transaccionales (BDT), se define:

Donde,
Tb, es el conjunto de Tablas de la Base de Datos Transaccional.
ReTb, es la Relacin existente entre una y otra Tabla de la Base de datos
Transaccional.

Tablas de Base de Datos Transaccionales


Su representacin formal es:

Relaciones de Tablas de las Base de datos Transaccionales.


Su representacin formal es:

Esquema de Minera de Datos.


El Esquema de Minera de Datos (EMD) se define como la unin de la Integracin de
Datos (ID), Arboles de Decisin (AD) y la Regresin Lineal Mltiple (RLM). Es decir:

41

Donde,

Donde,
I, es la Integracin
T, es la Transformacin
C, es la Carga
Adems los Arboles de Decisin (AD), se define como:

Donde,
A, es el conjunto de Acciones
E, es el conjunto de Eventos,
P, es la Probabilidad
R, es la Respuesta

Acciones
Su representacin formal es:

42

Eventos
Su representacin formal es:

Y por ltimo, la Regresin Lineal Mltiple (RLM), se define:

Donde,
VD, es el conjunto de las Variables Dependientes.
VI, es la Variable Independiente.
C, es el Coeficiente de cada Variable.
VA, es la Varianza.

Variable Dependiente
Su representacin formal es:

43

Conclusiones

De nuestra investigacin bibliogrfica se determin que la minera de datos es el conjunto de


herramientas y tcnicas de anlisis de datos que permiten crear escenarios, de los cuales se
puede obtener informacin til para la toma de decisiones.

Del anlisis comparativo de las tcnicas de minera de datos se pudo observar que la tcnica de
redes neuronales presenta la mayora de los criterios, sin embargo son muy costosas
computacionalmente por lo que se decidi optar por los arboles de decisin apoyados de
regresin lineal mltiple.

Para el diseo del modelo se propuso una arquitectura por niveles de manera que haya una
separacin entre los distintos procesos que involucra la minera de datos y de forma que la
mayora de la interaccin ocurra nicamente entre niveles vecinos.

La implementacin del modelo propuesto es un objetivo que no se pudo alcanzar, sin embargo,
para llevarlo a cabo ser necesario un anlisis minucioso sobre los datos recolectados de la
empresa elegida para el caso de estudio.

44

Referencias Bibliogrficas
[1]. Hernndez J., Ramrez M. J. & Ferri C. (2004). Introduccin a la Minera de Datos. Editorial
Pearson Prentice Hall. Madrid (Espaa).
[2]. Moreno, M. & Quintales, L. & Polo, M. (2006). Aplicacin de tcnicas de minera de datos
en la construccin y validacin de modelos predictivos y asociativos a partir de
especificaciones de requisitos de software. (Espaa).
[3]. Velarde, A. (2004). Minera de Datos y su aplicacin. Recuperado el 29 de agosto del 2013,
de http://www.uthermosillo.edu.mx/voces/voces42/05.php.
[4]. Caldentey, E. & Pizarro, C. Administracin de Inventarios. Recuperado el 29 de agosto del
2013, de http://www.azc.uam.mx/alumnos/tradeoff/docu/adm.pdf.
[5]. Discua, W. (2013). Planificacin y control de inventarios. Recuperado el 21 de septiembre
del 2013 de: http://www.prezi.com/qgchtrvfi1bn/gerencia-de-operaciones.
[6]. Cuervo, A. (1994). Introduccin a la administracin de empresas. Civitas, Madrid
(Espaa).
[7]. Silver E., Pyke D. & Peterson R. (1998). Inventory Management and Production Planning
and Scheduling. ed. 3. John Wiley & Sons, New York.
[8]. Lpez, F. (2008). Logstica comercial: segunda edicin. Editorial paraninfo. Recuperado el
21 de septiembre del 2013 de:
http://books.google.com.pe/books?id=8Iz1a8iFGCgC&hl=es&source=gbs_navlinks_s
[9]. Godas, L. (2007). La distribucin: comercio mayorista y minorista. Recuperado el 21 de
septiembre del 2013 de:
http://apps.elsevier.es/watermark/ctl_servlet?_f=10&pident_articulo=13101022&pident
_usuario=0&pcontactid=&pident_revista=4&ty=28&accion=L&origen=zonadelectura&we
b=http://zl.elsevier.es&lan=es&fichero=4v26n03a13101022pdf001.pdf.
[10]. Molina, J. & Garcia, J. (2011). Tcnicas de Minera de Datos Basadas en Aprendizaje
Automtico. (chile).
[11]. Robbins, S.P. (1994). Management. Fourth Edition. Englewood Cliffs: NJ, Prentice Hall
[12]. Moreno, G. (2007).Tcnicas ms usadas en la minera de datos. Recuperado del 10 de
septiembre de 2013 de http://gamoreno.wordpress.com/2007/10/03/tecnicas-masusadas-en-la-mineria-de-datos/
[13]. Vallejos, S.(2006).Minera de datos. Universidad Nacional de Nordeste (Argentina).
[14]. Febles, J. & Gonzales, A. (2002). Aplicaciones de la minera de datos en la bioinformtica.
[15]. Ordoez, M. (2008). La minera de datos y el Negocio: Aplicaciones, metodologas y
tcnicas.

45

[16]. Witten, I.H. & Frank, E. (2000). Data Mining: Practical Machine Learning Toolsand
Techniques with Java Implementations. San diego (E.E.U.U).
[17]. Gilberto, G. (2008). Desarrollo de un modelo basado en tcnicas de Minera de Datos
para clasificar zonas climatolgicamente similares en el estado de Michoacn. (Mxico).
[18]. Macias, M. (2008). Tcnicas de Minera de Datos para Retencin de Clientes en el Sector
Asegurado.

Recuperado

del

10

de

octubre

de

2013

de

http://www.cnsf.gob.mx/Eventos/Premios/2008%20Seguros/ANIVDELAREV.pdf
[19]. Carle, A. (2006). La toma de Decisiones Empresariales. (Uruguay).
[20]. Benjamin, E. (2009). Toma de Decisiones Empresariales. Recuperado del 11 de octubre
de 2013 de http://www.internacionaleventos.com/Articulos/Tomadedecisiones.pdf.
[21]. Koontz, H & Weihrich, H. (1993). Administracin: Una perspectiva global. 12 ed.
(Mxico).
[22]. Peter, F. (2009). El ejecutivo Eficaz en Accin: un diario para organizarse bien
(Management).
[23]. Calleja, A. (2010). Minera de datos con weka para la prediccin del precio de
automviles de segunda mano. (Espaa).
[24]. Galvis, M. & Martinez, F. (2004). Confrontacin de dos tcnicas de minera de datos
aplicadas a un dominio especifico. Colombia (Bogot).

46

S-ar putea să vă placă și