Documente Academic
Documente Profesional
Documente Cultură
PROPUESTO POR:
charaujo2001@yahoo.es
ELABORADO POR:
jaque_17_8@hotmail.com
nando_23.07@hotmail.com
Tabla de contenido
Lista de Tablas o Cuadros ..............................................................................................................iv
Lista de Figuras ................................................................................................................................ v
Introduccin....................................................................................................................................... 1
Planteamiento del Estudio ................................................................................................................ 2
1.1.
1.2.
1.3.
Hiptesis ........................................................................................................................... 3
1.4.
Objetivos ........................................................................................................................... 3
1.5.
1.6.
2.1.1.
Definicin .................................................................................................................. 5
2.1.2.
2.1.3.
2.2.
2.2.1.
Definicin. ............................................................................................................... 10
2.2.2.
2.2.3.
2.2.4.
2.3.
2.3.1.
Definicin. ............................................................................................................... 23
2.3.2.
2.3.3.
2.3.4.
2.3.5.
2.4.
2.4.1.
Definicin. ............................................................................................................... 27
2.4.2.
Clasificacin ............................................................................................................ 27
2.4.3.
3.2.
Poblacin y Muestra...................................................................................................... 29
Poblacin......................................................................................................................... 29
Muestra............................................................................................................................ 29
3.3.
3.3.1.
3.3.2.
3.4.
Resultados ........................................................................................................................................ 31
4.1.
4.1.1.
4.1.2.
4.2.
4.2.1.
4.2.2.
4.2.3.
Conclusiones .................................................................................................................................... 44
Referencias Bibliogrficas............................................................................................................... 45
iii
iv
Lista de Figuras
Figura
Figura
Figura
Figura
Figura
Figura
Figura
Figura
Figura
Introduccin
Objetivo General
Desarrollar un modelo de minera de datos para mejorar el proceso de toma de decisiones
en la gestin de inventarios en las empresas comerciales.
Objetivos Especficos
Realizar una investigacin bibliogrfica referente al tema de investigacin propuesto.
Analizar las diferentes tcnicas de la minera de datos para determinar la tcnica a
utilizar.
Disear un modelo de minera de datos, basada en el anlisis de las tcnica
seleccionadas.
Implementar el modelo de minera de datos diseado.
Analizar la mejora en el proceso de la toma de decisiones en la gestin de inventarios al
aplicar el modelo de minera de datos implementado.
1.5. Justificacin del Problema
Marco Terico
2.1. Gestin de Inventarios
2.1.1. Definicin
Segn Caldentey, E. y Pizarro, C. [4], se le define como la administracin de existencias
de todo producto o artculo que es utilizado para la comercializacin dentro de una
organizacin. Es decir, todo lo relativo al control y manejo de las existencias de
determinados bienes, en la cual se aplican mtodos y estrategias que pueden hacer
rentable y productivo la tenencia de estos bienes y a la vez sirve para evaluar los
procedimientos de entradas y salidas de dicho producto.
2.1.2. Clasificacin Funcional de Inventarios.
Silver et al. [7], definen seis tipos funcionales de inventarios, a saber: inventario cclico,
inventario de congestin, inventario de seguridad, inventario de anticipacin, inventario
en trnsito e inventario de separacin. stos de describen a continuacin:
Inventario Cclico
Los inventarios cclicos resultan del hecho de producir u ordenar en lotes en vez de
unidad por unidad. La cantidad de inventario disponible en cualquier momento como
resultado de dichos lotes se denomina inventario cclico. Las principales razones
para utilizar produccin u rdenes por lotes son las siguientes:
Lograr economas de escala al evitar altos costos de alistamiento u ordenamiento.
Lograr descuentos por cantidad en costos de compra y/o transporte
Satisfacer restricciones tecnolgicas de produccin por lotes.
Inventario de Congestin
Cuando existen productos que compiten por capacidad limitada, se generan los
denominados inventarios de congestin. stos se forman cuando varios tems
comparten el mismo equipo de produccin o cuando existen tiempos de alistamiento
grandes, ya que los tems deben esperar a que el equipo est disponible.
5
Inventario de Seguridad
El inventario de seguridad es el inventario que se conserva disponible para
responder a todas las fluctuaciones aleatorias que puedan existir en el sistema. Las
ms importantes son la variabilidad de la demanda y de los tiempos de reposicin
(Lead Times). El inventario de seguridad afecta directamente el nivel del servicio al
cliente, el cual puede definirse como la frecuencia con la que la demanda del cliente
es satisfecha del inventario disponible. El inventario de seguridad es un tema
fundamental.
Inventario de Anticipacin
Este es el inventario acumulado con anterioridad para responder a picos de
demanda. Se maneja en empresas para las cuales es ms costoso satisfacer picos de
demanda a partir de la contratacin adicional de personal, a la programacin de
horas extras y/o a la compra a proveedores externos durante los periodos de alta
demanda. Tambin ocurre en empresas donde la naturaleza del producto as lo
determina, como por ejemplo en la produccin de salsa de tomate en pases donde la
cosecha ocurre en un tiempo relativamente corto del ao, y las empresas que
fabrican adornos de navidad.
Inventario de Separacin
Se utiliza este trmino en sistemas de varios puntos de almacenamiento (sistemas de
produccin/distribucin en etapas o cascadas). Su funcin es la de separar los
procesos decisorios relacionados con inventarios en las diferentes etapas del sistema
mediante estos inventarios, por ejemplo, una bodega secundaria menor puede tomar
sus propias decisiones sin detrimento de lo que ocurra en la bodega central.
El costo de espacio es el reflejo del uso del volumen dentro del edificio de la
bodega. Si la bodega es arrendada, estos costos se expresan generalmente por
unidad de peso por cada perodo de tiempo, por ejemplo en S/(ton x mes). Si
el espacio es propio de la empresa, los costos de espacio se determinan de
acuerdo con los costos de operacin asociados con dicho espacio, tales como
climatizacin e iluminacin, y costos fijos, tales como los costos del edificio y
del equipo, basados en el volumen que se maneja en la bodega. Los costos de
espacio no se incluyen en el clculo de inventarios en trnsito.
Los costos de capital o costos de oportunidad representan la mayor
proporcin de los costos de llevar el inventario. A pesar de esto, es el costo
menos tangible de todos los componentes del costo de inventario. Su
determinacin no es fcil, ya que depende de muchos factores. Primero, los
inventarios pueden tratarse de activos a corto plazo o de activos a largo plazo,
dependiendo de su funcin. Segundo, el costo de capital puede determinarse
de un rango amplio de valores que van desde las tasas de inters del mercado
hasta el costo de oportunidad del capital, que puede estar representado en el
promedio de las tasas mnimas de retorno de la empresa o en las inversiones
ms rentables a las que la empresa tiene acceso.
Los seguros e impuestos dependen del inventario disponible y por ello forman
parte del costo de llevar el inventario. Los seguros se toman como prevencin
contra incendio, robo, daos, etc. Los impuestos se pagan dependiendo de los
sistemas contables particulares de cada regin y generalmente se cobran de
acuerdo con los valores en libros de los inventarios. El tema de valoracin de
los inventarios para efectos contables no se considera en esta publicacin.
Los costos de riesgo representan los costos de obsolescencia, deterioro y
depreciacin del inventario. El deterioro puede deberse a condiciones
naturales de los tems en inventario, especialmente si se trata de artculos
perecederos. Estos costos pueden determinarse del costo de tems perdidos, o
del costo de actualizacin mediante trabajo adicional para recobrar el estado
normal del producto, o de reponer el producto desde otra localizacin.
El Costo de Ordenamiento, A
Cada orden para reponer el inventario tiene varios costos asociados, los cuales en
general son fijos y no dependen del tamao de la orden. Estos costos
corresponden al procesamiento, transmisin, manejo y compra de la orden.
Especficamente, para un comerciante (n-productor), el costo de ordenamiento
puede comprender:
Costo de preparacin de los formatos de las rdenes.
Costos de correo (o de cualquier sistema que utilice para la transmisin de
rdenes, incluyendo fax, EDI, etc.).
Costos de llamadas telefnicas relacionadas con el pedido.
Costos de autorizacin del pedido.
Costos de recepcin e inspeccin.
Costos de manejo de las facturas del proveedor.
Otros costos relacionados con el procesamiento de la orden.
Para un productor este costo puede incluir los costos relacionados con el montaje
de maquinaria fija, los costos de alistamiento para preparar las mquinas para
procesar la orden, la transmisin y control de la orden en la planta. En este caso
se prefiere utilizar el trmino costo de preparacin.
10
Tecnologa de
base de datos
Reconocimiento
de patrones
Estadstica
Redes
neuronales
artificiales
Minera
de Datos
Inteligencia
Artificial
Computacin
paralela
Aprendizaje
automtico
Otras
disciplinas
Integracin y
recopilacin
Datos
Iniciales
Almacn de
Datos
Seleccin, Limpieza
y transformacin
Datos
Seleccionados
3
Minera de
Datos
Patrones
Evaluacin e
interpretacin
Difusin y
uso
Conocimiento
Acciones
11
12
d. Evaluacin e Interpretacin.
Los patrones extrados en el paso anterior son interpretados y evaluados de acuerdo
a mediciones que garanticen la identificacin de patrones verdaderamente
significativos (patrones que representen conocimiento). Algunas de estas mediciones
podran ser : validacin cruzada, la cual divide los datos en dos conjuntos
(entrenamiento y prueba); matrices de confusin (empleadas generalmente en
problemas de clasificacin), la cual indica cuantas clasificaciones se han hecho
correctamente para cada tipo; entre otras.
e. Difusin y uso del Conocimiento.
En esta parte, el conocimiento extrado es incorporado en algn sistema o
procedimiento para su difusin y uso de los usuarios finales. Este resultado debe ser
examinado para descartar posibles errores en la representacin del conocimiento.
Por lo general, en los modelos predictivos se deben comprobar continuamente las
prestaciones del mismo, puesto que los patrones podran cambiar con el tiempo, de
ser as, se tendra que reevaluar, reentrenar y posiblemente completamente el
modelo.
2.2.3. Modelos y Tareas de Minera de Datos.
Al ser la minera de datos un mtodo para extraer conocimiento til mediante el anlisis
de los datos, sta recurre a modelos que permitan encontrar relaciones, patrones o
reglas inferidas previamente desconocidas (Hernndez et al. [1]). Los modelos
empleados en la minera de datos son el descriptivo y el predictivo.
a. Modelo Descriptivo.
En el modelo descriptivo se identifican patrones que describen los datos mediante
tareas, ej. Agrupamiento y reglas de asociacin. Hernndez et al. Destacan
que
13
b. Modelo Predictivo.
Este modelo se emplea para estimar valores futuros de variables de inters. El
proceso se basa en la informacin histrica de los datos mediante las cuales se
predice un comportamiento de los datos, ya sea mediante clasificaciones,
categorizaciones o regresiones. Los modelos predictivos siguen un aprendizaje
supervisado, que consiste en aprender mediante el control de un supervisor o
maestro que determina la respuesta que se desea generar del sistema. El atributo a
predecir se conoce como variable dependiente u objetivo, mientras que los atributos
utilizados para realizar la prediccin se llaman variables independientes o de
exploracin.
c. Tareas de Minera de datos.
Dentro de los modelos descriptivos y predictivos se encuentran diferentes tareas
especficas como: agrupamiento, reglas de asociacin, clasificacin, regresin, entre
otras. Estas tareas corresponden a un tipo de problema especfico en el proceso de
minera de datos.
En la Figura 4, se muestra una representacin general de los modelos y tareas
halados en el proceso de minera de datos.
Modelos de Minera
de Datos
Agrupamiento
Descriptivos
Predictivos
Clasificacin
Reglas de Asociacin
Regresin
Correlaciones
14
15
SUPERVISADOS
NO SUPERVISADOS
Arboles de Decisin
Deteccin de Desviaciones
Induccin Neuronal
Segmentacin
Regresin
Clustering (Agrupamiento)
Series Temporales
Reglas de Asociacin
Algoritmos Genticos
Patrones Secuenciales
a. Supervisados
Arboles de Decisin.
Segn Calleja, A. [23]. Un rbol de decisin se utiliza como clasificador para
determinar una accin o decisin apropiada (de entre un conjunto
predeterminado de acciones) para una situacin determinada. Un rbol de
decisin nos ayuda a identificar correctamente los factores que se deben
considerar y como cada uno de estos factores se ha asociado histricamente a los
resultados de la decisin. La visin esquemtica de este mtodo lo hace uno de los
mtodos ms sencillos de interpretar y asimilar la informacin que contienen. Se
denomina rbol de decisin debido a que el resultado del modelo est
representado en forma de rbol.
Los rboles de decisin son un mtodo de los clasificados como mtodos de
aprendizaje supervisados, pues deben ser entrenados con informacin que
contiene un histrico de los propios datos y los resultados que han sido
consecuencia de dichos datos para poder utilizarse con el fin de crear
predicciones.
Para verificar estas predicciones obtenidas como resultado y comprobar la
precisin, podemos ejecutar el modelo entrenado contra otra coleccin de datos
conocida para evaluar dicha precisin del modelo entrenado.
16
17
Edad
>= 35
< 35
Comprara
Salario
<= $ 50.00
> $ 50.00
No comprara
Ocupacin
Contable
No comprara
Consultor
Comprara
Regresin
Segn Calleja, A. [23]. El anlisis regresivo es una tcnica utilizada para inter y
extrapolar las observaciones, las cuales pueden clasificarse como regresin lineal
o no lineal. Hablamos de modelo de regresin cuando la variable de respuesta y
las variables explicativas son todas ellas cuantitativas. Si slo disponemos de una
variable explicativa hablamos de regresin simple, mientras que si disponemos
de varias variables explicativas se trata de un problema de regresin mltiple.
Para visualizar la relacin entre la variable de respuesta y una variable
explicativa, obtendremos el diagrama bivariante entre ambas variables. La forma
de dicho diagrama aporta informacin sobre el tipo de relacin entre la variable
de respuesta y la variable explicativa.
18
Regresin Lineal.
Segn Calleja, A. [23]. La regresin lineal es una tcnica estadstica que intenta
construir un modelo para los datos analizados, y a travs de ste predecir los
datos futuros. Este modelo cuantifica la relacin entre dos variables continuas:
la variable dependiente o la variable que intentamos predecir y la variable
independiente o la variable predecible. Funciona encontrando una lnea a
travs de los datos que minimiza el valor del error cuadrtico de cada punto.
La frmula de regresin lineal es la siguiente:
Dnde:
: Variable dependiente auxiliar; =1 si el evento sucede, =0 si no sucede.
: El coeficiente del trmino constante.
: El coeficiente en la variable dependiente.
La variable dependiente.
El termino de error.
Regresin no lineal.
Segn Calleja, A. [23]. La relacin entre dos variables puede no ser lineal, para
resolver este tipo de problemas surgen las diferentes tcnicas que existen de
regresin no lineal. La relacin puede ser curvilnea o de mltiples lneas.
Entre las curvilneas se encuentra la regresin logartmica, este modelo es
simplemente una transformacin no lineal de la regresin lineal. La diferencia
fundamental entre la regresin lineal y la logartmica reside en el hecho de que
en la regresin lineal, la variable dependiente es continua, sin embargo, en la
logartmica es discreta o categrica.
La frmula que describe esta funcin puede formularse como sigue:
19
Dnde:
: Probabilidad de que el evento Y ocurra, p (Y =1).
: El coeficiente en la variable dependiente.
El termino de error.
Rango de probabilidades.
[
Algoritmos Genticos.
El algoritmo gentico permite obtener soluciones a un problema que no tiene
ningn mtodo de resolucin descrito de forma precisa, o cuya solucin exacta, si
es conocida, es demasiado complicada para ser calculada en un tiempo aceptable.
Es el caso particular de cuando se encuentran restricciones mltiples y complejas,
e incluso contradictorias, que deben ser satisfechas simultneamente como, por
ejemplo, para formar equipos de trabajo, planificar rondas de entregas, implantar
puntos de venta de manera ptima, construir modelos estadsticos.
Segn el algoritmo gentico, numerosas soluciones ms o menos correctas
inherentes a dicho problema son creadas al azar, segn una forma ya definida:
itinerario, horarios, base de reglas de decisin, evaluacin por puntuacin, red
neuronal, etc. Cada solucin ser representada a travs de una cadena de 0 y de 1
en cromosomas que se vern entonces sometidos a una imitacin de la evolucin
de las especies: mutaciones y reproduccin por hibridacin. Al favorecer la
supervivencia de los ms aptos (las soluciones ms correctas), se provoca la
aparicin de hbridos cada vez mejores que sus padres. La poblacin inicial da
paso de esta manera a generaciones sucesivas mutadas y procreadas por
hibridacin a partir de sus padres. Al despejar los elementos ms aptos presin de
la evolucin se garantiza que las generaciones sucesivas sern cada vez ms
adaptadas a la resolucin del problema. Este mecanismo sorprendente de
clasificacin ha sido validado matemticamente con el rigor que le corresponde.
20
21
b. No Supervisados.
Clustering (Agrupacin)
Segn Calleja, A. [23]. El clustering se utiliza para agrupar los datos en conjunt
bien cohesionados y definidos. Podemos diferenciarlo de los mtodos de
clasificacin normales en el hecho siguiente: las clases en las que se agrupan los
datos no estn predefinidas como en las clasificaciones normales, si no que se
determinan a partir de los datos. Se trata de un mtodo de aprendizaje sin
supervisin.
Los resultados que podemos obtener al aplicar este mtodo pueden utilizarse
para resumir y analizar los contenidos de una coleccin de datos dada
considerando las caractersticas de cada conjunto ms que las caractersticas de
cada registro. Este mtodo puede utilizarse de manera descriptiva como
predictiva (a qu grupo pertenecer un nuevo dato).
Ejemplo: En la Figura 6, podemos observar como en la grfica obtenida al
representar una serie de datos, segn las caractersticas por las que estemos
representando dichos datos, se puede ver cmo, si elegimos los atributos
adecuados, se forman estos agrupamientos de los datos al coincidir
caractersticas similares unos con otros.
22
Se deben definir las condiciones lmites, estas son: los fines, metas y condiciones que
debe satisfacer la decisin. Cuanto ms claramente estn stas definidas ms
probable es que se llegue a una buena decisin y se alcancen los fines buscados. Si
por otro lado las condiciones lmites no estn bien establecidas, es probable que la
decisin que se alcance no sea efectiva.
23
que cambia a gran velocidad. Es ms, tal vez se tomen antes de que los problemas
hayan sido definidos y entendidos a fondo. Por lo tanto, para que las personas tomen
decisiones efectivas deben poner especial atencin en definir correctamente los
problemas y en reconocer que las primeras acciones afectan de forma ostensible las
decisiones posteriores.
2.3.4. Proceso de la Toma de Decisiones.
La Figura 7, nos muestra el proceso de toma de decisiones como una serie de ocho pasos
que comienza con la identificacin de problema, los pasos para seleccionar una
alternativa que pueda resolver el problema, y concluyen con evaluacin de la eficacia de
la decisin. Este proceso se puede aplicar tanto a sus decisiones personales como a una
accin de una empresa, a su vez tambin se puede aplicar tanto a decisiones individuales
como grupales.
Identificacin
de un
problema
Identificacin de
los criterios de
decisin
Evaluacin de
eficacia de la
decisin
Implantacin de la
alternativa
Asignacin de
pesos
(ponderados) a los
criterios
Seleccin de una
alternativa
Desarrollo
de
alternativas
Anlisis de
alternativas
25
Los efectos de encuadre son la manera en que los problemas o las alternativas de
solucin se formulan y a la forma en que esta percepcin subjetiva puede
imponerse sobre hechos objetivos.
26
27
Inventario Peridico (o fsico): Cada vez que hacemos una compra, cargamos a
Compras y abonamos a Cuentas por Pagar o Efectivo en caja o banco y cuando
hacemos una venta cargamos a Cuentas por Cobrar o Efectivo en Caja o Banco y
abonamos a Venta. El inventario slo podr determinarse por medio de un conteo
fsico de la mercanca existente al final del perodo. As se maneja el Sistema de
inventario peridico. Es muy apropiado para supermercados, ferreteras u otros
negocios por el estilo, que tiene un gran volumen de ventas y costos bajos.
Materiales y Mtodos
3.1. Diseo de la Investigacin.
Para el anlisis se aplicar el diseo con Post-Prueba nicamente y grupo de control.
Este diseo incluye dos grupos: Uno (G1) recibe el tratamiento experimental y el otro no (G 2
Grupo de control). Los sujetos se asignan a los grupos de manera aleatoria, Cuando concluye la
manipulacin, a ambos grupos se les administra una medicin sobre la variable dependiente en
estudio.
El diseo se diagrama de la siguiente manera:
Dnde:
X: Modelo de minera de datos aplicado al proceso de toma de decisiones en la gestin de
inventarios.
G1: Grupo experimental.
G2: Grupo Control.
O1: Medicin al aplicar X a G1.
O2: Medicin sin aplicar X a G2.
3.2. Poblacin y Muestra.
Poblacin
Los procesos de toma de decisiones para el reabastecimiento de productos en la gestin de
inventarios que manejan las distintas empresas comerciales de Trujillo.
Muestra
El proceso de toma de decisiones para el reabastecimiento de productos en la gestin de
inventarios que manejan 2 empresas comerciales mayoristas de Trujillo.
29
30
Resultados
4.1. Anlisis Comparativo de Tcnicas de Minera de Datos
En ste captulo se realizara un anlisis de las tcnicas de minera de datos ms usadas; las
tcnicas son:
a)
b)
c)
d)
e)
rboles de Decisin.
Regresin Lineal Mltiple.
Redes Neuronales
Algoritmos Genticos.
Clustering.
Para este anlisis comparativo se tomara en cuenta los siguientes criterios de comparacin
definidos por Galvis, M. & Martnez, F [24]:
Velocidad de Ejecucin: Se refiere al costo computacional involucrado en general el modelo
as como la rapidez con la que la tcnica es capaz de extraer un modelo exitosamente a partir
de los datos de entrenamiento suministrados.
Clasificacin de Datos de Origen: Se refiere a la capacidad de la tcnica para lograr clasificar
los registros suministrados, a partir de la o las reglas creadas.
Prediccin de Datos Futuros: Se refiere a que el conjunto de reglas generadas por la tcnica,
sea capaz de clasificar registros cuyo valor se desea predecir.
Escalabilidad: Se refiere a la habilidad que tiene una determinada tcnica para construir un
modelo eficiente dadas grandes cantidades de datos.
Robustez: Se refiere a la habilidad de la tcnica para realizar predicciones correctas en bases
de datos con ruidos o datos con valores faltantes.
4.1.1. Anlisis de las Tcnicas Segn Criterios.
A continuacin se analizara cada una de las tcnicas seleccionadas en base a los criterios
de comparacin definidos en el punto anterior:
a. rboles de Decisin
rbol de
Decisin
Regresin
Lineal
Mltiple
Redes
Neuronales
Algoritmos
Genticos
Clustering
Velocidad
ejecucin
Clasificacin de
datos de origen
Prediccin de
datos futuros
Escalabilidad
Robustez
33
Redes Neuronales cumple con la mayora de los criterios para ser una tcnica
adecuada para el desarrollo del modelo propuesto, sin embargo posee un costo
computacional elevado convirtindola en una tcnica inapropiada para nuestra
investigacin.
34
As mismo, el modelo posibilitar las consultas sobre los elementos formales bajo
lenguajes de consultas dentro del enfoque de minera de datos, que permita la gestin
del conocimiento adquirido.
En la Figura 8, resumimos de forma grfica estos enfoques.
Enfoque Orientado a
Objetos
Minera de datos:
-Metodologa de DM.
-Arboles de Decisin y
Regresin.
-Modelo predictivo
Investigacin Operativa:
-Apoyo a la Toma de
Decisiones.
-Modelos De Gestin de
Inventarios.
Modelo Propuesto
Para la Arquitectura del modelo de minera de datos, se propone una arquitectura por
niveles, en la que cada nivel se describe como una serie de tareas, herramientas y
objetos que se relacionan utilizando los conceptos de minera de datos.
A continuacin en la Figura 9, representamos grficamente el resultado de nuestra
arquitectura para el modelo propuesto.
35
Herramientas de consulta
y anlisis
Patrones
Nivel de
Presentacin
Consultas
Reportes
Herramientas de D.M
Nivel de Minera
de Datos
Arboles de Decisin
Regresin
Bodega de Datos
Nivel de
Integracin de
Datos
Nivel de Datos
Transformacin
Extraccin
Carga
Diagramas de clase
Base de Datos
Transaccional
36
Nivel de Datos
El Nivel de Datos es la abstraccin del proceso de gestin de inventarios dentro de la
empresa, consiste en la recopilacin de datos desde una base de datos externa o interna.
Este nivel incluye las Reglas del Negocio, los Diagramas de Clases y las Bases de datos
transaccionales.
Nivel de Integracin de Datos
Este nivel define el proceso que permite mover los datos ms representativos desde la
base de datos transaccional con el fin de crear una nueva base de datos con informacin
en funcin a las variables de la investigacin .Incluye los subprocesos de extraccin,
transformacin y carga de la informacin, todo esto apoyado de una herramienta de
ETL.
Nivel de Minera de Datos
Este nivel consiste en la explotacin de la Base de Datos con vista al descubrimiento de
informacin que pueda servir de ayuda al proceso de toma de decisiones, aplicando a
ella los algoritmos de minera de datos basados en arboles de Decision y Regresin,
estos a su vez implementados en una herramienta de minera de datos.
Nivel de Presentacin
Este nivel es el encargado de establecer un formato de presentacin de los datos y una
apariencia grafica de fcil interpretacin a travs de la cual se pueden visualizar los
resultados de los patrones obtenidos en el nivel anterior y adems permite la ejecucin
de consultas para la recuperacin del conocimiento.
Dnde:
II
EMD
:
:
Informacin Interna.
Esquema de Minera de Datos.
37
Informacin Interna
La Informacin Interna (II) se define como la unin de las Reglas del Negocio (RN),
Diagramas de Clase (DC) y las Bases de Datos Transaccionales (BDT) que se manejan
dentro de la organizacin. Es decir
Donde,
Donde,
P, es el conjunto de Polticas de Inventario.
O, es el conjunto de Operaciones de la Gestin de Inventarios
A, es el conjunto de Actores del Negocio.
R, es el conjunto de Restricciones de la organizacin.
Polticas de Inventario
Su representacin formal es:
38
Restricciones de la Organizacin
Su representacin formal es:
Donde,
NC, es el Nombre de la Clase.
AC, es el conjunto de Atributos de la Clase.
OC, es el conjunto de Operaciones de la Clase.
Donde,
39
Atributos de la Clase
Los atributos o caractersticas de una Clase pueden ser de tres tipos, los que definen
el grado de comunicacin y visibilidad de ellos con el entorno.
Donde,
Operaciones de la Clase
Las Operaciones de la Clase, representan la forma como esta interacta con su
entorno.
Donde,
40
Donde,
Tb, es el conjunto de Tablas de la Base de Datos Transaccional.
ReTb, es la Relacin existente entre una y otra Tabla de la Base de datos
Transaccional.
41
Donde,
Donde,
I, es la Integracin
T, es la Transformacin
C, es la Carga
Adems los Arboles de Decisin (AD), se define como:
Donde,
A, es el conjunto de Acciones
E, es el conjunto de Eventos,
P, es la Probabilidad
R, es la Respuesta
Acciones
Su representacin formal es:
42
Eventos
Su representacin formal es:
Donde,
VD, es el conjunto de las Variables Dependientes.
VI, es la Variable Independiente.
C, es el Coeficiente de cada Variable.
VA, es la Varianza.
Variable Dependiente
Su representacin formal es:
43
Conclusiones
Del anlisis comparativo de las tcnicas de minera de datos se pudo observar que la tcnica de
redes neuronales presenta la mayora de los criterios, sin embargo son muy costosas
computacionalmente por lo que se decidi optar por los arboles de decisin apoyados de
regresin lineal mltiple.
Para el diseo del modelo se propuso una arquitectura por niveles de manera que haya una
separacin entre los distintos procesos que involucra la minera de datos y de forma que la
mayora de la interaccin ocurra nicamente entre niveles vecinos.
La implementacin del modelo propuesto es un objetivo que no se pudo alcanzar, sin embargo,
para llevarlo a cabo ser necesario un anlisis minucioso sobre los datos recolectados de la
empresa elegida para el caso de estudio.
44
Referencias Bibliogrficas
[1]. Hernndez J., Ramrez M. J. & Ferri C. (2004). Introduccin a la Minera de Datos. Editorial
Pearson Prentice Hall. Madrid (Espaa).
[2]. Moreno, M. & Quintales, L. & Polo, M. (2006). Aplicacin de tcnicas de minera de datos
en la construccin y validacin de modelos predictivos y asociativos a partir de
especificaciones de requisitos de software. (Espaa).
[3]. Velarde, A. (2004). Minera de Datos y su aplicacin. Recuperado el 29 de agosto del 2013,
de http://www.uthermosillo.edu.mx/voces/voces42/05.php.
[4]. Caldentey, E. & Pizarro, C. Administracin de Inventarios. Recuperado el 29 de agosto del
2013, de http://www.azc.uam.mx/alumnos/tradeoff/docu/adm.pdf.
[5]. Discua, W. (2013). Planificacin y control de inventarios. Recuperado el 21 de septiembre
del 2013 de: http://www.prezi.com/qgchtrvfi1bn/gerencia-de-operaciones.
[6]. Cuervo, A. (1994). Introduccin a la administracin de empresas. Civitas, Madrid
(Espaa).
[7]. Silver E., Pyke D. & Peterson R. (1998). Inventory Management and Production Planning
and Scheduling. ed. 3. John Wiley & Sons, New York.
[8]. Lpez, F. (2008). Logstica comercial: segunda edicin. Editorial paraninfo. Recuperado el
21 de septiembre del 2013 de:
http://books.google.com.pe/books?id=8Iz1a8iFGCgC&hl=es&source=gbs_navlinks_s
[9]. Godas, L. (2007). La distribucin: comercio mayorista y minorista. Recuperado el 21 de
septiembre del 2013 de:
http://apps.elsevier.es/watermark/ctl_servlet?_f=10&pident_articulo=13101022&pident
_usuario=0&pcontactid=&pident_revista=4&ty=28&accion=L&origen=zonadelectura&we
b=http://zl.elsevier.es&lan=es&fichero=4v26n03a13101022pdf001.pdf.
[10]. Molina, J. & Garcia, J. (2011). Tcnicas de Minera de Datos Basadas en Aprendizaje
Automtico. (chile).
[11]. Robbins, S.P. (1994). Management. Fourth Edition. Englewood Cliffs: NJ, Prentice Hall
[12]. Moreno, G. (2007).Tcnicas ms usadas en la minera de datos. Recuperado del 10 de
septiembre de 2013 de http://gamoreno.wordpress.com/2007/10/03/tecnicas-masusadas-en-la-mineria-de-datos/
[13]. Vallejos, S.(2006).Minera de datos. Universidad Nacional de Nordeste (Argentina).
[14]. Febles, J. & Gonzales, A. (2002). Aplicaciones de la minera de datos en la bioinformtica.
[15]. Ordoez, M. (2008). La minera de datos y el Negocio: Aplicaciones, metodologas y
tcnicas.
45
[16]. Witten, I.H. & Frank, E. (2000). Data Mining: Practical Machine Learning Toolsand
Techniques with Java Implementations. San diego (E.E.U.U).
[17]. Gilberto, G. (2008). Desarrollo de un modelo basado en tcnicas de Minera de Datos
para clasificar zonas climatolgicamente similares en el estado de Michoacn. (Mxico).
[18]. Macias, M. (2008). Tcnicas de Minera de Datos para Retencin de Clientes en el Sector
Asegurado.
Recuperado
del
10
de
octubre
de
2013
de
http://www.cnsf.gob.mx/Eventos/Premios/2008%20Seguros/ANIVDELAREV.pdf
[19]. Carle, A. (2006). La toma de Decisiones Empresariales. (Uruguay).
[20]. Benjamin, E. (2009). Toma de Decisiones Empresariales. Recuperado del 11 de octubre
de 2013 de http://www.internacionaleventos.com/Articulos/Tomadedecisiones.pdf.
[21]. Koontz, H & Weihrich, H. (1993). Administracin: Una perspectiva global. 12 ed.
(Mxico).
[22]. Peter, F. (2009). El ejecutivo Eficaz en Accin: un diario para organizarse bien
(Management).
[23]. Calleja, A. (2010). Minera de datos con weka para la prediccin del precio de
automviles de segunda mano. (Espaa).
[24]. Galvis, M. & Martinez, F. (2004). Confrontacin de dos tcnicas de minera de datos
aplicadas a un dominio especifico. Colombia (Bogot).
46