Sunteți pe pagina 1din 24

PAPER SOBRE REDES BAYESIANAS

LA EXPLOTACIN DE LAS REGLAS DE ASOCIACIN


Y CORRELACIN PARMETROS PARA EL
APRENDIZAJE DE REDES BAYESIANAS
1. DEFINICIONES:
(Storari, Riguzzi, & Lamma, 2009) En su investigacin La explotacin de las reglas de
asociacin y correlacin parmetros para el aprendizaje de redes bayesianas defini a
las Redes Bayesianas como Son herramientas muy eficaces para representar el
conocimiento incierto y realizar el razonamiento sobre el mismo (pg. 1).
(Cooper & Herskovits, 1992) K2 es uno de los ms rpidos: se toma como entrada una
ordenacin topolgica de los nodos y, para cada nodo, se aade en varias ocasiones un
nodo anterior como un padre si la estructura resultante aumenta una puntuacin dada
por la probabilidad conjunta de los datos y la estructura de la red. K2 deja de agregar los
padres cuando hay adems puede aumentar la puntuacin.
2. ANTECEDENTES:
(Storari, Riguzzi, & Lamma, 2009) Sin embargo, la construccin de una red bayesiana
para un dominio es una prdida de tiempo y una tarea difcil. Por lo tanto, las tcnicas
para inferir automticamente una red bayesiana a partir de datos han recibido
recientemente mucha atencin. Dado un conjunto de ejemplos de entrenamiento, el
aprendizaje de una red bayesiana es el problema de encontrar la estructura de la red
junto con las tablas de probabilidad condicional (CPT para abreviar) que mejor
coinciden con el conjunto de datos. La calidad de la coincidencia se evalu utilizando
una mtrica de puntuacin tales como descripcin longitud o probabilidad posterior. Por
lo general, se adopta una bsqueda codiciosa en el espacio de posibles estructuras (pg.
1).
(Storari, Riguzzi, & Lamma, 2009) En las reglas de minera de datos, de asociacin y de
correlacin se desprende de los datos con el fin de resaltar las dependencias estadsticas
entre atributos. Las mtricas definidas para la evaluacin de estas normas pueden ser
explotadas para marcar las relaciones entre los atributos en el aprendizaje de la red
bayesiana (pg. 1).
(Storari, Riguzzi, & Lamma, 2009) En la minera de datos, reglas de asociacin y reglas
de correlacin se utilizan para representar dependencias entre las variables y se deducen
automticamente de los datos. Cada asociacin o regla de correlacin se caracteriza por
un nmero de parmetros que pueden utilizarse para identificar la independencia entre
los nodos (pg. 1-2).
3. METODOLOGA:
(Storari, Riguzzi, & Lamma, 2009) En este trabajo, se proponen dos nuevos mtodos
para el aprendizaje de redes bayesianas a partir de datos que se basan en el algoritmo de
aprendizaje K2 y mejorarlo mediante la explotacin de los parmetros de normalidad
definidos por reglas de asociacin y correlacin (pg. 1).
(Storari, Riguzzi, & Lamma, 2009) En este trabajo se presentan dos algoritmos que
utilizan estos parmetros para mejorar la calidad de las redes aprendidas por K2 y
reducir an ms los recursos computacionales necesarios (pg. 1-2):
K2-Lift explota el parmetro de elevacin con el fin de mejorar el K2.
K2-X2 explota ndice X2 de Pearson con el fin de mejorar K2.

4. MODELOS:
(Storari, Riguzzi, & Lamma, 2009) Las reglas de asociacin se relacionan los eventos
que se observan con frecuencia juntos. Un buen ejemplo de reglas de asociacin se
obtiene del dominio de las operaciones de venta: una regla de la asociacin en este
mbito expresa qu artculos estn generalmente comprados juntos. Un elemento es un
literal de la forma V = v, donde V es una variable del dominio (atributo del conjunto de
datos) y v es un valor que pertenece al dominio de la V. Sea M el conjunto de todos los
elementos posibles. Un conjunto de elementos X es un conjunto coherente de
elementos, es decir un conjunto X tal que X M y V = v1 X, V = v2 X v1 = v2.
Una transaccin T es un registro de la base de datos. Decimos que una transaccin T
contiene un conjunto de elementos X si X T o, en su defecto, si T satisface todos los
literales en X. El apoyo de un conjunto de elementos X (indicado por el Soporte (X)) es
la fraccin de las transacciones en D que contienen X (pg. 4).
(Storari, Riguzzi, & Lamma, 2009) El apoyo de la frente de un conjunto de elementos X
(! Indicado por el Soporte (X)) es la fraccin de las transacciones en D que no contienen
X. Por lo tanto, Soporte (X!) = 1 - Apoyo (X). Una regla de asociacin es una
implicacin de la Formx Y, whereX e Y son conjuntos de elementos y X Y = . X
se llama el cuerpo de la regla e Y se llama la cabeza. Para una regla de asociacin X
Y definimos los siguientes parmetros (pg. 4):
El apoyo de X Y (representado por el soporte (X Y)) se define como
Soporte (X Y);
La elevacin [6] de X Y (representado por elevacin (X Y)) se define
como Soporte (X Y) / (Soporte (X) Ayuda (Y));
La influencia [30] de X Y (representado por el apalancamiento (X Y)) se
define como Soporte (X Y) - Soporte (X) Apoyo (Y).
K2-Lift:
(Storari, Riguzzi, & Lamma, 2009) K2-Lift se basa en la siguiente observacin. Cuando
dos nodos Q y P son mximamente dependiente entonces de Apoyo ({Q = qi P = pj})
= Soporte ({Q} = qi) = Soporte ({P} = pj) y la elevacin de la regla P = pj Q = qi
sera 1/Support ({P} = pj) = 1/Support ({Q} = qi). Cuando P y Q no son mximamente
dependiente, entonces 1/Support ({Q} = qi)? = 1/Support ({P} = pj). Consideramos, en
este caso, el promedio de estos dos valores (pg. 5):

(Storari, Riguzzi, & Lamma, 2009) Utilizamos este parmetro (LiftMD) como una
medida de la elevacin en el caso de mxima dependencia, y comparamos la elevacin
real Liftij de la regla P = pj Q = qi con este valor mediante el clculo de la frmula
(pg. 5):

(Storari, Riguzzi, & Lamma, 2009) Donde se utiliza el trmino-1 porque queremos
medir la salida del ascensor desde el caso de la independencia en la que la elevacin es
igual a 1. Usamos la versin normalizada del ascensor porque de esta manera podemos
comparar LiftNormij para todos los valores posibles pi y qj de P y Q. Let MaxLiftNorm
ser (pg. 5):

(Storari, Riguzzi, & Lamma, 2009) A continuacin, comparar MaxLiftNorm a un
umbral: si MaxLiftNorm es mayor que o igual al umbral, aadimos P para los posibles
padres de nodo Q como no podemos excluir una posible correlacin entre P y Q (pg.
5).
K2-X
2
:
(Storari, Riguzzi, & Lamma, 2009) K2-X
2
difiere de K2, ya que elimina de la pareja de
padres permisibles de un Q nodo todos los nodos P para que la estadstica de X
2
para la
regla de correlacin {P, Q} es inferior al valor umbral dado por una significacin del
95%. En ambos casos, si MaxLiftNorm est por encima del umbral para muchos pares
de variables y si X
2
est por encima del umbral de muchas reglas de correlacin,
entonces K2-Lift y K2-X
2
no eliminar muchas variables de la lista de los padres y la
ejecucin requerir ms tiempo y, posiblemente, incurrir en ms errores (pg. 5).


5. CONCLUSIONES:
(Storari, Riguzzi, & Lamma, 2009) En este trabajo se ha descrito un mtodo para
mejorar el aprendizaje bayesiano red algoritmo K2 mediante la explotacin de una serie
de parmetros de asociacin y reglas de correlacin (pg. 11-12).
(Storari, Riguzzi, & Lamma, 2009) Nuestro mtodo mejora el rendimiento al reducir el
K2 pareja de padres permitidos de la que el algoritmo selecciona a los padres reales.
Hemos presentado los algoritmos K2-Lift y K2-X
2
que se aprovechan de los parmetros
de elevacin y X
2
, respectivamente, de asociacin y de reglas de correlacin. Hemos
comparado los algoritmos en una serie de redes generadas al azar y en tres redes de
referencia. Por generada aleatoriamente redes K2-Lift y K2-X
2
nunca perder contra K2
y con frecuencia son significativamente superiores. La mejora aumenta con el nmero
de atributos de red. En cuanto a la dependencia del tamao del conjunto de datos, la
mejora K2-X
2
es ms alto para un pequeo nmero de ejemplos, mientras que mejora
K2-Lift es ms alta para las redes de tamao medio. En general, K2-X
2
es el mejor para
los pequeos conjuntos de datos, mientras que K2-Lift es mejor para grandes conjuntos
de datos, sobre todo con un gran nmero de atributos. En las redes de referencia, K2-
Lift y K2-X
2
son siempre significativamente superior al K2 y K2-Lift es siempre
significativamente superior al K2-X
2
(pg. 11-12).
(Storari, Riguzzi, & Lamma, 2009) Tambin hemos comparado K2-Lift y K2-X
2
con el
enfoque algoritmo gentico propuesto en la red de Asia, K2-Lift y K2-X
2
obtener un
menor nmero de arcos equivocadas durante tres dimensiones de conjuntos de datos de
cada cuatro con respecto a la mejor parametrizacin GA, mientras que en la red de
alarma K2-X
2
mejora la parametrizacin "hbrido GA con el criterio de reduccin
simple, tamao de la poblacin 50, bajo la mutacin y la tasa de cruce" en dos casos de
cada cuatro y parametrizacin "hbrido GA con la reduccin elitista criterio, tamao de
la poblacin de 50 aos, la baja tasa de mutacin y de cruce de alta "en un caso de cada
cuatro. En el futuro, tenemos la intencin de investigar la contribucin que las reglas de
asociacin y correlacin pueden proporcionar a los algoritmos basados en la bsqueda
gentica de aprendizaje (pg. 11-12).
6. REFERENCIAS:
Cooper, G., & Herskovits, E. (1992). A Bayesian Method for the Induction of Probabilistic
Networks from Data. Machine Learning, 1-39.
Storari, S., Riguzzi, F., & Lamma, E. (2009). Exploiting association and correlation rules
parameters for learning Bayesian networks. Intelligent Data Analysis, 1-14.


APRENDER REDES BAYESIANAS A PARTIR DE
MARKOV CAMPOS AL AZAR: UN ALGORITMO
EFICIENTE PARA LOS MODELOS LINEALES
DEFINICIONES:
(Zhenxing & Laiwan, 2012) En su investigacin Aprender redes bayesianas a partir de
Markov campos al azar: un algoritmo eficiente para los modelos lineales defini a las
Redes Bayesianas como Redes bayesianas se emplean con frecuencia para representar
estructuras causales desde los trabajos pioneros de Wermuth y Lauritzen (Wermuth &
Lauritzen, 1983) (pg. 1).
(Zhenxing & Laiwan, 2012) (pg. 2):
Escasez de datos: Pruebas de CI (Independencia Condicional) de orden superior se
convierten en poco fiables con muestras limitadas (Cooper & Herskovits, 1992), y en la
prctica que por lo general no tenemos suficientes datos.
Complejidad computacional: La mayora de los algoritmos de anlisis de dependencia
existentes requieren nmeros exponenciales de las pruebas de CI.
Pon a prueba la independencia condicional: No es fcil de medir independencia
condicional en las variables continua.
(Zhenxing & Laiwan, 2012) Una red bayesiana GB (V, E) es un grfico acclico
dirigido se utiliza para representar una distribucin de conjunto sobre conjunto de
vrtices V en la que un solo vrtice est asociada a una variable aleatoria en un conjunto
de datos (pg. 3).
ANTECEDENTES:
(Zhenxing & Laiwan, 2012) El aprendizaje de redes bayesianas a partir de datos es un
problema importante que se ha estudiado ampliamente en los ltimos aos. Existentes
algoritmos de aprendizaje de red bayesiana generalmente se clasifican en dos grupos:
bsqueda y algoritmos basados en la puntuacin y algoritmos basados en anlisis de
dependencia. Estos dos enfoques consideran redes bayesianas diferente. El enfoque
basado en la bsqueda y la puntuacin sugiere que una red bayesiana codifica la
distribucin conjunta de los datos, y este enfoque busca en la estructura que maximiza
la funcin de puntuacin bayesiana, mientras que el enfoque de anlisis de la
dependencia considera que cada arista en una red bayesiana especifica una relacin de
dependencia entre los dos puntos finales del borde, y este enfoque sugiere la bsqueda
de la estructura de la captura de estas dependencias. En este artculo, nos centraremos en
este ltimo enfoque, porque las relaciones de dependencia y las relaciones causales
estn estrechamente relacionados (pg. 1-2).
(Zhenxing & Laiwan, 2012) El enfoque de anlisis de dependencia aprende redes
bayesianas a partir de datos por el descubrimiento de las relaciones de dependencia
implcita en los datos y luego utiliza estas relaciones para inferir estructuras. Para
emplear el enfoque de anlisis de la dependencia en la prctica, las siguientes
dificultades se deben superar (pg. 2):
Escasez de datos.
Complejidad computacional.
Pon a prueba la independencia condicional.
(Zhenxing & Laiwan, 2012) Hay una gran cantidad de literatura sobre el anlisis de la
dependencia para resolver las dificultades que acabamos de mencionar. Escasez de
datos y la complejidad computacional pueden ser consideradas en conjunto. La razn es
que cuando un algoritmo limita el espacio de bsqueda de conjuntos de
acondicionamiento, tambin excluye los conjuntos de acondicionamiento de gran
tamao. Una forma tpica de reducir el espacio de bsqueda de conjuntos de
acondicionamiento es mostrar que si existen conjuntos de vrtices dos vrtices dados
separa-d, a continuacin, siempre podemos encontrar un conjunto como por la eleccin
de los vrtices slo de un subconjunto particular de todo el conjunto de vrtices. El
subconjunto utilizado por el algoritmo de Peter y Clark (PC) [Spirtes y Glymour 1991]
es el formado por todos los vrtices en los caminos de adyacencia simples que conectan
los dos vrtices dados se cruzaban con el conjunto de vrtices adyacentes a los dos
vrtices dados. Sin embargo, para decidir estos conjuntos, el algoritmo PC necesita
estimar redes bayesianas subyacentes (pg. 2).
METODOLOGA:
(Zhenxing & Laiwan, 2012) En el resto de este artculo, los grficos se indican mediante
letra caligrfica G. Negrita capiteles X, Y, y Z denotan conjuntos de variables aleatorias
o vrtices en una red. V es el conjunto de todas las variables del anlisis. Capitales en
cursiva como X, Y, y Z se designan como matrices constantes, variables aleatorias, o
vrtices en V segn el contexto. Vectores se establecen en minsculas en negrita, como
a, b; escalares en cursiva, como el nmero de muestras n o el grado de una red
bayesiana d. Un borde no dirigido entre los vrtices X e Y se denota por X Y, y un
borde dirigido por X Y o X Y dependiendo de la orientacin del borde (pg. 3).
(Zhenxing & Laiwan, 2012) En este trabajo, utilizamos vrtice para denotar la variable
aleatoria en el dominio y el vrtice correspondiente de la red bayesiana, y E para
denotar el conjunto de borde de la red bayesiana. Un borde de Vi a Vj, por Vi, Vj V,
indica que Vi es una causa directa de Vj. La distribucin conjunta p representado por
una red bayesiana obedece a la propiedad local de Markov que para cualquier vrtice V
V, V es independiente condicional de sus nondescendants dado sus padres, denotado
por V Nd (V) | Pa (V). En esta frmula, Nd (V) es el conjunto que se compone de
todos nondescendants de V, y Pa (V) es el conjunto que se compone de todos los padres
de V. Si ignoramos la direccin de todos los bordes en GB (V, E) obtenemos un grafo
no dirigido llama el esqueleto de GB (V, E), indicado por el esqueleto (GB (V, E)) (pg.
4).

MODELOS:
ALGORITMO DE DOS FASES:
Algoritmo bsico de dos fases:
(Zhenxing & Laiwan, 2012) Pruebas de CI de orden superior y de alta complejidad
computacional se pueden evitar mediante la restriccin del espacio de bsqueda de
conjuntos de acondicionamiento. Ms en concreto, supongamos que en una red
bayesiana GB, no hay ningn borde entre dos vrtices U y V. Si se puede demostrar que
siempre podemos encontrar un conjunto acondicionado d-separacin U y V eligiendo
vrtices slo de un subconjunto de la todo el conjunto de vrtices, el espacio de
bsqueda se reduce por debajo de todo el conjunto de vrtices de este subgrupo
particular. Un tal subconjunto de uso comn se compone de todos los vrtices en los
caminos de adyacencia simples de conexin U y V en GB excluyendo U y V a s
mismos, indicados por ADJ (U, V, E). La razn es que de acuerdo con la definicin de
D-separacin, slo los vrtices en un camino de adyacencia simple puede bloquear ese
camino. Observe que el botn ADJ conjunto (U, V, E) puede ser un conjunto vaco, y
esto sucede cuando no hay un camino simple adyacencia connectingU y V o la nica va
de adyacencia simple Conexin U y V es una ventaja. Tome la Figura 1 como un
ejemplo. En la red bayesiana en la Figura 1 (b), para decidir que no hay una arista entre
los vrtices A y B, es suficiente demostrar que sea A B | {C} o A B | es
cierto, porque ADJ (A, B, E) = {C}. Tambin tenemos ADJ (A, C, E) = , ya que el
nico camino adyacente sencilla conexin de A y C en la red es (A, C). El ADJ exacta
(A, B, E) se pueden identificar slo cuando conocemos la estructura de GB. Por lo
tanto, necesitamos una estimacin de la red subyacente, decir? GB, a partir del cual
podemos averiguar un ADJ estimado (A, B, E) denota ADJ (A, B? GB). La garanta de
la correccin requiere que ADJ (A, B, E) es un subconjunto de ADJ (A, B? GB), lo que
implica eso? GB tiene que contener todos los bordes verdaderos en GB. Algoritmos
existentes que emplean informacin ADJ tales como el uso de PC esqueletos estima que
satisface esta condicin. La segunda fase del algoritmo TPDA agrega bordes en el
esqueleto debido a que los rboles de expansin mximos obtenidos en la primera fase
no cumplen esta condicin (pg. 5-6).
Relaciones con las obras existentes:
(Zhenxing & Laiwan, 2012) El algoritmo Markov2P se puede aplicar tanto a los datos
discretos y los datos continuos, siempre y cuando existen mtodos para probar la
independencia condicional. Por ejemplo, en Markov2P, podemos utilizar una prueba de
X2 para medir la independencia condicional para datos discretos e informacin mutua
para los datos continuos. El algoritmo Markov2P restringe el espacio de bsqueda del
conjunto acondicionado en un subconjunto de la manta de Markov de manera que el
nmero de pruebas de CI requeridos por Markov2P se reduce, y se evitan los grandes
conjuntos de acondicionamiento. El algoritmo Markov2P puede ser visto como una
versin mejorada de TPDA y GS. Mejora TPDA proporcionando un paso concisa para
aprender los esqueletos aproximados que contienen todos los bordes en los esqueletos
de los verdaderos redes bayesianas (pg. 10-11).
Markov2P en Lineal Gauss Data:
(Zhenxing & Laiwan, 2012) En este experimento, se prueba la precisin y el tiempo de
funcionamiento de la PC, TPDA, MMHC, TC, Basic2P y Markov2P. Los algoritmos se
ponen a prueba en las seis redes bayesianas en la Tabla I, y los datos se han extrado de
la distribucin de Gauss. En cada red, ponemos a prueba el valor de F1 y el tiempo
corriendo en contra de diferentes tamaos de muestra. Los tamaos de muestra en este
experimento son 256, 512, 1024, 2048, 4096 y 8192. En primer lugar, nos centramos en
la exactitud de los algoritmos. Una tendencia obvia para todos los algoritmos es que el
valor de F1 aumenta con el nmero de muestras. La razn es que un gran nmero de
muestras de hacer las pruebas de CI ms estable que algunas muestras, que se ilustra por
el hecho de que las desviaciones estndar de los valores de F1 disminuyen a medida que
aumentan los tamaos de muestra (pg. 18-19).

CONCLUSIONES:
(Zhenxing & Laiwan, 2012) En este trabajo, nos dirigimos a una de dos fases algoritmo
de anlisis de la dependencia para el aprendizaje de redes bayesianas a partir de datos.
La idea de un algoritmo de dos fases proviene de la observacin de que la estructura de
un campo aleatorio de Markov y que de una red bayesiana definido en el mismo
conjunto de variables aleatorias son similares. Sobre la base de esta observacin, la fase
uno construye Markov campos al azar a partir de datos y la segunda fase infiere redes
bayesianas a partir de los campos aleatorios de Markov aprendidas por la fase uno (pg.
27).
(Zhenxing & Laiwan, 2012) El marco de dos fases nos permite superar dos dificultades
que enfrenta el enfoque de anlisis de la dependencia. La primera es la complejidad
computacional exponencial. Algoritmos de anlisis de dependencia necesitan para
buscar cada subconjunto del espacio de bsqueda de conjuntos de acondicionamiento
con el fin de decidir si un borde debe ser incluido en una red bayesiana. Al aprender
campos aleatorios de Markov, el algoritmo de dos fases restringe el espacio de bsqueda
de los conjuntos de onditioning dentro de la interseccin de la manta de Markov y el
conjunto ADJ y reduce el nmero de pruebas de CI requeridos. La segunda es que las
pruebas de CI highorder son inestables. Cuando la red bayesiana subyacente es grande,
los algoritmos de aprendizaje de red bayesiana necesitan para poner a prueba la
independencia de los grandes conjuntos de acondicionamiento. Al reducir el espacio de
bsqueda de los conjuntos de acondicionamiento, el algoritmo de dos fases tambin
reduce el tamao de la mayor acondicionado establecen de modo que se evitan las
pruebas de CI de alto orden (pg. 27).
(Zhenxing & Laiwan, 2012) El algoritmo de dos fases se puede aplicar a cualquier
informacin siempre que existen maneras de medir independencia condicional. En este
trabajo, le damos una solucin cuando los datos se generan por los modelos lineales. Se
demuestra que las pruebas de CI basados en correlaciones parciales se pueden tratar con
los datos despus de ambas distribuciones no gaussianas Gaussianos y lineales. En
particular, la distribucin gaussiana es un caso especial de un modelo lineal. Por lo
tanto, este trabajo proporciona una forma unificada para hacer frente a los datos no
Gaussianos y lineales. (pg. 27)
REFERENCIAS:
Cooper, G., & Herskovits, E. (1992). A Bayesian Method for the Induction of Probabilistic
Networks from Data. Machine Learning, 1-39.
Wermuth, N., & Lauritzen, S. (1983). Graphical and recursive models for contingency tables.
Biometrika 70, 537-552.
Zhenxing, W., & Laiwan, C. (2012). Learning Bayesian Networks from Markov Random Fields:
An Efficient Algorithm for Linear Models. ACM Transactions On Knowledge Discovery
From Data, 1-32.

RED BAYESIANA CON PARMETROS DE
PROBABILIDAD DE INTERVALO
DEFINICIONES:
(Liu & Yue, 2011) Datos de intervalo son ampliamente utilizados en aplicaciones reales
para representar los valores de las cantidades en situaciones de incertidumbre. Sin
embargo, las relaciones causales entre las variables probabilsticas implcitas intervalo-
valorados con datos de intervalo no se pueden representar e inferirse redes bayesianas
generales con los parmetros de probabilidad basadas en puntos. Por lo tanto, se desea
extender la red bayesiana en general con mecanismos eficaces de representacin,
aprendizaje y la inferencia de relaciones causales probabilsticas implicados en datos de
intervalo. En este trabajo, definimos las probabilidades de intervalos, las dbiles
probabilidades de intervalos condicionales con destino limitado y la descripcin
probabilstica, as como las reglas de multiplicacin. Por otra parte, se propone el
mtodo para el aprendizaje de la estructura de la red bayesiana a partir de datos de
intervalo y el algoritmo para correspondientes inferencias aproximadas. Los resultados
experimentales muestran que nuestros mtodos son factibles, y llegamos a la conclusin
de que la red bayesiana con parmetros de probabilidad de intervalo es la expansin de
la red bayesiana general. (pg. 1).
ANTECEDENTES:
(Liu & Yue, 2011) Como una representacin grfica y la inferencia de relaciones
causales probabilsticas, BN (BN) son eficaces y marcos utilizados. A BN se puede
construir a travs del aprendizaje estadstico de la muestra datos.2, 13,18 inferencias
probabilsticas pueden realizarse mediante el clculo de los productos de las
probabilidades condicionales de mtodos BNs.18 estadsticos se han desarrollado
principalmente para el anlisis de las variables de un solo valor. En las aplicaciones del
mundo real, BN se ha desarrollado para describir las relaciones causales de los datos de
la muestra con precisin los parmetros de probabilidad basadas en puntos (pg. 1-2).
(Liu & Yue, 2011) Sin embargo, en la vida real, los valores de las variables pueden
difcilmente ser precisos porque falta informacin o conceptos mal de nido. Valores de
intervalo se utilizan para representar los valores de las magnitudes en situations.1
incierto, 11,12 Por ejemplo, los datos meteorolgicos, como la temperatura diaria y
densidades lluvia, estn registrados como valores mnimos y mximos. Como las
unidades estadsticas de las variables inciertas, los datos de intervalo son ampliamente
utilizados para la economa, la ingeniera y otras aplicaciones del mundo real, tales
como la representacin intervalo-valorado de incremento econmico, las cargas de
trabajo de tolerancia equipos ', los indicadores de salud de las personas, y as
sucesivamente. A menudo es deseable determinar las causalidades probabilsticos
implcitas en los datos de intervalo de las variables de intervalo-valorados
correspondientes. Para ello, vamos a tener que discutir los siguientes dos problemas
(pg. 2):
Cmo representar las probabilidades de las variables de intervalo-valorados?
Cmo hacer inferencias entre las variables intervalo-valorados con BN?
(Liu & Yue, 2011) Claramente, no es razonable representar y deducir las causalidades
de variables de tipo intervalo por un general BN con preciso basado en puntos (es decir,
solo valor) probabilidades. Por lo tanto, es necesario extender el general BN con e
efectiva de los mecanismos de representacin, aprendizaje y la inferencia de relaciones
causales probabilsticas implicadas en los datos sobre las variables de tipo intervalo
(pg. 2).
METODOLOGA:
Las probabilidades de intervalos de variables con intervalos de datos:
(Liu & Yue, 2011) En esta seccin, se discuten las probabilidades de las variables con
datos de intervalo y las propiedades de la probabilidad de intervalo. Estos son la base
del aprendizaje y las inferencias de BNs cuando se trata de intervalo-valorados datos de
ejemplo. Es difcil imaginar que una variable con datos de ejemplo intervalo-valorado
tiene una probabilidad de un solo valor preciso. Sin embargo, en este trabajo, desde el
punto de vista prctico e intuitivo, adoptamos la idea bsica de la teora de conjuntos en
bruto para unir las probabilidades inferiores y superiores para las variables de intervalo-
valorados. Consideramos que la eficacia y la concisin de la teora de conjuntos en
bruto en comparacin con la alta complejidad computacional de la teora de DS con el
aumento de las evidencias en el marco de discernimiento (pg. 5).
Aprendiendo Estructuras BN de datos por intervalos:
(Liu & Yue, 2011) En esta seccin, se presentar el mtodo para aprender la estructura
BN de datos de intervalo. En primer lugar, le damos la definicin de la BN con los
parmetros de probabilidad de intervalo, como base de las discusiones posteriores (pg.
10).
Inferencia aproximada en un BNs con parmetros de probabilidad de intervalo:
La inflexibilidad de la inferencia exacta de la probabilidad de intervalo es obvio. Sobre
la base de la propiedad de mantas de Markov, 18 consideramos adoptar algoritmo de
muestreo de Gibbs para inferencias aproximadas de la BN con los parmetros de
probabilidad de intervalos. Una cadena de Markov MB (X) de un 17,18 X nodo en una
BN es cualquier subconjunto S (X = 2 S) de nodos en los que X es independiente de U S
X dada S. Perla seal que en cualquier BN, la unin de los siguientes tres tipos de
vecinos es su ciento para formar una manta Markov de un nodo X: los padres directos
de X, los sucesores directos de X y todos los padres directos de los sucesores directos de
X.
MODELOS:
Extendemos el algoritmo de Gibbs-muestreo para el caso de los parmetros de
probabilidad de intervalo y damos el mtodo de inferencia aproximada en el Algoritmo
5.1. En este algoritmo, utilizamos constantemente los dbiles probabilidades
condicionales de intervalo-encuadernados limitado a expresar la condicin de que la
consulta de las evidencias dadas. Ahora le damos la idea bsica de inmediato de la
siguiente manera. En primer lugar, a partir de la consulta expresa como BL (Xj! e) y BU
(Xj! e) cuando X es la variable de destino, el estado inicial se puede obtener por la
distribucin probabilstica conjunta. Entonces, las variables nonevidence se muestrean
al azar. De las tablas de probabilidad de intervalos condicionales de la BN, las
probabilidades condicionales de intervalo de las variables nonevidence se pueden
obtener teniendo en cuenta sus mantas de Markov respectivamente. Por lo tanto, el
nuevo estado se puede lograr. Este proceso se itera hasta que se alcanza el nmero
umbral dado de muestras, durante el cual el nmero de cada posible valor de intervalo
de la variable de destino X se puede contar. Por fin, por la proporcin de todas las
apariencias de cada valor objetivo entre todas las muestras generadas, las probabilidades
de intervalos deseados de [BL (xij! e); BU (xij! e)] se puede calcular como las
respuestas a la consulta dada.


CONCLUSIONES:
(Liu & Yue, 2011) Datos de intervalo son ampliamente utilizados en aplicaciones
reales. Las relaciones causales probabilsticas implcitas no pueden ser representados e
inferirse BNs generales con los parmetros de probabilidad basadas en puntos precisos.
En este trabajo, hemos ampliado BNs generales con mecanismos eficaces de
representacin, aprendizaje y la inferencia de relaciones causales probabilsticas
implicados en datos de intervalo sobre las variables intervalo-valorados (pg. 27-28).
(Liu & Yue, 2011) En primer lugar, define las probabilidades de intervalos, los dbiles
probabilidades unidas limitados condicionales de intervalo entre ellos la
correspondiente descripcin probabilstica, y las reglas de multiplicacin de
probabilidades de intervalos. Por lo tanto, las relaciones causales probabilsticas de
variables de intervalo-valorados podran estar representados e inferirse con un BN.
Luego, se propusieron e implementaron los mtodos de aprendizaje de la estructura BN
a partir de datos de intervalo y la inferencia aproximada (pg. 27-28).
(Liu & Yue, 2011) La adopcin de la artificial y los conjuntos de datos reales, la
viabilidad de nuestros mtodos propuestos fue verificada. Aparte de anlisis terico, la
convergencia de nuestro algoritmo de inferencia aproximada fue probada y verificada
tambin. Por lo tanto, la correccin de los mtodos para construir y deducir de la BN
con los parmetros de probabilidad de intervalo ha sido verificada. Ms an, hemos
probado la tendencia de intervalo de probabilidad cambia cuando de apoyo y opuestos
evidencias fueron dadas respectivamente. Por lo tanto, llegamos a la conclusin de que
la BN con los parmetros de probabilidad de intervalo es la expansin a una BN
general, con los parmetros de probabilidad de un solo valor preciso (pg. 27-28).
(Liu & Yue, 2011) Este documento tambin deja abierta algunas otras cuestiones de
investigacin interesantes. Sobre la base de los mtodos propuestos en este trabajo, la
integracin de la BN con los parmetros de probabilidad de intervalos se puede estudiar.
Adems, la extensin de las redes probabilsticas cualitativos con medidas de
probabilidad de intervalos se puede llevar a cabo en consecuencia. Mientras tanto,
vamos a hacer ms experimentos ms en la capacidad de aprendizaje de nuestros
mtodos con los conjuntos de datos ms realistas y mejorar nuestra propuesta en este
trabajo. Haremos lo posible para hacer frente a los problemas anteriores en nuestro
trabajo futuro (pg. 27-28).
REFERENCIAS:
Cano, A., & Moral, S. (2000). Using probability trees to compute marginals with imprecise.
Techinical report, 1-46.
Liu, W., & Yue, K. (2011). BAYESIAN NETWORK WITH INTERVAL PROBABILITY PARAMETERS.
International Journal On Artificial Intelligence Tools, 1-30.

DISEO DE UN MODELO DE PLANIFICACIN DE
ZONAS DE ACTIVIDADES LOGSTICAS MEDIANTE EL
EMPLEO DE REDES BAYESIANAS
DEFINICIONES:
(Soler Flores, Gonzlez Cancelas, Camarero Orive, Almazn Grate, & Palomino
Monzn, 2013) Defini: Entre las diferentes tcnicas disponibles en minera de datos,
las redes probabilsticas o redes bayesianas permiten modelizar de forma conjunta toda
la informacin relevante para un problema dado, utilizando posteriormente mecanismos
de inferencia probabilstica para obtener conclusiones en base a la evidencia disponible
(Pearl 1988), (Castillo et al. 1997). Estos modelos se adaptan de forma natural a la
concepcin probabilstica y local actual de la modelizacin en planificacin (pg. 5).
(Soler Flores, Gonzlez Cancelas, Camarero Orive, Almazn Grate, & Palomino
Monzn, 2013) Defini: Se puede decir que una Red Bayesiana es un conjunto de nodos
y arcos. Cada nodo corresponde a una variable, que a su vez representa una entidad del
mundo real, y los arcos que unen los nodos indican relaciones de influencia causal entre
las variables. Una Red Bayesiana es un grafo acclico dirigido, en el que cada nodo
representa una variable y cada arco una dependencia probabilstica, en la cual se
especifica la probabilidad condicional de cada variable dados sus padres (Castillo et al.
1997) (pg. 6).
ANTECEDENTES:
(Soler Flores, Gonzlez Cancelas, Camarero Orive, Almazn Grate, & Palomino
Monzn, 2013) La dificultad para el establecimiento de pautas de dimensionamiento de
Plataformas Logsticas y, en especial, de las Zonas de Actividades Logsticas (ZAL),
recae en la heterogeneidad del desarrollo de este tipo de nodos de transporte a nivel
internacional. Bajo la denominacin genrica de Plataformas Logsticas han surgido
multitud de iniciativas en la escena internacional, que, respondiendo a diferentes
motivos de implantacin de un nodo de intercambio modal, ha producido la aparicin
de diferentes tipos de Plataformas con diversos objetivos que implican unidades
funcionales especficas, con necesidades de localizacin, instalacin y superficie
necesaria deferentes. Este sector logstico tan importante, se encuentra sin
metodologas, herramientas o programas que permitan establecer los parmetros de
planificacin y explotacin ptimos para las diferentes zonas de actividades logsticas,
si bien se han desarrollado tecnologas de trazabilidad de la carga y elementos basadas
en la planificacin logstica, con el objetivo de determinar los parmetros ptimos de
explotacin y planificacin portuaria, a travs de la clasificacin de las zonas de
actividades logsticas, aadiendo la inferencia de escenarios virtuales. Como resultado
principal se destaca que, mediante el empleo de herramientas de inteligencia artificial,
modelos grficos probabilsticos: Redes Bayesianas (BN), se han definido las
principales variables de planificacin de las zonas de actividades logsticas y se puede
planificar con BN una ZAL seleccionando las variables conocidas y obteniendo las
variables a predecir (pg. 1).


METODOLOGA:
(Soler Flores, Gonzlez Cancelas, Camarero Orive, Almazn Grate, & Palomino
Monzn, 2013) Para la consecucin del objetivo de caracterizar los parmetros fsicos
de las zonas de actividades logsticas mediante redes bayesianas, de manera que una vez
construida la y al realizar inferencia probabilstica dadas ciertas variables conocidas de
la ZAL a planificar (evidencia), calcular la probabilidad posterior de las dems variables
(desconocidas) de dicha ZAL. Para la consecucin del objetivo se ha desarrollado la
siguiente metodologa, que se divide en dos tareas: una, para determinar el escenario de
trabajo y, la otra, para desarrollar el modelo de inteligencia artificial (pg. 8).
(Soler Flores, Gonzlez Cancelas, Camarero Orive, Almazn Grate, & Palomino
Monzn, 2013):
Determinacin del escenario de trabajo:
Diagnosis y estado del arte:
Consiste en la revisin del estado del arte para identificar el conjunto de variables de
medida de la explotacin en ZALs, mediante el empleo de buscadores especializados y
gestores de aplicaciones. Se desarrolla en dos etapas:
a) Determinacin de las variables de la ZAL y seleccin de las mismas: se realiza
un estudio de todas las variables de la ZAL susceptibles de investigacin.
b) Obtencin del valor de las variables para las distintas ZALs de estudio: una vez
seleccionadas las ZALs de estudio que se quieren obtener se utilizan diferentes
fuentes de informacin para obtener, los valores de las mismas.
Las variables (rasgos) que intervienen en el clculo de las probabilidades, tanto a priori
como las condicionales son las variables de planificacin de la ZAL. El nmero de
variables (rasgos) conforma una tabla de 2n combinaciones, donde n es un nmero
natural que puede ser considerablemente grande; lo cual constituye una dificultad, cuya
solucin pudiera consistir en reducir el espacio de representacin inicial, de forma tal
que si existen variables superfluas, se analice si se mantienen o no, segn su
importancia desde el punto de vista metodolgico. Una alternativa de solucin al
problema de la seleccin de variables es el uso del conjunto de testores tpicos (Ruiz-
Shulcloper et al. 1990). Los testores tpicos son el nmero de variables (atributos o
rasgos), con los cuales se deben describir los objetos (cuestionarios) que inciden de
manera determinante en un problema. En el modelo propuesto se aplica el algoritmo
LEX (Alganza et al. 2003) para obtener los testores tpicos (pg. 8-9).
MODELOS:
(Soler Flores, Gonzlez Cancelas, Camarero Orive, Almazn Grate, & Palomino
Monzn, 2013) La informacin proporcionada por una o ms variables que se observan
(evidencia), se propaga por la red y actualiza nuestra creencia acerca de las variables no
observadas; por ello es muy importante la seleccin de las variables que darn
informacin para la planificacin. Tras el desarrollo del escenario de trabajo se
concluye que para la planificacin de ZALs, las variables empleadas para la
investigacin son las que se recogen en la Tabla 1 (pg. 9).

Construccin del modelo de inteligencia artificial:
(Soler Flores, Gonzlez Cancelas, Camarero Orive, Almazn Grate, & Palomino
Monzn, 2013) Obtener una red bayesiana a partir de datos, es un proceso de
aprendizaje que se divide en dos etapas: el aprendizaje estructural y el aprendizaje
paramtrico (Pearl 1988). La primera de ellas consiste en obtener la estructura de la red
bayesiana, es decir, las relaciones de dependencia e independencia entre las variables
involucradas. La segunda etapa, tiene como finalidad obtener las probabilidades a priori
y condicionales requeridas, a partir de una estructura dada. A continuacin se describe
la discretizacin de las variables, la construccin del modelo y la inferencia y
clasificacin (pg. 10).
RESULTADOS:
Con la aplicacin de la Red Bayesiana mediante el algoritmo K2, la red construida es la
que aparece en la figura 2.

Figura 2. Red Bayesiana, algoritmo K2 para la estimacin de parmetros para Zona de
Actividades Logsticas
La probabilidad a priori es la que aparece en la Figura 3.

Figura 3. Probabilidad a priori de la Red Bayesiana, algoritmo K2 para la estimacin de
parmetros para Zona de Actividades Logsticas.
A partir de la red construida mediante inferencia, se pueden obtener las probabilidades
que pueden adoptar las discretizaciones de las diferentes variables. A partir de la red
construida, y al realizar la inferencia (Figura 4), la inferencia probabilstica permite:
dadas ciertas variables conocidas (evidencia): que la superficie de la ZAL est en el
estrato de menos de 100 hectreas, que la ubicacin de la ZAL es ubicacin
intraportuaria dentro de la zona de servicio y que el rea intermodal est en desarrollo
(lo que corresponde a un rea intermodal ferroviaria poco madura, con ausencia de
conexin con la red general del puerto), calcular la probabilidad posterior de las dems
variables (desconocidas) como la importancia estratgica de la ZAL, su ordenacin
interna, el rea de servicios. El ejemplo se representa en la Figura 4.

Figura 4. Ejemplo de inferencia de la Red Bayesiana, algoritmo K2 para la estimacin
de parmetros para zona de actividades logsticas
REFERENCIAS:
Castillo, E., Gutirrez, J., & Hadi, A. (1997). Expert Systems and Probabilistic Network. Springer
Verlag, 1-605.
Soler Flores, F., Gonzlez Cancelas, N., Camarero Orive, A., Almazn Grate, J., & Palomino
Monzn, C. (2013). DISEO DE UN MODELO DE PLANIFICACIN DE ZONAS DE
ACTIVIDADES LOGSTICAS MEDIANTE EL EMPLEO DE REDES BAYESIANAS. Ingeniera
Industrial, 1-21.

UTILIZACIN DE REDES BAYESIANAS COMO
MTODO DE CARACTERIZACIN DE PARMETROS
FSICOS DE LAS TERMINALES DE CONTENEDORES
DEL SISTEMA PORTUARIO ESPAOL
DEFINICIONES:
(Camarero, Gonzlez Cancelas, Soler, & Lpez, 2013) En su investigacin Utilizacin
de redes bayesianas como mtodo de caracterizacin de parmetros fsicos de las
terminales de contenedores del sistema portuario espaol defini a las Redes Bayesianas
como Las redes bayesianas son una representacin compacta de una distribucin de
probabilidad multivariante. Formalmente, una red bayesiana es un grafo dirigido
acclico donde cada nodo representa una variable aleatoria y las dependencias entre las
variables fueran codificadas en la propia estructura del grafo segn el criterio de
separacin (pg. 3).
(Camarero, Gonzlez Cancelas, Soler, & Lpez, 2013) Defini: A partir de este
escenario de trabajo para la explotacin de las terminales portuarias de contenedores, se
pretende aplicar una nueva metodologa, en este caso, inteligencia artificial, mediante el
empleo de modelos grficos probabilsticos (redes bayesianas) para determinar los
parmetros ptimos de explotacin y planificacin portuaria, a travs de la clasificacin
de las terminales portuarias aadiendo la inferencia de escenarios virtuales.
ANTECEDENTES:
La planificacin y gestin de las terminales portuarias tradicionalmente se realiza
empleando ratios de gestin y explotacin tomados de experiencias internacionales, y
no con ratios determinados expresamente para sistemas portuarios concretos. Por esto se
hace difcil planificar y gestionar la explotacin de las terminales de contendedores
espaolas con dichos ratios dada su heterogeneidad. El objeto del presente artculo es
determinar los escenarios de eficiencia de las terminales de contenedores de los puertos
fue integran el actual Sistema Portuario Espaol, mediante el empleo de modelos
graficados probabilsticos, redes bayesianas, y se han definido las principales variables
de explotacin portuaria.
METODOLOGA:
(Camarero, Gonzlez Cancelas, Soler, & Lpez, 2013) Para la consecucin del objetivo
de caracterizar los parmetros fsicos de las terminales de contenedores del sistema
portuario espaol, mediante redes bayesianas, se ha desarrollado la siguiente
metodologa (Figura 1). Esta se divide en dos tareas: una para determinar el escenario
de trabajo y la segunda para desarrollar el modelo de inteligencia artificial (pg. 3).

MODELOS:
(Camarero, Gonzlez Cancelas, Soler, & Lpez, 2013) Una vez construidos los
modelos, en esta fase se ha estudiado la capacidad de inferencia de la red construida. La
red construida es la que aparece en la Figura 2. De la red construida se obtienen las
siguientes relaciones padres-hijos e independencia de variables (pg. 5):
Las variables calado, zona_almacenamiento, zona_operacin, linea_atraque y
gruas_muelle son independientes conocida la superficie total.
Las variables gruas_prtico y trfico_total son independientes si conocemos la
variable gruas_muelle.
Las variables superficie total y gruas_muelle son independientes conocida la
variable lnea_atraque.
Las variables gruas_muelle y zona_servicio son independientes conocida la variable
gruas_portico.
Las variables linea_atraque y trfico_total son independientes conocida la variable
gruas_muelle.

(Camarero, Gonzlez Cancelas, Soler, & Lpez, 2013) Mediante la creacin de la red
bayesiana y el estudio de inferencia de escenarios se obtiene la terminal ms probable,
definida por sus caractersticas fsicas principales por subsistemas en funcin de la
superficie total disponible de la terminal como se resume en la Tabla 1 (pg. 6).

CONCLUSIONES:
(Camarero, Gonzlez Cancelas, Soler, & Lpez, 2013) En trminos de redes la
superficie total de la terminal es la que define los tres escenarios (S1, S2 y S3), se puede
elegir como elemento de planificacin, adems, es esta variable una de las variables que
se conocen tanto desde el inicio del planteamiento de un proyecto, cuando se va a
planificar una terminal en un determinado entorno como a lo largo de la explotacin
donde est variable es el rea en que opera la terminal (pg. 6).
(Camarero, Gonzlez Cancelas, Soler, & Lpez, 2013) Si se analizan las distintas
superficies de la terminal, en el caso de la superficie de la zona de operacin se observa
que los escenarios con mayor superficie necesitan mayor superficie de operacin como
se prev a priori. Respecto a la superficie de almacenamiento, ocurre lo mismo. En el
caso de la zona de servicio los resultados son diferentes debido a que muchas terminales
que se encuentran saturadas en su explotacin y la zona de almacenamiento han ido
ocupando la zona de servicios para cubrir estas carencias (pg. 6).
(Camarero, Gonzlez Cancelas, Soler, & Lpez, 2013) De los resultados obtenidos se
puede concluir, respecto al calado, que las variables del subsistema atraque-
carga/descarga, a mayor superficie, no necesariamente se tiene un calado mayor; si el
calado del puerto es elevado, mayor de 16 metros, y es un calado natural, es ptimo
pues no se ha necesitado de obras de dragado; si las obtencin del calado es con obras
de ingeniera, el coste es muy elevado y no es ptimo. Para anticiparse a los futuros
buques portacontenedores denominados megabuques, como corresponde a la Clase E
Maersk Line con capacidad para 1000 TEU (Gonzlez & Camarero, 2009a), se
necesitan calados de 15,5 metros porque el Escenario 1 y el Escenario 3, presentan
mayor probabilidad de poder atender a dichos buques. Las limitaciones de calado no
ralentizan la operativa en el atraque: o se puede operar, o no se puede. Respecto a la
lnea de atraque, a mayor volumen de trfico, es necesaria mayor lnea de atraque (pg.
6).
REFERENCIAS:
Camarero, A., Gonzlez Cancelas, N., Soler, F., & Lpez, I. (2013). Utilizacin de redes
bayesianas como mtodo de caracterizacin de parmetros fsicos de las terminales de
contenedores del sistema portuario espaol. Revista De Ingeniera, 1-9.
Soler Flores, F., Gonzlez Cancelas, N., Camarero Orive, A., Almazn Grate, J., & Palomino
Monzn, C. (2013). DISEO DE UN MODELO DE PLANIFICACIN DE ZONAS DE
ACTIVIDADES LOGSTICAS MEDIANTE EL EMPLEO DE REDES BAYESIANAS. Revista
Ingeniera Industrial, 1-21.

S-ar putea să vă placă și