Sunteți pe pagina 1din 8

Infotaxis colectivo con amebas reactivas: Una nota sobre un

mecanismo simple de inspiración biológica


Abstracto. Estudiamos cómo coordinar un equipo de agentes para localizar una fuente
oculta en una cuadrícula discreta bidimensional. El desafío es encontrar la posición de la
fuente con solo detecciones esporádicas. Este problema surge en diversas situaciones,
por ejemplo, cuando los insectos emiten feromonas para atraer a sus parejas. Se propuso
un mecanismo de búsqueda llamado infotaxis para explicar cómo los agentes pueden
acercarse progresivamente a la fuente utilizando solo detecciones intermitentes.
Aquí, estudiamos el problema de hacer una búsqueda colectiva de infotaxis con agentes
que son casi sin memoria. Presentamos un modelo de inspiración biológica que mezcla
los autómatas celulares estocásticos y los sistemas reactivos de agentes múltiples. El
modelo, inspirado en el comportamiento de la ameba social Dictyostelium discoideum, se
basa en el uso de ondas de difusión de reacción para guiar a los agentes hacia la fuente.
Las emisiones aleatorias de ondas permiten la formación de un grupo de amebas, que
sucesivamente actúan como emisores de ondas u oyentes, de acuerdo con sus
percepciones locales. Presentamos un primer estudio que muestra que el modelo vale la
pena considerar y puede proporcionar una solución simple para coordinar un equipo para
realizar una distribución

Keywords: Bio-inspired models · Multi-agent systems · Infotaxis · Asynchronous cellular automata ·


Probabilistic cellular autómata

1 Introduction
Estudiamos cómo coordinar un equipo de agentes para realizar una búsqueda colectiva
en un entorno bidimensional. El equipo de agentes necesita ubicar una fuente que emite
información que solo se puede detectar esporádicamente. Este problema surge en
diversas situaciones, por ejemplo, cuando los insectos emiten feromonas para atraer a
sus parejas. Hay casos en que las feromonas se dispersan en un entorno turbulento, lo
que hace que sea imposible encontrar la fuente emisora simplemente siguiendo un
gradiente. Como las feromonas se distribuyen en parches, los agentes necesitan confiar
en eventos aleatorios y adaptar su movimiento de acuerdo con las detecciones que
realizan. Vergassola et al. llama infotaxis una estrategia de búsqueda que consiste en
maximizar la ganancia de información en la ubicación de la fuente [6].

Aquí, estudiamos este problema en el contexto de los autómatas celulares. Imagine un


equipo de agentes que están dispersos aleatoriamente en una cuadrícula bidimensional.
Los equipos necesitan ubicar una celda particular, la fuente emisora, pero los agentes
tienen una memoria interna muy pequeña y no tienen un mapa de su entorno ni pueden
construir uno. Su percepción se limita a las células situadas a poca distancia de su
ubicación, y la información contenida en estas células es mínima; por lo general, cada
célula puede adoptar solo unos pocos estados. En cada paso de tiempo, los agentes
pueden detectar la presencia de la fuente (hacer un "golpe"), pero sin conocer la dirección
de la fuente ni su distancia. La probabilidad de detección aumenta a medida que uno se
acerca a la fuente y esta es la única ayuda que puede guiar a los agentes hacia la fuente.
Dado el hecho de que tuvieron éxito o no, los agentes pueden mover o cambiar el estado
de la celda en la que se encuentran. Bajo tales circunstancias, ¿cómo puede un equipo de
agentes lograr una forma de coordinación para ubicar de manera eficiente la fuente?

Se puede llamar a este problema el problema de la infotaxis distribuida con agentes sin
memoria. Por el contrario, la infotaxis (clásica) se ha estudiado principalmente con
agentes que recuerdan dónde ocurrieron los golpes. Esto les permite construir un mapa
de su entorno de acuerdo con las detecciones que han realizado. Como las detecciones
son eventos estocásticos, el mapa se ajusta progresivamente. Curiosamente, se demostró
que una buena estrategia de búsqueda no necesariamente consiste en tratar siempre de
acercarse a la fuente. También es una ventaja moverse ortogonalmente a la dirección
estimada de la fuente para mejorar el proceso de localización de la dirección de la fuente
[6]. Sin embargo, el uso de un mapa en agentes virtuales o en robots reales impone un
cierto grado de complicación. Se han propuesto diferentes soluciones para simplificar este
esquema. En particular, Masson ha propuesto usar solo una proyección del mapa de
probabilidades en una forma predeterminada, donde aparecen los términos de detección y
no detección [4]. Más tarde, esta técnica fue extendida por Zhang et al. para coordinar un
equipo de robots [7].

Preguntamos si podemos simplificar aún más la solución mediante el uso de agentes que
no recuerden dónde se han producido detecciones previas. En este contexto, las
soluciones anteriores no se pueden usar y el desafío es encontrar un método para guiar a
los agentes hacia la fuente de una mejor manera que una caminata aleatoria pura.

En un trabajo previo consideramos el problema de la agregación descentralizada: los


agentes necesitan agruparse y formar un grupo compacto de forma totalmente
descentralizada con solo percepciones locales y sin memoria de sus acciones previas.
Propusimos utilizar un modelo de inspiración biológica, el modelo de amebas sociales,
para realizar esta tarea de recopilación [2]. El esquema de agregación imita el
comportamiento que ocurre en la primera fase de agrupamiento en la ameba social
Dictyostelim discoideum. El mecanismo se basa en la emisión asincrónica de ondas de
difusión de reacción en el medio ambiente: las amebas alternativamente hablan y
escuchan y estos diferentes roles se rigen por eventos aleatorios simples (ver más
detalles en Ref. [2]). Hay una solución de compromiso para encontrar entre estos dos
roles para garantizar un proceso de recopilación eficiente.

Modificamos este esquema de agregación para que el equipo de amebas detecte una
fuente oculta. Informalmente, el sistema funciona de la siguiente manera: en ausencia de
información, un agente realiza una caminata aleatoria en la cuadrícula. Cuando realiza
una detección, que debería ser un evento raro, desencadena una onda de difusión de
reacción en la red. Esta onda se propagará y atraerá a los otros agentes hacia el agente
emisor. La repetición de estos eventos progresivamente ayudará a formar un grupo. Sin
embargo, este grupo no será estático: los agentes que están más cerca de la fuente
tendrán una tendencia a emitir con mayor frecuencia que los agentes que están lejos de
ella. Como consecuencia, el grupo progresivamente se moverá hacia la fuente y
finalmente alcanzará su objetivo. La coordinación del grupo está garantizada por la
naturaleza asincrónica de las interacciones: no hay líderes para tomar decisiones, sino
que cada agente tiene la posibilidad de emitir ondas o de "escuchar" las emisiones de los
demás de acuerdo con un comportamiento estocástico particular que necesita ser
ajustado apropiadamente
Se puede observar que, aunque seductor, el éxito de este escenario no está garantizado.
De hecho, este proceso de comunicación indirecta entre agentes, también llamado
stigmergy, debe tener lugar en un grupo que no es demasiado compacto ni demasiado
escaso. Una agrupación excesiva de agentes es perjudicial porque sus movimientos se
producen en una zona más restringida que si fueran absolutamente libres para deambular
por la red. Por el contrario, si se mantienen alejados el uno del otro, los agentes no
tenderán a moverse colectivamente hacia la fuente. En esta nota, exploramos esta
compensación con algunas primeras simulaciones numéricas. Analizamos si hay algunas
condiciones particulares en las que el modelo de ameba-infotaxis puede ser beneficioso.
No brindamos una respuesta definitiva al problema de la infotaxis distribuida, sino que
buscamos demostrar que una estrategia de búsqueda simple con autómatas celulares es
digna de consideración.

2 Presentation of the Model

Nuestro modelo se define en una cuadrícula cuadrada finita denotada por L = {1,. . ., L} ×
{1,. . . , L}. Este modelo, que podríamos llamar el modelo amobae-infotaxis, está
compuesto por dos capas que interactúan: el entorno y las amebas.

El entorno es un autómata celular compuesto por las celdas de la cuadrícula. Los estados
de las celdas se toman en un conjunto finito Q que se especificará a continuación. El
estado global del entorno se denomina configuración y el conjunto de configuraciones se
denota por QL. En cada paso de tiempo, cada célula calcula su nuevo estado de acuerdo
con su propio estado y los estados de sus vecinos y una posible influencia de las amebas.
En otras palabras, el ambiente es un autómata celular que está en interacción con un
sistema de agentes reactivos.

La fuente emisora es modelada por una célula distinguida σ ∈ L, cuya ubicación es fija.
Como se mencionó anteriormente, en este problema, las células solo pueden realizar
detecciones binarias y la probabilidad de detección disminuye con la distancia a la fuente
emisora. Esta propiedad se modela mediante la introducción de un campo de detección
de probabilidad ρ: L → [0, 1] que asocia a cada celda la probabilidad de realizar una
detección en esta celda determinada. Aquí, trabajamos con un campo que sigue un
inverso ley cuadrada; se describe con: ρ (σ) = 1 y
𝐾
∀𝑐 ≠ 𝜎, 𝑝(𝑐) = ,
𝑑(𝑐, 𝜎)2

donde d (c, c ') = | cx - c'x | + | cy - c'y | es la distancia de Manhattan entre dos celdas de la
cuadrícula c = (cx, cy) y c’ = (c’ x, c’y), y donde K <1 es una constante arbitraria. Otros
autores han usado una disminución exponencial con la distancia a la fuente. Preferimos
usar una función 1 / d2 para permitir la existencia de una pequeña, pero no despreciable,
probabilidad de detección en las células que están lejos de la fuente. Tenga en cuenta
que este campo no hace que el problema sea no local: las probabilidades son
simplemente algunos parámetros fijos que no pueden ser "leídos" directamente por las
células ni por los agentes. También tenga en cuenta que este campo puede ser calculado
por una regla local si se desea (asignando un estado particular a la fuente y calculando
las probabilidades con una ecuación de difusión).

Las amebas son agentes reactivos: se describen por sus posiciones en la red y su estado
interno, que es binario y se toma en el conjunto S = {rec, emi}, que corresponde a un
receptor y un estado emisor, respectivamente. Para un conjunto de N amebas,
denotaremos por p = (pi) ∈ LN el vector de todas las posiciones en la cuadrícula y por s =
(si) ∈ SN el vector de todos los estados internos. La cantidad pi y si por lo tanto denotan la
posición y el estado interno de la i-ésima ameba, respectivamente.

Con estas anotaciones, podemos describir nuestro modelo con un sistema dinámico F,
que opera en el espacio QL × LN × SN. Para una condición inicial (x0, p0, s0) ∈ QL × LN × SN,
su evolución se describe mediante la ecuación recursiva: (xt + 1, pt + 1, st + 1) = F (xt, pt, st).
Vamos a describir ahora cómo se calculan estas cantidades.

Para definir esta ley, presentamos la función ξe que selecciona las celdas excitadas
alrededor de una celda determinada:
ξe (x, c) = {d ∈ D, c + d ∈ L, xc + d = e}
donde D = {(0, 1), (0, -1), (1, 0), (-1, 0)} representa las cuatro direcciones cardinales. Esto
significa que nuestro autómata celular utiliza el barrio de von Neumann, pero tenga en
cuenta que también se puede aplicar fácilmente a otros tipos de barrios [2].

Luego definimos la ley de evolución de Greenberg-Hastings modificada de las celdas con,


para todos c ∈ L:
𝑒 𝑠𝑖 𝑥𝑐𝑡 = 𝑛 𝑎𝑛𝑑 (𝜉𝑒 (𝑥𝑡, 𝑐)𝑛𝑜 𝑒𝑠𝑡á 𝑣𝑎𝑐í𝑜 𝑜 ∃𝑖, 𝑝𝑖𝑡 = 𝑐 𝑦 𝑠𝑖𝑡 = 𝑒𝑚𝑖)
𝑡+1
𝑥𝑐 = { 𝑟 𝑠𝑖 𝑥𝑐𝑡 = 𝑒
𝑛 𝑑𝑒 𝑜𝑡𝑟𝑎 𝑚𝑎𝑛𝑒𝑟𝑎

Evolución de la ameba Primero, necesitamos describir el hecho de que algunas amebas


darán un golpe, es decir, detectarán la fuente con una probabilidad dada que depende de
su ubicación. Para este fin, presentamos la secuencia de variables aleatorias (Ht), donde
Ht dice si un golpe ocurre en una celda dada en un momento dado t:
1 𝑐𝑜𝑛 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝜌(𝑐)
∀𝑐 ∈ 𝐿, 𝐻𝑡 (𝑐) = {
0 𝑐𝑜𝑛 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 1 − 𝜌(𝑐)

El comportamiento de las amebas es el siguiente: en cada paso de tiempo,


independientemente de las otras amebas, cada ameba puede seguir un movimiento
aleatorio según los cuatro puntos cardinales con probabilidad pA, la probabilidad de
agitación. Con probabilidad 1 - pA, se aplica el comportamiento "regular". Informalmente,
este comportamiento regular sigue:

1. Para una ameba en el estado rec, si está parada en una celda neutral y ve una o
varias células excitadas en su vecindario, elige una de estas células excitadas
uniformemente al azar para su movimiento; de lo contrario, permanece estático.
2. Para una ameba en el estado emi, si está parada en una celda neutral, convierte
esta celda en el estado excitado. Luego permanece en estado emi con
probabilidad pR, la probabilidad de reemisión.

La motivación para introducir la probabilidad de agitación pA es doble: por un lado,


agregamos una aleatoriedad que asegura que las amebas no sean demasiado estáticas,
por otro lado, esto nos permite modelar el ruido intrínseco que existiría en el movimiento
de organismos biológicos o robots. El uso de la probabilidad de reemisión pR no es
obligatorio. Simplemente está aquí para permitir que varias ondas de difusión de reacción
se activen cuando ocurre un golpe. Como veremos más adelante, estas ondas tienen una
fuerza atractiva que agrupa a las amebas; esta fuerza atractiva equilibra la fuerza de
dispersión creada por los movimientos aleatorios.
Para escribir esta regla con nuestras anotaciones, tenemos:

Las posiciones evolucionan de acuerdo a:

dónde
- U (X) es una variable aleatoria que selecciona un elemento uniformemente en un
conjunto X,
- B [c, d] es una función que es igual a c + d si c + d está en L yc de lo contrario,
- ξe es el conjunto de células excitadas vecinas a una celda determinada (ver arriba).
La tarea se completa cuando una ameba se mueve a la fuente emisora σ. El tiempo de
detección es el t más pequeño que satisface: ∃i, pti = σ.

3 First Experiments
Recuerde que nuestro propósito es simplemente probar la relevancia de hacer una forma
colectiva de infotaxis con (casi) agentes sin memoria. En aras de la simplicidad,
arbitrariamente corregimos el valor de la constante en Eq. 2 a K = 0.5. De manera similar,
corregimos la probabilidad de reemisión a pR = 0.9 para permitir que se emitan múltiples
ondas cuando ocurre un 'golpe'. Se presentará un primer experimento visual para L = 20 y
N = 5, y luego se darán estadísticas para L = 80 y N = 20.

3.1 Una observación cualitativa

En nuestros experimentos, las amebas se colocan uniformemente al azar en la


cuadrícula. La fuente emisora se coloca en coordenadas (L / 4, L / 4) para dificultar el
problema. De hecho, si se coloca en el centro, las amebas podrían encontrarlo más
fácilmente ya que no necesitan desplazar su centro de gravedad.
Fig. 1. Evolución del sistema para N = 5 amebas en una cuadrícula de tamaño L = 20 con
K = 0.5, pA = 0.2, y pR = 0.9; la fuente emisora está en azul (forma de diamante); Las
amebas se muestran como círculos en negro (estado rec) o en morado (estado emi). Los
colores de las celdas de la cuadrícula son rojo, naranja o blanco, que corresponden
respectivamente a los estados e, r y n. [color en línea, vea también el material adicional
dado en la preimpresión HAL 01327983 https://hal.inria.fr/hal-01327983].

Primero, observemos visualmente cómo un sistema con solo 5 amebas se comporta para
una pequeña rejilla de tamaño L = 20 y una pequeña probabilidad de agitación pA = 0.2.

La Figura 1 muestra una evolución aleatoria particular de dicho sistema. Vemos que
varias ondas de difusión de reacción se emiten en diferentes momentos cuando ocurren
los golpes. En esta evolución, dos aciertos ocurren en un corto tiempo alrededor de t = 20,
lo que nos permite observar cómo la difusión de la reacción se aniquila cuando se
encuentran frontalmente y cómo se fusionan cuando se encuentran ortogonalmente. Esta
es la razón por la cual es importante que la emisión de ondas no ocurra simultáneamente:
como las ondas de difusión de reacción se aniquilan cuando se encuentran, si todas las
amebas emitieran al mismo tiempo, ninguna de ellas podría recibir la información. En
otras palabras, algunas amebas necesitan permanecer en el estado de rec para poder
"sentir" las ondas emitidas por las otras amebas. En esta evolución, después de cien
pasos, las amebas ya están reagrupadas alrededor de la fuente emisora y, en el momento
t = 150, estamos muy cerca del evento de detección de la fuente.

3.2 Un experimento cuantitativo

Ahora hacemos un segundo paso al considerar las variaciones estadísticas del tiempo de
búsqueda en función de la probabilidad de agitación pA. De hecho, pA es el parámetro
más importante en nuestro estudio ya que controla la cantidad promedio de movimiento
de las amebas.

Tomando los mismos ajustes que en el experimento anterior, observamos la variación del
tiempo de detección promedio para un tamaño de cuadrícula de L = 80. Variamos la
probabilidad de agitación pA de 0.1 a 1.0 con un paso de 0.1 y medimos el tiempo de
detección con 1000 muestras aleatorias.

Los resultados se muestran en la Fig. 2 y, curiosamente, presentan un comportamiento


bastante sorprendente del sistema. Se puede observar que se obtiene un mínimo local en
el tiempo de detección para pA ~ 0.2. (Se agrega un punto de muestreo adicional en pA =
0.15 para tener una mejor observación de esta zona).

Fig. 2. Tiempo de detección para N = 20 amebas en función de la probabilidad de


agitación pA para L = 80 (en azul) con K = 0.5, pA = 0.1, y pR = 0.9. La curva en morado
muestra el tiempo de detección cuando las amebas siguen una caminata aleatoria pura
(se suprimen las ondas de difusión de reacción). (Figura de color en línea)

Creemos que la existencia de este mínimo corresponde a un equilibrio entre el efecto


dispersivo de la agitación y el efecto de agrupamiento de las ondas de difusión de la
reacción. De hecho, si pA es demasiado pequeño, las amibas tienden a agruparse en el
mismo punto, ¡no a la fuente! - y permanecer casi estático cerca de este punto. Como los
movimientos aleatorios son raros, si una ameba se aleja progresivamente del punto de
agregación, las ondas emitidas por las otras amebas la devolverán a su punto de partida.
Por el contrario, cuando pA es demasiado alto, el desorden introducido por la agitación ya
no es beneficioso porque la información obtenida al "escuchar" a la otra ameba se "diluye"
con los movimientos aleatorios.

Para los valores de pA que son incluso mayores, es decir, superiores a 0,75, observamos
que el tiempo de detección disminuye nuevamente. Este segundo efecto se explica
simplemente considerando el número promedio de movimientos por paso: dado que el
orden del sistema ya es muy débil (como pA es alto), se vuelve más eficiente aumentar
"mecánicamente" la velocidad promedio de las amebas moviéndose más a menudo.

Para estimar qué parte del comportamiento se debe a las ondas de reacción-difusión y
qué parte se debe a los movimientos aleatorios, estimamos el tiempo promedio de
búsqueda cuando no hay olas (establecemos K = 0). La curva correspondiente en la Fig. 2
no muestra ninguna sorpresa: está disminuyendo con pA y, más precisamente, el tiempo
de detección promedio varía como 1 / pA. Esto es esperado ya que las amebas siguen un
movimiento browniano puro y no interactúan. Podemos observar que para valores
pequeños de pA, la ganancia es importante y para una velocidad promedio similar de
movimientos, el tiempo de búsqueda con la estrategia de búsqueda de amebas-infotaxis
puede dividir un factor 5 con respecto a la estrategia de caminar al azar.

4 Discussion
Esta nota presentaba un modelo discreto para realizar una tarea de infotaxis colectiva en
un entorno donde solo está disponible una información intermitente. Los primeros
experimentos mostraron que el modelo de ameba-infotaxis puede ser un método simple
para realizar una búsqueda colectiva de una fuente oculta. El mecanismo que describimos
depende de la naturaleza probabilística y asíncrona de las detecciones: dado que estos
eventos son raros, los agentes del sistema (las amebas) alternativamente pueden actuar
como emisores o receptores y así coordinar sus movimientos para acercarse cada vez
más al emisor. fuente.

Se necesita una continuación del trabajo experimental para obtener más información
sobre cómo usar amebas virtuales para resolver el problema de la infotaxis
descentralizada. De hecho, aún no está claro en qué situaciones es más eficiente usar
este mecanismo en lugar de una simple caminata aleatoria. También es importante
obtener una visión más precisa de las leyes de escalado del sistema: ¿cómo depende el
tiempo de búsqueda del número de amebas y del tamaño de la cuadrícula? También hay
preguntas que consideran la posible mejora del modelo. Aquí, presentamos una solución
que utiliza solo tres estados para la dinámica de autómatas celulares del entorno y dos
estados para los agentes, pero las posibilidades de extender aún más el comportamiento
de los agentes son numerosas, como por ejemplo, hacer que sus emisiones se ajusten
automáticamente para tener el equilibrio correcto entre "escuchar" y "hablar".

En el contexto de la aplicación del método de la ameba-infotaxis en el contexto de la


robótica distribuida [3,5], también sería interesante probar la robustez de nuestro
esquema frente a varias perturbaciones tales como la introducción de obstáculos en la red
o un no- distribución regular de las probabilidades de detección.

S-ar putea să vă placă și