Sunteți pe pagina 1din 13

HomeostaticAdaptationtoInversionofVisualFieldand

OtherSensorimotorDisruption
Paolo (2000)

Adaptao para inverso do campo visual estudada em um modelo


simulado simples de comportamento homeosttico. Inspirado por recentes
resultados em neurocincia, implementada uma nova arquitetura neural
baseada em redes neurais de dinmica continua. Clulas individuais
comportam-se de forma homeosttica ao facilitar plasticidade local sempre
que suas atividades se distanciam de determinado intervalo. Assim, robs
so evoludos para realizarem a tarefa de seguirem e se aproximarem de
fontes de luz (comportamento este chamado de foto txi ou comportamento
foto ttico). O rob foi provido da estrutura neural com suporte para estados
homeostticos e evoludo de modo a manter a dinmica sensor motora
dentro de limites viveis de existncia. Os resultados apresentados so
promissores para um primeiro modelo, contudo, problemas foram percebidos
para um futuro melhoramento.

Extendedhomeostaticadaptationmodelwithmetabolic
causationinplasticitymechanismtowardconstructinga
dynamicneuralnetworkmodelformentalimagery
Lizuka et. al. (2013)

Os autores testaram o modelo de adaptao homeosttico desenvolvido em


um rob controlado por uma verso de rede neural de tempo continuo
desenvolvida por eles mesmos. Portanto, os autores propem modificaes
nas equaes diferenciais que representam a rede neural recorrente de
tempo continuo para efetivar um modelo capaz de promover o
desacoplamento da dinmica de baixo nvel do comportamento externamente
observado do agente, criando uma dinmica de alto nvel capaz de manter o
comportamento do agente em nveis aceitveis de viabilidade.

OvercomingDeceptioninEvolutionofCognitiveBehaviors
Lehman e Miikkulainen (2014)

Quando neuro-evoluo escalada para comportamentos complexos,


capacidades cognitivas tais quais aprendizagem, comunicao e memria
tornam-se mais e mais importantes. Contudo, a evoluo bem sucedida de
tais habilidades cognitivas permanece difcil. Este artigo argumenta que uma
das principais causas de tais dificuldades a decepo, isto , a evoluo
converge para um comportamento no relacionado soluo desejada. Mais
especificamente, comportamentos cognitivos frequentemente requerem
acumulao de estruturas neurais que no proveem nenhum benefcio
imediato ao desempenho dos indivduos medido pelo fitness, e evoluo

dessa forma frequentemente converge para solues no cognitivas. Para


investigar essa hiptese, os autores adaptaram o domnio
T-Maze, um ambiente comum de robs evolucionrios, de trs diferentes
formas para requerer as capacidades de comunicao, relembrana e
aprendizagem dos agentes. Uma indicao de decepo que a evoluo
guiada por fitness baseado em objetivo frequentemente converge para
comportamentos no cognitivos simples. Em contraste, a evoluo guiada
para explorar novos comportamentos, por exemplo, utilizando busca por
novidades, frequentemente evolui os comportamentos cognitivos desejados.
A concluso que os mtodos abertos de evoluo podem reconhecer
melhor os degraus ou ferramentas de apoio necessrias para o surgimento
de comportamentos cognitivos.

Behaviorbelievabilityinvirtualworlds:agentsactingwhen
theyneedto
Avradinis e Anastassakis (2013)

Objetivo principal do artigo utilizar conceito de necessidades humanas


como fatores motivadores primrios para produzir comportamentos criveis.
Bates (1994) define, no contexto de personagens sintticos, credibilidade
como algo que possui a capacidade de evitar a descrena do usurio quando
expostos a uma iluso de vida. Ou seja, credibilidade em agentes virtuais
tudo sobre como fazer os humanos aceitarem que eles esto interagindo com
personagens vivos, cuja existncia consistente e coerente no contexto do
mundo virtual em que est situado. Essa ltima parte distingue credibilidade
de realismo. Credibilidade est relacionada com a consistncia do agente
virtual com a essncia da entidade que ele incorpora e com a coerncia
desse agente dentro do mundo em que ele est situado. J o realismo, est
relacionado com a criao de um mundo virtual com propriedades fidedignas
ao mundo fsico. Segundo Loyall e Bates (1997), realismo no necessrio e
nem desejvel para a credibilidade. O realismo pode at atrapalhar a
obteno de agentes crveis. Pode-se citar como exemplo o efeito chamado
de vale de estranheza.

Evolving Multimodal Behavior With Modular Neural


NetworksinMs.PacMan
Schrum e Miikkulainen (2014)

O objetivo do artigo a gerao de comportamento multi-modal que


responde diferentemente a diferentes situaes. Por exemplo, no famoso
jogo Pac-Man, os fantasmas podem em alguns momentos serem uma amea
(quando tocam o personagem do Pac-Man, este morre) ou podem ser frgeis
(nesse caso, personagem principal poder devorar os fantasmas). O fantasma
fica frgil quando o personagem do Pac-Man come uma poderosa plula. O
efeito do poder da plula dura pouco tempo e quando termina, os fantasmas
voltam a constituir uma ameaa. Esse cenrio exige que o personagem
principal tenha um comportamento diferente para cada situao. Portanto, os

autores apostaram no uso de comportamentos multi-modais por meio de


neuro-evoluo com um framework chamado Modular Multi-Objective NEAT
(NeuroEvolution de Augmenting Topologies).

ConstructingCompetitiveandCooperativeAgentBehavior
UsingCoevolution
Rawal et. al. (2010)

O artigo aborda a co-evoluo ou evoluo concomitante de comportamentos


competitivos e colaborativos, que geralmente so evoludos separadamente.
Os autores ampliam uma arquitetura multi-agente existente de forma a
suportar vrias redes neurais cooperativas em um agente. Essa arquitetura
demonstra com sucesso a cooperao hierrquica e a competio entre
equipes de presas e predadores. Foi mostrado nesse contexto de coevoluo, que comportamentos de perseguio e fuga emergiram. Desta
forma, a co-evoluo de redes neurais se mostrou escalvel para uma
guerra entre vrias populaes competindo e cooperando, o que mais
prximo da co-evoluo na natureza.
A co-evoluo utilizada refere-se evoluo simultnea de dois ou mais
populaes geneticamente distintas com fitness acoplado ao ambiente. No
caso da co-evoluo competi- tiva, o fitness de um indivduo baseado na
competio direta com um indivduo de outra populao. Em co-evoluo
cooperativa, indivduos de diferentes populaes cooperam para resolverem
um problema.

AnExperimentalStudyoftheEmergentBehaviorsofSelf
OrganizedAgentCommunities(OK)
Wang e Zhu (2007)

O comportamento emergente um fenmeno comum em sistemas


complexos. Tanto em sistemas naturais quanto em sistemas artificiais,
componentes individuais realizam suas aes e tomam decises baseadas
em informao local. Enquanto o sistema completo demonstra propriedades
e comportamentos que tem forte caractersticas globais. O artigo aplica o
mtodo experimental para o estudo de comportamentos emergentes de
comunidades de agentes auto-organizados. O objetivo do estudo duplo.
Primeiro, o objetivo do experimentos validar resultados obtidos em anlises
tericas realizadas previamente. O segundo, explorar as caractersticas da
formao de comunidades que so difceis de obter por meio de anlise
terica, mas adequadas para estudos experimentais.

OnSeeingRobots(OK)
Mackworth (1992)

Mackworth argumenta que agentes situados deveriam ser projetados


utilizando um modelo computacional online unitrio. As redes de restries de

Zhang e Mackworth satisfazem


percepo situada construdos
experimentos de monitoramento
controle visual em tempo real de
em um mundo dinmico.

este requerimento. Dois sistemas para


em laboratrio foram utilizados nos
visual de brao robtico e outro para
mltiplos robs competindo e cooperando

ALayeredApproachtoLearningClientBehaviorsinthe
RoboCupSoccerServer(OK)
Stone e Veloso (1998)
Stone e Veloso (1998) utilizaram aprendizagem de mquina como uma
ferramenta para a construo de clientes para servidores de futebol de rob.
A abordagem utilizada consiste na construo de camadas de
comportamentos cada vez mais complexos, comeando dos comportamentos
mais simples. Os autores descrevem dois nveis de comportamento
aprendidos. Em primeiro lugar, os clientes aprendem habilidades de baixo
nvel, como controlar a bola de forma eficaz. Em seguida, usando essa
estabilidade aprendida, eles aprendem uma habilidade de nvel superior que
envolve vrios jogadores. As habilidades aprendidas mostraram ser
aplicveis s situaes do jogo.

EvolvingKeepawaySoccerPlayersthroughTask
Decomposition(OK)
Whiteson et. al.( 2005)
Whiteson et. al (2005) analisaram o impacto do tradeoff resultado da
codificao de conhecimento humano para auxiliar na aprendizagem de subtarefas resultantes da decomposio de tarefas de controle complexas. O
tradeoff surge porque a codificao do conhecimento humano requer esforo
manual e pode restringir incorretamente o tamanho do espao de hipteses
ou levar a aprendizagem para distante da soluo tima. Para examinar o
impacto desse tradeoff, os autores exploram um espao definido por duas
dimenses: (1) quanta assistncia humana dada e (2) quo difcil a tarefa .
Para isso, um algoritmo de aprendizagem por neuro-evoluo melhorado
com trs diferentes mtodos para aprender os componentes resultantes da
decomposio de tarefas.
1) Co-evoluo: principalmente no auxiliado por conhecimento
humano.
2) Aprendizagem em camadas: altamente auxiliado por conhecimento
humano.
3) Aprendizagem em camadas concorrentes: uma nova combinao
dos dois primeiros que tenta explorar conhecimento humano enquanto
retm alguma flexibilidade da co-evoluo.
Duas verses do problema keepway (um subproblema de futebol de robs)
so usados para avaliao. Os resultados obtidos confirmam que, dado uma

decomposio adequada em subtarefas, neuroevoluo pode dominar


tarefas difceis.

EvolvingMultimodalNetworksforMultitaskGames(OK)
Schrum e Miikkulainen (2012)

Schrum e Miikkulainen (2012) avaliaram diferentes abordagens para


gerao de comportamentos multitarefa para oponentes de jogadores
humanos em jogos de vdeo game. Assim, utilizaram neuro-evoluo de trs
formas diferentes para atingirem esse objeto: (1) no mtodo com vrias redes
(multi-redes), aprende-se controladores separados para cada tarefa; (2) o
mtodo multitarefa evolui unidades de sada separadas para cada tarefa, mas
compartilha informaes dentro da camada escondida da rede; e (3) e o
mtodo de mutao de modo evolui novos modos de sada, e inclui uma
forma de realizar a arbitragem entre eles. Enquanto os dois primeiros
mtodos requerem que a diviso de tarefa seja conhecida, o mtodo de
mutao de modo no tem esse requerimento. Nesse mtodo, a subdiviso
de tarefas realizada automaticamente por meio de um operador de mutao
personalizado. Esse operador adiciona novos neurnios de sada e conta
com um neurnio que faz a arbitragem sobre quais sadas devem prevalecer
a cada momento. Experimentos foram realizados em dois tipos de jogos
diferentes: Front/Back Ramming e Predator/Presa. Os resultados mostraram
que as abordagens tem diferentes foras. A abordagem de muti-redes
mostrou bons resultados em ambos os domnios, tomando a vantagem da
diviso de tarefas j feita. A abordagem multitarefa obtm bons resultados no
domnio do jogo Front/Back Ramming, em que a dificuldade relativa das
tarefas a mesma; mas executa pobremente no cenrio de presa-predator,
em que a dificuldade relativa das tarefas diferente. interessante que a
abordagem de mutao de modo se adapta assimetria do domnio
presa/predador e consegue obter bons resultados. Este resultado mostra que
a diviso humana de tarefas nem sempre melhor. Esses resultados
sugerem como o conhecimento humano e aprendizagem podem ser
combinados mais efetivamente na obteno de melhores resultados.

MultiagentLearningthroughNeuroevolution(Para
introduo)
Miikkulainen et. al. (2012)

Neuroevolution is a promising approach for constructing intelligent agents in


many complex tasks such as games, robotics, and decision making. It is also
well suited for evolving team behavior for many multiagent tasks. However,
new challenges and opportunities emerge in such tasks, including facilitating
cooperation through reward sharing and communication, accelerating
evolution through social learning, and measuring how good the resulting
solutions are. This paper reviews recent progress in these three areas, and
suggests avenues for future work.

ConnectingInteractiveArtsandVirtualRealitywith
Enaction(OK)
Loor et. al.(2014)

Relatam um experimento de teatro virtual conduzido por artistas e cientistas


da computao trabalhando em cincias cognitivas. Trata-se de um
experimento que possibilita a troca de ideias e de conhecimento entre estes
grupos, destacando os benefcios de colaborao desse tipo. Os autores
explicam a ligao entre enao em cincia cognitiva e realidade virtual, e
especialmente a necessidade de desenvolver entidades autnomas que
melhoram a presena em mundos virtuais. Por meio de um experimento de
teatro virtual, demostraram que a Inteligncia Artificial Enativa capaz de
produzir esse tipo de autonomia.

EvolvingMultimodalBehaviorinNPCs
Schrum e Miikkulainen(2009)

A evoluo geralmente bem sucedida na gerao de comportamentos


complexos, mas evoluir agentes que exibem distintamente diferentes modos
de comportamentos sob diferentes circunstncias (comportamento
multimodal) difcil e consome tempo. Assim, Schrum e Miikkulainen (2009)
utilizaram um mtodo para evoluo de comportamentos multimodais em
agentes controlados por redes neurais artificiais: uma mutao de rede que
adiciona neurnios de sada para rede criar um novo modo de sada. Cada
modo de sada completamente define o comportamento da rede, mas apenas
um dos modos escolhido no tempo, baseado nas sadas de neurnios de
preferencia. Com essa estrutura, a rede capaz de produzir sadas
apropriadas para vrios modos de comportamentos simultaneamente, e
arbitrar entre eles usando ns de preferencia. Esta mutao facilita a
descoberta de comportamentos multimodais interessantes ao longo da neuroevoluo. Os resultados em experimentos de jogos de luta, em que NPCs
so evoludos contra jogadores, mostraram resultados promissores.

RealTimeNeuroevolutionintheNEROVideoGame
Stanley et. al.(2005)

Um dos principais objetivos da Inteligncia Artificial (IA) permitir que os


usurios interajam com os agentes que aprendem em tempo real, tornando
possvel novos tipos de simulaes interativas, aplicativos de treinamento e
entretenimento digital. Este artigo descreve um novo tipo de tecnologia de
aprendizagem denominada de real time NeuroEvolution of Augmenting

Topologies (rtNEAT), e descreve como rtNEAT foi usada para o vdeo game
NeuroEvolving Robotic Operatives (NERO). Este jogo representa um novo
gnero de jogo de aprendizagem de mquina onde o jogador treina agentes
em tempo real para realizar tarefas desafiantes em um ambiente virtual.
Prover a leigos a capacidade de efetivamente treinar agentes em tempo real
sem nenhum conhecimento a priori de Inteligncia Artificial ou aprendizagem
de mquina tem amplas implicaes, tanto na promoo da inteligncia
artificial quanto em fazer suas realizaes disponveis ao grande pblico.

AnalysisofEmergentPropertiesinaHybridBioinspired
ArchitectureforCognitiveAgents
Romero e Jimenez (2007)

Romero e Jimnez (2007) desenvolveram uma arquitetura evolucionria,


multi-camadas e autoconfigurvel para agentes cognitivos. Cada camada da
arquitetura de subordinao (subsumption) modelada por uma sistema de
aprendizagem de mquina diferente baseado em tcnicas bio-inspiradas. Um
mecanismo de arbitrao entre camadas baseado em programao de
expresso gnica sugerido. Alm disso, utilizado um mecanismo coevolucionrio para evoluir comportamentos de uma forma paralela e
independente. A abordagem proposta foi testada em um ambiente utilizando
uma plataforma multi-agente e exibiu vrias capacidades de aprendizagem e
propriedades emergentes para autoconfigurar arquiteturas internas de
agentes

Hybridizationofcognitivemodelsusingevolutionary
strategies
Lopez et. al. (2009)

Incorporar diferentes tipos de microteorias da cognio e modular vrios


mecanismos para unificar todas as sadas e aes recomendadas de um
sistema inteligente quando uma enorme quantidade de variveis ambientais
est mudando continuamente com o aumento da complexidade, pode tornarse uma tarefa muito abrangente. O quadro apresentado prope uma
arquitetura cognitiva hbrida que se baseia na integrao de conexionismo de
abordagens de sistemas emergentes e de sistemas autopoiticos e em
abordagens cognitivistas afim de combinar processos explcitos e implcitos
necessrios no desenvolvimento de atividades cognitivas. A arquitetura
proposta inclui diferentes tipos de capacidades de aprendizagem em cada
nvel cognitivo, o que garante uma grande plasticidade arquitetura. Alm
disso, o mdulo de ateno proposto inclui um mecanismo evolutivo baseado
em programao de expresso gnica para evoluir um conjunto de condies
de elegibilidade responsveis pela modulao coligao/subordinao de
comportamentos especializados, levando em considerao a metfora do
teatro para a conscincia. Finalmente, um mecanismo de co-evoluo
proposto para propagar comportamentos e conhecimentos entre sistemas
cognitivos com base em engenharia mimtica. A arquitetura proposta foi

testada em um ambiente de animao utilizando uma plataforma multiagente, onde vrias propriedades emergentes de auto-organizao surgiram.

Anevolutionarybehavioralmodelfordecisionmaking
Lpez (2011)

Para agentes autnomos, o problema de decidir o que fazer a seguir se torna


cada vez complexo quando atua em ambientes estocsticos e dinmicos
enquanto persegue mltiplos e contraditrios objetivos. Um dos modelos
baseados em comportamentos mais relevantes para este problema o
modelo de redes de comportamentos proposto por Maes. Este modelo,
prope um conjunto de comportamentos como unidades intencionais de
percepo-ao que esto conectadas em uma rede no hierrquica e cujo
processo de seleo de comportamento orquestrado por dinmica de
ativao distribuda. Apesar de ser um modelo adaptativo (no sentido de auto
regular seu prprio processo de seleo de comportamento) e a despeito do
fato que vrias extenses foram propostas afim de melhorar o modelo de
adaptabilidade original, no h ainda um modelo robusto que possa
adaptativamente se auto-modificar tanto a topologia de sua estrutura quanto
o propsito funcional da rede como resultado da interao entre os agentes e
seus ambientes. Desta forma, este trabalho prope um modelo hbrido guiado
por programao de expresso gnica, que faz duas principais contribuies:
(1) dado um conjunto inicial de unidades sem significado e desconectadas, o
mecanismo evolucionrio capaz de construir uma rede de comportamentos
bem-definidos e robustos que so adaptados e especializados para as
necessidades e objetivos internos de agentes; e (2) o mesmo mecanismo
hbil a montar estruturas bastante complexas tais quais planos deliberativos
(que opera a longo-prazo) e estratgias de resoluo de problemas. Como
resultado, vrias propriedades de auto-organizao e adaptabilidade
emergiram quando o modelo proposto foi testado em um ambiente de robs
utilizando uma plataforma multi-agente.

CreatingIntelligentAgentsinGames
Miikkulainen (2006)
Game playing
tem sido um tema central em inteligncia artificial.
Considerando que as primeiras pesquisas focaram na utilizao de busca e
lgica em jogos de tabuleiro, aprendizagem de mquina em jogos est sendo
objeto de muitas pesquisas recentes. Em vdeo games, o comportamento
inteligente pode ser naturalmente capturado por meio de interaes com o
ambiente e tcnicas biologicamente inspiradas, tais quais computao
evolucionria, redes neurais e aprendizagem por reforo so bem adequadas
para estas tarefas. Em particular, neuro-evoluo, isto , a construo de
agentes com redes neurais artificiais por meio de evoluo simulada, tem se
mostrado muito promissor em muitos domnios de jogos. Baseado em
feedback distribudo, comportamentos complexos podem ser descobertos por
agentes simples ou por times de agentes, mesmo em tempo real. Tais
tcnicas podem permitir a construo de gneros de vdeo game

completamente novos, e pode mesmo servir como ambiente de treinamento


para pessoas. Tcnicas desenvolvidas para tais jogos podem mesmo serem
aplicadas em outros campos, como robtica, otimizao de recursos e
assistentes inteligentes

AComparativeStudyofNEATandXCSinRobocode
Nidorf e Barone (2010)

Historicamente, algoritmos de aprendizagem foram aplicados em jogos como


um teste de seu desempenho e, com o aumento exponencial de poder
computacional disponvel, aprendizado de mquina tem sido experimentado
em ambientes cada vez mais complexos. Nidorf e Barone (2010) detalham a
aplicao de neuro-evoluo de topologias aumentas (NEAT
NeuroEvolution of Augmenting Topologies) e de sistema classificador de
aprendizagem baseado em preciso (XCS) no ambiente Robocode. Nos
experimentos, o desempenho dos jogadores com essas tcnicas medido
colocando os jogadores guiados por esses algoritmos contra uma srie de
oponentes em vrios desafios tticos. Conclui-se, discutindo-se as vantagens
comparativas de NEAT e XCS, que ambos so capazes de aprenderem
estratgias eficazes, mas NEAT suscetvel a overfiting e XCS faz muito
esforo computacional quando muitas aes esto disponveis. Foi
observado que a seleo apropriada de cenrios de treinamento um fator
chave para garantir que estratgias evoludas so maximamente gerais para
ambos os algoritmos.

Evolving Artificial Neural Networks Applied to Generate


VirtualCharacters
Asensio et. al. (2014)
Industria de jogos de computadores uma das mais lucrativas hoje em dia.
Embora esta indstria tenha evoludo rapidamente nos ltimos anos em
diferentes campos, o uso de Inteligncia Artificial (IA) em jogo parece ter
paralisado. Muitos jogos ainda fazem uso de mquinas de estado simples
para simular a IA de seus personagens no controlados por humanos. Novos
modelos podem ser projetados e propostos para substituir essa tcnicas
jurssica. Asensio et. al. (2014) propem o uso de redes neurais artificiais
como um novo modelo. A Rede Neural Artificial (RNA) ser ento responsvel
por receber as informaes do jogo (sensores) e realizar aes (atuadores)
de acordo com a informao recebida. A busca pela melhor RNA uma tarefa
complexa, que afeta fortemente o desempenho da tarefa, enquanto que
muitas vezes requerem um elevado tempo computacional. Assim, o autor
apresenta um sistema para evoluo e adaptao automtica de redes
neurais artificiais baseada em redes neurais evolucionrias. Esta abordagem
utiliza algoritmo gentico para evoluir RNAs completamente conectadas. O
jogo de teste utilizado foi o Unreal Tournament 2004. O novo agente obtido foi
testado juntamente com o CCBot3, o vencedor da competio BotPrize em
2010, e mostrou uma melhoria significativa no ndice de comparao com o

comportamento humano. Alm disso, temos confrontado nossa abordagem e


o CCBot3 (vencedor da competio BotPrize em 2010) para avaliao de
credibilidade em primeira pessoa (BotPrize utilizando o protocolo julgamento
original), demonstrando que a participao ativa do juiz tem um grande
impacto no reconhecimento do comportamento como parecido com o
humano.

Evolutionofneuralcontrollersforcompetitive
gameplayingwithteamsofmobilerobots
Nelson et. al. (2004)
Nelson et. al. (2004) desenvolveram um treinamento evolucionrio de
controladores baseados em redes neurais artificiais para jogos de times
competitivos desempenhando comportamentos para equipes robs mveis
reais. Essa pesquisa enfatizou o desenvolvimento de mtodos para
automatizar a produo de comportamentos de controladores de robs
comportamentais. Nelson procurou mtodos que no requeriam um projetista
humano para definir comportamentos intermedirios para uma tarefa
complexa de robs. O trabalho fez uso de colnia de robores moveis e um
acoplamento ntimo de ambiente de treinamento simulado baseado em
computador. A aquisio de comportamento em um sistema robtico
evolucionrio foi demonstrado utilizando uma verso robtica do jogo
Capture a Bandeira.
Neste jogo, jogado por dois times de robs
competindo, cada time tenta defender seu prprio gol enquanto tenta atacar o
outro gol defendido pelo outro time. Controladores neurais de rob foram
selecionados com base em suas taxas de vitria e de derrota ao longo de um
torneio. Na sequncia de um torneio, os controladores neurais foram
classificados competitivos de acordo com o nmero de jogos que ganharam a
populao foi propagada usando uma estratgia de mutao e de
substituio. Depois de vrias centenas de geraes, os controladores com
melhores desempenhos foram transferidos para equipes de robs mveis
reais, onde eles apresentaram comportamentos similares aos observados em
simulao incluindo navegao bsica, a capacidade de distinguir entre
diferentes tipos de objetos e comportamentos de tendncia de gol.

EvolvingreactiveNPCsfortherealtime
simulationgame
Hong (2005)
Inteligncia Artificial para jogos tem ganho destaque recente, mas o seu
projeto manual tem um custo muito alto. Um algoritmo evolutivo descobriu

estratgia para jogar sem usar recursos que normalmente exigem o


conhecimento de desenvolvedores. Uma vez que seleo reativa em tempo
real de comportamentos de NPCs necessria para uma melhor reproduo,
um sistema de comportamento reativo que consiste de redes neurais
apresentado. Utilizando apenas as informaes no-interpretadas em jogos,
o algoritmo evolutivo otimiza o sistema de comportamento reativo baseado
em um mtodo co-evolutivo. Hong (2005) demonstrou esse mtodo
desenvolvendo um jogo de simulao em tempo real chamado Build & Build.
Os resultados obtidos foram comportamentos emergentes interessantes que
so adaptativos ao ambiente e confirmaram a aplicabilidade de abordagens
evolucionrias para se projetar comportamentos de NPCs sem contar com a
expertise humana.

Theembodiedandsituatednatureofcomputer
gameplay
Rambusch (2006)
Os jogos de computadores esto sendo abordados de uma ampla gama de
perspectivas, mas a atividade de jogar jogos, com o jogador e suas aes em
foco, at agora, no recebeu muita ateno da pesquisa acadmica.
Abordando jogos a partir de uma perspectiva da cincia cognitiva, no entanto,
Rambusch (2006) argumenta que as teorias sobre cognio incorporada e
situada proveem uma forte base sobre a pesquisa nessa questo em
particular, pois o jogo uma atividade socialmente encarnada e situada,
moldada pela experincia corporal do jogador e suas interaes com o jogo.

Evolvingteambehaviorswithspecialization
Nitschke et. al. (2012)
Nitschke et. al. (2012) avaliaram um metodo de cooperao coevolutivo chamado de Collective Neuro-Evolution (CONE). Esse
metodo foi criado para resolver tarefas de comportamentos
coletivos e aumentar o desempenho de tarefas por meio de
facilitao de especializao comportamental em times de agentes.
Especializao e utilizada como um mecanismo de resoluo de
problemas e sua emergncia e guiada e regulada pelo CONE. CONE
e avaliado comparativamente com os metodos relacionados em
robtica evolucionria
na tarefa de perseguio-evaso. Os
resultados indicam que CONE e apropriado para a evoluo de
comportamentos especializados. A interao de comportamentos

especializados produz heterogeneidade de comportamento em


equipes e comportamentos coletivos de captura de presas que
produzem desempenhos significativamente mais elevados em
comparao aos metodos relacionados.

Coevolutionofrolebasedcooperationinmulti
agentsystems
Yong e Miikkulainen (2007)
Em determinadas tarefas, tais como perseguio e fuga, vrios agentes
precisam coordenar o seus comportamentos para alcanarem um objetivo
comum. Uma questo interessante : como pode o melhor comportamento
evoluiu? Uma abordagem poderosa controlar os agentes com redes
neurais, utilizar co-evoluo em subpopulaes separadas, e test-las aos
mesmo tempo em uma tarefa comum. Neste trabalho, um mtodo chamado
de ESP (Enforced Subpopulations) Multi-agente, proposto e demonstrado
em uma tarefa de captura de presas. Em primeiro lugar, a abordagem
mostrada mais eficiente do que a evoluo de um nico controlador central
para todos os agentes. Em segundo lugar, concluiu-se que a cooperao
mais eficiente atravs atravs de respostas baseadas em funes para o
meio ambiente, ao invs de comunicao direta entre os agentes. Juntos,
esses resultados sugerem que a cooperao baseada em funes uma
estratgia eficaz em certos domnios multiagentes.

Neuroevolutionforadaptiveteams
Bryant e Miikkulainen (2003)
Bryant e Miikkulainen (2003) apresentam um sistema de agentes
homogneos com polticas de controle idnticas, mas que adotam papeis
heterogneos adequados em seu seus ambientes. Segundo os autores, a
abordagem apresentada tem aplicaes em domnios como os jogos de
computadores e pode ser desenvolvida por meio de neuro-evoluo. A
abordagem foi experimentada em um ambiente de estratgia simples,
embora cenrios mais complexos tenham sido discutidos.

CooperativeCoevolution:AnArchitecturefor
EvolvingCoadaptedSubcomponents

Potter e Jong (2003)


Para aplicar com sucesso algoritmos evolutivos para a soluo de problemas
cada vez mais complexos, preciso desenvolver tcnicas eficazes para a
evoluo de solues na forma de interagir de subcomponentes
coadaptadas. Uma das principais dificuldades encontrar extenses
computacionais para os paradigmas evolutivos atuais que permitam tais
subcomponentes "emergirem" ao invs de serem projetado mo. Nesse
contexto, Potter e Jong (2003) descrevem uma arquitetura para a evoluo
desses subcomponentes como uma coleo de espcies que colaboraram.
Dada uma tarefa simples em sequncia de correspondncia, que mostram
que a presso evolutiva para aumentar o condicionamento fsico geral do
ecossistema pode fornecer o estmulo necessrio para o surgimento de um
nmero adequado de subcomponentes interdependentes que cobrem vrios
nichos, evoluir para um nvel adequado de generalidade, e adaptar-se como
o nmero e os papis de seus companheiros subcomponentes mudar ao
longo do tempo. Essas questes foram exploradas atravs de um estudo de
caso envolvendo a evoluo de redes neurais artificiais.

Modelinghabitsasselfsustainingpatternsof
sensorimotorbehavior
Barandiaram e DiPaolo (2011)
Tendncias recentes em cincia cognitiva comprometeram seriamente a
noo de representao (simblica ou sub-simblica) um bloco um bloco de
construo para construo e modelagem terica em cincia cognitiva. A
atual falta de um bloco de construo claro para abordagens dinmicas
cognitivas, situadas e incorporadas clama para uma reavaliao do conceito
de hbito desenvolvido pelos primeiros psiclogos continentais pragmticos e
filsofos. Ao passo que abordagens da neurocincia computacional
contempornea e do aprendizado de mquina ainda sustentarem uma
concepo behaviorista (associao probabilstica) de hbito, Barandiaram e
DiPaolo (2011) propem uma noo rica da modelagem de hbitos como um
padro neurodinmico comportamental autossustentvel onde uma
plasticidade dependente de atividade mostra uma prolongada estrutura
temporal. Este ponto ilustrado com um trabalho sobre robtica evolutiva, a
implementao de uma combinao de plasticidade Hebbiana e
homeosttica. No modelo robtico dos autores, este mecanismo capaz de
gerar desenvolvimento sensrio, reforo de aprendizagem e re-habituao
espontnea s perturbaes sensrio-motoras. Os autores defendem que
uma noo mais rica de hbito pode contribuir significativamente para os
fundamentos de cincias cognitivas, abrindo caminho para a modelagem de
fenmenos psicolgicos mal compreendidos.

S-ar putea să vă placă și