Documente Academic
Documente Profesional
Documente Cultură
FLECK, Leandro1; TAVARES, Maria Hermínia Ferreira2; EYNG, Eduardo3; HELMANN, Andrieli
Cristina4; ANDRADE, Minéia Aparecida de Moares5
1,2
Universidade Estadual do Oeste do Paraná – UNIOESTE, Cascavel, Paraná, Brasil
3,4,5
Universidade Tecnológica Federal do Paraná – UTFPR, Medianeira, Paraná, Brasil
1
fleckmissal@gmail.com, 2mhstavar@gmail.com, 3eduardoeyng@utfpr.edu.br,
4
andrieli.utfpr@hotmail.com, 5mineia.moraes@hotmail.com
Resumo
A atual capacidade computacional tem possibilitado o desenvolvimento constante de ferramentas
de apoio à melhoria contínua dos processos industriais, onde as Redes Neurais Artificiais (RNAs)
merecem especial destaque. Diante disso, o presente artigo tem como objetivo apresentar uma
revisão bibliográfica acerca dos principais conceitos, características e princípios relacionados às
RNAs, com enfoque em suas aplicações práticas. É possível identificar três classes de arquitetura de
redes neurais fundamentalmente diferentes: redes alimentadas adiante com camada única, redes
alimentadas diretamente com múltiplas camadas e redes recorrentes, sendo sua definição de
fundamental importância para a eficiência do processo ao qual se destina. O processo de
aprendizagem de uma RNA pode ocorrer de duas maneiras distintas: aprendizado supervisionado e
aprendizado não supervisionado, tendo como principal diferença a presença ou não de um
supervisor externo. Uma das principais vantagens da RNA é a capacidade de aprender e generalizar,
ou seja, produzir saídas adequadas para entradas inexistentes durante o processo de aprendizagem.
Em termos práticos a aplicação de uma RNA não ocorre de maneira simples, uma vez que,
inúmeros problemas podem ocorrer durante o processo de implementação. Assim, pesquisas
constantes são necessárias a fim de se chegar a uma arquitetura computacional que possibilite
ampliar as atividades de modelagem, simulação e controle.
Palavras-chave: cérebro humano; inteligência artificial; neurônios; pesos sinápticos.
Abstract
The current computing power has enabled the constant development of tools to support continuous
improvement of industrial processes, where the Artificial Neural Networks (ANN) deserves special
focus. Therefore, this article aims to present a bibliographic review on the main concepts, features
and principles related to ANNs, focusing on its practical applications. It is possible to identify three
classes of architecture of neural networks fundamentally different: networks fed forward with single
layer, networks fed directly with multiple layers and recurrent networks, being its definition of
fundamental importance for the efficiency of the process to which it is intended. The learning
process of ANN can occur in two distinct ways: supervised learning and unsupervised learning,
having as main difference the presence or absence of an external supervisor. One of the main
advantages of ANN is the ability to learn and generalize, ie, produce appropriate outputs for
nonexistent entries during the learning process. In practical terms, the application of an ANN does
not occur of simple manner, since several problems may occur during the deployment process.
Thus, researches constants are needed in order to reach a computing architecture that enables
expanding the activities of modeling, simulation and control.
Key-words: human brain; artificial intelligence; neurons; synaptic weights.
A aprendizagem de redes MLP por linearidade das saídas dos neurônios. Essa não
retropopagação (algoritmo BP) consiste de duas linearidade é obtida utilizando-se como função
etapas: a propagação e a retropopagação. Na de ativação uma função do tipo sigmoide,
etapa de propagação, um padrão de ativação é normalmente a função logística, apresentada na
aplicado aos nós da camada de entrada da rede e equação 5.
seu efeito se propaga através da rede, camada
por camada. Na última camada, um conjunto de 5. Principais benefícios e desvantagens
saídas é produzido, configurando-se como das RNAs
resposta real da rede. Na etapa de
retropopagação, todos os pesos sinápticos são Uma RNA extrai seu poder
ajustados de acordo com uma regra de correção computacional através de sua habilidade de
de erro. O sinal de erro é propagado para trás aprender e de generalizar. A generalização se
através da rede, contra a direção das conexões refere ao fato de a rede neural produzir saídas
sinápticas, sendo os pesos sinápticos ajustados adequadas para entradas inexistentes durante a
para fazer com que a resposta real da rede se aprendizagem, tornando possível a resolução de
aproxime da resposta desejada, num sentido problemas complexos, atualmente intratáveis.
estatístico (NIED, 2007). Entretanto, as redes neurais precisam ser
De acordo com Ambrósio (2002), uma integradas em uma abordagem consistente de
característica importante de redes MLP é a não engenharia de sistemas, onde um problema
Revista Eletrônica Científica Inovação e Tecnologia v. 1, n. 13, p. 47-57, jan./jun. 2016 53
Universidade Tecnológica Federal do Paraná
Câmpus Medianeira ISSN 2175-1846
Medianeira, Paraná, Brasil
complexo é decomposto em um número de de que o processamento paralelo tolerante a
tarefas relativamente simples, de acordo com a falhas é possível fisicamente, rápido e
capacidade inerente à RNA (HAYKIN, 2001). poderoso. Os neurobiólogos encaram as
De acordo com Haykin (2001) o uso das RNAs como ferramentas de pesquisa para a
redes neurais oferece as seguintes capacidades: interpretação de fenômenos
Não-linearidade: um neurônio artificial neurobiológicos e os engenheiros olham
pode ser linear ou não-linear. A não- para a neurobiologia buscando ideias para a
linearidade é distribuída por toda a rede. Se resolução de problemas mais complexos do
o mecanismo responsável pela geração do que aqueles baseados em técnicas
sinal de entrada for inerentemente não- convencionais de projeto por conexões
linear, a não-linearidade torna-se uma fixas.
propriedade muito importante. Ambrósio (2002) ressalta que além das
Adaptabilidade: as redes neurais possuem a inúmeras vantagens supracitadas, existem
capacidade de adaptar seus pesos sinápticos algumas desvantagens relacionadas à utilização
a modificações do meio ambiente. Assim, das redes neurais, dentre as quais:
uma rede neural treinada para operar em um Treinamento demorado: dependendo da
ambiente específico pode ser retreinada aplicação da rede neural, o treinamento
para lidar com pequenas alterações nas pode ser demorado, demorando horas ou
condições operativas do ambiente. mesmo dias.
Resposta a evidências: no contexto de Resultados desconcertantes: as redes podem
classificação de padrões, uma rede neural chegar a conclusões contrárias às teorias
pode ser projetada para fornecer aceitas, onde somente o bom senso do
informações sobre a confiança ou crença na pesquisador poderá solucionar tal problema.
decisão tomada, possibilitando rejeitar Caixa-preta: não é possível saber o motivo
padrões ambíguos e, por consequência, que levou a rede a uma determinada
melhorar o desempenho de classificação da conclusão.
rede. Grande volume de dados: para o correto
Informação contextual: O conhecimento é aprendizado da rede, é necessário um
representado pela estrutura e estado de grande volume de dados históricos, o que
ativação de uma rede neural. Cada neurônio pode demandar tempo e recursos.
da rede é potencialmente afetado pelas Preparação dos dados: os dados de entrada
atividades de todos os outros neurônios na da rede neural necessitam de tratamento
rede. Dessa forma, a informação contextual prévio como, por exemplo, a normalização
é tratada naturalmente pela rede. e seleção criteriosa, a fim de obter
Tolerância a falhas: uma rede neural, resultados confiáveis.
implementada em hardware, tem como
característica a tolerância a falhas. 6. Principais aplicações de RNAs
Entretanto, para se assegurar que uma rede
neural seja de fato tolerante a falhas pode A utilização da RNA para um fim
ser necessário adotar-se medidas corretivas específico tem relação direta com a eficiência
no projeto do algoritmo utilizado para com que esta fornece respostas próximas aos
treiná-la. dados de saída reais. Para isso, o neurônio
Análise neurobiológica: o projeto de uma artificial deve ser capaz de aprender uma
rede neural é motivado pela analogia com o determinada tarefa (EYNG, 2008).
cérebro humano, sendo esta uma prova viva De acordo com Eyng et al. (2009) e
Revista Eletrônica Científica Inovação e Tecnologia v. 1, n. 13, p. 47-57, jan./jun. 2016 54
Universidade Tecnológica Federal do Paraná
Câmpus Medianeira ISSN 2175-1846
Medianeira, Paraná, Brasil
Eyng e Fileti (2010), ao aplicar um controlador camadas de saída funções de ativação do tipo
feedforward-feedback, baseado em RNAs, a um lineares. Os valores de Eto gerados pela RNA
processo de produção de etanol por foram comparados com os obtidos pelos
fermentação, cujas características também métodos de Blanney-Criddle e Hargreaves,
indicam a não-linearidade do sistema, os considerando meses referentes a todas as
resultados foram muito satisfatórios, superando estações do ano. O desempenho da RNA
a estratégia de controle tradicional (linear), desenvolvida foi considerado satisfatório,
baseada em um controlador Proporcional representando um método indireto para
Integral Derivativo (PID). estimativa da evapotranspiração, com custos
Salviano (2002) realizou a modelagem reduzidos na aquisição de dados para a
do processo de tratamento de efluentes estimativa dessa variável.
orgânicos visando à predição da concentração Santos et al. (2005) desenvolveram um
de nitrogênio em um reator biológico, sistema para predição da soroprevalência da
fornecendo dados ao operador para controle da Hepatite A, considerando modelos de regressão
dosagem de hidróxido de amônio (NH4OH), de logística e RNAs, sendo seus desempenhos
com o intuito de evitar o excesso de nitrogênio mensurados pela taxa de classificação incorreta
lançado no curso hídrico receptor. Como os em uma amostra do município de Duque de
fenômenos que ocorrem no reator biológico são Caxias (RJ), o qual apresenta elevada
de difícil modelagem fenomenológica e, diante prevalência da doença. Os resultados obtidos
de uma extensa base de dados coletados, com mostraram que o modelo neural, aplicado sobre
informações das variáveis de entrada e saída de a informação relevante extraída do modelo de
interesse, optou-se pela modelagem via RNAs. regressão logística, apresenta um bom
Foram definidas onze variáveis de entrada e desempenho, alcançando uma eficiência de
uma variável de saída (concentração de classificação geral acima de 88%.
nitrogênio no seio do reator), formando uma
arquitetura da rede neural de 11 neurônios na 7. Considerações finais
camada de entrada, 27 na camada oculta e 1 na
camada de saída. Utilizando o modelo neural As RNAs configuram-se como uma
treinado para simular a estação de tratamento de tecnologia embasada em raízes
efluentes, detectou-se a realização de um multidisciplinares, sendo fundamentada pela
procedimento operacional (adição de anti- neurociência, matemática, física, estatística,
espumante ao reator biológico) que resultava em ciência da computação e engenharia. Como
aumentos bruscos da concentração de resultado do acelerado desenvolvimento
nitrogênio. Diante da informação obtida foi tecnológico, as redes neurais passaram a ter
possível eliminar a adição de anti-espumante ao aplicações em diferentes campos como, por
reator, permitindo uma melhor estabilização da exemplo, em processos de modelagem, análise
estação de tratamento. de séries temporais, reconhecimento de padrões,
Alves Sobrinho et al. (2008) processamento de sinais e controle de processos.
elaboraram uma RNA para estimar a Uma das principais características que
evapotranspiração de referencia (Eto) em função fundamentam sua ampla aplicabilidade é a
de dados diários de temperatura do ar. A RNA habilidade de aprender a partir de dados de
foi treinada tomando-se por referência a Eto entrada com ou sem a supervisão de um
diária obtida pelo método de Penman-Monteith. professor.
Nas camadas intermediárias foram utilizadas Para que a rede neural forneça resultados
funções de ativação do tipo tan-sigmóide, e nas satisfatórios, além de uma arquitetura adequada,
Revista Eletrônica Científica Inovação e Tecnologia v. 1, n. 13, p. 47-57, jan./jun. 2016 55
Universidade Tecnológica Federal do Paraná
Câmpus Medianeira ISSN 2175-1846
Medianeira, Paraná, Brasil
o processo de treinamento e validação deve ser Universidade Estadual de Campinas.
efetuado com qualidade. Dessa forma, se faz EYNG, E.; FILETI, A. M. F. Control of absorption
necessário fornecer à rede dados representativos columns in the bioethanol process: Influence of
da dinâmica do processo, onde a determinação measurement uncertainties. Engineering Applications of
Artificial Intelligence, v. 23, p. 271-282, 2010.
destes valores deve ser efetuada de modo a
propiciar uma rede que forneça bons resultados EYNG, E.; SILVA, F. V.; PALÚ, F.; FILETI, A. M. F.
sem que haja um esforço computacional Neural Network Based Control of an Absorption Column
in the Process of Bioethanol Production. Brazilian
excessivo. Archives of Biology and Technology, v. 52, p. 961-972,
Na prática, a aplicação das redes 2009.
neurais não ocorre de maneira tão simples.
HAYKIN, S. Redes Neurais- Princípios e Práticas.
Inúmeros problemas podem ocorrer durante o BOOKMAN, São Paulo, 2ª ed. 2001. 900 p.
seu processo de implementação, podendo
restringir sua aplicação em situações HOPFIELD, J. J. Neural networks and physical systems
with emergent collective computational abilities.
específicas. Além disso, as RNAs normalmente Proceedings of the National Academy of Science of the
não conseguem fornecer soluções precisas USA. v.79, n.8, p.2554-2558, 1982.
quando aplicadas isoladamente, sendo
MACHADO, W, C.; FONSECA JÚNIOR, E. S. Redes
integradas a outros tipos de sistemas. Assim,
Neurais Artificiais aplicadas na previsão do VTEC no
pesquisas constantes são necessárias a fim de se Brasil. Boletim de Ciências Geodesicas, v.19, n.2, p.
chegar a uma arquitetura computacional que 227-246, 2013.
possibilite ampliar as atividades de modelagem,
McCULLOCH, W.; PITTS, W. A logical calculus of the
simulação e controle. ideas immanent in nervous activity. Bulletin of
Mathematical Biophysics, v.5, p.115-133, 1943.
8. Referências MINSKY, M. L.; PAPERT, S. A. Perceptrons, MIT
Press, Cambridge, MA. 1969.
ALVES SOBRINHO, T.; RODRIGUES, D. B. B.;
OLIVEIRA, P. T. S.; REBUCCI, L. C. S.; MIRANDA, F. A.; FREITAS, S. R. C.; FAGGION, P. L.
PERTUSSATTI, C. A. Estimativa da evapotranspiração Integração e interpolação de dados de anomalias ar livre
de referência através de redes neurais artificiais. Revista utilizando-se a técnica de RNA e krigagem. Boletim de
Brasileira de Meteorologia, v.26, n.2, p. 197-203, 2011. Ciências Geodésicas, v.15, n.3, p. 428-443, 2009.
AMBRÓSIO, P. E. Redes neurais artificiais no apoio ao NIED, A. Treinamento de redes neurais artificiais
diagnóstico diferencial de lesões intersticiais baseado em sistemas de estrutura variável com taxa de
pulmonares. 2002. Ribeirão Preto – SP. Dissertação aprendizado adaptativa. 2007. Belo Horizonte, MG.
(Mestrado) – Faculdade de Filosofia, Universidade de São Tese (Doutorado) – Programa de Pós-Graduação em
Paulo. Engenharia Elétrica, Universidade Federal de Minas
Gerais.
BISHOP, C. M. Neural networks for Pattern
Recognition. Clarendon Press, Oxford, 1995. OLESKOVICZ, M.; COURY, D. V.; AGGARWAL, R.
K. O emprego de Redes Neurais Artificiais na detecção,
BRAGA, A. de.; LUDERMIR, T. B.; CARVALHO, A. classificação e localização de faltas em linhas de
C. P. de L. F. Redes Neurais Artificiais teoria e transmissão. Revista Controle e Automação, v.14, n.2,
aplicações, Rio de Janeiro: LTC – Livros Técnicos e p. 138-150.
Científicos Editora S.A., 2000.
ROSENBLATT, F. The perceptron: A probabilistic model
BRAGA, A. P.; LUDENIR, T. B.; CARVALHO, A. C. P. for information storage and organization in the brain.
L. F. Redes Neurais Artificiais: teorias e aplicações. Psychological Review, v.65, n.6, p. 386-408, 1958.
Livros Técnicos e Científicos, Rio de Janeiro. 2007.
SALVIANO, F. O. C. Modelagem e simulação de um
EYNG, E. Controle Feedforward-Feedback aplicado às tratamento de efluentes orgânicos através de redes
colunas de absorção de produção de etanol por neurais. 2002. Campinas, SP. Dissertação (Mestrado) –
fermentação. 2008. Campinas, SP. Tese (Doutorado) – Faculdade de Engenharia Química, Universidade Estadual
Programa de Pós-Graduação em Engenharia Química, de Campinas.