EspacoEnergia Samuel Bellido Rodrigues

ESPAÇO ENERGIA | ISSUE xx | MONTH 20xx
in recent years, the support vector regression (SVR) has also

Forecasting of the appeared as a promising alternative for predicting them. In
several papers, the performance of the ARIMA models and
the SVRs are confronted and different conclusions are gotten
relative such that they cannot be considered conclusive. Thus, this
paper put forward a hybrid approach for predicting of real
displacements in time series called the ARIMA-SVR hybrid approach. It
combines both the ARIMA models and the SVRs in order to
take advantage, simultaneously, from the linear
block I11 of the autodependence (by using the ARIMA models) and from the
non-linear autodependence (by using the SVRs models)
presenting in the time series, as well as it uses the wavelet
Itaipu hydroelectric decomposition and linear combination of forecasts (CL). The
results indicated that the ARIMA-SVR hybrid approach can be
plant dam through a an effective methodology to obtain accuracy gain in the
forecasting process.
ARIMA-SVR hybrid Keywords: Time series forecasting, ARIMA, decomposition

wavelet, support vector regression, linear combination of
forecasts.
approach Resumo: Nas últimas quatro décadas, os modelos ARIMA têm
sido amplamente utilizados na previsão de séries de
tempo. No entanto, nos últimos anos, a regressão por vetores
Previsão dos deslocamentos suporte (SVR) se apresenta como uma alternativa promissora
para a previsão. Em vários trabalhos, o desempenho dos
relativos no bloco I11 da modelos ARIMA e SVR são comparados obtendo conclusões
mistas em termos de acurácia de previsão. Assim, este
barragem da usina trabalho apresenta uma abordagem híbrida para previsão de
séries de tempo real a qual chamaremos de abordagem
hidrelétrica de Itaipu híbrida ARIMA-SVR. Ele combina os modelos ARIMA e SVR
para tirar proveito, simultaneamente, da dependência linear
através de uma abordagem (usando os modelos ARIMA) e da não-linear (usando o
modelo SVR) apresentado na série temporal, bem como usa
híbrida ARIMA-SVR a decomposição wavelet e combinação linear de previsões
(CL). Os resultados indicaram que a abordagem híbrida de
ARIMA-SVR pode ser uma metodologia eficaz para obter
Samuel Bellido Rodrigues 1 ganho de precisão no processo de previsão.
Levi Lopes Teixeira1
Palavras-Chave: previsão de séries temporais, ARIMA,
Luiz Albino Teixeira Júnior2 decomposição wavelet, regressão por vetores suporte,
Arinei Carlos Lindbeck da Silva3 combinação linear de previsões.
Paulo Henrique Siqueira3
Edgar Manuel Carreño Franco4
1 Introdução
1
Universidade Tecnológica Federal do Paraná A previsão de séries de tempo é uma importante área de
samuelb@utfpr.edu.br pesquisa. Para prever uma série de tempo são utilizadas
levilopes@utfpr.edu.br observações passadas da mesma variável que são coletadas
e analisadas com o intuito de desenvolver um modelo que
2 apresenta a relação implícita entre passado e futuro. Várias
Universidade Federal da Integração Latino-
Americana - UNILA pesquisas têm sido realizadas ao longo dos últimos anos para
Luiz.a.t.junior@gmail.com o desenvolvimento e aprimoramento da previsão de séries
de tempo, como por exemplo, [1], [2] e [3].
3
Universidade Federal do Paraná O objetivo consiste em modelar a série de dados existente
arineicls@gmail.com com o intuito de estimar valores futuros de dados
paulohs@ufpr.br desconhecidos com a melhor precisão possível. Tal precisão
na previsão de séries temporais é fundamental para muitos
4
Universidade Estadual do Oeste do Paraná processos de decisão, deste modo a pesquisa em modelos
emfra.uinoeste@gmail.com utilizados para prever séries temporais nunca foi
interrompido, [4], [2], [5].
Abstract: Last four decades, the well-known ARIMA models
have been widely used for time series forecasting. However,
1
Dentre os modelos e algoritmos existentes para prever uma entre outros. No caso da série temporal ( y t ) t =1 apresentar
T
série temporal o método Arima [6], que consiste em ajustar

modelos lineares auto-regressivos integrados de médias componente sazonal, o modelo de Box & Jenkins plausível é
móveis, é sem dúvida um dos mais populares, e diversas dado genericamente, em na equação 2:
aplicações são encontradas na literatura [2], [7] e [8].
φ ( B ) (1 − Φ 1 B − … − Φ P B P S ) ∇ d (1 − B S ) y t =
D
(2)
A regressão por vetores suporte (SVR) [9], que é uma θ ( B ) (1 − Θ 1 B − … − Θ Q B QS
)ε t
máquina de aprendizagem baseada na teoria da

Onde d é a ordem das diferenças simples, D é a ordem das
aprendizagem estatística, e adere ao princípio da
diferenças sazonais, S é o período sazonal, ϕ ∈ e ∈
minimização do risco estrutural, é uma técnica que vem
são os coeficientes dos polinômios não sazonais e ∈ e
sendo usada frequentemente nos últimos anos na
∈ são os coeficientes dos polinômios sazonais.
modelagem de séries temporais não lineares com
extraordinário sucesso [10], [11], [12].
3 Wavelet
Segundo [13], a combinação de previsões possibilita a
geração de melhores previsões. De acordo com [14], a A análise Wavelet tem se mostrado nos últimos anos uma
diversificação de previsões leva a diminuição do erro, e [15] ferramenta eficiente em vários ramos de pesquisa, tais como:
salienta que a previsão combinada é uma agregadora de engenharia, física, matemática e estatística.
informações oriundas de diferentes fontes (no caso, os
métodos preditivos base) sobre a flutuação estocástica da Função Wavelet é uma função capaz de decompor ou
série temporal a ser modelada. representar uma série de temporal originalmente descrita
num domínio de tempo de tal forma que a série possa ser
Neste trabalho uma abordagem híbrida para previsão de analisada em diferentes escalas de frequência de tempo. A
séries temporais usando os modelos ARIMA e a decomposição de uma função com o uso de wavelet é
decomposição Wavelet aplicado na regressão de vetores conhecida como transformada wavelet.
suporte e a consequente combinação é realizada.
Na Análise de Fourier (canônica), uma série temporal
(unidimensional) com T observações, denotada por
2 Metodologia Box e Jenkins . = 1 , 2 ,…, , é ortogonalmente decomposta
A metodologia proposta por [6], apresenta a metodologia em termos de senos e cossenos em diversas bandas de
que fez a integração de conhecimentos existentes na época. frequências [16]; enquanto que, na Análise Wavelet, . é,
A metodologia consiste em ajustar modelos auto-regressivos de forma ortogonal, decomposta, simultaneamente, a partir
integrados de médias móveis (ARIMA) a um conjunto de de informações de escala e de translação capturadas a partir
dados a partir de três estágios: identificação do modelo, de um conjunto de funções wavelet ω , . " , ∈ #$ , onde
%
estimação dos parâmetros e verificação do modelo ajustado. cada mapa ω , . 2 $ ω 2 . & ' é gerado por meio
Segundo [6], um modelo ARMA plausível para a série da dilatação (que está associada ao parâmetro m) e
( yt )t =1 ,
T
temporal T= cardinalidade, de ordens p translação (que está associada ao parâmetro n) de uma
(autorregressivo) e q (médias móveis) é descrito pela função wavelet ω . original conforme [17]. Segundo [18], o
equação (1): parâmetro m é chamado de parâmetro de escala diádica e n,
de parâmetro de translação unitária.
Zt = δ + φ1Z t −1 + φ2 Z t − 2 + …
(1) Em [19], verifica-se, empiricamente, que cada função
+φ p Z t − p − θ1at −1 − θ 2 at − 2 − …− θ q at − q + at wavelet ω , . está associada ao mapeamento das
componentes de detalhe (que são as componentes de alta
frequência) de . ; e, teoricamente, que a componente de
O modelo da equação (1) combina valores passados das
entradas Zt e choques aleatórios ( at ) descorrelacionados, aproximação (que consiste na componente de baixa
de média zero e variância constante. Neste modelo , ∈ frequência) de . está associada ao conjunto de funções
, com 1, … , 1, … , , denotam os parâmetros do (wavelet) escala ϕ (, . " . Cada mapa ϕ (, .
∈#
%(
modelo e uma constante. Na hipótese da série temporal ser 2 $ ϕ 2 ( . & ' , onde )* é um número inteiro fixo, é
não estacionária, esta deve ser diferenciada e o modelo gerado por meio da translação unitária n de uma função
ARMA(p,q) substituído pelo ARIMA(p,d,q), sendo d a ordem escala original ϕ . [17]. De acordo com [20], por definição,
de diferenciação da série. Para a identificação do modelo, as as funções wavelet e as funções escala consistem em ondas
ordens p e q podem ser determinadas por meio da análise do de curta duração, geralmente assimétricas, que permitem a
perfil dos gráficos das funções de autocorrelação (FAC) e sua dilatação diádica n (positiva ou negativa) e translação
autocorrelação parcial (FACP). Identificado o modelo, passa- unitária m (positiva ou negativa) de seu domínio. Não
se ao estágio seguinte que é a estimação dos parâmetros. obstante, definições mais formais e gerais, do ponto de vista
Para tanto, é necessário utilizar métodos iterativos não matemático, podem ser verificadas em [19]. Segundo [17],
lineares de mínimos quadrados, maiores detalhes podem ser as famílias wavelet, em geral, são apresentadas em pares
encontrados em [6] e [16]. Para a validação do modelo já constituídos de uma função wavelet ω . e uma função
com os parâmetros estimados pode-se usar testes escala ϕ . originais. As famílias wavelet de Haar,
estatísticos, tais como: teste de Box-Pierce, teste do Daubechies, Coifelet e Symelet são exemplos de famílias que,
periodograma acumulado, teste da autocorrelação cruzada,
2
comumente, são utilizadas na modelagem de séries Para a formulação dual, serão introduzidos alguns
temporais, para fins de geração de previsões.
multiplicadores de Lagrange (α ,α ) não negativos conforme
i
*
i
De acordo com [21] e [17], tem-se que a decomposição relata [9] e [19]. Logo o problema, agora de maximização, na
wavelet de uma série temporal . é dada, genericamente, sua forma dual é dado por:
na equação 3.
1 l l
. +%( . , ∑/0 ( .% . 3 Maximizar − ∑

2 i , j =1
(α i − α i* )(α j − α *j ) x i , x j − ε ∑ (α i + α i* )
i =1
l
Onde: +%( . ∑ ∈# 2 (, (, . é a componente de + yi ∑ (α i − α i* ) (5)

aproximação de nível )* de . ; .% .
i =1
l
∑ ∈# 3 , 4 , . é a componente de detalhe de nível ) de Sujeito a ∑ (α i − α i* ) = 0

. ; 3 , e 2 (, são, respectivamente, os coeficientes de
i =1
α i ,α i* ∈ [ 0, C ] , ∀i = 1,..., l
detalhe e de aproximação e são calculados, ainda nesta
ordem, a partir do produto interno usual entre . e e a função linear de aproximação passa a ser:
4 , . (isto é, 3 , ∑6708 5 4 , 5 ) e entre . e
(,
. (isto é, 2 (, ∑6708 5 4 , 5 ), para todo l
)* , ), ' ∈ #, onde # é o conjunto dos números inteiros. f ( x ) = ∑ (αi − αi* ) xi , x + b (6)

Na prática, é usual que o parâmetro )* assuma valor igual ao
i =1
nível de decomposição. Em particular, em uma A formulação dual do problema SVR fornece como
decomposição wavelet de nível p=2, onde o truncamento, em alternativa trabalhar em um espaço de alta
(3), ocorre na segunda componente de detalhe, se adota dimensionalidade. Assim, pode-se realizar um mapeamento
)* 2. Com efeito, tem-se que: . +$ . , .$ . , não linear dos dados de entrada para um espaço de dimensão
.9 . +:, onde : é o vetor de erro de aproximação. maior, onde a regressão linear torna-se possível. Para isso,
Independente do nível p de decomposição wavelet, observa- utiliza-se a abordagem baseada em funções Kernel
se empiricamente que : é, em geral, constituído de valores K ( x , x ' ) := φ ( x ) , φ ' ( x ) , cuja sua introdução no problema
muito próximos a zero, de modo que pode ser de otimização faz com que este passe a ser descrito da
desconsiderado para fins de geração de previsões (pontuais). seguinte forma:
1 l l
4 Support Vector Regression Maximizar − ∑ (α i − αi* )(α j − α *j ) K ( x i , x j ) − ε ∑ (α i + α i* )
2 i , j =1 i =1
A regressão de vetores de suporte (SVR, Support Vector l
Regression) é fundamentada em uma máquina de vetor de + yi ∑ (αi − α i* ) (7)

i =1
suporte (SVM, Support Vector Machine), [9]. O modelo l
produzido por SVR depende apenas de um subconjunto dos Sujeito a ∑ (α

i =1
i − αi* ) = 0
dados de formação e por sua função de custo que é utilizada
α i ,αi* ∈ [ 0, C ] , ∀i = 1,..., l
para a construção do modelo, ignorando os dados de
formação perto do modelo de previsão.
e a função de aproximação da SVR não linear passa a ser
As descrições a seguir sobre o SVR baseiam-se no tutorial de
l
[22], mais detalhes, podem ser encontrados nesse guia. f ( x ) = ∑ (αi − αi* )K ( xi , x ) + b (8)
i =1
Seja uma amostra de dados de treinamento
{( x , y ) ,... ( x , y )} ⊂
1 1 l l X × ℝ , onde X indica o espaço de Dentre as funções Kernel mais utilizadas no algoritmo SVR
padrões de entrada, o objetivo é encontrar uma função destacam-se o Kernel: linear, polinomial homogêneo,
f ( x ) , que apresente no máximo um desvio ε dos alvos yi , polinomial não homogêneo, sigmoidal e gaussiano.
obtido para todos os dados de treinamento. Logo, descreve-
se a função linear de aproximação por 5 Combinação de Previsões
f ( x ) = w , x + b com ω ∈ X , b ∈ ℝ , onde .,. denota o
A combinação de acordo com [23] é uma metodologia
produto interno em X . Contudo, nem sempre é possível atraente na obtenção de previsões, pois ao invés escolher a
garantir a viabilidade do problema, já que existem pontos melhor técnica, o problema passa a ser de quais técnicas
que violam as restrições, assim chegamos à formulação podem ajudar na melhoria da acurácia.
mencionada em [9], com váriaveis de folga:
Conforme [24], as previsões pontuais são combinadas
1 2  l  linearmente utilizando algum mecanismo ponderador de
minimize w + C  ∑ξi + ξi* 
2  i =1  forma à minimização da variância dos resíduos combinados
yi − w,xi − b ≤ ε + ξi (4) ou outra função residual. Os pesos podem ser fixos ou
 variáveis (não necessariamente positivos) e / ou somar ou
sujeitoa :  w,x i + b − y1 ≤ ε + ξi*
 não uma unidade. Destaca-se ainda que as médias, simples,
ξi ,ξi ≥ 0, ∀i = 1,..., l
*
ponderada ou harmônica, também podem ser utilizadas na
combinação de previsões.
3
Já [25] propôs o método de combinar os resultados dos eficiência na modelagem de séries oriundas de processos não
modelos de previsão mais eficientes, com a finalidade de lineares. Obtidas as previsões das componentes wavelet,
agregar as características mais relevantes de cada um dos estas serão combinadas linearmente a fim de se obter a
modelos utilizados em uma determinada situação, os autores previsão ̂7 .
sugeriram uma combinação, para a previsão da série
Considere a sequência infinita ̃ 7 ∈ # obtida da série
temporal {yt }Tt=1 , onde a previsão é combinada temporal 7 6708 , onde é a cardinalidade da série, a partir
, 5 ∈ G1, … , H
linearmente. da igualdade ̃7 F 7
0, 5 ∈ # \ G1, … , H
. Segundo [19], a
Foi utilizado em [26] a média aritmética das previsões decomposição wavelet de nível de uma série temporal ̃7
individuais. Já em [13] foi proposto, entre outros métodos, em relação a uma determinada base ortonormal wavelet é
uma combinação linear sem restrição para os coeficientes e representada por (9).
adição de uma constante. No trabalho de [27] é proposto o
uso de filtros de Kalman para o cálculo dos coeficientes e que ̃7 ≅ K̃7 ∑ ∈LM%( 2 (, (,
,
(Q RS8
estes sejam variáveis ao longo do tempo. ∑ 0 (
N∑ ∈LO% 3 , 4 , P (9)
No trabalho de [24] ele utilizou programação matemática Onde ΓU%( e ΓV% são subconjuntos de índices em #. A
para calcular os coeficientes da combinação linear. O autor
determinação de tais conjuntos ocorre através da
minimização do erro quadrático médio (MSE) entre ̃7 e K̃7 .
otimizou um problema de programação não linear, onde a
função objetivo era constituída pela soma dos erros de
previsão ao quadrado. As componentes de aproximação ∑ ∈LM%( 2 (, (,
e
detalhe ∑ ∈LM%( 2 (, (,
provenientes da decomposição
6 A metodologia híbrida da série de resíduos foram obtidos a partir do aplicativo
computacional Matlab 8.0, que oferece várias opções de
A comparação entre a modelagem linear ARIMA e da bases wavelet, tais como: as famílias daubechies (db), coiflets
modelagem não linear SVR nos últimos anos vem (coif) e symlets (sym), desenvolvidas por Ingrid Daubechies
despertando a atenção de cientistas em volta do mundo, [20]. Neste trabalho, a série 7 foi decomposta em nível
fazendo uma revisão da literatura se encontram estudos 2, que resulta em duas componentes de detalhe W8 WA e
comparativos entre o desempenho destes métodos, como uma de aproximação XA .
por exemplo , [5], [11], [28], [29], [30], [31], [32] , [33] e [34]
entre outros. No entanto, não se pode afirmar que nenhum Uma vez obtidas as componentes wavelet de aproximação e
deles é um modelo universal e o mais apropriado para todas detalhe para a série de resíduos, estas foram modeladas por
as situações. SVR, resultando as previsões das componentes wavelet de
detalhe W YA e aproximação XZA . No passo seguinte
Y8 W
Do fato de ser de interesse extrair completamente
obteve-se a previsão do resíduo a partir da combinação linear
características lineares e não lineares de um conjunto de
descrita em (10)
dados em um problema real a metodologia híbrida que tem
ambas capacidades mostra ser uma boa estratégia de ̂7 [8 XZA , [A W
Y8 , [\ W
YA 10
utilização, já que, combinando diferentes modelos,
características distintas podem ser capturadas, na literatura onde [8 , [A [\ são parâmetros a serem determinados com
pode-se encontrar alguns trabalhos que visam capturar a resolução do problema de programação não linear (11),
estruturas lineares e não lineares através de metodologias cuja função objetivo é a raiz do erro quadrático médio (RMSE)
hibridas, tais como: [35] , [36], [3], [1], [12], [27], [4], [37], entre o resíduo 7 e a sua previsão combinada ̂7 .
[2].
8
] ' ^]_` a ∑6708 7 & ̂7 A 11
Seja a série temporal ;7 <7 , =7 , :7 , onde Lt denota a 6
componente linear, Nt a componente não linear e :7 ∼ b. 2. [8 , [A [\ bãd ee b5e 52b

. . 3. = 0, @ A . Inicialmente, ajusta-se um modelo ARIMA à Na hipótese do modelo ARIMA ter capturado as estruturas
série ;7 , obtendo-se a sua previsão ;B7 e a componente total Y7
lineares da série e o SVR as não lineares, então = ̂7 e a
de resíduo 7 ;7 & ;B7 . Características lineares do ARIMA previsão da série temporal pela modelagem híbrida
permitem representar a previsão de <7 por ;B7 , assim a série proposta, a qual chamaremos de ARIMA-SVR, é representada
de resíduos pode ser escrita na forma 7 ;7 & <C7 . Os testes
por yˆ t = Lˆ t + Nˆ t .
de autocorrelação residual, independência estatística BDS e
de estacionariedade Dickey-Fuller são aplicados à Em resumo, a metodologia híbrida proposta consiste nos
componente 7 a fim de se obter indicação que a mesma não passos, representados no fluxograma da figura 1.
pode ser classificada estatisticamente como ruído branco, de
forma que os resíduos devem possuir estruturas lineares Para a avaliação do método foram utilizados os Erros RMSE
e/ou não lineares que podem ser modeladas. Neste caso, a (Raiz do Erro Quadrático Médio) e MAE (Erro Absoluto
previsão da série observada resultará da soma das previsões Médio), representados em (12).
dos resíduos e <C7 ;B7 <C7 , ̂7 . Os resíduos são
8
decompostos ortogonalmente via wavelet e suas ^]_` a ∑6707( ;7 & ;B7 A
componentes modeladas por SVR, aproveitando a sua 6
4
8
]X` ∑6707(|;7 & ;B7 | 12 ( yt ) são
6 Os dados que formam a série temporal
provenientes do aparelho denominado base de alongâmetro
7 Materiais e métodos que mede a abertura e o fechamento, o recalque e o
deslizamento entre os blocos.
A Itaipu é uma empresa que se preocupa com a segurança de
suas operações, mantendo um monitoramento de seu A figura 2 mostra o comportamento dos deslocamentos
desempenho através da análise de dados coletados pela relativos do bloco I(11), nas direções de abertura entre juntas
instrumentação que medem indicadores críticos do e deslizamento (que são os deslocamentos horizontais), do
comportamento da barragem. Dentre os diversos fatores que aparelho base de alongâmetro JS-I-35:
se pode considerar em uma barragem de concreto os
deslocamentos ocorridos nos blocos e entre eles surgem 800
abertura mm
como um assunto de extremo interesse e análise, os blocos recalques mm
700
sofrem a ação do nível do lago, das variações das
temperaturas, por exemplo, no verão ocorre uma dilatação 600
no concreto, o que provoca uma tendência de deformação 500

do bloco para a direção montante que por sua vez, faz com
que os blocos comprimam a fundação. No inverno o concreto 400
se contrai, provoca uma tendência de deformação do bloco à 300

jusante, voltando à posição inicial. Pode-se então identificar
200
um comportamento cíclico da estrutura, intimamente
condicionado a condições ambientais que envolvem a obra 100
conforme [38]. Então fazer a previsão de deslocamentos mais 0

precisamente dos deslocamentos relativos entre blocos é de
-100
grande relevância para ajudar a compreender e prever o 0 100 200 300 400 500 600
comportamento futuro da barragem de concreto Itaipu.
Figura 2: deslocamentos relativos do bloco I(11).
A série escolhida para aplicação da metodologia é bivariada

e contém os dados referentes do período de 1982 – 2014, do
aparelho denominado base de alongâmetro (JS-I-35),
localizado no bloco I-11, que mede a abertura (JS-I-35-X) e os
recalques (JS-I-35-Y) entre os blocos 10 e 11, os valores são
dados em milésimos de milímetros. Na primeira etapa deste
trabalho foi feito o tratamento das informações, para serem
estruturadas de acordo com a metodologia de previsão e,
optou-se por trabalhar com o período de 1992-2013, com
valores mensais.
Para ambas as séries foram deixadas para treino o período de

1992-2012 totalizando 252 valores e os 12 últimos valores o
ano de 2013 para teste. A metodologia usada é de um passo
à frente.
Primeiramente foi realizada a modelagem Arima para as

Figura 1: Fluxograma ARIMA-SVR séries JS-I-35-X e JS-I-35-Y, em seguida foi obtido o resíduo
para cada série, que denotaremos por r-JS-I-35-X e r-JS-I-35-
O comportamento dos deslocamentos diferenciais entre Y, ainda para cada série de resíduo foi aplicado a
blocos se dá segundo três direções ortogonais entre si, decomposição Wavelet, obtendo assim as componentes que
recalques diferenciais entre blocos, deslocamentos foram modeladas via SVR e combinadas para obtenção da
cisalhantes horizontais e movimentos de abertura- previsão do resíduo para posterior obtenção das previsões
fechamento das juntas. A base de alongâmetro é utilizada pontuais.
para medir deslocamentos horizontais e verticais entre
juntas, aberturas de fissuras de barragens, galerias, túneis, Para modelagem ARIMA foi utilizado o software Eviews
maciços rochosos e edificações. Do aparelho base de sendo feita a análise gráfica da série temporal e identificado
alongâmetro se obtém quatro medidas, duas no piso: o modelo apropriado a partir das funções de autocorrelação
abertura entre juntas e deslizamento no sentido montante- e autocorrelações parciais, os valores encontrados se
jusante, e duas na parede: recalque entre os blocos e encontram na Tabela 1.
abertura entre os blocos. Um vídeo ilustrativo do movimento
e de como o medidor base de alongâmetro funciona pode ser Na decomposição wavelet e na modelagem SVR foi utilizado
assistido em: uma caixa de ferramentas em Matlab que é uma linguagem
https://www.youtube.com/user/CeasbPTI/videos. de alto nível e oferece um ambiente interativo que permite
realizar tarefas de computação intensiva. Na Tabela 2
5
encontram-se as bases utilizadas para decomposição Foram realizadas várias simulações para as séries supra
Wavelet, escolhidas após alguns testes, e as respectivas citadas e está apresentado na Tabela 3 os parâmetros que
componentes. melhor se ajustaram, baseado nos dados de treinamento e
que foram escolhidos de acordo com as medidas de acurácia
Tabela 1– Modelo Arima
mean square error (MSE) e Squared correlation coefficient
SÉRIE MODELO Equação (SCC).
JS-I-35-X Arima Wt = 0.418Wt −1 − 0.040Wt −4 +
(36,0,11) Tabela 2– Decomposição Wavelet
+ 0.398Wt −11 + 0.285Wt −36 +
SÉRIES Base Aproximação Detalhes
+ 0.141at −2 + 0.272at −5 + r-JS-I-35-X Daubechies r-A2-X r-D1-X
− 0.377at −11 8 r-D2-X
JS-I-35-Y Arima Wt = 0.894Wt −1 − 0.163Wt −6 + r-JS-I-35-Y Daubechies r-A2-Y r-D1-Y
(9,0,16) 8 r-D2-X
+ 0.279Wt −9 − 0.362at −1 +
+ 0.324at −6 − 0.154at −16 Em seguida foi feita a combinação das séries dos resíduos
previstas via SVR. Das componentes: r-A2-X, r-D1-X e r-D2-X
Para o uso do SVR foi utilizada uma biblioteca para máquinas resultou nos parâmetros, ρ rA X =1.015 , ρ rD X = 1.069 e
2 1
de vetores suporte para Matlab denominada de LIBSVM [39], ρ rD = 0.5616 , e, para a série dos resíduos r-A2-Y, r-D1-Y e
2X
sendo que a biblioteca LIBSVM é atualmente um dos
r-D2-Y foram obtidos os parâmetros ρ rA Y = 1 .0099 ,
softwares mais utilizados para regressão em vetores suporte. 2
Ao treinar o modelo SVR, existem alguns parâmetros para ρ rD Y =1.0360

1
e ρ rD Y =1.0501 . Tais parâmetros foram
2
serem escolhidos que influenciam no desempenho do ajustados através da otimização de um problema de

modelo. Portanto, a fim de obter um modelo ajustado tais programação não linear, cuja função objetivo é a raiz do erro
parâmetros têm que ser selecionados adequadamente. quadrático médio (RMSE), a partir do Solver do Excel.
Tabela 3– Parâmetros SVR

SÉRIES Kernel Gamma Degree Coef0 Cost Epsilon Janela
r-A2_X RBF 0.5 - - 100 0.02 4
r-D1_X RBF 0.8 - - 100 0.02 4
r-D2_X Polinomial - 3 800 1 0.402 2
r-A2_Y RBF 1 - - 100 0.0002 4
r-D1_Y RBF 2 - - 10 0.02 4
r-D2_Y RBF 0.9 - - 5 0.002 2
Tabela 4 - Comparação da previsão para a série JS-I-35-X

8 Resultados Medidas de acurácia
Neste trabalho foi considerada para análise da previsão a Série Método MAE RMSE
metodologia um passo à frente. As medidas de acurácia JS-I-35-X ARIMA 33,865 45,648
utilizadas para avaliação foram: raiz quadrada do erro JS-I-35-X SVR 37,608 55,189
quadrático médio (RMSE) e a média dos erros absolutos JS-I-35-X ARIMA-SVR 29,515 35,346
(MAE).
São mostradas na tabela 5 as medidas de acurácia MAE e
A tabela 4 apresenta as medidas de acurácia MAE e RMSE RMSE para às previsões da série JS-I-35-Y dos modelos Arima,
correspondentes às previsões da série JS-I-35-X, para SVR e para a metodologia híbrida Arima-SVR. Nesta série a
modelagem Arima, SVR e para a metodologia híbrida. metodologia hibrida Arima-SVR obteve um ganho preditivo
Observa-se que a metodologia hibrida Arima-SVR obteve um de 91,25% quando comparado com o método ARIMA e
ganho preditivo de 18,76% quando comparado com o 70,14% quando comparado com o método SVR para a
método ARIMA e 27,41% quando comparado com o método medida de acurácia MAE, e de 102,56% quando comparado
SVR para a medida de acurácia MAE, e de 29,15% quando com o método ARIMA e 88,56% quando comparado com o
comparado com o método ARIMA e 56,14% quando método SVR para a medida de acurácia RMSE.
comparado com o método SVR para a medida de acurácia
Tabela 5 - Comparação da previsão para a série JS-I-35-Y
RMSE.
Medidas de acurácia
A comparação entre o valor real e o valor previsto via Arima, Série Método MAE RMSE
SVR e Arima-SVR para os 12 valores fora da amostra de dados JS-I-35-Y ARIMA 10,094 12,344
da série JS-I-35-X são apresentados na Figura 3. JS-I-35-Y SVR 8,980 11,490
JS-I-35-Y ARIMA-SVR 5,278 6,094
6
A comparação entre o valor real e o valor previsto via Arima, Neste trabalho, foi proposta uma modelagem híbrida para
SVR e ARIMA-SVR para os 12 valores fora da amostra de previsão de séries temporais usando os modelos ARIMA,
dados da série JS-I-35-Y é apresentada na Figura 4. decomposição Wavelet, a regressão de vetores suporte (SVR)
e a combinação de previsões. A eficácia do método foi
verificada através da aplicação em um problema real que
9 Conclusão
mede os deslocamentos relativos entre blocos.
Com intuito de diminuir erros de previsão, o estudo de séries
Os dados que formam a série temporal que é bivariada são
temporais vem crescendo bastante nos últimos anos, pois é
provenientes do aparelho denominado base de alongâmetro
sensato que quanto maior a eficiência do método preditivo
e que mede a abertura (JS-I-35-X) e os recalques (JS-I-35-Y)
ou da metodologia que leva às previsões de menor acurácia
entre os blocos 10 e 11 da barragem da Usina Hidrelétrica de
propiciará a técnicos e engenheiros uma ferramenta de apoio
Itaipu. Os resultados obtidos mostram que a metodologia
nos processos de tomadas de decisões.
híbrida denominada de ARIMA-SVR obteve ganhos preditivos
Dos vários métodos de análise e previsão de séries temporais para ambas as séries testadas. Comprovando que a
existentes o modelo ARIMA é sem dúvida o mais popular metodologia proposta para previsões de séries temporais
deles, entretanto nos últimos anos o método de Regressão contribui para melhora da acurácia nas previsões pontuais,
por Vetores Suporte (SVR) surge como uma novidade neste caso comparadas com as técnicas ARIMA e SVR.
promissora neste campo, demonstrando sua boa capacidade
de generalização através da obtenção de bons resultados. Agradecimentos
Embora estas duas técnicas mostrem seu potencial não se
pode dizer que uma técnica é melhor que outra, portanto a Às instituições: Itaipu Binacional, PPGMNE (Programa de Pós
metodologia hibrida aqui apresentada serve como uma Graduação em Métodos Numéricos em Engenharias), CEASB
alternativa na obtenção de melhores resultados. (Centro de Estudos Avançados em Segurança de Barragens),
PTI (Parque Tecnológico Itaipu, e, em especial, aos
engenheiros: Cláudio Neumann Júnior e Dimilson Coelho.
Figura 3 - Gráfico da amostra de teste e previsões para a série JS-I-35-X
7
Figura 4 - Gráfico da amostra de teste e previsões para a série JS-I-35-Y
[7] K. Suresh e S. K. Priya, Forecasting sugarcane yield of

Referências Tamilnaduusing ARIMA models, Sugar Tech, vol. 13, nº 1,
pp. 23-26, 2011.
[1] C. H. Aladag, E. Egrioglu e C. Kadilar, Forecasting nonlinear
time series with a hybrid methodology, Applied [8] C. Babu e B. Reddy, Predictive data mining on average global
Mathematics Letters, pp. 1467-1470, 2009. temperature usingvariants of ARIMA models, em 2012
International Conference on Advancesin Engineering,
[2] C. N. Babu e B. E. Reddy, A moving-average filter based Science and Management , ICAESM, 2012.
hybrid ARIMA–ANN model forforecasting time series data,
Applied Soft Computing, pp. 27-38, 2014. [9] V. N. Vapnik, The Nature of Statistical Learning Theory, New
York: Springer - Verlag, 1995.
[3] P. F. Pai e C. S. Lin, A hybrid ARIMA and support vector
machines model in stock price forecasting, The [10] V. Vapnik , S. . E. Golowich e A. Smola, Support Vector
International journal of Management Science, pp. 497-205, Method for Function Approximation, Regression Estimation,
2005. and Signal Processing·, Advances in Neural Information
Processing Systems 9, pp. 281-287, 1996.
[4] R. Alwee, S. M. H. Shamsuddin e R. Sallehuddin, Hybrid
Support Vector Regression and Autoregressive Integrated [11] V. Anandhi e R. . M. Chezian, Support Vector Regression to
Moving Average Models Improved by Particle Swarm Forecast the Demand and Supply of Pulpwood,
Optimization for Property Crime Rates Forecasting with International Journal of Future Computer and
Economic Indicators, The ScientificWorld Journal, pp. 1-11, Communication, vol. 2, 2013.
2013.
[12] W. C. Hong, Electric load forecasting by seasonal recurrent
[5] O. Kosanan e N. Kantanantha, Thailand’s Rubber Production SVR (support vector regression) with chaotic artificial bee
Forecasting Comparison, Proceedings of the International colony algorithm, Energy, pp. 5568-5578, 2011.
MultiConference of Engineers and Computer Scientists
2014 Vol II,, Hong Kong, 2014. [13] C. W. Granger, R. Ramanathan, Improved Methods of
Forecasting, Journal of Forecasting, vol. 3, pp. 197-204,
[6] G. E. Box e G. M. Jenkins, Time Series Analysis: Forecasting 1984.
and Control., Oakland, Califórnia: Holden-Day, 1970.
[14] G. Hollauer, J. V. Issler e H. H. Notini, Prevendo o
crescimento da produção industrial usando um número
8
limitado de combinações de previsões, Economia Aplicada, [32] L. L. Teixeira, S. B. Rodrigues, P. H. Siqueira, A. C. L. d. Silva
vol. 12, pp. 177-198, 2008. e L. A. Teixeira Jr, Comparativo entre arima, redes neurais
artificiais, máquinas de vetores suporte para regressão e
[15] A. E. Faria, E. Mubwandarikwa, Multimodality on the combinação linear de previsões de vasões mensais no posto
Geometric Combination of Bayesian Forecasting Models, 266-itaipu, XXI SIMPEP, 2014.
International Journal of Statistics and Management
System, pp. 1-25, 2008. [33] E. K. Lafdani, A. M. N. Nia e A. Ahmadi, Daily suspended
sediment load prediction using artificial neural networks
[16] P. P. Morettin e C. M. Toloi, Análise de Séries Temporais, São and support vector machines, Journal of Hydrology, vol.
Paulo: Blucher, 2006. 478, pp. 50-62, 2013.
[17] S. Mallat, A Wavelet Tour of Signal Processing., San Diego: [34] Z. He, X. Wen, H. Liu , J. Du, A comparative study of artificial
Academic Press, 2009. neural network, Journal Hydrology, vol. 509, pp. 379-386,
2014.
[18] N. Levan e C. S. Kubrusly, A Wavelet Time-Shift Detail
Decomposition, Mathematics and Computers in [35] F. M. Tseng, H. C. Yu, G. H. Tzeng, Combining neural
Simulation, vol. 63, pp. 73-78, 2003. network model with seasonal time series ARIMA model,
Technological Forecasting & Social Change, pp. 71-87,
[19] L. A. Teixeira Jr, J. F. M. Pessanha, M. L. Menezes, K. M. 2002.
Cassiano e R. C. Souza, Redes Neurais Artificiais E
Decomposição Wavelet Na Previsão Daradiação Solar [36] P. G. Zhang, Time series forecasting using a hybrid ARIMA
Direta, Simpósio Brasileiro de Pesquisa Operacional, Rio de and neural network model, Neurocomputing, pp. 159-175,
Janeiro, 2012. 2003.
[20] I. DAUBECHIES, Orthonormal basis of compactly supported [37] B. Zhu e Y. Wei, Carbon price forecasting with a novel hybrid
wavelets, Comm. Appl. Math., pp. 909-996, 1988. ARIMA and least Squares support vector machines
methodology, Omega, pp. 517-524, 2013.
[21] C. S. Kubrusly, N. Levan, Abstract Wavelets Generated by
Hilbert Space Shift Operators, Adv. Math. Sci. Appl., vol. 14, [38] C. I. Osako, A manutenção dos drenos nas Fundações de
pp. 643-660, 2006. Barragens o caso da Usina Hidrelétrica de Itaipu, Dissertação
Curso de Pós-Graduação em Construção Civil, Setor de
[22] A. J. SMOLA e B. Schölkopf, A Tutorial on Support Vector Tecnologia, Universidade Federal do Paraná, 2002.
Regression, NeuroCOLT Technical Report, 1998.
[39] C. C. Chang, C. J. Lin, LIBSVM: a library for support vector
[23] R. T. CLEMEN, Combining forecasts: A review and annotated machines, [Online]. Available:
bibliography, International Journal of Forecasting, pp. 559- http://www.csie.ntu.edu.tw/~cjlin/libsvm. [Acesso em 5
583. Janeiro 2014].
[24] L. A. Teixeira Jr., Combinação SSA-Wavelet de métodos
preditivos com ajuste numérico MINIMAX, na geração de
previsões e de cenários, Puc. Rio de Janeiro, 2013.
[25] J. M. Bates, C. . W. J. Granger, The Combining of Forecasts.,

Operational Research Quarterly, vol. 20, nº 4, pp. 451-468,
1969.
[26] S. Gupta, P. C. Wilton, Combination of Forecasts: An

Extension, Management Science, vol. 33, nº 3, pp. 356-372,
1987.
[27] N. Terui, H. K. Dijk, Combined forecasts from linear and

nonlinear time series models, International Journal of
Forecasting, p. 421–438, 2002. .
[28] M. K. Okasha, Using Support Vector Machines in Financial

Time Series Forecasting, International Journal of Statistics
and Applications, pp. 28-39, 2014.
[29] K. Kandananond, A Comparison of Various Forecasting

Methods for Autocorrelated Time Series, International
Journal of Engineering Business Management, pp. 1-6,
2012.
[30] X. Zhang, T. Zhang, A. . A. Young e X. Li, Applications and

Comparisons of Four Time Series Models in Epidemiological
Surveillance Data, PLoS ONE, 2014.
[31] M. Moharrampour, A. Mehrabi, H. Hajikandi, S. Sohrabi e J.

Vakili, Comparison of Support Vector Machines (SVM) and
Autoregressive integrated moving average (ARIMA) in daily
flow forecasting, Journal of River Engineering, 2013.

EspacoEnergia Samuel Bellido Rodrigues

Încărcat de

Informații document

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

EspacoEnergia Samuel Bellido Rodrigues

Încărcat de

Drepturi de autor:

Formate disponibile

ESPAÇO ENERGIA | ISSUE xx | MONTH 20xx

in recent years, the support vector regression (SVR) has also

ARIMA-SVR hybrid Keywords: Time series forecasting, ARIMA, decomposition

série temporal o método Arima [6], que consiste em ajustar

máquina de aprendizagem baseada na teoria da

. +%( . , ∑/0 ( .% . 3 Maximizar − ∑

Onde: +%( . ∑ ∈# 2 (, (, . é a componente de + yi ∑ (α i − α i* ) (5)

∑ ∈# 3 , 4 , . é a componente de detalhe de nível ) de Sujeito a ∑ (α i − α i* ) = 0

)* , ), ' ∈ #, onde # é o conjunto dos números inteiros. f ( x ) = ∑ (αi − αi* ) xi , x + b (6)

A regressão de vetores de suporte (SVR, Support Vector l

Regression) é fundamentada em uma máquina de vetor de + yi ∑ (αi − α i* ) (7)

produzido por SVR depende apenas de um subconjunto dos Sujeito a ∑ (α

componente linear, Nt a componente não linear e :7 ∼ b. 2. [8 , [A [\ bãd ee b5e 52b

no concreto, o que provoca uma tendência de deformação 500

se contrai, provoca uma tendência de deformação do bloco à 300

conforme [38]. Então fazer a previsão de deslocamentos mais 0

comportamento futuro da barragem de concreto Itaipu.

Figura 2: deslocamentos relativos do bloco I(11).

A série escolhida para aplicação da metodologia é bivariada

Para ambas as séries foram deixadas para treino o período de

Primeiramente foi realizada a modelagem Arima para as

Ao treinar o modelo SVR, existem alguns parâmetros para ρ rD Y =1.0360

serem escolhidos que influenciam no desempenho do ajustados através da otimização de um problema de

Tabela 3– Parâmetros SVR

Tabela 4 - Comparação da previsão para a série JS-I-35-X

Figura 3 - Gráfico da amostra de teste e previsões para a série JS-I-35-X

Figura 4 - Gráfico da amostra de teste e previsões para a série JS-I-35-Y

[7] K. Suresh e S. K. Priya, Forecasting sugarcane yield of

[25] J. M. Bates, C. . W. J. Granger, The Combining of Forecasts.,

[26] S. Gupta, P. C. Wilton, Combination of Forecasts: An

[27] N. Terui, H. K. Dijk, Combined forecasts from linear and

[28] M. K. Okasha, Using Support Vector Machines in Financial

[29] K. Kandananond, A Comparison of Various Forecasting

[30] X. Zhang, T. Zhang, A. . A. Young e X. Li, Applications and

[31] M. Moharrampour, A. Mehrabi, H. Hajikandi, S. Sohrabi e J.

S-ar putea să vă placă și