Documente Academic
Documente Profesional
Documente Cultură
Controle Estoc
astico
4.1
Introdu
c
ao
Seja o problema:
xk+1 = f (xx , uk , k)
yk = g(xk , k)
Deseja-se calcular a sequencia de controle
Un1
= { u0 u1 un1 }
tal que:
min
Un1
n1
Rk (xk+1 , uk )
k=0
Para a solucao deste problema utiliza-se programacao dinamica. Assim, supondo que k = n
1 ,deve-se determinar un1 que minimiza Rn1 (xn , un1 ), isto e:
Rn1 (xn , un1 ) = Rn1 (f (xn1 , un1 , n 1), un1 )
Denindo
Sn1 = Rn1 (f (xn1 , un1 , n 1), un1 ) = min Rn1 (xn , un1 )
un1
un2 un1
A primeira parcela da u
ltima equacao nao e funcao do controle no instante n 1; a segunda
parcela e funcao de un1 e un2 . Assim:
Sn2 (xn2 ) = min{Rn2 (xn1 , un2 ) + min Rn1 (xn , un1 )}
un2
un1
4.1.1
A sequencia de valores que constituem o controle otimo tem a propriedade de que qualquer que
seja o estado inicial e o valor inicial de controle, o restante da sequencia de controle deve ser
otima para o problema de otimizacao em que o estado inicial e o estado resultante do primeiro
controle.
Exemplo:
xk+1 = f (xk , uk , k)
N
min{
R(xk , uk , k)}
u
k=0
x
II
B
xN
I
C
xL
IV
x0
III
Seja I a trajetoria otima, isto e, a trajetoria originada pelo controle otimo, logo o custo associado
a I e menor do que o custo associado a qualquer outra trajetoria, isto e:
JI < JII e JI < JIII
Seja o problema:
N
min{
R(xk , uk , k)} e x(L) = xL x(N ) = xN
u
k=L
2( 2 + b2 )uot
N 1 = 2abxN 1
2
2
uot
N 1 = (b/(b + ))axN 1
Neste caso o controle otimo difere do controle C.E. Obtem-se uma lei de controle denominada
cautelosa, pois o controle e inversamente proporcional ao erro na estimacao do parametro b.
4.2
Controle Otimo
de Sistemas Estoc
asticos
4.2.1
Proposi
c
oes B
asicas
Sejam x e y duas variaveis aleatorias e seja u a variavel de controle. Deseja-se obter u tal que
J seja mnimo, onde:
J = Exy {R(x, y, u)}
4.2.2
Informa
c
ao Completa de Estado
u(x,y)
u(x,y)
= Exy {R(x, y, uo )}
Portanto a minimizacao e a esperanca matematica comutam.
Prova: Para u R(x, y, u) R(x, y, uo ) = min R(x, y, u)
u(x,y)
u(x,y)
u(x,y)
u(x,y)
Portanto
min R(x, y, u) E{ min R(x, y, u)}
u(x,y)
u(x,y)
Como tambem uo (x, y) e uma estrategia adimissvel de controle, mas nao obrigatoriamente
mnimo de ER , tem-se que:
min E{R(x, y, u)} ER(x, y, uo )
u(x,y)
Portanto
min ER(x, y, u) = E{ min R(x, y, u)}
u(x,y)
u(x,y)
4.2.3
Informa
c
ao Incompleta de Estado
u(y)
= Ey {R(x, y, uo (y))}
Prova: Para u tem-se que:
f (y, u) f (y, uo (y)) = min f (y, u)
u(y)
u(y)
u(y)
u(y)
Nota:
min E{R(x, y, u)/y} min E{R(x, y, u)}
u(y)
u(x,y)
4.3
Estrat
egia de Controle Dual
Seja o sistema
xk+1 = f (xk , uk , wk )
yk = g(xk , vk )
Sao dados p(wk ) p(vk ) p(x0 )
Problema: Determinar a sequencia de controle uk ,isto e:
U (0 N 1) = {u0 u1 . . . uN 1 }
que minimiza
N
1
JN = {
ERk (xk+1 , uk )}
k=0
A lei de controle obtida no instante k , em malha fechada, sera funcao da informacao disponvel
ate este instante, isto e:
uk = uk (Ik )
onde Ik e a informacao disponvel no instante k.
Ik = {Y (0 k), U (0 k 1}
Ik+1 = F {Ik , yk+1 , uk )
Os controles sao determinados utilizando-se o princpio da otimalidade de Bellman. Assim o
controle otimo no instante k = N 1 e obtido a partir de:
min E{RN 1 (xN , uN 1 )} com uN 1 = uN 1 (IN 1 )
uN 1
E{RN 1 (xN , uN 1 (IN 1 ))} = RN 1 (.)p(xN , IN 1 )dxn dIN 1
= RN 1 (.)p(xN /IN 1 )p(IN 1 )dxn dIN 1 =
= EIN 1 {ExN (RN 1 (xN , uN 1 (IN 1 ))/IN 1 )}
min E{RN 1 (xN , IN 1 )} = EIN 1 {min ExN (RN 1 (xN , IN 1 )/IN 1 )}
uN 1
uN 1
uN 1 uN 2
p(xN , IN 1 ) = p(xN , IN 2 , uN 2 , yN 1 ) =
= p(xN /IN 2 , uN 2 , yN 1 )p(IN 2 , uN 2 , yN 1 ) =
= p(xN /IN 1 )p(yN 1 /IN 2 , uN 2 )p(IN 2 , uN 2 )
logo
ERN 1 (xN , uN 1 ) = EIN 2 {EyN 1 {ExN (RN 1 (.)/I N 1 )/IN 2 , uN 2 }}
Portanto
E{RN 2 (xN 1 , IN 2 ) + RN 1 (xN , uN 1 (IN 1 ))} =
= EIN 2 {ExN 1 (RN 2 (xN 1 , IN 2 )/I N 2 )}+
+EIN 2 {EyN 1 {ExN (RN 1 (.)/I N 1 )/IN 2 , uN 2 }}
min
uN 2 uN 1
Observacoes:
A dimensao de I(k) cresce com o instante k, logo tem-se problema de dimensao.
Em cada instante de tempo devem ser calculadas as densidades:
p(xk+1 /Ik ) densidade de previsao de estado
p(yk+1 /Ik ) densidade de previsao da sada
A primeira densidade e obtida utilizando-se o modelo de estado e a segunda densidade e obtida
utilizando-se as medidas e a densidade de previsao de estado.
4.4
M
etodos Sub
otimos de Controle Estoc
astico
4.4.1
Controlador n
ao dual-CE
Este controlador e obtido utilizando o teorema da separacao, isto e, a lei de controle e derivada
resolvendo-se o problema determinstico, e na lei de controle resultante substitue-se os valores
uma lei de controle sub-otima, com excecao do controlador
desconhecidos pelas suas medias. E
linear quadratico gaussiano.
4.4.2
Controlador n
ao dual Cauteloso(neutro)
A sequencia de controle e calculada, supondo que esta sequencia nao interfere na incerteza futura.
Esta lei de controle e obtida minimizando um criterio do tipo um passo a` frente e supondo que:
- a partir de um certo instante nao se vai ter mais medidas;
- a partir de um certo instante as medidas serao perfeitas.
A lei de controle obtida e funcao dos parametros estimados e da precisao. Neste tipo de controlador pode ocorrer o desligamento.
4.4.3
4.5
xk+1 = k xk + Gk uk + k
yk = H k xk + v k
Evk = Ek = Ek xTo = Evk kT = Evk xTo = 0
E{k jT } = k kj
E{vk vjT } = VK kj
Otimizar
min
u(0n1)
E{J} =
min
u(0n1)
n1
E{ (xTk Rk xk + uTk Qk uk ) + xTn Rn xn }
k=0
+Eyn (
xTn Rn xn /In1 un1 ) + tr(Rn Xn )}
onde Xn e a covariancia do estimador xn .
Neste caso, em que o sistema e linear e as perturbacoes sao gaussianas, o estimador xn e obtido
utilizando o ltro de Kalman, isto e:
xn = n1 xn1 + Gn1 un1 + KFn {yn Hn (n1 xn1 + Gn1 un1 )}
ou
xn = n1 xn1 + Gn1 un1 + KFn n
onde n e a serie de inovacao, isto e:
En /In1 = 0
En Tn /In1 = Hn Xn/n1 HnT + Vn
Sn1 (In1 ) = min{
xTn1 Rn1 xn1 + tr(Rn1 Xn1 ) + uTn1 Qn1 un1 +
un1
+Eyn1 {
xTn1 Fn1 xn1 + bn1 /In2 un2 }}
Em relacao a otimizacao no instante k = (n 1) tem-se uma equacao equivalente com alteracao
nas seguintes matrizes: Rn por Fn1 e tr(Rn Xn ) por bn1 .
Assim a solucao no instante k = (n 2) e dada por:
uot
n2
n2 = Kn2 x
Kn2 = [Qn2 + Gn2 Fn1 Gn2 ]1 GTn2 Fn1 n2
Para um instante de tempo qualquer k o controle e dado por:
uot
k
k = Kk x
Kk = [Qk + Gk Fk+1 Gk ]1 GTk Fk+1 k
Fk = Rk + Tk Fk+1 (k Gk Kk )
com Fn = Rn .
O estimador de estado e dado por:
xk+1 = k xk + Gk uk + KFk {yk+1 Hk xk+1/k }
KFk = Xk/k1 HkT [Vk + Hk Xk/k1 HkT ]1
Xk+1/k = Wk + k Xk/k Tk
1
T
Xk+1/k+1 = [Xk+1/k + Hk+1
Vk+1
Hk+1 ]1
+ tr(F0 X0 ) +
n1
tr(Fk+1 Wk + Pk Xk/k )
k=0
Pk = Tk Fk+1 k + Pk Fk
wk
vk
Gk
xk
Hk
yk
ek
KFk
Hk
uk
xk
Kk
Z 1
+
Gk
4.6
Seja o Sistema:
xk+1 = xk + Guk + wk
yk = Hxk + vk
E o seguinte criterio a otimizar:
n1
J = E{ (xTk Rxk + uTk Quk ) + xTn Rn xn }
k=0
xk+1
xk
=
+
xk+1
xk
KFr H GKr KFr H
+
0
KFr H 0
wk
vk+1
Outra representacao do sistema em malha fechada pode ser obtida utilizando o erro de estimacao
de estado, isto e:
xk+1 = xk+1 xk+1
A utilizacao desta nova variavel corresponde a` seguinte transformacao de similaridade
xk
xk
=T
xk
xk
T =
I
0
I I
I
0
I
0
r
A =
I I
I I
KFr H GKr KFr H
GKr
GKr
A =
0
KFr H
Portanto os polos do sistema em malha fechada sao as razes de :
= det(zI + GKr )det(zI + KFr H) = 0
det(zI A)
isto e, se x, x Rn tem-se 2n polos onde n polos correspondem ao sistema sem ltro e
n polos correspondem ao ltro de Kalman. Assim mais uma vez se verica a separacao entre as
etapas de controle e estimacao.
4.7
Filtro de Kalman
xk+1 = I KFk
wk
xk +
H
vk
T
I
R1 R12
Pk
+
T
R12 R2
H
H
KFk
KFk
Pk T + R1 Pk hT + R12
T
HPk T + R12
HPk H T + R2
I
KFk