5 Cap5 - A

Cap. 5.
Optimizarea cu criteriu ptratic a sistemelor liniare

n acest capitol vom aborda o problem de optimizare important att prin consecinele aplicative largi pe care le are, ct i prin suportul constructiv pe care l furnizeaz n investigarea teoretic i procedural a unor clase de probleme mai complexe de optimizare. Totodat, prezentul capitol reprezint o jonciune ntre aspectele structurale ale sistemelor liniare, studiate cu precdere la cursul de teoria sistemelor i problematica propriu-zis de optimizare a acestora. 5.1. Formularea problemei Fie sistemul liniar (variabil n timp)
& x(t ) = A(t ) x(t ) + B(t )u (t )
(5.1)
unde x(t ) n este starea, u (t ) m este comanda, iar A(t) i B(t) sunt n n i respectiv n m matrice continue pe intervalul deschis I = (Ta , Tb ) . Fie fixat intervalul de conducere [t 0 , t f ] I i criteriul ptratic
J = x T (t f ) Sx(t f ) + x T (t )Qx(t ) + u T (t ) Ru (t ) dt
t0 tf
(5.2)
unde S este o n n matrice simetric constant, iar Q(t) i R(t) sunt n n i respectiv m m matrice simetrice continue, cu R(t) pozitiv definit pe intervalul I, adic R(t ) > 0 . Problema optimizrii cu criteriul ptratic (5.2) a sistemului liniar (5.1), pe scurt problema liniar ptratic (PLP) se formuleaz astfel: dndu-se o condiie iniial x(t 0 ) = x0 a sistemului (5.1), s se determine o comand u () pe intervalul [t 0 , t f ] care s minimizeze criteriul (5.2). Notm cu V ( x0 ) valoarea optim a criteriului (5.2) asociat iniializrii x0. Comanda u () care se cere a fi determinat reprezint o soluie n circuit deschis (Atenie, s-ar putea s fie mai multe soluii) a PLP. Interesant ns din punctul de vedere al implementrii conducerii optimale este determinarea unei soluii n circuit nchis. Pentru a preciza noiunea, s considerm legea de comand u (t ) = F (t ) x(t ) cu F (t ) o m n matrice continu pe [t 0 , t f ] . Atunci sistemul (5.1) devine
& x(t ) = A0 (t ) x(t )
(5.3) (5.4) (5.5) (5.6) (5.7)
unde
A0 (t ) = A(t ) + B(t ) F (t )
Corespunztor unei iniializri x0, traiectoria lui (5.4) este x(t ) = 0 (t , t 0 ) x0 iar comanda, furnizat prin legea de comand (5.3), va fi u (t ) = F (t ) 0 (t , t 0 ) x0
unde 0 (t , t 0 ) este matricea fundamental a matricei A0(t). Pentru comanda (5.7) i traiectoria (5.6), criteriul (5.2) capt valoarea
5-1
f ~ T T V ( x0 ) = x0 T (t f , t 0 ) S 0 (t f , t 0 ) x0 + x0 T (t , t 0 ) Q(t ) + F T (t ) R(t ) F (t ) 0 (t , t 0 )dt x0 0 0
(5.8)
t0
Vom spune c legea de comand (5.3), sau pe scurt matricea F(t) este o soluie n circuit nchis a PLP, dac pentru orice x0 n este adevrat egalitatea: ~ V ( x0 ) = V ( x0 ) (5.9) n acest caz legea de comand (5.3) se numete lege de comand optimal. Considernd implementat legea de comand optimal (Fig. 5.1), se constat imediat c aceasta furnizeaz, corespunztor iniializrii arbitrare x0, o soluie n circuit deschis a PLP. Altfel spus, n timp ce determinarea unei soluii n circuit deschis a PLP trebuie fcut ori de cte ori se schimb iniializarea x0, cunoaterea unei soluii n circuit nchis, explicitat prin matricea F(t), permite autogenerarea, prin schema din Fig. 5.1, a unei soluii n circuit deschis, oricare ar fi iniializarea x0.
x(t0) = x0 u(t)
& x(t ) = A(t ) x(t ) + B(t ) u (t )

F(t)
Fig. 5.1.
x(t)
5.2. Soluia problemei liniar ptratice cu timp final finit
Introducem ecuaia diferenial matricial: & P(t ) = AT (t ) P(t ) + P(t ) A(t ) P(t ) B(t ) R 1 (t ) B T (t ) P(t ) + Q(t ) cu condiia de capt P(t f ) = S
(5.10) (5.11)
ecuaie care poart numele de ecuaia diferenial matriceal Riccati (EDMR). Aa cum vom vedea, esenial n rezolvarea PLP este soluia EDMR pe intervalul [t 0 , t f ] , satisfcnd condiia (5.11). Referitor la aceast, soluie se impun n prealabil cteva precizri sintetizate n: Observaia 5.1. Membrul drept al ecuaiei (5.10) este descris de funcia F : I nn nn definit prin egalitatea F (t , P) = AT (t ) P + PA(t ) PB(t ) R 1 (t ) B T (t ) P + Q(t ) care se vede c este continu n t i P i, datorit structurii polinomiale, este local lipschitzian n P. n consecin, EDMR are, ntr-o vecintate a lui tf, o unic soluie care satisface (5.11). Aceast existen local a soluiei nu implic n mod necesar i existena global a soluiei pe [t 0 , t f ] . ntr-adevr, fie, referitor la intervalul [0, ] , ecuaia:
& P = P 2 + 1, P() = 0
Separnd variabilele, rezult soluia P(t ) = tg t care, se constat imediat c, exist numai pe intervalul ( 2 , 3 2 ) rezultnd c ecuaia de mai sus nu are o soluie pe [0, ] . Evident dac EDMR are pe intervalul [t 0 , t f ] o soluie care satisface (5.11) atunci, conform proprietilor funciei F (t , P) menionate mai sus, aceast soluie este unic. Rezult de aici
5-2
c dac EDMR are pe intervalul [t 0 , t f ] o soluie satisfcnd (5.11), aceast soluie este simetric. ntr-adevr fie P() aceast soluie. Atunci, se verific imediat c i P T () verific (5.10). Cum S este simetric avem P (t f ) = S = P T (t f ) i deci conform unicitii P T (t ) = P(t ) pe [t 0 , t f ] . Se poate acum formula rezultatul fundamental exprimat prin:
Teorema 5.1. Dac EDMR are pe intervalul [t 0 , t f ] o soluie satisfacnd (5.11), atunci
u (t ) = R 1 (t ) B T (t ) P(t ) x(t )
(5.12)
este o soluie n circuit nchis a PLP. Aceast soluie este unic. Valoarea optim a indicelui de performan este
T V ( x0 ) = x0 P(t 0 ) x0
(5.13)
Demonstraie. Fie x0 n o iniializare oarecare i u () o comand arbitrar pe [t 0 , t f ] . Fie x() traiectoria corespunztoare a lui (5.1) i fie introdus funcia: (t ) = x T (t ) P(t ) x(t ) Atunci, prin derivare i utiliznd (5.1) i (5.10) obinem: & & & & (t ) = x T (t ) P(t ) x(t ) + x T (t ) P(t ) x(t ) + x T (t ) P(t ) x(t ) =
= u T (t ) B T (t ) P(t ) x(t ) + x T (t ) P(t ) B(t )u (t ) + + x T (t ) P(t ) B(t ) R 1 (t ) B T (t ) P(t ) x(t ) x T (t )Q(t ) x(t ) Integrnd pe [t 0 , t f ] ambii membri ai lui (5.15), cu (5.11) i (5.14), obinem:
T x T (t f ) Sx(t f ) x0 P(t 0 ) x0 = tf 1 T T T T T T [u (t ) B (t ) P(t ) x(t ) + x (t ) P(t ) B(t )u (t ) + x (t ) P(t ) B(t ) R (t ) B (t ) P(t ) x(t ) x (t )Q(t ) x(t )]dt
(5.14)
(5.15)
t0
(5.16) Adunnd membru cu membru (5.2) cu (5.16), obinem: J = [u T (t ) R(t )u (t ) + u T (t ) B T (t ) P(t ) x(t ) + x T (t ) P(t ) B(t )u (t ) +
t0 T + x (t ) P(t ) B(t ) R 1 (t ) B T (t ) P(t ) x(t )]dt + x0 P(t 0 ) x0 T tf
= [u (t ) + R (t ) B (t ) P(t ) x(t )] R(t )[u (t ) + R (t ) B (t ) P(t ) x(t )]dt

T T T t0 T + x0 P(t 0 ) x0 = J 1 + J 2
tf
(5.17)
unde n ultima egalitate din (5.17) s-a fcut apel la simetria soluiei P() (vezi Observaia 5.1). Din (5.17) se vede c indicele J este o sum dintre J1 dependent de u () i este 0 i J2 care este, pentru iniializarea fixat x0, constant. Rezult atunci c minimul lui J se obine pentru J 1 = 0 . Din pozitivitatea definit a lui R(t) se vede c J 1 = 0 dac i numai dac (5.12) este adevrat. Unicitatea soluiei (5.12) rezult direct din faptul c J 1 = 0 dac dependena (5.12) este ndeplinit i din unicitatea soluiei EDMR. n fine, rezult c valoarea minim a lui J este J2, adic (5.13).
5-3
Dac se dorete expresia comenzii n circuit nchis, aceasta se obine cu relaia (5.7) n care factorul de reacie este dat de F (t ) = R 1 (t ) B T (t ) P(t ) . S remarcm de asemenea c Teorema 5.1 exprim o teorem de suficien pentru optim. Condiiile de necesitate vor fi cercetate n capitolele 5 i 6. Exemplul 5.1. Fie sistemul & x=u cu x, u i criteriul
J = x 2 + u 2 dt
3 4
Se vede c A = 0, B = 1, S = 0, Q = 1, R = 1 . EDMR corespunztoare este & P = P 2 1, P() = 0 , care aa cum s-a vzut n Observaia 5.1 are soluia P(t) = tg t, soluie care exist pe [ 3 4, ]. Atunci, legea de comand optimal este u (t ) = ( tg t ) x0 , iar valoarea optimal a criteriului este 3 2 2 V ( x0 ) = x0 tg = x0 4
5.3. Soluia ecuaiei difereniale Riccati. Tehnici de rezolvare
Introducem aa-numitul sistem canonic matriceal definit prin:

& X (t ) = A(t ) X (t ) B(t ) R 1 (t ) BT (t ) (t ) & (t ) = Q(t ) X (t ) AT (t ) (t )
(5.18) (5.19) (5.20) (5.21)
cu condiiile de capt X (t f ) = I (t f ) = S ,
X i fiind n n matrice. Introducem i 2n 2n matricea
A(t ) B(t ) R 1 (t ) B T (t ) H (t ) = AT (t ) Q(t )
(5.22)
i notm cu (t , t f ) matricea fundamental a lui H (t ) . Atunci

X (t ) = (t , t ) I f (t ) S
(5.23)
este soluia sistemului canonic matriceal. Importana acestui sistem pentru EDMR este evideniat de: Teorema 5.2. Fie X (t ) i (t ) furnizate de (5.23). Dac X (t ) este nesingular pe [t 0 , t f ] atunci (t ) X 1 (t ) este soluie a EDMR care satisface condiia de capt (5.11). Aceast soluie este unic. Demonstraie. Fie P(t ) definit prin
P (t ) X (t ) = (t )
(5.24)
5-4
Derivnd ambii membri ai lui (5.24), cu (5.18), (5.19) i (5.24) obinem:
& P (t ) X (t ) + P(t )(A(t ) X (t ) B (t ) R 1 (t ) B T (t ) P(t ) X (t ) ) = Q(t ) X (t ) AT (t ) P(t ) X (t ) (5.25)
Simplificnd cu X (t ) nesingular n (5.25) rezult direct c P(t ) satisface EDMR. Din (5.20), (5.21) i (5.24) rezult P(t f ) = S , adic ndeplinirea condiiei (5.11). Unicitatea rezult din observaia 5.1. S vedem n ce condiii X (t ) este nesingular. n acest sens avem:
Teorema 5.3. Dac S 0 , iar Q(t ) 0 pe [t 0 , t f ] , atunci X (t ) este nesingular pe
[t 0 , t f ] .
Demonstraie. S presupunem c exist [t 0 , t f ] n care X () este singular. Cum X (t f ) = I , evident < t f . Exist atunci un n , 0 , astfel nct
X () = 0
Introducem pe [t 0 , t f ]
x(t ) = X (t ) (t ) = (t )

(5.26)
(5.27) (5.28) (5.29) (5.30)
Rezult imediat c avem cu (5.18) i (5.19):

& x(t ) = A(t ) x(t ) B (t ) R 1 (t ) B T (t ) (t ) & (t ) = Q(t ) x(t ) AT (t ) (t )
Fie funcia T (t ) x(t ) . Derivnd-o, obinem: d T & & (t ) x(t ) = T (t ) x(t ) + T (t ) x(t ) dt
( = (x
(t )Q(t ) x(t ) + T (t ) A(t ) x(t ) ) + T (t )(A(t ) x(t ) B(t ) R 1 (t ) B T (t ) (t ) ) (5.31)
= x T (t )Q(t ) x(t ) T (t ) B(t ) R 1 (t ) B T (t ) (t ) de (5.20), (5.21) i (5.26), obinem:

0 = T S + x T (t )Q x(t ) + T (t ) B (t ) R 1 (t ) B T (t ) (t ) dt
tf
unde s-a utilizat (5.29) i (5.30). Integrnd ambii membri ai lui (5.31) pe [, t f ] i innd cont
(5.32)
ntruct S 0 , Q(t ) 0 i R (t ) > 0 , obligatoriu cei doi termeni din membrul drept al lui (5.32) sunt nuli, de unde n continuare, integralul din (5.32) este nul i deci cum R (t ) > 0 , rezult: B T (t ) (t ) = 0 , t [, t f ] Atunci, cu (5.33), (5.29) devine: & x(t ) = A(t ) x(t ) , t [, t f ] 0 = x() = (, t f ) x(t f ) = (, t f ) , 0 (5.34) Notnd cu (t , t f ) matricea fundamental a lui A(t ) obinem din (5.20), (5.27) i (5.26): (5.35) (5.33)
5-5
Din prima i ultima egalitate din (5.35) rezult c (t , t f ) este singular, ceea ce este absurd. Cu acest rezultat avem: Corolarul 5.1. Dac S 0 i Q(t ) 0 pe [t 0 , t f ] existena global a soluiei EDMR este asigurat i n consecin soluia PLP poate fi construit. Fa de constatarea din Corolarul 5.1, n cele ce urmeaz vom presupune pretutindeni n acest paragraf c S 0 i Q(t ) 0 pe [t 0 , t f ] . Obinem astfel urmtorul algoritm de calcul a soluiei EDMR. Algoritmul 5.1. 1. Se construiete matricea H (t ) dat prin (5.22) i se calculeaz matricea fundamental (t , t f ) a acesteia care se partiioneaz n n n blocurile: (t , t f ) 12 (t , t f ) (t , t f ) = 11 21 (t , t f ) 22 (t , t f ) 2. Soluia EDMR este atunci (conform Teoremei 5.2 i relaiei (5.23): P (t ) = 21 (t , t f ) + 22 (t , t f ) S 11 (t , t f ) + 12 (t , t f ) S
H ( t t f )
(5.36)
][
(5.37)
De remarcat c n cazul n care A, B, Q i R sunt matrice constante avem (t , t f ) = e , (5.38)
H furnizat de (5.22) fiind constant. Exemplul 5.2. Fie sistemul & x = x+u cu x, u i criteriul:
J = x 2 (1) + ( x 2 + u 2 ) dt
0 1
Ecuaia Riccati este: & P = 2 P P 2 + 1 , P(1) = 1 . Atunci H = 1 1 1 1 Rezult (2 + 2 ) e 2 t + (2 2 ) e 4 eH t = 2 e 2 t + 2 e 2 t 4 Aplicnd (5.37) obinem soluia
P (t ) = (1 2 ) e e
2 ( t 1) 2 ( t 1)
2t
2e (2 2 ) e
2t
2t
+ 2 e 2 t 4 + (2 + 2 ) e 4
2t
+ (1 + 2 ) e + e
2 ( t 1)
2 ( t 1)
comanda optimal fiind u (t ) = P(t ) x(t ) , iar valoarea optimal a criteriului este
V ( x 0 ) = x P ( 0) = x
2 0 2 0
(1 2 ) e e
2 2
+ (1 + 2 ) e +e
2
5-6
Referitor la matricele H (t ) i (t , t f ) , prima introdus prin (5.22), iar a doua ca matrice fundamental a primeia, se impun cteva precizri importante. n acest sens introducem dou definiii. Definiia 5.1. O 2n 2n matrice H se numete de tip Hamilton dac J H J = HT unde
0 In J= I n 0
(5.39) (5.40)
Se verific imediat c H (t ) introdus prin (5.22) este de tip Hamilton. Definiia 5.2. O 2n 2n matrice se numete simplectic dac T J = J . Avem imediat:
Teorema 5.4. Matricea fundamental (t , t f ) a lui H (t ) este simplectic. Demonstraie. Fie
(t , t f ) = T (t , t f ) J (t , t f ) J
(5.41)
(5.42)
Atunci
& & & (t , t f ) = T (t , t f ) J (t , t f ) + T (t , t f ) J (t , t f )
= T (t , t f ) H T (t ) J + J H (t ) (t , t f ) = 0
(5.43)
& unde s-a inut cont de faptul c = H i unde s-a utilizat (5.39). Deci (t , t f ) = ct. Din
(5.42) rezult (t , t f ) = 0 i deci (t , t f ) = 0 , t , rezultnd din (5.42) proprietatea de siplecticitate.
5.4. Problema liniar ptratic cu timp final infinit
Considerm sistemul liniar invariant n timp
& x(t ) = A x(t ) + B u (t )
(5.44)
unde x(t ) n este starea, u (t ) m este comanda, iar A i B sunt n n i respectiv n m matrice constante i criteriul ptratic: J = x T (t )Q x(t ) + u T (t ) R u (t ) dt
0
(5.45)
unde Q 0 i R > 0 sunt n n i respectiv m m matrice simetrice constante. Vom fi interesai exact n aceeai problematic pe care am prezentat-o n paragraful 5.1. Totui, datorit faptului c intervalul de conducere este [0, ] se pune n prealabil problema finititudinii indicelui (5.45). Altel spus, cu toate c J 0 , dac pentru o iniializare dat x0 i orice comand u () avem J = , problema de optimizare este lipsit de obiect. n sprijinul acestei afirmaii considerm: Exempul 5.3. Fie sistemul liniar definit prin:
5-7
A = 0 1 , B = 1 , 0 0 0 ponderile din criteriu fiind Q = 0 0 , R = 1 . 0 1 Dinamica sistemului este descris de:
& x1 = x2 + u & x2 = 0
Se vede imediat c din iniializarea x0 = 0 se obine urmtoarea traiectorie: 1
x (t ) x(t ) = 1 , 1
x1 (t ) depinznd de comanda aplicat u () . Introducnd n criteriul (5.45) pe x(t ) i u (t ) obinem:
J = (1 + u 2 (t )) dt =
0
oricare ar fi comanda aplicat u () . Din acest exemplu rezult c este necesar s impunem unele restricii asupra perechii ( A, B) . n acest sens, dac perechea ( A, B) este stabilizabil, atunci exist o comand u () care face mrginit criteriul (5.45). ntr-adevr, fie F mn astfel nct ( A + BF ) C ( ( A, B) este stabilizabil) i fie legea de comand
u=Fx
(5.46) (5.47) (5.48)
Cu (5.46) traiectoria lui (5.44), plecnd dintr-o iniializare arbitrar x0 este:

x(t ) = e ( A+ BF ) t x0 ,
iar comanda furnizat de (5.46) este:

u (t ) = F e ( A+ BF ) t x0
Cu (5.47) i (5.48), indicele (5.45) devine:

T J = x0 e ( A+ BF ) t Q + F T R F e ( A+ BF ) t dt x0
T
(5.49)
Cum A + BF este stabil, matricea

M = e ( A+ BF ) t Q + F T R F e ( A+ BF ) t dt 0
0

T
(5.50)
este bine definit i deci (5.49) cu (5.50) se scrie sub forma:

T 0 J = x0 M x0 <
(5.51)
aceasta atestnd mrginirea lui J. Introducem acum i indicele:

J t f = x T (t )Q x(t ) + u T (t ) R u (t ) dt
0
tf
(5.52)
5-8
i considerm EDMR cu coeficieni constani: & P = AT P + P A P B R 1 B T P + Q condiia de capt, t f . Notm, pentru claritate, aceast soluie cu:
P(t ) = (t ; t f , 0)
(5.53)
cu condiia de capt P (t f ) = 0 , care conform Corolarului 5.1 are o soluie unic satisfcnd (5.54)
ultimele dou argumente ale lui indicnd condiiile de capt. Datorit faptului c coeficienii lui (5.53) sunt constani, din (5.37) i (5.38) rezult direct c:
(t ; t f , 0) = (t t f ; 0, 0) = (0; t f t , 0)
(5.55)
De asemenea, notnd cu Vt f ( x0 ) valoarea optim a indicelui (5.52) asociat unei iniializri arbitrare x0 , conform Teoremei 5.1, avem:
T Vt f ( x0 ) = x0 (0; t f , 0) x0
(5.56)
Atunci, avem: Teorema 5.5. Dac perechea ( A, B) este stabilizabil, atunci: i) lim = (0; t f , 0) = P
t f
(5.57)
unde P 0 este bine definit, ii) AT P + P A P B R 1 B T P + Q = 0 cu t f , ceea ce nseamn c avem conform cu (5.56):
T x0 (0; t f , 0) x0 cnd t f , x0 .
(5.58)
Demonstraie. Se constat imediat c Vt f ( x0 ) este, oricare ar fi x0 , monoton cresctoare
(5.59)
Pe de alt parte, ntruct perechea ( A, B ) este stabilizabil, exist un F astfel nct

( A + BF ) C . Utiliznd atunci (5.47) i (5.48) avem sigur, datorit faptului c Vt f ( x0 ) este
valoarea minim a criteriului (5.52):

T T Vt f ( x0 ) x e ( A+ BF ) t Q + F T R F e ( A+ BF ) t dt x0 x0 e ( A+ BF ) t Q + F T R F e ( A+ BF ) t dt x0 = x0 M x0 T 0
0 0
tf
cu M 0 bine definit prin (5.50). Aadar, din (5.56) i (5.60) obinem c:

T T x0 (0; t f , 0) x0 x0 M x0 , t f , x0
(5.60) (5.61)
T Atunci, din (5.59) i (5.61) rezult c x0 (0; t f , 0) x0 este o funcie (continu n t f ) monoton
T cresctoare i mrginit cu t f cresctor. n consecin, lim x0 (0; t f , 0) x0 exist i este bine t
definit, x0 . Rezult atunci c (5.57) este adevrat, P 0 ntruct Vt f ( x0 ) 0 i proprietatea i) este complet demonstrat. Pentru demonstrarea proprietii ii) considerm soluia (t ; t f , P ) a EDMR (5.53), cu condiia de capt P(t f ) = P . Atunci, avem:
5-9
(t ; t f , P ) = (t ; t f , lim (0; t f , 0)) = lim (t ; t f , ( t f ; , 0))

= lim (t ; , 0) = lim (0; t , 0) = P

(5.62)
unde n irul de egaliti (5.62) s-a utilizat proprietatea de continuitate a soluiei n raport cu condiiile iniiale, proprietatea de compunere, definirea lui P prin (5.57) i proprietile de invarian (5.55). Din prima i ultima egalitate a lui (5.62) rezult c P satisface EDMR & (5.53). Cum P este o matrice constant, P = 0 i (5.53) devine (5.58), proprietatea ii) fiind i ea demonstrat. Teorema este astfel complet demonstrat. Din proprietatea ii) a Teoremei 5.5 se constat c P 0 este o soluie pozitiv semidefinit a ecuaiei matriceale algebrice:
AT P + P A P B R 1 B T P + Q = 0
(5.63)
care poart numele de ecuaia matriceal algebric Riccati (EMAR). Aceast ecuaie joac un rol central n PLP cu timp final infinit. Trebuie precizat ns c numai cu elementele furnizate de Teorema 5.5 localizarea soluiei P n clasa soluiilor EMAR nu este clar determinat, aa c pentru calculul lui P se folosete limita (5.57), adic plecnd de la EDMR i nu rezolvnd EMAR. n continuare vom analiza legtura dintre matricea P introdus prin Teorema 5.5, satisfcnd EMAR (5.63) i soluia PLP cu timp final infinit. n acest sens avem:
Teorema 5.6. Presupunem perechea ( A, B) stabilizabil, ipotez ce permite definirea prin Teorema 5.5 a matricei P . Atunci legea de comand
u = R 1 B T P x
(5.64)
(5.65)
este o soluie n circuit nchis a PLP cu timp final infinit, iar

T V ( x0 ) = x0 P x0
este valoarea optim a indicelui (5.45). Demonstraie. Artm mai nti c V ( x0 ) este valoarea indicelui (5.45) pentru comanda generat de legea (5.64) (vezi (5.48)) corespunztoare iniializrii x0 . Pentru aceasta, considerm criteriul:
J = x T (t f ) P x(t f ) + x T (t )Q x(t ) + u T (t ) R u (t ) dt
0 tf
(5.66)
Conform Teoremei 5.1,

u = R 1 B T (t ; t f , P ) x
(5.66)
este legea de comand optimal pentru criteriul (5.66), iar corespunztor unei iniializri x0 valoarea optim este: T V ( x0 ) = x0 (0; t f , P ) x0 (5.67) Utiliznd (5.62), expresiile (5.66) i (5.67) devin respectiv: u = R 1 B T P x i
T V ( x0 ) = x0 P x0
(5.68) (5.69)
5-10
Corespunztor iniializrii x0 , legea de comand optimal (5.68) genereaz prin (5.48) i (5.47) comanda i traiectoria optimal pentru citeriul (5.66) date de: u (t ) = R 1 B T P e ( A BR i respectiv 1 T x(t ) = e ( A BR B P ) t x0 Atunci, (5.69) se expliciteaz prin: x P x0 = x (t f ) P x(t f ) + x T (t )Q x(t ) + u T (t ) R u (t ) dt
T 0 T 0 tf
1 T
B P )t
x0
(5.70) (5.71)
(5.72)
cu u (t ) i x(t ) dai prin (5.70) i respectiv (5.71). Cum P 0 , din (5.72) avem:
tf T T T [x (t )Q x(t ) + u (t ) R u (t )]dt x0 P x0 0
(5.73)
i deci
T T T [x (t )Q x(t ) + u (t ) R u (t )]dt x0 P x0 0
(5.74)
membrul stng al lui (5.74) fiind bine definit datorit monotoniei cresctoare cu t f i mrginirii membrului stng al lui (5.73). Pe de alt parte, valoarea optim a criteriului (5.52) T este conform cu (5.56) x0 (0; t f , 0) x0 . nseamn c pentru comanda i traiectoria (5.70) i (5.71) avem sigur:
T x0 (0; t f , 0) x0 x T (t )Q x(t ) + u T (t ) R u (t ) dt 0 tf
(5.75)
Trecnd la limit n (5.75) cu t f i innd cont c membrul drept al lui (5.75) tinde ctre membrul stng al lui (5.74), rezult cu (5.57):
T x0 P x0 x T (t )Q x(t ) + u T (t ) R u (t ) dt 0
(5.76)
Comparnd (5.74) cu (5.76) rezult cu (5.69): V ( x0 ) = x T (t )Q x(t ) + u T (t ) R u (t ) dt

0
(5.77)
cu u (t ) i x(t ) dai de (5.70) i respectiv (5.71), demonstrnd astfel ceea ce ne-am propus. Vom arta acum c V ( x0 ) este valoarea minim a criteriului (5.45). S presupunem prin absurd c exist o comand u1 () care face, corespunztor iniializrii x0 , indicele (5.45) strict mai mic dect V ( x0 ) , adic:
T T V ( x0 ) > x1 (t )Q x1 (t ) + u1 (t ) R u1 (t ) dt 0
(5.78)
unde x1 () este traiectoria ce pleac din x0 sub aciunea comenzii u1 () . Cu comanda u1 () i traiectoria x1 () avem, relativ la criteriul (5.52):
T T T x0 (0; t f , 0) x0 x1 (t )Q x1 (t ) + u1 (t ) R u1 (t ) dt 0
(5.79)
Trecnd la limit n (5.79) cu t f , obinem cu (5.57) i (5.69):
5-11
T T V ( x0 ) x1 (t )Q x1 (t ) + u1 (t ) R u1 (t ) dt 0
(5.80)
Se constat imediat c (5.78) i (5.80) conduce la o contradicie, teorema fiind astfel complet demonstrat. Se pune totui ntrebarea: ce se ntmpl cu lim x(t ) atunci cnd este introdus legea de
t
comand optimal (5.64) ? Referitor la aceast ntrebare s considerm: Exemplul 5.5. Fie sistemul & x = x+u cu x, u i criteriul cu timp final infinit: J = u 2 dt
0
Se constat direct c P = 0 i deci u () = 0 este comanda optimal x0 . Valoarea optim a lui J este V ( x0 ) = 0 . Traiectoriile optimale sunt atunci de forma: x(t ) = e t x0 rezultnd lim x(t ) = . Aadar, cu toate c valoarea optim a criteriului este finit,
t
traiectoriile optimale tind la infinit. Exemplul de mai sus ne face s formulm mai precis ntrebarea de mai sus: n ce condiii legea de comand optimal (5.68) este i stabilizatoare ? Rspunsul este dat de:
Teorema 5.7. Dac perechea ( A, B) este stabilizabil, iar perechea ( Q , A) este detectabil, legea de comand optimal (5.68) este stabilizatoare. Demonstraie. Conform teoremei de stabilizabilitate (vezi Teorema 5.5), matricea P este bine definit. Aceast matrice (vezi de asemenea Teorema 5.5) satisface EMAR (5.63). Scriem (5.58) n forma: ( A B R 1 B T P ) T P + P ( A B R 1 B T P ) = Q P B R 1 B T P (5.81)
Introducnd matricea de reacie optimal F = R 1 B T P , (5.81) se rescrie ca o ecuaie Liapunov: ( A + B F ) T P + P ( A + B F ) = Q F T R F
(5.82) (5.83)
Perechea ( Q , A) fiind detectabil, rezult (exerciiu pentru cititor) c i perechea
( Q + F T R F , A + B F ) este detectabil. Atunci, cum P 0 , din teorema lui Liapunov (vezi (5.83)), rezult c matricea A + B F este stabil, adic matricea de reacie optimal (5.82) este stabilizatoare. Introducem acum Definiia 5.3. O soluie simetric P a EMAR se numete stabilizatoare dac F = R 1 B T P (5.84) definete o lege de comand (5.46) stabilizatoare. Direct din Teorema 5.7 avem: Corolarul 5.2. n condiiile Teoremei 5.7, o soluie simetric P a EMAR este stabilizatoare dac i numai dac este pozitiv semidefinit. ntr-adevr, aceasta rezult imediat din interpretarea unei ecuaii Liapunov de tipul (5.83) (lsm detaliile ca exerciiu cititorului).
5-12
Avem acum imediat,

Teorema 5.8. n condiiile Teoremei 5.7, soluia P a EMAR introdus prin Teorema 5.5 este unica soluie pozitiv semidefinit. Demonstraie. S presupunem c n afar de P , EMAR mai are o soluie P 0 . Atunci, conform Teoremei 5.7 i Corolarului 5.2, aceste dou soluii sunt soluii stabilizatoare. Utiliznd aceast constatare, un calcul elementar ne conduce la ecuaia Liapunov:
( A + B F )T ( P P) + ( P P)( A + B F ) = 0
(5.85)
Cum A + B F i A + B F sunt stabile, din (5.85) rezult c P P = 0 , adic P = P i teorema este complet demonstrat. Aadar, dac perechea ( A, B) este stabilizabil, iar perechea ( Q , A) este detectabil, localizarea matricei P n clasa soluiilor EMAR este perfect determinat, aceasta fiind unica soluie pozitiv semidefinit a EMAR. n plus, legea de comand este stabilizatoare. n consecin, cu ipotezele de mai sus, calculul soluiei PLP cu timp final infinit se reduce la calculul soluiei pozitiv semidefinite a EMAR. Exemplul 5.6. Fie sistemul & x = x+u cu x, u i criteriul cu timp final infinit: J = ( x 2 + u 2 ) dt
0
Observm mai nti c perechea ( A, B) = (1, 1) este stabilizabil, iar perechea ( Q , A) = (1, 1) este detectabil. Atunci, P este soluia pozitiv a ecuaiei algebrice P 2 2P 1 = 0 care este P = 1+ 2 . Rezult c soluia problemei este u = (1 + 2 ) x . Constatm de asemenea c A B R 1 B T P = 2 i deci traiectoriile optimale sunt de forma x(t ) = e fiind stabile.
2 t
x0
5-13

5 Cap5 - A

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

5 Cap5 - A

Încărcat de

Drepturi de autor:

Formate disponibile

Cap. 5.

Optimizarea cu criteriu ptratic a sistemelor liniare

& x(t ) = A(t ) x(t ) + B(t )u (t )

(5.3) (5.4) (5.5) (5.6) (5.7)

f ~ T T V ( x0 ) = x0 T (t f , t 0 ) S 0 (t f , t 0 ) x0 + x0 T (t , t 0 ) Q(t ) + F T (t ) R(t ) F (t ) 0 (t , t 0 )dt x0 0 0

& x(t ) = A(t ) x(t ) + B(t ) u (t )

5.2. Soluia problemei liniar ptratice cu timp final finit

= [u (t ) + R (t ) B (t ) P(t ) x(t )] R(t )[u (t ) + R (t ) B (t ) P(t ) x(t )]dt

Introducem aa-numitul sistem canonic matriceal definit prin:

(5.18) (5.19) (5.20) (5.21)

i notm cu (t , t f ) matricea fundamental a lui H (t ) . Atunci

Derivnd ambii membri ai lui (5.24), cu (5.18), (5.19) i (5.24) obinem:

& P (t ) X (t ) + P(t )(A(t ) X (t ) B (t ) R 1 (t ) B T (t ) P(t ) X (t ) ) = Q(t ) X (t ) AT (t ) P(t ) X (t ) (5.25)

(5.27) (5.28) (5.29) (5.30)

Rezult imediat c avem cu (5.18) i (5.19):

(t )Q(t ) x(t ) + T (t ) A(t ) x(t ) ) + T (t )(A(t ) x(t ) B(t ) R 1 (t ) B T (t ) (t ) ) (5.31)

= x T (t )Q(t ) x(t ) T (t ) B(t ) R 1 (t ) B T (t ) (t ) de (5.20), (5.21) i (5.26), obinem:

De remarcat c n cazul n care A, B, Q i R sunt matrice constante avem (t , t f ) = e , (5.38)

Considerm sistemul liniar invariant n timp

& x(t ) = A x(t ) + B u (t )

A = 0 1 , B = 1 , 0 0 0 ponderile din criteriu fiind Q = 0 0 , R = 1 . 0 1 Dinamica sistemului este descris de:

(5.46) (5.47) (5.48)

Cu (5.46) traiectoria lui (5.44), plecnd dintr-o iniializare arbitrar x0 este:

iar comanda furnizat de (5.46) este:

Cu (5.47) i (5.48), indicele (5.45) devine:

Cum A + BF este stabil, matricea

este bine definit i deci (5.49) cu (5.50) se scrie sub forma:

aceasta atestnd mrginirea lui J. Introducem acum i indicele:

Demonstraie. Se constat imediat c Vt f ( x0 ) este, oricare ar fi x0 , monoton cresctoare

Pe de alt parte, ntruct perechea ( A, B ) este stabilizabil, exist un F astfel nct

valoarea minim a criteriului (5.52):

cu M 0 bine definit prin (5.50). Aadar, din (5.56) i (5.60) obinem c:

(t ; t f , P ) = (t ; t f , lim (0; t f , 0)) = lim (t ; t f , ( t f ; , 0))

= lim (t ; , 0) = lim (0; t , 0) = P

este o soluie n circuit nchis a PLP cu timp final infinit, iar

Conform Teoremei 5.1,

Comparnd (5.74) cu (5.76) rezult cu (5.69): V ( x0 ) = x T (t )Q x(t ) + u T (t ) R u (t ) dt

Trecnd la limit n (5.79) cu t f , obinem cu (5.57) i (5.69):

Introducnd matricea de reacie optimal F = R 1 B T P , (5.81) se rescrie ca o ecuaie Liapunov: ( A + B F ) T P + P ( A + B F ) = Q F T R F

Perechea ( Q , A) fiind detectabil, rezult (exerciiu pentru cititor) c i perechea

Avem acum imediat,

S-ar putea să vă placă și