Sunteți pe pagina 1din 13

Cap. 5.

Optimizarea cu criteriu ptratic a sistemelor liniare


n acest capitol vom aborda o problem de optimizare important att prin consecinele aplicative largi pe care le are, ct i prin suportul constructiv pe care l furnizeaz n investigarea teoretic i procedural a unor clase de probleme mai complexe de optimizare. Totodat, prezentul capitol reprezint o jonciune ntre aspectele structurale ale sistemelor liniare, studiate cu precdere la cursul de teoria sistemelor i problematica propriu-zis de optimizare a acestora. 5.1. Formularea problemei Fie sistemul liniar (variabil n timp)

& x(t ) = A(t ) x(t ) + B(t )u (t )

(5.1)

unde x(t ) n este starea, u (t ) m este comanda, iar A(t) i B(t) sunt n n i respectiv n m matrice continue pe intervalul deschis I = (Ta , Tb ) . Fie fixat intervalul de conducere [t 0 , t f ] I i criteriul ptratic
J = x T (t f ) Sx(t f ) + x T (t )Qx(t ) + u T (t ) Ru (t ) dt
t0 tf

(5.2)

unde S este o n n matrice simetric constant, iar Q(t) i R(t) sunt n n i respectiv m m matrice simetrice continue, cu R(t) pozitiv definit pe intervalul I, adic R(t ) > 0 . Problema optimizrii cu criteriul ptratic (5.2) a sistemului liniar (5.1), pe scurt problema liniar ptratic (PLP) se formuleaz astfel: dndu-se o condiie iniial x(t 0 ) = x0 a sistemului (5.1), s se determine o comand u () pe intervalul [t 0 , t f ] care s minimizeze criteriul (5.2). Notm cu V ( x0 ) valoarea optim a criteriului (5.2) asociat iniializrii x0. Comanda u () care se cere a fi determinat reprezint o soluie n circuit deschis (Atenie, s-ar putea s fie mai multe soluii) a PLP. Interesant ns din punctul de vedere al implementrii conducerii optimale este determinarea unei soluii n circuit nchis. Pentru a preciza noiunea, s considerm legea de comand u (t ) = F (t ) x(t ) cu F (t ) o m n matrice continu pe [t 0 , t f ] . Atunci sistemul (5.1) devine
& x(t ) = A0 (t ) x(t )

(5.3) (5.4) (5.5) (5.6) (5.7)

unde
A0 (t ) = A(t ) + B(t ) F (t )

Corespunztor unei iniializri x0, traiectoria lui (5.4) este x(t ) = 0 (t , t 0 ) x0 iar comanda, furnizat prin legea de comand (5.3), va fi u (t ) = F (t ) 0 (t , t 0 ) x0

unde 0 (t , t 0 ) este matricea fundamental a matricei A0(t). Pentru comanda (5.7) i traiectoria (5.6), criteriul (5.2) capt valoarea
5-1

f ~ T T V ( x0 ) = x0 T (t f , t 0 ) S 0 (t f , t 0 ) x0 + x0 T (t , t 0 ) Q(t ) + F T (t ) R(t ) F (t ) 0 (t , t 0 )dt x0 0 0

(5.8)

t0

Vom spune c legea de comand (5.3), sau pe scurt matricea F(t) este o soluie n circuit nchis a PLP, dac pentru orice x0 n este adevrat egalitatea: ~ V ( x0 ) = V ( x0 ) (5.9) n acest caz legea de comand (5.3) se numete lege de comand optimal. Considernd implementat legea de comand optimal (Fig. 5.1), se constat imediat c aceasta furnizeaz, corespunztor iniializrii arbitrare x0, o soluie n circuit deschis a PLP. Altfel spus, n timp ce determinarea unei soluii n circuit deschis a PLP trebuie fcut ori de cte ori se schimb iniializarea x0, cunoaterea unei soluii n circuit nchis, explicitat prin matricea F(t), permite autogenerarea, prin schema din Fig. 5.1, a unei soluii n circuit deschis, oricare ar fi iniializarea x0.

x(t0) = x0 u(t)

& x(t ) = A(t ) x(t ) + B(t ) u (t )


F(t)
Fig. 5.1.

x(t)

5.2. Soluia problemei liniar ptratice cu timp final finit

Introducem ecuaia diferenial matricial: & P(t ) = AT (t ) P(t ) + P(t ) A(t ) P(t ) B(t ) R 1 (t ) B T (t ) P(t ) + Q(t ) cu condiia de capt P(t f ) = S

(5.10) (5.11)

ecuaie care poart numele de ecuaia diferenial matriceal Riccati (EDMR). Aa cum vom vedea, esenial n rezolvarea PLP este soluia EDMR pe intervalul [t 0 , t f ] , satisfcnd condiia (5.11). Referitor la aceast, soluie se impun n prealabil cteva precizri sintetizate n: Observaia 5.1. Membrul drept al ecuaiei (5.10) este descris de funcia F : I nn nn definit prin egalitatea F (t , P) = AT (t ) P + PA(t ) PB(t ) R 1 (t ) B T (t ) P + Q(t ) care se vede c este continu n t i P i, datorit structurii polinomiale, este local lipschitzian n P. n consecin, EDMR are, ntr-o vecintate a lui tf, o unic soluie care satisface (5.11). Aceast existen local a soluiei nu implic n mod necesar i existena global a soluiei pe [t 0 , t f ] . ntr-adevr, fie, referitor la intervalul [0, ] , ecuaia:
& P = P 2 + 1, P() = 0

Separnd variabilele, rezult soluia P(t ) = tg t care, se constat imediat c, exist numai pe intervalul ( 2 , 3 2 ) rezultnd c ecuaia de mai sus nu are o soluie pe [0, ] . Evident dac EDMR are pe intervalul [t 0 , t f ] o soluie care satisface (5.11) atunci, conform proprietilor funciei F (t , P) menionate mai sus, aceast soluie este unic. Rezult de aici
5-2

c dac EDMR are pe intervalul [t 0 , t f ] o soluie satisfcnd (5.11), aceast soluie este simetric. ntr-adevr fie P() aceast soluie. Atunci, se verific imediat c i P T () verific (5.10). Cum S este simetric avem P (t f ) = S = P T (t f ) i deci conform unicitii P T (t ) = P(t ) pe [t 0 , t f ] . Se poate acum formula rezultatul fundamental exprimat prin:
Teorema 5.1. Dac EDMR are pe intervalul [t 0 , t f ] o soluie satisfacnd (5.11), atunci

u (t ) = R 1 (t ) B T (t ) P(t ) x(t )

(5.12)

este o soluie n circuit nchis a PLP. Aceast soluie este unic. Valoarea optim a indicelui de performan este
T V ( x0 ) = x0 P(t 0 ) x0

(5.13)

Demonstraie. Fie x0 n o iniializare oarecare i u () o comand arbitrar pe [t 0 , t f ] . Fie x() traiectoria corespunztoare a lui (5.1) i fie introdus funcia: (t ) = x T (t ) P(t ) x(t ) Atunci, prin derivare i utiliznd (5.1) i (5.10) obinem: & & & & (t ) = x T (t ) P(t ) x(t ) + x T (t ) P(t ) x(t ) + x T (t ) P(t ) x(t ) =
= u T (t ) B T (t ) P(t ) x(t ) + x T (t ) P(t ) B(t )u (t ) + + x T (t ) P(t ) B(t ) R 1 (t ) B T (t ) P(t ) x(t ) x T (t )Q(t ) x(t ) Integrnd pe [t 0 , t f ] ambii membri ai lui (5.15), cu (5.11) i (5.14), obinem:
T x T (t f ) Sx(t f ) x0 P(t 0 ) x0 = tf 1 T T T T T T [u (t ) B (t ) P(t ) x(t ) + x (t ) P(t ) B(t )u (t ) + x (t ) P(t ) B(t ) R (t ) B (t ) P(t ) x(t ) x (t )Q(t ) x(t )]dt

(5.14)

(5.15)

t0

(5.16) Adunnd membru cu membru (5.2) cu (5.16), obinem: J = [u T (t ) R(t )u (t ) + u T (t ) B T (t ) P(t ) x(t ) + x T (t ) P(t ) B(t )u (t ) +
t0 T + x (t ) P(t ) B(t ) R 1 (t ) B T (t ) P(t ) x(t )]dt + x0 P(t 0 ) x0 T tf

= [u (t ) + R (t ) B (t ) P(t ) x(t )] R(t )[u (t ) + R (t ) B (t ) P(t ) x(t )]dt


T T T t0 T + x0 P(t 0 ) x0 = J 1 + J 2

tf

(5.17)

unde n ultima egalitate din (5.17) s-a fcut apel la simetria soluiei P() (vezi Observaia 5.1). Din (5.17) se vede c indicele J este o sum dintre J1 dependent de u () i este 0 i J2 care este, pentru iniializarea fixat x0, constant. Rezult atunci c minimul lui J se obine pentru J 1 = 0 . Din pozitivitatea definit a lui R(t) se vede c J 1 = 0 dac i numai dac (5.12) este adevrat. Unicitatea soluiei (5.12) rezult direct din faptul c J 1 = 0 dac dependena (5.12) este ndeplinit i din unicitatea soluiei EDMR. n fine, rezult c valoarea minim a lui J este J2, adic (5.13).

5-3

Dac se dorete expresia comenzii n circuit nchis, aceasta se obine cu relaia (5.7) n care factorul de reacie este dat de F (t ) = R 1 (t ) B T (t ) P(t ) . S remarcm de asemenea c Teorema 5.1 exprim o teorem de suficien pentru optim. Condiiile de necesitate vor fi cercetate n capitolele 5 i 6. Exemplul 5.1. Fie sistemul & x=u cu x, u i criteriul
J = x 2 + u 2 dt
3 4

Se vede c A = 0, B = 1, S = 0, Q = 1, R = 1 . EDMR corespunztoare este & P = P 2 1, P() = 0 , care aa cum s-a vzut n Observaia 5.1 are soluia P(t) = tg t, soluie care exist pe [ 3 4, ]. Atunci, legea de comand optimal este u (t ) = ( tg t ) x0 , iar valoarea optimal a criteriului este 3 2 2 V ( x0 ) = x0 tg = x0 4
5.3. Soluia ecuaiei difereniale Riccati. Tehnici de rezolvare

Introducem aa-numitul sistem canonic matriceal definit prin:


& X (t ) = A(t ) X (t ) B(t ) R 1 (t ) BT (t ) (t ) & (t ) = Q(t ) X (t ) AT (t ) (t )

(5.18) (5.19) (5.20) (5.21)

cu condiiile de capt X (t f ) = I (t f ) = S ,
X i fiind n n matrice. Introducem i 2n 2n matricea
A(t ) B(t ) R 1 (t ) B T (t ) H (t ) = AT (t ) Q(t )

(5.22)

i notm cu (t , t f ) matricea fundamental a lui H (t ) . Atunci


X (t ) = (t , t ) I f (t ) S

(5.23)

este soluia sistemului canonic matriceal. Importana acestui sistem pentru EDMR este evideniat de: Teorema 5.2. Fie X (t ) i (t ) furnizate de (5.23). Dac X (t ) este nesingular pe [t 0 , t f ] atunci (t ) X 1 (t ) este soluie a EDMR care satisface condiia de capt (5.11). Aceast soluie este unic. Demonstraie. Fie P(t ) definit prin
P (t ) X (t ) = (t )

(5.24)

5-4

Derivnd ambii membri ai lui (5.24), cu (5.18), (5.19) i (5.24) obinem:

& P (t ) X (t ) + P(t )(A(t ) X (t ) B (t ) R 1 (t ) B T (t ) P(t ) X (t ) ) = Q(t ) X (t ) AT (t ) P(t ) X (t ) (5.25)

Simplificnd cu X (t ) nesingular n (5.25) rezult direct c P(t ) satisface EDMR. Din (5.20), (5.21) i (5.24) rezult P(t f ) = S , adic ndeplinirea condiiei (5.11). Unicitatea rezult din observaia 5.1. S vedem n ce condiii X (t ) este nesingular. n acest sens avem:
Teorema 5.3. Dac S 0 , iar Q(t ) 0 pe [t 0 , t f ] , atunci X (t ) este nesingular pe

[t 0 , t f ] .
Demonstraie. S presupunem c exist [t 0 , t f ] n care X () este singular. Cum X (t f ) = I , evident < t f . Exist atunci un n , 0 , astfel nct

X () = 0
Introducem pe [t 0 , t f ]
x(t ) = X (t ) (t ) = (t )

(5.26)

(5.27) (5.28) (5.29) (5.30)

Rezult imediat c avem cu (5.18) i (5.19):


& x(t ) = A(t ) x(t ) B (t ) R 1 (t ) B T (t ) (t ) & (t ) = Q(t ) x(t ) AT (t ) (t )

Fie funcia T (t ) x(t ) . Derivnd-o, obinem: d T & & (t ) x(t ) = T (t ) x(t ) + T (t ) x(t ) dt

( = (x

(t )Q(t ) x(t ) + T (t ) A(t ) x(t ) ) + T (t )(A(t ) x(t ) B(t ) R 1 (t ) B T (t ) (t ) ) (5.31)

= x T (t )Q(t ) x(t ) T (t ) B(t ) R 1 (t ) B T (t ) (t ) de (5.20), (5.21) i (5.26), obinem:


0 = T S + x T (t )Q x(t ) + T (t ) B (t ) R 1 (t ) B T (t ) (t ) dt
tf

unde s-a utilizat (5.29) i (5.30). Integrnd ambii membri ai lui (5.31) pe [, t f ] i innd cont

(5.32)

ntruct S 0 , Q(t ) 0 i R (t ) > 0 , obligatoriu cei doi termeni din membrul drept al lui (5.32) sunt nuli, de unde n continuare, integralul din (5.32) este nul i deci cum R (t ) > 0 , rezult: B T (t ) (t ) = 0 , t [, t f ] Atunci, cu (5.33), (5.29) devine: & x(t ) = A(t ) x(t ) , t [, t f ] 0 = x() = (, t f ) x(t f ) = (, t f ) , 0 (5.34) Notnd cu (t , t f ) matricea fundamental a lui A(t ) obinem din (5.20), (5.27) i (5.26): (5.35) (5.33)

5-5

Din prima i ultima egalitate din (5.35) rezult c (t , t f ) este singular, ceea ce este absurd. Cu acest rezultat avem: Corolarul 5.1. Dac S 0 i Q(t ) 0 pe [t 0 , t f ] existena global a soluiei EDMR este asigurat i n consecin soluia PLP poate fi construit. Fa de constatarea din Corolarul 5.1, n cele ce urmeaz vom presupune pretutindeni n acest paragraf c S 0 i Q(t ) 0 pe [t 0 , t f ] . Obinem astfel urmtorul algoritm de calcul a soluiei EDMR. Algoritmul 5.1. 1. Se construiete matricea H (t ) dat prin (5.22) i se calculeaz matricea fundamental (t , t f ) a acesteia care se partiioneaz n n n blocurile: (t , t f ) 12 (t , t f ) (t , t f ) = 11 21 (t , t f ) 22 (t , t f ) 2. Soluia EDMR este atunci (conform Teoremei 5.2 i relaiei (5.23): P (t ) = 21 (t , t f ) + 22 (t , t f ) S 11 (t , t f ) + 12 (t , t f ) S
H ( t t f )

(5.36)

][

(5.37)

De remarcat c n cazul n care A, B, Q i R sunt matrice constante avem (t , t f ) = e , (5.38)

H furnizat de (5.22) fiind constant. Exemplul 5.2. Fie sistemul & x = x+u cu x, u i criteriul:
J = x 2 (1) + ( x 2 + u 2 ) dt
0 1

Ecuaia Riccati este: & P = 2 P P 2 + 1 , P(1) = 1 . Atunci H = 1 1 1 1 Rezult (2 + 2 ) e 2 t + (2 2 ) e 4 eH t = 2 e 2 t + 2 e 2 t 4 Aplicnd (5.37) obinem soluia
P (t ) = (1 2 ) e e
2 ( t 1) 2 ( t 1)

2t

2e (2 2 ) e

2t

2t

+ 2 e 2 t 4 + (2 + 2 ) e 4

2t

+ (1 + 2 ) e + e
2 ( t 1)

2 ( t 1)

comanda optimal fiind u (t ) = P(t ) x(t ) , iar valoarea optimal a criteriului este
V ( x 0 ) = x P ( 0) = x
2 0 2 0

(1 2 ) e e

2 2

+ (1 + 2 ) e +e
2

5-6

Referitor la matricele H (t ) i (t , t f ) , prima introdus prin (5.22), iar a doua ca matrice fundamental a primeia, se impun cteva precizri importante. n acest sens introducem dou definiii. Definiia 5.1. O 2n 2n matrice H se numete de tip Hamilton dac J H J = HT unde
0 In J= I n 0

(5.39) (5.40)

Se verific imediat c H (t ) introdus prin (5.22) este de tip Hamilton. Definiia 5.2. O 2n 2n matrice se numete simplectic dac T J = J . Avem imediat:
Teorema 5.4. Matricea fundamental (t , t f ) a lui H (t ) este simplectic. Demonstraie. Fie
(t , t f ) = T (t , t f ) J (t , t f ) J

(5.41)

(5.42)

Atunci
& & & (t , t f ) = T (t , t f ) J (t , t f ) + T (t , t f ) J (t , t f )
= T (t , t f ) H T (t ) J + J H (t ) (t , t f ) = 0

(5.43)

& unde s-a inut cont de faptul c = H i unde s-a utilizat (5.39). Deci (t , t f ) = ct. Din
(5.42) rezult (t , t f ) = 0 i deci (t , t f ) = 0 , t , rezultnd din (5.42) proprietatea de siplecticitate.
5.4. Problema liniar ptratic cu timp final infinit

Considerm sistemul liniar invariant n timp

& x(t ) = A x(t ) + B u (t )

(5.44)

unde x(t ) n este starea, u (t ) m este comanda, iar A i B sunt n n i respectiv n m matrice constante i criteriul ptratic: J = x T (t )Q x(t ) + u T (t ) R u (t ) dt
0

(5.45)

unde Q 0 i R > 0 sunt n n i respectiv m m matrice simetrice constante. Vom fi interesai exact n aceeai problematic pe care am prezentat-o n paragraful 5.1. Totui, datorit faptului c intervalul de conducere este [0, ] se pune n prealabil problema finititudinii indicelui (5.45). Altel spus, cu toate c J 0 , dac pentru o iniializare dat x0 i orice comand u () avem J = , problema de optimizare este lipsit de obiect. n sprijinul acestei afirmaii considerm: Exempul 5.3. Fie sistemul liniar definit prin:

5-7

A = 0 1 , B = 1 , 0 0 0 ponderile din criteriu fiind Q = 0 0 , R = 1 . 0 1 Dinamica sistemului este descris de:

& x1 = x2 + u & x2 = 0
Se vede imediat c din iniializarea x0 = 0 se obine urmtoarea traiectorie: 1
x (t ) x(t ) = 1 , 1
x1 (t ) depinznd de comanda aplicat u () . Introducnd n criteriul (5.45) pe x(t ) i u (t ) obinem:

J = (1 + u 2 (t )) dt =
0

oricare ar fi comanda aplicat u () . Din acest exemplu rezult c este necesar s impunem unele restricii asupra perechii ( A, B) . n acest sens, dac perechea ( A, B) este stabilizabil, atunci exist o comand u () care face mrginit criteriul (5.45). ntr-adevr, fie F mn astfel nct ( A + BF ) C ( ( A, B) este stabilizabil) i fie legea de comand
u=Fx

(5.46) (5.47) (5.48)

Cu (5.46) traiectoria lui (5.44), plecnd dintr-o iniializare arbitrar x0 este:


x(t ) = e ( A+ BF ) t x0 ,

iar comanda furnizat de (5.46) este:


u (t ) = F e ( A+ BF ) t x0

Cu (5.47) i (5.48), indicele (5.45) devine:


T J = x0 e ( A+ BF ) t Q + F T R F e ( A+ BF ) t dt x0
T

(5.49)

Cum A + BF este stabil, matricea


M = e ( A+ BF ) t Q + F T R F e ( A+ BF ) t dt 0
0

T

(5.50)

este bine definit i deci (5.49) cu (5.50) se scrie sub forma:


T 0 J = x0 M x0 <

(5.51)

aceasta atestnd mrginirea lui J. Introducem acum i indicele:


J t f = x T (t )Q x(t ) + u T (t ) R u (t ) dt
0
tf

(5.52)

5-8

i considerm EDMR cu coeficieni constani: & P = AT P + P A P B R 1 B T P + Q condiia de capt, t f . Notm, pentru claritate, aceast soluie cu:
P(t ) = (t ; t f , 0)

(5.53)

cu condiia de capt P (t f ) = 0 , care conform Corolarului 5.1 are o soluie unic satisfcnd (5.54)

ultimele dou argumente ale lui indicnd condiiile de capt. Datorit faptului c coeficienii lui (5.53) sunt constani, din (5.37) i (5.38) rezult direct c:
(t ; t f , 0) = (t t f ; 0, 0) = (0; t f t , 0)

(5.55)

De asemenea, notnd cu Vt f ( x0 ) valoarea optim a indicelui (5.52) asociat unei iniializri arbitrare x0 , conform Teoremei 5.1, avem:
T Vt f ( x0 ) = x0 (0; t f , 0) x0

(5.56)

Atunci, avem: Teorema 5.5. Dac perechea ( A, B) este stabilizabil, atunci: i) lim = (0; t f , 0) = P
t f

(5.57)

unde P 0 este bine definit, ii) AT P + P A P B R 1 B T P + Q = 0 cu t f , ceea ce nseamn c avem conform cu (5.56):
T x0 (0; t f , 0) x0 cnd t f , x0 .

(5.58)

Demonstraie. Se constat imediat c Vt f ( x0 ) este, oricare ar fi x0 , monoton cresctoare

(5.59)

Pe de alt parte, ntruct perechea ( A, B ) este stabilizabil, exist un F astfel nct


( A + BF ) C . Utiliznd atunci (5.47) i (5.48) avem sigur, datorit faptului c Vt f ( x0 ) este

valoarea minim a criteriului (5.52):


T T Vt f ( x0 ) x e ( A+ BF ) t Q + F T R F e ( A+ BF ) t dt x0 x0 e ( A+ BF ) t Q + F T R F e ( A+ BF ) t dt x0 = x0 M x0 T 0
0 0

tf

cu M 0 bine definit prin (5.50). Aadar, din (5.56) i (5.60) obinem c:


T T x0 (0; t f , 0) x0 x0 M x0 , t f , x0

(5.60) (5.61)

T Atunci, din (5.59) i (5.61) rezult c x0 (0; t f , 0) x0 este o funcie (continu n t f ) monoton
T cresctoare i mrginit cu t f cresctor. n consecin, lim x0 (0; t f , 0) x0 exist i este bine t

definit, x0 . Rezult atunci c (5.57) este adevrat, P 0 ntruct Vt f ( x0 ) 0 i proprietatea i) este complet demonstrat. Pentru demonstrarea proprietii ii) considerm soluia (t ; t f , P ) a EDMR (5.53), cu condiia de capt P(t f ) = P . Atunci, avem:

5-9

(t ; t f , P ) = (t ; t f , lim (0; t f , 0)) = lim (t ; t f , ( t f ; , 0))


= lim (t ; , 0) = lim (0; t , 0) = P


(5.62)

unde n irul de egaliti (5.62) s-a utilizat proprietatea de continuitate a soluiei n raport cu condiiile iniiale, proprietatea de compunere, definirea lui P prin (5.57) i proprietile de invarian (5.55). Din prima i ultima egalitate a lui (5.62) rezult c P satisface EDMR & (5.53). Cum P este o matrice constant, P = 0 i (5.53) devine (5.58), proprietatea ii) fiind i ea demonstrat. Teorema este astfel complet demonstrat. Din proprietatea ii) a Teoremei 5.5 se constat c P 0 este o soluie pozitiv semidefinit a ecuaiei matriceale algebrice:
AT P + P A P B R 1 B T P + Q = 0

(5.63)

care poart numele de ecuaia matriceal algebric Riccati (EMAR). Aceast ecuaie joac un rol central n PLP cu timp final infinit. Trebuie precizat ns c numai cu elementele furnizate de Teorema 5.5 localizarea soluiei P n clasa soluiilor EMAR nu este clar determinat, aa c pentru calculul lui P se folosete limita (5.57), adic plecnd de la EDMR i nu rezolvnd EMAR. n continuare vom analiza legtura dintre matricea P introdus prin Teorema 5.5, satisfcnd EMAR (5.63) i soluia PLP cu timp final infinit. n acest sens avem:
Teorema 5.6. Presupunem perechea ( A, B) stabilizabil, ipotez ce permite definirea prin Teorema 5.5 a matricei P . Atunci legea de comand

u = R 1 B T P x

(5.64)
(5.65)

este o soluie n circuit nchis a PLP cu timp final infinit, iar


T V ( x0 ) = x0 P x0

este valoarea optim a indicelui (5.45). Demonstraie. Artm mai nti c V ( x0 ) este valoarea indicelui (5.45) pentru comanda generat de legea (5.64) (vezi (5.48)) corespunztoare iniializrii x0 . Pentru aceasta, considerm criteriul:
J = x T (t f ) P x(t f ) + x T (t )Q x(t ) + u T (t ) R u (t ) dt
0 tf

(5.66)

Conform Teoremei 5.1,


u = R 1 B T (t ; t f , P ) x

(5.66)

este legea de comand optimal pentru criteriul (5.66), iar corespunztor unei iniializri x0 valoarea optim este: T V ( x0 ) = x0 (0; t f , P ) x0 (5.67) Utiliznd (5.62), expresiile (5.66) i (5.67) devin respectiv: u = R 1 B T P x i
T V ( x0 ) = x0 P x0

(5.68) (5.69)

5-10

Corespunztor iniializrii x0 , legea de comand optimal (5.68) genereaz prin (5.48) i (5.47) comanda i traiectoria optimal pentru citeriul (5.66) date de: u (t ) = R 1 B T P e ( A BR i respectiv 1 T x(t ) = e ( A BR B P ) t x0 Atunci, (5.69) se expliciteaz prin: x P x0 = x (t f ) P x(t f ) + x T (t )Q x(t ) + u T (t ) R u (t ) dt
T 0 T 0 tf
1 T

B P )t

x0

(5.70) (5.71)

(5.72)

cu u (t ) i x(t ) dai prin (5.70) i respectiv (5.71). Cum P 0 , din (5.72) avem:
tf T T T [x (t )Q x(t ) + u (t ) R u (t )]dt x0 P x0 0

(5.73)

i deci

T T T [x (t )Q x(t ) + u (t ) R u (t )]dt x0 P x0 0

(5.74)

membrul stng al lui (5.74) fiind bine definit datorit monotoniei cresctoare cu t f i mrginirii membrului stng al lui (5.73). Pe de alt parte, valoarea optim a criteriului (5.52) T este conform cu (5.56) x0 (0; t f , 0) x0 . nseamn c pentru comanda i traiectoria (5.70) i (5.71) avem sigur:
T x0 (0; t f , 0) x0 x T (t )Q x(t ) + u T (t ) R u (t ) dt 0 tf

(5.75)

Trecnd la limit n (5.75) cu t f i innd cont c membrul drept al lui (5.75) tinde ctre membrul stng al lui (5.74), rezult cu (5.57):
T x0 P x0 x T (t )Q x(t ) + u T (t ) R u (t ) dt 0

(5.76)

Comparnd (5.74) cu (5.76) rezult cu (5.69): V ( x0 ) = x T (t )Q x(t ) + u T (t ) R u (t ) dt


0

(5.77)

cu u (t ) i x(t ) dai de (5.70) i respectiv (5.71), demonstrnd astfel ceea ce ne-am propus. Vom arta acum c V ( x0 ) este valoarea minim a criteriului (5.45). S presupunem prin absurd c exist o comand u1 () care face, corespunztor iniializrii x0 , indicele (5.45) strict mai mic dect V ( x0 ) , adic:
T T V ( x0 ) > x1 (t )Q x1 (t ) + u1 (t ) R u1 (t ) dt 0

(5.78)

unde x1 () este traiectoria ce pleac din x0 sub aciunea comenzii u1 () . Cu comanda u1 () i traiectoria x1 () avem, relativ la criteriul (5.52):
T T T x0 (0; t f , 0) x0 x1 (t )Q x1 (t ) + u1 (t ) R u1 (t ) dt 0

(5.79)

Trecnd la limit n (5.79) cu t f , obinem cu (5.57) i (5.69):

5-11

T T V ( x0 ) x1 (t )Q x1 (t ) + u1 (t ) R u1 (t ) dt 0

(5.80)

Se constat imediat c (5.78) i (5.80) conduce la o contradicie, teorema fiind astfel complet demonstrat. Se pune totui ntrebarea: ce se ntmpl cu lim x(t ) atunci cnd este introdus legea de
t

comand optimal (5.64) ? Referitor la aceast ntrebare s considerm: Exemplul 5.5. Fie sistemul & x = x+u cu x, u i criteriul cu timp final infinit: J = u 2 dt
0

Se constat direct c P = 0 i deci u () = 0 este comanda optimal x0 . Valoarea optim a lui J este V ( x0 ) = 0 . Traiectoriile optimale sunt atunci de forma: x(t ) = e t x0 rezultnd lim x(t ) = . Aadar, cu toate c valoarea optim a criteriului este finit,
t

traiectoriile optimale tind la infinit. Exemplul de mai sus ne face s formulm mai precis ntrebarea de mai sus: n ce condiii legea de comand optimal (5.68) este i stabilizatoare ? Rspunsul este dat de:
Teorema 5.7. Dac perechea ( A, B) este stabilizabil, iar perechea ( Q , A) este detectabil, legea de comand optimal (5.68) este stabilizatoare. Demonstraie. Conform teoremei de stabilizabilitate (vezi Teorema 5.5), matricea P este bine definit. Aceast matrice (vezi de asemenea Teorema 5.5) satisface EMAR (5.63). Scriem (5.58) n forma: ( A B R 1 B T P ) T P + P ( A B R 1 B T P ) = Q P B R 1 B T P (5.81)

Introducnd matricea de reacie optimal F = R 1 B T P , (5.81) se rescrie ca o ecuaie Liapunov: ( A + B F ) T P + P ( A + B F ) = Q F T R F

(5.82) (5.83)

Perechea ( Q , A) fiind detectabil, rezult (exerciiu pentru cititor) c i perechea

( Q + F T R F , A + B F ) este detectabil. Atunci, cum P 0 , din teorema lui Liapunov (vezi (5.83)), rezult c matricea A + B F este stabil, adic matricea de reacie optimal (5.82) este stabilizatoare. Introducem acum Definiia 5.3. O soluie simetric P a EMAR se numete stabilizatoare dac F = R 1 B T P (5.84) definete o lege de comand (5.46) stabilizatoare. Direct din Teorema 5.7 avem: Corolarul 5.2. n condiiile Teoremei 5.7, o soluie simetric P a EMAR este stabilizatoare dac i numai dac este pozitiv semidefinit. ntr-adevr, aceasta rezult imediat din interpretarea unei ecuaii Liapunov de tipul (5.83) (lsm detaliile ca exerciiu cititorului).
5-12

Avem acum imediat,


Teorema 5.8. n condiiile Teoremei 5.7, soluia P a EMAR introdus prin Teorema 5.5 este unica soluie pozitiv semidefinit. Demonstraie. S presupunem c n afar de P , EMAR mai are o soluie P 0 . Atunci, conform Teoremei 5.7 i Corolarului 5.2, aceste dou soluii sunt soluii stabilizatoare. Utiliznd aceast constatare, un calcul elementar ne conduce la ecuaia Liapunov:

( A + B F )T ( P P) + ( P P)( A + B F ) = 0

(5.85)

Cum A + B F i A + B F sunt stabile, din (5.85) rezult c P P = 0 , adic P = P i teorema este complet demonstrat. Aadar, dac perechea ( A, B) este stabilizabil, iar perechea ( Q , A) este detectabil, localizarea matricei P n clasa soluiilor EMAR este perfect determinat, aceasta fiind unica soluie pozitiv semidefinit a EMAR. n plus, legea de comand este stabilizatoare. n consecin, cu ipotezele de mai sus, calculul soluiei PLP cu timp final infinit se reduce la calculul soluiei pozitiv semidefinite a EMAR. Exemplul 5.6. Fie sistemul & x = x+u cu x, u i criteriul cu timp final infinit: J = ( x 2 + u 2 ) dt
0

Observm mai nti c perechea ( A, B) = (1, 1) este stabilizabil, iar perechea ( Q , A) = (1, 1) este detectabil. Atunci, P este soluia pozitiv a ecuaiei algebrice P 2 2P 1 = 0 care este P = 1+ 2 . Rezult c soluia problemei este u = (1 + 2 ) x . Constatm de asemenea c A B R 1 B T P = 2 i deci traiectoriile optimale sunt de forma x(t ) = e fiind stabile.
2 t

x0

5-13

S-ar putea să vă placă și