Sunteți pe pagina 1din 12

L13. Probleme variaționale.

Probleme de control optimal

1. Metode variaționale clasice


1.1. Algoritmul Euler-Lagrange

Probleme cu condiții terminale fixate


Metodele clasice de rezolvare a problemelor de optimizare au la bază algoritmul Euler –
Lagrange pentru problemele variaţionale. În cazul problemelor cu restricţii aplicarea este, în
general, dificilă și de aceea se preferă metodele ce au la bază principiul minimului şi principiul
optimalităţii - metode strâns legate de rezultatele obţinute în cadrul calculului variaţional, fiind o
extindere a acestora.
Formularea unei probleme variaționale cu condiții terminale fixate este următoarea:

Se cere determinarea funcţiei x(t) care extremizează integrala


tf
dx
I  L( x (t ), x (t ), t )dt , x 
dt
, (1)
t0

0 f
cu t0, tf , x(t0) = x , x(tf) = x fixate, (2)
unde L are derivate de ordinul al doilea continue în raport cu toate argumentele, iar x(t ) este
continuă în intervalul [t0 , t f ] .
Condiția necesară de extrem este
L( x , x , t ) d L( x , x , t )
  0, (3)
x dt x
care se mai poate scrie sub forma
 2 L(.)  2 L(.)  2 L(.) L(.)

x (t )  x (t )   0 . (4)
x x x x x t x
Sistemul de ecuații diferențiale de ordinul 2 dat de (4) permite, ținînd cont de condițiile
de capăt (2), determinarea soluției extremale.
Observații:
 Integrarea ecuației (4) nu se poate face în cazul general;
 Soluționare analitică e posibilă doar când lipsește unul din argumentele funcției L sau
pentru forme particulare ale funcției L, după cum se va vedea mai jos:

a) Presupunem L  L( x , t )
L( x , x , t )
Deoarece  0 , din (4) se obține
x
L( x , t )
 c  const. (5)
x
Dacă ecuația anterioară se poate soluţiona în raport cu x , astfel încât x  g (t , c ) atunci
t
x (t )   g ( , c ) d  k , (6)
0
unde k este un vector constant arbitrar, care, împreună cu c, se determină din condiţiile impuse la
capetele intervalului.
Dacă în plus L  L( x ) , atunci rezultă x  g (c )  k  const. , deci x(t) este o funcţie liniară.

b) Presupunem L  L( x , x ) . Ecuația (4) se poate scrie


d  L  d L L L L L  L d L 
 x   L   x  x   x  
x   x   0 (7)
dt  x  dt x x t x x  x dt x 

L( x, x )
 x (t )  L( x , x )  c, c  const. (8)
x
Se observă din (8) că am ajuns la un sistem de ecuații diferențiale de ordinul I, mai ușor de
rezolvat analitic.

Exercițiul 1. Problema celei mai scurte curbe plane: să se determine curba de lungime
minimă care uneşte două puncte din plan A(x0, y0), B(x1, y1).
În acest caz trebuie minimizată integrala care exprimă lungimea unei curbe plane:
x1
I=  1  (dy / dx) 2 dx .
x0

Condiția necesară de extrem:


L( y, y , x) d L( y , y , x)
  0, (e1)
y dx y

unde
L( y , y , x )  L( y )  1  ( dy / dx ) 2 . (e2)

Deoarece L( y, y , x)  L( y ) , condiția necesară de extrem devine


L( y )
 c  const. ,
y
adică
y c
 c  y    y  k  y ( x)  kx  b . (e3)
1  y 2 1  c2

Evident, soluţionarea problemei a condus la ecuația unei drepte. Constantele k și b


se determină impunând condiția ca segmentul de dreaptă să treacă prin punctele A şi B.

Exercițiul 2. Problema brahistocronei: să se unească printr-o curbă y(x) punctele A(x0, y0)
şi B(x1, y1) situate într-un plan vertical xOy, dar nu pe aceeaşi verticală (adică x0  x1 ),
cu y0 > y1. Curba trebuie astfel aleasă încât un punct material să se deplaseze în timp
minim din A în B prin alunecare în lungul acestei curbe, sub acţiunea forţei de gravitaţie
(pentru simplificare, se poate neglija frecarea).

Dacă viteza iniţială este v0, atunci se poate scrie


v 2  v02  2 g ( y  y0 ),
unde s-a notat cu v viteza instantanee la un moment dat. Dacă se introduce constanta α
prin relaţia 2 g  2 gy0  v02 , atunci relaţia de mai sus se scrie
v2  2g ( y   ) sau v  2 g ( y   ).

Viteza fiind derivata spaţiului s, timpul de transfer dintre poziţia iniţială şi cea finală
se poate scrie
s1 2
ds 1 x1 1  (dy / dx )
T   dx.
s0 v 2 g x0 y 

Problema se formulează astfel: să se determine curba y(x) care satisface condiţiile


terminale y(x0) = y0, y(x1) = y1, astfel încât să se minimizeze funcţionala
x1
1  ( dy / dx) 2
I  dx. (e1)
x0 y 

Să observăm că, în forma finală, funcţionala I diferă de expresia T printr-o constantă


multiplicativă. Aceasta nu a mai fost luată în considerare deoarece constantele
multiplicative sau aditive nu au importanţă în rezolvarea unei probleme de extremizare a
unei funcţii sau funcţionale.

Rezolvarea problemei o vom face în cazul în care punctul iniţial este originea
( x0  0, y0  0 ), iar viteza iniţială este nulă (v0  0) ; cu aceasta, constanta  = 0 şi rezultă
că trebuie minimizată funcţionala
x1
1  ( dy / dx) 2
I  dx. (e2)
x0 y

Condiția necesară de extrem:


L( y, y , x) d L( y , y , x)
 0
y dx y , (e3)
unde
1   dy / dx 
2
L( y, y , x)  L( y, y )  , (e4)
y

Deoarece L( y , y , x )  L( y , y ) putem scrie:


L( y, y )
y ( x )  L ( y , y )  c
y (e5)
şi, având în vedere (e4), se obţine

1   dy / dx 
2
y 2 ydy 1
  c sau dx  , k .
y 1   dy / dx 
2 y k y2 c

Notăm y  k 2 sin 2  , de unde dx  2k 2 sin 2 d  şi deci

k2 k2
x (2  sin 2), y  (1  cos 2),
2 2
care reprezintă ecuaţiile parametrice pentru o familie de cicloide. Constanta k se
determină din condiţia ca cicloida să treacă prin punctul ( x1 , y1 ) (reamintim că punctul
( x0 , y0 ) a fost fixat).
Probleme cu tf liber și x(tf ) liber pe o curbă dată
0
Se cere determinarea funcţiei x(t) care extremizează integrala (1) cu t0, tf , x(t0) = x fixați
și x(tf) = g(tf).
*
Funcția extremală x (t) trebuie să satisfacă:
L( x , x , t ) d L( x , x , t )
  0,
x dt x
(9)
L( x , x , t )  dg dx 
    L( x (t f ), x (t f ), t f )  0.
x  dt dt  t t f

A doua relație din (9) se numește condiție de transversalitate.


Dacă tf este fixat condiția (9) se reduce la

L( x , x , t )
0 (10)
x t t f

Observație: condiții similare cu (9) și (10) apar și în raport cu capătul inițial (dacă t0 și
0
x(t0) = x nu sunt fixați).

1.2. Probleme cu restricții

Restricții de tip funcție


Se cere determinarea funcţiei x(t) care extremizează integrala (1) cu t0, tf, x(t0) și x(tf )
fixați și
h(t , x (t ))  0, h   p , p  n . (11)
Pentru rezolvarea unei astfel de probleme se construieşte funcţia sintetică:
F ( x , x ,  , t )  L( x , x , t )  λT (t )h( x , t ) . (12)
Condiția necesară Euler-Lagrange se scrie sub forma:
F d F
 0 (13)
x* dt x *

Observații:
• Ecuaţia (13) este de aceeaşi formă cu (4), scrisă însă pentru F;
• Ecuaţia Euler – Lagrange a funcţiei F în raport cu variabila  conduce la legăturile (11).

Exercițiul 3. Problema geodezicelor: să se determine arcul situat pe suprafața


h( x1 , x2 , x3 )  0 astfel încât distanța dintre două puncte de pe această suprafață să fie
tf
minimă; distanța se poate calcula cu: I   x12  x22  x32 dt .
t0
Se construiește funcţia sintetică

F  L  h  x12  x22  x32  h( x1 , x2 , x3 ) (e1)

şi condiţia
F d F
 0
x dt x
se scrie
h d  xi 
   , i  1, 2,3 (e2)
xi dt  L 
sau, eliminând  ,
d  x1  d  x2  d  x3 
     
dt  L  dt  L  dt  L 
  . (e3)
h h h
x1 x2 x3
Să considerăm mai departe geodezicele pe o sferă (cu centrul în origine şi de rază r).
În acest caz
h ( x1 , x2 , x3 )  x12  x22  x32  r 2  0 .
Atunci (e3) conduce la
Lx1  x1L Lx2  x2 L Lx3  x3 L
2
 2
 ,
x1 L x2 L x3 L2

x2 
x1  x1x2 x3  x3 L
x2  x2 
de unde   .
x2 x1  x1 x2 x3 x2  x2 x3 L
Din prima egalitate se obţine
d d
( x2 x1  x1 x2 ) ( x3 x2  x2 x3 )
dt  dt
x2 x1  x1 x2 x3 x2  x2 x3

dy
şi, prin integrare directă, deoarece  y
 ln y  c , se obţine

x2 x1  x1 x2  a ( x3 x2  x2 x3 ), a  const.


Relaţia se mai scrie
x1  ax3 x2

x1  ax3 x2
şi, după o nouă integrare, rezultă
x1  bx2  ax3  0, b  const. ,
care reprezintă ecuaţia unui plan ce trece prin centrul sferei; intersecţia acestui plan
(conţinând cele două puncte terminale) cu sfera determină un arc de cerc, care precizează
complet soluţia.

Restricții izoperimetrice
Se cere determinarea funcţiei x(t) care extremizează integrala (1) cu t0, tf, x(t0) și x(tf )
fixați și
tf

 f ( x (t ), x (t ), t ) dt  k , k   p , f   p . (14)
t0

Problema poate fi redusă la cea cu legături de tip funcţie prin introducerea variabilei p-
dimensionale:
t
x0 (t )   f ( x, x , t )dt , x0 (t )   p  x 0 (t )  f ( x, x , t ) . (15)
t0

Se construiește funcția sintetică:


F ( x , x , λ, t )  L( x, x , t )  λT [ f ( x, x , t )  x 0 (t )] . (16)
Dacă x0(t) satisface (16), atunci F = L.
Ecuaţia Euler – Lagrange pentru funcţia sintetică F în raport cu variabila x:
F d F L f d  L f 
   T λ   λ  0 . (17)
x dt x x x dt  x x T 
Ecuaţia Euler – Lagrange pentru funcţia sintetică F în raport cu variabila x0 este
d
λ(t )  0  λ(t )  const. (18)
dt
Ecuaţia Euler – Lagrange în raport cu variabila x0 oferă doar relația(18), deci se poate
renunţa la x0 din expresia lui F, obţinând astfel o altă funcţie sintetică

H ( x , x , λ, t )  L( x, x , t )  λT f ( x , x , t ) . (19)

Observații:
• Condiția necesară de extrem (17) se poate exprima în raport cu funcția sintetică a lui
Hamilton (hamiltonianul) (19);
• Valorile multiplicatorilor  se precizează în funcție de valorile k din (14).

Exercițiul 4. Problema izoperimetrică propriu-zisă: să se determine curba plană y(x) de


x1
lungime dată k astfel încât aria delimitată I   y ( x)dx să fie maximă, punctele terminale
x0

( x0 , y0 ) şi ( x1 , y1 ) ale curbei fiind fixate. Se cere de fapt extremizarea funcţionalei I cu


condiţia ca
x1

 1  y 2 dx  k . (e1)
x0
Formăm funcţia sintetică

H  L( y , y , x)  f ( y, y , x )  y   1  y 2 ,

pentru care se aplică condiţia Euler – Lagrange. Deoarece variabila independentă x nu


apare explicit în expresia lui H, se poate folosi, în mod echivalent, o condiţie de forma:
H ( y, y )
H  y  c1
y

sau

y 2
y   1  y 2   c1 ,
1  y 2

de unde y  c1   .
1  y 2

Notăm y  tg ,   / 2     / 2 şi deci

y  c1   cos  . (e2)

dy dy  sin 
Dar y  şi deci dx   d    cos d  şi prin integrare,
dx y tg 

x  c2   sin . (e3)
Din (e2) şi (e3), prin ridicare la pătrat şi adunare, se găseşte
( x  c2 ) 2  ( y  c1 ) 2   2 , (e4)
care este o familie de cercuri cu centrul în (c2 , c1 ) şi rază  .
Constantele c1 , c2 şi  se determină din condiţiile:
x1
y ( x0 )  y0 , y ( x1 )  y1 şi  1  y 2 dx  k .
x0

2. Probleme de control optimal

2.1. Probleme de control optimal cu condiții terminale fixate


Se consideră sistemul:
x (t )  f ( x (t ), u(t ), t ), x   n , u   m , t  [t0 , t f ]   . (20)
*
Se cere determinarea comenzii optimale u (t) care minimizează indicele de performanță
tf
I  L( x(t ), u(t ), t )dt , (21)
t0

cu t0, tf, x(t0) și x(tf ) fixați.


Problema se poate reformula ca o cerinţă de minimizare a funcţionalei (21) cu restricția
suplimentară (20) impusă de sistem:
h( x , x , u, t )  x  f ( x , u, t )  0 (22)
Pentru a rezolva problema cu restricții de tip funcție se formează funcţia sintetică:
F ( x , x , λ, u, t )  L( x , u, t )  λT (t )[ f ( x, u, t )  x ], λ   n . (23)
Se introduce hamiltonianul:
H ( x , u, λ, t )  L( x , u, t )  λT f ( x , u, t ) . (24)
Din (23) și (24) se obține:
F ( x , x , u, λ, t )  H ( x , u, λ, t )  λT (t ) x (t ) . (25)
Ecuaţiile E–L pentru funcţia sintetică F în raport cu u, x şi λ sunt:
F d F H
 0 * 0 (26)

u dt u u

F d F H
  0  *   λ* (t ) (27)
x dt x x

F d F H
  0  *  x * (t ) (28)

λ dt λ λ
Ecuația (26) este condiția necesară de extrem iar (27) și (28) se numesc ecuațiile canonice
ale lui Hamilton.

Observație. Pe traiectoria extremală avem:


dH H
 (29)
dt t
Într-adevăr, deoarece
dH H H H H
 T x  T u  T λ 
dt x u λ t
și ținând cont de (26)-(28) , obținem(29).
dH
Pentru problemele invariante  0 , deci funcția H este constantă pe traiectoria
dt
extremală

Exercițiul 5. Fie sistemul x (t )  u (t ), x   cu condiţiile iniţiale x(0) și finale x(T) fixate.


Se cere să se determine comanda optimală care minimizează funcţionala
T
I   ( x 2  u 2 ) dt .
0

Se construiește hamiltonianul

H  x 2  u 2   u.
Condiția necesară de extrem și ecuațiile canonice ale lui Hamilton conduc la
H
 0  2u    0 , (e1)
u

H
   2 x   , (e2)
x

H
 x  x  u , - ecuația sistemului (e3)


Exprimând u din (e1) funcție de , introducând în (e3) și folosind (e2) se obține


ecuația diferențială de ordin 2 cu coeficienți constanți:


x (t )  x(t )  0 ,
care are soluția
x* (t )  c1et  c2 et ,
de unde, ținând cont de (e3), obținem comanda optimală

u* (t )  c1et  c2 e t .

Constantele c1 și c2 se obțin din condițiile de capăt care sunt fixate.

2.2. Probleme de control optimal cu condiții terminale libere


*
Se cere determinarea comenzii optimale u (t) care transferă sistemul (20) din condițiile
inițiale x(t0) fixate într-o stare finală x(tf ) liberă în  n , cu tf > t0 liber, a.î. să se minimizeze
criteriul de calitate:
tf

 L( x(t ), u(t ), t )dt


f
I  M (t f , x )  (30)
t0

Condițiile necesare de extreme sunt date de ecuațiile lui Hamilton (26)-(28).În plus apar
condițiile de transversalitate în raport cu momentul final (31) și cu starea finală (32):
tf
I  M (t f , x f )   L( x(t ), u(t ), t )dt (31)
t0

M (t f , x f )
 H ( x* (t f ), u* (t f ), λ* (t f ), t f )  0 (32)
t f

Exercițiul 6. Se consideră sistemul: x  u cu x(0) =1 şi se cere u(t) astfel ca x(tf ) = 0,


unde tf este liber. Se cere minimizarea indicelui de performanță:
tf
1
I  t f    u 2 dt , ,   const.
2 0

Acest criteriu combină problema timpului minim şi a energiei minime. În această



problemă avem M (t f , x f )  M (t f )  t f , L  u 2 , iar hamiltonianul este
2
1
H  u 2  u.
2
Din condiţiile de extrem se deduce
H 
0u  ,
u 
H
     0     (t f )  const.
x
Condiţia de transversalitate în raport cu momentul final este
M 1  2
 H (t f )  0  t 
f  u (t f )   (t f )u (t f )  0
t f 2

 2 (t f )
şi deci t 
f
1
 ,
2
de unde se poate exprima t f în funcţie de (t f ) .
Ecuaţia sistemului se scrie: x   /  şi admite soluţia

x(t )  (t f )t /   1.

Deoarece x(t f )  0 , rezultă t f   / (t f ) .


Pentru   1,   1 , se obţine  (t f )  2 şi t f  1/ 2 . Cu aceasta,

x* (t )  1  t 2 şi u* (t )  (t )  (t f )   2 .

Exercițiul 7. Fie sistemul


 x1 (t )   x2 (t )  2u1 (t )

 x2 (t )   x3 (t )  u1 (t )u2 (t ) , (e1)
 x (t )  2 x (t ) x (t )  x (t )  u (t )
 3 1 3 2 2

cu t0 , xi (t0 ), i  1,3 fixate. Se cere să se scrie condițiile necesare de extrem, ecuațiile


canonice ale lui Hamilton și condițiile de transversalitate necesare pentru determinarea
 u (t ) 
comenzii optimale u (t )   1  care minimizează funcţionala
u2 (t ) 
tf
 t f x12 (t f   x1 (t )  3x2 (t )  x32 (t )  2u12 (t )  u2 2 (t )  dt .
2 2 2
I )  x2 (t f )  (e2)
0

Se construiește hamiltonianul:

H  x12  3 x2 2  x32  2u12  u2 2  1 (  x2  2u1 )  2 ( x3  u1u2 )  3 (2 x1 x3  x2  u2 ) .(e3)


Condiția necesară de extrem și ecuațiile canonice ale lui Hamilton conduc la:
H  4u1  21   2u2  0
 0, i  1, 2   , (e4)
ui  2u2   2u1   3  0

2 x1  2 3 x3   1
H 
  j , j  1,3  6 x2  1  3   2 , (e5)
x j  
2 x3   2  2 x1 3   3

H
 x j , j  1,3  (e1).
 j

Condiția de transversalitate în raport cu starea finală (liberă) este:

2t f x1 (t f )  1 (t f )
M 2 2 
  j (t f ), j  1,3, unde M  t f x1 (t f )  x2 (t f )  2 x2 (t f )   2 (t f ) , (e6)
x j (t f ) 
0   3 (t f )

Condiția de transversalitate în raport cu momentul final (de asemenea liber) este:

M
 H tt  0  x12 (t f )  x12 (t f )  3x22 (t f )  3 (t f )[2x1(t f )x3 (t f )  x2 (t f )  u2 (t f )]  0 (e7)
t f f
2.3. Observaţii privind condiţiile terminale în problemele de optimizare
 În problemele cu condiţii terminale fixate nu apar condiţii de transversalitate;
0 f
 În problemele cu momente terminale t0 şi tf libere şi stări terminale x şi x fixate apar
condiţii de transversalitate referitoare la aceste momente (relaţia (32) şi similara acesteia pentru
t0);
0 f
 În problemele cu momente terminale t0 şi tf fixate şi stări terminale x şi x libere apar
0
condiţii de transversalitate referitoare la aceste stări (relaţia (31) şi similara acesteia pentru x );
 În problemele cu momente şi stări terminale libere apar ambele tipuri de condiţii de
transversalitate (31) și (32);
 La capătul unde starea x(t) este liberă, costarea (t) este fixată, iar la capătul unde
starea x(t) este fixată, costarea (t) este liberă. Această situaţie poate să apară doar în legătură cu
anumite variabile de stare, fără să se extindă asupra întregului vector de stare x(t);
 Specific în astfel de probleme este faptul că unele variabile se pot fixa la ambele
capete ale traiectoriei şi atunci se spune că avem o problemă bilocală în raport cu aceste
variabile iar alte variabile nu se fixează la nici un capăt, ceea ce determină fixarea
multiplicatorilor la capete şi avem o problemă bilocală în raport cu aceşti multiplicatori.

2.4. Condiţii necesare şi suficiente de extrem


Satisfacerea ecuaţiilor Euler – Lagrange nu asigură în mod obligatoriu extremizarea
funcţionalei. Există posibilitatea ca ecuaţiile şi condiţiile de transversalitate să nu admită nicio
soluţie, să admită o soluţie sau mai multe soluţii în mulţimea comenzilor admisibile. Evident, nu
orice soluţie a acestor ecuaţii determină o traiectorie extremală. Din mulţimea traiectoriilor
extremale trebuie aleasă cea optimă, care asigură minimul global.

În general problema existenţei şi unicităţii extremalei este dificilă. Uneori, considerente


fizice conduc la concluzia că problema admite o singură extremală şi că aceasta reprezintă
traiectoria optimă căutată.

Condiţiile suficiente de extrem se referă la extreme locale, deci nu garantează că extremul


obţinut este absolut dar, cunoscând toate extremele de pe mulţimea traiectoriilor admise,
separarea extremului absolut nu prezintă dificultăţi deosebite.
Calculul variaţional clasic oferă o serie de condiţii necesare de extrem, toate acestea la un
loc formând condiţia suficientă de extrem:
a) Condiţii Euler – Lagrange

b) Condiţii de transversalitate

c) Condiţia Legendre
 pentru probleme variaţionale cu condiţii de capăt fixate :
 2L 2L 
  
2  x1x1 x1xn 
 L
    0 (33)
x x T  2 
  L 2L 
 x x  x x 
 n 1 n n

 pentru probleme de conducere optimală de tip Bolza cu condiţii iniţiale fixate:


*
 H 
(i )   0
 u 

*
 2H 
(ii )  2   0
 u 

 2H 2H 
 2 
 x ux 
(iii ) 0 (34)
 2H 2H 
 
 xu u2 

2H 2M
(iv)  0, 0
x 2 x 2f

d) Condiţia suficientă Jacobi-Legendre


e) Condiţia Weierstrass
f) Condiţia Erdman-Weierstrass

Observații:
• Condiţiile de extrem (a)...(f) sunt toate condiţii necesare. Ansamblul acestor condiţii
oferă condiţia suficientă de extrem
• În anumite probleme nu trebuie considerate toate condiţiile (a...f) pentru a verifica
suficienţa
• Pentru verificarea suficienţei trebuie utilizate toate cele şase condiţii de extrem
numai în cazul folosirii formelor mai puţin restrictive ale acestora
• Se pot folosi în afară de (a) doar condiţiile Jacobi şi Legendre, dacă aceasta din urmă
este verificată strict
• În problemele de conducere optimală se poate apela doar la condiţia Legendre
extinsă sub forma relaţiilor (34)

S-ar putea să vă placă și