Documente Academic
Documente Profesional
Documente Cultură
LEFTER, CATALIN-GEORGE
Calculul variatiilor si controlul ecuatiilor diferentiale /
Cat
alin-George Lefter. - Iasi : Editura Alexandru Myller, 2006
Bibliogr.
Index.
ISBN (10) 973-86987-4-X ; ISBN (13) 978-973-86987-4-X
517.9
Referent stiintific
Prof. Univ. Dr. Gheorghe Anicul
aesei
Facultatea de Matematica
Universitatea Alexandru Ioan Cuza Iasi
c
Toate
drepturile asupra acestei edit
ii apart
in autorului
si Editurii Alexandru Myller
Cuprins
Introducere
Partea 1.
1
Calculul variatiilor
11
11
16
18
26
29
29
33
Partea 2.
39
35
41
41
46
48
50
53
56
59
59
61
73
73
76
79
79
81
6.3.
6.4.
6.5.
6.6.
Index
Bibliograe
83
85
88
90
99
101
Introducere
Scopul acestei carti este de a prezenta, ntr-un volum restr
ans, problematica si ideile fundamentale din dou
a ramuri ale matematicii: Calculul
variatiilor si Teoria controlului. Teoria controlului, dezvoltat
a ncep
and cu
a o continuare modern
a a Calculului variatiilor, fata de
anii 50, reprezint
care si diversic
a mult problematica, ns
a cu care pastreaza n comun un
aspect deosebit de important care este structura hamiltonian
a subiacent
a.
Acest capitol introductiv face o trecere n revista a principalelor notiuni
si rezultate considerate n lucrare. Pentru nceput, mention
am urm
atoarea
conventie de notatie: daca M este o varietate diferentiabil
a si q : IR M
d
este neteda, atunci q = q(t) Tq(t) M , unde Tq(t) M este spatiul tangent
dt
la M n q(t). In cazul n care varietatea diferentiabil
a M = IRn , derivata
d
a cu y = y(t) IRn .
unei functii netede y : IR IRn va notat
dt
Calculul variatiilor. Fie M o varietate diferentiabil
a ndimensional
a,
M0 , M1 M subvarietati ale lui M , T M este bratul tangent al lui M ,
L : IR T M IR o functie pe care o numim lagrangean. Problema de
a si de clasa C 1 pe
calculul variatiilor este de a gasi o curb
a q , continu
portiuni, care rezolv
a problema de minim
t1
L(t, q(t), q(t))dt,
(0.1)
inf J(q), J(q) =
qC
t0
J(q )h :=
d
J(q + sh)|s=0 = 0.
ds
2(t, h, h)dt,
J(q)h := 2 J(q + sh)|s=0 =
ds
t0
= 1 Lqq (t, q , q )h2 + 2Lqq (t, q , q )hh + Lqq (t, q , q )h 2 .
unde (t, h, h)
2
Conditia necesara de ordinul al doilea pentru ca q sa realizeze inmul
este ca a doua variatie sa e pozitiv
a: 2 J(q ) 0. Vom ajunge astfel
la notiunea de punct conjugat. Acesta este un punct t (t0 , t1 ] pentru care
a doua ecuatie a lui Euler (ecuatia Euler-Lagrange asociata lagrangeanului
are o solutie nenul
(t, h, h))
a cu h(t0 ) = h(t) = 0. Conditia necesara a lui
a n intervalul
Jacobi ne spune c
a dac
a q realizeaza inmul, atunci nu exist
a
(t0 , t1 ) puncte conjugate cu t0 n raport cu extremala q . Conditia sucient
de minim local slab este urmatoarea: dac
a intervalul nchis [t0 , t1 ] nu contine
puncte conjugate cu t0 , atunci extremala q este un minim local n raport
cu topologia C 1 . Tot n 1.3 vom extinde toate notiunile introduse la cazul
n-dimensional.
In 1.4 prezentam teorema lui Noether, care ne da un mod de constructie
a integralelor prime pentru ecuatiile Euler-Lagrange atunci c
and lagrangeanul este invariant la un grup de difeomorsme. Aceast
a teorema este deosebit de utila ntruc
at majoritatea legilor de conservare pentru sistemele
mecanice se obtin drept consecinte ale acestui rezultat (v.[3]).
Capitolul 2 studiaz
a formalismul canonic hamiltonian. Ecuatiile EulerLagrange se transform
a dintr-un sistem de ordinul al doilea pe bratul tangent T M ntr-un sistem de ordinul nt
ai pe bratul cotangent T M , care are
o structur
a natural
a de varietate simplectica. Acesta este sistemul hamiltonian. Aceasta transformare permite studiul si integrarea unor sisteme
din mecanic
a care nu admit alte abord
ari. De asemenea, punctul de vedere
hamiltonian este util n studiul asimptotic care se face n teoria perturbatiilor
si permite o ntelegere mai profund
a a propriet
atilor calitative ale sistemelor
mecanice complicate care apar, de exemplu, n mecanica cereasc
a, mecanica
statistic
a, mecanica cuantica etc. (v.[3],[17]).
p = Lq (t, q, q).
2
H(t, q, p) = (p, q)
L(t, q, q).
(t, q, p)
q =
p
(0.6)
p =
(t, q, p)
q
Acestea sunt ecuatiile lui Hamilton sau sistemul hamiltonian. Solutiile acestui sistem sunt extremalele corespunzatoare lagrangeanului
(q, p), (q,
L(t,
p))
= (p, q)
H(t, q, p)
pe T M . Proiectiile pe M ale acestora sunt extremale pentru J. Consider
am
de asemenea forma Lax a sistemelor hamiltoniene:
(0.7)
d
F (q, p) = {H, F },
dt
H F
H F
reprezint
a paranteza Poisson a hamilp q
q p
tonienilor F = F (q, p), H = H(t, q, p). Considerarea celor dou
a puncte de
vedere pentru solutiile sistemelor hamiltoniene, si anume ca acestea sunt, pe
iar pe de alt
de o parte, extremale pentru lagrangeanul L,
a parte c
a hamiltonienii F (q, p) evolueaz
a de-a lungul curbelor integrale conform ecuatiei
(0.7), ne conduce la introducerea notiunii de transformare canonic
a (i.e.
care pastreaza structura simplectic
a si deci forma sistemului hamiltonian)
si a notiunii de functie generatoare pentru o transformare canonic
a.
In 2.2 calcul
am variatia totala a unei functionale de tipul (0.1), c
and
asate sa se miste liber pe subvarietati diferentiabile
capetele (ti , qi ) sunt l
ang
a ecuatiile Eulerdin spatiul (t, q). Obtinem pentru o extremala q , pe l
Lagrange, conditiile de transversalitate
unde {H, F } =
1
(pq Ht)|t=t
t=t0 = 0.
S
S
(t, q) + H(t, q,
)(t, q) = 0.
t
q
(0.11)
uU
u
temului hamiltonian cu hamiltonianul H si conditiile n capete y(0) = y0 ,
p(T ) = l(y(T )), iar
(0.12)
Demonstratia dat
a aici functioneaza n cazul problemei Bolza pentru sistemele liniare cu functionala de cost patratica. Notam cu Hmax (t, y, p) =
a acesta este regulat, atunci
max H u (t, y, p) hamiltonianul maximizat. Dac
uU
demonstr
am ca (y , p ) satisfac si sistemul hamiltonian cu hamiltonianul
arii adjuncte p
Hmax , iar controlul optimal u se exprima cu ajutorul st
folosind proprietatea de maxim (0.12).
In 3.3 problema de control optimal este nglobat
a ntr-o familie de probleme de control optimal pentru care variem data initiala (t0 , y0 ). Functia
valoare obtinut
a veric
a o ecuatie cu derivate partiale de ordinul nt
ai.
5
P (T ) = P0 ,
a iar controlul
care n conditii de pozitivitate pentru Q, R, P0 , are solutie unic
optimal se exprim
a n form
a feedback cu ajutorul lui P :
u (t) = R1 B P (t)y.
Paragraful 3.5 studiaz
a stabilizarea cu control feedback liniar a sistemelor liniare. Rezultatul central este ca controlabilitatea sistemului este
echivalenta cu proprietatea de completa stabilizare a sistemului (i.e. pentru
orice < 0 se poate alege feedbackul astfel nc
at sistemul liniar cu bucla
nchisa obtinut are toate valorile proprii cu partea real
a mai mica decat
, deci sistemul se poate stabiliza cu orice descrestere exponentiala). De
asemenea, problema stabilizarii este legata de o problem
a de control optimal cu functionala de cost patratica cu orizont innit. Aceasta conduce la
ecuatia Riccati algebrica:
SA + A S SBR1 B S + Q = 0.
a, ne furnizeaz
a un control
Solutia minimal
a S a acestei ecuatii, cand exist
Partea 1
Calculul variatiilor
CAPITOLUL 1
(1.1)
J(q) =
t0
d
Am notat cu q = q = q. L se numeste lagrangeanul problemei. Conditiile
dt
asupra lagrangeanului L vor precizate ulterior.
Ne propunem s
a determin
am conditii necesare de extrem si conditii suciente pentru ca o curb
a q = q(t) sa e extrem local ntr-o anumit
a topologie.
Metodele folosite pentru a obtine aceste conditii au la baz
a metodele din
analiza functiilor reale de varibil
a reala, ns
a se identic
a cu acestea numai
ntr-o prim
a etap
a, ulterior c
ap
atand aspecte specice.
Amintim n continuare c
ateva rezultate elementare privind caracterizarea punctelor de extrem pentru o functie de variabil
a real
a. Fie f : [a, b]
IR.
Conditii necesare de extrem. Daca f este diferentiabil
a de clasa C 2 si x
[a, b] este punct de minim pentru f , atunci:
Daca x (a, b) atunci f (x ) = 0, f (x ) 0.
Daca x = a (respectiv x = b) atunci f (x ) 0 (respectiv f (x ) 0).
Conditii suficiente de extrem (local). Daca f este diferentiabil
a, de clasa C 2 ,
atunci
Daca x (a, b) si f (x ) = 0, f (x ) > 0 atunci x este un punct de
minim local strict.
Daca x = a (respectiv x = b) si f (x ) > 0 (respectiv f (x ) < 0)
atunci x este un punct de minim local strict.
Conditii suficiente de extrem global. Daca f este inferior semicontinu
a si
marginit
a inferior, atunci exist
a x [a, b] punct de minim pentru f .
Conditii suficiente de unicitate a punctului de minim. Daca f este strict
convex
a, atunci f are cel mult un punct de minim n intervalul [a, b].
11
xK
d
J(u + v)|=0 .
d
d2
J(u + v)|=0 .
d2
J si atinge infimul pe K.
Inainte de a aplica rezultatele mentionate pentru functionalele de tipul
(1.1), prezent
am cateva exemple care sa motiveze studiul acestor probleme.
Exemplul 1.1.1. Suprafata minima de rotatie.
Se pune problema
determin
arii unei curbe q : [t0 , t1 ] IR+ , q(t0 ) = q0 , q(t1 ) = q1 pentru care
aria suprafetei de rotatie este minima. Se stie ca aria suprafetei de rotatie
este data de formula
t1
q(t) 1 + q(t)
2 dt.
J(q) = 2
t0
12
= 1 + y 2 x,
v=
dt
d
y. Obtinem
unde y =
dx
1 + y 2
dx,
dt =
2gy
deci functionala pe care trebuie sa o minimizam este
x1
1 + y 2 (x)
dx.
J(y) =
2gy(x)
x0
1 + y 2
Lagrangeanul pentru problema brahistocronei este L(x, y, y ) =
2gy
iar multimea de denitie este multimea curbelor denite pe [x0 , x1 ], continue
si de clasa C 1 pe portiuni, cu capetele xate n y0 , y1 .
Exemplul 1.1.3. Mecanica lagrangeana este ramura mecanicii ce studiaz
a miscarea unui sistem mecanic cu ajutorul spatiului conguratiilor.
Spatiul conguratiilor are o structur
a de varietate diferentiabil
a pe care o
not
am cu M . Coordonatele locale pe M sunt coordonate generalizate ale
sistemului mecanic. Un sistem mecanic lagrangean este denit de o functie
diferentiabil
a L : IR T M IR numit
a lagrangean, unde T M este bratul
tangent al lui M . Traiectoriile sistemului mecanic, q : [t0 , t1 ] M , sunt
extremale (v. 1.2) pentru functionala
t1
L(t, q(t), q(t))dt.
J(q) =
t0
L(t, q, q)
= T (q)
U (t, q)
13
n
1
i=1
mi |ri |2
U (q).
ri
U (q).
ri
U (r) = F (r)
r.
r
Inmultind ecuatia vectorial cu cu r, obtinem ca d (
r r ) = 0, deci miscarea
dt
este plan
a. In planul miscarii introducem coordonatele plare (r, ) n care
2
2
|r | = r + r 2 2 . Asadar, lagrangeanul sistemului este
= m (r 2 + r 2 2 ) U (r).
L((r, ), (r,
))
2
mr =
|r |2
2
14
i,j=1
J() =
t0
2
n
i j
gij q q
.
L(q, q)
=
i,j=1
15
J(q + h) =
L(t, q + h, q + h)dt
=
d
d t0
t1
+ Lq (t, q + h, q + h)
hdt.
Lq (t, q + h, q + h)h
=
t0
L
L
, Lq =
. Deci, f
acand = 0, obtinem urm
atoarea
q
q
expresie pentru prima variatie:
t1
Lq (t, q, q)h
+ Lq (t, q, q)
hdt.
(1.3)
J(q)h =
Am notat cu Lq =
t0
2
and prin p
arti, obtinem:
care q este de clasa C atunci, integr
t1
d
[Lq (t, q , q ) Lq (t, q , q )]hdt
0 = J(q )h =
dt
t0
pentru orice h H. Rezulta ca
d
Lq (t, q , q ) Lq (t, q , q ) = 0.
dt
Aceasta este ecuatia Euler-Lagrange care este o ecuatie diferentiala, de
ordinul al doilea. De altfel, aceasta este ntotdeauna satisf
acut
a n sens
distributional.
Asadar, dac
a q realizeaza inmul lui J si este de clasa C 2 , atunci q
veric
a (1.4). Nu orice extremala realizeaza inmul. Vom reveni asupra
acestei chestiuni n 1.3.
and cu p(t) =
Daca q nu este decat de clasa C 1 pe portiuni atunci, not
t
Lq (s, q (s), q (s))ds si integr
and prin p
arti n (1.3), obtinem:
(1.4)
t0
(1.5)
0 = J(q )h =
t1
t0
r
Atunci, dac
a L C pentru un r 2, rezult
a c
a q C .
a cu conditia WeierstrassDemonstratie Ipoteza Lqq (t, q , ) > 0 mpreun
Erdmann (1.7) ne spune c
a n orice punct t (t0 , t1 ) are loc q (t 0) =
q (t + 0), deci q este de clasa C 1 si p C 1 (t0 , t1 ). De asemenea, conditia
am teorema functiilor implicite n (1.6)
Lqq (t, q , ) > 0 ne permite sa aplic
privit
a ca ecuatie n ultima variabil
a q . Cum p(t) este de clasa C 1 , rezulta
ca q este de clasa C 1 deci q C 2 . Pentru r > 2 rezultatul se obtine prin
inductie.
Observat
ia 1.2.1. Un lagrangean pentru care Lqq (t, q, ) > 0 se numeste
lagrangean regulat . Ecuatia Euler Lagrange este n acest caz o ecuatie
diferential
a de ordinul II, nedegenerat
a. Aceast
a nseamn
a, rezolv
and o
a pentru fiecare valorare
problem
a Cauchy, c
a din punctul initial (t0 , q0 ) pleac
ate o extremal
a unic
a.
a lui q(0)
= q0 c
Observat
ia 1.2.2. Pentru un lagrangean regulat ce nu depinde explicit
de t, L = L(q, q),
are loc pentru orice extremal
a q:
L(q , q ) q Lq (q , q ) = cst,
adic
a avem o integral
a prim
a pentru ecuatia Euler-Lagrange.
Intr-adev
ar, utiliz
and (1.4), avem c
a
d
d
(L(q , q ) q Lq (q , q )) = q (Lq (q , q ) Lq (q , q )) = 0.
dt
dt
Problema brahistocronei. Revenim la exemplul 1.1.2. Am v
azut ca lagrangeanul n problema
brahistocronei
este
(facem
abstract
ie
de
constanta
2
1+y
. Se veric
a usor ca acesta este lagrangean re1/ 2g): L(y, y ) =
y
gulat deci extremalele sunt netede n domeniul y > 0. Problema este deci
de a g
asi extremalele functionalei
x1
1 + y2
dx.
J(y) =
y
x0
17
F
ar
a a restrange generalitatea putem presupune c
a x0 = 0. Lagrangeanul
L nu depinde explicit de x, deci avem o integral
a prim
a: L + y Ly = cst,
2
in
and cont de directia de
de unde un simplu calcul ne d
a y(1 + y ) = cst. T
miscare a punctului obtinem ecuatia:
Cy
y =
,
y
cu o constant
a C > 0. Aceasta este o ecuatie cu variabile separabile care,
tin
and cont de faptul c
a y(0) = 0, are solutia
y
z
dz.
x=
C z
0
2(t, h, h)dt
=: Q(q )h,
J(q )h =
t0
Propozit
ia 1.3.2. Fie q(, s), s (0, s1 ), o familie de extremale ast q
q
(t, 0) =
fel nc
at q = q(, 0), q(t0 , s) = q0 s (0, s1 ), (t0 , 0)
= 0,
s
s
q
0 pentru un t (t0 , t1 ]. Atunci, not
(, 0), h este extremal
a
and cu h =
s
a verific
a ecuatia (numit
a si a doua ecuatie
pentru functionala Q(q )(), adic
a lui Euler)
d
(1.10)
h h = 0
dt
cu h(t0 ) = h(t),h
0.
Demonstratie Intruc
at q(, s) sunt extremale pentru L, care este lagrangean regulat, acestea veric
a ecuatia Euler-Lagrange (1.4). Deriv
am
ecuatia (1.4) n raport cu s pentru s = 0 si obtinem (pentru simplitate
omitem argumentul (t, q (t), q (t)) al lui L):
d
d
.
0 = Lqq h + Lqq h (Lqq
h + Lqq h) = h
dt
dt h
0 ) = q (t0 , 0)
= 0. Faptul c
h
0 deoarece h(t
a h(t0 ) = h(t1 ) = 0 rezult
a
s
imediat din ipotez
a.
Definit
ia 1.3.1. Fie q extremal
a pentru L. Perechea (t, q (t)) cu t
a cu (t0 , q0 ) de-a lungul extremalei (sau n raport
(t0 , t1 ) se numeste conjugat
a exist
a h extremal
a pentru a doua problem
a a lui Euler
cu extremala) q dac
(solutie pentru (1.10)) astfel nc
at h(t0 ) = h(t) = 0, h
0. Vom mai spune
si c
a t este conjugat cu t0 n raport cu q .
Observat
ia 1.3.1. Multimea punctelor conjugate de pe extremalele ce
a o curb
a nf
asur
atoare a acestor familii de
pleac
a din (t0 , q0 ), q(, s), formeaz
extremale, dat
a parametric prin s (t(s), q(t(s), s)) unde t = t(s) verific
a
t0
Intruc
at q este minim pentru J, inf Q(q )h = 0. Presupunem acum
hH
ca t (t0 , t1 ) este conjugat cu t0 . Rezulta ca exista pe [t0 , t] extremala
19
2(t, h, h)dt
= 0 deci, dac
a extindem pe h cu 0 pe intervalul [t, t1 ],
t0
0
pentru |t t|
Se veric
a usor ca lim Q(h ) = , ceea ce contrazice pozitivitatea lui Q.
0
Demonstratie () : Am demonstrat c
a n intervalul (t0 , t1 ) nu exist
a
puncte conjugate cu t0 . Presupunem ca t1 ar punct conjugat cu t0 . Aceasta
nseamna ca exista h H, solutie nenul
a pentru (1.10) deci Q(h) = 0 ceea
ce contrazice ipoteza Q > 0.
() : Ideea este de a adauga la integrandul lui Q o diferentiala exacta
care sa nu i schimbe valoarea iar noul integrand s
a e un p
atrat perfect.
at
Astfel, caut
am w C 1 (t0 , t1 ) astfel nc
t1
d
P (t)h 2 + R(t)h2 + (wh2 )dt
Q(h) =
dt
t0
t1
d
(wy 2 )dt = 0) si integrandul P h 2 + Rh2 +
pentru h H (observ
am ca
t0 dt
d
(wh2 ) = P (t)h 2 + (R(t) + w )h2 + 2whh sa e un p
atrat perfect. Acest
dt
lucru se nt
ampl
a dac
a:
P (R + w ) = w2
(1.12)
si, n acest caz,
t1
Q(h) =
2
P h + P 1 wh dt.
t0
Se observ
a ca, dac
a aceasta scriere este posibila, atunci Q este strict pozitiv
a.
Intr-adev
ar, dac
a Q(h) = 0 atunci h + P 1 wh = 0 pe (t0 , t1 ), h(t0 ) = 0 si
deci, n mod necesar, h 0.
Ramane deci de gasit o solutie a ecuatiei Riccati (1.12) care nu se anaut
am w de forma
uleaza pe intervalul nchis [t0 , t1 ]. C
w(t) =
u(t)
P (t)
u(t)
21
Vom numi extrem local slab un extrem local n raport cu topologia dat
a de
norma C 1 .
a pentru functionala
Teorema 1.3.4. Presupunem c
a q este extremal
(1.1) (deci este solutie a ecuatiei (1.4)) si intervalul nchis [t0 , t1 ] nu contine
puncte conjugate cu t0 n raport cu extremala q . Atunci q este un minim
local slab.
Demonstratie Fie P (t) = Lqq (t, q (t), q (t)). Deoarece lagrangeanul este
at P (t) > 0.
regulat, P (t) > 0 pe [t0 , t1 ] si putem alege > 0 astfel nc
Din continuitatea solutiilor unei ecuatii diferentiale n raport cu parametrii
t1
2 dt > 0 pentru y = 0.
(h)
rezulta ca forma p
atratica Q(h)
= Q(q )h 2
t
0
t1
2
(y ) . Rezulta ca forma p
atratica Q este pozitiv denit
a
Deci Q(y)
t0
a de rotatie.
q
a qL
q L =
= cst,
L(t, q, q)
= q 1 + q2 . Avem integrala prim
1 + q2
deci ecuatia satisf
acut
a de extremale este
1
2
q C 2.
q =
C
Aceasta este o ecuatie cu variabile separabile ce are solutiile
q(t) = C cosh(
1
t + s),
C
22
J(q) =
t0
t1
d2
J(q + sh)|s=0 =
ds2
n
Lqi qj hi hj + 2Lqi qj hi h j + Lqi qj h i h j dt,
t0 i,j=1
23
d
Lqq (t, q(t), q(t))
dt
sunt functii continue cu valori matrici simetrice iar (, ) este produsul scalar
a poate
din IRn . Ipoteza de simetrie ne usureaza scrierea si calculele, ns
evitat
a. Daca nu este satisfacut
a, n expresia lui Q(q)h, dup
a integrarea
t1
(A(t)h (t), h(t))dt cu
prin p
arti, mai apare un termen integral de forma
t0
d
pozitiv denit
a. Caut
am asadar un termen de forma (W h, h) unde W (t)
dt
este o matrice simetrica. Are loc:
t1
t1
h)
+ (R(t)h, h) + 2(W h , h) + (W h, h)dt
(P (t)h,
t0
Pentru a obtine un p
atrat perfect sub integral
a ar trebui ca W sa verice
ecuatia Riccati
W = R + W P 1 W.
(1.17)
In acest caz
t1
Q(q )(h) =
1
1
1
1
P 2 h + P 2 W h, P 2 h + P 2 W h dt.
t0
1
21
a P 2 h+P
W h 0 pe [t0 , t1 ]. Cum h(t0 ) = 0,
Q(q ) se anuleaza numai dac
ar rezulta ca h 0 deoarece verica o problem
a Cauchy pentru un sistem
liniar omogen. Deci, ceea ce am obtinut p
an
a acum este ca daca putem
am
rezolva ecuatia Riccati (1.17) pe intervalul [t0 , t1 ], atunci Q > 0. Caut
pe W de forma
W = P U U 1 ,
d
P U + RU = 0.
dt
i=1
25
Se noteaza cu
1 kl
=
g (glj,i + gli,j gij,l )
2
n
kij
l=1
q =
gij
si (gij ) =
q l
kij qi qj , k = 1, . . . , n.
i,j=1
(1.18)
I(q, q)
= Lq (q, q),
ds
este integral
a prim
a pentru sistemul Euler-Lagrange.
Demonstratie Fie q(t) o curb
a integral
a pentru ecuatiile Euler-Lagrange
in
and cont c
a hs invariaz
a pe L si ca (s, ) veric
a
si e (s, t) = hs (q(t)). T
ecuatiile Euler-Lagrange, obtinem
L(, ) = Lq (, ), + Lq (, ), =
0=
s
s
s
Lq (, ), + Lq (, ), =
Lq (, ), .
=
t
s
s
t
s
26
d
Facem acum pe s = 0 si, cum 0 = Id, obtinem ca I(q(t), q(t))
= 0 deci
dt
I este integrala prim
a.
Mecanica lagrangeana. Revenim acum la exemplul 1.1.3. Fie un sistem de
a a acestui sistem este
n puncte materiale de mase mi . Energia cinetic
n
x 2 + yi2 + zi2
.
mi i
T =
2
i=1
Presupunem c
a sistemul este conservativ, adic
a exista un potential al fortelor
care actioneaza asupra sistemului: U = U (xi , yi , zi ). Lagrangeanul sistemului este L = T U . Este usor de v
azut ca euatiile lui Euler nu sunt altceva
decat ecuatiile lui Newton. In prezenta simetriilor, legi de conservare se
obtin din teorema lui Noether. Astfel, dac
a lagrangeanul este invariant la
translatii s : (xi , yi , zi ) (xi + s, yi , zi ), obtinem integrala prim
a
n
Lx i = cst
i=1
geometrica: viteza areolara (viteza de variatie a ariei descrise de raza vectoare) este constanta. Introduc
and aceasta integral
a prim
a n prima ecuatie
din sistemul Euler-Lagrange obtinem ecuatia
K
m
r = 3 U (r).
r
2
M m
constant
a pozitiv
a. Aceasta ecuatie diferentiala de ordinul
cu K =
2
al doilea si autonom
a poate integrat
a. Astfel se reduce sistemul la studiul
K
unei miscari 1-dimensionale cu potential V (r) = U (r)+ 2 . Avem integrala
2r
prim
a a energiei pentru aceast
a ecuatie care conduce la o ecuatie de ordinul
nt
ai:
r = 2(E V (r))/m
si care combinat
a cu expresia lui M ne d
a urm
atoarea ecuatie pentru r ca
functie de , r = r():
r 2 2(E V (r))/m
dr
=
.
d
M
Daca miscarea are loc n c
amp central gravitational, potentialul U este de
k
forma U (r) = , k > 0. Solutiile se gasesc de forma
r
p
,
r=
1 + e cos
care este ecuatia unei conice n coordonate polare. Dac
a traiectoria este
marginit
a (e (1, 1)), atunci ea este elips
a cu unul din focare n O. Aceasta
este prima lege a lui Kepler, cu referire la miscarea planetelor n jurul soarelui. Pentru un studiu detaliat al miscarii unui punct material ntr-un c
amp
de forte central, v. [3].
28
CAPITOLUL 2
Formalismul canonic
2.1. Sisteme hamiltoniene
Consider
am din nou sistemul de ecuatii Euler-Lagrange
L
d L
= 0,
dt q
q
care este format din n ecuatii diferentiale de ordinul al doilea. Ne propunem
n continuare s
a reducem ordinul sistemului tansform
andu-l ntr-un sistem
2
de 2n ecuatii de ordinul I. Vom presupune c
a L C si
este nesingular
a t, q, q,
(2.1)
(2.2)
(2.3)
pi qi
i=1
qi dpi +
i=1
L
dt
t
n
i=1
L i
dq
q i
n
i=1
pi dqi =
i=1
L i i
dq +
q dpi +
pi dqi =
i
q
n
i=1
i=1
n
n
L i i
L
dq
+
q dpi .
= dt
t
q i
i=1
i=1
29
L
d
=
and n
pi deci, evalu
i
q
dt
coordonatele (t, q, p) diferentiala lui H, obtinem sistemul
H = L
t
t
H
L
= i
i
q
q
H = qi
pi
Din ecuatiile Euler-Lagrange stim ns
a ca
Ultimele dou
a ecuatii le scriem n forma
qi =
pi
(2.4)
H .
p i =
q i
Acesta este sistemul hamiltonian care este un sistem de 2n ecuatii diferentiale
de ordinul nt
ai. Acesta mai poate scris si n forma:
d
q
q
= JH
,
p
dt p
0n In
.
unde J =
In 0n
Transformata Legendre
a.
Fie f : D(f ) IRn IR {+} convexa, inferior semicontinu
Transformata Legendre a lui f este functia convexa f : D(f ) IRn
IR {+} denit
a prin
f (x ) = sup [(x , x) f (x)].
xIRn
L(t, q, q)}.
Intr-adev
ar, supremul se atinge ntr-un punct q cu proprietatea c
a diferentiaL
(t, q, q).
F
F
d
F (t, q(t), p(t)) = F (t, q, p) +
q +
p =
dt
t
q
p
F H
F H
= F (t, q, p) + {H, F }
= F (t, q, p) +
t
q p
p q
t
H F H F
reprezint
a paranteza Poisson a functiilor
unde {H, F } =
p q
q p
H, F . Forma Lax a sistemului hamiltonian (2.4) este data de
d
F (t, q, p) = F (t, q, p) + {H, F }.
(2.5)
dt
t
Observat
ia 2.1.1. Dac
a F nu depinde explicit de t atunci ecuatia (2.5)
d
F (q, p) = {H, F } si conditia ca F s
a fie integral
a prim
a pentru
devine
dt
sistemul (2.4) se scrie {H, F } = 0. Dac
a n plus H nu depinde de t atunci
H este integral
a prim
a. In cazul sistemelor mecanice, H are semnificatie de
energie; aceasta se conserv
a dac
a hamiltonianul nu depinde explicit de timp.
Observat
ia 2.1.2. Paranteza Poisson are urm
atoarele propriet
at i ce se
verific
a prin calcul direct:
{H, F } = {F, H} (antisimetrie)
{{F,G},H}+{{G,H},F}+{{H,F},G}=0 (identitatea lui Jacobi)
31
{Pi , Qj }(q,p) = ij
{Qi , Qj }(q,p) = 0
{Pi , Pj }(q,p) = 0, i, j = 1, n.
Transform
arile care verica aceste conditii se numesc transform
ari canonice.
Un alt punct de vedere care ne conduce la denirea transform
arilor
canonice este legat de echivalenta dintre ecuatiile Euler-Lagrange
s
i
ecuat
iile
lui Hamilton. Mai precis, sa observ
am ca extremalele pentru L(t, q, q)dt
pe spatiul q. Daca
consider
am acum schimbarea de coordonate (q, p) (Q, P ) iar hamilto
sa coincid
a cu extremalele
dt. Aceasta se nt
ampl
a dac
a exista o functie
pentru
H (t, Q, P ) + QP
at
neted
a pe bratul cotangent T M , S = S(t, q, p) astfel nc
(2.7)
S1
(t, q, Q)
H = H +
S1
(t, q, Q)
p=
(2.8)
q
S1
(t, q, Q)
P =
Q
32
(2.9)
deci
S2
(t, q, P )
H = H +
S2
.
(t, q, P )
p=
Q = S2 (t, q, P )
P
(2.10)
2 S2
este matrice
qP
nesingular
a.
2.2. Variatia total
a a unei functionale
t1
L(t, q, q)dt
si vom presupune
Consider
am din nou functionala J(q) =
t0
t1
=
t0
Lq (t, q, q)h+L
hdt+L(t
1 ))t1 (0)L(t0 , q0 , q(t
0 ))t0 (0) =
q (t, q, q)
1 , q1 , q(t
t1
=
t0
d
Lq (t, q, q)
hdt+
Lq (t, q, q)
dt
Notam cu p = Lq (t, q, q)
si cu H = L + q Lq = p q L. Amintim ca (q, p)
sunt variabilele canonice iar H este hamiltonianul sistemului. De asemenea,
i ), i = 0, 1. Astfel, prima variatie poate scrisa n forma:
h(ti ) = qi (0) q(t
t1
d
1
Lq Lq hdt + (pq Ht)|t=t
(2.11)
J(q)h =
t=t0 .
dt
t0
O extremal
a pentru problema general
a de calculul variatiilor este o curba
q pentru care J(q ) = 0 si este, desigur, o extremala pentru problema
simpla de calculul variatiilor, cand capetele sunt xate. Lu
and asadar
h(t0 ) = h(t1 ) = 0 cu t0 , t1 de asemenea xate, obtinem ca o extremala
a verice n primul r
and ecuatiile Euler-Lagrange. Pentru o
q trebuie s
Lq Lq = 0
dt
(2.12)
1
(pq Ht)|t=t
t=t0 = 0.
Exemplul 2.2.1. Distanta dintre dou
a curbe Consider
am dou
a curbe
a q = q(t), q(t0 ) = q0 , q(t1 ) = q1
n IRn , q0 = (t0 ), q1 = (t1 ). O curb
t1
q
1 + q2
iar
1
. Cum lagrangeanul nu depinde de t, H = cst
hamiltonianul H =
1 + q2
deci q = cst si distanta se atinge pe o dreapt
a q(t) = at + b.
Conditia a doua din (2.12) devine
(p1 (t1 ) H|t=t1 )t1 (p0 (t0 ) Ht=t0 )t0 = 0
a ca 0 = p1 (t1 ) H|t=t1 =
si cum t0 , t1 sunt variatii independente, rezult
p0 (t0 ) Ht=t0 Deci
1
1
, q(t
1) =
,
q(t
0) =
(t0 )
(t0 )
relatii care exprima faptul c
a extremala trebuie sa e ortogonal
a n q0 , q1
pe curbele date.
Acestea sunt conditii de transversalitate si se regasesc n aceea
si forma
Lq |t=c0 = Lq |t=c+0
(2.13)
L + q Lq |t=c0 = L + q Lq |t=c+0 .
Acestea sunt conditiile Weierstrass-Erdmann care exprim
a faptul c
a, de-a
lungul extemalelor, variabilele canonice q, p si hamiltonianul H sunt functii
continue.
2.3. Ecuatia Hamilton-Jacobi. Metoda lui Jacobi de integrare a
sistemelor hamiltoniene
In cele ce urmeaza presupunem c
a lagrangeanul L este regulat, adica
matricea (Lqq ) este matrice nesingulara. Aceasta nseamna ca sistemul 1.4
este un sistem diferential de ordinul 2, nedegenerat. Dac
a x
am q(t0 ), atunci
solutia sistemului 1.4 depinde de n parametri q,
deci pentru (t, q) ntr-o
a extremala care uneste
vecinatate sucient de mica a lui (t0 , q0 ), exista o unic
am cu t,q si denim functia
(t0 , q0 ) cu (t, q); o not
S(t, q) = J(t,q ).
Proprietatea de dependenta diferentiabil
a de datele initiale a solutiei problemei Cauchy pentru ecuatiile Euler-Lagrange ne asigura ca S C 1 . In
cele ce urmeaza, studiem functia S si aratam ca ea satisface o ecuatie cu
derivate partiale de ordinul nt
ai. Fie t = t(s), t(0) = t, q = q(s), q(0) = q
curbe netede. Atunci:
S
S
d
S(t(s), q(s))|s=0 =
(t, q)t (0) +
(t, q) q (0).
ds
t
q
Pe de alt
a parte, folosind (2.11), obtinem
d
J(t(s),q(s) )|s=0 = p(t) q (0) H(
q , p(t))t (0)
ds
35
S
S
(t, q), H(t, q, p) = (t, q),
q
t
deci
(2.14)
S
S
(t, q) + H(t, q,
)(t, q) = 0.
t
q
Aceasta este ecuatia Hamilton-Jacobi, o ecuatie cu derivate partiale de ordinul I. Sistemul hamiltonian (2.4) reprezinta sistemul caracteristic pentru aceast
a ecuatie cu derivate partiale. Curbele integrale ale sistemului
hamiltonian sunt caracteristicile ecuatiei Hamilton-Jacobi (vezi [4],[35]).
Metoda caracteristicilor se aplica pentru integrarea ecuatiei cu derivate
partiale folosind sistemul caracteristicilor. Metoda lui Jacobi, care va
prezentat
a n continuare, se foloseste pentru a g
asi curbele integrale pentru
sistemul hamiltonian (2.4) folosind o solutie generala a ecuatiei HamiltonJacobi (2.14), solutie care trebuie sa depind
a de exact n parametri. Acest
lucru se nt
ampl
a, dup
a cum se va vedea, n cazul n care variabilele se pot
separa.
Teorema 2.3.1. (Jacobi) . Presupunem c
a S = S(t, q, C1 , . . . , Cm )
este o solutie a ecuatiei (2.14), solutie ce depinde neted de m parametri
S
, j = 1, m sunt integrale prime pentru sistemul
C1 , . . . , Cm Atunci Dj =
Cj
hamiltonian (2.4). Dac
a solutia depinde de n parametri C1 , . . . , Cn astfel
nc
at
2
S
= n,
(2.15)
rang
q i Cj i,j=1,n
atunci o solutie general
a a sistemului hamiltonian (2.4), depinz
and de 2n
a, prin intermediul teoremei
constante de integrare Ci , Di , i = 1, n, este dat
functiilor implicite, de
(t, q, C)
D =
i Ci
(2.16)
pi =
(t, q, C)
q i
Demonstratie Deriv
am ecuatia (2.14) n raport cu Cj si obtinem:
H 2 S
2S
+
= 0.
tCj
pi q i Cj
n
i=1
36
Obtinem ca
n
2S
S
2S
d
(t, q(t), C) =
(t, q(t), C) +
(t, q(t), C)qi =
dt Cj
tCj
q i Cj
i=1
n
H
2S
i
=0
(t,
q(t),
C)
q
q i Cj
pi
i=1
H
, adic
a
pi
p i =
j=1
2S
S
H
(t, q, C)) +
(t, q, C)
=
= i H(t, q,
i
j
q
q
q q
pj
n
j=1
2
n
H
H
S
H
i
= i (t, q, p).
q
= i (t, q, p) +
q
pj q i q j
q
j=1
Observat
ia 2.3.1. Putem privi pe S ca functie generatoare, Pi = Ci
noile impulsuri generalizate, Qi = Di noile coordonate generalizate. Schimbarea canonic
a de coordonate este dat
a de (2.10).
In noul sistem de coor
donate (Q, P ), hamiltonianul este H = 0 iar curbele integrale sunt Qi =
a exact (2.16).
cst, Pi = cst, adic
Observat
ia 2.3.2. Presupunem c
a n hamiltonianul H una din variabile
se separ
a, mai precis
q, p),
H(t, q, p) = H1 (q 1 , p1 ) + H(t,
auta solutia ecuatiei
unde q = (q 2 , . . . , q n ), p = (p2 , . . . , pn ). Atunci putem c
q) unde S1 , S2
Hamilton-Jacobi (2.14) de forma S(t, q) = S1 (q 1 ) + S(t,
37
verific
a ecuatiile de tipul (2.14):
H1 (q 1 , S1 (q1 )) = C1
q, Sq) = C1 .
St + H(t,
Prima este de fapt o ecuatie diferential
a care, dac
a poate fi adus
a la form
a
normal
a prin teorema functiilor implicite, devine o ecuatie cu variabile separabile care poate fi integrat
a. Unei ecuatii Hamilton-Jacobi i se poate g
asi
o solutie general
a depinz
and de n constante dac
a toate variabilele se separ
a.
Atractia de catre dou
a mase egale, fixe. Consider
am exemplul 1.1.5. Hamiltonianul sistemului se calculeaza (folosind de exemplu transformata Legendre) si se obtine
2
2
4k1
12 4l2
2 4l 2
+
2p
2
.
2 2
2
2
2
1 2
1 2
1 22
Caut
am o solutie generala pentru ecuatia Hmilton-Jacobi corespunz
atoare.
Pentru aceasta sa observ
am ca variabilele se separ
ad
aca scriem ecuatia sub
forma
S 2 2
S 2 2
2
(1 4l ) +
(4l 22 ) = C1 (12 22 ) + 4k1 .
1
2
Separ
am variabilele si caut
am solutii pentru urm
atoarele ecuatii HamiltonJacobi:
S 2 2
(1 4l2 ) 4k1 C1 12 = C2 ,
1
H(1 , 2 , p1 , p2 ) = 2p21
S 2 2
(4l 22 ) + C1 22 = C2 .
2
G
asim solutia generala
4k1 + C1 12 + C2
C1 22 C2
d
+
d2 .
S(1 , 2 , C1 , C2 ) =
1
12 4l2
4l2 22
38
Partea 2
CAPITOLUL 3
a a sistemului liniar
unde S(t, s) = X(t)X(s)1 cu X(t) matrice fundamental
and va
omogen y = A(t)y. Vom mai nota solutia y u cu y y0 ,u , atunci c
necesar sa punem n evidenta si starea initiala. Notiunile de controlabilitate nul
a, aproximativ
a, exacta si de stabilizabilitate au fost introduse n
capitolul introductiv, pag. 4. In cazul sistemelor liniare de tipul (3.1), c
and
A, B sunt matrici constante, vom mai spune despre perechea (A, B) ca are
propriet
atile mentionate, adica este controlabila, stabilizabila etc.
Fie acum sistemul adjunct:
p + A (t)p = 0
(3.2)
p(T ) =
Solutia acestui sistem este p(t) = S (T, t).
Teorema 3.1.1. i) Sistemul liniar (3.1) este aproximativ controlabil n
timp T dac
a si numai dac
a, pentru p solutie a sistemului adjunct,
(3.3)
Demonstratie i) Not
am cu
X(T ) =
T
0
S(T, s)Bu(s)ds|u U
41
Are loc ns
a egalitatea
T
,
S(T, s)Bu(s)ds
0
IRn
si concluzia rezult
a imediat dac
a tinem seama de faptul ca solutia sistemului
adjunct (3.2) este p(t) = S (T, s).
ii) Sistemul este exact nul controlabil n timp T daca si numai dac
a, pentru
T
at S(T, 0)y0 =
S(T, s)Bu(s)ds
orice y0 IRn , exista u U astfel nc
0
Date dou
a multimi convexe si nchise A1 , A2 IRn , atunci A1 A2 daca
si numai dac
a H1 () H2 (), IRn , unde Hi sunt functiile suport ale
multimilor Ai , denite prin Hi () = supyAi (, y), i = 1, 2. Alegem A1 =
T
S(T, s)Bu(s)ds, uL2 (0,T ;IRm ) . Functiile su{S(T, 0)y0 } si A2 =
0
a alegem
Dac
a are loc (3.4), atunci H1 () |y0 ||S (T, 0)| H2 () dac
= C|y0 |.
Reciproc, daca sistemul (3.1) este nul controlabil, rezult
a ca, pentru orice
at pentru orice IRn
y0 IRn , exista > 0 astfel nc
2
|B (t)S (T, t)n | dt
.
|S (T, 0)n | n
0
Observat
ia 3.1.1. Proprietatea (3.3) se numeste proprietate de unic
a
continuare. Inegalitatea (3.4) se numeste inegalitate de observabilitate si
aceasta implic
a unica continuare.
In cazul sistemelor diferentiale finit dimensionale pe care le studiem aici, facem observatia c
a cele dou
a propriet
at i
sunt echivalente si sunt de asemenea echivalente cu controlabilitatea exact
aa
sistemului.
Intr-adev
ar, dac
a sistemul este aproximativ controlabil, rezult
a
c
a X(T ) = IRn si, cum subspatiile spatiului euclidian IRn sunt subspatii
nchise, rezult
a c
a X(T ) = IRn , deci sistemul este controlabil
Acest lucru rezult
a si din urm
atoarea teorem
a care, n plus, ne d
a o
alt
a caracterizare a controlabilit
at ii si o form
a explicit
a a controlului care
transform
a starea initial
a a n starea final
a b.
Teorema 3.1.2. Fie operatorul (matricea de controlabilitate):
T
S(T, s)B(s)B (s)S (T, s)ds.
QT =
0
In plus,
transform
a starea initial
a a n starea final
a b, adic
a y a,u (T ) = b.
T
T
|u (s)|2 ds
|u(s)|2 ds,
= S(T, 0)a + QT Q1
T (S(T, 0)a b) = b.
Deci sistemul este exact controlabil n timp T .
Reciproc, sa presupunem c
a sistemul este aproximativ controlabil. Dac
a
(QT , ) = 0, rezulta ca B (s)S (T, s) 0 pe (0, T ) si din proprietatea de
a.
unic
a continuare rezulta ca = 0, deci matricea QT est nesingular
In cazul n care are loc controlabilitatea sistemului liniar, un calcul simplu ne arat
a ca
T
|u |2 ds = (Q1
T (S(T, 0)a b), (S(T, 0)a b))
0
43
= (Q1
T (S(T, 0)a b), (S(T, 0)a b)) =
De aici rezulta imediat ca
T
T
2
2
|u(s)| ds =
|u(s) u (s)| ds +
0
T
0
|u (s)|2 ds.
|u (s)| ds
T
0
|u (s)|2 ds.
Consider
am operatorul KT : L2 (0, T, IRm ) IR dat de
T
S(T, s)B(s)u(s)ds.
KT (u) =
0
kn (v0 , v1 , . . . , vn1 ) =
Aj Bvj ,
vj IRm .
j=0
1
IRn ,1 IRl , are
tei schimb
ari de baz
a. In noua baz
a, pentru =
2
and cu z = Sy, A1 = SAS 1 si cu B1 = SB,
loc X(T ) 2 = 0. Not
sistemul devine:
z = A1 z + B1 u.
45
A11 A12
A21 A22
si ar
atam ca A21 = 0, B21 = 0.
1
trebuie s
a aib
a
Deoarece X(T ) este invariant la A, rezulta ca A1
0
ultimele n l componente 0, deci A21 1 = 0. Cum 1 este arbitrar rezulta
a ultimele n l
ca A21 = 0. Deoarece Im B X(T ), trebuie ca B1 u sa aib
componente 0 pentru orice u IRm . Deci B21 u = 0, u si obtinem B21 = 0.
am ca:
Pentru a ar
ata ca perechea (A11 , B11 ) este controlabila observ
[A11 |B11 ]
,
l = rang [A|B] = rang S[A|B] = rang [A1 |B1 ] = rang
0
Notam A1 =
, B1 =
B11
B21
J(y, u) =
(3.7)
Ne propunem s
a obtinem conditii de optimalitate pe o cale aseman
atoare
celei urmate pentru a deduce ecuatiile Euler-Lagrange.
Vom considera n cele ce urmeaza ca f, L, l sunt functii de clasa C 1 n
n ansamblul variabilelor. Not
am, pentru simplitate,
raport cu y, u si L
loc
u
a exista un control optimal u . Atunci
J(u) := J(y , u). Presupunem c
a:
prima variatie a lui J n u este pozitiv
d
J(u + v)|=0+ 0
J(u )v =
d
pentru orice v U cu proprietatea c
a u + v U cand 0 < < sucient
de mic. Notam cu
d
|=0 y u +v
z=
d
si obtinem
T
Ly (t, y , u )z + Lu (t, y , u )vdt + l(y(T )) z(T ).
(3.8)
0
0
De asemenea, z veric
a ecuatia n variatie (v. [4],[35]):
(3.9)
z = fy (t, y , u )z + fu (t, y , u )v
z(0) = 0.
S
a denim, ca si n calculul variatiilor, hamiltonianul depinz
and de u
(3.10)
H (t, y , p )v
Cum Du
= (p , fu (t, y , u )v) (Lu (t, y , u ), v), obtinem ca
si sa presupunem c
a acesta este de clasa C 1 . Are loc Hmax (t, y , p )
u
H (t, y, p) 0 cu egalitate pentru y = y , p = p . Deci
u
Hmax (t, y , p ) =
H (t, y , p ),
Hmax (t, y , p ) =
H (t, y , p ).
y
y
p
p
Problema se reduce asadar la rezolvarea sistemului hamiltonian corespunz
ator
a precizate. Controlul
hamiltonianului maximizat Hmax , cu conditiile la limit
optimal se exprim
a, folosind conditia (3.12), n functie de (y , p ).
47
x IRn ,
(T, x) = l(x),
unde
, x =
t
x
Notand cu H : [0, T ] IRn IR hamiltonianul denit de:
t =
(3.15)
Daca (y, v) este pereche admisibila n problema (3.6), (3.7), are loc:
d
(s, y(s)) = s (s, y(s)) + (x (s, y(s)), f (s, y(s), v(s)))
ds
s (s, y(s)) H(s, y(s), x (s, y(s))) L(s, y(s), v(s)),
deci:
d
(s, y(s)) L(s, y(s), v(s)) a.e. s (t, T )
ds
si astfel
T
L(s, y(s), v(s))ds + l(y(T )).
(3.22)
(t, x)
t
Intruc
at (y, v) a fost arbitrar ales, din (3.21) si (3.22) ca = . In plus,
din (3.21) rezulta, f
acand t = 0, obtinem ca u = (t, y(t)) este un control
feedback optimal.
Observat
ia 3.3.1. Functia valoare este, n conditii de regularitate,
solutie clasic
a a ecuatiei program
arii dinamice. Dac
a este numai continu
a, atunci ea r
am
ane solutie a ecuatiei respective ns
a ntr-un sens generalizat si anume este solutie de v
ascozitate (v. [18],[19],[20],[21]).
Observat
ia 3.3.2. Ecuatia (3.16) este ecuatia Hamilton-Jacobi (v 2.3)
asociat
a sistemului hamiltonian cu hamiltonianul Hmax obtinut n studiul
principiului de maxim n 3.6.
49
J(y, u) =
(3.24)
1
2
0
1
(Q(t)y, y) + (R(t)u, u)dt + (P0 y(T ), y(T )),
2
u = R1 B p
1
1
Hmax (t, y, p) = (p, Ay) + (p, BR1 B p) + (p, f ) (Qy, y)
2
2
(3.27)
t (0, T )
y = Ay + BR1 B p + f
t (0, T )
p = A p + Qy
a p conform
iar controlul optimal u se exprima n functie de starea adjunct
formulei (3.25)
Decuplarea sistemului hamiltonian (3.27) se poate face caut
and pe p ca
functie de y:
p(t) = P (t)y(t) + r(t),
a (3.27) este
unde P : [0, T ] Mn (IR) iar r : [0, T ] IRn . Problema la limit
satisfacut
a de y si de p dat n forma de mai sus dac
a P (t), respectiv r(t)
50
P (T ) = P0
r = (A P BR1 B )r P f
(3.29)
r(T ) = 0.
u = R1 B p = R1 B (P (t)y + r(t)).
O alt
a abordare a problemei liniar p
atratice este folosirea principiului
program
arii dinamice al lui Bellman. Fie functia valoare a problemei,
denit
a ca n (3.18). Hamiltonianul denit n (3.15) veric
a:
H(t, y, p) = Hmax (t, y, p)
iar (t, x) denit
a n (3.17) este
(t, x) = R1 B x
unde este solutia ecuatiei Hamilton-Jacobi-Bellman (3.16), care devine
(T, x) = 12 (P0 x, x)
Teorema 3.3.1 ne spune c
a daca este solutie de clasa C 1 , atunci deneste
controlul optimal n form
a feedback u(t) = (t, y(t)). C
aut
am solutia de
forma
1
(t, x) = (P (t)x, x) + (r(t), x) + b(t).
2
Introducem n (3.31) si obtinem ca este solutie daca P, r veric
a (3.28),
respectiv (3.29) iar b veric
a
1
(3.32)
b = (B r, R1 B r) (r, f ), b(T ) = 0.
2
Observam aici ca dicultatea principal
a este rezolvarea problemei (3.28),
care contine o neliniaritate p
atratica. Problemele (3.29) si (3.32) sunt liniare
si nu prezint
a dicult
ati din punct de vedere teoretic: odat
a determinat P ,
se determin
a r si apoi b.
Teorema 3.4.1. Presupunem c
a Q(t), t [0, T ], P0 sunt matrici simetrice si pozitive, iar R(t) este uniform pozitiv definit
a, adic
a exist
a > 0
astfel nc
at:
(Rx, x) x2 , x IR.
Atunci:
51
S(0) = P0
Teorema de existenta locala pentru problema Cauchy ne spune c
a exista o
at S este de
unic
a solutie S, denit
a pe un interval maximal [0, T1 ). Intruc
asemenea solutie, rezulta ca S = S . Inlcuim P0 cu P0 + I, Q cu Q + I
si ar
at
am ca solutia problemei r
amane pozitiv denit
a si are ca interval de
existenta [0, T ]. F
acand pe 0, obtinem existenta globala a solutiei si
pozitivitatea acesteia.
Presupunem asadar c
a P0 si Q(t) sunt pozitiv denite. Solutia S este
local pozitiv denit
a. Pentru x IRn are loc
d
(S(t)x, x) = 2(Ax, Sx) (R1 B Sx, B Sx) + (Qx, x).
dt
Daca am presupune c
a pentru un t > 0 si un x IRn are loc (S(t)x, x) = 0 si
T
t)A
x, e(T
t)A
x) C(T )x2 .
Obtinem asadar c
a S(t) este marginit
a n norm
a pe intervalul [0, T1 ) si deci
T1 = T . In consecinta P (t), solutia ecuatiei diferentiale Riccati (3.28) este
pozitiv
a si denit
a pe ntreg intervalul nchis [0, T ].
Existenta solutiei problemei de control liniar p
atratic rezult
a din teorema
3.3.1 deoarece exista o solutie C 1 a ecuatiei Hamilton-Jacobi-Bellman, exprimat
a cu ajutorul solutiei ecuatiei diferentiale Riccati. Unicitatea solutiei
rezulta de asemenea din reprezentarea controlului optimal n functie de
starea adjunct
a p (3.25), care la randul sau se exprima n mod unic cu
52
ajutorul solutiei ecuatiei Riccati (folosind evident si solutiile unice ale problemelor (3.29), (3.32)).
De altfel, se poate observa ca problema de control optimal considerat
a
este o problema de optimizare pentru o functionala strict convexa si coerciva
(R este uniform pozitiv denit
a si Q este pozitiv
a) pe o multime convexa si
nchisa.
3.5. Stabilizarea sistemelor diferentiale liniare
Consider
am sistemul liniar controlat
(3.34)
y = Ay + Bu
y = (A + BK)y
este controlabil
a. In acest fel se reduce demonstratia la cazul m = 1 si feedator
backul c
autat este L + vK, unde K M1n este feedbackul corespunz
cazului m = 1 si perechii (A + BL, Bv).
at Bv
= 0. Construim o baz
a n IRn
Alegem asadar v IRm astfel nc
n felul urm
ator: f1 = Bv, fi+1 = Afi + Bui , pentru un ui IRm , i =
am ul IRm astfel
1, . . . , n. Presupunem c
a am construit f1 , . . . , fl si caut
nc
at fl+1 = Afl + Bul sa nu apartin
a spatiului Xl = span {f1 , . . . , fl }.
Daca aceasta nu este posibil, nseamna ca Afl + Bu Xl , u IRm , deci
Afl Xl si Bu Xl , u IRm . Rezulta imediat ca Im B Xl si Xl este
subspatiu invariant al lui A. Deci ET Xl si deci Xl = IRn si l = n (din
controlabilitate).
iii) i). Implicatia aceasta este imediata.
Stabilizarea feedback a sistemului liniar (3.34) este intim legat
a de problema de minimizare
u
(3.36)
inf J(y , u), J(y, u) =
(Qy, y) + (Ru, u)dt
0
yu
y u (0)
veric
a (3.34) cu
= x, cu Q, R matrici pozitiv denite xate.
unde
Aceasta problem
a de control cu orizont innit ne va conduce la o ecuatie
Riccati algebric
a :
(3.37)
SA + A S SBR1 B S + Q = 0
aut
am n multimea matricilor
unde necunoscuta este S Mn (IR) pe care o c
simetrice pozitive. Vom vedea n cele ce urmeaza ca stabilizabilitatea feedback a sistemului (3.34) este echivalenta cu existenta unei astfel de solutii
pentru ecuatia (3.37).
a solutii simetrice ale ecuatiei diferentiale
Lema 3.5.1. Fie S1 , S2 dou
a) atunci
Riccati 3.33) cu S1 (0) S2 (0) (i.e. S2 (0) S1 (0) este pozitiv
S1 (t) S2 (t) pentru t > 0.
Demonstratie Fie S = S1 S2 . Acesta verica ecuatia
S = SA + A S S2 BR1 B S + S1 BR1 B S SBR1 B S
Acelasi argument din demonstratia teoremei 3.4.1 folosit pentru a arata pozitivitatea lui P functioneaza si aici. Se face mai nt
ai demonstratia nlocuind
at S(0) este pozitiv denit
a, iar pe S2 l
pe S2 (0) cu S2 (0) + I, astfel nc
consider
am solutia ecuatiei perturbate cu I (Q Q + I) . In aceasta
situatie S veric
a
S = SA + A S S2 BR1 B S + S1 BR1 B S SBR1 B S + I
Daca t este primul punct pentru care S nu mai este pozitiv denit
a, rezulta
ca, pentru x vector propriu al lui S(t) corespunz
ator valorii proprii 0, are
loc
d
(S(t)x, x)|t=t = x2 > 0
dt
54
(3.38)
J(y u , u ) = (Sx, x)
(3.39)
Dac
a n plus Q este pozitiv definit
a, atunci matricea A BR1 B S este
stabil
a, altfel spus feedbackul construit este stabilizant.
Demonstratie Fie S(t) solutia ecuatiei diferentiale Riccati (3.33) cu conditia
initiala S(0) = 0. Deoarece S(t) 0 pentru t 0, iar pentru > 0 S( + )
a t S(t)
este solutie care n 0 ia valoarea S(), rezulta din lema 3.5.1 c
este crescatoare.
i) S
a presupunem c
a perechea (A, B) este stabilizabila. Atunci exista
un feedback K astfel nc
at A + BK este matrice stabila. Se poate observa
cu usurinta ca (S(t)x, x) este functia valoare pentru problema de control
optimal de tip Bolza pe intervalul (0, t) cu functionala de cost
t
t
(Qy, y) + (Ru, u)ds.
J (y, u) =
0
de unde
0
a parte
si deci J(y , u ) (Sx, x). Pe de alt
T
(Qy , y ) + (Ru, u )ds J(y , u ),
(S(T )x, x)
0
de unde rezult
a si inegalitatea invers
a si, n consecinta, egalitatea (3.39).
Fie ecuatia
y = Ay BR1 B Sy
acand uz de ecuatia Riccati
pe care o nmultim scalar cu Sy. Obtinem, f
algebric
a, ca
1
1d
(Sy(t), y(t)) = (R1 B Sy(t), B Sy)(Qy(t), y(t)) (Qy(t), y(t)).
2 dt
2
a
Deoarece
a, rezulta ca S este pozitiv denit
Q este
deci (Qy, y), (Sy, y) denesc norme echivalente pe IRn . Rezulta ca exista
C, > 0 astfel nc
at |y(t)| Cet |y0 |. Asadar matricea A BR1 S este
stabila.
3.6. Problema de timp optimal pentru sisteme liniare
Consider
am U un poliedru din IRm :
U = conv(a1 , . . . , ad )
iar {aj , j = 1, . . . , d} este o multime minimala ce genereaza pe U . aj sunt
v
arfurile poliedrului. Consider
am U = {u : [0, ) U : u masurabil
a},
multimea controalelor admisibile pentru problema liniar
a
(3.40)
y = Ay + Bu, y(0) = y0 ,
inf{t : u U, y u (t) = y1 },
y(0) = y0 , y(t ) = y1 .
Ca si n cazul timpului nal xat pentru problema Bolza, se obtine ca daca
a o solutie (y , p ), cu (, p )
= (0, 0)
u este control optimal, atunci exist
astfel nc
at are loc proprietatea de maxim (3.12). In plus fata de cazul
timpului nal liber, dup
a cum se va demonstra n 6.3, are loc
Hmax 0.
Astfel, not
and cu
hu (y, p) = (p, Ay + Bu),
at are loc hu (y , p ) =
obtinem ca exista un arc dual p netrivial astfel nc
u
Hmax (y , p ) = hu (y , p ) + 0
si (, p )
= (0, 0).
Teorema 3.6.1. i) Problema de timp optimal (3.40),(3.41) are cel putin
o solutie.
ii) Dac
a n plus, not
and cu lij = aj ai , are loc pentru i, j
rang [A|Blij ] = n,
(3.43)
(tn s)A
e
Bu(s)ds
e(t s)A Bu (s)ds,
0
Demonstr
am acum unicitatea controlului optimal. Presupunem c
a ar
exista dou
a controale optimale u , v . Din formula variatiei constantelor
deducem:
t
t
t A
(t s)A
t A
e
Bu (s)ds = e y0 +
e(t s)A Bv (s)ds,
y1 = e y0 +
0
de unde
sA
(3.44)
Bu (s)ds =
esA Bv (s)ds.
tA
cu
= 0. Maximul
e
max(p (t), Ay (t) + Bu)
uU
s [0, t ].
ar nit de puncte
Ar
at
am ca, pentru t [0, t ] cu exceptia unui num
{tj : j = 1, . . . , m}, acest maxim este atins ntr-un singur element din U
care este v
arf al poliedrului (prima parte din iii)). Aceste puncte le vom
numi puncte de comutare. Presupunem c
a ar exista o innitate de puncte
arf. Cum
tk [0, t ] pentru care maximul ar atins n mai mult de un v
num
arul v
arfurilor este nit, exita dou
a v
arfuri ai , aj n care maximul se
atinge pe un subsir pe care l not
am tot cu tk . Deci
(p(tk ), Bai ) = (p(tk ), Baj ),
de unde
de unde, tin
and cont de conditia 3.43, rezulta = 0, contradictie. Obtinem
asadar din (3.45) c
a u = v aproape peste tot.
Din punctul iii) a mai r
amas de demonstrat ca pe [0, t ] \ T , u este
local constant
a. Aceasta rezulta imediat din continuitatea functiei t
(etA , Bu).
Acest rezultat se mai nt
alneste n literatur
a sub numele de teorem
a de
bang-bang .
58
CAPITOLUL 4
d t
F (q) = f t F t (q), q M
dt
(4.4)
0
F = Id.
unde Id este aplicatia identitate pe M .
Asadar, n cele ce urmeaza, presupunem satisfacute urm
atoarele ipoteze:
60
C (M ).
F() = F.
In general, dac
a F : M N este o aplicatie neteda ntre dou
a variet
ati,
atunci ea deneste un morsm de algebre F : C (N ) C (M ) prin
a ca daca F, G Di (M ) atunci
F () = F unde C (N ). Se observ
F .
F
G=G
Vectori tangenti. Fie f Tq M . Atunci f poate privit e ca vector
tangent n q al unei curbe ce tece prin q, e ca derivat
a directionala, sau
derivat
a Lie, a functiilor n punctul q si n directia f . Asadar, din primul
punct de vedere se considera o curb
a neteda q(t), q(0) = q, q(0)
= f . Al
d
doilea punct de vedere este de a considera derivata Lie Lf = (q(t)) |t=0 .
dt
Se deneste asadar f : C (M ) IR,
d
y (t)()] |t=0 = Lf .
f() := [
dt
f este functionala liniar
a pe C (M ) si satisface regula lui Leibniz
(4.5)
1
g F = Ad F1
g
F
g = F
Observat
ia 4.2.1. Notatia Ad provine din teoria grupurilor Lie unde
desemneaz
a reprezentarea adjunct
a a grupului n spatiul operatorilor liniari
pe algebra Lie asociat
a.
In cazul de fat
a, rolul grupului Lie este jucat
de grupul difeomorfismelor variet
atii, iar algebra Lie asociat
a este algebra
c
ampurilor vectoriale. Prin reprezentarea exponential
a descris
a mai sus se
obtine grupul automofismelor lui C (M ), iar algebra Lie asociat
a este algebra deriv
arilor lui C (M ) (v. [3], [31]).
Reprezentarea exponential
a a fluxurilor.
Ecuatia (4.1) devine, prin reprezentarea exponentiala:
(4.9)
d
ft
q(t) = q(t)
dt
q(0) = q0 ,
(4.10)
d t
F = F t ft
dt
0
F = Id.
a cronologic
a la dreapta si, prin analogie
Fluxul F t se numeste exponential
cu cazul liniar, se noteaz
a
t
t
fs ds
(4.11)
F = exp
0
62
completa dat
a de o metrica invariant
a la translatii). In aceasta topologie
a si numai dac
a m s,K 0, s 0 si K M .
m dac
Pentru o varietate diferentiabil
a generala M , alegem o acoperire local
nit
a cu h
arti locale (Vi , i )iI , i : V i Oi IRn difeomorsme si e
atii subordonat
a acestei acoperiri. Denim familia
{i }iI o partitie a unit
de seminorme
s,K = sup{Dk [(i ) 1 ](q)| |k| s, 1 (q) K, i I}
Aceasta familie de seminorme depinde de alegerea atlasului de h
arti locale,
dar topologia denit
a pe C (M ) este independenta de aceasta alegere.
Odat
a denit
a topologia, consider
am pe C (M ) spatiul operatorilor
liniari continui L(C (M )). Spatiile Di (M ) si Vec (M ) devin prin intermediul reprezent
arii cronologice subspatii liniare. Intr-adev
ar, pentru
f Vec (M ) si F Di (M ) are loc
fs,K C1 s+1,K , Fs,K C2 s,K
unde constantele C1 = C1 (s, K, f ), C2 = C2 (s, K, F ). Se denesc astfel
familiile de seminorme pe Vec (M ) si respectiv pe Di (M ):
f s,K = sup{fs+1,K |s,K = 1},
F s,K = sup{Fs,K |s,K = 1},
care induc pe aceste spatii topologii local convexe.
Pe aceste spatii vom considera, de asemenea, si topologiile slabe induse
a si numai dac
a Fn F , C (M ).
de C (M ): Fn F dac
63
Propriet
ati de diferentiabilitate si integrabilitate pentru familii de functii
sau operatori.
Int
ai vom caracteriza aceste proprietati pentru spatiul C (M ) care este un
spatiu Frechet.
In general, e X un spatiu Frechet a carui topologie este denit
a de o
familie num
arabil
a de seminorme {pk }kN . Metrica pe X este data de
1 pk (x y)
d(x, y) =
2k 1 + pk (x y)
kN
a dac
a X este
este masurabila pentru orice x X . Se poate demonstra c
separabil cele dou
a notiuni de m
asurabilitate coincid (v. teorema lui Pettis,
[36], n cazul n care X este spatiu Banach). Dac
a h este functie n scara,
atunci h se numeste integrabil
a daca
(Jn )pk (xn ) , pk .
n
64
atile enuntate.
si aceasta este independenta de sirul {hn }nN cu propriet
Limita se noteaza cu
h(t)dt
J
d t
G = f t Gt
dt
(4.12)
0
G = Id
Se deneste n acest fel exponentiala cronologic
a la st
anga :
t
exp
f t dt.
Gt =
0
d t
F |t=0 = f Vec M
dt
.
0
F = Id
Are loc
d
|t=0 (Ad F t )g = f g g f = [f, g] =: (ad f)
g.
dt
65
In cazul particular
exp
F =
f s ds
0
obtinem:
d
(Ad F t )g = (Ad F t )ad f t g
,
dt
Ad F 0 = Id
Ad (
exp
t
0
t
Fie acum F Di (M ) si
un c
amp vectorial neautonom. Atunci
t
t
s
1
g ds F = exp
(Ad F gt )
(4.13)
F exp
gt
Intr-adev
ar, cele doua p
arti ale egalitatii veric
a aceeasi problema Cauchy
pentru ecuatia operatorial
a
d t
q = q t (Ad F gt )
dt
0
q = Id
deci, din unicitatea solutiei, coincid.
Consider
am din nou Gt = (F t )1 si diferentiem identitatea Gt F t = Id .
d
Obtinem ca Gt F t = Gt F t f t si deci
dt
d t
G = Gt (Ad F t )f t .
dt
Aceasta ne da legatura ntre exponentialele cronologice la stanga si la dreapta:
t
t
s
f ds = exp
(Ad F s )f s ds
(4.14)
exp
0
t
F = exp
Lfs ds.
0
Mention
am dou
a propriet
ati fundamentale ale derivatei Lie:
t
Deoarece F d = d Ft , are loc
f d = d f ( echivalent Lf d = d Lf ).
amp
Notam cu if produsul interior al unei forme diferentiale cu un c
vectorial f : if (f1 , . . . , fk ) = (f, f1 , . . . , fk ), pentru k+1 (M ), fi
Vec M . Formula lui Cartan este :
(4.15)
f = d if + if d.
Formula variatiei constantelor.
Consider
am problema Cauchy pentru ecuatia diferentiala liniar
a n IRn :
y = Ay + b(t)
y(0) = y0
Solutia ecuatiei omogene (b 0) este y(t) = etA y0 . Pentru ecuatia neomogena se cauta solutia prin metoda variatiei constantelor . Aceasta consta
n a c
auta o solutie de forma y(t) = etA c(t) si se obtine astfel pentru c(t)
ecuatia c (t) = A(t)b(t) care se integreaza. Solutia sistemului liniar neomogen este data de formula variatiei constantelor:
t
eA(ts) b(s)ds.
(4.16)
y(t) = eAt y0 +
0
Consider
am acum ecuatia diferentiala pe varietatea diferentiabil
aM
q = f t (q),
t
exp
f s ds. Consider
am de asemenea ecuatia
care genereaza uxul F t =
perturbat
a
q = f t (q) + gt (q)
67
care genereaza uxul H =
exp
d t
G = Gt F t f t (F t )1 = Gt Ad F t gt
dt
0
G = Id
Am obtinut deci
t
t
Ad F s gs ds
G = exp
0
si prima form
a a formulei variatiei contantelor este
exp
Ht =
(4.17)
t
0
Ad F s gs ds F t .
Obtinem de asemenea
t 1
H = F Ad (F )
t
si din (4.13)
(4.18)
exp
Ht = F t
exp
unde Fst =
t
0
(
exp
Ad F s gs ds)
0
Ad [(F t )1 F s ]gs ds = F t
exp
t
0
(Fst ) gs ds
f d .
s
f s + gs ds =
exp
f s ds
exp
ad f d gs ds.
exp
exp
0
exp
Ad esf gds etf = etf
exp
Ad e(st)f gds.
et(f +g) =
0
68
pe T M . Fie
(4.19)
dpi dq i .
i=1
Pentru a vedea c
a denitia este independenta de alegerea coordonatelor
locale, e : T M M proiectia canonica si e 1-forma canonica pe T M :
pentru w T (T M )
1 (w) = (w),
Daca w T (T M ), atunci w =
asim ca
= i , g
si
i
q
q
i=1
+ v i i . Intruc
at
pi
q
1 (w) =
pi
=0
pi v i
i=1
deci
1 =
pi dq i
i=1
si
= d1 .
Se vede acum cu usurinta ca este o structura simplectic
a pe T M , care
devine n acest fel o varietate simplectica.
Fie acum (N, ) o varietate simplectic
a generala. Functiile din C (N )
se numesc hamiltonieni. Fie H un hamiltonian pe N . Atunci exista un unic
= (, H ) = dH.
i
H
H se numete c
ampul vectorial hamiltonian al lui H iar uxul corespunz
ator
este fluxul hamiltonian. Ecuatia lui Hamilton sau sistemul hamiltonian este
d
(t) = H ((t))
(4.20)
dt
69
exp
t =
H ds.
= d(
) = (
, ) = {, }
{, } = L
tul c
a {, } = [
, ], se demonstreaza usor daca n coordonate locale
are forma canonic
a (4.19). Argumentul este complet ntruc
at, din teorema lui Darboux (v. [3]), exist
a un atlas simplectic pe N astfel nc
at n
coordonate locale se exprima n form
a canonica. In aceste coordonate
H
H
i
H =
i
pi q
q pi
n
i=1
si
n
i
.
{, } =
i
pi q
q pi
i=1
Ad F H = F H. Intr-adev
ar,
(, F H) = d(F H) = d(H F ) = H F = dH F =
= (F , H ) = F (, (F )1 H ) = (, Ad F H ).
Integralele prime ale sistemelor hamiltoniene autonome sunt functiile
ce comuta cu hamiltonianul. Intr-adev
ar, e ecuatia (4.20). Atunci
a dac
a si numai dac
a et H = const ceea ce este
C (N ) este integrala prim
(4.21)
n
i=1
fi (t, q)
, atunci
q i
i=1
70
(f t )# = f t .
t
Stabilim n continuare leg
attura ntre uxurile determinate de f , respectiv
de (f t )# . Fie Ft =
exp
f s ds. Aunci (Ft ) Di (T M ). Fie
d
|t= (Ft )
dt
Propozit
ia 4.2.1. gt = (f t )# si
t
(f s )# ds
(4.22)
(F ) = exp
g =
Demonstratie Intruc
at Ft+ = Ft Ftt+ , urmeaza, prin diferentiere n
raport cu n 0, c
a
d t
(F ) = gt (Ft ) ,
dt
deci
t
t
gs ds.
(F ) = exp
Deoarece
(Ft ) = (Ft )1
rezulta ca
(4.23)
gt = f t
Pe de alt
a parte, uxul (Ft ) p
astreaza 1-forma 1 si prin urmare forma
simplectica . Din formula lui Cartan (4.15) avem ca
0 = Lgt 1 = igt + d1 (gt ),
de unde
gt = 1 (gt ).
Aceasta nseamna ca campul vectorial gt este hamiltonian iar concluzia
propozitiei urmeaza din (4.23).
71
CAPITOLUL 5
q = f u (q).
Ar
at
am ca pentru o vecin
atate V0 sucient de mic
a q este imersie si multimile de forma q (V0 ) formeaza un atlas pe Oq0 si de asemenea formeaza o
baz
a de vecinat
ati, ind astfel denite structurile topologic
a si de varietate
diferentiabil
a.
q
(0) = fi (q). Rezulta ca pentru o
i) Dq (0) are rangul m deoarece
ti
a Dq (t) are rangul m si deci q este imersie,
vecinatate V0 sucient de mic
deci q (V0 ) este subvarietate m dimensional
a a lui M .
ii) Ar
at
am ca q (V0 ) Oq si Dq Tt IRm = q (t) pentru t V0 . Intrat fi = (Ad Fi )gi ,
adev
ar, exist
a g1 , . . . , gm F, F1 , . . . , Fm P astfel nc
i = 1, . . . , m. In plus pentru s R are loc
es(Ad Fi )gi = (Ad F )esgi P
i
deci q (t) Oq .
Pentru a ar
ata egalitatea Dq Tt IRm = q (t) este sucient sa demonstr
am incluziunea deoarece dimensiunea celor dou
a spatii liniare coincide (amintim c
a din constructia lui q , v. i), rangul lui Dq este m).
Intr-adev
ar, tin
and cont c
a (etk fk etm fm )1 P, fk F, rezulta ca:
Propozit
ia 5.1.1. Algebra Lie generat
a de F are proprietatea c
a pentru
orice q Oq0
(5.2)
Lie q F Tq Oq0 .
Lieq F = Tq M, q M,
atunci
(5.4)
Oq = M, q M
F = F
a c
a Aq0 = Oq0 si dac
a n plus sunt satisf
acute
cu F = {f u , u U } rezult
ipotezele teoremei 5.1.2, atunci sistemul (5.1) este controlabil.
75
2
,
unde
Exemplul 5.2.1. Fie M = IR , F = (x2 )
x1 x2
a cu
a c
a Oq = IR2 , ns
a
C0 (IR). Pentru q = (x1 , x2 ) se observ
usurint
a c
a Lieq F = span
, dim Lieq F = 1, deci
dac
a (x2 ) = 0 rezult
x2
incluziunea (5.2) este strict
a.
Asadar, Vec M , pe l
ang
a structura de algebr
a Lie are si o structura de
modul peste inelul C (M ). Un submodul S Vec
mM se numeste finit gene"
at S =
k fk : k C (M ) .
rat dac
a exista f1 , . . . , fm S astfel nc
k=1
Tq Oq0 = Lieq F.
C (M ).
(5.7)
Atunci Ad etg S = S.
Demonstratie Fie f1 . . . , fm S un sistem de generatori si e fi (t) =
at {fi } este sistem de generatori, rezulta ca exista ij
Ad etg fi . Intruc
at
C (M ), i, j = 1, . . . , m astfel nc
(ad g)fi =
m
j=1
76
ij fj .
j=1
j=1
tg
(5.8)
a ca S =
Notam cu S modulul peste C (M ) generat de LieF. Se observ
at pentru g F
{f : C (M ), f LieF} si deci Sq = Lieq F. Intruc
are loc (ad g)LieF LieF, rezulta din propozitia 5.2.1 ca (Ad etg )S = S.
Din caracterizarea spatiului tangent la orbit
a dat
a n teorema 5.1.1, punctul
(2). si consideratiile precedente, obtinem incluziunea (5.8).
Corolar 5.2.1. Dac
a M este varietate analitic
a si F Vec M este o
familie de c
ampuri vectoriale analitice, atunci are loc (5.6).
Demonstratie Facem pentru nceput observatia ca propozitia 5.2.1 si teorema 5.2.1 r
aman valabile dac
a consider
am M varietate analitic
a si nlocuim
pe C (M ) cu C (M ), spatiul functiilor analitice pe M .
Ramane numai de ar
atat ca modulul S peste C (M ), generat de Lie F,
este local nit generat. De altfel este sucient sa ar
atam n loc c
a, pentru
g F, f S, are loc Ad etg f S. Are loc egalitatea Ad etg f = et[g,f ] si,
cum solutiilor ecuatiilor diferentiale cu membrul drept analitic sunt analitice,
putem scrie ca, pentru un q M
t[g,f ]
qe
k
t
k=1
k!
q (ad g)k f,
iar convergenta seriei are loc uniform pe compacte din IR. Cum q(ad g)k f
Lieq F, rezulta ca q et[g,f ] Lieq F si deci Ad etg f S.
O alt
a consecinta remarcabila a teoremei orbitei este teorema lui Frobenius. Pentru a descrie acest rezultat introducem notiunea de distributie .
Se numeste distributie de dimensiune m < n pe M o familie de subspatii
tangente n ecare punct q al variet
atii, = {q Tq M : q M }, de
a distributia este integrabil
a daca
dimensiune dim q = m. Vom spune c
77
n vecin
atatea ecarui punct q0 exista o subvarietate Nq0 de dimensiune m
astfel nc
at pentru orice q Nq0 are loc Tq Nq0 = q .
Notam cu Sec = {f Vec M : f (q) q , q M }.
Teorema 5.2.2. Distributia T M este integrabil
a dac
a si numai
dac
a are loc conditia lui Frobenius:
(5.9)
Demonstratie Presupunem c
a distributia este integrabila. Deoarece
atatea
orice camp vectorial din Sec este tangent la Nq0 , rezulta ca, n vecin
at cu F = Sec are loc (5.2), rezult
a ca dim Oq0
lui q0 , Oq0 Nq0 . Intruc
atatea lui q0 , Nq0 = Oq0 . Includim Lieq0 Sec dim Nq0 si deci, n vecin
ziunea (5.2) devine astfel egalitate si deci are loc (5.9).
Reciproc, presupunem c
a are loc (5.9). Atunci, n vecin
atatea lui q0
putem g
asi f1 , . . . , fm , baz
a pentru . Deoarece are loc (5.9), rezulta ca
atatea lui q0 , astfel nc
at
exista kij C , i, j, l = 1, . . . , m, denite n vecin
[fi , fj ] =
kij fk .
k=1
Aceasta ne spune ca Lie Sec = Sec deci Lie Sec este modul nit
generat peste C . Asadar (5.2) are loc cu egalitate si deci Tq Oq0 = q .
Rezulta ca varietatea integral
a cautat
a este Nq0 = Oq0 .
78
CAPITOLUL 6
f u( ) d |u U }
Aq0 (t) = {q0 exp
exp
Notam cu q u (t) = y0
Fst
=
exp
f u( ) d.
0 T
L(q(t), u(t))dt
Problema Lagrange
J(q, u) =
0
J(q, u) = l(q(T ))
Problema Mayer .
q(0) = q0 , j(0) = 0
cu datele initiale Consideram multimea controalelor u U astfel nc
at
q u (T ) = q1 . Daca (u , q ) este pereche optimala atunci
(j(T ), q (T )) A(0,q0 ) (T )
a multimea accesibila pentru sistemul (6.2). Aceasta
unde A(0,q0 ) reprezint
transformare are inconvenientul c
a nu distinge ntre traiectoriile ce realizeaza
minimul lui J si cele care realizeaza maximul. Pentru a corecta acest lucru,
consider
am o multime extinsa de controale U = {(u, v)|u U, v [0, +)}
si problema modicata
j = L(q, u) + v
q = f u (q)
(6.3)
q(0) = q0 , j(0) = 0
Daca u este control optimal pentru problema Lagrange atunci (u , 0) este
control optimal pentru (6.3).
Deoarece problema Mayer este un caz particular al problemei Bolza, descriem n cele ce urmeaza reducerea la o problem
a de multimi accesibile n
cazul celei din urm
a, cu cap
atul nal liber.
Introducem noua variabil
a de stare j, multimea extinsa de controale U
si consider
am noul sistem de stare:
80
(6.4)
j = L(q, u) + Lf u l(q) + v
q = f (q, u)
.
q(0) = q0 , j(0) = 0
a o curb
a Lipschitz, netrivial
a, n fi[0, T ], q u (T ) Aq0 (T ). Atunci exist
bratul cotangent, (t) Tqu (t) M , solutie a ecuatiei lui Hamilton (v. (4.20)):
d
(t) = H u (t) ((t)).
dt
In plus, urm
atoarea conditie de maximalitate este satisf
acut
a:
u
u (t)
Se observ
a cu usurinta ca se poate gasi un subspatiu liniar ndimensional
at T0 (X) = IRn deci T0 |X este inversabil. Fie D = B X
X IRN astfel nc
si pentru > 0 e functiile continue T : D IRn :
T (v) =
1
T((y + v))
at 0 int T0 (D)
Se veric
a cu usurinta ca T T0 uniform pe D si ntruc
rezulta ca 0 int T (D) pentru > 0 sucient de mic sau, echivalent,
0 int T((y + B )) ceea ce ncheie demonstratia pasului 1.
Pasul 2 Consider
am un control admisibil u(t) si expim
am punctul nal al
traiectoriei folosind a doua form
a a formulei variatiei constantelor (4.18):
T
u
f u (t) + (f u(t) f u (t) )dt =
q (T ) = q0 exp
0
(6.6)
= q (T )
exp
u
(FtT ) (f u(t) f u
(t)
)dt
Notam cu
gt,u = (FtT ) (f u f u
(t)
u (s) u (t)/h = 0.
Lebesgue ale lui u sunt punctele t n care lim
h0 t
Presupunem c
a conul convex nchis W generat de {gt,u (y u (T ))|t
L, u U } coincide cu ntregul spatiu tangent Tyu (T ) M . Demonstram
ca daca se nt
ampl
a acest lucru atunci n mod necesar q1 := q u (T )
ar, se poate atunci g
asi o multime nita de puncte
int Aq0 (T ). Intr-adev
at W este generat de
0 < t1 < . . . < tN < T si u1 , . . . , uN U astfel nc
multimea nita {gti ,ui |i = 1, . . . , N }. Pentru x = (x1 . . . xN ) IRN
+ consider
am controlul:
t [ti , ti + xi ]
ui ,
ux (t) =
u (t), t [0, T ] \ N
i=1 [ti , ti + xi ]
Formula variatiei constantelor (6.6) ne d
a:
T
x
x
exp
f u (t) dt =
q u (T ) = q0
0
(6.7)
t1 +x1
u
t,u1
g dt exp
= q (T ) exp
t1
tN +xN
tN
Consider
am acum aplicatia:
x
T(x1 , . . . , xN ) = q u (T ),
82
x1 , . . . , xN IR.
gt,un dt
Se veric
a cu usurinta ca T este Lipschitz continua, T(0) = q1 si
T
|
= gti ,ui (y1 ).
xi (0,...,0)
Ipotezele pasului 1 din demonstratie sunt vericate si, n consecinta,
q1 int T(V IRN
+)
at ux este control admisibil
pentru orice vecin
atate V a lui 0 n IRN . Intruc
deducem ca
q1 int Aq0 (T )
Pasul 3 Presupunem c
a q u (T ) Aq0 (T ). Deoarece 0 W, exista un
at
hiperplan suport denit de (T ) Tqu (T ) M ,(T )
= 0 astfel nc
(t) = (FtT ) (T ).
Conditia de maximalitate este satisfacut
a si, din (4.22),
d
(t) = H u (t) ((t)),
dt
ceea ce ncheie demonstratia.
6.3. Probleme de control optimal cu timp final liber
Din punctul de vedere geometric, n cazul problemelor Lagrange sau
Bolza considerate n 6.1, dac
a timpul nal T este liber, concluzia este
ca pentru problemele echivalente (6.2), respectiv (6.4), perechea optimal
a
d
(t) = H u (t) ((t))
dt
si urm
atoarea conditie de maximalitate este satisf
acut
a:
(6.9)
Hu
(t)
83
In plus fat
a de cazul timpului fixat are loc:
Hu
(6.10)
(t)
((t)) = 0
a.p.t. t [0, T ]
q(0) = q0
Controalele admisibile sunt functiile masurabile, marginite, de forma v(t) =
H v ((t)) = H u
(t)
((t)) =
de unde rezult
a relatiile (6.9), (6.10).
84
max
|1|<T,uU
H u ((t))
pentru y veric
and (6.11) si
y(T ) = y1 .
Lagrangeanul L veric
a ipoteza:
L, Ly sunt functii continue n ansamblul variabilelor (y, u).
Consider
am sistemul (6.3). Starea adjunct
a este (, p), IR, p IRn ,
hamiltonianul
H u,v (j, y, , p) = (L(y, u) + v) + p f (y, u).
Presupunem c
a u este control optimal iar y este solutia corespunzatoare
controlului optimal (u , 0) n problema de multimi accesibile asociata. Notam
cu H u (y, p) := H u,0 (j, y, , p) pentru un xat. Sistemul adjunct este
(6.12)
= 0
H u
H u,v
(j, y, , p) =
(y, p) = (fy (y , u)) p Ly (y , u)
p =
y
y
Principiul de maxim ne spune c
a exista (, p) solutie netrivial
a a sistemului
adjunct astfel nc
at
Hu
,0
H u = max H u (y , u ).
uU
pentru y veric
and (6.11) si y(T ) liber. l este o functie de clasa C 2 . Aceast
grad de regularitate sporit este util numai pentru a obtine principiul de
maxim reducand problema la o problem
a Lagrange nsa forma principiului
de maxim r
amane valabil
a si daca l este numai de clasa C 1 .
Am vazut n 6.1 cum o problem
a Bolza se reduce formal la o problema
Lagrange cu cap
atul nal liber. Aplic
am principiul de maxim pentru sistemul extins (6.4). Presupun
and c
a u este control optimal, exista perechea
u,v denit
(, )
= (0, 0) care verica sistemul adjunct, cu hamiltonianul H
n mod uzual:
=0
u ,0
= H
(j, y, , ) =
y
n
, u )) L (y , u) (
(y
(q)fi (q, u))
=
(f
y
y
y
qi
i=1
si conditia de transversalitate
(T ) = 0.
In plus, este vericata conditia de maximalitate
u,v (y (t), (t)).
u ,0 (y (t), (t)) = max H
H
uU,v0
Daca not
am cu
si cu
H u (t, y, p) = (p, f (y, u)) + L(y, u)
obtinem ca exista perechea (, p) netrivial
a astfel nc
at este vericat sistemul
adjunct obisnuit
=0
(6.13)
H u
p =
(y , p) = fy (y , u )p Ly (y , u)
y
mpreun
a cu conditia de transversalitate
p(T ) = l(y (T )).
Daca presupunem c
a y(T ) este liber s
a se miste pe o subvarietate diferentiabil
a
M1 conditia de transversalitate devine
p(T ) l(y (T )) M1 n y (T ).
86
H u (y (t), p(t)) 0.
Probleme neautonome. Consider
am acum cazul n care functiile ce intervin n problem
a, f, L, depind explicit de timpul t. Pentru nceput consider
am timpul nal T xat. Ad
aug
am urm
atoarea ipotez
a de regularitate:
f, ft , L, Lt continue n raport cu ansamblul variabilelor (t, y, u).
Ca de obicei, se transform
a sistemul ntr-un sistem autonom prin introducerea unei variabile suplimentare yn+1 = t. Sistemul de stare (6.11) se
completeaza cu ecuatia
yn+1
= 1, yn+1 (0) = 0.
87
6.5. Leg
atura dintre principiul de maxim si principiul
program
arii dinamice
In cele ce urmeaza vom pune n evidenta legatura dintre principiul de
maxim al lui Pontriaghin si ecuatia program
arii dinamice a lui Bellman.
Consider
am problema de control optimal de tip Bolza care a fost studiat
a
n 6.4. Principiul de maxim pentru aceast
a problem
a ne spune c
a, dac
a u
este un control optimal, atunci exist
a {0, 1} si p(t), (, p)
= (0, 0) ,
astfel nc
at (y, p) veric
a sistemul hamiltonian
H (t, y , p)
y = f (t, y , u ) =
(6.14)
p = (p, fy (t, y , u )) + Ly (t, y , u ) = H u (t, y , p)
p(T ) = l(y (T ))
unde H u (t, y, p) = (p, f (t, y, u)) + L si
Hu
(t)
In 3.3, teorema 3.3.1 s-a aratat ca functia valoare , n cazul n care este
a ecuatia programarii dinamice (3.14):
de clasa C 1 , veric
t H(t, x, x ) = 0
(6.15)
(T, x) = l(x)
unde H(t, x, p) = max H u (t, x, p). Notand cu S = , obtinem
u
St + H u (t, x, Sx ) = 0
iar aceasta este exact ecuatia Hamilton-Jacobi (v.2.3) ce corespunde sistemului hamiltonian (6.14) ce apare n principiul de maxim al lui Pontriaghin.
Urm
atoarea teorema stabileste principiul de maxim pentru problema de
control considerat
a, f
acand apel la ecuatia lui Bellman. Ipotezele considerate
sunt, desigur, restrictive ns
a rezultatul pune n lumin
a legatura dintre cele
dou
a ramuri ale teoriei controlului optimal, ind un analog al teoremei lui
Jacobi din Calculul variatiilor. Aceasta problem
a, n ipoteze generale, a fost
studiat
a n [15].
Teorema 6.5.1. Presupunem c
a u este control optimal iar functia va2
a
loare este de clas
a C . Atunci problema de control optimal considerat
este normal
a. In plus, dac
a not
am cu
(6.16)
p = x (t, y (t))
Pe de alt
a parte, din principiul program
arii dinamice,
d
(t, y (t)) = L(t, y (t), u (t)) =
dt
= t (t, y (t)) + (x (t, y (t)), f (t, y (t), u (t))).
Aceasta, mpreun
a cu ecuatia lui Bellman satisf
acut
a de , ne spune c
a
H u (y, p) = p1 y2 + p2 u + u2
2
Sistemul dual este
p1 = 0
p2 = p1
Principiul de maxim ne spune c
a
(6.19)
H u (y , p ) = max H u (y , p )
uIR
1
y 2 = p2
p = p2
1
p2 = p1
cu conditiile la limit
a:
y1 (0) = y10 , y2 (0) = y20 , y1 (T ) = 0, y1 (T ) = 0 .
90
H u (y , p ) = max H u (y , p ) 0,
|u|1
M y = u M g
91
unde M reprezint
a masa navei iar g acceleratia gravitationala. Sistemul de
stare, not
and cu y1 = M y, devine
y1 = y2
(6.22)
y2 = M g + u
Ne propunem determinarea unui control admisibil astfel nc
at la momentul
a proprietate.
T sa avem y1 (T ) = 0, y2 (T ) = 0, iar T sa e minim cu aceast
Putem sa renot
am controlul si consider
am noul control
u
= u Mg
cu u
[M g F, M g + F ]. Sistemul (6.22) este de aceeasi forma cu
sistemul (6.18), ns
a, spre deosebire de problema opririi unui tren n statie,
apare restrictia de stare
y1 0.
In plus este necesara conditia ca
F > M g,
altminteri acceleratia mobilului este ntotdeauna negativ
a si deci problema
nu are solutie.
Asadar, n problema de timp optimal avem aceleasi solutii ca si n cazul
opririi unui tren n statie (cu deosebirea ca parabolele respective ce compun
traiectoria optimal
a corespund controalelor u
= F M g, respectiv u
=
F + M g) ns
a vom retine drept acceptabilie numai solutiile care r
aman n
semiplanul y1 0. Daca solutia n semiplanul y1 < 0, aceasta semnica n
situatia de fata ca nu putem pozitiona lin mobilul: acesta va atinge solul cu
viteza nenul
a.
Pozitionarea cu optimizarea timpului si a consumului de combustibil. Presupunem c
a consumul de combustibil este proportional cu forta aplicata:
c = u si ne propunem sa optimiz
am simultan consumul si timpul de
pozitionare T . Functionala de cost pe care o consideram n acest caz este
T
(k + |u|)dt.
J(y, u) =
0
at
H (u controlul optimal) astfel nc
H u (y , p) = max H u (y , p) 0.
|u|F
F
0
u =
observ
am ca
= 0. Intr-adev
ar, dac
a = 0, atunci p1 0, p2 iar
a > 0, atunci maximul hamiltoniH u (y, p) = (u M g) (|u| + k). Dac
anului este max|u|F = M g k < 0, contradictie. Daca < 0, atunci
maximul se atinge pentru u negativ, deci controlul optimal p
astreaza semn
negativ, ceea ce ar nsemna ca ajungem n (0, 0) cu acceleratie negativ
a.
Din acelasi motiv controlul initial nu poate 0, deci ntreaga succesiune
(F, 0, F ) este parcursa de controlul optimal u . Cum perechea (, ) este
determinat
a p
ana la o constant
a multiplicativ
a, putem considera = 1 si
< 1. Necunoscutele sunt deci si timpul nal T , care se determina
din conditia de anulare a hamiltonianului si datele initiala si nala pentru
asam ca exercitiu acest calcul, precum si determinarea momentelor
(y1 , y2 ). L
de comutare.
Pozitionarea cu variatia masei datorata consumului de combustibil. Daca
tinem cont de faptul c
a masa navei variaz
a ca urmare a consumului de
combustibil, trebuie sa supliment
am ecuatia (6.21) cu ecuatia
M = |u|
#, M
# ind masa vehiculului f
si restrictia de stare M M
ar
a combustibil.
and numai controale pozitive u U = [0, F ], obtinem
Cu y1 = y si consider
sistemul de stare
y1 = y2
u
y2 = g +
(6.23)
M
M = u
Ne propunem pozitionarea lin
a cu consum minim de combustibil deci avem
o problem
a de tip Mayer cu functionala de minimizat
J(u, (y1 , y2 , M )) = M (T )
93
p1 = 0
p2 = p1
p3 = up2
M2
Conditia de transversalitate care se adaug
a este
p3 (T ) = 1
si, ntruc
at avem o problem
a cu timpul nal liber,
H u (y , p) = max H u (y , p) 0.
uU
u =
F dac
a p2 M 1 p3 > 0
Functia h(t) = p2 (t)M 1 (t) p3 (t) este monotona deoarece un calcul simp1 (t)
. Punctele de comutare ale controlului optimal
plu ne arat
a ca h (t) =
M (t)
gt2
+ y10 .
2
Pentru t t T :
1 M0 F (t t)
,
M (t) = M0 F (t t), y2 (t) = gt ln
M0
gt2 M0 F (t t) M0 F (t t) t t
+
ln
+
y1 (t) = y10
2
2 F
M0
94
H u (y , p ) = max H u (y , p )
u
iar perechea (p, )
= (0, 0). Daca = 0 atunci maximul se poate atinge
a
numai dac
a p2 = 0, caz n care si p1 ar nul. Deci problema este normal
95
Rezulta asadar c
a
u (t) = sign (a sin(t + b)).
Din forma controlului optimal rezult
a ca acesta ia alternativ valorile 1
cu un num
ar nit de schimb
ari de semn la intervale de timp de unit
ati
(mai putin eventual la ultima schimbare). Solutiile sistemului cu controlul
constant u = 1 sau u = 1 veric
a respectiv sistemul
y1 = y2
y2 = y1 1
Traiectoriile sunt cercuri cu centrele n (1, 0), respectiv (1, 0). Traiectoriile optimale care ajung direct n origine f
ar
a schimbarea controlului sunt
semicercurile de ecuatii:
(y1 1)2 + y22 = 1, y2 0, u = 1;
parcurse n sens orar. Celelalte traiectorii optimale sunt formate din succesiuni nite de arce de cerc parcurse n sens orar, cu centrele n (1, 0),
96
respectiv (1, 0) (alternativ), care, cu exceptia eventual a primului si a ultimului arc, sunt semicercuri. Punctele de comutare a controlului se a
a la
intersectia cu semicercurile de ecuatii:
(y1 (2k + 1))2 + y22 = 1, y2 0;
p1 (T )
p2 (T ) = ,
p3 (T )
cu , constante. Solutia sistemului adjunct este p1 (t) = , p2 (t) = t +
T , p3 (T ) = . Conditia de maximizare a hamiltonianului de-a lungul
traiectoriei optimale ne d
a forma controlului optimal (am notat cu B =
T ):
u (t) = p2 (t) = t + B.
Integr
am acum sistemul de stare cu controlul optimal obtinut si obtinem
y1 (t) =
t3 Bt2
+
.
6
2
97
T 3 BT 2
+
=T
62
2
T
+ BT = 1
B 1=0
2
care rezolvat ne d
a valorile pentru , B, T .
98
Index
brahistocrona, 13, 17
c
amp vectorial
complet, 60
hamiltonian, 69
neautonom, 59
catenara, 22
cicloida, 18
conditii
de transversalitate, 34, 89
necesar
a, 1
necesar
a, Jacobi, 19, 20, 24
necesar
a, Legendre, 2, 20, 24
suciente de minim local, 24
Weierstrass-Erdmann, 17, 35
control, 4
admisibil, 4, 5
bang-bang, 80
feedback, 4, 48
optimal, 4, 5, 79
controlabilitate
aproximativ
a, 4
exact
a, 4
ux, 60
hamiltonian, 69
forma Lax, 31
formula
Cartan, 67
variatiei constantelor, 67
functie
generatoare, 32
integrabil
a, 64
slab m
asurabil
a, 64
tare m
asurabil
a, 64
derivare, 62
distributie, 77
ecuatia
a doua a lui Euler, 19, 24
Euler-Lagrange, 2, 23, 29
Euler-Lagrange n IRn , 23
Hamilton, 69
Hamilton-Jacobi, 36
Hamilton-Jacobi-Bellman, 48
program
arii dinamice, 48
Riccati, 25
Riccati algebric
a, 54
Riccati diferential
a, 51
Exemple
Atractia de c
atre dou
a mase xe
egale, 14, 38
geodezic
a, 15, 25
hamiltonian, 29, 69
inegalitate de observabilitate, 43
integral
a prim
a, 31
integrala Bochner, 64
lagrangean, 1, 11, 13
regulat, 17, 23
lift hamiltonian, 71
99
matrice
de controlabilitate, 43
Kalman, 44
metoda variatiei constantelor, 67
metric
a riemannian
a, 15
modul
nit generat, 76
local nit generat, 76
multime accesibil
a, 79
de descompunere Kalman, 45
Frobenius, 77
Jacobi, 36
Kalman, 44
Nagano-Sussmann, 73
Noether, 26
orbitei, 73
transformare
canonic
a, 32
transformare canonic
a, 32
transformata Legendre, 30
orbita, 73
paranteza Poisson, 31, 70
principiul de maxim, 47
principiul minimei actiuni, 14
problema
Bolza, 80
de sintez
a, 48
Lagrange, 80
Mayer, 80
normal
a, 85
singular
a, 85
timp optimal, 80
punct conjugat, 19, 24
unic
a continuare, 43
variabile conjugate, 29
varietate
riemannian
a, 15
simplectic
a, 69
reprezentare
c
ampuri vectoriale, 61
difeomorsme, 61
puncte, 61
vectori tangenti, 61
sistem
aproximativ controlabil, 4
controlabil, 4
cu bucl
a nchis
a, 4, 48
hamiltonian, 30, 69
nul controlabil, 4
stabilizabil, 4
sistem liniar
aproximativ controlabil, 41
complet stabilizabil, 53
controlat, 41
controlat, clasicare, 45
echivalenta
, 45
nul controlabil, 41
stabilizabil, 53
spatiul controalelor, 4
stabilizare, 4
starea sistemului, 4
subdiferentiala, 30
teorema
bang-bang, 58
Chow-Rashevsky, 75
100
Bibliografie
[1] A. A. Agrachev, R. V. Gamkrelidze. Exponential representation of ows and a chronological enumeration. Mat. Sb. (N.S.), 107(149)(4):467532, 639, 1978.
[2] Andrei A. Agrachev, Yuri L. Sachkov. Control theory from the geometric viewpoint,
volume 87 of Encyclopaedia of Mathematical Sciences. Springer-Verlag, Berlin, 2004.
Control Theory and Optimization, II.
[3] V. I. Arnold. Mathematical methods of classical mechanics, vol. 60, Graduate Texts
in Mathematics. Springer-Verlag, New York, 1978.
[4] V. Barbu. Ecuatii diferentiale. Editura Junimea, 1985.
[5] V. Barbu. Mathematical methods in optimization of dierential systems, vol. 310,
Mathematics and its Applications. Kluwer Academic Publishers Group, Dordrecht,
1994. Translated and revised from the 1989 Romanian original.
[6] V. Barbu, Th. Precupanu. Convexitate si optimizare n spatii Banach. Editura
Academiei Republicii Socialiste Rom
ania, Bucuresti, 1975.
[7] Viorel Barbu. Metode matematice n optimizarea sistemelor diferentiale. Editura
Academiei, Bucuresti, 1989.
[8] Viorel Barbu. Analysis and control of nonlinear innite-dimensional systems, vol.
190, Mathematics in Science and Engineering. Academic Press Inc., Boston, MA,
1993.
[9] Viorel Barbu, C
at
alin Lefter. Optimal control of ordinary dierential equations.
Ca
nada, A.(ed.) et al., Ordinary dierential equations. Vol. II. Amsterdam: Elsevier/North Holland. Handbook of Dierential Equations, 1-75, 2005.
[10] R. Bellman. Dynamic programming. Princeton Univeristy Press, Princeton, N. J.,
1957.
[11] G. A. Bliss. Calculus of variations. 6th impression. The Carus Mathematical Monographs. No.1. Washington: The Mathematical Association of America; La Salle, Ill.:
The Open Court Publishing Company. XIII, 189 p. , 1971.
[12] F. H. Clarke. Generalized gradients and applications. Trans. Amer. Math. Soc.,
205:247262, 1975.
[13] F. H. Clarke. The maximum principle under minimal hypotheses. SIAM J. Control
Optimization, 14(6):10781091, 1976.
[14] F. H. Clarke. Optimization and nonsmooth analysis. Canadian Mathematical Society
Series of Monographs and Advanced Texts. John Wiley & Sons Inc., New York, 1983.
A Wiley-Interscience Publication.
[15] F.H. Clarke, R.B. Vinter. The relationship between the maximum principle and dynamic programming. SIAM J. Control Optim., 25(5):12911311, 1987.
[16] E. A. Coddington, N. Levinson. Theory of ordinary dierential equations. McGrawHill Book Company, Inc., New York-Toronto-London, 1955.
[17] R. Courant, D. Hilbert. Methods of mathematical physics. Vol. II: Partial dierential
equations. (Vol. II by R. Courant.). Interscience Publishers (a division of John Wiley
& Sons), New York-Lon don, 1962.
[18] M. G. Crandall, L. C. Evans, P.-L. Lions. Some properties of viscosity solutions of
Hamilton-Jacobi equations. Trans. Amer. Math. Soc., 282(2):487502, 1984.
101
[19] M.G. Crandall, H. Ishii, P.-L. Lions. Uniqueness of viscosity solutions of HamiltonJacobi equations revisited. J. Math. Soc. Japan, 39:581596, 1987.
[20] M.G. Crandall, H. Ishii, P.-L. Lions. Users guide to viscosity solutions of second order
partial dierential equations. Bull. Am. Math. Soc., New Ser., 27(1):167, 1992.
[21] M.G. Crandall, P.-L. Lions. Viscosity solutions of Hamilton-Jacobi equations. Trans.
Amer. Math. Soc., 277(1):142, 1983.
[22] B. A. Dubrovin, A. T. Fomenko, S. P. Novikov. Modern geometrymethods and
applications. Part I, vol. 93, Graduate Texts in Mathematics. Springer-Verlag, New
York, second edition, 1992. The geometry of surfaces, transformation groups, and
elds.
[23] B. A. Dubrovin, A. T. Fomenko, S. P. Novikov. Modern geometrymethods and
applications. Part II, vol. 104, Graduate Texts in Mathematics. Springer-Verlag, New
York, 1985. The geometry and topology of manifolds.
[24] B. A. Dubrovin, A. T. Fomenko, S. P. Novikov. Modern geometrymethods and
applications. Part III, vol. 124, Graduate Texts in Mathematics. Springer-Verlag, New
York, 1990. Introduction to homology theory.
[25] W.H. Fleming, R.W. Rishel. Deterministic and stochastic optimal control. SpringerVerlag, Berlin, 1975. Applications of Mathematics, No. 1.
[26] R. Gamkrelidze. Exponential representation of solutions of ordinary dierential equations. In Equadi IV, Proceedings, Prague 1977, pages 118129. Lecture Notes in
Mathematics, vol. 703, Springer.
[27] I.M. Gelfand, S.V. Fomin. Calculus of variations. Transl. from the Russian and edited
by Richard A. Silverman. Reprint of the 1963 original. Mineola, NY: Dover Publications. vii, 232 p. $ 9.95 , 2000.
[28] Leslie M. Hocking. Optimal control. Oxford Applied Mathematics and Computing
Science Series. The Clarendon Press Oxford University Press, New York, 1991. An
introduction to the theory with applications.
[29] Alberto Isidori. Nonlinear control systems. Communications and Control Engineering
Series. Springer-Verlag, Berlin, third edition, 1995.
[30] V. Jurdjevic. Geometric control theory, volume 52 of Cambridge Studies in Advanced
Mathematics. Cambridge University Press, Cambridge, 1997.
[31] J.E. Marsden, T. S. Ratiu. Introduction to mechanics and symmetry, volume 17 of
Texts in Applied Mathematics. Springer-Verlag, New York, second edition, 1999. A
basic exposition of classical mechanical systems.
[32] L. Pontriaghin, V. Boltianski, R. Gamkrelidze, E. Michtchenko. Theorie
102