Sunteți pe pagina 1din 12

SISTEME DE CONDUCERE OPTIMALĂ

STRUCTURA PROBLEMELOR DE OPTIMIZARE DINAMICĂ

1. Sistemul sau procesul dinamic

Se descrie structura dinamică cauzală a sistemului prin mărimile de intrare, stare


și ieșire. Să reținem pentru exemplificare sistemele netede, cu parametri concentrați,
descrise prin ecuațiile de stare:
Տ : ẋ ═ ƒ(x,u,t), y = g(x,t), t ϵ [t 0 ,t1 ] ⊆ T ⊆ R.

( cu condiții la limită date). (1)

în care x și ƒ sunt vectori n × 1 reprezentând starea și un câmp de vectori,


u - vector m × 1 de intrare și y – vector r × 1 de ieșire, de regulă mărimi reale, funcții de
timp:

x∈ X ⊆ R n , u ∈ U ⊆ R n , y ∈ Y ⊆ R r , f : X × U × T → R r , g : X × T → R r ,

unde X, U, Y și T reprezintă mulțimi sau domenii admise pentru stare, intrare, iesire și
intervalul de timp dat. Mărimile ( x(.), u (.),.) care verifică ecuațiile (1). Prin traiectorie în
sens larg vom înțelege tripletul ( x(t ),t ), respectiv ( y(t ), t ) la ieșire.
În modelul (1), (2) se pot specifica unul sau mai mulți parametri constructivi sau
de proiectare, care formează un vector p, precum și unul sau mai mulți parametri
funcționali sau de acordare, formînd un vector w.
Astfel, modelul (1) ia forma:

ẋ ═ f ( x, u , t , p, w), y ═ g ( x, t , p, w),

în care p ∈ P și w ∈ W , P și W fiind domenii compacte admise pentru parametrii p si


w.
2. Restricțiile impuse mărimilor de intrare, stare și ieșire

Am notat cu X ⊆ R n , U ⊆ R m și Y ⊆ R r domeniile admise pentru x(.), u (.)


și, repsectiv, y (.), cu t ∈ T . Am introdus, de asemenea, parametrii constanți p si w care
pot lua valori în domeniile compacte P și W , de regulă domenii mărginite și închise.
Funcțiile f și g, suficient de netede, cel puțin pe porțiuni, sunt astfel încât pentru x
0
dat

sau un alt punct fixat in X și pentru p,w fixate în P, W ecuațiile (3) admit o soluție și
numai una în domeniile admise.

Definiția 1 ( Traiectorie admisibilă). Numim traiectorie admisă orice


traiectorie ( curbă integrală ) a sistemului (3) care aparține integral domeniilor
admise:

{x(.), u (.),..., p, w} ⊆ {X ,U , T , P;W } ═ τ . (4)

Mulțimea τ se va numi mulțimea traiectoriilor admise în sens larg ( fără precizarea


condițiilor inițiale și finale). Dacă se dau u (.), p și w ca mărimi de „intrare”, rezultă
mărimile de stare și ieșire, respectiv traiectoriile admise ale sistemului (3) sub forma:

x(t ) = p (t , t 0 , x0 , u (.), p, w), y (t ) = τ ( x(t ), t , p, w),

x(.) ∈ X , y (.) ∈ Y . (5)

Aceasta înseamnă că u (.) , p și w sunt elemente programabile (în domeniile admise),


inclusiv extremal sau optim, în sensul care se va preciza mai jos. Celelalte elemente, x(.)
și y (.) țin de structură și depind de sistemul S parametrizat sub forma (3).
Condițiile inițiale t 0, x0 și finale t1 , x1 pot fi elemente fixe sau programabile (optim).

Toate acestea restricționează mulțimea traiectoriilor admise (4), după cum urmează.

3. Condițiile inițiale și finale (la limită) se asociază intervalului de optimizare


[t 0 , t1 ], finit sau infinit, pe care sunt definite funcțiile f și g din (1), explicit și implicit

prin traiectoria ( x, y , t ) sau ( y, u, t ) . Astfel, vom distinge următoarele cazuri pentru S


din (1):

t ∈T ,
0
finit,fixat sau liber;

I : x (t ) = x
0 0
∈ X 0
⊂ X , x 0
fixat, liber sau combinat în X 0
dat, fixat sau

mobil;
y (t 0 ) = y ∈Y 0
⊂Y , y fixat, liber sau combinat în Y 0
dat, fixat sau
0 0

mobil;

t ∈T, t >t ,
1 1 0
finit, fixat sau liber, infinit;

F: x (t ) = x ∈ X ⊂ X
1 1 1
, fixat, liber sau combinat în X 1
dat

( X I X = Φ ),
0 1
fixat sau mobil; (7)

y (t1) =
y ∈Y ⊂ Y 1
, fixat, liber sau combinat în Y 1
dat
1

(Y I Y = Φ ),
0 1
fixat sau mobil

Parametrizarea de acordare după w se poate extinde și asupra condițiilor I, F care în


acest caz devin I(w), F(w).
Mulțimile X 0 ,Y0 se numesc varietăți sau domenii inițiale (de lansare), iar

X 1 ,Y1 sunt varietăți sau domenii finale (țintă). Cu aceste elemente obligatorii, definiția 1
se precizează astfel:
Definiție 1 Mulțimea τ IF ⊂ τ , restricționează prin condiții inițiale și finale (6)

și (7), se numește mulțimea traiectoriilor admise în sens restrîns sau mai simplu,
mulțimea traiectoriilor admise.
Indicatorul de performanță reprezintă de regulă un număr, mai exact o
funcțională asociată fiecărei traiectorii admise, care determină calitatea relativă a
traiectoriei considerate (de referintă) în comparație cu calitatea celorlalte traiectorii din
vecinătatea referinței (calitatea locală) sau din întreaga mulțime a traiectoriilor admise
(calitatea absolută). Structura generală a acestui indicator este (fără parametrizare după p
și w).
1
J = ∫ L( x, (t ), u (t ), t )dt + M (t 0 , x0 , t1 , x1 ) (8)
0

Prima componentă (integrală) din (8) „măsoară” calitatea traiectoriei pe care se


evaluează integrala și se numește, componentă integrală sau criteriu de tip Lagrange.
A doua componentă reprezintă calitatea „concentrată” în extremitățile inițială și finală ale
traiectoriei și se numește componentă sau criteriu de tip Mayer. Daca sunt prezente
simultan cele două componente sau criterii parțiale, expresia (8) reprezintă un criteriu
combinat sau de tip Bolza. Indicatorul (8) permite marcarea fiecărei traiectorii
(admise) cu un număr J care poate fi mai mare sau mai mic. După semnificația acestui
indicator se formulează și problemele de extremizare (locală) sau optimizare (absolută)
a traiectoriilor sestemului 1 în condițiile 2 și 3. Dacă se cere ca J să ia o valoare
minimă, presupunând că există, atunci selecția unei asemenea traiectorii reprezintă o
problemă de minimizare (locală sau absolută), iar pentru maxim avem o problemă de
minimizare (locală sau absolută). Pentru asigurarea existenței unor extreme (locale sau
absolute), funcțiile Lagrange (lagrangeanul) L( x, u , t ) și Mayer (mayerianul) M (I , F ) ,
definite pe {X ,U , T } și respectiv {t 0 , X 0 , t1 , X 1 } în mod asemănător, trebuie să îndepli-
nească anumite condiții, care se vor preciza, ca și acelea pentru f și g, prin formularea
problemelor de optimizare și construcția soluțiilor extreme, din care se rețin soluțiile
optime, acestea reprezentând sisteme sau procese optimale.
O problemă de optimizare este complet determinată dacă se precizează elementele
de la p.1…4, astfel încât toate datele sunt compatibile, mulțimea traiectoriilor admise este
nevidă și indicatorul de performanță admite unul sau mai multe extreme pe această
mulțime.
Dacă ținem seama de structura soluției posibile din (5), indicatorul de performanță
(8) ia forma extinsă

t1
J ( x0 , x1 , t 0 , t1 , u (.), p, w) = ∫ L(ϕ (t , t 0 , x0 , u (.), p, w), u (t ), t )dt + M (t 0 , x0 , t1 , x1 )
t0
(9)

Expresia (9) arată că indicatorul J este în primul rând o funcție de comandă u(.).
Sub acest raport avem:
Definiția 3. Se numește comandă optimală acea comandă admisă u (.) ∈ U ⊂ τ IF care
minimizează (maximizează) funcționala (9)

J (.,.,., u * (.),.,.) ≤ (≥ )J (.,.,.,., u (.),.,.)


∀u∈U
(10)

unde u(.) este orice comandă din U. În mod similar, se definesc și ceilalți parametri
optimali din J, care sunt liberi în domeniile lor admise. Determinarea comenzii optimale
și a parametrilor optimi în mulțimea traiectoriilor admise formează o problemă de
optimizare.
Indicatorii de formă (8), care conțin în principal mărimile de intrare u(.) și de stare
x(.) se pot prelungi până la mărimile de ieșire y(.), care pot interveni prin funcția
vectorială g(x,t) din (1) sau prin măsurarea directă a acestor mărimi, fiecare caz având
particularități distincte. Dacă sistemul S se ia sub forma parametrizată (3), iar condițiile la
limită 3 sunt de asemenea parametrizate, indicatorul de performanță (8) va avea tot o
formă parametrizată J(p,w) sau numai J(w), care verifică inegalități optimizante (10) în
raport cu fiecare parametru.

5. Condiții suplimentare. Încheiem lista principalelor elemente ale problemelor


de optimizare dinamică menționând și alte condiții posibile, care pot reprezenta egalități
și inegalități diferențiale (independente de (9.1) dar similare cu acestea). Cu fiecare nouă
condiție în plus, mulțimea traiectoriilor admise τ IF se îngustează și mai mult. Asemenea
condiții se vor formula și aplica la unele probleme specifice după prezentarea și
rezolvarea unor probleme cu structură de bază 1…
La nivelul acestor formulări se pot defini câteva probleme uzuale de optimizare.
METODE VARIAȚIONALE.
ALGORITMUL EULER-LAGRANGE

PROBLEMA VARIAȚIONALĂ

Reluăm elementele (structura) de bază ale problemelor de optimizare (definiția 3)


O = {S , X , U , T , I , F , J }

fără a explicita parametrii constructivi P și de acordare W. Presupunem că {X ,U , T }


formează o mulțime deschisă (mulțimea traiectoriilor lui S) sau că în interiorul acesteia
se poate delimita submulțimea deschisă {X *,U *, T *} ⊆ {X , U , T } care conține cel puțin o
*

traiectorie admisibilă (x*, u*, t )t ∈ {X *,U *, T *}, în sensul că verifică sistemul S


1
*
în
t 0

condi-ții I și F determinate. Admițând că o asemenea traiectorie există, vom impune


*

condițiile ca aceasta să reprezinte o extremală, în sensul că J * ( x*, u*, t )


t 1

= J * ia o
*
t 0

valoare minimă sau maximă pentru J ( x, u , t )


t 1
în mulțimea {X *,U *, T *}.
t 0

Traiectoriile vecine din {X *,U *, T *}, fie acestea ( x, u , t )


t 1
cu
t 0

x(t ) = x * (t ) + δx(t ) ∈ X *
u (t ) = u * (t ) + δu (t ) ∈ U * (27)
* *
(t 0 , t1 ) = (t 0 + δt 0 , t1 + δt1 ) ∈ T
se numesc traiectorii perturbate față de traiectoria de referință sau extremală, în jurul
căreia există vecinătatea {X *,U *, T *}. Orice traiectorie perturbată (27) se caracterizea-ză

t 1

printr-un indicator J ( x, u , t ) = J care poate fi comporat cu indicatorul de referință
t 0

(extremal) J*:

J = J * +δJ (28);

unde δJ este variația lui J față de referința (valoarea extremă) J* corespunzătoare


variațiilor δx(t ), δu (t ), δt 0 și δt1 din (27), considerate arbitrare în

{X *,U *, T *}=τ ⊃τ * IF , unde τ *IF
* ține seama și de condițiile inițiale I și finale F

(v. și definiția 2 pentru mulțimea traiectoriilor admise).


Dacă aceste variații, ramănând arbitrare, se presupun suficient de mici, adică
t t
( x, u , t ) 1 se află în imediata vecinătate a extremalei (x*, u*, t ) 1 , atunci egalitatea
t0 t0

δJ = 0, ∀δx(t ), ∀δu (t ), ∀δt 0 , ∀δt1 în τ * (29)

reprezintă condiția necesară ca ( x*, u*, t )


t 1
să fie o traiectorie extremală (suportul
t 0

hiperplanului) din spațiul de definiție al lui J tangent la suprafața J pe traiectoria de


 t1 
contact (de ordin I)  x*, u*, t . Condiția (29) reprezintă o condiție de extrem pentru J

 t 0 
din (28) și dă
J * = min max J . (30)
U U

Problema 1 (Problema variațională). Se dau urmatoarele elemente și condiții:

1. sistemul S sub formă generală


x& = f ( x, u, t ), f : τ → R n , (31)

în care f este o funcție vectorială definită pe mulțimea

τ ={X ,U , T }, (32)

n
continuă și derivabilă în raport cu toate argumentele (x,u,t) cu valori în R ;
2. mulțimea τ deschisă, în sensul că toate submulțimile X,U,T sunt deschise
(mărginite sau nu );
3. condițiile inițiale I și finale F în oricare din variantele și combinațiile din (6),
(7), după specificul problemei;
indicatorul de performanță

t1
t1
J = λ 0 ∫ L( x, u , t )dt + µ 0 M ( x, t ) , (33)
t0 t0

în care L este o funcție scalară continuă și derivabilă în raport cu toate argumentele


(x,u,t), ca și componentele funcției f: în plus, langrangeanul L este o funcție cu semn cel
puțin semi-definit (pozitiv pentru minimizare și negativ pentru maximizare); M este o
funcție scalară definită pe mulțimile X 0 și X 1 din (6), (7), continuă și derivabilă în

raport cu toate argumentele, convexă. Multiplicatorii constanți λ0 și µ 0 permit

1
selectarea tipului de problemă (criteriu) de optimizare prin egalarea lor cu 0,± ,±1 etc.
2
Se cere să se determine comanda admisă u* care:
5. transportă sistemul (1) din starea inițială ( x0 , t 0 ) ∈ X 0 × {t 0 } în starea finală

(x1 , t1 ) ∈ X 1 × {t1 } pe o traiectorie admisă;


6. minimizează (maximizează) indicatorul de performanță (4) pe o traeictorie
*
admisă, cel puțin într-o mulțime deschisă restrânsă τ IF
⊆ τ IF de traiectorii (extreme

locale);
7. verifică strict semnul variației a două δ 2 J (hessianul este strict pozitiv-definit
pentru minim și strict negativ-definit pentru maxima);
8. asigură extremul absolut în cazul mai multor extreme locale. Pentru a selecta
extremul absolut sunt necesare toate traiectoriile extremale x * și valorile J * ale
indicatorului de performanță corespunzător acestora.
Soluția acestei probleme constă în:
- formularea condițiilor necesare de extrem pentru traiectoriile extremale;
- determinarea traiectoriilor extremale (dacă există), inclusiv natura lor
(minim, maxim):
- selectarea extremului absolut (care verifică și condițiile suficiente de optim).
Problema variațională se rezolvă pe părți, primele două etape fiind ușor
abordabile, iar ultima etapă se rezolvă cu mijloace specifice fiecărei aplicații.
În unele cazuri particulare (problema liniar-pătraticăa), este posibilă și o soluție
analitică de ansamblu.

4.2.2. CONDIȚIILE NECESARE DE EXTREM RELATIV


(LOCAL) PENTRU UN INTERVAL (t 0 , t1) FIXAT


Fie mulțimea traiectoriilor perturbate τ * ={X * , U * , T * } în jurul unei traiectorii

t *1 ∆
extremale (x * , u * , t ) ∈ τ * . Dacă o asemenea variație δJ = J − J * verifică identitatea
t *0

(29). Să evaluăm această variație. Vom considera mai întâi cazul interva-lului [t 0 , t1 ]
fixat, apoi liber.
Cazul 1 (intervalul de optimizare [t 0 , t1 ] fixat). În esență este vorba de extremizarea
unei funcționale J de forma (33), ale cărei variabile sunt supuse la restricțiile
diferențiale (31), ceea ce corespunde evaluării indicatorului J pe o traiectorie a
sistemului S, definită pe mulțimea τ din (32). Determinarea extremului condițional al
integralei J cu langrangeanul L (condiționat de egalitatea(31)) se reduce la
determinarea unui extrem necondiționat cu o funcție Lagrange sintetică de forma
(omogenă în raport cu funcțiile care se integrează)

H ( x, u , λ , t ) = λ0 L( x, u , t ) + λT x = λ 0 L( x, u , t ) + λT f ( x, u, t ), (34)

unde λ0 este un factor de proporționalitate care depinde de tipul problemei de optimizare,


iar

λ
T
(t ) = [λ (t ), λ
1 2
(t ),..., λ n (t ) ]
T
(35)

este vectorul multiplicatorilor lui Lagrange, care trebuie determinat. În condițiile


menționate prin problema 1 și din structura (34) rezultă că funcția lui Hamilton H este
continuă și derivabilă în raport cu toate argumentele ( x, u , λ , t ) . Prin urmare, vom avea
(reținem că și mulțimile pe care se calculează derivatele sunt deschise)
∂L( x, u, t ) ∂H ( x, u, λ , t ) ∂f T ( x, u , t )
λ0 = = − λ (t ) ,
∂x ∂x ∂x
. ∂H
x = f ( x, u , t ) = , (36)
∂λ
∂L( x, u , t ) ∂H ( x, u , λ , t ) ∂f T ( x, u , t )
λ0 = − λ (t ) .
∂u ∂u ∂u
Cu acestea trecem la calculul variației δJ pentru extremul necondiționat
t1 t1
δJ = J − J *
= λ ∫ L( x(t ), u (t ), t )dt + µ M ( x, t )
t 1
( ) ( )t
− λ0 ∫ L x * (t )u * (t ), t dt − µ 0 M x * , t
1
=
0 0
t 0
t 0 t0 t 0

t1
[ ( )] [
= λ0 ∫ L( x(t ), u (t ), t ) − L x * (t ), u * (t ), t dt + µ 0 M ( x, t ) − M x * , t ( )]t 1
.
t0 t 0

În condițiile de regularitate formulate la § 2.1 putem introduce dezvoltările


∂L( x, u , t ) ∂L( x, u , t ) ∂M ( x, t )
T T T
(
L ( x, u , t ) = L x , u , t +
* *
) ∂x x = x*
δx +
∂u x = x*
δu + ...M (x, t ) = M (x , t ) + *
.
∂x + ...
u =u* u =* ∂x x = x*

Pentru δx și δu arbitrari, dar suficient de mici, ținând seama și de (36), rezultă


aproximația primei variații

t 1  ∂H T
  T  
T
T
  ∂f ∂f T ∂M t1
δJ = ∫  x = x* δu  −  δx + δu  λ dt + µ 0 δx . (37)
 ∂x   ∂x 
x = x* x = x*
t 0 
u =u* u =u* ∂u u =u*   ∂x x = x*
t0
λ =λ*  
A doua paranteză de sub integrala din (37) se poate transforma astfel:
 ∂f T ∂f T   dx T  d

∂x
δx +
∂u
( )
δu λ = δf T (x, u , t )λ = δx T λ =  δ
dt
λ =
dt
δx T λ ( )
   
și se integrează prin părți.
t1 t1 t 1 T
d
∫ dt (δx )λdt = (δx )λ t 0 − ∫ (δx )λdt .
T T

t0 t0

S-ar putea să vă placă și