Sunteți pe pagina 1din 39

(R.-E.

Precup, UPT, 2013)

2. ELEMENTE DE OPTIMIZARE A SISTEMELOR DE


REGLARE AUTOMAT
2.1. Definirea unei probleme de optimizare
n sens larg, optimizare nseamn aciunea de stabilire, pe baza unui criteriu prestabilit, a celei
mai bune decizii ntro situaie dat cnd sunt posibile mai multe decizii, precum i aciunea de
implementare a deciziei stabilite precum i a rezultatului acesteia. n sens restrns, optimizare
nseamn doar aciunea de stabilire a celei mai bune decizii (soluii). Cea mai bun decizie (soluie)
este numit decizie optimal (soluie optimal).
Enunul unei probleme de optimizare (PO) n sens restrns trebuie s conin dou elemente:
A) Modelul mediului la care se refer situaia dat.
B) Criteriul de optimizare.
Rezolvarea unei PO presupune existena unui al treilea element, i anume:
C) Metoda de optimizare.
n cele ce urmeaz vor fi fcute referiri la aceste trei elemente.
A) Modelul mediului. Modelul mediului caracterizeaz procesul cauzal din cadrul mediului la care se
refer PO i reprezint elementul pe baza cruia sunt estimate efectele diferitelor decizii care pot fi
luate n considerare. Modelul mediului conine patru categorii de relaii:
1) Ecuaiile procesului, n diferite forme cunoscute, prezentate n capitolele anterioare sub
forma modelelor matematice ale proceselor. n cadrul acestora apar trei tipuri de mrimi:
a) Variabile n timp:
- de intrare (comand), u U Rm,
- de stare, x X Rn,
- de ieire, y Y Rp.
b) Variabila independent timp:
t T0f R pentru sisteme cu timp continuu (SC);
t T0f = {tk0, tk0+1, , tkf} = {tk | k = k0, , kf Z} R pentru sisteme cu timp discret (SD).
Domeniul T0f se numete interval de optimizare sau orizont de timp. n anumite probleme orizontul
de timp este finit: T0f = [t0, tf] R, cu t0 i tf finite pentru SC, respectiv k0 i kf finite pentru SD, iar
n altele este infinit: T0f = [t0, ) R, cu t0 finit pentru SC, respectiv k0 finit, kf infinit pentru SD.
Momentul t0 (tk0) se numete moment iniial i tf (tkf) se numete moment final.
c) Constante n timp (parametri):
- parametri constructivi sau de proiectare, pc Pc Rqc,
- parametri de acordare sau funcionali, pa Pa Rqa.
2) Domeniile admise pentru mrimile care apar n ecuaiile procesului. Acestea au fost
prezentate anterior (este vorba despre U, X, Y, T0f, Pc, Pa).
3) Condiiile iniiale i finale care se asociaz capetelor (bornelor) t0 (tk0) i tf (tkf) ale
orizontului de timp pe care a fost definit PO. Aceste condiii se refer de regul la mrimile de stare:
x(t0) = x0, x(tf) = xf
i, mai rar, la mrimile de ieire:
y(t0) = y0, y(tf) = yf,
domeniile corespunztoare avnd expresiile:
x0 X0 X, xf Xf X, respectiv:
y0 Y0 Y, yf Yf Y
i purtnd denumirile:
- X0, Y0 varietate (domeniu) iniial (de lansare),
- Xf, Yf varietate (domeniu) final (int).

60 Elemente de optimizare a sistemelor de reglare automat 2 (R.-E. Precup, UPT, 2013)


4) Condiiile suplimentare impuse mrimilor care apar n ecuaiile procesului. Aceste condiii
sunt datorate particularitilor situaiei n care se afl mediul considerat. Ele pot fi exprimate printr-un
sistem de ecuaii algebrice i / sau difereniale (cu diferene) i / sau inecuaii algebrice i / sau
integrale i / sau difereniale (cu diferene), valabil pe ntregul orizont de timp T0f sau numai la anumite
momente ale acestuia.
n cazul utilizrii unor ecuaii, condiiile suplimentare sunt numite restricii de tip egalitate
(RTE). Pe de alt parte, n cazul utilizrii unor inecuaii, condiiile suplimentare sunt numite restriii
de tip inegalitate (RTI).
Se numete proces admisibil sau traiectorie global admisibil orice soluie a sistemelor de
ecuaii ale procesului menionate la punctul 1), care aparine integral domeniilor admise i care
satisface condiiile iniiale, finale i suplimentare impuse. Se noteaz cu 0f mulimea proceselor
admisibile, care are expresia
0f = {{x(t), u(t), , pa} | x X, u U, , pa Pa, t T0f;
x0 X0, , yf Yf;
g(x, ..., pa) = 0, h(x, ..., pa) 0, t T0f;
g0(x0, ..., y0) = 0, gf(xf, ..., yf) = 0},

(2.1.1)

n care cu g(x, ..., pa) = 0, g0(x0, ..., y0) = 0 i gf(xf, ..., yf) = 0 au fost exprimate RTE, iar cu
h(x,...,pa)0 au fost exprimate RTI.
B) Criteriul de optimizare. Criteriul de optimizare este exprimat n general prin funcia obiectiv
(numit i funcie criteriu sau funcie cost i abreviat FO) i reflect atitudinea fa de FO,
imprimat de problema de optimizare (PO). FO are rol de indicator de calitate global [P2-1] i
servete la evaluarea numeric a diferitelor decizii, iar atitudinea fa de FO trebuie s specifice sensul
de variaie dorit al FO, minimizare sau maximizare. Funcia obiectiv este de regul o funcional
notat cu J:

J : 0 f R ,

(2.1.2)

care asociaz fiecrui proces admisibil = {x(t ), u(t ), K , p a } 0 f un numr real prin care este
apreciat calitatea absolut a procesului n raport cu mulimea 0 f .
Pentru sistemele cu timp continuu, forma general a FO este
J (t 0 , x 0 , t f , x f , x(t ), u(t ), p c , p a ) =
tf

= (t 0 , x 0 , t f , x f ) + E (x(t ), u(t ), t )dt .

(2.1.3)

t0

Termenul , numit component de tip Mayer, evalueaz calitatea capetelor traiectoriei. Termenul
integral, numit component de tip Lagrange, evalueaz parcursul traiectoriei pe care evolueaz
procesul considerat. n consecin, se vorbete de criteriu de tip Mayer, corespunztor FO

J = (t 0 , x 0 , t f , x f ) ,

(2.1.4)

care penalizeaz capetelor traiectoriei i de criteriu de tip Lagrange, corespunztor FO


tf

J = E (x(t ), u(t ), t )dt ,

(2.1.5)

t0

care penalizeaz parcursul traiectoriei i de criteriu de tip Bolza, corespunztor FO (2.1.3), care
penalizeaz traiectoria n ansamblu.
Pentru sistemele cu timp discret, forma general a FO (de tip Bolza) este

(R.-E. Precup, UPT, 2013) 2.1 Definirea unei probleme de optimizare 61


J (tk 0 , x k 0 , tkf , x kf , x k , u k , pc , p a ) =
= (th 0 , x k 0 , tkf , x kf ) +

k f 1

Ek ( x k , u k ) ,

(2.1.6)

k = k0

aspectele de terminologie de la cazul cu timp continuu fiind variabile i n cazul cu timp discret. O
funcie obiectiv discret poate fi obinut dintro FO continu prin discretizare.
n funcie de precizarea sau nu a orizontului de timp, exist probleme de optimizare dinamic
(POD), pentru care precizarea orizontului de timp e fundamental i probleme de optimizare
staionar (POS), pentru care precizarea orizontului de timp nu e necesar nici pentru modelul
mediului i nici pentru FO i n care intereseaz doar regimul staionar al sistemului dinamic. n cazul
POS, FO au expresia

J = (x, u) .

(2.1.7)

C) Metoda de optimizare. Metoda de optimizare reprezint ansamblul de mijloace utilizate pentru


determinarea deciziei optimale pe baza modelului mediului i a FO.

Considernd o problem de optimizare pentru care singura variabil (singurul element


programabil) este reprezentat (reprezentat) de comanda u(t) (pentru SC) sau uk (pentru SD), adic o
problem de conducere optimal, se zice comand optimal acea funcie de comand u (t ) U sau
u k U , t T0 f , k = k 0 , k f 1 , care extremizeaz FO J n sensul cerut de criteriul de optimizare.
Mulimea U reprezint mulimea comenzilor admisibile, adic mulimea funciilor de comand care
apar n mulimea 0 f a proceselor admisibile. Dac mulimea U este compact, n cazul minimizrii
poate fi exprimat rezultatul

u = arg min J (u), u U .


u

(2.1.8)

Altfel spus, comanda optimal este acea funcie de comand admisibil care minimizeaz funcia
obiectiv J. n cazul sistemelor discrete, n care comanda optimal este reprezentat de un ir de vectori
{u k 0 , u k 0+1 , K , u kf 1 } aplicat secvenial la intrarea procesului condus, este vorba despre probleme de
optimizare n mai muli pai.
n particular, exist probleme de optimizare ntr-un singur pas, care din punct de vedere
matematic nu se deosebesc de POS [D2-1]. Acestea sunt cunoscute i sub numele de probleme de
programare matematic, liniar, neliniar (ptratic, convex).

Remarc: Pentru PO cu mai multe variabile / elemente programabile (de exemplu, tf, xf i u)
elementele programabile optimale sunt definite similar.
Din punct de vedere al implementrii comenzii optimale exist probleme de conducere optimal
n circuit deschis i n circuit nchis, situaii n care se vorbete despre funcii de comand optimal
(independente de starea / ieirea procesului condus) respectiv de legi de comand optimal,
u = u (t , x) sau u = u k ( x k ) .
Observaii:
1. Orice problem de maximizare poate fi transformat ntro problem de minimizare prin
schimbarea semnului FO.
2. ntro PO valoarea FO e mai puin important, conteaz doar ca valoarea sa s fie minim.
Definirea unei PO trebuie concretizat sub forma acesteia. Enunul unei PO poate fi exprimat
sub urmtoarea form general:

A : v = arg min J = B( v) , supus la RTE, RTI,


v

(2.1.9)

62 Elemente de optimizare a sistemelor de reglare automat 2 (R.-E. Precup, UPT, 2013)


n care v reprezint variabilele problemei (elementele programabile, exprimate sub form vectorial),
A este nlocuit cu denumirea PO i B este nlocuit cu expresia FO.
n subcapitolele urmtoare vor fi prezentate modaliti de rezolvare a unor clase de probleme de
optimizare n contextul sistemelor de reglare automat. Prezentarea este orientat n vederea atingerii
scopului de proiectare unor sisteme de reglare automat optimal.

2.2. Probleme de optimizare parametric a regimurilor dinamice ale


sistemelor liniare reductibile la probleme de optimizare ntr-un singur
pas soluionabile pe baza egalitilor lui Parseval
A) Formule de baz pentru sistemele cu timp continuu. Fie f1 i f2 funcii original,
f1 : R+ R, f 2 : R+ R , care satisfac proprietatea

lim f1 (t ) f 2 (t ) = 0 .

(2.2.1)

Fie f 1 ( s ) = L{ f 1 (t )} i f 2 ( s ) = L{ f 2 (t )} transformatele Laplace ale lui f1 respectiv f2. Atunci poate fi


calculat integrala urmtoare:

f 1 (t ) f 2 (t )dt = [ L1 { f 1 ( s )}] f 2 (t )dt .


0

n continuare, prin aplicarea formulei de inversiune de la transformarea Laplace, teoremei lui Fubini i
definiiei transformrii Laplace, rezult succesiv:
j

1
st

f 2 (t )dt =
=
f
t
f
t
dt
f
s
e
ds
(
)
(
)
(
)
1
2
1

2 j

j
0
0

1
f 2 (t )e ( s )t dt ds = 1
=
f
s
(
)
1
0

2 j
2 j j
1442443
L { f 2 ( t )}

Prin urmare, se obine urmtorul rezultat:


j

f1 ( s) f 2 ( s)ds .

f1 (t ) f 2 (t )dt =

1
f1 ( s ) f 2 ( s )ds .
2 j j

(2.2.2)

n particular, dac f1(t) = f2(t) = f(t) i lim f (t ) = 0 , atunci din (2.2.2) rezult
t

f 2 (t )dt =

1
f ( s ) f ( s )ds .
2 j j

(2.2.3)

Formulele (2.2.2) i (2.2.3) se numesc egalitile lui Parseval. O clas de funcii care verific
(2.2.3) n condiii de convergen a integralei este reprezentat de funciile de tip H2 (de exemplu, [D22]).
Remarc: s = + j C este variabila operaional.
n cazul n care f(s) este funcie raional strict proprie n s cu coeficieni reali,

f ( s) =

c m s m + ... + c1 s + c 0
, m < n, d n , d 0 0 ,
d n s n + ... + d1 s + d 0

(2.2.4)

evaluarea integralei din membrul drept al egalitii lui Parseval (2.2.3) conduce la rezultatul

(R.-E. Precup, UPT, 2013) 2.2 Probleme de optimizare parametric a regimurilor dinamice 63
Jn =

f 2 (t )dt = 2d
0

c
,

(2.2.5)

n care
d0
0
0
=
...
0

d2
d1
d0
...
0

d4
d3
d2
...
0

...
...
...
...
...

0
0
0
...
d n2

... d n 3

0
0
0
...
dn

(2.2.6)

d n 1

i c reprezint determinantul obinut din prin nlocuirea ultimei linii a lui cu linia
[C0 C1 ... C n1 ] , unde coeficienii sunt exprimai n (2.2.7):
C 0 = c02 ,
C1 = c12 2c0 c 2 ,
C 2 = c 22 2c1c3 + 2c0 c 4 ,

(2.2.7)

...
k

C k = c k2 2c k 1c k +1 + ... + (1) k 2c0 c 2 k = c k2 + 2 (1) l c k l c k +l ,


l =1

...
C n 1 = c n21 .

Observaii:
1. n relaia (2.2.7) k = 1, n 2 , iar pentru C0 i Cn-1 sunt utilizate formule speciale.
2. i c sunt determinani de ordinul n.
3. De cele mai multe ori n aplicaii este cunoscut f(s) (imaginea Laplace) i nu f(t) (funcia
original). n aceste situaii, pentru ca s fie asigurat condiia lim f (t ) = 0 este necesar ca toate
t

rdcinile numitorului lui f(s) s fie situate strict n semiplanul stng al planului complex asociat
variabilei s.
Relativ la relaia (2.2.4) sunt de interes cazurile particulare caracterizate prin m=n1,
prezentate n cele ce urmeaz.
o

Cazul n = 1 m = 0 f ( s ) =

c0
.
d1 s + d 0

Se obine: d n = d1 , = d 0 = d 0 . Aplicnd (2.2.7) rezult C 0 = c 02 c = c 02 = c 02 . n final se


efectueaz nlocuirile n (2.2.5), obinndu-se
c02
J1 =
.
2d 0 d 1
o

Cazul n = 2 m = 1 f ( s ) =

n acest caz se obine: d n = d 2 , =

d0
0

c1 s + c 0
d 2 s + d1 s + d 0
2

d2
= d 0 d1 . Aplicnd din nou relaia (2.2.7), rezult
d1

64 Elemente de optimizare a sistemelor de reglare automat 2 (R.-E. Precup, UPT, 2013)


C 0 = c 02 , C1 = c12 c =

d0

d2

c 02

c12

= c12 d 0 + c02 d 2 . Apoi, se efectueaz nlocuirile n (2.2.5), cu

rezultatul
J2 =

c12 d 0 + c 02 d 2
2d 0 d1 d 2

Cazul n = 3 m = 2 f ( s ) =

c 2 s 2 + c1 s + c 0
d 3 s 3 + d 2 s 2 + d1 s + d 0

d0

d2

Se particularizeaz: d n = d 3 , = 0
0

d1
d0

C1 =

c12

2c 0 c 2 , C 2 =

c 22

d0
, c = 0
c 02

0
d 3 = d 0 (d1d 2 d 0 d 3 ) . Se aplic (2.2.7) C0 = c02 ,
d2

d2
d1

0
d 3 = c 22 d 0 d 1 + (c12 2c 0 c 2 )d 0 d 3 + c 02 d 2 d 3 .

c12 2c 0 c 2

c 22

Aplicnd din nou relaia (2.2.5), se obine


c 2 d 0 d 1 + (c12 2c 0 c 2 )d 0 d 3 + c 02 d 2 d 3
J3 = 2
.
2d 0 d 3 ( d 1 d 2 d 0 d 3 )
B) Cazuri derivate din formulele de baz. Pornind de la formulele (2.2.1) (2.2.7), n continuare vor
fi abordate trei cazuri utilizate n practic.

B.1) Cazul lim f (t ) = f 0 = finit. Atunci, n locul integralei


t

funcie obiectiv integrala

f 2 (t )dt

prezint interes ca

( f (t ) f ) 2 dt .

~
Funcia definit sub forma f (t ) = f (t ) f satisface

~
condiia lim f (t ) = 0 i este funcie original, prin urmare verific egalitatea lui Parseval (2.2.3):
t

j
~ ~
~2
1
f (t )dt =
f ( s) f ( s )ds .
2 j j

c m' s m + ... + c1' s + c 0' 1


, atunci din teorema valorii finale de
d n s n + ... + d1 s + d 0 s
~
la transformarea Laplace se obine f = c 0' / d 0 . ns de regul expresia f ( s) = f ( s) f / s poate
avea forme relativ complicate datorit coeficienilor lui f(s) care, la rndul lor sunt funcie de anumii
parametri, de regul parametrii de acordare ai unui sistem de reglare automat (SRA). De aceea, se
~
recomand ca n locul formei (2.2.5), n care intr coeficienii lui f ( s) , s fie utilizat direct formula
1
Jn =
(C 0' 0 + C1' 1 + ... + C n' 1 n 1 2c 0' c1' ) ,
2d 02

Dac expresia lui f(s) este f ( s ) =

n care intr coeficienii lui f(s). este determinantul anterior; coeficienii C k' , k = 0, n 1 , au

expresiile coeficienilor Ck din formulele de baz nlocuind pe ck cu


prin nlocuirea coloanei (k+1) cu coloana [d 1

d0

0 ... 0]T .

ck' ; determinanii k se obin din

(R.-E. Precup, UPT, 2013) 2.2 Probleme de optimizare parametric a regimurilor dinamice 65

B.2) La optimizarea sistemelor dinamice, n particular a SRA, n cadrul FO apar att

termeni integrali de forma

f 2 (t )dt
0

forma [ f

( k ) (t )] 2 dt , k N

( f (t ) f ) 2 dt

deja discutai ct i termeni integrali de

Se

poate

demonstra

fr

dificultate

urmtorul

rezultat:

dac

lim f (t )

finit

lim f ( k ) (t ) = 0 . Prin urmare, pe baza egalitii lui Parseval (2.2.3) se obine


t

1
2 j

unde transformata Laplace f

(k ) (s)

J n( k ) = [ f

(k ) (s)

= L{ f

Dac f

( k ) (t )] 2 dt

( k ) (t )} =
(k ) (s)

sk

f (k ) ( s) f ( k ) ( s)ds ,

rezult din teorema derivrii originalului i are expresia

( s ) s k 1

f (0 + ) s k 2 f ' (0 + ) ... sf

( k 2 ) (0

+)

este forma raional strict proprie (2.2.4), atunci J n( k ) =

( k 1) (0

+)

1 c

, cu i c
2d n

avnd expresiile cunoscute (2.2.6) respectiv (2.2.7).

B.3) La optimizarea SRA intereseaz FO de forma J = t k f 2 (t )dt , cu proprietatea:


0

lim t k
t

2 (t )

= 0, k

n acest caz, din teorema derivrii imaginii de la transformarea Laplace este cunoscut faptul c:
d p f ( s)
L{t p f (t )} = ( 1) p
= F p ( s), p N . Pentru exprimarea funciei obiectiv se descompune k sub
ds p
forma: k = q + n, q, n N , se aplic egalitatea lui Parseval (2.2.2) i rezult:

2
k
q
n
t f (t )dt = [t f (t )] [t f (t )]dt =

1 j
Fq ( s) Fn ( s)ds ,
2 j j

cu notaia pentru Fq (s) i Fn (s ) definit anterior.


n cazul particular k = par, constantele q i n pot fi considerate egale, q = n = k / 2 i se obine:

J = t 2 q f 2 (t )dt =
0

1
2 j

Fq (s) Fq ( s)ds ,

situaie n care dac Fq (s) este raional avnd o expresie de tip (2.2.4) pentru J, poate fi aplicat
formula deja cunoscut (2.2.5).
C) Probleme de optimizare parametric a sistemelor cu timp continuu bazate pe utilizarea
egalitilor lui Parseval. n cele ce urmeaz va fi analizat cazul a dou tipuri de FO folosite n
optimizarea parametric a sistemelor dinamice cu timp continuu.

C.1) Cazul FO avnd expresia

J = { f 2 (t ) + 12 [ f ' (t )] 2 + ... + k2 k [ f

(k )

(t )] 2 }dt ,

(2.2.8)

n care f(t) este o funcie caracteristic a sistemului considerat, corespunztoare unui regim dinamic
bine precizat. De exemplu, pentru sistemele de reglare automat convenional (SRA-c, fig.2.1), de
cele mai multe ori f(t) = e(t) eroarea de reglare, f(t) = u(t) comanda sau f(t) = y(t) ieirea reglat.

66 Elemente de optimizare a sistemelor de reglare automat 2 (R.-E. Precup, UPT, 2013)

Fig.2.1. Schema bloc simplificat a unui SRA-c.

Celelalte elemente din fig.2.1 au semnificaia cunoscut: w intrarea de referin, u comanda, v


intrarea de perturbaie, RG regulatorul, PC procesul condus. Cazurile cele mai frecvent utilizate n
practic sunt surprinse n relaiile

J = e 2 (t )dt , J = [e 2 (t ) + 12 e& 2 (t )]dt ,

J = [e 2 (t ) + 2 u 2 (t )]dt , J = y 2 (t ) dt .

(2.2.9)

Dac e 0, u 0 sau y 0 , atunci n locul lui e, u sau y sunt folosite diferenele


(e(t ) e ), (u (t ) u ) i respectiv ( y (t ) y ) pentru a asigura convergena integralelor.
Ponderile (coeficienii de ponderare) i , i = 1, k , sunt constate cu dimensiunea timp, numite i
constante de timp de ponderare, iar este o constant cu dimensiunea aleas astfel nct s fie
asigurat omogenitatea integrandului din FO. Prin intermediul acestor parametri sunt ponderai n mod
diferit termenii componeni ai FO, acionndu-se astfel asupra aspectului funciei caracteristice n
sensul dorit de proiectant.

Remarc: n general, ntruct termenii sunt ptratici, mrirea coeficientului de ponderare a unui
termen conduce la reducerea ponderii termenului respectiv n valoarea minim a FO.

ncadrnd funciile obiectiv (2.2.8) i (2.2.9) n clasificarea prezentat n subcapitolul anterior


privind diferite probleme de optimizare, poate fi observat c problemele de optimizare bazate pe aceste
FO sunt de tip Lagrange, ecuaiile sistemului de optimizat reprezint restricii de tip egalitate, iar
parametrii de acordare p a reprezint elementele programabile ale problemei. Pe baza egalitilor lui
Parseval aceste probleme pot fi reduse la POS cu FO de tip Mayer, J = (p a ) , fr restricii
(probleme fr restricii, PFR)
PFR: p a = arg min J = (p a ), p a R qa .
pa

(2.2.10)

Procedeul de rezolvare a PFR, adic de determinare a parametrilor de acordare optimali, se


numete procedeul Hall-Phillips-Newton. n continuare va fi prezentat algoritmul de determinare a
minimului absolut pentru procedeul Hall-Phillips-Newton, care const n parcurgerea urmtoarelor
etape:
1. Se determin transformata Laplace a funciei caracteristice aferente fiecrui termen al FO
aducndu-se la forme canonice raionale n s. Trebuie respectat condiia ca rdcinile polinomului de
la numitorul funciei raionale n s s fie toate situate n semiplanul complex stng.
2. Folosind relaiile J n =

1
1 c
(C 0' 0 + C1' 1 + ... + C n' 1 n 1 2c0' c1' ) ,

sau J n =
2d 02
2d n

funcie de caz, se stabilete expresia FO (p a ) .


3. Se calculeaz gradientul p a i se rezolv ecuaia p a (p a ) = 0 (este vorba despre condiiile
de optimalitate de ordinul I) avnd ca soluii punctele staionare p a .

(R.-E. Precup, UPT, 2013) 2.2 Probleme de optimizare parametric a regimurilor dinamice 67
4. n punctele staionare se calculeaz hessianul p a p a (p a ) i se aleg acele valori p a ,i , i = 1, ,
care satisfac condiiile de optimalitate de ordinul II (vor fi explicitate ulterior) i care reprezint
punctele de minim relativ.
5. Se selecteaz minimul absolut (p a ) din cadrul minimelor relative (p a,i ), pe baza condiiei
(p a ) (p a ,i ) 0, i = 1, .

Observaii:

1. Revenind la notaia din (2.1.9) pentru variabilele problemei (elementele programabile ale
problemei) i observnd corespondena cu relaia (2.2.10), v=pa, n algoritmul prezentat a fost utilizat
pentru gradientul lui calculat n punctul v* (este vorba despre derivata unei funcii scalare de
variabil vectorial) notaia urmtoare:


v ( v) =
v1

v 2

...

v n v = v*

(2.2.11)

Calculul gradientului este necesar n condiiile de optimalitate de ordinul I din pasul 3 al


algoritmului prezentat i care apar n general n condiiile necesare pentru ca punctul v* s fie punct
de minim relativ, exprimate n general sub forma (2.2.12) i (2.2.13) (de exemplu, [P2-2]):
v (v* ) = 0 ,

(2.2.12)

vv ( v * ) 0 .

(2.2.13)

Condiia (2.2.12) se numete condiie de optimalitate de ordinul I, iar punctele v* care o verific se
numesc puncte staionare.
2. Condiia (2.2.13), denumit condiie de optimalitate de ordinul II, amintit la pasul 4 al
algoritmului prezentat, cere ca hessianul funciei obiectiv , calculat n punctul v*, s fie pozitiv
semidefinit (n notaia >0). Condiia se refer n general la derivata a doua a unei funcii reale de
variabil vectorial ce are forma unei matrice ptratice numit matricea lui Hess (hessian),

2
v21

vv ( v * ) = v v
2 1
...
2

v n v1

2
v1v 2
2
v 22
...
2
v n v 2

v1v n
2
...
.
v 2 v n

...
...
2
...
v n2 v = v*
...

(2.2.14)

3. Condiiile suficiente pentru ca punctul v* s fie punct de minim relativ strict sunt
v (v* ) = 0 ,

(2.2.15)

vv ( v * ) > 0 ,

(2.2.16)

alctuite din nou din condiia de optimalitate de ordinul I (2.2.15) i condiia de optimalitate de ordinul
II (2.2.16).
4. Pentru a fi verificate condiiile de extrem (2.2.12)-(2.2.13) i (2.2.15)-(2.2.16), funcia
trebuie s fie de clas C2 (de dou ori continuu difereniabil) avnd numai extreme netede (puncte de
extrem v* pentru care exist o vecintate n care este de clas C2 i v ( v * ) = 0 ).
5. n general, derivata unei funcii vectoriale de variabil vectorial f : R n R m n raport cu
vectorul x R n este matricea Jacobian de dimensiune (m, n),

68 Elemente de optimizare a sistemelor de reglare automat 2 (R.-E. Precup, UPT, 2013)

f1
f x1
T f
f 2
f x = 2,x = x1
... ...
f T f m
m ,x
x1
T
1, x

f1
x 2
f 2
x 2
...
f m
x 2

f1
x n

f 2
...
x n .
... ...
f m

...
x n
...

(2.2.17)

6. Sunt considerate utile n aplicaii urmtoarele relaii de calcul al gradienilor i formule de


derivare:
(a T x ) x = a ,

(2.2.18)

(x T b) x = b ,

(2.2.19)

unde a i b sunt matrice coloan constante de aceeai dimensiune cu x,


( A x) x = A ,

(2.2.20)

cu A, dim A = (m, n) matrice constant, x R n ,


(a T f ) x = f xT a ,

(2.2.21)

cu a matrice coloan constant de aceeai dimensiune cu f(x), f : R n R m .


7. La pasul 4 al algoritmului prezentat trebuie determinate punctele de minim relativ, care
satisfac condiiile de optimalitate de ordinul II exprimate sub forma relaiilor (2.2.13) sau (2.2.16). n
acest scop, se reamintete criteriul lui Sylvester, care trebuie aplicat matricei Hessian calculate n
punctele staionare (de exemplu, [V2-1]):
o matrice A este pozitiv definit, adic A > 0, dac i numai dac det A > 0 i toi minorii
principali ai lui A sunt strict pozitivi;
o matrice A este pozitiv semidefinit, adic adic A 0, dac i numai dac det A = 0 i toi
minorii principali ai lui A sunt pozitivi.

C.2) Cazul FO de forma J = t k f l (t )dt , cu k, l N , unde f reprezint funcia caracteristic


0

asociat SRA, corespunztoare unui regim dinamic bine precizat. Cazurile particulare de interes sunt
urmtoarele:

J = t e(t ) dt , J = te 2 (t )dt ; J = t 2 e 2 (t )dt ,

n condiiile lim e(t ) = 0 , precum i aceleai integrale, dar cu (e(t ) e ) n locul lui e(t) dac
t

lim e(t ) = e 0 finit.

Exemplul 2.1: Se consider sistemul de reglare automat a vitezei unui hidrogenerator (SRAV) avnd structura prezentat n fig.2.2, n care sunt puse n eviden: w referina de vitez, Cm
cuplul de rotaie dezvoltat de turbina hidraulic (TH), v perturbaia echivalent modificrii puterii
active, y ieirea reglat (viteza), e = w y eroarea de reglare, u comanda, RG-V regulatorul de
vitez, PC procesul condus alctuit din dou subsisteme, SAT subsistemul aduciune-turbin i
SGS subsistemul generator sincron-sarcin. n condiiile fluidului incompresibil i ale rigiditii
peretelui conductei de aduciune, funcia de transfer (f.d.t.) aferent SAT obine urmtoarea expresie
simplificat [M2-1]:
H SAT ( s) = y

T s
1 K qh
w

1 + 0.5 K qh
Tw s

(1)

(R.-E. Precup, UPT, 2013) 2.2 Probleme de optimizare parametric a regimurilor dinamice 69
care corespunde unui sistem cu faz neminim [I2-1].

Fig.2.2. Structura simplificat a unui SRA-V.

Considernd un studiu de caz reprezentat de reglarea turaiei unui hidrogenerator (HG) de


tipul celui din centrala hidroelectric Porile de Fier 1 (PdF 1), valoarea constantee de timp Tw,
calculat pe baza datelor nominale ale amenajrii conform [N2-1], este
Tw = 2.2 sec .

(2)

Pentru ceilali doi parametri literatura recomand urmtoarele valori uzuale [H2-1], [I2-2]:
[0.3; 1.3] ,
y [0.3; 1.3] , K qh

(3)

valori dependente de coordonatele punctului de funcionare staionar constant (p.d.f.s.c.) n


vecintatea cruia a fost efectuat liniarizarea modelului matematic detaliat al SAT [P2-3] i de
caracteristicile TH.
Expresia simplificat a f.d.t. aferente SGS este (de exemplu, [M2-1])
H SGS ( s ) =

1
,
+ Tm s

(4)

n care parametrul , numit coeficient de autoreglare a reelei, depinde de coordonatele p.d.f.s.c. n


jurul cruia a fost efectuat liniarizarea i, n acelai timp, reprezint o msur a gradului de cuplare
a generatorului sincron (GS) la sistem energetic (SE) / sarcin. poate lua urmtoarele valori
dependent de regimul de funcionare al GS (de exemplu, [P2-4]):
a) = 0 , pentru GS n gol (presincronizare) ;

(5)

b) (0; 1] , pentru GS cuplat la SE (sarcin) .

(6)

Valorile foarte mici ale lui corespund unui GS funcionnd izolat pe o sarcin local; valoarea lui
crete pe msur ce crete gradul de cuplare a GS la SE.
n relaia (4) Tm este constanta de timp mecanic a prii mobile (rotorului TH-GS); pentru HG
luat n considerare n cadrul studiului de caz acceptat Tm are valoarea
Tm = 6.8 sec .

(7)

Reunind modelelele matematice (MM) simplificate (1) i (7), se obine urmtoarea expresie de
aproximare pentru f.d.t. aferent procesului condus (PC):
H PC ( s ) = y

1 K qh
Tw s

1 + 0.5 K qh
T w s + Tm s

(8)

Procesul condus cu f.d.t. conform relaiei (8) reprezint un sistem cu faz neminim de ordinul
al doilea cu doi poli i un zero cu f.d.t. de form general (9), analizat n [P2-3],
H PC ( s ) = k PC

1 T1 s
,
(1 + T2 s )( 3 + T3 s )

(9)

n care: T1, T2 i T3 sunt constante de timp (strict pozitive), dintre care T1 i T2 sunt variabile, iar T3 este
constant; kPC > 0 i 3 0 sunt parametri variabili (cu valoarea dependent de condiii reale posibile
de operare ale procesului real).
Pentru studiul de caz al reglrii turaiei unui HG al unei centrale hidroelectrice de tipul celei de
la PdF 1 valorile numerice nominale ale parametrilor PC pentru un GS cuplat la SE sunt

70 Elemente de optimizare a sistemelor de reglare automat 2 (R.-E. Precup, UPT, 2013)

kPC = 1 , T1 = 2.2 sec , T2 = 1.1 sec , T3 = 6.8 sec, 3 = 1 .

(10)

Corespondena parametrilor ntre f.d.t. (8) i (9) este


T

Tw , T2 = 0.5 K qh
k PC = y , 3 = , T1 = K qh
w , T3 = Tm .

(11)

Pentru conducerea procesului menionat se constat (de exemplu, [P2-3]) c utilizarea unui RGV de tip PI cu f.d.t.

1
,
H R ( s ) = k R 1 +

Ti s

(12)

n care kR coeficientul de transfer i Ti constanta de timp de integrare, poate asigura sistemului de


reglare automat perfoemanele impuse.
Observaii:
1. Structura de SRA-V ilustrat n fig.2.2 cu f.d.t. a PC din relaia (8) sau (9) este acceptat n
stadiul de dezvoltare a RG-V i n cel de testare a performanelor de regim dinamic i staionar
realizabile de SRA-V prin simulare pe calculator numeric (de exemplu, [P2-4], [M2-1]). Trebuie

subliniat c parametrii { y , K qh
, } depind continuu (n permanen) de coordonatele p.d.f.s.c. n
jurul cruia a fost efectuat liniarizarea.
2. n schema din fig.2.2 putea fi pus n eviden i prezena unui element neliniar de tip
saturaie amplasat pe ieirea regulatorului, la care limitarea corespunde regimului de mari perturbaii.
n regimul de mici perturbaii PC poate fi considerat cu o bun aproximaie ca fiind liniar i limitarea
poate fi omis [P2-3]. Studiul dezvoltat n continuare se refer la cazul liniar, fr limitri, funcionare
la mici perturbaii fa de p.d.f.s.c. corespunztor frecvenei reelei de 50 Hz.
Pentru studiul de caz acceptat, pentru SRA-V cu structura prezentat n fig.2.2 se cere s se

stabileasc expresia FO J = [e 2 (t ) + 2 e& 2 (t )]dt pentru SRA-V cu structura prezentat n fig.2.2 n


0

funcie de parametrii de acordare strict pozitivi {kR, Ti} ai RG-V i apoi s se determine valorile
acestor parametri astfel nct J s obin valoarea minim n regimul dinamic caracterizat prin
aplicarea unui semnal de tip treapt unitate (t) pe intrarea de referin, w, a SRA: w(t) = (t) i
sistemul nu este perturbat, adic v(t) = 0.
Remarc: Optimizarea parametric a SRA poate fi efectuat att n raport cu regimul considerat
ct i n raport cu regimul dinamic v(t) = (t) , w(t) = 0, n ideea dezvoltrii unor SRA cu comportare
optimal n raport cu ambele regimuri.
Utilizarea unei FO de forma prezentat asigur un regim tranzitoriu corespunztor cu limitarea
ptratului erorii de reglare e(t). Se asigur suplimentar i limitarea valorii derivatei erorii de reglare,
e&(t ) , avnd ca efect limitarea valorii suprareglajului i, eventual, a subreglajului. Mrirea constantei

de tip de ponderare conduce la scderea ponderii termenului 2 e& 2 (t ) dt n valoarea minim a FO,
0

cu efectul reducerii valorii suprareglajului i, eventual, a subreglajului.


Soluie: innd seama de liniaritatea integralei, funcia obiectiv J poate fi descompus n alte
dou funcii obiectiv conform sumei

J = J * + 2 J ** , J * = e 2 (t )dt , J ** = e& 2 (t )dt .

(13)

Apoi se parcurg etapele din algoritmul aferent procedeului Hall-Phillips-Newton.


1, 2. Pentru FO J*, sistemul este simplu integrator i semnalul de intrare este de tip treapt
lim e(t ) = 0 egalitile lui Parseval sunt valabile.
t

(R.-E. Precup, UPT, 2013) 2.2 Probleme de optimizare parametric a regimurilor dinamice 71
Se calculeaz transformata Laplace a erorii de reglare pe baza schemei bloc din fig.2.2 utiliznd
expresiile (9) i (12) ale f.d.t. [P2-5]:
e( s ) =

1
1
1
w( s ) =
,
1 + H 0 (s) s
1 + H 0 ( s)

(14)

unde H0(s) este f.d.t. a sistemului deschis,


H 0 ( s ) = H R ( s ) H PC ( s ) =

k PC k R (1 sT1 )(1 + sTi )


.
sTi (1 + sT2 )( 3 + sT3 )

(15)

Dup efectuarea calculelor se obine


e( s ) =

(1 + sT2 )( 3 + sT3 )Ti


, A( s ) = T2 T3Ti s 3 +
A( s )

(16)

+ (T3 + 3T2 k PC k R T1 )Ti s + [ 3Ti + k PC k R (Ti T1 )]s + k PC k R .


2

Utiliznd expresia (16), se face identificarea coeficienilor conform formei utilizate n cazul n=3 (m=2)
al paragrafului A):
c 2 = T2 T3Ti , c1 = (T3 + 3T2 )Ti , c 0 = 3Ti , d 3 = T2 T3Ti , d 2 = (T3 +
+ 3T2 k PC k R T1 )Ti , d 1 = 3Ti + k PC k R (Ti T1 ) , d 0 = k PC k R .

(17)

ntruct m = n 1 = 2, FO J* este de tip J3, deci poate fi aplicat relaia din paragraful A):
J * = J3 =

c 22 d 0 d 1 + (c12 2c 0 c 2 )d 0 d 3 + c 02 d 2 d 3
2d 0 d 3 ( d 1 d 2 d 0 d 3 )

(18)

Utiliznd relaiile (17) i (18), rezult expresia FO J*:


J* =

B * ( s)
, B * ( s ) = T22 T32 ( 3Ti + k PC k R Ti
A* ( s)

k PC k R T1 )k PC k R Ti + (T32 + 32 T22 )k PC k R T2 T3Ti 2 + 32 (T3 +


+ 3T2 k PC k R T1 )T2 T3Ti3 ,

A* ( s)

(19)

= 2k PC k R T2 T3 [( 3Ti +

+ k PC k R Ti k PC k R T1 )(T3 + 3T2 k PC k R T1 ) k PC k R T2 T ]Ti .

Pentru FO J** trebuie calculat transformata Laplace e&(s ) , cu teorema derivrii originalului:
e&( s) = s e( s ) e(0 + ) .

(20)

ns, din teorema valorii iniiale rezult


e(0 + ) = lim s e( s) = 1 ,
s

(21)

deci utiliznd relaiile (16), (20) i (21), se obine


e&( s ) =

k PC k R [T1Ti s 2 (Ti T1 ) s 1]
,
A( s )

(22)

n care polinomul A(s) are expresia din (16). n continuare, se face identificarea coeficienilor din
expresia transformatei Laplace e&(s ) :
m = n 1 = 2, c 2 = k PC k R T1Ti , c1 = k PC k R (Ti T1 ) , c 0 = k PC k R ,
d 3 = T2 T3Ti , d 2 = (T3 + 3T2 k PC k R T1 )Ti , d 1 = 3Ti +

(23)

+ k PC k R (Ti T1 ) , d 0 = k PC k R .

Particulariznd din nou egalitile lui Parseval, se obine o relaie de tip (18) pentru J**, care se
transform n (24) prin utilizarea lui (23):

72 Elemente de optimizare a sistemelor de reglare automat 2 (R.-E. Precup, UPT, 2013)


J ** =

B ** ( s )
, B ** ( s ) = T12 ( 3Ti + k PC k R Ti
A* ( s)

3 k 3 T + (T 2 + T 2 ) k 3 k 3 T T + T T (T +
k PC k R T1 )k PC
i
2 3 3
R i
PC R 2 3
1

(24)

2
+ 3T2 k PC k R T1 ) k PC
k R2 Ti ,

n care polinomul A*(s) are expresia din (19).


Adunnd cele dou componente ale funciei obiectiv din (19) i (24) innd seama de
descompunerea (13), rezult expresia FO J:
J=

B * ( s) + 2 B ** ( s)
= (k R , Ti ) ,
A* ( s)

(25)

cu polinoamele conform relaiilor (19) i (24), iar formularea PO este urmtoarea:


PFR: [ kR

Ti ]T = arg minT J = ( k R , Ti ), k R > 0, Ti > 0 .


[ k R ,Ti ]

(26)

Remarc: Un aspect important de altfel la toate problemele de reglare optimal l constituie


impunerea condiiilor de stabilitate a SRA. Aceste condiii fac ca problema de optimizare iniial fr
restricii s se transforme ntro problem cu restricii de tip inegalitate care pot fi fixate, de exemplu,
prin aplicarea criteriului Hurwitz [R2-1], [V2-1].
Impunerea condiiilor de stabilitate a SRA conduce i la asigurarea convergenei integralelor din
componena FO (13).
Pentru surprinderea acestor aspecte, n subcapitolul urmtor vor fi prezentate elemente privind
rezolvarea problemelor de optimizare cu restricii de tip egalitate i de tip inegalitate.
3, 4. Paii 3 i 4 ai algoritmului implic efectuarea unor calcule legate de gradient i hessian,
care sunt relativ dificile pentru FO obinut. Pentru studiul de caz considerat i valorile parametrilor
PC din (10), poate fi apelat Optimization Toolbox din cadrul mediului Matlab [C2-1], care permite
rezolvarea PFR (26).
Prin apelarea funciei Matlab fminunc se obin urmtoarele valori ale parametrilor de acordare
optimal:
(a) k R = 1.4422 i Ti = 9.1299 sec pentru = 1 sec;
(b) k R = 1.1823 i Ti = 8.1229 sec pentru = 2 sec;
(c) k R = 0.9748 i Ti = 7.4146 sec pentru = 3 sec.
Acceptnd un scenariu de simulare caracterizat prin w(t) = (t), v(t) = (t50), pe o durat de
100 sec, n fig.2.3 este ilustrat n cazul (b) rspunsul SRA optimal a vitezei HG, caracterizat prin
evoluia n funcie de timp a ieirii reglat y (reprezentat cu linie continu) i a comenzii u
(reprezentat cu linie punctat). Rspunsul prezentat evideniaz valori bune ale indicatorilor de
calitate empirici precum i stabilitatea SRA-V.

(R.-E. Precup, UPT, 2013) 2.2 Probleme de optimizare parametric a regimurilor dinamice 73

Fig.2.3. Rspunsul SRA optimal a vitezei HG din exemplul 2.1.


D) Probleme de optimizare parametric a sistemelor cu timp discret bazate pe utilizarea
egalitilor lui Parseval. Fie f k R eantioanele unui semnal stabil cauzal i FO ptratic general

J = f k2 .

(2.2.22)

k =0

Fie transformata Z a acestor eantioane, notat cu f(z) = Z{fk}. Atunci, conform unui raionament
similar celui din paragraful A), FO (2.2.22) poate fi exprimat n form operaional sub forma
egalitii de tip Parseval (2.2.23):

J = f k2 =
k =0

1
2 j

f ( z) f ( z

) z 1 dz .

(2.2.23)

z =1

n cazul n care produsul din (2.2.23) poate fi adus la forma


f ( z ) f ( z 1 ) z 1 = g ( z ) g ( z 1 ) z 1 ,

(2.2.24)

n care g(z) este o funcie raional strict proprie stabil, cu expresia (2.2.25):
g ( z) =

B( z ) bm z m + ... + b1 z + b0
=
,
A( z ) a n z n + ... + a1 z + a 0

(2.2.25)

cu m < n, a n , a 0 0, m = n 1, bn 1 0 (n cazul general), integrala din relaia (2.2.23) poate fi adus


la o form raional. Pentru aceasta, utiliznd notaia (2.2.25), integrala din (2.2.23) se transform n

J=

1
2 j

B( z ) B( z 1 ) 1
A( z) A( z 1 ) z dz .
z =1

(2.2.26)

Apoi, pentru a face trecerea de la planul complex z la planul complex s, se efectueaz transformarea
conform w (de exemplu, [I2-1]):
z=

1+ w
,
1 w

(2.2.27)

74 Elemente de optimizare a sistemelor de reglare automat 2 (R.-E. Precup, UPT, 2013)

care transform discul z 1 din planul z n semiplanul Re w 0 din planul w. Din relaia (2.2.27)
rezult difereniala
dz =

2dw
.
(1 w) 2

(2.2.28)

Prin aplicarea transformrii (2.2.27), polinoamele A( z ), A( z 1 ), B( z ) i B( z 1 ) devin


A( z ) z =1+ w =

D( w)
D( w)
, A( z 1 ) 1 1 w =
,
n
z
=
(1 w)
(1 + w) n
1+ w

B( z ) z =1+ w =

C ( w)
C ( w)
, B( z 1 ) 1 1 w =
.
n 1
z
=
(1 w)
(1 + w) n 1
1+ w

1 w

1 w

(2.2.29)

S-au obinut, deci, polinoamele C(w) i D(w) de grad (n1), respectiv n, care sunt definite n (2.2.29).
n continuare, prin utilizarea relatiilor (2.2.27) (2.2.29), FO din (2.2.26) poate fi rescris sub forma
j

C ( w) C ( w)
1

J=
dw .

j j D ( w) D ( w)

(2.2.30)

Introducnd notaiile
c w n 1 + ... + c1 w + c 0
C ( w)
= h( w) = n 1 n
, dn , d0 0
D( w)
d n w + ... + d1 w + d 0

(2.2.31)

relaia (2.2.30) devine


j

J = 2J ' = 2

1
h( w) h( w)dw .
2 j j

(2.2.32)

Concluzionnd, pentru integrala J ' din (2.2.32) pot fi aplicate relaiile prezentate n paragraful A),
specifice sistemelor cu timp continuu, care permit aducerea integralei la forme raionale continue.
Urmeaz aplicarea procedeului Hall-Phillips-Newton similar cazului cu timp continuu.
Remarc: Valabilitatea trasformrii (2.2.27) trebuie analizat de la caz la caz cu atenie
deosebit n cazul sistemelor de ordin relativ mare [S2-1]. Calculele pot deveni foarte complicate,
motiv pentru care este recomandat algoritmizarea.
Exemplul 2.2: Se consider servosistemul de ordinul nti, cu timp discret, cu structura
simplificat prezentat n fig.2.4, n care H0(z) este f.d.t. a sistemului deschis care include elementul de
eantionare i reinere (zero-order-hold, ZOH).

Fig.2.4. Schema bloc a SRA-c din exemplul 2.2.

S se determine valoarea coeficientului de transfer k care asigur minimizarea FO J =

ek2

k =0

condiiile aplicrii unui semnal de tip treapt unitate pe intrarea de referin w.


Soluie: Pe baza schemei bloc din fig.2.4 se calculeaz
1
1
z
z
=
e( z ) = w( z )
=

. Produsul e( z ) e( z 1 ) z 1 se transform n
k
1 + H 0 ( z) z 1
z + k 1
1+
z 1

(R.-E. Precup, UPT, 2013) 2.2 Probleme de optimizare parametric a regimurilor dinamice 75
1
1
1
1
1
z
z

= g ( z ) g ( z 1 ) z 1 ,
e( z ) e( z 1 ) z 1 =
z + k 1 1
z z + k 1 1
z
+ k 1
+ k 1
z
z
2dw
1+ w
1
. Aplicnd transformarea conform w sub forma z =
, cu dz =
,
unde g ( z ) =
z + k 1
(1 w) 2
1 w

expresia lui J devine succesiv:


j

1
1
1
1 w
2dw
J=

1 w
2 j j 1 + w
1 + w (1 w) 2
+ k 1
+ k 1
1 w
1+ w
j

1
1
1
1
= 2

dw = 2
h( w) h( w)dw ,

2 j j
2 j j ( 2 k ) w + k + 1 ( k 2) w + k + 1
1
.
(2 k ) w + k + 1
Pentru calculul ultimei integrale pot fi aplicate formulele cunoscute din paragraful A). Astfel,
prin identificarea coeficienilor, n = 1, m = 0, c0 = 1, d1=2k, d0 = k+1 i aplicarea formulei cunoscute
pentru J1, rezult
c 02
1
1
J = 2J1 = 2
= 2
= 2
= (k ) .
2(2 k )(k + 1)
2d 0 d 1
k k 2
Prin urmare, problema de optimizare poate fi formulat astfel:
PFR: k = arg min J = (k ), k > 0 .

unde a fost utilizat notaia: h( w) =

Se calculeaz gradientul FO: k =

d
2k 1
= 2
= 0 punctul staionar k = 1 / 2 .
dk (k k 2) 2

Apoi, n acest punct staionar se calculeaz valoarea hessianului:


2(...) 2 (2k 1)(...)
d 2
2
kk (k ) = 2
=
= 2
>0,
dk k =1 / 2
k
k
(...) 4
(

2) 2 k =1 / 2
k =1 / 2
cu poriunea punctat din parantez () corespunztoare factorului (k 2 k 2) .
Poate fi observat faptul c k este punct de minim, este unicul, deci k = 1 / 2 (soluia
problemei). n final, pentru valoarea optimal a lui k , k = 1 / 2 , se verific stabilitatea SRA. Se pornete
de la exprimarea polinomului caracteristic al SRA:
k
1 + H 0 ( z) = 0 1 +
= 0 z + k 1 = 0
z 1
se obine polinomul caracteristic ( z ) = z + k 1 , cu polul p1 = 1 k = 1 / 2 . Cum |p1|<1, se poate trage
concluzia c SRA optimal este stabil.
Remarc: Rmne n seama cititorului particularizarea polinoamelor A, B, C i D din relaiile
(2.2.25), (2.2.29), (2.2.30) i (2.2.31).

2.3. Probleme de optimizare cu restricii


n cadrul acestui capitol vor fi tratate probleme de optimizare cu restricii de tip egalitate
(probleme cu restricii de tip egalitate, PRE) i probleme de optimizare cu restricii de tip inegalitate
(probleme cu restricii de tip inegalitate, PRI).

76 Elemente de optimizare a sistemelor de reglare automat 2 (R.-E. Precup, UPT, 2013)

2.3.1. Optimizarea cu restricii de tip egalitate


O problem de optimizare cu restricii de tip egalitate are enunul
PRE: v = arg min J = ( v ) , supus la g ( v) = 0 ,

(2.3.1)

n
n care : R n R , g : R n R g i g ( v ) = 0 reprezint un numr de ng restricii de tip egalitate
(RTE) liniar independente.

Remarc: Situaia n care ng n nu constituie o PO ntruct cu primele n RTE poate fi construit


un sistem de n ecuaii cu n necunoscute care, dac este compatibil determinat i dac soluia sa verific
i restul de (ng n) ecuaii, ea reprezint soluia problemei (nu de optimizare), iar dac nu le verific
sau dac sistemul este incompatibil, problema nu are soluie.
Se consider c funciile i g sunt de clas C2. Punctele de extrem ale acestei probleme se
numesc puncte de extrem condiionat.
Cele mai rspndite metode pentru rezolvarea problemei sunt: metoda substituiei i metoda
multiplicatorilor lui Lagrange, abordate n continuare.
A) Metoda substituiei. La rezolvarea PRE utiliznd metoda substituiei se ncepe cu rezolvarea
sistemului de ecuaii reprezentat de RTE n raport cu ng variabile obinnd soluia v care este funcie
de restul de (n ng) variabile v, adic v=r(v). Apoi, soluia v este substituit n FO, rezultnd n
acest mod o PFR de ordinul (n ng). Pentru aceast PFR funcia obiectiv are expresia

J = ( v) = ([( v' ) T

( v' ') T ]T ) = ([(r ( v ' ' )) T

( v ' ') T ]T ) = ( v' ' ) ,

(2.3.2)

iar PO devine
nn
PFR: v ' ' = arg min J = ( v' ' ), v' ' R g .
v ''

(2.3.3)

n continuare, va fi determinat soluia PRE conform algoritmului din subcapitolul anterior:

v = [(r( v ' ' ))T

( v ' ') T ]T .

(2.3.4)

De cele mai multe ori metoda substituiei nu poate fi aplicat n mod direct. Dificultile apar
la calculul analitic al soluiei v=r(v), calcul care poate fi fcut doar n cazuri particulare. De
asemenea, forma concret a PO sugereaz de multe ori utilizarea unei alte metode, mai simple, de
optimizare. Totui, metoda substituiei este aplicabil ca instrument auxiliar altor metode de
optimizare. Eliminarea prin substituie chiar a unui numr mai mic de variabile dect ng simplific de
obicei rezolvarea PO considerate. Restul de restricii i variabile rmase se trateaz apoi cu o alt
metod de rezolvare a PO cu RTE.
B) Metoda multiplicatorilor lui Lagrange. Aceast metod presupune introducerea unei funcii
numit funcie Lagrange (lagrangean), definit astfel:
L ( v ) = ( v ) + T g ( v ) , L : R n R .

(2.3.5)

Vectorul coloan , dim = (ng, 1), este constant i componentele sale, n numr egal cu numrul
RTE, se numesc multiplicatorii lui Lagrange.
Observaie: n multe situaii se folosete notaia L(v; ) pentru lagrangean.
Dac punctul v* este punct de extrem condiionat, atunci ntruct g( v * ) = 0 , n acest punct
valoarea FO i valoarea lagrangeanului coincid, adic
J = ( v ) = ( v ) + T g( v ) = L( v ) , R n g .

(2.3.6)

(R.-E. Precup, UPT, 2013) 2.3 Probleme de optimizare cu restricii 77


Notnd cu gi, i = 1, n g , componentele lui g, dac derivatele lui gi n raport cu v (gradienii lui gi) n
punctul v* sunt vectori liniari independeni, atunci punctul v* se zice punct regulat (de extrem
regulat).
Din analiza matematic este cunoscut urmtorul aspect: dac v* este punct de extrem regulat,
atunci exist ntotdeauna vectorul care, mpreun cu v*, ndeplinete condiiile
v ( v ) = 0 ,

(2.3.7)

Lv ( v ) = 0 i g( v ) = 0 .

(2.3.8)

Condiiile (2.3.7) sau (2.3.8) reprezint condiiile de optimalitate de ordinul I n cazul PRE. Se observ
c sunt in numar de (n+ng) i pot fi privite ca un sistem de (n+ng) ecuaii cu acelai numr de
necunoscute (n datorate lui v i ng datorate lui ). De aceea, relaiile (2.3.8) se numesc condiiile de
optimalitate de ordinul I completate. Rezolvarea sistemului (2.3.8) conduce la punctele regulate v*.
Condiiile necesare pentru ca un punct regulat v* s fie punct de minim local pentru PRE sunt
(2.3.8) i condiiile de optimalitate de ordinul II, care n acest caz sunt exprimate sub forma (de
exemplu, [D2-1]):
zT Lvv ( v )z 0 , z R n cu g v ( v )z = 0 ,

(2.3.9)

unde a fost utilizat urmtoarea notaie relativ la derivata unei funcii vectoriale de variabil
vectorial (a se vedea i relaia (2.2.17)):

g1
v
1
g 2
g v = v1
...
g
ng
v1

g1
v 2
g 2
v 2
...
g ng
v 2

g1
v n
g 2
...
v n
...
...
g ng
...
v n
...

(2.3.10)

Condiiile suficiente de optimalitate sunt (2.3.8) i (2.3.9) n care inegalitatea este strict.
Dac Lvv ( v ) > 0 , atunci punctul v* este un punct de minim; dac Lvv ( v ) < 0 , atunci v* este un
punct de maxim. Restricia g v ( v )z = 0 din (2.3.9) devine activ numai dac L vv ( v ) 0 sau dac
hessianul nu este nici pozitiv, nici negativ definit.
Pentru verificarea relativ uoar a condiiilor de optimalitate de ordinul II este prezentat
urmtoarea teorem [D2-1] (fr demonstraie).
Teorema 2.1: Relaiile (2.3.9) care exprim condiiile de optimalitate de ordinul II sunt
echivalente cu

{r

rI L vv ( v ) g Tv ( v )

g v (v )

=0

} R+ ,

dim 0 = (ng, ng),

(2.3.11)

adic v* este punct de minim dac toate rdcinile ecuaiei (2.2.11) sunt situate n R+. Pentru punctele
de maxim R+ este nlocuit de R.
Pe baza rezultatelor anterioare, poate fi formulat algoritmul de rezolvare a PRE cu metoda
multiplicatorilor lui Lagrange, cu etapele:
1. Se formeaz functia lui Lagrange, L(v). Se calculeaz gradientul acesteia i se determin
punctele staionare v* i multiplicatorii lui Lagrange ca soluii ale sistemului
Lv ( v ) = 0
.

g( v ) = 0

(2.3.12)

78 Elemente de optimizare a sistemelor de reglare automat 2 (R.-E. Precup, UPT, 2013)


2. Pentru fiecare punct staionar v* se calculeaz hessianul Lvv ( v ) n care multiplicatorii lui
Lagrange se nlocuiesc cu valorile obinute la etapa 1, apoi:
a) se selecteaz minimele relative v i , i = 1, n1 , obinute direct din condiia Lvv ( v i ) > 0 ;
b) din punctele staionare rmase se selecteaz punctele v i , i = n1 + 1, n2 , care satisfac relaia
(2.3.11);
c) din punctele staionare rmase se determin un ultim grup de minime relative v i , i = n2 + 1, n3 ,
pe baza derivatelor de ordin superior ale lagrangeanului (se continu dezvoltarea n serie
Taylor).
3. Se determin punctul de minim global / absolut v din cadrul minimelor relative v*i pe baza
inegalitii
( v ) ( v *i ) 0 , i = 1, n 3 .

(2.3.13)

Se constat simplificarea calculelor dac se combin metoda multiplicatorilor lui Lagrange cu


metoda substituiei. Fiecare substituie reuit reduce cu 2 (o variabil i un multiplicator) numrul de
ecuaii din condiiile de optimalitate de ordinul I. n paragraful urmtor va fi prezentat un exemplu de
aplicare a metodei multiplicatorilor lui Lagrange.

2.3.2. Optimizarea cu restricii de tip inegalitate


O problem de optimizare cu restricii de tip egalitate are enunul
PRI: v = arg min J = ( v ) , supus la h( v) 0 ,
v

(2.3.14)

n care : R n R , h : R n R nh .

Observaii:
1. Funciile i h se presupun de clas C2.
2. Dac problema impune RTI de forma h( v) 0 , prin nmulire cu (1) va rezulta h( v ) 0 .
Fie hi ( v), i = 1, nh , componentele lui h. Dac un punct v satisface RTI, atunci v este punct
admisibil. O restricie se zice activ (saturat) cnd ea acioneaz la limit ca egalitate. Se noteaz cu
(v) mulimea indicilor restriciilor active n punctul v admisibil:
( v) = {i | hi ( v ) = 0, i = 1, n h } .

(2.3.15)

Se zice c punctul admisibil v* este regulat dac gradienii hi , v , i ( v ) , sunt liniar independeni n
v*.

Metodele de rezolvare a PRI pot fi categorisite n dou categorii:


grafo-analitic,
metoda multiplicatorilor lui Lagrange.

n continuare vor fi fcute referiri la metoda multiplicatorilor lui Lagrange. Problema se


trateaz iniial ca o PFR, a crei soluie, v FR , trebuie s satisfac cele nh RTI iar v FR este punctul de
optim cutat. Dac este nclcat cel puin una din RTI, atunci soluia se afl pe frontiera domeniului
punctelor admisibile, adic ntr-un punct n care cel puin una din restricii este activ.
Dac se tie care din RTI este nclcat, se reia problema ca o PRE lund ca RTE doar pe cea
nclcat (care, astfel, devine activ). n general, ns, nu se cunoate RTI nclcat, aa c PRE se
rezolv pentru fiecare RTI n parte, punctul de minim determinat n fiecare caz, v RE1 j , j = 1, n h ,
trebuind s verifice toate RTI.

(R.-E. Precup, UPT, 2013) 2.3 Probleme de optimizare cu restricii 79


Dac nici una din soluii nu satisface aceast condiie, atunci se reia PRE considernd ca RTE
cte dou din RTI care devin, astfel, saturate. Punctul de minim gsit n fiecare caz, v RE 2 j , j = 1, C n2h ,
trebuie s verifice celelalte RTI. n caz contrar, se iau 3 RTE .a.m.d. pn ce soluiile PRE,
v RElj , j = 1, C nl

verific toate celelalte RTI.

Lagrangeanul problemei are expresia


L( v; ) = ( v) + T h( v) ,

(2.3.16)

unde L : R n R i R nh reprezint vectorul multiplicator al lui Lagrange, numii n cazul PRI


multiplicatori Kuhn-Tucker.
Condiiile necesare ca un punct regulat v* s fie punct de minim local pentru PRI (2.3.14)
sunt:
- condiiile de optimalitate de ordinul I:

h( v ) 0,

Lv ( v , ) = 0,

0, hT ( v ) = T h( v ) = 0;

(2.3.17)

- condiiile de optimalitate de ordinul II:


z T Lvv ( v ; )z 0 , z R n cu hiT, v ( v )z = 0 , i ( v ) .

(2.3.18)

Se observ c prima i cea de-a treia relaie din condiiile de optimalitate de ordinul I corespund
situaiilor:
i ( v ) hi ( v ) = 0 i i 0 ,

(2.3.19)

i ( v ) hi ( v ) > 0 i i = 0 ,

(2.3.20)

cu observaia c situaiile din (2.3.19) i (2.3.20) se exclud reciproc (pentru aceeai restricie este
valabil doar una dintre ele). Condiiile suficiente difer de cele necesare doar prin ultima relaie, n
care inegalitatea este strict.
Exemplul 2.3: S se determine minimul FO

J = ( x1 , x 2 ) = ( x1 1) 2 + ( x 2 1) 2 , x = [ x1

x 2 ]T R 2 ,

x 2 + x 22 1
x 2 + x 22 1 0
1
.
supus la RTI 1
x1 + x 2 3
x1 + x 2 3 0

Soluie: Se ncepe cu rezolvarea PFR: x FR = arg min J = (x), x R 2 .


x

Gradientul are expresia:

x1 = 1
2( x 1) 0
x = 1
=

, x = [1 1]T punct staionar.

x2 = 1
2( x 2 1) 0
Hessianul devine
2 0
*
xx =
> 0 x este punct de minim relativ.
0 2
ntruct x* este unic x FR = x = [1, 1]T .
Apoi, se verific cele dou RTI:
prima: 1 + 1 1 0;
a doua: 1 + 1 3 < 0 nu este verificat.
Deci, este necesar rezolvarea urmtoarei probleme de optimizare cu metoda multiplicatorilor
lui Lagrange conform algoritmului din paragraful 2.3.1:

80 Elemente de optimizare a sistemelor de reglare automat 2 (R.-E. Precup, UPT, 2013)


PRE: x RE12 = arg min J = (x), x R 2 , supus la x1 + x2 3 = 0 .
x

Lagrangeanul pentru aceast PO are expresia:


L ( x1 , x 2 ; ) = ( x1 1) 2 + ( x 2 1) 2 + ( x1 + x 2 3) .
Se caut punctele staionare ca soluii ale sistemului:
L x1 = 2( x1 1) + = 0 x1 = 1 / 2

L x2 = 2( x 2 1) + = 0 x 2 = 1 / 2 .

x1 + x 2 3 = 0

nlocuind n relaia a treia, se obine 1 / 2 + 1 / 2 3 = 0 = 1 , de unde rezult:


x1 = 3 / 2, x 2 = 3 / 2 x = [3 / 2 3 / 2]T .
Hesianul lagrangeanului obine expresia:
2 0
*
Lxx (x * ; ) =
> 0 x este punct de minim relativ.
0 2
ns, x* este unic x RE12 = [3 / 2 3 / 2]T .
Dar, x RE12 astfel determinat verific i cea de-a doua RTI. Prin urmare, x = [3 / 2 3 / 2]T este
minim absolut (soluia PRI).

Exemplul 2.4: S se rezolve problema de optimizare din exemplul 2.3 utiliznd multiplicatorii
Kuhn-Tucker.

Soluie: Se ncepe cu identificarea datelor problemei conform formulrii standard:

h1 (x) = x12 + x 22 1 , x = [ x1

x 2 ]T , h2 (x) = x1 + x 2 3 ,

L(x; ) = L(x; 1 , 2 ) = (x) + T h(x) = (x) + 1 h1 (x) + 2 h2 (x) =


= ( x1 1) 2 + ( x 2 1) 2 + 1 ( x12 + x 22 1) + 2 ( x1 + x 2 3) .
Condiiile de optimalitate de ordinul I devin
h1 ( x ) 0 ( x1 ) 2 + ( x 2 ) 2 1 0 ,

(1)

h2 ( x ) 0 x1 + x2 3 0 ,

(2)

L x (x ; ) = 0 L x1 (x ; ) = 0 2( x1 1) + 2 1 x1 + 2 = 0 ,

(3)

Lx2 (x ; ) = 0 2( x2 1) + 21 x2 + 2 = 0 ,
hi ( x ) = 0 i i 0 , i = 1,2 ,

(4)
(5)

sau (exclusiv):
hi ( x ) > 0 i i = 0 , i = 1,2 .

(6)

Rezolvnd sistemul (3), (4) n raport cu x1 i x 2 , se obine x1 =


x 2 n expresia lui h1 ( x ) , rezult h1 (x ) =

2 2
= x 2 . nlocuind apoi x1 i
2(1 + 1 )

(2 2 ) 2
2 4 2 + 22 4 1 221

1
=
. n cele ce
2(1 + 1 ) 2
2(1 + 1 ) 2

urmeaz sunt posibile dou cazuri, I) i II).

I) Cazul

h1 ( x ) = 0

(situaia (5) pentru h1). Se obine

( 2 2 ) 2 = 2(1 + 1 ) 2

2 2 = 2 (1 + 1 ) i rezult 1 0 (din (5)). nlocuind apoi x1 i x 2 n expresia lui


h2 ( x ) , rezult

(R.-E. Precup, UPT, 2013) 2.3 Probleme de optimizare cu restricii 81


2 2
2 (1 + 1 )
3 =
3 = 2 3 < 0 . Deci, acest caz nu convine (h2 nu satisface nici
1+ 1
1+ 1
(5) nici (6)). Prin urmare, este necesar cazul II (situaia (6) pentru h1).
h2 (x ) =

II) Cazul 1 = 0 . Se obine h1 (x ) =

2 4 2 + 22

2 (,2 2 ) (2 + 2 , ) ; h2 (x ) =

> 0 ( 2 2 2 )( 2 2 + 2 ) > 0

2 2
3 = 2 2 3 = 1 2 . Prin urmare, rezult
1+ 1

dou subcazuri posibile, II.1) i II.2).

II.1) Cazul h2 (x ) > 0 (situaia (6) pentru h2). n aceast situaie este valabil relaia
1 2 > 0 2 < 1 2 0 , deci acest caz nu convine. Prin urmare, este necesar cazul II.2).
II.2) Situaia (5) pentru h2, deci cazul h2 ( x ) = 0 2 = 1 0 i
2 (,2 2 ) (2 + 2 , ).

De

aceast

dat

se

obine

1 =0

2 = 1,

deci

x = [3 / 2 3 / 2] este punct staionar.


T

Hessianul calculat n x* are expresia


2 0
*
Lxx (x * ; ) =
> 0 x este punct de minim relativ, unic.
0
2

n concluzie, soluia PRI va fi: x = [3 / 2 3 / 2]T minim absolut.


Valoarea minim a funciei obiectiv pentru problema dat este:
J min = (x ) = (3 / 2 1) 2 + (3 / 2 1) 2 = 2(1 / 2) 2 = 0.5 .
Remarc: Pentru rezolvarea asistat de calculator a PO cu restricii poate fi apelat funcia
Matlab fmincon.

2.4. Elemente de optimizare parametric a sistemelor de reglare automat cu


reacie dup stare cu timp continuu
Se consider structura de sistem de reglare automat cu reacie dup stare (SRA-x) cu schema
bloc informaional prezentat n fig.2.5, n care: u U Rm vectorul mrimilor de comand;
yYRp vectorul mrimilor de ieire; x X Rn vectorul de stare; w W Rm vectorul
mrimilor de referin (prescriere); v V Rq vectorul mrimilor perturbatoare; BC-x blocul de
compensare prin reacie dup stare (compensatorul stabilizator). Se consider c procesul condus (PC)
este neliniar i caracterizat prin urmtoarele ecuaii de stare:
x& (t ) = f (x, u, t ) ,
(2.4.1)

Fig.2.5. Structura unui SRA-x.

82 Elemente de optimizare a sistemelor de reglare automat 2 (R.-E. Precup, UPT, 2013)


n care f: Rm+n+1 R este o funcie de clas C2. ntruct intereseaz doar comportamentul dinamic al
SRA-x, adic doar regimurile tranzitorii, pentru simplitate se accept regimul liber al SRA-x, ceea ce
presupune intrri nule:

w(t) = 0, v(t) = 0.

(2.4.2)

BC-x de tip proporional este caracterizat printro funcie vectorial K de variabil vectorial aferent
legii de reglare prin reacie dup stare:

u = K(x).

(2.4.3)

Problema de conducere optimal n aceast situaie const n determinarea comenzii optimale


(matricei K) astfel nct FO de tip Bolza
t

J = ( x, t )

f
t =tf
+ E (x, u, t )dt ,
t = t 0 t0

(2.4.4)

cu funcia E corespunztor definit i de clas C2, s-i ating minimul. n plus, sub forma unor
restricii de tip egalitate se dau:
condiii iniiale asociate lui x:

x(t0) = x0,

(2.4.5)

condiii finale asociate lui x:


x(tf) = xf.

(2.4.6)

Condiia (2.4.6) corespunde situaiei frecvent ntlnite cnd se cere ca PC s ajung n starea final de
repaus; ns, din punct de vedere tehnic este vorba de un repaus relativ n sensul c variabilele au
semnificaia de creteri n raport cu punctul de funcionare nominal, deci, se cere ca PC s fie readus
n starea nominal. Rezolvarea problemei de optimizare menionate se face pe baza principiului
minimului al lui Pontryagin, a crui formulare este prezentat succinct n cele ce urmeaz (de
exemplu, [P2-2]):
Se definete funcia lui Hamilton (hamiltonianul)

H(x, u, , t) = E(x, u, t) + T f(x, u, t),

(2.4.7)

unde R este vectorul de stare adjunct.


Se impune condiia
~ U | H ( x, u
~, , t ) < H (x, v, , t ) , v U } ,
u = {u

(2.4.8)

interpretabil prin aceea c la orice moment de timp t pentru care x i sunt bine determinate,
comanda optimal u este acea comand pentru care hamiltonianul problemei ia valoarea mimim.
Se formuleaz ecuaiile adjuncte
& = H (x, u, , t ) .
(2.4.9)
x

Se rezolv sistemul (2.4.1), (2.4.8), (2.4.9) pentru t [t0, tf] n condiiile (2.4.5), (2.4.6) i
(2.4.10):

H(x, u, , tf) = tf,

(2.4.10)

n raport cu necunoscutele x, u i , rezultatul fiind exprimat sub forma relaiei (2.4.3).


Un caz particular al problemei de optimizare prezentate l constituie problema regulatorului
liniar-ptratic n cazul omogen staionar, la care FO este de tip Lagrange

J = (1 / 2) [x T (t )Q x(t ) + u T (t )R u(t )]dt ,

(2.4.11)

t0

cu matricele de ponderare simetrice Q i R pozitiv semidefinit de dimensiune (n,n), respectiv pozitiv


definit de dimensiune (m,m). Se consider c PC este liniar invariant n timp, caracterizat matematic
prin ecuaiile de stare

(REP) 2.4 Elemente de optimizare parametric a sistemelor de reglare automat cu reacie dup stare 83
x& (t ) = A x(t ) + B u(t ) , t [t 0 , ) ,

(2.4.12)

cu A de dimensiune (n, n) i B de dimensiune (n, m). Rezolvarea problemei parcurge calea cunoscut
folosind funcia lui Hamilton
H ( x, u, , t ) = (1 / 2) x T Q x + (1 / 2)u T R u + T ( A x + B u), t [t 0 , ) .

Ecuaiile adjuncte (2.4.9) devin


& = Q x + A T , t [t , ) ,
0

(2.4.13)
(2.4.14)

cu observaia c relaia (2.4.14) a fost obinut n urma utilizrii operaiilor de derivare de tip (5.2.12)
i (5.2.13). Impunnd condiii de minim (n raport cu u) hamiltonianului, rezult

Hu = 0,

(2.4.15)

R u + BT = 0, t [t0, ),

(2.4.16)

deci
de unde se obine

u = R-1 BT , t [t0, ).

(2.4.17)

Se caut o soluie de forma


= S x, t [t0, ),

(2.4.18)

n care matricea constant S este simetric, pozitiv semidefinit, de dimensiune (n,n). Substituind
vectorul de stare adjunct din relaia (2.4.18) n relaia (2.4.14), rezult
S x& = Q x + AT P x, t [t0, ).

(2.4.19)

Apoi, n ecuaia (2.4.19) se nlocuiete derivata vectorului de stare conform relaiei (2.4.12) i se
obine n final ecuaia matriceal algebric Riccati

S A + AT S S B R-1 BT S + Q = 0.

(2.4.20)

Prin urmare, problema regulatorului liniar-ptratic n cazul omogen staionar se reduce la rezolvarea
ecuaiei matriceale algebrice Riccati (2.4.20) n raport cu S. innd seama de relaiile (2.4.17) i
(2.4.18), expresia legii de reglare (dup stare) devine

u = R-1 BT S x, t [t0, ).

(2.4.21)

Dac n relaia (2.4.21) se nlocuiete soluia S a ecuaiei matriceale algebrice Riccati (2.4.20), atunci
comanda u va fi comanda optimal notat cu u .
Relaia (2.4.21) corespunde unui BC-x de tip proporional invariant n timp, care asigur
urmtoarea lege de reglare:

u = K x,

(2.4.22)

unde matricea compensator K de dimensiune (m, n) are expresia

K = R-1 BT S.

(2.4.23)

Pentru rezolvarea ecuaiei matriceale algebrice Riccati poate fi utilizat Optimization Toolbox din
cadrul mediului Matlab [C2-1].
n finalul subcapitolului trebuie remarcat faptul c n cazul general (neomogen nestaionar)
problema regulatorului liniar-ptratic se reduce la rezolvarea unei ecuaii matriceale difereniale
Riccati [I2-3], pentru a crei integrare se recomand [C2-2], [S2-2], [V2-2]. n aceast situaie BC-x
este variant n timp, iar matricea compensator se numete matrice Kalman.
Rmne ca exerciiu pentru cititor aducerea celor dou probleme cea de conducere optimal i
cea a regulatorului liniar-ptratic n cazul omogen staionar la forma general a unei PO, (2.1.9).

Exemplul 2.4: Se dau ecuaiile de stare liniarizate de forma (2.4.12) ale PC corespunztor unui
HG cu turbin Kaplan, n care matricele au expresiile urmtoare n care sunt puse n eviden doar
elementele nenule [A2-1]:

84 Elemente de optimizare a sistemelor de reglare automat 2 (R.-E. Precup, UPT, 2013)


0
a
21
A= 0

0
0

a12

a 22
a 32
0

a 23
a 33
0

a 24
a 34
a 44

0
0
0

a 25

a 35 , B = 0 ,

0
b51
b52

a 55

(1)

iar variabilele vectorului de stare x = [x1 x2 x3 x4 x5]T au semnificaia (fiind exprimate n creteri): x1
unghiul intern, x2 viteza unghiular, x3 debitul n turbin, x4 i x5 poziiile celor dou
servomotoare aferente TH. n cazul unui HG al centralei hidroelectrice PdF 1 pe partea din Serbia,
parametrii din (1) obin valorile
a12 = 314.16, a 21 = 0.23, a 22 = 0.594, a 23 = 0.59, a 24 = 0.37,
a 25 = 0.18, a 32 = 0.566, a 33 = 1.46, a 34 = 1.28,

(2)

a 35 = 0.61, a 44 = 2, a 55 = 0.71, b41 = 2, b51 = 0.71.

Se cere s se dezvolte regulatoare liniar-ptratice n cazul omogen staionar, altfel spus s se dezvolte
regulatoare dup stare care s asigure minimizarea FO (2.4.11) considernd matricea de ponderare
Q=I5 (matricea unitate de ordinul 5) i mai multe valori ale matricei de ponderare R = r (scalar),
r{0.5, 1, 2}.

Soluie: n condiiile problemei date rezolvarea se face apelnd funcia Matlab lqr i se obin
urmtoarele rezultate:
- n cazul r = 0.5: K= [0.4212, 41.6433, 2.0140, 2.7976, 1.5928] i polii SRA-x: (AB K)
= {2.0794+9.1266i, 2.07949.1266i,5.2891, 1.1498, 0.8926};
- n cazul r = 1: K= [0.4169, 25.8047, 1.6516, 1.9691, 1.1351] i polii SRA-x: (AB K) =
{1.6129+8.8781i, 1.61298.8781i, 4.2355, 1.1819, 0.8651};
- n cazul r = 2: K= [0.3465, 15.3366, 1.2371, 1.3191, 0.7685] i polii SRA-x: (AB K) =
{0.6373+8.5296i, 0.63738.5296i, 2.4317, 1.3439, 0.7555}.
Considernd structura de SRA-x din fig.2.5 i acceptnd un scenariu de simulare caracterizat
prin modificarea n treapt unitate a intrrii de referin w=w, SRA-x fiind monovariabil la intrare n
acest exemplu, n fig. 2.6 ... 2.8 sunt prezentate rspunsurile celor trei SRA-x cu regulator liniarptratic (cu linie continu pentru variabila de stare x1 i linie punctat pentru comanda u=u).

Fig.2.6. Rspunsul SRA-x cu regulator liniar-ptratic n cazul r = 0.5.

(REP) 2.4 Elemente de optimizare parametric a sistemelor de reglare automat cu reacie dup stare 85

Fig.2.7. Rspunsul SRA-x cu regulator liniar-ptratic n cazul r = 1.

Fig.2.8. Rspunsul SRA-x cu regulator liniar-ptratic n cazul r = 2.

2.5. Elemente de optimizare parametric a sistemelor de reglare automat cu


timp discret
2.5.1. Ecuaia Euler-Lagrange discret n cazul problemei fr restricii
Fie variabila vectorial v Rn i mulimea de puncte
Vk

0 ,k f

= {v k 0 , v k0 +1 ,..., v k f } ,

asociat orizontului de timp

(2.5.1.1)

86 Elemente de optimizare a sistemelor de reglare automat 2 (R.-E. Precup, UPT, 2013)


Tof = {t k0 , t k0 +1 ,..., t k f } ,

(2.5.1.2)

deci cu un numr de (kf k0 + 1) momente de timp discrete.


Fie problema de optimizare
PFR: Vk0 , k f = arg min J =
Vk

0 ,k f

k f 1

Ek ( v k , v k +1 ) .

(2.5.1.3)

k = k0

Funciile Ek(vk, vk+1) se consider de clas C2 n raport cu vk i vk+1. Se definete urmtoarea variabil
vectorial:

vk

= [ v k0

0 ,k f

v k0 +1

... v k f ]T R

n ( k f k0 +1)

(2.5.1.4)

i PO (2.5.1.3) devine
n ( k k +1)
PFR: v k0 ,k f = arg min J = ( v k0 ,k f ) , v k0 ,k f R f 0 ,
vk

(2.5.1.5)

0 ,k f

n care FO (de tip Lagrange) are expresia


( v k

0 ,k f

)=

k f 1

E k ( v k , v k +1 ) .

(2.5.1.6)

k = k0

Rezolvarea PFR (2.5.1.5) se face pe baza rezultatelor din subcapitolul 2.2 n urma considerrii
problemei ca o problem de programare matematic neliniar. Condiia de optimalitate de ordinul
I este
v

k0 ,k f

( v *k

0 ,k f

) = 0.

(2.5.1.7)

Observaie: Notnd
Ek , v l = E k , v l ( v k , v k +1 ) = ( E k ) v l =

E k
,
v l

(2.5.1.8)

se obine
l=k
E k , v k ( v k , v k +1 ) dac

E k , v l ( v k , v k +1 ) = E k , v k +1 ( v k , v k +1 ) dac
l = k +1 .

0
dac l {k,k + 1 }

(2.5.1.9)

Dac se efectueaz derivarea lui (cerut de condiia de optimalitate (2.5.1.7)) i se utilizeaz


expresia (2.5.1.6), atunci ecuaia (2.5.1.7) devine
E k , v = 0,
0 k0
E k0 , v k + E k0 +1, v k +1 = 0,
0
0

...,
E
+ E k f 1, v k 1 = 0,
f
k f 2, v k f 1
E
=
0
,
k f 1, v k f

(2.5.1.10)

iar setul de relaii (2.5.1.10) este echivalent cu


E k 1, v k ( v *k 1 , v *k ) + E k , v k ( v *k , v *k +1 ) = 0, k = k 0 + 1, k f 1 ,

(2.5.1.11)

Ek0 , v k ( v *k0 , v *k0 +1 ) = 0, Ek f 1, v k ( v *k f 1 , v *k f ) = 0 .

(2.5.1.12)

(RE Precup) 2.5 Elemente de optimizare parametric a sistemelor de reglare automat cu timp discret 87
Ecuaia (2.5.1.11) se numete ecuaia Euler-Lagrange discret (EELD) pentru PFR (de exemplu,
[A2-2]) i mpreun cu cele dou ecuaii din (2.5.1.12) formeaz un sisitem algebric de n(kf k0 + 1)
ecuaii cu tot attea necunoscute v *k prin rezolvarea cruia se obin punctele staionare v *k 0 , k f .
n multe aplicaii v *k 0 i / sau v *k f sunt precizate. Atunci ecuaiile corespunztoare din
(2.5.1.12) nu mai au sens. ntotdeauna ns rmne un sistem la care numrul de ecuaii este egal cu
cel al necunoscutelor i acest aspect trebuie urmrit n toate aplicaiile.
Ecuaiile (2.5.1.12) se numesc condiiile de transversalitate (CT) asociate EELD. Ele pot
apare i sub forma de prim variaie:
v Tk E k 0 , v k ( v *k0 , v *k0 +1 ) = 0 ,

(2.5.1.13)

v Tk Ek f 1, v k ( v *k f 1 , v *k f ) = 0 .

(2.5.1.14)

Se observ c dac v *k 0 i / sau v *k f nu sunt precizate, atunci v k 0 i / sau v k f sunt arbitrare i


pentru ca aceste ultime dou relatii (2.5.1.13) i (2.5.1.14) s fie satisfcute trebuie satisfcute
relaiile (2.5.1.12). Dac v *k 0 i / sau v *k f sunt precizate, atunci v k 0 i / sau v k f sunt nule i
(2.5.1.12) sunt satisfcute, deci nu mai are sens asocierea lor la EELD.

Condiiile de optimalitate de ordinul II necesare sunt


v

k0 ,k f

vk

0 ,k f

( v *k

0 ,k f

)0

(2.5.1.15)

i dificil de evaluat analitic.

2.5.2. Problema de conducere optimal discret


Fie problema de optimizare
PRE: {u k }k ,k 1 = arg min J = k (x k )
0 f
{u k }k0 , k f 1

k = k f k f 1
+ Ek (x k , u k ) ,
k = k 0 k = k0

supus la x k +1 = f k ( x k , u k ), k = k 0 , k f 1 ,

(2.5.2.1)

n care: x k R n , u k R m , f k : R n R m R m , k : R n R, E k : R n R m R, funciile fiind de


clas C2. Aceast problem poate fi denumit i problem de tip Bolza discret i cere determinarea
secvenei de comand optimal {u k }k0 , k f 1 cu (kf k0) componente astfel nct ea s minimizeze
funcia obiectiv J care conine n mod distinct i doi termeni ce depind numai de variabilele de stare
ale sistemului cu timp discret x k +1 = f k (x k , u k ) . Lagrangeanul problemei este

L( v k

0 ,k f

; ) = k (x k )

k = kf
k = k0

k f 1

+ [ E k (x k , u k ) +
k = k0

(2.5.2.2)

+ Tk +1 (f k (x k , u k ) x k +1 )] ,
unde au fost utilizate notaiile (2.5.2.3) i (2.5.2.4) pentru:
- vectorul multiplicatorilor lui Lagrange:

= [ Tk0

Tk0 +1 ... Tk f ]T R

- variabilele problemei:

n ( k f k0 )

(2.5.2.3)

88 Elemente de optimizare a sistemelor de reglare automat 2 (R.-E. Precup, UPT, 2013)

vk

= [ v Tk0

0 ,k f

= [x Tk0

u Tk0

v k = [x Tk

v Tk0 +1 ... v Tk f ]T =
x Tk0 +1

u Tk0 +1 ... x Tk f 1

u Tk f 1

x Tk f ]T R

( n + m )( k f k 0 ) + n

(2.5.2.4)

u Tk ]T R n + m , k = k 0 , k f 1, v k f = x k f R n .

Pentru uurarea calculelor se introduce funcia lui Hamilton (hamiltonianul)


H k ( v k ; k +1 ) = E k (x k , u k ) + Tk +1f k (x k , u k ), k = k 0 , k f 1

(2.5.2.5)

i expresia lagrangeanului devine


L( v k

0 ,k f

; ) = k (x k )

k = k f k f 1
+ [ H k ( v k ; k +1 ) Tk +1 x k +1 ] .
k = k 0 k = k0

(2.5.2.6)

Se fac notaiile
~
E k ( v k , v k +1 ; k +1 ) = H k ( v k ; k +1 ) kT+1 x k +1 , k = k 0 + 1, k f 1 ;
~
E k0 ( v k0 , v k0 +1 ; k0 +1 ) = k0 (x k0 ) + H k0 ( v k0 ; k0 +1 ) kT +1 x k0 +1 ;
0

~
E k f 1 ( v k f 1 , x k f ;

kf

) = k f (x k f ) + H k f 1 (x k f 1 ;

kf

(2.5.2.7)

) Tk x k f .
f

n continuare vor fi particularizate condiiile de optimalitate de ordinul I completate innd


seama de notaiile anterioare:
~
~
~
EELD E k 1, v k + E k , v k = 0 , utiliznd E k 1 ( v k 1 , v k ; k ) = H k 1 ( v k 1 ; k ) Tk x k se transform n
k H k ,x k ( v *k ; k +1 )
= 0, k = k 0 + 1, k f 1 .
0 + H
*

k ,u k ( v k ; k +1 )
~
CT la momentul iniial Ek0 , v k = 0 se transform n

(2.5.2.8)

k ,x (x *k ) + H k , x (v * ; k +1 )
k0
0
0 k0
0
0 k0

=0.
*

H k0 ,u k (v k0 ; k0 +1 )
0

(2.5.2.9)

CT la momentul final E k f 1, v k f = 0 se transform n


k f , x k (x *k f ) k f = 0 .

(2.5.2.10)

RTE au expresia
x *k +1 = f k ( x *k , u *k ), k = k 0 , k f 1 .

(2.5.2.11)

Pentru o scriere unitar se adaug notaia


k0 = H k0 , x k ( v *k0 ; k 0 +1 ) = H k 0 , x k (x *k 0 , u *k 0 ; k 0 +1 ) .
0

(2.5.2.12)

Utiliznd relaiile anterioare se formuleaz urmtorul rezultat. Considernd functia


hamiltonian
H k (x k , u k ;

k +1 )

= E k ( x k , u k ) + Tk +1f k (x k , u k ), k = k 0 , k f 1,

(2.5.2.13)

dac v *k0 , k f reprezint un punct de minim local al problemei de conducere optimal discret cu RTE,
atunci exist ntotdeauna multiplicatorii lui Lagrange k0 , k0 +1 ,..., k f , care satisfac relaiile

(RE Precup) 2.5 Elemente de optimizare parametric a sistemelor de reglare automat cu timp discret 89
k = H k , x k ( x *k , u *k ;

k +1 ),

k = k0 , k f 1 ;

(2.5.2.14)

k0 = k0 ,x k (x *k0 ), k f = k f ,x k (x *k f ) ;

(2.5.2.15)

H k ,u k ( x *k , u *k ; k +1 ) = 0, k = k 0 , k f 1 ;

(2.5.2.16)

x *k +1 = f k ( x *k , u *k ), k = k 0 , k f 1 ;

(2.5.2.17)

z T Lv

k0 ,k f

vk

0 ,k f

( v *k

0 ,k f

) z 0, z R ( n + m )( k f k0 ) + n ,

cu [f k ( x k , u k ) x k +1 ] v k

0 ,k f

( v *k

0 ,k f

) z = 0.

(2.5.2.18)

Relaiile (2.5.2.14) (2.5.2.18) reprezint condiiile necesare de minim local n punctul v *k0 , k f , iar
condiiile suficiente difer de cele necesare prin inegalitatea strict n (2.5.2.18).
Unele relaii dintre acestea i unele variabile poart denumiri consacrate i anume: (2.5.2.17)
ecuaii de dinamic ale procesului condus; (2.5.2.14) ecuaii adjuncte; (2.5.2.15) condiii de
transversalitate; (2.5.2.16) ecuaii de legatur; variabile adjuncte; ansamblul (x, )
variabile canonice.
Relaiile (2.5.2.14) (2.5.2.17) formeaz un sistem de
n(k f k 0 ) + 2n + m(k f k 0 ) + n(k f k 0 ) = 2n(k f k 0 + 1) + m(k f k 0 )
ecuaii cu tot attea necunoscute. Rezolvarea problemei const tocmai n rezolvarea acestui sistem.
Mai mult, n rezolvrile practice de probleme, dup scrierea tuturor ecuaiilor trebuie verificat
egalitatea dintre numrul de ecuaii i numrul de necunoscute; dac acest lucru nu este verificat,
nseamn c s-a procedat greit.
Dup cum ecuaiile de dinamic au variabila de stare pe xk, n aceeai manier ecuaiile
adjuncte pot fi privite ca ecuaii de variabil de stare k+1. Interdependena dintre cele dou categorii
de variabile canonice este stabilit de ecuaiile de legtur. Astfel, rezolvnd ecuaiile de legtur n
raport cu secvena de comand u *k i substituind rezultatul n ecuaiile de dinamic i n ecuaiile
adjuncte, se ajunge la sistemul cu timp discret exprimat n forma sistemului de ecuaii recurente
(2.5.2.19), (2.5.2.20):
~
x *k +1 = Fk (x *k ; k +1 ) ,
(2.5.2.19)
k +1 = G k ( x *k ; k ) ,

(2.5.2.20)

cu k = k 0 , k f . nlocuind pe k+1 din ecuaia (2.5.2.20) n (2.5.2.19), rezult sistemul


x*k +1 Fk (x*k ; k )

=
.
*
k +1 G k (x k ; k )

(2.5.2.21)

Pentru rezolvarea sistemului (2.5.2.21) se dispune i de condiiile de transversalitate.

Dac x*k0 i / sau x *k f

sunt fixate, atunci prima i / sau a doua din condiiile de

transversalitate i pierde / pierd sensul.


Problema de rezolvare a sistemului (2.5.2.21) n condiiile dispunerii de date corespunztoare
momentului iniial ( t k0 ) i final ( t k f ) se numete problem bilocal sau problem cu valori n dou

puncte de frontier.

Remarc: n cazul general, n problema de conducere optimal discret apar i restricii


auxiliare, care pot fi RTE i / sau RTI. Tratarea problemei se face conform celor prezentate n
subcapitolul 2.3, ca o problem de optimizare cu RTE, n care ca RTE apar ecuaiile de dinamic ale
procesului, RTE auxiliare precum i RTI saturate.

90 Elemente de optimizare a sistemelor de reglare automat 2 (R.-E. Precup, UPT, 2013)


Exemplul 2.5: S se minimizeze FO J = x 42 +

1 3 2
u pentru sistemul
2 k =0 k

x k +1 = ax k + bu k , k = 0,3, cu x0 = 1 i a, b = const R \ {0} .

Soluie: Se identific datele problemei cu forma canonic.


1
4 ( x 4 ) = x 42 , 0 ( x 0 ) = 0; E k ( x k , u k ) = u k2 , k = 0,3; f k ( x k , u k ) = ax k + bu k , k = 0,3 .
2
Deci hamiltonianul este H k ( x k , u k ; k +1 ) = (1 / 2)u k2 + k +1 ( ax k + bu k ), k = 0,3 . Rezult succesiv:
- ecuaiile adjuncte
k = a k +1 , k = 0,3 ;

(1)

- condiiile de transversalitate
x 0* = 1, 4 = 2 x 4* ;

(2)

- ecuaiile de legtur
u k* + b k +1 = 0, k = 0,3 ;

(3)

- ecuaiile de dinamic
x k*+1 = ax k* + bu k* , k = 0,3 .

(4)

Relaiile (1) (4) reprezint un sistem de 14 ecuaii cu 14 necunoscute. n continuare se rezolv


sistemul (1) (4). Din relaiile (1) se obine

k = a 4k 4 , k = 0,3 .

(5)

Apoi, din (3) i (5) rezult


u k* = ba 3 k 4 , k = 0,3 .

(6)

Urmeaz scrierea detaliat a relaiilor (4):


x1* = ax0* + bu 0*
x 2* = ax1* + bu1*
x3* = ax2* + bu 2*

(7)

x 4* = ax3* + bu3*

Prin nmulirea primei relaii din (7) cu a3, a celei de-a doua cu a2, a celei de-a treia cu a i adunarea
membru cu membru a relaiilor (7), rezult
x 4* = a 4 x 0* + a 3 bu 0* + a 2 bu1* + abu 2* + bu 3* .

(8)

Se nlocuiesc n (8) toate variabilele n funcie de 4


4 / 2 = a 4 a 6b 2 4 a 4b 2 4 a 2b 2 4 b 2 4

= a 4 /[0.5 + b 2 (a 6 + a 4 + a 2 + 1)] .

(9)

Din (6) i (8) se obine


u k* = ba 7 k /[0.5 + b 2 (a 6 + a 4 + a 2 + 1)], k = 0,3 .

(10)

Din (2) i (8) se obine apoi


x 4* = a 4 /[1 + 2b 4 (a 6 + a 4 + a 2 + 1)], k = 0,4 .

(11)

(RE Precup) 2.5 Elemente de optimizare parametric a sistemelor de reglare automat cu timp discret 91
n final, ntruct funcia obiectiv J este convex i punctul de extrem este unic, se obine secvena de
comand optimal u k = u k* , k = 0,3 , precum i traiectoria de stare optimal, x k = x k* , k = 0,4. Rmne
ca exerciiu pentru cititor calculul valorii minime a funciei obiectiv.

2.5.3. Problema regulatorului liniar-ptratic discret n cazul omogen nestaionar


n cadrul acestui paragraf se trateaz problema regulatorului liniar-ptratic discret n cazul
omogen nestaionar (PRLPD-CON) formulat ca urmtoarea problem de optimizare:
{u k } k

0 , k f 1

= arg

min

{u k }k

0 , k f 1

J=

1 T
x S xkf +
2 kf

k f 1

1
+ (x Tk Q k x k + u Tk R k u k ),
2 k = k0

supus la:

x k +1 = A k x k + B k u k , k = k 0 , k f 1 ecuaiile de dinamic ale PC,


x k0 = x 0 fixat,

(2.5.3.1)

S 0, R k > 0, Q k 0, k = k 0 , k f 1 simetrice, date,

dim S = (n, n), dim R k = (m, m), dim Q k = (n, n) ,


x k R n , k = k0 , k f , u k R m , k = k0 , k f 1 ,
dim A k = ( n, n), dim B k = ( n, m), k = k 0 , k f 1 .

n literatur, aceast problem se gsete sub denumirile de Discrete Linear Quadratic Regulator
Problem (DLQR Problem) sau Linear Quadratic Optimal Control (LQ Optimal Control) (de
exemplu, [A2-2]).
Termenul liniar din denumirea problemei se datoreaz formei liniare a ecuaiilor de dinamic
ale PC, iar termenul ptratic se refer la forma funciei obiectiv (FO). Avnd n vedere faptul c n
expresia FO apar numai termeni de gradul II ptratici, se vorbete despre cazul omogen al PRLPD.
Termenul nestaionar provine de la variana n timp a ecuaiilor de dinamic i a matricelor de
ponderare Qk i Rk.
Rezolvarea problemei se poate face apelnd rezultatele obinute n cazul problemei de
conducere optimal discret, sau ca aplicaie la principiul minimului discret, sau ca aplicaie la metoda
programrii dinamice discrete. n cele ce urmeaz se recurge la rezolvarea PRLPD-CON prin aplicarea
principiului minimului discret. Conform rezultatelor prezentate n paragraful anterior, rezolvarea
problemei (2.5.3.1) ncepe cu exprimarea hamiltonianul (pentru simplitate, se minimizeaz funcia
obiectiv 2J) sub forma
H k (x k , u k , k +1 ) = x Tk Q k x Tk + u Tk R k u Tk + k +1 ( A k x k + B k u k ), k = k 0 , k f 1 .

(2.5.3.2)

n continuare, se determin u *k din condiia de minim impus hamiltonianului (2.5.3.2). ntruct nu se


impun restricii de tip inegalitate asupra comenzii n procesul de conducere, minimizarea va reprezenta
o PFR, rezolvat n continuare.
Se calculeaz gradientul lui Hk innd seama de faptul c trebuie derivat un produs (n paranteze
vor fi marcai factorii care vor fi derivai), de proprietile transpusei i de faptul c matricea Rk este
simetric:

H k ,u k = (u 'kT R k u k ) u k + (u Tk R k u k ' ) u k + ( Tk +1 R k u k ) u k =
= R k u k + (u Tk R k ) T + ( Tk +1 R k ) T = 2R k u k + R Tk k +1 ,
H k ,u k = 0 u k = (1 / 2)R k 1 R Tk k +1 = (1 / 2) k +1 , k = k 0 , k f 1 .

92 Elemente de optimizare a sistemelor de reglare automat 2 (R.-E. Precup, UPT, 2013)


Hessianul lui Hk are expresia H k ,u k u k = 2( R k u k ) u k = 2R k > 0 . Prin urmare, vectorul uk obinut
asigur minimizarea hamiltonianului, deci se poate nota
u *k = (1 / 2) k +1 , k = k 0 , k f 1 .

Celelalte elemente necesare n rezolvarea problemei sunt:


ecuaiile de dinamic ale procesului condus
x *k +1 = A k x *k + B k u *k , k = k 0 , k f 1 ;

(2.5.3.3)

(2.5.3.4)

ecuaiile adjuncte
k = H k ,x k (x *k , u *k , *k +1 ), k = k 0 , k f 1 ,

care, prin derivarea hamiltonianului din (2.5.3.2) n raport cu xk, devin


k = 2Q k x*k + ATk k +1 , k = k 0 , k f 1 ;

(2.5.3.5)

condiiile iniiale
x*k0 = x 0 ;

(2.5.3.6)

condiiile de transversalitate la momentul final (corespund funciei obiectiv 2J)


k f = k f , x k (x *k f ) = (x Tk S x k f ) x k (x *k f ) ,
f

echivalente cu
k f = 2S x k f .

(2.5.3.7)

Nu au fost introduse condiiile de frontier deoarece n formularea problemei nu sunt impuse RTE
suplimentare.
Rezolvarea PRLPD-CON const n rezolvarea sistemului format de relaiile (2.5.3.3)
(2.5.3.7). n acest scop, se ncepe cu substituirea comenzii u *k din (2.5.3.3) n ecuaiile de dinamic
(2.5.3.4), rezultnd
x *k +1 = A k x *k

1
B k R k 1 B Tk k +1 , k = k 0 , k f 1 .
2

(2.5.3.8)

A fost obinut astfel problema bilocal liniar discret (2.5.3.5) (2.5.3.8). n continuare, se
prelungete condiia de transversabilitate din (2.5.3.7) pe ntreg intervalul de conducere
k = 2Pk x *k , k = k 0 , k f ,

(2.5.3.9)

n care a fost introdus matricea simetric Pk 0, dim Pk = (n, n), care trebuie determinat. nlocuind
expresia lui k din (2.5.3.9) n (2.5.3.5), rezult 2Pk x *k = 2Q k x *k + 2 A Tk Pk +1x *k +1 , k = k 0 , k f 1 , de
unde
(Pk Q k ) x *k = A Tk Pk +1 x *k +1 , k = k 0 , k f 1 .

(2.5.3.10)

Substituind apoi expresia lui k din (2.5.3.9) n (2.5.3.8), rezult urmtoarea relaie:
x *k +1 = A k x *k B k R k 11B Tk Pk +1 x *k +1 , k = k 0 , k f 1 ,
echivalent cu
x *k = A k 1 (B k R k 11 B Tk Pk +1 + I)x *k +1 , k = k 0 , k f 1 .

(2.5.3.11)

Eliminnd x*k din (2.5.3.10) i (2.5.3.11), se obine

(Pk Q k ) A k 1 (B k R k11B Tk Pk +1 + I)x *k +1 = A Tk Pk +1 x *k +1 , k = k 0 , k f 1 .

(2.5.3.12)

(RE Precup) 2.5 Elemente de optimizare parametric a sistemelor de reglare automat cu timp discret 93
Apoi, utiliznd (2.5.3.12), se exprim diferena (Pk Qk). Pentru aceasta, se efectueaz un ir de
operaii matriceale care pornesc de la adunarea i scderea produsului A Tk Pk +1 A k . n final, se obine
expresia Pk Q k = A Tk Pk +1 A k A Tk Pk +1B k ( R k + B Tk Pk +1B k ) 1 B Tk Pk +1 A k .
Ultima relaie poate fi rearanjat i conduce la concluzia c matricele Pk sunt obinute ca soluii
ale ecuaiei matriceale recurente Riccati (EMRR)
Pk = Q k + A Tk Pk +1 A k A Tk Pk +1B k (R k + B Tk Pk +1B k ) 1 B Tk Pk +1 A k ,

k = k f 1, k f 2, ..., k 0 ,

(2.5.3.13)

care se iniializeaz cu (a se vedea (2.5.3.7) i (2.5.3.9))


Pk f = S .

(2.5.3.14)

Rmne de determinat expresia legii de comand optimal. Substituind k din (2.5.3.9) n (2.5.3.3),
rezult (se renun la indicele superior * corespunztor punctelor staionare)
u k = R k 1B Tk Pk +1 x k +1 , k = k 0 , k f 1 .

(2.5.3.15)

ns, relaia (2.5.3.10) se poate rescrie sub forma


Pk +1 x k +1 = ( A Tk ) 1 (Pk Q k ) x k , k = k 0 , k f 1 .

(2.5.3.16)

Se substituie Pk+1xk+1 din (2.5.3.16) n (2.5.3.15) rezultnd


u k = R k 1B Tk ((A Tk ) 1 (Pk Q k )x k , k = k 0 , k f 1 .

(2.5.3.17)

Dar expresia (Pk Qk) este cunoscut din EMRR (2.5.3.13). n concluzie, din (2.5.3.17) se obine
legea de comand optimal
u k = K k x k , k = k 0 , k f 1 ,

(2.5.3.18)

unde matricea Kk are urmtoarea expresie, obinut din prelucrarea relaiilor (2.5.3.13) i (2.5.3.17)
utiliznd proprietile operaiilor cu matrice:
K k = (R k + B Tk Pk +1B k ) 1 B Tk Pk +1 A k , k = k 0 , k f 1 .

(2.5.3.19)

2.5.4. Observaii i aspecte de implementare


n cadrul acestui paragraf vor fi prezentate observaii i aspecte de implementare privind
PRLPD-CON. Acestea au ns un grad mai mare de generalitate, fiind valabile la conducerea optimal
cu timp discret i n unele cazuri la conducerea optimal cu timp continuu.
A) Rezolvarea PRLPD-CON a condus la acelai rezultat exprimat sub forma EMRR (2.5.3.13)
iniializat conform relaiei (2.5.3.14). Dup rezolvarea EMRR, comanda optimal u k are expresia
(2.5.3.18), n care matricea Kk se obine din (2.5.3.19).
Odat matricele Kk determinate off-line pentru un proces dat i o FO dat, ele se memoreaz, iar
structura sistemului de reglare automat numeric (SRAN) cu regulator liniar-ptratic discret (RLPD)
va fi conform schemei bloc informaionale din fig.2.9 (ecuaiile de ieire ale PC sunt yk = Ckxk, cu yk
vectorul ieirilor reglate). n schema bloc din fig.2.9 este pus n eviden algoritmul de reglare
numeric (ARN) dup stare, iar Te reprezint perioada de eantionare (pasul de discretizare).

94 Elemente de optimizare a sistemelor de reglare automat 2 (R.-E. Precup, UPT, 2013)

Fig.2.9. Structura sistemului de reglare automat cu regulator liniar-ptratic discret.

La declanarea operaiei de conducere, pentru a genera mrimea (vectorul) de comand


optimal u k se citesc matricele Kk pas cu pas din memorie i se utilizeaz mpreun cu starea xk a
sistemului dinamic, msurat sau estimat. Prin urmare, dispozitivul de conducere numeric trebuie
s realizeze urmtoarele sarcini:
msurarea / estimarea strii curente xk;
calculul mrimii de comand conform ARN: u k = K k x k ;
generarea / transmiterea semnalului de comand (optimal) u k ctre PC.
Rezultatul obinut este independent de starea iniial xk, ceea ce i confer un mare grad de
generalitate.
B) Denumirea de regulator se datoreaz tocmai asemnrii comenzii cu cea obinut n cazul unui
bloc compensare prin reacie dup stare (BC-x) convenional. Cum ns modalitile de obinere a
matricei-compensator K din cazul unui SRA-x convenional i a setului de matrice Kk din cazul
analizat sunt diferite, este normal ca SRA ce utilizeaz aceste legi de comand s prezinte diferene.
Blocul de compensare K (numit i compensator stabilizator) are mn parametri. Adoptarea
acestor valori astfel nct s fie obinute performane dorite de regim dinamic n condiiile variaiei
mrimilor de comand ntre anumite limite i ale unei implementri ct mai avantajoase a legii de
comand constituie o problem dificil. Majoritatea procedurilor de stabilizare prin reacie dup stare
nu recurg la adoptarea direct a tuturor parametrilor BC-x, ci la adoptarea doar a celor n valori proprii
ale matricei Ax = A + B K, adic la o procedur de alocare. O astfel de metod posed, ns, un numr
de n(m1) grade de libertate. Diversele proceduri de alocare difer ntre ele prin modul de rezolvare
a celor n(m1) grade de libertate, fiecare element al matricei K putnd constitui unul din gradele de
libertate.
Atingerea performanelor impuse prin metoda de alocare necesit n consecin de cele mai
multe ori un volum mare de calcule i realizeaz cu greu compromisul ntre obinerea unei viteze de
reglare dorite i meninerea mrimilor de comand n domenii de variaie admise. Compensatorul (BCx) optimal are avantaje tocmai din acest punct de vedere. Compromisul menionat poate fi realizat
destul de simplu prin adoptarea adecvat matricelor de ponderare din FO. n plus, structura obinut
este valabil att pentru procese variante n timp ct i pentru procese invariante n timp.
C) Problema de stabilire a matricelor ponderare din funcia obiectiv (Qk i Rk) constituie problema
cheie pentru aceast aplicaie. Numrul aplicaiilor tehnice de conducere optimal a proceselor
industriale pentru care s existe FO bine precizate este redus. Dezideratele tehnico-economice sunt
formulate de regul n termeni cantitativi impunndu-se condiii de tipul consum de energie ct mai
redus, variaii ct mai mici ale uneia sau mai multor mrimi, etc.; totodat se impun i valori limit
pentru indicatorii de calitate empirici de tip: suprareglaj, timp de cretere, timp de reglare, timp de
prim reglare, amortizare, lrgime de band, etc. Toate acestea se refer la mrimi de intrare de
referin sau de perturbaie bine precizate.

(RE Precup) 2.5 Elemente de optimizare parametric a sistemelor de reglare automat cu timp discret 95
Pe baza tuturor acestor cerine proiectantului de SRA i revine sarcina de a stabili forma FO
pentru cazul concret. n asemenea situaii FO se stabilete iterativ modificndu-se componentele
matricelor de ponderare (coeficienii de ponderare) pn cnd se ating performanele impuse.
Astfel, plecnd de la o prim form a FO stabilit de catre proiectant i care este apropiat sau
departat de forma final, n funcie de experiena proiectantului se calculeaz coeficienii legii de
comand, Kk. Se analizeaz apoi performanele realizate de SRAN obinut. Dac performanele
impuse nu sunt ndeplinite, atunci din nou n funcie de experiena proiectantului se modific ponderile
unor termeni din FO, eventual se adaug noi termeni i se repet proiectarea analizndu-se din nou
performanele realizate.
Din punct de vedere statistic a rezultat c aceast metod conduce mai rapid la soluia final
comparativ cu procedurile de alocare (de exemplu, [D2-1]).
Datorit dimensiunilor fizice diferite ale mrimilor ce intr n componena FO i domeniilor de
valori admisibile ale mrimilor, prima form a FO se construiete considernd variabilele n valori
normate. Normarea se face prin raportare la valori nominale i / sau maxime i coeficienii de
ponderare rezult adimensionali pentru fiecare termen.
Dac, de exemplu, FO se refer la un sistem de ordinul al treilea monovariabil la intrare iar n
FO trebuie s apar mrimile x1, x2 i u ca mrimi fizice semnificative, pentru starea x1 fiind
important valoarea sa n raport cu cea maxim, iar pentru starea x2 i comanda u valorile nominale,
prima form a FO poate fi
J=

k 1
x1,k 2
x 2, k 2
u
1 f
[12 (
) + 22 (
) + ( k )2 ],

2 k = k0
x1 max
x 2nom
u nom

(2.5.3.20)

care este echivalent cu


k 1

J=

1 f
(xT Q ` x k + uTk R ` u k ) ,
2 k = k0 k

(2.5.3.21)

n care
(1 / x1 max ) 2

0
Q` =

0
( 2 / x 2 max ) 2
0

x1, k
0

0 , x k = x 2, k ,
x
0
3, k

(2.5.3.22)

u k = [u k ] , R ` = [(1 / u nom ) 2 ] .

Mrimea unom fiind constant, poate fi considerat ca prim form a FO expresia mai convenabil
k 1

J=

1 f
(x T Q x k + u Tk R u k ) ,
2 k = k0 k

(2.5.3.23)

cu
Q = diag(q12 , q 22 ,0), R = 1, q1 = 1u nom / x1 max , q 2 = 2 u nom / x 2 max .

(2.5.3.24)

Ponderea lui uk = [uk] egal cu 1 are n vedere faptul c ntro FO de form aditiv ntotdeauna
ponderea unui termen poate fi constant, ponderile celorlali termeni adoptndu-se n raport cu
aceasta. Dac nu apar inconveniente legate de valoarea absolut a diferiilor termeni, atunci ca pondere
pentru termenul cu pondere constant este adoptat valoarea 1. Procednd n acest mod, pentru
procesul considerat pe parcursul procedeului iterativ menionat se acioneaz numai asupra
coeficienilor q1 i q2.
n cazurile n care sunt cunoscute abaterile maxime admise ale variabilelor care compun FO, la
o perturbare bine precizat a echilibrului sistemului o regul practic de adoptare a primei forme a FO
const n adoptarea unor matrice de ponderare de form diagonal, n care fiecrei mrimi i se

96 Elemente de optimizare a sistemelor de reglare automat 2 (R.-E. Precup, UPT, 2013)


asociaz cte un coeficient egal cu inversul ptratului deviaiei maxime admise. n alte situaii se
adopt FO de forma
J=

k 1 n
x i, k x ir 2 m 2 u j , k u jr 2
1 f
[ i2 (
) + j(
) ],

2 k = k0 i =1
x ir
u jr
j =1

(2.5.3.25)

n care i i j reprezint ponderile, iar xir ( i = 1, n ) i ujr ( j = 1, m ) sunt mrimi de normare sau de
referin. Se observ c n aceast expresie se penalizeaz abaterile mrimilor (ce intr n componena
FO) fa de mrimile de referin.
D) Un ultim aspect legat de implementarea regulatoarelor liniar-ptratice discrete const n alegerea
perioadei de eantionare, Te. n majoritatea aplicaiilor industriale, Te reprezint un parametru
necunoscut, adoptarea valorii sale fiind afectat de modul n care se precizeaz performanele
impuse SRA. Astfel, dup unii autori sunt frecvente urmtoarele dou cazuri:

(1) Performanele impuse se refer la comportarea SRA n raport cu variaii bine precizate ale
semnalelor de intrare, cerndu-se totodat meninerea mrimilor de comand ntre limite prestabilite.
(2) Performanele SRA sunt exprimate prin intermediul unei FO de tip integral (deci, n timp
continuu), care este bine precizat att ca structur ct i ca valori ale matricelor de ponderare, forma
FO fiind stabilit de ctre beneficiarul SRA sau de comun acord cu acesta.
n primul caz, (1), n ipoteza furnizrii mrimii de comand cu un extrapolator de ordinul
zero (Zero-Order-Hold, ZOH), valoarea lui Te este adoptat ca o cot-parte din unul dintre indicatori
de calitate empirici temporali precizai n tema de proiectare [P2-1]. Poate fi utilizat, astfel, relaia
Te [t c /( 4 + n), t c / 2] ,

(2.5.3.26)

unde: tc timpul de cretere, n ordinul sistemului. Practic, se constat c reducerea lui Te sub o
anumit valoare minim nu mai mbuntete calitatea reglrii. n general este recomandat testarea a
dou-trei valori ale lui Te n domeniul menionat prin relaia (2.5.3.26), fiind evident faptul c pentru
fiecare valoare testat trebuie reconsiderat FO [D2-1].
n cel de-al doilea caz, (2), principiul determinrii valorii lui Te const n obinerea unui
compensator optimal discret care s conduc la un SRAN ct mai apropiat de SRA cu timp continuu
proiectat pe baza minimizrii unei FO de tip integral.
Obinerea FO discrete din FO integrale se face n general prin aproximare dac Te este
constant. Astfel, dac
tf

J = (x f , t f ) + E ( x(t ), u(t ), t )dt ,

(2.5.3.27)

t0

atunci n timp discret rezult


J = (x f , t f ) +

k f 1 t k +1

E (x(t ), u(t ), t )dt ,

k = k0 t k

(2.5.3.28)

cu t k0 = t 0 , t k f = t f i, dac fiecare integral este aproximat, de exemplu, cu metoda dreptunghiurilor


n variant ntrziat, se obine
k f 1

Te E (x k , u k , t k ) .

(2.5.3.29)

( x k f , t k f ) = k f (x k f ), Te E (x k , u k , t k ) = Ek (x k , u k ) ,

(2.5.3.30)

J (x k f , t k f ) +

k = k0

Notnd

Rezult

(RE Precup) 2.5 Elemente de optimizare parametric a sistemelor de reglare automat cu timp discret 97
J k f (x k f ) +

k f 1

Ek (x k , u k ) .

(2.5.3.31)

k = k0

Pentru regulatorul liniar-ptratic studiat, avnd n vedere forma liniar a ecuaiilor de dinamic
ale PC, poate fi efectuat chiar i o discretizare exact a FO. i n acest al doilea caz sunt testate doutrei valori ale lui Te situate deasupra valorii limit care poate fi obinut cu echipamentele disponibile
de conducere numeric.

Observaii:
1. Rezolvarea problemei regulatorului liniar-ptratic discret n cazul omogen sau neomogen
staionar (matricele Qk i Rk sunt constante) pentru S = 0 se face apelnd funcia Matlab dlqr [C2-1].
2. n practic sunt ntlnite regulatoare liniar-ptratice att cu timp continuu ct i cu timp
discret, la care este ponderat ieirea reglat n locul variabilelor de stare, caz n care pentru uurarea
calculului matricei compensator pot fi apelate funciile Matlab lqry n cazul ambelor regulatoare sau
dlqry doar n cazul celui cu timp discret.

S-ar putea să vă placă și