Sunteți pe pagina 1din 329

Teoria Sistemelor Automate

Cristian Oară

Facultatea de Automatica si Calculatoare


Universitatea “Politehnica” Bucuresti
e-mail: oara@riccati.pub.ro
URL: http://www.riccati.pub.ro/

TEORIA SISTEMELOR AUTOMATE


Capitolul 1: CONCEPTE FUNDAMENTALE ALE BUCLEI
DE REACTIE (FEEDBACK)

Ce Dorim ?

Bucla de Reactie

Stabilitatea Interna a Buclei de Reactie

Stabilizare

Performante Asimptotice

Solutia Problemei Reglarii

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 1


1. Ce Dorim ?

Acest capitol este cel mai important pentru intelegerea scopului si mijloacelor
automaticii !
Introducem notiuni de baza cum ar fi conexiunea in bucla de reactie (feed-
back) si caracterizam principalele ei proprietati ce o transforma in instrumentul
fundamental al automaticii (asigura stabilizarea + reglarea)!
Punctul de plecare: Avem un sistem care nu face ceea ce dorim ! Cum procedam?
Doua variante posibile:
• Il schimbam cu altul care face ceea ce dorim (dar oricum trebuie sa stim CUM
sa cerem/construim sistemul nou...)
• Il modificam (CUM ?) pe cel pe care il avem deja.
Analiza sistemelor de la Semnale si Sisteme a incercat sa va familiarizeze cu diverse
clase de modele sistemice si cerinte naturale asupra lor.

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 2 Ce Dorim ?


Clasa sistemelor considerate:
• LINIARE
• INVARIANTE IN TIMP
• FINIT DIMENSIONALE
• CAUZALE
• O INTRARE – O IESIRE (SISO)
Punctul de vedere:
Intrare–Iesire (I/O) (modelele sunt fctii rationale proprii) –
Teoria matematica de baza:
Functii de o variabila complexa

Ce Dorim de la un astfel de Sistem ?

Multe ...
De exemplu: Sa fie stabil (semnalele externe de energie finita sa rezulte in semnale
interne tot de energie finita), sa urmareasca clase de semnale prescrise in conditiile
in care apar semnale perturbatoare cunoscute ori necunoscute si zgomote, sa faca

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 3 Ce Dorim ?


totul cu comenzi mici (pentru a nu satura elementul de actionare) si totul in
prezenta incertitudinilor de model...
Multe intr–adevar!!!! Este posibil sa facem toate aceste lucruri? Daca DA, cum?
Incercam sa raspundem treptat acestor intrebari dezvoltand Teoria Sintezei.

ATENTIE INSA: Modelele cu care lucram sunt black–box si nu putem umbla in


interiorul lor (si oricum este nevoie de specialisti din domenii din cele mai diverse
pentru a stii cum)!

Cum procedam? Tratam modelul sistemului nominal ca atare (black–box) si


anexam un alt sistem (numit uzual regulator si apartinand aceleiasi clase
de modele) pe care il proiectam noi astfel incat sistemul rezultant format
din sistemul nominal si regulator sa faca ceea ce dorim.

Cum il “anexam”? In serie, in paralel, in bucla de reactie pozitiva/negativa?

Depinde ce dorim dar minimal dorim ca indiferent de sistemul original


(stabil sau nu) sistemul rezultant sa fie stabil.

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 4 Ce Dorim ?


Conexiunea Serie
1
Fie P (s) = s−1 pe care il inseriem cu un sistem proiectat de noi C astfel incat
sistemul rezultant sa fie stabil. Cum procedam? Trebuie ca C sa fie de forma
e
(s − 1)C(s) e
unde C(s) sa fie strict stabila. Este sistemul rezultant strict stabil?
Da, dpdv intrare–iesire dar daca injectam un semnal intre cele doua sisteme NU!
Mai mult, nu putem asigura un zerou EXACT in s = 1 si nici nu stim EXACT
ca sistemul original are un pol in s = 1! La o mica abatere rezulta un sistem
INSTABIL! Deci nici un regulator nu-mi asigura cerinta de stabilitate (interna)!

Conexiunea Paralel

Similar pentru conexiunea paralel! Exemplificati voi cum ar trebui sa arate un


regulator si de ce nici un regulator nu ne satisface!

Cum mai putem lega doua sisteme in mod elementar?

Bucla de reactie (Feedback)

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 5 Ce Dorim ?


2. Bucla de Reactie (Feedback)

Asa cum vom vedea printr-o analiza detaliata, conexiunea in bucla de reactie
este CEA CARE REZOLVA CHESTIUNEA STABILITATII (interne) si inca
multe alte cerinte!

Cel mai simplu sistem REAL cu bucla de reactie are trei componente (vezi Fig. 1):

• Un sistem nominal ce este controlat (automatizat);

• Un senzor ce masoara iesirea sistemului nominal;

• Un sistem numit regulator (controller) ce genereaza intrarea sistemului nominal;


(elementele de actionare sunt uzual incluse in sistemul nominal);

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 6 Bucla de Reactie (Feedback)


Fiecare dintre cele trei componente ale buclei de reactie are doua
semnale de intrare (unul din interiorul sistemului si unul exogen)
si un semnal de iesire. Semnalele au urmatoarele semnificatii:
r : referinta (semnal de intrare) v : iesirea senzorului
u : comanda (semnal de actionare) d : perturbatia externa
y : iesirea sistemului (semnal masurat) n : zgomot de masura
Cele trei semnale externe r, d si n se numesc intrari exogene.
d
r u y
Sistem
Regulator nominal

v
Senzor

Fig. 1: Sistem de control automat (elementar)

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 7 Bucla de Reactie (Feedback)


Ce dorim? y trebuie sa aproximeze o functie de r prespecificata si trebuie sa faca
acest lucru in prezenta perturbatiei externe d, a zgomotului n si a incertitudinilor
diverse de modelare (a sistemului nominal)! Mai mult, uzual nu acceptam nici
comenzi u prea mari iar y este disponibil doar prin intermediul masuratorii v !

Ipoteze matematice fundamentale (tipice cursului SS): Semnalele din Fig.


1 sunt scalare, descrise de functii regulate sau singulare (generalizate) ce au
transformate Laplace, cele trei componente ale buclei de reactie (sistemul nominal,
regulatorul si senzorul) sunt sisteme liniare invariante in timp avand functie de
transfer rationala proprie (Totul este “civilizat”)! Deci “avem” frecventa si analiza
urmatoare se face la nivelul transformatelor Laplace.

Fiecare componenta din Figura 1 are doua intrari si o iesire putand fi exprimata
sub forma (de exemplu in cazul sistemului nominal)

   
d   d
y=P = P1 P2 = P1d + P2u.
u u

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 8 Bucla de Reactie (Feedback)


Ipoteza aditionala: Iesirile celor trei componente sunt functii liniare de suma (sau
diferenta) intrarilor, i.e., ecuatiile sistemului nominal, senzorului si regulatorului
sunt de forma
y = P (d + u),
v = F (y + n),
u = C(r − v).
Semnul “ − ” din ultima ecuatie este o chestiune de traditie (reactie negativa in
electronica) putand fi inlocuit alternativ cu “ + ”. Diagrama bloc a acestor ecuatii
este data in Figura 2 in care s-au omis semnele “ + ” in jonctiuni.
d
r u y
x1 x2
C P
-
v
x3
F

Fig. 2: Bucla de reactie (standard)

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 9 Bucla de Reactie (Feedback)


Cand este (bine) definit asa ceva ? Toate functiile de transfer in bucla inchisa
trebuie sa existe, i.e., functiile de transfer de la cele trei semnale exogene r, d si n
la toate semnalele interne u, y, v si x1, x2 si x3 !
Prima concluzie: Este suficient sa analizam functiile de transfer de la r, d si n la
x1, x2 si x3 (celelalte rezulta din acestea). Scriind ecuatiile jonctiunilor obtinem

x1 = r − F x3,
x2 = d + Cx1 ,
x3 = n + P x2,

sau in forma matriciala


    
1 0 F x1 r
 −C 1 0   x2  =  d  .
0 −P 1 x3 n

Sistemul in bucla inchisa este deci bine definit daca matricea de dimensiune 3 × 3
de mai sus este nesingulara, i.e., determinantul ei 1 + P CF nu este identic nul,

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 10 Bucla de Reactie (Feedback)


i.e., 1 + PCF 6≡ 0 ! In acest caz, functiile de transfer in bucla inchisa se obtin din
   −1  
x1 1 0 F r
 x2  =  −C 1 0   d 
x3 0 −P 1 n

care este echivalenta cu


    
x1 1 −P F −F r
 x2  = 1  C 1 −CF   d  . (1)
1 + P CF
x3 PC P 1 n

Problema: Am presupus intitial ca P , C, F sunt proprii (avand motivatie


matematica serioasa). Rezulta si ca functiile de transfer in bucla inchisa (1) sunt
proprii atunci cand sistemul in bucla inchisa este bine definit ? Din pacate NU fara
ipoteze suplimentare ... !!! Introducem:

Sistemul in bucla inchisa este bine definit in sens strict daca toate functiile

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 11 Bucla de Reactie (Feedback)


de transfer in bucla inchisa sunt proprii (⇔ 1 + P CF nu este strict propriu
⇔ 1 + PCF(∞) 6= 0 ).

Nota: Buna definire in sens strict implica automat si buna definire ! Este realist
sa cerem unui sistem de reglare buna definire in sens strict ? DA !!!

Argumente pro (si contra !): Functiile de transfer ale oricarui sistem sunt de
fapt strict proprii (o sinusoida de amplitudine constanta si frecventa din ce in ce
mai mare aplicata unui sistem conduce la o iesire ce tinde la zero). Da, dar la
frecvente mari sistemele sunt in general foarte complexe si inceteaza in fapt sa fie
liniare pe masura ce frecventa creste ! De fapt avem nevoie ca unul singur dintre
P , C sau F sa fie strict propriu si daca acest lucru nu se intampla automat la
modelele cu care lucram oricum cerem |P CF (∞)| < 1 (motive profunde legate de
stabilitate interna si “small–gain”) ceea ce asigura automat buna definire in sens
strict.

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 12 Bucla de Reactie (Feedback)


3. Stabilitatea Interna a Buclei de Reactie

Problema (fundamentala): Ce notiune de stabilitate este adecvata sistemului


din Figura 2 (stabilitate externa stricta, BIBO, asimptotica, Lyapunov etc.)?

Raspuns: Niciuna nu este adecvata sistemului in bucla inchisa...

Ce functii de transfer ne intereseaza de fapt ? In primul rand transferul I/O al


sistemului in bucla r → y ! Dar chiar daca acest transfer este strict stabil este
posibil ca alt transfer de la un exogen la un semnal intern al buclei sa nu fie stabil
rezultand in distrugerea unei parti sau a intregului sistem !!! Deci avem nevoie ca
toate functiile de transfer

r, d, n → x1, x2, x3, v, y, u,

sa fie SIMULTAN stabile pentru a fi siguri ca totul este OK !

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 13 Stabilitatea Interna a Buclei de Reactie
Exemplul 1. In Figura 2 fie C(s) = s+1 s
, P (s) = s21−1 , F (s) = 1. Functia de
transfer r → y este strict stabila (in sens BIBO) dar functia de transfer de la
d la y nu este.
Exemplul 2. In Figura 2 fie C(s) = s+1 s
, P (s) = s21+1 , F (s) = 1. Toate functiile
de transfer exogen → semnal intern al buclei sunt strict stabile (in sens BIBO).
Definitia 3. Sistemul in bucla de reactie din Figura 2 se numeste intern stabil
daca toate transferurile in bucla inchisa sunt strict stabile (i.e., au polii in C−).

Aparent trebuie sa verificam 18 functii de transfer dar de fapt sunt suficiente doar
9. Aratati de exemplu ca urmatoarele functii de transfer sunt suficiente pentru
verificarea stabilitatii interne

r, d, n → x1, x2, x3.

Este relativ complicat sa examinam chiar si 9 numitori si sa le calculam zerourile.

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 14 Stabilitatea Interna a Buclei de Reactie
Scriem fctiile de transfer rationale sub forma unor cături de polinoame coprime

NP NC NF
P = , C= , F = (2)
MP MC MF

si definim polinomul caracteristic al sistemului in bucla inchisa (din Figura 2) ca


produsul numaratorilor + produsul numitorilor celor trei functii de transfer,

χ = NP NC NF + MP MC MF .

Polii sistemului in bucla inchisa sunt zerourile polinomului caracteristic χ.


Teorema 4. Sistemul in bucla de reactie este intern stabil daca si numai daca
polii sistemului in bucla inchisa sunt in C−.

Demonstraţie. Pentru simplitate presupunem F = 1 (argumentatia in cazul gen-

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 15 Stabilitatea Interna a Buclei de Reactie
eral este similara dar este mai greu de urmarit). Din (1) avem
    
x1 1 −P −1 r
 x2  = 1  C 1 −C   d 
1 + PC
x3 PC P 1 n

si inlocuind (2) obtinem


    
x1 MP MC −NP MC −MP MC r
 x2  = 1  MP NC MP MC −MP NC   d  (3)
NP NC + MP MC
x3 NP NC NP MC MP MC n

in care polinomul de la numitor este exact polinomul caracteristic χ.


Suficienta: Sistemul in bucla inchisa este intern stabil daca polinomul caracteristic
are toate zerourile in C−.
Necesitatea: Implica un argument mai subtil. Presupunem ca sistemul in bucla
inchisa este intern stabil. Atunci toate cele noua functii de transfer in (3) sunt

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 16 Stabilitatea Interna a Buclei de Reactie
strict stabile (in sens BIBO), i.e., au poli numai in C−. Aceasta nu implica automat
ca NP NC + MP MC are zerourile in C− intrucat este posibil sa aibe un zerou in
afara care sa fie zerou si al tuturor numaratorilor din (3) si deci sa se simplifice.
In orice caz, polinomul χ nu are un zerou comun cu toti numaratorii din (3) asa
cum demonstram prin reducere la absurd. Fie s0 a.i. (NP NC + MP MC )(s0) = 0.
P.p. ca este zerou si al tutoror numaratorilor, in particular MP MC (s0) = 0. Apar
doua situatii posibile: i)MP (s0) = 0; ii)MC (s0) = 0.
Cazul i) MP (s0) = 0; Automat NP (s0) 6= 0 (MP este coprim cu NP ) si rezulta
din elementul (1,2) al matricii ca MC (s0) = 0 si din elementul (3,1) ca NC (s0) = 0
ceea ce nu este posibil din nou din coprimitatea lui NC si MC .
Cazul ii) MC (s0) = 0. Automat atunci NC (s0) 6= 0 si rationamentul se repeta ca
mai sus folosind elementele (2,3) si (3,1) ale matricii rezultand ca MP (s0) = 0 si
NP (s0) = 0, ceea ce contrazice coprimitatea lui MP si NP .

Teorema de mai sus ne da o modalitate sintetica de verificat stabilitatea interna


a unei bucle de reactie: se verifica locatia in C− a zerourilor unui polinom χ
(de exemplu calculand efectiv zerourile prin calculul valorilor proprii ale matricii

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 17 Stabilitatea Interna a Buclei de Reactie
companion asociate sau, mai simplu, folosind criteriul lui Hurwitz).
Teorema 5 (Test de Stabilitate Interna). Sistemul in bucla inchisa este intern
stabil daca si numai daca urmatoarele doua conditii sunt simultan indeplinite:

a) Functia de transfer 1 + P CF are zerourile in C−;

b) Nu au loc simplificari in C+ ∪ C0 cand formam produsul PCF.

Demonstraţie. Sistemul in bucla inchisa este intern stabil daca si numai daca
toate cele 9 functii de transfer
 
1 −P F −F
1  C 1 −CF 
1 + P CF
PC P 1

sunt stabile.
Necesitatea: Presupunem ca sistemul in bucla inchisa este intern stabil. Rezulta

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 18 Stabilitatea Interna a Buclei de Reactie
in particular ca 1+P1CF este stabila, deci 1 + P CF are zerourile in C− ceea ce
NP NC NF
demonstreaza necesitatea lui a). Fie P = M ,C=M ,F =M . Din Teorema
P C F
4 rezulta ca polinomul caracteristic χ = NP NC NF + MP MC MF are zerourile in
C−. Prin urmare perechea (NP , MC ) nu are zerouri comune in Re s ≥ 0 si similar
NP NC NF
pentru toate celelalte perechi corespunzand lui P CF = M P MC MF
. Deci si b) este
adevarata ceea ce incheie necesitatea.
Suficienta: Presupunem adevarate a) si b). Factorizam P, C, F ca mai sus si fie
s0 un zerou al polinomului caracteristic, i.e.,

(NP NC NF + MP MC MF )(s0) = 0. (4)

Aratam prin reducere la absurd ca Re s < 0. Presupunem contrariul, Re s ≥ 0.


Daca MP MC MF (s0) = 0 rezulta MP MC MF (s0) = 0 ceea ce violeaza b). Deci
NP NC NF
MP MC MF (s0) 6= 0 si impartind cu el in (4) obtinem 1 + MP MC MF
(s0) = 0 de
unde (1 + P CF )(s0) = 0 ceea ce violeaza a).

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 19 Stabilitatea Interna a Buclei de Reactie
Concluziile “la zi”

• Un sistem se comporta “civilizat” doar daca avem stabilitate interna, adica


indiferent unde se injecteaza un semnal exogen de energie finita toate semnalele
din sistem vor fi de energie finita;
• Stabilitatea interna nu se poate asigura cu conexiunile serie sau paralel ci
doar cu bucla de reactie;
• Stabilitatea interna se verifica pe baza faptului ca cele 18 functii de transfer din
bucla de reactie sunt simultan strict stabile dar exista teste mult mai simple
(vezi Teoremele 4 si 5);
• Ramane sa investigam problema de sinteza: Dandu-se un sistem nominal
oarecare P exista intotdeauna un regulator C care asigura stabilitatea interna ?
Daca DA se cere constructia clasei regulatoarelor C ce asigura stabilitatea interna.

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 20 Stabilitatea Interna a Buclei de Reactie
4. Stabilizarea

Consideram sistemul (mai simplu) cu bucla de reactie unitara din Figura 3. Aceasta
diagrama arata situatia teoretica tipica in controlul automat (F = 1) in care se
da P si se cere C ce satisface anumite cerinte: stabilizeaza intern, asigura
performante, tolereaza incertitudini de modelare, limiteza comenzi, etc. Cu toate
ca in general F 6= 1, dezvoltarile teoretice sunt destul de complexe chiar in acest
caz mai simplu pentru a-l analiza separat.
Ipoteza: P este strict propriu (bucla este automat bine definita in sens strict).
d
r u y
e
C P
-

Fig. 3: Sistem cu bucla de reactie unitara

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 21 Stabilizarea


Problema fundamentala: Dandu-se P exista intotdeauna un C care stabilizeaza
intern sistemul in bucla de reactie? Daca DA, cati exista ? Cum ii putem
caracteriza?
Raspuns: DA, exista o infinitate de C care stabilizeaza intern si ei se pot
da explicit prin intermediul parametrizarii lui Youla !

Parametrizarea lui Youla: Cazul P Stabil

Deoarece cazul general este relativ complicat, incepem sa dezvoltam mecanismul


necesar intr-un caz mai simplu: P stabil (P ∈ S, unde S este inelul comutativ al
functiior de transfer rationale proprii si stabile in sens strict).
Teorema 6. Presupunem ca P ∈ S. Clasa tuturor C pentru care sistemul in
bucla de reactie din Fig. 3 este intern stabil este data de
 
Q
: Q∈S . (5)
1 − PQ

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 22 Stabilizarea


Teorema afirma doua lucruri: oricare ar fi C dat de (5) (cu un Q ∈ S arbitrar) el
stabilizeaza intern si, pe de-alta parte, pentru oricare C care stabilizeaza intern se
Q
gaseste un Q a.i. C = 1−P Q , cu Q ∈ S.

Demonstraţie. Presupunem ca C stabilizeaza intern. Fie Q functia de transfer de


la r la u
C
Q := .
1 + PC
Q
Evident Q ∈ S si C = 1−P Q .

Reciproc, fie Q ∈ S. Definim

Q
C := . (6)
1 − PQ

Sistemul in bucla inchisa este intern stabil daca si numai daca cele 9 functii de

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 23 Stabilizarea


transfer  
1 −P −1
1  C 1 −C 
1 + PC
PC P 1
sunt proprii si stabile. Substituind expresia (6) pentru C aceasta matrice devine
 
1 − P Q −P (1 − P Q) −(1 − P Q)
 Q 1 − PQ −Q . (7)
PQ P (1 − P Q) 1 − PQ

Cum Q ∈ S si P ∈ S este clar ca toate elementele acestei matrici sunt proprii si


strict stabile.
Observatia 7. Toate functiile de transfer in bucla inchisa sunt afine in
parametrul liber Q, i.e., sunt de forma T1 +T2Q pentru anumiti T1 ∈ S, T2 ∈ S.
Acest fapt simplifica major orice calcule necesare pentru alegerea parametrului
Q a.i. sistemul in bucla inchisa sa satisfaca cerinte suplimentare (se poate
interpreta ca o liniarizare).

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 24 Stabilizarea


Trecem in continuare la analiza cazului general (P nu este neaparat stabil). In
acest scop introducem factorizarile coprime peste S.

Factorizari Coprime

Presupunem ca P nu este stabil si vrem sa gasim in continuare un C care


stabilizeaza intern. Cum procedam ?

Ideea de baza: Factorizam P peste S !


N
De ce nu peste polinoame ? Sa presupunem ca scriem P = M , unde (N, M ) sunt
polinoame coprime. Atunci exista doua alte polinoame X si Y (ce se pot construi
de exemplu pe baza algoritmului lui Euclid) ce satisfac identitatea lui Bezout

NX + MY = 1

(ideea calauzitoare este sa folosim Teorema 1 care afirma ca sistemul in bucla


inchisa este intern stabil daca si numai daca polinomul caracteristic nu are zerouri

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 25 Stabilizarea


in Re s ≥ 0). Daca am seta pe baza identitiatii Bezout C = X Y atunci polinomul
caracteristic verifica N X + M Y = 1 si deci nu are zerouri in Re s ≥ 0. De aici
“concluzia” ca C stabilizeaza intern.

Ce este gresit ? Y ar putea fi nul (deci C nu se poate construi astfel) sau


∂Y < ∂X (rezulta un regulator impropriu )!
Exemplul 8. Fie P (s) = 1s pentru care avem N (s) = 1, M (s) = s. O solutie
a ecuatiei Bezout N X + M Y = 1 este X(s) = 1 si Y (s) = 0 pentru care
C := X
Y nu este definit. Alta solutie este X(s) = −s + 1, Y (s) = 1, pentru care
C := X
Y = −s + 1 nu este propriu.

Pentru a remedia aceasta situatie cerem ca M, N, X, Y sa fie elemente ale lui S


si deci procedam la factorizari coprime peste S !

Doua functii in S se numesc coprime daca exista alte doua functii X, Y ambele
in S a.i. sa aibe loc identitatea lui Bezout

N X + M Y = 1.

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 26 Stabilizarea


In particular, identitatea de mai sus implica ca N si M nu au zerouri comune in
Re s ≥ 0 sau la ∞. Daca ar exista un astfel de s0 atunci am avea

0 = N (s0)X(s0) + M (s0)Y (s0) 6= 1.

Conditia este si suficienta pentru coprimitate: daca N si M nu au zerouri comune


in Re s ≥ 0 sau la ∞ atunci sunt coprime (Demonstratia: Exercitiu ! )
Factorizare coprima: Fie G matrice real rationala. O reprezentare de forma

N
G= , N, M ∈ S,
M

se numeste factorizare coprima a lui G peste S. Prezentam in continuare un


mecanism (algoritm) de constructie a celor 4 functii din S ce satisfac cele 2 ecuatii:

N
G= , N X + M Y = 1.
M
CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 27 Stabilizarea
n
Constructia lui M si N : Fie G rationala proprie cu coeficienti reali si fie G = m
o factorizare coprima peste polinoame (se obtine direct prin simplificarea oricaror
N
factori polinomiali comuni). Evident ∂n ≤ ∂m =: k. Atunci G = M cu

n m
N= k
, M=
(s + 1) (s + 1)k

este o factorizare coprima peste S a lui G.


1 2
Exemplul 9. Fie G = (s−1) 2 . Atunci k := 2, n(s) = 1, m(s) = (s − 1) si
obtinem factorizarea coprima

n(s) 1 m(s) (s − 1)2


N (s) = 2
= 2
, M (s) = 2
= 2
.
(s + 1) (s + 1) (s + 1) (s + 1)

Observatia 10. Asa cum se observa si in exemplul de mai sus, k este fixat de
cerintele de coprimitate ale celor doi factori. Intr-adevar, un k mai mic creaza
un M impropriu pe cand un k mai mare creaza doi factori M si N avand
zerouri comune la infinit.

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 28 Stabilizarea


Deci N si M se obtin facil. Obtinerea in continuare a lui X si Y este considerabil
mai dificila necesitand algoritmul lui Euclid.

Algoritmul Euclid calculeaza cel mai mare divizior comun a doua polinoame date
n(λ) si m(λ). Cand n(λ) si m(λ) sunt coprime, algoritmul lui Euclid se poate
folosi pentru calculul polinoamelor x(λ) si y(λ) ce satisfac identitatea lui Bezout

n(λ)x(λ) + m(λ)y(λ) = 1.

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 29 Stabilizarea


Algoritmul lui Euclid

Intrari: Polinoamele n(λ) si m(λ). Daca ∂m > ∂n se interschimba m si n.


Pasul 1: Imparte n la m pentru a obtine

n = mq1 + r1, ∂r1 < ∂m

(gradul restului mai mic strict decat gradul catului).


Pasul 2: Imparte m la r1 pentru a obtine

m = r 1 q2 + r 2 , ∂r2 < ∂r1.

·········
Pasul k: Imparte rk−2 la rk−1 pentru a obtine

rk−2 = rk−1qk + rk , ∂rk < ∂rk−1.

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 30 Stabilizarea


Opreste–te la Pasul k pentru care rk este o constanta nenula.
Ce am obtinut ? Scriind ecuatiile obtinute in forma compacta obtinem
    
1 0 0 r1 1 −q1
 q2 1 0  r2   0 1   
     n
 −1 q3 1  r3 = 0 0  .
  ..   .. 
..  m
 ... ... ...   
−1 qk 1 rk 0 0

Prima matrice din membrul stang este inversabila si are inversa tot o matrice
polinomiala (determinantul ei este o constanta) obtinandu-se resturile sub forma
   −1  
r1 1 0 0 1 −q1
 r2   q2 1 0   0 1   
      n
 r3 = −1 q3 1   0 0  .
 ..   ... ... ...   .. 
..  m
    
rk −1 qk 1 0 0

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 31 Stabilizarea


Deci rk (λ) := qe(λ)n(λ) + qb(λ)m(λ) in care qe si qb sunt polinoame functie de qi(λ).
Cum rk = cst. 6= 0, fie x(λ) := qer(λ) , y(λ) := qbr(λ) care sunt polinoamele cerute.
k k

Obtinerea Factorizarii Coprime peste S

Am vazut algoritmul Euclid si ca rezultat identitatea Bezout pentru polinoame.


Avem insa nevoie de identitatea Bezout peste functii din S (nu peste polinoame).
Cum procedam ? Facem o transformare de variabila a.i. polinoamele in λ sa
genereze functii in S.
Intrari: G
Pasul 1: Daca G este stabila, setam N = G, M = 1, X = 0, Y = 1 si STOP.
Altfel continua;
e
Pasul 2: Transforma G(s) in G(λ) luand s := 1−λ . Scrie e ca un cat de doua
G
λ
polinoame coprime

e n(λ)
G(λ) = .
m(λ)

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 32 Stabilizarea


Pasul 3: Foloseste algoritmul Euclid (peste polinoame) si gaseste x(λ) si y(λ) a.i.

nx + my = 1.

Treci de la n(λ), m(λ), x(λ), y(λ) la N (s), M (s), X(s), Y (s) facand tranformarea
1
inversa de variabila λ = s+1 .

Parametrizarea lui Youla: Cazul General (P oarecare)

Cu aceste preliminarii asigurate putem trece la constructia parametrizarii Youla


pentru cazul in care P este arbitrar (dar propriu).
N
Fie P = M o factorizare coprima peste S si fie X si Y doua functii in S satisfacand
identitatea lui Bezout
NX + MY = 1 (8)
(toate acestea sunt furnizate de procedura elaborata anterior).
Teorema 11 (Parametrizarea lui Youla). Multimea tuturor C pentru care sis-

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 33 Stabilizarea


temul in bucla de reactie din Figura 3 este intern stabil este data de
 
X + MQ
: Q∈S . (9)
Y − NQ

Exercitiu: Aratati ca Teorema 6 se obtine prin particularizarea Teoremei 11 atunci


cand P ∈ S !
Demonstratia Teoremei 2 se face pe baza unei leme preliminare.
N NC
Lema 12. Fie P = M si C = M factorizari coprime peste S. Sistemul cu bucla
C
de reactie este intern stabil daca si numai daca

(N Nc + M MC )−1 ∈ S.

Demonstraţie. Demonstratia lemei fiind aproape identica cu cea a Teoremei 5 este


lasata drept exercitiu !

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 34 Stabilizarea


Demonstratia Teoremei 11. Fie Q ∈ S si definim

X + MQ
C := .
Y − NQ

Pentru a arata ca sistemul in bucla inchisa este intern stabil definim

NC := X + M Q, MC := Y − N Q

si incercam sa aplicam Lema precedenta. Pentru aceasta trebuie sa aratam succesiv


Nc −1
ca C = M c
este o factorizare coprima si ca (N Nc + M M c ) ∈ S. Intr-adevar,
avem ca N X + M Y = 1 de unde rezulta automat ca N NC + M Mc = 1 ceea ce
demonstreaza prima parte a Teoremei.

Reciproc, fie C un regulator ce stabilizeaza intern bucla de reactie. Trebuie sa


aratam ca exista Q ∈ S a.i.
X + MQ
C= . (10)
Y − NQ

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 35 Stabilizarea


NC −1
Fie C = M C
o factorizare coprima peste S si definim V := (N NC + M M C ) .
Din Lema 1 rezulta ca V ∈ S. Avem ca

NC V
C= (11)
MC V

si incercam sa alegem Q a.i. (10) sa coincida cu (11) in sensul ca NC V = X +M Q


si MC V = Y − N Q. Il definim pe Q din prima ecuatie rezultand ca Q = NC M V −X

si calculand

N (NC V − X) M Y + N X − N NC V
Y − NQ = Y − =
M M

1 − N NC V M MC V
= = = MC V
M M
arata ca o verifica de fapt si pe a doua. A ramas sa aratam ca Q astfel definit

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 36 Stabilizarea


apartine lui S. Am vazut ca Q verifica

MC V = Y − N Q, NC V = X + M Q.

Scazand a doua ecuatie multiplicata cu Y din prima multiplicata cu X obtinem

MC V X − NC V Y = XY − XY − (N X + M Y )Q ⇔ Q = NC V Y − MC V X

si ultimul membru drept apartine lui S intrucat toate elementele apartin lui S.
Deci Q ∈ S.
Observatia 13. Analog ca in cazul in care P era stabila, toate functiile de
transfer in bucla inchisa sunt functii afine de Q daca parametrizam C ca in
enuntul teoremei in functie de Q. De exemplu functia de transfer de la r si d
la ǫ devine

1 P
ǫ= r− d = M (Y − N Q)r − N (Y − N Q)d.
1 + PC 1 + PC
CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 37 Stabilizarea
Acest fapt va fi esential in sectiunile urmatoare in care parametrul Q se va de-
termina a.i. sa satisfaca cerinte suplimentare de reglare (urmarirea asimptotica
a unui semnal referinta si rejectia unui semnal de tip perturbator).

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 38 Stabilizarea


5. Performante Asimptotice

Ce am obtinut pana in prezent ? Pentru o bucla de reactie standard (F = 1)


am reusit caracterizarea clasei tuturor compensatoarelor care asigura stabilitatea
interna (cea mai larga clasa ce ne intreseaza in aplicatii practice !)

Ce mai dorim de la un sistem de reglare automat ? Minimal dorim sa-i


asiguram o comportare dorita la anumite clase de semnale date si in conditiile in
care pot aparea semnale perturbatoare si/sau zgomote.

Ideal: Dorim ca la semnale precizate de intrare u ∈ U iesirii sistemului sa-i


corespunda un semnal dorit de iesire y ∈ Y. Mai precis, dorim ca fiecarui u ∈ U
sa-i asociem un y ∈ Y deci dorim ca sistemul sa reprezinte o aplicatie din U in Y
precizata.

Este realist sa cerem asa ceva ? In general NU !!! De ce ? Sunt mai multe
motive:

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 39 Performante Asimptotice


• u si y sunt functii de timp (sau rationale in domeniul transformatelor Laplace) iar
sistemul este liniar, invariant in timp, descris de o transformata Laplace rationala
proprie si stabila (cel putin in bucla inchisa). Deci pentru o pereche (u0, y0) fixata
exista cel mult un sistem T (rezulta din y0 = T u0). Daca dorim ca la alta intrare
u1 sa corespunda o alta iesire y1 rezulta in general alt sistem T ! Concluzie: se
poate cere asa ceva cel mult pentru o pereche de semnale !
• Este posibil asa ceva macar si pentru O SINGURA pereche de semnale?
Nici macar ! Raportul uy00 poate rezulta intr-un sistem instabil si deci neinteresant
pentru aplicatii (semnalele de intrare interesante u sunt in general de tip persistent
ca de exemplu treapta, sinusoide, rampe, etc.)
• Mai mult, din raportul uy00 pot rezulta sisteme improprii !

Ce este de facut? Relaxam cerintele pastrand esenta exigentelor! In general


nu ne intereseaza ca un semnal de iesire sa aibe exact forma dorita de noi ci mai
curand ne intereseaza ca dupa trecerea regimului tranzitoriu semnalul sa aibe o
comportare dorita rezultand deci anumite cerinte de performanta asimptotica !

Clasa de semnale de intrare: semnale persistente (pentru noi ≡ semnale cu

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 40 Performante Asimptotice


us (s)
transformata Laplace rationala strict proprie uj (s) in care polinomul uj (s) are toate
radacinile antistabile, i.e., in afara lui C−).

De ce facem astfel de ipoteze asupra semnalului?

• Transformata Laplace rationala: Lucram cu sisteme dinamice descrise de fctii


de transfer rationale si deci este normal ca semnalele sa fie tot rationale (solutii
ale unor ecuatii diferentiale ordinare in conditii initiale arbitrare).

• Strict proprii: Semnalul in domeniul timp dorim sa fie functie in sens regulat
(nu semnal generalizat).

• Radacini antistabile: Putem considera semnale generale dar cele interesante


din punct de vedere al proprietatilor asimptotice sunt doar cele antistabile. De
ce ? Raspunsul unui sistem liniar y = T u la o intrare u = u+ + u− (u+ partea
antistabila si u− partea stabila) este

y = y+ + y−, y+ = T u+, y− = T u−.

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 41 Performante Asimptotice


Deoarece sistemul este neaparat stabil (in bucla inchisa), rezulta ca y− are toate
radacinile in C− si deci limt→∞ y−(t) = 0 si dpdv asimptotic conteaza numai
componenta antistabila.

Ipoteze: Presupunem configuratia clasica de reglare din Figura 4

d
r u y
e
C P
-

Fig. 4: Sistem cu bucla de reactie unitara (F = 1)

in care semnalele externe r si d sunt presupuse de tip persistent. Semnalul r numit


referinta reprezinta semnalul pe care dorim sa-l urmareasca iesirea sistemului

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 42 Performante Asimptotice


y iar semnalul d este semnalul perturbator pe care il dorim rejectat la iesirea
sistemului (omitem momentan o discutie separata asupra lui n deorece F = 1 si
deci presupunem ca este disponibila iesirea y (prim masurare exacta); mai mult, n
fiind in general zgomot alb rejectia sa se poate trata doar cu instrumente specifice
statisticii matematice) !

Problema fundamentala a reglarii: Pentru configuratia de reactie din Figura


4 sa se gaseasca un sistem (numit compensator regulator) a.i. sistemul in bucla
inchisa sa indeplineasca simultan cerintele:

Stabilizare (S): Sa fie intern stabil, adica C sa fie un compensator stabilizator;

Reglare (R): Sa indeplineasca cerintele de reglare asimptotica adica

lim ǫ(t) = 0 ∀r ∈ R,
t→∞

lim ǫ(t) = 0 ∀d ∈ D,
t→∞

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 43 Performante Asimptotice


adica C sa fie un compensator regulator pentru clasa referintelor R si clasa
pertubatiilor D.
Observatia 14. • Cerinta de reglare (performanta asimptotica) nu are
sens fara asigurarea simultana a conditiei de stabilizare ! Nu are deci
sens sa abordam separat problema reglarii de cea a stabilizarii de exemplu prin
parametrizarea clasei tuturor regulatoarelor si ulterior intersectarea cu clasa
celor care stabilizeaza. Problema se abordeaza prin deducerea subclasei
compensatoarelor stabilizatoare ce asigura in plus si reglarea !
• Cerinta de reglare expliciteaza de fapt doua cerinte individuale de comportare
la doua clase de semnale de intrare:
Urmarirea referintei (Rr):

lim ǫ(t) = 0, ∀r ∈ R ,d = 0
t→∞

Rejectia perturbatiei (Rd):

lim ǫ(t) = 0, ∀d ∈ D , r = 0.
t→∞

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 44 Performante Asimptotice


• Ambele clase de semnale R, D sunt presupuse cunoscute (date prin cerinta
de proiectare). Cele doua cerinte se considera separat rezultand in final si com-
punerea efetcelor limt→∞ ǫ(t) = 0, ∀r ∈ R, ∀d ∈ D (acest fapt este o consecinta
a principiului superpozitiei aplicabil sistemelor liniare).
• Cerinta de urmarire a referintei se poate scrie echivalent

lim y(t) = lim r(t) ∀r ∈ R , d = 0.


t→∞ t→∞

Reformularea problemei reglarii


N Nc
Fie P = M si C = M c
factorizari coprime ale lui P si respectiv ale lui C peste S
si fie r = rrm
n
, d = ddmn factorizari coprime peste polinoame. Deorece r si d sunt
presupuse semnale persistente avem automat ca

∂rn < ∂rm, ∂dn < ∂dm

si radacinile lui rm si dm sunt in C+ ∪ C0.

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 45 Performante Asimptotice


Expresia lui ǫ ca functie de semnalele de intrare d si r este

1 P M Mc rn N Mc dn
ǫ= r− d= − . (12)
1 + PC 1 + PC N Nc + M Mc rm N Nc + M Mc dm

Teorema valorii finale: Daca ǫ(s) este o transformata Laplace rationala fara poli
in Re s ≥ 0 cu posibila exceptie a unui pol simplu in s = 0 atunci limt→∞ ǫ(t)
exista si se poate calcula cu alternativ prin

lim ǫ(t) = lim sǫ(s).


t→∞ s→0

Problema reglarii capata atunci urmatoarea formulare echivalenta:


Nc
Problema reglarii: Sa se gaseasca doua elemente in S notate Nc si Mc, cu Mc
proprie, care satisfac simultan cerintele:
1
Stabilizare (S’): N Nc +M Mc ∈S

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 46 Performante Asimptotice


Reglare (R’): Polii lui sǫ(s) ⊂ C− si

lim sǫ(s) = 0|∀r∈R,d=0, lim sǫ(s) = 0|∀d∈D,r=0.


s→0 s→0

Observatia 15. Chiar in aceasta formulare problema este relativ complicata in-
trucat cele doua conditii (S’) si (R’) trebuie asigurate simultan ! Asa cum
vom vedea putin mai tarziu, problema se simplifica considerabil daca folosim
pentru Nc si Mc expresiile deduse la stabilizare, adica daca scriem formula
parametrizata a compensatoarelor stabilizatoare si impunem sa satisfaca exclu-
siv conditia (R’), (S’) fiind automat satisfacuta in acest caz. In aceasta idee
este formulata si teorema reglarii din sectiunea urmatoare.

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 47 Performante Asimptotice


6. Solutia Problemei Reglarii

Teorema 16. Presupunand conditia (S) (sau echivalent (S’)) din problema
reglarii indeplinita, conditia (R) (sau echivalent (R’)) este indeplinita daca si
numai daca urmatoarele doua conditii sunt simultan indeplinite:

1 1 1
(i) × ∈ S ⇔ Z(rm) ⊂ Z( ) ⇔ Z(rm) ⊂ P(P ) ∪ P(C)
1 + P C rm 1 + PC

P 1 P
(ii) × ∈ S ⇔ Z(dm) ⊂ Z( ) ⇔ Z(dm) ⊂ Z(P ) ∪ P(C)
1 + P C dm 1 + PC

Demonstraţie. Sa observam intai ca sirurile de echivalente din enunt rezulta


automat din conditia ca rm si dm au toate zerourile in C+ ∪ C0 si sistemul in bucla
inchisa este intern stabil.

Conditiile sunt suficiente: Intr–adevar, conditiile fiind indeplinite rezulta din (12)

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 48 Solutia Problemei Reglarii


ca ǫ(s) are toti polii in C−. Mai mult, deoarece r si d sunt descrise de rationale
strict proprii rezulta si ca toti polii lui sǫ(s) sunt in C−.
Deoarece S × r1m ∈ S si P S × d1m ∈ S avem ca s nu este pol al acestor rationale
si din (12) rezulta
lim sǫ(s) = 0.
s→0
Deci conditia (R’) este in totalitate indeplinita.
Conditiile sunt necesare: Deorece (R’) este indeplinita, rezulta din (12) ca
simultan
1 rn P dn
ǫ= |d=0, ǫ= |r=0. (13)
1 + P C rm 1 + P C dm
1
Cum sistemul este intern stabil si deci 1+P C ∈ S iar Z(rm) ⊂ C+ ∪ C0 rezulta
automat din conditia (R’) folosita in prima relatie (13) ca rm trebuie sa dispara
complet prin simplificare. Rationamentul pentru a doua conditie din (13) este
similar rezultand in final necesitatea conditiilor (i) si (ii) din enunt.
1
Observatia 17. • Sa observam ca 1+P C are un zerou instabil in s0 (care sa
simplifice corespunzator “modelul” semnalului referinta continut in rm ) daca

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 49 Solutia Problemei Reglarii


si numai daca functia de transfer in bucla deschisa L = P C are un pol acolo.
• Teorema de mai sus se mai numeste si principiul modelului intern: pentru
a avea urmarire asimptotica a semnalului referinta trebuie ca polii semnalului
referinta sa apara ca poli in modelul intern al buclei deschise L.
• O analiza asemanatoare se poate face si in privinta semnalului perturbator d.

Exemple de aplicare:

Sa presupunem ca avem un sistem P si dorim sa construim un regulator care sa


urmaresca un semnal de tip treapta sau de tip rampa
 
c, daca t ≥ 0, ct, daca t ≥ 0,
r(t) = , r(t) =
0, daca t < 0, 0, daca t < 0,

unde c ∈ R∗. Alternativ, dorim sa rejectam de exemplu o perturbatie de tip


sinusoidal, i.e.
d(t) = sin(ωt)1(t).

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 50 Solutia Problemei Reglarii


Exemple tipice pentru referinta treapta il constituie reglarea automata a vitezei unui
automobil (cruise control) sau reglarea temperaturii dintr-o camera cu ajutorul unui
termostat ce comanda centrala termica. Un exemplu tipic pentru reglarea la rampa
il constituie o farfurie de radar sau de TV prin satelit ce trebuie sa urmareasca
orbita circulara a unui satelit (negeostationar). Un satelit ce se misca pe o orbita
circulara cu o viteza unghiulara constanta acopera un unghi ce este functie liniara
de timp (adica o rampa). Perturbatii sinusoidale apar in medii magnetice sau
bune conducatoare de electricitate acolo unde este folosita de exemplu tensiunea
alternativa. Aplicand teorema reglarii in aceste cazuri obtinem urmatoarea lema.
Lema 18. Prespunem ca sistemul in bucla inchisa este intern stabil si d = 0.
(a) Daca r este o treapta atunci are loc reglarea (i.e. limt→∞ ǫ(t) → 0) daca si
1
numai daca S := 1+P C are cel putin un zerou in origine (s = 0).
(b) Daca r este o rampa atunci are loc reglarea (i.e. limt→∞ ǫ(t) → 0) daca si
1
numai daca S := 1+P C are cel putin doua zerouri in origine (s = 0).
Prespunem ca sistemul in bucla inchisa este intern stabil si r = 0.
(c) Daca d este o sinusoida d(t) = sin(ωt)1(t) atunci are loc rejectia pertur-
batiei (i.e. limt→∞ ǫ(t) → 0) daca si numai daca P are un zerou in s = jω

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 51 Solutia Problemei Reglarii


sau C are un pol s = jω (automat va avea si s = −jω deoarece sistemele au
coeficienti reali).

Demonstraţie. Rezulta direct din aplicarea transformatei Laplace asupra lui r(t)
si d(t) si Teorema reglarii.
Exemplul 19. Sa luam un exemplu banal. Fie P (s) = 1s , C(s) = 1. Functia de
transfer de la r la ǫ este

1 s
Tǫr = =
1 + s−1 s + 1

Prin urmare polul din bucla deschisa din s = 0 devine zerou al functiei de
transfer de la referinta la eroare si acest zerou anuleaza polul lui r(s) = 1s
rezultand un ǫ(s) fara poli instabili. Deci acest sistem asigura in bucla inchisa
urmarirea unei referinte de tip treapta unitara.
Cu toate ca teorema reglarii ne da un instrument teoretic extrem de util in

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 52 Solutia Problemei Reglarii


abordarea analitica a solutiei problemei reglarii, mai sunt inca de facut cativa mici
pasi in explicitarea clasei compensatoarelor stabilizante si gasirea parametrului Q
care satisface conditiile enuntate.

Clasa compensatoarelor care asigura cerinta primordiala de stabilitate interna este


data de C = X+M Q N
Y −N Q in care Q este arbitrar in S si P = M si N X + M Y = 1, cu
toate N, M, X, Y ∈ S.

Functiile de transfer ce intervin in Teorema reglarii sunt date de

1 M Mc N Mc
Tǫr = S = = , si Tǫd = −P S = −
1 + PC N Nc + M Mc N Nc + M Mc

care devin dupa inlocuirea formulelor pentru Mc := Y − N Q si Nc := X + M Q,

Tǫr = M (Y − N Q), Tǫd = N (Y − N Q).

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 53 Solutia Problemei Reglarii


Scriind acum rm si dm in forma

rm = kr (s − sr1)(s − sr2) . . . (s − srk )

dm(s) = kd(s − sd1)(s − sd2) . . . (s − sdℓ)


unde kr , kd ∈ R si radacinile sri, sdj ∈ C+ ∪ C0, i = 1, . . . k, j = 1, . . . , ℓ apar in
perechi complex conjugate.

Cu aceste notatii, conditiile de interpolare enuntate in Teorema reglarii devin


pentru urmarirea referintei

M (sr1)(Y (sr1) − N (sr1)Q(sr1)) = 0,


M (sr2)(Y (sr2) − N (sr2)Q(sr2)) = 0,
.. (14)
M (srk )(Y (srk ) − N (srk )Q(srk )) = 0,

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 54 Solutia Problemei Reglarii


iar cele pentru rejectia perturbatiei devin

N (sd1)(Y (sd1) − N (sd1)Q(sd1)) = 0,


N (sd2)(Y (sd2) − N (sd2)Q(sd2)) = 0,
.. (15)
N (sdℓ)(Y (sdℓ) − N (sdℓ)Q(sdℓ)) = 0.

• In ecuatiile de mai sus N, M, X, Y sunt elemente cunoscute (determinate


anterior) in S si deci valorile lor in punctele sri si srj sunt numere reale (sau
complexe) ce se pot calcula direct. Necunoscuta o constituie parametrul liber
Q ∈ S care se determina a.i. conditiile de interpolare de mai sus sa fie indeplinite.
• Daca sri sau sdj sunt reali, ecuatia corespunzatoare va avea toti coeficientii reali
si evident si valoarea rezultata pentru Q(sri) sau Q(sdj ) va fi reala. Daca radacina
corespunzatoare este complexa atunci automat valoarea pentru Q(sri) sau Q(sdj )
va fi complexa rezultand doua ecuatii corespunzatoare partii reale si celei imaginare
avand ca solutii Re Q(·) si Im Q(·). Ecuatiile care rezulta pentru radacina complex
conjugata sri sau srj vor fi identice cu cele obtinute pentru sri sau srj si nu mai
este necesar sa le rezolvam/scriem.

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 55 Solutia Problemei Reglarii


• Parametrul Q este complet arbitrar in S insa conditiile de interpolare impun
esentialmente conditii asupra zerourilor sale. In consecinta pentru simplificarea cat
mai mult posibil a calculelor necesare se ia un Q ∈ S de o forma cat mai simpla
de tipul
a0 + a1s + . . . + ak+ℓ−1sk+ℓ−1
Q(s) =
(s + 1)k+ℓ−1
sau
1 1
Q(s) = a0 + a1 + . . . + ak+ℓ−1 k+ℓ−1
.
s+1 (s + 1)
Numarul minim de parametri cu care se incearca gasirea lui Q este dat de numarul
de conditii de interpolare ce trebuie satisfacute, i.e., k + ℓ si fixeaza gradul (minim)
al numaratorului si numitorului lui Q la k + ℓ − 1 (Q trebuie sa fie propriu). Se
observa ca pentru orice valori ale parametrilor a0, a1, . . . , ak+ℓ−1 avem Q ∈ S.
• Daca modelul intern este asigurat de sistemul original P atunci ecuatiile
(14) si (15) sunt satisfacute indiferent de valoarea lui Q. Intr–adevar, daca in
cazul urmaririi referintei avem ca sri este pol al lui P , atunci automat M (sri) = 0

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 56 Solutia Problemei Reglarii


si ecuatia respectiva

M (sri)(Y (sri) − N (sri)Q(sri)) = 0,

nu conduce la nici o restrictie asupra lui Q(sri). Similar pentru cazul rejectiei
perturbatiei daca sdj este in modelul original P (s) sub forma unui zerou atunci
ecuatia
N (sdj )(Y (sdj ) − N (sdj )Q(sdj )) = 0,

este automat satisfacuta pentru ca N (sdj ) = 0 si deci nu apare nici o restrictie


asupra lui Q(sdj ). Aceste fapte ne permit reducerea complexitatii parametrului
Q (si implicit a complexitatii regulatorului rezultant) in cazurile mentionate.
• Daca apare necesitatea asigurarii unui model intern cu radacini multiple ecuatiile
(14) si (15) trebuie completate cu variantele lor derivate de k − 1 ori, unde k este
multiplicitatea radacinii lui r(s) sau d(s).
• Ecuatiile (14) sunt satisfacute sau daca M (sri) = 0 caz in care ecuatia se elimina

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 57 Solutia Problemei Reglarii


si se scade cu 1 sau cu 2 gradul lui Q (caz real sau complex) sau daca

Y (sri )
Q(sri) = .
N (sri )

Dupa eliminarea tuturor ecuatiilor triviale (generate de prezenta chiar si partiala a


radacinilor in modelul intern) rezulta deci ca Q se alege a.i. sa satisfaca ecuatiile

Y (sri) Y (sdj )
Q(sri) = , Q(sdj ) =
N (sri) N (srj )

ceea ce revine la gasirea parametrilor a0, a1, . . . ak+ℓ−1 ce satisfac sistemul de


ecuatii

 Y (sri) = a0 + a1 1 + . . . + ak+ℓ−1 1
, ∀i = 1, . . . , k,
N (sri ) sri +1 (s +1)k+ℓ−1 ri
Y (sdj ) 1 1
 N (sdj ) = a0 + a1 s + . . . + ak+ℓ−1 (s k+ℓ−1 , ∀i = 1, . . . , ℓ.
dj +1 dj +1)

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 58 Solutia Problemei Reglarii


Acest sistem este un sistem liniar de k + ℓ ecuatii si k + ℓ necunoscute
a0, a1, . . . , ak+ℓ−1, avand matricea sistem de tip Vandermonde. Notam in
continuare unitar cu si punctele de interpolare atat corespunzatoare referintei
cat si perturbatiei (mai exact si := sri ptr. i = 1, . . . , k si si := sdi−k ptr
i = k + 1, . . . , k + ℓ. Sistemul Vandermonde se rescrie Aax = b unde
 1 1 1
  Y (s ) 
1 . . . 1
s1 +1 (s1 +1)2 (s1 +1)k+ℓ−1 N (s1 )
 1 s2 1 . . . 1  " a #  Y (s2) 
 (s2 +1)2 (s2 +1)k+ℓ−1  a1
0
 N (s2) 

A :=  .. . .
.. .
.. .
..  , ax := .. , b :=  .. .
 .  .
..

 ... ..
.
..
.
..
.  ak+ℓ−1  . 
1 1 1 ... 1 Y (sk+ℓ )
sk+ℓ +1 (sk+ℓ +1)2 (sk+ℓ +1)k+ℓ−1 N (sk+ℓ )

Sistemul are solutie unica daca si numai daca matricea A este inversabila sau
det A 6= 0. Se stie ca pentru o matrice Vandermonde are loc formula

det A = Π1≤i<j≤k+ℓ(si − sj )

si deci problema are solutie unica daca si numai daca punctele de interpolare

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 59 Solutia Problemei Reglarii


sunt distincte.
• Daca punctele de interpolare nu sunt distincte (apar radacini si cu ordinul de
multiplicitate m > 1 atunci se scrie ecuatia de baza si inca m − 1 derivate ale sale.
Matricea A devine de tip Vandermonde extinsa avand cele m linii corespunzatoare
lui si de tipul
 1 1 1

1 si+1 (si+1)2
... (si+1)k+ℓ−1
 0 1 2 si1+1 ... (k + ℓ − 1) (s +1)1k+ℓ−2 
 
 i 
 0 0 2 ... (k + ℓ − 1)(k + ℓ − 2) (s +1)1k+ℓ−3 
i
.. .. .. .. ..

Y (si )
si se actualizeaza corespunzator coeficientul termenului liber N (si ) ce corespunde
componentelor derivate.

• Din cele de mai sus aparent reiese ca problema reglarii are intotdeauna solutie.
Acest lucru nu este adevarat si rezulta din faptul ca este posibil ca N (si) = 0 caz in
care automat M (si) 6= 0 iar ecuatia de interpolare M (si)(Y (si)−N (si)Q(si)) = 0

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 60 Solutia Problemei Reglarii


poate fi satisfacuta daca si numai daca Y (si) = 0. Aceasta egalitate nu poate
insa avea loc intrucat rezulta ca

(N X + M Y )(sri) = 0 6= 1.

Teorema urmatoare sintetizeaza conditiile necesare si suficiente de existenta a unei


solutii a problemei reglarii.
N
Teorema 20. Fie P = M o factorizare coprima peste S si X, Y ∈ S a.i.
N X + M Y = 1. Fie r = rrmn si d = ddm n
semnale persistente de tip referinta
si respectiv de tip perturbator factorizate coprim peste polinoame. Fie r1 si
d1 c.m.m.d.c. (cel mai mare divizor comun – peste polinoame – ) al perechii
(rm, M ) si respectiv al perechii (dm, N ) si fie

rm e dm e := rem × dem.
rem = , dm = , rd
r1 d1

Problema reglarii are o solutie daca si numai daca N nu are nici un zerou
e
comun cu rd.

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 61 Solutia Problemei Reglarii


Demonstraţie. Conditia este necesara: P.p. prin absurd ca si este un zerou
comun atat al lui N (s) cat si red(s). Dupa simplificarea c.m.m.d.c. re1 si de1 in
ecuatiile de interpolare rezulta ca si trebuie sa satisfaca ecuatia

Y (si) − N (si)Q(si) = 0

care asa cum am vazut deja este posibila daca si numai daca N (si) 6= 0. De unde
contradictia.
Conditia este suficienta: Intr–adevar, daca rd e nu are zerouri comune cu N
e
rezulta ca N (si) 6= 0 pentru fiecare zerou al lui rd(s) si deci putem scrie un sistem
Vandermonde corespunzator care are intotdeauna o solutie unica.

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 62 Solutia Problemei Reglarii


Procedura pentru rezolvarea problemei reglarii

Pasul 1: Se rezolva problema stabilizarii folosind parametrizarea lui Youla pentru


clasa tuturor compensatoarelor stabilizante;
Pasul 2: Se analizeaza specificatiile de performanta asimptotice si se reduc la
conditii de interpolare asupra parametrului Q; se trateaza distinct cazul cu radacini
multiple si se analizeaza existenta solutiilor;
Pasul 3: Daca problema are solutie se rezolva sistemul Vandermonde corespunzator
si se determina parametrul Q care satisface deci conditiile de interpolare;
Pasul 4: Se inlocuieste parametrul Q in expresia parametrizata a compensatorului
si se obtine compensatorul regulator.
Observatia 21. Toate dezvoltarile de mai sus se pot face folosind modele poli-
nomiale insa natura intima a problemelor de reglare (cu asigurarea prealabila
a stabilizarii) indica ca mult mai potrivita abordarea de mai sus ce foloseste
factorizari coprime peste S !
Observatia 22. Se poate formula o problema conexa problemei de reglare deja

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 63 Solutia Problemei Reglarii


formulate, numita problema de reglare structural stabila. Aceasta cere ca pen-
tru o vecinatatate intreaga (cat de mica) a modelului nominal compensatorul
sa stabilizeze si sa continue sa regleze. Se poate arata relativ usor ca acesta
problema are solutie daca si numai daca cel mai mic multiplu comun al lui rm
si dm notat rdb divide Y − N Q adica daca si numai daca

N (si) 6= 0, ∀si a.i. b i) = 0


rd(s

b
⇔ rd(s) nu are zerouri comune cu N (s).

Acest fapt implica ca modelul semnalelor externe (exogene) r si d trebuie sa fie


integral inclus in modelul regulatorului si nu poate fi folosita (in caz ca exista)
partea comuna cu modelul nominal P (s).
Din punct de vedere al aplicatiilor concrete ale reglarii, avand in vedere ca mod-
elul nominal este aproape intotdeauna imprecis se impune deci includerea INTE-
GRALA a modelului exogenului in regulator (chiar daca este deja total/partial
continut in P ).

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 64 Solutia Problemei Reglarii


In general aceasta masura de precautie nu este suficienta pentru multe aplicatii
intrucat nu garanteaza rezolvarea problemei decat pentru o vecinatate arbitrar de
mica a modelului nominal. Formularea corecta si rezolvarea completa a proble-
mei se face in cadrul teoriei robustetii in care se gasesc acei Q care maximizeaza
vecintatea in care are loc stabilizarea si/sau performanta asimptotica.

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 65 Solutia Problemei Reglarii


Alte cerinte de performanta realizabile cu Q

Parametrul Q poate fi folosit pentru realizarea altor cerinte de performanta:

• Obtinerea anumitei comportari dinamice dorite a sistemului in bucla inchisa prin


asigurarea anumitor locatii a polilor in bucla inchisa) – (exercitiu: propuneti o
metoda pentru aceasta !);

• Asigurarea stabilizarii robuste ce permite cele mai mari incertitudini (intr-o


anumita norma) asupra modelului nominal P cu pastrarea stabilitatii interne;

• Performanta robusta ce permite asigurarea proprietatilor de tip asimptotic


pentru o incertitudine cat mai mare in modelul nominal P ;

• Asigurarea reglarii cu o clasa de regulatoare ce permit limitarea comenzii la o


anumita valoare prescrisa;

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 66 Solutia Problemei Reglarii


• Sa se stabilizeze un sistem stabil cu un compensator stabil;

• Problema stabilizarii simultane a doua sau mai multe sisteme nominale date
folosind acelasi regulator

• Combinatii ale tuturor sau doar unora dintre cerintele de mai sus.

Desigur, combinand toate sau chiar o parte dintre aceste cerinte problemele se
complica major si exista desigur situatii in care nu se pot asigura simultan toate
cerintele. Un studiu mai detaliat al conditiilor in care anumite cerinte din cele
de mai sus pot fi satisfacute se va face la Master (implica introducerea unui
formalism matematic adecvat). Desigur exista si numeroase probleme deschise (a
caror solutie nu a fost inca data) pe care sunteti invitati sa le incercati !

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 67 Solutia Problemei Reglarii


Exemple de Probleme (tipice de examen)

Exemplul 23. Fie un sistem nominal stabil P . Sa se gasesca toate regulatoarele


care urmaresc o referinta treapta. Mai mult, sa se precizeze subclasa solutiilor
structural stabile.
Rezolvare: Orice reglare se face cu stabilizare prealabila. P fiind stabil, rezulta
Q
ca C = 1−P Q da clasa tuturor compensatoarelor stabilizatoare cand Q parcurge
S. In cazul in care P este stabil, avem trivial N = P , M = 1, Y = 1, X = 0.
Pentru un semnal de tip treapta r(t) = 1(t) avem r(s) = 1s si deci rm(s) = s cu
singurul zerou in s = 0. Cum M (0) = 1 6= 0 rezulta ca singura varianta de a
satisface ecuatia M (0)(Y (0) − N (0)Q(0)) = 0 este sa avem P (0) = N (0) 6= 0.
In concluzie problema are solutie daca si numai daca s = 0 nu este zerou al lui
1
P caz in care orice Q ∈ S cu Q(0) = P (0) satisface cerinta de reglare, i.e.,

 
Q 1
C= : Q ∈ S, Q(0) = .
1 − PQ P (0)

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 68 Solutia Problemei Reglarii


Aceasta expresie da si clasa solutiilor structural stabile (explicati de ce !!!).
1
Exemplul 24 (Exemplu detaliat la seminar). Fie P (s) = (s−1)(s−2) . Sa se
gaseasca un regulator ce asigura urmarirea unei referinta treapta r(t) = 1(t)
si rejectia unei perturbatii sinusoidale d(t) = sin10t. Rezolva orice regulator
gasit problema structural stabila ?
Schita de rezolvare: Trebuie gasita intai clasa compensatoarelor stabilizante.
P fiind instabila aceasta are forma C = X+M Q
Y −N Q cu Q arbitrar in S. Deci trebuie
intai gasiti N, M, X, Y folosind procedura de la pagina 29. Mai intai calculam

2
1 − λ λ
Pe (λ) := P ( )= 2 , cu n(λ) = λ2, m(λ) = 6λ2 − 5λ + 1.
λ 6λ − 5λ + 1

Aplicam algoritmul lui Euclid pentru n(λ) si m(λ) obtinand succesiv

1 5 1
q1(λ) = , r1(λ) = λ − ,
6 6 6
CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 69 Solutia Problemei Reglarii
36 1 6
q2(λ) = λ − , r2(λ) =
5 6 25
si ne oprim intrucat am obtinut un rest constant nenul. Ecuatiile verificate
sunt
n = mq1 + r1
m = r 1 q2 + r 2
de unde
r2 = (1 + q1q2)m − q2n.
Deci luam
q2 1 + q1 q2
x = − = −30λ + 19, y = = 5λ + 1.
r2 r2
1
Revenind in variabila s prin transformarea inversa λ = s+1 obtinem

1 (s − 1)(s − 2)
N (s) = , M (s) =
(s + 1)2 (s + 1)2

1 19s − 1 1 s+6
X(s) = x( )= , Y (s) = y( )= .
s+1 s+1 s+1 s+1
CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 70 Solutia Problemei Reglarii
Deci am deteminat toti C care asigura stabilitatea interna.

Avem r(s) = 1s si d(s) = s2100 +100


de unde r m (s) = s si d m (s) = s 2
+ 100.
Observam ca nici o radacina a acestor doua polinoame nu apare ca pol respectiv
ca zerou al sistemului initial P si deci problema de reglare structural stabila va
avea aceeasi solutie cu cea obisnuita data de cele doua conditii de interpolare
ce trebuie satisfacute:

M (0)(Y (0) − N (0)Q(0)) = 0,


N (10j)(Y (10j) − N (10j)Q(10j)) = 0.

Inlocuind valorile corespunzatoare ale lui N, M, Y obtinem echivalent

Y (0)
Q(0) = N (0) = 6
Y (10j)
Q(10j) =N (10j) = −94 + 10j ⇔ Re Q(10j) = −94, Im Q(10j) = 70.

Avem de satisfacut trei conditii de interpolare si deci vom lua un polinom Q

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 71 Solutia Problemei Reglarii


1
(in variabila s+1 ) cu trei coeficienti deci de gradul 2:

1 1
Q(s) = a0 + a1 + a2 2
.
s+1 (s + 1)

Ramane sa determinam coeficientii a0, a1, a2 pe baza conditiilor de interpolare.


Rezolvand sistemul liniar de tip Aax = b ce se obtine rezulta coeficientii a0 =
−79, a1 = −723, a2 = 808. De aici rezulta expresiile

−79s2 − 881s + 6 −60s4 − 598s3 + 2515s2 − 1794s + 1


Q(s) = 2
, C(s) =
(s + 1) s(s2 + 100)(s + 9)

care reprezinta solutia cautata.


Exemplul 25. Sa presupunem ca in exercitiul precedent se cere realizarea unei
urmariri a unei referinte de tip rampa, in contextul in care perturbatiile nu apar

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 72 Solutia Problemei Reglarii


(sunt nule). Semnalul rampa are transformata Laplace

1
r(s) =
s2

si deci rm(s) = s2. Conditia de interpolare se pune astfel incat M (s)(Y (s) −
N (s)Q(s)) sa aibe un zerou dublu in s = 0. Cum M (0) 6= 0 rezulta echivalent
ca Y (s) − N (s)Q(s) trebuie sa aibe un zerou dublu in s = 0 si deci Q(s) trebuie
sa fie de gradul 1 pentru a avea doi parametri liberi a0 si a1, i.e.,

1
Q(s) = a0 + a1 .
s+1

Conditiile de interpolare sunt deci

Y (0)
Q(0) = =6
N (0)

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 73 Solutia Problemei Reglarii


si respectiv conditia asupra derivatei

′ ′
′ Y (0)N (0) − N (0)Y (0)
Q (0) =
N (0)2

din care rezulta sistemul corespunzator cu solutia a0 = 13, a1 = −7. Similar se


scrie acum Q si respectiv C.

CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 74 Solutia Problemei Reglarii


CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR

1. Sisteme Dinamice pe Spatiul Starilor

2. Evolutia Starii, Tranzitia Intrare–Iesire

3. Echivalenta Sistemelor Liniare

4. Stabilitatea Sistemelor

5. Regimurile Permanent/Tranzitoriu/Stationar

CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 75 SISTEME DINAMICE PE SPATIUL STARILOR


1. Sisteme Dinamice pe Spatiul Starilor

Clasa sistemelor considerate:

• LINIARE

• INVARIANTE IN TIMP

• FINIT DIMENSIONALE

• MULTI-INTRARE/MULTI-IESIRE (MIMO)
Definitia 26. Se numeste sistem dinamic liniar, invariant in timp, cu timp
continuu un cuadruplu de matrici constante (A, B, C, D), unde A ∈ Rn×n,

CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 76 Sisteme Dinamice pe Spatiul Starilor


B ∈ Rn×m, C ∈ Rp×n, D ∈ Rp×m ce se expliciteaza prin

ẋ(t) = Ax(t) + Bu(t), x(to) = xo
(16)
y(t) = Cx(t) + Du(t)

unde x(t) ∈ Rn, u(t) ∈ Rm, y(t) ∈ Rp;


u(t) → intrarea sistemului, u(·) ∈ U, U → spatiul functiilor (semnalelor) de intrare;
y(t) → iesirea sistemului, y(·) ∈ Y, Y → spatiul functiilor (semnalelor) de iesire;
x(t) → starea sistemului, x(·) ∈ X , X → spatiul starilor.

Observatii:
• Sistemul dinamic astfel definit admite o scriere matriciala ce expliciteaza de fapt
un sistem de n ecuatii diferentiale cu n necunoscute (starile) iar iesirile sunt o
combinatie liniara a starilor si intrarilor (FIG);
• Sistemul este automat invariant in timp, liniar, finit dimensional si cauzal !
• Datorita invariantei in timp se poate lua intotdeauna to = 0 si deci conditia
initiala se rescrie x(0) = xo;

CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 77 Sisteme Dinamice pe Spatiul Starilor


• Sistemul dinamic astfel definit se poate figura ca un sistem intrare–iesire in care
starea joaca rolul de variabila de cuplare (FIG) !
• Sistemul este complet precizat de cele patru matrici (A, B, C, D);
• Conditii uzuale: u(t) continua cel putin pe portiuni caz in care x(t) si y(t)
rezulta functii continue;

CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 78 Sisteme Dinamice pe Spatiul Starilor


2. Evolutia Starii, Tranzitia Intrare–Iesire

Prima ecuatie a sistemului

ẋ(t) = Ax(t) + Bu(t), x(0) = xo

este in fapt un sistem de n ecuatii diferentiale ordinare cu n necunoscute avand


o solutie unica in cazul in care starea initiala xo si comanda u(t), t ≥ 0, sunt
precizate (u(·) este continua pe portiuni). Din teoria ecuatiilor diferentiale ordinare
solutia rezulta
At
R t A(t−τ )
x(t) = φ(t, xo, u(·)) = e xo + 0 e Bu(τ )dτ
= φ(t, xo, 0) + φ(t, 0, u(·))
= xℓ(t) + xf (t).

Functia φ : R × Rn × U → Rn se numeste functia de tranzitie a starii. Descom-


punerea aditiva de mai sus pune in evidenta superpozitia efectelor (datorate starii

CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 79 Evolutia Starii, Tranzitia Intrare–Iesire


initiale xo – regim liber – si respectiv comenzii u(·) – regim fortat).

Matricea
Φ(t) := eAt

se numeste matricea de tranzitie a starii. Cu aceasta notatie solutia sistemului de


ecuatii diferentiale se rescrie

Z t
x(t) = Φ(t)xo + Φ(t − τ )Bu(τ )dτ. (17)
0

Problema: Ce inseamna si cum se calculeaza eAt ?


Avem prin definitie

1 1 1
ex = 1 + x + x2 + . . . + xn + . . .
1! 2! n!
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 80 Evolutia Starii, Tranzitia Intrare–Iesire
care in cazul matricial devine

At 1 1 2 1
e = In + (At) + (At) + . . . + (At)n + . . . . (18)
1! 2! n!

Calculul matricii de tranzitie a starii se bazeaza pe forma Jordan a matricii A si va


fi explicitat mai tarziu.

Reversibilitatea timpului: Deoarece Φ(t) 6= 0, ∀t finit, obtinem din (17)


Rt
xo = Φ(−t)x(t) − 0 Φ(−t)Φ(t − τ )Bu(τ )dτ
Rt (19)
= Φ(−t)x(t) − 0 Φ(−τ )Bu(τ )dτ

de unde rezulta ca in cazul sistemelor netede (cu timp continuu) starea initiala se
poate intotdeauna recupera daca se cunoaste “unde s-a ajuns” si comanda care a
generat starea respectiva. (FIG)

Iesirea sistemului se obtine imediat ca o combinatie liniara de intrari si stari sub

CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 81 Evolutia Starii, Tranzitia Intrare–Iesire


forma (vezi (16) si (17))

Rt
y(t) = f (t, xo, u(·)) = Ce xo + 0 CeA(t−τ ) Bu(τ )dτ
At

= f (t, xo, 0) + f (t, 0, u(·))


= yℓ(t) + yf (t).

Matricile 
0, t < 0,
T (t) := CΦ(t)B, Tc(t) :=
T (t), t ≥ 0
se numesc matricea pondere respectiv matricea de raspuns cauzal la impuls. Mai
mult
Tc(t) = T (t)1(t)
unde 1(t) := diag {1(t)} iar 1(t) este functia treapta (Heaviside). Cu aceste
notatii Z t
y(t) = CΦ(t)xo + Tc(t − τ )u(τ )dτ.
0

CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 82 Evolutia Starii, Tranzitia Intrare–Iesire


In particular daca xo = 0 obtinem
Z t
y(t) = Tc(t − τ )u(τ )dτ = yf (t)
0

ceea ce arata ca matricea de raspuns cauzal la impuls permite exprimarea iesirii


atunci cand conditia initiala este nula. Mai precis, in conditii initiale nule sistemul
dinamic se poate exprima ca un sistem de convolutie sub forma
Z ∞
y(t) = Tc(t − τ )u(τ )dτ = Tc(t) ∗ u(t),
−∞

(u = 0 pentru t < 0 si Tc(t − τ ) = 0 pentru t − τ < 0). Daca m = p = 1 atunci


Tc(t) = hc(t) si are semnificatia de raspuns cauzal al sistemului atunci cand la
intrare se aplica un impuls Dirac u(t) = δ(t).

Functie (Matrice) de Transfer

CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 83 Evolutia Starii, Tranzitia Intrare–Iesire


Restrangem intrarile la clasa functiilor original, i.e., U ⊂ O. Atunci automat x(t)
si y(t) vor fi functii original, i.e. X ⊂ O si Y ⊂ O. In aceste conditii aplicand
transformatele Laplace sistemului original (16) obtinem

sx(s) − xo = Ax(s) + Bu(s),
(20)
y(s) = Cx(s) + Du(s),

de unde tinand cont ca (sI − A) este a.p.t. nesingulara

x(s) = (sI − A)−1xo + (sI − A)−1Bu(s) = xℓ(s) + xf (s).

Avem deasemenea

Φ(s) := L(Φ(t)) = L(eAt) = (sI − A)−1

care se numeste matricea rezolventa si deci

Φ(t) = L−1((sI − A)−1).

CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 84 Evolutia Starii, Tranzitia Intrare–Iesire


Mai mult,
Φ(s) = s−1I + s−2A + s−3A3 + . . .
care are loc pentru |s| > R unde R := max{|λ|, λ ∈ Λ(A)}. Deasemenea

−1 (sI − A)∗ G(s)


Φ(s) = (sI − A) = =
χ(s) ν(s)

unde χ(s) := det(sI − A) si ν(s) sunt polinomul caracteristic respectiv minimal


ale lui A. In operational iesirea devine

y(s) = Cx(s)+Du(s) = C(sI−A)−1xo+C(sI−A)−1Bu(s)+Du(s) = yℓ (s)+yf (s).

Matricea de transfer este prin definitie


 
A B
T (s) := L(Tc(t)) = C(sI − A)−1 B + D =:
C D

CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 85 Evolutia Starii, Tranzitia Intrare–Iesire


unde ultima expresie explicita se obtine comparand expresiile iesirii in domeniul
timp si operational. Mai departe,

C(sI − A)∗B e
R(s) R(s)
T (s) = +D = = = {Tij (s)} 1≤i≤p .
χ(s) χ(s) ν(s) 1≤j≤m

Matricea de transfer a unui sistem dinamic (in acceptiunea definitiei date) este o
p × m matrice de functii rationale proprii. Ea permite explicitarea in operational a
iesirii in functie de intrare atunci cand conditiile intiale sunt nule

y(s) = T (s)u(s) (xo = 0).

CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 86 Evolutia Starii, Tranzitia Intrare–Iesire


3. Echivalenta Sistemelor Liniare

Definitia 27. Doua sisteme liniare (A, B, C, D) si (A, e B,


e C,
e D)
e avand acelasi
numar de intrari si iesiri si aceeasi dimensiune a spatiului starilor (p = pe, m =
e n=n
m, e) se numesc echivalente (izomorfe) pe stare daca exista o transformare
nesingulara T astfel incat

e
A = T AT −1,
e
B = T B,
e
C = CT −1,
e
D = D.

Transformarea T este de fapt o schimbare de coordonate la nivelul marimii de

CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 87 Echivalenta Sistemelor Liniare


stare. Intr–adevar, daca

ẋ(t) = Ax(t) + Bu(t),
(21)
y(t) = Cx(t) + Du(t),

si definim pentru un T inversabil fixat

e(t) := T x(t)
x ⇔ x(t) = T −1x
e(t)

atunci obtinem 
T −1x ˙
e(t) = AT −1x e(t) + Bu(t),
−1 ⇒ (22)
y(t) = CT x e(t) + Du(t),

˙
e(t)
x = T AT −1x
e(t) + T Bu(t),
−1 ⇒
y(t) = CT x e(t) + Du(t),
(
˙
e(t)
x ex(t) + Bu(t),
= Ae e
y(t) = C ex e
e(t) + Du(t),

CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 88 Echivalenta Sistemelor Liniare


unde
e = T AT −1,
A e = T B,
B e = CT −1, D
C e = D.

Propozitia 28 (Exercitiu). Doua sisteme echivalente pe stare care au conditiile


initiale asemenea prin T si sunt supuse aceleiasi comenzi u(·) au traiectoriile
de stare asemenea prin T si evolutii la iesire identice.
Definitia 29. Doua sisteme dinamice (A, B, C, D) si (A, e B,
e C,
e D)e se numesc
echivalente intrare–iesire daca au aceeasi functie de transfer, i.e.,

Te(s) = C(sI
e e −1B
− A) e+D
e = C(sI − A)−1B + D = T (s).

Observatii: a) Doua sisteme echivalente intrare–iesire trebuie sa aibe acelasi numar


de intrari (m = m)e si acelasi numar de iesiri (p = pe). Este posibil insa ca
dimensiunea vectorului de stare sa difere, i.e. n 6= n
e.

CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 89 Echivalenta Sistemelor Liniare


b) Pentru doua sisteme echivalente intrare–iesire avem automat

D = T (∞) = Te(∞) = D.
e

CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 90 Echivalenta Sistemelor Liniare


Relatia intre Echivalenta de Stare si Echivalenta Intrare–Iesire

Propozitia 30. Doua sisteme echivalente pe stare sunt echivalente intrare–iesire.

Demonstraţie. Intr-adevar,

Te(s) = C(sI
e e −1B
− A) e+D e = CT −1(sI − T AT −1)−1T B + D
= CT −1(T (sI − A)T −1)−1T B + D = C(sI − A)−1B + D = T (s).

Observatii: a) Reciproca nu este in general valabila (este posibil ca pentru doua


sisteme echivalente intrare–iesire) sa avem n 6= n e). (EX)
b) Diferenta in definitiile echivalentei consta in aceea ca una este centrata pe stare
pe cand cealalta este centrata pe functia de transfer (intrare–iesire).
c) Pentru orice matrice de transfer exista o infinitate de realizari de stare.

CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 91 Echivalenta Sistemelor Liniare


d) Problema dimensiunii realizarii de stare este esentiala: exista o dimensiune ce
este minima (realizare minimala), strict legata de anumite proprietati structurale.

CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 92 Echivalenta Sistemelor Liniare


4. Stabilitatea Sistemelor Dinamice

Stabilitatea este o proprietate calitativa a sistemelor asociata comportarii dinamice


a acestora.

Daca stabilitatea se refera la comportarea lui x(t) se numeste stabilitate de tip


Lyapunov iar daca se refera la y(t) se numeste stabilitate externa.

Stabilitate Interna (Libera sau Lyapunov)

Acest tip de stabilitate se refera la comportarea marimii de stare x(t) atunci cand
intrarea este identic nula. Ecuatia relevanta este

ẋ(t) = Ax(t), x(0) = xo.

Definitia 31. Un sistem dinamic se numeste intern stabil daca ∀ǫ > 0, ∃δ(ǫ) > 0

CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 93 Stabilitatea Sistemelor Dinamice


a.i. ∀xo cu kxok < δ(ǫ) avem

kx(t)k ≤ ǫ, ∀t ∈ R+.

Definitia 32. Un sistem dinamic s. n. intern asimptotic stabil daca ∀xo avem

lim kx(t)k = 0.
t→∞

Observatii: a) Definitia este generala folosindu-se si in cazul sistemelor neliniare.


In cazul liniar exista anumite consecinte simple deoarece avem solutia

x(t) = eAtxo.

b) Sistemul este intern asimptotic stabil daca si numai daca limt→∞ Φ(t) = 0.

Evaluarea lui Φ(t) = eAt

CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 94 Stabilitatea Sistemelor Dinamice


Consideram succesiv urmatoarele cazuri:
a) A este un bloc Jordan elementar cu valoare proprie 0;
b) A este un bloc Jordan elementar oarecare;
c) A oarecare.

a) In acest caz presupunem A ∈ Rn×n si

 
0 1 ... 0
 .. .. . . . .. 
A = J0 = 
 0 0 ...
.
1 
0 0 ... 0

Evident A este nilpotenta cu indice de nilpotenta egal cu n, i.e. An = 0 si

CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 95 Stabilitatea Sistemelor Dinamice


An−1 6= 0. Folosind definitia exponentialei matriciale (18) obtinem in acest caz

   n−1
 
t t t tn−1
0 1! ... 0 0 0 ... (n−1)! 1 1! ... (n−1)!
 .. .. ... ..   .. .. . . . ..   .. .. ... ..
  
eAt
= I n +
 0 t 
 +· · ·+  =
0 ... 1!  0 0 ... 0   0 0 ... t
1!
0 0 ... 0 0 0 ... 0 0 0 ... 1

b) In acest caz presupunem A ∈ Rn×n si

 
λo 0 . . . 0
 .. .. . . . .. 
A = Jo + Λo, unde Λo = 
 0 0 ...
 = λoIn.
0 
0 0 ... λo

Avem eAt = e(Jo+Λo)t = eJoteΛ0t (relatie ce are loc pentru ca Λo comuta cu Jo).

CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 96 Stabilitatea Sistemelor Dinamice


Tinand cont ca eΛot = eλotIn obtinem in final

 n−1

t t
1 1! ... (n−1)!
 .. .. ... .. 
 
eAt = eλot  t .
 0 0 ... 1!

0 0 ... 1

c) Cazul general se reduce la cazurile precedente prin aducerea matricii A la forma


canonica Jordan. Mai precis, ∀A ∈ Rn×n, ∃T ∈ Rn×n nesingulara a.i.

 
J1 0
J = T AT −1 =  ... 
0 Jk

unde J este o matrice Jordan (bloc diagonala avand pe diagonala blocuri elementare

CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 97 Stabilitatea Sistemelor Dinamice


Jordan Ji la valorile proprii ale matricii A). Matricea de tranzitie a starii devine
 J1 t

−1
e 0
eAt = eT JT t
= T −1eJtT = T −1  ...  T.
0 eJk t

Recapitulare: Polinom caracteristic, minimal, forma canonica Jordan, valori proprii,


multiplicitati algebrice si geometrice;
Teorema 33. 1. Sistemul dinamic (A, B, C, D) este intern asimptotic stabil
daca si numai daca Λ(A) ⊂ C− (spectrul matricii de stare A este localizat in
semiplanul stang deschis).
2. Sistemul dinamic (A, B, C, D) este intern stabil daca si numai daca Λ(A) ⊂
C− ∪ C0 iar valorile proprii care au partea reala nula sunt radacini simple ale
polinomului minimal.
Demonstratie: 1. Suficienta conditiilor rezulta automat din forma Jordan. Pentru
necesitate pp ca sistemul este intern asimptotic stabil. Atunci rezulta ca Φ(t)xo →
0 pentru t → ∞, ∀xo ∈ Rn. Pp prin absurd ca nu este indeplinita conditia de

CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 98 Stabilitatea Sistemelor Dinamice


spectru. Atunci ∃ λ0 ∈ Λ(A) cu Re λo ≥ 0. Fie xo un vector propriu asociat lui
λo. Atunci
eAtxo = eλotxo 6→ 0
ceea ce contrazice ipoteza de stabilitate asimptotica.
2. Demonstratia este similara tinand cont ca eJit este marginita (Ji este bloc
Jordan elementar) daca si numai daca v. p. corespunzatoare are partea reala sau
strict negativa sau zero cu multiplicitatea cel mult unu.
Observatii: a) Testarea stabilitatii interne pentru un sistem dinamic se reduce
din punct de vedere procedural la calculul valorilor proprii ale matricii de stare A
(aducerea matricii la forma Schur).
b) Deoarece stabilitatea interna a unui sistem depinde exclusiv de locatia spectrului
matricii de stare A uneori se foloseste abuziv terminologia de matrice (asimptotic)
stabila.

Ecuatia Lyapunov si Stabilitatea Sistemelor Liniare

Ecuatia
AT P + P A + Q = 0, A ∈ Rn×n , Q ∈ Rn×n (23)

CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 99 Stabilitatea Sistemelor Dinamice


in necunoscuta P ∈ Rn×n se numeste ecuatie Lyapunov (matriciala, algebrica, in
timp continuu).
Teorema 34. Daca matricea A este asimptotic stabila (Λ(A) ⊂ C−) atunci
ecuatia Lyapunov are o solutie unica data explicit de expresia
Z ∞
AT t
P := e QeAtdt. (24)
0

Demonstraţie. Sa observam intai ca deoarece A este asimptotic stabila expresia


(24) este bine definita (integrala nedefinita este convergenta). Calculand

T
R∞ T AT t At AT t At
R∞ d AT t At
A P + PA = 0
(A e ∞ Qe +e Qe A)dt = 0 dt (e Qe )dt
T
A t At
= e Qe = −Q
0

concluzionam ca intr-adevar P dat de (24) este o solutie a ecuatiei Lyapunov.

CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 100 Stabilitatea Sistemelor Dinamice


Ramane sa aratam ca P este unica solutie. Consideram aplicatia liniara
2 2
P : Rn → Rn , P(P ) := AT P + P A.
2
Aceasta aplicatie este insa surjectiva deoarece tocmai am aratat ca ∀Q ∈ Rn ⇒
n2
∃P ∈ R (dat de (24)) a.i. P(P ) = −Q. Deoarece o aplicatie liniara si surjectiva
este automat injectiva (si deci bijectiva) rezulta ca pentru Q fixat P dat de (24)
este unica solutie a ecuatiei Lyapunov (23). In particular, P = P −1(−Q).

Observatii: a) Daca Q = QT atunci rezulta automat din (24) ca P = P T .


b) Daca Q = QT ≥ 0 atunci P = P T ≥ 0.
c) Daca Q = QT > 0 atunci P = P T > 0.
Ecuatia Lyapunov se foloseste in special in teoria sistemelor neliniare pentru testarea
stabilitatii. In cazul liniar avem urmatorul rezultat (un fel de reciproca).
Teorema 35 (Lyapunov). Presupunem ca ∃P = P T > 0 si Q = QT ≥ 0 a. i.

AT P + P A + Q = 0.

CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 101 Stabilitatea Sistemelor Dinamice


Atunci Λ(A) ⊂ C−
0.

Demonstraţie. Fie λ ∈ Λ(A) o valoare proprie a lui A si x un vector propriu


asociat, i.e.,
Ax = λx (λ ∈ C, x ∈ Cn, x = 6 0).
Hermitizand aceasta ecuatie (transpus + conjugat) obtinem

xH AT = λxH ,

iar din ecuatia Lyapunov avem succesiv

xH AT P x + xH P Ax = −xH Qx;

λxH P x + λxH P x = −xH Qx;


2 Re(λ)xH P x = −xH Qx.
Deoarece xH P x > 0 si −xH Qx ≤ 0 rezulta automat Re(λ) ≤ 0.

CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 102 Stabilitatea Sistemelor Dinamice


Observatii: a) Daca in teorema de mai sus intarim ipotezele a.i. P > 0, Q > 0
atunci rezulta ca A este asimptotic stabila (Λ(A) ⊂ C−).
b) Indicatii procedurale de testare a (semi)pozitivitatii si rezolvare a ecuatiilor
Lyapunov.
c) Ecuatia Lyapunov se poate folosi pentru a testa stabilitatea unui sistem prin
rezolvarea unui sistem de ecuatii liniare (o problema considerabil mai simpla dpdv
teoretic decat calculul valorilor proprii ale matricii A).

CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 103 Stabilitatea Sistemelor Dinamice


5. Regimurile Permanent/Tranzitoriu/Stationar ale Sistemelor

Fie sistemul 
ẋ = Ax + Bu, x(0) = xo,
(25)
y = Cx + Du
avand matricea de transfer

T (s) = C(sI − A)−1B + D.

Pentru a pune in evidenta regimurile permanent si tranzitoriu ale unui sistem facem
ipotezele:
a) Sistemul este intern asimptotic stabil, i.e., Λ(A) ⊂ C−;
b) Comanda u este produsa de regimul liber al unui sistem antistabil

ẋe = Aexe, xe(0) = xeo,
(26)
u = Cexe

CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 104 Regim Permanent/Tranzitoriu/Stationar


cu Λ(Ae) ⊂ C+ ∪ C0. Comanda are deci expresia

u(t) = CeeAe txeo

si cum Λ(Ae) ⊂ C+ ∪ C0 rezulta ca u este un semnal persistent (in particular,


daca Ae = 0 avem u = Cexeo = cst).

Deoarece sistemul (A, B, C, D) este asimptotic stabil putem afirma intuitiv ca


dupa un timp suficient de lung (asimptotic) starea sistemului va urma semnalul de
intrare produs de sistemul instabil (generatorul de semnal u). Prin urmare incercam
sa vedem daca se poate pune in evidenta la nivelul starii x o descompunere de
tipul
x(t) = ξ(t) + V xe(t) (27)
unde limt→∞ ξ(t) = 0 (componenta tranzitorie) si V xe(t) este proportionala cu
u(t) = Cexe(t) (componenta permanenta). Inlocuind (27) in (25) obtinem

ξ˙ + V ẋe = Aξ + AV xe + BCexe

CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 105 Regim Permanent/Tranzitoriu/Stationar


sau inca
ξ̇ = Aξ + (AV − V Ae + BCe)xe. (28)
Deoarece Λ(A) ∩ Λ(Ae) = ∅ rezulta ca ecuatia Sylvester

AV − V Ae + BCe = 0

are o solutie unica V . Punand acest V in (27) si (28) regimul dinamic devine

ξ˙ = Aξ, ξ(0) = ξ0

si cum sistemul original este asimptotic stabil avem ca limt→∞ ξ(t) = 0. Prin
urmare, in ipotezele facute exista si este unic V a.i. sa avem descompunerea

x(t) = xp(t) + xt(t)

in regim permanent si respectiv regim tranzitoriu

xp(t) := V xe, xt(t) := ξ(t). (29)

CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 106 Regim Permanent/Tranzitoriu/Stationar


Observatii: a) Descompunerea in regim permanent si tranzitoriu se face in raport
cu clasa de semnale exogene {u(·)|u(t) = CeeAetxeo, xeo ∈ Rne }.
b) Descompunerea in regim permanent si tranzitoriu este specifica sistemelor liniare
(apare numai in context liniar) pe cand descompunerea in regim liber si fortat are
loc si in cazul sistemelor neliniare.
c) Daca Ae = 0 atunci avem de-a face cu un regim stationar (intrari constante),
xe(t) = xeo, ∀t ≥ 0, ecuatia Sylvester are solutia V = −A−1BCe si obtinem

xp(t) = −A−1BCexeo = −A−1BCu0,

yp(t) = −CA−1 BCexe0 + Du0 = −CA−1Bu0 + Du0 = T (0)u0,


unde u0 := Cexe0 si T (s) = C(sI − A)−1 B + D este matricea de transfer a
sistemului.
d) Daca Ae = jωI, Ce = I, avem u = uoejωt iar ecuatia Sylvester devine

AV − jωV + B = 0

CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 107 Regim Permanent/Tranzitoriu/Stationar


avand solutia unica
V = (jωI − A)−1B.
Regimul permanent este atunci

yp = C(jωI − A)−1Buoejωt = T (jω)uoejωt

unde uo = Cexeo.

Exercitiu: Puneti in evidenta regimurile liber/fortat, permanent/tranzitoriu pentru


un circuit RLC cu intrarea generata de un sistem cu matricea de stare Ae avand
doua radacini pur imaginare complex conjugate. Specificati regimul stationar
pentru acest circuit.

CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 108 Regim Permanent/Tranzitoriu/Stationar


CAPITOLUL 3: PROPRIETATI STRUCTURALE

Exista anumite proprietati fundamentale ale sistemelor dinamice pe spatiul starilor


care influenteaza decisiv posibilitate de analiza si sinteza: controlabilitate, ob-
servabilitate, minimalitate, stabilizabilitate, detectabilitate. Aceste proprietati se
reflecta in anumite proprietati structurale ale matricilor sistemice (A, B, C, D).

1. Controlabilitatea

2. Observabilitatea

3. Descompunere Structurala

4. Realizabilitate

5. Conexiunea Sistemelor

CAPITOLUL 3: PROPRIETATI STRUCTURALE 109 PROPRIETATI STRUCTURALE


1. Controlabilitatea (“Posibilitatea de a Controla”)

Controlabilitatea este o proprietate calitativa ce caracterizeaza abilitatea unui


sistem 
ẋ(t) = Ax(t) + Bu(t), x(0) = xo
(30)
y(t) = Cx(t) + Du(t),
de a putea tranzita dintr-o stare in alta prin intermediul unei anumite comenzi
(control). Pentru controlabilitate este relevanta numai prima ecuatie din (43) si
solutia corespunzatoare
Z t
x(t) = e A(t)
xo + eA(t−τ ) Bu(τ )dτ, t ≥ 0. (31)
0

Stare/Sistem Controlabil(a)
Definitia 36. O stare x ∈ Rn se numeste controlabila la momentul t > 0 daca
exista o comanda u(·) ∈ U care transfera xo = 0 (originea) in starea x(t) = x.

CAPITOLUL 3: PROPRIETATI STRUCTURALE 110 Controlabilitatea


Observatii: a) Aparent pentru a stabili controlabilitatea unei stari la momentul t
trebuie rezolvata ecuatia functionala (31) in necunoscuta u(·) : [0, t] → Rn (cu
xo = 0).
b) Conform definitiei, controlabilitatea unei stari x depinde de perechea de matrici
(A, B) si de momentul t > 0. Vom vedea ca de fapt controlabilitatea este o
proprietate ce depinde exclusiv de perechea (A, B) (este independenta de t).

Gramian de Controlabilitate

Pentrul studiul controlabilitatii se introduce Gramianul de Controlabilitate la mo-


mentul t > 0 definit de
Z t
A(t−τ ) T AT (t−τ )
Lc(t) = e BB e dτ. (32)
0

Observatii:a) Lc(t) = Lc(t)T ;


b) Lc(t) ≥ 0;
c) Pentru orice matrice simetrica X = X T ∈ Rn×n avem Ker (X) ⊥ Im (X) si

CAPITOLUL 3: PROPRIETATI STRUCTURALE 111 Controlabilitatea


Rn = Ker (X) ⊕ Im (X). Cum se obtine asa ceva ?

Caracterizarea Controlabilitatii prin Gramianul de Controlabilitate


Teorema 37. Starea x este controlabila la momentul t > 0 daca si numai daca
x ∈ Im Lc(t).

Demonstraţie. Necesitatea: Presupunem ca x este controlabila la momentul t > 0


adica ∃u(·) a.i.
Z t
x= eA(t−τ ) Bu(τ )dτ.
0

Avem x = xK + xI unde xK ∈ Ker Lc(t), xI ∈ Im Lc(t). Aratam ca xK = 0.


Intr-adevar,
Z t
xTK x = kxK k2 = xTK eA(t−τ ) Bu(τ )dτ (33)
0

si pentru a arata ca xK = 0 este suficient sa aratam ca xTK eA(t−τ ) B = 0,

CAPITOLUL 3: PROPRIETATI STRUCTURALE 112 Controlabilitatea


∀τ ∈ [0, t]. Aceasta identitate rezulta insa automat din sirul de egalitati

Z t Z t
T
T AT (t−τ )
0= xTK Lc(t)xK = xTK eA(t−τ ) BB T eA (t−τ )xK dτ = kB e xK k2dτ
0 0

T
si din analiticitatea functiei B T eA (t−τ ) xK pe [0, t].
Suficienta: Presupunem ca x ∈ Im Lc(t) ceea ce este echivalent cu

Z t
T
x = Lc(t)z = eA(t−τ ) BB T eA (t−τ )
zdτ (34)
0

pentru un z ∈ Rn potrivit ales. Definim

T AT (t−τ )
u(τ ) := B e z, τ ∈ [0, ∞) (35)

CAPITOLUL 3: PROPRIETATI STRUCTURALE 113 Controlabilitatea


care introdus in (34) arata ca
Z t
x= eA(t−τ ) u(τ )dτ
0

sau ca starea x este controlabila la momentul t.

Observatii: a) Deoarece z = Lc(t)#x comanda (35) se mai poate scrie ca


T
(t−τ )
u(τ ) := B T eA Lc(t)#x, (36)

unde Lc(t)# este pseudoinversa (Moore-Penrose) a lui Lc(t).


b) Daca x ∈ Im Lc(t) atunci comanda (36) duce starea initiala (originea) in starea
x la momentul t iar daca x 6∈ Im Lc(t) atunci comanda (36) duce originea cat se
poate de aproape de x la momentul t (adica transfera starea pe directia data de
imaginea gramianului)!

Caracterizarea Controlabilitatii prin Matricea de Controlabilitate

CAPITOLUL 3: PROPRIETATI STRUCTURALE 114 Controlabilitatea


Din cele discutate pana acum controlabilitatea unei stari depinde de momentul de
timp t > 0. In continuare vom vedea ca de fapt proprietatea de controlabilitate
este independenta de t.

Introducem matricea de controlabilitate asociata unui sistem dinamic (sau mai


precis unei perechi matriciale (A, B), A ∈ Rn×n, B ∈ Rn×m):
 2 n−1

R := B AB A B ... A B . (37)

Matricea de controlabilitate are dimensiune n × (nm).


Teorema 38. Fie t > 0 fixat. Atunci x ∈ Im Lc(t) ⇔ x ∈ Im R, i.e.,

Im Lc(t) = Im R. (38)

Demonstraţie. Sa observam mai intai ca Lc(t) fiind simetrica conditia (49) este

CAPITOLUL 3: PROPRIETATI STRUCTURALE 115 Controlabilitatea


echivalenta cu Ker Lc(t) = Ker RT sau inca

Lc(t)x = 0 ⇔ xT R = 0, x ∈ Rn. (39)

Aratam intai implicatia directa. Avem

Z t Z t
T A(t−τ ) T AT (t−τ )
Lc(t)x = 0 ⇔ x e BB e xdτ = 0 ⇔ kxT eA(t−τ ) Bk2dτ = 0.
0 0

Rezulta succesiv ca
xT eA(t−τ ) B = 0, ∀0 ≤ τ ≤ t,

xT eAτ B = 0, ∀τ ∈ R,
ultima egalitate rezultand din analiticitatea functiei xT eAτ B (daca o functie
analitica este nula pe un interval deschis atunci este nula pe toata axa reala, iar

CAPITOLUL 3: PROPRIETATI STRUCTURALE 116 Controlabilitatea


[0, t] contine automat un interval deschis). Mai departe obtinem ca

dk T AT τ
k
[B e x]τ =0 = 0, k = 0, 1, 2, . . .
dt

de unde
xT B = 0, xT AB = 0, , . . . , xT Ak B = 0, . . .
T
 2 n−1

ceea ce este echivalent cu x B AB A B . . . A B = 0 sau xT R = 0.
T
Aratam
 acum implicatia inversa.  Fie x 6
= 0 a.i. x R = 0. Atunci
xT B AB A2B . . . An−1B = 0 sau inca

xT B = 0, xT AB = 0, , . . . , xT An−1 B = 0.

Din teorema Hamilton–Cayley rezulta imediat ca

xT Ak B = 0, ∀k ≥ 0.

CAPITOLUL 3: PROPRIETATI STRUCTURALE 117 Controlabilitatea


Definim functia analitica φ(τ ) := xT eAτ B, φ : [0, t] ⇒ Rm. Din relatiile de
mai sus rezulta ca toate derivatele evaluate in zero sunt nule, i.e., φ(0) = 0,
φ(1)(0) = 0, . . . φk (0) = 0. Din analiticitate rezulta automat ca

φ(τ ) = 0, ∀τ ∈ [0, t]

si mai departe ca Z t
xT Lc(t)x = φ(τ )φ(τ )T dτ = 0.
0
Cum Lc(t) ≥ 0 rezulta in continuare Lc(t)x = 0 q.e.d.

Observatii: a) O stare x ∈ Rn este controlabila independent de momentul t > 0.


Proprietatea este intrinseca starii x si perechii (A, B).
b) Se poate arata ca daca extindem clasa de semnale de intrare la functii
generalizate (incluzand distributii) atunci daca x este controlabila exista o comanda
care duce originea in acea stare intr-un timp infinit mic (nul) – fenomene de tip
Bushow.

CAPITOLUL 3: PROPRIETATI STRUCTURALE 118 Controlabilitatea


c) Putem introduce definitia echivalenta: o stare x s.n. controlabila daca exista
t > 0 si o comanda u(·), u : [0, t], a.i. traiectoria satisface x(t) = x.
Corolarul 39.
R := Im R = Im Lc(t), ∀t > 0.

Introducem notiunea de sistem controlabil (sau pereche (A, B) controlabila) cu


semnificatia ca fiecare stare x ∈ Rn este controlabila. Avem atunci urmatorul
rezultat central.
Teorema 40. Fie perechea (A, B).
1. O stare x este controlabila daca si numai daca x ∈ R.
2. Perechea (A, B) (sau sistemul corespunzator) este controlabila (controlabil)
daca si numai daca R = Rn (sau, echivalent, rank R = n).

Observatie: Din punct de vedere procedural controlabilitatea unui sistem se poate


testa verificand ca rangul matricii de controlabilitate este n, i.e. rank R = n.
Pentru testarea controlabilitatii exista un algoritm dedicat foarte eficient numit
“controllability staircase”. Cu toate ca acest algoritm este numeric stabil atragem
atentia ca problema testarii controlabilitatii este o problema “ill–posed” (prost

CAPITOLUL 3: PROPRIETATI STRUCTURALE 119 Controlabilitatea


conditionata numeric).

Gramian de Controlabilitate in Timp Infinit

Daca matricea A este asimptotic stabila (Λ(A) ⊂ C−) atunci limita

lim Lc(t)
t→∞

este finita, se noteaza cu Lc ∈ Rn×n = LTc ≥ 0 si este numita gramian de


controlabilitate asimptotic. El verifica automat ecuatia Lyapunov

ALc + LcAT + BB T = 0

si are expresia explicita


Z ∞
T
Lc := eAτ BB T eA τ dτ.
0

CAPITOLUL 3: PROPRIETATI STRUCTURALE 120 Controlabilitatea


Observatie: Ecuatia Lypunov verificata de gramianul asimptotic are solutie unica.
Aceasta ecuatie are insa solutii (unice) in conditii mult mai generale decat atunci
cand A este stabila.
Propozitia 41. Daca A este asimptotic stabila si perechea (A, B) este controla-
bila atunci Lc > 0.

Demonstraţie. Rationam prin reducere la absurd. Stim ca Lc ≥ 0 si pp ca ∃x 6= 0


a.i. Lcx = 0. Atunci din ecuatia gramianului rezulta succesiv ca B T Ker Lc = 0,
Ker Lc este AT invariant, B T AT Ker Lc = 0, . . . B T (AT )k Ker Lc = 0, ∀k ≥ 0.
De aici rezulta ca pentru orice x 6= 0, x ∈ Ker Lc, avem xT R = 0 ceea ce
contrazice ipoteza ca rank R = n si deci ipoteza ca (A, B) este controlabila.

CAPITOLUL 3: PROPRIETATI STRUCTURALE 121 Controlabilitatea


Semnificatia Gramianului de Controlabilitate in Timp Infinit

Presupunem A stabila, perechea (A, B) controlabila si deci Lc > 0. Atunci avem


Λ(Lc) = {σ1, σ2, . . . , σn}, σi > 0, unde indexarea s-a facut in ordine descrescatoare
(i = 1, . . . , n). Fie xi vectori proprii ce formeaza o baza ortonormata (xi ⊥ xj ,
kxi k = 1). Ne propunem sa calculam energia corespunzatoare comenzii ce duce
originea in starea xi. Avem
Z ∞
xi = eA(t−τ ) Bui(τ )dτ = Lczi
0

unde
T AT τ T AT τ T AT τ 1
ui(τ ) = B e zi = B e L−1
c xi =B e xi .
σi
Energia comenzii este
Z ∞
2 1 T Aτ T AT τ 1 T 1 T 1
kui(τ )k2 = 2 xi e BB e xidτ = 2 xi Lcxi = 2 xi σixi = .
σi 0 σi σi σi

CAPITOLUL 3: PROPRIETATI STRUCTURALE 122 Controlabilitatea


Din aceasta expresie concluzionam ca gramianul de controlabilitate asimptotic
masoara efortul energetic al sistemului pentru a transfera originea pe sfera unitate
(cu cat Gramianul este mai mare – mai pozitiv – avem nevoie de o energie a
comenzii mai mica). Valorile proprii ale gramianului pun in evidenta nivelele
energetice ale sistemului si dau o procedura efectiva de reducere dimensionala.

Subspatii controlabile

Se introduc
 k−1

Rk := B AB ... A B , Rk := Im Rk , k ≥ 1,

numite matricea de controlabilitate respectiv subspatiul controlabil in k pasi


(semnificatia numelui va deveni clara la studiul sistemelor cu timp discret).
Rk poseda urmatoarele proprietati:
a) Rk+1 = Im B + ARk = Rk + Ak Im B, unde Ro := {0};
b) Ro ⊂ R1 ⊂ . . . Rk ⊂ . . . adica subspatiile formeaza un lant crescator. In limbaj

CAPITOLUL 3: PROPRIETATI STRUCTURALE 123 Controlabilitatea


matricial avem
rank Ro ≤ rank R1 ≤ · · · ≤ Rk ≤ · · · .
Din finitudinea dimensionala rezulta ca aceste incluziuni nu pot fi stricte decat
pentru un numar finit de subspatii (maxim n) si exista un subspatiu Rν , pentru un
ν suficient de mare, care le va contine pe toate celelalte. Sa observam ca daca ν
este cel mai mic indice pentru care Rν+1 = Rν atunci Rν+1 = Rν+2 = . . . = R.
Acest indice ν se numeste indice de controlabilitate iar Rν = R := Im R adica Rν
este exact subspatiul controlabil (al perechii (A, B));
c) R este A–invariant si contine Im B. Intr–adevar, avem ca R = Im B + AR;
d) R este cel mai mic subspatiu A–invariant care contine Im B. Intr–adevar, fie
V un spatiu A–invariant care contine Im B. Aratam prin inductie ca Rk ⊂ V de
unde concluzia ca R ⊂ V. Deoarece Im B ⊂ V rezulta ca R1 ⊂ V. Presupunem
ca Rk ⊂ V si aratam ca Rk+1 ⊂ V. Intr–adevar, Rk+1 = Im B + ARk . Dar
Im B ⊂ V si ARk ⊂ V (deoarece V este A–invariant si din ipoteza Rk ⊂ V) de
unde concluzia. Cu alte cuvinte, subspatiul controlabil R este solutia infimala in
subspatii a ecuatiei
T = Im B + AT

CAPITOLUL 3: PROPRIETATI STRUCTURALE 124 Controlabilitatea


in necunoscuta T . Mai precis,

R = inf{T |T = AT + Im B} = inf{T |AT ⊂ T si Im B ⊂ T }.

Recapitulare: Subspatii invariante, spectru restrans la un subspatiu, operatii cu


subspatii, suma directa, completari ortogonale etc.

Ce inseamna ca subspatiul V de dimensiune ρ este A–invariant ? Avem AV ⊂ V


iar daca V = Im V , unde V este o n × ρ matrice baza pentru V atunci automat

AV = V J

unde J este o matrice patrata ρ × ρ cu Λ(J) ⊂ Λ(A). Facand o completare pana


la o matrice nesingulara S = V W si notand T := S −1 obtinem
 
b := T AT −1 = A1 A3
A .
O A2

CAPITOLUL 3: PROPRIETATI STRUCTURALE 125 Controlabilitatea


Ce inseamna ca subspatiul V de dimensiune ρ este A–invariant si contine Im B ?
Repetand schimbarea de coordonate si aplicand-o corespunzator si lui B avem
   
b := T AT −1 = A1 A3 b = TB = B1
A , B
O A2 O

deoarece Im B ⊂ V. Cu aceasta schimbare de coordonate, matricea de controla-


b B)
bilitate corespunzatoare a perechii (A, b este

 
b= B1 A1B1 A21B1 ··· An−1
1 B1 }ρ
R .
O O O ··· O

Daca spatiul A–invariant (ce contine si Im B) in raport cu care s-a facut descom-
punerea este chiar R, atunci perechea (A1, B1) este automat controlabila si avem
ca rank R = rank R b = ρ = ν (indicele de controlabilitate).
Teorema 42 (Teorema de Descompunere Controlabila). Un sistem dinamic oare-
care descris de (A, B, C, D), A ∈ Rn×n, B ∈ Rn×m, C ∈ Rp×n, D ∈ Rp×m este

CAPITOLUL 3: PROPRIETATI STRUCTURALE 126 Controlabilitatea


b B,
intotdeauna echivalent pe stare cu un sistem (A, b C,
b D) avand structura
 
b = T AT −1 = A1 A3 }ν
A
O A2 }n − ν
, (40)
|{z} |{z}
ν n−ν
 
B1 }ν  
b = TB =
B , b = CT −1 =
C C1 C2 , (41)
O }n − ν
|{z} |{z}
ν n−ν

in care perechea (A1, B1) este controlabila. Mai mult, sistemele (A, B, C, D),
b B,
(A, b C,
b D) si (A1, B1, C1, D) sunt echivalente intrare–iesire, i.e.,

  " #  
A B b B
A b A1 B1
T (s) = = b D = .
C D C C1 D

CAPITOLUL 3: PROPRIETATI STRUCTURALE 127 Controlabilitatea


Observatii: a) Teorema afirma in particular ca dandu-se un sistem dinamic putem
intotdeauna gasi un alt sistem echivalent intrare–iesire care este controlabil (avand
dimensiunea spatiului starilor mai mica sau egala cu cea a sistemului initial).
b) Obtinerea descompunerii controlabile se bazeaza in mod esential pe matricea
S = T −1 care se poate obtine facand o completare pana la o inversabila a oricarei
baze V a subspatiului controlabil R = Im R (consecinte procedurale).
c) Proprietatea de controlabilitate este invarianta in raport cu relatia de echivalenta
pe stare. Mai precis, un sistem este controlabil daca si numai daca orice sistem
echivalent pe stare este controlabil.

Criteriul lui Popov–Belevitch–Hautus (PBH)

Folosind teorema de descompunere controlabila se poate obtine un criteriu extrem


de util pentru testarea controlabilitatii unei perechi (A, B).
Teorema 43 (Criteriul lui Hautus). Perechea (A, B), A ∈ Rn×n, B ∈ Rn×m, este

CAPITOLUL 3: PROPRIETATI STRUCTURALE 128 Controlabilitatea


controlabila daca si numai daca
 
rank sI − A B = n, ∀s ∈ C. (42)

Demonstraţie. Necesitatea: Pp prin absurd ca (42) nu este satisfacuta. Atunci


exista s0 ∈ C si un vector x0 6= 0, x0 ∈ Cn a.i.
 
xT0 s0 I − A B = 0.

De aici rezulta imediat ca


 
xT0 R = xT0 B AB ...A n−1
B =0

si deci perechea (A, B) nu este controlabila intrucat rank R < n.


Suficienta: Pp din nou prin reducere la absurd ca (A, B) nu este controlabila

CAPITOLUL 3: PROPRIETATI STRUCTURALE 129 Controlabilitatea


(ν < n). Atunci conform teoremei de descompunere controlabila exista un sistem
echivalent pe stare avand perechea (A1, B1) controlabila. Avem succesiv
 
    T O−1
rank sI − A B = rank T sIn − A B
 O I 
sIν − A1 −A3 B
= rank .
O sIn−ν − A2 O

Rangul ultimei matrici este insa mai mic decat n pentru orice s ∈ Λ(A2) ceea ce
contrazice (42).

Observatii: a) Pentru a decide controlabilitatea unei perechi (A, B) este suficient


sa testam criteriul lui Hautus pentru s ∈ Λ(A). Intr–adevar, pentru s ∈ C − Λ(A)
avem automat rank (sI − A) = n si deci criteriul este indeplinit.
b) Observatia de mai sus justifica introducerea de valoare proprie (sau mod) con-
trolabila/necontrolabila: O valoare proprie a lui A s.n. controlabila (necontrolabila)
daca satisface (nu satisface) criteriul lui Hautus. Din teorema de descompunere

CAPITOLUL 3: PROPRIETATI STRUCTURALE 130 Controlabilitatea


controlabila rezulta imediat ca o valoare proprie λ a lui A este controlabila (necon-
trolabila) daca si numai daca λ ∈ Λ(A1) (λ ∈ Λ(A2)).
c) Din demonstratia de mai sus rezulta ca daca doua sisteme (A, B, C, D) si
e B,
(A, e C,
e D)
e sunt echivalente pe stare cu matricea de echivalenta T atunci matri-
e satisfac
cile de controlabilitate corespunzatoare R si R

e = T R.
R

“Controlabilitatea este o proprietate generica”


Teorema 44. Fie Fn,m := {(A, B)|A ∈ Rn×n, B ∈ Rn×m} familia tuturor
perechilor (A, B) cu n si m fixati. Submultimea M ⊂ F a perechilor necon-
trolabile formeaza o suprafata algebrica iar submultimea perechilor controlabile
n2 +nm
este densa in R . Cu alte cuvinte, controlabilitatea este o proprietate
generica in F (o pereche (A, B) selectata la intamplare din F este controlabila
sau, echivalent, probabilitatea de a selecta o pereche necontrolabila este nula).

Nul Controlabilitate

CAPITOLUL 3: PROPRIETATI STRUCTURALE 131 Controlabilitatea


Am vazut ca proprietatea de controlabilitate exprima esentialmente capacitatea de
a aduce un sistem din origine intr-o stare arbitrara. Introducem acum conceptul
de nul controlabilitate (cu consecinte interesante in special in cazul sistemelor cu
timp discret).
Definitia 45. O stare x ∈ Rn se numeste nul controlabila la momentul t fixat
daca exista o comanda u(·) care transfera starea x0 = x in starea x(t) = 0 (in
origine).

Exercitii: a) Aratati ca o stare este controlabila daca si numai daca este nul
controlabila.
b) Perechi cu matricea B monica. (Explicitare)

CAPITOLUL 3: PROPRIETATI STRUCTURALE 132 Controlabilitatea


2. Observabilitatea

Observabilitatea este o proprietate calitativa a sistemului



ẋ(t) = Ax(t) + Bu(t), x(0) = xo
(43)
y(t) = Cx(t) + Du(t),

de a determina o stare din prelucrarea marimii masurate y. Pentru observabilitate


este relevanta evolutia sistemului in regim liber, i.e., sub comenzi externe nule,

ẋ(t) = Ax, x(0) = xo,


(44)
y = Cx,

deci observabilitatea este o proprietate in caracterizarea careia intervine numai


perechea de matrici (C, A) – observati ordinea in pereche – . Din (44) rezulta

y(τ ) = CeAτ xo, τ ≥ 0. (45)

CAPITOLUL 3: PROPRIETATI STRUCTURALE 133 Observabilitatea


Stare/Sistem Observabil(a)

Pentru studiul observabilitatii este mai simplu sa introducem notiunea de stare


neobservabila in loc de cea de stare observabila.
Definitia 46. O stare x ∈ Rn se numeste neobservabila la momentul t > 0 daca
pentru x(0) = x regimul liber al iesirii y este identic zero pe intervalul [0, t],
i.e., y(τ ) = 0, 0 ≤ τ ≤ t, cu y(τ ) furnizat de (45).

Notiunea de stare observabila se obtine prin negarea definitiei de mai sus.

Gramian de Observabilitate

Pentrul studiul observabilitatii se introduce Gramianul de Observabilitate la mo-


mentul t > 0 definit de
Z t
T
Lo(t) = eA τ C T CeAτ dτ. (46)
0

CAPITOLUL 3: PROPRIETATI STRUCTURALE 134 Observabilitatea


Observatii: a) Lo(t) = Lo(t)T ;
b) Lo(t) ≥ 0;
c) Se poate obtine din nou o descompunere ortogonala a lui Rn in raport cu Ker Lo
si Im Lo.

Caracterizarea Observabilitatii prin Gramianul de Observabilitate


Teorema 47. Fie t > 0 fixat (se poate si t ≥ 0). Starea x este neobservabila la
momentul t > 0 daca si numai daca x ∈ Ker Lo(t). Mai mult, daca o stare este
neobservabila la un t > 0 atunci este neobservabila la orice alt moment de timp
T > 0.

Demonstraţie. Necesitatea: Presupunem ca x este neobservabila la momentul


t > 0 adica y(τ ) = CeAτ x = 0, 0 ≤ τ ≤ t. De aici rezulta
Z t
T 2 T AT τ
0 = y (t)y(t) = ky(t)k = x e C T CeAτ xdτ = xT Lo(t)x, (47)
0

de unde rezulta ca Lo(t)x = 0 sau inca x ∈ Ker Lo(t), q.e.d.

CAPITOLUL 3: PROPRIETATI STRUCTURALE 135 Observabilitatea


Suficienta: Avem x ∈ Ker Lo(t) de unde rezulta xT Lo(t)x = 0 si folosind lantul
de egalitati din (47) obtinem ky(τ )k2 = 0, 0 ≤ τ ≤ t. Sa observam in plus ca
deoarece y(τ ) este analitica si nula pe un interval inchis nenul rezulta ca y(T ) = 0
pentru orice T > 0, q.e.d.

Din cele discutate mai sus am vazut ca (ne)observabilitatea unei stari nu depinde
de momentul de timp. In continuare vom obtine o caracterizare a subspatiului
starilor neobservabile pe baza matricii de observabilitate – notiune duala celei de
matrice de controlabilitate.

Caracterizarea Observabilitatii prin Matricea de Observabilitate

CAPITOLUL 3: PROPRIETATI STRUCTURALE 136 Observabilitatea


Introducem matricea de observabilitate asociata unui sistem dinamic :
 
C
 CA 
 
Q := 
 CA2 
 (48)
 .. 
CAn−1

(sau mai precis unei perechi matriciale (C, A), C ∈ Rp×n, A ∈ Rn×n). Matricea
de observabilitate are dimensiune (np) × n.
Teorema 48. Fie t > 0 fixat. Atunci x ∈ Ker Lo(t) ⇔ x ∈ Ker Q =: Q, i.e.,

Ker Lo(t) = Q. (49)

Demonstraţie. Exercitiu (demonstratie similara celei date pentru Teorema 38).

CAPITOLUL 3: PROPRIETATI STRUCTURALE 137 Observabilitatea


Observatii: a) Avem deci ca

Ker Lo(t) = Ker Q, ∀t > 0.

b) O stare x ∈ Rn este observabila/neobservabila independent de momentul t > 0


– cu anumite precautii se poate lua t ≥ 0. Proprietatea este intrinseca starii x si
perechii (C, A).
c) Se poate introduce definitia echivalenta: o stare x s.n. neobservabila daca
exista t > 0 pentru care x este neobservabila la acest moment.
Introducem notiunea de sistem observabil (sau pereche (C, A) observabila) cu
semnificatia ca fiecare stare x ∈ Rn, x 6= 0 este observabila. Avem atunci
urmatorul rezultat central.
Teorema 49. Fie perechea (C, A).
1. O stare x este neobservabila daca si numai daca x ∈ Q.
2. Perechea (C, A) (sau sistemul corespunzator) este observabila (observabil)
daca si numai daca singura stare neobervabila este 0, i.e. Q = {0} (sau, echiva-
lent, rank Q = n).

CAPITOLUL 3: PROPRIETATI STRUCTURALE 138 Observabilitatea


Gramian de Observabilitate in Timp Infinit

Daca matricea A este asimptotic stabila (Λ(A) ⊂ C−) atunci limt→∞ Lo(t)
este finita, se noteaza cu Lo ∈ Rn×n = LTo ≥ 0 si este numita Gramian de
Observabilitate asimptotic. El verifica automat ecuatia Lyapunov

AT Lo + LoAT + C T C = 0

si are expresia Z ∞
AT τ
Lo := e C T CeAτ dτ.
0
Observatii: a) Similar ca in cazul controlabilitatii, observabilitatea unui sistem se
poate testa dpdv procedural verificand ca rank Q = n (matricea Q este monica –
rang intreg pe coloane).
b) Daca perechea (C, A) este observabila atunci automat Lo(t) > 0 si Lo > 0.
Gramianul de observabilitate asimptotic se poate calcula ca solutia unica a ecuatiei
Lyapunov respective.

CAPITOLUL 3: PROPRIETATI STRUCTURALE 139 Observabilitatea


c) Daca x ∈ Rn arbitrara, atunci putem descompune unic x = xI + xK , unde
xI ∈ Im Lo(t) si xK ∈ Ker Lo(t) (deoarece Rn := Im Lo(t) ⊕ Ker Lo(t)). Atunci

y(t) = CeAtx = CeAtxI + CeAtxK = CeAtxI .

Deci cu exceptia sistemelor din Ker Lo(t), toate celelalte “se vad” la iesire.

Subspatii neobservabile

Se introduc
 
C
 CA 
Qk := 
 ..
,
 Nk := Ker Qk , k ≥ 1,
CAk−1

numite matricea de observabilitate respectiv subspatiul neobservabil in k pasi.


Nk poseda urmatoarele proprietati:

CAPITOLUL 3: PROPRIETATI STRUCTURALE 140 Observabilitatea


a) Nk = ∩ki=1Ker CAi−1 = ∩ki=1A−i+1Ker C (A−1 semnifica aici preimaginea si
nu inversa !);
b) Nk+1 = Ker C ∩ A−1Nk ;
c) . . . ⊂ N2 ⊂ N1 ⊂ N0 := Rn adica subspatiile neobservabile Nk formeaza un
lant descrescator. De aici rezulta ca exista un intreg µ, n ≥ µ ≥ 0, a.i.

. . . Nµ+2 = Nµ+1 = Nµ 6= Nµ−1 6= . . . 6= N1 6= N0

sau pe scurt
lim Nk = Nµ = Nn.
k→∞

Intregul µ se numeste indice de observabilitate iar Nµ = Nn se numeste subspatiul


neobservabil a perechii (C, A). Avem ca

N = Ker Q.

CAPITOLUL 3: PROPRIETATI STRUCTURALE 141 Observabilitatea


In limbaj matricial obtinem

0 < rank Q1 < rank Q2 < rank Qµ = rank Qµ+1 = . . . .

d) Din cele de mai sus obtinem ca

N = Ker C ∩ A−1N

sau inca
AN ⊂ N , N ⊂ Ker C
adica N este un subspatiu A–invariant continut in Ker C. Mai mult, se poate
arata (exercitiu) ca N este cel mai mare subspatiu A–invariant continut in Ker C.
Deasemenea, considerand ecuatia

T = Ker C ∩ A−1T

in necunoscuta T rezulta ca N este solutia sa supremala.

CAPITOLUL 3: PROPRIETATI STRUCTURALE 142 Observabilitatea


Principiul Dualitatii

Principiul dualitatii este un principiu fundamental in teoria sistemelor dinamice,


aratand in ce conditii anumite proprietati structurale sunt echivalente.
Teorema 50 (Principiul dualitatii). Subspatiul controlabil in k pasi al perechii
(A, B) este complementul ortogonal al subspatiului neobervabil in k pasi al
perechii (B T , AT ), i.e.

Rk (A, B) = Nk (B T , AT )⊥.

In particular, perechea (A, B) este controlabila daca si numai daca perechea


(B T , AT ) este observabila.

Pe baza principiului dualitatii se pot formula dualele tuturor rezultatelor obtinute


in cazul controlabilitatii.
Teorema 51 (Criteriul PBH). Perechea (C, A), C ∈ Rp×n, A ∈ Rn×n , este

CAPITOLUL 3: PROPRIETATI STRUCTURALE 143 Observabilitatea


observabila daca si numai daca
 
sI − A
rank = n, ∀s ∈ C. (50)
C

Prin dualitate se introduc notiunile de valoare proprie (sau mod) observ-


abil/neobservabil. Dam in continuare teorema de descompunere observabila in
doua forme complet echivalente.
Teorema 52 (Teorema de Descompunere Observabila). Un sistem dinamic oare-
care descris de (A, B, C, D), A ∈ Rn×n, B ∈ Rn×m, C ∈ Rp×n, D ∈ Rp×m este
b B,
intotdeauna echivalent pe stare cu un sistem (A, b C,
b D) avand structura

 
b = T AT −1 = A1 A3 }n − µ
A
O A2 }µ
,
|{z} |{z}
n−µ µ

CAPITOLUL 3: PROPRIETATI STRUCTURALE 144 Observabilitatea


 
B1 }n − µ  
b = TB =
B , b = CT −1 =
C O C2 ,
B2 }µ
|{z} |{z}
n−µ µ
in care perechea (C2, A2) este observabila. Mai mult, sistemele (A, B, C, D),
b B,
(A, b C,
b D) si (A2, B2, C2, D) sunt echivalente intrare–iesire, i.e.,

  " #  
A B b B
A b A2 B2
T (s) = = b D = .
C D C C2 D

Teorema 53 (Teorema de Descompunere Observabila – varianta). Un sistem


dinamic oarecare descris de (A, B, C, D), A ∈ Rn×n, B ∈ Rn×m, C ∈ Rp×n,
b B,
D ∈ Rp×m este intotdeauna echivalent pe stare cu un sistem (A, b C,
b D) avand
structura  
b = T AT −1 = A1 O }µ
A
A3 A2 }n − µ
,
|{z} |{z}
µ n−µ

CAPITOLUL 3: PROPRIETATI STRUCTURALE 145 Observabilitatea


 
B1 }µ  
b = TB =
B , b = CT −1 =
C C1 O ,
B2 }n − µ
|{z} |{z}
µ n−µ
in care perechea (C1, A1) este observabila. Mai mult, sistemele (A, B, C, D),
b B,
(A, b C,
b D) si (A1, B1, C1, D) sunt echivalente intrare–iesire, i.e.,

  " #  
A B A b
b B A1 B1
T (s) = = b D = .
C D C C1 D

CAPITOLUL 3: PROPRIETATI STRUCTURALE 146 Observabilitatea


3. Teorema de Descompunere Structurala

Avem intai nevoie de reamintirea catorva rezultate de algebra matriciala:


• Ecuatie Sylvester;
• Subspatiu A–invariant si consecinte.

Consideram un sistem definit de (A, B, C, D). Fie R subspatiul controlabil al


perechii (A, B) si N subspatiul neobservabil al perechii (C, A).

Fie
X1 := R ∩ N (51)
si introducem subspatiile X2 si X3 ca fiind complementii lui X1 in R si respectiv
N , i.e.,
R = X1 ⊕ X2 , (52)

N = X1 ⊕ X3 . (53)

CAPITOLUL 3: PROPRIETATI STRUCTURALE 147 Teorema de descompunere structurala


Fie deasemenea X4 complementul lui R ∪ N in Rn, i.e.,

Rn = (R ∪ N ) ⊕ X4 = X1 ⊕ X2 ⊕ X3 ⊕ X4 (54)

Subspatiile X2, X3 si X4 nu sunt unic definite. Deoarece

AR ⊂ R, Im B ⊂ R (55)

AN ⊂ N , N ⊂ Ker C (56)
rezulta ca
AX1 ⊂ X1, X1 ⊂ Ker C. (57)
Fie Xi matrici baza pentru subspatiile Xi (i=1...4), Xi =< Xi > si

 −1
T := X1 X2 X3 X4 . (58)

CAPITOLUL 3: PROPRIETATI STRUCTURALE 148 Teorema de descompunere structurala


Atunci sistemul echivalent pe stare fata de transformarea (57) are forma
   
A11 A12 A13 A14 B1
 O A22 O A24   B2 
b
A = T AT = 
−1 , b
B = TB =  
 O O A33 A34   O  (59)
O O O A44 O
 
b = CT −1 = O C2
C O C4 ,

structura ce rezulta din (51)-(58). Din teorema de descompunere controlabila


rezulta ca perechea    
A11 A12 B1
, (60)
O A22 B2
este controlabila iar din teorema de descompunere observabila rezulta ca perechea
  
  A22 A24
C2 C4 , (61)
O A44

CAPITOLUL 3: PROPRIETATI STRUCTURALE 149 Teorema de descompunere structurala


este observabila. Aplicand criteriul PBH pentru perechea (60) rezulta
 
sI − A11 −A12 B1
rank = dim X1 + dim X2, ∀s ∈ C
O sI − A22 B2

de unde rezulta automat ca


 
rank sI − A2 B2 = dim X2, ∀s ∈ C

deci perechea (A22, B2) este controlabila. Aplicand criteriul PBH dual perechii
(61) rezulta similar ca perechea (C2, A22) este observabila. In consecinta rezulta
ca (sub)sistemul (A22, B2, C2, D) este controlabil si observabil (se mai numeste
partea controlabila si observabila a sistemului initial) si inca

  " #  
A B b B
A b A22 B2
T (s) = = b D = .
C D C C2 D

CAPITOLUL 3: PROPRIETATI STRUCTURALE 150 Teorema de descompunere structurala


Sintetizand cele de mai sus obtinem urmatorul rezultat remarcabil.
Teorema 54 (Teorema de descompunere structurala). Orice sistem arbitrar
b B,
(A, B, C, D) este echivalent pe stare cu un sistem (A, b C,
b D) cu structura (59)
(unde unele blocuri pot avea dimensiune nula !) si echivalent intrare–iesire cu
sistemul controlabil si observabil (A22, B2, C2, D).

CAPITOLUL 3: PROPRIETATI STRUCTURALE 151 Teorema de descompunere structurala


4. Realizabilitate

Am vazut ca orice sistem dinamic descris de ecuatii de tipul



ẋ(t) = Ax(t) + Bu(t), x(to) = xo
(62)
y(t) = Cx(t) + Du(t)

este automat invariant in timp, liniar, cauzal, finit dimensional. In particular,


sistemul dinamic este un sistem de convolutie avand matrice de transfer data de

T (s) = C(sI − A)−1B + D.

Matricea de transfer descrie comportarea intrare–iesire in conditii initiale nule si


este o matrice avand drept elemente functii rationale proprii.
Problema naturala: Stiind ca matricea de transfer a unui sistem MIMO este
rationala si proprie exista o descriere dinamica a sistemului de tipul (62) ? Mai

CAPITOLUL 3: PROPRIETATI STRUCTURALE 152 Realizabilitate


precis, stiind ca T (s) este o matrice rationala proprie de dimensiune p × m exista
intotdeauna patru matrici (A, B, C, D), unde A ∈ Rn×n, B ∈ Rn×m, C ∈ Rp×n,
D ∈ Rp×m a.i. sistemul dinamic corespunzator (62) sa aibe matricea de transfer
T (s), i.e.,
T (s) = C(sI − A)−1 B + D?
Atunci cand exista, cele patru matrici (A, B, C, D) se numesc o realizare a
rationalei T (s) (sau a sistemului avand ca matrice de transfer pe T (s)).
INTREBARI NATURALE:
• Exista intotdeauna o realizare si daca da cum se poate obtine ? DA!
• Este realizarea unica ? NU !
• Exista o realizare de dimensiune minima (maxima) ? DA (NU) !
• Cum se pot caracteriza realizarile minimale ? Controlabile + observabile!
• Cum se pot obtine realizarile minimale ? Teorema de Descompunere Structurala
!
• Sunt realizarile minimale unice ? NU !
• Ce relatie exista intre doua realizari minimale ? Sunt echivalente pe stare !

CAPITOLUL 3: PROPRIETATI STRUCTURALE 153 Realizabilitate


Problema existentei

Fie T (s) o p × m matrice rationala proprie data de

 
rij (s)
T (s) = , grad(pij ) ≥ grad(rij ), ∀i, j,
pij (s) 1≤i≤p
1≤j≤m

in care rapoartele se considera ireductibile. Deoarece rationala este proprie avem


ca D := T (∞) ∈ Rp×m (finit). Problema realizabilitatii rationalei proprii T (s) se
reduce atunci la problema realizabilitatii rationalei strict proprii Te(s) = T (s) − D,
i.e., trebuie sa gasim trei matrici (A, B, C) a.i.

Te(s) = C(sI − A)−1B.

CAPITOLUL 3: PROPRIETATI STRUCTURALE 154 Realizabilitate


Deoarece Te(s) este strict proprie avem

k−1
K 0 + K 1 s + . . . + Kk−1 s
Te(s) = (63)
γ0 + γ1s + . . . + γk−1sk−1 + sk

unde γ(s) := γ0 + γ1s + . . . + γk−1sk−1 + sk este cel mai mic multiplu comun
(monic) al numitorilor tuturor elementelor rationalei Te(s) iar Ki, i = 0, . . . , k − 1,
sunt p × m matrici constante.

O realizare a lui Te(s) este data de

   
Om Im Om
 ...   ..  
A=

,B = 

 , C = K0 K1 . . . Kk−
 Om 
Im
−γ0Im −γ1Im . . . −γk−1Im Im
(64)

CAPITOLUL 3: PROPRIETATI STRUCTURALE 155 Realizabilitate


Intr–adevar, cu  
Im
 sIm 
Θ(s) := 
 ..


sk−1Im
se verifica direct ca
(sI − A)Θ(s) = Bγ(s)
sau inca
Θ(s)
= (sI − A)−1B. (65)
γ(s)
Cum
CΘ(s) = K0 + K1s + . . . + Kk−1sk−1
inmultind (65) la stanga cu C si tinand cont de (63) obtinem Te(s) = C(sI −
A)−1 B. Realizarea (A, B, C, D) astfel obtinuta este controlabila si de aceea se
mai numeste realizarea standard controlabila a lui T (s). Controlabilitatea perechii
(A, B) se poate testa imediat cu criteriul PBH. In general, realizarea obtinuta nu

CAPITOLUL 3: PROPRIETATI STRUCTURALE 156 Realizabilitate


este insa observabila (poate fi!). O realizare standard observabila este data de
   
Om −γ0Ip K0
 Ip −γ1Ip   K1   
A=
 ... .. 
,B = 
 .. 
 , C = Op Op . . . Ip .
Ip −γk−1Ip Kk−1
(66)
Aceasta realizare nu este in general controlabila.

Observatie: Pentru matrici de transfer rationale de dimensiuni arbitrare nu exista


in general posibilitatea sa scriem direct o realizare care sa fie simultan controlabila
si observabila.

Coeficienti Markov si Matrici Hankel

Studiem acum relatiile care exista intre doua realizari ale unei matrici rationale
proprii. In primul rand este clar ca cele doua matrici ”D” sunt egale. Dezvoltand
Te(s) in serie Laurent in jurul punctului s = ∞ obtinem pentru ksk > r, unde r

CAPITOLUL 3: PROPRIETATI STRUCTURALE 157 Realizabilitate


este ales suficient de mare,

Te(s) = Γ1s−1 + Γ2s−2 + . . . . (67)

Identificand coeficientii din (67) cu ajutorul lui (63) obtinem

Kk−1 = Γ1
Kk−2 = Γ2 + γk−1Γ1
... ... ...
K0 = Γk + γk−1 Γk−1 + . . . + γ1Γ1
0 = Γk+i + γk−1 Γk−1+i + . . . + γ0Γi, i ≥ 1.

Coeficientii matriceali Γi ∈ Rp×m, i ≥ 1, s.n. coeficientii Markov ai matricei


rationale T (s).
Daca (A, B, C, D) este o realizare a lui T (s) atunci avem

C(sI − A)−1B + D = D + CBs−1 + CABs−2 + CA2Bs−3 + . . . , (68)

CAPITOLUL 3: PROPRIETATI STRUCTURALE 158 Realizabilitate


pentru ksk > rA, unde rA este raza spectrala a matricei A.

Coeficientii D si CAi−1 B, i ≥ 1, se numesc coeficientii Markov ai sistemului


(realizarii) (A, B, C, D). Identificand coeficientii in (67) si (68) obtinem

Γo := D, Γi = CAi−1B, ∀i ≥ 1. (69)

Deci toate realizarile lui T (s) au aceeasi coeficienti Markov, identici cu cei ai lui
T (s). Introducem matricile de tip Hankel

   j−1

Γ1 Γ2 . . . Γj CB CAB ... CA B
 Γ2 Γ3 . . . Γj+1   CAB CA2B ... CAj B 
Hij = 
 ..
=
  .. 

Γi Γi+1 . . . Γj+i−1 CAi−1 B CAiB . . . CAj+i−2B
(70)

CAPITOLUL 3: PROPRIETATI STRUCTURALE 159 Realizabilitate


 
C
 CA  
  i−1
= ..  B AB . . . A B = QiRj i ≥ 1, j ≥ 1, (71)
CAi−1B
unde Rj este matricea de controlabilitate in j pasi si Qi este matricea de
observabilitate in i pasi. Din aceasta relatie rezulta ca pentru orice doua realizari
e B,
(A, B, C, D) si (A, e C,
e D) ale aceluiasi T (s) avem

e iR
QiRj = Q ej , ∀i ≥ 1, j ≥ 1. (72)

Observatie: Matricile Hankel cu toate ca au dimensiuni arbitrar de mari au totusi


rangul marginit de n. Acest lucru rezulta din ultima egalitate din (71).

Realizari minimale
Definitia 55. O realizare (A, B, C, D) a rationalei proprii T (s) se numeste min-
imala daca orice alta realizare are dimensiunea spatiului starilor mai mare sau
egala cu aceasta.

CAPITOLUL 3: PROPRIETATI STRUCTURALE 160 Realizabilitate


Teorema 56. O realizare este minimala daca si numai daca este controlabila si
observabila.

Demonstraţie. Conditia este necesara. P.p. prin reducere la absurd ca realizarea


minimala (A, B, C, D) de dimensiune n nu este controlabila si/sau observabila.
Atunci printr–o transformare de echivalenta aducem sistemul la forma din teo-
rema de descompunere structurala si rezulta ca realizarea (A22, B2, C2, D) are
dimensiune strict mai mica ceea ce contrazice ipoteza de minimalitate a realizarii
originale.
Conditia este suficienta. Presupunem ca realizarea (A, B, C, D) de dimensiune n
este controlabila si observabila. Atunci

rank Rn = rank Qn = n

rezultand in continuare ca

rank QnRn = rank Rn − dim(Im Rn ∩ Ker Qn) = n. (73)

CAPITOLUL 3: PROPRIETATI STRUCTURALE 161 Realizabilitate


P.p. prin absurd ca (A, B, C, D) nu este minimala. Atunci exista o realizare
e B,
(A, e C,
e D) de dimensiune ne cu

e < n.
n

Din (72) rezulta ca


e nR
rank Q en = rank QnRn
en ≤ n
ceea ce este absurd intrucat rank Q en ≤ n
e si rank R e.
Teorema 57. Oricare doua realizari minimale ale unei matrici de transfer pro-
prii T (s) sunt echivalente pe stare.

Demonstraţie. Fie (A, B, C, D) si (A, e B,


e C,
e D) doua realizari minimale ale lui
T (s). Conform teoremei precedente, ambele realizari au aceeasi dimensiune n si
sunt controlabile si observabile. Din (71) avem

e nR
QnRn+1 = Q en+1 (74)

CAPITOLUL 3: PROPRIETATI STRUCTURALE 162 Realizabilitate


  h i
sau inca Qn B ARn en
=Q e
B eR
A en de unde rezulta

QnB = Q e
e nB, QnARn = Q eR
e nA en . (75)

Deoarece Q e Tn Q
e n este monica atunci Q e n este nesingulara si din prima relatie din
(75) rezulta
Be = TB (76)
unde
eT Q
T := (Q e n)−1Q
e T Qn ∈ Rn×n.
n n

Similar, deoarece Ren este epica rezulta ca R


en R
enT este nesingulara si din a doua
egalitate din (75) rezulta ca
e = T AS
A (77)
unde
enT (R
S = Rn R en R
enT )−1 ∈ Rn×n.

CAPITOLUL 3: PROPRIETATI STRUCTURALE 163 Realizabilitate


Din (74) rezulta ca
   
C C e h i
 
 CA  Rn AnB = 
 C eA 
e  R en A
enB
e
.. ..

eR
de unde CRn = C en sau inca
e = CS.
C (78)
Din (76), (77) si (78) rezulta ca cele doua realizari sunt echivalente pe stare daca
aratam ca S = T −1. Intr–adevar,

e Tn Q
T S = (Q e n)−1Q
e Tn QnRnR
enT (R
enR
enT )−1 = (Q
e Tn Q
e n)−1 Q
e Tn Q
e nR
enR
enT (R
enR
enT )−1 = I.

Teorema 58. Fie µ si ν cei mai mici intregi pentru care rank Hµ,ν =
rank Hµ+i,ν+j . Atunci ν = µ = n, unde n este dimensiunea realizarii mini-
male.

CAPITOLUL 3: PROPRIETATI STRUCTURALE 164 Realizabilitate


Demonstraţie. Rezulta automat din (71).

Observatie: Pentru orice sistem descris de matrice de transfer rationala proprie


T (s) putem calcula coeficientii Markov (unici) Γi pe baza descompunerii (67).
Mai mult, daca stim o realizare (A, B, C, D) a sistemului dinamic cu matricea de
transfer T (s), atunci coeficientii Markov se pot calcula pe baza expresiilor explicite
(69). Mai mult, coeficientii Markov determina unic sirul dublu indexat de matrici
Hankel Hij care au rang finit egal cu n, pentru i, j ≥ n, unde n este dimensiunea
unei realizari minimale.

Problema inversa (fundamentala): Presupunand acum ca avem un sir de coeficienti


Markov Γi ∈ Rp×m, i ≥ 0, se pune problema fireasca daca exista intotdeauna un
sistem dinamic care are acesti coeficienti Markov ? Mai exact, seria din membrul
drept din (67) converge intotdeauna la o rationala proprie ce este matricea de
transfer a unui sistem (A, B, C, D) ? Sau, echivalent, exista intotdeauna matricile
(A, B, C, D) de dimensiuni potrivite a.i. sa aibe loc relatiile (69) ?

Raspuns: NU (in general)! Rezultatul urmator da un raspuns complet acestei

CAPITOLUL 3: PROPRIETATI STRUCTURALE 165 Realizabilitate


probleme.
Teorema 59. Fie un sir de matrici reale Γi ∈ Rp×m, i ≥ 0, pentru care exista
j ≥ 1 a.i. Γj 6= 0. Atunci exista o p × m matrice rationala proprie T (s) ai carei
coeficienti Markov sunt exact elementele sirului Γi daca si numai daca exista
un intreg n ≥ 1 a.i.

n = rank Hn+i,n+j , ∀i, j ≥ 0. (79)

In cazul in care (79) are loc, intregul n ≥ 1 se numeste gradul McMillan al


rationalei T (s).

Observatie (fundamentala): Gradul McMillan al unei rationale proprii T (s)


coincide cu dimensiunea unei realizari minimale.
Corolarul 60. Functia f : N → Rp×m cu f (i) = Γi, i ≥ 0, este z–transformabila
(are transformata z) si transformata z este o matrice rationala proprie daca si
numai daca este indeplinita conditia (79).

CAPITOLUL 3: PROPRIETATI STRUCTURALE 166 Realizabilitate


Procedura de obtinere a unei realizari minimale pentru o
matrice rationala proprie

 
rij (s)
T (s) = , grad(pij ) ≥ grad(rij ), ∀i, j.
pij (s) 1≤i≤p
1≤j≤m

Pasul 0: Se pune D := T (∞) si se aduce matricea rationala (strict proprie)


Te(s) := T (s) − D la forma

k−1
K 0 + K 1 s + . . . + Kk−1 s
Te(s) = (80)
γ0 + γ1s + . . . + γk−1sk−1 + sk

unde γ(s) := γ0 + γ1s + . . . + γk−1sk−1 + sk este cel mai mic multiplu comun
(monic) al numitorilor tuturor elementelor rationalei Te(s) iar Ki, i = 0, . . . , k − 1,
sunt p × m matrici constante.

CAPITOLUL 3: PROPRIETATI STRUCTURALE 167 Realizabilitate


Pasul 1: Se scrie realizarea standard controlabila
   
Om Im Om
 ...   ..  
A=    
Im  , B =  Om  , C = K0 K1 . . . Kk−
−γ0Im −γ1Im . . . −γk−1Im Im
(81)
in care perechea (A, B) este automat controlabila.
Pasul 2: Se aplica teorema de descompunere observabila perechii (C, A) si se
obtine  
b = T AT −1 = A1 A3 }n − µ
A
O A2 }µ
,
  |{z} |{z}
b B1 }n − µ n − µ b µ −1  
B = TB = , C = CT = O C2 ,
B2 }µ
|{z} |{z}
n−µ µ
in care perechea (C2, A2) este observabila.

CAPITOLUL 3: PROPRIETATI STRUCTURALE 168 Realizabilitate


Pasul 3: Deoarece perechea (A, B) este controlabila, rezulta automat ca
b B)
perechile (A, b si (A2, B2) sunt deasemenea controlabile. Prin urmare sistemul
(A2, B2, C2, D) care este echivalent intrare–iesire cu sistemul original (A, B, C, D)
este controlabil, observabil si deci minimal. Prin urmare (A2, B2, C2, D) este o
realizare minimala pentru T (s) si

T (s) = C2(sI − A2)−1B2 + D.

Observatii: a) Din punct de vedere procedural, algoritmul de calcul al realizarii


minimale urmeaza exact pasii de mai sus cu observatia ca transformarea T de la
pasul 2 se alege intotdeauna ortogonala T −1 = T T .
b) Pentru obtinerea unei realizari minimale se poate proceda dual, calculand la
Pasul 1 o realizare standard observabila (66) si facand la Pasul 2 o descompunere
controlabila (40)–(41).

CAPITOLUL 3: PROPRIETATI STRUCTURALE 169 Realizabilitate


5. Conexiunile Sistemelor Dinamice pe Stare si Operatii cu
Sisteme

Consideram cateva posibile conexiuni standard ale sistemelor dinamice descrise prin
intermediul realizarilor de stare si ne punem problema sa gasim o realizare de stare
pentru sistemul echivalent rezultant. In particular, vom considera urmatoarele
tipuri de conexiuni: serie, paralel, bucla cu reactie inversa, transformare liniar
fractionara si produs Redheffer.

Intocmai ca in cazul sistemelor cu o intrare si o iesire (SISO) anumite conexiuni


pot sa nu fie definite (in sens general sau in sens strict) – cu semnificatia ca
sistemul rezultant nu are matrice de transfer (vectorul marimilor de iesire nu este
unic definit pentru un vector dat de marimi de intrare) sau matricea de transfer
rezultanta nu este proprie (sistemul rezultant nu are o realizare standard de stare).
Prin urmare vom spune ca o anumita conexiune a doua sisteme pe stare este
bine definita daca sistemul rezultant este deasemenea un sistem pe spatiul starilor.

CAPITOLUL 3: PROPRIETATI STRUCTURALE 170 Conexiuni si operatii


Buna definire a conexiunii implica deci ca sistemul rezultant are o matrice de
transfer rationala care este proprie.

Ca un exemplu relevant pentru discutia de mai sus sa consideram inversul unui


sistem (A, B, C, D) – sistemul care are intrarile si iesirile inversate. Inversul exista
daca si numai daca matricea D este inversabila iar o realizare a inversului este data

ẋI (t) = (A − BD −1C)xI (t) + BD −1uI (t),


(82)
yI (t) = −D −1CxI (t) + D −1uI (t),

(uI (t) = y(t), yI (t) = u(t)) iar matricea de transfer este


   −1 −1

AI BI A − BD C BD
T −1(s) = = . (83)
CI DI −D −1C D −1

Observatii: • Un sistem este inversabil daca si numai daca are acelasi numar de
intrari si iesiri (p = m).
• Ipoteza de inversabilitatea a lui D nu este necesara pentru existenta inversei

CAPITOLUL 3: PROPRIETATI STRUCTURALE 171 Conexiuni si operatii


matricii de transfer T (vazuta ca matrice rationala) si este facuta doar pentru a
asigura ca T −1(s) este proprie si deci este matricea de transfer a unui sistem pe
spatiul starilor (AI , BI , CI , DI ).
• Daca sistemul original este controlabil/observabil/minimal atunci realizarea
inversului (83) este automat controlabila/observabila/minimala. – Exercitiu!

Conexiunea paralel

Fie doua sisteme


ẋ1 (t) = A1x1 (t) + B1u1(t),
(84)
y1 (t) = C1x1 (t) + D1u1(t),
si
ẋ2 (t) = A2x2 (t) + B2u2(t),
(85)
y2 (t) = C2x2 (t) + D2u2(t),
avand matricile de transfer
   
A1 B1 A2 B2
T1 = , T2 = , (86)
C1 D1 C2 D2

CAPITOLUL 3: PROPRIETATI STRUCTURALE 172 Conexiuni si operatii


respectiv. Daca cele doua sisteme au acelasi numar de intrari si iesiri (m1 = m2,
p1 = p2), atunci se defineste conexiunea paralel a lui T1 cu T2 ca fiind sistemul care
are intrarea u obtinuta punand u1 ≡ u2 = u si iesirea y := y1 + y2. Conexiunea
paralel este intotdeauna bine definita, matricea de transfer a sistemului rezultant
este
T (s) := T1(s) + T2(s), (87)
avand o realizare data de
 
A1 O B1
T (s) =  O A2 B2 . (88)
C1 C2 D1 + D2

Conexiunea serie

Fie doua sisteme (84) si (85), avand matricile de transfer date in (86). Daca
numarul de iesiri ale sistemului T1 este egal cu numarul de intrari ale sistemului

CAPITOLUL 3: PROPRIETATI STRUCTURALE 173 Conexiuni si operatii


T2 atunci se defineste conexiunea serie a lui T1 cu T2 (in aceasta ordine) ca
fiind sistemul cu intrarea u := u1 si iesirea y := y2, obtinut punand u2 ≡ y1.
Conexiunea serie este intotdeauna bine definita, matricea de transfer a sistemului
rezultant este
T (s) := T2(s)T1(s), (89)
(observati ordinea !) iar o realizare pentru sistemul rezultant este data de
 
A2 B2C1 B2D1
T (s) =  O A1 B1  . (90)
C2 D2C1 D2D1

Conexiunea in reactie inversa

Fie doua sisteme (84) si (85), avand matricile de transfer date in (86). Daca
numarul de iesiri ale sistemului T1 este egal cu numarul de intrari ale sistemului T2
si numarul de iesiri ale sistemului T2 este egal cu numarul de intrari ale sistemului

CAPITOLUL 3: PROPRIETATI STRUCTURALE 174 Conexiuni si operatii


T1 (p1 = m2, p2 = m1) atunci se defineste conexiunea in reactie inversa a lui T1
cu T2 (in aceasta ordine) ca fiind sistemul cu intrarea u si iesirea y := y1 , obtinut
punand u1 ≡ u + y2 si u2 ≡ y1. Conexiunea in reactie inversa este intotdeauna
bine definita daca si numai daca matricea
 
I D1
(91)
D2 I

este nesingulara. In acest caz functia de transfer a sistemului echivalent este

T (s) := T1(s)(I − T2(s)T1(s))−1, (92)

iar o realizare pentru sistemul rezultant este


 
A1 + B1D2Sb−1C1 B1S −1C2 B1S −1
 b−1C1 −1 −1 

T (s) =  B 2 S A 2 + B 2 D 1 S C2 B 2 D 1 S , (93)

Sb−1C1 Sb−1D1C2 D1S −1

CAPITOLUL 3: PROPRIETATI STRUCTURALE 175 Conexiuni si operatii


unde Sb := I − D1D2 si S := I − D2D1 care sunt ambele inversabile din ipoteza
de nesingularitate a matricii (91).
Exercitiu: Ce se poate spune despre controlabilitatea/observabilitatea/minimalitatea
sistemului echivalent paralel/serie/reactie inversa daca stim ca sistemele compo-
nente sunt controlabile/observabile/minimale ?

Observatie: Pentru conexiunile paralel/serie/reactie inversa nu este necesar ca


spatiul starilor sistemelor componente sa fie de dimensiune egala.

Transformare liniar fractionara (TLF)

Aceste conexiuni pot fi privite ca o extensie la clasa sistemelor (sau mai precis la
clasa functiilor matriceale rationale) a transformari liniar fractionare (sau Moebius)
din cazul scalar
a + bλ
f (λ) = ,
c + dλ
unde a, b, c, d sunt scalari.

CAPITOLUL 3: PROPRIETATI STRUCTURALE 176 Conexiuni si operatii


Fie doua sisteme date de

ẋ = Ax + B1u1 + B2u2,
y1 = C1x + D11u1 + D12u2, (94)
y2 = C2x + D21u1 + D22u2,

si
ẋc = Acxc + Bcuc,
(95)
yc = Ccxc + Dcuc,
avand matricile de transfer
 
  A B1 B2
T11(s) T12(s)
T (s) = =  C1 D11 D12  (96)
T21(s) T22(s)
C2 D21 D22

si  
Ac Bc
Tc(s) = . (97)
Cc Dc

CAPITOLUL 3: PROPRIETATI STRUCTURALE 177 Conexiuni si operatii


Un sistem de tipul (96) se numeste sistem generalizat si are intrarile si iesirile
partitionate in doua clase avand anumite semnificatii in controlul automat. Daca
T22 are numarul de intrari/iesiri egal cu numarul de iesiri/intrari ale lui Tc (mc = p2,
pc = m2) atunci de defineste transformarea liniar fractionara inferioara (TLFI) a
lui T cu Tc (in aceasta ordine) ca fiind sistemul cu intrarea u := u1 si iesirea
y := y1 obtinut punand u2 ≡ yc si uc ≡ y2. Conexiunea este bine definita daca si
numai daca matricea

 
I D22
(98)
Dc I

este inversabila si in acest caz matricea de transfer a sistemului rezultant echivalent


este

TR = T LF I(T, Tc) := T11 + T12Tc(I − T22Tc)−1T21, (99)

CAPITOLUL 3: PROPRIETATI STRUCTURALE 178 Conexiuni si operatii


si are o realizare data de

 
A + B2S DcC2 e−1 e−1
B2S Cc e−1
B1 + B2S DcD21
 B S −1
C A + B S −1
D C B S −1
D 
TR(s) =  c 2 c c 22 c c 21 ,

C1 + D12DcS −1C2 D12Se−1Cc D11 + D12DcS −1D21
(100)
unde S := I − D22Dc si Se := I − DK D22 care sunt ambele inversabile din ipoteza
de inversabilitate asupra matricii (98). In particular avem DcS −1 = Se−1Dc si
S −1D22 = D22Se−1 asa cum rezulta din identitatea matriciala U (I − V U )−1 =
(I − U V )−1 U care are loc pentru oricare matrici U si V de dimensiuni compatibile.

Consideram din nou doua sisteme (94) si (95) avand matricile de transfer (96)
si (97). Daca T11 are numarul de intrari/iesiri egal cu numarul de iesiri/intrari
ale lui Tc (mc = p1, pc = m1) atunci se defineste transformarea liniar fractionara
superioara (TLFS) a lui T cu Tc (in aceasta ordine) ca fiind sistemul cu intrarea
u := u2 si iesirea y := y2 obtinut punand u1 ≡ yc si uc ≡ y1. Conexiunea este

CAPITOLUL 3: PROPRIETATI STRUCTURALE 179 Conexiuni si operatii


bine definita daca si numai daca matricea
 
I D11
(101)
Dc I

este inversabila si in acest caz matricea de transfer a sistemului rezultant echivalent


este
TR = T LF S(T, Tc) := T22 + T21Tc(I − T11Tc)−1T12, (102)
si are o realizare data de
 
A + B1 U e −1DcC1 B1 Ue −1Cc B2 + B1 U e −1DcD12
 B U −1
C A + B U −1
D C B U −1
D 
TR =   c 1 c c 11 c c 12 ,

C2 + D21DcU −1C1 D21U e −1Cc D22 + D21DcU −1D12
(103)
unde am notat U := I − D11Dc si U e := I − DcD11 care sunt ambele inversabile
intrucat matricea (101) este inversabila. Avem deasemenea ca DcU −1 = U e −1Dc
si U −1D11 = D11U e −1.

CAPITOLUL 3: PROPRIETATI STRUCTURALE 180 Conexiuni si operatii


Produs Redheffer

Aceasta conexiune este o extensie a transformarii liniar fractionare. Consideram


doua sisteme generalizate (94) si

ẋc = Acxc + Bc1uc1 + Bc2uc2,


yc1 = Cc1 xc + Dc11uc1 + Dc12uc2, (104)
yc2 = Cc2 xc + Dc21uc1 + Dc22uc2,

avand matricile de transfer date de (96) si respectiv


 
  Ac Bc1 Bc2
Tc11 Tc12
Tc = =  Cc1 Dc11 Dc12  . (105)
Tc21 Tc22
Cc2 Dc21 Dc22

Daca T22 are numarul de intrari/iesiri egal cu numarul de iesiri/intrari ale lui Tc11
(mc1 = p2, pc1 = m2) atunci se defineste produsul Redheffer al lui T cu Tc (in

CAPITOLUL 3: PROPRIETATI STRUCTURALE 181 Conexiuni si operatii


   
u1 y1
aceasta ordine) ca fiind sistemul cu intrarea u := si iesirea y :=
uc2 yc2
 punand u2 ≡ yc1
obtinut si uc1 ≡ y2. Conexiunea este bine definita daca si numai
I D22
daca este inversabila. In acest caz obtinem sistemul generalizat
Dc11 I

TR =  
−1 −1
T11 + T12Tc11(I − Tc22Tc11) T21 T12(I − Tc11T22) Tc12
T ⊗ Tc :=
Tc21(I − T22Tc11)−1T21 Tc22 + Tc21T22(I − Tc11T22)−1Tc12
(106)

CAPITOLUL 3: PROPRIETATI STRUCTURALE 182 Conexiuni si operatii


avand o realizare data de

A + B2Se−1Dc11C2 B2Se−1Cc1 B1 + B2Se−1Dc11D21
 Bc1S −1C2 Ac + Bc1S −1D22Cc1 Bc1S −1D21

TR = 
 C1 + D12Dc11S −1C2 D12Se−1Cc1 D11 + D12Dc11S −1D21
Dc21S −1C2 Cc2 + Dc21S −1D22Cc1 Dc21S −1D21 
B2Se−1Dc12
Bc2 + Bc1S −1D22Dc12  


e−1
D12S Dc12 
Dc22 + Dc21S −1D22Dc12
(107)
unde s–a notat S := I −D22Dc11 si Se := I −Dc11D22 care sunt ambele inversabile.

Observatie: Daca in (96) avem T22(∞) = D22 = 0 atunci TLF si produsul


Redheffer ale lui T cu Tc sunt automat bine definite.

CAPITOLUL 3: PROPRIETATI STRUCTURALE 183 Conexiuni si operatii


6. Elemente Structurale ale Matricilor Rationale

Anumite elemente structurale ale matricilor rationale joaca un rol aparte in teoria
controlului sistemelor dinamice pe spatiul starilor: poli, zerouri, forma Smith
McMillan, directiile de poli/zerouri, indicii singulari stanga si dreapta.
Conceptele de pol si zerou sunt considerabil mai dificile decat in cazul scalar in
principal datorita posibilitatii ca o matrice rationala sa aibe pol si zerou in acelasi
punct so ∈ C, cat si datorita posibilitatii existentei polilor si zerourilor la infinit
(un concept relativ greu de explicitat in cazul multivariabil).
In cazul sistemic avem doua notiuni de poli: poli ai matricii de transfer (vazuta
ca matrice rationala) si poli ai sistemului pe spatiul starilor definiti ca fiind valorile
proprii ale matricii A. Mai precis, so ∈ C este pol al matricii de transfer rationale
T (s) daca este pol cel putin al unui element al sau considerat ca rationala
ireductibila. Polii matricii de transfer coincid cu polii sistemului daca si numai
daca realizarea corespunzatoare este minimala.

CAPITOLUL 3: PROPRIETATI STRUCTURALE 184 Elemente Structurale ale Rationalelor


In cazul sistemic exista si doua notiuni de zerouri: zerouri de transmisie si zerouri
invariante. Notiunea de zerou de transmisie se introduce pe baza matricii de
transfer rationale iar cea de zerou invariant pe baza unei matrici polinomiale
construite pe baza unei realizari de stare (A, B, C, D).

Pentru a intelege intuitiv notiunea de zerou sa presupunem ca so ∈ C nu este pol


al rationalei. Atunci s0 se numeste zerou al rationalei T (s) daca si numai

rank T (so) < rank nT (s)

unde prin rank nT (s) intelegem rangul normal al rationalei, i.e., rangul pentru
aproape toti s ∈ C. In termeni sistemici, cand T (s) are semnficatia de matrice
de transfer a unui sistem, zerourile ei se mai numesc zerouri de transmisie ale
sistemului.

Pentru a introduce notiunea de zerou invariant al unui sistem de tipul (A, B, C, D)

CAPITOLUL 3: PROPRIETATI STRUCTURALE 185 Elemente Structurale ale Rationalelor


sa presupunem conditii initiale nule. Atunci avem in transformate Laplace

(sI − A)x − Bu = 0,
Cx + Du = y

sau echivalent     
sI − A −B x 0
= .
C D u y
Matricea polinomiala (de grad 1)
 
sI − A −B
S(s) := ∈ R[s](n+p)×(n+m) (108)
C D

se numeste matricea sistem (sau de transmisie) si joaca un rol central in studiul


sistemelor dinamice liniare atat din punct de vedere teoretic cat si procedural.
s0 ∈ C se numeste zerou invariant al sistemului daca

rank S(s0) < rank nS(s) =: r.

CAPITOLUL 3: PROPRIETATI STRUCTURALE 186 Elemente Structurale ale Rationalelor


Rangul normal este egal cu dimensiunea maxima a unui minor al lui S(s) care
nu are determinantul identic nul. Fie χ(s) cel mai mare divizor comun al
tuturor determinantilor minorilor de rang (avand dimensiunea egala cu rangul
normal). Atunci zerourile invariante ale sistemului (A, B, C, D) sunt exact zerourile
polinomului χ(s).

Din identitatea  
sI − A −B
=
C D
   −1

I O sI − A O I −(sI − A) B
C(sI − A)−1 I O T (s) O I
se observa ca daca s0 6∈ Λ(A) atunci so este zerou invariant daca si numai daca
este zerou de transmisie.

Problemele majore apar insa atunci cand exista zerouri comune cu poli. Pentru a
intelege riguros aceste concepte avem nevoie de o teorie mai sofisticata a formelor
canonice pentru matrici rationale si matrici polinomiale de gradul 1 (numite
fascicole matriciale).

CAPITOLUL 3: PROPRIETATI STRUCTURALE 187 Elemente Structurale ale Rationalelor


Forma Smith–McMillan a rationalei T (s) – o forma canonica sub transformari
unimodulare –
Teorema 61 (Forma Smith–McMillan). Fie T (s) o p × m matrice rationala cu
coeficienti in R avand rangul normal r. Atunci exista o p × p matrice polino-
miala U (s) si o m × m matrice polinomiala V (s), ambele cu coeficienti in R
si determinant constant nenul (independent de s), care aduce T (s) la forma
Smith–McMillan
S(s) = U (s)T (s)V (s), (109)
unde  
ǫ1(s) ǫ2(s) ǫr (s)
S(s) := diag , ,..., , 0, . . . , 0 , (110)
η1 (s) η2(s) ηr (s)
polinoamele ǫi(s), ηi (s) sunt monice (au coeficientul termenului de grad maxim
egal cu 1), sunt doua cate doua coprime pentru i = 1, . . . , r, si satisfac propri-
etatile de divizibilitate

ǫi(s) | ǫi+1(s),
i = 1, . . . , r − 1. (111)
ηi+1(s) | ηi(s),

CAPITOLUL 3: PROPRIETATI STRUCTURALE 188 Elemente Structurale ale Rationalelor


Mai mult, polinoamele ǫi(s) si ηi(s) sunt unic definite de T (s) si se numesc
divizori elementari ai lui T (s).
Definim
z(s) := ǫ1(s) · · · ǫr (s),
(112)
p(s) := η1(s) · · · ηr (s).
Atunci cele nz (np) radacini ale lui z(s) (p(s)) sunt prin definitie zerourile (polii)
finiti ai lui T (s).
Ordinul zeroului (polului) s0 al lui T (s) este prin definitie multiplicitatea sa ca
radacina a polinomului z(s) (p(s)).
Ordinele partiale ale zeroului (polului) s0 al lui T (s) sunt prin definitie mul-
tiplicitatile nenule ale lui s0 ca radacina a polinoamelor ǫi(s) (ηi(s)), pentru
i = 1, . . . , r.
Spunem ca ∞ este zerou (pol) al lui T (s) daca s = 0 este zerou (pol) al matricii
rationale Tb(s) = T ( 1s ), si definim ordinele zeroului (polului) s = ∞ al lui T (s) ca
fiind ordinele zeroului (polului) s = 0 al lui Tb(s).

CAPITOLUL 3: PROPRIETATI STRUCTURALE 189 Elemente Structurale ale Rationalelor


Notam cu Z(T ) si respectiv P(T ) reuniunea tuturor zerourilor si respectiv tuturor
polilor (incluzand infinitul si repetitii in acord cu ordinele elementelor).

Gradul McMillan al lui T este prin definitie suma tuturor ordinelor polilor (finiti si
infiniti). Deci gradul McMillan al unei matrici rationale este egal cu numarul de
poli (socotind ordinele inclusiv ale polilor de la infinit).

Observatie: Daca rationala este proprie atunci nu are poli la infinit si definitiile de
mai sus se simplifica corespunzator.

Cand suntem interesati de un singur punct s0 se poate folosi o forma Smith–


McMillan locala care pune in evidenta numai ordinele zeroului si polului din s0.
Teorema 62 (Forma Smith–McMillan locala). Fie T (s) o p×m matrice rationala
cu coeficienti in R, avand rangul normal r, si fie s0 ∈ C. Atunci exista o p × p
matrice rationala U (s) si o m × m matrice rationala V (s), ambele nesingulare
si fara poli sau zerouri in so, care aduc T (s) la forma Smith–McMillan locala
(in jurul lui s0),
Sℓ(s) = U (s)T (s)V (s), (113)

CAPITOLUL 3: PROPRIETATI STRUCTURALE 190 Elemente Structurale ale Rationalelor


unde
 k1 k2 kr

Sℓ(s) := diag (s − s0) , (s − s0) , . . . , (s − s0) , (114)
si
k1 ≤ k2 ≤ . . . ≤ kr
sunt numere intregi. Mai mult, intregii strict pozitivi (sau strict negativi) ki
sunt ordinele partiale ale lui s0 ca zerou (pol) al lui T .

Forma Smith–McMillan in jurul lui s = ∞ se obtine din forma Smith–McMillan a


lui T ( 1s ) in jurul lui s = 0.

Baze minimale pentru spatiile nucleu la stanga si dreapta

Fie T (s) o p × m matrice rationala avand rangul normal r.

Nucleul la dreapta (peste rationale) are dimensiune m − r iar nucleul la stanga are
dimensiune p − r. Introducem in continuare notiunile de indici minimali la dreapta
si stanga. Pentru acesta avem nevoie de cateva notiuni de subspatii rationale.

CAPITOLUL 3: PROPRIETATI STRUCTURALE 191 Elemente Structurale ale Rationalelor


Definim gradul unui vector de polinoame ca fiind cel mai mare grad al elementelor
respectivului vector. Dandu–se un subspatiu in Rm(s) (vectori rationali de dimen-
siune m), putem intotdeauna construi o baza polinomiala pentru el. Coloanele
unei matrici polinomiale P(s) formeaza o baza minimala pentru spatiul pe care-l
genereaza daca au loc simultan:

1. P (s) este monica pentru toti s ∈ C finiti;

2. P (s) este redusa pe coloane (sau proprie pe coloane). Mai precis, fie ni gradul
coloanei i a lui P (s) si construim matricea constanta Pn a carei coloana i este
coeficientul vectorial al lui sni in coloana i a lui P(s). Atunci P(s) este de tip
coloana redusa daca Pn este monica.

Echivalent, o baza polinomiala este minimala daca suma tuturor gradelor vectorilor
polinomiali care o formeaza este cat mai mica posibila.
Multimea gradelor vectorilor din orice baza minimala a unui subspatiu este invari-
anta in raport cu operatiile unimodulare pe coloane, si aceste grade se numesc

CAPITOLUL 3: PROPRIETATI STRUCTURALE 192 Elemente Structurale ale Rationalelor


indici minimali (sau indici Kronecker ) ai subspatiului.

Se numesc indici minimali la stanga si dreapta ai unei matrici rationale multimea


indicilor minimali ai subspatiilor nule (nucleu) la stanga si respectiv la dreapta.

Pentru o matrice rationala arbitrara are loc o relatie interesanta intre indicii
structurali. Fie nr si nℓ suma indicilor minimali la dreapta si respectiv la stanga si
fie nz si np numarul total de zerouri si respectiv de poli. Atunci are loc relatia

np = nz + nr + nℓ.

CAPITOLUL 3: PROPRIETATI STRUCTURALE 193 Elemente Structurale ale Rationalelor


7. Fascicole Matriciale si Forme Canonice

Fie M si N doua m × n matrici cu elemente in R. Matricea polinomiala (de grad


1) sM − N se numeste fascicol matricial sau pe scurt fascicol.
Ne concentram intai atentia asupra fascicolelor sM − N care sunt regulate, i.e.,
care sunt patrate (n × n) si au un determinant neidentic nul det(sM − N ) 6≡ 0.
Un fascicol care nu este regulat se numeste singular. In particular, daca M sau N
sunt inversabile atunci fascicolul sM − N este regulat. In general vom fi interesati
de fascicole arbitrare (inclusiv singulare).
Dandu-se un fascicol regulat sM − N , cu M, N ∈ Rn×n, problema de gasire a
solutiilor ecuatiei polinomiale

χ(s) := det (sM − N ) = 0 (115)

se numeste problema de valori proprii generalizate.

CAPITOLUL 3: PROPRIETATI STRUCTURALE 194 Fascicole matriciale


Deoarece M poate fi singulara, polinomul caracteristic χ(s) are gradul nf ≤ n.

Cele nf radacini ale lui χ(s) se numesc valori proprii generalizate finite ale
fascicolului sM − N .

s = ∞ este o valoare proprie (generalizata) a lui sM − N daca s = 0 este o


valoare proprie (generalizata) a fascicolului reciproc sN − M . Multiplicitatea n∞
a valorii proprii de la infinit este prin definitie multiplicitatea valorii proprii s = 0
pentru fascicolul sN − M . Evident avem n∞ = n − nf .

Prin urmare un fascicol matricial regulat de dimensiune n × n are intotdeauna n


valori proprii (finite si infinite) care formeaza spectrul fascicolului notat Λ(M, N ).

Pentru o valoare proprie s0 exista intotdeauna un vector nenul x ∈ Cn – numit


vector propriu generalizat a.i.

N x = s0 M x daca s0 este finita,
Mx = 0 daca s0 este infinit.

CAPITOLUL 3: PROPRIETATI STRUCTURALE 195 Fascicole matriciale


Forma canonica Weierstrass a unui fascicol regulat

Introducem o relatie de echivalenta pentru fasciole matriciale si studiem intai


proprietatile si consecintele asupra fascicolelor regulate.

Doua fascicole sM − N si sM f−N e , cu M, N, M f, N


e ∈ Cm×n se numesc (strict)
echivalente daca exista doua matrici inversabile Q ∈ Cm×m, Z ∈ Cn×n, a.i.

f−N
Q(sM − N )Z = sM e. (116)

Relatia de echivalenta stricta (116) induce o forma canonica pe multimea fasci-


colelor regulate de dimensiune n × n numita forma canonica Weierstrass. Prin
urmare, pentru oricare fascicol regulat sM − N , cu M, N ∈ Cn×n, exista doua
matrici inversabile Q, Z ∈ Cn×n a.i.

Q(sM − N )Z = sMW − NW

CAPITOLUL 3: PROPRIETATI STRUCTURALE 196 Fascicole matriciale


unde
sMW − NW := diag (sM∞ − In∞ , sInf − Nf ), (117)
Nf este in forma canonica Jordan, M∞ este nilpotenta si este in forma canonica
Jordan
M∞ := diag (Js∞ 1
(0), Js∞
2
(0), . . . , Js∞
h
(0)) (118)

si Jsi (0) este un bloc elementar (nilpotent) Jordan de dimensiune si × si cu valoare


proprie s = 0.

Observatii: • Valorile proprii generalizate finite ale fascicolului sM − N coincid cu


valorile proprii ale matricii Nf . Prin urmare se poate folosi matricea Nf pentru
a defini conceptele de multiplicitate partiala, algebrica si geometrica a unei valori
proprii generalizate finite a lui sM − N .
• Similar, se definesc multiplicitatea partiala, algebrica si geometrica a valorii pro-
prii generalizate de la infinit ca fiind multiplicitatea corespunzatoare a valorii proprii
s = 0 a matricii M∞. Prin urmare pentru s = ∞ multiplicitatile partiale sunt s∞
Ph ∞ ∞ i
(i = 1, . . . , h∞), multiplicitatea algebrica este n∞ si satisface n∞ = i=1 si , iar
multiplicitatea geometrica este h∞.

CAPITOLUL 3: PROPRIETATI STRUCTURALE 197 Fascicole matriciale


•Multimea valorilor proprii generalizate impreuna cu multiplicitatile partiale deter-
mina complet forma canonica Weierstrass a unui fascicol matricial regulat (pana
la o permutare a blocurilor diagonale).

Daca M este inversabila atunci fascicolul nu are are valori proprii infinite si forma
canonica Weierstarss se reduce la forma canonica Jordan a matricii M −1N .

CAPITOLUL 3: PROPRIETATI STRUCTURALE 198 Fascicole matriciale


Problema de valori proprii generalizate: cazul general

Extindem in continuare studiul asupra fascicolelor arbitrare (posibil singulare)


sM − N de dimensiune m × n cu elemente in R. Un fascicol este numit singular
daca nu este patrat sau daca este patrat dar det(sM − N ) ≡ 0. In particular,
sM − N are rang constant pentru toti s ∈ C cu exceptia unui numar finit pentru
care are rang strict mai mic.

Observatii: Rangul normal r al fascicolului sM − N este rangul lui sM − N


pentru aproape toti s ∈ C. Pentru un fascicol regulat avem m = n = r.
Daca νr := n − r > 0 atunci fasciolul are structura singulara la dreapta. Daca
νℓ := m − r > 0 atunci fascicolul are structura singulara la stanga. Un fascicol
regulat nu are structura singulara nici la stanga si nici la dreapta.

Polinomul caracteristic χ(s) al fascicolului este cel mai mare divizor comun al
polinoamelor Ri(s), unde {Ri(s)} este multimea tutoror minorilor de dimensiune
r.

CAPITOLUL 3: PROPRIETATI STRUCTURALE 199 Fascicole matriciale


Problema rezolvarii ecuatiei polinomiale

χ(s) := χ0 + χ1s + . . . + χnf snf = 0,

cu χnf 6= 0, se numeste problema de valori proprii generalizate pentru fascicolul


sM − N .
Cele nf radacini ale lui χ(s) se numesc valori proprii finite. Spunem ca s = ∞ este
valoare proprie lui sM − N daca s = 0 este valoare proprie a fascicolului reciproc
sN − M sau, echivalent, daca rank M < r. Multiplicitatea n∞ a v.p. de la infinit
este prin definitie multiplicitatea v.p. s = 0 a lui sN − M .
Reuniunea (nedisjuncta) a celor nf + n∞ v.p. generalizate (finite si infinite)
formeaza spectrul lui sM − N notat Λ(M, N ).

Forma canonica Kronecker a unui fascicol general

Relatia de stricta echivalenta induce o forma canonica pe multimea fascicolelor de


dimensiune m × n numita forma canonica Kronecker. Mai exact, pentru oricare

CAPITOLUL 3: PROPRIETATI STRUCTURALE 200 Fascicole matriciale


fascicol sM − N , cu M, N ∈ Cm×n, exista doua matrici inversabile Q ∈ Cm×m si
Z ∈ Cn×n a.i.

Q(sM − N )Z = sMKR − NKR ,

unde

 
Lǫ1
 ... 
 Lǫνr 
 
 sM∞ − In∞ 
 
sMKR − NKR :=  sInf − Nf , (119)
 
 LTη1 
 ... 
 
LTην

Nf este o matrice in forma canonica Jordan, M∞ este o matrice nilpotenta in

CAPITOLUL 3: PROPRIETATI STRUCTURALE 201 Fascicole matriciale


forma canonica Jordan, si Lk (k ≥ 0) este un k × (k + 1) fascicol bidiagonal
 
s −1
Lk :=  ... ... .
s −1

k poate fi zero corespunzand unei linii sau coloane de zerouri in fascicolul (119).
Structura Kronecker este complet determinata de partea regulata si singulara.
Valorile proprii (finite si infinite) ale fascicolului sM − N sunt valorile proprii ale
fascicolului regulat    
M∞ O I n∞ O
s −
O I nf O Nf
Partea singulara a fascicolului este determinata de structura singulara Kronecker la
stanga si dreapta. Blocurile de dimensiune ǫi × (ǫi + 1) notate Lǫi , (i = 1, . . . , νr ),
sunt blocurile elementare Kronecker la dreapta si ǫi ≥ 0 sunt indicii Kronecker la
dreapta. Blocurile de dimensiune (ηj + 1) × ηj notate Lηj T , (j = 1, ..., νℓ), sunt
blocurile elementare Kronecker la stanga si ηj ≥ 0 sunt indicii Kronecker la stanga.

CAPITOLUL 3: PROPRIETATI STRUCTURALE 202 Fascicole matriciale


Din forma canonica Kronecker avem

rank n(sM − N ) = nr + n∞ + nf + nℓ, (120)


Pνr P νℓ
unde nr := i=1 ǫi si nℓ := j=1 ηj . Daca sM − N este regulat atunci nu exista
indici Kronecker (i.e., blocurile Lǫi , LTηj dispar) si forma canonica Kronecker se
reduce la forma canonica Weierstrass.

CAPITOLUL 3: PROPRIETATI STRUCTURALE 203 Fascicole matriciale


8. Elemente Structurale ale unei Matrici Rationale in
Termenii Realizarilor de Stare

Intre elementele structurale ale matricii de transfer rationale T (s) a unui sistem
dinamic si formele canonice ale fasciolelor
 
sI − A −B
sI − A,
C D

asociate unei realizari arbitrare – numite fascicolul de poli si fascicolul de zerouri


(sau matricea de transmisie) – exista o legatura stransa.
Teorema 63. Fie T (s) o p×m matrice rationala proprie avand gradul McMillan
n si rangul normal r. Fie  
A B
T = (121)
C D

CAPITOLUL 3: PROPRIETATI STRUCTURALE 204


o realizare de dimensiune k cu coeficienti in R si fie
 
sI − A −B
sI − A, sET − AT :=
−C −D

fasciolele de poli si respectiv de zerouri asociate acestei realizari.

1. Pentru orice realizare (121) avem:


(a) Rangul normal: Rangurile normale ale lui T (s) si sET − AT satisfac

rank nT (s) = rank n(sET − AT ) − k.

(b) Poli: Reuniunea polilor P(T ) este inclusa Λ(A),

P(T ) ⊂ Λ(A).

CAPITOLUL 3: PROPRIETATI STRUCTURALE 205


(c) Zerouri: Reuniunea zerourilor de transmisie Z(T ) (finite si infinite) ale
lui T este inclusa in Λ(ET , AT ),

Z(T ) ⊂ Λ(ET , AT ).

2. Pentru o realizare minimala (121) avem in plus:


(a) Poli: Polii lui T (s) coincid cu valorile proprii ale lui A. Ordinele partiale
ale polilor lui T (s) sunt egale cu multiplicitatile partiale ale v.p. ale lui A.
(b) Zerouri finite : Zerourile finite (de transmisie) ale lui T coincid cu v. p.
finite ale lui sET − AT . Ordinele partiale ale zerourilor finite ale lui T (s)
sunt egale cu multiplicitatile partiale ale v.p. finite ale lui sET − AT .
(c) Zerouri infinite: Ordinele partiale ale zerourilor infinite (de transmisie)
ale lui T sunt egale cu multiplicitatile partiale ale v.p. infinite a lui sET −
AT minus 1.

CAPITOLUL 3: PROPRIETATI STRUCTURALE 206


(d) Indici minimali la stanga. Indicii minimali la stanga ai lui T sunt egali
cu indicii Kronecker la stanga ai lui sET − AT .
(e) Indici minimali la dreapta. Indicii minimali la dreapta ai lui T sunt egali
cu indicii Kronecker la dreapta ai lui sET − AT .

CAPITOLUL 3: PROPRIETATI STRUCTURALE 207


CAPITOLUL 4: SINTEZA ELEMENTARA

1. Compensatoare Dinamice : Problematica

2. Lege de Comanda, Stabilizabilitate, Alocabilitate

3. Estimatori de Stare

4. Estimatori de Tip 1

5. Compensatorul Kalman

6. Estimatori de Stare de Ordin Redus (Tip 2)

7. Reglarea Sistemelor Dinamice

CAPITOLUL 4: SINTEZA ELEMENTARA 208 SINTEZA ELEMENTARA


1. Compensatoare Dinamice : Problematica

Consideram un sistem liniar



ẋ(t) = Ax(t) + Bu(t), x(0) = xo
(122)
y(t) = Cx(t) + Du(t)

cu x(t) ∈ Rn, u(t) ∈ Rm, y(t) ∈ Rp.


Problema sintezei (naturala): Cum putem sa modificam dinamica acestui sistem
astfel incat sa satisfaca anumite cerinte ? Cerintele elementare discutate si in cazul
sistemelor SISO sunt legate de stabilitate si comporatarea sistemului la diverse
semnale de referinta/perturbatii.
Raspuns: Cerintele de proiectare se pot realiza prin cuplarea unui nou sistem
dinamic (de preferinta din aceeasi clasa de modele) astfel incat sistemul rezultant
sa se comporte in modul dorit.

CAPITOLUL 4: SINTEZA ELEMENTARA 209 Compensatoare Dinamice: Problematica


Asa cum am vazut in cazul sistemelor SISO, conexiunile serie si paralel nu pot
asigura in general nici macar cerinta minimala de stabilitate (interna) si acest fapt
este specific si sistemelor dinamice (Ex: Aratati acest lucru prin analogie cu cazul
SISO sau direct pe realizarile de stare ale conexiunilor serie/paralel). Prin urmare
ne indreptam atentia din nou asupra conexiunii in bucla de reactie negativa.

In conjunctie cu sistemul (122) consideram sistemul dinamic pe spatiul starilor


(numit compensator dinamic sau regulator)

ẋc(t) = Acxc(t) + Bcuc(t), xc(0) = xco
(123)
yc(t) = Ccxc(t) + Dcuc(t),

unde xc(t) ∈ Rnc , uc(t) ∈ Rp, yc(t) ∈ Rm, cuplat in reactie inversa cu (122) a. i.

u ≡ yc + uR, yR ≡ y ≡ uc

unde uR este intrarea (semnal extern) si yR este iesirea sistemului rezultant.

CAPITOLUL 4: SINTEZA ELEMENTARA 210 Compensatoare Dinamice: Problematica


Pentru simplificare presupunem S := Ip − DDc = I, Sb = Im − DcD = I (de
exemplu D = 0 sau Dc = 0). Atunci ecuatiile dinamice ale sistemului echivalent
sunt

 ˙      
x A + BDcC BCc x B
= + uR
xc BcC  Ac +
 BcDCc xc Bc D (124)
  x
yR = C DCc + DuR.
xc

Notand
     
x A + BDcC BCc B
xR := , AR := , BR := ,
xc Bc C Ac + BcDCc Bc D

 
CR := C DCc , DR := D

CAPITOLUL 4: SINTEZA ELEMENTARA 211 Compensatoare Dinamice: Problematica


obtinem echivalent
  
 xo
ẋR (t) = ARxR (t) + BRuR(t), xR (0) =
xco (125)

yR (t) = CRxR (t) + DRuR(t).

Se formuleaza urmatoarele probleme fundamentale:

1. Problema stabilizarii: Pentru sistemul original (A, B, C, D) sa se gaseasca un


regulator (sau clasa tuturor !!!) (Ac, Bc, Cc, Dc) a. i. sistemul rezultant in bucla
inchisa sa fie intern asimptotic stabil (Λ(AR) ⊂ C−).

2. Problema alocarii: Pentru sistemul original (A, B, C, D) sa se gaseasca un


regulator (sau clasa tuturor !!!) (Ac, Bc, Cc, Dc) a. i. sistemul rezultant in bucla
inchisa sa aibe o dinamica impusa (mai precis valorile proprii ale sistemului in
bucla inchisa sa coincida cu multimea Λ0 de n + nc valori complexe date, i.e.,
Λ(AR) = Λ0.

CAPITOLUL 4: SINTEZA ELEMENTARA 212 Compensatoare Dinamice: Problematica


Observatii: a) Ambele probleme impun conditii numai asupra matricii AR .
b) In ambele probleme trebuie implicit determinat si nc (dimensiunea compen-
satorului) fiind de dorit ca aceasta sa fie cat mai mica. Problemele de stabi-
lizare/alocare in care se impune conditia suplimentara de minimalitate a lui nc sunt
probleme structurale in general foarte dificile.
c) Multimea Λ0 se ia in general simetrica, i.e. daca s ∈ Λ0 atunci si s ∈ Λ0,
regulatorul rezultand automat cu coeficienti reali. Λ0 se da in general ca cerinta de
proiectare asigurand automat o anumita viteza de raspuns, timp tranzitoriu, etc.
d) Spre deosebire de problema alocarii, problema stabilizarii nu pretinde spectru
fix ci doar locatia acestuia in C−.
In mod traditional au existat cateva abordari ale acestei probleme:

• Prin extensie dinamica: Problema se reduce simplu la o problema algebrica


de alocare de poli ce insa s-a dovedit a fi foarte dificil de rezolvat in conditii
generale.

• Principiul separatiei: S–a pus in evidenta un principiu fundamental in teoria

CAPITOLUL 4: SINTEZA ELEMENTARA 213 Compensatoare Dinamice: Problematica


sistemelor liniare numit principiul separatiei si care reduce problema originala la
doua probleme algebrice de alocare ce se rezolva independent.

• Parametrizarea lui Youla: cea mai completa solutie disponibila (foloseste implicit
principiul separatiei) necesitand insa dezvoltarea teoriei factorizarilor de matrici
rationale peste S (relativ sofisticata) – solutia este formal identica cu cazul
SISO.

Extensie dinamica

Consideram pentru simplitate D = 0. Metoda se bazeaza pe observatia ca matricea


de stare AR a sistemului rezultant se poate scrie succesiv
       
A + BDcC BCc A O B O Dc Cc C O
AR := = +
Bc C Ac O O O I nc Bc Ac O I nc

= Ae + BeKCe (126)

CAPITOLUL 4: SINTEZA ELEMENTARA 214 Compensatoare Dinamice: Problematica


unde

       
A O B O C O Dc Cc
Ae := , Be := , Ce := , K := .
O O O I nc O I nc Bc Ac
(127)
Deci problema originala de stabilizare/alocare dinamica prin gasirea compensatoru-
lui (Ac, Bc, Cc, Dc) s–a redus la problema echivalenta de gasire a matricii constante
K astfel incat spectrul matricii (126) sa fie in C−. Aceasta din urma problema este
in fapt o problema de gasire a unei reactii constante dupa iesire (reactie inversa cu
compensator constant) pentru sistemul (Ae, Be, Ce).

Sistemul extins (Ae, Be, Ce) se obtine prin adaugarea la sistemul initial (A, B, C, D)
a sistemului

ẋa(t) = ua(t),
ya(t) = xa(t),

CAPITOLUL 4: SINTEZA ELEMENTARA 215 Compensatoare Dinamice: Problematica


unde xa(t), ua(t), ya(t) ∈ Rnc . Obtinem astfel ecuatiile dinamice

ẋe(t) = Aexe(t) + Beue(t),
ye(t) = Cexe(t),
     
x(t) u(t) y(t)
xe(t) := , ue(t) := , ye(t) :=
xa(t) ua(t) ya(t)
sunt starea, intrarea si respectiv iesirea extinsa.
Daca conectam un compensator constant in reactie inversa cu sistemul extins
obtinem ca matricea de stare a sistemului in bucla inchisa este (126). Deci
problema originala de gasire a unui compensator (Ac, Bc, Cc, Dc) s-a redus la
problema de gasire a unei reactii cst. K (127) pentru sistemul extins (Ae, Be, Ce).
Cu toate ca aceasta problema pare mai simpla decat cea originala, solutionarea ei
este foarte dificila intrucat nu este cunoscuta dimensiunea nc. Chiar cu nc impus,
problema se reduce la rezolvarea unei probleme de optimizare neconvexe (dificile
!).

CAPITOLUL 4: SINTEZA ELEMENTARA 216 Compensatoare Dinamice: Problematica


Principiul separatiei

Un compensator dinamic se poate obtine rezolvand independent problemele:

• Constructia unei legi de reactie dupa stare F ∈ Rm×n care aloca sau stabilizeaza
(face ca matricea A + BF sa aibe spectrul dorit sau sa fie asimptotic stabila).

• Constructia unui estimator de stare (prelucreaza semnalele exogene – marimile


de intrare u si de iesire y – si genereaza o estimare a marimii de stare x).

In final, regulatorul (de tip Kalman) se obtine luand reactia F dupa starea estimata.

Problema de alocare (cu reactie dinamica dupa iesire) are solutie daca si numai
daca perechea (A, B) este controlabila si perechea (C, A) este observabila.

Problema de stabilizare (cu reactie dinamica dupa iesire) are solutie daca si numai
daca perechea (A, B) este stabilizabila si perechea (C, A) este detectabila.

CAPITOLUL 4: SINTEZA ELEMENTARA 217 Compensatoare Dinamice: Problematica


2. Lege de Comanda, Alocabilitate, Stabilizabilitate

Definitia 64. • Pentru un sistem (A, B, C, D) dependenta

u = F x + Gv (128)

se numeste lege de comanda prin reactie dupa stare, unde F ∈ Rm×n, G ∈


Rm×m, F se numeste matricea de reactie si v este noua marime de intrare.
(FIG)
• Perechea (A, B), A ∈ Rn×n, B ∈ Rn×m se numeste stabilizabila daca exista
o matrice de reactie dupa stare F ∈ Rm×n a.i.

Λ(A + BF ) ⊂ C−.

• Perechea (C, A), C ∈ Rp×n, A ∈ Rn×n se numeste detectabila daca exista o


matrice de reactie dupa stare K ∈ Rn×p a.i.

Λ(A + KC) ⊂ C−.

CAPITOLUL 4: SINTEZA ELEMENTARA 218 Lege de Comanda, Alocabilitate, Stabilizabilitate


• Perechea (A, B), A ∈ Rn×n, B ∈ Rn×m , se numeste alocabila daca oricare
ar fi multimea simetrica Λ0 de n numere complexe (orice s ∈ Λ0 ⇒ s ∈ Λ0),
exista o matrice de reactie dupa stare F ∈ Rm×n a.i.

Λ(A + BF ) = Λ0.

Proprietatile de stabilizabilitate si detectabilitate sunt duale.

Considerand sistemul dinamic



ẋ(t) = Ax(t) + Bu(t), x(0) = xo
(129)
y(t) = Cx(t) + Du(t)

legea de comanda dupa stare implica accesul (din punct de vedere tehnic) la stare,
i.e., cunoasterea marimii de stare ! Dupa implementarea comenzii (128) sistemul

CAPITOLUL 4: SINTEZA ELEMENTARA 219 Lege de Comanda, Alocabilitate, Stabilizabilitate


in bucla inchisa devine

ẋ(t) = (A + BF )x(t) + BGv(t), x(0) = xo
(130)
y(t) = (C + DF )x(t) + DGv(t)

avand noua intrare v si iesirea y.

Exercitiu: Explicitati in domeniul timp si al transformatelor Laplace traiectoria,


iesirea si legea de comanda pentru sistemul (130). Scrieti o realizare de stare pentru
acest sistem si precizati cum sunt influentate controlabilitatea/ observabilitatea/
minimalitatea/ stabilizabilitatea/ detectabilitatea/ polii/ zerourile printr–o lege de
comanda cu reactie dupa stare.
Teorema 65. Fie A ∈ Rn×n, B ∈ Rn×m, F ∈ Rm×n, G ∈ Rm×m nesingulara si
fie AF := A + BF .
a) Perechea (A, B) este controlabila daca si numai daca perechea (AF , BG) este
controlabila.
b) Subspatiile controlabile in k pasi ale perechii (A, B) si perechii (AF , BG)

CAPITOLUL 4: SINTEZA ELEMENTARA 220 Lege de Comanda, Alocabilitate, Stabilizabilitate


coincid, i.e.,
Rk (A, B) = Rk (AF , BG). (131)

Demonstratie. a) Avem succesiv


 
    I O 
rank sI − A − BF BG = rank sI − A B = rank sI − A
−F G

si concluzia rezulta folosind criteriul PBH de controlabilitate.


b) Demonstram prin inductie. Pentru k = 0 avem prin definitie

R0(A, B) = R0(AF , BG) = {0}

iar pentru k = 1 avem

R1(A, B) = Im B = Im BG = R1(AF , BG).

CAPITOLUL 4: SINTEZA ELEMENTARA 221 Lege de Comanda, Alocabilitate, Stabilizabilitate


Presupunem acum (131) adevarata. Atunci pentru k + 1 avem

Rk+1(AF , BG) = Im BG + AF Rk (AF , BG)

= Im B + AF Rk (A, B) = Im B + ARk (A, B) = Rk+1(A, B).

Solutia problemei alocarii


Teorema 66. Perechea (A, B), A ∈ Rn×n, B ∈ Rn×m este alocabila daca si
numai daca este controlabila.
Demonstratia acestui rezultat este relativ complicata si o vom face in cateva etape
formulate ca rezultate separate:
• Demonstram suficienta pentru m = 1 (o intrare);
• Aratam ca problema cu m > 1 se poate reduce printr-o (pre)reactie dupa stare
F la problema cu m = 1;
• Demonstram teorema pentru m general.

CAPITOLUL 4: SINTEZA ELEMENTARA 222 Lege de Comanda, Alocabilitate, Stabilizabilitate


Teorema 67 (Cazul m=1). Perechea (A, b), A ∈ Rn×n, b ∈ Rn×1 este alocabila
daca este controlabila.

Demonstraţie. Fie Λ0 un set simetric de n numere si ∈ C, i = 1, 2, . . . , n. Aratam


ca exista f ∈ Rn×1 a.i.
Λ(A + bf T ) = Λ0.
Demonstratia este constructiva (furnizeaza reactia care aloca). Deoarece (A, b)
este controlabila, matricea de controlabilitate
 2 n−1

R= b Ab A b . . . A b

are dimensiune n × n si rang n si deci este inversabila. Atunci ecuatia

q T R = eTn (132)

T 1×n
 
are solutie unica q = eTn R−1
∈ R , unde eTn
= 0 . . . 0 1 (q T este
ultima linie a lui R−1 ). Fie Λ0 un set simetric fixat de n numere complexe si,

CAPITOLUL 4: SINTEZA ELEMENTARA 223 Lege de Comanda, Alocabilitate, Stabilizabilitate


i = 1, 2, . . . , n si fie

χ(s) = Πni=1(s − si) = sn + αn−1 sn−1 + . . . + α0 (133)

polinomul avand radacinile date de Λ0. Aratam ca exista un f a.i. polinomul


caracteristic a lui A + bf T sa coincida cu χ(s) ceea ce este echivalent cu a spune
ca matricea A + bf T are spectrul Λ0. Pentru aceasta este suficient sa aratam ca

χ(A + bf T ) = 0

pentru un f potrivit ales. Scriind (132) explicit obtinem

qT b = 0
q T Ab = 0
..
q T An−2b = 0
q T An−1b = 1

CAPITOLUL 4: SINTEZA ELEMENTARA 224 Lege de Comanda, Alocabilitate, Stabilizabilitate


care se pot rescrie pentru orice f ∈ Rn sub forma

qT = qT
q T (A + bf T ) = q T A
q T (A + bf T )2 = q T A2
.. (134)
q T (A + bf T )n−1 = q T An−1
q T Anb = q T An + q T An−1 bf T = q T An + f T .

Inmultind succesiv ecuatiile cu α0, α1, . . . αn−1 si 1, adunandu-le membru cu


membru si folosind (133) rezulta

q T χ(A + bf T ) = q T χ(A) + f T . (135)

Alegand
f T := −q T χ(A) (136)
rezulta automat ca
q T χ(A + bf T ) = 0. (137)

CAPITOLUL 4: SINTEZA ELEMENTARA 225 Lege de Comanda, Alocabilitate, Stabilizabilitate


Folosind (134), obtinem prin inmultire succesiva cu A, A2, . . ., An−1 ca

 
0 0 ... 0 1  T

  q
 0 0 ... 1 0   qT A 
T χ(A + bf T ) = 0, TR =  .. .. .. .. .. , 
T :=  . .
  . 
 0 1 ... 0 0 
q T An−1
1 0 ... 0 0

Deci T este inversabila si prin urmare χ(A + bf T ) = 0 pentru f dat de (136),


q.e.d.

Dam in continuare un rezultat care permite reducerea problemei generale de alocare


cu m > 1 la cazul m = 1.
Teorema 68. Daca perechea (A, B) este controlabila atunci pentru orice b ∈
Rn, b 6= 0, exista o matrice de reactie F astfel incat perechea (A + BF, b) este
controlabila.

CAPITOLUL 4: SINTEZA ELEMENTARA 226 Lege de Comanda, Alocabilitate, Stabilizabilitate


Demonstraţie. Fie b 6= 0 fixat. Definim recurent n vectori

xk+1 = Axk + Buk , k = 1, 2, . . . , n − 1, x1 = b (138)

unde uk ∈ Rm.

Aratam ca putem intotdeauna alege vectorii uk (in numar de n − 1) a. i. vectorii


x1, . . . , xn sa fie liniar independenti. Presupunem prin reducere la absurd ca am
construit vectorii liniar independenti x1, . . . , xk (k < n) si oricare ar fi uk ∈ Rm
avem ca xk+1 este liniar dependent de precedentii, i.e.,

 
xk+1 = Axk + Buk ∈ Sk := Im x1 x2 . . . , xk , ∀uk ∈ Rm. (139)

Din (139) rezulta automat ca

Axk ∈ Sk , Im B ∈ Sk .

CAPITOLUL 4: SINTEZA ELEMENTARA 227 Lege de Comanda, Alocabilitate, Stabilizabilitate


Avem deasemenea
 
ASk = Im Ax1 Ax2 . . . Axk

 
= Im x2 − Bu1 x3 − Bu2 . . . xk+1 − Buk ⊂ Sk
ceea ce inseamna ca Sk este A–invariant si contine Im B. Deoarece perechea
(A, B) este controlabila avem ca R = Rn si deci

Rn = R ⊂ Sk

ceea ce implica automat k = n obtinand astfel o contradictie.

Consideram acum ecuatia


   
F x1 x2 . . . xn = u1 u2 . . . , un−1 0 (140)

CAPITOLUL 4: SINTEZA ELEMENTARA 228 Lege de Comanda, Alocabilitate, Stabilizabilitate


care are o solutie unica F . Daca premultiplicam ecuatia de mai sus cu B obtinem

Bui = BF xi, i = 1, 2, . . . , n − 1

care inlocuite in (138) genereaza

xk+1 = (A + BF )xk , k = 1, 2, . . . , n − 1, x1 = b

sau inca
xk = Ak−1
F b, k = 1, 2, . . . , n.
Deoarece xk sunt liniar independenti rezulta ca matricea
 
b AF b . . . An−1
F b

este inversabila si deci perechea (AF , b) cu F dat de (140) este controlabila.


Teorema 69. Perechea (A, B), A ∈ Rn×n, B ∈ Rn×m este alocabila daca si
numai daca este controlabila.

CAPITOLUL 4: SINTEZA ELEMENTARA 229 Lege de Comanda, Alocabilitate, Stabilizabilitate


Demonstraţie. Suficienta: Deoarece perechea (A, B) este controlabila inseamna
ca B 6= 0 si deci exista g ∈ Rm a.i. b = Bg 6= 0. Din Teorema 67 rezulta atunci
ca exista Fe a.i. perechea (AFe , b) sa fie controlabila, unde AFe := A + B Fe . Din
teorema 67 rezulta ca pentru orice Λ0 set simetric de n numere exista f ∈ Rm a.i.

Λ(AFe + bf T ) = Λ0.

Prin urmare punand


F := Fe + gf T (141)
rezulta ca

Λ(A + BF ) = Λ(A + B(Fe + gf T )) = Λ(AFe + bf T ) = Λ0

de unde concluzia ca perechea (A, B) este alocabila si reactia care aloca este data
de (141).
Necesitatea: Pp prin absurd ca perechea (A, B) este alocabila dar nu este

CAPITOLUL 4: SINTEZA ELEMENTARA 230 Lege de Comanda, Alocabilitate, Stabilizabilitate


controlabila. Atunci aplicand teorema de descompunere controlabila obtinem in
noul sistem de coordonate
   
−1 b b b A1 A3 B1  
T (A + BF )T = A + B F = + F1 F2
O A2 O
 
A1 + B1F1 A3 + B1F2
= (142)
O A2
unde am notat Fb := F T −1. De aici rezulta ca

b+B
Λ(A + BF ) = Λ(A b Fb) = Λ(A1 + B1F1) ∪ Λ(A2)

si deci Λ(A2) ⊂ Λ(A + BF ) oricare ar fi reactia F ceea ce contrazice ipoteza de


alocabilitate a perechii (A, B).

Observatii: a) Relatia (142) evidentiaza ca orice pereche (A, B) are o subpereche


care poate fi alocata (parte din spectru poate fi alocat) – aceasta coincide cu

CAPITOLUL 4: SINTEZA ELEMENTARA 231 Lege de Comanda, Alocabilitate, Stabilizabilitate


partea controlabila – si o parte nealocabila, i.e. anumiti poli ficsi dati de Λ(A2).
Acesti poli sunt invarianti in raport cu orice reactie dupa stare.
b) Teorema de mai sus arata ca proprietatea ”benefica” fundamentala a unei
perechi controlabile (A, B) este ca dinamica sistemului (determinata de v.p. ale
matricii de stare) poate fi modificata in mod arbitrar printr–o reactie dupa stare.
c) Alocarea se poate extinde si asupra vectorilor proprii (simultan cu valorile proprii)
cu anumite precautii privitoare la alegerea acestora.
d) Demonstratia teoremelor de mai sus este constructiva rezultand proceduri de
obtinere a reactiei care aloca. Aceaste metode au insa numeroase dezavantaje dpdv
numeric si de aceea s-au dezvoltat alte proceduri numeric stabile de constructie a
reactiei F (algoritm de tip Schur, alocare cu norma minima, etc).
e) Alocabilitatea nu implica in general faptul ca matricea A + BF are orice
elemente prescrise ci doar orice spectru prescris !

Procedura de Alocare: Cazul m = 1

Pasul 0: Dandu–se perechea controlabila (A, b), A ∈ Rn×n, b ∈ Rn, si un set

CAPITOLUL 4: SINTEZA ELEMENTARA 232 Lege de Comanda, Alocabilitate, Stabilizabilitate


simetric de n valori proprii s1, s2, . . . , sn se construieste polinomul

χ(s) = Πni=1(s − si) = α0 + α1s + α2s2 + . . . + αn−1sn−1 + sn

cu α0, α1, . . . , αn−1 ∈ R.

Pasul 1: Se construieste matricea de controlabilitate

 n−1

R= b Ab . . . A b

care este automat patrata si nesingulara.

CAPITOLUL 4: SINTEZA ELEMENTARA 233 Lege de Comanda, Alocabilitate, Stabilizabilitate


Pasul 2: Se rezolva ecuatia
 
0
 0 
 .. 
R q = en = 
T



 0 
1

in necunoscuta q ∈ Rn.

Pasul 3: Se calculeaza
f T = −q T χ(A).

Pentru a explicita procedura pentru cazul multivariabil avem nevoie de un rezultat


auxiliar.

CAPITOLUL 4: SINTEZA ELEMENTARA 234 Lege de Comanda, Alocabilitate, Stabilizabilitate


Propozitia 70. Fie (A, B) controlabila, A ∈ Rn×n, B ∈ Rn×m. Controlabili-
tatea perechii (A + BF, b) este generica in raport cu F ∈ Rm×n si b := Bg,
0 6= g ∈ Rm. Mai exact, alegand aleator perechea (F, g) perechea (AF , b) este
(generic) controlabila.

Demonstraţie. Demonstratia este lasata ca exercitiu fiind asemanatoare cu demon-


strarea genericitatii controlabilitatii unei perechi de matrici alese arbitrar.

Procedura de Alocare: Cazul General

Pasul 0: Dandu–se perechea controlabila (A, B), A ∈ Rn×n , B ∈ Rn×m, si un


set simetric de n valori proprii s1, s2, . . . , sn se construieste polinomul

χ(s) = Πni=1(s − si) = α0 + α1s + α2s2 + . . . + αn−1sn−1 + sn

cu α0, α1, . . . , αn−1 ∈ R.

CAPITOLUL 4: SINTEZA ELEMENTARA 235 Lege de Comanda, Alocabilitate, Stabilizabilitate


Pasul 1: Se aleg Fe ∈ Rm×n si g ∈ Rm aleator si se construiesc matricile

AFe := A + B Fe , b = Bg.

Pasul 2: Se aplica procedura de alocare (cu m = 1) perechii (AFe , b) si


polinomului χ(s) obtinandu-se reactia f ∈ Rm.

Pasul 3: Calculam reactia finala sub forma

F = Fe + gf T .

Propozitia 71 (Criteriul Hautus de Stabilizabilitate/Detectabilitate). •


Perechea (A, B), A ∈ Rn×n, B ∈ Rn×m este stabilizabila daca si numai daca
 
rank sI − A B = n, ∀s ∈ C+ ∪ C0. (143)

CAPITOLUL 4: SINTEZA ELEMENTARA 236 Lege de Comanda, Alocabilitate, Stabilizabilitate


• Perechea (C, A), C ∈ Rp×n, A ∈ Rn×n este detectabila daca si numai daca
 
sI − A
rank = n, ∀s ∈ C+ ∪ C0. (144)
C

Demonstraţie. Exercitiu ! Indicatie: Se foloseste teorema de descompunere


controlabila punandu-se in evidenta polii ficsi.

CAPITOLUL 4: SINTEZA ELEMENTARA 237 Lege de Comanda, Alocabilitate, Stabilizabilitate


3. Estimatori de Stare

Asa cum am vazut, legea de comanda cu reactie dupa stare poate asigura in
mod satisfacator cerintele fundamentale ale sintezei sistemelor de stabilizare si
alocare cu conditia ca starea sa fie disponibila pentru masura (sa fie accesibila
dpdv tehnic). Din pacate acest lucru nu este in general posibil si atunci ne punem
problema estimarii cat mai exacte a starii unui sistem dinamic prin constructia
unui nou sistem care sa citeasca marimile accesibile sau masurabile (intrarea u si
iesirea y) si care sa genereaze la iesire o estimare a starii x
b. Un astfel de sistem se
numeste estimator de stare (FIG).
Problema: Dandu–se un sistem


ẋ(t) = Ax(t) + Bu(t), x(0) = xo
(145)
y(t) = Cx(t) + Du(t),

CAPITOLUL 4: SINTEZA ELEMENTARA 238 Estimatori de Stare


dorim sa construim un nou sistem

ẇ(t) = Jw(t) + Hy(t) + M u(t),
(146)
b(t) = Kw(t) + N y(t) + P u(t)
x

(care are deci ca intrari intrarea u si iesirea y, are ca iesiri starea estimata x
b, si
marimea de stare w) care sa indeplineasca simultan urmatoarele doua conditii:

1. Sa fie intern asimptotic stabil, i.e., matricea de stare J sa satisfaca

Λ(J) ⊂ C−.

2. limt→∞(bx(t)−x(t)) = 0, i.e., iesirea x


b(t) (numita estimatia starii) sa aproximeze
asimptotic starea sistemului original x(t).

CAPITOLUL 4: SINTEZA ELEMENTARA 239 Estimatori de Stare


b(t), ∀t. Acest lucru nu este insa in general posibil
Observatii: a) Ideal ar fi x(t) = x
(explicati de ce !) si atunci aceasta cerinta se relaxeaza la cea asimptotica.
b) Cerinta de stabilitate interna este esentiala pentru constructia estimatorului
(explicati de ce!).

Pentru a solutiona problema punem in evidenta ”fidelitatea” cu care starea esti-


matorului (146) urmareste starea sistemului original, i.e. evaluam

w−Vx

unde V este o matrice ce ”adapteaza” dimensiunile eventual diferite ale lui x si w.


Folosind (145) si (146) avem succesiv

ẇ − V ẋ = Jw + Hy + M u − V Ax − V Bu,


(w − V x) = J(w − V x) + JV x + HCx + HDu − V Ax + (M − V B)u,

CAPITOLUL 4: SINTEZA ELEMENTARA 240 Estimatori de Stare



(w − V x) = J(w − V x) + (JV + HC − V A)x + (M − V B + HD)u. (147)
Calculam succesiv

b − x = Kw + N y + P u − x = K(w − V x) + KV x + N Cx + N Du − x + P u
x

b − x = K(w − V x) + (KV + N C − I)x + (P + N D)u


x (148)
Combinand (147) cu (148) obtinem
 ′
(w − V x) = J(w − V x) + (JV + HC − V A)x + (M − V B + HD)u,
b−x
x = K(w − V x) + (KV + N C − I)x + (P + N D)u.

Pentru ca starea estimatorului sa urmareasca asimptotic starea sistemului original


(conditia 2) trebuie ca iesirea sistemului dinamic de mai sus sa tinda asimptotic la
zero (indiferent de initializari si de semnalele de intrare x si u). Acest lucru este
posibil daca satisfacem simultan urmatoarele conditii:

CAPITOLUL 4: SINTEZA ELEMENTARA 241 Estimatori de Stare


a) J asimptotic stabila;
b) JV + HC − V A = 0;
c) M − V B + HD = 0;
d) KV + N C − I = 0;
e) P + N D = 0.
Daca aceste conditii sunt simultan satisfacute obtinem comportarea dinamica
 ′
(w − V x) = J(w − V x),
b−x
x = K(w − V x).

Obtinem deci

lim (w(t) − V x(t)) = 0, x(t) − x(t)) = 0


lim (b
t→∞ t→∞

indiferent de initializarea sistemului sau estimatorului !

Problema de constructie a estimatorului asimptotic stabil s–a redus la problema

CAPITOLUL 4: SINTEZA ELEMENTARA 242 Estimatori de Stare


algebrica de satisfacere simultana a conditiilor a) – e): avem 5 conditii (4 ecuatii
algebrice si o locatie de spectru) si 7 necunoscute.

Evident c) si e) se pot satisface automat alegand M := V B − HD si P := −N D.


Raman in continuare mai multe grade de libertate in satisfacerea restului de conditii

Λ(J) ⊂ C−,
JV + HC − V A = 0,
KV + N C − I = 0,

functie de care se deosebesc mai multe tipuri de estimatori.

CAPITOLUL 4: SINTEZA ELEMENTARA 243 Estimatori de Stare


4. Estimatori de Tip 1: N = 0

Conditia este echivalenta cu a a spune ca estimatorul nu are transfer direct I/O,


i.e., matricea sa “D” este zero. In acest caz obtinem

JV + HC − V A = 0,
KV = I

si putem alege K = I, V = I, ramand de satisfacut doar conditia

J = A − HC, Λ(J) ⊂ C−.

Aceasta conditie se poate satisface automat daca perechea (C, A) este detectabila,
caz in care alegem −H egal cu reactia care stabilizeaza (problema de stabilizare
pentru perechea (AT , C T )). Mai mult, daca perechea (C, A) este observabila,
atunci spectrul matricii de stare J a estimatorului poate fi alocat arbitrar.

CAPITOLUL 4: SINTEZA ELEMENTARA 244 Estimatori de Tip 1


In concluzie am obtinut pentru un estimator de tipul 1 urmatoarea constructie:

CAPITOLUL 4: SINTEZA ELEMENTARA 245 Estimatori de Tip 1


Pasul 1: Se foloseste procedura de alocare pentru perechea (AT , C T ) si se
determina o matrice Fe a.i. (AT ) + (C T )Fe sa aibe spectrul dorit (un anumit
spectru impus sau doar localizat in C− in functie de cerinta de proiectare).
Pasul 2: Se calculeaza estimatorul cu parametrii

H = −Fe T , J = A − HC, K = V = I, M = B − HD, P = 0,

rezultand

ẇ(t) = (A − HC)w(t) + Bu(t) − HDu(t) + Hy(t),
(149)
b(t) = w(t),
x

sau, sub forma echivalenta,

ḃ = Ab
x b + Du − y)
x + Bu + L(C x (150)

in care este cunoscut sub numele de estimator Luenberger (am notat L := −H).

CAPITOLUL 4: SINTEZA ELEMENTARA 246 Estimatori de Tip 1


Observatii: a) Pentru a construi un estimator Luenberger avem nevoie doar sa
specificam spectrul estimatorului Λ0 si sa construim reactia L care aloca respectivii
poli pentru estimator Λ(A + LC) = Λ0. Pentru ca estimatorul sa rezulte cu
coeficienti reali, spectrul se alege intotdeauna simetric.
b) Daca perechea (C, A) este observabila atunci spectrul matricii de stare a
estimatorului poate fi alocat arbitrar si deci este posibil ca estimatorul sa furnizeze
o estimatie cat de precisa a starii intr-un timp oricat de scurt !
c) Din (150) observam ca estimatorul “copiaza” dinamica sistemului original +
termen proportional cu “inovatia” C x b + Du − y care de fapt masoara “calitatea”
estimarii ! Pentru o estimare perfecta avem x b(t) = x(t) si deci inovatia este zero
deoarece
Cxb + Du − y = C x b − Cx = 0.
d) Daca facem o transformare de similaritate asupra sistemului original estimatorul
Luenberger se modifica corespunzator (Ex: aratati cum ! )
e) Pentru a construi estimatorul Luenberger singura conditie pe care am impus-o
sistemului intitial este cea de detectabilitate (sau respectiv de observabilitate)
asupra perechii (C, A). Conditia este nu numai suficienta pentru constructia unui

CAPITOLUL 4: SINTEZA ELEMENTARA 247 Estimatori de Tip 1


estimator Luenberger ci si necesara asa cum vom vedea in continuare. Mai mult,
conditia este necesara pentru existenta unui estimator general de tipul (146).
f) Estimatorul de tipul 1 (Luenberger) are dimensiunea n si de aceea se mai
numeste de ordin integ. Asa cum vom vedea, in anumite situatii se pot construi
estimatori de ordin mai mic.
Teorema 72. Fie sistemul (A, B, C, D) descris de (145). Atunci exista un esti-
mator (146) daca si numai daca perechea (C, A) este detectabila. Daca (C, A)
este detectabila atunci un estimator (de tip 1 sau Luenberger) este dat de ecu-
atille 
ẇ = (A + LC)w + Bu + LDu − Ly,
(151)
xb(t) = w(t)
unde L este orice matrice a.i. Λ(A + LC) ⊂ C−.

Demonstraţie. Partea de suficienta am aratat-o deja. Demonstram necesitatea


prin reducere la absurd. Presupunem ca perechea (C, A) nu este detectabila si
fara a restrange generalitatea presupunem deasemenea ca perechea (C, A) este in

CAPITOLUL 4: SINTEZA ELEMENTARA 248 Estimatori de Tip 1


forma de descompunere observabila
 
A1 A3  
A= , C= O C2
O A2

unde Λ(A1) 6⊂ C− (aceasta rezulta automat din testul PBH aplicat perechii
nedetectabile (C, A)). Fie s+ 6∈ C− o valoare proprie si x+ un vector propriu
corespunzator ale lui A1. Luam starea initiala x0 a sistemului (A, B, C, D) de
forma  
x+
xo = .
O
Evident xo apartine subspatiului neobservabil al perechii (C, A), i.e., x0 ∈ N (C, A).
Deasemenea luam w(0) = 0 si u(t) ≡ 0. Atunci ecuatiile pentru x si estimatorul
(146) sunt
ẋ = Ax,
ẇ = Jw + HCx,
b = Kw + N Cx.
x

CAPITOLUL 4: SINTEZA ELEMENTARA 249 Estimatori de Tip 1


Deoarece x0 ∈ N (C, A) rezulta ca iesirea sistemului (A, B, C, D) este identic nula

y(t) = Cx(t) = CeAtx0 = 0, ∀t ≥ 0,

si deasemenea
w(t) = 0, b(t) = 0,
x ∀t.
Pe de–alta parte, avem

x(t) = eAtx0 = es+tx0 6→ 0

b(t) − x(t) 6→ 0 pentru comanda u ≡ 0, starea initiala a estimatorului


si deci x
w(0) = 0 si x0 aleasa ca mai sus ceea ce contrazice ipoteza ca (146) este un
estimator pentru sistemul (A, B, C, D).

Observatii: a) Dimensiunea unui estimator de tip Luenberger (de tip 1) este egala
cu n (dimensiunea spatiului starilor sistemului orginal (A, B, C, D)). Asa cum vom
vedea mai tarziu, in anumite situatii se pot construi estimatoare de dimensiune mai

CAPITOLUL 4: SINTEZA ELEMENTARA 250 Estimatori de Tip 1


mica si se poate formula problema de constructie a unui estimator de dimensiune
minimala (legata de teoria estimatoarelor de tipul 2).
b) Am vazut ca un sistem poate fi stabilizat/alocat cu o reactie constanta dupa
stare. Deoarece starea nu este in general cunoscuta am construit mai sus un sistem
(numit estimator) care estimeaza asimptotic starea sistemului pe baza informatiilor
furnizate de semnalele de intrare u si de iesire y. Intrebarea naturala este daca
putem stabiliza/aloca sistemul original prin implementarea reactiei constante dupa
starea estimata x
b (in locul starii reale x care nu este accesibila) ? Raspunsul este
pozitiv obtinandu-se compensatorul Kalman.

CAPITOLUL 4: SINTEZA ELEMENTARA 251 Estimatori de Tip 1


5. Compensatorul Kalman

Fie (A, B, C, D) un sistem dinamic si presupunem pentru problema de stabilizare


cu reactie dinamica dupa iesire ca (A, B) este stabilizabila si (C, A) este detectabila
iar pentru problema cu alocare dinamica dupa iesire ca (A, B) este controlabila si
(C, A) este observabila.
Consideram un compensator cu reactie constanta F dupa starea estimata de catre
un estimator Luenberger descris de ecuatiile (151). Obtinem atunci ecuatiile
dinamice ale compensatorului – numit compensator Kalman –

x + Bu + LDu − Ly,
ḃ = (A + LC)b
x
(152)
u = Fx b,

sau inca 
x − Ly,
ḃ = (A + LC + BF + LDF )b
x
(153)
u = Fx b,

CAPITOLUL 4: SINTEZA ELEMENTARA 252 Compensatorul Kalman


avand matricea de transfer
   
AK BK A + LC + BF + LDF −L
K(s) := = , u = Ky.
CK DK F O

Matricile F si L se aleg a.i. A + BF si A + LC sa fie asimptotic stabile (si


eventual cu spectru impus).

Conectand compensatorul Kalman in reactie inversa cu sistemul original obtinem


pentru matricea de stare a sistemului rezultant in bucla inchisa
 
A BF
AR = .
−LC A + BF + LC

Aplicand transformarea de similaritate


 
I O
T :=
−I I

CAPITOLUL 4: SINTEZA ELEMENTARA 253 Compensatorul Kalman


asupra lui AR obtinem
 
A + BF BF
T ART −1 =
O A + LC

ceea ce arata ca dinamica (polii) sistemului in bucla inchisa satisfac

Λ(AR) = Λ(A + BF ) ∪ Λ(A + LC)

si deci sistemul in bucla inchisa este intern asimptotic stabil (si eventual are
dinamica prescrisa).

Observatii: a) Polii sistemului in bucla inchisa sunt dati de reuniunea polilor alocati
ai lui A + BF prin reactia dupa stare F cu polii alocati de estimator Λ(A + LC)
prin reactia L. Cele doua alocari se pot face independent, punandu-se astfel in
evidenta celebrul principiu al separatiei.
b) Un sistem este stabilizabil/alocabil prin reactie (dinamica) dupa iesire daca

CAPITOLUL 4: SINTEZA ELEMENTARA 254 Compensatorul Kalman


perechea (A, B) este stabilizabila/controlabila si perechea (C, A) este de-
tectabila/observabila. Aceste conditii sunt nu numai suficiente ci si necesare
asa cum reiese din urmatoarea teorema.
Teorema 73. Un sistem (A, B, C, D) este stabilizabil/alocabil prin reac-
tie dinamica dupa iesire daca si numai daca perechea (A, B) este stabiliz-
abila/controlabila si perechea (C, A) este detectabila/observabila.

Demonstraţie. Suficienta a fost demonstrata constructiv mai sus. Ramane sa


aratam necesitatea (Exercitiu !). Indicatie: Pp prin reducere la absurd ca nu
este adevarat si puneti in evidenta printr-o descompunere controlabila/observabila
anumiti poli ficsi ai sistemului rezultant (ce nu pot fi modificati indiferent de
reactia dupa stare.

CAPITOLUL 4: SINTEZA ELEMENTARA 255 Compensatorul Kalman


6. Estimatori de Stare de Ordin Redus (Tip 2)

Fie un sistem (A, B, C, D) cu m intrari, p iesiri si ordinul n (dimensiunea spatiului


starilor). Daca dorim estimarea starii acestui sistem nu este nevoie sa construim un
estimator care sa estimeze direct toate cele n stari intrucat o parte dintre acestea
rezulta automat pe baza iesirilor. Intr–adevar, sa presupunem ca C are rangul egal
cu numarul de iesiri p. Atunci cunoscand iesirea y(t) si estimand numai n − p stari
rezulta ca celelate p stari se pot calcula din ecuatiile corespunzatoare ale iesirii.
Un astfel de estimator de ordin redus se numeste estimator de tipul 2.

Pentru constructia estimatorului de tipul 2 facem ipotezele:


i) Matricea C este epica, i.e., rank C = p;
ii) Matricea C are forma  
C = O Ip . (154)
Observatii: a) Ipoteza i) nu constituie o restrictie majora intrucat o putem asigura
in etapa de modelare printr-o alegere judicioasa a iesirilor sistemului. In cazul in

CAPITOLUL 4: SINTEZA ELEMENTARA 256 Estimatori de Ordin Redus


care prin modelare nu s-a asigurat indeplinirea ei se poate face o schimbare de
variabile in spatiul marimilor de iesire punandu–se in evidenta anumite iesiri identic
zero sau redundante ce pot fi eliminate ramanand o matrice C ce satisface ipoteza.
b) Ipoteza ii) se poate asigura printr–o simpla transformare de coordonate in
spatiul starilor (presupunand evident ipoteza i) adevarata) !
c) Rationand prin dualitate, in anumite
  circumstante matricea intrarilor B se poate
Im
presupune monica si de forma .
O
d) Ipotezele i) si ii) implica ca

 
  x1
y = Cx + Du = O Ip + Du = x2 + Du
x2

deci starile x2 – in numar de p – sunt automat cunoscute (prin cunoasterea


intrarilor si iesirilor) si raman de estimat starile x1 – in numar de n − p.

Asa cum am vazut, pentru constructia unui estimator general (146) trebuie sa

CAPITOLUL 4: SINTEZA ELEMENTARA 257 Estimatori de Ordin Redus


satisfacem relatiile
Λ(J) ⊂ C−,
JV + HC − V A = 0,
KV + N C − I = 0,
(celelalte relatii fiind automat satisfacute prin alegerea lui P si M ). Pentru a
explicita aceste relatii, partitionam matricile A, B, V , K, N conform cu C in
(154),
       
A1 A3 B1   K1 N1
A= ,B = ,V = V1 V2 ,K = ,N =
A2 A4 B2 K2 N2

si obtinem
V1A1 + V2A2 = JV1, V1 A3 + V2A4 = JV2 + H,

K1V1 = I, K1V2 + N1 = 0,
K2V1 = 0, K2V2 + N2 = I.
Alegem K1 := V1 := I si rezulta automat K2 = 0, N2 = I, N1 = −V2 ceea ce

CAPITOLUL 4: SINTEZA ELEMENTARA 258 Estimatori de Ordin Redus


determina complet matricile K si N , ramanand de satisfacut doar conditiile

A1 + V2A2 = J, Λ(J) ⊂ C−, H = A3 + V2A4 − (A1 + V2 A2)V2 . (155)

Daca perechea (A1, A2) este detectabila (observabila) atunci putem alege automat
V2 := L unde L este reactia care aloca Λ(A1 + LA2) ⊂ C− iar H se defineste pe
baza ultimei ecuatii din (155).
Ramane sa aratam ca perechea (A1, A2) este detectabila daca sunt indeplinite
conditiile de existenta ale unui estimator general, i.e. perechea (C, A) este
detectabila. Formulam acest rezultat sub forma unei propozitii de sine statatoare.
Teorema 74. Fie un sistem (A, B, C, D) avand matricea C epica.
i) Exista o transformare de coordonate a.i.
 
A1 A3 }n − p
T AT −1 =
A2 A4 }p
,
|{z} |{z}
n−p p

CAPITOLUL 4: SINTEZA ELEMENTARA 259 Estimatori de Ordin Redus


 
B1 }n − p −1
 
TB = , CT = O Ip , (156)
B2 }p
|{z} |{z}
n−p p
ii) Perechea (A2, A1) este detectabila (observabila) daca si numai daca perechea
(C, A) este detectabila (observabila).

Demonstraţie. i) Intrucat C este epica de dimensiune p × n, exista o matrice C


de dimensiune (n − p) × n a. i. matricea
 
C
T :=
C

sa fie inversabila. Avem evident


   
C In−p O
T −1 =
C O Ip

CAPITOLUL 4: SINTEZA ELEMENTARA 260 Estimatori de Ordin Redus


de unde concluzionam ca CT −1 are forma din (156).
ii) Avem succesiv

 
    sI − A1 −A3
sI − A T (sI − A)T −1
rank = rank = rank  −A2 sI − A4 
C CT −1
O Ip

 
sI − A1
= p + rank , ∀s ∈ C
A2
de unde concluzia rezulta direct din criteriul Hautus de detectabilitate (observabil-
itate).

In concluzie am obtinut pentru un estimator de tipul 2 urmatoarea constructie:


Pasul 0: Dandu-se sistemul (A, B, C, D) cu perechea (C, A) detectabila (observ-
abila) si matricea C epica, se gaseste cf. Teoremei 74 o transformare de similaritate

CAPITOLUL 4: SINTEZA ELEMENTARA 261 Estimatori de Ordin Redus


T a.i. in noul sistem de coordonate sa avem (refolosind notatiile)
 
A1 A3 }n − p
A=
A2 A4 }p
, (157)
|{z} |{z}
n−p p
 
B1 }n − p  
B= , C= O Ip ,
B2 }p
|{z} |{z}
n−p p
in care perechea (A2, A1) este detectabila (observabila).
Pasul 1: Se foloseste procedura de alocare pentru perechea (A2, A1) si se determina
o matrice V2 a.i. A1 + V2A2 sa aibe spectrul dorit (un anumit spectru impus sau
doar localizat in C− in functie de cerinta de proiectare).
Pasul 2: Se calculeaza estimatorul cu parametrii

J = A1 + V2A2, H = A3 + V2A4 − A1V2 − V2A2V2, M = B1 + V2B2 − HD,

CAPITOLUL 4: SINTEZA ELEMENTARA 262 Estimatori de Ordin Redus


     
In−p −V2   V2 D
K= , N= , V = In−p V2 , P =
O Ip −D
rezultand

   = 
ẇ(t) (A1 + V2A2)w(t) + Hy(t) + (B1 + V2B2 −  HD)u(t),
b1 (t)
x In−p −V2 V2D
 x b(t) = = w(t) + y(t) + u(t).
b2 (t)
x O Ip −D
(158)
Pasul 3: Se “reverseaza” corespunzator transformarea de similaritate asupra
estimatorului, obtinandu-se in final un estimator de tip 2 pentru sistemul original.
Observatii: a) Estimatorul de tip 2 obtinut are ordinul egal cu n − p (dimensiunea
spatiului starii w(t)).
b) Ecuatia iesirii pentru estimatorul de tip 2 (158) contine o parte de dimensiune
n − p ce este estimata prin intermediul dinamicii w(t) de forma

b1(t) = w(t) − V2y(t) + V2Du(t)


x

CAPITOLUL 4: SINTEZA ELEMENTARA 263 Estimatori de Ordin Redus


si o parte ce este deja cunoscuta de dimensiune p (nu se estimeaza prin intermediul
dinamicii) de forma
b2(t) = y(t) − Du(t).
x

De obicei in ecuatiile dinamice ale estimatorului de tip 2 se pastreaza numai prima


x1(t)).
parte (b
c) Din cele de mai sus rezulta ca in ipoteza (C, A) detectabila si C epica
putem intotdeauna construi un estimator de ordin n − p (dimensiunea matricii
J). Problema naturala care se pune este daca pe baza acestui estimator putem
construi in continuare un compensator care stabilizeaza intern – exact cum am
facut in cazul estimatorului de tip 1 obtinand compensatorul Kalman.

Interpretarea Estimatorului de Tip 2 (Ordin Redus)

Estimatorul de tip 2 poate fi obtinut si prin scrierea directa a unui estimator de


tip 1 pentru partea starii ce trebuie efectiv estimata. Intr–adevar, cu notatiile deja
introduse avem ca sistemul original este descris de ecuatiile (pentru simplificarea

CAPITOLUL 4: SINTEZA ELEMENTARA 264 Estimatori de Ordin Redus


calculelor facem ipoteza D = 0)

ẋ1 = A1x1 + A3x2 + B1u,


ẋ2 = A2x1 + A4x2 + B2u, (159)
y = x2

si inlocuind ultima ecuatie in precedentele doua avem

ẋ1 = A1x1 + A3y + B1u,


ẋ2 = ẏ = A2x1 + A4y + B2u,

sau inca
ẋ1 = A1x1 + A3y + B1u,
(160)
ẏ − A4y − B2u = A2x1,
care este un sistem cu dinamica x1 ce se doreste estimata si intrarile u si y.

CAPITOLUL 4: SINTEZA ELEMENTARA 265 Estimatori de Ordin Redus


Reamintim ca un estimator de tip 1 se poate pune sub forma

ḃ = Ab
x x +Bu+L(C x b +Du−y) = Ab x +Bu+LדEROAREA DE ESTIMARE”.
(161)
Scriind un astfel de estimator pentru sistemul (160) obtinem

b˙1 = A1xb1 + A3y + B1u + L(A2x


x b1 − ẏ + A4y + B2u). (162)

b1 = w − Ly si notam V2 := L.
Eliminam ẏ facand schimbarea de variabile x
Obtinem echivalent

ẇ − V2ẏ = A1(w − V y) + A3 y + B1u + V2(A2(w − V2 y) − ẏ + A4y + B2u) (163)

sau inca

ẇ = (A1 + V2 A2)w + (−A1V2 + A3 − V2A2V2 + V2A4)y + (B1 + V2B2)u. (164)

CAPITOLUL 4: SINTEZA ELEMENTARA 266 Estimatori de Ordin Redus


Din ultima ecuatie din (159) obtinem
     
b1
x In−p −V2
= w+ y. (165)
b2
x O Ip

Comparand ecuatille (164), (165) cu ecuatille (158) observam ca acestea coincid


in ipoteza facuta D = 0. In consecinta am reobtinut expresia estimatorului de tip
2 scriind un estimator de tip 1 pentru susbsisemul cu dinamica ce trebuie efectiv
estimata x1 !
Exercitiu: Aratati acelasi lucru fara a face ipoteza D = 0 !

Stabilizarea cu Estimatoare Generale

Am vazut ca daca folosim o schema de compensare cu reactie constanta F dupa


starea estimata printr-un estimator de tip 1 se obtine un compensator Kalman
care stabilizeaza intern sistemul si eventual aloca o dinamica dorita. Aratam in
continuare ca o schema similara in care insa estimarea se face cu un estimator
general se poate deasemenea folosi pentru stabilizare/alocare.

CAPITOLUL 4: SINTEZA ELEMENTARA 267 Estimatori de Ordin Redus


In particular, in cazul in care estimarea se face cu un estimator de ordin redus (de
tipul 2) sistemul rezultant va avea dimensiunea spatiului starilor de dimensiune
redusa (< 2n).

Fie un sistem 
ẋ = Ax + Bu,
(166)
y = Cx + Du,
si un estimator general descris de ecuatiile

ẇ = Jw + Hy + M u,
(167)
b = Kw + N y + P u,
x

ce satisface automat conditiile:


a) J asimptotic stabila;
b) JV + HC − V A = 0;
c) M − V B + HD = 0;
d) KV + N C − I = 0;

CAPITOLUL 4: SINTEZA ELEMENTARA 268 Estimatori de Ordin Redus


e) P + N D = 0.

Consideram o schema de compensare cu reactie constanta F dupa starea estimata


b, i.e.,
x
u = Fx
b. (168)
Studiem comportarea dinamica in bucla inchisa a sistemului descris de (166), (167)
si (168). Evaluam intai

N y + P u = N Cx + N Du − N Du = N Cx, (169)

unde am folosit proprietatea e). Avem succesiv

ẋ = Ax + Bu = Ax + BF x
b = Ax + BF (Kw + N y + P u)
(170)
= Ax + BF Kw + BF N Cx = (A + BF N C)x + BF Kw

CAPITOLUL 4: SINTEZA ELEMENTARA 269 Estimatori de Ordin Redus


in care am folosit (169). Pentru dinamica w obtinem

ẇ = Jw + Hy + M u = Jw + HCx + HDu + M F (Kw + N Cx)


(171)
= (HC + M F N C)x + (J + M F K)w + HDu

in care am folosit succesiv (168) si (169). Evaluam separat

HDu = HDF x
b = HDF (Kw + N Cx) = HDF N Cx + HDF Kw

pe care il inlocuim in (171) obtinand

ẇ = (HC + M F N C + HDF N C)x + (J + M F K + HDF K)w. (172)

Din (170) si (172) avem ca dinamica sistemului rezultant este data de


 ˙    
x A + BF N C BF K x
=
w HC + (M + HD)F N C J + (M + HD)F K w

CAPITOLUL 4: SINTEZA ELEMENTARA 270 Estimatori de Ordin Redus


si deci matricea de stare a sistemului rezultant este
 
A + BF N C BF K
AR =
HC + V BF N C J + V BF K

in care am folosit proprietatea c). Pentru a pune in evidenta spectrul acestei


matrici facem o transformare de coordonate
 
I O
T =
−V I

si obtinem
   
A + BF N C + BF KV BF K A + BF BF K
T ART −1 = = ,
−V A + HC + JV J O J

unde pentru ultima egalitate am folosit proprietatile d) si b). Din relatia de mai
sus concluzionam ca
Λ(AR) = Λ(A + BF ) ∪ Λ(J)

CAPITOLUL 4: SINTEZA ELEMENTARA 271 Estimatori de Ordin Redus


si deci Λ(AR) ⊂ C− daca alegem F a.i. Λ(A + BF ) ⊂ C−.
Observatii: a) Daca (A, B) controlabila atunci putem aloca orice spectru pentru
A + BF si daca (C, A) observabila atunci putem aloca orice spectru pentru
estimator Λ(J) rezultand ca putem aloca orice dinamica pentru sistemul rezultant
in bucla inchisa.
b) Ordinul sistemului rezultant este n + ne unde ne este ordinul estimatorului.

CAPITOLUL 4: SINTEZA ELEMENTARA 272 Estimatori de Ordin Redus


7. Reglarea Sistemelor Dinamice

Problematica, Ipoteze
In aceasta sectiune abordam problema reglarii sistemelor dinamice. Problema
clasica de reglare intern stabila consta in gasirea unui regulator care sa realizeze
simultan urmatoarele deziderate asupra sistemului rezultant in bucla inchisa:

(S) Sa fie intern asimptotic stabil;

(Re) Sa urmareasca (macar) asimptotic anumite semnale (sau clase de semnale)


prescrise numite referinte r;

(Rj) Sa rejecteze (macar) asimptotic anumite perturbatii d sau zgomote w; (FIG).

Solutia generala a problemei de reglare intern stabila are o serie de inconveniente


majore:

CAPITOLUL 4: SINTEZA ELEMENTARA 273 Reglarea Sistemelor Dinamice


(i) Este foarte complicata;

(ii) Este bazata pe geometria interna a sistemului original si pe o serie de descom-


puneri structurale sofisticate in spatiul starilor;

(iii) Conditiile de solvabilitate sunt in general greu de verificat dpdv procedural;

(iv) Solutia generala este complet nerobusta in raport cu perturbatiile paramet-


rice sau structurale ale modelului (A, B, C, D) limitand major aplicabilitatea
metodelor la cazul sistemelor cu dimensiuni medii sau relativ mari.

In continuare vom prezenta solutia in anumite cazuri particulare insa de mare


interes practic in care neajunsurile de mai sus sunt partial eliminate prin ipotezele
facute. Ne restrangem la prezentarea unei solutii in caz particular deoarece:

• Efortul de a prezenta/intelege solutia completa (in intreaga ei complexitate) nu


se justifica in general in raport cu clasa aplicatiilor concrete ”real–life”;

CAPITOLUL 4: SINTEZA ELEMENTARA 274 Reglarea Sistemelor Dinamice


• Solutia generala este nerobusta;

• Exista abordari alternative bazate pe teoria sistemelor robuste ce furnizeaza


solutii mult mai fezabile;

Ipotezele pe care le facem sunt:

(I1) d = 0 (nu apar perturbatii);

(I2) w = 0 (nu apar zgomote);

(I3) D = 0 (ipoteza facuta ptr. simplificarea calculelor);

(I4) r(t) = 1(t) (referintele sunt semnale de tip treapta).

Conditiile de reglare asimpotic stabila

CAPITOLUL 4: SINTEZA ELEMENTARA 275 Reglarea Sistemelor Dinamice


Incepem prin a explicita conditiile pe care trebuie sa le indeplineasca sistemul in
bucla inchisa pentru a realiza dezideratele (S) si (Re) sub ipotezele (I1)-(I3). In
final, vom introduce principiul modelului intern pentru sistemele descrise pe spatiul
starilor si vom particulariza constructia efectiva a unui regulator in ipoteza (I4) –
care realizeaza urmarirea asimptotica a unor referinte de tip treapta –.

PROBLEMA: Dandu–se sistemul dinamic

ẋ = Ax + Bu
(173)
y = Cx

avand m intrari, p iesiri si dimensiunea spatiului starilor n, si vectorul de semnale


de referinta r(t) ∈ Rp, se cere un sistem dinamic (regulator)

ẋK = AK xK + BK ǫ
(174)
u = CK xK + DK ǫ,

in care ǫ = r − y, astfel incat sa aibe loc:

CAPITOLUL 4: SINTEZA ELEMENTARA 276 Reglarea Sistemelor Dinamice


(S) Sistemul in bucla inchisa sa fie intern asimptotic stabil;

(Re) Iesirile y sa urmareasca asimptotic referintele r(t), i.e.,

lim ǫ(t) = 0.
t→∞

Clasa semnalelor referinta se considera de tip persistent generate de un generator


liniar de semnal (de tipul celor introduse la studiul regimului permanent/tranzitoriu)

ẋr = Ar xr xr (0) = xro, Λ(Ar ) ⊂ C− ∪ C0


(175)
r = Cr xr .

Referintele vor avea atunci expresia

r(t) = Cr eAr txro.

CAPITOLUL 4: SINTEZA ELEMENTARA 277 Reglarea Sistemelor Dinamice


Eliminand succesiv semnalele din bucla si tinand cont ca ǫ = r − y = r − Cx
obtinem
ẋK = AK xK + BK r − BK Cx
(176)
u = CK xK + DK r − DK Cx.
Inlocuind ultima ecuatie in ẋ = Ax + Bu obtinem succesiv

ẋ = Ax + B(CK xK + DK r − DK Cx) = (A − BDK C)x + BCK xK + BDK r

si deci pentru sistemul in bucla inchisa obtinem ecuatiile dinamice

 ˙      
x A − BDK C BCK x BDK
= + r
xK −BK C  AK xK BK
  x
ǫ = −C O + Ip r (177)
 xK 
  x
y = C O
xK

CAPITOLUL 4: SINTEZA ELEMENTARA 278 Reglarea Sistemelor Dinamice


sau
ẋR = AR xR + BRr
(178)
ǫ = CR xR + DRr,

unde

   
A − BDK C BCK BDK  
AR = , BR = , CR = −C O , D R = Ip , xR
−BK C AK BK
(179)
Conditia (S) de stabilitate interna devine atunci

Λ(AR) ⊂ C−

si explicitam in continuare conditia de reglare (Re). Combinand ecuatiile sistemului


in bucla inchisa (178) cu cele ale generatorului de semnale de referinta (175)

CAPITOLUL 4: SINTEZA ELEMENTARA 279 Reglarea Sistemelor Dinamice


obtinem
 ˙    
xR AR BRCr xR
= , xR (0) = xRo, xr (0) = xro,
xr O Ar  x
r (180)
  xR
ǫ = CR Cr
xr

sau
ẋRr = ARr xRr , xRr (0) = xRro,
(181)
ǫ = CRr xRr
unde am folosit notatiile
     
AR BRCr   xR xRo
ARr = , CRr = CR Cr , xRr = , xRro =
O Ar xr xro
(182)
Conditia de reglare (Re)

lim ǫ(t) = 0, ∀ xRro


t→∞

CAPITOLUL 4: SINTEZA ELEMENTARA 280 Reglarea Sistemelor Dinamice


devine atunci

lim CRr eARr txRro = 0, ∀ xRro. (183)


t→∞

Observatie fundamentala: Aceasta cerinta nu poate fi realizata prin impunerea


conditiei ca matricea de stare ARr sa fie intern asimptotic stabila deoarece ARr
contine valori proprii care sunt sigur in C+ ∪ C0 (semnalul r a fost presupus
persistent)! Singura posibilitate pentru a satisface conditia de (Re) ramane
sa impunem ca dinamica care nu este stabila sa fie neobservabila in raport cu
perechea (CRr , ARr ) si acest lucru sa-l satisfacem prin alegerea judicioasa a
parametrilor regulatorului ce se regasesc implicit in parametrii sistemului rezultant
(AR , BR, CR, DR) ! In consecinta conditia de reglare implica satisfacerea anumitor
proprietati structurale relativ sofisticate in spatiul starilor sistemului rezultant !

Pentru a satisface conditia (Re) trebuie sa impunem deci conditia ca subspatiul


invariant asociat dinamicii Ar sa fie neobservabil in perechea (CRr , ARr ) explicitata
in (182). O baza pentru subspatiul invariant corespunzator lui Ar – notat V+ are

CAPITOLUL 4: SINTEZA ELEMENTARA 281 Reglarea Sistemelor Dinamice


evident expresia  
V
V+ =
I nr
unde V este o matrice ce se determina din conditia ca V+ sa fie neobservabil.
Facand o completare pana la o transformare inversabila obtinem
 
I nR V
S=
O I nr

de unde
 
−1 AR ARV + BRCr − V Ar  
S ARr S = , CRr S = CR CRV + Cr
O CR V + Cr

iar in noul sistem de coordonate avem


 
O
V+ = .
I nr

CAPITOLUL 4: SINTEZA ELEMENTARA 282 Reglarea Sistemelor Dinamice


Din conditia ca V+ este ARr invariant si inclus in Ker CRr se obtin conditiile

AR V + BRCr − V Ar = 0, CR V + Cr = 0. (184)

Deci existenta unei matrici V care satisface relatiile (184) este echivalenta cu
satisfacerea cerintei de reglare (Re) explicitata sub forma (183).
Observatie: Prima conditie (184) este o ecuatie Sylvester ce are intotdeauna o
solutie unica deoarece Λ(AR) ⊂ C− si Λ(Ar ) ⊂ C+ ∪ C0 (Explicati acest lucru
pe baza conditiilor generale de existenta/unicitate a solutiilor ecuatiilor Sylvester –
vezi Appendix).
In concluzie am redus problema originala de reglare intern asimptotic stabila la
gasirea unui sistem (AK , BK , CK , DK ) a.i. :

(S) Λ(AR) ⊂ C−;

(Re) Solutia unica V a ecuatiei Sylvester AR V + BRCr − V Ar = 0 sa satisfaca


CRV + Cr = 0.

CAPITOLUL 4: SINTEZA ELEMENTARA 283 Reglarea Sistemelor Dinamice


Observatie: Tinand cont de expresiile explicite ale matricilor sistemului in bucla
inchisa (AR , BR, CR, DR) ca functii de parametrii regulatorului (AK , BK , CK , DK )
(vezi (179)) este clar ca aceste conditii algebrice nu sunt deloc triviale sau usor de
explicitat intr-o forma procedurala. De aceea ne vom limita la prezentarea cazului
reprezentativ al referintelor de tip treapta.

Reglarea la Referinte Treapta

Fie sistemul (A, B, C, D = 0) avand matricea de transfer T (s) si y = T u. Facem


ipotezele ca (A, B) este stabilizabila si (C, A) este detectabila, conditii ce sunt
necesare si suficiente pentru existenta unui compensator stabilizator.

Considerand o schema clasica de reglare cu regulatorul K(s) montat pe calea


directa intre eroare ǫ := r − y si comanda u, i.e., u = Kǫ.

Conform principiului modelului intern, pentru a regla la referinte de tip treapta


trebuie ca modelul referintei M (s) sa fie inclus in matricea de transfer in bucla
deschisa, in cazul nostru L(s) := T (s)K(s). Mai exact, cum T (s) este dat,

CAPITOLUL 4: SINTEZA ELEMENTARA 284 Reglarea Sistemelor Dinamice


impunem ca modelul referintei sa fie inclus in

e
K(s) = K(s)M (s) (185)

unde M (s) este matricea de transfer a modelului referintei. Aceasta conditie


asigura automat cerinta de reglare (Re). Daca consideram reglarea la referinta
treapta atunci
1
M (s) = Ip.
s
Pentru a asigura cerinta (S) trebuie ca regulatorul K(s) sa stabilizeze intern T (s)
e
sau, echivalent, ca K(s) sa stabilizeze intern Te(s) = M (s)T (s) (FIG) – K(s)
are o parte fixata R(s) pe care o includem in Te(s) –. In consecinta proiectam
e
un compensator stabilizator K(s) pentru Te(s) dupa care regulatorul dorit se
calculeaza din (185).

Explicitam in continuare aceste conditii in termenii ecuatiilor dinamice de stare.

CAPITOLUL 4: SINTEZA ELEMENTARA 285 Reglarea Sistemelor Dinamice


Fie
ẋM = AM xM + BM ǫ
(186)
ye = CM xM + DM ǫ
sau inca
ẋM = AM xM + BM (r − Cx)
(187)
ye = CM xM + DM (r − Cx)
ecuatiile ce descriu dinamica modelului referintei si

ẋ = Ax + Bu,
y = Cx,

ecuatiile ce descriu sistemul. O realizare de stare pentru sistemul Te cu ye = Teu se


obtine automat inseriind T (s) cu M (s) (semnalul exogen r = 0)

" #  
e B
A e A O B
Te = =  −BM C AM O . (188)
e D
C e
O CM O

CAPITOLUL 4: SINTEZA ELEMENTARA 286 Reglarea Sistemelor Dinamice


Deci problema s-a redus la constructia unui compensator pentru Te dat de (188).

In cazul particular in care dorim reglarea la referinte de tip treapta avem AM = 0,


BM = Ip, CM = Ip, DM = 0 si (188) devine

" #  
e B
A e A O B
Te = =  −C O O . (189)
e D
C e
O Ip O

Pentru scrierea unui compensator stabilizator pentru Te putem aplica schema


standard de scriere a unui compensator Kalman (sau orice schema de stabilizare
e este
cu estimator de stare si reactie dupa starea estimata). Intrucat matricea C
epica preferam sa scriem un estimator de ordin redus si sa luam o reactie dupa
starea estimata obtinand in final un sistem compensator de ordin mai mic decat
Te(s) (si de acelasi ordin cu T (s)).

Pentru scrierea unui estimator de ordin redus folosim direct formulele (158)

CAPITOLUL 4: SINTEZA ELEMENTARA 287 Reglarea Sistemelor Dinamice


observand in prealabil ca realizarea (189) este in forma (157) si facand identificarile

       
A O A1 A3 B B1  
e=
A = e=
,B = e=
,C O Ip .
−C O A2 A4 O B2

Conditia necesara si suficienta pentru existenta unui estimator este ca perechea


(A2, A1) = (−C, A) sa fie detectabila ceea ce este automat asigurat in ipotezele de
e = −L a.i. Λ(A + LC) = Λ(A − LC)
lucru ((C, A) este detectabila). Fie L e ⊂ C−.
Obtinem pentru ecuatiile estimatorului de ordin redus


   = 
ẇ (A + LC)w
 + (A + LC)Ley + Bu,
b1
x In−p L (190)
b=
 x = w+ ye.
b2
x O Ip

Un compensator stabilizator se obtine atunci luand o reactie stabilizanta dupa

CAPITOLUL 4: SINTEZA ELEMENTARA 288 Reglarea Sistemelor Dinamice


starea estimata de forma
h i x
b1

u= F Fe y ) + Feye.
= F (w + Le (191)
b2
x

O astfel de reactie stabilizanta exista daca si numai daca perechea (A, e B)


e este
stabilizabila. Acest lucru nu este insa automat indeplinit decat daca facem ipoteza
ca modelul referintei (polii s = 0) nu este simplificat de modelul sistemului T (s) !
(Ex: faceti conexiunea cu sistemele SISO – trebuie ca diag { 1s } sa apara in fctia de
transfer in bucla deschisa si deci nu trebuie sa se simplifice in produsul L = T K
–. O conditie suficienta ca sa nu apara aceasta simplificare este ca sistemul T sa
nu aibe zerouri in s = 0 ceea ce este asigurat de impunerea conditiei
 
−A −B
rank = n + p. (192)
C O

e B)
Intr-adevar, daca (A, B) stabilizabila si are loc (192) atunci (A, e este stabilizabila
(Ex: Demonstrati acest lucru folosind criteriul PBH).

CAPITOLUL 4: SINTEZA ELEMENTARA 289 Reglarea Sistemelor Dinamice


Deci in ipotezele (A, B) stabilizabila, (C, A) detectabila si (192) exista un com-
pensator stabilizator care se obtine luand o reactie dupa starea estimata prin
intermediul unui estimator de ordin redus pentru sistemul Te. Ecuatiile compen-
satorului sunt
ẇ = (A + LC)w + (A + LC)Le
y + Bu
b1
x = w + Ley
(193)
b2
x = ye
u = y ) + Fe ye
F (w + Le

sau eliminand w prin inlocuire din a doua ecuatie si inlocuind u in prima ecuatie
obtinem
b˙1 = (A + LC + BF )b
x x1 + +B Fe x
b2 + Lǫ
b˙2 = ǫ
x (194)
u = Fx b1 + Fe x
e2

unde am tinut cont ca ye = x b˙2 = ǫ. Deci un compensator stabilizator pentru


b2 si x

CAPITOLUL 4: SINTEZA ELEMENTARA 290 Reglarea Sistemelor Dinamice


T (s) este dat de
 
  A + LC + BF B Fe L
AK BK  O O I 
K(s) = = . (195)
CK DK
F Fe O

A ramas de verificat ca intr–adevar acest compensator (regulator) asigura de fapt


reglarea. Acest lucru se arata verificand conditiile de reglare (184)

ARV + BRCr − V Ar = 0, CRV + Cr = 0

in care Ar = O, Cr = I. Aceasta este echivalent cu a arata ca solutia ecuatiei

ARV = −BR

verifica CRV = −Ip. Inlocuind expresiile lui AR , BR si CR cu datele obtinute

CAPITOLUL 4: SINTEZA ELEMENTARA 291 Reglarea Sistemelor Dinamice


rezulta dupa partitionarea corespunzatoare a lui V
    
A BF BF e V1 O
 
(AR V =)  −LC A + BF + LC B Fe   V2  =  −L  (= −BR)
−C O O V3 −Ip
(196)
si  
 V1

(CR V =) −C O O  V2  = −Ip. (197)
V3
Inspectand ultima relatie observam ca este identica cu ultima ecuatie din (196) si
deci daca V verifica (196) atunci automat verifica si (197). In final, V exista si
este unic intrucat AR este inversabila (Λ(AR) ⊂ C− asa cum rezulta din teoria
stabilizarii cu compensatoare de ordin redus).

Procedura de reglare la referinta treapta cu compensare asimptotic intern stabila

– Exercitiu –

CAPITOLUL 4: SINTEZA ELEMENTARA 292 Reglarea Sistemelor Dinamice


ANEXA: COMPLEMENTE DE ALGEBRA LINIARA

1. Forma Canonica Jordan si Notiuni Conexe

2. Aspecte Geometrice in Algebra Liniara Finit Dimensionala

3. Ecuatii Matriciale Liniare

COMPLEMENTE DE ALGEBRA LINIARA 293 COMPLEMENTE DE ALGEBRA LINIARA


1. Forma Canonica Jordan si Notiuni Conexe

In aceasta parte a Anexei prezentam cateva rezultate de teoria operatorilor liniari pe


spatii finit dimensionale. Punctul de vedere este axat pe reprezentarea matriciala
(intr-o baza fixata) a aplicatiei liniare. In principal vom da rezultate privind valorile
proprii, vectorii proprii, spatii invariante si forme canonice Jordan.
Fie C si R multimea numerelor complexe si respectiv reale. Notam cu Rn spatiul
vectorial n–dimensional cu elemente in R (vectorii sunt considerati prin conventie
intotdeauna de tip coloana) si fie Rp×m multimea matricilor de dimensiune p × m
cu elemente in R (prin simpla inlocuire a lui R cu C vom folosi notatii similare
pentru cazul elementelor complexe). Notam R sau C cu F.
Fie N ∈ Fn×n. N reprezinta in mod natural o transformare liniara din Fn in Fn.
Problema rezolvarii ecuatiei polinomiale de grad n

χ(s) := det(sIn − N ) = 0 (198)

COMPLEMENTE DE ALGEBRA LINIARA 294 Forma Canonica Jordan si Notiuni Conexe


in necunoscuta s ∈ C se numeste problema de valori proprii iar χ(s) se numeste
polinom caracteristic al matricii N . Din teorema fundamentala a algebrei aceasta
ecuatie are intotdeauna n radacini complexe (eventual care coincid) care se numesc
valori proprii ale lui N . Setul celor n valori proprii se numeste spectrul lui N si se
noteaza cu Λ(N ). Daca s0 este o valoare proprie a lui N , atunci exista intotdeauna
un vector nenul x ∈ Cn – numit vector propriu al lui N – astfel incat N x = s0x.

Daca s0 = 0 este o valoare proprie a lui N atunci N se numeste singulara.


O matrice nesingulara are o inversa si se numeste inversabila. Mai exact, daca
N ∈ Fn×n este nensingulara, atunci exista o matrice unica in Fn×n, numita inversa
lui N si notata N −1 , a.i. N −1N = N N −1 = In (matricea identitate).

Pe multimea matricilor n × n introducem relatia de echivalenta numita similaritate.


Doua matrici N, Ne ∈ Fn×n s.n. similare daca exista o matrice inversabila
T ∈ Fn×n a. i.
e.
T N T −1 = N (199)
T se asociaza cu o schimbare de baza in Fn. Astfel orice x ∈ Fn se transforma
in x
e = T x, iar N si N e reprezinta aceeasi transformare liniara din Fn in Fn

COMPLEMENTE DE ALGEBRA LINIARA 295 Forma Canonica Jordan si Notiuni Conexe


reprezentata in doua baze diferite.

Forma Canonica Jordan

Prezentam in continuare forma canonica Jordan indusa de transformarile de simi-


laritate.

Forma canonica Jordan complexa

Transformarea de similaritate (199) induce o forma canonica pe multimea matricilor


de dimensiune n × n cu elemente in C numita forma canonica Jordan complexa.
Fie N ∈ Cn×n si fie {s1, s2, . . . , sk } multimea celor k valori proprii distincte ale
lui N . Atunci exista intotdeauna o transformare inversabila T ∈ Cn×n a.i.

T N T −1 = NJ (200)

unde
NJ := diag (N11(s1), N22(s2), . . . , Nkk (sk )), (201)

COMPLEMENTE DE ALGEBRA LINIARA 296 Forma Canonica Jordan si Notiuni Conexe


Nii(si) := diag (Js(i) (si), Js(i) (si), . . . , Js(i) (si)), (202)
1 2 hi

si Js(si) este o s × s matrice elementara de forma


 
si 1
 si . . . 
Js(si) :=  . . . 1 , (203)
si

numita bloc elementar Jordan.

Multimea de valori proprii distincte {s1, s2, . . . , sk } impreuna cu multimea indicilor


(i)
{sj , i = 1, . . . , k, j = 1, . . . , hi} determina complet forma canonica Jordan
(pana la o permutare a blocurilor pe diagonala principala). Pentru o valoare
(i)
proprie si, dimensiunile blocurilor sj , (j = 1, . . . , hi) se numesc indici Jordan
elementari (sau multiplicitati partiale ) ale valorii proprii si. Intregii pozitivi hi
(i) (i)
se numesc multiplicitati geometrice a lui si. Suma ni = s1 + · · · + shi se

COMPLEMENTE DE ALGEBRA LINIARA 297 Forma Canonica Jordan si Notiuni Conexe


numeste multiplicitate algebrica a lui si si este multiplicitatea lui si ca radacina a
polinomului caracteristic.

COMPLEMENTE DE ALGEBRA LINIARA 298 Forma Canonica Jordan si Notiuni Conexe


Forma canonica Jordan reala

Fie N o matrice cu elemente reale. O matrice N ∈ Rn×n nu are intotdeauna n


valori proprii reale dar are intotdeauna n valori proprii complexe. Valorile proprii
care nu sunt reale sunt prezente in perechi complex conjugate. Aceasta face ca
studiul formelor canonice sub transformari de similaritate avand elemente reale sa
fie oarecum diferit.

Fie {s1, s2, . . . , sr , sr+1, . . . , sk , sr+1, . . . , sk } spectrul lui N , unde s1, . . . , sr , sunt
valorile proprii reale si sr+1, . . . , sk , sr+1, . . . , sk , sunt valorile proprii care nu sunt
reale si apar in perechi complex conjugate.

Astfel daca restrangem clasa transformarilor de similaritate T exclusiv la cele cu


elemente reale obtinem forma canonica Jordan reala NJ a lui N , unde NJ are
forma din (201), Nii(si) are forma (202)–(203) pentru valorile proprii reale si
(i = 1, . . . , r) in timp ce pentru valorile proprii care nu sunt reale si = αi + jβi

COMPLEMENTE DE ALGEBRA LINIARA 299 Forma Canonica Jordan si Notiuni Conexe


(αi, βi ∈ R, βi 6= 0, i = r + 1, . . . , k), avem

Nii(si) := diag (Js(i) (αi, βi), Js(i) (αi, βi), . . . , Js(i) (αi, βi)), (204)
1 2 hi

unde Js(αi, βi) este o 2s × 2s matrice elementara de forma

 
K(αi, βi) I2
 K(αi, βi) I2 
 
Js(αi, βi) :=  K(αi, βi) . . .  (205)
 ... I2 
K(αi, βi)

numita bloc Jordan elementar real, unde


 
αi βi
K(αi , βi ) := .
−βi αi

COMPLEMENTE DE ALGEBRA LINIARA 300 Forma Canonica Jordan si Notiuni Conexe


Observatie: Orice doua matrici similare au aceeasi forma Jordan (si deci acelasi
spectru si indici Jordan elementari).

Subspatiu Invariant al unei Matrici Patrate


Definitia 75. Fie A ∈ Fn×n. Subspatiul vectorial V ⊂ Fn se numeste subspatiu
invariant al lui A daca
AV ⊂ V. (206)

Cel mai simplu exemplu de spatiu invariant sunt vectorii proprii. Este usor de
verificat ca daca V este un subspatiu invariant de dimensiune ℓ, atunci exista o
transformare de similaritate U , partitionata

 
U = U1 U2 , (207)
|{z} |{z}
ℓ n−ℓ

COMPLEMENTE DE ALGEBRA LINIARA 301 Forma Canonica Jordan si Notiuni Conexe


cu V = Im U1, astfel incat
 
−1 A11 A12 }ℓ
U AU = (208)
O A22 }n − ℓ
| {z } |{z}
ℓ n−ℓ

si Λ(A) = Λ(A11)∪Λ(A22). In acest nou sistem de coordonate V este reprezentata


prin  
Iℓ
V = Im . (209)
O
Matricea A restrictionata la subspatiul (invariant) V si spectrul ei restrictionat la
subspatiul (invariant) V se definesc prin

A|V := A11,
Λ(A)|V := Λ(A11).

COMPLEMENTE DE ALGEBRA LINIARA 302 Forma Canonica Jordan si Notiuni Conexe


Reciproc, daca (208) este adevarata pentru o matrice nesingulara U ca in (207),
atunci V = Im U1 este un subspatiu invariant a lui A si Λ(A)|V = A11.
Consideram o a partitie a planului complex in doua submultimi disjuncte

C = Cg ∪ Cb.

Un subspatiu invariant V se numeste Cg –invariant daca Λ(A)|V ⊂ Cg .


Daca Λ1 ∪ Λ2 = Λ(A) este o partitie a spectrului lui A ∈ Fn×n atunci exista un
susbaptiu invariant V a lui A astfel incat Λ(A)|V = Λ1. Acest lucru rezulta din
forma canonica Jordan. Daca A are elemente reale si Λ1 este un set simetric (in
raport cu axa imaginara), atunci putem alege V ⊂ Rn. Mai mult, daca Λ1 ∩Λ2 = ∅
atunci V este unic.
Urmatorul rezultat este folosit intens in Teoria Sistemelor Liniare.
Teorema 76. Fie A ∈ Fn×n.
1. Daca V = Im V ⊂ Fn este un subspatiu invariant al lui A de dimensiune ℓ,

COMPLEMENTE DE ALGEBRA LINIARA 303 Forma Canonica Jordan si Notiuni Conexe


unde V ∈ Fn×ℓ este o matrice baza pentru V, atunci exista o matrice S ∈ Fℓ×ℓ
a.i.
AV = V S. (210)
Mai mult, S = A|V .

2. Reciproc, daca AV = V S pentru o anumita amtrice baza V ∈ Fn×ℓ si o


matrice S ∈ Fℓ×ℓ, atunci V = Im V este un subspatiu invariant a lui A si
S = A|V .

Demonstraţie. Rezulta automat din definitia subspatiului invariant.

COMPLEMENTE DE ALGEBRA LINIARA 304 Forma Canonica Jordan si Notiuni Conexe


2. Aspecte Geometrice in Algebra Liniara Finit Dimensionala

Fie A o aplicatie liniara dintr–un spatiu vectorial X de dimensiune n intr–un spatiu


vectorial Y de dimensiune m. Daca X si Y sunt spatii vectoriale peste F (tipic R
sau C), atunci liniaritatea lui A implica ca daca

yi = Axi , i = 1, 2,

atunci
(α1y1 + α2y2) = A(α1x1 + α2x2), ∀α1, α2 ∈ F.
Alegand baze in ambele subspatii X si Y putem intotdeauna reprezenta aplicatia
A printr-o matrice m × n pentru care se foloseste adesea (prin abuz de notatie!)
tot simbolul A.
In Teoria Sistemelor este adesea util sa consideram anumite aspecte geometrice
ale aplicatiei A mai degraba decat proprietatile matricii A, cu toate ca – evident
– cele doua puncte de vedere sunt strans relationate.

COMPLEMENTE DE ALGEBRA LINIARA 305 Aspecte Geometrice in Algebra Liniara


Nucleu si Imagine

Consideram doua subspatii S ⊂ X si R ⊂ Y. Definim imaginea lui S prin aplicatia


A ca fiind multimea
AS := {y | y = Ax, x ∈ S}
si preimaginea (sau imaginea inversa) a lui R prin aplicatia A ca fiind multimea

A−1R := {x | y = Ax, y ∈ R} .

Se poate verifica imediat ca ambele multimi sunt de fapt subspatii ale lui Y si
respectiv X .

Observatie: Preimaginea (sau imaginea inversa) se poate defini pentru orice


aplicatie A, chiar daca matricea corespunzatoare A nu este patrata sau inversabila.

In particular, daca S = X si R = {0} obtinem doua spatii remarcabile asociate


oricarei aplicatii liniare:

COMPLEMENTE DE ALGEBRA LINIARA 306 Aspecte Geometrice in Algebra Liniara


• Subspatiul AX este imaginea intregului spatiu X prin aplicatia A si se numeste
imaginea lui A (notata Im A),

Im A := AX = {y | y = Ax, x ∈ X } ⊂ Y;

• Subspatiul A−1{0} este preimaginea vectorului nul si se numeste nucleul lui A


(notata Ker A),

Ker A := A−1 {0} = {x | Ax = 0} ⊂ X .

Baze pentru aceste subspatii se obtin facand anumite descompuneri ale matricii A.

COMPLEMENTE DE ALGEBRA LINIARA 307 Aspecte Geometrice in Algebra Liniara


Propozitia 77. O m × n matrice Y de forma
 
Y1 }r
Y = (211)
O }m − r

cu Y1 avand rang intreg pe linii r are imaginea


 
Ir
Im ,
O
 
y1 }r
i.e., orice vector apartine imaginii lui Y .
O
O m × n matrice X de forma
 
X= X1 O (212)
|{z} |{z}
r n−r

COMPLEMENTE DE ALGEBRA LINIARA 308 Aspecte Geometrice in Algebra Liniara


cu X1 avand rang intreg pe coloane r are un nucleu egal cu
 
O
Im ,
In−r

 
O
i.e., orice vector apartine nucleului lui X.
x2 }n − r

Demonstraţie. Consideram y = Y x pentru oricare x ∈ Cn si partitionam y conform


cu (211) de unde obtinem y1 = Y1x, y2 = 0. Din ipoteza ca Y1 are rang intreg pe
linii r rezulta ca exista r coloane liniar independente care genereaza orice vector
y1 ∈ Cr .

Consideram Xx = 0, x ∈ Cn, de unde obtinem partitionand x in conformitate cu


(212) X1x1 = 0, 0 · x2 = 0. Din ipoteza ca X1 are coloane independente rezulta
ca x1 = 0 este unica solutie a ecuatiei X1x1 = 0. Pe de–alta parte, orice vector
x2 satisface 0 · x2 = 0.

COMPLEMENTE DE ALGEBRA LINIARA 309 Aspecte Geometrice in Algebra Liniara


Propozitia 78. Fie B o aplicatie din X in Z si A o aplicatie din Z in Y. Atunci

Im (A · B) = AIm B
Ker (A · B) = B −1Ker A

Demonstraţie. Avem

Im (AB) = {y | ABx = y, x ∈ X }.

Deoarece
Im B = {z | Bx = z, x ∈ X }

COMPLEMENTE DE ALGEBRA LINIARA 310 Aspecte Geometrice in Algebra Liniara


avem deasemenea

Im (AB) = {y | Az = y, z ∈ Im B} = AIm B.

Din definitia nucleului obtinem

Ker (AB) = {x | ABx = 0},

sau inca
{x | Bx = z, z ∈ Ker A} = B −1Ker A.

Propozitia 79. • Daca B este inversabila la dreapta atunci Im AB = Im A.

• Daca A este inversabila la stanga atunci Ker AB = Ker B.

COMPLEMENTE DE ALGEBRA LINIARA 311 Aspecte Geometrice in Algebra Liniara


Demonstraţie. Daca B este inversabila la dreapta atunci are liniile liniar indepen-
dente si Im B = Z. Din Propozitia 78

Im (A · B) = AIm B = AZ = Im A.

Daca A este inversabila la stanga atunci are coloanele liniar independente si


Ker A = {0}. Din Propozitia 78 avem

Ker (A · B) = B −1Ker A = B −1{0} = Ker B.

Descompuneri si Transformari de Coordonate

Consideram descompunerea in valori singulare a unei matrici generale


 

  Σr O  ∗
A = U ΣV = U1 U2 V1 V2 (213)
O O

COMPLEMENTE DE ALGEBRA LINIARA 312 Aspecte Geometrice in Algebra Liniara


unde Σr este diagonala si inversabila. Aceasta descompunere genereaza baze
ortonormale pentru cateva subspatii importante ale aplicatiei A.
Propozitia 80. Fie descompunerea in valori singulare a lui A din (213). Atunci
avem
Im A = Im U1, Ker A = Im V2 ,

Im A∗ = Im V1, Ker A∗ = Im U2.

Demonstraţie. Din Propozitiile 78 si 79 avem

Im A = Im U ΣV ∗ = Im U Σ = U Im Σ

Ker A = Ker U ΣV ∗ = Ker ΣV ∗ = V Ker Σ

COMPLEMENTE DE ALGEBRA LINIARA 313 Aspecte Geometrice in Algebra Liniara


Din Propozitia 77 avem  
Ir
Im Σ = Im
O
si  
O
Ker Σ = Im .
In−r
De aici rezulta imediat
 
Ir
Im A = U Im = Im U1
O

si  
O
Ker A = V Im = Im V2.
In−r
Pentru imaginea si nucleul lui A∗ se pot folosi descompuneri similare pentru
A∗ = V Σ∗U ∗.
Corolarul 81.
Im A⊥ = Ker A∗, Ker A⊥ = Im A∗

COMPLEMENTE DE ALGEBRA LINIARA 314 Aspecte Geometrice in Algebra Liniara


unde ·⊥ semnifica complementul ortogonal.

Demonstraţie. Rezulta din ortogonalitatea lui U1 si U2 si respectiv a lui V1 si


V2.

Constructia lui AS si A−1 R

Fie S si R doua matrici astfel incat S = Im S si R = Ker R. Aplicam transformari


ortogonale (unitare) Vs∗ si Ur liniilor lui S, respectiv coloanelor lui R (i.e. facem o
descompunere QR a acestor matrici) astfel incat
 
∗ 
 
S1  ..  n1    

Vs S = =

 , RUr = O R2 = O ∗ ··· ∗
O ∗ 
O | {z }
n2

Aplicam Vs coloanelor lui A, respectiv Ur∗ liniilor lui A si partitionam matricea

COMPLEMENTE DE ALGEBRA LINIARA 315 Aspecte Geometrice in Algebra Liniara


rezultanta precum urmeaza

 
  Ar1
As1 As2 := AVs , := Ur∗A.
n2{ Ar2
|{z}
n1

Atunci Im As1 = AS si Ker Ar2 = A−1R. Intr–adevar,

AS = AIm S = Im AS = Im [(AVs)(Vs∗S)] = Im As1S1 = Im As1,

A−1R = A−1Ker R = Ker RA = Ker [(RUr )(Ur∗A)] = Ker R2Ar2 = Ker Ar2

Daca in plus dorim sa obtinem baze ortonormale atunci efectuam aplicam transfor-
mari ortogonale asupra lui As1 respectiv asupra lui Ar2 pentru a obtine un numar

COMPLEMENTE DE ALGEBRA LINIARA 316 Aspecte Geometrice in Algebra Liniara


maxim de linii respectiv coloane de zero

  
s2 {  ∗ ∗ ∗
:= U ∗
s A Vs , := Ur∗AVr .
 ∗ n2{ 0
0 |{z}
|{z} n1
s1

Atunci AS este generat de primele s2 coloane ale lui Us si A−1 R este generat de
primele n − n2 coloane ale lui Vr , i.e.:

AS = Im Us,1 A−1R = Im Vr,1.

Din relatiile de mai sus observam ca AS si A−1R sunt concepte duale, similar
precum Im cu Ker . Intr–adevar avem

(A−1S)⊥ = (A∗)S ⊥

COMPLEMENTE DE ALGEBRA LINIARA 317 Aspecte Geometrice in Algebra Liniara


(AS)⊥ = (A∗)−1S ⊥
Subspatii Nestate
Lema 82. Presupunem ca avem o multime crescatoare de subspatii ( nestate) :

0 = V 0 ⊂ V 1 ⊂ V 2 ⊂ · · · ⊂ Vk = X

de dimensiune 0 = d0 < d1 < d2 < · · · dk = n. Atunci exista o matrice unitara


V a.i.
V = [ V1 | V2 | · · · | Vk ]
|{z} |{z} |{z}
r1 r2 ··· rk
unde ri = di − di−1 si astfel incat Vi = Im [V1| · · · |Vi].
Spatiile transformate V ∗Vi sunt acoperite de “vectorii baza ordonati ”:
 
Id i
V ∗Vi = Im
0

COMPLEMENTE DE ALGEBRA LINIARA 318 Aspecte Geometrice in Algebra Liniara


Un subspatiu invariant V al unei matrici patrate A (sau un subspatiu A-invariant
este orice spatiu astfel incat
  AV ⊂ V
Id
Daca V este acoperit de atunci matricea A are forma bloc
0
 
A11 A12 }d
A= 0 A22
|{z}
d

si este clar ca Λ(A) = Λ(A11) ∪ Λ(A22). Matricea A11 se numeste restrictia lui
A la V : A11 = A|V .
Observati ca suma R1 + R2 si intersectia R1 ∩ R2 a doua subspatii A-invariante
este deasemenea un subspatiu A-invariant. De aici rezulta ca un subspatiu A-
invariant formeaza o latice sub operatiile de adunare si intersectie care prin urmare
va avea intotdeauna un infimum si un supremum.

COMPLEMENTE DE ALGEBRA LINIARA 319 Aspecte Geometrice in Algebra Liniara


3. Ecuatii Matriciale Liniare

Anumite ecuatii matriciale liniare precum ecuatia Sylvester, Stein si versiunile lor
simetrice de tip Lyapunov joaca un rol central in teoria sistemelor dinamice liniare.
Prezentam in continuare conditii de solvabilitate si anumite proprietati remarcabile
ale acestor ecuatii.

Reamintim intai cateva concepte de teoria matricilor.

O matrice A se numeste simetrica daca A = AT si se numeste hermitica daca


A = A∗. Daca A este hermitica atunci toate valorile ei proprii sunt reale si in
acest caz introducem semnul matricii A (sau matricea semn) prin formula

sgn (A) := diag (In− , In+ , On0 ) (214)

unde n−, n+ si n0 sunt numarul de valori proprii strict negative, strict pozitive si

COMPLEMENTE DE ALGEBRA LINIARA 320 Ecuatii Matriciale Liniare


nule iar On0 semnifica matricea nula de dimensiune n0 × n0. Matricea semn este
unic definita de matricea hermitica A.
Teorema 83 (Ecuatii Sylvester si Stein). Fie A ∈ Fn×n, B ∈ Fm×m, si C ∈
Fn×m.
1. Ecuatia Sylvester
AX + XB + C = 0 (215)
are o solutie unica X ∈ Fn×m daca si numai daca

s + µ 6= 0, oricare s ∈ Λ(A), µ ∈ Λ(B). (216)

2. Ecuatia Stein
AXB − X + C = 0 (217)
are o solutie unica X ∈ Fn×m daca si numai daca

sµ 6= 1, oricare s ∈ Λ(A), µ ∈ Λ(B). (218)

COMPLEMENTE DE ALGEBRA LINIARA 321 Ecuatii Matriciale Liniare


Daca conditia (216) (sau (218)) nu este indeplinita atunci ecuatia Sylvester
(respectiv ecuatia Stein) poate sa nu aibe nici o solutie sau poate avea o infinitate
de solutii in functie de termenul liber C.

Ecuatii Lyapunov

Daca B = A∗ si Q := C = C ∗ atunci ecuatia Sylvester este cunoscuta sub numele


de ecuatie Lyapunov (in timp continuu) si are forma

AX + XA∗ + Q = 0, (219)

iar ecuatia Stein este cunoscuta sub numele de ecuatie Lyapunov (in timp discret)
si are forma
AXA∗ − X + Q = 0. (220)
Urmatorul rezultat este o consecinta directa a Teoremei 83.
Teorema 84 (Ecuatii Lyapunov). Fie A ∈ Fn×n si Q = Q∗ ∈ Fn×n.

COMPLEMENTE DE ALGEBRA LINIARA 322 Ecuatii Matriciale Liniare


1. Ecuatia Lyapunov (in timp continuu)

AX + XA∗ + Q = 0 (221)

are solutie unica X ∈ Fn×n daca si numai daca

s + µ 6= 0, oricare s, µ ∈ Λ(A). (222)

Mai mult, daca X este unica, atunci este hermitica.

2. Ecuatia Lyapunov (discreta)

AXA∗ − X + Q = 0 (223)

are o solutie unica X ∈ Fn×n daca si numai daca

sµ 6= 1, oricare s, µ ∈ Λ(A). (224)

COMPLEMENTE DE ALGEBRA LINIARA 323 Ecuatii Matriciale Liniare


Mai mult, daca X este unica, atunci este hermitica.
Dam in continuare cateva rezultate ce leaga interia solutiei X de cea a matricii A.
Fie A ∈ Fn×n. Notam νc(A), πc(A), si δc(A), numarul de valori proprii ale lui A
cu parte reala strict negativa, strict pozitiva si respectiv nula si cu νd(A), πd(A),
si δd(A), numarul de valori proprii ale lui A cu modul strict mai mic, strict mai
mare si respectiv egal cu 1. Tripletul de numere intregi (νc(A),πc(A),δc(A)) este
numit c–inertia matricii A iar tripletul de numere intregi (νd(A),πd(A),δd(A)) este
numit d–inertia matricii A. Evident avem

νc(A) + πc(A) + δc(A) = νd(A) + πd(A) + δd(A) = n.

Teorema 85. Fie A, Q, X ∈ Fn×n, cu X = X ∗ si Q = Q∗ ≥ 0.

1. Presupunem ca A, Q, X satisfac ecuatia Lyapunov

AX + XA∗ + Q = 0.

COMPLEMENTE DE ALGEBRA LINIARA 324 Ecuatii Matriciale Liniare


Atunci avem:
(a) Daca δc(A) = 0 atunci νc(A) ≥ πc(X) si πc(A) ≥ νc(X).
(b) Daca δc(X) = 0 atunci νc(X) ≥ πc(A) si πc(X) ≥ νc(A).

2. Presupunem ca A, Q, X satisfac ecuatia Lyapunov discreta

AXA∗ − X + Q = 0.

Atunci avem:
(a) Daca δd(A) = 0 atunci νd(A) ≥ πc(X) si πd(A) ≥ νc(X).
(b) Daca δc(X) = 0 atunci νc(X) ≥ πd(A) si πc(X) ≥ νd(A).

Presupunem ca Q = Q∗ ≥ 0 este de forma Q = BB ∗. Daca perechea (A, B) este


controlabila atunci inegalitatile din Teorema 85 pot fi intarite la egalitati.
Teorema 86. Fie A, X ∈ Fn×n, B ∈ Fn×m, X = X ∗, si presupunem ca (A, B)
este controlabila.

COMPLEMENTE DE ALGEBRA LINIARA 325 Ecuatii Matriciale Liniare


1. Daca A, X, B satisfac ecuatia Lyapunov

AX + XA∗ + BB ∗ = 0

atunci avem δc(A) = 0, δc(X) = 0, νc(A) = πc(X), πc(A) = νc(X).


2. Daca A, X, B satisfac ecuatia Lyapunov discreta

AXA∗ − X + BB ∗ = 0

atunci avem δd(A) = 0, δc(X) = 0, νd(A) = πc(X), πd(A) = νc(X).


Daca relaxam ipoteza de controlabilitate a perechii (A, B) obtinem urmatorul
rezultat.
Teorema 87. Fie A, X ∈ Fn×n, B ∈ Fn×m, si X = X ∗.
1. Daca perechea (A, B) este stabilizabila (in timp continuu) si A, X, B satisfac
ecuatia Lyapunov
AX + XA∗ + BB ∗ = 0

COMPLEMENTE DE ALGEBRA LINIARA 326 Ecuatii Matriciale Liniare


atunci avem δc(A) = 0, νc(A) = πc(X) + δc(X), πc(A) = νc(X).
2. Daca perechea (A, B) este stabilizabila (in timp discret) si A, X, B satisfac
ecuatia Lyapunov discreta

AXA∗ − X + BB ∗ = 0

atunci δd(A) = 0, νd(A) = πc(X) + δc(X), πd(A) = νc(X).


Daca in Teoremele 86 si 87 inlocuim A cu A∗ si B cu C ∗ obtinem versiunile duale
corespunzatoare. Nucleul solutiei X are anumite proprietati dupa cum reiese din
urmatoarea teorema.
Teorema 88. Fie A, X ∈ Fn×n, C ∈ Fp×n, X = X ∗ si fie N (C, A) subspatiul
neobservabil al perechii (C, A).

1. Presupunem ca A, X, C satisfac ecuatia Lyapunov

A∗X + XA + C ∗C = 0. (225)

COMPLEMENTE DE ALGEBRA LINIARA 327 Ecuatii Matriciale Liniare


Atunci avem:
(a) Ker X ⊂ N (C, A).
(b) Daca ecuatia Lyapunov (225) are o unica solutie X atunci avem
N (C, A) ⊂ Ker X.

2. Presupunem ca A, X, C satisfac ecuatia Lyapunov discreta

A∗XA − X + C ∗C = 0. (226)

Atunci avem:
(a) Ker X ⊂ N (C, A).
(b) Daca ecuatia Lyapunov discreta (226) are o unica solutie X atunci avem
N (C, A) ⊂ Ker X.

COMPLEMENTE DE ALGEBRA LINIARA 328 Ecuatii Matriciale Liniare