Cristian Oară
Ce Dorim ?
Bucla de Reactie
Stabilizare
Performante Asimptotice
Acest capitol este cel mai important pentru intelegerea scopului si mijloacelor
automaticii !
Introducem notiuni de baza cum ar fi conexiunea in bucla de reactie (feed-
back) si caracterizam principalele ei proprietati ce o transforma in instrumentul
fundamental al automaticii (asigura stabilizarea + reglarea)!
Punctul de plecare: Avem un sistem care nu face ceea ce dorim ! Cum procedam?
Doua variante posibile:
• Il schimbam cu altul care face ceea ce dorim (dar oricum trebuie sa stim CUM
sa cerem/construim sistemul nou...)
• Il modificam (CUM ?) pe cel pe care il avem deja.
Analiza sistemelor de la Semnale si Sisteme a incercat sa va familiarizeze cu diverse
clase de modele sistemice si cerinte naturale asupra lor.
Multe ...
De exemplu: Sa fie stabil (semnalele externe de energie finita sa rezulte in semnale
interne tot de energie finita), sa urmareasca clase de semnale prescrise in conditiile
in care apar semnale perturbatoare cunoscute ori necunoscute si zgomote, sa faca
Conexiunea Paralel
Asa cum vom vedea printr-o analiza detaliata, conexiunea in bucla de reactie
este CEA CARE REZOLVA CHESTIUNEA STABILITATII (interne) si inca
multe alte cerinte!
Cel mai simplu sistem REAL cu bucla de reactie are trei componente (vezi Fig. 1):
v
Senzor
Fiecare componenta din Figura 1 are doua intrari si o iesire putand fi exprimata
sub forma (de exemplu in cazul sistemului nominal)
d d
y=P = P1 P2 = P1d + P2u.
u u
x1 = r − F x3,
x2 = d + Cx1 ,
x3 = n + P x2,
Sistemul in bucla inchisa este deci bine definit daca matricea de dimensiune 3 × 3
de mai sus este nesingulara, i.e., determinantul ei 1 + P CF nu este identic nul,
Sistemul in bucla inchisa este bine definit in sens strict daca toate functiile
Nota: Buna definire in sens strict implica automat si buna definire ! Este realist
sa cerem unui sistem de reglare buna definire in sens strict ? DA !!!
Argumente pro (si contra !): Functiile de transfer ale oricarui sistem sunt de
fapt strict proprii (o sinusoida de amplitudine constanta si frecventa din ce in ce
mai mare aplicata unui sistem conduce la o iesire ce tinde la zero). Da, dar la
frecvente mari sistemele sunt in general foarte complexe si inceteaza in fapt sa fie
liniare pe masura ce frecventa creste ! De fapt avem nevoie ca unul singur dintre
P , C sau F sa fie strict propriu si daca acest lucru nu se intampla automat la
modelele cu care lucram oricum cerem |P CF (∞)| < 1 (motive profunde legate de
stabilitate interna si “small–gain”) ceea ce asigura automat buna definire in sens
strict.
CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 13 Stabilitatea Interna a Buclei de Reactie
Exemplul 1. In Figura 2 fie C(s) = s+1 s
, P (s) = s21−1 , F (s) = 1. Functia de
transfer r → y este strict stabila (in sens BIBO) dar functia de transfer de la
d la y nu este.
Exemplul 2. In Figura 2 fie C(s) = s+1 s
, P (s) = s21+1 , F (s) = 1. Toate functiile
de transfer exogen → semnal intern al buclei sunt strict stabile (in sens BIBO).
Definitia 3. Sistemul in bucla de reactie din Figura 2 se numeste intern stabil
daca toate transferurile in bucla inchisa sunt strict stabile (i.e., au polii in C−).
Aparent trebuie sa verificam 18 functii de transfer dar de fapt sunt suficiente doar
9. Aratati de exemplu ca urmatoarele functii de transfer sunt suficiente pentru
verificarea stabilitatii interne
CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 14 Stabilitatea Interna a Buclei de Reactie
Scriem fctiile de transfer rationale sub forma unor cături de polinoame coprime
NP NC NF
P = , C= , F = (2)
MP MC MF
χ = NP NC NF + MP MC MF .
CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 15 Stabilitatea Interna a Buclei de Reactie
eral este similara dar este mai greu de urmarit). Din (1) avem
x1 1 −P −1 r
x2 = 1 C 1 −C d
1 + PC
x3 PC P 1 n
CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 16 Stabilitatea Interna a Buclei de Reactie
strict stabile (in sens BIBO), i.e., au poli numai in C−. Aceasta nu implica automat
ca NP NC + MP MC are zerourile in C− intrucat este posibil sa aibe un zerou in
afara care sa fie zerou si al tuturor numaratorilor din (3) si deci sa se simplifice.
In orice caz, polinomul χ nu are un zerou comun cu toti numaratorii din (3) asa
cum demonstram prin reducere la absurd. Fie s0 a.i. (NP NC + MP MC )(s0) = 0.
P.p. ca este zerou si al tutoror numaratorilor, in particular MP MC (s0) = 0. Apar
doua situatii posibile: i)MP (s0) = 0; ii)MC (s0) = 0.
Cazul i) MP (s0) = 0; Automat NP (s0) 6= 0 (MP este coprim cu NP ) si rezulta
din elementul (1,2) al matricii ca MC (s0) = 0 si din elementul (3,1) ca NC (s0) = 0
ceea ce nu este posibil din nou din coprimitatea lui NC si MC .
Cazul ii) MC (s0) = 0. Automat atunci NC (s0) 6= 0 si rationamentul se repeta ca
mai sus folosind elementele (2,3) si (3,1) ale matricii rezultand ca MP (s0) = 0 si
NP (s0) = 0, ceea ce contrazice coprimitatea lui MP si NP .
CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 17 Stabilitatea Interna a Buclei de Reactie
companion asociate sau, mai simplu, folosind criteriul lui Hurwitz).
Teorema 5 (Test de Stabilitate Interna). Sistemul in bucla inchisa este intern
stabil daca si numai daca urmatoarele doua conditii sunt simultan indeplinite:
Demonstraţie. Sistemul in bucla inchisa este intern stabil daca si numai daca
toate cele 9 functii de transfer
1 −P F −F
1 C 1 −CF
1 + P CF
PC P 1
sunt stabile.
Necesitatea: Presupunem ca sistemul in bucla inchisa este intern stabil. Rezulta
CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 18 Stabilitatea Interna a Buclei de Reactie
in particular ca 1+P1CF este stabila, deci 1 + P CF are zerourile in C− ceea ce
NP NC NF
demonstreaza necesitatea lui a). Fie P = M ,C=M ,F =M . Din Teorema
P C F
4 rezulta ca polinomul caracteristic χ = NP NC NF + MP MC MF are zerourile in
C−. Prin urmare perechea (NP , MC ) nu are zerouri comune in Re s ≥ 0 si similar
NP NC NF
pentru toate celelalte perechi corespunzand lui P CF = M P MC MF
. Deci si b) este
adevarata ceea ce incheie necesitatea.
Suficienta: Presupunem adevarate a) si b). Factorizam P, C, F ca mai sus si fie
s0 un zerou al polinomului caracteristic, i.e.,
CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 19 Stabilitatea Interna a Buclei de Reactie
Concluziile “la zi”
CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 20 Stabilitatea Interna a Buclei de Reactie
4. Stabilizarea
Consideram sistemul (mai simplu) cu bucla de reactie unitara din Figura 3. Aceasta
diagrama arata situatia teoretica tipica in controlul automat (F = 1) in care se
da P si se cere C ce satisface anumite cerinte: stabilizeaza intern, asigura
performante, tolereaza incertitudini de modelare, limiteza comenzi, etc. Cu toate
ca in general F 6= 1, dezvoltarile teoretice sunt destul de complexe chiar in acest
caz mai simplu pentru a-l analiza separat.
Ipoteza: P este strict propriu (bucla este automat bine definita in sens strict).
d
r u y
e
C P
-
Q
C := . (6)
1 − PQ
Sistemul in bucla inchisa este intern stabil daca si numai daca cele 9 functii de
Factorizari Coprime
NX + MY = 1
Doua functii in S se numesc coprime daca exista alte doua functii X, Y ambele
in S a.i. sa aibe loc identitatea lui Bezout
N X + M Y = 1.
N
G= , N, M ∈ S,
M
N
G= , N X + M Y = 1.
M
CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 27 Stabilizarea
n
Constructia lui M si N : Fie G rationala proprie cu coeficienti reali si fie G = m
o factorizare coprima peste polinoame (se obtine direct prin simplificarea oricaror
N
factori polinomiali comuni). Evident ∂n ≤ ∂m =: k. Atunci G = M cu
n m
N= k
, M=
(s + 1) (s + 1)k
Observatia 10. Asa cum se observa si in exemplul de mai sus, k este fixat de
cerintele de coprimitate ale celor doi factori. Intr-adevar, un k mai mic creaza
un M impropriu pe cand un k mai mare creaza doi factori M si N avand
zerouri comune la infinit.
Algoritmul Euclid calculeaza cel mai mare divizior comun a doua polinoame date
n(λ) si m(λ). Cand n(λ) si m(λ) sunt coprime, algoritmul lui Euclid se poate
folosi pentru calculul polinoamelor x(λ) si y(λ) ce satisfac identitatea lui Bezout
n(λ)x(λ) + m(λ)y(λ) = 1.
·········
Pasul k: Imparte rk−2 la rk−1 pentru a obtine
Prima matrice din membrul stang este inversabila si are inversa tot o matrice
polinomiala (determinantul ei este o constanta) obtinandu-se resturile sub forma
−1
r1 1 0 0 1 −q1
r2 q2 1 0 0 1
n
r3 = −1 q3 1 0 0 .
.. ... ... ... ..
.. m
rk −1 qk 1 0 0
e n(λ)
G(λ) = .
m(λ)
nx + my = 1.
Treci de la n(λ), m(λ), x(λ), y(λ) la N (s), M (s), X(s), Y (s) facand tranformarea
1
inversa de variabila λ = s+1 .
(N Nc + M MC )−1 ∈ S.
X + MQ
C := .
Y − NQ
NC := X + M Q, MC := Y − N Q
NC V
C= (11)
MC V
si calculand
N (NC V − X) M Y + N X − N NC V
Y − NQ = Y − =
M M
1 − N NC V M MC V
= = = MC V
M M
arata ca o verifica de fapt si pe a doua. A ramas sa aratam ca Q astfel definit
MC V = Y − N Q, NC V = X + M Q.
MC V X − NC V Y = XY − XY − (N X + M Y )Q ⇔ Q = NC V Y − MC V X
si ultimul membru drept apartine lui S intrucat toate elementele apartin lui S.
Deci Q ∈ S.
Observatia 13. Analog ca in cazul in care P era stabila, toate functiile de
transfer in bucla inchisa sunt functii afine de Q daca parametrizam C ca in
enuntul teoremei in functie de Q. De exemplu functia de transfer de la r si d
la ǫ devine
1 P
ǫ= r− d = M (Y − N Q)r − N (Y − N Q)d.
1 + PC 1 + PC
CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 37 Stabilizarea
Acest fapt va fi esential in sectiunile urmatoare in care parametrul Q se va de-
termina a.i. sa satisfaca cerinte suplimentare de reglare (urmarirea asimptotica
a unui semnal referinta si rejectia unui semnal de tip perturbator).
Este realist sa cerem asa ceva ? In general NU !!! De ce ? Sunt mai multe
motive:
• Strict proprii: Semnalul in domeniul timp dorim sa fie functie in sens regulat
(nu semnal generalizat).
d
r u y
e
C P
-
lim ǫ(t) = 0 ∀r ∈ R,
t→∞
lim ǫ(t) = 0 ∀d ∈ D,
t→∞
lim ǫ(t) = 0, ∀r ∈ R ,d = 0
t→∞
lim ǫ(t) = 0, ∀d ∈ D , r = 0.
t→∞
1 P M Mc rn N Mc dn
ǫ= r− d= − . (12)
1 + PC 1 + PC N Nc + M Mc rm N Nc + M Mc dm
Teorema valorii finale: Daca ǫ(s) este o transformata Laplace rationala fara poli
in Re s ≥ 0 cu posibila exceptie a unui pol simplu in s = 0 atunci limt→∞ ǫ(t)
exista si se poate calcula cu alternativ prin
Observatia 15. Chiar in aceasta formulare problema este relativ complicata in-
trucat cele doua conditii (S’) si (R’) trebuie asigurate simultan ! Asa cum
vom vedea putin mai tarziu, problema se simplifica considerabil daca folosim
pentru Nc si Mc expresiile deduse la stabilizare, adica daca scriem formula
parametrizata a compensatoarelor stabilizatoare si impunem sa satisfaca exclu-
siv conditia (R’), (S’) fiind automat satisfacuta in acest caz. In aceasta idee
este formulata si teorema reglarii din sectiunea urmatoare.
Teorema 16. Presupunand conditia (S) (sau echivalent (S’)) din problema
reglarii indeplinita, conditia (R) (sau echivalent (R’)) este indeplinita daca si
numai daca urmatoarele doua conditii sunt simultan indeplinite:
1 1 1
(i) × ∈ S ⇔ Z(rm) ⊂ Z( ) ⇔ Z(rm) ⊂ P(P ) ∪ P(C)
1 + P C rm 1 + PC
P 1 P
(ii) × ∈ S ⇔ Z(dm) ⊂ Z( ) ⇔ Z(dm) ⊂ Z(P ) ∪ P(C)
1 + P C dm 1 + PC
Conditiile sunt suficiente: Intr–adevar, conditiile fiind indeplinite rezulta din (12)
Exemple de aplicare:
Demonstraţie. Rezulta direct din aplicarea transformatei Laplace asupra lui r(t)
si d(t) si Teorema reglarii.
Exemplul 19. Sa luam un exemplu banal. Fie P (s) = 1s , C(s) = 1. Functia de
transfer de la r la ǫ este
1 s
Tǫr = =
1 + s−1 s + 1
Prin urmare polul din bucla deschisa din s = 0 devine zerou al functiei de
transfer de la referinta la eroare si acest zerou anuleaza polul lui r(s) = 1s
rezultand un ǫ(s) fara poli instabili. Deci acest sistem asigura in bucla inchisa
urmarirea unei referinte de tip treapta unitara.
Cu toate ca teorema reglarii ne da un instrument teoretic extrem de util in
1 M Mc N Mc
Tǫr = S = = , si Tǫd = −P S = −
1 + PC N Nc + M Mc N Nc + M Mc
nu conduce la nici o restrictie asupra lui Q(sri). Similar pentru cazul rejectiei
perturbatiei daca sdj este in modelul original P (s) sub forma unui zerou atunci
ecuatia
N (sdj )(Y (sdj ) − N (sdj )Q(sdj )) = 0,
Y (sri )
Q(sri) = .
N (sri )
Y (sri) Y (sdj )
Q(sri) = , Q(sdj ) =
N (sri) N (srj )
Sistemul are solutie unica daca si numai daca matricea A este inversabila sau
det A 6= 0. Se stie ca pentru o matrice Vandermonde are loc formula
det A = Π1≤i<j≤k+ℓ(si − sj )
si deci problema are solutie unica daca si numai daca punctele de interpolare
Y (si )
si se actualizeaza corespunzator coeficientul termenului liber N (si ) ce corespunde
componentelor derivate.
• Din cele de mai sus aparent reiese ca problema reglarii are intotdeauna solutie.
Acest lucru nu este adevarat si rezulta din faptul ca este posibil ca N (si) = 0 caz in
care automat M (si) 6= 0 iar ecuatia de interpolare M (si)(Y (si)−N (si)Q(si)) = 0
(N X + M Y )(sri) = 0 6= 1.
rm e dm e := rem × dem.
rem = , dm = , rd
r1 d1
Problema reglarii are o solutie daca si numai daca N nu are nici un zerou
e
comun cu rd.
Y (si) − N (si)Q(si) = 0
care asa cum am vazut deja este posibila daca si numai daca N (si) 6= 0. De unde
contradictia.
Conditia este suficienta: Intr–adevar, daca rd e nu are zerouri comune cu N
e
rezulta ca N (si) 6= 0 pentru fiecare zerou al lui rd(s) si deci putem scrie un sistem
Vandermonde corespunzator care are intotdeauna o solutie unica.
b
⇔ rd(s) nu are zerouri comune cu N (s).
• Problema stabilizarii simultane a doua sau mai multe sisteme nominale date
folosind acelasi regulator
• Combinatii ale tuturor sau doar unora dintre cerintele de mai sus.
Desigur, combinand toate sau chiar o parte dintre aceste cerinte problemele se
complica major si exista desigur situatii in care nu se pot asigura simultan toate
cerintele. Un studiu mai detaliat al conditiilor in care anumite cerinte din cele
de mai sus pot fi satisfacute se va face la Master (implica introducerea unui
formalism matematic adecvat). Desigur exista si numeroase probleme deschise (a
caror solutie nu a fost inca data) pe care sunteti invitati sa le incercati !
Q 1
C= : Q ∈ S, Q(0) = .
1 − PQ P (0)
2
1 − λ λ
Pe (λ) := P ( )= 2 , cu n(λ) = λ2, m(λ) = 6λ2 − 5λ + 1.
λ 6λ − 5λ + 1
1 5 1
q1(λ) = , r1(λ) = λ − ,
6 6 6
CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 69 Solutia Problemei Reglarii
36 1 6
q2(λ) = λ − , r2(λ) =
5 6 25
si ne oprim intrucat am obtinut un rest constant nenul. Ecuatiile verificate
sunt
n = mq1 + r1
m = r 1 q2 + r 2
de unde
r2 = (1 + q1q2)m − q2n.
Deci luam
q2 1 + q1 q2
x = − = −30λ + 19, y = = 5λ + 1.
r2 r2
1
Revenind in variabila s prin transformarea inversa λ = s+1 obtinem
1 (s − 1)(s − 2)
N (s) = , M (s) =
(s + 1)2 (s + 1)2
1 19s − 1 1 s+6
X(s) = x( )= , Y (s) = y( )= .
s+1 s+1 s+1 s+1
CAPITOLUL 1: Concepte Fundamentale ale Buclei de Reactie 70 Solutia Problemei Reglarii
Deci am deteminat toti C care asigura stabilitatea interna.
Y (0)
Q(0) = N (0) = 6
Y (10j)
Q(10j) =N (10j) = −94 + 10j ⇔ Re Q(10j) = −94, Im Q(10j) = 70.
1 1
Q(s) = a0 + a1 + a2 2
.
s+1 (s + 1)
1
r(s) =
s2
si deci rm(s) = s2. Conditia de interpolare se pune astfel incat M (s)(Y (s) −
N (s)Q(s)) sa aibe un zerou dublu in s = 0. Cum M (0) 6= 0 rezulta echivalent
ca Y (s) − N (s)Q(s) trebuie sa aibe un zerou dublu in s = 0 si deci Q(s) trebuie
sa fie de gradul 1 pentru a avea doi parametri liberi a0 si a1, i.e.,
1
Q(s) = a0 + a1 .
s+1
Y (0)
Q(0) = =6
N (0)
′ ′
′ Y (0)N (0) − N (0)Y (0)
Q (0) =
N (0)2
4. Stabilitatea Sistemelor
5. Regimurile Permanent/Tranzitoriu/Stationar
• LINIARE
• INVARIANTE IN TIMP
• FINIT DIMENSIONALE
• MULTI-INTRARE/MULTI-IESIRE (MIMO)
Definitia 26. Se numeste sistem dinamic liniar, invariant in timp, cu timp
continuu un cuadruplu de matrici constante (A, B, C, D), unde A ∈ Rn×n,
Observatii:
• Sistemul dinamic astfel definit admite o scriere matriciala ce expliciteaza de fapt
un sistem de n ecuatii diferentiale cu n necunoscute (starile) iar iesirile sunt o
combinatie liniara a starilor si intrarilor (FIG);
• Sistemul este automat invariant in timp, liniar, finit dimensional si cauzal !
• Datorita invariantei in timp se poate lua intotdeauna to = 0 si deci conditia
initiala se rescrie x(0) = xo;
Matricea
Φ(t) := eAt
Z t
x(t) = Φ(t)xo + Φ(t − τ )Bu(τ )dτ. (17)
0
1 1 1
ex = 1 + x + x2 + . . . + xn + . . .
1! 2! n!
CAPITOLUL 2: SISTEME DINAMICE PE SPATIUL STARILOR 80 Evolutia Starii, Tranzitia Intrare–Iesire
care in cazul matricial devine
At 1 1 2 1
e = In + (At) + (At) + . . . + (At)n + . . . . (18)
1! 2! n!
de unde rezulta ca in cazul sistemelor netede (cu timp continuu) starea initiala se
poate intotdeauna recupera daca se cunoaste “unde s-a ajuns” si comanda care a
generat starea respectiva. (FIG)
Rt
y(t) = f (t, xo, u(·)) = Ce xo + 0 CeA(t−τ ) Bu(τ )dτ
At
Matricile
0, t < 0,
T (t) := CΦ(t)B, Tc(t) :=
T (t), t ≥ 0
se numesc matricea pondere respectiv matricea de raspuns cauzal la impuls. Mai
mult
Tc(t) = T (t)1(t)
unde 1(t) := diag {1(t)} iar 1(t) este functia treapta (Heaviside). Cu aceste
notatii Z t
y(t) = CΦ(t)xo + Tc(t − τ )u(τ )dτ.
0
Avem deasemenea
C(sI − A)∗B e
R(s) R(s)
T (s) = +D = = = {Tij (s)} 1≤i≤p .
χ(s) χ(s) ν(s) 1≤j≤m
Matricea de transfer a unui sistem dinamic (in acceptiunea definitiei date) este o
p × m matrice de functii rationale proprii. Ea permite explicitarea in operational a
iesirii in functie de intrare atunci cand conditiile intiale sunt nule
e
A = T AT −1,
e
B = T B,
e
C = CT −1,
e
D = D.
e(t) := T x(t)
x ⇔ x(t) = T −1x
e(t)
atunci obtinem
T −1x ˙
e(t) = AT −1x e(t) + Bu(t),
−1 ⇒ (22)
y(t) = CT x e(t) + Du(t),
˙
e(t)
x = T AT −1x
e(t) + T Bu(t),
−1 ⇒
y(t) = CT x e(t) + Du(t),
(
˙
e(t)
x ex(t) + Bu(t),
= Ae e
y(t) = C ex e
e(t) + Du(t),
Te(s) = C(sI
e e −1B
− A) e+D
e = C(sI − A)−1B + D = T (s).
D = T (∞) = Te(∞) = D.
e
Demonstraţie. Intr-adevar,
Te(s) = C(sI
e e −1B
− A) e+D e = CT −1(sI − T AT −1)−1T B + D
= CT −1(T (sI − A)T −1)−1T B + D = C(sI − A)−1B + D = T (s).
Acest tip de stabilitate se refera la comportarea marimii de stare x(t) atunci cand
intrarea este identic nula. Ecuatia relevanta este
Definitia 31. Un sistem dinamic se numeste intern stabil daca ∀ǫ > 0, ∃δ(ǫ) > 0
kx(t)k ≤ ǫ, ∀t ∈ R+.
Definitia 32. Un sistem dinamic s. n. intern asimptotic stabil daca ∀xo avem
lim kx(t)k = 0.
t→∞
x(t) = eAtxo.
b) Sistemul este intern asimptotic stabil daca si numai daca limt→∞ Φ(t) = 0.
0 1 ... 0
.. .. . . . ..
A = J0 =
0 0 ...
.
1
0 0 ... 0
n−1
t t t tn−1
0 1! ... 0 0 0 ... (n−1)! 1 1! ... (n−1)!
.. .. ... .. .. .. . . . .. .. .. ... ..
eAt
= I n +
0 t
+· · ·+ =
0 ... 1! 0 0 ... 0 0 0 ... t
1!
0 0 ... 0 0 0 ... 0 0 0 ... 1
λo 0 . . . 0
.. .. . . . ..
A = Jo + Λo, unde Λo =
0 0 ...
= λoIn.
0
0 0 ... λo
Avem eAt = e(Jo+Λo)t = eJoteΛ0t (relatie ce are loc pentru ca Λo comuta cu Jo).
n−1
t t
1 1! ... (n−1)!
.. .. ... ..
eAt = eλot t .
0 0 ... 1!
0 0 ... 1
J1 0
J = T AT −1 = ...
0 Jk
unde J este o matrice Jordan (bloc diagonala avand pe diagonala blocuri elementare
Ecuatia
AT P + P A + Q = 0, A ∈ Rn×n , Q ∈ Rn×n (23)
T
R∞ T AT t At AT t At
R∞ d AT t At
A P + PA = 0
(A e ∞ Qe +e Qe A)dt = 0 dt (e Qe )dt
T
A t At
= e Qe = −Q
0
AT P + P A + Q = 0.
xH AT = λxH ,
xH AT P x + xH P Ax = −xH Qx;
Fie sistemul
ẋ = Ax + Bu, x(0) = xo,
(25)
y = Cx + Du
avand matricea de transfer
Pentru a pune in evidenta regimurile permanent si tranzitoriu ale unui sistem facem
ipotezele:
a) Sistemul este intern asimptotic stabil, i.e., Λ(A) ⊂ C−;
b) Comanda u este produsa de regimul liber al unui sistem antistabil
ẋe = Aexe, xe(0) = xeo,
(26)
u = Cexe
ξ˙ + V ẋe = Aξ + AV xe + BCexe
AV − V Ae + BCe = 0
are o solutie unica V . Punand acest V in (27) si (28) regimul dinamic devine
ξ˙ = Aξ, ξ(0) = ξ0
si cum sistemul original este asimptotic stabil avem ca limt→∞ ξ(t) = 0. Prin
urmare, in ipotezele facute exista si este unic V a.i. sa avem descompunerea
AV − jωV + B = 0
unde uo = Cexeo.
1. Controlabilitatea
2. Observabilitatea
3. Descompunere Structurala
4. Realizabilitate
5. Conexiunea Sistemelor
Stare/Sistem Controlabil(a)
Definitia 36. O stare x ∈ Rn se numeste controlabila la momentul t > 0 daca
exista o comanda u(·) ∈ U care transfera xo = 0 (originea) in starea x(t) = x.
Gramian de Controlabilitate
Z t Z t
T
T AT (t−τ )
0= xTK Lc(t)xK = xTK eA(t−τ ) BB T eA (t−τ )xK dτ = kB e xK k2dτ
0 0
T
si din analiticitatea functiei B T eA (t−τ ) xK pe [0, t].
Suficienta: Presupunem ca x ∈ Im Lc(t) ceea ce este echivalent cu
Z t
T
x = Lc(t)z = eA(t−τ ) BB T eA (t−τ )
zdτ (34)
0
T AT (t−τ )
u(τ ) := B e z, τ ∈ [0, ∞) (35)
Im Lc(t) = Im R. (38)
Demonstraţie. Sa observam mai intai ca Lc(t) fiind simetrica conditia (49) este
Z t Z t
T A(t−τ ) T AT (t−τ )
Lc(t)x = 0 ⇔ x e BB e xdτ = 0 ⇔ kxT eA(t−τ ) Bk2dτ = 0.
0 0
Rezulta succesiv ca
xT eA(t−τ ) B = 0, ∀0 ≤ τ ≤ t,
xT eAτ B = 0, ∀τ ∈ R,
ultima egalitate rezultand din analiticitatea functiei xT eAτ B (daca o functie
analitica este nula pe un interval deschis atunci este nula pe toata axa reala, iar
dk T AT τ
k
[B e x]τ =0 = 0, k = 0, 1, 2, . . .
dt
de unde
xT B = 0, xT AB = 0, , . . . , xT Ak B = 0, . . .
T
2 n−1
ceea ce este echivalent cu x B AB A B . . . A B = 0 sau xT R = 0.
T
Aratam
acum implicatia inversa. Fie x 6
= 0 a.i. x R = 0. Atunci
xT B AB A2B . . . An−1B = 0 sau inca
xT B = 0, xT AB = 0, , . . . , xT An−1 B = 0.
xT Ak B = 0, ∀k ≥ 0.
φ(τ ) = 0, ∀τ ∈ [0, t]
si mai departe ca Z t
xT Lc(t)x = φ(τ )φ(τ )T dτ = 0.
0
Cum Lc(t) ≥ 0 rezulta in continuare Lc(t)x = 0 q.e.d.
lim Lc(t)
t→∞
ALc + LcAT + BB T = 0
unde
T AT τ T AT τ T AT τ 1
ui(τ ) = B e zi = B e L−1
c xi =B e xi .
σi
Energia comenzii este
Z ∞
2 1 T Aτ T AT τ 1 T 1 T 1
kui(τ )k2 = 2 xi e BB e xidτ = 2 xi Lcxi = 2 xi σixi = .
σi 0 σi σi σi
Subspatii controlabile
Se introduc
k−1
Rk := B AB ... A B , Rk := Im Rk , k ≥ 1,
AV = V J
b= B1 A1B1 A21B1 ··· An−1
1 B1 }ρ
R .
O O O ··· O
Daca spatiul A–invariant (ce contine si Im B) in raport cu care s-a facut descom-
punerea este chiar R, atunci perechea (A1, B1) este automat controlabila si avem
ca rank R = rank R b = ρ = ν (indicele de controlabilitate).
Teorema 42 (Teorema de Descompunere Controlabila). Un sistem dinamic oare-
care descris de (A, B, C, D), A ∈ Rn×n, B ∈ Rn×m, C ∈ Rp×n, D ∈ Rp×m este
in care perechea (A1, B1) este controlabila. Mai mult, sistemele (A, B, C, D),
b B,
(A, b C,
b D) si (A1, B1, C1, D) sunt echivalente intrare–iesire, i.e.,
" #
A B b B
A b A1 B1
T (s) = = b D = .
C D C C1 D
Rangul ultimei matrici este insa mai mic decat n pentru orice s ∈ Λ(A2) ceea ce
contrazice (42).
e = T R.
R
Nul Controlabilitate
Exercitii: a) Aratati ca o stare este controlabila daca si numai daca este nul
controlabila.
b) Perechi cu matricea B monica. (Explicitare)
Gramian de Observabilitate
Din cele discutate mai sus am vazut ca (ne)observabilitatea unei stari nu depinde
de momentul de timp. In continuare vom obtine o caracterizare a subspatiului
starilor neobservabile pe baza matricii de observabilitate – notiune duala celei de
matrice de controlabilitate.
(sau mai precis unei perechi matriciale (C, A), C ∈ Rp×n, A ∈ Rn×n). Matricea
de observabilitate are dimensiune (np) × n.
Teorema 48. Fie t > 0 fixat. Atunci x ∈ Ker Lo(t) ⇔ x ∈ Ker Q =: Q, i.e.,
Daca matricea A este asimptotic stabila (Λ(A) ⊂ C−) atunci limt→∞ Lo(t)
este finita, se noteaza cu Lo ∈ Rn×n = LTo ≥ 0 si este numita Gramian de
Observabilitate asimptotic. El verifica automat ecuatia Lyapunov
AT Lo + LoAT + C T C = 0
si are expresia Z ∞
AT τ
Lo := e C T CeAτ dτ.
0
Observatii: a) Similar ca in cazul controlabilitatii, observabilitatea unui sistem se
poate testa dpdv procedural verificand ca rank Q = n (matricea Q este monica –
rang intreg pe coloane).
b) Daca perechea (C, A) este observabila atunci automat Lo(t) > 0 si Lo > 0.
Gramianul de observabilitate asimptotic se poate calcula ca solutia unica a ecuatiei
Lyapunov respective.
Deci cu exceptia sistemelor din Ker Lo(t), toate celelalte “se vad” la iesire.
Subspatii neobservabile
Se introduc
C
CA
Qk :=
..
,
Nk := Ker Qk , k ≥ 1,
CAk−1
sau pe scurt
lim Nk = Nµ = Nn.
k→∞
N = Ker Q.
N = Ker C ∩ A−1N
sau inca
AN ⊂ N , N ⊂ Ker C
adica N este un subspatiu A–invariant continut in Ker C. Mai mult, se poate
arata (exercitiu) ca N este cel mai mare subspatiu A–invariant continut in Ker C.
Deasemenea, considerand ecuatia
T = Ker C ∩ A−1T
Rk (A, B) = Nk (B T , AT )⊥.
b = T AT −1 = A1 A3 }n − µ
A
O A2 }µ
,
|{z} |{z}
n−µ µ
" #
A B b B
A b A2 B2
T (s) = = b D = .
C D C C2 D
" #
A B A b
b B A1 B1
T (s) = = b D = .
C D C C1 D
Fie
X1 := R ∩ N (51)
si introducem subspatiile X2 si X3 ca fiind complementii lui X1 in R si respectiv
N , i.e.,
R = X1 ⊕ X2 , (52)
N = X1 ⊕ X3 . (53)
Rn = (R ∪ N ) ⊕ X4 = X1 ⊕ X2 ⊕ X3 ⊕ X4 (54)
AR ⊂ R, Im B ⊂ R (55)
AN ⊂ N , N ⊂ Ker C (56)
rezulta ca
AX1 ⊂ X1, X1 ⊂ Ker C. (57)
Fie Xi matrici baza pentru subspatiile Xi (i=1...4), Xi =< Xi > si
−1
T := X1 X2 X3 X4 . (58)
deci perechea (A22, B2) este controlabila. Aplicand criteriul PBH dual perechii
(61) rezulta similar ca perechea (C2, A22) este observabila. In consecinta rezulta
ca (sub)sistemul (A22, B2, C2, D) este controlabil si observabil (se mai numeste
partea controlabila si observabila a sistemului initial) si inca
" #
A B b B
A b A22 B2
T (s) = = b D = .
C D C C2 D
rij (s)
T (s) = , grad(pij ) ≥ grad(rij ), ∀i, j,
pij (s) 1≤i≤p
1≤j≤m
k−1
K 0 + K 1 s + . . . + Kk−1 s
Te(s) = (63)
γ0 + γ1s + . . . + γk−1sk−1 + sk
unde γ(s) := γ0 + γ1s + . . . + γk−1sk−1 + sk este cel mai mic multiplu comun
(monic) al numitorilor tuturor elementelor rationalei Te(s) iar Ki, i = 0, . . . , k − 1,
sunt p × m matrici constante.
Om Im Om
... ..
A=
,B =
, C = K0 K1 . . . Kk−
Om
Im
−γ0Im −γ1Im . . . −γk−1Im Im
(64)
Studiem acum relatiile care exista intre doua realizari ale unei matrici rationale
proprii. In primul rand este clar ca cele doua matrici ”D” sunt egale. Dezvoltand
Te(s) in serie Laurent in jurul punctului s = ∞ obtinem pentru ksk > r, unde r
Kk−1 = Γ1
Kk−2 = Γ2 + γk−1Γ1
... ... ...
K0 = Γk + γk−1 Γk−1 + . . . + γ1Γ1
0 = Γk+i + γk−1 Γk−1+i + . . . + γ0Γi, i ≥ 1.
Γo := D, Γi = CAi−1B, ∀i ≥ 1. (69)
Deci toate realizarile lui T (s) au aceeasi coeficienti Markov, identici cu cei ai lui
T (s). Introducem matricile de tip Hankel
j−1
Γ1 Γ2 . . . Γj CB CAB ... CA B
Γ2 Γ3 . . . Γj+1 CAB CA2B ... CAj B
Hij =
..
=
..
Γi Γi+1 . . . Γj+i−1 CAi−1 B CAiB . . . CAj+i−2B
(70)
e iR
QiRj = Q ej , ∀i ≥ 1, j ≥ 1. (72)
Realizari minimale
Definitia 55. O realizare (A, B, C, D) a rationalei proprii T (s) se numeste min-
imala daca orice alta realizare are dimensiunea spatiului starilor mai mare sau
egala cu aceasta.
rank Rn = rank Qn = n
rezultand in continuare ca
e < n.
n
e nR
QnRn+1 = Q en+1 (74)
QnB = Q e
e nB, QnARn = Q eR
e nA en . (75)
Deoarece Q e Tn Q
e n este monica atunci Q e n este nesingulara si din prima relatie din
(75) rezulta
Be = TB (76)
unde
eT Q
T := (Q e n)−1Q
e T Qn ∈ Rn×n.
n n
eR
de unde CRn = C en sau inca
e = CS.
C (78)
Din (76), (77) si (78) rezulta ca cele doua realizari sunt echivalente pe stare daca
aratam ca S = T −1. Intr–adevar,
e Tn Q
T S = (Q e n)−1Q
e Tn QnRnR
enT (R
enR
enT )−1 = (Q
e Tn Q
e n)−1 Q
e Tn Q
e nR
enR
enT (R
enR
enT )−1 = I.
Teorema 58. Fie µ si ν cei mai mici intregi pentru care rank Hµ,ν =
rank Hµ+i,ν+j . Atunci ν = µ = n, unde n este dimensiunea realizarii mini-
male.
rij (s)
T (s) = , grad(pij ) ≥ grad(rij ), ∀i, j.
pij (s) 1≤i≤p
1≤j≤m
k−1
K 0 + K 1 s + . . . + Kk−1 s
Te(s) = (80)
γ0 + γ1s + . . . + γk−1sk−1 + sk
unde γ(s) := γ0 + γ1s + . . . + γk−1sk−1 + sk este cel mai mic multiplu comun
(monic) al numitorilor tuturor elementelor rationalei Te(s) iar Ki, i = 0, . . . , k − 1,
sunt p × m matrici constante.
Consideram cateva posibile conexiuni standard ale sistemelor dinamice descrise prin
intermediul realizarilor de stare si ne punem problema sa gasim o realizare de stare
pentru sistemul echivalent rezultant. In particular, vom considera urmatoarele
tipuri de conexiuni: serie, paralel, bucla cu reactie inversa, transformare liniar
fractionara si produs Redheffer.
Observatii: • Un sistem este inversabil daca si numai daca are acelasi numar de
intrari si iesiri (p = m).
• Ipoteza de inversabilitatea a lui D nu este necesara pentru existenta inversei
Conexiunea paralel
Conexiunea serie
Fie doua sisteme (84) si (85), avand matricile de transfer date in (86). Daca
numarul de iesiri ale sistemului T1 este egal cu numarul de intrari ale sistemului
Fie doua sisteme (84) si (85), avand matricile de transfer date in (86). Daca
numarul de iesiri ale sistemului T1 este egal cu numarul de intrari ale sistemului T2
si numarul de iesiri ale sistemului T2 este egal cu numarul de intrari ale sistemului
Aceste conexiuni pot fi privite ca o extensie la clasa sistemelor (sau mai precis la
clasa functiilor matriceale rationale) a transformari liniar fractionare (sau Moebius)
din cazul scalar
a + bλ
f (λ) = ,
c + dλ
unde a, b, c, d sunt scalari.
ẋ = Ax + B1u1 + B2u2,
y1 = C1x + D11u1 + D12u2, (94)
y2 = C2x + D21u1 + D22u2,
si
ẋc = Acxc + Bcuc,
(95)
yc = Ccxc + Dcuc,
avand matricile de transfer
A B1 B2
T11(s) T12(s)
T (s) = = C1 D11 D12 (96)
T21(s) T22(s)
C2 D21 D22
si
Ac Bc
Tc(s) = . (97)
Cc Dc
I D22
(98)
Dc I
A + B2S DcC2 e−1 e−1
B2S Cc e−1
B1 + B2S DcD21
B S −1
C A + B S −1
D C B S −1
D
TR(s) = c 2 c c 22 c c 21 ,
C1 + D12DcS −1C2 D12Se−1Cc D11 + D12DcS −1D21
(100)
unde S := I − D22Dc si Se := I − DK D22 care sunt ambele inversabile din ipoteza
de inversabilitate asupra matricii (98). In particular avem DcS −1 = Se−1Dc si
S −1D22 = D22Se−1 asa cum rezulta din identitatea matriciala U (I − V U )−1 =
(I − U V )−1 U care are loc pentru oricare matrici U si V de dimensiuni compatibile.
Consideram din nou doua sisteme (94) si (95) avand matricile de transfer (96)
si (97). Daca T11 are numarul de intrari/iesiri egal cu numarul de iesiri/intrari
ale lui Tc (mc = p1, pc = m1) atunci se defineste transformarea liniar fractionara
superioara (TLFS) a lui T cu Tc (in aceasta ordine) ca fiind sistemul cu intrarea
u := u2 si iesirea y := y2 obtinut punand u1 ≡ yc si uc ≡ y1. Conexiunea este
Daca T22 are numarul de intrari/iesiri egal cu numarul de iesiri/intrari ale lui Tc11
(mc1 = p2, pc1 = m2) atunci se defineste produsul Redheffer al lui T cu Tc (in
TR =
−1 −1
T11 + T12Tc11(I − Tc22Tc11) T21 T12(I − Tc11T22) Tc12
T ⊗ Tc :=
Tc21(I − T22Tc11)−1T21 Tc22 + Tc21T22(I − Tc11T22)−1Tc12
(106)
Anumite elemente structurale ale matricilor rationale joaca un rol aparte in teoria
controlului sistemelor dinamice pe spatiul starilor: poli, zerouri, forma Smith
McMillan, directiile de poli/zerouri, indicii singulari stanga si dreapta.
Conceptele de pol si zerou sunt considerabil mai dificile decat in cazul scalar in
principal datorita posibilitatii ca o matrice rationala sa aibe pol si zerou in acelasi
punct so ∈ C, cat si datorita posibilitatii existentei polilor si zerourilor la infinit
(un concept relativ greu de explicitat in cazul multivariabil).
In cazul sistemic avem doua notiuni de poli: poli ai matricii de transfer (vazuta
ca matrice rationala) si poli ai sistemului pe spatiul starilor definiti ca fiind valorile
proprii ale matricii A. Mai precis, so ∈ C este pol al matricii de transfer rationale
T (s) daca este pol cel putin al unui element al sau considerat ca rationala
ireductibila. Polii matricii de transfer coincid cu polii sistemului daca si numai
daca realizarea corespunzatoare este minimala.
unde prin rank nT (s) intelegem rangul normal al rationalei, i.e., rangul pentru
aproape toti s ∈ C. In termeni sistemici, cand T (s) are semnficatia de matrice
de transfer a unui sistem, zerourile ei se mai numesc zerouri de transmisie ale
sistemului.
(sI − A)x − Bu = 0,
Cx + Du = y
sau echivalent
sI − A −B x 0
= .
C D u y
Matricea polinomiala (de grad 1)
sI − A −B
S(s) := ∈ R[s](n+p)×(n+m) (108)
C D
Din identitatea
sI − A −B
=
C D
−1
I O sI − A O I −(sI − A) B
C(sI − A)−1 I O T (s) O I
se observa ca daca s0 6∈ Λ(A) atunci so este zerou invariant daca si numai daca
este zerou de transmisie.
Problemele majore apar insa atunci cand exista zerouri comune cu poli. Pentru a
intelege riguros aceste concepte avem nevoie de o teorie mai sofisticata a formelor
canonice pentru matrici rationale si matrici polinomiale de gradul 1 (numite
fascicole matriciale).
ǫi(s) | ǫi+1(s),
i = 1, . . . , r − 1. (111)
ηi+1(s) | ηi(s),
Gradul McMillan al lui T este prin definitie suma tuturor ordinelor polilor (finiti si
infiniti). Deci gradul McMillan al unei matrici rationale este egal cu numarul de
poli (socotind ordinele inclusiv ale polilor de la infinit).
Observatie: Daca rationala este proprie atunci nu are poli la infinit si definitiile de
mai sus se simplifica corespunzator.
Nucleul la dreapta (peste rationale) are dimensiune m − r iar nucleul la stanga are
dimensiune p − r. Introducem in continuare notiunile de indici minimali la dreapta
si stanga. Pentru acesta avem nevoie de cateva notiuni de subspatii rationale.
2. P (s) este redusa pe coloane (sau proprie pe coloane). Mai precis, fie ni gradul
coloanei i a lui P (s) si construim matricea constanta Pn a carei coloana i este
coeficientul vectorial al lui sni in coloana i a lui P(s). Atunci P(s) este de tip
coloana redusa daca Pn este monica.
Echivalent, o baza polinomiala este minimala daca suma tuturor gradelor vectorilor
polinomiali care o formeaza este cat mai mica posibila.
Multimea gradelor vectorilor din orice baza minimala a unui subspatiu este invari-
anta in raport cu operatiile unimodulare pe coloane, si aceste grade se numesc
Pentru o matrice rationala arbitrara are loc o relatie interesanta intre indicii
structurali. Fie nr si nℓ suma indicilor minimali la dreapta si respectiv la stanga si
fie nz si np numarul total de zerouri si respectiv de poli. Atunci are loc relatia
np = nz + nr + nℓ.
Cele nf radacini ale lui χ(s) se numesc valori proprii generalizate finite ale
fascicolului sM − N .
f−N
Q(sM − N )Z = sM e. (116)
Q(sM − N )Z = sMW − NW
Daca M este inversabila atunci fascicolul nu are are valori proprii infinite si forma
canonica Weierstarss se reduce la forma canonica Jordan a matricii M −1N .
Polinomul caracteristic χ(s) al fascicolului este cel mai mare divizor comun al
polinoamelor Ri(s), unde {Ri(s)} este multimea tutoror minorilor de dimensiune
r.
unde
Lǫ1
...
Lǫνr
sM∞ − In∞
sMKR − NKR := sInf − Nf , (119)
LTη1
...
LTην
ℓ
k poate fi zero corespunzand unei linii sau coloane de zerouri in fascicolul (119).
Structura Kronecker este complet determinata de partea regulata si singulara.
Valorile proprii (finite si infinite) ale fascicolului sM − N sunt valorile proprii ale
fascicolului regulat
M∞ O I n∞ O
s −
O I nf O Nf
Partea singulara a fascicolului este determinata de structura singulara Kronecker la
stanga si dreapta. Blocurile de dimensiune ǫi × (ǫi + 1) notate Lǫi , (i = 1, . . . , νr ),
sunt blocurile elementare Kronecker la dreapta si ǫi ≥ 0 sunt indicii Kronecker la
dreapta. Blocurile de dimensiune (ηj + 1) × ηj notate Lηj T , (j = 1, ..., νℓ), sunt
blocurile elementare Kronecker la stanga si ηj ≥ 0 sunt indicii Kronecker la stanga.
Intre elementele structurale ale matricii de transfer rationale T (s) a unui sistem
dinamic si formele canonice ale fasciolelor
sI − A −B
sI − A,
C D
P(T ) ⊂ Λ(A).
Z(T ) ⊂ Λ(ET , AT ).
3. Estimatori de Stare
4. Estimatori de Tip 1
5. Compensatorul Kalman
unde xc(t) ∈ Rnc , uc(t) ∈ Rp, yc(t) ∈ Rm, cuplat in reactie inversa cu (122) a. i.
u ≡ yc + uR, yR ≡ y ≡ uc
˙
x A + BDcC BCc x B
= + uR
xc BcC Ac +
BcDCc xc Bc D (124)
x
yR = C DCc + DuR.
xc
Notand
x A + BDcC BCc B
xR := , AR := , BR := ,
xc Bc C Ac + BcDCc Bc D
CR := C DCc , DR := D
• Parametrizarea lui Youla: cea mai completa solutie disponibila (foloseste implicit
principiul separatiei) necesitand insa dezvoltarea teoriei factorizarilor de matrici
rationale peste S (relativ sofisticata) – solutia este formal identica cu cazul
SISO.
Extensie dinamica
= Ae + BeKCe (126)
A O B O C O Dc Cc
Ae := , Be := , Ce := , K := .
O O O I nc O I nc Bc Ac
(127)
Deci problema originala de stabilizare/alocare dinamica prin gasirea compensatoru-
lui (Ac, Bc, Cc, Dc) s–a redus la problema echivalenta de gasire a matricii constante
K astfel incat spectrul matricii (126) sa fie in C−. Aceasta din urma problema este
in fapt o problema de gasire a unei reactii constante dupa iesire (reactie inversa cu
compensator constant) pentru sistemul (Ae, Be, Ce).
Sistemul extins (Ae, Be, Ce) se obtine prin adaugarea la sistemul initial (A, B, C, D)
a sistemului
ẋa(t) = ua(t),
ya(t) = xa(t),
• Constructia unei legi de reactie dupa stare F ∈ Rm×n care aloca sau stabilizeaza
(face ca matricea A + BF sa aibe spectrul dorit sau sa fie asimptotic stabila).
In final, regulatorul (de tip Kalman) se obtine luand reactia F dupa starea estimata.
Problema de alocare (cu reactie dinamica dupa iesire) are solutie daca si numai
daca perechea (A, B) este controlabila si perechea (C, A) este observabila.
Problema de stabilizare (cu reactie dinamica dupa iesire) are solutie daca si numai
daca perechea (A, B) este stabilizabila si perechea (C, A) este detectabila.
u = F x + Gv (128)
Λ(A + BF ) ⊂ C−.
Λ(A + BF ) = Λ0.
legea de comanda dupa stare implica accesul (din punct de vedere tehnic) la stare,
i.e., cunoasterea marimii de stare ! Dupa implementarea comenzii (128) sistemul
q T R = eTn (132)
T 1×n
are solutie unica q = eTn R−1
∈ R , unde eTn
= 0 . . . 0 1 (q T este
ultima linie a lui R−1 ). Fie Λ0 un set simetric fixat de n numere complexe si,
χ(A + bf T ) = 0
qT b = 0
q T Ab = 0
..
q T An−2b = 0
q T An−1b = 1
qT = qT
q T (A + bf T ) = q T A
q T (A + bf T )2 = q T A2
.. (134)
q T (A + bf T )n−1 = q T An−1
q T Anb = q T An + q T An−1 bf T = q T An + f T .
Alegand
f T := −q T χ(A) (136)
rezulta automat ca
q T χ(A + bf T ) = 0. (137)
0 0 ... 0 1 T
q
0 0 ... 1 0 qT A
T χ(A + bf T ) = 0, TR = .. .. .. .. .. ,
T := . .
.
0 1 ... 0 0
q T An−1
1 0 ... 0 0
unde uk ∈ Rm.
xk+1 = Axk + Buk ∈ Sk := Im x1 x2 . . . , xk , ∀uk ∈ Rm. (139)
Axk ∈ Sk , Im B ∈ Sk .
= Im x2 − Bu1 x3 − Bu2 . . . xk+1 − Buk ⊂ Sk
ceea ce inseamna ca Sk este A–invariant si contine Im B. Deoarece perechea
(A, B) este controlabila avem ca R = Rn si deci
Rn = R ⊂ Sk
Bui = BF xi, i = 1, 2, . . . , n − 1
xk+1 = (A + BF )xk , k = 1, 2, . . . , n − 1, x1 = b
sau inca
xk = Ak−1
F b, k = 1, 2, . . . , n.
Deoarece xk sunt liniar independenti rezulta ca matricea
b AF b . . . An−1
F b
Λ(AFe + bf T ) = Λ0.
de unde concluzia ca perechea (A, B) este alocabila si reactia care aloca este data
de (141).
Necesitatea: Pp prin absurd ca perechea (A, B) este alocabila dar nu este
b+B
Λ(A + BF ) = Λ(A b Fb) = Λ(A1 + B1F1) ∪ Λ(A2)
n−1
R= b Ab . . . A b
in necunoscuta q ∈ Rn.
Pasul 3: Se calculeaza
f T = −q T χ(A).
AFe := A + B Fe , b = Bg.
F = Fe + gf T .
Asa cum am vazut, legea de comanda cu reactie dupa stare poate asigura in
mod satisfacator cerintele fundamentale ale sintezei sistemelor de stabilizare si
alocare cu conditia ca starea sa fie disponibila pentru masura (sa fie accesibila
dpdv tehnic). Din pacate acest lucru nu este in general posibil si atunci ne punem
problema estimarii cat mai exacte a starii unui sistem dinamic prin constructia
unui nou sistem care sa citeasca marimile accesibile sau masurabile (intrarea u si
iesirea y) si care sa genereaze la iesire o estimare a starii x
b. Un astfel de sistem se
numeste estimator de stare (FIG).
Problema: Dandu–se un sistem
ẋ(t) = Ax(t) + Bu(t), x(0) = xo
(145)
y(t) = Cx(t) + Du(t),
(care are deci ca intrari intrarea u si iesirea y, are ca iesiri starea estimata x
b, si
marimea de stare w) care sa indeplineasca simultan urmatoarele doua conditii:
Λ(J) ⊂ C−.
w−Vx
ẇ − V ẋ = Jw + Hy + M u − V Ax − V Bu,
′
(w − V x) = J(w − V x) + JV x + HCx + HDu − V Ax + (M − V B)u,
b − x = Kw + N y + P u − x = K(w − V x) + KV x + N Cx + N Du − x + P u
x
Obtinem deci
Λ(J) ⊂ C−,
JV + HC − V A = 0,
KV + N C − I = 0,
JV + HC − V A = 0,
KV = I
Aceasta conditie se poate satisface automat daca perechea (C, A) este detectabila,
caz in care alegem −H egal cu reactia care stabilizeaza (problema de stabilizare
pentru perechea (AT , C T )). Mai mult, daca perechea (C, A) este observabila,
atunci spectrul matricii de stare J a estimatorului poate fi alocat arbitrar.
rezultand
ẇ(t) = (A − HC)w(t) + Bu(t) − HDu(t) + Hy(t),
(149)
b(t) = w(t),
x
ḃ = Ab
x b + Du − y)
x + Bu + L(C x (150)
in care este cunoscut sub numele de estimator Luenberger (am notat L := −H).
unde Λ(A1) 6⊂ C− (aceasta rezulta automat din testul PBH aplicat perechii
nedetectabile (C, A)). Fie s+ 6∈ C− o valoare proprie si x+ un vector propriu
corespunzator ale lui A1. Luam starea initiala x0 a sistemului (A, B, C, D) de
forma
x+
xo = .
O
Evident xo apartine subspatiului neobservabil al perechii (C, A), i.e., x0 ∈ N (C, A).
Deasemenea luam w(0) = 0 si u(t) ≡ 0. Atunci ecuatiile pentru x si estimatorul
(146) sunt
ẋ = Ax,
ẇ = Jw + HCx,
b = Kw + N Cx.
x
si deasemenea
w(t) = 0, b(t) = 0,
x ∀t.
Pe de–alta parte, avem
Observatii: a) Dimensiunea unui estimator de tip Luenberger (de tip 1) este egala
cu n (dimensiunea spatiului starilor sistemului orginal (A, B, C, D)). Asa cum vom
vedea mai tarziu, in anumite situatii se pot construi estimatoare de dimensiune mai
sau inca
x − Ly,
ḃ = (A + LC + BF + LDF )b
x
(153)
u = Fx b,
si deci sistemul in bucla inchisa este intern asimptotic stabil (si eventual are
dinamica prescrisa).
Observatii: a) Polii sistemului in bucla inchisa sunt dati de reuniunea polilor alocati
ai lui A + BF prin reactia dupa stare F cu polii alocati de estimator Λ(A + LC)
prin reactia L. Cele doua alocari se pot face independent, punandu-se astfel in
evidenta celebrul principiu al separatiei.
b) Un sistem este stabilizabil/alocabil prin reactie (dinamica) dupa iesire daca
x1
y = Cx + Du = O Ip + Du = x2 + Du
x2
Asa cum am vazut, pentru constructia unui estimator general (146) trebuie sa
si obtinem
V1A1 + V2A2 = JV1, V1 A3 + V2A4 = JV2 + H,
K1V1 = I, K1V2 + N1 = 0,
K2V1 = 0, K2V2 + N2 = I.
Alegem K1 := V1 := I si rezulta automat K2 = 0, N2 = I, N1 = −V2 ceea ce
Daca perechea (A1, A2) este detectabila (observabila) atunci putem alege automat
V2 := L unde L este reactia care aloca Λ(A1 + LA2) ⊂ C− iar H se defineste pe
baza ultimei ecuatii din (155).
Ramane sa aratam ca perechea (A1, A2) este detectabila daca sunt indeplinite
conditiile de existenta ale unui estimator general, i.e. perechea (C, A) este
detectabila. Formulam acest rezultat sub forma unei propozitii de sine statatoare.
Teorema 74. Fie un sistem (A, B, C, D) avand matricea C epica.
i) Exista o transformare de coordonate a.i.
A1 A3 }n − p
T AT −1 =
A2 A4 }p
,
|{z} |{z}
n−p p
sI − A1 −A3
sI − A T (sI − A)T −1
rank = rank = rank −A2 sI − A4
C CT −1
O Ip
sI − A1
= p + rank , ∀s ∈ C
A2
de unde concluzia rezulta direct din criteriul Hautus de detectabilitate (observabil-
itate).
sau inca
ẋ1 = A1x1 + A3y + B1u,
(160)
ẏ − A4y − B2u = A2x1,
care este un sistem cu dinamica x1 ce se doreste estimata si intrarile u si y.
ḃ = Ab
x x +Bu+L(C x b +Du−y) = Ab x +Bu+LדEROAREA DE ESTIMARE”.
(161)
Scriind un astfel de estimator pentru sistemul (160) obtinem
b1 = w − Ly si notam V2 := L.
Eliminam ẏ facand schimbarea de variabile x
Obtinem echivalent
sau inca
Fie un sistem
ẋ = Ax + Bu,
(166)
y = Cx + Du,
si un estimator general descris de ecuatiile
ẇ = Jw + Hy + M u,
(167)
b = Kw + N y + P u,
x
N y + P u = N Cx + N Du − N Du = N Cx, (169)
ẋ = Ax + Bu = Ax + BF x
b = Ax + BF (Kw + N y + P u)
(170)
= Ax + BF Kw + BF N Cx = (A + BF N C)x + BF Kw
HDu = HDF x
b = HDF (Kw + N Cx) = HDF N Cx + HDF Kw
si obtinem
A + BF N C + BF KV BF K A + BF BF K
T ART −1 = = ,
−V A + HC + JV J O J
unde pentru ultima egalitate am folosit proprietatile d) si b). Din relatia de mai
sus concluzionam ca
Λ(AR) = Λ(A + BF ) ∪ Λ(J)
Problematica, Ipoteze
In aceasta sectiune abordam problema reglarii sistemelor dinamice. Problema
clasica de reglare intern stabila consta in gasirea unui regulator care sa realizeze
simultan urmatoarele deziderate asupra sistemului rezultant in bucla inchisa:
ẋ = Ax + Bu
(173)
y = Cx
ẋK = AK xK + BK ǫ
(174)
u = CK xK + DK ǫ,
lim ǫ(t) = 0.
t→∞
˙
x A − BDK C BCK x BDK
= + r
xK −BK C AK xK BK
x
ǫ = −C O + Ip r (177)
xK
x
y = C O
xK
unde
A − BDK C BCK BDK
AR = , BR = , CR = −C O , D R = Ip , xR
−BK C AK BK
(179)
Conditia (S) de stabilitate interna devine atunci
Λ(AR) ⊂ C−
sau
ẋRr = ARr xRr , xRr (0) = xRro,
(181)
ǫ = CRr xRr
unde am folosit notatiile
AR BRCr xR xRo
ARr = , CRr = CR Cr , xRr = , xRro =
O Ar xr xro
(182)
Conditia de reglare (Re)
de unde
−1 AR ARV + BRCr − V Ar
S ARr S = , CRr S = CR CRV + Cr
O CR V + Cr
AR V + BRCr − V Ar = 0, CR V + Cr = 0. (184)
Deci existenta unei matrici V care satisface relatiile (184) este echivalenta cu
satisfacerea cerintei de reglare (Re) explicitata sub forma (183).
Observatie: Prima conditie (184) este o ecuatie Sylvester ce are intotdeauna o
solutie unica deoarece Λ(AR) ⊂ C− si Λ(Ar ) ⊂ C+ ∪ C0 (Explicati acest lucru
pe baza conditiilor generale de existenta/unicitate a solutiilor ecuatiilor Sylvester –
vezi Appendix).
In concluzie am redus problema originala de reglare intern asimptotic stabila la
gasirea unui sistem (AK , BK , CK , DK ) a.i. :
e
K(s) = K(s)M (s) (185)
ẋ = Ax + Bu,
y = Cx,
" #
e B
A e A O B
Te = = −BM C AM O . (188)
e D
C e
O CM O
" #
e B
A e A O B
Te = = −C O O . (189)
e D
C e
O Ip O
Pentru scrierea unui estimator de ordin redus folosim direct formulele (158)
A O A1 A3 B B1
e=
A = e=
,B = e=
,C O Ip .
−C O A2 A4 O B2
=
ẇ (A + LC)w
+ (A + LC)Ley + Bu,
b1
x In−p L (190)
b=
x = w+ ye.
b2
x O Ip
e B)
Intr-adevar, daca (A, B) stabilizabila si are loc (192) atunci (A, e este stabilizabila
(Ex: Demonstrati acest lucru folosind criteriul PBH).
sau eliminand w prin inlocuire din a doua ecuatie si inlocuind u in prima ecuatie
obtinem
b˙1 = (A + LC + BF )b
x x1 + +B Fe x
b2 + Lǫ
b˙2 = ǫ
x (194)
u = Fx b1 + Fe x
e2
ARV = −BR
– Exercitiu –
T N T −1 = NJ (200)
unde
NJ := diag (N11(s1), N22(s2), . . . , Nkk (sk )), (201)
Fie {s1, s2, . . . , sr , sr+1, . . . , sk , sr+1, . . . , sk } spectrul lui N , unde s1, . . . , sr , sunt
valorile proprii reale si sr+1, . . . , sk , sr+1, . . . , sk , sunt valorile proprii care nu sunt
reale si apar in perechi complex conjugate.
Nii(si) := diag (Js(i) (αi, βi), Js(i) (αi, βi), . . . , Js(i) (αi, βi)), (204)
1 2 hi
K(αi, βi) I2
K(αi, βi) I2
Js(αi, βi) := K(αi, βi) . . . (205)
... I2
K(αi, βi)
Cel mai simplu exemplu de spatiu invariant sunt vectorii proprii. Este usor de
verificat ca daca V este un subspatiu invariant de dimensiune ℓ, atunci exista o
transformare de similaritate U , partitionata
U = U1 U2 , (207)
|{z} |{z}
ℓ n−ℓ
A|V := A11,
Λ(A)|V := Λ(A11).
C = Cg ∪ Cb.
yi = Axi , i = 1, 2,
atunci
(α1y1 + α2y2) = A(α1x1 + α2x2), ∀α1, α2 ∈ F.
Alegand baze in ambele subspatii X si Y putem intotdeauna reprezenta aplicatia
A printr-o matrice m × n pentru care se foloseste adesea (prin abuz de notatie!)
tot simbolul A.
In Teoria Sistemelor este adesea util sa consideram anumite aspecte geometrice
ale aplicatiei A mai degraba decat proprietatile matricii A, cu toate ca – evident
– cele doua puncte de vedere sunt strans relationate.
A−1R := {x | y = Ax, y ∈ R} .
Se poate verifica imediat ca ambele multimi sunt de fapt subspatii ale lui Y si
respectiv X .
Im A := AX = {y | y = Ax, x ∈ X } ⊂ Y;
Baze pentru aceste subspatii se obtin facand anumite descompuneri ale matricii A.
O
i.e., orice vector apartine nucleului lui X.
x2 }n − r
Im (A · B) = AIm B
Ker (A · B) = B −1Ker A
Demonstraţie. Avem
Im (AB) = {y | ABx = y, x ∈ X }.
Deoarece
Im B = {z | Bx = z, x ∈ X }
Im (AB) = {y | Az = y, z ∈ Im B} = AIm B.
sau inca
{x | Bx = z, z ∈ Ker A} = B −1Ker A.
Im (A · B) = AIm B = AZ = Im A.
Im A = Im U ΣV ∗ = Im U Σ = U Im Σ
si
O
Ker A = V Im = Im V2.
In−r
Pentru imaginea si nucleul lui A∗ se pot folosi descompuneri similare pentru
A∗ = V Σ∗U ∗.
Corolarul 81.
Im A⊥ = Ker A∗, Ker A⊥ = Im A∗
Ar1
As1 As2 := AVs , := Ur∗A.
n2{ Ar2
|{z}
n1
A−1R = A−1Ker R = Ker RA = Ker [(RUr )(Ur∗A)] = Ker R2Ar2 = Ker Ar2
Daca in plus dorim sa obtinem baze ortonormale atunci efectuam aplicam transfor-
mari ortogonale asupra lui As1 respectiv asupra lui Ar2 pentru a obtine un numar
Atunci AS este generat de primele s2 coloane ale lui Us si A−1 R este generat de
primele n − n2 coloane ale lui Vr , i.e.:
Din relatiile de mai sus observam ca AS si A−1R sunt concepte duale, similar
precum Im cu Ker . Intr–adevar avem
(A−1S)⊥ = (A∗)S ⊥
0 = V 0 ⊂ V 1 ⊂ V 2 ⊂ · · · ⊂ Vk = X
si este clar ca Λ(A) = Λ(A11) ∪ Λ(A22). Matricea A11 se numeste restrictia lui
A la V : A11 = A|V .
Observati ca suma R1 + R2 si intersectia R1 ∩ R2 a doua subspatii A-invariante
este deasemenea un subspatiu A-invariant. De aici rezulta ca un subspatiu A-
invariant formeaza o latice sub operatiile de adunare si intersectie care prin urmare
va avea intotdeauna un infimum si un supremum.
Anumite ecuatii matriciale liniare precum ecuatia Sylvester, Stein si versiunile lor
simetrice de tip Lyapunov joaca un rol central in teoria sistemelor dinamice liniare.
Prezentam in continuare conditii de solvabilitate si anumite proprietati remarcabile
ale acestor ecuatii.
unde n−, n+ si n0 sunt numarul de valori proprii strict negative, strict pozitive si
2. Ecuatia Stein
AXB − X + C = 0 (217)
are o solutie unica X ∈ Fn×m daca si numai daca
Ecuatii Lyapunov
AX + XA∗ + Q = 0, (219)
iar ecuatia Stein este cunoscuta sub numele de ecuatie Lyapunov (in timp discret)
si are forma
AXA∗ − X + Q = 0. (220)
Urmatorul rezultat este o consecinta directa a Teoremei 83.
Teorema 84 (Ecuatii Lyapunov). Fie A ∈ Fn×n si Q = Q∗ ∈ Fn×n.
AX + XA∗ + Q = 0 (221)
AXA∗ − X + Q = 0 (223)
AX + XA∗ + Q = 0.
AXA∗ − X + Q = 0.
Atunci avem:
(a) Daca δd(A) = 0 atunci νd(A) ≥ πc(X) si πd(A) ≥ νc(X).
(b) Daca δc(X) = 0 atunci νc(X) ≥ πd(A) si πc(X) ≥ νd(A).
AX + XA∗ + BB ∗ = 0
AXA∗ − X + BB ∗ = 0
AXA∗ − X + BB ∗ = 0
A∗X + XA + C ∗C = 0. (225)
A∗XA − X + C ∗C = 0. (226)
Atunci avem:
(a) Ker X ⊂ N (C, A).
(b) Daca ecuatia Lyapunov discreta (226) are o unica solutie X atunci avem
N (C, A) ⊂ Ker X.