Sunteți pe pagina 1din 10

2.3.

Estimarea parametrilor în sistemele dinamice


În cele ce urmează se va prezenta modul de utilizare a algorimului c.m.m.p.
pentru estimarea parametrilor sistemelor dinamice.
Modele cu răspuns finit la impuls (FIR)
Se ştie că un sistem liniar invariant în timp este complet caracterizat prin
răspunsul său la impuls. De regulă, răspunsul la impuls este infinit dimensional.
Deoarece pentru sistemele stabile răspunsul la impuls converge exponenţial la zero,
rezultă că acesta poate fi truncheat. Dar dacă intervalul de discrtetizare este mic în
comparaţie cu constantele sistemului, pentru reprezentarea semnalului truncheat
este necesar un număr mare de parametri. Aceasta conduce la aşa-numitul model al
răspunsului finit la impuls (FIR). Modelul poate fi descris prin ecuaţia:
y (t ) = b1 u (t − 1) + b2 u (t − 2) + L + bn u (t − n) (2.33)
sau
y (t ) = ϕT (t − 1) θ
unde
θ = [ b1 b2 Lbn ]T , ϕT (t − 1) = [ u (t − 1) u (t − 2) L u (t − n) ]T
Acest model este identic cu modelul regresiv (2.1), cu excepţia indexului t din
vectorul regresor care este diferit. Motivul acestei schimbări de notaţie constă în
faptul că este mai convenabil a indicia vectorul regresor cu timpul celei mai recente
date care apar în regresor. Modelul (2.33) corespunde formulării celor mai mici
pătrate, şi atunci, estimatorul este dat de Teorema 2.3.
Estimatorul parametrilor poate fi poate fi reprezentat prin schema bloc din
Fig. 2.3.
y
u ŷ ε
Filtru FIR -1 Σ

θ
Mecanism
de ajustare
Fig. 2.3. Schema bloc a unui estimator parametric recursiv pentru un model FIR
Estimatorul poate fiprivit ca un sistem cu intrarările u şi y şi ieşirea θ .
Întrucât în sistem este disponibil şi semnalul
yˆ (t ) = bˆ1 (t − 1) u (t − 1) + bˆ2 (t − 1) u (t − 2) + L + bˆn (t − 1) u (t − n)
rezultă că se poate considera ca ieşire şi yˆ (t ) . Deoarece yˆ (t ) este o estimare de
predicţie a lui y, estimatorul recursiv poate fi interpretat ca un filtru adaptiv pentru
predictarea lui y.

16
Modele descrise prin funcţii de transfer
Metoda c.m.m.p. poate fi folosită pentru identificarea parametrilor în sisteme
dinamice. Considerăm sistemul descris prin modelul:
A(q) y (t ) = B (q) u (t ) (2.34)
unde q este operatorul de avans cu un pas, iar A(q ) şi B(q) sunt polinoamele:
A(q) = q n + a1 q n −1 + a2 q n − 2 + L + an ; B (q) = b1 q m −1 + b2 q m − 2 + L + bm
Ecuaţia (2.34) se poate rescrie ca o ecuaţie în diferenţe, astfel:
y (t ) + a1 y (t − 1) + L + an y (t − n) = b1 u (t + m − n − 1) + L + bmu (t − n) (2.34a)
Presupunem că pentru secvenţa de intrări { u (1), u ( 2),K, u (t )} , secvenţa
corespondentă observată la ieşire este { y (1), y (2),K, y (t )} . Introducem vectorul
parametrilor:
θ = [ a1 L an b1 L bm ]T (2.35)
şi vectorul regresorilor
ϕ(t − 1) = (− y (t − 1) L − y (t − n) u (t + m − n − 1) L u (t − n) )
T

Deoarece în vectorul regresorilor, ieşirea apare întârziată, acest model


se numeşte model autoregresiv.
Ecuaţia (2.34) capătă următoarea formă regresivă:
y (t ) = ϕT (t − 1) θ
Estimările parametrilor pot fi obţinute prin aplicarea metodei c.m.m.p.
(Teorema 2.1) cu matricea Φ este dată de:
 ϕT (n) 
Φ= M 
ϕT (t − 1)
 
Modele continue descrise prin funcţii de transfer
Vom prezenta modul de aplicare a metodei c.m.m.p. pentru estimarea parametrilor
sistemelor continue. Considerăm un model continu în timp de forma:
dny d n −1 y d m −1u
n
+ a1 n −1 + L + an y = b1 m −1 + L + bmu
dt dt dt
care poate fi rescris prin:
A( p ) y (t ) = B ( p ) u (t ) (2.36)
unde A( p) şi B( p) sunt polinoame în operatorul diferenţial p = d / dt . În
majoritatea cazurilor calculul lui p n y (t ) nu este convenabil deoarece aceasta ar
însemna calculul a n derivate ale ieşirii. De aceea, modelul (3.36) se rescrie sub
forma:

17
A( p ) y f (t ) = B( p) u f (t ) (2.37)

unde y f (t ) = H f ( p ) y (t ) şi u f (t ) = H f ( p) u (t ) , H f ( p) este o funcţie de transfer


stabilă având n sau mai mulţi poli în exces, vezi Fig. 2.5.

θ̂
Hf Estimator Hf
pi Hf(p)u pi Hf(p)y

Proces
Intrarea u Ieşirea y
Fig. 2.5. Schema bloc a estimatorului cu filtre Hf

Dacă se notează:
θ = [ a1 L an b1 L bm ]T
(
ϕT (t ) = − p n −1 y f L − y f p m −1u f L u f )
= (− p n −1
H f ( p ) y L − H f ( p ) y p m −1H f ( p)u L H f ( p)u , )
modelul (2.37) se rescrie sub forma:
p n y f (t ) = p n H f ( p ) y (t ) = ϕT (t )θ

Printr-o realizare corespunzătoare a filtrului H f este posibil a se utiliza un filtru


pentru generarea tuturor semnalelor p i H f ( p) y, i = 0,K, n , şi un alt filtru care să
genereze p i H f ( p)u , i = 0,K, m − 1 . Pentru modelul regresiv de mai sus se poate
aplica metoda c.m.m.p. (variana recursivă este dată de Teorema 2.5). Se vede că
dacă H f îndeplineşte condiţia formulată, atât ieşirea cât şi intrarea sistemului nu
trebuie derivate.

Modele neliniare
Algoritmul c.m.m.p. poate fi aplicat şi anumitor modele neliniare. Condiţia
esnţială este ca modelele să fie linare în raport cu parametrii pentru a se putea scrie
ca modele liniar regresive. Precizăm că regresorul nu trebuie să fie liniar în raport
cu intrările sau ieşirile.
Exemplu. Fie modelul: y (t ) + a y (t − 1) = b1 u (t − 1) + b2 sin(u (t − 1)) .
Introducând θ = [ a b1 b2 ]T şi ϕT (t ) = [ − y (t ) u (t ) sin(u (t − 1)) ] , modelul poate
fi scris sub forma: y (t ) = ϕT (t − 1)θ . Cum acest model este liniar în raport cu
parametrii, pentru estimarea lui θ poate fi folosit algoritmul c.m.m.p.

18
Modele stochastice
Considerăm modelul
A(q) y (t ) = B (q) u (t ) + C (q ) e(t ) (2.38)
unde A(q ) , B(q) şi C (q) sunt polinoame în operatorul de avans q, iar {e(t )} este
semnalul zgomot alb. Parametrii polinomului C descriu corelaţia perturbaţiei.
Deoarece variabilele {e(t )} nu sunt cunoscute, modelul (2.38) nu poate fi convertit
direct la un model regresiv. Folosind însă aproximări corespunzătoare, se poate
obţine un model regresiv. Pentru aceasta, se introduce
ε(t ) = y (t ) − ϕT (t − 1) θˆ (t − 1)
unde: θ = [ a1 L an b1 L bm c1 L cn ]T
ϕ(t − 1) = [− y (t − 1) L − y (t − n) u (t − 1) Lu (t − n) ε(t − 1) L ε(t − n)]
T

Variabilele e(t) sunt aproximate prin erorile de predicţie ε(t ) . Modelul poate fi
atunci aproximat prin
y (t ) = ϕT (t − 1) θˆ (t − 1) + e(t )
pentru care poate fi aplicat algoritmul standard al c.m.m.p. Metoda obţinută se
numeşte algoritmul c.m.m.p. extins. Ecuaţiile pentru actualizarea estimaţiilor sunt
date de:
θˆ (t ) = θˆ (t − 1) + P (t ) ϕ(t − 1) ε(t )
(2.39)
P −1 (t ) = P −1 (t − 1) + ϕ(t − 1)ϕT (t − 1)
O altă metodă de estimare a parametrilor din (2.38) constă în utilizarea
ecuaţiilor (2.39), a reziduului definit prin
Cˆ (q ) ε(t ) = Aˆ (q ) y (t ) − Bˆ ( q) u (t ) (2.40)
şi a vectorului regresorilor ϕ din (2.39) înlocuit cu ϕ f unde:
Cˆ (q) ϕ f (t ) = ϕ(t ) (2.41)
În aceste actualizări ar trebui folosite cele mai recente estimări. Metoda obţinută nu
este tocmai recursivă, deoarece ecuaţiile (2.41) şi (2.40) trebuie rezolvate de la
t = 1 pentru fiecare măsurătoare. Se pot face următoarele aproximaţii:
ε(t ) = y (t ) − ϕT (t − 1) θˆ (t − 1)
f

Acest algoritm se numeşte algoritmul recursiv cu probabilitate maximă.


În ambele metode este avantajos să se înlocuiască reziduul din vectorul
regresorilor prin reziduul posterior definit prin:
ε (t ) = y (t ) − ϕT (t − 1) θˆ (t )
p

adică, pentru calculul lui ε p să fie folosită ultima valoare a lui θ̂ .

19
Diferiţii algoritmi recursivi prezentaţi sunt similari. Toţi aceştia pot fi
descrişi prin ecuaţiile:
θˆ (t ) = θˆ (t − 1) + P(t ) ϕ(t − 1) ε(t )
1 P(t − 1)ϕ(t − 1)ϕT (t − 1) P (t − 1) 
P (t ) =  P(t − 1) − 
λ  λ + ϕT (t − 1) P(t − 1)ϕ(t − 1) 
unde θ, ϕ şi ε sunt diferite pentru diferitele metode.

2.4. Condiţii experimentale


Proprietăţiile datelor folosite pentru estimarea parametrilor sunt esenţiale
pentru calitatea estimărilor. În continuare se va prezenta şi analiza influenţa
condiţiilor experimentale asupra calităţii estimărilor. În mecanismul de identificare
automată a sistemului, cum este cazul sistemelor adaptive, înţelegerea acestor
condiţii este foarte importantă. În acest sens, se va introduce noţiunea de excitaţie
persistetă, noţiune care caracterizează proprietăţile intrărilor procesului. Cum
pentru sistemele adaptive intrările sunt generate prin feedback (reacţie inversă), se
vor analiza şi dificultăţile care apar în această situaţie.
Noţiunea de excitaţie persistentă
Considerăm problema estimării parametrilor într-un model FIR descris de
ecuaţia (2.33). Parametrii modelului nu pot fi estimaţi dacă nu se impun anumite
condiţii asupra semnalului de intrare. Teorema 2.1 arată că estimările obţinute cu
algoritmul c.m.m.p. sunt unice dacă matricea:
 t t t

 ∑ ∑ ∑ u (k − 1)u (k − n) 
2
u ( k − 1) u ( k − 1)u ( k − 2) L
 t n +1 n +1
t
n +1
t

 L ∑ u (k − 2)u (k − n) (2.42)
ΦT Φ = ∑ u (k − 1)u (k − 2) ∑ u ( k − 2)
2

 n +1 M
n +1
M L
n +1
M 
 t t t 
∑ u (k − 1)u (k − n) ∑ u (k − 2)u (k − n) L ∑ u 2
( k − n ) 
 n +1 n +1 n +1 
are rang maxim. Această condiţie se numeşte condiţie de excitaţie. Pentru seturi de
date lungi, toate sumele din (2.42) trebuie să se efectueze de la 1 la t. Notăm
 c ( 0) c(1) L c(n − 1) 
1 T  c(n − 2)
Cn = lim Φ Φ =  c(1) c(0) L (2.43)
t →∞ t M M L M 
c(n − 1) c ( n − 2) L c(0) 

unde c(k) sunt covarianţele empirice ale intrării, adică:
1 t
c(k ) = lim ∑ u (i ) u (i − k ) (2.44)
t →∞ t
i =1

20
Condiţia de unicitate poate fi acum exprimată prin aceea ca matricea din (2.43) să
fie pozitiv definită. Aceasta conduce la următoarea definiţie.
Definiţia 2.1. Un semnal u se numeşte excitaţie persistentă de ordin n dacă
limitele (2.44) există şi matricea Cn din (2.43) este pozitiv definită.
Observaţie. Pentru sistemele adaptive, semnalul u se numeşte excitaţie
persistentă de ordin n dacă pentru orice t există un întreg m astfel încât:
t+m
ρ1I > ∑ ϕ(k ) ϕT (k ) > ρ2 I
k =t

unde ρ1 , ρ 2 > 0 şi vectorul ϕ(t ) este dat de ϕ(t ) = [ u (t − 1) u (t − 2) L u (t − n) ]T .


Matricea (2.43) poate fi scrisă ca:
1 t
Cn = lim ∑ ϕ(k ) ϕT (k )
t →∞ t
k =1

Se poate formula următorul rezultat.


Teorema 2.6. Consistenţa estimaţiilor pentru modele FIR.
Se consideră problema estimării prin metoda c.m.m.p. a celor n parametri ai unui
răspuns finit la impuls. Estimarea este consistentă şi varianţa estimărilor tinde la
zero dacă semnalul este excitaţie persistentă de ordin n.
Demonstraţia se obţine din Definiţia 2.1 şi Teorema 2.2.
Teorema 2.7. Semnale tip excitaţie persistentă.
Semnalul u cu proprietatea (2.44) este excitaţie persistentă de ordin n dacă şi
numai dacă:
1 t
U = lim ∑ ( A(q) u (k ) ) > 0
2
(2.45)
t →∞ t
k =1

pentru toate polinoamele A de grad n – 1 sau mai mic.


Demonstraţie. Fie polinomul A definit prin:
A(q) = a0 q n −1 + a1q n − 2 + L + an −1
Prin calcul direct se arată că
1 t
U = lim
t →∞ t
∑ (a0 u (k + n − 1) + L + an −1u (k ) ) = aT Cn a
2

k =1

unde Cn este matricea din (2.43). Dacă Cn este pozitiv definită, rezultă că U > 0 .
Acest rezultat este util în testarea condiţiei de persistenţă a unor tipuri de
semnale, astfel:
• Semnalul treaptă. Fie u (t ) = 1 pentru t > 0 şi 0 în rest. Avem:
1 t = 0
(q − 1)u (t ) = 
0 t ≠ 0
Semnalul treaptă poate fi deci excitaţie persistentă cel mult de ordin 1. Într-adevăr

21
1 t 2
C1 = ∑ u (k ) = 1 .
t k =1
• Semnalul sinusoidal. Fie u (t ) = sin ωt . Avem: (q 2 − 2q cos ω + 1) u (t ) = 0 .
Deci o sinusoidă poate fi o excitaţie persistentă cel mult de ordin 2. Întrucât
1 cos ω
C2 =  1
2 cos ω 1 
rezultă că sinusoida este într-adevăr o excitaţie persistentă de ordin 2.
• Semnal periodic. Fie u (t ) un semnal periodic cu perioada n. Avem că
n
(q − 1) u (t ) = 0 , de unde se deduce că acesta poate fi excitaţie persistentă de ordin
cel mult n.
• Semnale aleatoare. Considerăm procesul stochastic u (t ) = H (q)e(t ) , unde
e(t) este zgomotul alb, iar H(q) este o funcţie de transfer. Din definiţia zgomotului
alb rezultă că ecuaţia (2.45) este satisfăcută pentru orice semnal e şi pentru orice
polinom nenul A(q). Această proprietate este valabilă şi pentru semnalul u. Deci, u
este excitaţie persistentă de orice ordin.
Teorema 2.8. Torema lui Parseval. Fie
∞ ∞
H (q −1 ) = ∑ hk q − k ; G (q −1 ) = ∑ gk q−k
k =0 k =0

două funcţii de transfer stabile şi e(t) zgomotul alb cu media nulă şi covarianţa σ 2 .
Atunci:
∞ π
σ2
σ 2 ∑ hk g k = ∫ H (eiω )G (eiω )dω
k =0 2 π −π
Observaţie. Membrul drept al acestei relaţii poate fi interpretat ca
E ( H (q −1 )e(t ) ⋅ G (q −1 )e(t )) , adică covarianţa a două semnale obţinute prin trecerea
zgomotului alb prin funcţiile de transfer H (q −1 ) şi G (q −1 ) .
Caracterizare în domeniul frecvenţă
Considerăm un semnal quasi-staţionar u(t) cu spectrul Φ u (ω) . Din teorema
lui Parseval se deduce că:
π
1 t 1
lim ∑ ( A(q ) u ( k ) ) =
2
∫ | A(eiω ) |2 Φ u (ω)dω (2.46)
t →∞ t
k =1 2 π −π

Această ecuaţie ne oferă o bună înţelegere a noţiunii de excitaţie persistentă. Se ştie


că un polinom de grad n – 1 se poate anula în cel mult n – 1 puncte. Atunci,
membrul drept din (2.46) va fi pozitiv dacă Φ u (ω) ≠ 0 pentru cel puţin n puncte în
intervalul − π ≤ ω ≤ π . Un semnal al cărui spectru este diferit de zero într-un
interval este excitaţie persistentă de orice ordin.

22
Spectrul unei sinusoide este diferit de zero în două puncte. De aceea, aceasta
este excitaţie persistentă de ordinul 2. Un semnal care este o sumă de k sinusoide
este excitaţie persistentă de ordinul 2k.
Teorema 2.9. Excitaţia persistentă a semnalelor filtrate.
Fie u un semnal excitaţie persistentă de ordinul n. Presupunem că A(q) este un
polinom de grad m < n . Atunci, semnalul v definit prin v(t ) = A(q )u (t ) este
excitaţie persistentă de ordinul l cu n − m ≤ l ≤ n . Presupunând că A este stabil,
semnalul w definit prin w(t ) = (1 / A(q ))u (t ) este excitaţie persistentă de ordin n.
Modele discrete descrise prin funcţii de transfer
Vom analiza proprietăţile estimărilor parametrilor pentru funcţii de transfer
discrete în timp. Mai întâi vom analiza unicitatea estimărilor. Pentru aceasta, se
presupune că datele sunt generate prin:
A0 (q) y (t ) = B 0 (q )u (t ) + e(t + n) (2.47)
unde A0 şi B0 sunt polinoame relativ prime. Fie A şi B estimările lui A0 şi B0. Dacă
e = 0 , grad A > grad A0 şi grad B > grad B 0 , din Teorema 2.1 se deduce că
estimarea nu este unică deoarece coloanele matricei Φ sunt liniar dependente.
Există totuşi următorul rezultat.
Teorema 2.10. Considerăm datele generate prin modelul (2.47), cu A0 stabil
şi e = 0 . Fie parametrii polinoamelor A şi B funizate prin metoda c.m.m.p.
Presupunem că intrarea u este excitaţie persistentă de ordinul grad A + grad B + 1 .
Dacă se presupune că grad A = grad A0 şi grad B > grad B 0 , atunci
lim Φ T Φ / t este pozitiv definită.
t →∞

Demonstraţie. Considerăm: V (θ) = θT lim ΦT Φ θ = lim


1
t →∞ t
1 t
t →∞ t
∑ ( ) 2
ϕT (k ) θ .
k =1

Itroducem:
v(t ) = ϕT (t + n − 1) θ = B(q )u (t ) − ( A(q) − q n ) y (t )

= B(q )u (t ) −
A( q) − q n 0
0
A (q)
{ ( )
B (q )u (t ) = A0 (q) B( q) − A(q ) − q n B 0 (q) 0
1
A (q)
}u (t )

Deoarece A0 este stabil, din Teorema 2.9 rezultă că semnalul 1 / A0 (q) ⋅ u (t ) este
excitaţie persistentă de ordinul grad A + grad B + 1 . Deoarece gradul polinomului
din paranteză este mai mic sau egal cu grad A + grad B , rezultă că semnalul v(t)
nu dispare, în sensul mediei pătratice, în afară de cazul când polinomul este identic
zero. Aceasta se întâmplă dacă
B 0 (q) B(q)
=
0
A (q) A( q) − q n

23
Întrucât grad A = grad A0 , numitorul din membrul drept are gradul grad A − 1
= grad A0 − 1 . Deci funcţiile raţionale nu sunt identice şi teorema şi demonstrată.
Observaţii:
1. Se vede că grad A + grad B + 1 este egal cu numărul parametrilor din
modelul (2.47). Ordinul necesar al excitaţiei persistente este egal cu numărul
parametrilor estimaţi.
2. Dacă datele sunt generate prin (2.47), unde {e(t )} este zgomot alb (adică
o secvenţă de variabile aleatoare necorelate), atunci matricea lim Φ T Φ / t este
t →∞

pozitiv definită pentru modele de orice ordin cu condiţia ca intrarea să fie


excitaţie persistentă de ordinul grad B + 1 .
Identificarea în circuit închis
În conducerea adaptivă, identificarea sistemului se realizează, de regulă, în
circuit închis; pot apare astfel anumite dificultăţi. Considerăm, de exemplu,
estimarea coeficienţilor unei funcţii de transfer ca cea dată de ecuaţia (2.34).
Matricea Φ va fi:
 − y ( n) L − y (1) u ( n) L u (1) 
 u ( 2) 
Φ = − y (n + 1) L − y ( 2) u (n + 1) L (2.48)
M L M M L M 
 − y (t − 1) L − y (t − n) u (t − 1) L u (t − n)

O reacţie liniară introduce dependenţe liniare între coloanele matricei Φ . Aceasta
înseamnă că parametrii nu pot fi unic determinaţi. Vom vedea ce se întâmplă
analizând următorul exemplu.
Pierderea identificabilităţii datorită feedback-ului. Se consideră sistemul
descris prin
y (t + 1) + a y (t ) = b u (t ) (2.49)
Considerăm că trebuie estimaţi parametrii a şi b în prezenţa reacţiei
u (t ) = − k y (t ) (2.50)
Înmulţind (2.50) cu α şi adunând-o la (2.49), se obţine
y (t + 1) + (a + αk ) y (t ) = (b − α) u (t )
Aceasta arată că orice toţi parametrii de forma aˆ = a + αk , b̂ = b − α produc
aceeaşi relaţie intrare-ieşire. În planul parametrilor, aceste relaţii reprezintă ecuaţia
unei drepte (Fig. 2.6) dată de:
1
bˆ = b + (a − aˆ ) (2.51)
k
Funcţia cost (2.2) are aceeaşi valoare pentru toţi prametrii de pe această linie.
Problema pierderii identificabilităţii datorită feedback-ului dispare dacă se
utilizează o reacţie liniară cu un ordin suficient de ridicat. În aceste condiţii
24
coloanele matricei Φ dată de (2.48) nu mai rămân liniar dependente. O altă
posibilitate constă în folosirea unei reacţii variabile în timp. De exemplu, în
exemplul analizat este suficient să alegem o comandă de forma:
u (t ) = − k1 y (t ) − k 2 y (t − 1)

cu k 2 ≠ 0 . O altă posibilitate constă în
Panta -1/k a folosi o comandă de forma:
u (t ) = − k (t ) y (t )
b Valori adevărate cu k variabil în timp. În exemplul
prezentat este suficient să se folosească
două valori ale factorului de
amplificare. Fiecare valoare a
a â factorului de amplificare corespunde
Fig. 2.6. unei drepte cu panta −1 / k . Ori două
drepte se intersectează într-un singur
punct.
În sistemele adaptive, există o variaţie în timp naturală a recţiei deoarece
amplificările din legea de comandă cu reacţie se bazează pe estimările parametrilor.

25

S-ar putea să vă placă și