Sunteți pe pagina 1din 15

1.1. Noţiunea de sistem adaptiv

În concepţia actuală a teoriei sistemelor, rezolvarea problemelor de

conducere a proceselor tehnologice presupune parcurgerea câtorva etape cum ar fi:

- prima etapă constă în construirea modelului matematic al obiectului

condus, deci a unui sistem dinamic capabil să descrie satisfăcător comportarea procesului dat;

- în ultima etapă are loc materializarea conducerii prin implementarea

sistememului de conducere pe un suport material oarecare (regulatoar, calculator de proces) şi conectarea acestuia cu procesul tehnologic real. Se vede că a doua etapă, care constituie, în fond, esenţa teoriei sistemelor operează cu obiecte abstracte, modele posibile ale obiectelor lumii reale, şi oferă ca soluţii, de asemenea, modele matematice. În acest sens, prima şi ultima etapă pot fi privite ca interfaţă a conexiunii dintre teorie şi practică.

Punctul de vedere asupra noţiunii de sistem adaptiv, porneşte de la faptul că pentru realizarea sistemului de conducere sunt necesare două tipuri de informaţii: pe de o parte informaţia privitoare la structura şi parametrii modelului matematic al procesului, numită şi informaţie de construcţie (care face obiectul primei etape de mai sus), iar pe de altă parte, informaţia de funcţionare furnizată de ieşirile procesului condus, obţinută prin măsurători în timp real.

Vom considera că unui sistem de conducere i se poate ataşa atributul de adaptiv dacă acesta este capabil să atingă obiectivele conducerii în sistemele în care informaţia de construcţie, disponibilă iniţial, nu este completă. Ţinând seama de faptul că datele constructive sunt de o importanţă esenţială în elaborarea unui sistem de conducere, acesta implică, în mod automat, ideea că un sistem adaptiv trebuie să-şi completeze informaţia de construcţie despre proces în timp real, pe baza informaţiei de funcţionare, respectiv să aibă loc, explicit sau nu, o operaţie de identificare on-line a procesului. Deci, un sistem de conducere adaptiv nu mai este destinat unui anumit proces, ci unei clase de procese, sistemul trebuind să se adapteze – pe baza informaţiei de funcţionare în timp real – la obiectul cu care este efectiv cuplat. Un astfel de punct de vedere include, în mod natural, situaţiile în care parametrii şi/sau structura unui obiect dat au variaţii ce nu pot fi prevăzute, dar care păstrează obiectul în clasa precizată.

1

1.2. Scheme de conducere adaptivă

În acest paragraf se prezintă patru scheme de conducere adaptivă: scheme cu amplificare planificată (variabilă), scheme de conducere adaptivă cu model de referinţă, regulatoare cu autoacordare şi scheme de conducere duale.

Scheme cu amplificare planificată (variabilă)

Una dintre primele abordări în conducerea adaptivă a fost metoda amplificării planificate (variabile). Această metodă a fost introdusă în anii 1950- 1960 în sistemele de control al zborului. Ideea metodei constă în găsirea unor variabile auxiliare măsurabile (altele decât ieşirile utilizate ca mărimi de reacţie) ale procesului, variabile ce pot determina schimbări în dinamica procesului. Schema bloc a unui sistem cu amplificare planificată este prezenată în Fig. 1.1.

Parametrii

regulatorului

ă este prezenat ă în Fig. 1.1. Parametrii regulatorului Amplificare planificat ă Variabile auxiliare Referin ţă

Amplificare

planificată

Fig. 1.1. Parametrii regulatorului Amplificare planificat ă Variabile auxiliare Referin ţă Regulator Comand ă

Variabile

auxiliare

Referinţă

Regulator

Comandă

Regulator Comand ă
Variabile auxiliare Referin ţă Regulator Comand ă Proces Ie ş ire Fig. 1.1. Schema bloc a

Proces

auxiliare Referin ţă Regulator Comand ă Proces Ie ş ire Fig. 1.1. Schema bloc a unui

Ieşire

Referin ţă Regulator Comand ă Proces Ie ş ire Fig. 1.1. Schema bloc a unui sistem

Fig. 1.1. Schema bloc a unui sistem cu amplificare planificată

Sistemul poate fi cosiderat ca având două bucle: o buclă interioară, clasică, alcătuită din procesul condus şi regulator şi o buclă exterioară care ajusteză parametrii regulatorului utilizând masurătorile variabilelor auxiliare ale procesului. Amplificarea planificată poate fi privită ca o relaţie ce se stabileşte între parametrii procesului şi parametrii regulatorului şi poate fi implementată ca o funcţie sau un tabel. Deşi această schemă este foarte utilizată în pracică, are dezavantajul că ea este o schemă de adaptare în circuit deschis.

Sisteme adaptive cu model referinţă (etalon)

Sistemele adaptive cu model referinţă (etalon) au fost propuse pentru a rezolva problemă în care performanţele sistemului sunt formulate în funcţie de parametrii unui model de referinţă. Modelul precizează comportamentul ideal al

M a

procesului. Sistemul adaptiv trebuie să urmărească asimptotic ieşirea

modelului referinţă. Schema bloc a unui astfel de sistem este prezentată în Fig. 1.2. Regulatorul poate fi gândit ca având două bucle: o buclă internă este o buclă cu reacţie după ieşire ce conţine procesul şi regulatorul şi o buclă externă care

ajustează parametrii regulatorului astfel încât eroarea

dintre ieşirea y a procesului şi ieşirea modelului să tindă la zero. Problema

y

e = y y , adică diferenţa

M

2

esenţială în acest sistem constă în proiectarea unui mecanism de ajustare care să fie stabil
esenţială în acest sistem constă în proiectarea unui mecanism de ajustare care să fie
stabil şi să determine eroarea e să tindă la zero.
Model
y M
referinţă
_
Parametrii reguatorului
e
Mecanism
de ajustare
+
r
y
u
Regulator
Proces
Referinţă
Ieşire

Fig. 1.2. Schema bloc a unui sistem adaptiv cu model referinţă (etalon)

În primele aplicaţii ale acestor sisteme, pentru a realiza acestă cerinţă s-a utilizat o metodă de tip gradient. Fie θ vectorul care conţine parametrii ajustabili ai regulatorului. Metoda de actualizare a parametrilor constă în reducerea erorii

θ prin ajustarea lui θ de-a lungul direcţiei celei mai rapide pante,

pătratice

astfel:

e

2

(

)

d

θ

dt

=−γ e

∂θ

2

∂θ

∂θ

(

θ=−γ θ

)

2

e

(

)

e

(

θ=−γ θ

)

2

e

(

)

(

θ−

y y

)

(

M

)

=−γ θ

2

e

(

)

∂θ

y θ

(

)

y este

unde γ este o constată pozitivă numită factor de adaptare. Precizăm că

independent de θ , iar y(θ) / ∂θ reprezintă senzitivitatea ieşirii în raport cu parametrul θ . Această metodă este cunoscută şi sub numele de regula MIT. Cum, de obicei, funcţia y(θ) / ∂θ depinde de parametrii necunoscuţi ai procesului, aceasta devine inutilizabilă. O soluţie constă în înlocuirea parametrilor necunoscuţi cu valorile lor estimate calculate la un moment t . Din păcate, utilizând regulile de tip MIT nu este totdeauna posibil de demonstrat stabilitatea sistemului în circuit închis sau convergenţa la zero a erorii. Pentru înlăturarea acestor neajunsuri s-au folosit alte metode bazate pe tehnici Liapunov, disipative etc.

M

Regulatoare autoacordabile

Schemele adaptive prezentate mai sus sunt scheme de control adaptive directe, deoarece actualizarea parametrilor regulatorului (cu structură cunoscută) se face direct de către mecanismul de ajustare pe baza relaţiilor dintre parametrii procesului şi cei ai regulatorului. Întrucât parametrii procesului sunt de fapt ncunoscuţi, aceştia trebuie înlocuiţi cu valorile lor estimate, furnizate de un algoritm recursiv de estimare a parametrilor. Parametrii regulatorului vor fi calculaţi şi actualizaţi utilizând

3

estimările parametrilor procesului, exact ca şi în cazul în care parametrii ar fi cei adevăraţi.
estimările parametrilor procesului, exact ca şi în cazul în care parametrii ar fi cei
adevăraţi. Această metodă este cunoscută sub numele de principiul echivalenţei
certe. Schema bloc a unui astfel de sistem este prezetată în Fig. 1.3.
Regulator cu autoacordare
Criterii
Parametrii procesului
Proiectarea
Estimatorul
regulatorului
parametrilor
Parametrii
regulatorului
Refetinţă
Comanda
Ieşirea
r Regulator
Proces
u
y

Fig.1.3. Schema bloc a unui regulator cu autoacodare

În contrast cu schemele cu model de referiţă, unde parametrii regulatorului sunt actualizate direct astfel încât sistemul adaptiv să urmărească modelul impus, în această situaţie, se constată că are loc o separare a operaţiilor de identificare şi control. Regulatorul adaptiv din Fig. 1.3 poate fi gândit ca având două bucle: o buclă internă formată din procesul condus şi un regulator convenţional, dar cu parametrii variabili, şi o buclă externă care conţine un estimator recursiv al parametrilor şi un bloc de proiectare care ajustează on-line aceşti parametrii. Sistemul poate fi privit ca un automat în care la fiecare perioadă de eşatioare are loc atât actualizarea modelului procesului cât şi proiectarea noii comenzi, respectiv a noilor valori ale parametrilor regulatorului. Un regulatorul cu această structură se numeşte regulator cu autoacordare deoarece acesta are capacitatea de a-şi acorda proprii parametri în scopul obţinerii performanţelor dorite ale sistemului în circuit închis. Blocul de proiectare reprezintă o soluţie on-line a unei probleme de proiectare pentru un sistem cu parametri cunoscuţi. Aceast tip de problemă adaptivă este considerată o schemă de adaptare indirectă. Schemele cu autoacordare sunt foarte flexibile în raport cu alegerea metodelor de proiectare (metode liniar-patratice, metode bazate pe principiul varianţei minime etc.) şi de estimare (metoda celor mai mici pătrate, principiul probalilităţii maxime etc.).

Scheme de control adaptiv dual

Schemele prezentate mai sus prezintă anumite limitări. De exemplu, în proiectarea regulatorului incertitudinilre parametrice nu sunt luate în considerare. Apare ca naturală întrebarea: există şi alte abordări mai bune decât schemele bazate pe principiul echivalenţei certe ? Este posibilă obţinerea unor astfel de regulatoare

4

adaptive pe baza unor principii teoretice generale ? Răspunsul la aceste întrebări este afirmativ, adică este posibilă găsirea unei soluţii pornind de la o formulare abstractă a unei probleme şi utilizând teoria optimizării. Aceasta se bazează pe controlul stochastic, sau mai nou, pe noţiunea de control dual. Această abordare conduce la o structură de regulator cu proprietăţi interesante. O remarcă importantă este aceea că regulatorul va lua în considerare şi incertitudinile în estimarea parametrilor. Abordarea este totuşi foarte complicată şi până acum nu a fost utilizată în probleme practice. Ideea metodei este următoarea. Sistemul se va descrie printr-un model stochastic, apoi se va formula un criteriu care să minimizeze o funcţie cost, scalară, care depinde de starea şi comanda procesului. Problema găsirii unui regulator care să minimizeze funcţia cost în raport cu comanda este foarte dificilă. Dacă aceasta poate fi rezolvată, regulatorul optimal are structura din Fig. 1.4, unde vectorul hiperstare conţine atât starea procesului cât şi parametrii acestuia.

Referinţă Regulator Comandă Ieşire Proces (neliniar) Calcul hiperstare Hiperstare Fig. 1.4. Schema bloc a
Referinţă
Regulator
Comandă
Ieşire
Proces
(neliniar)
Calcul
hiperstare
Hiperstare
Fig. 1.4. Schema bloc a unui regulator dual

Regulatorul poate fi privit ca fiind alcătuit din două părţi: un estimator neliniar şi un regulator cu reacţie. Pe baza măsurătorilor din proces, estimatorul generează distribuţia de probabilitate condiţionată a stării numită hiperstare. Regulatorul este o funcţie neliniară care realizează o legătură între hiperstare şi spaţiul variabilelor de comandă. Simplitatea structurală a acestei soluţii se obţine cu preţul introducerii hiperstării care poate fi un vector cu dimensiune foarte mare.

2. Estimarea în timp real a parametrilor

2.1. Introducere

Determinarea on-line a parametrilor procesului este o problemă esenţială a conducerii adaptive. S-a văzut că în structura unui regulator autoacordabil apare explicit un estimator al parametrilor (vezi Fig. 1.3). Dar şi structura regulatorului adaptiv cu model de referinţă conţine implicit un estimator al parametrilor (vezi Fig. 1.2). În acest capitol se prezintă câteva metode pentru estimarea on-line a parametrilor procesului privite în contextul identificării sistemului. Elementele de bază ale identificării unui sistem sunt: alegerea structurii modelului, realizarea experimentelor, estimarea parametrilor şi validarea modelului. Deoarece în sistemele adaptive identificarea sistemului se face automat, este esenţială înţelegerea tuturor aspectelor acestei probleme. Alegerea structurii modelului şi

5

parametrizarea sunt elemente fundamentale. Problemele de identificare se simplifică dacă modelele sunt simple şi mai mult, liniare în raport cu parametrii. Realizarea experimentelor impune câteva cunoştinţe despre proces, dar şi ce tip de semnale trebuie aplicate pentru a obţine rezultate concludente. Cum în sistemele adaptive parametrii procesului se modifică continuu, sunt necesare metode de estimare care să actualizeze recursiv valorile parametrilor estimaţi. Pentru estimarea parametrilor, o tehnică de bază este metoda celor mai mici pătrate (c.m.m.p.). Metoda este foarte simplă în cazul proceselor descrise prin modele liniare în raport cu parametrii, situaţie în care estimările pot fi calculate şi analitic.

2.2. Metoda celor mai mici pătrate

Metoda celor mai mici pătrate poate fi aplicată unei clase largi de probleme. Metoda este simplă în cazul unui proces descris printr-un model matematic de forma:

y(i) (i)θ +ϕ (i)θ + +ϕ (i)θ =ϕ (i)θ

1

1

2

2

L

n

n

0

0

0

T

0

(2.1)

unde y este variabila observată,

determinaţi, iar

variabile cunoscute. Definim vectorii:

( )

i

n sunt parametrii modelului ce trebuie

n sunt funcţii cunoscute care pot depinde de alte

θ

1

,

θ K θ

2

,

,

0

0

0

ϕ

T

ϕ , ϕ

1

2

,

[

= ϕ

K

,ϕ

1

( )

i

ϕ

2

( )

i

L ϕ

n

( )]

i

, θ =θ θLθ

[

1

2

0

0

0

0

n

]

T

Indexul i din (2.1) aparţine unei muţimi discrete şi reprezintă timpul la pasul i .

ϕ se numesc variabile regresoare sau regresori, iar modelul (2.1) se

Funcţiile

numeşte

efectuarea unui experiment. Se pune

problema determinării parametrilor θ astfel încât ieşirile calculate cu modelul (2.1) se apropie cât mai mult posibil de variabilele măsurate y(i) în sensul celor mai

θ trebuie aleşi astfel încât să minimizeze

mici pătrate. Rezultă că parametrii funcţia cost:

y i

i

model

regresiv. Perechile observaţiilor şi regresorilor

se

obţin

prin

{( y(i), ϕ(i)), i = 1, 2,K,t}

1 )
2

i

= 1

(

( )

T

−ϕ θ

( )

i

2

t

V (

θ ,

t

) =

(2.2)

Deoarece variabila y este liniară în raport cu parametrii

unul pătratic, problema admite o soluţie analitică. Introducem notaţiile

θ 0 şi criteriul este

Y (t) = [ y(1) E(t) = [ε(1)

T

y(2) K y(t)] ε(2) K ε(t)]

T

6

Φ

( )

t

=

ϕ

ϕ

T

M

T

(1)

( t )

( )

P t

(

=Φ Φ

T

( )

t

( )

t

)

1

=

t

i

= 1

ϕ ( i ) ϕ

T

unde rezidurile ε(i) sunt definite prin:

T

ε(i) = y(i) yˆ(i) = y(i) −ϕ (i)θ

( )

i

1

(2.3)

Cu aceste notaţii, funcţia cost (2.2) se rescrie sub forma:

V

( θ ,

t

) =

1

t

1

 

1

2

i

( )

=

E

T

E

=

 

ε

2

i = 1

2

2

||

E

||

2

unde E se poate rescrie sub forma:

ˆ

E = Y Y = Y − Φθ

(2.4)

Soluţia problemei celor mai mici pătrate este dată de următoarea teoremă.

Teorema 2.1. Estimarea pe baza celor mai mici pătrate (c.m.m.p).

astfel încât:

ˆ

ˆ

Funcţia cost (2.2) admite un minim în raport cu parametrii θ

T

ΦΦθ=Φ

T

Y

T

Dacă matricea Φ Φ

este nesingulară, mininul este unic şi este dat de:

ˆ

θ=ΦΦ Φ

(

T

)

1

T

Y

(2.5)

(2.6)

Demonstraţie. Funcţia cost (2.2) poate fi scrisă ca:

θ

2V ( ,t)

=

E

T

E

= (Y − Φθ

)

T

(Y

− Φθ ) =

Y

T

Y

− Φθ − θ Φ + θ Φ Φθ

Y

Y

T

T

T

T

T

(2.7)

Deoarece matricea Φ Φ

este întotdeauna nenegativ definită, funcţia V are un

minim. Funcţia V fiind pătratică în raport cu θ , minimul său poate fi alculat în mai multe moduri. Unul ditre acestea costă în calculul gradientului în raport cu θ . Un alt mod constă în a completa expresia (2.7) pentru a obţine un pătrat, astfel:

T

2

=

V

(

θ

,

t

Y

T

(I

)

=

Y

T

Y

− Φθ−θΦ +θΦΦθ+ ΦΦΦ Φ − ΦΦΦ Φ

Y

Y

Y

(

)

Y

Y

(

)

T

T

T

T

T

T

T

1

T

T

T

1

T

T

1

)(Y

−ΦΦΦ Φ +θ−ΦΦ Φ

(

)

(

)

T

1

T

Y

)

T

(

ΦΦθ−ΦΦ Φ

(

T

T

)

1

T

Y )

(2.8)

Y

Primul termen din membrul drept este independent de θ , iar cel de-al doilea este întotdeauna pozitiv. Minimul se obţine pentru:

Observa ţ ii :

ˆ

θ=θ=ΦΦ Φ

(

)

T

1

7

T

Y

1.

Ecuaţia (2.5) se numeşte ecuaţie normală. Ecuaţia (2.6) poate fi scrisă sub

forma:

1

   

t

T

i

=

1

ˆ

θ

t

i

=

1

ϕ ( i ) ϕ

T

( )

t

=

( )

i

2. Condiţia ca matricea Φ Φ excitaţie.

ϕ

( )

i

( )

y i

=

( )

P t

t

=

i

1

ϕ

( )

i

( )

y i

(2.9)

să fie inversabilă se numeşte condiţie de

3. Criteriul celor mai mici pătrate ponderează toate erorile ε(i) în mod egal,

ceea ce corepunde ipotezei că toate măsurătorile au aceeaşi precizie.

Funcţia criteriu V poate fi modificată considerând ponderi diferite ale erorilor, astfel

V

=

1

2

T

E WE

(2.10)

unde W este o matrice de ponderare diagonală. Estimările parametrilor vor fi acum date de:

Interpretare geometrică

ˆ

θ=Φ W Φ Φ

(

T

)

1

T

WY

(2.11)

Problema celor mai mici pătrate poate fi interpretată ca o problemă de

geometrie în spaţiul

t

, unde t este numărul observaţiilor. Fig. 2.1 prezintă situaţia cu doi parametrii şi trei observaţii. Vectorii

2 Y ϕ 1 şi ϕ acoperă un plan, dacă sunt liniar ˆ E independenţi.
2
Y
ϕ 1 şi ϕ acoperă un plan, dacă sunt liniar
ˆ
E
independenţi. Mărimea predictivă Y
se află
2
în planul format de
ϕ 1 şi ϕ . Eroarea
2
ϕ
ˆ
E = Y −
Y
ia cea mai mică valoare când E
1
θϕ
1
este perpendiculară pe acest plan. În cazul
general, ecuaţia (2.4) se poate rescrie sub
ˆ
Y
forma:
 ε (1)   y (1)  ϕ (1) 
 ϕ
n (1) 
2
1
θϕ
2
1
ϕ
ε (2)
y (2)
ϕ
1 (2)
ϕ
n (2)
− 
θ− L −
θ
1
n
M
= 
M
M
M
Fig. 2.1. Interptrtarea geometrică a
estimatorului celor ai mici pătrate
ε ( t )
sau
y ( t )
ϕ
1 ( t )
ϕ
n ( t )
1
2
n
E = Y −ϕθ−ϕθ −Lϕθ
1
2
n

unde

interpretată ca probema găsirii constantelor

ϕ i sunt coloanele matricei Φ . Probema celor mai mici pătrate poate fi

n astfel încât vectorul

θ , θ

1

2

,

,θ

K

8

Y să fie aproximat cât mai bine posibil printr-o combinaţie liniară a

vectorilor

care reprezintă cea mai bună aproximaţie şi E Y Y

,

1

ϕ , ϕ

2

,

,ϕ

n

. Fie

ˆ

Y

vectorul din spaţiul generat de

=

ˆ

1

ϕ , ϕ

2

,

,ϕ

n

K

K

. Vectorul E ia cea mai

mică valoare când el este perpendicular pe toţi vectorii

i

ϕ . Aceasta îseamnă că:

(

ϕ

i

)

T

(

Y

− θ ϕ − θ ϕ −L θ ϕ =

1

2

n

)

1

2

n

0

i

1,

= K

,

t

care este identică cu ecuaţia normala (2.5). Vectorul θ este unic dacă vectorii

1

ϕ , ϕ

2

,

K

,ϕ

n sunt liniar independenţi.

Calculul recursiv

În regulatoarele adaptive, observaţiile se obţin secvenţial în timp real. Apare ca firesc ca efectuarea calculelor să se facă recursiv. Calculul estimărilor celor mai mici pătrate pot fi efectuate astfel încât rezultatele obţinute la momentul t 1 să

poată fi utilizate pentru obţinerea estimărilor de la momentul t. Pentru aceasta,

soluţia ecuaţiei (2.6) va fi rescrisă într-o formă recursivă. Fie

parametrului θ obţinută pe baza primelor t 1 măsurători. Presupunem că

este nesingulară pentru orice t. Din definiţia lui P(t) dată de (2.3)

matricea Φ Φ rezultă că:

θ t estimarea

ˆ

(

1)

T

P

1

( )

t

T

( )

t

Φ

( )

t

=

t

1

i =

( )

i

ϕ ϕ

T

( )

i

=

t

1

i

=

1

( )

i

ϕ ϕ

T

( )

i

( )

t

+ϕ ϕ

T

( )

t

=

P

1

(

t

− +ϕ ϕ

1)

( )

t

T

( )

t

(2.14)

Estimările parametrului θ bazate pe metoda celor mai mici pătrate sunt ate de ecuaţia (2.9):

ˆ

θ

( )

t

=

( )

P t

t

1

i =

ϕ

( )

i

( )

y i

Din (2.9) şi (2.14) se deduce că:

ˆ

1) θ

t 1

i = 1

ϕ

( i )

y ( i )

=

P

1

(

t

(

t

1)

=

=

( )

P t

t

1

i

=

1

ϕ

( )

i

( )

y i

P

1

( t )

ˆ

θ − −ϕ

(

t

1)

( )

t

( )

y t

( t )

ϕ

T

( t )

ˆ

θ (

t

1)

Estimările la pasul t se pot rescrie sub forma:

ˆ

( ) θ

ˆ

ˆ

θ

t

( )

=θ − −

(

t

1)

ˆ

=θ − +

(

t

1)

( )

( )

P t

P t

ϕ

ϕ

t

( )

( )

t

ϕ

(

T

t

y t

T

(

t

1)

( )

P t

T

+

ˆ

ϕ

)

( ) θ

t

(

1) .

t

1)

( ) −ϕ

ˆ

ε(t) = y(t) −ϕ (t)θ t

(

unde K (t) = P(t)ϕ(t) ,

( )

t

=θ − +

( )

y t

ˆ

(

t

1)

K

( )

t

ε

( )

t

Eroarea

ε(t)

poate fi interpretată ca eroarea în predicţia cu un pas a

semnalului y(t) bazată pe estimarea

ˆ

θ t

(

1)

.

9

Pentru a continua este necesară deducerea unei ecuaţii recursive pentru P(t) ,

nu numai pentru

P

1

( ) . Pentru aceasta se utilizează următoarea lemă.

t

Lema 2.1. Lema inversei matricelor. Fie

A, B

şi

C

1

+

DA

1

B

matrice

pătratice nesingulare. Atunci A + BCD este inversabilă, şi

(

A + BCD

)

1

= A

1

A

1

B C

(

1

+ DA

1

B

)

1

DA

1

Demonstraţie. Prin înmulţire directă, se obţine:

(

= − B C

(

= − BC

A + BCD

)(

A

I + BCDA

I + BCDA

1

1

1

A

(

1

B ( C

1

1

+ DA

B

1

)

1 1

1

)

B

DA

1

1

B

)(

C

1

C

+ DA

1

+ DA

DA

1

)

BCDA

+ DA

1 1

B

)

1

B C

(

DA

1

1

+ DA

= I

1

B

)

1

DA

1

Aplicând Lema 2.1 în P(t) şi utilizând (2.14) se obţine:

( )

P t

(

T

( )

t Φ t

( )

)(

1

t − Φ t − +ϕ t ϕ t

T

(

1)

(

1)

( )

T

( )

Această conduce la:

(

= P t

1)

(

P t

1)

− ϕ

( )(

t

I

T

( )

t

(

P t

1)

− ϕ

( ))

t

1

)

ϕ

1

T

(

1

P

=

( )

t

(

P t

(

t − +ϕ t ϕ t

1)

1)

( )

T

( )

K

( )

t

= P t ϕ t

( )

( )

(

= P t

1)

(

ϕ t I

( )

T

( )

t

(

P t

1)

( )

ϕ t

)

1

)

1

Se observă că matricea ce trebuie inversată are aceeaşi dimensiune cu numărul măsurătorilor. Rezultă că pentru un sistem cu o singură ieşire, această este un scalar.

Algoritmul recursiv al celor mai mici pătrate este prezentat în teorema următoare.

Teorema 2.3. Algoritmul recursiv bazat pe metoda c.m.m.p.

Presupunem că matricea Φ(t) are rang maxim, adică,

Dându-se

următoarele ecuaţii recursive:

t t .

0

ˆ

θ t

(

0

)

(

şi

(

P t

0

)

t Φ t

(

T

0

)

(

0

)

)

1

ˆ

( )

θ t t − + K t y t −ϕ t θ t

K

(

( )

P t

ˆ

(

T

1))

( )

t

(

P t

( )

( )

t

( )

ˆ

(

(

1)

( )

(

( )

1)

1)

− ϕ

T

( )

I

( )

(

= P t ϕ t

=

(

P t

1)

( )

= P t

P t

ϕ t I

( )(

t

T

t

P t

(

1)

− ϕ

1)

= (I K (t)ϕ (t))P(t 1)

T

Φ

,

T

(t)

)

1

( )

ϕ t

( ))

t

1

ϕ

T

Φ

estimarea

(t)

este nesingulară,

(

P t

ˆ

θ t

( )

satisface

(2.15)

(2.16)

1)

 

(2.17)

( )

t

Observa ţ ii :

din (2.15) se obţine adunând o corecţie la

θ t . Această corecţie este proporţională cu

1) , unde ultimul termen poate fi interpretat ca valoarea predictivă

a lui y la momentul t obţinută prin modelul (2.1). Termenul corecţie este astfel

1. Intuitiv, valoarea estimată

ˆ

anterioară

ˆ

(

1)

ˆ

θ t

( )

estimarea

T

y(t) −ϕ (t)θ t

(

10

proporţional cu diferenţa dintre valoarea măsurată a lui y(t) şi predicţia lui y(t) bazată pe estimarea anterioară a parametrilor. Componentele vectorului K (t) sunt factori de ponderare care combină corecţia şi estimarea anterioară.

2. Estimatorul bazat pe metoda c.m.m.p. poate fi interpretat ca un filtru

Kalman pentru procesul:

θ(t +1) = θ(t)

y(t)

= ϕ

T

(t) θ (t)

+

e(t)

(2.18)

3. Ecuaţiile recursive pot fi desuse pornind şi de la funcţia cost (2.2).

Folosind (2.8) şi (2.6), se obţine:

2

=

θ , t

t

(

(

V

Y

T

)

=

1)

2

V

I

(

θ , t

(

1)

( θ , t

1)(

2

−Φ − Φ

t

T

(

t

)

1) Φ

(

t

1))

1

Φ ( t

1)

Y

(

t

1)

+ (θ − θ t

ˆ

(

1)

)

T

Φ

T

(

t

(

t

1)

(θ

− θ( 1))+

ˆ

t

(

(

y t

) − ϕ ( )θ)

T

t

T

(

(

y t

) − ϕ ( )θ)

T

t

Φ

T

(2.19)

Cum primul termen din membrul drept este independent de θ , iar termenii rămaşi sunt pătratici în θ , rezultă că V (θ,t) poate fi uşor minimizat în raport cu θ .

Precizăm că matricea este nesingulară. Deoarece

1)

− Φ

P(t) este definită numai dacă matricea

(t)

Φ

(t)

Φ

T

( t )

Φ

( t )

=

t

i = 1

ϕ ( ) ϕ

i

T

( i )

rezultă că Φ Φ

iniţială penru P, este necesar sa se aleagă nesingulară. Atunci, condiţiile iniţiale vor fi:

T

este totdeauna nesingulară dacă t < n . Pentru a obţine o condiţie

să fie

t = t

0

astfel încât

Φ

T

(

t

0

)

Φ

(

t

0

)

)

(

P t

ˆ

θ

(

0

t

0

)

(

t Φ t

(

T

0

)

(

0

=

P ( t

0

)

Φ

T

(

t

0

)

)

1

)

Y

t

0

(

)

t > t . Totuşi, este convenabil ca ecuaţiile

Ecuaţiile recursive pot fi utilizate pentru

recursive să se utilizeze în toţi paşii. Dacă ecuaţiile recursive pornesc din condiţia

iniţială P(0) = P , unde

0

P

0

este pozitiv definită, atunci

0

Notăm că

alegerea lui

( )

P t

=

(

P

0

1

t Φ t

T

( )

( )

)

1

P(t)

poate fi făcută să tindă către valoarea lui

P

0

suficient de mare.

(

Φ

T

( )

t Φ t

( )

)

1

prin

Parametrii variabili în timp

θ i 0 sunt presupuşi constanţi. În multe probleme

adaptive este interesant să