Documente Academic
Documente Profesional
Documente Cultură
Curs
2009
1
UNIVERSITATEA “PETRU MAIOR” TG.MUREŞ
MASTERAT:
Curs
2009
2
CUPRINS:
I. Introducere ......................................................................................................................... 5
II. Aspecte generale privind sistemele de reglare adaptivă şi sistemele de reglare fuzzy ......... 8
II.1. Sisteme de reglare adaptivă ........................................................................................ 8
II.1.1. Sisteme adaptive cu model de referinţă (MRAS)................................................ 10
II.1.2. Metoda gradientului (regula MIT) pentru adaptarea regulatoarelor..................... 12
II.1.3. Metoda teoriei stabilităţii Lyapunov pentru adaptarea regulatoarelor.................. 13
II.1.4. Exemple de sisteme adaptive cu model etalon.................................................... 15
II.2. Sisteme de reglare directă fuzzy................................................................................ 22
II.2.1. Elemente de logica fuzzy ................................................................................... 24
II.2.2. Structura de bază a regulatoarelor fuzzy directe ................................................. 29
II.2.3. Exemple de structuri de reglare fuzzy directe ..................................................... 36
V. Concluzii ........................................................................................................................ 89
3
Bibliografie ......................................................................................................................... 92
Anexe .................................................................................................................................. 95
Anexa 1. Schema neliniară a pendulului inversat.............................................................. 95
Anexa 2. Descrierea regulatorului fuzzy........................................................................... 95
Anexa 3. Lista figurilor din lucrare .................................................................................. 96
4
I. Introducere
5
situaţie, şi mai puţin cu proprietatea de a învăţa. Dacă pentru controlul proceselor se folosesc
structuri neuronale artificiale atunci spunem că avem un “control neuronal”. Dacă sistemul
de reglare conţine un raţionament fuzzy (bazat pe logica fuzzy) atunci avem de-a face cu un
“control fuzzy”. Dacă sistemul de reglare conţine atât structuri neuronale cât şi raţionament
fuzzy atunci întâlnim conceptual de “control neuro-fuzzy”. [Dav1, Dav2]
Particular sistemelor de conducere inteligente de tip neuronal este faptul că peste
regulatoarele convenţionale se suprapune sistemul de învăţare. Metodele de învăţare utilizează
eroarea de reglare fie pentru ajustarea parametrilor, fie pentru selecţia anumitor parametrii
dintr-un set de soluţii posibile.
Logica fuzzy permite înlocuirea metodelor clasice de proiectare a sistemelor de reglare
automată bazate pe modele matematice cu intuiţie şi euristică inginerească. Sistemele fuzzy
realizează îmbinarea între două lumi: om-maşină, şi anume modelarea informaţiei hibride
lingvistico-numerice. Informaţia lingvistică este conţinută într-o bază de reguli “dacă …
atunci …” (“if … then …”), iar cea numerică se regăseşte în perechile de valori intrare-ieşire.
Fundamentat pe logica fuzzy s-a dezvoltat controlul fuzzy al proceselor prin care se simulează
comportamentul uman în conducerea proceselor.
Pe de altă parte variaţiile parametrice şi structurale pot fi compensate şi prin adăugarea
unei bucle suplimentare în structura unui sistem de reglare clasic alături de bucla de reglare
convenţională (reacţiei negative). Această buclă suplimentară este denumită buclă de
adaptare, al cărei rol este de a asigura adaptarea continuă a comenzii prin modificarea
parametrilor regulatorului sau a structurii acestuia prin semnale adiţionale. Structurile de
sisteme adaptive pot fi în circuit deschis, cu răspândire mai redusă (telecomunicaţii) sau în
circuit închis, folosite în cazul sistemelor automate de reglare.
Un sistem fuzzy adaptiv poate fi văzut ca un sistem fuzzy înzestrat cu un “algoritm de
antrenare”, algoritm care are rolul de a ajusta parametrii sistemului de reglare fuzzy pe baza
perechilor de valori numerice intrare-ieşire obţinute prin măsurători efectuate asupra
procesului. Acesta combină facilităţile oferite de reglarea bazată pe logica fuzzy (Fuzzy Logic
Control FLC) şi conducerea adaptivă a proceselor (Adaptive Control AC).
Lucrarea structurată pe 3 capitole principale, prezintă exemple de aplicaţii ale
inteligenţei artificiale în reglarea adaptivă, prin detalierea sistemelor adaptive, sistemelor
fuzzy directe şi a celor fuzzy adaptive. Avantajele ultimelor metode moderne permit obţinerea
unor performanţe deosebite în conducerea unor procese care conţin elemente neliniare,
procese asupra cărora există incertitudini de model, cu parametrii şi structură variabili în timp,
precum şi procese unde intervin perturbaţii externe.
6
Astfel, în capitolul 2 se prezintă aspecte ce stau la baza construcţiei regulatoarelor
inteligente adaptive, şi anume structurile de reglare adaptive (Adaptive Control) şi structurile
de reglare fuzzy inteligente (Fuzzy Logic Control), exemplificate prin aplicaţii concrete de
control.
Capitolul 3 prezintă structuri de regulatoare fuzzy adaptive (Adaptive Fuzzy Control),
iar apoi este axat pe proiectarea sistemului de reglare fuzzy cu învăţare cu model de referinţă
(Fuzzy Model Reference Learning Control FMRLC), cu evidenţierea blocurilor componente
şi a elementelor care separă aceste sisteme de celelalte regulatoare, fie ele clasice, adaptive
sau inteligente.
În partea finală a referatului sunt prezentate aplicaţii şi programe pentru studiul acestor
regulatoare fuzzy adaptive şi concluzii referitoare la alegerea şi avantajele introducerii acestor
tipuri de regulatoare în cadrul sistemelor automate.
7
II. Aspecte generale privind sistemele de reglare adaptivă şi
sistemele de reglare fuzzy
În teoria reglării automate moderne, conceptul de control adaptiv este deseori amintit
alături de cel de control robust. Amândouă reprezentând metode de reglare a unor sisteme cu
parametrii cu un grad mai mare sau mai mic de incertitudini sau variabili în timp.
Un regulator robust este considerat acel regulator care reuşeşte să păstreze anumite
proprietăţi (de stabilitate şi performanţă) ale sistemului automat, chiar şi atunci când asupra
sistemului se interpun anumite elemente perturbatoare (externe, mărimi exogene sau interne,
variaţii ale parametrilor procesului), iar sistemul de reglare devine unul robust.
Proiectarea unui regulator adaptiv este impusă atunci când structura dinamică a
procesului este cunoscută, dar pot apărea variaţii mai lente ai parametrilor fizici ai procesului.
Indiferent de natura procesului, sistem liniar sau neliniar, regulatoarele adaptive sunt neliniare
prin construcţie.
Deosebirea între cele două tehnici de compensare a acestor variaţii în cadrul
sistemelor este dată de modul de calcul a parametrilor de acord, iar aplicarea fiecărei metode
depinde de viteza şi domeniul de variaţie al parametrilor procesului.
8
Spre deosebire de sistemele adaptive, unde parametrii regulatorului se modifică în
mod repetitiv (“online”, în timpul funcţionării), în urma variaţiei parametrilor procesului,
regulatorul robust este calculat o singură dată, înainte de punerea în funcţiune a sistemului
automat. Avantajul regulatoarelor robuste constă în reducerea algoritmului de calcul, acesta
efectuându-se o singură dată.
Deşi un regulator robust are o acţiune mai rapidă decât cea a unui regulator adaptiv în
momentul modificărilor parametrice a procesului condus, este obligatorie cunoaşterea
domeniului de variaţie a acestora. Astfel, în cazul unor modificări parametrice mai lente
într-un domeniu mai mare şi necunoscut se impune folosirea regulatoarelor adaptive, mai ales
dacă structura procesului este cunoscută.
Soluţiile de conducere în cadrul sistemelor adaptive au la bază două tehnici de
adaptare parametrică, sisteme adaptive cu model de referinţă SAMR (Model Reference
Adaptive System MRAS), cu structura generală de reglare din figura 2.1, şi sisteme adaptive cu
autoreglare sau autoacordare SAA (Self-tuning Adaptive System SAS), cu structura prezentată
în figura 2.2.
Fig. 2.1. Structura generală a unui sistem adaptiv cu model de referinţă (direct)
Modelul de referinţă (etalon) din cadrul sistemelor adaptive de acest tip (cu structura
prezentată deja în figura 2.1) caracterizează comportarea dorită a sistemului, furnizând la
10
ieşire semnalul ym(t). Astfel, acelaşi semnal de intrare r(t) este aplicat atât modelului ideal cât
şi construcţiei regulator adaptiv-proces.
Sistemele adaptive cu model de referinţă se impun în domeniul sistemelor automate
mai ales atunci când parametrii procesului sunt constanţi, dar necunoscuţi sau atunci când
aceştia variază lent (pe intervale mari de timp) în comparaţie cu dinamica adaptării, dar suferă
modificări importante sub acţiunea unor perturbaţii parametrice. Spre deosebire de sistemele
adaptive cu model de referinţă trebuie recunoscută totuşi superioritatea sistemelor adaptive cu
autoacordare din punct de vedere al flexibilităţii, deoarece la acestea din urmă există
posibilităţi multiple de cuplare a metodelor de proiectare a regulatoarelor şi de estimare a
modelelor proceselor.
Mecanismul de ajustare al sistemelor adaptive cu model etalon asigură o stabilitate şi o
convergenţă superioară sistemelor autoacordabile, deoarece rolul acestuia este de a modifica
parametrii ajustabili ai regulatorului adaptiv astfel încât regulatorul să furnizeze o comandă
u(t), în scopul reducerii erorii de adaptare ye(t), dintre ieşirea procesului y(t) şi ieşirea
modelului etalon ym(t).
11
- determinarea semnalului de comandă u(t) se face doar prin utilizarea informaţiilor
funcţionale disponibile, pentru intrare în procesul condus {u(τ), τ ≤t} şi pentru ieşire
din procesul condus {y(τ), τ≤t};
- regulatorul adaptiv este un sistem dinamic cauzal;
- parametrii ajustabili ai regulatorului sa ia doar valori care să asigure convergenţa din
relaţia 2.1.
Structura generală a sistemului adaptiv cu model etalon, prezentată în figura 2.1, a fost
propusă prima oară de Whitaker, Yamron şi Keezer în anul 1958, iar formularea problemei de
adaptare a parametrilor regulatorului cu scopul de a obţine un răspuns al procesului identic cu
cel al modelului etalon este cunoscută ca o problemă de urmărire a modelului etalon. Alte
studii în domeniul sistemelor adaptive au fost efectuate ulterior de Parks, Butchart, Hang,
Monopoly, Landau, Ionescu, Wittenmark, Sastry, Bodson, Ioannou, Stoica, Tao etc. [Koo]
Principalele metode de analiză şi sinteză a sistemelor adaptive cu model etalon
dezvoltate în continuarea acestui subcapitol sunt:
- metoda gradientului, cunoscută şi sub denumirea de regula MIT;
- metoda bazată pe teoria stabilităţii Lyapunov.
1
J (q ) =
2
× ye (2.2)
2
dq dJ ¶y
= -g × = -g × y e × e (2.3)
dt dq ¶q
12
unde γ reprezintă viteza de adaptare (constantă pozitivă);
ye – eroarea de adaptare.
O altă variantă pentru adaptarea parametrilor este cea care foloseşte criteriul de
calitate:
J (q ) = y e (2.4)
dq dJ ¶y
= -g × = -g × e × sign( y e ) (2.5)
dt dq ¶q
ì 1, y e > 0
ï
unde sign ( y e ) = í 0, y e = 0 .
ï- 1, y < 0
î e
Un termen esenţial în relaţia 2.3 şi 2.5 este funcţia de sensibilitate a derivatei erorii
∂ye/∂θ, deoarece aceasta determină modul de adaptare a parametrilor. Se consideră de
asemenea că parametrii se modifică mai lent decât variaţiile sistemului.
Alegerea vitezei (ratei) de adaptare se face în funcţie de amplitudinea semnalului de
intrare. Totuşi nu se pot preciza exact limitele care asigură stabilitatea sistemului în buclă
închisă, ceea ce înseamnă că metoda de adaptare cu gradient descendent poate conduce la
instabilitate. Pentru asigurarea stabilităţii se înlocuieşte funcţia de sensibilitate cu o altă
metodă de adaptare, mai bună, bazată pe teoria de stabilitate Lyapunov.
dx (t )
= f ( x (t )), f (0) = 0 (2.6)
dt
unde sistemul este neliniar sau liniar după cum este şi funcţia f(x).
13
Soluţia x(t) este stabilă în sens Lyapunov dacă pentru orice ε>0 există δ>0 astfel încât
la orice moment de timp t pozitiv x (t ) < d Þ x (t ) < e . Soluţia este asimptotic stabilă dacă
Forma practică şi utilă în cazul sistemelor adaptive cu model etalon este cea dată de
metoda directă Lyapunov. Să presupunem încă o dată relaţia 2.6 pentru caracterizarea
dinamicii sistemului în buclă închisă. Dacă se găseşte o funcţie V, care depinde de parametrii
sistemului, denumită funcţie Lyapunov, astfel încât:
1. V(x)>0, x≠0;
2. V(0)=0;
3. V este derivabilă;
· ¶V ·
4. V (t ) = × x (t ) £ 0 .
¶x
atunci sistemul este stabil. Altfel spus dacă funcţia V este pozitiv definită (1 şi 2) şi
derivata ei negativ semidefinită (3 şi 4) atunci sistemul în buclă închisă este stabil.
Înlocuind condiţia 4 cu relaţia 2.7, ceea ce înseamnă că derivata funcţiei V este negativ
definită, sistemul în buclă închisă devine asimptotic stabil (exponenţial stabil).
· ¶V ·
V (t ) = × x (t ) < 0 (2.7)
¶x
În plus dacă V(x)→∞, când x→∞, sistemul este global asimptotic stabil (adică
sistemul este asimptotic stabil pentru toate valorile x iniţiale). Relaţia 2.7 stă la baza
determinării mecanismului de ajustare a parametrilor regulatorului adaptiv pe baza teoriei
Lyapunov. [Iou, Dav2, Ast2]
Problema esenţială şi în cazul sistemelor adaptive rămâne găsirea acestei funcţii V(x)
(denumită şi funcţie de energie care depinde de parametrii sistemului), deoarece în cazul în
care ea nu a putut fi găsită astfel încât să îndeplinească condiţiile 1-4 din teoria stabilităţii nu
se pot face aprecieri din punct de vedere al stabilităţii şi convergenţei sistemului adaptiv în
buclă închisă.
Pentru un sistem dat prin ecuaţia:
dx (t )
= A × x (t ), x (0) = x0 (2.8)
dt
V ( x) = x T × P × x > 0 (2.9)
Dacă P este o matrice pătratică simetrică pozitiv definită atunci primele două condiţii
din teorema stabilităţii (forma practică) sunt îndeplinite şi deci funcţia Lyapunov este pozitiv
definită. Derivata funcţiei Lyapunov este conform relaţiei 2.10 negativ definită.
·
V ( x, t ) = x T × P × x + x T × P × x = x T × AT × P × x + x T × P × A × x = x T (AT × P + P × A) × x
· ·
·
AT × P + P × A = -Q Þ V ( x , t ) = - x T × Q × x < 0 (2.10)
H ( s ) = Y ( s ) U ( s ) = k × G( s) (2.11)
H m ( s ) = Ym ( s ) R ( s ) = k 0 × G ( s ) (2.12)
U ( s ) = q × R( s) (2.13)
Ideal, răspunsurile celor două sisteme sunt identice când parametrul de acord are
valoarea optimă staţionară.
Ye ( s ) = 0 Þ Y ( s ) = Ym ( s ) Þ q * = k 0 k (2.14)
Dar valoarea lui k nu este cunoscută şi atunci trebuie găsit un mecanism de adaptare a
parametrului regulatorului θ. Eroarea de adaptare (de urmărire) dintre ieşirile din cele două
sisteme trebuie să tindă spre 0 şi este dată de relaţia:
Dacă se aplică regula MIT (relaţia 2.3) pentru adaptarea parametrului θ atunci rezultă:
dq dJ ¶y
= -g × = -g × y e × e = -g × y e × y m (2.16)
dt dq ¶q
iar pentru metoda Lyapunov se poate alege următoarea funcţie V, pozitiv definită:
2
g k æ k ö
V ( y e , q ) = × y e + × çq - 0 ÷
2
(2.17)
2 2 è k ø
Din teoria stabilităţii Lyapunov rezultă că sistemul în buclă închisă este stabil dacă
derivata acestei funcţii V este negativ semidefinită. Din această condiţie rezultă regula pentru
adaptarea parametrului θ, ce se bazează pe teoria stabilităţii (interne) Lyapunov:
dq
= -g × r × y e (2.18)
dt
În figura 2.3 se găsesc cele două sisteme adaptive cu model etalon, care folosesc drept
mecanism de adaptare al parametrului ajustabil relaţiile 2.16 şi 2.18. Schemele de simulare au
16
fost realizate în mediul Simulink, un accesoriu util de proiectare, modelare şi simulare al
programului de calcul numeric folosit în instituţii academice şi de cercetare Matlab.
Versiunea de program Matlab folosită este 6.5. [***1, ***2, Ghi, ww11]
Fig. 2.6. Răspunsurile modelului etalon şi procesului condus, respectiv evoluţia în timp a
parametrului ajustabil θ, pentru un factor de adaptare prea mare.
Al doilea exemplu reprezintă adaptarea unui sistem în care procesul condus conţine
factorul de amplificare k şi constanta de timp T necunoscute (sistem de ordin I). Se dau pentru
acest exemplu procesul condus H(s) şi modelul etalon Hm(s):
b ·
H ( s ) = Y ( s) R( s) = Þ y (t ) = - a × y ( t ) + b × u ( t ) (2.19)
s+a
18
bm ·
H m ( s ) = Ym ( s ) U ( s ) = Þ y m (t ) = - a m × y m (t ) + bm × r (t ) (2.20)
s + am
u( t ) = q1 × r ( t ) - q 2 × y ( t ) (2.21)
Ieşirea sistemului în buclă închisă în funcţie de intrarea r(t) este dată de relaţia 2.22.
b × q1
y (t ) = r (t ) (2.22)
p + a + b ×q2
ì * bm
ï q1 = b
(- a - b × q 2 ) × y(t ) + b × q1 × r (t ) = -am × ym (t ) + bm × r(t ) Þ í a -a
(2.23)
ïq 2* = m
î b
y e ( t ) = y (t ) - y m ( t ) (2.24)
¶y e b ¶y e b 2 × q1 b
= ×r; =- ×r = - ×y (2.25)
¶q1 p + a + b × q 2 ¶q 2 ( p + a + b × q2 )2
p + a + b ×q2
p + a + b × q 2 = p + am (2.26)
Dacă se aplică regula gradientului descendent (MIT, cu relaţia 2.3) pentru adaptarea
parametrilor θ1 şi θ2, incluzând parametrul b în factorul de adaptare γ, atunci rezultă:
dq 1 æ am ö dq 2 æ am ö
= -g × çç × r ÷÷ × y e şi =g × çç × y ÷÷ × y e (2.27)
dt è p + am ø dt è p + am ø
Pentru metoda de adaptare bazată pe teoria stabilităţii Lyapunov din relaţiile 2.19 şi
2.20 rezultă:
dy e (t )
= - a m × y e (t ) - (b × q 2 + a - a m ) × y (t ) + (b × q 1 - bm ) × r (t ) (2.28)
dt
1æ 2 1 1 2ö
V ( ye ,q ) = × (b × q 2 + a - am ) + × (b × q1 - bm ) ÷÷
2
çç × y e + (2.29)
2è b ×g b ×g ø
20
Din teoria stabilităţii Lyapunov rezultă că sistemul în buclă închisă este stabil dacă
derivata acestei funcţii V este negativ semidefinită.
dV ( y e , q ) 2
= -am × ye £ 0 (2.30)
dt
dq 1 dq 2
= -g × r × y e şi = g × y × ye (2.31)
dt dt
În figura 2.8 se prezintă două structuri de reglare cu model etalon care folosesc drept
mecanism de adaptare al parametrului ajustabil relaţiile 2.16 şi 2.18.
Diferenţa între cele două scheme este dată de prezenţa filtrelor în structura
mecanismului de adaptare realizat cu relaţia 2.16. Şi pentru adaptarea factorului de
amplificare k, respectiv a constantei de timp T, creşterea vitezei de adaptare poate conduce la
oscilaţii ale semnalului de ieşire (figura 2.10). Îmbunătăţirea stabilităţii se face folosind un
mecanism de adaptare bazat pe teoria stabilităţii Lyapunov.
21
Fig. 2.9. Răspunsurile procesului condus şi modelului etalon
Din studiul celor două aplicaţii de control adaptiv cu model etalon se observă
superioritatea netă din orice punct de vedere al celei de-a doua metode de adaptare a
parametrilor regulatorului adaptiv folosită în lucrare, şi anume metoda de adaptare bazată pe
teoria stabilităţii Lyapunov.
În această secţiune se prezintă noţiuni introductive şi de bază din logica fuzzy, urmate
de prezentarea structurii regulatoarelor directe fuzzy cu evidenţierea blocurilor componente şi
a câtorva aplicaţii de reglare inteligentă.
În deceniile trecute am asistat la o dezvoltare puternică în domeniul acestei noi teorii,
logica fuzzy. Această nouă teorie stă la baza reglării si controlului fuzzy, una din metodele de
reglare moderne care duce la schimbarea modului de abordare a problemelor în cadrul
automaticii de astăzi.
Există diverse situaţii în care cunoştinţele despre un anumit fenomen sunt parţiale sau
chiar contradictorii şi totuşi omul este pus în situaţia de a lua o decizie raţională deoarece nu
22
mai poate apela la situaţii similare memorate şi cunoscute deja. Având în vedere că universul
este un conglomerat de cunoştinţe ce nu vor putea fi vreodată cunoscute în totalitate s-a
elaborat o teorie bazată pe probabilistica logicii clasice . Logica fuzzy utilizează informaţia
sub forma unor elemente lingvistice pentru descrierea comportării sistemelor complexe fără a
fi necesară utilizarea obişnuitelor modele matematice folosite la proiectarea clasică a
sistemelor. Însă se ştie că în practică informaţiile (datele) obţinute de la diferiţi senzori se
găsesc sub forma unor elemente numerice .
Între cele două tipuri de informaţii există diferenţe fundamentale atât cu privire la
regulile ce le guvernează cât şi ca formalism. Astfel pentru a forma un sistem util practic
trebuie găsită o punte de legătură între cele două lumi formate, pe de o parte lumea calculelor
matematice şi numerice şi pe de altă parte lumea umană reprezentată de noţiunile lingvistice.
Această punte poate fi constituită de logica fuzzy şi sistemele fuzzy aferente.
Fundamentat pe logica fuzzy s-a dezvoltat controlul fuzzy al proceselor prin care se
simulează comportamentul uman în conducerea proceselor. Dacă am face o scurtă incursiune
în automatica şi conducerea proceselor clasice putem să observăm uşor marele impediment al
acestor metode, modelarea fizică a proceselor supuse reglării şi eventual liniarizarea
modelului prin diferite tehnici. În practică ne putem lovi uşor de această problemă când
modelul matematic devine prea complex sau chiar atunci când acesta nu poate fi determinat
datorită inexistenţei unor informaţii necesare. O alta situaţie ar fi atunci când sistemul nostru
are un model neliniar şi nu dorim liniarizarea lui. Atunci în sprijinul nostru vin metodele
moderne bazate pe inteligenţă artificială sau pe experienţă umană pentru a face mai eficient
întregul proces de reglare. Aceste metode utilizează o descriere semiformală despre strategia
de reglare .
Logica fuzzy asigură posibilitatea conversiei unei strategii lingvistice într-una
numerică fără a se dispune de un model matematic al procesului. Ea este des utilizată în
aplicaţii de control, unde procesul este prea complex pentru a fi analizat prin metode
convenţionale.
Odată cu creşterea interesului faţă de posibilităţile inedite oferite de logica fuzzy în
aplicaţii de testare şi control, s-au dezvoltat procesoare fuzzy precum şi medii de programare
dedicate simulării şi implementării acestor aplicaţii. Astfel a apărut posibilitatea utilizării unor
controllere simple de logică fuzzy, în locul unor procesoare convenţionale mai complicate ce
lucrează pe cuvinte de 32 biţi. Pentru implementările cele mai simple s-au utilizat
microcontrolere ieftine având lungimea codului de câteva sute de biţi.
Printre companiile renumite producătoare de sisteme fuzzy se numără : American
Neuralogix, Aptronix, Fuzzy Systems Engineering, Hitachi America, Intel, Integrated
23
Systems, National Semiconductor, Motorola, National Semiconductor, Philips, SGS Thomson
Microelectronics. [Dav1, Olt1, Pre1, Pre2, ww1]
Fără a epuiza posibilităţile de folosire a sistemelor de reglare fuzzy (FLC) putem
aminti de reglarea unor parametrii critici precum temperatura, presiunea, debitul, poziţia,
clima, viteza etc. precum şi de câteva domenii clare de aplicare :
Tabel 2.1. Domenii de aplicare ale FLC
Nr. aplicaţiilor :
Domenii de aplicare
1990-1999
Sisteme de reglare Peste 13.289
Măsurări traductoare Peste 1.919
Automobile Peste 394
Robotică Peste 1.867
Prelucrări de imagine Peste 3.469
Diagnoză automată Peste 1.271
Alte aplicaţii Peste 11.045
ì1, u Î A
x A : U ® {0,1}; x A (u ) = í (2.32)
î0, u Ï A
24
există sau nu există sau conform filozofiei şi religiei orientale principiul că ceva există şi, în
acelaşi timp, nu există, de exemplu YIN şi YANG.
Dar nu orice informaţie poate fi convertită binar folosind acest principiu de true/false
şi atunci se apelează la statistică, ceea ce presupune introducerea probabilităţii cuprinse între 0
şi 1, ca un element u să aparţină unei mulţimi A. Logica fuzzy produce acelaşi rezultat, în
sensul în care etichetează variabilele cu valori cuprinse între 0 şi 1, adică funcţia x de
apartenenţă a elementelor u la mulţimea A poate lua şi valori subunitare. [Kis, Pre1, Dri]
O mulţime fuzzy (mulţime vagă) A, dintr-un domeniu U, este caracterizată printr-o
funcţie de apartenenţă μA, care poate lua valori în intervalul [0,1]:
m A : U ® [0,1] (2.33)
A = {(u, m A (u ) ) | u Î U } (2.34)
O mulţime fuzzy (vagă) sau un set fuzzy este alcătuit grafic din una sau mai multe
funcţii de apartenenţă. Pentru caracterizarea analitică a mulţimilor vagi se folosesc
următoarele noţiuni:
- suportul (baza, lăţimea) mulţimilor vagi;
25
S ( m ) = {u | u Î A, m (u ) > 0} (2.35)
T ( m ) = {u | u Î A, m (u ) = 1} (2.36)
h ( m ) = max {m (u ) | u Î A} (2.37)
sau operatori şi conectori lingvistici ai acestor mulţimi, ilustraţi grafic în figura 2.12.
- conectorul şi, după Zadeh corespunzător intersecţiei a două mulţimi, evaluat prin
operatorul minimum;
- operatorul sau, după Zadeh corespunzător reuniunii a două mulţimi, evaluat prin
operatorul maximum;
Pentru evaluarea reuniunii şi intersecţiei mai sunt folosiţi şi operatorii sumă (sum) şi
produs (prod), iar în literatura de specialitate se mai întâlnesc operatorii şi-vag şi sau-vag sau
modificatori de conţinut cum sunt operatorul de concentrare (con) sau de diluare (dil).
Printre alte noţiuni elementare folosite în teoria mulţimilor fuzzy sunt:
- valoare crisp, reală (crisp value);
- variabilă lingvistică (linguistic variable), de exemplu: temperatura, viteza, clima;
- termen lingvistic (linguistic term), de exemplu: mic, mediu, plăcut, foarte cald;
- grad de apartenenţă la o mulţime fuzzy (membership value, cuprins între 0 şi 1);
- funcţii de apartenenţă (membership functions, cu diferite forme).
În cadrul sistemelor fuzzy, variabila lingvistică reprezintă o mărime fizică şi defineşte
mulţimea de bază, în timp ce termenul lingvistic caracterizează diferitele mulţimi ce se
definesc pe mulţimea de bază prin intermediul funcţiilor de apartenenţă. Termenul lingvistic
trebuie înţeles ca un descriptor fuzzy al unui subdomeniu de valori ale mărimii fizice.
Pentru exemplificare se prezintă descrierea vagă a temperaturii unui cuptor, folosind
cinci termeni lingvistici: foarte mică, mică, medie, mare, foarte mare; termeni definiţi prin
funcţiile de apartenenţă cu forma din figura 2.13. [Dav1, Pre1, Pre2, Jag, Olt1]
28
II.2.2. Structura de bază a regulatoarelor fuzzy directe
Această secţiune este dedicată regulatoarele fuzzy directe. Sunt detaliate structura
acestor regulatoare, blocurile constructive şi diferitele tipuri de raţionamente folosite în cadrul
ingineriei reglării automate.
Modalitatea tradiţională de a proiecta sistemele de control automat pentru procese
neliniare şi afectate de incertitudini se dovedeşte de multe ori a fi foarte dificilă. Prin
utilizarea euristicilor (cunoştinţelor expertului), tehnicile de control bazate pe inteligenţă
artificială pot simplifica sinteza unor regulatoare pentru asemenea procese. Combinând aceşti
algoritmi soft-computing cu unele metode adaptive de învăţare se pot obţine metode de
control aproape optimale.
Utilizarea metodelor bazate pe experienţa umană sunt pe cale să înlocuiască tot mai
des în procesul de conducere metodele clasice de control, aceasta deoarece folosesc doar o
descriere semiformală a strategiei de reglare, adică le formalizează funcţionarea modelelor
proceselor necunoscute printr-o metodă similară cu gândirea umană şi nu au nevoie de modele
matematice.
În general un regulator fuzzy are structura de bază prezentată în figura 2.14, unde sunt
evidenţiate următoarele blocuri componente: [Dav1, Dav2, Olt1, Duk]
- baza de reguli;
- blocul de fuzzificare;
- mecanismul de inferenţă;
- blocul de defuzzificare.
30
lingvistici şi a funcţiilor de apartenenţă se face astfel încât să fie acoperit tot domeniul de
bază. În plus este recomandabil ca o valoare fermă să activeze simultan doi termeni
lingvistici.
În figura 2.15 sunt prezentate câteva exemple de alegere a mulţimilor fuzzy ataşate
unor variabile lingvistice.
31
(dacă situaţii ferme puţin probabile sunt lăsate spre rezolvare unor reguli adiacente sau nu
sunt definite).
Numărul de reguli ale unei baze de reguli complete se calculează cu relaţia:
n
n R = Õ ni (2.44)
i =1
Textual din tabelul de reguli (baza de reguli fuzzy completă) intersecţia coloanei 5 cu
linia 5 conţine implicaţia lingvistică “dacă condiţia 5a şi condiţia 5b atunci concluzia 25”,
deci “dacă x1 este PM şi x2 este PM atunci y este PM” (if x1 is PM and x2 is PM then y is
PM).
În conducerea automată a sistemelor este întâlnită mai rar situaţia în care în premisă se
foloseşte conectorul sau. Acesta ar impune înlocuirea operatorului min din evaluarea analitică
2.45, 2.46 cu operatorul max, respectiv a operatorului prod cu operatorul sum din relaţia 2.47.
Folosirea celor doi operatori simultan în premisele implicaţiilor din baza de reguli duce în
final şi la o modificare a matricei bazei de reguli fuzzy din figura 2.16. Aceasta trebuie să
conţină şi explicaţii asupra operatorului conectorilor folosiţi în premisă. [Pre1, Pre2, Ali, Jag]
În figura 2.17 este prezentat modul de aplicare a inferenţei max-min.
34
Defuzzificarea este procesul de extragere a unei valori reale deterministe din
informaţia fuzzy asociată variabilei de ieşire, obţinută din mecanism de inferenţă μyRez → u.
Metoda cea mai des utilizată, datorită rezultatelor consistente obţinute este cea a centrului de
greutate MCG (center of gravity CoG), introdusă de Watanabe (1986).
Pentru calculul efectiv al ieşirii se poate aplica relaţia 2.48 dacă funcţiile de
apartenenţă ale ieşirii sunt simetrice (cu forme favorabile).
åy i × m y Re z ( y i )
yCoG = i =1
n
(2.48)
åm
i =1
y Re z ( yi )
35
II.2.3. Exemple de structuri de reglare fuzzy directe
Teoretic, un regulator fuzzy este prin construcţie un regulator neliniar, cu una sau mai
multe intrări şi una sau mai multe ieşiri. Un regulator fuzzy poate deveni un regulator cu
dinamică dacă una din mărimile sistemului este prelucrată dinamic.
Regulatoarele fuzzy fără dinamică cu o intrare şi o ieşire sunt regulatoare
proporţionale neliniare cu limitare sau regulatoare multipoziţionale. Regulatoarele fără
dinamică cu mai multe intrări (MISO) corespund structurii clasice, realizarea lor presupune ca
mărimile culese din procesul condus să fie deja separate prin blocuri cu dinamică incluse în
proces. [Jan, Pre1, Pre2, Dav1, Dav2]
Un caz interesant este regulatorul fuzzy după stare, cu structura prezentată în figura
2.20. La acest tip de regulator mărimile de intrare în regulator sunt chiar mărimile de stare ale
procesului condus x1,x2...
· ··
e1 (t ) = e(t ) = r (t ) - y (t ), e2 (t ) = e(t ), e3 (t ) = e(t ) sau e3 (t ) = ò e(t )dt (2.49)
0
k
1
Dk = (ek - ek -1 ) , Ik = å e j (2.50)
Te j =0
36
Cu cele două componente dinamice se realizează în prezent variante de regulatoare
fuzzy de tip PID. Construcţia unui regulator fuzzy cvasi-PD are la bază schema bloc din figura
2.21a şi relaţia 2.51, ce caracterizează o dependenţă tipică a unui regulator convenţional PD.
Dacă coeficienţii k1, k2, kd sunt modelaţi cu ajutorul regulatorului fuzzy atunci rezultă
echivalentul cvasicontinuu al regulatorului fuzzy PD. [Pre1, Pre2]
Construcţia unui regulator fuzzy cvasi-PI de poziţie se poate face în două variante:
- cu efectul de integrare introdus pe ieşirea regulatorului fuzzy (figura 2.21b);
- cu efectul de integrare introdus pe intrarea regulatorului fuzzy (figura 2.21c).
t t
Dacă coeficienţii k1, k2, kd, ki, kp sunt modelaţi cu ajutorul regulatorului fuzzy atunci
rezultă echivalentul cvasicontinuu al regulatorului fuzzy PI.
În mod asemănător se pot realiza şi regulatoarele fuzzy cvasi-PID sau alte regulatoare
fuzzy cu dinamică. În practică sunt întâlnite cel mai des regulatoare fuzzy cu dinamică care au
ca intrări eroarea de reglare şi variaţia acesteia (derivata erorii).
37
Un exemplu în care nu se doreşte obţinerea unor performanţe deosebite, ci doar
detalierea funcţionării unui regulator fuzzy direct, este un sistem de reglare automată a unui
proces de ordin doi. Pentru a obţine un regulator fuzzy cu dinamică a fost introdus un bloc
numeric de derivare. Se consideră următoarea funcţie de transfer continuă a procesului:
1
H (s) = (2.54)
s + 3× s + 4
2
Întrucât metodele de reglare inteligente fuzzy fac parte din categoria soft-computing,
adică implică implementarea acestora pe un sistem de calcul, deci o tratare în plan discret a
problemelor, este necesară o reprezentare discretizată a procesului.
Funcţia discretă a procesului considerând o perioadă de eşantionare de 0.001s este:
H ( z -1 ) =
(
10 -6 × 0.4995 × z -1 + 0.499 × z -2 ) (2.50)
1 - 1.997 × z -1 + 0.997 × z -2
Regulatorul fuzzy a fost realizat folosind editorul grafic fuzzy disponibil în mediul
Matlab. El are două variabile lingvistice de intrare (eroarea şi derivata intrării) şi una de ieşire
(comanda). Pentru toate variabilele au fost alocaţi cinci termeni lingvistici (cu funcţii de
apartenenţă de tip triunghi şi trapez). Domeniile de bază pentru cele trei variabile lingvistice
au fost obţinute prin teste experimentale, deci implicit şi factorii de scalare a domeniilor.
În figura 2.22 sunt prezentate mulţimile de bază pentru variabilele lingvistice şi tabelul
cu baza de reguli.
38
Regulatorul foloseşte raţionamentul Mamdani (pentru mecanismul de inferenţă), ceea
ce înseamnă folosirea operatorului min/max pentru evaluarea conectorului şi/sau din premisă,
respectiv concluzionarea în cadrul regulilor se face cu operatorul min şi conectarea regulilor
cu operatorul max. Obţinerea valorii crisp din valoarea fuzzy (defuzzificarea) se face cu
metoda centrului de greutate.
39
III. Sisteme de reglare fuzzy adaptive
Deşi fiecare din cele două strategii de reglare (adaptivă convenţională şi fuzzy
inteligentă) au adus îmbunătăţiri în domeniul ingineriei reglării automate, modernizându-l,
acestea şi-au dovedit şi ele limitele. Spre exemplu sistemele de reglare inteligente fuzzy, deşi
utile în multe aplicaţii de control automat unde teoria clasică nu face faţă, au şi ele problemele
lor de proiectare şi funcţionare.
Alegerea mulţimilor de bază ale mărimilor de intrare şi ieşire, funcţiile de apartenenţă
şi proiectarea bazei de reguli depind de expertul uman şi de modul în care acesta prelucrează
lingvistic informaţiile despre proces. În plus este posibil ca un regulator deja proiectat să
funcţioneze în condiţii nominale să nu ofere aceleaşi rezultate în cazul unor variaţii
semnificative ale parametrilor procesului.
Dacă ar fi posibilă o reactualizare şi modificare on-line a parametrilor regulatorului
atunci performanţele sistemului în buclă închisă s-ar îmbunătăţii şi am avea de-a face cu o
tehnică de control fuzzy adaptivă. Această tehnică reprezintă o soluţie care combină practic
algoritmii soft-computing (bazaţi pe logica fuzzy) cu metodele adaptive de învăţare, obţinând
metode de control aproape optimale.
Deci, un regulator fuzzy adaptiv posedă avantaje moştenite atât de la sistemele
inteligente fuzzy, cât şi de la sisteme adaptive, pentru a controla sisteme neliniare, cu
parametrii variabili în timp şi cu o structură parţial cunoscută. (Figura 3.1) [Koo]
În cazul regulatorului cu structură variabilă din figura 3.2 unul dintre regulatoare
standard acţionează când modulul erorii de reglare este mai mare de o valoare limită, iar
celălalt când modulul erorii de reglare coboară sub această limită. Parametrii fuzzy ai
regulatoarelor pot fi de fapt factorii de scalare a mulţimilor de bază ale mărimilor de intrare şi
ieşire.
Un alt tip de regulator adaptiv este cel care foloseşte o strategie de adaptare a
parametrilor fuzzy. Parametrii unui regulator fuzzy ce pot fi luaţi în considerare pentru
adaptarea acestuia la noi condiţii de funcţionare sunt:
- funcţiile de apartenenţă (pentru variabile intrare şi ieşire);
- factorii de scalare ai mulţimilor de bază (pentru variabile intrare şi ieşire);
- conţinutul bazei de reguli.
41
Dacă considerăm un regulator fuzzy cvasi-PID standard, structura unui sistem adaptiv
cu parametrii regulatorului variabili după o strategie este dată în figura 3.3. [Pre2]
Ieşirea blocului de adaptare poate fi factorul de scalare al uneia din mulţimile de bază
sau chiar unul din parametrii regulatorului PID (de exemplu factorul proporţional Kr).
Se practică şi o variantă derivată a sistemului adaptiv din figura 3.3, în care regulatorul
fuzzy cvasi-PID standard este înlocuit cu un regulator convenţional PID proiectat iniţial după
metode clasice de proiectare, iar dependent de modificările condiţiilor de funcţionare ale
procesului se modifică on-line parametrii regulatorului PID după o strategie fuzzy. În această
situaţie este necesară prezenţa mai multor blocuri de adaptare fuzzy. Fiecare astfel de bloc
ajustează câte un parametru al regulatorului convenţional (Kr, Ki, Kd).
Aceste tipuri de regulatoare bazate pe logica fuzzy nu reprezintă o soluţie ce
garantează performanţe superioare regulatoarelor convenţionale. Chiar mai mult, aceste
regulatoare moderne nu asigură stabilitatea şi robusteţea sistemelor de reglare automată,
deoarece aceste proprietăţi sunt bazate pe modul de întocmire al mulţimilor de bază ale
variabilelor lingvistice şi de baza de reguli, deci pe experienţa şi cunoştinţele umane.
Totuşi studiile realizate în ultimii ani s-au axat pe dezvoltarea şi perfecţionarea acestui
domeniu. O variantă de bază de implementare a strategiei fuzzy adaptive este prezentată în
figura 3.4.
42
III.2. Sistem de reglare fuzzy adaptiv cu model de referinţă
43
Sistemele de control fuzzy, adaptive sau nu, fac parte din categoria metodelor speciale
soft-computing, adică a metodelor care necesită o implementare pe un sistem de calcul. Acest
fapt ne impune să folosim şi semnale discrete.
Structura sistemului de reglare fuzzy cu învăţare cu model de referinţă FMRLC este
prezentată în figura 3.6. [Koo, Lay, Pas1, Duk]
Acest sistem adaptiv modern conţine patru părţi importante: [Pas1, Koo]
- procesul;
- regulatorul fuzzy;
- modelul de referinţă;
- mecanismul de învăţare (sau de adaptare).
Sistemul de reglare cu FMRLC utilizează mecanismul de învăţare pentru a observa
informaţiile din proces şi modul de funcţionare al sistemului fuzzy. Aceste date sunt folosite
ulterior cu scopul de ajusta parametrii sistemului de reglare inteligent pentru a îndeplini
performanţele cerute sistemului construit, performanţe introduse prin modelul etalon.
Practic se poate spune că sistemul de reglare rezolvă două probleme de urmărire
corespunzătoare celor două bucle din figura 3.6. Sistemul de reglare fuzzy acţionează prin
bucla de reglare inferioară şi prin comanda u(kT) astfel încât ieşirea sistemului y(kT) să
urmărească intrarea r(kT). Sistemul adaptiv de reglare (în special mecanismul de învăţare)
încearcă să ajusteze parametrii regulatorului fuzzy pentru ca sistemul în buclă închisă
(caracterizat prin semnalele r(kT) şi y(kT)) să se comporte asemeni sistemului de referinţă
(caracterizat prin r(kT) şi ym(kT)), deci pentru ca ieşirea sistemului y(kT) să urmărească ieşirea
modelului etalon ym(kT).
În continuare se vor trata mai detaliat doar componentele sistemului de reglare fuzzy
cu învăţare cu model de referinţă (FMRLC), cu schema bloc funcţională prezentată deja în
figura 3.6, care nu au fost studiate până la acest punct al referatului.
44
Regulatorul fuzzy este unul clasic, construit cu structura din figura 2.14 şi după
etapele de proiectare menţionate la subcapitolul II.2.2. După cum s-a văzut aceste regulatoare
pot fi fără dinamică sau cu dinamică, dacă sunt ataşate blocuri de derivare şi integrare pe
intrări. Cel mai des sunt întâlnite regulatoarele fuzzy cu dinamică, respectiv cu două intrări şi
o ieşire (sisteme MISO). Intrările alese cel mai frecvent sunt:
- eroarea de reglare;
e(kT ) - e(kT - T )
d (kT ) = (3.2)
T
45
performanţelor. Funcţiile de apartenenţă ale ieşirii sunt iniţializate în mod euristic, pentru ca
apoi ele să fie modificate de mecanismul de adaptare.
Pentru raţionamentul fuzzy se alege mecanismul de inferenţă Mamdani (inferenţa
max-min), iar valoarea crisp se obţine din valoarea fuzzy prin metoda centrului de greutate.
Modelul de referinţă este elementul prin care sunt introduse în schema funcţională
performanţele dinamice dorite pentru sistemul în buclă închisă (sau altfel spus “sistemul
ideal”). În general, modelul de referinţă poate fi discret sau continuu, liniar sau neliniar,
variabil în timp sau nu, dar pentru a nu îngreuna implementarea calculelor sunt folosite
sistemele de ordin I şi II.
Pentru un sistem de ordin I cu factorul de amplificare k şi constanta de timp T1 dorite
rezultă modelul continuu:
Ym ( s ) k
H (s) = = (3.3)
R( s ) T1 × s + 1
Ym ( s ) k ×wn
H (s) = = 2 (3.4)
R( s ) s + 2 × z × w n × s + w n2
y e ( kT ) = y m ( kT ) - y (kT ) (3.5)
y e (kT ) - y e (kT - T )
y d (kT ) = (3.6)
T
46
III.2.1. Mecanismul de învăţare (de adaptare)
47
mărimea de ieşire dorită ym(kT) să ofere un semnal de corecţie nul (p(kT)=0), ceea ce
înseamnă că adaptarea regulatorului fuzzy încetează. Deci teoretic calea de adaptare este
dezactivată, ceea ce nu înseamnă că ea nu continuă să existe şi să urmărească în continuare
eventualele modificări ce pot apărea în proces.
Această caracteristică (relaţia 3.8) specifică doar modelului fuzzy invers asigură o
stabilitate generală mai bună sistemului.
unde ep este o valoare foarte mică aleasă a priori care va opri adaptarea.
Oricând eventualele modificări în proces conduc la o creştere a erorii de adaptare peste
valoarea lui ep mecanismul de învăţare (adaptare) va intra din nou în funcţiune şi va încerca să
reducă această eroare.
Importante sunt pentru obţinerea unor performanţe mai bune ale sistemului adaptiv
FMRLC sunt şi valorile factorilor de scalare. Valorile factorilor de scalare sunt determinate
prin încercări, respectând câteva reguli. [Pas1]
Pentru o influenţă mai mică a experienţei umane şi a informaţiilor despre proces în
proiectarea modelului fuzzy invers procedura de scalare a parametrilor modelului invers este:
- iniţial se începe cu o valoare gye astfel încât intrarea ye(kT) să nu satureze funcţiile de
apartenenţă ale intrării de la capetele mulţimii de bază;
- se alege un factor de scalare gp al ieşirii modelului fuzzy invers identic cu factorul de
scalare gu al comenzii regulatorului fuzzy direct, iar factorul de scalare gyd este nul;
- se aplică o referinţă treaptă r(kT) cu o valoare a amplitudinii cât mai aproape de cea
din funcţionare normală a sistemului;
- se compară ieşirea sistemului cu ieşirea modelului etalon şi se efectuează modificări
ale parametrilor modelului fuzzy invers până când cele două răspunsuri sunt apropiate,
proiectarea modelului invers fiind oprită. Pentru un răspuns al sistemului în buclă
48
închisă cu oscilaţii prea mari în comparaţie cu răspunsul modelului de referinţă se
creşte acţiunea intrării derivative din mecanismul de învăţare (prin factorul de scalare
al variaţiei erorii de adaptare gyd). Pentru un răspuns al sistemului în buclă închisă prea
lent, ce nu poate urmări răspunsul modelului etalon se scade valoarea acţiunii
derivative (prin gyd).
Unele aplicaţii necesită o implicare mai mare a intuiţiei umane şi o procedură cu mai
puţini parametrii de reglat, şi atunci se recomandă o procedură alternativă de scalare a
factorului gp, echivalentul factorului de adaptare din cazul regulatoarelor adaptive
convenţionale:
- iniţial se începe cu un factor de scalare gp=0 al semnalului de corecţie p(kT), ceea ce
înseamnă că mecanismul de adaptare este inactiv şi avem de-a face cu o reglare fuzzy
directă simplă. Dacă răspunsul sistemului nu este cel dorit atunci se trece la
introducerea treptată a buclei de învăţare (adaptare) prin creşterea factorului de
scalare;
- se aleg amplificările gye şi gyd astfel încât să se evite saturarea funcţiilor de apartenenţă
de la capetele mulţimilor de bază pentru variabilele de intrare;
- se creşte încet valoarea lui gp (se modifică factorul de adaptare) până se obţine un
răspuns satisfăcător.
Modificatorul bazei de reguli are rolul de a adapta baza de reguli a regulatorului fuzzy
direct cu scopul de a realiza o îmbunătăţire a stabilităţii şi performanţelor sistemului în buclă
închisă. Modificarea bazei de reguli se realizează cu ajutorul funcţiilor de apartenenţă ale
ieşirii regulatorului, funcţiile variabilelor de intrare fiind lăsate constante.
Modelul fuzzy invers prelucrează informaţiile venite de la proces şi de la modelul
etalon şi furnizează semnalul de corecţie p(kT) pentru a duce la anularea erorii de adaptare, iar
modificatorul bazei de reguli adaptează baza de reguli astfel încât comanda aplicată de
regulatorul fuzzy direct la un moment anterior u(kT-T) să se modifice cu p(kT).
La un moment ulterior (deci după t=kT), când se vor obţine valori asemănătoare
pentru eroarea de adaptare ye şi pentru variaţia acesteia yd, comanda furnizată de regulatorul
fuzzy va fi deja actualizată (după reguli modificate), rezultând o eroare mai mică între
răspunsul modelului de referinţă şi ieşirea procesului.
49
Modificarea bazei de reguli a regulatorului fuzzy direct se efectuează în doi paşi şi se
realizează prin deplasarea centrelor funcţiilor de apartenenţă a valorilor lingvistice asociate
regulilor ieşirii regulatorului fuzzy direct care au contribuit la comanda anterioară u(kT-T).
Pentru exemplificare se consideră b drept centrul funcţiei de apartenenţă a valorii lingvistice
U asociată variabilei de ieşire. [Pas1]
Dacă intrarea în proces u(kT) are efect la ieşirea procesului nu doar peste un eşantion
de timp, ci peste mai multe eşantioane (n eşantioane) atunci şi adaptarea bazei de reguli se va
face cu o întârziere de n eşantioane şi relaţiile 3.11 şi 3.12 devin:
O altă observaţie ce se evidenţiază este aceea că modificările bazei de reguli sunt doar
modificări locale. Adică, nu se modifică (adaptează) întreaga bază de reguli a regulatorului
fuzzy deoarece sunt active la un moment dat doar un număr limitat de reguli în funcţie de
structura şi aşezarea funcţiilor de apartenenţă ale regulatorului fuzzy. Se modifică doar acele
reguli necesare pentru a reduce puternic eroarea de adaptare ye(kT).
Metoda de adaptare denumită sugestiv şi metodă de învăţare (Fuzzy Model Reference
Learning Model FMRLC) tocmai pentru a diferenţia sistemul modern inteligent şi adaptiv de
sistemele adaptive convenţionale, are un rol important deoarece permite regulatorului să-şi
amintească modificările efectuate în trecut.
50
Deci, în momentul în care la intrarea regulatorului va apărea o situaţie caracterizată de
nişte condiţii care au mai fost întâlnite, regulatorul inteligent “îşi va aminti de aceasta” şi va
lua decizia corespunzătoare anulării erorii de învăţare. [Pas1]
Regulile şi funcţiile de apartenenţă ale ieşirii active nu au o contribuţie egală în
concluzia finală şi atunci în unele aplicaţii ar fi mai bine dacă modificarea bazei de reguli s-ar
efectua doar asupra funcţiilor de apartenenţă (regulilor) cele mai importante (cu grad de
apartenenţă mare) dintre cele activate. Această metodă este practică mai ales când sunt
folosite funcţii de apartenenţă cu formă gaussiană.
51
IV. Aplicaţii de control inteligent adaptiv
Acest capitol conţine câteva aplicaţii de sisteme de reglare fuzzy adaptive, realizate
prin comparaţie cu structuri adaptive convenţionale sau inteligente. Procesele conduse sunt
complexe, neliniare, cu parametrii variabili în timp şi instabile, ceea ce ar face imposibilă
obţinerea unor performanţe dorite şi păstrarea stabilităţii prin metode de proiectare clasice.
Spre exemplu reglarea poziţiei unui braţ robotic dintr-un întreg lanţ cinematic prin
intermediul servomotoarelor de curent continuu sau balansarea şi echilibrarea unui pendul
inversat prin deplasarea unui cărucior de-a lungul unei axe orizontale sunt probleme clasice în
domeniul controlului adaptiv automat. Sistemul robotic (robot, acrobot) este în general
compus din mai multe elemente componente, interdependenţa între diferite axe de mişcare
creează o variaţie a parametrilor procesului cunoscuţi iniţial. Sistemul cu pendul inversat
(inverted pendulum, cart-pole system) este un sistem instabil, folosit la rândul lui în scopuri
didactice în multe universităţi.
Controlul pe care omul l-ar aplica pentru astfel de sisteme diferă mult de soluţiile pe
care le oferă automatica clasică. Ceea ce încearcă tehnicile de control automat bazate pe
inteligenţă artificială este tocmai să speculeze modalitatea în care s-ar realiza controlul de
către un individ uman.
52
Sistemul cu pendul matematic inversat este un sistem neliniar instabil, constituit
dintr-un pendul aflat pe un cărucior mobil şi poate avea drept scop fie menţinerea acestuia în
poziţie verticală în singurul punct de echilibru instabil (deci echilibrarea acestuia) dacă se
consideră ca ieşire din sistem deplasarea căruciorului xp sau conducerea pendulului la un
anumit unghi faţă de axa verticală Oy dacă se consideră ca ieşire din sistem chiar unghiul θ.
Deplasarea ansamblului cărucior-pendul se poate realiza doar de-a lungul axei Ox, prin
intermediul unei forţe mecanice f (comenzi) aplicate din exterior de-a lungul acestei axe.
Chiar dacă metodele de proiectare modernă nu necesită cunoaşterea modelului
matematic al procesului condus (dinamica exactă), acesta va fi determinat pentru a se putea
realiza simularea şi studiul performanţelor sistemului de reglare bazat pe logica fuzzy sau
sistemului adaptiv cu model de referinţă. [Duk, Sti, ***3]
Coordonatele centrului de greutate al pendulului (x0,y0) în raport cu baza acestuia, deci
cu punctul de balansare (xp,yp), cunoscând lungimea lui 2·l şi unghiul pe care îl face cu axa
verticală θ sunt:
x 0 = x p + l × sin(q )
(4.1)
y 0 = y p + l × cos(q )
Ecuaţiile dinamice ale procesului care descriu poziţia căruciorului mobil xp, cât şi
poziţia pendulului faţă de verticală θ, în funcţie de forţa aplicată doar pe axa Ox se determină
folosind echilibrul de forţe şi echilibrul de momente, considerând coeficientul de frecare al
căruciorului b, respectiv coeficientul de frecare al pendulului c foarte mici.
Echilibru de forţe de pe axa Ox ce acţionează doar la nivelul căruciorului este:
·· ·
f - Fx = M × x p + b × x p (4.2)
·· æ ·· ·· ·2 ö
Fx = m × x0 = m × çç x p + l × q × cos(q ) - l × q × sin(q ) ÷÷ (4.3)
è ø
53
·· · ·· ·2
f = (M + m ) × x p + b × x p + m × l × q × cos(q ) - m × l × q × sin(q ) (4.4)
·· ·
åM 0 = J × q + c × q = Fx × l × sin(q ) - Fy × l × cos(q ) (4.5)
·· æ ·· ·· ·2 ö
Fy = G + m × y 0 = mg - m çç x p + l × q × sin(q ) - l × q × cos(q ) ÷÷ (4.6)
è ø
·· ·· ×·· ·
m × g × l × sin(q ) - m × l 2 × q - m × x p × l × cos(q ) = J × q + c × q (4.7)
Sistemul de ecuaţii diferenţiale format din ecuaţiile 4.4 şi 4.7, care descrie dinamica
procesului, este unul neliniar. Acest sistem poate fi liniarizat şi simplificat dacă discutăm de
un unghi θ foarte mic (θ=0, sin(θ)=0, cos(θ)=1, d2θ=0) apropiat de punctul de echilibru
instabil şi dacă se neglijează frecările prin rotaţie şi translaţie (b=c=0).
În cazul general, pendulul are două puncte de echilibru, unul de echilibru stabil pentru
pendul situat în partea de jos a căruciorului şi unul de echilibru instabil pentru pendul situat în
partea de sus a pendulului (adică cazul ce studiat în continuare, pendulul inversat).
ì ·· ··
ï(M + m ) × x p + m × l × q = f
í ·· ·· ·· ··
(4.8)
ïm × g × l × q - m × l 2 × q - m × l × x p = J × q = m × l × q
2
î 3
æ4 m × l ö ·· f
ç ×l - ÷ ×q - g ×q + =0 (4.9)
è3 m+M ø m+M
1
-
q (s) m+M
H (s) = = (4.10)
F ( s) æ 4 m×l ö 2
ç ×l - ÷×s - g
è3 m+M ø
Dacă dorim să avem la ieşire poziţia pendulului pe axa orizontală xp atunci din a doua
ecuaţie a sistemului 4.8 rezultă relaţia 4.11, relaţie ce reprezintă o dependenţă matematică
între poziţia căruciorului şi unghiul de înclinare al pendulului (în domeniu complex).
é J + m × l2 g ù é4 gù
X p ( s) = - ê - 2 ú × q ( s) = - ê × l - 2 ú × q ( s) (4.11)
ë m×l s û ë3 s û
Din 4.10 şi 4.11 rezultă şi funcţia de transfer a procesului condus liniarizat cu intrarea
f şi ieşirea xp.
X p (s) éJ + m ×l2 g ù
H XP ( s ) = = -ê - 2 ú × H ( s)
F ( s) ë m×l s û
4 (4.12)
× l × s2 - g
H XP ( s ) = 3
æ 4 ö 4
ç (m + M ) × × l - m × l ÷ × s - (m + M ) × g × s
2
è 3 ø
ì·
ïx = x
ï 1 2
ï · g 1
í x2 = × x1 - ×u (4.13)
m×l
ï æ4
ç ×l -
ö
÷ (m + M ) × æç 4 × l - m × l ö
÷
ï è3 m+M ø è3 m+M ø
ï
î y = x1
æ 0 1ö æ 0 ö
ç g ÷ ç 1 ÷
A=ç 4 0÷ , B = ç - ÷ , C = (1 0 ) , D = 0 .
ç æç × l - m × l ö÷ ÷ ç (m + M ) × æç 4 × l - m × l ö÷
÷÷
ç 3 m+M ø ÷ ç m+M
èè ø è è3 øø
0.66
H (s) = - (4.14)
0.5 × s 2 - 9.8
După cum se remarcă din relaţia 4.14 şi din figura 4.2, unde este prezentat răspunsul
sistemului neliniarizat în circuit deschis (fără regulator), sistemul cu pendul inversat este
instabil (de fapt funcţia de transfer a acestuia prezintă un pol în semiplanul drept al planului
complex). Regulatoarele care vor fi determinate în continuare trebuie să asigure în stabilizarea
sistemului în buclă închisă.
56
În continuare vor fi de terminate mai multe tipuri de regulatoare (adaptive cu model
etalon, fuzzy inteligente, fuzzy adaptive) pentru a se putea compara şi alege în final varianta
care oferă performanţele cele mai bune pentru sistemul în buclă închisă.
·
u(t ) = k1 × r (t ) - k 2 × y (t ) - k 3 × y (t ) (4.15)
· ·
u(t ) = k1 × (r (t ) - y (t ) ) - k 3 × y (t ) = k1 × e(t ) - k 3 × y (t ) (4.16)
Ym ( s ) wn 2 9
H m ( s) = = 2 = 2 (4.17)
R( s) s + 2 × z × w n × s + w n 2
s + 6×s + 9
ì
y ( t ) =
(- 0.66 0.5) × k1 × r(t )
ï p 2
- (0 .66 × k 0 .5 ) × p - (0 . 66 × k + 9 . 8 ) 0 .5
ï 3 2
í (4.18)
ï y (t ) = wn 2 9
× r(t ) = 2 × r(t )
ïî m
p + 2 × z × w n × p + wn
2 2
s + 6×s + 9
57
parametrilor regulatorului. Pentru aceasta sunt exemplificate cele două metode discutate: MIT
sau metoda gradientului descendent şi metoda bazată pe stabilitatea Lyapunov (capitolul II.1).
Prin metoda MIT (folosind relaţia 2.3) rezultă următoarele trei legi de adaptare:
ì · æ 0.66 0.5 ö
ïk1 (t ) = -g 1 çç 2 × r (t ) ÷÷ × y e (t )
ï è p - (0.66 × k 3 0.5) × p - (0.66 × k 2 + 9.8) 0.5 ø
ïï · æ 0.66 0.5 ö
ík 2 (t ) = -g 2 çç 2 × y (t ) ÷÷ × y e (t ) (4.19)
ï è p - (0.66 × k 3 0.5) × p - (0.66 × k 2 + 9.8) 0.5 ø
ï · æ 0.66 0.5 · ö
ïk 3 (t ) = -g 3 ç 2 × y (t ) ÷÷ × y e (t )
ç
ïî è p - (0.66 × k 3 0.5) × p - (0.66 × k 2 + 9.8) 0.5 ø
În figura 4.3 este prezentată schema de reglare adaptivă cu model etalon folosind
metoda de adaptare MIT. Adaptarea se realizează aplicând la intrare un semnal de referinţă de
tip impulsuri dreptunghiulare cu o perioadă de 20 secunde şi amplitudine de pi/10 (unghiul θ).
Fig. 4.4. Evoluţia în timp a ieşirilor din modelul etalon şi din proces
O variantă de sistem adaptiv cu model de referinţă mai bună din punct de vedere al
performanţelor se obţine dacă se aplică a doua metodă de adaptare bazată pe teoria de
stabilitate Lyapunov. Aceasta presupune să folosim modele matematice ISO (intrare-stare-
ieşire) pentru sisteme cu un grad mai mare. Se introduc notaţiile:
T T T
y = éê y y ùú , y m = éê y m y m ùú , y e = éê y e y e ùú
· · ·
ë û ë û ë û
Ecuaţiile dinamice care descriu comportarea celor două bucle de urmărire (de adaptare
şi de referinţă) şi eroarea de adaptare sunt:
ì · =
ï y (t ) A(t ) × y (t ) + B(t ) × r (t )
ï ·
í y m (t ) = Am × y m (t ) + Bm × r (t ) (4.21)
ï ·
ï y e (t ) = Am × y e (t ) + ( Am - A(t ) ) × y (t ) + (Bm - B (t ) ) × r (t )
î
é 0 1 ù é 0 ù
A(t ) = ê 0.66 × k 2 (t ) + 9.8 0.66 ú, B(t ) = ê - 0.66
êë × k 3 (t )ú ê × k1 (t )úú
0.5 0.5 û ë 0.5 û (4.22)
é 0 1 ù é 0 ù
Am = ê ú, Bm = ê 2 ú
ë- w n - 2 × z × w n û ëw n û
2
T
{ T
} {
V (t , y e (t ) ) = y e × P × y e + tr ( Am - A) × ( Am - A) + tr (Bm - B ) × (Bm - B ) > 0
T
} (4.23)
ép p12 ù
unde P = ê 11 este o matrice pozitiv definită (p11>0 şi p11p22-p12p12>0);
ë p12 p22 úû
( ) ì ü
V (t , y e (t ) ) = y e × Am × P + P × Am × y e + 2 × tr í( Am - A) × æç P × y e × y T - Aö÷ ý +
· ·
T T T
î è øþ
(4.24)
ì ü
+ 2 × tr í(Bm - B ) × æç P × y e × r T - B ö÷ ý
·
T
î è øþ
Derivata funcţiei Lyapunov este negativ definită (se îndeplineşte a doua condiţie din
teorema de stabilitate) şi conform teoremei punctul de echilibru ye=ym-y=0 este asimptotic
stabil dacă se aleg:
ì Am T × P + P × Am = -Q < 0
ï ·
ï
í A(t ) = g A × P × y e × y
T
(4.25)
ï ·
ïî B(t ) = g B × P × y e × r T
unde Q este o matrice simetrică pozitiv definită (se poate alege matricea identitate).
é1 0ù
Q=ê ú
ë0 1û
Rezolvând sistemul de ecuaţii 4.25 rezultă mai întâi matricea simetrică P (relaţia
4.26), iar apoi legile de adaptare pentru parametrii variabili ai regulatorului (relaţia 4.27).
é1 æ 1 + wn ö
2
1 ù
ê × çç z + ÷ ú
w è 4 × z ÷ø 2 ×wn
2
ú = é1.1667 0.0556ù
P=ê n ê0.0556 0.0926ú (4.26)
ê 1 1 æ 1 öú
× çç1 + 2 ÷÷ú ë û
ê
êë 2 ×wn2 4 × z × w n è w n øúû
60
ì · æ p × y (t ) + p × y ·(t ) ö r (t )
ï k1 ( t ) = -g 1 ç 12 e 22 e ÷×
è ø
ï
ï ·
æ ·
ö
ík 2 (t ) = g 2 ç p12 × y e (t ) + p 22 × y e (t ) ÷ × y (t ) (4.27)
ï è ø
ï · æ ·
ö ·
ïk 3 (t ) = g 3 ç p12 × y e (t ) + p22 × y e (t ) ÷ × y (t )
î è ø
În figura 4.5 este prezentată schema de reglare adaptivă cu model etalon folosind
teoria de stabilitate Lyapunov. Adaptarea se realizează aplicând la intrare acelaşi tip de
semnal de referinţă.
Evoluţia în timp a semnalelor de ieşire din modelul etalon şi din procesul condus,
respectiv eroarea de adaptare sunt prezentate în figura 4.6. Se evidenţiază o adaptare mai
rapidă a parametrilor regulatorului şi oscilaţii mai mici ale erorii de adaptare ye(t), decât în
cazul metodei MIT (gradient descendent).
Fig. 4.6. Evoluţia în timp a ieşirilor din modelul etalon şi din proces
61
În figura 4.7 este prezentată evoluţia parametrilor ajustabili ai regulatorului şi
comanda dată de acesta.
Pentru reglarea sistemului cu pendul inversat analizat s-au considerat ca intrări pentru
regulatorul fuzzy două mărimi: eroarea de reglare şi variaţia erorii de reglare; rezultând un
regulator fuzzy cvasi-PD cu dinamică. [Pre1, Pre2]
62
Schema de reglare fuzzy a pendulului inversat este prezentată în figura 4.9.
64
şi/sau din premisă, respectiv concluzionarea în cadrul regulilor se face cu operatorul min şi
conectarea regulilor cu operatorul max.
Obţinerea valorii crisp din valoarea fuzzy se face prin operaţia de defuzzificare,
practic ultima etapă şi componentă a regulatorului fuzzy. În cazul regulatorului fuzzy cvasi-
PD folosit la echilibrarea pendulului defuzzificarea se face cu metoda centrului de greutate.
Definirea regulatorului fuzzy a fost realizată de către autor folosind funcţii din
biblioteca Fuzzy Logic Toolbox a mediului Matlab. Acest program de descriere (cuprins în
Anexa 2) este utilizat de blocul FLC pentru simularea sistemului din figura 4.9 în Simulink.
În figura 4.12 sunt prezentate evoluţia în timp a erorii de reglare, a comenzii şi a ieşirii
din procesului condus la un semnal de intrare de tip impulsuri dreptunghiulare.
Pentru obţinerea diagramelor în timp din figura 4.13 a fost folosită schema neliniară a
pendulului matematic inversat (Anexa 1). Echilibrarea pendulului inversat se face după mai
puţin de 3 secunde.
În cazul regulatorului fuzzy direct sunt necesare multe simulări şi teste ale sistemului
în buclă închisă până se ajunge la acordarea corectă a acestuia pentru obţinerea unor
65
performanţe cât mai bune. În situaţia regulatorului fuzzy adaptiv (sistem de reglare fuzzy cu
învăţare cu model etalon) alegerea parametrilor regulatorului fuzzy direct nu mai este
esenţială, deoarece mecanismul de învăţare (adaptare) va modifica oricum aceşti parametrii.
Parametrul variabil la sistemul de reglare fuzzy cu învăţare cu model etalon reprezintă baza de
reguli. [Pas1, Koo]
Schema sistemului de reglare fuzzy adaptiv al pendulului inversat (din categoria
sistemelor de reglare fuzzy cu învăţare cu model de referinţă) este prezentată în figura 4.14.
Se evidenţiază din schemă cele patru blocuri importante detaliate deja din punct de
vedere teoretic: procesul, regulatorul fuzzy, modelul de referinţă, mecanismul de învăţare
Dacă procesul condus şi modelul de referinţă sunt uşor de înţeles, acestea fiind
discutate şi la celelalte tipuri de reglări, regulatorul fuzzy şi mecanismul de adaptare (modelul
fuzzy invers împreună cu modificatorul bazei de reguli) vor fi puţin mai detaliate.
Modelul de referinţă din sistemul de reglare fuzzy cu învăţare cu model de referinţă
specifică performanţele dorite pentru sistemul în buclă închisă. În general, acest sistem poate
lua orice formă, poate fi discret sau continuu, liniar sau neliniar, variant sau invariant în timp
etc. Eroarea de învăţare ye(kT) dintre ieşirea modelului etalon şi ieşirea procesului condus
furnizează o caracterizare a măsurii în care performanţa dorită este atinsă în eşantionul kT.
De asemenea regulatorul fuzzy direct este cel prezentat la subcapitolul IV.1.4, cu
deosebirea că mulţimile de bază ataşate intrărilor şi ieşirilor, respectiv funcţiile de apartenenţă
sunt introduse în program cu ajutorul unor amplificări (factori de scalare).
Sunt considerate şi aici ca intrări pentru regulatorul fuzzy direct două mărimi: eroarea
de reglare, notată aici cu e(kT) şi variaţia erorii de reglare d(kT); rezultând un regulator direct
fuzzy cvasi-PD cu dinamică (caracterizat de relaţia 4.28). Ieşirea din regulator este comanda
procesului condus u(kT), adică forţa care deplasează căruciorul pendulului inversat.
66
Domeniul şi funcţiile de apartenenţă ataşate celor trei mărimi folosite la regulatorul
fuzzy direct pot fi deci modificate experimental prin intermediul factorilor de scalare şi
normalizare: ge reprezintă factorul de scalare al erorii de reglare e(kT), gd reprezintă factorul
de scalare al variaţiei erorii d(kT), iar gu este factorul de scalare al comenzii u(kT).
Baza de reguli este aceeaşi cu cea prezentată în figura 4.10, iar pentru inferenţă
(activare şi decizionare în interiorul regulatorului) este folosit raţionamentul Mamdani.
Defuzzificarea se face prin metoda centrului de greutate (CoG).
În continuare va fi prezentat mecanismul de învăţare (adaptare). Acesta este
descompus la rândul lui, după cum se vede şi din schemă, în două blocuri componente:
modelul fuzzy invers şi modificatorul bazei de reguli.
În mod asemănător cu regulatorul fuzzy direct, şi modelul fuzzy invers conţine factori
de scalare şi normalizare ataşaţi intrărilor şi ieşirilor acestuia cu scopul de a realiza modificări
experimentale: gye reprezintă factorul de scalare al erorii de adaptare ye(kT), gyd reprezintă
factorul de scalare al variaţiei erorii de adaptare yd(kT), iar gp este factorul de scalare al ieşirii
din modelul invers (semnalul de corecţie) p(kT).
67
După ce au fost efectuate mai multe teste şi respectând procedura de scalare de la
secţiunea III.2.1 din conţinutul acestui referat au fost alese următoarele valori: gye=π/10,
gyd=0.5, gp=1. În plus, în modelul fuzzy invers a fost implementată şi strategia de oprire a
adaptării parametrilor regulatorului fuzzy direct când eroarea de adaptare este foarte mică şi
deci sistemul în buclă închisă ce conţine procesul urmăreşte destul de bine modelul de
referinţă. Strategia este introdusă prin relaţia 3.9, considerându-se o eroare maximă admisă
ep=0.001ּgp.
Modificarea bazei de reguli se realizează prin adaptarea funcţiilor de apartenenţă ale
ieşirii regulatorului, funcţiile variabilelor de intrare fiind lăsate constante, în cele două etape
discutate la secţiunea teoretică (subcapitolul III.2.1) de proiectare a modificatorului bazei de
reguli. [Pas1, Koo]
Pentru sistemul studiat, având în vedere structura funcţiilor de apartenenţă ale
regulatorului fuzzy (Fig. 4.15), pot fi active la un moment dat maxim patru reguli, ceea ce
indică faptul că vom avea de adaptat conform ecuaţiei (3.12) cel mult patru reguli. Această
observaţie mai confirmă încă o dată că modificările realizate în baza de reguli sunt modificări
locale.
Definirea regulatorului fuzzy direct, a modelului fuzzy invers şi a modificatorului bazei
de reguli a fost realizată de către autor folosind funcţii proprii create în mediul Matlab. Aceste
programe de descriere a celor trei componente folosite la simularea sistemului din figura 4.14
stau în spatele blocurilor din mediul Simulink.
În figura 4.16 sunt prezentate evoluţia în timp a comenzii, ieşirii (unghiului făcut de
pendul cu axa verticală) şi factorului de adaptare (semnalului de corecţie), când la intrare se
aplică un semnal tren de impulsuri dreptunghiulare cu o amplitudine de π/10.
68
Capacitatea de învăţare şi de adaptare la situaţii diferite este remarcată şi dacă la
intrare este aplicat un semnal de tip tren de impulsuri triunghiulare (între –π/10 şi π/10).
Figura 4.17 prezintă evoluţia în timp a comenzii, ieşirii şi factorului de adaptare.
Din analiza celor trei tipuri de sisteme de reglare este evidentă superioritatea tehnicilor
de conducere inteligente şi adaptive. Acestea nu doar pot compensa prezenţa neliniarităţilor în
proces fără a fi necesară liniarizarea acestora în momentul proiectării regulatoarelor, dar au şi
o capacitate suplimentară de a învăţa din evenimente desfăşurate deja.
69
ce presupune interinfluenţe între forţele şi momentele diferitelor grade de libertate (Figura
4.19).
Aceste probleme de proiectare pot fi soluţionate prin folosirea roboţilor paraleli sau
dacă nu este posibilă a unei comenzi adaptive. Această tehnică modernă se impune mai ales
când nu se cunosc exact modelele matematice ale elementelor componente ale robotului,
respectiv când nu se cunosc momentele care acţionează asupra fiecărui element din lanţul
cinematic. Sistemele de reglare adaptivă asigură robusteţea sistemului chiar şi în cazul unor
variaţii semnificative ale parametrilor acestuia. [Mou, Bro]
Majoritatea roboţilor industriali sunt acţionaţi cu elemente hidraulice, pneumatice sau
electrice, ele acţionând prin intermediul unor bucle de reglare a poziţiei. Fiecare braţ al
robotului devine astfel un sistem de reglare al poziţiei. Dacă fiecare astfel de element este
acţionat separat, alternant în timp când celelalte braţe sunt menţinute în echilibru, atunci
implementarea unor bucle de reglare PID s-au dovedit eficiente.
Să presupunem că avem de-a face cu un sistem robotic acţionat cu servomotoare de
curent continuu. Atunci se poate realiza câte un sistem de reglare decuplat pe axe, adică
dedicat fiecărui braţ din lanţul cinematic al robotului. Variaţia parametrilor unui braţ în timp
este compensată printr-o reglare adaptivă cu model de referinţă local robustă.
În figura 4.20 este prezentată schema de funcţionare a unui servomotor de curent
continuu (SMcc), care permite mişcarea unui singur braţ. [Zăr2, Dul]
70
Dacă se presupune excitaţia independentă atunci ecuaţiile care descriu funcţionarea
motorului se obţin aplicând teorema a doua a lui Kirchhoff circuitului de alimentare a
motorului şi legea echilibrului cuplurilor care apar în funcţionarea sistemului.
ì d ia
ïU a = Ra × ia + La × d t + e
ï
ïe = K e × Ω
í (4.29)
ïC = K × i = J × d Ω + C + B × Ω
ï m m a
dt
r
ïW = dq dt
î
W( s ) Km
H W (s) = = (4.30)
U a ( s ) K e K m + ( Ra + sLa ) × ( B + sJ )
q ( s) 1 W( s ) Km
H q ( s) = = × = (4.31)
U a (s) s U a ( s ) s × [K e K m + ( Ra + sLa ) × ( B + sJ )]
q (s) Km × m
H (s) = = (4.31)
U a ( s) s × [K e K m + Ra × ( B + s × J )]
q (s) 0.061
H (s) = = (4.32)
U a ( s) s × [8.2 × s + 4.738]
Răspunsul acestui sistem de ordin doi este identic cu răspunsul sistemului real de ordin
trei unde a fost introdusă şi valoarea inductanţei bobinei (La=0.1H), la o intrare treaptă este
prezentat în figura 4.22. Schema Simulink a manipulatorului de ordin trei este detaliată în
Anexa 4.
Bucla de reglare a poziţiei are rolul de a determina la orice moment valoarea erorii de
reglare între valoarea de referinţă şi valoarea măsurată a ieşirii din proces şi orice diferenţă
între acestea două este amplificată prin intermediul unui regulator.
Bucla de adaptare a sistemului de reglare are rolul de a determina la orice moment
valoarea erorii de adaptare şi prin intermediul unui bloc de adaptare fie să introducă semnale
de compensare (varianta 1 de sistem adaptiv), fie să modifice direct parametrii regulatorului
(varianta 2 de sistem adaptiv) cu scopul diminuării acestei erori.
Pentru prima variantă de sistem adaptiv cu model etalon din figura 4.24 se
recomandă folosirea unui regulator proporţional proiectat după modelul procesului cunoscut
73
iniţial şi compensarea eventualelor modificări ale procesului prin semnalul de compensare
g(t). Acest semnal este dedus folosind teoria de stabilitate Lyapunov.
(s 2 2
) 2 2 é
+ 2 × z × w n × s + w n × q ( s ) = w n × q pr ( s ) + w n × ê g ( s ) -
R × m ×t ù
K 0 × K m úû
(4.33)
ë
Ra × B + K m × K e m × Ra × t
z = , w= (4.34)
2 × m × K 0 × K m × Ra × J Km × K0
Modelul sistemului etalon este tot de ordin doi cu parametrii am=2, bm=1. Acest
sistem etalon are la intrare aceeaşi referinţă θpr, iar la ieşire poziţia dorită θm.
(s 2
+ a m × s + bm ) × q m ( s ) = bm × q pr ( s ) (4.35)
Se calculează eroarea de adaptare θe(t)= θm(t)- θ(t), reprezentând eroarea între ieşirea
dorită (din modelul etalon) şi ieşirea din procesul condus, pornind de la relaţiile 4.33 şi 4.35.
Apoi conform teoriei Lyapunov pentru sisteme adaptive cu model etalon se caută ecuaţia
diferenţială care descrie eroarea de adaptare pentru a se asigura o stabilitate asimptotică a
acesteia, mai exact revenirea asimptotică a erorii spre valoarea de echilibru θe(t)=0.
s 2 × q m ( s ) + a m × s × q m ( s ) + bm × q m ( s ) - s 2 × q ( s ) - 2 × z × w n × s × q ( s ) - w n × q ( s ) =
2
2 é R × m ×t ù (4.36)
= bm × q pr ( s ) - w n × q pr ( s ) - w n × ê g ( s ) -
2
ë K 0 × K m úû
74
Dacă se introduce un moment rezistiv sub forma τ=τ0+η1·(θpr-θ)+ η2·dθ/dt şi se
grupează termenii din relaţia 4.36 se obţine:
(s 2
)
+ a m × s + bm × q e ( s ) = - am × s × q ( s ) - bm × q ( s ) + 2 × z × w n × s × q ( s ) +
2 é R × m ×t ù (4.37)
+ w n × q ( s ) + bm × q pr ( s ) - w n × q pr ( s ) - w n × ê g ( s ) -
2 2
ë K 0 × K m úû
æ 2 æ R×m öö
(s 2
+ a m × s + bm ) × q e ( s ) = çç bm - w n × çç1 -
K0 × K m
× h1 ÷÷ ÷÷ × (q pr ( s ) - q ( s ) ) -
è è øø
(4.38)
é R × m ×t 0 ù æ R×m ö
- wn + çç 2 × z × w n - a m + w n × × h 2 ÷÷ × s × q ( s )
2 2
× ê g ( s) - ú
ë K0 × Km û è K0 × Km ø
Ultima relaţie poate fi trecută din domeniul complex în timp prin transformare Laplace
inversă.
æ æ R×m öö
× h1 ÷÷ ÷÷ × (q pr (t ) - q (t ) ) -
·· ·
q e (t )+ am × q e (t )+ bm × q e (t ) = çç bm - w n 2 × çç1 -
è è K0 × K m øø
(4.39)
é R × m ×t 0 ù æ R×m ö ·
- w n × ê g (t ) - ç z w w h ÷ × q (t )
2÷
2 2
+ 2 × × - a + × ×
K 0 × K m úû çè
n m n
ë K0 × Km ø
În final, s-a obţinut o eroare de adaptare θe cu trei termeni, unul depinde de derivata
poziţiei unghiulare sau viteza unghiulară Ω(t)= dθ/dt, un termen ce depinde de eroarea de
reglare e(t)= θpr(t)-θ(t), şi un termen liber de regim staţionar.
Rolul sistemului de reglare adaptiv este de a da un semnal de compensare g(t), care să
asigure o stabilitatea asimptotică a erorii de adaptare. Acest semnal trebuie de fapt să
compenseze fiecare din cei trei termeni ai erorii de adaptare. Această condiţie este îndeplinită
dacă şi semnalul g(t) este compus la rândul lui din trei termeni similari celor din ecuaţia
diferenţială a erorii de adaptare.
g (t ) = g1 (t ) × (q pr (t ) - q (t ) ) + g 2 (t ) × q (t )+ g 3 (t )
·
(4.40)
75
æ 0 ö
æ 0 1 ö ç ÷
÷ × (q pr (t ) - q (t ) ) +
·
q e (t ) = çç ÷÷ × q e (t ) + ç b - w × ç1 - æ R × m ö
2
× h ÷
è - bm - am ø ç m n ç
è K × K
1 ÷÷
øø
è 0 m
(4.41)
æ 0 ö · æ 0 ö
ç R×m ÷ × q (t )- w 2 × ç R × m × t ÷
ç 2 × z × w n - am + w n × × h2 ÷
2
ç g (t ) -
0
n ÷
è K0 × K m ø è K0 × Km ø
q e (t ) = Am × q e (t ) + b1 × (q pr (t ) - q (t ) ) + b2 × q (t ) + b3
· ·
(4.42)
æ 0 1 ö
Am = çç ÷
è - bm - a m ÷ø
æ 0 ö
ç ÷
b1 = ç b - w 2 × æç1 - R × m × h ö÷ - w 2 × g (t ) ÷
ç m n ç K0 × Km
1 ÷ n 1 ÷
è è ø ø
(4.43)
æ 0 ö
b2 (t ) = 2 × z × w - a + w × R × m × h - w 2 × g (t ) ÷
ç 2
ç n m n 2 n 2 ÷
è K0 × Km ø
æ 0 ö
2 ç R × m ×t ÷
b3 (t ) = w n × 0
- g 3 (t ) ÷
ç
è K0 × Km ø
Funcţia Lyapunov ataşată sistemului descris prin ecuaţiile diferenţiale 4.42 se alege
astfel încât să satisfacă condiţiile din teorema de stabilitate a sistemelor. Această funcţie
Lyapunov V(t) are o formă asemănătoare cu derivata erorii de adaptare θe(t).
Această funcţie Lyapunov este pozitiv definită dacă matricea P este o matrice
pătratică pozitiv definită (p11>0 şi p11p22-p12p12>0) şi a1, a2, a3 sunt factori de ponderare.
· · T · · · ·
V = q e (t ) × P × q e (t ) + q e (t ) × P × q e (t ) + 2a1b1T (t ) b1 (t ) + 2a2 b2T (t ) b2 (t ) + 2a3b3T (t ) b3 (t )
T
76
V (t , q e (t ) ) = q e (t ) × (AmT × P + P × Am ) × q e (t ) +
·
T
ë û
(4.45)
+ éêb2T (t ) × q (t ) × P × q e (t ) + q eT (t ) × P × b2 (t ) × q (t ) + 2a 2 b2T (t ) b2 (t )ùú +
· · ·
ë û
ë û
Derivata funcţiei Lyapunov este negativ definită (se îndeplineşte a doua condiţie din
teorema de stabilitate) şi conform teoremei punctul de echilibru θe=θm-θ=0 este asimptotic
stabil dacă se aleg relaţiile 4.46.
ì Am T × P + P × Am = -Q < 0
ï
[ e 1 ]
ï bT (t ) × P × q (t ) + q T (t ) × P × b (t ) × (q (t ) - q (t ) ) = -2a b· T (t )b (t )
ï 1 e pr 1 1 1
í (4.46)
[ ]
· ·T
ï b2T (t ) × P × q e (t ) + q eT (t ) × P × b2 (t ) × q (t ) = -2a 2 b 2 (t )b2 (t )
ï
ï T
[ ]
·T ·
b
î 3 ( t ) × P × q e ( t ) + q T
e ( t ) × P × b3 ( t ) = - 2 a b
3 3 ( t ) b 3 (t )
unde Q este o matrice simetrică pozitiv definită (se poate alege matricea identitate).
Rezolvând sistemul de ecuaţii 4.46 rezultă mai întâi matricea simetrică P (relaţia 4.47)
în funcţie de parametrii modelului etalon, iar apoi vectorii b1(t),b2(t),b3(t) cu ajutorul cărora se
vor determina legile de adaptare pentru componentele variabile ale semnalului de compensare
g(t) (relaţia 4.48).
é 1 æ a m 1 + bm ö 1 ù
ê × çç + ÷÷ ú
2 è b a ø 2 × bm ú = é 11
p p12 ù é1.5 0.5ù
P=ê m m
ê = (4.47)
ê 1 1 æ 1 öú p p 22 úû êë0.5 0.5úû
ê × çç1 + ÷÷ú ë 12
ë 2 × bm 2 × a m è bm øû
ì·T
ïb1 (t ) = - a × q e (t ) × P × (q pr (t ) - q (t ) )
1 T
ï 1
ïï · T 1 T ·
íb 2 (t ) = - × q e ( t ) × P × q (t ) (4.48)
ï a2
ï·T 1
ïb 3 (t ) = - × q eT (t ) × P
ïî a3
77
Dacă se consideră specificul şi forma vectorilor b1(t),b2(t),b3(t), din relaţiile 4.43 şi
4.48 se obţine următorul sistem de ecuaţii monodimensionale în forma finală pentru
compensarea variaţiilor parametrilor procesului condus:
ì· æ (t ) × p + · (t ) × p ö ( ( t )
g
ï 1 ( t ) = g 1 çq e
× 12 qe 22 ÷ × q pr - q (t ) )
è ø
ï
ï· æ ·
ö ·
í g 2 (t ) = g 2 × çq e (t ) × p12 + q e (t ) × p22 ÷ × q (t ) (4.49)
ï è ø
ï· æ ·
ö
ï g 3 (t ) = g 3 × çq e (t ) × p12 + q e (t ) × p22 ÷
î è ø
78
Evoluţia în timp a semnalelor de ieşire din modelul etalon şi din procesul condus,
respectiv manipulatorul, sunt prezentate în figura 4.26. Se evidenţiază o adaptare a semnalului
g(t) cu scopul anulării erorii de adaptare.
·
u(t ) = k1 × q pr (t ) - k 2 × q (t ) - k 3 × q (t ) (4.50)
u(t ) = k1 × (q pr (t ) - q (t ) ) - k 3 × q (t ) = k1 × e(t ) - k 3 × q (t )
· ·
(4.51)
79
Modelul de referinţă este cel folosit la prima variantă de sistem adaptiv cu model
etalon. Parametrii sistemului de ordin doi etalon sunt parametrii am=2, bm=1. Răspunsul
sistemului etalon la o intrare treaptă este amortizat critic.
q m ( s) bm 1
H m (s) = = 2 = 2 (4.52)
q pr ( s ) s + am × s + bm s + 2 × s + 1
Din relaţiile 4.31, 4.35, 4.51 rezultă relaţiile de calcul al răspunsurilor modelului
etalon şi procesului condus. Se consideră pentru început cuplu rezistent nul şi dispare
semnalul de compensare g(t).
ì (0.061 8.2 ) × k1
ïq (t ) = p 2 + (4.7382 + 0.061 × k ) 8.2 × p + 0.061 × k 8.2 × q pr (t )
ï 3 2
í (4.53)
ïq (t ) = b 1
m
× q pr (t ) = 2 × q pr (t )
îï
m
p + a m × p + bm
2
s + 2× s +1
ï ·
íq m (t ) = Am × q m (t ) + Bm × q pr (t ) (4.54)
ï ·
ïq e (t ) = Am × q e (t ) + ( Am - A(t )) × q (t ) + (Bm - B(t ) ) × q pr (t )
î
T T T
ë û ë û ë û
T
{ T
} {
V (t , q e (t ) ) = q e × P × q e + tr ( Am - A) × ( Am - A) + tr (Bm - B ) × (Bm - B ) > 0
T
} (4.56)
Derivata funcţiei Lyapunov este negativ definită (se îndeplineşte a doua condiţie din
teorema de stabilitate) şi conform teoremei punctul de echilibru θe=θm-θ=0 este asimptotic
stabil dacă se aleg:
ì Am T × P + P × Am = -Q < 0
ï ·
ï
í A(t ) = g A × P × q e × q
T
(4.57)
ï ·
ïî B(t ) = g B × P × q e × q pr
T
Rezolvând sistemul de ecuaţii 4.57 rezultă mai întâi matricea pătratică şi simetrică,
pozitiv definită P (relaţia 4.58), iar apoi legile de adaptare pentru parametrii variabili ai
regulatorului (relaţia 4.59).
é 1 æ a m 1 + bm ö 1 ù
ê × çç + ÷ ú
ê 2 è bm a m ÷ø 2 × bm ú = é p11 p12 ù é1.5 0.5ù
P= = (4.58)
ê 1 1 æ 1 öú ê p p 22 úû êë0.5 0.5úû
ê × çç1 + ÷÷ú ë 12
ë 2 × bm 2 × a m è bm øû
ì · æ p × q (t ) + p × q ·(t ) ö × q (t )
ï k1 ( t ) = g 1 ç 12 e 22 e ÷ pr
ï è ø
ï ·
æ ·
ö
ík 2 (t ) = -g 2 ç p12 × q e (t ) + p22 × q e (t ) ÷ × q (t ) (4.59)
ï è ø
ï ·
æ ·
ö ·
ïk 3 (t ) = -g 3 ç p12 × q e (t ) + p22 × q e (t ) ÷ × q (t )
î è ø
81
Se observă că relaţiile 4.59 sunt simetrice cu relaţiile 4.27 obţinute în cazul reglării
adaptive a pendulului inversat. În figura 4.28 este prezentată a doua variantă de schemă de
reglare adaptivă cu model etalon local robustă a unei componente dintr-un lanţ cinematic al
unui robot, folosind teoria de stabilitate Lyapunov. Adaptarea se realizează aplicând la intrare
acelaşi tip de semnal de referinţă ca şi în cazul primei variante de reglare adaptivă.
Evoluţia în timp a semnalelor de ieşire din modelul etalon şi din procesul condus,
respectiv eroarea de adaptare sunt prezentate în figura 4.29. Se evidenţiază o adaptare a
semnalului g(t) cu scopul anulării erorii de adaptare.
82
acelaşi tip de model etalon reuşesc o compensare, respectiv o adaptare totală a sistemelor de
reglare după aproximativ 100 secunde.
Evoluţia în timp a parametrilor regulatorului (k1, k2, k3) este prezentată în figura 4.30.
83
Parametrul variabil al sistemul de reglare fuzzy adaptiv cu învăţare cu model etalon
reprezintă după cum s-a mai precizat baza de reguli, aceasta se modifică prin intermediul
funcţiilor de apartenenţă ale ieşirii. [Pas1, Pas2, Mou, Koo]
Se evidenţiază din schemă cele patru blocuri cunoscute deja: procesul, regulatorul
fuzzy, modelul de referinţă, mecanismul de învăţare
Modelul de referinţă din sistemul de reglare fuzzy cu învăţare cu model de referinţă
specifică performanţele dorite pentru sistemul în buclă închisă. Acesta reprezintă un sistem de
ordin doi:
q m ( s) 1
H m (s) = = 2 (4.60)
q pr ( s ) s + 2 × s + 1
Fig. 4.33. Baza de reguli a regulatorului fuzzy direct şi a modelului fuzzy invers
Baza de reguli fuzzy este cea din figura 4.33 de la regulatorul fuzzy direct. Astfel,
pentru toate cele trei variabile ale modelului fuzzy invers se folosesc 5 funcţii de apartenenţă
triunghiulare simetrice uniform distribuite pe domeniul variabilelor în cauză. Conform acestor
85
funcţii de apartenenţă rezultă un total de 25 de reguli. Inferenţa este realizată şi aici cu
raţionamentul Mamdani şi defuzzificarea prin metoda centrului de greutate (CoG).
După ce au fost efectuate mai multe teste şi respectând procedura de scalare de la
secţiunea III.2.1 din conţinutul acestui referat au fost alese următoarele valori pentru scalarea
intrărilor şi ieşirilor din regulatorul fuzzy direct şi din modelul fuzzy invers: ge=1, gd=1.1,
gu=10, gθe=1, gθd=0.5, gp=2.
În plus, în modelul fuzzy invers pentru o eroare de adaptare foarte mică se foloseşte
strategia de oprire a adaptării parametrilor regulatorului fuzzy direct. Strategia este introdusă
prin relaţia 3.9, considerându-se o eroare maximă admisă ep=0.001ּgp.
Modificarea bazei de reguli se realizează prin adaptarea funcţiilor de apartenenţă ale
ieşirii regulatorului, funcţiile variabilelor de intrare fiind lăsate constante, în cele două etape
discutate la secţiunea teoretică (subcapitolul III.2.1) de proiectare a modificatorului bazei de
reguli.
Pentru sistemul studiat, având în vedere structura funcţiilor de apartenenţă ale
regulatorului fuzzy (Fig. 4.34), pot fi active la un moment dat maxim patru reguli, ceea ce
indică faptul că vom avea de adaptat conform ecuaţiei (3.12) cel mult patru reguli. Această
observaţie mai confirmă încă o dată că modificările realizate în baza de reguli sunt modificări
locale.
Definirea regulatorului fuzzy direct, a modelului fuzzy invers şi a modificatorului bazei
de reguli a fost realizată de către autor folosind funcţii proprii create în mediul Matlab. Aceste
programe de descriere a celor trei componente folosite la simularea sistemului din figura 4.31
în mediul Simulink sunt asemănătoare cu cele de la aplicaţia pendulului inversat. Singurele
modificări sunt legate de factorii de scalare / amplificare precizaţi în paragrafele anterioare.
În figura 4.35 sunt prezentate evoluţia în timp a comenzii, a ieşirii din proces (poziţia
unghiulară) şi referinţa, respectiv evoluţia erorii de adaptare dintre ieşirea din proces şi
modelul etalon, când la intrare se aplică impulsuri dreptunghiulare cu o amplitudine unitară.
Din analiza celor trei tipuri de sisteme de reglare adaptivă este evidentă superioritatea
tehnicilor de conducere inteligente adaptive (FMRLC). Aceste sisteme pot compensa prezenţa
eventualele variaţii lente ale parametrilor procesului în comparaţie cu dinamica acestuia prin
capacitatea suplimentară de a învăţa din evenimente desfăşurate deja, în plus ele nu necesită o
liniarizare a procesului condus în cazul în care acesta este neliniar.
Evident un robot serial are o construcţie serială ceea ce presupune interinfluenţe între
forţele şi momentele diferitelor componente ale lanţului cinematic. Controlul întregului robot
impune folosirea mai multor regulatoare clasice, adaptive sau inteligente. Un control eficient
şi cu performanţe bune se poate realiza de exemplu dacă pentru fiecare componentă a
87
robotului serial este realizat câte un regulator. În figura 4.38 este prezentată o posibilă schemă
de reglare fuzzy adaptivă a unui robot serial cu două componente (braţ robotic cu două grade
de libertate date de umăr şi cot). [Mou, Bro]
88
V. Concluzii
89
Sistemele adaptive, indiferent de categoria din care fac parte, pot să realizeze câteva
sarcini tipice cum ar fi:
- acordarea automată a regulatoarelor la punerea în funcţiune a schemelor de reglare
automată (şi îmbunătăţirea performanţelor);
- determinarea automată a parametrilor optimali ai regulatoarelor automate pentru
diferite puncte de funcţionare a procesului;
- menţinerea performanţelor sistemului de comandă şi reglarea automată atunci când
parametrii de structură ai procesului se modifică;
- posibilitatea realizării unor regulatoare mai complexe şi mai performante decât cele
PID;
- detectarea unor evoluţii anormale ale parametrilor proceselor (aceste variaţii se
reflectă în valorile parametrilor furnizate de algoritmul de proiectare).
Introducerea sistemelor adaptive şi inteligente este legată atât de factorul tehnic cât şi
de rentabilitatea economică. Evaluarea rentabilităţii se face ţinând cont de: ameliorarea
calităţii produselor, creşterea producţiei, economie de energie, reducerea timpilor de oprire
pentru întreţinere, detectarea rapidă a unor regimuri anormale de funcţionare etc.
Există o serie de studii de aplicabilitate industrială a controlului adaptiv. Printre
procesele unde au fost introduse sistem adaptive sunt: amestecarea materiilor prime, mori de
măcinare a cimentului, laminoare, coloane de distilare, reactoare chimice, sisteme energetice,
sisteme de poziţionare, maşini de fabricat hârtie, controlul pH-ului, piloţi automaţi pentru
aeronave şi vapoare, maşini-unelte, schimbătoare de căldură, sisteme de încălzire şi de
ventilare, fabricarea sticlei.
Lucrarea de faţă şi-a propus prezentarea unei tehnici combinate de control fuzzy
adaptiv şi performanţele superioare oferite de aceasta. Pentru a înţelege mai bine specificul
tehnicilor avansate de control au fost abordate:
- sistemele adaptive cu model de referinţă cu adaptarea parametrilor regulatorului pe
baza regulii gradientului descendent (MIT) şi pe baza teoriei Lyapunov pentru
stabilitatea sistemelor;
- sistemele inteligente ce au la bază teoria logicii fuzzy;
- sistemele fuzzy adaptive cu model etalon (sau de referinţă) prin proiectarea unui
regulator fuzzy cu învăţare cu model de referinţă;
- două aplicaţii de control automat: reglarea şi echilibrarea pendulului inversat,
respectiv reglarea locală a unei componente decuplate dintr-un lanţ cinematic.
90
Programele şi aplicaţiile realizate oferă un exemplu al modului în care se pot
implementa conceptele care intervin în realizarea unui sistem adaptiv, fuzzy, fuzzy adaptiv. În
concluzie, această lucrare prezintă etapele şi modul de proiectare a unei metode de control
inteligentă şi adaptivă bazată pe regulatoare fuzzy.
91
Bibliografie
[Ali] Aliev, R., Aliew, F., Bonfig, D., Messen, steuern, regeln mit fuzzy logik, Franzis
Verlag, 1994, Munchen.
[And] Andonie, R., Caţaron, A., Inteligenţă artificială, Univ. “Transilvania”, 2000,
Braşov.
[Ant] Antsaklis, P.J., Passino, K.M., An introduction to intelligent and autonomous
control, Kluwer Academic Publishers, 1992.
[Ast1] Astrom, K.J., Wittenmark, B., Adaptive control (1st edition), Addison Wesley,
1989.
[Ast2] Astrom, K.J., Wittenmark, B., Adaptive control (2nd edition), Addison Wesley,
1995.
[Ast3] Astrom, K.J., Theory and applications of adaptive control, IFAC Kyoto, 1981,
Japan.
[Ast4] Astrom, K.J., Wittenmark, B., Computer controlled systems. Theory and design,
Pretince Hall, 1990, New York.
[Bro] Brown, S.C., Passino, K.M., Intelligent control for an acrobot, The Ohio State
University, 1997, Ohio.
[Căl] Călin, S., Conducerea adaptivă şi flexibilă a proceselor industriale, Ed. Tehnică,
1988, Bucureşti.
[Dam1] Damen, A., Weiland, S., Robust control, Eindhoven University of Technology,
2001, Netherland.
[Dam2] Damen, A., Modern control theory, Eindhoven University of Technology, 2002,
Netherland.
[Dri] Driankov, D., Hellendoorn, H., Reinfrank, M., An introduction to fuzzy control,
Springer Verlag, Heidelberg, 1993, New York.
[Dum] Dumitrache, I., Tehnica reglării automate, Ed. Didactică şi Pedagogică, 1980,
Bucureşti.
[Dav1] David, L., Marton, L., Reţele neuronale şi logica fuzzy în automatizări, Ed.
Universităţii “Petru Maior”, 2000, Târgu Mureş.
[Dav2] David, L., Control inteligent şi adaptiv. Notiţe de curs, Universitatea “Petru
Maior”, 2004, Târgu Mureş.
92
[Duk] Duka, A., Studiul reglării sistemului cu pendul inversat. Modelare şi simulare,
Lucrare de dizertaţie, Universitatea “Petru Maior”, 2005, Târgu Mureş.
[Dul] Dulău, M., Oltean, S., Modelare şi simulare. Lucrări de laborator, Ed. Universităţii
“Petru Maior”, 2003, Târgu Mureş.
[Gee] Geering, H.P., Robuste regelung, Institut für Mess- und Regeltechnik,
Eidgenössische Technische Hochschule Zürich, 1999, Schweiz.
[Ghi] Ghinea, M., Fireţeanu, V., Matlab. Calcul numeric. Grafică şi aplicaţii, Ed. Teora,
1997, Bucureşti.
[Iou] Ioannou, P., Robust adaptive control, University of Southern California, 2003, Los
Angeles.
[Ise] Isermann, R., Lachmann, K.H., Adaptive control systems, Pretince Hall, 1992.
[Jag] Jager, R., Fuzzy logic in control, Phd. thesys, 1995, Amsterdam.
[Jan] Jantzen, J., Verbruggen, H., Ostergaard, J.J., Fuzzy control in the process industry,
1998.
[Kis] Kiss, P., Logica fuzzy şi aplicaţii în tehnică, Referat nr. 1 de doctorat, Universitatea
"Politehnica" Timişoara, 1997, Timişoara.
[Koo] Koo, J.T.K., Design of stable adaptive fuzzy control, Master Thesis, Univ. of Hong
Kong, 1994, Hong Kong.
[Lay] Layne, J.R., Passino, K.M., Fuzzy Model Reference Learning Control for Cargo
Ship Steering, IEEE, 1993.
[Lyu] Lyung, L., System identification, Pretince Hall, 1987.
[Mou] Moudgal, V.G., Kwong, W.A., Passino, K.M., Yurkovich, S., Fuzzy learning
control for a flexible-link robot, IEEE Transactions on Fuzzy Systems, vol. 3, no.2,
may 1995.
[Naş] Naşcu, I., Control adaptiv, Ed. Mediamira, 2002, Cluj Napoca.
[Olt1] Oltean, S., Sistem de dozare automată prin comandă fuzzy cu microcontrolerul
80C552, Proiect de diplomă, Universitatea “Petru Maior”, 2002, Târgu Mureş.
[Olt2] Oltean, S., Gligor, A., Grif, H., Fuzzy logic approach for reactive power control,
Inter-Ing 2003, Universitatea “Petru Maior” Târgu Mureş.
[Pas1] Passino, K.M., Yurkovich, S., Fuzzy control, Addison Wesley Longman, Inc.,
1998, California.
[Pas2] Passino, K.M., Intelligent control. An overview of techniques, The Ohio State
University, 1998, Ohio.
[Pre1] Precup, R.E., Preitl, Ş., Fuzzy controllers, Ed. Orizonturi Universitare, 1999,
Timişoara.
93
[Pre2] Preitl, Ş., Precup, R.E., Introducere în conducerea fuzzy a proceselor, Ed. Tehnică,
1997, Bucureşti.
[Sas] Sastry, S., Bodson, M., Adaptive control. Stability, convergence, and robustness,
Pretince Hall, 1989, New Jersey.
[Sch] Scherer, C., Theory of robust control, Delft University of Technology, 2001,
Netherland.
[Sha] Shafai, E., Einfuhrung in die adaptive regelung, Institut für Mess- und
Regeltechnik, Eidgenössische Technische Hochschule Zürich, 2003, Schweiz.
[Sti] Stimac, A.K., Standup and stabilization of the inverted pendulum, Massachusetts
Institute of Technology, 1999.
[Tog] Togneri, R., Adaptive systems, Electrical and Electronic Engineering, The
University of Western Australia, 2002.
[Wil1] Wilson, D.I., Adaptive control. Course notes, Electrical Engineering Karlstad
University, 2001.
[Wil2] Wilson, J.R., Nonlinear system theory, The Johns Hopkins University Press, 1981.
[Zad] Zadeh, L.A., Fuzzy sets, Information and control 8:338-353, 1965.
[Zăr1] Zărnescu, H., Ingineria reglării automate II. Proiectarea sistemelor convenţionale
şi avansate de reglare automată, Ed. Univ. “Petru Maior”, 1999, Târgu Mureş.
[Zăr2] Zărnescu, H., Dulău, M., Morar, P., Gligor, A., Brassai, T., Ingineria reglării
automate. Îndrumător de laborator, Ed. Univ. “Petru Maior”, 1998, Târgu Mureş.
[ww1] www.fuzzytech.com.
[ww2] www.netlab.lmcc.fju.edu.tw.
[ww3] www.elsevier.com.
[ww4] www.ctrl.cinvestav.mx.
[ww5] www.ee.uwa.edu.au.
[ww6] www.rdg.ac.uk.
[ww7] www.ee.kau.se.
[ww8] www.control.lth.se.
[ww9] www.engr.uky.edu.
[ww10] www.ece.utah.edu.
[ww11] www.mathworks.com.
[ww12] www.engin.umich.edu.
[***1] Using Simulink, The Mathworks Inc., 1998.
[***2] Matlab, The Mathworks Inc., 1998.
[***3] Control Tutorials for Matlab – Inverted Pendulum Modelling.
94
Anexe
reg=newfis('regulatorul');
% amplificari de scalare
g1 = pi/32;
g2 = pi/10;
g0 = 120;
95
reg=addmf(reg,'input',1,'PS','trimf',g1*[0 0.5 1]);
reg=addmf(reg,'input',1,'PB','smf',g1*[0.5 1]);
reg=addrule(reg,ruleList);
Fig. 2.1. Structura generală a unui sistem adaptiv cu model de referinţă (direct)
Fig. 2.2. Structura generală a unui sistem adaptiv cu autoacordare (indirect)
Fig. 2.3. Adaptarea factorului de amplificare prin regula MIT şi Lyapunov
Fig. 2.4. Răspunsurile procesului condus şi modelului etalon
Fig. 2.5. Îmbunătăţirea vitezei de adaptare prin creşterea factorului γ
Fig. 2.6. Răspunsurile modelului etalon şi procesului condus, respectiv evoluţia în timp a
parametrului ajustabil θ, pentru un factor de adaptare prea mare.
Fig. 2.7. Schema de reglare adaptivă pentru sistem de ordin I
Fig. 2.8. Adaptarea factorului de amplificare k şi a constantei de timp T
Fig. 2.9. Răspunsurile procesului condus şi modelului etalon
Fig. 2.10. Răspunsurile procesului condus şi modelului etalon pentru γ>10
Fig. 2.11. Exemple de funcţii de apartenenţă
Fig. 2.12. Exemplificarea grafică a operatorilor min, max, comp
Fig. 2.13. Descrierea vagă a temperaturii
Fig. 2.14. Structura informaţională a unui regulator fuzzy
Fig. 2.15. Exemple de mulţimi de bază pentru variabile lingvistice
96
Fig. 2.16. Matricea cu baza de reguli
Fig. 2.17. Mecanismul de decizie, inferenţa max-min (Mamdani)
Fig.2.18. Defuzzificare prin metoda centrului de greutate (center of gravity) CoG
Fig. 2.19. Alte tehnici de defuzzificare
Fig. 2.20. Regulator fuzzy după stare
Fig. 2.21. Regulatoare fuzzy cvasi-PID
Fig. 2.22. Mulţimile variabilelor lingvistice şi baza de reguli
Fig. 2.23. Schema de simulare a sistemului de reglare
Fig. 2.24. Evoluţia erorii, comenzii şi ieşirii procesului în timp
Fig. 3.1. Tipuri de strategii de reglare
Fig. 3.2. Regulatoare fuzzy cvasi-PID cu structură variabilă
Fig. 3.3. Regulatoare fuzzy cvasi-PID cu parametrii variabili
Fig. 3.4. Sistem de reglare fuzzy adaptiv
Fig.3.5. Sistem de reglare fuzzy adaptiv direct cu model de referinţă
Fig. 3.6. Sistem de reglare fuzzy cu învăţare cu model etalon (FMRLC)
Fig. 4.1. Ansamblul cărucior-pendul (pendulul inversat)
Fig. 4.2. Răspunsul sistemului la o intrare treaptă
Fig. 4.3. Sistem de conducere adaptivă a pendulului inversat
Fig. 4.4. Evoluţia în timp a ieşirilor din modelul etalon şi din proces
Fig. 4.5. Sistem de conducere adaptivă a pendulului inversat
Fig. 4.6. Evoluţia în timp a ieşirilor din modelul etalon şi din proces
Fig. 4.7. Evoluţia parametrilor ajustabili şi comanda regulatorului
Fig. 4.8. Evoluţia erorii, comenzii şi ieşirii pentru echilibrarea pendulului
Fig.4.9. Schema de reglare fuzzy a pendulului inversat
Fig. 4.10. Baza de reguli
Fig. 4.11. Mulţimile variabilelor lingvistice
Fig. 4.12. Evoluţia erorii, comenzii şi ieşirii pentru reglarea fuzzy
Fig. 4.13. Evoluţia erorii, comenzii şi ieşirii pentru echilibrarea pendulului
Fig. 4.14. Schema de reglare fuzzy adaptivă
Fig. 4.15. Structura modelului fuzzy invers, mulţimile de bază
Fig. 4.16. Evoluţia comenzii, ieşirii şi factorului de adaptare (semnalul de corecţie)
Fig. 4.17. Evoluţia comenzii, ieşirii şi factorului de adaptare (semnalul de corecţie)
Fig. 4.18. Echilibrarea pendulului (restabilirea stării de echilibru)
Fig. 4.19. Robot cu mişcare în plan orizontal cu două grade de libertate
Fig. 4.20. Schema de funcţionare a unui servomotor de curent continuu
97
Fig. 4.21. Schema funcţională a manipulatorului de ordin doi
Fig. 4.22. Răspunsul manipulatorului de ordin doi şi trei la o intrare treaptă
Fig. 4.23. Scheme de reglare adaptivă cu model etalon
Fig. 4.24. Schema de reglare adaptivă prin compensare
Fig. 4.25. Schema de reglare adaptivă local robustă a manipulatorului
Fig. 4.26. Referinţa şi răspunsurile modelului etalon şi procesului
Fig. 4.27. Evoluţia componentelor semnalului de compensare g(t)
Fig. 4.28. Schema de reglare adaptivă local robustă a manipulatorului
Fig. 4.29. Referinţa şi răspunsurile modelului etalon şi procesului, eroarea de adaptare
Fig. 4.30. Evoluţia parametrilor regulatorului
Fig. 4.31. Schema de reglare fuzzy adaptivă
Fig. 4.32. Modelul de referinţă
Fig. 4.33. Baza de reguli a regulatorului fuzzy direct şi a modelului fuzzy invers
Fig. 4.34. Structura modelului fuzzy invers, mulţimile de bază
Fig. 4.35. Evoluţia comenzii, ieşirii şi factorului de adaptare (semnalul de corecţie)
Fig. 4.36. Factorul de adaptare, poziţia şi viteza unghiulară
Fig. 4.37. Evoluţia comenzii, ieşirii şi factorului de adaptare (semnalul de corecţie)
Fig. 4.38. Reglarea adaptivă a unui braţ robotic
98