Sunteți pe pagina 1din 167

ASTI CONTROL SA

RO-060011 Bucureti, Calea Plevnei 139, Bloc B Tel: +(4 021) 317 4732 Fax: +(4 021) 317 4733 E-mail: office@asticontrol.ro www.asticontrol.ro

PROIECT DE TIP INOVARE NR. 117-2007 (UMAPID) U Un cr niit ra ar ta re at e,, iid te em mo de ob en biill nt tiif d fiic de ca ea ar re ac e ch hiiz zii iie e,, p pr re ellu uc se em mn na all ii d diia ag gn no oz z d de es

A Allg e go or ii d riit tm diia mii d ag gn de no e iid oz z de en nt tiif fiic ca ar re e,, p pr re ed diic c iie p ne es st ta a iio on na ar re e pe eb ba az z d de es se em mn na alle en
RAPORT DE CECETARE AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009

Autori: Dan TEFNOIU Janetta CULI Ctlin PETRESCU Alex DUMITRACU

R Re a ea alliiz ii p za pu ar un re ne ea er a,, t re ea a n te es st nf ta ar fu re un ea nc a,, m c iiu un mb ne bu ea un n a t t iir re ea p pu ullu uii ( (s se er riia a0 0) )u un niit t iiii m mo ob pr biille ro ot to e ot tiip
RAPORT DE CERCETARE AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009
Dan TEFNOIU, Janetta CULI, Ctlin PETRESCU, Alexandru DUMITRACU
Universitatea Politehnica din Bucureti Facultatea de Automatic i Calculatoare Centrul de cercetare ACPC (partener al proiectului) www.pub.ro, www.acs.pub.ro E-mails: danny@indinf.pub.ro, jculita@yahoo.com catalin@indinf.pub.ro, dumalex@ecosys.pub.ro

Etapa III (final) 2009

Rezumat
Ajuns la final, proiectul, intitulat Unitate mobil de achiziie, prelucrare, identificare i diagnoz de semnal (UMAPID), a avut ca obiectiv realizarea unui sistem de achiziie i prelucrare a datelor, cu deschidere ctre mai multe categorii de semnale, avnd naturi diferite. n precedentele rapoarte de cercetare a fost descris structura hardware i (parial) software a acestui sistem. n ultima etap a proiectului (a treia), s-a urmrit finalizarea lucrrilor privind sistemul UMAPID, ca produs de inovare valorificabil n perioada urmtoare de timp. Principalele activiti ale etapei, prevzute n planul de realizare, sunt urmtoarele: Proiectarea i implementarea algoritmilor evoluai de tip timp-frecvenscal. (Tip: CI.) Personalizarea pachetelor de senzori. (Tip: DE.) Testarea i punerea n funciune. (Tip: DE.) Pregtirea demonstrrii funcionrii. (Tip: DE.) Redactarea manualului de utilizare. (Tip: DE.) Omologarea i introducerea n fabricaie (seria 0). (Activitate susinut prin cofinanare, fr implicarea sursei bugetare alocate acestui proiect.) Se poate constata cu uurin c singura activitate care incumb cercetare i inovare este prima. Celelalte activiti se refer la finalizarea efectiv a produsului. Din acest motiv, raportul de cercetare prezentat n continuare este constituit din dou pri:

Director de proiect.

www.geocities.com/dandusus/Danny.html

Descrierea riguroas a algoritmilor i programelor software cu care a fost dotat produsul. Manualul de utilizare i documentaia de produs. Aceste pri sunt desprite net una fa de alta, avnd n vedere c a doua (manulaul de utilizare i documentaia de produs) constituie o entitate de sine stttoare, care nsoete produsul. Ea conine ns numeroase detalii privind structura i funcionarea acestuia, n scopul facilitrii exploatrii de ctre utilizatori cu o minim pregtire n domeniu (inclusiv lista comentat a programelor i rutinelor implementate n urma descrierii din prima parte a raportului).


Echipa de cercetare i inovare a proiectului i exprim gratitudinea fa de AMCSIT Politehnica pentru susinerea financiar fr de care acest produs nu ar fi putut vedea lumina zilei. Totodat, ea continu s spere ntr-o reducere drastic i benefic unei mini creator-inovatoare a birocraiei creia a trebuit s i se fac fa, cu greu, pe toat durata proiectului.

Precizri suplimentare privind finalizarea

R Re a ea alliiz ii p za pu ar un re ne ea er a,, t re ea a n te es st nf ta ar fu re un ea nc a,, m c iiu un mb ne bu ea un n a t t iir re ea p pu ullu uii u un niit t iiii m mo ob biille e pr ro ot to ot tiip
Aa cum s-a precizat n rezumatul raportului tiinifico-tehnic AMCSIT.UPB-P5.117-

Etapei a III-a, din 2009

2007.III/DS.JC.CP.AD-09.2009, depus la AMCSIT Politehnica, odat cu documentele


de finalizare a Etapei a III-a (ultima a proiectului), principalele activiti ale etapei, prevzute n planul de realizare, sunt urmtoarele: Proiectarea i implementarea algoritmilor evoluai de tip timp-frecvenscal. (Tip: CI.) Personalizarea pachetelor de senzori. (Tip: DE.) Testarea i punerea n funciune. (Tip: DE.) Pregtirea demonstrrii funcionrii. (Tip: DE.) Definitivarea documentaiei de execuie i redactarea manualului de utilizare. (Tip: DE.) Omologarea i introducerea n fabricaie. (Activitate susinut prin cofinanare, fr implicarea sursei bugetare alocate acestui proiect.) Vom oferi cteva explicaii suplimentare, pe marginea acestora. 1. Proiectarea i implementarea algoritmilor evoluai de tip timp-frecven-scal Algoritmii sunt descrii n capitolele 2-4 ale raportului mai sus amintit. Descrierea se refer att la fundamentul teoretic, ct i la aspecte de natur practic privind implementarea acestora. Algoritmii vizai sunt urmtorii: PARMAX identificare i predicie de date cu ajutorul unor modele de tip autoregresiv, cu medie alunectoare i control exogen; FORWAVER predicie pe baza unui model de semnal construit cu ajutorul undinelor, n combinaie cu un model auto-regresiv de zgomot; GAMP diagnoz de defecte pe baza unui dicionar de forme de und. Aceti algoritmi sunt originali i integreaz dou tehnici de optimizare evoluionar, care permit eficientizarea lor: aglomerarea de particule i urmrirea prin potrivire cu ajutorul unui algoritm genetic. Complexitatea lor este relativ ridicat, fapt pentru care a fost necesar o manier de programare profesional, de nivel nalt. 2. Personalizarea pachetelor de senzori Chiar dac reducerea resurselor bugetare ale proiectului a afectat extinderea reelei de senzori din viziunea proiectului iniial (cu att mai mult cu ct senzorii avnd comunicaie radio sunt relativ rari i scumpi pe pia), a fost totui posibil personalizarea unui pachet principal de senzori cel ecologic. Acesta include senzorii descrii pe larg n raportul tiinifico-tehnic al etapei precedente sau n manualul de utilizare. Cu toate acestea, a fost personalizat i o (mini-)reea de senzori de vibraie (accelerometre), cu transmisie prin fir (nu radio), menit s permit achiziia de date pentru programul de diagnoz GAMP. n raportul aferent acestei etape (mai sus amintit), la seciunea 5.3., este descris o platform de lucru n care a fost integrat reeaua de accelerometre.
1/2

Se are n vedere extinderea sub-sistemului de senzori cu alte pachete specializate, n msura bugetului disponibil, chiar i dup finalizarea acestui proiect. Manualul de utilizare include o descriere extrem de detaliat privind maniera n care utilizatorul poate s i construiasc i personalizeze propria sa reea de senzori, pe baza unor principii cunoscute n tiina calculatoarelor. 3. Testarea i punerea n funciune Au fost efectuate msurtori specifice i teste (n special de anduran) ale produsului UMAPID n integralitatea lui i, n particular, ale subansamblului constituit de interfaa de achiziie de date VISA (descris pe larg n cadrul raportului tiinifico-tehnic al etapei precedente). n cadrul dosarului de omologare anexat se gsete un buletin de msurtori i teste efectuat de ctre o firm specializat, n colaborare cu partenerii proiectului. Au fost testate caracteristicile tehnice ale produsului, performanele sale uzuale i capacitatea de a rezista la condiii grele de exploatare. n paralel, au fost testate programele software implementate la nivelul unitii mobile, pe o serie de studii de caz cu date reale, provenite de la diferite fenomene naturale. Rezultatele acestor teste sunt prezentate att n Capitolul 5 al raportului mai sus menionat, ct i n compendiul anexat dosarului de omologare. Unele dintre aceste studii de caz au fost utilizate i n cadrul manualului de utilizare, pentru exemplificarea funcionrii produsului. Punerea n funciune a constat n conectarea celor 3 subsisteme, mici reglaje hardware ale interfeei VISA i configurri software ale reelei de senzori cu transmisie radio. Toate aceste operaii sunt descrise pe larg n manualul de utilizare, unde utilizatorul este nvat cum s pun n funciune produsul UMAPID. 4. Pregtirea demonstrrii funcionrii A fost imaginat un protocol de demonstrare a funcionrii produsului, cu ocazia prezentrii acestuia la dou expoziii. n raportul mai sus amintit, la pagina 92, au fost ilustrate 4 fotografii ale produsului expus la una dintre aceste expoziii. Obiectivul principal urmrit n cursul pregtirii demonstrrii a fost acela de a ilustra capacitile unitii mobile prin intermediul a dou interfee grafice conviviale, proiectate i implementate de ctre echipa proiectului: eKo-View care permite configurarea reelei de senzori ecologici; Forecast care permite iniializarea i rularea programelor de predicie/diagnoz. 5. Definitivarea documentaiei de execuie i redactarea manualului de utilizare n urma mai multor teste de produs, a fost posibil corectarea unor mici deficiene de proiectare (n special a interfeei VISA), cum ar fi: recalibrarea unor circuite, schimbarea unor contacte defectuoase sau simplificarea unor circuite. Acestea au condus la definitivarea documentaiei de execuie. Manualul de utilizare al produsului a fost anexat raportului mai sus menionat i include toate informaiile necesare instalrii i utilizrii produsului (mpreun cu o serie de caracteristici tehnice ale acestuia). 6. Omologarea i introducerea n fabricaie mpreun cu aceast not explicativ, au fost anexate i: procesul verbal de omologare intern a produsului; dosarul care a stat la baza procesului verbal amintit. O cerere de brevet de invenie a fost de asemenea naintat, asa cum s-a specificat n documentele de finalizare a etapei.
2/2

ASTI CONTROL SA
RO-060011 Bucureti, Calea Plevnei 139, Bloc B Tel: +(4 021) 317 4732 Fax: +(4 021) 317 4733 E-mail: office@asticontrol.ro URL: www.asticontrol.ro

PROCES VERBAL DE OMOLOGARE INTERN


ncheiat azi, 29.09.2009

Comisia de omologare intern s-a reunit la sediul S.C. ASTI CONTROL S.A., n vederea omologrii prototipului Unitii Mobile de Achiziie, Prelucrare, Identificare i Diagnoz de Semnal (pe scurt, UMAPID), constituit din 3 module principale: unitatea central de prelucrare, interfaa de achiziie de date cu transmisie radio (VISA) i reeaua de senzori cu transmisie radio. Obiectul omologrii este naintat ca propunere de brevet de invenie la OSIM, cu nr. A-00779/29.09.2009. El a fost realizat n cadrul Programului Naional Inovare, finanat prin AMCSIT Politehnica Bucureti, cu Proiectul nr. 1081/2007 i Contractul nr. 117/2007. Comisia: a ascultat expunerea directorului de proiect, dl. profesor Dan tefnoiu, cu privire la structura produsului i principiile care au condus la conceperea i realizarea acestuia; a examinat dosarul de omologare; a examinat prototipul produsului, acesta fiind pus n funciune; a examinat manualul de utilizare a produsului. Comisia a constatat c: realizarea unei uniti mobile de monitorizare i diagnosticare a unor sisteme n spaiu deschis sau nchis este justificat sub raport tiinific i tehnic; produsul corespunde datelor i caracteristicilor tehnice din manualul de utilizare; verificrile efectuate de ctre S.C. ASTI CONTROL S.A., mpreun cu partenerii din consoriu, asupra preciziei i repetabilitii rezultatelor testelor cu ajutorul prototipului sunt convingtoare i corespund exigenelor tiinifice n domeniu; prototipul corespunde cu prevederile proiectului, prezentat n documentaia de omologare; prototipul este funcional, fiind echipat cu toate componentele specificate n manualul de utilizare; manualul de utilizare este explicit i pe deplin lmuritor pentru utilizatori; proba de anduran a fost efectuat prin monitorizarea produsului pe durata a 100 de zile de funcionare continu, fr defect. 1/2

n urma discuiilor purtate, Comisia omologheaz produsul UMAPID att din punct de vedere hardware, ct i software, n vedrea utilizrii n special n aplicaii de ecologie i protecie a mediului, cu recomandarea de a extinde sistemul de senzori radio i ctre alte domenii. Prezentul proces verbal a fost ncheiat n 4 exemplare cte unul pentru fiecare partener din proiect (S.C. ASTI CONTROL S.A (coordonator), Universitatea Politehnica din Bucureti Centrul de Cercetare ACPC (partenerul 1) i S.C. DIGITAL CONTROL S.R.L. (partenerul 2)) i unul pentru AMCSIT Politehnica Bucureti.

COMISIA Preedinte: Ing. Sabin STAMATESCU


Administrator S.C. ASTI CONTROL S.A.

Semnturi

Membri: Prof.dr.ing. Dumitru POPESCU


Decan, Facultatea de Automatic i Calculatoare, din cadrul UPB

Ing.drd. Octavian NICULA


Director S.C. DIGITAL CONTROL S.R.L.

Ing. Adrian ECATERINESCU


S.C. ASTI CONTROL S.A.

Secretar: Ing. Veronica Barbulea


S.C. ASTI CONTROL S.A.

2/2

Cuprins
1. Scurt introducere 2. Predicia datelor multi-dimensionale cu ajutorul modelelor ARMAX
2.1. 2.2. 2.3. 2.4. 2.5. 3.1. 3.2. 3.3. 3.4. 3.5. 3.6. 3.7. Reprezentarea discret, de stare, a unei reele de senzori Modelul discret, de tip intrare-ieire, al unei reele de senzori Construcia predictorului PARMAX Selectarea predictorului PARMA(X) optimal prin strategia PSO Algoritmul PARMAX Paradigma deparazitrii semnalelor Scurt privire asupra undinelor ortogonale i structurii multi-rezoluie Alegerea pachetelor de undine optimale prin minimizarea entropiei Modelul de predicie bazat pe undine ortogonale Selecia unui predictor optimal prin maximizarea calitii prediciei Algoritmul FORWAVER Detalii privind implementarea Algoritmului FORWAVER 3.7.1. Observaii generale 3.7.2. Evaluarea suporturilor corespunztoare coeficienilor undin 3.7.3. Evaluarea valorilor unei undine utiliznd bancul de filtre 3.7.4. Evaluarea suporturilor corespunztoare coeficienilor undin Despre dicionarele timp-frecven-scal Construcia i configurarea unui dicionar timp-frecven-scal Algoritmul urmririi prin potrivire Cutarea atomilor celor mai potrivii cu ajutorul unui Algoritm Genetic Algoritmul GAMP

1 3
3 4 9 14 22

3. Predicia datelor uni-dimensionale cu ajutorul undinelor

29
29 34 39 43 43 46 51 51 55 58 56

4. Diagnoz de defecte cu ajutorul dicionarelor timp-frecven-scal


4.1. 4.2. 4.3. 4.4. 4.5.

61
61 63 71 74 88

5. Rezultate obinute cu ajutorul sistemului UMAPID n funciune


5.1. Predicia datelor multi-dimensionale 5.2. Predicia datelor uni-dimensionale 5.2.1. Predicia seriei de timp a omajului n SUA 5.2.2. Predicia seriei de timp a contiinei colective 5.3. Diagnoz de defecte mecanice 5.3.1. Caracteristici ale vibraiilor emise de sisteme mecanice 5.3.2. Platforma i parametrii de lucru ai aplicaiei 5.3.3. Rezultatele programului de diagnoz GAMP

93
93 94 94 95 106 106 110 115

6. Concluzii finale i perspective Anexa A. Redefiniri ale criteriului calitii prediciei (PQ) Anexa B. Algoritmi de eantionare stocastic universal
B.1. Algoritmul original al lui Baker B.2. Algoritmul generalizat al lui Baker

120 121 123


123 126

Anexa C. Publicaii selectate Bibliografie


I

129 153

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

Lista figurilor

1.1. Structura sistemului UMAPID. 2.1. Evoluia unei populaii ctre punctul de optim n cadrul Algoritmului PSO. 2.2. Reprezentarea tridimensional a populaiilor de particule n cadrul Algoritmului PARMAX. 2.3. Reprezentarea tridimensional a populaiilor de particule n cadrul Algoritmului PARMA multi-dimensional. 2.4. Reprezentarea tridimensional a populaiilor extinse de particule n cadrul Algoritmului PARMAX. 3.1. Principiul deparazitrii semnalelor cu ajutorul proieciilor ortogonale. 3.2. Harta Romniei reprezentat la diferite scale i nivele de rezoluie. 3.3. Proprietatea de reconstrucie perfect a undinelor ortogonale. 3.4. Corespondena timp-frecven n Algoritmul lui Mallat. 3.5. Corespondena generalizat timp-frecven. 3.6. Strategia de cutare din cadrul procedurii IDA*. 3.7. Meta-arborele utilizat pentru optimizarea unui banc QMF pe ramura de analiz. 3.8. Principiul actualizrii matricii informatice a frunzelor binare. 3.9. Configuraia matricii informatice a coeficienilor undin. 3.10. Utilizarea bancului de filtre pentru calcularea valorilor undinelor. 4.1. Efectul operatorilor atomici aplicai asupra unei ferestre de baz. 4.2. Laticea curent din planul timp-frecven-scal. 4.3. Atomi timp-frecven-scal Gaussieni i spectrele asociate. 4.4. Principiul deparazitrii semnalelor folosind un dicionar timp-frecven-scal. 4.5. Principiul urmririi prin potrivire. 4.6. Definiia unui cromozom timp-frecven-scal. 4.7. Definiia ncrucirii genetice. 4.8. Definiia mutaiei genetice. 4.9. Definiia inversiunii genetice. 4.10. Principiul strategiei elitiste de selecie. 4.11. Un exemplu de variaie a temperaturii de clire. FOTO: Participarea sistemului UMAPID la Salonul inovrii, Bucureti, 28-29 iulie 2009. 5.1. 5.2. 5.3. 5.4. 5.5. 5.6. 5.7. 5.8. 5.9. Seria de timp Y1, mpreun cu tendina i componenta sezonier. Y1: Vedere global asupra prediciei clasice i a performanei asociate. Y1: Vedere detaliat asupra orizontului de predicie clasic. Y1: Undinele tat i mam ale predictorului bazat pe undine. Y1: Arborele binar optimal asociat Transformatei Undin. Y1: Scalograma seriei de timp (reprezentare n plan). Y1: Scalograma seriei de timp (reprezentare n spaiu). Y1: Suprafaa de calitate a prediciei i punctul de maxim. Y1: Vedere global asupra prediciei cu undine i a performanei asociate. 5.10. Y1: Vedere detaliat asupra orizontului de predicie cu undine.
II

1 15 21 22 27 30 33 37 37 38 41 42 53 53 59 64 68 71 72 74 76 78 78 78 82 85 92 96 96 97 97 98 98 99 99 100 100

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

5.11. Seria de timp Y11, mpreun cu tendina i componenta sezonier. 5.12. Y11: Vedere global asupra prediciei clasice i a performanei asociate. 5.13. Y11: Vedere detaliat asupra orizontului de predicie clasic. 5.14. Y11: Undinele tat i mam ale predictorului bazat pe undine. 5.15. Y11: Arborele binar optimal asociat Transformatei Undin. 5.16. Y11: Scalograma seriei de timp (reprezentare n plan). 5.17. Y11: Scalograma seriei de timp (reprezentare n spaiu). 5.18. Y11: Suprafaa de calitate a prediciei i punctul de maxim. 5.19. Y11: Vedere global asupra prediciei cu undine i a performanei asociate. 5.20. Y11: Vedere detaliat asupra orizontului de predicie cu undine. 5.21. Principiul genezei vibraiilor mecanice. 5.22. Spectrul tipic al unui accelerometru. 5.23. Imagini intuitive ale efectului de rezonan din funcionarea accelerometrelor. 5.24. Modelul cu purttoare de rezonan al vibraiei codificatoare de defect. 5.25. O platform de testare i diagnoz a rulmenilor. 5.26. Caracteristicile constructive ale rulmenilor testai. 5.27. Segmente de vibraie achiziionate de la 4 rulmeni cu bile. 5.28. Segmente de vibraie prelucrate primar, provenite de la 4 rulmeni cu bile. 5.29. Rezultate de deparazitare a vibraiilor cu ajutorul unui dicionar de undine. 5.30. Reprezentarea timp-scal-frecven a vibraiei <B3850610>. 5.31. Reprezentarea timp-scal-frecven a vibraiei <I3850610>. 5.32. Reprezentarea timp-scal-frecven a vibraiei <E3850610>. 5.33. Reprezentarea timp-scal-frecven a vibraiei <M3850610>. B.1. Mecanismul SUS simulat cu ajutorul unei rulete virtuale ideale. B.2. Mecanismul SUS implementat cu ajutorul unei rulete virtuale.

101 101 102 102 103 103 104 104 105 105 106 108 109 109 110 111 113 114 116 117 117 118 118 123 124

Lista tabelelor
4.1. Parametri care definesc un dicionar timp-frecven-scal discret. 4.2. Parametri care configureaz un Algoritm Genetic. 5.1. Frecvenele naturale (caracteristice) ale unui rulment cu bile. 71 88 111

III

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

Lista algoritmilor
2.1. PARMAX un algoritm de predicie a proceselor stocastice, cu ajutorul modelelor MISO-ARMAX, folosind tehnica PSO. 2.2. Testul de stabilitate Schr-Cohn. 3.1. FORWAVER un algoritm de predicie a seriilor de timp nestaionare, folosind pachete de undine ortogonale, cu suport compact. 3.2. Algoritmul lui Daubechies de generare a undinelor ortogonale, cu suport compact. 3.3. Algoritmul Daubechies-deRham de rezolvare a EDL finite, cu rezoluie controlat. 4.1. GAMP un algoritm genetic de urmrire prin potrivire. B.1. Algoritmul (clasic al) lui Baker. B.2. Algoritmul generalizat al lui Baker.

23 28 47 49 50 88 125 126

IV

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

1. Scurt introducere
Ultima etap (a treia) a proiectului Unitate mobil de achiziie, prelucrare, identificare i diagnoz de semnal (UMAPID), are ca obiectiv principal finalizarea produsului. Pentru aceasta, au fost desfurate dou tipuri majore de activiti: de cercetare-inovare (nzestrarea produsului cu programe software adecvate) i de dezvoltare (efectuarea de teste i elaborarea manualului de utilizare, nsoit de documentaia de produs). n cadrul acestui raport de cercetare, va fi descris pe larg prima activitate a etapei, cu referire la rezultatele testrii (numite rezultate de simulare). Ce-a de-a doua categorie de activiti a condus la manualul de utilizare anexat (extins cu documentaia de produs). nainte de a ataca problematica de la baza programelor software proiectate i implementate, este util o scurt privire de ansamblu asupra sistemului UMAPID. n rapoartele tehnice precedente, [PNS07] i [SPD08], a fost descris pe larg structura hardware a sistemului. Ea este ilustrat sugestiv n Figura 1.1.
Calculator portabil ACER 1 procesor dual core Interfa de achiziie de date VISA Transmisie radio

Valea Alb din Alpii francezi

Nod de comunicaie Transmisie radio

Senzor Transmisie radio

Figura 1.1. Structura sistemului UMAPID. Exist 3 nivele ierarhice privind transferul i prelucrarea de date: reeaua de senzori, interfaa VISA i calculatorul portabil. Reamintim ca principala caracteristic a senzorilor (care s-a dovedit i un impediment important n achiziionarea acestora) este capacitatea de a transmite date pe calea undelor radio. Exist puini productori de senzori cu transmisie radio. Interfaa VISA a fost de asemenea mbuntit, fr a fi totui schimbate principiile care au stat la proiectarea ei (descrise n [SPD08]). (Dealtfel, interfaa este n curs de omologare la OSIM.)
1

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

n afara descrierii configuraiei hardware, n raportul tehnic precedent, [SPD08], a fost prezentat i primul pas n direcia nzestrrii sistemului cu programe software de identificare, predicie i diagnoz a fenomenelor care furnizeaz date, achiziionate cu ajutorul senzorilor. A fost, astfel, implementat un prim algoritm, numit PARMA (Predicie pe baz de modele de identificare ARMA), care constituie o procedur rapid (dei nu foarte precis) de prognozare a datelor uni-dimensionale (numite serii de timp) achiziionate prin intermediul senzorilor. Datele achiziionate prezint ns alte dou caracteristici importante: pot fi grupate n blocuri multi-dimensionale i au un caracter nestaionar. Vom explica dendat semnificaia acestor termeni. Senzorii sistemului UMAPID sunt grupai n truse specializate. n Figura 1.1, este ilustrat un exemplu de astfel de trus n aciune. Este vorba despre senzori ecologici, care msoar temperatura i umiditatea (dou mrimi fizice corelate, aa cum s-a artat n [NDS07]). Mrimile de acelai tip (de exemplu, temperaturi la sol sau ambiante), eantionate n diferite locaii ale unui micro-climat conduc la un bloc de date unitar, n care fiecare serie de timp reprezint un canal de msur. Este foarte probabil existena unei corelaii ntre seriile de timp ale unui astfel de bloc de date. Aceasta ar putea fi exploatat pentru a crete precizia de predicie de pe fiecare canal. Algoritmul PARMA nu ia n considerare o astfel de proprietate, el acionnd pe fiecare canal de msur ca i cum ar fi izolat fa de celelalte. De aceea, a fost necesar proiectarea unui algoritm de predicie bazat tot pe modele de identificare, dar de complexitate mai mare, n care s fie pus n valoare posibila corelaie existent ntre canalele de msur ale aceleiai mrimi fizice. Pe scurt, este vorba despre modelul ARMAX [SoSt89], [SCS05], care a condus la Algoritmul PARMAX (descris pe larg n acest raport de cercetare). Acesta apeleaz la o tehnic de neconvenional de optimizare, de tip euristic (heuriskein = a cuta, n limba greac) [KeEb95]. Datele numerice care provin de la fenomene naturale posed, n marea lor majoritate, o proprietate care, de regul, limiteaz precizia modelelor matematice construite: nestaionaritatea. Ideal ar fi ca datele s fie staionare, adic s aib spectrul de frecven [PrMa96] constant n timp. Ori, aceast ipotez (ca i cea a liniaritii modelelor matematice) s-a dovedit a fi nerealist. Spectrul unei serii de timp cu un numr suficient de mare de date variaz n timp. Cu alte cuvinte, seria de timp este nestaionar. Pentru ca acest fenomen s nu se nregistreze, este necesar ca perioada de eantionare s aib valori foarte mici (la nivel de milisecunde) i numrul de date msurate s fie, de asemenea, mic (cteva zeci, cel mult). Cu un astfel de bloc de date nu se pot construi ns modele matematice suficient de precise n scopul prediciei i al diagnozei. (Aceast abordare apare totui n aplicaii de telecomunicaie bazate pe compresia datelor cu modele auto-regresive.) Rezult c este necesar o abordare bazat pe tehnici de prelucrare a semnalelor nestaionare. Aceste tehnici fac parte dintr-un cmp de cercetare relativ nou i extrem de dinamic al domeniului Prelucrrii Semnalelor (PS): analiza de semnal de tip timp-frecven [CoL95], [StD95]. Unul dintre cele mai interesante instrumente din acest cmp l constituie undina [StSt07], [SSP09]. Ce sunt undinele i cum au fost ele utilizate n cadrul acestui proiect va fi explicat n seciunile urmtoare. Cert este faptul c ele au condus la doi algoritmi de prelucrare a datelor achiziionate avnd complexitate ridicat: FORWAVER (de predicie uni-canal pe baz de undine ortogonale cu suport compact) i GAMP (de diagnoz a defectelor mecanice pe baz de dicionare de forme de unde, care includ undine). Aceti algoritmi sunt detaliai n cadrul raportului de cercetare de fa. Aa cum se va observa, ei sunt conjugai cu tehnici euristice de optimizare provenind din Inteligena Artificial [RuNo95] sau din domeniul Programrii Evoluionare [MiM95]. De notat c algoritmii bazai pe modele de identificare (PARMA i PARMAX) iau de asemenea n considerare caracterul nestaionar al datelor achiziionate, dei nu ntr-o
2

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

manier direct. Modelele de identificare din clasa ARMAX (care include ARMA) au o caracteristic important: pot fi adaptive. Aceasta nseamn c ele se adapteaz permanent noilor date msurate, adic au parametri variabili n timp. Este binecunoscut corelaia direct ntre modelele ARMA(X) de identificare i operaia de filtrare din PS: ele sunt de fapt filtre de semnal. Ca orice filtru, ele posed caracteristici n frecven. Variind parametrii unui filtru, este variat i caractertistica sa n frecven, adic spectrul. Am fcut aceast precizare pentru a justifica titlul reportului de cercetare. Semnalele nestaionare constituie punctul de plecare pentru ambele categorii de modele matematice: cele bazate pe tehnici de identificare a sistemelor (PARMA, PARMAX) i cele bazate pe tehnici de prelucrare de semnal (FORWAVER, GAMP). Acest raport de cercetare se concentreaz aadar pe descrierea n detaliu a primei activiti din cadrul etapei, cu referire, n final la activitatea de testare a produsului, prin cteva dintre rezultatele de simulare obinute. Unele publicaii ale echipei de cercetare, publicaii care au legtur cu acest subiect, au fost de asemnea anexate raportului. Ele descriu i alte rezultate de simulare dect cele din raport.

2. Predicia datelor multi-dimensionale cu ajutorul modelelor ARMAX


Sistemul de senzori ai UMAPID are capacitatea de furniza dou mari categorii de date: uni-dimensionale (cnd este msurat o singur mrime fizic ntr-o singur locaie) i multi-dimensionale (cnd operaia de msurare se efectueaz asupra uneia sau mai multe mrimi fizice, spaial localizate n mai multe puncte). Desigur, datele din a doua categorie pot fi vzute ca o colecie de serii de timp unidimensionale care prezint sau nu corelaii ntre ele. Dac aceste corelaii exist, predictorul PARMA descris n raportul tehnic precedent ([SPD08]) nu le ia n considerare, fapt care poate conduce la limitarea performanelor sale. Din acest motiv, n cazul blocurilor de date multi-dimensionale, este necesar proiectarea i implementarea unui predictor adecvat, care s exploateze proprietatea de inter-corelare a diferitelor canale de msur, n vederea creterii perormanei de predicie. n aceast seciune, va fi descris Algoritmul de predicie PARMAX, care se bazeaz pe un model de identificare multidimensional, adic de tip MIMO (Multi-Input-Multi-Output cu intrri i ieiri multiple). 2.1. Reprezentarea discret, de stare, a unei reele de senzori Senzorii cu repartizare geografic (cum ar putea fi i cei ai sistemului UMAPID n anumite aplicaii de exemplu, de monitorizare ecologic a unui areal) nu furnizeaz doar valori eantionate n timp ale parametrilor sistemului investigat, ci i valori ale acestora eantionate spaial. Cu alte cuvinte, sistemul investigat este, n acest caz, o entitate ale crei stri variaz continuu att n timp, ct i n spaiu. Prin alegerea adecvat a ratelor de eantionare, se rezolv problema succesiunii temporale a datelor provenite de la strile sistemului [PrMa96], [StD96]. Prin distribuirea adecvat a senzorilor n cadrul arealului, se rezolv problema eantionrii spaiale a sistemului, adic a alegerii strilor sale reprezentative. Dac pentru prima problem exist o serie de rezultate de eantionare ajuttoare (n spe, Regula de eantionare Kotelnikov-Shannon-Nyquist [StD96]), pentru cea de-a doua, dup cunotinele noastre, nu au fost nc propuse reguli att de generale. Intuitiv, senzorii amplasai spaial ar trebui s constituie o reea ct mai dens, pentru a putea surprinde corelaiile intime ale strilor sistemului (chiar dac o parte dintre senzori se vor dovedi redundani). Ca i n cazul stabilirii ratelor de eantionare, alegerea unei anumite densiti a senzorilor este condiionat de raiuni economice. Deosebirea const ns n faptul c adugarea unui nou senzor n reea se poate dovedi a fi o decizie mult mai scump dect cea de cretere a ratei de eantionare. n [ASTI09] este descris maniera n care poate fi achiziionat un bloc de date multi-dimensionale cu ajutorul trusei de senzori specializai n ecologie (numii i eKo-senzori).
3

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

Predicia blocului de date multi-dimensional este aadar abordat n accepia c el este alctuit prin eantionarea spaio-temporal a strilor entitii care furnizeaz datele i care are o distribuie spaial. Dinamica strilor poate fi descris prin ecuaii difereniale de ordine relativ reduse (maxim 3), aa cum s-a artat, de exemplu, n [NDS07]. Multe dintre aceste ecuaii prezint, de regul, neliniariti. Deoarece modelarea neliniaritilor constituie un demers care poate conduce uor la rezultate imprecise, s-a apelat la un mecanism adaptiv care s suplineasc aceste neliniariti. Mai precis, chiar dac modelul asociat furnizorului de date este liniar, se consider c parametrii si variaz n timp. Aceast caracteristic este sinonim cu alegerea celui mai apropiat model liniar dintr-o clas, la fiecare moment de adaptare. Astfel, neliniaritile, dac exist, conduc la o problem de identificare adaptiv multi-model. Odat ce modelul intrare-ieire a fost stabilit ca exprimare, urmeaz determinarea/reactualizarea acestuia i rezolvarea sistemului de ecuaii difereniale (de fapt, cu diferene, deoarece modelul este discret), n vederea prediciei. O reea de senzori (cum este i cea din Figura 1.1) poate fi considerat sistem de msur direct a strilor unui proces stocastic. Cu alte cuvinte, ieirea acestui sistem este direct conectat la stri. Aceast reprezentare are urmtoarea exprimare matematic: x[ n + 1] = A n x[ n] + B nu[ n] + Fn w[ n] , nN , (2.1) y[ n] = C x[ n] + D v[ n] n n unde: A n R nxnx , Bn R nxnu , Cn R nynx , D n R nynv i Fn R nxnw sunt matrici care includ toi parametrii variabili (dar deja estimai) ai procesului stocastic; x R nx este vectorul necunoscut al strilor procesului; u R nu este vectorul semnalelor de intrare (msurabile sau nu); y R ny este vectorul semnalelor de ieire msurabile; w R nw este zgomotul perturbator intern (endogen), necunoscut, al procesului; v R nv este zgomotul perturbator extern (exogen), necunoscut, care afecteaz msurtorile ieirilor procesului. n cazul seriilor de timp, intrrile din ecuaiile (2.1) sunt cel puin nemsurabile (dac nu necunoscute). Este aproape imposibil de msurat semnalul (sau semnalele) care guverneaz dinamica unui anumit parametru monitorizat. De aceea, intrrile pot fi cel mult estimate, ca i strile. n acest caz, zgomotul endogen poate juca rol de intrare parazit, care nsoete intrarea util. Ambele sunt ns necunoscute i trebuie estimate. n schimb, zgomotul exogen este ntotdeauna considerat o perturbaie care corupe datele msurate i apare n mod inevitabil asociat cu operaia de msurare. Reprezentarea pe stare (2.1) nu este util dect n condiiile n care se precizeaz anumite caracteristici ale celor dou tipuri de zgomote. De aceea, se consider verificate urmtoarele ipoteze, larg acceptate n aplicaii: H1 Toate zgomotele au media nul i sunt de tip Gaussian [SCS05]. H2 Cele dou tipuri de zgomote sunt necorelate ntre ele. H3 Zgomotul endogen este neauto-corelat, dar componentele sale pot fi corelate ntre ele la acelai moment de timp. H4 Componentele zgomotului exogen sunt albe i necorelate ntre ele. Ultimele dou ipoteze se exprim matematic astfel:
w [ n] = E {w[ n]wT [ n]} R nwnw , respectiv v [ n] = E {v[ n]vT [ n]} R nvnv , n N , (2.2)

unde E este operatorul de mediere statistic. Cele dou matrici definite n (2.2) sunt diferite nu doar ca dimensiune, ci i ca structur. Prima ( w [ n] ) este o matrice strict
4

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

pozitiv definit (nu neaprat diagonal), n timp ce a doua ( v [ n] ) este o matrice diagonal, cu diagonala strict pozitiv. Evident, ipoteza H4 are accente restrictive. O variant relaxat a acesteia ar fi chiar ipoteza H3, adaptat la zgomotul exogen. n acest caz, matricea v [ n] nu mai este neaprat diagonal, dar continu s fie strict pozitiv definit. Diagonalitatea acestei matrici asigur doar o vitez mai bun de convergen a algoritmului de rezolvare a ecuaiei (2.1). Renunarea la diagonalitate, va conduce doar la o cretere a timpului necesar calculatorului pentru rezolvarea ecuaiei (2.1). Nu este afectat n mod sesizabil precizia rezultatului final, astfel nct se poate considera, fr a face un compromis prea mare, c zgomotul exogen verific, la rndul lui, cel puin ipoteza H3. De notat c ambele matrici (2.2) sunt necunoscute i pot fi cel mult estimate. Revenind la modelul (2.1), este clar c vectorul ieirilor y are un numr de componente ny egal cu numrul senzorilor. Elementele sale se mai numesc i canale de msur. Vectorul strilor are rolul de a codifica toate corelaiile existente ntre senzori. Nu este obligatoriu ca numrul strilor procesului stocastic ( nx ) s fie egal cu numrul senzorilor. Sistemul de ecuaii cu diferene (2.1) este doar de ordin I, n timp ce legile de variaie ale parametrilor de proces monitorizai pot fi exprimate prin ecuaii difereniale de ordine superioare. Aceasta mrete numrul de stri ale procesului (este adevrat, unele dintre ele fiind doar virtuale), avnd n vedere binecunoscuta manier de a obine un sistem diferenial de ordin I dintr-unul de ordin superior. n consecin, nx ny . n schimb, exist tot attea surse de zgomot exogen cte canale de msur au fost instalate (dimensiunea vectorului Dn v este egal cu cea a vectorului y ). Fiecare senzor cu zgomotul su exogen. Zgomotul endogen Fn w se pliaz ns pe cel al strilor, avnd aceeai dimensiune ( nx ). n ceea ce privete intrrile, n general, ele pot fi n numr arbitrar, necorelat cu nx i ny . n particular, n cazul seriilor de timp distribuite, dimensiunea intrrilor este determinat de numrul de senzori i de anumii indici structurali ai modelelor de identificare autoregresive asociate reprezentrii pe stare. Aceast proprietate va fi explicitat n paragrafele urmtoare. Pentru a ajunge la algoritmii de predicie bazai pe moldelul (2.1), este necesar s fie rezolvate 2 probleme: proiectarea unui mecanism de adaptare parametric i rezolvarea numeric a ecuaiilor cu diferene, eventual prin intermediul unui model echivalent de tip intrare-ieire. Le vom aborda pe rnd, n continuare, ncepnd cu maniera de echivalare a modelului de stare cu un model de tip intrare-ieire. 2.2. Modelul discret, de tip intrare-ieire, al unei reele de senzori Dac se pleac de la modelul cu reprezentare pe stare:

x[ k + 1] = Ax[ k ] + Bu[ k ] + Fw[ k ] , k N , y[ k ] = Cx[ k ] + Dv[ k ]

(2.3)

cu aceleai notaii ca n definiia (2.1) (dar cu parametri constani), atunci, pentru a obine ecuaia intrare-ieire echivalent, se poate apela la Transformata Z (TZ). Ea va conduce la un model de tip MIMO-ARMAX. Folosind Teorema ntrzierii (proprietate a TZ), ecuaiile (2.3) devin:

( zI nx A ) X( z ) = B U( z ) + F W( z ) , z C , Y ( z ) = C X ( z ) + D V( z )

(2.4)

unde C C este o coroan circular centrat n origine, care joac rol de zon de convergen pentru funciile complexe rezultate. Introducnd prima egalitate n cea de-a doua (pentru a elimina TZ a vectorului de stare), se obine TZ a ieirii, fr intervenia direct strilor:
5

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

Y( z ) = C ( zI nx A ) B U ( z ) + C ( zI nx A ) F W( z ) + D V( z ) , z C ,
1 1

(2.5)

Ecuaia (2.5) pune n eviden doi termeni: unul determinat de intrarea n sistem i altul care filtreaz zgomotele endogen i exogen. Din primul termen, se obine funcia de transfer util a sistemului modelat:

H( z ) =

def

Y( z ) 1 = C ( zI nx A ) B , z C , U( z )

(2.6)

care, dup inversarea matricii

( zI nx A )

(prin metode de descompunere spectral

[DPJ98]), va conduce la o matrice de dimensiune ny nu exprimat printr-un raport de polinoame (adic raional). Mai mult, rapoartele de polinoame pot fi obinute direct n forma de exprimare cu fracii simple, polii fiind valorile proprii ale matricii A , iar numitorul fiind chiar polinomul caracteristic al acestei matrici, notat prin A . Polinomul caracteristic A este de fapt numitorul comun al tuturor elementelor matricii H , astfel c:

H( z ) =

1 Q B,C ( z ) , z C , A ( z )

(2.7)

unde Q B,C R nynu ( z ) este o matrice de polinoame de grad cel mult egal cu ( nx 1) , unic determinat de matricile B i C (dar i cu intervenia indirect a lui A , prin matricile de trecere la forma diagonal). Trecnd la operatorii de deplasare temporal ( z 1 q 1 , tot conform Teoremei ntrzierii), matricea util de sistem este urmtoarea:

H (q

)=q
def

nx

A ( q 1 )

nx 1

( q 1 ) = Q B,C

( q 1 ) q 1 Q B,C A ( q 1 )

(2.8)

unde simbolul ~ indic operatorul de trecere la polinomul reciproc. (Prin definiie, dac A x) = xn A ( xn ) , este un polinom de grad n , atunci polinomul reciproc are exprimarea: A( gradul su fiind tot egal cu n .) Aa cum era de ateptat, polinoamele de la numrtor nu au termen liber, indicnd faptul c intrrile sistemului sufer o ntrziere de cel puin un pas n traseul lor ctre ieire. Din definiia (2.8), rezult c partea util a ieirii sistemului are exprimarea:

yu H (q
def

)u =

( q 1 ) q 1 Q B,C A ( q 1 )

u,

(2.9)

ceea ce permite aducerea la forma MIMO-ARX [SCS05], n care matricea prii autoA: regresive este diagonal, cu diagonala ocupat de acelai polinom reciproc

B1,1 ( q 1 ) B1,nu ( q 1 ) A ( q 1 ) 0 yu u . A ( q 1 ) 0 Bnx ,1 ( q 1 ) Bnx ,nu ( q 1 )


A q 1

(2.10)

( )

B q 1

( )

Expresia (2.10) arat c abordarea legat de sistemele multi-dimensionale din cadrul mediului de programare MATLAB (despre care vom vorbi puin mai trziu) nu este ntmpltoare. Plecnd de la o reprezentare pe stare a unui sistem, se ajunge n mod natural la un sistem de ecuaii cu diferene, n care ieirile nu mai sunt amestecate. n MATLAB este chiar surprins o situaie mai bun, din punctul de vedere al Principiului
6

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

parsimoniei [SCS05]: pe fiecare linie a matricii raionale H se procedeaz la simplificarea zerorurilor i polilor comuni, dup care linia este adus la acelai numitor. Numrul de parametri ai numrtorilor liniei poate astfel s scad. n consecin, ecuaia (2.10) devine:

A1 ( q 1 ) B1,1 ( q 1 ) B1,nu ( q 1 ) 0 yu u , 0 Bnx ,1 ( q 1 ) Bnx ,nu ( q 1 ) A nx ( q 1 )


A q 1

(2.11)

( )

B q 1

( )

cu polinoame eventual diferite pe diagonal. Un ultim artificiu conduce la forma canonic din exprimarea modelelor MIMO-ARX: se mparte fiecare linie a celor dou matrici cu termenul liber al polinomului A j corespunztor i se renoteaz coeficienii.

A j , care este maxim egal cu nx ) i {nb j ,i }

Se pot identifica i indicii structurali ai modelului MIMO-ARX: na j (gradul polinomului


i1,nu

(gradele polinoamelor {B j ,i }

i1,nu

, care sunt

cel mult egale cu nx 1 ), pentru fiecare canal de msur j 1, ny . Ultimii doi termeni din egalitatea (2.5) se refer la componenta de medie alunectoare din modelul MIMO-ARMAX. Pentru a obine funcia de transfer corespunztoare, trebuie efectuate cteva aranjri preliminare ale acestora. Astfel, se poate evalua matricea:
( z ) = ( zI A ) C ( zI A )1 , z C , C nx nx
def

(2.12)

care permite urmtoarea exprimare:


1 ( z ) F W( z ) + D V ( z ) , z C . Ye ( z ) = ( zI nx A ) C def

(2.13) , la stnga ambilor (2.14)

n definiia (2.13), se poate scoate factorul comun forat termeni:


def 1

( zI nx A )

Ye ( z ) = ( zI nx A ) C( z )F W( z ) + ( zI nx A ) D V( z ) , z C .

S presupunem c exist o precizare privind legtura dintre cele dou zgomote (endogen i exogen) i zgomotele albe, de exemplu, de forma:

W( z ) = Gx ( z 1 ) E( z ) & V( z ) = G y ( z 1 ) E( z ) , z C ,

(2.15)

unde Gx R nwny ( z ) i G y R nvny ( z ) sunt funcii de transfer polinomiale cauzale (adic produse de filtre cu rspuns finit la impuls), iar E R ny ( z ) este TZ a secvenei de zgomote albe care afecteaz canalele de msur. Atunci, din (2.14), se poate pune n eviden funcia de transfer perturbatoare: def Y ( z) 1 1 1 = ( zI nx A ) G( z ) = e C( z )FGx ( z ) + ( zI nx A ) DG y ( z ) = E( z ) (2.16) 1 1 1 = C ( zI nx A ) FGx ( z ) + DG y ( z ) , z C . Dac informaia de filtrare (2.15) nu este disponibil, atunci se poate considera pur i simplu c ambele perturbaii sunt constituite din zgomote albe. n acest caz: def Y ( z) 1 = ( zI nx A ) G( z ) = e C( z )F + ( zI nx A ) D = E( z ) (2.17) 1 = C ( zI nx A ) F + D , z C .
7

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

Indiferent de caz, se poate observa c funcia de transfer este raional i numitorul comun al rapoartelor de polinoame este tot polinomul caracteristic A . Cu alte cuvinte,

G( z ) =

1 QC,D,F ( z ) , z C , A ( z )

(2.18)

unde, de aceast dat, QC,D,F R nyny ( z ) este o matrice de polinoame Laurent n care gradul maxim n z este cel mult egal cu nx (gradul maxim n z 1 fiind nul sau orict de mare, dar finit). Matricea este unic determinat de matricile B i C (dar i cu intervenia indirect a lui A , prin matricile de trecere la forma diagonal). Trecnd la operatorii de deplasare temporal, matricea util de sistem este urmtoarea:

G ( q 1 ) =

def

A ( q 1 ) q nx

1 q nx Q C,D,F ( q ) =

1 Q C,D,F ( q )

A ( q 1 )

(2.19)

1 unde Q este acum un polinom veritabil n q 1 , al crui grad poate fi inferior, egal C,D,F q

( )

sau superior lui nx . (Practic, n polinomul QC,D,F ( z ) , a fost scos ca factor comun forat monomul z nx ; cum gradul su n z este cel mult egal cu nx , polinomul rezultat nu mai are puteri ale lui z , ci puteri ale lui z 1 .) Din definiia (2.19), rezult c partea perturbatoare a ieirii sistemului are exprimarea:

ye G (q
def

)e =

1 Q C,D,F ( q )

A ( q 1 )

e,

(2.20)

ceea ce permite aducerea la forma MIMO-ARMA, n care matricea prii auto-regresive A : este diagonal, cu diagonala ocupat de polinomul

C1,1 ( q 1 ) C1,ny ( q 1 ) A ( q 1 ) 0 ye e. A ( q 1 ) 0 Cny ,1 ( q 1 ) C ny ,ny ( q 1 )


A q 1

(2.21)

( )

C q 1

( )

Ca i n cazul componentei utile, sistemul are ieiri neamestecate. Pentru a aplica Principiul parsimoniei, trebuie apelat la polinoamele {A j } din exprimarea (2.11) (i nu
j1,ny

altele). Acestea se obin din (2.21) numai dac este posibil simplificarea acelorai poli de pe liniile j ale matricilor A ( q 1 ) i C ( q 1 ) ca i n cazul matricilor A ( q 1 ) i B ( q 1 ) . Altfel, ecuaia (2.21) foreaz revenirea ecuaiei (2.11) la ecuaia (2.10), pentru a conserva unicul A , care trebuie s intervin att n partea util, ct i n partea perturbatoare a polinom ieirii. Dac este posibil aplicarea Principiului parsimoniei, ecuaia ieirilor perturbatoare devine: A1 ( q 1 ) C1,1 ( q 1 ) C1,ny ( q 1 ) 0 ye e . (2.22) A nx ( q 1 ) 0 Cny ,1 ( q 1 ) Cny ,ny ( q 1 )
A q 1

( )

C q 1

( )

i n acest caz, se poate aplica normalizarea prin mprirea polinoamelor cu termenii lor liberi i renotarea coeficienilor (coeficienii liberi intr practic n valorile zgomotelor).
8

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

Este clar ns c matricea C ( q 1 ) ar putea s nu mai fie diagonal, ca n cazul modelelor MISO-ARMAX. Cu toate acestea, gradele polinoamelor ei, depi numrul de stri ale sistemului iniial. 2.3. Construcia predictorului PARMAX Paragraful precedent a artat ca se poate renuna la serviciile modelului cu reprezentarea pe stare (mai dificil de manevrat n scopul prediciei), n favoarea unui model discret de tip intrare-ieire din clasa ARMAX. Pentru a putea identifica un astfel de model, sunt necesari doi pai. La primul, se determin un model grosier de tip ARMA, al crui rol este de a oferi posibilitatea estimrii zgomotului exogen v . Odat acest zgomot estimat, el va juca rol de intrare pentru sistemul investigat, avnd n vedere c datele msurate la ieire sunt serii de timp. Aadar, n cadrul intrrii u din ecuaiile de stare (2.1), vor fi nglobate i versiunile estimate ale . (Aa cum se cunoate, simbolul ^ nseamn zgomotelor exogene, grupate n vectorul v estimat.) La pasul doi, se determin modelul ARMAX multi-dimensional (adic MIMOARMAX), pe baza datelor msurate de la senzori i a valorilor estimate ale zgomotului exogen (cu rol de intrri). Modelul ARMA multi-dimensional (MIMO-ARMA) grosier se poate construi relativ simplu, considernd c senzorii nu sunt corelai unul cu altul. Cu alte cuvinte, modelul este total decuplat, matricile sale fiind diagonale. Aa cum s-a precizat i n [SPD08], modelul ARMA are urmtoarea exprimare matematic:

{nc }
j ,i

j ,i1,ny

, pot, eventual,

A j ( q 1 ) y j C j ( q 1 ) e j , j 1, ny ,

(2.23)

unde A j i C j sunt polinoame de forma:


def na 1 A q = 1 + a j ,1 q 1 + + a j ,na j q j j , (2.24) def nc j 1 1 C j q = 1 + c j ,1 q + + c j ,nc j q indici structurali optimali (minimali) care trebuie determinai odat cu

( ) ( )

cu na j i nc j

parametrii, prin aplicarea unei srategii de optimizare i a Metodei Minimizrii Erorii de Predicie (MMEP) [SCS05]. Optimalitatea este apreciat n raport cu PQ calitatea prediciei un criteriu definit n [SPD08], care, n urma numeroaselor simulri efectuate, a necesitat redefinirea, ca n Anexa A. Mai precis, pentru fiecare canal j 1, ny , se variaz indicii na j i nc j ntr-o anumit
max max gam de variaie (de exemplu: na j na min i nc j nc min ), alegndu-se ca valori j , na j j , nc j

optime cele pentru care PQ este maxim. Pentru uurin, cele dou game de variaie pot fi aceleai, indiferent de canalul de msur. Astfel, prin convenie, na min = na min = Na , j j
nc min = nc min = Nc , na max = na max = NA i nc max = nc max = NC , j 1, ny . n vederea evalurii j j j j j j
def def def def

criteriului PQ, este necesar s se adopte aceeai strategie de rezervare a ultimelor date de pe fiecare canal (de exemplu, n numr de K / 2 , dar nu mai puine de 4) ca i n cazul predictorului PARMA (unde K 1 este dimensiunea orizontului de predicie). (n [SPD08] a fost descris aceast strategie, astfel c ea nu va fi reluat aici.) Revenind, funcia de sistem grosier asociat este diagonal:
1 1 G0 ( q 1 ) = diag C j ( q ) A j ( q ) j1,ny

(2.25)

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

Cu alte cuvinte, modelul ARMA grosier multi-dimensional are urmtoare exprimare:

y G0 ( q 1 ) e ,

(2.26)

unde e R ny este vectorul zgomotelor albe Gaussiene de medie nul care provoac variaia datelor msurate de la senzori. De notat c MMEP ofer, n plus, estimaii att 2 pentru dispersiile necunoscute ale zgomotelor albe ( ), ct i pentru valorile e, j

{ }

j1,ny

), pn la momentul curent. Acestea din urm sunt, de fapt efective ale zgomotelor albe ( e erorile de predicie estimate, folosind modelul ARMA grosier. Dup estimarea parametrilor polinoamelor (2.24) (efectuat separat, pe fiecare canal de msur, cu date staionarizate (adic centrate n jurul mediei de canal)), se pot determina valorile aproximative ale zgomotelor exogene: ( q 1 ) y + 1 C ( q 1 ) v j A v j j j j , unde: v j [ n] = e j [ n] , n 1, nc j , j 1, ny .
(2.27)

Acestea sunt, de fapt, estimaii mai precise ale unor zgomote albe, care urmeaz s fie filtrate de ctre fiecare canal de msur n parte. Zgomotele (2.27) sunt n continuare utilizate pe post de intrri n modelul mai rafinat, de tip MIMO-ARMAX, de mai jos:

+ C ( q 1 ) e , A ( q 1 ) y B ( q 1 ) v

(2.28)

n care A R nyny ( q 1 ) , B R nyny ( q 1 ) i C R nyny ( q 1 ) sunt matrici polinomiale de grade


na , nb , respectiv nc , iar diagonala lui B este nul (zgomotul canalului curent lipsete):
def 1 A = I ny + A1 q 1 + + A na q na q ( ) def 1 B B1 q 1 + + B nb q nb . = q ( ) def C ( q 1 ) = I ny + C1 q 1 + + Cnc q nc

(2.29)

Coeficienii matriciali ai polinoamelor (2.29) sunt necunoscui (mai puin I ny , care este matricea unitate de ordin ny ) i trebuie determinai cu ajutorul datelor msurate. La fel i indicii structurali na , nb i nc . Cele dou funcii de sistem asociate modelului (2.28) sunt urmtoarele:

H ( q 1 ) = A 1 ( q 1 ) B ( q 1 ) (util) & G ( q 1 ) = A 1 ( q 1 ) C ( q 1 ) (rezidual).

(2.30)

Spre deosebire de modelul grosier ARMA, cel rafinat, de tip ARMAX, codific i corelaiile existente ntre senzorii din reea. Acesta este motivul principal pentru care a fost necesar rafinarea modelului ARMA. Este drept, ns, c efectuarea inversrii matricii polinomiale A nu beneficiaz de o procedur comod din punct de vedere numeric. De asemenea, identificarea tuturor parametrilor celor 3 matrici ridic numeroase probleme de implementare. De aceea, se apeleaz la o abordare simplificat legat de MMEP. n mediul de programare MATLAB, identificarea modelelor multi-dimensionale este supus unui principiu simplificator, care ar putea fi adoptat i n cazul modelului (2.28). Pentru aceasta, se poate utiliza funcia armax (care, de fapt, implementeaz MMEP una dintre cele mai complexe metode de identificare a sistemelor). S presupunem c procesul de identificat are nu canale de intrare i ny canale de ieire, fiind descris de modelul MIMO-ARMAX general:
10

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

A ( q 1 ) y B ( q 1 ) u + C ( q 1 ) e

(2.31)

i aceleai matrici polinomiale (2.29)). Atunci, n loc s fie determinai (cu u n loc de v coeficienii matriciali ai polinoamelor (2.29) dintr-o dat, se determin, pe rnd, polinoamele unidimensionale ale cte unui model ARMAX de de tip MISO (mai multe intrri i o ieire):

A j ( q 1 ) y j B j , i ( q 1 ) ui + C j ( q 1 ) e j , j 1, ny .
nu i =1

(2.32)

Cu alte cuvinte, se identific doar modelul parial al influenei pe care o au toate canalele de intrare asupra canalului de ieire din poziia j . Dup aceea, se pot preciza direct elementele funciilor de sistem (2.30), sub forma:
yj
i =1 nu

A j ( q 1 )
H j , i q 1

B j , i ( q 1 )

ui +

( )

A j ( q 1 )
G j q 1

C j ( q 1 )

e j , j 1, ny .

(2.33)

( )

n detaliu, cele dou funcii de sistem multi-dimensionale au exprimarea urmtoare:


B1,1 ( q 1 ) 1 A1 ( q ) B j ,1 ( q 1 ) 1 H (q ) = A q 1 j( ) Bny ,1 ( q 1 ) 1 A ny ( q ) B1,2 ( q 1 ) A1 ( q 1 ) B j ,2 ( q 1 ) A j ( q 1 ) Bny ,2 ( q 1 ) A ny ( q 1 ) B1,nu ( q 1 ) A1 ( q 1 ) 1 B j ,nu ( q ) A j ( q 1 ) Bny ,nu ( q 1 ) A ny ( q 1 ) C1 ( q 1 ) 1 A1 ( q ) 1 C j (q ) & G ( q 1 ) = diag . (2.34) A j ( q 1 ) Cny ( q 1 ) 1 A q ( ) ny

n acest mod, este evitat inversarea matricii polinomiale A . Preul pltit l constituie scderea preciziei modelului multi-dimensional, prin faptul c nu sunt surprinse toate tipurile de corelaii dintre intrri, ieiri i zgomote, ci doar a corelaiilor dintre setul de intrri i fiecare ieire n parte. n cazul seriilor de timp distribuite, se poate presupune ns c zgomotul de msur al unei anumite ieiri nu influeneaz alt ieire, iar interferenele dintre senzori (care ar cauza corelaii i ntre ieirile msurate) sunt neglijabile n contextul tehnologiilor actuale de fabricaie. De notat c, alegnd ca vector de intrare chiar vectorul (deci nu = ny ), este permis identificarea influenei pe care o au zgomotelor colorate v perturbaiile tuturor canalelor de msur asupra unui anumit canal. Aadar, pentru a determina modelul ARMAX asociat procesului ecologic, plecnd de la colecia de modele ARMA independente, se va adopta principiul de mai sus, care ofer elementele celor dou funcii de sistem (2.30) dup ecuaiile (2.33)-(2.34). De altfel, aa cum s-a menionat n paragraful precedent, colecia de modele MISO-ARMAX (care formeaz modelul global MIMO-ARMAX) corespunde i transformrii echivalente de la reprezentarea pe stare la reprezentarea de tip intrare-ieire. Evident, pentru o mai mare eficien, MMEP poate fi implementat n variant adaptiv. Cu alte cuvinte, la fiecare pas de predicie, parametrii cureni ai modelelor ARMA grosier i ARMAX rafinat se pot reactualiza n funcie de noile date msurate, n loc s fie determinai complet folosind ntregul set de date achiziionate pn atunci. Aceast operaie dei relativ complicat, din cauza formei destul de laborioase a modelului de identificare, conduce la o mai mare precizie a predictorului.
11

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

S presupunem, n continuare, c indicii structurali ai modelului MIMO-ARMAX (3.34) au fost fixai i c parametrii si au fost estimai. Pentru a efectua predicia datelor, este clar c fiecare canal de msur poate fi tratat separat. Modelul generic de predicie este, n acest caz, de tip MISO-ARMAX. Fie j 1, ny indicele curent al canalelor de msur. Din (2.32), rezult c ecuaia modelului de predicie asociat canalului j este urmtoarea:

( q 1 ) y B ( q 1 ) e (cu B ( q 1 ) 0 ). i + C A j , i ( q 1 ) v j, j j j j j
nu i =1

(2.35)

n consecin, predictorul optimal ideal are exprimarea de mai jos:


1 ( q 1 ) e . ( q 1 ) v i + C yj B j,i j j 1 A j ( q ) y j + i =1

nu

(2.36)

Ceea ce mpiedic utilizarea direct a ecuaiei (2.36) pentru a produce valorile predictate este componenta de medie alunectoare (mai precis, zgomotul alb necunoscut e j ). De aceea, predictorul va trebui s opereze cu estimaii ale acesteia. Pentru a le evalua, se apeleaz la un model MISO-ARX aproximant, descris de ecuaia:
1 n 1 A nj ( q 1 ) y j Bnj , i ( q ) vi + e j (cu B j , j ( q ) 0 ),

nu

(2.37)

i =1

unde gradele polinoamelor A nj i Bnj , i sunt:


ny n = min 3 ( na j + nc j ) , N y , respectiv n = min 3 na j + nc j + nb j , i , N y , i =1, i j

(2.38)

sensibil mai mari dect oricare dintre indicii structurali ai modelului MISO-ARMAX. (Pentru simplitate, a fost omis indicele j din notaia lor.) Plecnd de la datele msurate ale canalului j , dup staionarizarea acestora, se poate identifica modelul MISO-ARX (2.37). (Mediile datelor de pe fiecare canal de msur vor fi reinute, deoarece ele trebuie adugate valorilor predictate.) Ecuaia modelului MISO-ARX poate fi acum exprimat sub forma de tip eroare de ieire:
1 j A nj ( q 1 ) y j Bnj e , i ( q ) vi . nu i =1

(2.39)

Aceasta ofer chiar valorile estimate ale zgomotului alb de pe canalul j . Abia acum se poate efectua predicia (n doi pai), prin tandemul ecuaiilor (2.36) i (2.39). Pentru sincronizarea calculelor, este foarte important s se aplice urmtoarea strategie: la fiecare pas de predicie ( k ) se predicteaz toate canalele (adic variind j ntre 1 i ny ). Astfel, predicia avanseaz simultan pe toate canalele. Aceast strategie asigur posibilitatea de a predicta intrrile

{v }
j

j1,ny

n paralel cu ieirile, fr a utiliza

modelele ARMA grosiere. Ecuaiile predictorului multi-dimensional, numit ad hoc PARMAX, sunt descrise n continuare. a. Pe orizontul de msur ( k 1, N y ):
y j k | N y j ,1 y j [ k 1] a j ,2 y j [ k 2] a j ,na j y j = a k na j + ny v b k nb j , i + + j , i ,1 i [ k 1] + + b j , i ,nb j , i vi i =1, i j j ,1e j [ k 1] + + c j ,nc j e j +c k nc j ;
12

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

j ,1 y j [ k 1] + + j ,n y j [ k n] j [k ] = y j [k ] + e ny v j , i ,1 i [ k 1] + + j , i ,n vi [ k n ] , j 1, ny . i =1, i j
b. Pe orizontul de predicie ( k N y + 1, N y + K ): b1. pentru k N y + 1, N y + min {K , na j } :

(2.40)

y j k | N y j ,1 y j j ,k N y 1 y j = a k 1 | N y a N y +1 | N y j ,k N y y j j ,na j y j a N y a k na j + ny v b k nb j , i + j , i ,1 i [ k 1] + + b j , i ,nb j , i vi + i =1, i j j ,1e j [ k 1] + + c j ,nc j e j +c k nc j ;


b2. pentru k N y + na j + 1, N y + K (numai dac na < K ):
y j k | N y j ,1 y j j ,na j y j = a k 1 | N y a k na j | N y + ny v b k nb j , i + j , i ,1 i [ k 1] + + b j , i ,nb j , i vi + i =1, i j j ,1e j [ k 1] + + c j ,nc j e j +c k nc j ;

(2.41)

(2.42)

b3. predicia zgomotelor (presupunnd n mod natural c n > K ):

e j ,1 y j ,k N y 1 y j [k ] = v j [k ] = y j j j k | N y + k 1 | N y + + N y +1 | N y + j ,k N y y j j ,n y j [ k n] + Ny + + ny v j , i ,1 i [ k 1] + + j , i ,n vi [ k n ] , j 1, ny . i =1, i j

(2.43)

n afara valorilor predictate, se pot evalua i dispersiile erorilor de predicie, ca n cazul modelelor ARMA. Prima operaie const n estimarea dispersiei erorii de predicie pe orizontul de msur:
2 = 1 j Ny ( y [k ] y
Ny k =1 j j

k | N y

, j 1, ny .

(2.44)

Apoi, se evalueaz coeficienii polinomului trunchiat obinut prin mprirea infinit dintre i A : polinoamele C j j

j ,1 q + j ,2 q + + j ,K 1 q 1+

1 K

def

( z 1 ) C j = , j 1, ny . ( z 1 ) A j K 1

(2.45)

n fine, dispersiile erorilor de predicie se evalueaz dup cum urmeaz:

2 (1 + 2 2j ,1 + + 2j ,k 1 ) = 2 2j ,k = 2j ,k 1 + k 1, K , j 1, ny . j j j ,k 1 ,
def

(2.46)

Acum, exist toate condiiile pentru a evalua criteriul PQ (A.8), dup ce se msoar datele pe orizontul de predicie. El trebuie ns adaptat contextului modelelor multidimensionale prin extinderea la un criteriu multi-dimensional. Mai precis, criteriul PQ asociat canalului j 1, ny va ocupa aceeai poziie ntr-un vector:
13

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

unde fiecare PQ j

PQ = (2.47) PQ1 PQ ny , este definit ca n (A.8). Evident, modelul optimal este cel care

def

maximizeaz norma vectorului (2.47). 2.4. Selectarea predictorului PARMA(X) optimal prin strategia PSO Identificarea modelului MIMO-ARMAX presupune cunoaterea indicilor structurali i {nc j } . Este evident c, pentru selecia lor, trebuie utilizat {na j } , {nb j ,i }
j1,ny j , i1,ny , i j j1,ny

acelai criteriu PQ. Sunt posibile mai multe strategii: i {nc j } la valorile optimale din cazul modelelor ARMA 1. Fixarea indicilor {na j } grosiere i varierea doar a indicilor {nb j , i }
j1,ny j1,ny j , i1,ny , i j

ntr-o gam de valori.

2. Varierea tuturor indicilor n anumite game de valori. Varierea indicilor {nb j ,i } (care consum cea mai mare parte a timpului de cutare)
j , i1,ny , i j

se poate realiza, la rndul ei, n diferite moduri. Ca mai mare durat de cutare este cauzat de varierea independent a indicilor. n acest caz, pentru fiecare na j i nc j ( j 1, ny ) numrul de modele care trebuie testat este egal cu ( NB Nb + 1)( ny 1) , dac
2

indicii {nb j ,i }

dac indicii {nb j ,i }

j , i1,ny , i j

variaz n gama Nb, NB . Acest numr se reduce la ( NB Nb + 1)ny 1 , de pe linia j 1, ny a matricii H q 1 (definiia (2.34)) sunt egali. n

i1,ny , i j

( )

fine, numrul de modele care trebuie testate se reduce i mai mult, la valoarea ( NB Nb + 1) , dac toi indicii {nb j , i } sunt egali. ns, pe msur ce scade efortul de
j , i1,ny , i j

cutare, se reduce i precizia predictorului. Este evident c prima strategie conduce la un efort de calcul mai mic fa de cea de-a doua, deoarece spaiul de cutare este redus de ( NA Na + 1)ny ( NC Nc + 1)ny ori. Preul pltit l constituie degradarea performanelor predictorului multi-dimensional. De exemplu, pentru o reea de 6 senzori, dac se aleg limitele de variaie Na = Nc = Nb = 1 i NA = NC = NB = 100 , atunci numrul de modele care trebuie testate prin varierea independent a tuturor indicilor este de ordinul 1074 . Variind numai indicii {nb j , i } (tot
j , i1,ny , i j

independent unul fa de altul), numrul de modele de test este de ordinul 10 (nc foarte mare). O reducere semnificativ a efortului de cutare s-ar obine observnd c, de fapt, indicii structurali ai unui canal pot fi alei independent de cei ai altui canal. Cu alte cuvinte, cutarea indicilor structurali optimi se poate efectua n paralel, pe toate canalele odate. n acest caz, varierea independent a acestora pe oricare dintre canale ar conduce la un spaiu de cutare cu ( NA Na + 1)( NB Nb + 1)ny 1 ( NC Nc + 1) modele. n cazul exemplului anterior, acest numr este de ordinul 1014 . Din pcate, ns, calculatorul mobil nu dispune dect de dou procesoare n paralel, astfel c determinarea indicilor structurali ai modelului printr-o cutare exhaustiv, ntr-un timp rezonabil (de ordinul orelor, cel mult) este un deziderat imposibil de realizat. O tehnic de cutare care ar putea reduce efortul de calcul este de tip evoluionar. De exemplu, s-ar putea utiliza fie un Algoritm Genetic [MiM05], fie, mai simplu, o tehnic bazat pe algoritmul de optimizare prin algomerare de particule (Particle Swarm Optimisation PSO) [KeEb95]. Chiar dac soluia oferit este sub-optimal, n acest caz, utilizatorul poate cel puin controla compromisul dintre durata de cutare i calitatea soluiei optimale.
50

14

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

Vom dezvolta n continuare o metod de selecie a indicilor structurali bazat pe strategia PSO. Spaiul de cutare, notat cu S , este un hiper-paralelipiped din laticea multi-dimensional N ni , unde ni este numrul de indici structurali ai modelului de identificare-predicie. n acest spaiu, se definete un vector de poziie asociat unei particule: x S . Subliniem c vectorul trebuie s aib numai componente cu valori ntregi, nu fracionare. De aceea, eventualele valori fracionare rezultate din calcul trebuie aproximate la cel mai apropiat ntreg. Pe spaiul de cutare, se definete o funcie de potrivire (sau concordan) (fitness), care trebuie optimizat. n varianta original a algoritmului PSO (propus n [KeEb95]), funcia de potrivire este nenegativ i trebuie minimizat. n contextul predictorilor din cadrul acestui proiect, funcia de potrivire este chiar criteriul PQ (re)definit n (A.8), care va trebui maximizat n raport cu vectorul indicilor structurali x . Din acest motiv, algoritmul PSO original va fi modificat i adaptat criteriului PQ. Exist i alte modificri originale importante ale variantei de baz din [KeEb95], care vor fi punctate la momentul potrivit. Principiul care st la baza tehnicii de cutare de tip PSO este urmtorul: punctul de optim al funciei de potrivire este aproximat cu ajutorul unei populaii de particule, care evolueaz incremental, pe parcursul mai multor generaii. Vom explica pe rnd termenii utilizai n aceast aseriune. Se pleac de la o populaie de particule cu poziii prestabilite:

P0 = {x 0p }p1, P S ,
def

(2.48)

unde P N este numrul de membri ai populaiei, iar indicele 0 (zero) arat c evoluia acesteia se gsete n stadiul iniial (adic la generaia 0 ). De regul, generaia iniial a populaiei caut s acopere n mod uniform spaiul de cutare. Dac exist indicii preliminare legate de o anumit zon din spaiul de cutare n care se presupune c s-ar gsi punctul de optim, atunci generaia iniial ar putea popula mai dens acea zon. Chiar dac indiciile sunt false, dup cteva generaii, populaia poate migra ctre zona unde se gsete punctul de optim, dar cutarea va fi mai ndelungat. Uzual, P 20,200 , n funcie de dimensiunea spaiului de cutare. Populaia iniial trebuie s evolueze n manier incremental. Aceasta nseamn c, de la generaia avnd indicele de evoluie m N , se va produce o generaie ulterioar, de indice m + 1 (incrementat cu o unitate). Astfel, generaiei P0 i succede generaia P1 , care, la rndul ei este printele generaiei P2 , etc. Succesiunea generaiilor se realizeaz dup un program prestabilit, aa cum se va vedea n continuare. Obiectivul acestei evoluii este acela de a fora particulele s se grupeze din ce n ce mai mult n jurul unui punct de optim al funciei de potrivire, aa cum sugereaz Figura 2.1.

Figura 2.1. Evoluia unei populaii ctre punctul de optim n cadrul Algoritmului PSO. Pentru a atinge obiectivul dorit, este necesar s se asigure un bun compromis ntre dou proprieti opuse ale populaiei: diversitate (care permite evitarea stagnrii n puncte locale de optim ale funciei de potrivire) i vitez de convergen (care depinde de viteza de grupare a populaiei n jurul unui optim). Raportul dintre aceste proprieti va fi relevat n finalul descrierii Algoritmului PSO.
15

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

Cum se realizeaz evoluia populaiei de particule de la o generaie la alta? Operaia principal o constituie reactualizarea poziiilor particulelor din generaia curent (s spunem Pm ) prin intervenia unui termen corector aditiv:
+1 m +1 p 1, P . xm = xm p p + x p ,

(2.49)

Coreciile se evalueaz pe baza vitezelor de deplasare ale particulelor (considernd deplasarea uniform de la o generaie la alta). Mai precis:
+1 m +1 ny +1 x m = p v p T + 0.5 Z , p 1, P ,
def

(2.50)

+1 ny +1 unde v m este viteza reactualizat a particulei (care nu are neaprat valori ntregi), p R

iar T > 0 este durata de timp necesar populaiei din generaia curent pentru a produce generaia urmtoare. De regul, pentru simplitate, T este ales de valoare unitar (adic joac rol de unitate de msur a timpului). n definiia (2.50), se remarc utilizarea operaiei de rotunjire la cel mai apropiat ntreg (care nu este precizat n algoritmul PSO general). Aa cum s-a menionat, ns, spaiul de cutare este o submulime a unei latici de ntregi, astfel c operaia de rotunjire este obligatorie n contextul predictorului MIMOARMAX. Mai mult, valorile poziiilor (2.49) trebuie i limitate la frontierele mulimii S , pentru a nu depi spaiul de cutare. Vitezele de deplasare ale particulelor se reactualizeaz, la rndul lor, prin trei tipuri de corecii: una multiplicativ numit factor de mobilitate (care ine cont de ineria particulei), una aditiv numit cognitiv (determinat de istoria evoluiei particulei) i alta, tot aditiv, dar numit social (n care intervine evoluia ntregii populaii din care face particula). Matematic, relaia de reactualizare a vitezelor este urmtoarea:
+1 m m = m vm p p v p + p ,c m xm p ,0 x p +1 m p ,c

+ m s

m xm P ,0 x p +1 m s

, p 1, P ,

(2.51)

unde: m p [0,1] este factorul de mobilitate a particulei; xm p ,0 S este cea mai bun poziie atins de particul n cursul evoluiei, pn la momentul curent; m xP ,0 S este cea mai bun poziie atins de ntreaga populaie n cursul evoluiei, pn la momentul curent; m p ,c [0,2] este variana normalizat n intervalul [0,2] a tuturor poziiilor atinse de particul n cursul evoluiei sale, n raport cu cea mai bun poziie a sa pn la momentul curent, x m p ,0 ; ea se mai numete i varian cognitiv; m s [0,2] este variana normalizat n intervalul [0,2] a tuturor poziiilor atinse de populaia de particule n cursul evoluiei sale, n raport cu cea mai bun poziie atins m pn n momentul curent, x P ,0 ; ea se mai numete i varian social;
+1 m p ,c T este durata de care ar avea nevoie particula s migreze din poziia curent

n cea mai bun poziie atins de ea pn atunci, x m p ,0 ;


+1 T este durata de care ar avea nevoie ntreaga populaie ca s migreze n cea m s

mai bun poziie atins pn atunci, x m P ,0 , dac ea ar fi concentrat n poziia curent a particulei curente. Vor fi explicitai pe rnd parametrii enumerai mai sus.
16

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

Factorul de mobilitate al unei particule depinde, de fapt, n mod opus de ineria acesteia. Ineria de valori mari trebuie s induc valori mici ale factorului de mobilitate i reciproc. Ineria particulei trebuie sa fie mare cnd ea se gsete n apropierea punctului de optim i mic atunci cnd distana pn la acesta este mare. De asemenea, factorul de mobilitate trebuie s aib modul cel mult unitar, deoarece, n realitate, relaia de reactualizare (2.51) este o ecuaie cu diferene de ordin I. Soluia acesteia este stabil numai dac factorul de mobilitate se gsete n intervalul [0,1] (valoarea unitar a acestuia producnd soluii la limita de stabilitate). Pentru a specifica relaia de reactualizare a factorului de mobilitate, trebuie mai nti evaluat ineria particulei curente p 1, P :

=
m p

def

m m PQ x p PQ x p ,1 m m PQ x p ,0 PQ x p ,1

(2.52)

unde x m p ,1 S este poziia cea mai slab a particulei n cursul evoluiei pn n momentul curent (adic acea poziie de pe traiectoria particulei care produce valoarea cea mai mic a criteriului PQ). Este evident c ineria astfel definit nu poate lua dect valori n intervalul [0,1] . Ea este nul atunci cnd poziia curent a particulei produce cea mai mic valoare a criteriului PQ i unitar cnd ea produce cea mai mare valoare a acestuia. Cu alte cuvinte, ineria particulei se mrete odat cu apropierea de optimul criteriului PQ. Menionm c definiia (3.16) ofer posibilitatea ajustrii adaptive a mobilitii particulei, spre deosebire de articolul original n care a fost introdus tehnica PSO, unde mobilitatea ia valori constante. De altfel, n abordarea noastr, s-a urmrit asigurarea caracterului adaptiv al tuturor parametrilor relaiei de reactualizare (2.51), care se preteaz la aceast manier de variaie. Odat ineria evaluat, factorul de mobilitate se reactualizeaz dup urmtoarea regul simpl: PQ PQ xm xm p ,0 p m m . p = 1 p = (2.53) m m PQ PQ x x ,0 ,1 p p Variana cognitiv a unei particule se poate evalua n doi pai. La primul, se estimeaz variana absolut a poziiilor particulei, n raport cu poziia cea mai bun atins pn la momentul curent:

m p ,c =

def

1 m i x p xm p ,0 m + 1 i =0

(2.54)

(n definiia (2.54), a fost utilizat norma Euclidian.) Al doilea pas const n normalizarea varianei absolute n intervalul [0,2]:

m p ,c = 2

def

m m p ,c p ,c ,min m m p ,c ,max p ,c ,min

(2.55)

m unde m p ,c ,min i p ,c ,max sunt valorile minim, respectiv maxim ale varianei cognitive

absolute de la momentul iniial de evoluie, pn la cel curent, considernd inclusiv m p ,c . Dac se adopt definiia (2.55), aceasta prezint un mare dezavantaj practic: ea necesit importante resurse de memorie pentru a putea fi implementat pe un mijloc automat de calcul. Mai precis, aceast implementare solicit memorarea tuturor generaiilor de la iniializare pn la momentul curent. Din acest motiv, se propune definiia alternativ de mai jos, care permite implementarea cu ajutorul unei relaii recursive:
17

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare


def m m m p ,c = p x p ,0 2

1 m i 2 = xp m + 1 i =0
2

xm p ,0

1 m i xp m + 1 i =0

=
(2.56)

1 xm p ,0 m + 1 i =0

xip

),

unde m p este semnul diferenei din paranteza care i urmeaz. De aceast dat, variana cognitiv este exprimat ca o medie a distanelor dintre norma poziiei celei mai bune obinute de particul n cursul evoluiei sale pn n prezent ( x m p ,0 ) i normele tuturor poziiilor de pe traseu (tot pn n prezent). Evidenierea semnului este util n calculele care urmeaz, unde este vizat o relaie recursiv de determinare a varianei. Mai nti, se poate observa c:

x
i =0

m 1

i 2 p

1 2 1 1 2 = m xm m m ( p p p c ) . ,0 ,

(2.57)

n consecin, din (2.56) i (2.57) rezult:


2 m m ( m p ,c ) = p x p ,0

m = m p x p ,0 m m1 m1 2 = m p ( p ,c ) + x m p p ,0 m +1

1 m i 2 m m 2 1 m1 i = x x p xp p p ,0 m + 1 i =0 m +1 i =0 2 2 1 1 2 1 1 2 m m + xm = m xm ( ) ,0 , p p p c p m +1
2

2 + xm p =

(2.58)

2 m 1 1 2 xm xm , p ,0 p m +1 m +1

unde m p nu poate fi altceva dect semnul expresiei din paranteza dreapt care i urmeaz. Evident, expresia (2.58) este acum implementabil cu o ocupare rezonabil a memoriei (se rein doar caracteristicile generaiei precedente). n manier similar, se determin variana social a populaiei. Mai nti se calculeaz valoarea absolut a acestei variane, innd cont de poziiile curente ale tuturor particulelor populaiei, fa de poziia cea mai bun atins de o particul a populaiei, pn la momentul curent:

m s =

def

1 P m x p xm P ,0 P p =1

(2.59)

Urmeaz normalizarea acesteia n intervalul [0,2]:

m s = 2

def

m m s s ,min , m m s ,max s ,min

(2.60)

m unde m s ,min i s ,max sunt valorile minim, respectiv maxim ale varianei sociale absolute

de la momentul iniial de evoluie, pn la cel curent, considernd inclusiv m s . Duratele de migrare ale particulei, respectiv populaiei nu pot fi cunoscute, de aceea ele vor fi alese de o manier pseudo-aleatoare. Tot ce se poate cunoate este faptul c ele nu pot fi inferioare duratei de schimb a unei generaii cu alta ( T ), deoarece migrarea n poziiile cele mai bune (ale particulei sau populaiei) nu se poate produce dect cel mai devreme dup schimbarea unei generaii cu alta. Dac la momentul curent se ating chiar poziiile cele mai bune, atunci termenii corectori corespunztori sunt nuli i duratele de m+1 +1 migrare i pierd nsemntatea. Aadar, m trebuie generate pseudo-aleator n p ,c i s
18

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

intervalul [ T , + ) . Cum gama de variaie este infinit, se vor genera pseudo-aleator inversele acestor durate (numite frecvene de tranziie) n intervalul ( 0,1/ T ] . Algoritmul PSO bazat pe relaiile (2.49)-(2.51) difer destul de mult de cel original propus n [KeEb95] sau de alte variante propuse de-a lungul timpului, n cei aproape 15 ani de la apariie. n algoritmul original sunt utilizate alte notaii pentru parametrii ecuaiei +1 (2.51). Mai mult, acetia nu au semnificaiile pe care le-am atribuit noi mai sus. Astfel, m p (notat prin w ) este considerat un factor de inerie (dar variaia lui contrazice definiia m comun a ineriei, care se opune schimbrii parametrilor micrii), m p ,c i s (notate prin

c1 , respectiv c2 ) sunt dou constante alese n intervalul [0,2] pentru a stabili ponderea
+1 m+1 fiecrei componente aditive (cognitiv i social), iar n loc de m se opereaz cu p ,c i s

inversele r1 , respectiv r2 , care sunt numere pseudo-aleatoare n intervalul [0,1] . Dup cum sugereaz relaiile algoritmului, este clar c, pe lng populaia de particule care evolueaz, trebuie reinute i o serie de rezultate auxiliare: valori maxime/minime ale criteriului PQ i poziii care produc aceste valori. Este aadar util s se menin n memorie i s se reactualizeze nu doar populaia curent, ci i alte dou populaii:

o elit Em = {x m p ,0 }
def

p1, P

S , format din poziiile particulelor care au produs cele mai

bune valori ale criteriului PQ; evident, cea mai bun poziie atins de populaia de particule se va regsi n Em ; cu alte cuvinte, x m P ,0 E m ; n subsidiar, vor fi memorate i reactualizate inclusiv aceste valori (sub-)optimale;

o anti-elit A m = {x m p ,1 }
def

p1, P

S , format din poziiile particulelor care au produs cele

mai slabe valori ale criteriului PQ; n subsidiar, vor fi memorate i reactualizate inclusiv aceste valori anti-optimale. Elita joac un rol important n oprirea mecanismului de cutare al algoritmului. Exist mai multe teste de stop care pot fi imaginate. Tradiional, se impune atingerea unui numr maxim de generaii M N , fr a ine cont de alte considerente. (n mod uzual M 10,100 .) Exist ns i teste de stop mai puin rudimentare. De exemplu, se poate evalua dispersia elitei n jurul poziiei optimale x m P ,0 E m , aa cum sugereaz Figura 3.1. Dac ea devine suficient de mic sau dac descreterea ei relativ devine nesemnificativ (scade sub un prag impus), atunci poziia optimal a elitei este cea cutat. Un alt exemplu face referire la conceptul de supravieuire a unei particule n cadrul elitei. Dac particula care produce poziia optimal din cadrul elitei reuete s supravieuiasc unui anumit numr de generaii (adic nu este nlocuit cu alt particul mai bun), atunci algoritmul se poate opri la acea particul. Probabil c nici unul dintre testele de stop nu este perfect, avnd n vedere c nu s-a demonstrat riguros convergena algoritmului ctre punctul de optim global. (Ca i n cazul Algoritmilor Genetici, sunt formulate doar conjecturi de convergen, care par a funciona n majoritatea aplicaiilor.) Din acest motiv, se poate opta pentru un test de stop combinat, de exemplu, de forma: Algoritmul PSO se oprete dac: n evoluia populaiei s-au nregistrat M generaii SAU particula optimal din elit a supravieuit peste un anumit numr de generaii (de exemplu 5-10) SAU dispersia relativ a elitei are o descretere sub un prag dat (de exemplu de 3-5%) SAU un procent mare din populaia curent face parte i din elit (de exemplu, peste 85%), dup schimbarea unui numr suficient de mare de generaii, etc. (se mai pot aduga i alte condiii de tip SAU).
19

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

Performanele algoritmului PSO depind n mare msur de compromisul dintre diversitatea populaiei i viteza de convergen. Aceste dou caracteristici ar putea fi chiar cuantificate, cu ajutorul celor dou populaii Pm (dinamic) i Em (elitist). Astfel, variana populaiei dinamice Pm n jurul valorii optimale a acesteia poate constitui o msur a diversitii. Cu ct variana este mai mare, cu att diversitatea este mai mare i ansa de a depista optimul global este mai mare. n schimb, inversa varianei populaiei elitiste Em ar putea msura viteza de convergen a algoritmului. Cu ct aceasta are valoare mai mare, cu att particulele elitiste sunt mai grupate n jurul celei optimale i ansa de a opri rapid cutarea ntr-un optim local este mai mare. Cele dou variane se pot evalua astfel:
m P = def

1 P m x p xm P ,0 P p =1

m , respectiv E =

def

1 P m m x p,0 x E ,0 P p =1

(2.61)

m unde x m P ,0 este cea mai bun poziie a particulelor dinamice curente, iar x E ,0 este cea mai

bun poziie a particulelor elitiste curente. Ambele poziii sunt egale, deoarece, din relaiile (2.51) i (2.53), rezult c viteza particulei care ocup aceast poziie este nul. innd cont de valorile cuantificate empiric cu ajutorul varianelor (3.23) ale diversitii populaiei i vitezei de convergen, se poate interveni n cazul n care situaia devine dezechilibrat. O diversitate prea mare produce oscilaii ale algoritmului, n timp ce o vitez de convergen prea mare poate bloca algoritmul ntr-un optim local. n aceste m condiii, se poate monitoriza produsul celor dou variane, m P E . Acesta ar trebui s varieze n jurul unei constante, dup cteva generaii de la iniializare. Dac se nregistreaz creteri rapide ale sale, atunci probabil c diversitatea este prea mare i algoritmul tinde s devin oscilant. Dac, din contr, se nregistreaz scderi rapide, probabil c algoritmul tinde s fie capturat ntr-un optim local. Pentru a remedia tendinele excentrice ale algoritmului, se poate apela la mai multe operaii. Una dintre ele este inspirat de Algoritmii Genetici: ncruciarea particulelor. Dac x1 i x 2 sunt dou particule numite generic prini, iar vitezele lor instantanee sunt v1 , respectiv v 2 , atunci ele pot produce doi urmai prin ncruciare. Pentru a realiza ncruciarea, se genereaz n prealabil un numr aleator (0,1) , care stabilete ponderile prinilor. Apoi, urmaii sunt produi astfel:

1 = 2 = x x1 + (1 ) x 2 + 0.5 , respectiv x x 2 + (1 ) x1 + 0.5 .


Acestora le sunt imprimate vitezele instantanee de mai jos:
def def

def

def

(2.62)

1 = v1 + (1 ) v 2 , respectiv v 2 = v 2 + (1 ) v1 . v
ncruciarea se poate aplica astfel:

(2.63)

m a. Dac produsul m P E nregistreaz o cretere semnificativ, atunci diversitatea este

prea mare. n acest caz, populaia dinamic Pm trebuie ncruciat cu populaia elitist Em , pentru a produce 3 noi populaii (dinamic, elitist i anti-elitist). n noile populaii dinamic i elitist, se va conserva totui particula optimal curent. n noua populaie elitist, se vor nlocui celelalte particule cu urmaii cei mai buni. n noua populaie anti-elitist, se vor reactualiza doar urmaii cei mai slabi.
m b. Dac produsul m P E nregistreaz o scdere semnificativ, atunci riscul de blocare

ntr-un optim local este ridicat. n acest caz, populaia dinamic Pm trebuie ncruciat cu populaia anti-elitist A m , pentru a crete diversitatea. Sunt produse
20

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

tot 3 noi populaii ca i n cazul precedent (dup aceleai reguli). Tot pentru a crete diversitatea populaiei dinamice, se poate apela i la un transfer direct al unora dintre particulele anti-elitiste ctre aceasta, cu nlturarea unora dintre particulele mai bune. Transferul poate fi efectuat i prin generarea pseudo-aleatoare a unor poziii, vitezele aferente fiind conservate. Aadar, algoritmul funcioneaz pe baza a 3 populaii: dinamic, elitist i anti-elitist. Din punct de vedere informatic, ntr-o populaie trebuie memorate: poziiile particulelor, vitezele instantanee aferente i valorile corespunztoare ale criteriului PQ, cu indicarea optimului curent (pentru populaiile dinamic i elitist). n plus, se mai pot memora varianele populaiilor i varianele extreme din definiiile (2.55) i (2.60). Iniializarea algoritmului (care ncheie descrierea lui) const n urmtoarele: generarea unei populaii dinamice de generaie nul ( P0 ), care va fi deopotriv populaie elitist i anti-elitist la momentul iniial; stabilirea vitezelor iniiale nule pentru toate particulele. Revenind la predictorul PARMAX, Spaiul de cutare al fiecrui canal j 1, ny , notat cu S ARMAX , este un hiper-paralelipiped din laticea multi-dimensional N 2 ny +1 , deoarece indicii structurali sunt n numr de 2ny + 1 . Primii ny + 1 indici pot fi considerai principali: unul este na j , altul este nc j i restul de ny 1 indici sunt ai ansamblului {nb j , i }
i1,ny , i j

indici provin de la modelul MISO-ARX aproximant: n j i {n j , i }


def

i1,ny , i j

. Ultimii ny

n acest spaiu, se definete urmtorul vector generic de poziie a unei particule:

xj = na j

nb j ,1 nb j , j 1 n j ,1 n j , j 1

nb j , j +1 nb j ,ny

nc j
T

n j

n j , j +1 n j ,ny S ARMAX .

(2.64)

Reamintim c vectorul trebuie s aib numai componente cu valori ntregi, nu fracionare. De aceea, eventualele valori fracionare rezultate din calcul trebuie aproximate la cel mai apropiat ntreg. Populaia curent, elita i anti-elita, fiecare de dimensiune P , sunt reprezentate n acest caz ca blocuri tridimensionale cu 2ny + 1 linii, P coloane i ny straturi, ca n Figura 2.2.

ny

Model ARMAX

Model ARX aproximant

Figura 2.2. Reprezentarea tridimensional a populaiilor de particule n cadrul Algoritmului PARMAX.


21

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

Fiecare tietur vertical de-a lungul grosimii blocului tridimensional reprezint o combinaie de indici structurali care permit identificarea modelului de predicie de tip MIMO-ARMAX. Strategia PSO poate fi (i a fost) integrat i n cazul modelelor MIMO-ARMA, fapt care a condus la versiunea a doua a Algoritmului PARMA. Fa de prima versiune, descris n [SPD08], acum predictorul poate furniza valori de predicie multi-canal, chiar dac ele sunt independente una fa de alta. Populaia de particule este foarte asemntoare celei din Figura 2.2. Ea este ilustrat n Figura 2.3.

ny

Tendin Model ARMA Model AR aproximant

P
Figura 2.3. Reprezentarea tridimensional a populaiilor de particule n cadrul Algoritmului PARMA multi-dimensional. Singura deosebire o constituie faptul c indicele structural al tendinei poate lipsi, dac utilizatorul a optat astfel. Cu alte cuvinte, modelul ARMA poate fi identificat direct din datele msurate, fr a construi componenta determinist a acestuia (constituit din tendin i, eventual, dac exist, variaia sezonier). Au fost date explicaii detaliate n legtur cu acest subiect n [SPD08], astfel c ele nu vor fi reluate i n acest context. 2.5. Algoritmul PARMAX Exist 3 variante de implementare ale Algoritmului PARMAX. Vom detalia n continuare numai varianta cea mai eficient, Algoritmul 2.1. Aceasta se bazeaz pe idea fundamental c, dei sistemul de senzori ar trebui considerat ca un tot unitar, complexitatea algoritmilor de identificare a modelului MIMIO-ARMA asociat este inacceptabil de mare. n consecin, va fi construit cte un model MISO-ARMAX pentru fiecare canal, n paralel. Modelele sunt aparent independente, ns, n realitate, exist corelaii subtile ntre ele. Complexitatea acestui algoritm este superioar celei a algoritmului precedent de predicie, PARMA. La Cu toate acestea, paii strategiei PSO sunt similari, dei ei au fost detaliai doar n acest context. Este ns evident c durata de rulare crete. Pentru a o scdea, ar trebui iniiate n paralel tot attea rulri cte canale de msur exist, cu focalizarea prediciei pe cte un canal separat. Aceasta ar fi posibil numai n condiiile n care programele ar fi gzduite de o main paralel de calcul. Simulrile au artat ns c versiunea de predicie global nu este neaprat superioar versiunilor cu predicie direcionat pe un anumit canal. Implementarea de facto a Algoritmului 2.1 incumb utilizarea multor artificii informatice. Ne vom referi numai la cteva dintre ele, cele mai importante.
22

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

Algoritmul 2.1. PARMAX un algoritm de predicie a proceselor stocastice, cu ajutorul modelelor MISO-ARMAX, folosind tehnica PSO. Date de intrare: un conglomerat de serii de timp distribuite { y j }

j1,ny

, de durat finit, N y ;

lungimea orizontului de predicie K (unde K << N y ); de regul, K 7 ; parametri de configurare: valorile maxime ale indicilor structurali din modelele grosiere ARMA NA0 , NC0 N (implicit: NA0 = NC0 = 30 , dar NA0 = 100 dac nc = 0 , iar

NC0 = 100 dac na = 0 );


valorile maxime ale indicilor structurali din modelele MIMO-ARMAX NA, NB, NC N (implicit: NA = NB = NC = 30 , dar NA = 100 dac nb j = nc = 0 , j 1, ny ,
NB = 100

dac

na = nc = 0

NC = 100

dac

nb j = na = 0 ,

j 1, ny );
numrul P de particule din populaia algoritmului PSO (implicit: P = 100 ); numrul maxim de generaii ale populaiei, M (implicit: M = 100 ); numrul minim de supravieuire pentru stoparea algoritmului PSO, S (implicit: S = max {5, 0.05 M } ); nivelul de alarmare pentru aplicarea ncrucirii ntre particule, (0,1] (implicit, = 0.15 ); durata tranziiei ntre generaii, T > 0 (implicit, T = 1 ). 1. Prelucrri primare: se evalueaz mediile yj i deviaiile standard y j

{ }

j1,ny

{ }

j1,ny

ale datelor

distribuite; se staionarizeaz datele: y j y j y j . 2. Se estimeaz modelul ARMA grosier ale fiecrui canal de msur, folosind criteriul PQ pentru alegerea indicilor structurali optimali. Se obin astfel modelele: ( q 1 ) y C ( q 1 ) e , j 1, ny A j j j j

j} i valorile zgomotelor albe, {e

j1,ny

, estimate grosier (cu modelele AR aproximante).

3. Se rafineaz estimrile zgomotelor albe, cu ajutorul modelelor ARMA identificate. j} Notnd cu {v noile estimaii, acestea se determin ca n (2.27).
j1,ny

4. Algoritmul PSO pentru determinarea indicilor structurali optimali ai modelelor MISOARMAX care constituie modelul MIMO-ARMAX. Paii care urmeaz se parcurg (secvenial sau n paralel) pentru fiecare canal de msur j 1, ny . 4.1. Se stabilete forma generic a particulei de canal, ca n definiia (2.64). Particula generic global este o matrice cu ny coloane. 4.2. Se stabilete m = 0 (indicele dinamic) i se formeaz generaia iniial a populaiei dinamice, P0 = {x 0p } . Populaia are P particule matriciale ca n
p1, P

Figura 3.3, (aproximativ) uniform distribuite n spaiul de cutare S ARMAX .


23

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

Algoritmul 2.1. PARMAX un algoritm de predicie a proceselor stocastice... (continuare). Populaia dinamic va iniializa deopotriv populaia elitist E0 i pe cea antielitist A 0 . Particulele primesc vitezele iniiale nule: v 0p = 0 , p 1, P . 4.3. Se evalueaz i se memoreaz PQ pentru toate particulele (prin identificarea i predicia cu modelul MISO-ARMAX). Desigur, la acest pas, pentru fiecare 0 0 particul, poziiile extreme curente coincid cu poziia sa iniial: x 0 p ,0 = x p ,1 = x p . 4.4. Generaia urmtoare a populaiei dinamice se genereaz amestecnd pseudoaleator coordonatele de poziie ale fiecrei particule din populaia curent. Se obine astfel populaia P1 = {x1p } , cu viteze tot nule ( v1p = 0 , p 1, P ),
p1, P

pentru care se evalueaz valorile PQ. Fiecare particul a parcurs astfel o traiectorie format din dou poziii distincte. n consecin, se pot reactualiza elita E1 i anti-elita A1 , care vor fi acum diferite. Particula sub-optimal
1 curent (care a produs valoarea maxim a PQ) este x1 P ,0 = x E ,0 . Indicele ei

iniial de supravieuire n populaia elitist este stabilit la valoarea nul ( s = 0 ). 4.5. Pentru fiecare particul, se evalueaz variana cognitiv absolut maxim 1p ,c ,max , folosind cele dou generaii P0 i P1 i definiia (2.56). (Evident,

1p ,c ,min = 0 , p 1, P ; ele vor rmne nule pe tot parcursul algoritmului.)


4.6. Tot cu ajutorul generaiilor P0 i P1 , se evalueaz i varianele sociale absolute
1 minim i maxim ( 1 s ,min , s ,max ), pe baza definiiei (2.59). (De aceast dat,

1 s ,min > 0 , indiferent n ce generaie a fost ea atins.)


4.7. Se incrementeaz indicele dinamic: m = 1 .
m 4.8. Ct timp m M sau indicele s de supravieuire a particulei sub-optimale x E ,0

este cel mult egal cu S : 4.8.1. Se evalueaz varianele populaiilor Pm i Em , cu ajutorul definiiilor (2.61) i se calculeaz media produsului lor de la iniializare pn la 1 m 1 momentul anterior, notat prin m . Pentru m 2 , aceast medie P E se poate doar reactualiza:
2 m2 1 m 1 ( m 1) m + m P E P E

m 1 P

m 1 E

0 0 0 avnd n vedere c 0 P E = P E . m m 4.8.2. Dac m M / 3 , se testeaz abaterea produsului P E fa de media m 1 m 1 P E :

m m1 m 1 , atunci diversitatea este prea mare i a. Dac m P E > (1 + ) P E

populaia dinamic Pm trebuie ncruciat cu populaia elit Em (conform definiiilor (2.62) i (2.63)). m m 1 m 1 b. Dac m , atunci riscul de blocare ntr-un optim P E < (1 ) P E local este prea mare i populaia dinamic Pm trebuie ncruciat cu populaia anti-elit A m (tot conform definiiilor (2.62) i (2.63)).
24

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

Algoritmul 2.1. PARMAX un algoritm de predicie a proceselor stocastice... (continuare). c. Rezultatul oricreia dintre ncrucirile de la paii anteriori l constituie o populaie cu 2 P particule. Din aceasta, vor fi alese primele P 1 n ordinea descresctoare a criteriului PQ. Ele vor nlocui particulele mai slabe dect cea sub-optimal din populaia dinamic Pm . (Cu alte cuvinte, x m P ,0 este conservat n Pm , chiar dac i el particip la ncruciri.) Ca urmare, vor fi reactualizate i populaiile elit Em i anti-elit A m . 4.8.3. Pentru p 1, P (secvenial sau n paralel), se trece la generaia Pm+1 : a. Se evalueaz factorul de mobilitate m p prin relaia (2.53). b. Se evalueaz variana cognitiv prin relaiile (2.58) i (2.55) i se
m +1 +1 genereaz numrul 1/ m p ,c = p ,c ( 0,1/ T ] (numit ad hoc frecven def

cognitiv de tranziie) n manier pseudo-aleatoare. c. Se evalueaz variana social prin relaiile (2.59) i (2.60) i se
+1 +1 genereaz numrul 1/ m = m ( 0,1/ T ] (numit ad hoc frecven s s def

social de tranziie) n manier pseudo-aleatoare. +1 d. Se evalueaz viteza instantanee v m a particulei n poziia p urmtoare, cu ajutorul relaiei (2.51). e. Se corecteaz poziia particulei cu ajutorul relaiilor (2.50) i (2.49). f. Se limiteaz coordonatele poziiei la limitele spaiului de lucru, dac este cazul. 4.8.4. Se reactualizeaz populaia elit Em Em+1 , reinnd cele mai bune poziii atinse de particule n traiectoriile lor de la iniializare pn n m +1 m +1 prezent. Se detecteaz noua particul sub-optimal x E ,0 = x P ,0 . Dac
m +1 m xE ,0 = x E ,0 , atunci se incrementeaz indicele de supravieuire: s s + 1 .

Altfel

(adic

dac

m +1 m xE ,0 x E ,0 ),

se

reiniializeaz

indicele

de

supravieuire: s = 0 . 4.8.5. Se reactualizeaz populaia anti-elit A m A m+1 , reinnd cele mai slabe poziii atinse de particule n traiectoriile lor de la iniializare pn n prezent. 4.8.6. Se incrementeaz indicele dinamic: m m + 1 . 4.9. Particula (sub-)optimal a populaiei elit ofer indicii structurali ai modelului MISO-ARMAX. 5. Pentru indicii structurali optimali determinai la pasul anterior, se identific cele ny modele MISO-ARMAX, care alctuiesc mpreun modelul de predicie MIMOARMAX. La acest pas, intervin toate datele msurate, pe toate canalele. 6. Se evalueaz coeficienii ctului trunchiat (2.45), pentru fiecare canal de msur. 7. Predicie multi-pas, multi-canal. Pentru k 1, N y + K : Pentru j 1, ny (secvenial sau n paralel): 7.1. Pe orizontul de msur, adic pentru k 1, N y , se implementeaz relaiile recursive (2.40).
25

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

Algoritmul 2.1. PARMAX un algoritm de predicie a proceselor stocastice... (final). 7.2. Se evalueaz dispersia erorii de predicie pe orizontul de msur, cu ajutorul definiiei (2.46). 7.3. Pe orizontul de predicie, pentru k N y + 1, N y + K : 7.3.1. Se efectueaz o predicie pe termen scurt, adic pentru

k N y + 1, N y + min {K , na j } , prin implementarea relaiei recursive

(2.41). 7.3.2. Se efectueaz o predicie pe termen lung (dac este cazul, adic dac na < K ), pentru k N y + na j + 1, N y + K , prin implementarea relaiei recursive (2.42). 7.3.3. Se reactualizeaz valorile predictate ale zgomotului de canal, prin implementarea relaiei recursive (2.43). 7.3.4. Se estimeaz dispersiile erorilor de predicie (pe orizontul de predicie) folosind relaia recursiv (2.44). 7.4. Se adaug media de canal y j (evaluat la pasul 1) tuturor valorilor predictate. Date de ieire:
j mulimea valorilor predictate: y N y + k | N y

dispersiile erorii de predicie {2j ,k }

k1, K , j1,ny

k1, K , j1,ny

O prim modificare fa de fluxul logic o constituie faptul c particula generic a populaiei (definit n (2.64)) a fost extins cu particula generic din cazul Algoritmului PARMA. Mai precis, forma actual a particulei de canal este urmtoarea:
ARMA xj = p j na j na j nb j ,1 def

nc ARMA j nb j , j 1

n ARMA j nb j , j +1 n j , j +1 nb j ,ny nc j
T

(2.65)

n j

n j ,1

n j , j 1

e n j ,ny S ARMAX ,

e unde spaiul de cutare extins S ARMAX este un hiper-paralelipiped din laticea multi-

dimensional N{2 ny +4,2 ny +5} . Prima component poate lipsi sau nu, n funcie de opiunea utilizatotului privind determinarea componentei deterministe a modelului MIMO-ARMA (cu ajutorul cruia se estimeaz intrrile modelului MIMO-ARMAX). n consecin, blocul tridimensional al populaiei se extinde pe vertical ca n Figura 2.4. Motivul pentru care s-a extins configuraia particulelor este unul foarte simplu: n aceast manier este iniiat o singur procedur euristic de tip PSO pentru ntregul ansamblu de indici structurali ai tandemului modelelor de identificare ARMA-ARMAX i nu cte o procedur separat pentru fiecare dintre ele. Se obine astfel o important economie de timp de rulare. Iniializarea procedurii PSO este uor mai complicat dect n cazul Algoritmului PARMA-PSO, avnd n vedere numrul mai mare de dimensiuni ale spaiului de cutare. De aceea, s-a adoptat urmtoarea strategie:
26

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

ny

Tendin Model ARMA Model AR aproximant Model ARMAX Model ARX aproximant

P
Figura 2.4. Reprezentarea tridimensional a populaiilor extinse de particule n cadrul Algoritmului PARMAX. se genereaz toate numerele reprezentate n baza P , care au (2ny + 4 + d ) cifre, unde d {0,1} codific opiunea utilizatorului privind evaluarea componentei deterministe; se aleg doar P dintre acestea, aproximativ echidistante, exceptnd extremele (eventual, dac P este prea mic n raport cu numrul de cifre, el se mrete corespunztor); fiecare dintre numerele selectate are aadar (2ny + 4 + d ) cifre cte una pentru fiecare dintre indicii structurali ai particulei generice de canal (definiia (2.65)); o astfel de cifr variaz ntre 0 i P 1 ; 0 fie N 0 = ni i1,2 ny +4+ d un numr din mulimea celor selectate anterior, n care
ni0 0, P 1

este chiar cifra de pe poziia


0

i 1,2ny + 4 + d ; atunci particula

0 corespunztoare este de forma x = xi i1,2 ny +4 + d , unde:

def n0 xi0 = ximin + i ( ximax ximin ) + 0.5 N , i 1,2ny + 4 + d , P 1

(2.66)

unde ximin , ximax N este plaja de variaie a indicelui structural corespunztor. Modelele de identificare estimate pot fi sau nu stabile (n sensul c polinomul AR primul din definiiile (2.24)) poate avea polii n afara discului unitar. Utilizatorul are posibilitatea de a preciza nc de la nceput dac se va opera numai cu modele stabile sau dac stabilitatea modelelor nu va fi testat. Testul de stabilitate este binecunoscut n comunitatea Teoriei Sistemelor. El are dou variante: Testul Hurwitz (pentru sisteme continue) i Testul Schr-Cohn (pentru sisteme discrete) [IoV85], [SCS05]. n cadrul Algoritmului PARMAX, a fost integrat Testul Schr-Cohn (Algoritmul 2.2). Testarea stabilitii unui model de identificare revine adesea la verificarea proprietii unui polinom:
27

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

A( z 1 ) = 1 + aM ,1 z 1 +

+ aM , M z M

(2.67)

de a avea rdcinile n interiorul discului unitar al planului complex. Procedura care verific aceast proprietate se numete Criteriul (Testul) de stabilitate Schr-Cohn [ScI17], [GoI86], [PrMa96]. Aa cum am precizat, acesta este analogul din cazul sistemelor discrete al Criteriului lui Hurwitz, utilizat n contextul sistemelor continuale. Criteriul Schr-Cohn se bazeaz pe conceptele de polinom reciproc i coeficient de reflexie. Astfel,aa cum am mai menionat, polinomul reciproc al celui din (2.67) este, prin definiie, urmtorul:
A( z 1 ) = z M + aM ,1 z1 M +
def

+ aM , M = z M A( z +1 ) ,
def

(2.68)

iar coeficientul de reflexie corespunztor este k M = aM , M . Algoritmul 2.2 descrie paii Testului de stabilitate Schr-Cohn. Algoritmul 2.2. Testul de stabilitate Schr-Cohn. Date de intrare: Polinomul A( z 1 ) = 1 + aM ,1 z 1 +
+ aM , M z M .

1. Iniializare: m = M , k M = aM , M (primul coeficient de reflexie) i AM ( z 1 ) = A( z 1 ) (primul polinom furnizor de coeficient de reflexie). 2. Ct timp | km |< 1 i m > 0 , se efectueaz urmtoarele operaii: 2.1. Dac m > 1 : a. Se calculeaz polinomul urmtor, care folosete att polinomul curent, ct i A ( z 1 ) km Am ( z 1 ) polinomul reciproc asociat: Am1 ( z 1 ) = m . 2 1 km Evident: Am1 ( z 1 ) = 1 + am1,1 z 1 +
+ am1,m1 z1 m .

b. Se evalueaz coeficientul urmtor de reflexie: km1 = am1,m1 . 2.2. Se decrementeaz indicele curent: m m 1 . Test. Dac m > 0 polinomul este instabil. Altfel, polinomul este stabil.

Practic, polinomul (2.67) este stabil dac toi coeficienii de reflexie ( {km }m1, M ) se situeaz n interiorul discului unitar al planului complex (sau n intervalul [ 1, +1] , n cazul n care polinomul iniial are coeficieni reali). Se poate arta c polinoamele succesive {Am }m1, M au grade proporionale cu indicii care le definesc. Simulrile pe diferite seturi de date au artat c operarea numai cu modele stabile nu conduce ntotdeauna la cele mai bune rezultate de predicie. Aceasta, deoarece componenta ARMA a modelului ARMAX este cu precdere utilizat pentru identificarea sursei de zgomot care corupe datele. Predicia precis a datelor revine, de fapt, la predicia cu suficient acuratee a acestui zgomot. Ori, zgomotele sunt adesea generate de fenomene de instabilitate, care sunt mai bine modelate de modele ARMA instabile sau la limita de stabilitate. De aceea, implicit, dac utilizatorul nu are o opiune n ceea ce privete proprietatea de stabilitate, testul de mai sus este inhibat. (De altfel, el conduce la creterea duratei de rulare, fr a mbunti n mod obligatoriu calitatea prediciei.) Strategia euristic PSO se bazeaz pe trei rutine fundamentale: PSO_ARMAX (aplicarea strategiei PSO), PARMAX_model (identificarea unui model ARMAX) i PSO_fitness_PQ (evaluarea calitii prediciei). Lista programelor i rutinelor utilizate pentru implementarea Algoritmului PARMAX este inclus n manualul de utilizare [ASTI09]. Fiecare dintre ele include un set de comentarii care ofer principalele detalii de implementare, legate, mai
28

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

ales, de structurile de date utilizate. Toate sursele informatice ale acestui pachet sunt complet comentate, pentru uurina nelegerii fluxului logic n care se desfoar calculele. Exist cteva publicaii ale echipei de cercetare care fac referire la predictorul PARMAX. Cea mai important este [StCu09] (indexat ISI), anexat n finalul acestui raport de cercetare.

3. Predicia datelor uni-dimensionale cu ajutorul undinelor


Algoritmii PARMA i PARMAX caracterizeaz prin faptul c apeleaz la modele de identificare a sistemelor, n scopul prediciei. Algoritmii prezentai n aceast seciune i n urmtoarea apeleaz la modele de semnale nestaionare stocastice. Aceasta nseamn c semnalele considerate nu sunt doar afectate de perturbaii nedeterministe, ci au i proprietatea de a poseda spectru variabil n timp. Prelucrarea Semnalelor [PrMa96] este un domeniu de cercetare cel puin tot att de vast ca i Identificarea Sistemelor [SoSt89], cu care are numeroase corelaii. Algoritmul FORWAVER, care va fi descris n continuare, constituie de fapt o aplicaie a unor tehnici din cmpul de cercetare al analizei de semnal de tip timp-frecven-scal [CoL95]. Acesta a cunoscut o puternic dezvoltare n ultimii ani, prin numeroasele aplicaii n care intervine cu succes. O direcie de cercetare aparte a acestui domeniu o constituie cea al undinelor. Cuvntul undin a fost tradus n limba romn n teza de doctorat [StD95], a fost acceptat de ctre Academia Romn i corespunde cuvintelor wavelet din limba englez sau ondelette din limba francez. Crile [StSt07] i [SSP09] (n curs de apariie la Editura Academiei Romne) ofer o imagine destul de detaliat asupra acestui cmp de cercetare interesant. Exist, desigur, numeroase publicaii n alte limbi dect romn, care descriu undinele sub diferite aspecte. n cadrul acestei seciuni, va fi fcut numai o foarte succint prezentare legat de undine, suficient, totui, pentru a nelege fundamentul algoritmului de predicie FORWAVER. 3.1. Paradigma deparazitrii semnalelor Reprezentarea la scar este o operaie cunoscut nc din antichitate, n special n domeniul Cartografiei, unde obiectivul principal este de acela a reda hrile (geografice) cu un anumit grad de detaliere. De exemplu, la o scar de 1:2 500 000, harta Romniei se poate reprezenta pe o coal de hrtie de format A4 (2129.7 cm2), n poziie orizontal, unde 1 cm corespunde unei distane reale de 25 km. La o astfel de scar, localitile mici i mijlocii sau detaliile de relief nu pot fi reprezentate, deoarece rezoluia grafic a hrii este prea mic. Mrind scala de reprezentare 25 de ori (la 1:100 000), harta ocup acum o coal de hrtie de peste 5 m lime i 7.4 m lungime, iar 1 cm corespunde unei distane de 1 km. Avnd n vedere densitatea de localiti i variaia de relief din Romnia, noua hart permite acum reprezentarea oricrei localiti i a majoritii formelor de relief, cursurilor de ap, etc. Mai mult, localitile care nu sunt foarte mici beneficiaz acum de o rezoluie grafic suficient de bun, permind reprezentarea lor la nivel de strzi. Pentru a putea fi utilizat, ns, harta trebuie mpachetat ntr-un atlas cu 625 de pagini avnd formatul A4. La scala 1:1, atlasul Romniei ar cuprinde 62.5 milioane de pagini de format A4. Gradul de detaliere corespunde acum celui din realitatea perceput, dar atlasul este evident inutilizabil, rezoluia grafic fiind mult prea mare. O hart uor de utilizat i precis trebuie s dovedeasc un bun compromis ntre scala de reprezentare i rezoluia grafic. i n alte domenii operaia de scalare este frecvent utilizat. Este vorba de exemplu de Chimie, Medicin sau Nano-inginerie, unde, de aceast dat, scalele sunt de forma 25:1, 100:1, 1000:1, etc. Rezoluia de reprezentare a entitilor din aceste domenii (de regul, imagini) crete odat cu scala de reprezentare, ca i n Cartografie, numai c efectul scalrii este de mrire i nu de micorare.
29

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

Corelaia care exist ntre scala i rezoluia de reprezentare a unui semnal este surprins n cadrul unei teorii dezvoltate de ctre Stphane Mallat (n urma ntlnirii cu Yves Meyer) la mijlocul anilor 80: Teoria multi-rezoluie [MaS89]. Aceasta a condus la o abordare extrem de interesant pentru aplicaiile practice, concretizat ntr-o serie de algoritmi de analiz-sintez bazai pe structura multi-rezoluie a spaiului semnalelor uzuale (stabile i de energie finit H = L 1 L 2 , de tip Hilbert). Colecia acestor algoritmi constituie nucleul Analizei multi-rezoluie. n PS, existena posibilitii de a proiecta diferite semnale pe anumite subspaii din H a condus n mod natural la formularea uneia dintre cele mai interesante probleme: cea a deparazitrii semnalelor de perturbaii nedorite. Semnalele din aplicaiile practice sunt de regul afectate de perturbaii cu caracter determinist i/sau stocastic. Un astfel de semnal transport aadar nu numai o informaie util, ci i una parazit. Problema care se ridic este aceea a separrii componentei utile a semnalului de componenta sa parazit. Dou aspecte ridic mult gradul de dificultate al acestei probleme. n primul rnd, maniera n care perturbaiile se combin cu semnalul util este necunoscut. Pentru comoditate, se consider adesea c aceste semnale i adun contribuiile (eventual, de o manier ponderat), dei multe aplicaii au demonstrat c modelul care respect principiul superpoziiei este inadecvat. n al doilea rnd, nu exist o definiie general a conceptului de perturbaie. Aceasta mpiedic o metod de deparazitare care funcioneaz cu o anumit precizie n cazul unei clase de semnale s funcioneze cu aceeai precizie i n cazul altei clase de semnale. n general, oricare ar fi metoda de deparazitare de semnal, nu poate fi mpiedicat manifestarea urmtorului fenomen: o parte din informaia util este tratat ca parazit i se pierde, n timp ce o parte din informaia parazit este interpretat ca util i continu s distorsioneze semnalul. Nu se poate trasa o linie clar de demarcaie ntre cele dou tipuri de informaie, dar se poate diminua procentajul de informaie util pierdut sau parazit conservat. De regul, aceasta se realizeaz prin creterea complexitii metodei de deparazitare. Unul dintre principiile care st la baza metodelor de deparazitare n cazul modelelor de superpoziie este cel de proiecie a semnalului corupt pe un subspaiu nchis, generat de semnale utile cunoscute i nedistorsionate de prezena perturbaiilor. Figura 3.1 ilustreaz acest principiu.
def

ry f

fr y fr Uy
D [ ,...,u [g ]> U=<u1,u 2 ] n
0

Figura 3.1. Principiul deparazitrii semnalelor cu ajutorul proieciilor ortogonale. n acest exemplu, semnalul original f H este corupt de o perturbaie necunoscut. Cu toate acestea, informaia pe care o transport ar putea fi reprezentat cu ajutorul unui
30

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

sistem de semnale ortonormate {ui }i1,n , n numr finit. Aceste semnale numite ad hoc de baz pot fi cunoscute sau se pot construi dup anumite reete. De exemplu, ele pot constitui o colecie de armonice elementare de diferite frecvene (caz n care problema deparazitrii revine la determinarea unei representri armonice clasice, de tip Fourier). Fiind n numr finit, aceste semnale de baz nu pot genera ntregul spaiu de semnale, ci un subspaiu nchis al acestuia, U = u1 , u2 ,, un . Semnalul util este atunci definit prin proiecia semnalului original pe subspaiul U :
f U f , ui ui .
i =1 n

(3.1)

Diferena dintre semnalele original i util este declarat semnal parazit: f f f U . Acesta este ortogonal pe semnalul util, dovedind astfel neredundana cu acesta, proprietate care justific termenul de deparazitare. Calitatea separrii celor dou semnale depinde sensibil nu numai de maniera n care este ales sistemul de semnale ortonormate {ui }i1,n , prin intermediul cruia va fi codificat mai departe informaia util, ci i de natura semnalului i a perturbaiilor. Din acest motiv, gsirea unor metode generale de deparazitare a semnalelor rmne o problem deschis. Problema concret este ns aceea a stabilirii unei metode clare de construcie a subspaiilor de tipul lui U . n general s-a artat (i acesta este probabil meritul lui Mallat i Meyer) c spaiul H poate gzdui o structur imbricat de subspaii liniare nchise, strict incluse unul n altul, de forma:

V0 V1 V2
cu proprietatea:

Vm Vm+1

H ,

(3.2) (3.3)

Vm+1 = Vm Vm , m N .

Complementul ortogonal din (3.3), notat alternativ prin Wm , este evaluat n raport cu subspaiul urmtor i nu cu ntregul spaiu H . Aceast proprietate permite descompunerea iterativ a spaiului H dup cum urmeaz:

H = V0 W0 W1 W2 Wm

= V0 Wm .
mN

(3.4)

Dac dimensiunea lui H este finit, atunci numrul subspaiilor (3.3) este la rndul lui finit, deoarece V0 nu poate avea dimensiune inferioar unitii. De exemplu, dac H este spaiul Euclidian R 3 , atunci V1 poate fi planul orizontal principal, iar lui V0 nu-i mai rmne dect s se identifice cu o oblic oarecare din V1 trecnd prin origine. Evident, V1 este axa vertical a spaiului, n timp ce V0 este axa perpendicular pe V0 din planul V1 . Maniera n care se poate realiza descompunerea (3.4) nu este unic. Una dintre cele mai interesante (inclusiv pentru predicie) este cea legat logic de conceptele de scal i rezoluie de reprezentare. ntr-o astfel de descompunere, proiecia unui element oarecare f H pe subspaiul Vm , notat prin f m (pentru m N ) se numete aproximare la nivelul de rezoluie m a lui f . Elementul f m este similar unei hri a lui f reprezentate la o scal cresctoare n raport cu nivelul de rezoluie. Pentru a trece la nivelul urmtor de rezoluie, se poate proiecta f direct pe subspaiul Vm+1 , obinndu-se aproximarea f m+1 . innd cont de proprietatea (3.3), diferena dintre cele dou aproximaii succesive f m+1 (de
rezoluie mai mare) i f m (de rezoluie mai mic) este constituit de un element f m Wm

obinut prin proiecia lui f m+1 sau a lui f pe complementul ortogonal Wm . Astfel, se poate scrie c:
31

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare


, mN . f m+1 = Pr Vm +1 ( f ) = Pr Vm ( f ) + Pr Wm ( f ) = f m + f m

(3.5)

Relaia recursiv (3.5) relev mecanismul de cretere a rezoluiei de reprezentare favorizat de ortogonalitate: pentru a sri la nivelul urmtor de rezoluie, aproximaiei curente trebuie s i se adauge noi detalii. De aceea, elementul f m se numete detaliu la nivelul de rezoluie m + 1 al lui f . Nivelul de rezoluie al detaliului nu este m , deoarece complementul ortogonal Wm este un subspaiu al lui Vm+1 , disjunct cu Vm . Adugarea detaliului necesar saltului de rezoluie poate fi privit i ca o cretere a scalei de reprezentare a elementului original, similar cazului hrilor geografice la care s-a fcut referire n deschiderea paragrafului. Prin mrirea nivelului de rezoluie (sau a scalei de reprezentare), elementul original este mai bine aproximat. Aceast proprietate rezult n urma unui raionament destul de simplu, dup cum urmeaz. Pentru un anumit nivel de rezoluie arbitrar fixat m N , elementele f m
(detaliul) sunt evident ortogonale ( f m f m ). Mutual, este indus i (aproximaia) i f m ortogonalitatea elementului de eroare f f m+1 pe subspaiul Vm+1 (deoarece

(f

f m+1 = Pr Vm +1 ( f ) ). n consecin,
f m+1 ) f m , adic

( f f m+1 ) Wm , ceea ( f f m+1 ) ( f m+1 f m ) . Deoarece


2

ce implic, n particular, c:
f f m = ( f f m+1 ) + ( f m+1 f m ) , se
2

poate aplica Teorema Pitagora-Hilbert [SSP09], care conduce la:


f fm = f f m+1 + f m+1 f m
2 2

f f m+1 , m N .

(3.6)

Inegalitatea (3.6) probeaz proprietatea de mbuntire a preciziei de aproximare odat cu mrirea rezoluiei de reprezentare (sau a scalei). Ea nu se bazeaz dect pe ortogonalitate i nu pe definiia explicit a subspaiilor componente ale spaiului Hilbert. Mai mult, ea se verific i n absena interpretrii legate de rezoluia sau scala de reprezentare. Totui, n condiiile n care subspaiile componente sunt construite n corelaie direct cu primul concept (cel de rezoluie), atunci structura realizat de ele n cadrul spaiului Hilbert se numete multi-rezoluie a acestui spaiu. Numele este sugerat de urmtoarea egalitate evident obinut prin iterarea identitii (3.5):
f m = f 0 + f i , m N .
i =0 m 1

(3.7)

Cu alte cuvinte, aproximarea la nivelul de rezoluie curent f m se obine plecnd de la o versiune grosier f0 a elementului original f , prin adugarea tuturor detaliilor de la nivele de rezoluie inferioare. n evaluarea lui f m sunt astfel implicate mai multe rezoluii de reprezentare cu nivele succesive. De regul creterea rezoluiei de reprezentare este nsoit de o cretere a scalei, ca n irul de imagini succesive din Figura 3.2. Fiecare dintre hrile Figurii 3.2 este o aproximare la un anumit nivel de rezoluie a hrii naturale (reprezentate la scala 1:1). Adugarea de noi detalii mbogete fiecare imagine nu numai n ceea ce privete informaia codificat, ci i ca numr de pixeli, fapt care foreaz creterea scalei de reprezentare. Se observ cu uurin c, fa de aproximrea grosier (la scala cea mai mic), unde se distinge practic doar conturul granielor rii, pe msur ce rezoluia i scala de reprezentare cresc, se adaug noi detalii n interiorul acestui contur. n ultima aproximare, care este cea mai rafinat dintre cele prezentate, se pot deja distinge contururile judeelor, localizarea marilor orae, reeaua de ci rutiere, cursurile importante de ap, etc.
32

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

Figura 3.2. Harta Romniei reprezentat la diferite scale i nivele de rezoluie. Pentru construcia unei structuri multi-rezoluie exist mai multe abordri. n acest proiect, ne-am oprit la o construcie ingenioas propus de Stphane Mallat n [MaS89] i Ingrid Daubechies n [DaI88a], [DaI88b] i [DaI90], care a fost ulterior generalizat de Ronald Coifman i Mladen Victor Wickerhauser n [CoWi92]. Reamintim c, n modelarea unei serii de timp [SPD08], au intervenit dou componente cu naturi diferite: una determinist (constituit dintr-o tendin yT i o variaie sezonier

yS ) i alta nedeterminist (constituit dintr-un semnal stocastic v , identificat cu ajutorul V ). Cu alte cuvinte, expresia complet a modelului unei astfel unui model AR sau ARMA, y
de serii de timp este:

yT + yS + y V . y

(3.8)

Unul dintre impedimentele obinerii unei precizii foarte nalte a valorilor predictate cu ajutorul modelului (3.8) l constituie faptul c semnalul determinist yT + yS are o natur staionar. (n plus, el este i afectat de un anumit grad de subiectivism din partea utilizatorului, aa cum s-a artat n [SPD08].) Cu alte cuvinte, spectrul acestui semnal este considerat constant n timp, cu energia concentrat n special n jurul frecvenelor
33

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

caracteristice ale variaiei sezoniere. Aceasta face, de exemplu, ca modelul (3.8) s sesizeze numai o periodicitate de 12 luni (sau un multiplu al acestei valori) n seria de timp a omajului nregistrat ntr-o ar, nu i alte componente sezoniere, ale cror perioade nu fac parte din mulimea multiplilor lui 12. Explicaia acestei limitri rezid n faptul c spectrul componentei deterministe este constant n timp. O abordare opus este cea n care semnalul determinist staionar este nlocuit de unul tot determinist, dar nestaionar (cu spectru variabil n timp). Suma yT + yS , care definete semnalul determinist de identificare, corespunde de fapt semnalului util f U din Figura 3.1, n care semnalele de baz sunt polinoame i armonice de diferite frecvene, dar staionare. Pentru a nlocui aceast component din modelul (3.8), va trebui schimbat setul de semnale de baz cu unul n care elementele sunt nestaionare. De exemplu, cu undine ortogonale. Cu alte cuvinte, modelul de predicie alternativ, nestaionar i stocastic este urmtorul:

yW + y V , y

(3.9)

unde yW va corespunde acum semnalului util f U din Figura 3.1. Desigur, zgomotul colorat v continu s se identifice cu f proiecia ortogonal a semnalului original pe subspaiul parazit (ca n cazul modelului (3.8)). 3.2. Scurt privire asupra undinelor ortogonale i structurii multi-rezoluie Subspaiul U din abordarea nestaionar este generat prin utilizarea pachetelor de undine [CoWi92]. Astfel, subspaiul posed o structur multi-rezoluie. n domeniul undinelor, este bine cunoscut faptul c o structur multi-rezoluie [MaS89] poate fi generat cu ajutorul unei perechi de semnale ortogonale cu suport compact: o (aa numit) undin tat i o (aa numit) undin mam [DaI88]. De regul, ele constituie soluiile urmtoarelor dou ecuaii (duale) de dilatare laticeale (abreviate prin EDL, respectiv EDL):

(t ) = 2 hn (2t n ) , t 0,2 N 1 ,
n =0

2 N 1

(3.10) (3.11)

(t ) = 2

n =2 2 N

( 1)n h1n (2t n ) , t 1 N , N .

Definiiile (3.10) i (3.11) se bazeaz pe existena unei secvene de lungime finit {hn }n0,2 N 1 , cu urmtoarele proprieti: Normalizare:
2 N 1 n =0

= 2,

2 N 1 n =0

(1)

hn = 0 ;

(3.12)

Condiii Nyquist[2] (de ortogonalitate) :


2 N 1 n =0

hh

n n 2 k

= 0 [ k ] , k Z ,

(3.13)

unde 0 este impulsul unitar discret. De fapt, ortogonalitatea undinelor este o consecin direct a condiiilor Nyquist[2]. Mai mult, ortogonalitatea este echivalent urmtoarei proprieti: spectrele lui i sunt aproape disjuncte, fiind esenial localizate n sub-benzi de joas i respectiv nalt frecven, n concordan cu rezultatele lui Battle i Lemari [BaG87], [LePG88].
34

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

Determinarea cu o precizie finit a undinelor de baz i , ca soluii ale ecuaiilor (3.10) i (3.11), avnd coeficienii stabilii a priori, poate fi realizat prin intermediul unei proceduri iterative iniiat de Daubechies (i Lagarias) n [DaLa88a] i [DaLa88b]. Procedura urmrete exemplul cunoscut de generare a formelor fractale ale lui deRham, plecnd de la variaii mici, cu ajutorul unei ecuaii de tip EDL. De aceea, aceast procedur este cunoscut sub numele de Algoritm Daubechies-deRham. Algoritmul este descris n detaliu n [StSt07] i [SSP09]. Coeficienii {hn }n0,2 N 1 ai ecuaiei EDL sunt valori ale rspunsului la impuls ale unui filtru trece-jos, n timp ce

{g

= ( 1)n h1n }

n22 N ,1

sunt valorile rspunsului la impuls ale

unui filtru trece-sus. Cele dou filtre sunt oglindite n cuadratur (quadratic mirrored filters QMF) [PrMa96], [VaPP93]. Daubechies a introdus n [DaI88] un algoritm de construire a coeficienilor ecuaiei EDL, pentru diferite valori ale parametrilor suport N N , care permit undinelor i s genereze baze ortonormale de undine cu suport compact. Algoritmul Daubechies poate fi gsit n [StSt07] i [SSP09]. Ambii algoritmi Daubechies-deRham i Daubechies joac roluri importante n construirea modelului de predicie. Asupra unui semnal f (i, prin urmare, a unei undine), se pot aplica dou tipuri de operaii, pentru a i schimba rezoluia n timp: scalare i deplasare/decalare temporal (sau translatare). Ele sunt definite mai jos (respectiv), pentru orice t R :

( f ) (t ) = 2 f ( 2 t ) , m Z ; ( q f ) (t ) = f ( t n ) , n Z .
m m m
n

(3.14) (3.15)

Prin scalarea (3.14), orice semnal poate fi dilatat (pentru m > 0 ) sau contractat (pentru m < 0 ). Un semnal dilatat este considerat o versiune aproximat grosier a semnalului original, n termenii rezoluiei n timp. Mai mult, conform Principiului de Incertitudine GaborHeisenberg [StSt07], spectrul unui semnal dilatat/contractat este o versiune contractat/dilatat a spectrului original. Astfel, n principiu, prin micorarea rezoluiei n timp, crete rezoluia n frecven (i invers). Prin translatarea (3.15), variaia semnalului original este ntrziat (pentru n > 0 ) sau anticipat (pentru n < 0 ). Un semnal f poate aadar genera o familie de undine scalate i translatate

{f

m ,n

= q n m f }

m ,nZ

, unde:

(q

m f ) (t ) = 2 m f ( 2 m (t n ) ) , t R .

(3.16)

Structura multi-rezoluie a lui Mallat pentru semnale stabile de energie finit este bazat pe familii de tip (3.16). Ea const ntr-o colecie { Wm }mZ de subspaii ortogonale generate de toate translaiile temporale aplicate versiunilor scalate ale undinei mam. Cu alte cuvinte, orice

Wm

este generat de familia m,n = q genereaz subspaiul

m }

nZ

, care, n plus, este o baz

ortogonal de undine. Undina tat joac un rol similar. Astfel, baza ortogonal

m ,n

= q n m }

nZ

Vm

i: (3.17)
m

Vm+1 Wm+1 & Vm = Vm+1 Wm+1 , m Z .


Prin convenie,

Vm

este subspaiul tuturor semnalelor cu rezoluie temporal 2

, iar

Wm

este subspaiul care include semnale de detaliu, cu aceeai rezoluie n timp ca


35

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

Vm1 , adic 21m (dubl). De aceea, conform proprietilor (3.17), orice m semnal f m Vm (cu rezoluia 2 ) poate fi exprimat printr-o sum de dou semnale m1 ortogonale: versiunea dilatat f m+1 Vm+1 (cu rezolutie 2 ) i versiunea detaliat f m+1 Wm+1 (cu rezoluie 2 m ).
semnalele lui n aplicaii, numai un numr finit de subspaii sunt utilizate. De regul, analiza i sinteza se bazeaz pe urmtoarea structur multi-rezoluie:

V0 = W1 W 2 WM VM ,

(3.18)

unde M 1 este cel mai mic nivel scalar care poate fi considerat. Proprietatea (3.18) conduce la urmtoarea reprezentare asociat unui semnal f :

f 0 c0,n 0,n cM ,n M ,n + d m,n m,n ,


nZ nZ m=1 nZ

(3.19)

unde f 0 este proiecia lui f pe astfel:

V0

iar coeficienii undin sunt calculai n mod natural & d m ,n = f , m ,n . (3.20)

c0,n = f , 0,n

& c M ,n = f , M ,n

O implementare eficient a ecuaiilor (3.19) (de analiz) i (3.20) (de sintez) a fost propus de ctre Mallat in [MaS89], cu ajutorul a trei operaii cu timp discret: filtrare (sau convoluie, ), decimare ( 2 ) i interpolare ( 2 ). Prin decimare, se elimin fiecare eantion par din date, iar prin interpolare este inserat o valoare nul ntre oricare dou eantioane consecutive. Dac, n general, secvena de coeficieni ai EDL se noteaz prin g , pot fi definii operatorii liniari de mai jos:

h ) 2 ( H x ) [ n] = g H x (x g
2 ( I x ) [ n] = I x xh
kZ kZ

k 2 n

x[ k ] , n Z ; x[ k ] , n Z .

(3.21) (3.22)

k 2 n

corespunde versiunii n aceste ecuaii, x este o secven arbitrar cu timp discret i x [ n] = x[ n] , n Z ). Definiiile (3.21) si (3.22), mpreun cu EDL (3.10) i oglindite ( x
EDL (3.11), conduc la urmtoarele ecuaii recursive, verificate de coeficienii undin:

cm+1 I cm & d m+1 H cm , m 0, M 1 .

(3.23)

De fapt, ecuaiile (3.23) sunt utilizate n analiza semnalului. Pe de alt parte, sinteza semnalului este exprimat, de asemenea, recursiv:

cm I cm+1 + H d m+1 , m M 1,0 .


unde I i H sunt operatorii adjunci exprimai mai jos:

(3.24)

( ) h ( ) H x ( x 2 ) g ( H x ) [ n] = g
I x x 2 h I x [ n] =

kZ

n 2 k

x[ k ] , n Z ;
x[ k ] , n Z .

(3.25) (3.26)

kZ

n 2 k

Ecuaiile de analiz i sintez (3.23) i (3.24) constituie nucleul Algoritmului lui Mallat (AM). Operatorii liniari i adjuncii lor verific unele proprieti remarcabile (echivalente cu normalizarea (3.12) i condiiile Nyquist[2] (3.13)):
36

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

II HH J & IH HI P ,
unde J este operatorul de identitate i P este operatorul nul.

(3.27)

Mai mult, ecuaia de sintez (3.24) este verificat graie urmtoarei proprieti de reconstrucie perfect:

I I + HH J ,
ca n Figura 3.3.

(3.28)

H!

H+
2

~ g
x Analiz

xG

Sintez
2

h
I!

xH

h
I+

Figura 3.3. Proprietatea de reconstrucie perfect a undinelor ortogonale. Aceast figur ilustreaz o caracteristic suplimentar interesant: AM poate fi implementat utiliznd bancuri de filtre oglindite n cuadratur (adic de tip QMF) [VaPP93]. Analiza bancurilor de tip QMF este unic asociat unui arbore binar, unde nodurile interioare au cte 2 urmai, corespunztori operatorilor I i H . Este binecunoscut faptul c bancurile de tip QMF realizeaz o segmentare unic n sub-benzi de frecven. De exemplu, n Figura 3.3, xH este un semnal de frecven joas, iar xG este un semnal de frecven nalt. Astfel, ramura de analiz a Algoritmului lui Mallat corespunde unei configuraii n frecven unde doar sub-benzile de joas frecven sunt divizate n 2 pri, ca n Figura 3.4.
Spectru

iM+1 2 0 (0,0) (1,1) 1 (1,0) 4 (2,1) 3 frecven nalt im+1+1 iM

...

.i (m+1,1) (2,0) .. m im+1 (m,0) iM-1 (m+1,0) ... frecven joas (M-1,0)

0 2-M.../4 iM+1 (M,1) iM (M,0)

/2

Figura 3.4. Corespondena timp-frecven n Algoritmul lui Mallat.


37

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

Rafinarea n sub-benzi de frecven nseamn creterea rezoluiei n frecven, dar pe seama descreterii rezoluiei n timp. Dac i sub-benzile de frecven medie sau nalt trebuie rafinate, structura multi-rezoluie trebuie generalizat. Din fericire, n [CoWi92] a fost demonstrat c oricare din subspaiile Wm poate fi divizat n dou subspaii ortogonale. De aceast dat, rolul undinei tat este jucat de ctre undina m,0 . Iternd aceast poprietate, rezult c orice subspaiu, care face parte n mod curent din structura multirezoluie, poate fi de asemenea rafinat. Pentru a descrie o structur multi-rezoluie generalizat, se pornete de la un arbore binar, unde fiecare nod (nu numai cele corespunztoare sub-benzilor de joasa frecven) poate fi expandat. Nodurile sunt indexate ca n Figura 3.4, att dup o etichet ( m, pm ) , unde m 0, M este adncimea (nivelul) i

pm 0,2m 1 este azimutul n cadrul


m

arborelui, ct i dup un singur index im = 2 + pm 1 . Arborele corespunde unei segmentri unice n frecven, ca n Figura 3.5. Tot unic asociate acestuia sunt i bancul de tip QMF sau structura multi-rezoluie.
6 (2,3) frecven nalt 12 (3,5) 11 24 (4,9) 23 (4,8) 22 (4,7)

(1,1)

frecven medie

(2,2)

5 (3,4)

Spectru 15 16 21 22 23 24

0 (0,0)

10 (3,3) 4 (2,1) 21 (3,2) (4,6) 9 (1,0) 8 1 (3,1) 16 (2,0) 3 (4,1) (3,0) 7 15 frecven (4,0) joas

12

0 2-4

/4

/2

3/4

Figura 3.5. Corespondena generalizat timp-frecven. Se consider c nodul ( m, pm ) furnizeaz coeficienii undin corespunztori proieciei semnalului original pe subspaiul

Sm, p

, generat de familia de undine m, pm ,n

nZ

. Familia

este de fapt o baz ortogonal, referit de asemenea, ca pachet de undine. Pachetul de undine generic, m, pm ,0 , poate fi generat prin utilizarea EDL sau EDL, depinznd de paritatea azimutului:

m, pm ,0 (t ) = 2 n m1, (2t n ) , t R , pm / 2 ,0
nZ

(3.29)

unde h dac pm este par, sau g , altfel. Evident, ecuaia recursiv (3.29)
38

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

pornete de la 0,0,0 i continu cu 1,0,0 1,0 , 1,1,0 1,0 . Celelalte pachete de undine m, pm ,n

nZ

sunt doar versiuni decalate ale lui m, pm ,0 .

Structura multi-rezoluie produs de arborele binar poate fi exprimat astfel:

V0 =

( m , p )M P

S m, p ,

(3.30)

unde M P este produsul direct al mulimilor finite care includ toate nivelurile de adncime i azimuturile frunzelor arborelui (care sunt noduri ale frontierei arborelui). n consecin, reprezentarea asociat semnalului f este urmtoarea:

f0
unde f 0 este proiecia lui f pe

( m , p )

c M P
nZ

m , p ,n

m , p ,n ,

(3.31)

V0 . Coeficienii undin sunt calculai natural ca mai jos:


(3.32)

cm, p ,n = f , m, p ,n , (m, p ) M P , n Z .

Interesant, coeficienii undin pot fi, de asemenea, calculai recursiv, ca n cazul Algoritmului lui Mallat (vezi ecuaiile de analiz i sintez (3.23) i (3.24)):

cm+1,2 pm I cm, pm & cm+1,2 pm +1 H cm, pm , cm, pm I cm+1,2 pm + H cm+1,2 pm +1 ,


m

(3.33) (3.34)

pentru orice m 0, M 1 i pm 0,2 1 . Implementarea ecuaiilor (3.33) i (3.34) poate fi realizat tot prin intermediul bancurilor QMF, fapt care nchide cercul. Evident, subspaiul U este identificat cu V0 i yW cu y0 . Proiecia serie de timp pe V0 (i.e. y0 ) este calculat uor ca n prima identitate din (3.19), prin:

c0,n = c0,0,n = y, 0,0,n = y ( tk ) ( tk n ) , n Z .


k =1

def

def

Ny

(3.35)

Numrul coeficienilor undin (3.35) este totui finit, deoarece undina tat are suport compact. 3.3. Alegerea pachetelor de undine optimale prin minimizarea entropiei Odat ce cadrul structurii multi-rezoluie a fost stabilit (prin specificarea perechii de undine i ), singura problem rmas este alegerea unei colecii adecvate de pachete de undine. Pentru a rezolva aceast problem, trebuie utilizat o msur a informaiei. Astfel, arborele de analiz va fi construit adaptiv, depinznd de caracteristicile principale ale spectrului datelor. O msura introdus n [ShCE48] de Claude Shannon este entropia semnalului. n cazul unui semnal discret determinist x , entropia este definit astfel:

H ( x ) =
unde:

| x[ n] | | x[ n] | log 2 , E ( x) nZ E ( x )
def

(3.36)

E ( x ) = | x[ n] |2 ,
nZ

(3.37)

este energia semnalului. Entropia (3.36) cuantific numrul mediu de bii necesari codificrii unui eantion al semnalului. De asemenea, entropia exprim att redundana
39

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

semnalului ct i ordinea intrinsec. Cu ct entropia este mai mic, cu att semnalul este mai puin redundant i mai ordonat. Redundana este o caracteristic important pentru performanele compresiei de date. De regul, semnalele puternic redundante sunt comprimate cu o rat mai mare dect cele slab redundante. Totui, n cazul analizei bazate pe undine, redundana slab permite informaiei semnalului s fie concentrat ntr-un numr mic de coeficieni, datorit ordinii intrinseci mari a mulimii lor. Entropia poate fi evaluat pentru semnalul rezultat din concatenarea coeficienilor undin care corespund frontierei arborelui binar curent. Se pleac de la entropia datelor originale:

H ( c0,0 ) =
c= c1,0 c1,1 :

nZ E ( c0,0 )

| c0,0,n |

log 2

E ( c0,0 )

| c0,0,n |

(4.38)

unde suma este finit. Mai departe, se calculeaz entropia semnalului concatenat

H ( c ) =
Se observ c

H ( c1,0 ) + H ( c1,1 ) .

H ( c1,0 c1,1 )

| c1,0,n | |c | |c | |c | log 2 1,0,n 1,1,n log 2 1,1,n . E ( c ) nZ E ( c ) E (c) nZ E ( c )

(3.39)

nu este aditiv, adic nu este neprat egal cu

Deoarece analiza se concentreaz asupra a dou sub-benzi de frecven, entropia (3.39) este cel mult egal cu entropia (3.38). Mai departe, prin expandarea nodurilor (1,0) i/sau (1,1) trebuie comparate trei semnale n termeni de entropie: c2,0 c2,1 c1,1 ,

c1,0 c2,2 c2,3 i c2,0 c2,1 c2,2 c2,3 . Doar configuraia cu entropie minim trebuie
selectat din cele trei menionate. Pe msur ce expandarea arborelui avanseaz, din ce n ce mai multe semnale trebuie comparate ntre ele. De fapt, numrul de posibiliti crete exponenial. Astfel, o cutare exhaustiv a arborelui de entropie minim devine ineficient chiar pentru un nivel mic de adncime. De aceea, problema selectrii bazei de undine de entropie minim este echivalent cu cutarea optimului n cadrul unui arbore n care se asociaz costuri arcelor. O astfel de problem poate fi rezolvat prin intermediul unei tehnici care provine din domeniul Inteligenei Artificiale [RuNo95]. O tehnic rapid numit IDA* (Iterative Deepening Approach Star) este descris succinct n continuare. Se consider un arbore cu noduri etichetate dup indici n N , unde rdcina are indexul 0 . Un drum de la nodul n ctre printele su p este notat cu n p . Tranziiile ntre noduri i copiii lor direci sunt penalizate cu un cost. Costul total al drumului 0 n este notat cu h [ n] , unde h este o aplicaie numit euristic. Fundamental, euristica poate produce dou tipuri de costuri:

h [ n] , atunci cnd drumul 0 n a fost efectiv expandat; [ n] , pe drumul 0 n , unde p este o frunz, cnd nodul n b. estimate, h
a. realizate, nc expandat.

nu a fost

[ n] este o predicie a preului pltit dac nodul n ar fi expandat pe calea Practic, h 0 n . Dac prediciia nu se poate realiza, euristica estimat primete valoarea zero.
Costul total al nodului n este

[ n] H [ n] = h [ n] + h

i nu poate depi valoarea adevrat,

dar necunoscut H . De aici provine simbolul stea () asociat numelui IDA. Totui, trebuie s fie, de asemenea, cresctoare:
40

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AS-09.2009] <28-Sep-09>

[ n] H [ p ] = h [ p ] + h [ p] , H [ n] = h [ n] + h

(3.40)

unde p este un descendent al nodului n . n acest context, problema este de gsi un drum de la rdcin ctre o frunz (nod) cu cost global minim. Pentru a cuta drmul optim, strategia IDA* se bazeaz pe schema ilustrat n Figura 3.6.
Urmtorul nod curent Orizont de predicie nod curent

[ n] h

h [ n]
[ n] H [ n ] = h [ n] + h

Zona explorat Zon ne-explorat

Figura 3.6. Strategia de cutare din cadrul procedurii IDA*. Ea const n urmtorii pai, n ceea ce privete nodul curent n : Ct timp nu sunt ndeplinite unele condiii referitoare la euristica nodului curent H [ n] : 1. Expandeaz oricare nod m al frontierei arborelui curent cu H [ m] H [ n] (incluznd nodul n ), pn la primul descendent p pentru care H [ p ] > H [ n] . 2. Frontiera noului arbore fiind astfel generat, nodul urmtor al cii optime este unul de pe frontiera cu cost minim. Procedura poate fi oprit cu ajutorul unor condiii variate. Iat cteva dintre acestea, destul de simple: H [ n] H 0 (cu H 0 setat a priori); n a atins o adncime maxim;

se incrementeaz cu mai puin de > 0 comparativ cu valoarea euristicii anterioare, etc. Pot fi considerate, de asemenea, combinaii ntre aceste condiii. n Figura 4.6, nodurile arborelui au fost grupate n dou zone: explorat (incluznd doar nodurile cu euristica estimat) i ne-explorat (care se refer la noduri pentru care euristica nu a fost nc estimat). Pentru uurina nelegerii, zonele sunt reprezentate circular. Raza zonei expandate (care devine astfel un disc) este egal cu H [ n] valoarea minim a euristicei pentru toate nodurile incluse n acea zon. Trecerea la nivelul urmtor impune ca toate nodurile care au euristica estimat (cel mult) egal cu raza s fie expandate pn cnd euristica urmailor (noile frunze ale arborelui) devine superioar. Raza primete dup aceea valoarea euristicei minime a noilor frunze ale arborelui. Dac

H [ n]

41

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

raza crete semnificativ, de regul, procedura se oprete. Astfel, procedura IDA* se bazeaz pe mecanismul de curare a arborelui de ramurile inutile (cunoscut sub denumirea de pruning n limba englez), mecanism care permite saltul peste expandarea unor noduri. n cazul bancurilor QMF i a euristicii entropice, cutarea unei configuraii de entropie minim a arborelui binar asociat trebuie adaptat la contextul procedurii IDA*. Astfel, cutarea este realizat n cadrul unui meta-arbore definit aa cum sugereaz Figura 3.7.
0

[1 2]

[3 4 2]

[1 5 6]

[7 8 4 2]

[3 9 10 2]

[3 4 5 6]

[1 11 12 6]

[1 5 13 14]

Figura 3.7. Meta-arborele utilizat pentru optimizarea unui banc QMF pe ramura de analiz. Meta-arborele este construit dup urmtoarele reguli: a. se asociaz meta-noduri formei (adic frontierei) arborelui binar; b. fiecare meta-nod este generat prin expandarea unui nod din arborele binar pn la urmaii si direci; c. fiecare meta-nod primete o etichet definit de setul de indici asociai frunzelor arborelui binar; d. costul unei tranziii de la un meta-nod la unul dintre copiii si este entropia coeficienilor undin care formeaz frontiera bancului QMF asociat meta-copilului; e. fiecrui meta-nod i se asociaz o valoare euristic egal cu suma costurilor tranziiilor pe calea de la meta-rdcin la meta-nod; f. euristica estimat este mereu nul. Astfel, euristica meta-nodului, ca sum de entropii, este o aplicaie cresctoare, conform restriciei impuse de strategia IDA*. De exemplu:

H [3 9 10 2] = H

([ c c ]) + H ([ c
1 2

c4 c2 ]) + H
m

([ c

c9 c10 c2 ]) ,

(3.41)

unde: cim cm, pm , m = i pm = im 2 + 1 . Procedura IDA* este iniiat s log 2 (im + 1) ruleze n cadrul meta-arborelui astfel construit. Rezultatul este un meta-nod cu o euristic entropic minimal, care returneaz structura optimal a arborelui QMF, M P (corespunztoare frontierei acestuia).
42

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

3.4. Modelul de predicie bazat pe undine ortogonale Dup ce forma optimal a arborelui binar a fost selectat, prima versiune a modelului determinist al seriei de timp yW este exprimat ca n ecuaia (3.31). Evident, suma interioar din (3.31) este finit, deoarece i seria de timp i rspunsurile la impuls ale QMF au lungime finit. Forma final a lui yW este obinut doar dup nlturarea coeficienilor undin slabi din reprezentarea (3.31). Exist cteva criterii care stabilesc care coeficieni sunt slabi i care nu. De exemplu, pentru orice ( m, p ) M P , se poate obine media m, p i variana

2 m , p a secvenei cm , p . Atunci, toi coeficienii undin inferiori lui m , p m , p (unde nivelul de mascare 0 este stabilit a priori) sunt considerai slabi i trebuie eliminai. (De regul, = 3 , n cazul n care coeficienii sunt normal distribuii.) Un alt criteriu este pur energetic. Pentru orice ( m, p ) M P , toi coeficienii cu amplitudini mai mici dect un nivel de mascare [0,1) aplicat amplitudinii maxime a coeficienilor sunt eliminai. n
orice caz, modelul determinist al seriei de timp este:

yW (t ) =
unde

( m , p )M P nN m ,p

cm, p ,n m, p ,n (t ) , t R ,

(3.42)

Nm , p este mulimea finit de indici de translatare temporal rezultat dup

eliminarea coeficienilor slabi din secvena cm, p , prin utilizarea nivelului de mascare . Pstrarea doar a coeficienilor undin puternici conduce la o compresie de date (dac ei ar trebui transmii pe un canal de comunicaie). Compresia ar putea fi efectuat pe seama alterrii modelului. Simulrile au artat totui c eliminarea coeficienilor slabi poate mbunti modelul de predicie global. Acest fenomen este explicat prin faptul c modelul bazat pe undine a coninut prea mult zgomot, codificat de ctre coeficienii slabi. Dup cum s-a precizat, exist doar o limit fin ntre componenta util din date i perturbaiile care le corup. Dac modelul global a fost mbuntit prin eliminarea unor coeficieni undin, nseamn c separarea dintre cele dou componente a devenit mai precis. 3.5. Selecia unui predictor optimal prin maximizarea calitii prediciei Plecnd de la o serie de timp dat, pot fi construii mai muli predictori, prin varierea urmtorilor parametri: N parametrul de suport al undinelor; undina tat (de fapt, indexul de rezoluie al undinei, notat cu L N ); criteriul de stop al procedurii IDA* (de regul, pragul euristic > 0 ); nivelul de mascare al coeficienilor undin (notat cu [0,1) ); na , nc indicii structurali ai modelului ARMA ; n gradul polinomului al modelului aproximant AR. Parametrii , i n sunt mai puin importani dect ceilali. Exemple tipice de alegere sunt urmtoarele:

= 107 ; = 0 (la nceput); n = min {3(na + nc), N y } .

(3.43)

Dup ce a fost selectat un predictor cu ajutorul criteriului PQ, prin varierea celorlali parametri, nivelul de mascare poate fi incrementat, pentru a ndeprta coeficienii undin parazii. Limita superioar a lui depinde de degradarea acceptat a lui PQ.
43

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

Totui, dup cum s-a menionat deja, prin creterea nivelului de mascare, predictorul i poate mbunti performanele. Se consider acum ceilali parametri enumerai mai sus. De regul, parametrul de suport al undinei, N , variaz ntre 2 i 25. Acesta conduce la un filtru cu un numr de 4 pn la 50 valori ale rspunsului la impuls. Depinznd de natura seriei de timp, nu este obligatoriu ca filtrele cu memorie lung (adic avnd rspuns cauzal la impuls de lungime mare) s fie mai performante dect cele cu memorie scurt, n termeni de PQ. De regul, datele fractale necesit undine fractale, ceea ce conduce la valori mici ale lui N . Dac N = 1 , se obin undinele Haar [DaI88], [StSt07]. Simulrile au demonstrat c acele undine nu au putut conduce la valori mari ale PQ i de aceea ele au fost eliminate. Toate undinele ortonormale cu suport compact din clasa Daubechies cu N 25 s-au comportat aparent similar, n special datorit faptului c indexul lor de regularitate Hlder (estimat n [DaI88] la o valoare de aproximativ 0.1936 N ) este superior celui al seriei de timp. Cu alte cuvinte, undinele cu N 25 sunt prea netede pentru seriile de timp prelucrate i nu pot codifica caracteristicile lor fractale. Evident, exist i aici o demarcaie fin ntre comportamentul fractal determinist al seriei de timp i perturbaiile stocastice. Ori, este de dorit ca modelul bazat pe undine s fie capabil s extrag natura fractal intrinsec a seriei de timp, cu minim de zgomot posibil, pentru a efectua o extrapolare precis. De aceea, undinele prea netede trebuie eliminate din analiz. Pentru un N dat, undina tat este construit cu o rezoluie finit utiliznd algoritmul Daubechies-deRham [DaI88], [StSt07]. Conform acestui algoritm, undina poate fi evaluat L cu precizie mare la orice perioad de eantionare de tipul 2 , unde L N . Dac L = 0 , undina este evaluat la momente de timp discrete. Pentru L = 1 , rezoluia crete la jumti de ntregi, dup aceea, pentru L = 2 , se obin valorile la sfert de ntregi, etc. n mod normal, indicele de rezoluie L trebuie setat conform ratei de eantionare a seriei de timp, dac este cunoscut. Undina tat este necesar pentru a proiecta seria de timp pe subspaiul V 0 , cu ajutorul ecuaiei (3.35). Simulrile au dovedit c doar setarea L = 0 (adic rata de eantionare unitar) poate s nu conduc la predictori de calitate nalt. Deoarece axa timpului nu are o unitate impus n cazul undinelor, cea mai potrivit versiune eantionat a undinei tat poate fi gsit pentru L > 0 . De aceea, indicele L al rezoluiei trebuie s varieze, pentru a l gsi pe cel mai bun (n sensul maximizrii lui PQ). Deoarece N 2 (adic indicele de regularitate Hlder este cel puin 0.3872 ) caracteristicile fractale globale ale undinei sunt obinute cnd L atinge limita superioar egal cu 6 . Peste aceast limit, noile eantioane nu aduc nici o informaie nou privind discontinuitile microscopice la nivelul derivatelor undinei, de aceea, trebuie evitat supra-eantionarea. n cazul unei eantionri neuniforme, unele (sau toate) momentele de timp ale seriei de L timp pot fi diferite de multiplii ntregi ai lui 2 (adic de momentele de eantionare ale undinei tat). De aceea, proiecia seriei de timp pe V 0 poate fi doar aproximat prin regsirea celor mai apropiate eantioane ale undinei de eantioanele sale, pentru o anumit rezoluie. Predicia cu undine poate fi totui realizat, indiferent de tipul de eantionare. Este suficient s se asocieze indici corespunztori datelor numerice (seria de timp i undina tat), adic s se considere cazul de eantionare uniform, prin simpla enumerare a datelor. Dup aceasta, se alege eantionarea uniform pentru a simplifica abordarea i a aplica avantajos algoritmul Daubechies-deRham. n acest caz, perioada de eantionare
44

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

este fixat la 2 mai jos:

, utiliznd rezoluia undinei tat. Astfel, ecuaia (3.35) trebuie rescris ca


L = y[k ] ( 2 (k n) ) = y[k ]0,0, n [k ] , n Z , L k =1 k =1 Ny Ny

c0,0,n = y,
unde:

def

L 0,0, n

(3.44)

L L 0,0, n [ k ] = ( 2 ( k n) ) , k Z
def

(3.45)

nZ

este familia de undine tat discretizate, translatate. ntrebarea care se pune n cazul eantionrii undinei tat este urmtoarea: are familia (3.45) calitatea de baz ortonormal a subspaiului V 0 (n contextul semnalelor discrete stabile, de energie finit)? Pentru a da un rspuns corect, ar trebui dezvoltat un raionament complicat, bazat pe rezultatele obinute n special de Mallat [MaS99], Daubechies [DaI90] i Meyer [MeY87]. Dezvoltarea unei teorii care a fost deja abordat n trecut nu constituie scopul acestui raport de cercetare. n schimb am preferat un rspuns simplu, direct i intuitiv: a. Dac undina este eantionat la momente de timp ntregi ( L = 0 ), atunci familia (3.45) este o baz ortogonal a lui V 0 . Pentru a obine o baz ortonormal, este necesar normalizarea cu 0,0,0 .
0

b. Dac undina este eantionat cu L > 0 , atunci familia (3.45) este un cordaj dens (tight frame) al lui V 0 . Conceptul de cordaj dens a fost probabil introdus n contextul undinelor de ctre Daubechies [DaI90] i dezvoltat mai departe de W.M. Lawton n [LaWM90]. (Mai trziu, Daubechies i colaboratorii ei au introdus de asemenea numele de cordeline (framelets) pentru cordajele dense ale undinelor [DHRS03].) Prin definiie, o familie de vectori {vn }nZ este un cordaj dens (tight frame) dac genereaz un spaiu Hilbert u H poate fi extins astfel:

i orice element

u=

1 u, vn vn , A nZ

(3.46)

unde A R este constanta cordajului (independent de u ). (Alte definiii pot fi de asemenea enunate, dar toate sunt echivalente cu (3.46).) Reprezentarea (3.46) este foarte similar cu cea unui vector ntr-o baz ortonormal. Cordajele dense sunt baze cu redundan, deoarece vectorii lor nu sunt lineari independeni. Din acest motiv, ele se mai numesc i supra-baze. Din fericire, n cazul undinelor discretizate, dei necunoscut, constanta cordajului este invariant la variaia scalei de reprezentare. n consecin, este suficient s se determine constanta cordajului pentru reprezentarea seriei de timp cu ajutorul cadrul familiei (3.45):

1 L c0,0,n 0,0, n . A nZ

(3.47)

Suma din (3.47) este totui finit, deoarece att seria de timp ct i undina tat discretizat sunt secvene de lungime finit.
45

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

Dou abordri pot conduce la estimarea valorii lui A . Deoarece aceasta nu depinde de seria de timp, ar trebui adoptat un raionament riguros, bazat pe proprietile undinei tat. Dar aceast abordare este mai mult teoretic i greoaie, astfel c va fi evitat n acest context. O abordare mai rapid de estimare a lui A se bazeaz pe Metoda celor mai mici ptrate (MCMMP), care este mai practic. Conform MCMMP, trebuie minimizat parabola:

1 1 def L V = y[ n] c0,0, p 0,0, p [ n] . A pZ A nZ

(3.48)

Dup cteva calcule algebrice, unica rdcin a primei derivate a parabolei (ca funcie de 1/ A i nu de A ) poate fi exprimat astfel:

1 = A

c
nZ pZ

L 0,0, p 0,0, p

[ n] y[ n] [ n]
2

c
nZ

(3.49)

pZ

L 0,0, p 0,0, p

Dei constanta cordajului pare s depind de seria de timp analizat, simulrile pe cteva serii de timp de provenien diferit au artat c variaia este nesemnificativ, fiind cauzat n special de erorile numerice. De altfel, utilizarea MCMMP nu poate conduce dect la o estimaie a constantei cordajului, care motenete o parte din zgomotul seriei de timp. Aceasta este proprietatea care creaz dependena dintre estimaie i datele msurate. Se observ c ecuaia (3.49) poate fi utilizat chiar i n cazul n care undina tat este eantionat la momente ntregi, pentru a crete precizia modelului. Revenind la problema abordat n cadrul acestui paragraf, construcia predictorului optimal se poate realiza printr-o cutare exhaustiv n mulimea definit de plajele de variaie ale parametrilor principali. De notat c predictorul se adapteaz la datele msurate, deoarece bancul de QMF din implementarea transformrii undin este determinat prin minimizarea entropiei din frunzele acestuia. Intervenia Algoritmului IDA* reduce sensibil durata de cutare, fapt care permite evaluarea lui PQ pentru toi predictorii. 3.6. Algoritmul FORWAVER Descrierea din paragrafele anterioare ale acestei seciuni este sumarizat n Algoritmul 3.1, numit i (predictor) FORWAVER (forecasting with orthogonal wavelets). Undinele utilizate n acest algoritm sunt ortogonale. n viitor, se preconizeaz a fi proiectat i implementat un algoritm alternativ, care utilizeaz undine biortogonale [CDF92]. Acestea pot genera n mod natural cordaje dense de constant unitar, ceea ce poate conduce la o uoar cretere a preciziei de predicie. Paii principali ai Algoritmului 3.1 sunt discutai n detaliu n urmtorul paragraf. Aici ne concentrm doar asupra etapei 2, deoarece este invocat predictorul clasic PARMA. Acest predictor a fost integrat din dou motive. n primul rnd, pentru a stabili o referin n raport cu care se pot compara valorile predictate pe baz de undine. n al doilea rnd, deoarece extensiile oferite de undinele ortogonale sunt extrem de adaptive la semnalul analizat. Acestea nseamn c o astfel de extindere va ncerca s urmreasc nu numai datele msurate, ci i valorile nule n afara orizontului de msur. Astfel, fr a avea vreo informaie despre valorile seriei de timp pe orizontul de msur, modelul bazat pe undine, yW , va furniz valori extrapolate extrem de mici sau chiar nule. De aceea, sunt absolut necesare unele date suplimentare, chiar i grosier predictate.
46

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

Algoritmul 3.1. FORWAVER un algoritm de predicie a seriilor de timp nestaionare, folosind pachete de undine ortogonale, cu suport compact. Date de intrare: o serie de timp y de lungime finit N y ;
y

momentele de eantionare {tn }n1, N sau perioada de eantionare Ts (implicit,

tn = nTs , n 1, N y i/sau Ts = 1 );
lungimea orizontului de predicie, K (cu K << N y ); de regul, K 7 ; momentele de predicie t N y + k parametri de configurare: valoarea maxim a parametrului suport al undinei N max N \{1} (implicit, valoarea maxim a indicelui de rezoluie Lmax N (implicit, Lmax = 6 ); pragul euristic > 0 (implicit, = 10 ); valoarea minim a nivelului de mascare [0,1) (implicit, = 0 ); valoarea maxim a indicilor structurali ARMA NA, NC N (implicit, expresia gradului n corespunztor mpririi infinte ntre polinoamele AR i MA (implicit, n = min 3(na + nc ), N y ).
7

{ }

k1, K

(implicit, t N y + k = N y + k Ts , k 1, K );

N max = 25 );

NA = NC = 25 );

1. Prelucrarea preliminar a datelor.

1.1. Se ordoneaz datele: y[ n] y ( tn ) , n 1, N y . 1.2. Se calculeaz media datelor, y i deviaia standard y . 1.3. Se centreaz datele pe medie: y y y .

PARMA , prin invocarea Algoritmului PARMA. 2. Se construiete predictorul clasic y 3. Se efectueaz o predicie grosier a datelor utiliznd modelul clasic. Se noteaz
PARMA valorile predictate cu y N y + k

k1,K

4. Pentru orice N 2, N max : 4.1. Se genereaz rspunsurile la impuls h i g ale QMF (fiecare de lungime 2 N ), utiliznd Algoritmul lui Daubechies. 4.2. Pentru orice L 0, Lmax , execut:
L 4.2.1. Se evalueaz undina tat 0,0,0 (corespunztoare indicelui de rezoluie

L ) utiliznd Algoritmul Daubechies-deRham. PARMA 4.2.2. Se proiecteaz datele extinse { y[ n]}n1, N y N y + k


y

L subspaiul V 0 , prin intermediul familiei de undine discretizate 0,0, n

k1,K

pe
nZ

adic se calculeaz coeficienii din rdcina arborelui binar c0,0,n utiliznd ecuaiile (3.44)-(3.45).
47

, ,

nZ

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

Algoritmul 3.1. FORWAVER un algoritm de predicie a seriilor de timp ... (continuare) 4.2.3. Se estimeaz constanta cordajului dens A , utiliznd MCMMP, conform relaiei (3.49). 4.2.4. Se determin bancul de filtre optimal utiliznd prcedura IDA* cu pragul euristic . Intrarea bancului de filtre este secvena c0,0,n

nZ

i ieirea

este o colecie de coeficieni undin corespunztori frunzelor sale. Mulimea de etichete ale frunzelor este M P , iar indicii coeficienilor undin sunt grupai n seturi finite N m, p
0

4.2.5. Dac > 0 , se elimin coeficienii undin parazii (slabi) corespunzatori. Coeficienii undin aparin atunci mulimii finite restrnse

( m , p )M P

{N }

m , p ( m , p )M P

4.2.6. Se construiete modelul bazat pe undine yW , pe orizontul de msur i predicie (extrapolare), cu ajutorul relaiei (3.42):

yW [k ] =
L

( m , p )M P nN m ,p

L cm , p ,n m , p , n [ k ] , k 1, N y + K ,

unde m, p ,n sunt undinele evaluate plecnd de la undina tat 0,0,0 ,


L

utiliznd bancul de filtre. Evident, graie ordonrii datelor, valoarea extrapolat yW [ k ] corespunde yW ( tk ) , pentru orice k 1, N y + K . 4.2.7. Se extrage zgomotul colorat pe orizontul de msur restrns:

vK [ n] = y[ n] yW [ n] , n 1, N y K .
4.2.8. Pentru na 0, NA i nc 0, NC : a. Dac na = 0 i nc > 0 , se estimeaz modelul MA al zgomotului colorat vK , prin Metoda Wiener-Hopf. b. Dac na > 0 i nc = 0 , se estimeaz modelul AR al zgomotului colorat vK , prin MCMMP sau Algoritmul Levinson-Durbin. c. Dac na > 0 i nc > 0 , se estimeaz modelul ARMA al zgomotului colorat vK , prin MMEP. d. Dac exist un model valid al zgomotului colorat (oricare din paii V ,K anteriori pot eua), se construiete predictorul clasic stochastic y utiliznd ecuaiile predictorului PARMA. (n cazul modelelor AR, nu mai este necesar estimarea zgomotului alb.) e. Se predicteaz ultimele K date:

K [ n] = yW [ n] + y V ,K [ n] , n N y K + 1, N y . y
f. Se estimeaz dispersia erorii de predicie,

} {
2 K ,k

k =1, K

, utiliznd

modelul ARMA. (n cazul modelelor MA, doar nc valori ale varianei prediciei sunt nenule.) e. Se evalueaz calitatea prediciei (PQ) pentru ultimele K date, folosind definiia (A.8).
48

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

Algoritmul 3.1. FORWAVER 1 un algoritm de predicie a seriilor de timp ... (final) 4.2.9. Se selecteaz i memoreaz indicii structurali na0 i nc0 corespunztori valorilor maxime ale calitii prediciei calculate anterior. 4.2.10. Se pstreaz n memorie valoarea maxim a calitii prediciei. 5. Se selecteaz parametrii N i L corespunztori maximului tuturor valorilor criteriului PQ memorate. Acesta este unic asociat att modelului bazat pe undine yW ct i perechii de indici structurali {na , nc} . 6. Se extrage zgomotul colorat pe ntregul orizont de msur: v = y yW . 7. Se estimeaz modelul ARMA al zgomotului colorat v , pentru indicii structurali na , nc (ca n paul 4.2.8.).

V utiliznd ecuaiile predictorului PARMA. 8. Se construiete predictorul stochastic y


9. Se predicteaz seria de timp:

V N y + k = y + yW N y + k + y N y + k , k 1, K . y 2 i evalueaz dispersia erorii de predicie, .

{ }
k

k =1, K

Date de ieire:

)} } varianele corespunztoare ale erorii de predicie {


t N y +k mulimea valorilor predictate y N y + k y

k1, K k =1, K

; .

2 k

Se poate nelege acum de ce, la pasul 4.2.2., nu datele msurate proiectate pe subspaiul
y

PARMA unde y N y + k k1,K sunt valori suplimentare produse de predictorul clasic. Pentru a completa Algoritmul 3.1, n continuare, sunt sumarizai Algoritmii Daubechies i Daubechies-deRham, care au fost invocai. Detaliile privind proiectarea acestor algoritmi sunt precizate, de exemplu, n [StSt07] sau [SSP09].
Algoritmul 3.2. Algoritmul lui Daubechies de generare a undinelor ortogonale, cu suport compact. Date de intrare: parametrul de control al duratei undinelor cu suport compact: N 2,20 . 1. Iniializare:
n 1.1. Se construiete polinomul caracteristic P ( x ) = Cn N + n 1 x n =0 def N 1

PARMA V 0 , ci setul extins de date, { y[ n]}n1,N y N y + k

{ y[ n]}n1,N

sunt
y

k1,K

(adic se evalueaz coeficienii acestuia). 1.2. Se evalueaz rdcinile polinomului caracteristic: {xn }n1, N 1 . 1.3. Se iniializeaz mulimile rdcinilor TZ: S = (reale); D = (complexe).
49

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

Algoritmul 3.2. Algoritmul lui Daubechies de generare a undinelor ortogonale, cu suport compact (final). 2. Pentru n 1, N 1 , se efectueaz urmtoarele operaii: 2.1. Se evalueaz rdcinile ecuaiei: z + z 1 = 2 4 xn , notate prin zn ,1 i zn ,2 . Evident,
1 zn ,2 = zn ,1 .

2.2. Dac rdcinile zn ,1 i zn ,2 sunt reale, ele se adaug mulimii S , adic:


1 S = S {zn ,1 , zn ,1 } .

2.3. Dac rdcinile zn ,1 i zn ,2 sunt complexe, ele se adaug mulimii D , adic:

1 D = D {zn ,1 , zn ,1 } . (Se pot aduga i conjugatele lor complexe, caz n care pasul

2.1. nu se va mai efectua pentru ecuaia

2 z z 1 = xn .) 4
r

3. Finalizare. Rdcinile TZ se regsesc printre elementele mulimilor S = {rn }n1,2 N i

D = {zm , zm }m1,2 N (cu N r + 2 N c = N 1 ).


c

3.1. Se aleg n manier pseudo-aleatoare N r rdcini reale din mulimea S restriciilor de selecie): rnk

i N c

perechi de rdcini complex conjugate din mulimea D (cu respectarea

{ }

k 1, N r

zmk , zmk

k1, N c

3.2. Se construiete TCFD a secvenei coeficienilor EDL (pentru R ):

1 + e j C (e ) = 2 2
j def

Nr e j rnk k =1 1 rnk

Nc e j zmk e j zmk 1 zmk 1 zmk k =1

)( )(

3.3. Se extrag coeficienii EDL din expresia anterioar. Date de ieire:

secvena coeficienilor EDL: {cn }n0,2 N 1 (n numr par).


Algoritmul 3.3. Algoritmul Daubechies-deRham de rezolvare a EDL finite, cu rezoluie controlat.

Date de intrare: parametrul de control al dimensiunii suportului undinelor: N 2,20 sau secvena coeficienilor EDL: {cn }n0,2 N 1 ; pragul minimal de rezoluie: M = 2 L (de regul, L 2 + log2 N ). 1. Iniializare: 1.1. Dac nu este furnizat secvena coeficienilor EDL (adic

{cn }n0,2 N 1 ),

ea se

construiete cu ajutorul Algoritmului lui Daubechies (Algoritmul 4.2). 1.2. Se construiete matricea C N a coeficienilor EDL:

50

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

Algoritmul 3.3. Algoritmul Daubechies-deRham de rezolvare a EDL finite, cu rezoluie controlat (final).

c0 0 0 0 0 0 0 c1 c2 c1 c0 0 0 0 0 c3 c2 N 3 c2 N 4 c2 N 5 c2 N 6 c3 c2 c1 c0 def c5 c4 c3 c2 . C N = c2 N 1 c2 N 2 c2 N 3 c2 N 4 0 0 c2 N 1 c2 N 2 c7 c6 c5 c4 0 0 0 0 c2 N 1 c2 N 2 c2 N 3 c2 N 4 0 0 0 0 0 0 c2 N 1 c2 N 2 1.3. Se determin vectorul propriu normat corespunztor valorii proprii unitare a acestei matrici. 1.4. Se iniializeaz indicele de rezoluie: k = 1 . 1.5. Se iniializeaz numrul de valori ale undinei: M 1, N = 4( N 1) (pragul iniial de
rezoluie). 2. Ct timp M k , N < M , se efectueaz urmtoarele operaii: 2.1. Se determin undina tat cu rezoluia 2k folosind relaia:

k +1 ( 2 k 1 m ) =

2 N 1 n =0

k ( 2 k m n ) , m 0, M k , N .

2.2. Se incrementeaz indicele de rezoluie: k k + 1 . 2.3. Se reactualizeaz pragul de rezoluie: M " k k +1", N . 3. Se corecteaz indicele de rezoluie: k k 1 . 0 1 4. Se determin marginile de variaie M N , k i M N , k . 5. Se determin undina mam cu rezoluia 2k folosind relaia: k +1 ( 2 k 1 m ) =
n =22 N

1 ( 1)n c1n k ( 2 k m n ) , m M k0, N , M k ,N .

Date de ieire: perechea de undine tat i mam {, } determinate cu rezoluia de reprezentare 2k . 3.7. Detalii privind implementarea Algoritmului FORWAVER Pentru a implementa eficient Algoritmul 3.1, trebuie exploatate cteva proprieti. Cele mai importante dintre ele sunt prezentate n cele ce urmeaz, n ordinea pailor algoritmului. 3.7.1. Observaii generale La etapa 1., pasul 1.1., datele sunt simplu ordonate. Aceasta nseamn c eantionarea neuniform nu este tratat. Principalul motiv este urmtorul: bancul de filtre nu poate fi
51

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

utilizat n cazul eantionrii neuniforme a seriei de timp, pentru a construi modelul bazat pe undine. n acest caz, se pstreaz doar ecuaia de predicie de mai jos:

( tn ) = y

( m , p )M P nN m ,p

V ( tn ) , n 1, N y + K . cm, p ,n m, p ,n ( tn ) + y

(3.50)

Implementarea acestei ecuaii necesit, pe de o parte, calcularea coeficienilor undin cu ajutorul produselor scalare i, pe de alt parte, estimarea undinelor utiliznd recursiv EDL i EDL, combinate cu criteriul entropic (3.38). Dei posibil, aceast abordare conduce ctre o procedur consumatoare de timp i nu produce o cretere semnificativ a valorilor PQ. Mai mult, modelul ARMA fiind numeric, este invariant la tipul eantionrii. Ultimul pas al etapei 1. const n centrarea datelor pe media lor. Este bine cunoscut c structura multi-rezoluie ortogonal include nchiderea interseciei dintre dou spaii Lebesque: semnale stabile i semnale de energie finit (adic H = L 1 L 2 , cum s-a menionat deja). Evident, semnalele constante nu pot aparine acestei intersecii. ns, orice semnal practic poate fi exprimat ca o sum ntre o constant i o variaie staionar cu medie nul. Media eliminat este utilizat numai la sfarit (n etapa 9.), pentru a corecta valorile predictate. Se observ totui c centrarea datelor nu este aplicat n cazul predictorulu clasic, deoarece tendina polinomial include un coeficient liber, care codific informaia despre media semnalului. n bucla principal 4., la pasul 4.1., doar rspunsul la impuls h este generat cu Algoritmul lui Daubechies, corespunztor valorii curente a lui N 2, N max (deoarece cellalt rspuns la impuls este definit de: g n = ( 1) h1n
n
def

n22 N ,1

). (La fel se procedeaz

i n Algoritmul 3.2.). Daubechies a demonstrat c, pentru orice N 2 , pot fi construite mai multe secvene h (de lungime 2 N ), astfel nct s se verifice condiiile (3.12) i (3.13). n realitate, exist un grad de libertate n selectarea valorilor lui h . De aceea, n implementarea algorimului Daubechies, parametrul liber este ales (pseudo-)aleator. Rulri succesive pot produce diferite secvene h . n consecin, trebuie testate mai multe undine tat cu aceeai durat. Simulrile au demonstrat totui c varierea undinei de baz n cadrul aceluiai suport nu produce variaii semnificative ale valorilor criteriului PQ, chiar dac arborele asociat bancului de filtre optimal poate fi modificat. Astfel, orice undin tat cu suport [0, 2 N 1] poate fi selectat cu aproximativ aceleai perfomane. n algoritmul invocat n pasul 4.2.1. al buclei 4.2. (Daubechies-deRham Algoritmul 3.3) exist dou tipuri de iniializri: inconsistent i consistent. Iniializarea inconsistent este un impuls unitar poziionat n mijlocul suportului undinei. Iniializarea consistent este furnizat rezolvnd ecuaia spectral. Astfel, valorile undinei tat la momente ntregi sunt mpachetate ntr-un vector propriu de norm unitar corespunztoare valorii proprii unitare a unei matrici generate utiliznd valorile lui h (a se consulta [DaLa88a], [DaLa88b], [StSt07] pentru detalii). Procedura implementat pentru Algoritmul 3.1 ncepe cu iniializarea consistent, ceea ce conduce la uoar scdere a duratei de rulare. La pasul 4.2.2., proiecia semnalului extins pe subspaiul V 0 poate fi simplu evaluat transformnd undina tat ntr-o fereastr glisant de-a lungul datelor. Astfel, valorile nenule ale coeficienilor undin (3.44) sunt localizate pe un suport de lungime finit. Lungimea secvenei de coeficieni este mai mare dect N y + K , datorit suportului undinei tat. Evaluarea permanent a suporturilor coeficienilor undin este o operaie extrem de important pentru sincronizarea bancurilor de filtre i precizia modelului de predicie. Aceast operaie este detaliat la punctul 4.7.2. (care urmeaz) al paragrafului.
52

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

Implementarea procedurii IDA* (invocat la pasul 4.2.4.) necesit o reprezentare clar a arborelui binar i a parametrilor si. Sunt posibile cteva abordri, dependente n general de limbajul de programare utilizat pentru implementarea procedurii. Reprezentarea descris n cele ce urmeaz ine cont de caracteristicile limbajului MATLAB. Astfel, fiecrui meta-nod i se asociaz o celul cu 4 cmpuri, descris mai jos.

Matricea L de tip 2 L2 codific adncimea i azimutul frontierei curente a arborelui


binar, unde L2 N este numrul de frunze. Practic, matricea L include mulimea curent M (de valori ale adncimii frunzelor) pe prima linie i mulimea curent P (de valori ale azimutului frunzelor) pe a doua linie. Cnd o frunz devine nod intern al arborelui binar (prin expandare), coloana sa corespunztoare este eliminat din L i la sfrit se adaug dou noi coloane (corespunztoare nodurilor nou expandate urmaii acesteia). Figura 3.8 ilustreaz acest principiu.

Mleft Pleft
m+1 2p

m p

Mright Pright
m+1 2p+1

Mleft Pleft

Mright Pright

m+1 m+1 2p 2p+1

Figura 3.8. Principiul actualizrii matricii informatice a frunzelor binare.

Matricea C de tip N 2 L2 include toate secvenele de coeficieni undin corespunztori nodurilor matricii L . Secvenele sunt enumerate pe coloane, ncepnd cu primul coeficient nenul. Secvenele scurte sunt completate cu zerouri pn la lungimea maxim N 2 . O astfel de matrice arat ca n Figura 3.9. Este actualizat n acelai mod i timp cu matricea L .

C
0 0 0 0

0 0 0

Figura 3.9. Configuraia matricii informatice a coeficienilor undin. Secvenele scurte corespund frunzelor nalte, n timp ce secvenele lungi sunt asociate frunzelor apropiate de rdcina arborelui. Evident, exist cel puin dou coloane care includ secvena cu cea mai mic lungime. Ordinea n care secvenele sunt aranjate n matricea C este dat de ordinea coloanelor din matricea L . Matricea S de tip 2 L2 conine limitele suportului. Suportul secvenei de coeficieni undin cm , p este convenional reprezentat ca: N
53
0 m, p def min max = Nm , p , N m , p . Limitele inferioare

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

sunt aranjate pe prima linie a matricii S iar limitele superioare pe a doua linie. Evident, matricea S este sincronizat cu matricile L i C n ceea ce privete actualizarea. Mrimea scalar H memoreaz entropia total a cii de la meta-rdcin la metanodul curent (suma entropiilor corespunztoare tuturor meta-nodurilor de pe cale). Un vector de celule v este asociat frontierei curente a meta-arborelui. De fiecare dat cnd un meta-nod este expandat (el ar putea avea mai mult de doi meta-urmai), celula lui este eliminat din vectorul v i celulele noilor meta-frunze generate sunt adugate la sfrit (urmnd acelai principiu de actualizare a matricii L , ilustrat n Figura 3.8). Raza curent a zonei explorate este egal cu valoarea total a entropiei stocate ntr-una dintre celulele incluse n vectorul meta-frontierei v . De fapt, raza este minimum tuturor metaentropiilor gsite prin inspectarea celulelor lui v . Meta-nodurile de expandat sunt cele din v , cu entropia total minim, adic egal cu raza. Fie v i = {Li , Ci , Si , H i } meta-nodul de expandat. Expandarea const atunci n generarea unui numr de meta-noduri egal cu numrul de coloane incluse n matricea Li . Fiecare nou meta-nod este obinut prin aplicarea operaiilor urmtoare: a. Se reine coloana curent din L i . Dac adncimea curent nu a atins o frontier maxim, se nlocuiete valoarea maxim cu etichetele copiilor si, conform principiului ilustrat n Figura 3.8. Adncimea maxim a unui arbore binar, M y , depinde de lungimea secvenei de coeficieni c0,0 . Cu alte cuvinte:
max min My = log 2 ( N 0,0 N 0,0 + 1) .

(3.51)

b. Se calculeaz noile secvene ale coeficienilor undin ncepnd cu coloana curent din Ci , utiliznd blocul elementar al bancului de filtre de analiz, din Figura 4.3. c. Se evalueaz suporturile noilor secvene (ca n paragraful urmtor) i se extrag limitele lor. d. Se nlocuiete coloana curent din Ci cu coloanele noilor secvene, dup completarea corespunztoare cu zerouri. e. Se nlocuiete coloana curent din S i cu dou noi coloane care conin limitele suporturilor. f. Se evalueaz entropia noului arbore binar generat i se adaug la meta-entropia curent, H i . g. Se nlocuiete meta-entropia curent

Hi

cu noua entropie.

Pentru a opri procedura IDA*, se utilizeaz un prag euristic > 0 . Fie chiar nainte de expandarea unui meta-nod i v j = L j , C j , S j , H

R valoarea razei
noul meta-nod

(dup expandare), selectat ca un candidat pentru expandare. nainte de efectuarea noii expandri, se testeaz urmtoarea inegalitate:

H j R < . R

(3.52)

Meta-nodul este expandat numai dac nu se verific inegalitatea (3.52), adic testul de oprire eueaz. De asemenea, chiar n acest caz, procedura poate fi oprit cnd toate nodurile binare ale lui L j au atins adncimea maxim (3.51). Dac testul de stop (3.52) reuete, meta-nodul final este v j .
54

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

La pasul 4.2.5., dac nivelul de mascare [0,1) nu este nul, se efectueaz eliminarea coeficienilor slabi. Eliminarea nseamn n acest context nlocuirea cu valori nule. De aceea, coeficienii slabi nu sunt eliminai, ci doar mascai prin utilizarea valorilor nule. Mai precis, coeficientul cm , p ,n al secvenei cm , p este mascat cnd condiia de mascare de mai jos este verificat:

cm , p ,n < max cm , p ,i . 0
iN m , p

(3.53)

Se observ c nivelul de mascare produce anularea unui anumit procent din masa coeficienilor undin. De exemplu, alegerea = 5% poate conduce la mascarea a 70% dintre coeficienii undinei originale, ale cror amplitudini se situeaz sub 5% din amplitudinea maxim. L Singura problem de rezolvat la pasul 4.2.6. este regsirea valorilor undinelor m, p ,n . Ele pot fi evaluate prin intermediul bancului de filtre, dup cum este explicat la punctul 4.7.3. (care urmeaz) din acest paragraf. Se sare direct la bucla 4.2.8. Singura observaie care ar trebui evideniat aici este faptul c seria de timp ar putea conduce la modele ARMA invalide, pentru unii indici structurali (datorit discrepanelor puternice dintre date i modelul selectat). Modelele invalide sunt tratate ca vide iar PQ corespunztor este nlocuit cu EQ (definiia (3.9)). De regul, EQ are valori inferioare lui PQ pentru majoritatea modelelor ARMA valide. Mai mult, dac NA i NC sunt destul de mari, numrul de modele invalide este sensibil mai mic dect numrul de modele valide, astfel c selectarea unui predictor optimal nu este afectat. 4.7.2. Evaluarea suporturilor corespunztoare coeficienilor undin Se introduce notaia cunoscut Supp( x ) = N x , N x
min max

pentru suportul oricrui semnal

discret de lungime finit x . Primul pas n evaluarea suporturilor corespunztoare coeficienilor undin este setarea suporturilor semnalelor implicate n ecuaii ca (3.44) sau (3.45). Pentru a extinde generalitatea, se consider c Supp( y ) = N y , N y
min max

L min max Supp ( 0,0, n ) = N , L , N , L . Astfel, coeficienii corespunztori rdcinii arborelui sunt:
def
max Ny

c0,0,n = y,

L 0,0, n

min k =Ny

L y[k ]0,0, n [k ] , n Z .

(3.54)

Evident, valoarea curent c0,0,n este eventual nenul dac i numai dac:
min max min max N , , L k n N , L , k N y , N y

(3.55)

ceea ce implic:
min max max min Supp ( c0,0 ) N y N , L , N y N , L .

(3.56)

Operatorii parte ntreag (superioar) nu sunt neaprat necesari n (inferioar) i relaie (3.56), deoarece argumentele lor sunt valori ntregi. Totui, operatorii se aplic foarte bine n cazul n care acele argumente lor nu au neaprat valori ntregi. De aceea, relaia (3.56) va fi foarte util pentru pasul urmtor al raionamentului.
55

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

Continum s presupunem c argumentele operatorilor parte ntreag nu sunt neaprat ntregi. Din relaia (3.56), rezult limitele lui Supp c0,0 :
min min max max max min = N 0,0 N y N , L . N y N , L & N 0,0 =

( )

(3.57)

Se observ c difrenele

(N

min y

max max min N N , L ) i/sau ( N y , L ) pot fi negative. Indiferent

de semnul lor, proprietile operatorilor parte ntreag furnizeaz urmtoarele expresii ale limitelor suportului (3.57):
min min max max N 0,0 min N = sign ( N y N ,L ) N y ,L . N max = sign ( N min N max ) N max N min y , L , L y 0,0

(3.58)

Expresiile (3.57) i (3.58) pot fi combinate, pentru a exprima adecvat limitele (utiliznd doar operatorul inferior ), n cazul n care N y

max

min N ) este nenegativ:

min min max max N 0,0 min N = sign ( N y N ,L ) N y ,L . N max = N max N min , L 0,0 y

(3.59)

Acesta este cazul n care se utilizeaz undine ortogonale ale clasei Daubechies i seriei de timp, deoarece:
L max Supp( y ) = 1, N y & Supp ( 0,0, n ) = 1, N , L .

(3.60)

Limita superioar a lui Supp 0,0,n


L

) depinde att de parametrul suport N , ct i de indicele


(3.61)

de rezoluie L , dup cum se poate obine direct:


max L N , L = 2 (2 N 1) 1 .

n (3.60) i (3.61), se ine seama de proprietatea elementar a undinei tat originale (al crei support este [0, 2 N 1] ) de a fi nul n 0 i 2 N 1, datorit continuitii. De aceea, n acest caz:
min max max N 0,0 = 2 2 L (2 N 1) & N 0,0 = Ny 1.

(3.62)

n (3.62), se pot recunoate uor poziiile extreme ale ferestrei glisante a undinei tat pentru care valorile nenegative ar urmri valorile seriei de timp, ca s se poat calcula produsul scalar (3.54). Prima etap de calcul fiind ncheiat, limitele suportului altor coeficieni undin pot fi obinui successiv, conform unui raionament inductiv. Reamintim maniera n care coeficienii undin sunt calculai utiliznd bancul de filtre (ca n Figura 3.3), datorit proprietilor (3.23). ncepnd cu secvena generic cm , p , cu
min max Supp ( cm , p ) = N m , p , N m , p , secvenele rezultate prin expandare cm +1,2 p i cm +1,2 p +1 sunt

produse printr-o pereche de operaii succesive: filtrare i decimare. Filtrarea este efectuat cu ajutorul QMF oglindite. Mai precis, nainte de decimare, rezult secvena intermediar urmtoare:
56

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>


0 cm +1,2 p ,n = def
max Nh

min k = Nh

h[k ]cm, p ,nk

& cm+1,2 p ,n =
0

def

max Ng

min k =Ng

g[k ]cm , p ,nk , n Z .

(3.63)

Evident, ambele ecuaii din (3.63) sunt similare ecuaiei (3.54), cu semnale diferite, ns. n consecin, suporturile secvenelor intermediare au urmtoarele limite:
def def min min min min min min N m+1,2 p +1,0 = N m ,p + Ng N m+1,2 p ,0 = N m, p + N h & . def max def max max max max max N m+1,2 p ,0 = N m, p + N h N m+1,2 p +1,0 = N m, p + N g

(3.64)

(Sumele din (3.63) sunt totui convoluii i nu produse scalare ca (3.54).) Prin decimare, lungimea secvenei este aproximativ njumtit. De aceea, limtele suporturilor corespunztoare secvenelor urmailor rezult din (3.64) i (3.58):
min min Nm def , p + Nh min min min N m+1,2 p = sign ( N m, p + N h ) 2 ; max max max def N m, p + N h max max N + N m+1,2 p = sign ( N m ) ,p h 2 min min Nm def ,p + Ng min min min N m+1,2 p +1 = sign ( N m, p + N g ) 2 . max max Nm def max N + max max N m+1,2 p +1 = sign ( N m ) ,p 2 g ,p + Ng

(3.65)

(3.66)

Ecuaiile (3.65) i (3.66) sunt relaii recursive care permit evaluarea limitelor suporturilor pentru orice secven de coeficieni undin. Iniializarea este dat de (3.57). n cazul undinelor ortogonale cu suport compacr ale lui Daubechies, deoarece:
min min Ng Nh = 1 = 1 2N & , max max N = 0 = N 2 N 2 h g

(3.67)

urmtoarele ecuaii recursive rezult direct din (3.65) i (3.66):


min Nm def , p 2N + 1 min min N m+1,2 p = sign ( N m, p 2 N + 1) 2 ; max N m, p max def max N m+1,2 p = sign ( N m ) ,p 2 min Nm def ,p 1 min min N m+1,2 p +1 = sign ( N m, p 1) 2 . max Nm max def + 2 N 2 ,p max N m+1,2 p +1 = sign ( N m , p + 2N 2) 2

(3.68)

(3.69)

De aceast dat, iniializarea este dat de (3.62).


57

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

4.7.3. Evaluarea valorilor unei undine utiliznd bancul de filtre Revenim la reprezentarea de la pasul 4.2.6. a Algoritmului 3.1. Pentru a construi L modelul bazat pe undine, trebuie evaluate undinele discretizate m, p ,n , oricare ar fi eticheta ( m, p ) M P i deplasamentul n N m , p , ncepnd cu undina tat discretizat
L 0,0,0 . Legtura dintre undinele unui pachet i undina tat trebuie exploatat n acest scop. Fie ( m, p ) eticheta unui nod al arborelui binar, ales arbitrar. Unui astfel de nod i se asociaz att o secven de coeficieni undin de lungime finit cm , p , ct i un pachet

{ }

m , p ,n nZ

de undine continue. Reamintim c adncimea m este asociat operaiei de


m

scalare (definiia (3.14)), n timp ce n este deplasamentul de decalare temporal (definiia (3.15)). Azimutul p 0, 2 1 joaca aici un rol dublu. n primul rnd, el indic poziia exact a pachetului n arborele binar. n al doilea rnd, n funcie de paritate, sunt difereniate pachete de nalt i de joas frecven. Mai precis, dac p este par (adic p 2N ), atunci pachetul se refer la frecvene locale joase, iar dac p este impar (adic p 2N + 1), sunt referite frecvene locale nalte. Aici local nseamn divizarea oricrei sub-benzi, la rndul su, n dou noi sub-benzi: una de joas frecven i una de nalt frecven, ca n Figurile 3.4 i 3.5. Cteva prelucrri directe aplicate asupra EDL i EDL conduc la urmtoarele ecuaii recursive ntre pachetul de undine al nodului ( m, p ) i cel al nodului printe:

Evident, 0,0,0

Nh , p 2N hk m1, p ,2 n+ k min 2 k = Nh m , p ,n N max , nZ . (3.70) g g k p 1 , p 2N + 1 m 1, ,2 n + k min k N = 2 g (undina tat) i 0,1,0 (undina mam). Aadar, teoretic, undinele
max

discretizate rezult prin utilizarea ecuaiilor recursive (3.70). Exist dou abordri n acest sens: implementarea direct a ecuaiei (3.70) sau utilizarea bancului de filtre. Dei a doua abordare necesit mai multe prelucrri, este mai elegant i conduce la o procedur eficient. De aceea, este descris n continuare. Oricare ecuaie dintre cele dou ale ansamblului (3.70) poate fi analizat separat, dar utiliznd acelai raionament. Dup o schimbare natural de indice, prima din ele devine:

m , p ,n (t ) =

max Nh +2n

min k = Nh +2n

h[k 2n]

p m 1, ,k 2

(t ) =

max Nh +2n

min k = Nh +2n

h[2n k ]

p m 1, ,k 2

(t ) , t R . (3.71)

Interpretarea ecuaiei (3.71) este urmtoarea: indicele de sumare nu are influen asupra timpului continuu t R , dar modific deplasamentul undinelor. Mai precis, din (3.71), rezult direct urmtoarea identitate:

m , p , (t ) h p (t ) 2 , t R . m 1, , 2

(3.72)

Ecuaiile (3.68) i (3.72) arat c, pentru orice moment de timp t R , rspunsul la impuls oglindit al filtrului trece jos ( h ) este n convoluie cu secvena discret de lungime finit de mai jos:
58

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

m1, p , N min (t ), m1, p , N min +1 (t ), m 1, p / 2 m 1, p / 2 2 2

p max m 1, , N m 1, p / 2 2

(t ) .

(3.73)

Rezultatul (de asemenea o secven de lungime finit) este dup aceea decimat, pentru a obine urmtoarea secven:

min m, p , Nm ,p

(t ), m , p , N min +1 (t ),
m, p

, m , p , N max (t ) .
m,p

(3.74)

Se observ din nou c momentul de timp este pasiv n relaiile (3.72)-(3.74), adic nu joac un rol major n calcularea secvenelor. Similar, a doua ecuaie din (3.70) implic:

m , p , (t ) g p 1 (t ) 2 , t R . m 1, , 2

(3.75)

Reunind ecuaiile (3.72) i (3.75) i incrementnd adncimea, procesul recursiv poate fi reprezentat ca n Figura 3.10.

m, p , N m min (t ) ,p def ( t ) min m, p , N m , p +1 m, p (t ) = max (t ) m , p , N m, p

~ g

Analiz

(t ) m+1,2 p+1, Nm min +1,2 p+1 ( t ) m+1,2 p+1, Nm def min +1,2 p+1 +1 = m+1,2 p+1 (t ) (t ) max m + 1,2 p + 1, N 1,2 1 m + p +

h
I

(t ) m+1,2 p, Nm min +1,2 p ( t ) m+1,2 p, Nm def min +1,2 p +1 = m+1,2 p (t ) ( t ) max m + 1,2 p , N m+1,2 p

Figura 3.10. Utilizarea bancului de filtre pentru calcularea valorilor undinelor. Intrarea i ieirea procedurii sunt mpachetate adecvat n vectori (sau secvene de lungime finit). Undina tat contribuie la iniializarea procedurii. Astfel, dac m = p = 0 , vectorul iniial al intrrii este urmtorul:

0,0 (t ) = 0,0, N min (t ) 0,0, N min +1 (t ) 0,0 0,0 = ( t N


min 0,0

def

0,0, N max (t ) = 0 ,0 1) (t N
max 0,0

) (t N

min 0,0

(3.76)
T

, t R.

Evaluarea undinei tat la toate momentele specificate n (3.76) poate fi realizat utiliznd Algorithmul Daubechies-deRham (Algoritmul 3.3) Astfel, n cazul n care undina tat este discretizat cu rezoluia L , vectorul iniial devine:
min min L L L 0,0 [k ] = 0,0 k N 0,0 0,0 k N 0,0 1 def max L 0,0 k N 0,0 , k Z . (3.77) T

59

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

suportului undinei tat, doar puine elemente ale vectorului 0,0 [ k ] sunt nenule. Este
L

n consecin, schema de calcul din Figura 3.10 poate fi direct utilizat, cu urmtoarele uoare modificri formale: momentul de timp t devine momentul normalizat k , i vectorii (ca i undinele pe care le includ) primesc de asemenea indicele superior L . Evident, nu toate valorile vectorului iniial (3.77) sunt nenule. Dimpotriv, pentru c lungimea serie de timp originale, N y , este, de regul, mult mai mare dect lungimea adevrat, totui, c, pe msur ce indicele rezoluiei L crete, numrul de elemente nenule crete de asemenea. L Dac 0,0 [ k ] este un vector nul, ieirile schemei de calcul sunt evident nule. Pentru a evita acest comportament, este suficient ca timpul normalizat k s aparin mulimii:
min min max max N 0,0 + N , L , N 0,0 + N , L . 0 min 0,0 + 1) , ( N0,0

(3.78)
0 min 0,0 + 2) , ( N0,0

De exemplu,n cazul undinelor ortogonale ale lui Daubechies, definite de parametrul N i indicele de rezoluie

L =0,

vectorii

iniiali

0 min 0 max 0,0 + 3) i 0,0 + 1) arat ca mai jos: ( N0,0 ( N0,0

T 0 ( N min + 1) = (1) ( 0 ) = 0 0 0,0 0,0 T 0 N min + 2 = 2 1 0 = 0 0 ( ) ( ) ( ) ( ) 0,0 0,0 . (3.79) T 0 min 0 ( 3) ( 2 ) (1) ( 0 ) = 0 0,0 ( N 0,0 + 3) = 0 T max N N N + = = 1 0 2 1 0 2 2 2 1 ( ) ( ) ( ) ( ) ( ) 0,0 0,0

Se poate vedea cum este construit vectorul iniial: fereastra inversat a undinei tat gliseaza pe el, ncepnd de sus. Astfel, chiar i vectorul iniial poate fi construit recursiv. Paralelismul Algoritmului 3.1 este o proprietate intrinsec a acestuia, derivat din utilizarea bancurilor de QMF. Este clar c expandarea att a arborelui binar utilizat pentru evaluarea coeficienilor undin, ct i a meta-arborelui utilizat n determinarea Transformatei Undin de entropie minim, beneficiaz de procesarea n paralel a urmailor oricrui nod, respectiv meta-nod. Deocamdat, predictorul FORWAVER este proiectat n versiunea uni-canal. Cu alte cuvinte, seria de timp este uni-dimensional. El ar putea fi rulat n paralel n cadrul minireelei de calculatoare, pentru fiecare canal al oricrui bloc de date multi-dimensional. Cu toate acestea, se anvizajeaz proiectarea unei versiuni multi-canal a acestui algoritm, care, probabil, va apela din nou la strategia PSO pentru a determina modelul MIMOARMA inclus n modelul cu undine. Lista programelor i rutinelor pachetului FORWAVER este inclus n anexele manualului de utilizare [ASTI09]. Principalele rutine ale predictorului sunt: Daub (Algoritmul lui Daubechies), dwt_analysis (implementarea Transformatei Undin Discrete pe ramura de analiz), dwt_model (construcia modelului de predicie bazat pe undine ortogonale cu suport compact) IDA_star (procedura IDA*), phi_Rham, psi_Rham (Algoritmul Daubechies-deRham), rough_model (construcia modelului ARMA grosier) i prediction_quality (evaluarea calitii prediciei). Algoritmul FORWAVER a fost publicat n [SCI08] (indexat ISI) lucrare anexat n finalul acestui raport de cercetare. El este de asemenea inclus n partea de aplicaii a crii [SSP09], n curs de apariie la Editura Academiei Romne.
60

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

4. Diagnoz de defecte cu ajutorul dicionarelor timp-frecven-scal


Sistemul UMAPID nu este destinat doar identificrii i prediciei de date. El poate rezolva i unele probleme legate de diagnoz de defecte operaie care este n mod natural conectat cu proprietatea de mobilitate. Noile tehnologii de proiectare a sistemelor (n special automate) prevd includerea toleranei la defecte printre prescripiile iniiale. Aceasta nu este ntotdeauna o cerin comod, att din punctul de vedere al costurilor de fabricaie (care poate crete sensibil), ct i din cel al proiectrii n sine (care trebuie s fie predictiv i s se bazeze pe experiena apariiei de defecte n cursul utilizrii de sisteme similare cu cel proiectat). Probabil c domeniul aviaiei i al tehnicii spaiale este cel mai avansat n direcia integrrii toleranei la defect, avnd n vedere gradul de periculozitate la care este expus operatorul uman sau pierderile materiale importante pe care le-ar cauza funcionarea defectuoas. Totui, o larg categorie de sisteme artificiale sau naturale nu includ mecanisme de prevenie i combatere a defectelor. Pentru o parte dintre acestea, este util existena unor doctori, care s se deplaseze la faa locului i s ofere mcar un prim diagnostic al funcionrii anormale a sistemului pacient. Acesta este i rolul unitii mobile care a fcut obiectul proiectului de fa. n aceast seciune, va fi descris un algoritm complex de detecie de defecte, numit GAMP, implementat la nivelul sistemului UMAPID. El este destinat n special sistemelor mecanice, dar poate fi extins, pe baza acelorai principii, ctre alte tipuri de sisteme cu expunere la apariia de defecte. Proveniena numele algorimului va fi dezvluit mai trziu, dup nelegerea conceptelor care l fundamenteaz. 4.1. Despre dicionarele timp-frecven-scal Proprietatea de ortogonalitate care guverneaz abordarea anterioar poate fi relaxat. n 1992, a aprut o idee extrem de interesant, care, aparent, iese din cadrul Teoriei multirezoluie. Rezultatul obinut plecnd de la aceast idee a fost publicat la finele anului 1993 de ctre Stphane Mallat, n colaborare cu Siefen Zhong (un doctorand al su la acea dat) [MaZh93]. Noua idee se refer la organizarea familiilor de undine nu n pachete, ci ntr-un dicionar de forme de und. Un cuvnt n acest dicionar l reprezint o versiune scalat, translatat n timp i, eventual, modulat armonic, a unei ferestre mam, adic un atom timp-frecven-scal. Cuvintele pot sau nu s fie ortogonale, dar ele trebuie s genereze spaiul uzual de semnale sau, cel puin, sub-spaiul din care face parte semnalul analizat. n acest context, analiza de semnal este similar traducerii unei propoziii sau fraze dintr-o limb n alta, cu ajutorul unui dicionar. De exemplu, se ncearc traducerea n limba romn a unei celebre aseriuni a lui Arhimede: . Prima operaie const n gsirea unui dicionar adecvat. Urmeaz cutarea celor 3 cuvinte n dicionar i traducerea lor. Astfel, se gsesc urmtoarele semnificaii: (citit [en]) = n; (citit [arheos]) = vechime, antichitate; (citit [aritmos]) = numr, aritmetic. Plecnd de la asamblarea brut a cuvitelor traduse i innd cont de stilul limbii romne, se gsete o traducere acceptabil: La nceput a fost numrul. Etapele parcurse pentru traducerea aseriunii lui Arhimede pot fi nti adaptate i apoi adoptate n analiza de semnal cu un dicionar de undine. Adaptarea se bazeaz n principal pe definirea unui criteriu de potrivire (matching) cu ajutorul cruia se poate identifica o posibil colecie de cuvinte din care este format fraza reprezentat de semnal. n definirea criteriului, rolul principal l joac proprietatea de proiecie. Un cuvnt al dicionarului de forme de und este mai potrivit dect altul, pentru un semnal dat, dac proiecia sa pe semnal are energie mai mare. Odat acest criteriu stabilit, urmeaz
61

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

identificarea celor mai potrivite cuvinte n urma unui proces iterativ numit urmrire (pursuit). n final, semnalul este nlocuit de colecia de cuvinte potrivite extrase din dicionar (mpreun cu valorile coeficienilor de proiecie), iar semnalul rezidual rmas este ignorat. Ideea urmririi prin potrivire este descris pe larg n urmtoarele paragrafe ale seciunii. Ortogonalitatea nu mai joac rolul principal n cursul urmririi prin potrivire. Din contr, aa cum dicionarele lingvistice sunt redundante (unui cuvnt putndu-i-se asocia mai multe sensuri), dicionarul de forme de und include o familie redundant de cuvinte (atomi timpfrecven-scal nu neaprat ortogonali). Redundana ca proprietate opus ortogonalitii (sinonim neredundanei) este chiar necesar n anumite aplicaii, cum ar fi cele de interpretare a imaginilor sau diagnoz de defect. Alte aplicaii de exemplu de compresie i codaj ale semnalelor nu suport redundana, performanele fiind cu att mai bune cu ct realizrile efective ale cuvintelor din dicionar sunt mai aproape de ortogonalitate. Aa cum s-a menionat n seciunea precedent, una dintre cele mai interesante i importante paradigme din PS se refer la separarea dintre componenta util i componenta parazit (uzual afectat de diferite perturbaii numite zgomote) care sunt combinate (de o manier necunoscut) ntr-un semnal. Reamintim c aceast paradigm este referit i sub numele de problem a deparazitrii (denoising). Vom relua discuia pe scurt, n contextul dicionarelor de forme de und. De regul, datele utile codific informaia principal transportat de un semnal, n timp ce zgomotul are o natur nedeterminist i distorsioneaz aceast informaie. Zgomotul este considerat principala cauz a aspectului fractal relevat de semnalele practice, dei datele utile pot avea de asemenea o natur fractal. Dificultatea separrii este astfel cu att mai mare, chiar i n cazul ipotezei simplificatoare a superpoziiei liniare dintre cele dou componente (ipotez infirmat, totui, n numeroase aplicaii). De fapt, precizia separrii depinde sensibil de maniera n care sunt definite cele dou componente. Ori, formularea de definiii clare, riguroase i, mai ales, generale, ale componentelor de semnal se dovedete a fi extrem de dificil, dac nu imposibil. Din acest motiv, orice metod care ofer o soluie problemei de deparazitare (deci, care propune o tehnic de deparazitare) nu poate evita urmtorul efect: o parte a componentei utile este interpretat ca zgomot, fiind atenuat, n timp ce o parte a zgomotului este considerat util, fiind motenit de semnalul (pseudo-)deparazitat. Cantitatea de zgomot care afecteaz un semnal este cuantificat de raportul semnalzgomot, notat tradiional prin SNR (de la denumirea n limba englez Signal-to-Noise Ratio). Acesta nu poate fi determinat cu precizie, dar poate fi estimat, folosind un model matematic al sursei de zgomot. Dac f este un semnal uzual, iar v este zgomotul integrat, atunci SNR se poate defini astfel:

2f SNR( f , v ) = 10 lg 2 v
def

(4.1)

(msurat n dB). n definiia (4.1) (neunic, totui) 2f i 2 v desemneaz dispersiile semnalului, respectiv zgomotului. Acestea sunt entiti statistice care pot fi aproximate folosind Ipoteza ergodic. De exemplu, dac semnalul este discret i are N eantioane, o aproximaie a dispersiei acestuia este dat de raportul dintre energie i numrul de eantioane. Prin urmare, n practic, o aproximaie a SNR este dat de:

E( f ) SNR( f , v ) 10 lg . E (v)

(4.2)

Cu ct SNR se apropie de valoarea nul, cu att ponderea zgomotului n cadrul semnalului este mai mare. Absena zgomotului este exprimat de valoarea ideal, infinit, a SNR.
62

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

n mare, zgomotele pot fi descrise prin intermediul unui numr finit de parametri. De aceea, modelele asociate sursei de perturbaii se afl adesea la intersecia dintre PS i IS [SoSt89], [PrMa96], [SCS05]. Este vorba despre modelele auto-regresive (utilizate n cadrul algoritmilor precedeni, bazai pe modele de identificare). Acestea sunt de fapt funcii de sistem ale unor filtre care funcioneaz la intrare cu zgomotul total necorelat i impredictibil numit alb. Filtrele ofer la ieire un alt zgomot dar colorat. Acesta este cel care se suprapune peste datele utile. Odat un model al sursei de zgomot determinat, se pot estima, cu precizie controlat, valorile zgomotului din cadrul unui semnal. Printre altele, se poate evalua (tot aproximativ) SNR. Este evident c, dac o tehnic de deparazitare funcioneaz corect, SNR nainte de deparazitare este inferior SNR de dup deparazitare. Cum ambele valori sunt finite, rezult imediat c nu se poate trage o line de demarcaie clar ntre componenta util i cea parazit a unui semnal. Aceast ambiguitate de separare este deliberat conservat n denumirea alternativ a perturbaiei: reziduu de semnal. Este posibil creterea SNR n manier controlat, pn la o valoare acceptabil, prin diminuarea energiei reziduurilor. Aceasta este i proprietatea cea mai important a metodei de analiz cu ajutorul unui dicionar de undine. Problema deparazitrii devine mai dificil n cazul n care anumite zgomote sunt chiar dorite n componenta util. n acest caz, problema este aceea a separrii zgomotelor cu naturi diferite. De exemplu, semnalul de vibraie emis de un sistem mecanic sau biologic relev urmtoarea caracteristic interesant: dac sistemul funcioneaz normal, vibraia este cvasi-staionar, cu natur armonic i un SNR relativ ridicat; dac sistemul este ameninat de unul sau mai multe defecte, vibraia devine din ce n ce mai nestaionar i natura ei armonic este afectat de un semnal fractal, din ce n ce mai puternic, pe msur ce defectul/defectele devine/devin mai severe, scznd SNR. Zgomotele datorate defectelor se combin ntr-o manier necunoscut ntre ele i cu zgomotul extern din mediul nconjurtor n care evolueaz sursa de vibraii. Distincia dintre zgomotele produse de diferite tipuri de defecte este extrem de important n detecia automat acestora, dar nu este uor de realizat. Prin definiie, operaia care const n deparazitatea (parial) simultan cu compresia semnalului se numete compactare (de semnal). Complexitatea unei metode de compactare depinde de valoarea iniial a SNR. Cu ct zgomotul n care este scufundat partea util a semnalului este mai intens, cu att metoda compactare trebuie s fie mai complex. 4.2. Construcia i configurarea unui dicionar timp-frecven-scal Semnalul original poate fi considerat o fraz rostit de ctre o persoan ntr-o limb necunoscut. Mai mult, dac semnalul este afectat de perturbaii, este ca i cum persoana nu stpnete acea limb, vorbind cu un anumit accent i, eventual, cu greeli de pronunie i/sau gramaticale. Problema care se ridic este atunci aceea de a descompune fraza n cuvinte corecte, cu neles bine precizat, extrase dintr-un dicionar i, eventual, de a comprima semantica frazei ntr-un numr ct mai mic de cuvinte. Prima condiie pentru rezolvarea problemei este aceea de a gsi un dicionar corespunztor. n cazul utilizrii undinelor, acesta va putea fi construit i configurat plecnd de la o fereastr mam, prin aplicarea n ordine a 3 operatori: scalare ( , de factor > 0 ), translaie temporal ( q , de ecart R ) i modulaie armonic ( , de pulsaie R ). Aceste operaii se definesc astfel:

(q

f ) ( t ) = f ( t ) , t , R .
def

(4.3) (4.4)

( f ) (t ) =

def

1 t f , t R , R +.
63

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

( f ) (t ) = e
def

j t

f (t ) , t , R .

(4.5)

Prin discretizare, primele dou au expresiile (3.14) i (3.15). Pentru ultima, se poate scrie c:

( f ) (t ) = e
k def

kt 2

f (t ) , k Z + , t R .

(4.6)

De notat c, n definiiile (3.14), (3.15) i (4.6), timpul pstreaz variaia continu. Prin discretizarea acestuia, se obine un veritabil dicionar discret. Fiecare dintre cei 3 operatori atomici produce o schimbare a poziiei, formei sau numrului de oscilaii ntr-o fereastr mam. Aceasta atrage dup sine modificarea corespunztoare a segmentului de semnal decupat. n Figura 4.1, este ilustrat maniera n care o fereastr mam (de exemplu de tip Gaussian) poate fi modificat prin aplicarea operatorilor atomici.
Translaie temporal w Modulaie armonic w Scalare w
A 0

t0 ntrziere >0

t0 Re(w)

0 A/

t0-3

t0

t0+3

q- w

w t
0

contracie 0<<1

0
-

t0 t0+

t0 Im(w)

devansare q w <0

t0t0 (t0-3) (t0+3) dilatare >1 t0 t0

w
A/

0 t0-|| t0

t0

(t0-3)

(t0+3)

Figura 4.1. Efectul operatorilor atomici aplicai asupra unei ferestre de baz. Semnul ecartului indic i sensul translaiei temporale: >0 nseamn deplasare spre dreapta (adic ntrziere), n timp ce <0 nseamn deplasare spre stnga (adic devansare). Acesta este motivul pentru care operatorul de translaie temporal (4.3) este notat prin q (cu minus) i nu prin q (cu plus). n ceea ce privete operatorul de scalare (4.4), raportul n care se afl factorul de scalare fa de unitate este de asemenea sugestiv. Astfel, factorii subunitari (<1) indic o deplasare spre interior a flancurilor ferestrei (adic o contracie), n timp ce factorii supraunitari (>1) sunt responsabili de deplasarea spre exterior (adic o dilatare). Se observ cu uurin c translaia temporal i modulaia armonic nu modific dimensiunea suportului ferestrei, n timp ce scalarea are efectul unei camere cu oglinzi care produce diferite deformri caricaturale ale ferestrei. Matematic, efectul operatorilor asupra suportului ferestrei (finit sau infinit) este urmtorul:
64

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

Supp ( q w ) = Supp ( w ) + = q + Supp ( w ) , R ;


def

(4.7) (4.8) (4.9)

Supp ( w ) = Supp ( w ) , R +.

Supp ( w ) = Supp ( w ) , R ;

Ultima definiie din (4.7) este pur convenional, pentru a permite o exprimare elegant. De notat c efectul scalrii suportului din (4.8) (adic de-a lungul abscisei) este nsoit i de o scalare a amplitudinii ferestrei n sens opus (adic de-a lungul ordonatei). Aceasta este o consecin a proprietii de conservare a energiei, verificat de ctre toi operatorii atomici (aa cum s-a artat n [StSt07] sau [SSP09]). Dicionarul conine astfel o infinitate (tripl, de puterea continuului) de cuvinte indexate dup cei 3 parametri ai operatorilor elementari. n varianta original publicat de Mallat i Zhong [MaZh93], dicionarul este construit folosind numai operaiile de scalare i translaie temporal. Extinderea dicionarului prin utilizarea operaiei de modulaie armonic poate conduce ns att la mbuntirea performanelor de compactare a semnalelor, ct i la lrgirea clasei de semnale ce pot fi traduse cu ajutorul acestuia. Pentru a ilustra principiul urmririi prin potrivire, se va construi, la nceput, un dicionar continuu indexat. n aplicaii, acest dicionar trebuie discretizat, fiind necesar o indexare discret a celor 3 parametri de indexare. Dicionarul poate fi chiar de tip discret cnd, n plus, include atomi timp-frecven-scal ca semnale discrete. Construcia dicionarului pleac aadar de la o fereastr mam stabil, de energie unitar, w . Aceasta poate fi o undin mam, o undin tat sau o alt fereastr de semnal. Alegerea ei se efectueaz lund n considerare clase de semnale care urmeaz a fi analizate (traduse). Energia este unitar pentru a distorsiona minimal semnalul tradus. (Reamintim c fiecare dintre cei 3 operatori elementari este conservativ, astfel c fiecare cuvnt al dicionarului va avea energie unitar.) Faptul c fereastra mam are spectrul concentrat ntr-o anumit band de frecvene nu este esenial, deoarece, prin modulaia armonic, spectrul atomilor din dicionar culiseaz, putnd ocupa orice poziie. Mai mult, orice atom poate fi considerat o fereastr mam a dicionarului. De exemplu, rolul de fereastr mam poate fi asumat de ctre semnalul Gaussian de energie unitar definit prin:
w( t ) =
def 4

(t t0 )2 1 , exp 2 2

t R .

(4.10)

Semnalul este centrat n momentul t0 R , iar deschiderea clopotului este controlat de parametrul > 0 . Se poate arta c momentul central verific urmtoarea proprietate de medie:
+ def

t0 =

t w(t ) dt
2

t w(t )
E ( w)

dt =

w(t ) dt

t w(t )

dt = t ,

(4.11)

unde E ( w) este energia ferestrei w (integrala modulului la ptrat). La trecerea n frecven, fereastra mam (4.387) conserv caracterul Gaussian:
W ( j ) = 2 2 + j t0 e exp 2 , 4 R ,

(4.12)

dar deschiderea clopotului este controlat de inversul parametrului (cu respectarea Principiului de incertitudine). De aceast dat, pulsaia central este nul. Ea verific ns urmtoarea proprietate de medie:
65

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare


+ def

0 = 0 =

W ( j ) d
2

W ( j )
E (W )

d =

W ( j ) d
2

W ( j )

d = .

(4.13)

Proprietile (4.11) i (4.13) sunt verificate de ctre toi atomii dicionarului i pot fi extinse cu caracter de definiii la dicionarele generate de alte ferestre mam dect cea Gaussian. Cu ajutorul lor se vor putea evalua momentul central i pulsaia central a oricrui atom. Fereastra mam Gaussian este preferat n multe aplicaii, datorit bunei localizri n timp i frecven n jurul acestor parametri centrali (proprietate descris n [StSt07] sau [SSP09]). Se poate arta c suporturile practice ale semnalelor (4.10) i (4.12) au lrgimea 6 , respectiv 6 / . Astfel, fereastra Gaussian de baz are o lrgime practic de band egal cu [ 3/ ,3/ ] . Lrgimile de band ale celorlali atomi constituie versiuni scalate i translatate n pulsaie ale acesteia. n cazul altor ferestre, se apeleaz adesea la conceptul de lrgime de band la
+ + jumtatea puterii (spectrale): 1/ 2 = c c . Pulsaiile de tiere c i c sunt soluii ale
def

ecuaiei:

W ( ) =
2

1 2 W ( 0 ) , 2

(4.14)

care arat de unde provine terminologia utilizat. n cazul ferestrei Gaussiene, + c = c = ln 2 / , ceea ce conduce la 1/ 2 = 2 ln 2 / . Aplicnd cei 3 operatori elementari (n ordinea: scalare, translaie temporal, modulaie armonic), se obine cuvntul generic, n timp continuu, al dicionarului:

w( ,,) (t ) = ( q w ) (t ) =
def

1 j t t e w , t R ,

(4.15)

Indexul triplu ( , , ) se mai noteaz prin , pentru uurina exprimrii. innd cont de proprietile Operatorului Fourier (OF) [PrMa96], [StD96], relativ la operatorii elementari, efectul su asupra atomului (4.15) este urmtorul:
G ( q w ) ( j ) = q 1/ G ( w ) ( j ) = = e j ( ) W ( j( ) ) , R .

(4.16)

Ecuaia (4.16) arat, de fapt, c dicionarul acoper ntreaga plaj de frecvene, prin operaii de scalare i translatare a benzii principale specifice ferestrei mam (de exemplu, banda la jumtate de putere sau intervalul 3/ , n cazul ferestrei Gaussiene).
(1,0,0) Dicionarul poate fi notat prin E( w) = w R* . Se poate + R R , unde w w
def

arta c, dac fereastra mam satisface restricia de bun localizare n timp i frecven, E( w) este un cordaj (dens) al spaiului semnalelor uzuale (stabile i de energie finit) H . Cum acest spaiu este separabil (adic admite baze numrabile), din dicionarul E( w) se poate extrage o mulime numrabil de atomi, notat natural prin E ( 0 0 0 ) ( w) = E 0 ( w) , care, n anumite condiii, continu s fie un cordaj. Condiiile sunt impuse asupra * * parametrilor de discretizare 0 = ( 0 , 0 , 0 ) R* + R + R + . (n [DaI90], sunt precizate astfel
, ,

de condiii pentru familiile discretizate de undine.) De exemplu, se poate impune restricia ca paii de discretizare n timp i pulsaie s verifice inegalitatea:
66

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

2 , 0

(4.17)

provenit direct din Principiul de incertitudine (dar i dintr-un rezultat publicat n [DaI90]). De asemenea, alegerea cea mai frecvent a bazei de scalare este 0 = 1/ 2 (sau 0 = 2 ). n fine, potrivit rezultatelor din [DaI90], dac pasul de discretizare temporal nu depete un anumit prag (care depinde de 0 ), atunci familia discretizat de atomi este un cordaj al spaiului H . Elementul generic al dicionarului discretizat E 0 ( w) se poate exprima ca mai jos:
m / 2 j k 0 t m w[ m,n ,k ] (t ) = k 0 q n0 0 w (t ) = 0 e w ( 0 ( t n0 ) ) , t R , def
m

(4.18)

unde, de aceast dat, indicii sunt discrei ( m, n, k Z ), iar w w[0,0,0] . Dicionarul discretizat constituie sursa unei familii discrete de atomi timp-frecvenscal, care va juca rolul de dicionar discret. Spre deosebire de dicionarele anterioare, acesta va trebui s aib, n plus, un numr finit de cuvinte, ntocmai ca un dicionar lingvistic. Numrul finit de atomi discrei este o consecin direct a faptului c semnalele analizate sunt de band limitat i au un numr finit de eantioane. Aceasta implic automat c dicionarul discret nu poate genera ntregul spaiu al semnalelor uzuale discrete, H , dar poate fi configurat s genereze un subspaiu al acesuia care conine partea util a semnalului analizat. n acest fel, dicionarul discret are o natur adaptiv la semnalul analizat sau la clasa din care face parte acesta. Configurarea se bazeaz pe acordarea dintre spectrele ferestrei mam i semnalului analizat, aa cum arat raionamentul care urmeaz. Atomii discrei se obin prin discretizarea atomilor continuali ai dicionarului E 0 ( w) cu perioade de eantionare adaptate scalei. Dac fereastra mam este eantionat cu perioada Ts > 0 , atunci elementul generic al dicionarului discret se exprim prin:
m / 2 j kp 0Ts m w[ m,n ,k ] [ p ] = k 0 q n0 0 w [ p ] = 0 e w ( 0 ( pTs n0 ) ) , p Z , def
m

(4.19)

Familia atomilor discrei (4.19) este notat prin E 0 [ w] . Din aceast familie trebuie s fac parte numai atomii pentru care fenomenul de aliere n frecven [StD96] este insesizabil sau suficient de atenuat. De exemplu, se pot reine numai atomii a cror amprent spectral este inclus n banda [ / Ts , + / Ts ] . Amprenta spectral se poate evalua n diferite moduri, dar, n acest context, ea va fi identic benzii la jumtate de putere. Cum spectrul atomului (4.19) este centrat n jurul pulsaiei normalizate [ m,n ,k ] = k 0 , pulsaiile normalizate de tiere la jumtate de putere depind de aceasta, dar nu depind de indicele translaie temporal, n . De exemplu, n cazul ferestrei Gaussiene, m pulsaiile de tiere sunt: c ln 2 / . n consecin, dicionarul discret ,[ m ,n ,k ] = k 0 0 E 0 [ w] va include numai atomii care verific cel puin una dintre cele dou perechi de inegaliti de mai jos:

+ ; c . c ,[ m ,n ,k ] ,[ m ,n ,k ] Ts Ts Ts Ts

(4.20)

Acestea nu limiteaz ambele game de variaie a indicilor de scal m i modulaie k la mulimi finite, dar una dintre ele este finit pentru fiecare valoare a indicelui pereche. De exemplu, n cazul ferestrei Gaussiene, pentru orice indice de scal m Z , indicele de + modulaie k variaz n mulimea finit K m , Km , unde:
67

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

ln 2 ln 2 + Km = m + . & Km = m T T T T 0 0 s 0 s 0 0 s 0 s

(4.21)

Pentru a gsi i limitele de variaie ale celorlali doi indici, este necesar acordarea dicionarului la semnalul analizat. Aceast operaie se refer la localizarea atomilor n planul timp-frecven-scal, obinut prin concatenarea tuturor planelor timp-frecven corespunztoare cte unei scale constante. n acest fel, se evit precizarea unei relaii explicite ntre scal i frecven, meninnd un grad de libertate n plus att n reprezentare, ct i n interpretarea acesteia. Se consider c semnalul original (discret) cu N y eantioane este esenial localizat n banda normalizat

[l , h ]

(eventual, cu l = h ). Dac se cunoate perioada de

eantionare a acestuia, atunci valoarea ei va fi utilizat i la eantionarea ferestrei mam. Atunci, pentru fiecare indice de scal m Z , planul timp-frecven corespunztor scalei m (numit ad hoc i latice timp-frecven curent) conine maxim N y K m celule 0 dreptunghiulare de arie constant asociate perechilor de indici {n, k} sau, mai precis, atomilor w[ m,n ,k ] , aa cum ilustreaz Figura 4.2.

l + Km 0,m l + (Km-1) 0,m


Frecven

Scala: 0

l + 0,m l 0
m

t0+N l,m0

Timp n m 0 t0+(N l,m+1)0

0m t0+N r,m0

Figura 4.2. Laticea curent din planul timp-frecven-scal. Aadar, pentru fiecare latice timp-frecven, n N l ,m , N r ,m , iar k 0, K m , unde:
def l 1 Km = h (4.22) + . 2 0,m n definiia (4.22) a numrului maxim de sub-benzi, ar fi trebuit utilizat parametrul de discretizare n frecven 0 , ca pas de eantionare a benzii [ l , h ] . ns acesta trebuie s

depind de scala curent, avnd n vedere c fiecare celul a laticii este n mod unic asociat unui atom w[ m,n ,k ] din dicionarul discret. Astfel, atomii adiaceni w[ m,n ,k ] i w[ m,n ,k +1] (care corespund unei perechi de celule vecine n latice) au spectre nvecinate, centrate n k 0 , respectiv ( k + 1)0 . Nici un alt atom nu se interpune, n sensul c spectrul oricrui atom diferit de cele dou nu poate fi centrat n nici o pulsaie din banda [ k 0 ,( k + 1)0 ] . n consecin, este natural s se considere c sub-benzile la jumtate de putere ale spectrelor atomilor adiaceni sunt disjuncte i corespund sub-benzilor asociate celulelor vecine ale laticii. Spectrele se suprapun totui n afara sub-benzilor la jumtate de putere, fapt care atest redundana dicionarului. (Reamintim c ortogonalitatea este sinonim cu sub-benzi disjuncte.)
68

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

Condiia de disjuncie la jumtate de putere revine practic la egalitatea pulsaiilor de + tiere consecutive, c ,[ m ,n ,k ] = c ,[ m ,n ,k +1] , din care rezult clar c parametrul 0 depinde de indicele de scal. De exemplu, pentru fereastra mam Gaussian, rezult:

k 0 +

ln 2 ln 2 = ( k + 1)0 m m 0 0

0 =

2 ln 2 def = 0,m . m 0

(4.23)

Soluia (4.23) relev c, n general, exist o legtur indirect ntre scal i frecven. n particular, pentru fereastra Gaussian, frecvena variaz exponenial n raport cu scala, fenomen ateptat, avnd n vedere localizarea atomilor n planul timp-scal, descris n [SSP09]. De altfel, n contextul dicionarului E 0 [ w] , pavajul rectangular variabil al planului timp-scal este acum rafinat prin nlocuirea fiecrui grup de celule corespunztoare unei scale constante cu un pavaj rectangular constant, a crui granularitate depinde de factorul de scal. Acesta este, de fapt, planul timp-frecven-scal. Considernd c dicionarul E 0 [ w] conine numai atomii w[ m,n ,k ] redefinii prin:

w[ m,n ,k ] [ p] = =

def

l + k 0 , m

q n0 0 w [ p ] =
m

m / 2 0

j p ( l + k 0 , m )Ts

w(

m 0

( pTs n0 ) ) ,

(4.24)

pZ,

pentru m M l , M r , n N l ,m , N r ,m i k 0, K m , rmn de evaluat limitele de variaie ale indicilor de scal i translaie temporal. Fiecare celul din laticea timp-frecven a Figurii 4.2 este asociat elementelor principale ale unui atom timp-frecven la scal constant: momentul central t0,[ m,n ,k ] (evaluat mai jos, n ecuaia (4.27)), respectiv pulsaia central, 0,[ m,n ,k ] = l + k 0,m . Avnd n vedere ns c expresiile acestora conin constante cunoscute, exprimarea axelor laticii poate fi simplificat considernd numai indicii de ecart temporal i de modulaie armonic. Astfel, aa cum este sugerat i n figur, fiecare atom timp-frecven poate fi localizat n latice pur i simplu de coordonatele ntregi ( n, k ) . nainte de a determina numerele ntregi M l , M r , N l ,m i N r ,m , trebuie precizat pasul de translaie temporal, 0 . Pentru a menine un grad de redundan suficient de ridicat, acest pas poate fi ales egal cu perioada de eantionare, Ts . Dac aceasta nu este precizat pentru semnalul analizat (discret), atunci ea poate fi evaluat plecnd de la numrul de eantioane ale acestuia i dimensiunea suportului ferestrei mame continuale. De regul, numrul de eantioane N y este o putere a lui 2, avnd n vedere c factorul de scal este 0 = 1/ 2 (dar aceasta nu constituie o restricie). mprind dimensiunea n urma eantionrii cu aceast perioad, fereastra mam discretizat va avea N y eantioane, ca i semnalul original. De exemplu, n cazul ferestrei Gaussiene, perioada de eantionare se poate evalua folosind suportul de dimensiune 6 , ceea ce conduce la: suportului practic al ferestrei mam la ( N y 1) , rezult valoarea perioadei de eantionare.

Ts = 6 / ( N y 1) . Dac nici nu poate fi precizat, atunci se alege arbitrar Ts = 1 , rezultnd


def

automat: = ( N y 1) / 6 . Tot n cazul acestei ferestre, momentul central trebuie poziionat


def

la jumtatea suportului: t0 = ( N y 1) Ts / 2 .

Fereastra mam poate fi considerat cel mai dilatat atom din dicionar, avnd n vedere c atomii particip la evaluarea produselor scalare cu semnalul original. Astfel, M l = 0 . Ceilali atomi vor fi contractai (adic indicele de scal va fi nenegativ).
69

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

Limita de contracie este dat de spectrul cel mai dilatat, care corespunde atomului nemodulat armonic celui mai contractat. Evident, amprenta spectral a acestui atom trebuie cel mult s se suprapun peste spectrului semnalului original. Cu alte cuvinte, + lrgimea benzii la jumtate de putere ( c ,[ m ,n ,0] c ,[ m ,n ,0] ) trebuie s fie cel mult egal cu lrgimea de band a semnalului ( r l ). Din aceast ecuaie va rezulta valoarea maxim a indicelui de scalare, M r = M . De exemplu, n cazul ferestrei Gaussiene:

( r l ) + c = M , ,[ m ,n ,0] c ,[ m ,n ,0] r l m log 0 2 ln 2


innd cont c 0 = 1/ 2 < 1 .

(4.25)

n fine, pentru fiecare indice de scal m 0, M , fereastra mam contractat aferent se poate deplasa temporal ntre limitele date de urmtoarea restricie marginal: momentul central (4.11) nu trebuie s depeasc limitele suportului temporal al semnalului original. Acest restricie are ca scop diminuarea efectelor marginale provocate de excentricitatea suporturilor semnalului original i atomilor aflai n poziii extreme, n evaluarea produselor scalare. Cteva calcule elementare arat c momentul central al atomului w[ m,n ,k ] este:
m m t0,[ m,n ,k ] = 0 t0 + n0 = 0 t0 + nTs ,

(4.26)

unde t0 este momentul central al undei mam. Restricia marginal conduce atunci la urmtoarele inegaliti:

0 t0,[ m,n ,k ]

m m 0 0 t0 t = N l ,m n N r ,m = ( N 1) 0 . ( N 1)Ts Ts Ts

(4.27)

Se observ cu uurin c ecarturile limit N l ,m 0 i N r ,m N y 1 au amplitudini maxime pentru m = 0 , respectiv m = M , iar diferena dintre ele este constant i egal cu N y 2 . Dicionarul de forme de und este acum construit i configurat n funcie de caracteristicile principale ale semnalului original. Parametrii necesari efecturi acestor operaii sunt enumerai n Tabelul 4.1. Lista acestora este redundant, n sensul c o parte dintre ei se pot deduce (folosind raionamentul de mai sus) dac ceilali sunt precizai a priori. Plecnd de la fereastra mam Gaussian (4.10), n stnga Figurii 4.3 sunt ilustrai civa atomi ai dicionarului generat de aceasta. Spectrele atomilor sunt figurate n partea dreapt. De exemplu, dac semnalul original este de tip audio CD i are N y = 211 = 2048 eantioane achiziionate cu frecvena de 44.1 kHz (specific datelor stocate pe CD), acest dicionar include aproximativ 4.4 milioane de cuvinte organizate pe 9 nivele de scalare. Figura pune n eviden anvelopa atomilor ilustrai, pentru a putea sesiza cu mai mult uurin efectul Principiului de incertitudine. Dicionarul discret E 0 [ w] definete o structur multi-rezoluie redundant local a spaiului H . Subspaiul generat de acesta este considerat suficient de bogat pentru a include i partea util a semnalului analizat, tocmai datorit operaiei de acordare. De altfel, definirea dicionarului E 0 [ w] constituie o manier de definire indirect a componentei utile. Cu toate acestea, construcia acesteia nu este o operaie simpl, n special din cauza numrului mare de cuvinte ale dicionarului.
70

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

Tabelul 4.1. Parametri care definesc un dicionar timp-frecven-scal discret. fereastra sau undina generatoare: w (de exemplu, Gaussian, caz n care ea este configurat preciznd parametrul de deschidere ); momentul central al ferestrei generatoare: t0 ; numrul eantioanelor semnalului original: N = 2 P ; frecvena de eantionare: Fs = 1/ Ts ; pulsaiile normalizate de tiere (estimate) ale semnalului original: l (joas) i

h (nalt); baza de scalare: 0 ; ecartul temporal de discretizare: 0 ; pulsaia fundamental de modulaie armonic (la scal nul): 0,0 ; indicele maxim de scalare: M ; indicii extremi de ecart temporal: {N l ,m }m0, M & {N r ,m }m0, M ;
numrul de sub-benzi de frecven ale fiecrei latici: {K m }m0,M .

Figura 4.3. Atomi timp-frecven-scal Gaussieni i spectrele asociate. 4.3. Algoritmul urmririi prin potrivire n pofida operaiei de acordare, semnalul original discret, notat prin y , nu aparine n mod necesar subspaiului generat de dicionarul cu care este acordat, E 0 [ w] . Pentru a pune n eviden faptul c i semnalul y contribuie la construcia i configurarea
0 0 (adic dicionarului, acesta poate fi renotat prin E y [ w] . Astfel, n general, y E y [ w]

semnalul nu face parte din subspaiul generat de dicionar), dar, datorit acordrii, distana 0 dintre y i E y [ w] este minimal.
0 nu este ns ntotdeauna dezavantajos. Proprietatea poate fi Faptul c y E y [ w]

exploatat pentru a defini componenta parazit (perturbatoare) a semnalului original, ca n Figura 4.4.
71

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

y yE

0 E y [ w]

Figura 4.4. Principiul deparazitrii semnalelor folosind un dicionar timp-frecven-scal. Astfel, componenta util, notat prin yE , se obine proiectnd semnalul original pe subspaiul
0 E y [ w] . Semnalul rezidual, y se determin efectund diferena dintre

semnalul original i componenta util. Acesta corespunde componentei parazite care trebuie nlturat sau analizat separat. Evident, ntre cele dou componente (definite doar convenional n aceast manier) exist o diferen clar numai dac proiecia yE se poate evalua cu precizie infinit. Altfel, ntre cele dou componente nu se poate trasa o linie de demarcaie clar. Cu toate acestea, demarcajul este cu att mai clar cu ct componenta util este estimat mai precis, utilizatorul avnd astfel posibilitatea s controleze cantitatea de zgomot care mai poate corupe componenta util. Redundana dicionarului ngreuneaz n mod esenial determinarea componentei utile, chiar dac, aparent, evaluarea proieciei semnalului original nu ar trebui s ridice probleme. Pentru evaluarea acestei componente cu precizie controlat, Mallat i Zhong au introdus conceptul de cel mai potrivit atom (cuvnt). Acesta este un atom al dicionarului cu proprietatea de a avea cea mai mare valoare absolut a coeficientului de proiecie pe semnalul curent analizat. Plecnd de la semnalul original y , se caut mai nti atomul cel mai potrivit corespunztor, notat prin w 0 , unde, prin definiie, 0 = [ m0 , n0 , k0 ] . Astfel,
0 y , w0 y , w , w E y [ w] .

(4.28)

Odat gsit, atomul cel mai potrivit traduce o parte din informaia transportat de semnal, astfel c proiecia semnalului pe acest atom poate fi nlturat prin scdere: 1 y y y , w 0 w0 .
def

(4.29)

notat prin w 1 (cu 1 = [ m1 , n1 , k1 ] ), verific proprietatea:

n definiia (4.29), 1 y este prima aproximare a reziduului y , aproximare care, probabil, continu s transporte o cantitate important de informaie util. De altfel, chiar i semnalul original poate fi considerat o astfel de aproximare, notat prin 0 y . Noul semnal pentru care se caut acum cel mai potrivit atom este acum 1 y . Atomul,

0 1 y , w1 1 y , w , w E y [ w] .

(4.30) (4.31)

iar reziduul urmtor este:

2 y 1 y 1 y , w1 w1 .

def

n general, irul de reziduuri succesive care aproximeaz reziduul ideal y verific urmtoarea relaie de recuren (numit i relaie de urmrire):

i +1 y i y i y , wi wi , i 0 ,
72

def

(4.32)

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

unde atomul curent cel mai potrivit, w i (cu i = [ mi , ni , ki ] ), verific proprietatea:


0 i y, wi i y , w , w E y [ w] ,

(4.33)

Procedeul iterativ continu pn cnd se verific urmtoarea inegalitate:

i y i +1 y
2

i y

E ( i y ) E ( i +1 y ) < , E ( i y )

(4.34)

unde > 0 este un prag de precizie predefinit. Dac inegalitatea (4.34) se verific pentru un indice I , atunci componenta util a semnalului este aproximat de combinaia liniar a celor mai potrivii I + 2 atomi determinai anterior:
yE i y , w i w i ,
i =0 I +1

(4.35)

Mai mult, componenta parazit este aproximat de reziduul I +2 y , care este aproape ortogonal pe subspaiul semnal original:
y i y , wi wi + I +2 y .
i =0 I +1
0 E y [ w] . mpreun, ele reconstituie, prin superpoziie, ntregul

(4.36)

Este acest procedeu iterativ convergent? Cu alte cuvinte, este posibil verificarea testului de stop (4.34)? Rspunsul afirmativ la aceste ntrebri este oferit de o proprietate remarcabil, corelat intim cu o form de ortogonalitate (dei reamintim c nu toi atomii dicionarului sunt ortogonali ntre ei). n [MaZh93] s-a demonstrat c energia reziduurilor succesive scade pe msur ce procesul iterativ avanseaz. Demonstraia se bazeaz pe o egalitate aparent surprinztoare, similar relaiei lui Pitagora ntr-un un triunghi dreptunghic:
i y = i +1 y + i y , wi
2 2 2

E ( i y ) = E ( i +1 y ) + i y, w

2
i

i 0 .

(4.37)

Remarcabil este faptul c identitatea se verific indiferent dac atomii dicionarului sunt sau nu ortogonali ntre ei. Ortogonali sunt ns reziduul i +1 y i proiecia reziduului i y pe atomul cel mai potrivit corespunztor, aa cum catetele unui triunghi dreptunghic sunt ortogonale. Mai precis, folosind definiia (4.32) i proprietatea atomilor din dicionar de a avea energie unitar, se probeaz imediat proprietatea de ortogonalitate invocat:

i +1 y , i y , wi wi = i y, i y , wi wi i y , wi wi , i y, wi wi = = i y , wi
2

i y, wi

= 0, i 0.

(4.38)

Identitatea (4.37) arat c, treptat, energia semnalului original este disipat n coeficienii de proiecie ai atomilor celor mai potrivii. Acest fenomen este ilustrat i n Figura 4.5, unde grosimea vectorilor succesivi scade, sugernd diminuarea energiei reziduurilor sau proieciilor pe care le reprezint. Pragul > 0 este de fapt cel care controleaz maniera de separare dintre cele dou componente ale semnalului original sau cantitatea de zgomot care mai poate distorsiona componenta util. De notat totui c proprietatea (4.37), de conservare a energiei, se verific pentru orice atom din dicionar, nu neaprat pentru cel mai potrivit dintre ei. Dac se aleg ns atomii cei mai potrivii, energia se disip ntr-un numr sensibil mai mic de coeficieni de proiecie.
73

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

I +1 y y 1 y y , w0 w 0 2 y I y, w

I y
I

1 y, w1 w1

Figura 4.5. Principiul urmririi prin potrivire. Rezult c se poate realiza nu doar deparazitarea, ci eventual i compresia semnalului original, prin memorarea doar a coeficenilor de proiecie i a indicilor acestora. ns, pentru a evalua coeficienii de proiecie, sunt folosite reziduuri succesive i nu semnalul original. Adic, n general:

i y, wi y , wi , i N .

(4.39)

n ceea ce privete indicii atomilor celor mai potrivii, ei pot induce un efort semnificativ de memorare, n special dac numrul atomilor este mare. Astfel, fiecare atom este reprezentat nu doar de valoarea sa, ci i de 3 valori ntregi asociate poziiei sale n dicionar. i n dicionarele lingvistice, fiecrui cuvnt i se asociaz nu doar explicaia semantic, ci i pagina plus poziia pe pagin a cuvntului. 4.4. Cutarea atomilor celor mai potrivii cu ajutorul unui Algoritm Genetic Algoritmul urmririi prin potrivire este practic reprezentat de relaiile (4.33) (nti se determin atomul cel mai potrivit), (4.32) (apoi se evalueaz reziduul urmtor) i (4.34) (iar n final se testez dac urmrirea poate nceta). Problema cea mai dificil o constituie determinarea atomului celui mai potrivit, care, teoretic, revine la evaluarea proieciilor reziduului curent pe toi atomii dicionarului. Dac dicionarul posed un numr redus de atomi (cel mult de ordinul zecilor de mii), gsirea celui mai potrivit dintre ei se poate realiza printr-o cutare exhaustiv. n aplicaii, ns, dicionarele trebuie s fie suficient de bogate pentru a realiza o deparazitare satisfctoare a semnalului original. Complexitatea unui dicionar timp-frecven-scal crete extrem de sensibil odat cu indicele de scal, aa cum ilustreaz i exemplul din Figura 4.3, unde, pentru numai 9 nivele de scalare, se obin peste 4 milioane de atomi. Cutarea exhaustiv a celui mai potrivit atom pentru fiecare reziduu este evident ineficient n acest caz. De aceea, se apeleaz la alte tehnici de cutare. Determinarea celui mai potrivit atom este o problem granular de optimizare, n care se dorete maximizarea funciei cost reprezentate de modulul produsului scalar dintre un semnal i atomii dicionarului. Funcia cost este puternic neliniar i poate prezenta un numr de extreme comparabil cu numrul total al valorilor sale. Pentru maximizarea ei, se poate utiliza fie o tehnic euristic (cum este, de exemplu, IDA*), fie o strategie evoluionar, cum este PSO sau cea specific Algoritmilor Genetici (AG) [MiM95]. n continuare, va fi descris maniera de configurare a unui AG utilizat pentru rezolvarea problemei de urmrire n dicionarul timp-frecven-scal. Acum se poate justifica numele de GAMP asociat algoritmului rezultat: Genetic Algorithm for Matching Pursuit (Algoritmul Genetic al Urmririi prin Potrivire).
74

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>


0 Plecnd de la dicionarul E y [ w] , mulimile de variaie ale indicilor atomilor pot fi notate

prin: M = 0, M (pentru indicii de scal), N = indicii de ecart temporal) i K =


def

def

def

mM

m
def

cu N m = N l ,m , N r ,m , m M (pentru

def

mM

cu K m = 0, K m , m M (pentru indicii de

modulaie armonic). Atunci problema granular de optimizare se poate formula astfel:


i = arg max i y, w = arg max
M N K M N K

y[ p]w [ p] ,
pZ i

i N .

(4.40)

Suma din ecuaia (4.40) este n realitate finit, deoarece suportul semnalului original este finit, iar atomii dicionarului sunt esenial localizai tot ntr-un suport finit. De altfel, modulul acestei sume este chiar funcia de potrivire (fitness), care trebuie maximizat. Strategiile evoluionare care pot fi utilizate pentru maximizarea funciei de potrivire se bazeaz pe dou concepte inspirate de comportamentul sistemelor biologice: evoluie i adaptare. Ambele concepte ascund procese de optimizare ale sistemelor biologice, dar printr-o abordare mai degrab paralel dect secvenial. ntr-o accepie general, un sistem biologic este constituit din una sau mai multe populaii de entiti dotate cu via, care, interacionnd ntre ele i cu mediul nconjurtor, evolueaz i se adapteaz de la o generaie la alta, potrivit unui program (n general) necunoscut. Generaia unei populaii este constituit n mare parte din indivizi selectai natural, capabili s codifice, modifice i transmit generaiei urmtoare cele mai valoroase experiene de via. Prin evoluie se nelege un proces ndelungat, de-a lungul mai multor generaii, n urma cruia nivelul de via al sistemului biologic este mbuntit, pe seama transmiterii ntre generaii a celor mai valoroase experiene motenite i (eventual) trite. Adaptarea este un proces mai scurt, eventual, pe durata de via a unei generaii, care const adesea n modificarea experienelor de via ale sistemului biologic, provocat de necesitatea creterii eficienei aciunilor populaiei i/sau a nivelului de via a acesteia ntr-un anumit mediu. Grosso modo, evoluia este un ir de etape de adaptare succesive parcurse de ctre sistemul biologic de-a lungul timpului, pentru optimizarea nivelului su de via. Cercetrile privind corelaiile dintre evoluie i adaptare au nceput cu mult timp n urm, probabil mai intens dup introducerea de ctre Charles Darwin a controversatei (la acea dat i chiar i astzi) Teorii a Evoluiei [DaC1859], [DaC1871]. Abordrile mai recente au ns ca obiectiv modelarea i simularea evoluiei prin adaptri succesive ale unui sistem biologic folosind tehnica de calcul. Acesta a favorizat apariia i dezvoltarea domeniului Strategiilor Evoluionare, care este constituit din modele i tehnici de simulare ale fenomenului de evoluie prin adaptare, indiferent dac sistemele modelate includ entiti nzestrate cu via sau nu. Acest domeniu face parte din tiina Calculatoarelor. Dintre tehnicile evoluionare, AG se disting att prin apropierea lor de fenomenele biologice intime care stau la baza evoluiei i adaptrii, ct i prin ideea modelrii fenomenului de selecie natural (care, potrivit lui Darwin, st la baza evoluiei). Astfel strile optime ale sistemului sunt atinse de ctre acele generaii care includ indivizii cei mai bine selectai natural. Cu toate acestea, subliniem nc o dat c strategiile evoluionare (deci i AG) nu pot garanta determinarea optimului, dar acesta este urmrit (poate chiar atins) printr-un proces iterativ. Primele concepte legate de AG au fost introduse n 1975 de ctre John Holland [HoJH75], dar o foarte bun descriere a domeniului AG a fost realizat dup 20 de ani, n 1995, de ctre Melanie Mitchell [MiM95]. (Dup cum afirma John Holland, cartea publicat n 1995 de Melanie Mitchell este cea mai bun lucrare despre Algoritmi Genetici scris pn la acea dat.) Astfel, un AG este definit ca o procedur cu ajutorul cruia se poate simula procesul de evoluie prin adaptare a unui sistem (biologic sau nu). Convergena
75

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

acestei proceduri nu a fost ns niciodat demonstrat riguros. Cu toate acestea, n decursul timpului, au fost formulate o serie de ipoteze care redefinesc noiunea de convergen: convergena genetic. Ipotezele de convergen genetic au fost formulate i de ctre Holland n [HoJH75], ele fiind completate ulterior n publicaii ca [NiVo91] sau [RaWh93]. Pe baza acestora, sunt studiate o serie de proprieti legate de convergen, ca efecte ale operatorilor genetici aplicai n cursul seleciei candidailor la optim. Convergena este o proprietate determinat practic de compromisul dintre numrul de indivizi candidai la optim ai unei populaii i diversitatea acelei populaii. Cu ct o populaie conine mai muli astfel de candidai, ea este mai puin divers i crete riscul ca optimul s fie doar unul local, capturat de aceti indivizi. Cu ct diversitatea populaiei este mai mare, numrul de candidai la optim ai acesteia este mai mic i cresc att incertitudinea ct i timpul de cutare n determinarea optimului. AG nu constituie instrumente universale n rezolvarea problemelor granulare de optimizare. Proiectarea lor este delicat, necesit precizarea a numeroi parametri (n general n urma unui mare numr de simulri) i performanele lor pot fi neateptat de sczute (chiar i dup o proiectare atent). Cu toate acestea, AG s-au dovedit a funciona surprinztor de bine ntr-o serie de aplicaii, printre care se numr i cea de rezolvare a problemei (4.40), descris n continuare. n proiectarea unui AG, sunt utilizate concepte inspirate de tiinele Naturale, cum ar fi: cromozom, gen, alele, genom, genotip, fenotip, diploid, haploid, populaie, generaie, prini, urmai, selecie natural, ncruciare, mutaie, inversiune, viabilitate, fertilitate, potrivire, etc. Definiiile acestor concepte sunt sumarizate n [MiM95], astfel c nu vor fi formulate dect cele strict necesare n proiectarea AG utilizat n rezolvarea problemei granulare (4.440). 0 Primul concept de interes n contextul dicionarului timp-frecven-scal E y [ w] este cel de cromozom. n general, n orice AG, cromozomii reprezint indivizii unei populaii. Dintre acetia se recruteaz candidaii la punctele de optim. n particular, pentru dicionarul 0 E y [ w] , cromozomii sunt asociai indicilor atomilor componeni, M N K . Orice cromozom este format din gene. Dat fiind structura dicionarului, cromozomii timpm n k frecven-scal, notai prin m,n ,k , sunt formai din cte 3 gene: m,n ,k = | | . Fiecare gen este asociat unuia dintre cei 3 indici, ntr-o manier foarte direct: ea constituie reprezentarea binar a indicelui, aa cum ilustreaz Figura 4.6. def

m 1+ log 2 # M

n 1+ log 2 # N

k 1+ log 2 # K

Figura 4.6. Definiia unui cromozom timp-frecven-scal. Pe figur sunt marcate lungimile genelor msurate n numere de bii de reprezentare, lund n considerare numrul de valori ale indicilor asociai sau cardinalele mulimilor M , N i K . Pentru gena de scalare, m , mulimea M conine M + 1 valori. Gena de translaie temporal, n , trebuie s beneficieze de un numr de bii corespunztor diferenei dintre maximul indicelui de extrem dreapt N r ,m i minimul indicelui de extrem stng N l ,m , pentru a lua n considerare toate valorile posibile. Conform inegalitii (4.27), tiind c 0 = 1/ 2 < 1 , valorile extreme se ating pentru m = M , respectiv m = 0 , astfel c:
M 0 t t t0 t0 + = N y M0 + 0 . # N = Ny Ts Ts 2 Ts Ts

(4.41)

76

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

n fine, numrul maxim valori care definete lungimea genei de modulaie armonic, k , se atinge pentru m = 0 , conform ecuaiilor (4.22) i (4.23). Astfel, # K = K 0 + 1 . n general, lungimea genei de scalare este mult mai mic dect lungimile celorlalte dou gene (ea nu depete 4 bii). Aceasta permite restricionarea cromozomului la ultimele
n k dou gene ( n ,k = | ) i proiectarea unei tehnici euristice hibride, n care cutarea optimului se va efectua n dou etape succesive. Mai nti se caut cromozomii optimi cu ajutorul unui AG la nivelul fiecrei scale (eventual n paralel). Apoi se caut exhaustiv cromozomul optim dintr-un ir cu doar M + 1 valori, cte una pentru fiecare scal. Restrngerea cromozomului timp-frecven-scal la un cromozom timp-frecven are i alte avantaje (n afara posibilitii de a aciona n paralel pe toate scalele odat, deci de a reduce semnificativ timpul de cutare). Astfel, cromozomii produi prin operaii genetice nu mai risc s fie asociai unor indici de ecart sau de modulaie cu valori incorecte (adic din afara mulimilor de variaie pentru un anumit indice de scal). De asemenea, lungimile celor dou gene rmase pot fi reduse adaptiv, n funcie de indicele de scal. Mai precis, pentru fiecare m M , lungimea genei n este dat de: def

mt mt # N m = N r ,m N l ,m + 1 = N y 0 0 + 0 0 = N y 1 , Ts Ts

(4.42)

m m dac 0 t0 / Ts nu este ntreg sau de # N m = N y dac 0 t0 / Ts este ntreg. Acoperitor, se

poate considera c lungimea acestei gene este 1 + log 2 N y bii, indiferent de indicele de scalare. n ceea ce privete gena k , pentru fiecare m M , lungimea acesteia este egal cu 1 + log 2 ( K m + 1) bii. La nivelul unei scale de indice oarecare m M , cutarea cromozomului optim (care va corespunde atomului celui mai potrivit la iteraia i N ) se efectueaz prin rezolvarea problemei de optimizare (4.440), adic prin maximizarea funciei de potrivire curente:
n ,k gi m, = def

y[ p]w
pZ i

[ m ,n ,k ]

[ p] ,

(4.43)

n raport cu n ,k . Aadar, funcia de potrivire se modific la fiecare iteraie a procesului de urmrire prin potrivire. Cromozomul candidat la optim face parte dintr-o populaie m avnd o anumit dimensiune, mult mai mic, n general, dect numrul de atomi timp-frecven ai dicionarului, de la scala de indice m . De exemplu, pentru dicionarul din care au fost extrai atomii ilustrai n Figura 4.3, cele M + 1 = 9 populaii de cromozomi vor fi de ordinul sutelor sau cel mult de ordinul miilor (pe scalele joase, unde se afl mai muli atomi a se vedea numerele de atomi ai fiecrei scale pe coloana din stnga a figurii). O astfel de populaie conserv un numr constant de cromozomi, dar, n cursul cutrii celui optim, cromozomii din populaie nu sunt mereu aceiai. Populaia evolueaz prin nlturarea unora dintre cromozomii care nu mai pot constitui candidai la optim i nlocuirea lor cu alii selectai natural, cu valori mari ale funciei de potrivire. Pentru a realiza remprosptarea populaiilor, se utilizeaz operaii genetice aplicate cromozomilor pe care acestea i conin. Exist 3 astfel de operaii genetice folosite frecvent n cadrul unui AG, care vor fi descrise n continuare: ncruciare (crossover) cu probabilitatea Pcro , mutaie (mutation) cu probabilitatea Pmut i inversiune (inversion) cu probabilitatea Pinv .
77

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

Pentru a descrie maniera n care acioneaz cele 3 operaii genetice, se consider un cromozom binar oarecare , de lungime L . Fiecare dintre aceste operaii este determinat de 2 parametri (n afara probabilitii aferente): lungimea zonei din cromozom care va fi afectat, numit ad hoc gen de operare i un pointer numit pivot, care indic nceputul acestei zone. Pentru acelai cromozom, pot fi selectate mai multe gene de operare i pivoi. n principiu, oricare dintre biii cromozomului are aceeai probabilitate de a fi selectat ca pivot, dar operaia genetic aleas nu poate fi aplicat pentru orice pivot selectat. De exemplu, bitul cel mai puin semnificativ, adic LSB (Least Significant Bit) situat n extrema dreapt a cromozomului nu pote fi pivot pentru ncruciri i inversiuni, deoarece lungimea genei de operare trebuie s fie cel puin egal cu 2. n schimb, LSB poate fi ales ca pivot pentru o mutaie, unde lungimea genei este egal cu 1. Definiiile celor 3 operatori sunt ilustrate sugestiv n Figurile 4.7, 4.8 i 4.9.
pivot P 1L P 2L P1C P 2C lungime P 1R P2R P 1L P2L P 1C P 2C P 1R P2R P1L P 2L P2C P1C P1R P 2R

Cromozomi prini

Cromozomi urmai

Figura 4.7. Definiia ncrucirii genetice.

pivoi

Cromozom printe

Cromozom urma

Figura 4.8. Definiia mutaiei genetice.

pivot

lungime

Cromozom printe

Cromozom urma

Figura 4.9. Definiia inversiunii genetice. ncruciare genetic (Figura 4.7). Aceast operaie necesit doi cromozomi, numii prini. Prin ncruciare, ei vor genera doi cromozomi urmai (offspring). Aa cum ilustreaz i Figura 4.7, ncruciarea const n schimbarea ntre cei doi cromozomi prini a zonelor genetice selectate i la fel poziionate. Prin aceasta, cele dou reprezentri binare produc alte dou reprezentri binare, n general diferite de cele originale. Numai biii din poziiile 2 , 3 , ..., L pot fi selectate ca pivoi, considernd c LSB se afl pe poziia 1 . Probabilitatea de a selecta un pivot n poziia oarecare p 2, L este constant i egal cu Pcro /( L 1) . Probabilitatea de a selecta LSB ca pivot este egal cu probabilitatea de a anula operaia de ncruciare, adic 1 Pcro .
78

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

De altfel, dac LSB este selectat, atunci ncruciarea cromozomilor se anuleaz. Prin aceast atribuire de probabiliti la nivelul biilor, s-a definit o distribuie de probabilitate asociat cromozomilor prini, exprimat sintetic astfel:
cro pcro = L 1 def

p=L

Pcro L 1 p = L 1

Pcro L 1 p=2

| 1 Pcro . | p =1

(4.44)

Aceasta servete la selecia pivoilor cu probabilitate predeterminat sau inhibarea operaiei de ncruciare, cu ajutorul unui mecanism care va fi descris ulterior (tot n cadrul acestui paragraf). Acelai mecanism este utilizat pentru a selecta lungimea genei de operare. Mai precis, pentru pivotul din poziia p 2, L , lungimea genei de operare aparine mulimii 2, p . Acesteia i se atribuie o densitate de probabilitate uniform de valoare Pcro /( p 1) (innd cont de numrul de lungimi posibile). Mutaie genetic (Figura 4.8). Pentru aceast operaie, este suficient un singur cromozom printe, care, printr-un mecanism de auto-flagelare, se va transforma n propriul su urma. Mecanismul const n selectarea unui anumit numr de pivoi i n schimbarea valorilor biilor pe care acetia i indic, n valori opuse: bitul 0 devine 1 i bitul 1 devine 0. Probabilitatea de a selecta un pivot n poziia oarecare p 1, L (inclusiv LSB poate juca acest rol) este constant i egal cu Pmut . Rezult c probabilitatea de a sri peste bitul respectiv este 1 Pmut . Prin aceast atribuire de probabiliti, selecia pivoilor s-ar putea efectua considernd densitatea de probabilitate [ Pmut | 1 Pmut ] la nivelul fiecrui bit al cromozomului printe. Mutaia nu ar mai avea loc atunci cnd nu s-ar selecta nici un pivot. O alt abordare, mai eficient din punctul de vedere al mecanismului de selecie, const n construcia unei distribuii de probabilitate la nivel de cromozom i nu la nivel de bit. Astfel densitatea de probabilitate a fiecrui bit sugereaz definirea unei densiti de probabilitate asociat cromozomului, dup cum urmeaz:

pmut = mut L
p=L

def

Pmut 1 Pmut L L p =1 p=L

1 Pmut L . p =1

(4.45)

Lungimea acesteia este dubl, pentru a permite ca orice bit s poat fi ales ca pivot sau, din contr s nu joace rol de pivot. Dac bitul selectat este poziionat n prima jumtate a distribuiei (4.45), el i va asuma rolul de pivot, altfel, el nu va fi afectat de mutaie. n cazul n care acelai bit este selectat de dou ori i beneficiaz de cte o selecie n fiecare jumtate, el nu va fi afectat de mutaie (seleciile sale se anihileaz reciproc). Pentru a juca rolul de pivot, numrul seleciilor sale din prima jumtate trebuie s fie mai mare dect numrul seleciilor din a doua jumtate. De regul, probabilitatea de a efectua mutaii este mult mai mic dect probabilitatea de a efectua ncruciri. Astfel, dac ncruciarea este evitat, aproape sigur i mutaia va fi evitat. Mai precis, biii selectai vor face parte din a doua jumtate a distribuiei (4.45) ntr-un numr covritor de selecii. Pentru a nu irosi timp de calcul fr a efectua operaii genetice asupra cromozomilor, dac operaia de ncruciare a fost inhibat, automat, probabilitatea de a aplica inversiuni trebuie s creasc. De exemplu, n acest caz, se poate considera c Pmut = Pcro . De altfel, mutaia poate fi vazut ca o ncruciare a unui printe cu el nsui, genele de operare avnd lungime unitar.
79

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

Inversiune genetic. (Figura 4.9). i pentru aceast operaie este suficient un singur cromozom printe, care se va transforma n propriul su urma. Transformarea const n selectarea unei gene de operare n interiorul creia biii sunt enumerai n ordine invers. Astel, n cadrul genei, LSB devine MSB (Most Significant Bit bitul cel mai semnificativ) i reciproc. Probabilitatea de a selecta un pivot n poziia oarecare p 2, L (cu convenia din cazul ncruciarii) este constant i egal cu Pinv /( L 1) . Probabilitatea de a selecta LSB ca pivot este egal cu probabilitatea de a anula operaia de inversiune, adic 1 Pinv . Ca i ncazul ncrucirii, inversiunea se anuleaz dac LSB este selectat. Distribuia de probabilitate asociat biilor din cromozom este similar lui (4.44):
inv pinv = L 1 def

p=L

Pinv L 1 p = L 1

Pinv L 1 p=2

| 1 Pinv . | p =1

(4.46)

Selecia lungimii genei de operare se realizeaz ca n cazul ncruciarii genetice. Astfel, pentru pivotul din poziia p 2, L , lungimea genei de operare aparine mulimii

2, p . Acesteia i se atribuie o densitate de probabilitate uniform de valoare Pinv /( p 1) . i n acest caz, probabilitatea Pinv este cu mult inferioar probabilitii Pcro . Dac nici ncruciarea i nici mutaia nu au fost selectate, atunci probibilitatea de efectuare a unei inversiuni trebuie s creasc, de exemplu, la valoarea Pcro .
n mod uzual, cele 3 probabiliti variaz n intervalele de mai jos:

Pcro [0.5,1] ; Pmut (0,0.1] ; Pinv (0,0.05] .

(4.47)

Aceasta conduce la o aplicare mult mai frecvent a ncrucirii dect a mutaiei sau inversiunii, la fel cum se ntmpl i n cazul sistemelor biologice. n mod normal, urmaii sunt rezultatul ncrucirii a doi prini diferii. Rareori se produc mutaii sau inversiuni genetice, caz n care urmaii se numesc mutani i prezint anomalii genetice care i mpiedic s treac de procesul de selecie natural. Cu toate acestea, s-a demonstrat c unele specii au evoluat tocmai prin mutanii acestora, ca urmare a unei necesiti acute de adaptare la mediul lor de via. Este posibil ca acest lucru s se fi nregistrat (i s se mai nregistreze i n viitor) n anumite etape ale evoluiei speciei umane. De exemplu, expunerea prelungit la un mediu nociv (cu numeroi ageni chimici agresivi, dar neletali), oblig organismele vii s se adapteze treptat la acesta i s-i dezvolte un mecanism de protecie mpotriva noxelor sau asimlare a acestora. (Acesta se realizeaz mai mult prin mutaii genetice dect prin alte modificri genetice.) De aceea, producerea de mutani nu este complet exclus n cadrul unui AG, dar probabilitile de apariie a acestora trebuie s fie mult inferioare celor de apariie a urmailor pe cale natural, prin ncruciare. De regul, ncruciarea este asociat evoluiei, n timp ce mutaia i inversiunea sunt asociate mai degrab adaptrii. Pentru cromozomii timp-frecven, operaiile genetice se aplic fiecreia dintre cele dou gene, pentru a minimiza riscul de a produce urmai invalizi (adic indicnd cuvinte care nu exist n dicionar). n urma ncrucirii sunt produi 4 urmai (prin combinarea urmailor temporali cu cei frecveniali), n timp ce prin mutaie sau inversiune se produce cte un urma. Avnd n vedere c reprezentarea binar a indicilor este acoperitoare, cromozomul timp-frecven mai poate lua i valori invalide. Valorile invalide ale genei temporale nu sunt critice, deoarece ele indic atomi timp-frecven-scal cu suportul prea excentric (centrat n jurul unui moment aflat mult n afara suportului semnalului analizat). Rezult c valorile funciei de potrivire au amplitudini neglijabile (practic nule). n schimb, invaliditatea genelor frecveniale poate produce fenomenul de aliere n frecven.
80

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

De aceea, pentru gena frecvenial, valorile invalide pot fi corectate prin limitarea lor la valoarea maxim ( K m ) sau, mai corect, prin evaluarea restului mpririi acestuia la valoarea maxim ( k % K m ). Urmaii rezultai au, de regul, valori de potrivire diferite de ale prinilor. Un printe este dominant dac valoarea sa de potrivire este superioar celei a urmailor si. Punctele de optim sunt recrutate din rndurile cromozomilor dominani. Alegerea pivoilor, a lungimii genelor de operare i a cromozomilor, n vederea aplicrii de operaii genetice, se realizeaz cu ajutorul unui algoritm de generare de numere cu probabilitate prestabilit. Acesta se bazeaz pe o procedur ingenioas de selectare a unui element dintr-o mulime A = { an }n1,L creia i se asociaz o distribuie de probabilitate

p = [ p1 p2 pL ] . Cu alte cuvinte elementul generic an are probabilitatea pn de a fi

selectat. Procedura exprim un mecanism de selecie care simuleaz funcionarea unei rulete i a fost propus de ctre J.E. Baker n [BaJE87] sub numele de Eantionare Universal Stocastic (SUS Stochastic Universal Sampling). (O comunicare interesant pe aceast tem este i [BaJE85].) n Anexa B este descris att varianta original a mecanismului SUS (reprezentat de Algoritmul lui Baker), ct i o generalizare imaginat de noi pentru adaptarea acestui mecanism la contextul discionarului timp-frecven-scal. Generalizarea const n nlocuirea distribuiei de probabilitate p cu un set de numere nenegative a cror sum nu mai este n mod necesar egal cu 1. Astfel, selecia unui element din A se va realiza n conformitate cu profilul p . Aa cum se va observa n continuare, Algoritmul lui Baker va fi utilizat nu doar pentru seleciile cerute de operaiile genetice (unde intevine in varianta original), ci i n selectarea cromozomilor prini dintr-o populaie dat (unde este necesar varianta generalizat). Construcia i remprosptarea populaiilor de cromozomi se poate realiza dup mai multe strategii posibile. n cadrul acestui paragraf a fost imaginat o strategie adaptat la contextul dicionarului timp-frecven-scal: strategia elitist cu selecie adaptiv bazat pe fenomenul clirii simulate de tip Boltzmann. Fenomenul clirii metalelor (adic al rcirii cu temperatur controlat) a sugerat o procedur de optimizare numit clire simulat (simulated annealing), utilizat n special n aplicaii de Inteligen Artificial. (O descriere a acestei proceduri se gsete n [RuNo95].) n contextul AG, va fi utilizat doar ideea fundamental a clirii simulate, n care temperatura va fi controlat prin intermediul funciei Boltzmann. Strategia este descris n detaliu mai jos. Etapa cea mai important a unui AG o constituie selecia cromozomilor care vor suferi operaii genetice i vor produce urmai. Ca principiu general, este de dorit ca mecanismul de selecie s fie ct mai apropiat de cel al seleciei naturale. Acest lucru va conduce la mprosptarea generaiei curente a unei populaii de cromozomi, notat ad hoc prin t (adic la momentul oarecare t N ). (Populaiile de cromozomi conin candidaii la punctele de optim ale funciei de potrivire.) n urma mprosptrii, noua generaie a populaiei este t +1 . De regul, toate generaiile au acelai numr de cromozomi, P N , astfel c mprosptarea nu presupune doar adugarea cromozomilor urmai rezultai din operaiile genetice, ci i eliminarea unor cromozomi care nu mai pot constitui candidai viabili. Astfel, n cadrul generaiilor succesive, este pstrat n mod majoritar doar elita cromozomilor. Sunt totui conservai i o serie de cromozomi comuni, pentru ca, prin operaii genetice (n special ncruciare), s fie evitat degenerarea populaiei, adic gruparea acesteia n jurul unui optim local al funciei de potrivire. Proporia ocupat de elita cromozomilor n cadrul generaiilor este notat prin pe [0,1) . De exemplu, 10% dintre
81

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

cromozomii dominani (dar nu mereu aceiai!) sunt transferai nemodificat ntre generaiile succesive, n timp ce restul de 90% trebuie produi prin operaii genetice. Principiul strategiei elitiste de selecie este ilustrat n Figura 4.10.

t+1

Elit

Figura 4.10. Principiul strategiei elitiste de selecie. Astfel, un numr de cromozomi distinci ai generaiei curente t sunt motenii pe P direct de ctre generaia urmtoare, t +1 . Ei constituie elita curent a populaiei, dar unii dintre ei (sau chiar toi) pot pierde acest atribut n generaia urmtoare, dup completarea populaiei. Restul de P pe P cromozomi ai generaiei urmtoare t +1 (care trebuie s fie tot distinci) pot fi produi prin operaii genetice sau selecii la ntmplare. n acest scop, este construit o populaie temporar, t , numit i -populaie. Ea conine cromozomi api pentru a se reproduce. Orice cromozom cu un grad de potrivire suficient de bun va migra n cadrul -populaiei i va cuta o pereche n vederea reproducerii. Numrul de cromozomi din t este chiar P = P pe P . Cnd se produc cromozomii urmai, ei sunt trimii n t +1 tot printr-o strategie elitist, dup cum urmeaz:

n cazul ncrucirii, sunt selectai primii 2 cromozomi dominani dintre cei 2 prini i cei 4 urmai; n cazul mutaiei sau inversiunii este ales cromozomul dominant dintre printe i urmaul su. Strategia propus mai sus este diferit de cea adoptat n cadrul majoritii AG, unde urmaii i nlocuiesc pur i simplu pe prini, indiferent de valoarea funciei de potrivire. Ea este ns mai eficient din punctul de vedere al timpului de calcul. n plus, strategia elitist reduce ansa de a nu detecta sau chiar de a nltura optimul global prin selecie. Exist totui un pericol: elita poate opri evoluia populaiei, dominnd-o peste mai multe generaii. Pentru a diminua acest efect negativ, un numr de cromozomi distinci ai generaiei t +1
vor fi alei la ntmplare. Aceasta permite cromozomilor dominani s se poat mperechia cu cromozomi dominai, comuni, pentru a asigura diversitatea populaiei i a evita capturarea acesteia de ctre un optim local. Locurile libere din cadrul generaiei t +1 care trebuie ocupate de cromozomi distinci alei la ntmplare sunt rezervate prin impunerea unei restricii naturale: numai un numr de cel mult M go N operaii genetice sunt permise, n vederea completrii generaiei. Dac dup epuizarea celor M go operaii
82

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

genetice generaia t +1 este incomplet (adic nu s-au produs P cromozomi distinci), locurile rmase libere trebuie ocupate de ctre cromozomi alei la ntmplare. De regul, pentru a permite intrarea cromozomilor ntmpltori n cadrul populaiei, este suficient alegerea lui M go n gama 3P,6 P . Aceasta permite ca, n medie, circa 10% dintre cromozomii generaiei urmtoare s fie alei la ntmplare. (Desigur, acest procent poate fi impus nc de la nceput.) Cum se construiete totui -populaia? Spre deosebire de generaiile t i t +1 (care trebuie s includ numai cromozomi distinci), cele P locuri din cadrul -populaiei vor fi ocupate de ctre cromozomii cei mai reprezentativi ai generaiei t , un cromozom putnd ocupa mai multe locuri. Teoretic, reprezentativitatea ar trebui s reflecte capacitatea de reproducere a cromozomilor. Fiecare cromozom va fi reprezentat n t de un numr de clone ale sale proporional cu posibilitile sale reproductive (sau cu reprezentativitatea aferent). Cel mai reprezentativ cromozom al generaiei t va ocupa numrul cel mai mare de locuri n cadrul lui t (adic va fi clonat de un numr maxim de ori n cadrul lui intermediul unei funcii R t : t R + . Odat determinat reprezentativitatea R t ( n ,k ) a

t ). Practic, reprezentativitatea unui cromozom trebuie cuantificat i estimat prin

fiecrui cromozom n ,k t , se poate folosi Algoritmul generalizat al lui Baker pentru a construi populaia t cu P indivizi (adic mulimea U N de cardinal M = P a se vedea cardinal N = P ), pe baza profilului de reprezentativitate R t ( n ,k ) (avnd tot N = P valori). Algoritmul B.2) din populaia de generaie t cu P indivizi (adic din mulmea A N de

Aceasta justific generalizarea procedurii originale propuse de Baker, cu att mai mult cu ct R t nu este n mod necesar o distribuie de probabilitate. Reprezentativitatea cromozomilor dintr-o populaie poate fi cuantificat cu ajutorul funciei de potrivire. n literatura de specialitate, exist mai multe definiii propuse. Unele dintre acestea sunt formulate n [MiM95], cum ar fi: reprezentativitate proporional cu funcia de potrivire (bazat pe ideea original a lui Holland din [HoJH75]), sigma-scalare (bazat pe un concept nou, de varian a unei populaii), reprezentativitate proporional cu rangul cromozomilor n cadrul populaiei, reprezentativitate evaluat n urma unui turnir organizat ntre cromozomi, etc. Toate definiiile apeleaz direct sau indirect la funcia de potrivire. Pentru contextul dicionarului timp-frecven-scal, a fost imaginat o definiie combinat, care utilizeaz clirea simulat i funcia Boltzmann de control al temperaturii de clire. Dei combinaia dintre funcia Boltzmann i strategia turnirului a mai fost utilizat n [GoDE90], iar combinaia dintre aceeai funcie i clirea simulat a fost comunicat n [YaX91], abordarea noastr, prezentat mai jos, este diferit. Reprezentativitatea poate fi definit astfel nct rata de selecie s se adapteze la fiecare generaie. Un scenariu de selecie ideal este urmtorul. La primele generaii, cnd populaia include un spectru larg de cromozomi, este mai propice o selecie liberal dect una conservatoare, pentru a nu afecta prea rapid diversitatea populaiei. Astfel, cromozomi dominani au anse substaniale s se mperechieze cu ali cromozomi avnd valori modeste de potrivire. Dendat ce populaia atinge o generaie cu un numr suficient de mare de cromozomi dominani (adic dendat ce s-a conturat o elit), selecia va deveni mai conservatoare, considernd c diversitatea populaiei a fost asigurat anterior. A continua s fie combinai cromozomi din elita proaspt conturat cu unii comuni nseamn a nu reui consolidarea elitei n cadrul populaiei, ceea ce revine la o cutare aproape exhaustiv a optimului, adic ineficient.
83

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

Acest scenariu corespunde foarte bine fenomenului de clire a oelului. Este binecunoscut faptul c performanele oelului depind esenialmente de programul de rcire controlat. Obiectivul principal al acestui program de rcire l constituie obinerea unui oel cu un minim de tensiuni interne. Dac rcirea se efectueaz prea rapid, oelul rezultat este dur, dar casant i puin tenace (din cauza tensiunilor interne prea mari). Dac, din contr, rcirea se efectueaz prea lent, componentele chimice adugate fierului pentru a forma oelul risc s fie arse i acesta va avea mai degrab caracteristicile fierului. Astfel, scderea temperaturii trebuie efectuat dup un program precis, care s conduc la atingerea obiectivului de optimizare: minimizarea tensiunilor interne. (Aceasta justific utilizarea clirii simulate ca procedur euristic de optimizare.) Procesul de clire a oelului sugereaz un scenariu de selecie a cromozomilor pe baz de reprezentativitate, dup cum urmeaz. Se noteaz prin Tc temperatura de clire (variabil n timp). Aceasta va fi utilizat pentru a adapta rata de selecie la caracteristicile fiecrei generaii. La primele generaii, Tc trebuie s aib valori mari, aceasta fornd rate mici de selecii pentru toi cromozomii, aproape indiferent de gradul lor de potrivire. Pe msur ce Tc scade, funcia de potrivire ncepe s fac distincia ntre cromozomi. Apar cromozomii din elit, recunoscui prin faptul c supravieuiesc de-a lungul mai multor generaii. Reprezentativitatea care exprim acest fenomen este definit cu ajutorul funciei Boltzmann prin:

g ( n ,k ) exp Tc [t ] def n ,k R t ( n ,k ) = P , t , t N , g () exp t Tc [t ]

(4.48)

unde g este funcia de potrivire. Urmtorul pas l constituie precizarea unei legi de variaie corespunztoare a temperaturii din definiia (4.48). Tradiional, aceasta se bazeaz pe conceptul de varian a unei generaii (care, de fapt, cuantific diversitatea populaiei la un anumit de timp). Variana generaiei t se definete astfel:
2 g ( t ) =
def 2 1 g g ( ) ( ) t , t N , P t

(4.49)

unde media generaiei este:


g (t ) =
def

1 g () , t N . P t

(4.50)

n vecintatea optimului, variana (4.49) trebuie s aib valori ct mai mici, indicnd gruparea populaiei n jurul acestuia, populaia fiind format din cromozomi cu grade mari de potrivire. La primele generaii, variana prezint valori importante, ceea ce arat c elita nu a fost nc bine conturat i nu poate domina populaia. Astfel, variana populaiei (eventual normalizat cu un anumit factor) poate juca rolul temperaturii de clire. Mai general, temperatura poate fi definit astfel:

Tc [t ] = T0 ( t ) =
g

T0 P

2 g ( ) g (t ) , t N . t

(4.51)

unde > 0 este un factor de scal fixat.


84

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

Evaluarea varianei la fiecare generaie poate fi ns consumatoare de timp. n plus, nu este neaprat necesar ca variana s scad de-a lungul generaiilor, chiar pe termen lung. De aceea, temperatura de clire poate fi definit mai simplu prin:
Tc [t ] =
def

max { g ( )}
t

g (t )

, t N ,

(4.52)

avnd n vedere c maximul funciei de potrivire trebuie oricum evaluat n fiecare generaie (printr-o cutare exhaustiv). n plus, ansa ca media populaiei s creasc de-a lungul generaiilor este mai mare dect ansa ca variana acesteia s scad. n oricare dintre definiiile anterioare, temperatura de clire nu nregistreaz neaprat o scdere, ci o adaptare la caracteristicile fiecrei generaii. De fapt variaia nregistrat de temperatur poate cunoate mai multe salturi de-a lungul evoluiei populaiei. Ori de cte ori generaia curent pare a se grupa n jurul unui optim, prin remprosptare, se deschide posibilitatea de a iei din captura acelui optim local, ctre altul, mai performant. Aceasta se produce prin intrarea n cadrul elitei a unui cromozom puternic dominant. Funcia sa de potrivire poate fi departe de media generaiei, fapt care produce creterea temperaturii de rcire. Acest fenomen este ilustrat i n Figura 4.11, pentru dicionarul timp-frecven-scal Gaussian din care au fost extrai atomii Figurii 4.3.
Varia ia temperaturii de clire pn la atomii cei maimatching potrivii atoms Variation of temperature for first best Variation of annealing annealing temperature forthe the first 3 3 best matching atoms Numr de genera ii la fiecare Number of generations per scale Number of generations per scal scale 24 21 21 13 24 21 21 13

7 7

36 36

34 34

14 14

14 14

6 6
Temperaturtemperature de clire Annealing Annealing temperature

5 5

4 4

3 3

2 2

1 1 0 0 1 1 2 2 3 3 4 4 5 5 6 6 7 7

Indice de scal Scale index Scale index

Figura 4.11. Un exemplu de variaie a temperaturii de clire. Temperatura este definit n acest exemplu de (4.51). La fiecare scal a fost iniiat un proces de evoluie plecnd de la o populaie cu un numr redus de cromozomi timpfrecven ( P = 100 ). Aa cum ilustreaz i Figura 4.4, numrul total de cromozomi este sensibil mai mare la scale joase dect la scale nalte. Din acest motiv, diversitatea populaiilor se menine mai mult timp la scalele joase. Acest fenomen este ilustrat i de variaia temperaturii de clire din Figura 4.11, unde, n zona scalelor joase, exist cteva
85

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

salturi importante ale temperaturii din cauza schimbrii dramatice a elitei. La scale nalte, ns, se ajunge mai repede la elita optimal (ntr-un numr mai redus de generaii), deoarece numrul de atomi timp-frecven-scal este mai redus. Strategia de selecie bazat pe clire simulat asigur astfel i un echilibru ntre diversitatea populaiei i viteza de convergen ctre optim. Reprezentativitatea calculat cu ajutorul uneia dintre definiiile (4.51) sau (4.52) cuantific fertilitatea fiecrui cromozom, n funcie de potrivirea sa i de capacitatea de reproducere ale celorlali cromozomi din generaia curent. Populaia temporar t este practic construit prin selecie natural, pe baza fertilitii cromozomilor. Dup construcia acesteia, urmeaz aplicarea operaiilor genetice pentru completarea locurilor libere din cadrul generaiei urmtoare t +1 . Acestea se aplic astfel: nti ncruciare, apoi mutaie asupra celor 2 cromozomi urmai dominani (selectai dintre cei 6 participani la ncruciare) i n final inversiune tot asupra urmailor dominani selectai. De cele mai multe ori, mutaia i ncruciarea nu se mai aplic, din cauza probabilitilor mici asociate. Cu toate acestea, dac operaia de ncruciare eueaz (este selectat LSB ca pivot), probabilitatea mutaiei crete i se aplic perechii de prini care nu au putut fi ncruciai. Dac nici mutaia nu s-a putut efectua, atunci trebuie s creasc probabilitatea inversiunii, care se va aplica tot asupra celor doi prini. Urmaii selectai prin strategia elitist ajung n generaia t +1 numai dac sunt diferii de oricare alt cromozom deja existent n cadrul acesteia. Cromozomii selectai pentru aplicarea setului de operaii genetice pot sau nu s continue s mai participe la alte operaii genetice. Dac ei sunt nlturai, exist pericolul ca, la sfrit, cnd au mai rmas numai civa cromozomi n t , acetia s fie identici. n acest caz, fie lor li se aplic numai mutaii i/sau inversiuni, fie locurile libere din t +1 sunt pur i simplu ocupate de ctre cromozomi ntmpltori distinci, alei din afara generaiei t . Dac nu se nltur nici un cromozom din populaia t , cei mai api pentru reproducere tind s domine scena i s produc numai ei urmai. nlturarea cromozomilor care au participat deja la o operaie genetic este o opiune care asigur un mai bun echilibru ntre diversitatea populaiei i viteza de convergen. Pentru a ncheia acest paragraf, este necesar referirea la iniializarea i la maniera de oprire a AG. Procesul de evoluie al unei populaii de cromozomi ncepe cu o generaie iniial a populaiei, care ar trebui s fie ct mai divers. Spre deosebire de muli algoritmi de optimizare, AG sunt aproape insensibili la iniializare, ceea ce le confer un mare avantaj. Pentru dicionarul timp-frecven-scal, populaiile iniiale se pot genera pentru fiecare scal n parte, cu ajutorul laticii timp-frecven din Figura 4.2. Deoarece este dificil localizarea punctului de optim n latice fr un algoritm preliminar, iniializarea cea mai natural const n repartizarea uniform a celor P cromozomi peste ntreaga latice. Pentru fiecare indice de scal m M , laticea timp-frecven este eantionat cu perioada 0 = Ts de-a lungul axei timpului i cu lrgimea de band 0,m de-a lungul axei frecvenei. Numrul de celule ale laticii este egal cu ( N y 1) ( K m + 1) . Cum P << ( N y 1) ( K m + 1) , se impune o re-eantionare a laticii n vedere iniializrii AG. Aceasta se realizeaz simplu, redefinind parametrii de eantionare prin multiplicarea cu ( N y 1) / P (pentru axa timpului), respectiv

( K m + 1) /

P (pentru axa frecvenei). Cromozomii situai acum la

mijlocul fiecrei noi celule din laticea re-eantionat reprezint generaia iniial a populaiei. Desigur, indicii corespunztori acestora trebuie evaluai innd cont de eantionarea original a laticii. n general, dac celula generic din laticea re-eantionat
86

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

are poziia normalizat ( p, q ) , cu

p, q 0, P + 0.5 1 (poziie care indic centrul


n p ,k m , q

acesteia), ei i corespunde cromozomul

, cu: (4.53)

(2 p + 1) ( N y 1) (2q + 1)( K m + 1) np = i k m , q = . P 2 2 P

Interesant este faptul c, n cazul procesului de urmrire prin potrivire, dei funcia de potrivire se schimb la fiecare iteraie (conform definiiei (4.43)), nu este necesar iniializarea AG dect la prima iteraie. Pentru fiecare iteraie, generaia iniial poate fi chiar generaia final a iteraiei anterioare. Simulrile au demonstrat c atomul cel mai potrivit al iteraiei curente se gsete doar la cteva generaii ulterioare ale geneaiei finale din iteraia anterioar. Mai precis, dac la iteraia i 1 populaia de cromozomi din care s-a extras cromozomul optim se afl la generaia i 1,t , atunci, plecnd cu aceasta ca generaie iniial pentru iteraia i (adic i ,0 = i 1,t ), cromozomul optim se obine n generaia i ,t +n , cu n de ordinul unitilor sau zecilor (cel mult). Aceasta permite reducerea semnificativ a timpului de cutare. Dac s-ar pleca din nou de la generaia iniial neutr (cu repartizare uniform peste laticea timp-frecven), atunci optimul s-ar obine dup cel puin cteva sute de generaii. Explicaia pentru acest fenomen rezid n nsi forma funciei de potrivire i maniera de evaluare a reziduului urmtor. Faptul c din semnalul rezidual curent a fost eliminat contribuia unui atom, nu modific valoarea de potrivire a acelor cromozomi din generaia i 1,t care au suporturi disjuncte n timp sau frecven cu atomul cel mai potrivit eliminat (adic sunt, practic, ortogonali cu acesta). Fenomenul este cu att mai evident cu ct scala curent este mai mare (atomii sunt mai comprimai, avnd suporturi mai scurte). Pentru a opri evoluia unei populaii n cadrul unui AG, exist mai multe teste de stop utilizate n diferite aplicaii. Tradiional, evoluia populaiei de cromozomi este oprit dup un numr T N suficient de mare de generaii (de regul, de ordinul sutelor sau miilor). Un alt test de stop se poate imagina apelnd la conceptul de supravieiuire a unui cromozom dominant de-a lungul mai multor generaii. Astfel, dac acesta supravieuiete peste S N \ {1} generaii (de circa 10 ori mai mic dect T ), atunci el este declarat cromozomul optim. La nceput, ns, durata de via impus a unui cromozom ar trebui s fie mai mare dect cea din generaiile finale, deoarece diversitatea populaiei este de asemenea mare. Durata de via ar putea s se adapteze treptat la procesul de evoluie. De exemplu, se pot impune condiiile urmtoare: pentru generaia iniial, S = T ; pentru generaiile de la momentul t = T S0 + 1 pn la momentul t = T , durata de via este egal cu S0 (constant, de circa 10 ori mai mic dect T ); descreterea duratei de via impuse s fie exponenial. Acestea conduc la urmtorul profil al duratei de via impuse:
def S [t ] = max S0 , T S0 +1
t S0 , t N . t T + S0 1 T

(4.54)

Din motive de siguran, ambele teste ar putea fi considerate. De exemplu, evoluia populaiei nceteaz atunci cnd fie s-au produs T generaii, fie a aprut un cromozom dominant care a supravieuit timp de S [t ] generaii consecutive, pn la generaia t inclusiv (pentru t N ). n orice caz, odat evoluia oprit, cromozomul dominant din cadrul ultimei generaii produse este desemnat optim. Parametrii uzuali n proiectarea unui AG sunt enumerai n Tabelul 4.2.
87

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

Tabelul 4.2. Parametri care configureaz un Algoritm Genetic. dimensiunea populaiei: P 50,200 ; probabilitatea de ncruciare: Pcro [0.5,1] ; probabilitatea mutaiei: Pmut [0 ,0.1] (cu cretere la Pcro , dac este cazul); probabilitatea inversiunii: Pinv [0,0.05] (cu cretere la Pcro , dac este cazul); proporia elitei n cadru generaiilor:

pe [0.01,0.3] ;

numrul maxim de generaii ale evoluiei populaiei: T 50,200 ; numrul maxim de operaii genetice necesar pentru completarea generaiei urmtoare: M go 3P,6 P ; factorul de supravieuire de baz: S0 2, T /10 . 4.5. Algoritmul GAMP Combinaia dintre urmrirea prin potrivire i AG este sumarizat n Algoritmul 4.1. Algoritmul 4.1. GAMP Un algoritm genetic al urmririi prin potrivire.
0 Date de intrare: Dicionarul E x [ w] , reziduul i x (pentru i N arbitrar fixat) i

parametrii AG din Tabelul 4.2. Operaiile care urmeaz se pot implementa n paralel la nivelul fiecrei scale, de indice m 0, M . 1. Iniializare. Se construiete populaia iniial 0 (de dimensiune P ) prin reeantionarea laticii timp-frecven (pentru i = 0 ) sau prin preluarea ultimei generaii de la iteraia (i 1) . Se detecteaz cromozomul dominant al populaiei 0 (prin utilizarea funciei de potrivire g i definiia (4.43)) i se iniializeaz indexul su de supravieuire: s = 1 . Se ncepe procesul de evoluie cu generaia iniial (pentru
t = 0 ).

2. Ct timp t T i s S [t ] , se efectueaz urmtoarele operaii: 2.1. Se extrage elita generaiei curente t i se transfer direct generaiei urmtoare t +1 . Elita este format din primii pe P cromozomi dominani. 2.2. Se evalueaz reprezentativitatea R t a cromozomilor din t (cu ajutorul definiiilor (4.48), (4.50), (4.51), i (4.52) (unde g g i ). 2.3. Se construiete -populaia curent t (cu P pe P cromozomi), utiliznd Algoritmul generalizat al lui Baker (Algoritmul B.2), n care mulimea de plecare este t , iar profilul asociat de distribuie este R t . 2.4. Se repet paii urmtori pn la completarea populaiei urmtoare, t +1 : 2.4.1. Fie ngo = 0 numrul iniial de operaii genetice. Pentru ngo M go : a. Se extrage la ntmplare o pereche de cromozomi {, } t (care vor fi nlturai din t dup utilizare).
88

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

Algoritmul 4.1. GAMP Un algoritm genetic al urmririi prin potrivire (final). b. Dac , li se aplic ncruciarea genetic de probabilitate Pcro la nivel de gen i se incrementeaz ngo cu 1. Se selecteaz 2 cromozomi dominani c i c , dintre cei maxim 6 disponibili (2 prini i 4 urmai, dac ncruciarea a fost efectiv aplicat sau cei 2 prini dac ncruciarea nu a fost aplicat). c. Se aplic o mutaie de probabilitate Pmut asupra lui c i, dac este diferit de acesta, asupra lui c (valoarea probabilitii fiind Pcro dac

c = c ). Se incrementeaz ngo cu 1. Se selecteaz 2 cromozomi


dominani cm i cm , dintre cei maxim 4 disponibili (2 prini i 2 urmai, dac mutaia s-a aplicat efectiv sau numai 2 prini, dac mutaia nu s-a aplicat). d. Se aplic o inversiune de probabilitate Pinv asupra lui cm i, dac este diferit de acesta, asupra lui cm (valoarea probabilitii fiind Pcro dac

cm = cm ). Se incrementeaz ngo cu 1. Se selecteaz 2 cromozomi


dominani cmi i cmi , dintre cei maxim 4 disponibili (2 prini i 2 urmai, dac inversiunea s-a aplicat efectiv sau numai 2 prini, dac inversiunea nu s-a aplicat). e. Se adaug cmi i cmi generaiei t +1 i se elimin toate clonele acestora din t +1 , dac exist. (Generaia t +1 nu poate conine dect cromozomi distinci). 2.4.2. Dac generaia t +1 include mai puin de P cromozomi, aceasta se completeaz cu un numr corespunztor de cromozomi alei la ntmplare din dicionar (dar la scala corespunztoare populaiei). 2.5. Se incrementeaz t cu 1. Se determin cromozomul dominant al populaiei t +1 . Dac acesta coincide cu cel al populaiei t , se incrementeaz i indexul de supravieuire s cu 1. Altfel, acesta este reiniializat cu valoarea unitar, pentru noul cromozom dominant. 3. Se alege cromozomul timp-frecven dominant, nm ,km , din populaia final t i se declar optim pentru scala de indice m 0, M . 4. Se determin cromozomul timp-frecven-scal exhaustiv n mulimea { nm ,km }
m0, M

optim

mi ,ni ,ki , prin cutare

Date de ieire: Atomul cel mai potrivit la iteraia i N adic: w[mi ,ni ,ki ] . Algoritmul GAMP a fost utilizat ntr-o aplicaie de diagnoz a defectelor unor sisteme mecanice simple (rulmeni, roi dinate), descris n seciunea de rezultate de simulare. Alte implementri i adaptri ale acestui algoritm au fost realizate la Universitatea Politehnic din Lausanne (Elveia), aplicaia abordat referindu-se la prelucrarea de imagini furnizate de satelii [FiVa01], [FVF01], [FVF02]. Implementarea adoptat n acest proiect a necesitat un mare numr de artificii informatice, ale cror detalii sunt prea tehnice i numeroase pentru a fi descrise n raportul de cercetare de fa. Lista programelor i rutinelor implicate se gsete ntr-o anex a manulalului de utlizare [ASTI09].
89

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

Algoritmul GAMP se sprijin pe dou programe principale: VIBRA_PF (care realizeaz o serie de prelucrri preliminare a semnalelor de la baza diagnozei de defect; n aplicaia descris, aceste semnale sunt vibraii mecanice, achiziionate cu ajutorul accelerometrelor) i GENIC_MP (care implementeaz efectiv Algoritmul GAMP). Cele mai importante rutine ale acestor programe sunt: atom (extrage un atom din dicionarul timpfrecven-scal), fitness (realizeaz proiecia unui semnal pe un atom i calculeaz funcia de potrivire) i genetics (implementeaz nucleul Algoritmului Genetic). Publicaia care include att descrierea Algoritmului GAMP, ct i rezultate de diagnoz obinute cu ajutorul acestuia, este cartea [SSP09], n curs de apariie la Editura Academiei Romne. Echipa de cercetare este n curs de pregtire a unei serii de articole pe aceast tem, care vor fi propuse, ncepnd cu anul 2010, unor conferine internaionale i reviste de specialitate, de nivel ISI.


Algoritmii descrii pn acum au fost testai pe diferite seturi de date achiziionate, din domenii diverse. n seciunea urmtoare, sunt prezentate cteva dintre rezultatele acestor teste. De asemenea, cele dou publicaii anexate descriu studii de caz, finalizate cu rezultate de simulare, n care sunt implicai algoritmii PARMAX i FORWAVER, prin comparaie cu algoritmul PARMA. Utilizatorul beneficiaz de o interfa grafic de dialog, convivial, numit FORECAST. Ea este descris n manalul de utilizare [ASTI09] i permite rularea oricruia dintre cele 4 programe prezentate (PARMA, PARMAX, FORWAVER i GAMP). Trusa de senzori specializai n meteorologie i ecologie (singura avnd capacitatea de a transmite datele pe cale undelor radio) are de asemenea o interfa grafic uor de accesat i utilizat, numit eKo-View. Ea este descris tot n cadrul manualului de utilizare [ASTI09]. Sistemul UMAPID a fost prezentat n cadrul expoziiei de produs organizate cu ocazia simpozionului Inovarea o ans pentru Romnia, organizat la Universitatea Politehnica din Bucureti de ctre AMCSIT Politehnica, n zilele de 28 i 29 iulie 2009. Imaginile care urmeaz ilustreaz standul la care a fost expus sistemul mobil, mpreun cu o parte dintre membrii echipei de cercetare. Se pot observa: unitatea mobil de calcul mpreun cu interfaa grafic de predicie, interfaa VISA (conectat i la un osciloscop, pentru testare) i senzorii amplasai n apropierea unor plante de interior din salonul expoziional. Fotografiile surprind maniera n care se desfoar monitorizarea multi-canal a doi parametri corelai din ecosistemul plantelor: temperatura i umiditatea.

90

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

Figura FOTO. Participarea sistemului UMAPID la Salonul inovrii, Bucureti, 28-29 iulie 2009.
91

Algoritmi evoluai de identificare i predicie a fenomenelor ecologice

92

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

5. Rezultate obinute cu ajutorul sistemului UMAPID n funciune


Studiile de caz abordate n cadrul acestei seciuni demonstreaz funcionalitatea algoritmilor implementai n cadrul sistemului UMAPID. Au fost considerate 3 aplicaii: Predicia unui bloc de 4 canale de msur a temperaturilor ambiante zilnice (minim i maxim) din oraele Bucureti i Ploieti (relativ apropiate ntre ele i fr forme de relief abrupte care s le separe). Programe utilizate: PARMAX i PARMA. Predicia unor serii de timp uni-dimensionale din cteva domenii diferite (curs de schimb, omaj, intensitatea contiinei colective). Programe utilizate: FORWAVER i PARMA. Diagnoza de defecte multiple, efectuat asupra unor rulmeni cu bile. Program utilizat: GAMP. 5.1. Predicia datelor multi-dimensionale Pentru simulrile cu date multi-dimensionale (n care intervine predictorul PARMAX, prin comparaie cu predictorul PARMA), au fost anexate n finalul raportului de cercetare articolele urmtoare: [StCu09] (publicaie indexat ISI) n care este predictat un bloc de 4 temperaturi ambiante (dou maxime i dou minime zilnice) msurate cu ajutorul eKo-senzorilor n oraele Bucureti i Ploieti; [SSCM09] (acceptat la conferin internaional IEEE, indexat ISI) n care blocul de date provine din medicin i conine tot 4 canale (glicemie i ioni de sodiu pentru un pacient de sex masculin i altul de sex feminin). Aa cum arat i concluziile acestor articole, aparent, predictorul PARMAX ofer rezultate de predicie superioare predictorului PARMA. n primul caz, aceasta se datoreaz n special corelaiei destul de pronunate care exist ntre temperaturile celor dou orae, aflate la numai 60 km deprtare unul fa de altul i nedesprite de forme de relief abrupte. Alte simulri cu blocuri de date de temperatur ambiant din orae ndeprtate (de exemplu, Bucureti i Arad, Timioara sau Braov) au condus la performane mai slabe ale predictorului PARMAX n raport cu PARMA. Este clar c, dac ntre canalele de msur nu exist corelaii sau acestea sunt foarte slabe, utilizarea unor predictori de complexitate ridicat, cum este PARMAX, nu se recomand. n acest caz, PARMA este mai precis i mai rapid. n ceea ce privete datele din medicin, rezultatul de predicie a confirmat ceea ce se tie de mult vreme: glicemia i cantitatea de ioni de sodiu ai unei persoane sunt doi parametri corelai ntre ei. Corelaia este ns destul de complex i subtil. Cu toate acestea, predictorului PARMAX nu i-a scpat. Mai mult, el a pus n eviden un nou tip de corelaie ntre analizele unor pacieni care, fie sunt nrudii, fie le-au efectuat n aproximativ aceleai condiii. n cazul celor doi pacieni de sexe opuse, nenrudii, singura explicaie pentru corelarea analizelor lor o constituie faptul c au fost investigai n acelai spital, n aceleai condiii i n aceeai perioad. Predicia evoluiei glicemiei unui pacient este de maxim importan pentru medic (mult mai important dect predicia temperaturii ambiante). El poate astfel interveni nainte ca parametrul s ating valori letale pentru pacient. De notat c multe dintre datele provenind din diferite domenii sunt destul dificil de predictat, din cauza perturbaiilor care le-au corupt. n acest sens, de exemplu, datele din meteorologie sau ecologie se pot ncadra n categoria celor netede, n care zgomotele nu depesc limite normale. De aceea, ele sunt relativ mai precis predictate. Datele medicale, ns, au o variaie mai puin neted, fiind mai greu de predictat. Ceea ce nc nu se poate predicta precis cu aceste modele numerice (indiferent de domeniu) este variaia brusc, avnd efecte catastrofice n anumite cazuri (de exemplu, o tornad brusc sau un cutremur, o nrutire brusc a valorilor glicemiei).
93

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

5.2. Predicia datelor uni-dimensionale Scopul principal al experimentelor efectuate cu date uni-dimensionale a fost acela de a testa performanele predictorului FORWAVER, n raport cu cele ale predictorului PARMA. Spre deosebire de predictorul PARMAX, cel bazat pe undine este n mod constant superior lui PARMA (desigur, cu preul creterii sensibile a complexitii). Prima aplicaie selectat provine din economie i se refer la rata de schimb dintre EURO i dolarul american (USD), de la punerea n circulaie a monedei europene. Publicaia [SCI08] (indexat ISI i anexat n finalul raportului) prezint rezultatele superioare de predicie obinute de FORWAVER, n raport cu PARMA. De notat c predicia acestui curs de schimb nu a fost una banal, avnd n vedere inversarea saportului dintre cele dou monede ntr-un timp relativ scurt. Urmtoarele dou experimente vor fi prezentate pe larg n continuare. Ele sunt descrise i n cartea [SSP09] (n curs de apariie la Editura Academiei Romne). Datele asupra crora va fi focalizat discuia care urmeaz fac parte dintr-un corpus variat de serii de timp, care au mai degrab o natur statistic. Este vorba despre: Y1 Rata lunar medie a omajului n SUA, estimat ntre ianuarie 1973 i iulie 1985 (151 de eantioane). Y11 Evoluia contiinei colective a omenirii, conform unor msurtori efectuate la Kings College din Londra, ntre iulie 2000 i septembrie 2004 (128 de eantioane). Cele mai multe dintre seriile de timp ale acestui corpus posed doar un numr relativ redus de date (ca i cele selectate), fiind totodat afectate de zgomote relativ importante. Aceste caracteristici sunt extrem de utile n vederea testrii algoritmilor n condiii dificile. Unele serii de timp posed component sezonier vizibil, altele nu, iar altele necesit intervenia unor modele sofisticate (cum este i cel bazat pe undine) pentru a le fi detectat aceast component. Alte serii de timp, cum este i Y11, sunt relativ surprinztoare (sub rezerva corectitudinii metodei de msurare). Ineditul seriei Y11 (contiina colectiv a umanitii) este dat de faptul c ea posed dou minime foarte adnci, corespunztoare evenimentelor tragice din septembrie 2001 (n SUA) i martie 2003 (n Spania). Cu alte cuvinte, potrivit cercettorilor de la Kings College din Londra, tonusul general al omenirii a nregistrat scderi brute i extrem de pronunate n preajma i din cauza acestor evenimente. Cele dou serii de timp precizate mai sus au fost selectate din anumite motive: Y1 - pentru detecia relativ dificil a componentei sezoniere i Y11 nu att pentru ineditul su ct, mai ales, pentru a ilustra o limit important a algoritmilor numerici de predicie, care este incapacitatea de a prognoza catastrofe n timp util. n continuare, pentru fiecare dintre cele 2 serii de timp vor fi ilustrate comparativ performanele de predicie ale perechii de algoritmi PARMA FORWAVER. Cteva comentarii succinte preced imaginile prezentate. 5.2.1. Predicia seriei de timp a omajului n SUA n cazul acestei serii de timp, ilustrate n Figura 5.1, performana superioar a predictorului FORWAVER este evident: o valoare de 87.95% a criteriului PQ pentru modelul ARMA clasic (Figura 5.3), fa de 94.82% pentru modelul cu undine (Figura 5.10). Se observ c modelul cu undine mbuntete nu doar precizia de predicie (n special la primele 3 momente), ci i tubul de ncredere (care este mai ngust). n afara prediciei, modelul cu undine realizeaz i o compresie de rat grosier egal cu aproximativ 49.23%, pentru un nivel de mascare de 2%. Astfel, 49.23% dintre coeficienii undin au fost anulai, informaia codificat de ei fiind transferat zgomotului colorat. Performana superioar a prediciei se datoreaz aadar faptului c nivelul de mascare a reuit s traseze o linie de demarcaie mai clar ntre componenta determinist i cea nedeterminist a seriei de timp, fa de demarcaia realizat de modelul clasic.
94

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

Scalograma asociat fiecrui model cu undine este util n selectarea nivelului de mascare. (Scalograma este definit ca o aplicaie bidimensional care surprinde variaia ptratelor modulelor coeficienilor undin peste planul timp-frecven. Cu alte cuvinte, scalograma reprezint o distribuie a energiei seriei de timp peste acest plan, fiind similar unui spectru variabil n timp.) n cazul acestei serii de timp, scalograma (trasat n dB) este ilustrat n Figurile 5.6 (n plan) i 5.7 (n spaiu), fiind corelat cu arborele binar optimal asociat Transformatei Undin (determinat cu ajutorul procedurii IDA*), reprezentat n Figura 5.5. Nivelul de mascare este ridicat treptat, pn cnd valoarea estimat a SNR descrete brusc. (n acest context, SNR este evaluat prin efectuarea raportului dintre energia seriei de timp i cea a zgomotului colorat.) Aceast descretere a fost nregistrat pentru > 0.02 . Arborele binar ilustreaz de asemenea c, pentru aceast serie de timp, informaia determinist asociat prediciei pare a fi localizat n zona de frecvene medii, focalizat pn la o adncime egal cu 5. Undinele tat i mam care definesc Transformata Undin sunt ilustrate n Figura 5.4 i corespund parametrului de suport N = 12 (cel mai bun, n sensul valorii maxime a PQ). Acestea sunt reprezentate la rezoluia grosier ( L = 0 , de asemenea cea mai bun, n sensul valorii maxime a PQ), astfel c ele formeaz o baz ortonormat. Graficul suprafeei calitii prediciei (din Figura 5.8) a fost trasat pentru diferite valori ale componentei stocastice de tip ARMA, prin varierea indicilor structurali afereni ( na i nc ). Pentru a-l trasa, s-a apelat la strategia rezervrii ultimelor K / 2 date, despre care s-a amintit n seciunea 2. Evident, punctul de maxim al suprafeei simulate ofer predictorul optimal (de ordine na = 23 i nc = 18 ), care este re-identificat folosind ntregul set de date. Pentru el, se sper obinerea unei performane de predicie superioare n afara orizontului de msur. Cu toate acestea, valoarea maxim a PQ din cazul simulat (de 99.56%) a sczut pe orizontul real de predicie (n care datele msurate sunt necunoscute) la 94.82%. n acest caz, scderea nu este att de pronunat ca n cel al seriei de timp urmtoare. n general, ns, fenomenul de scdere a valorii PQ este inevitabil, tocmai din cauza faptului c datele msurate nu pot codifica ntreaga informaie despre viitor. 5.2.2. Predicia seriei de timp a contiinei colective Seria de timp este ilustrat n Figura 5.11. Chiar dac predictorul bazat pe undine (Figura 5.20) mbuntete performana predictorului clasic (Figura 5.13), creterea valorii PQ este mic (de la 87.42% la 89.63%). mbuntirea const mai mult n ngustarea tubului de ncredere. Mai mult, fa de valoarea de simulare a criteriului PQ (de 99.2%, din Figura 5.18), scderea la valoarea real de 89.63% este semnificativ. Aceast serie de timp nu este uor de predictat, n special din cauza existenei evenimentelor catastrofice (variaii brute de durat scurt i amplitudini mari, nregistrate la momente de timp aparent aleatoare). Dificultatea prediciei este accentuat i de aliura seriei de timp din afara celor dou perioade de apariie a catastrofelor, asemntoare variaiei unui semnal seismic. Nivelul de mascare a fost ridicat tot la 2% (ca n cazul seriei de timp precedente). Acesta a condus la mascarea a 63.76% dintre coeficienii undin. Scalograma seriei de timp (trasat n dB) este ilustrat n Figurile 5.16 (n plan) i 5.17 (n spaiu). Ea corespunde arborelui binar reprezentat n Figura 5.15. Se relev faptul c, n cazul acestei serii de timp, informaia determinist se afl localizat n zona de frecvene joase spre medii, unde adncimea de focalizare este egal cu 5. Undinele tat i mam ale modelului sunt ilustrate n Figura 5.14. Ele au fost construite plecnd de la parametrul optimal de suport N = 21 , astfel c au o regularitate ridicat fapt care corespunde variaiei linitite a seriei de timp n afara zonelor de catastrof. Ca i n cazul seriei precedente, rezoluia optimal reprezentare a acestor undine este tot cea grosier ( L = 0 ), astfel c ele formeaz o baz ortonormat.
95

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

Figura 5.1. Seria de timp Y1, mpreun cu tendina i componenta sezonier.

Figura 5.2. Y1: Vedere global asupra prediciei clasice i a performanei asociate.
96

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

Figura 5.3. Y1: Vedere detaliat asupra orizontului de predicie clasic.

Figura 5.4. Y1: Undinele tat i mam ale predictorului bazat pe undine.
97

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

Figura 5.5. Y1: Arborele binar optimal asociat Transformatei Undin.

Figura 5.6. Y1: Scalograma seriei de timp (reprezentare n plan).


98

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

Figura 5.7. Y1: Scalograma seriei de timp (reprezentare n spaiu).

Figura 5.8. Y1: Suprafaa de calitate a prediciei i punctul de maxim.


99

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

Figura 5.9. Y1: Vedere global asupra prediciei cu undine i a performanei asociate.

Figura 5.10. Y1: Vedere detaliat asupra orizontului de predicie cu undine.


100

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

Figura 5.11. Seria de timp Y11, mpreun cu tendina i componenta sezonier.

Figura 5.12. Y11: Vedere global asupra prediciei clasice i a performanei asociate.
101

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

Figura 5.13. Y11: Vedere detaliat asupra orizontului de predicie clasic.

Figura 5.14. Y11: Undinele tat i mam ale predictorului bazat pe undine.
102

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

Figura 5.15. Y11: Arborele binar optimal asociat Transformatei Undin.

Figura 5.16. Y11: Scalograma seriei de timp (reprezentare n plan).


103

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

Figura 5.17. Y11: Scalograma seriei de timp (reprezentare n spaiu).

Figura 5.18. Y11: Suprafaa de calitate a prediciei i punctul de maxim.


104

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

Figura 5.19. Y11: Vedere global asupra prediciei cu undine i a performanei asociate.

Figura 5.20. Y11: Vedere detaliat asupra orizontului de predicie cu undine.


105

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

5.3. Diagnoz de defecte mecanice Aplicaia prezentat pe scurt n cadrul acestui paragraf abordeaz o problem de detecie i identificare a defectelor care apar i se pot dezvolta n cadrul unui sistem mecanic de complexitate medie. Studiul de caz luat n considerare este cel al rulmenilor cu bile. n pofida aparenelor, defectele singulare posibile ale acestora sunt grupate n circa 12 clase, astfel c identificarea unui anumit comportament anormal nu reprezint o problem banal. De altfel, unii dintre marii productori de rulmeni (cum este i FAG din Germania [FAG97a]), i-au dezvoltat propriile sisteme de testare i detecie de defecte (de exemplu testorul FAG-2000 [FAG97b]). Una dintre cele mai populare metode adoptate de industrie este cea a Analizei de anvelop spectral aplicat vibraiilor mecanice msurate la nivelul rulmentului testat [ABY94]. Metoda este de complexitate redus i se bazeaz pe utilizarea unor filtre speciale, cunoscute sub numele de o treime de octav (ai cror parametri sunt totui relativ dificil de acordat). n urma aplicrii ei, este posibil detecia oricruia dintre cele 12 tipuri de defecte, dac se manifest izolat. Metoda nu este capabil s identifice defectele multiple (combinaii de defecte singulare). ns, ea furnizeaz n plus o estimaie a duratei medii de via a rulmentului pn la momentul cnd acesta trebuie nlocuit. nlocuirea la timp a pieselor afectate de defecte este una dintre cele mai importante operaii de ntreinere a unui sistem mecanic. Costurile demontrii i remontrii unei piese defecte cresc n raport cu durata fa de momentul optim la care ar trebui efectuat schimbarea acesteia. Schimbarea prematur conduce la o cantitate mai mare de piese consumate n decursul timpului, n timp ce schimbarea ntrziat expune i alte componente ale sistemului la defecte datorate n special supra-solicitrii. Metodele de analiz timp-frecven aplicate vibraiilor mecanice au fost utilizate pentru detecia de defecte n cuplajele de roi dinate nc de la nceputul anilor 90 [WaFa93a], [WaFa93b]. Tot pentru roi dinate au fost utilizate i undinele ortogonale ale lui Daubechies civa ani mai trziu [WaFa95], [WaFa96]. Performanele acestora sunt ns relativ modeste, probabil tocmai din cauza ortogonalitii. Redundana n informaie este factorul cheie pentru aplicaiile de detecie de defecte. Metoda descris succint n continuare apeleaz la dicionare timp-frecven-scal i Algorimul GAMP. Va fi demonstrat capabilitatea sistemului UMAPID nu doar de a detecta defecte multiple, ci i de a estima gradul de severitate al acestora, adic (indirect) gradul de uzur a rulmenilor (ceea ce permite luarea unei decizii privind momentul nlocuirii lor). 5.3.1. Caracteristici ale vibraiilor emise de sisteme mecanice Sistemele mecanice n funciune emit vibraii care pot fi msurate cu ajutorul unor traductoare (senzori) numite accelerometre. Acestea transform acceleraiile locale ale micrilor prilor mecanice pe care sunt aplicai n semnale electrice, numite ad hoc vibraii. n general, mai mui factori concur la formarea vibraiilor, aa cum este ilustrat n Figura 5.21.
Ambient

e x u d w v

Sistem mecanic

Mixer

Senzor

x = oscilaie natural w = vibraie mecanic brut v = vibraie electric (date)

e = zgomot ambiental d = zgomot de defect u = interferene

Figura 5.21. Principiul genezei vibraiilor mecanice.


106

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

Astfel, sistemul mecanic poate genera 3 clase de semnale: oscilaii naturale (modelate prin ecuaii difereniale adecvate), semnale de interferen cu alte (sub)sisteme mecanice i zgomote de defect (care indic starea de sntate a sistemului). mpreun cu zgomotul ambiental, aceste semnale sunt combinate ntr-o manier necunoscut pentru a forma vibraia mecanic brut, convertit apoi n vibraie (electric) prin intermediul senzorului. La rndul lui, senzorul poate distorsiona transformarea prin caracteristicile sale (mas, neliniaritate, etc.) Mai multe modele de combinare ntre semnalele menionate au fost propuse de-a lungul timpului (n special n cazul rulmenilor sau al cuplajelor cu roi dinate). n mod natural, s-a ncercat nti aplicarea Principiului superpoziiei, conform crora semnalele pot fi adunate:
w x +u + d + e.
def

(5.1)

Carenele acestui model s-au fcut vizibile cu uurin, n special n aplicaiile de diagnoz de defect. Numeroase experimente efectuate cu ajutorul unei mari varieti de sisteme mecanice au sugerat c zgomotele (ambiental i de defect) moduleaz de fapt celelalte semnale (i nu se adun la ele): w (d + e)( x + u ) . Un alt model (considerat mai realist de ctre unii autori) este urmtorul: w (1 + d + e)( x + u ) .
def def

(5.2)

(5.3)

Acesta a aprut ca urmare a similaritilor de comportament observate ntre sistemele mecanice rotative i valurile mrii. Modelele (5.1)-(5.3) au avantajul de a fi simple i uor de manipulat, chiar dac nu sunt foarte precise. Un model de complexitate i precizie crescut este cel bazat pe operaia de modulare n frecven: w(t ) = ( t + kT (t ) ) , t R ,
kZ def

(5.4)

unde: x + u este semnalul armonic modulat cu perioada medie T > 0 , n timp ce 1 + d + e este componenta modulatoare, format din cele dou zgomote. n cadrul aplicaiei de diagnoz de defecte, discuia se concentreaz pe modelarea zgomotului de defect d . Un astfel de model a fost propus, de exemplu, n [FaSm84]:

d (t ) = A 0 (t + kT ) , t R .
kZ

def

(5.5)

n definiia (5.5), zgomotul d se formeaz prin nsumarea unor impulsuri periodice produse de ocurile datorate apariiei defectelor. Perioada T > 0 i amplitudinea A > 0 ale acestor ocuri depind de mai muli factori, cum ar fi: viteza principal de rotaie, ncrcarea sistemului mecanic, localizarea defectelor sau gradul lor de severitate. Ipoteza ocurilor periodice nu se dovedete a fi ns viabil, deoarece exist defecte care pot avea efecte (pseudo)aleatoare. De exemplu, dac o bil de rulment este cariat, ocurile apar numai atunci cnd zona afectat atinge una dintre cele dou ci de rulare (numite cmi), acest fenomen producndu-se de o manier aleatoare. De asemenea, modelul (5.5) poate fi imprecis n cazul zgomotelor produse de uzura componentelor mecanice, de imperfeciunile de execuie sau de montarea lor greit. Cu toate acestea, ideea c zgomotul de defect este produs de ocuri microscopice (micro-ocuri) cvasi-aleatoare este larg acceptat astzi. Elementul cheie n achiziia vibraiilor l constituie senzorul specializat numit accelerometru. Acesta ar trebui s aib mas i dimensiuni mult mai mici dect ale
107

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

componentei mecanice testate. Tototdat, caracteristica sa ar trebui s fie ct mai apropiat de liniaritate (ideal este ca vibraia achiziionat s depind liniar de vibraia mecanic). n acest fel, distorsiunile introduse nu pot influena major informaia principal referitoare la defecte. Accelerometrele se bazeaz pe efectul piezo-electric, care ofer posibilitatea de a scoate n eviden anumite fenomene de rezonan. Ori, majoritatea defectelor mecanice aduc accelerometrul n zona de rezonan, ceea ce permite nu numai semnalarea, ci i identificarea lor (cu metode adecvate de prelucrare de semnal). Acest comportament poate fi mai bine pus n eviden dac se analizeaz rspunsul n frecven al accelerometrului. Funcia de transfer care red cel mai bine funcionarea real a acestuia este urmtoarea:
H (s) = G s 1 . s s0 ( s s1 )( s s2 )

(5.6)

Ecuaia (5.6) pune n eviden dou sub-sisteme n cascad: unul electric, de ordin I (descris de prima fracie) i altul mecanic, de ordin II (descris de a doua fracie). n frecven, sistemul este caracterizat de aliura spectral ilustrat n Figura 5.22.
H (2j) dB

Figura 5.22. Spectrul tipic al unui accelerometru. Astfel, sunt puse n eviden 3 benzi principale: de joas, medie i nalt frecven. Banda de joas frecven are lrgime relativ redus (pn la 100 Hz) i aplic o atenuare accentuat ctre origine. Ca urmare, componenta continu a vibraiei mecanice este eliminat, iar zgomotele de joas frecven sunt atenuate treptat (mai puin ctre limita superioar a benzii, 0 ). Banda de frecven medie este considerat principal i ocup cea mai larg plaj de frecvene (care se poate ntinde pn la 60 kHz, nescznd totui sub 10 kHz). Vibraia mecanic sufer n aceast zon cele mai mici distorsiuni, spectrul su fiind replicat cu acuratee destul de mare. Distorsiunile se nregistreaz n capetele benzii (n special cel de joas frecven). n fine, n banda de frecven nalt se poate nregistra fenomenul de rezonan, n jurul frecvenei critice a accelerometrului ( 2 ). Ori de cte ori spectrul vibraiei mecanice se etaleaz dincolo de limita superioar a benzii principale, 1 , este favorizat apariia rezonanei. Este drept, ns c, n aceast zon, spectrul vibraiei mecanice este puternic distorsionat, accelerometrul acionnd ca o lup, prin accentuarea liniilor spectrale originale din jurul frecvenei de rezonan. Extinderea spectrului vibraiei mecanice dincolo de limita 1 se poate datora n mare msur micro-ocurilor introduse de diferite defecte i, ntr-o msur mai mic, zgomotului ambiental (care, chiar dac poate fi de frecven nalt, are energia mult inferioar celei a vibraiei). Cu toate acestea, anumite interferene dintre vibraiile emise de diferite componente mecanice pot de asemenea s provoace rezonana. O explicaie intuitiv relativ la funcionarea senzorului se sprijin pe imaginile din Figura 5.23.
108

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

Viteza = 0 a

Viteza 0 b

Figura 5.23. Imagini intuitive ale efectului de rezonan din funcionarea accelerometrelor. Se consider pendulul din cele dou imagini, care are un pahar de cristal (sau un diapazon) la captul liber. Pendulul oscileaz n faa unui zid. Dac zidul are suprafaa neted (ca n imaginea a), pendulul este reglat ca, la atingerea lui, paharul/diapazonul s aib viteza nul. n consecin, oscilaiile pendulului sunt silenioase. Dac, ns, dintr-o cauz oarecare, zidul capt o protuberan (ca n imaginea b), de fiecare dat cnd este atins de pahar/diapazon, este emis un sunet datorat rezonanei proprii a acestuia, semnalnd neregularitatea. Mai mult, cu ct protuberana este mai nalt, cu att sunetul emis are intensitatea mai mare, indicnd prin aceasta i nivelul ei de dezvoltare. Practic, semnalul v este format din dou componente (combinate ntr-o manier necunoscut): vnd care nu conine informaii relative la defecte i vd care codific informaia referitoare la defecte. n general, energia componentei vnd este concentrat n zona de frecven joas, n timp ce energia componentei vd n zona de frecven nalt, dei cele dou spectre nu sunt disjuncte. Componenta de interes pentru diagnosticarea sistemului mecanic este, evident, vd . Conform manierei de funcionare a senzorului, este plauzibil s se considere c micro-ocurile i interferenele sunt purtate de ctre semnalul de rezonan, ca n Figura 5.24. Practic, vd este reprezentat ca o colecie de semnale de rezonan modulate n amplitudine, cu amortizare. Semnalele apar la diferite momente de timp (nu neaprat echidistante), n funcie de micro-ocuri i/sau interferene de frecven nalt.

vd

Anvelop

0 t1

t2

t3

Timp

Semnal de rezonan purttor

Figura 5.24. Modelul cu purttoare de rezonan al vibraiei codificatoare de defect.


109

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

Pentru a atenua interferenele care mascheaz apariia defectelor, se poate utiliza metoda relativ simpl i eficace din [CaDL96a] sau [CaDL96a] (un patent nregistrat n SUA). n general, ns, dac senzorii pot fi i sunt amplasai ct mai aproape de componenta mecanic testat, influena interferenelor este redus sensibil. Gradul de severitate al defectului este corelat cu amplitudinile semnalelor purttoare de rezonan i este cuantificat cu ajutorul a 10 trepte. Defectele incipiente se situeaz pe treptele 1-2, n timp ce ultima treapt (a 10-a) indic defectele majore. 5.3.2. Platforma i parametrii de lucru ai aplicaiei Aplicaia de diagnoz s-a desfurat cu ajutorul unui mini-stand de ncercri pus la dispoziia noastr de ctre Institutul de Mecatronic de la Universitatea de tiine Aplicate din Konstanz, Germania. Mini-standul a fost completat cu cteva elemente pn la configuraia platformei de test din Figura 5.25.
Rulment testat ncrcare: ~ 200 N Rulment de nalt calitate Cuplaj elastic

Accelerometre

Motor Siemens: 2740 rot/min 370 W 380 V, 3 LMS Roadrunner Transfer de date (vibraie)

Figura 5.25. O platform de testare i diagnoz a rulmenilor. Platforma include 3 sisteme interconectate: un stand mecanic de test, un aparat de achiziie i prelucrare primar a datelor (vibraii) i UMAPID. Componentele principale ale standului mecanic sunt urmtoarele: a. Un motor de tip Siemens cu vitez maxim de rotaie de 2740 rot/min (aproximativ 45.67 Hz) i o putere de 370 W, alimentat la reeaua trifazic de 380 V. Motorul a fost dotat cu un comutator care ntrerupe alimentarea electric, n vederea rotirii libere amortizate, timp n care se efectueaz achiziia de date. Aceast facilitate permite nlturarea interferenelor dintre vibraiile msurate i armonicele de 50 Hz induse de surse de alimentare.
110

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

b. O pereche de rulmeni cu aceeai geometrie, montai n lagre aferente, demontabile. Rulmentul din apropierea motorului este selectat astfel nct s fie fr defecte i de calitate nalt. Cellalt rulment este supus testelor i poate avea defecte n diferite faze de dezvoltare (singulare sau multiple). Geometria i frecvenele naturale ale rulmenilor testai sunt ilustrate n Figura 5.26. n figur, au fost utilizate notaiile din Tabelul 5.1. Frecvenele enumerate sunt determinate de caracteristicile geometrice ale rulmentului i frecvena principal de rotaie, FR. Ele s-au dovedit a fi extrem de importante n identificarea posibilelor defecte ale rulmentului.

10 bile

Frecvene caracteristice: FR = 44.3 Hz FTCI = 224.8 Hz FTCE = 173.9 Hz FRB = 139.8 Hz FCCI = 25 Hz FCCE = 19.3 Hz

Figura 5.26. Caracteristicile constructive ale rulmenilor testai. Tabelul 5.1. Frecvenele naturale (caracteristice) ale unui rulment cu bile. Acronim FR FTCI FTCE FRB FCCI FCCE Semnificaie Frecvena de Rotaie a axului central Frecvena de Trecere (a unei bile) pe Cmaa Interioar Frecvena de Trecere (a unei bile) pe Cmaa Exterioar Frecvena de Rotaie a unei Bile Frecvena de rotaie a Coliviei fa de Cmaa Interioar Frecvena de rotaie a Coliviei fa de Cmaa Exterioar

c. O pereche de discuri metalice montate axial care aplic o ncrcare constant (de aproximativ 200 N) asupra rulmenilor. De asemenea, ineria discurilor permite prelungirea sensibil a duratei de rotaie n regim amortizat (dup ntreruperea tensiunii de alimentare a motorului). n acest fel, pe durata primelor 5 secunde de regim amortizat, viteza de rotaie este aproximativ constant, ceea ce permite o achiziie a datelor cu acuratee. d. Un cuplaj elastic axial, care permite atenuarea influenelor datorate imperfeciunilor sau uzurii motorului. Vibraiile sunt achiziionate cu ajutorul a dou accelerometre uoare montate n cuadratur pe carcasa exterioar a lagrului rulmentului de test. Astfel, semnalul achiziionat are valori complexe. Partea real este convenional atribuit vibraiei orizontale, n timp ce vibraia vertical completeaz partea imaginar. Deoarece acceleormetrele nu au facilitatea transmisiei radio (nu a fost gsit nc o firm productoare), achiziia se efectueaz cu ajutorul unui aparat suficient de complex i precis: LMS Roadrunner, de producie belgian [LMS99], pus la dispoziie tot de ctre gazdele noastre din Germania. Caracteristicile sale sunt mult superioare celor necesare n aceast aplicaie: achiziie independent pe cel puin 4 canale, compatibilitate cu o gam larg de senzori, plaj de frecvene de eantionare de la 1 Hz la 100 kHz, filtrare preliminar a datelor, interfa prietenoas cu utilizatorul, metode de trasare a spectrelor i spectrogramelor i, mai ales, conexiune radio la internet, etc. n aceast aplicaie,
111

38.5

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

frecvena de eantionare a fost stabilit la: s = 22.707 kHz. Datele sunt salvate n format .CSV (tabelat), cu 22 de bii de reprezentare pentru fiecare eantion i apoi transferate la nivelul calculatorului mobil al sistemului UMAPID, prin intermediul interfeei VISA (care aplic o serie de pre-filtrri). Datele pot fi transmise i direct calculatorului mobil (via internet), ns aceast metod nu mai beneficiaz de pre-filtrare (care trebuie executat ulterior). Primele achiziii de date au fost efectuate asupra unui rulment fr defecte (standard), etichetat prin <B3850610>, conform caracteristicilor sale geometrice. Urmtoarele date au provenit de la 3 rulmeni cu aceeai geometrie, dar prezentnd defecte: <I3850610> (cu o crptur pe cmaa interioar defect singular), <E3850610> (avnd cmaa exterioar uzat neuniform ntr-o anumit zon defect singular) i <M3850610> (cu ciobituri repartizate neuniform pe ambele cmi defect multiplu). Datele achiziionate au urmtoarele caracteristici generale: a. precizie de achiziie de aproximativ 103 n gama de variaie a senzorilor de [0.1 , + 0.1] cm/s2; b. lungime de 2.048 eantioane (aproximativ 90 ms), achiziionate pe durata a 40 de rotaii complete libere ale axului central (dup ntreruperea tensiunii de alimentare a motorului); c. SNR relativ sczut, n special n cazul rulmenilor cu defecte, estimat la valori de cel mult 6 dB (aproximativ 30% din energia semnalului este constituit de perturbaii); d. variaia vitezei de rotaie n gama (1 15% ) 44.3 Hz, datorit unei uoare excentriciti a discurilor de ncrcare. n Figura 5.27 sunt ilustrate: partea real a cte unui segment de semnal de vibraie (de durat egal cu aproximativ o treime din durata total de 90 ms), un detaliu din mijlocul segmentului i spectrul corespunztor segmentului, pentru fiecare dintre cei 4 rulmeni. Vibraiile sunt reprezentate naintea oricror prelucrri primare, cu excepia celor aplicate implicit de ctre aparatul de achiziie de date, de aceea apar corupte de un zgomot important. Se observ imediat c vibraiile i spectrele corespunztoare rulmenilor cu defecte sunt diferite de cea a rulmentului standard (ceea ce indic prezena defectelor), dar sunt relativ dificil de deosebit ntre ele, n special la nivelul spectrelor. Spectrul rulmentului standard se etaleaz pe toat gama de frecvene cu o descretere aproape liniar, fr a prezenta linii spectrale dominante la frecven nalt. n schimb, spectrele rulmenilor cu defecte indic foarte clar funcionarea anormal prin prezena unei concentrri anormale de energie la frecven nalt. Prin simpla inspecie a acestor spectre, un utilizator obinuit nu poate sesiza dect faptul c 3 dintre cei 4 rulmeni testai au defecte, fr a putea preciza natura, localizarea i gradul de severitate ale acestora. Un operator uman expert ar putea realiza aceast distincie, dar experiena sa trebuie s fie extrem de vast (sute de mii de rulmeni observai). n [StIo02], [IoSt05], sau [StIo06], au fost publicate rezultatele unei abordri n care experiena operatorului uman i maniera sa de a raiona n legtur cu identificarea unui defect au fost automatizate cu ajutorul unui model combinat fuzzy-statistic. Cu toate acestea, n cadrul aplicaiei descrise n continuare, rezultatele nu se sprijin pe experiena unui operator uman. Datele achiziionate sunt supuse unor prelucrri primare, n vederea netezirii formelor de und i a izolrii informaiei despre defecte. Prima operaie este cea de filtrare numeric folosind un filtru trece-sus (FTS), pentru a elimina armonicele principale datorate frecvenelor naturale ale rulmenilor. Din Figura 5.26, rezult c frecvena cea mai mare este de aproximativ 225 Hz, astfel c filtrul a fost proiectat s atenueze toate armonicele sub 500 Hz. Astfel, sunt eliminate cel puin dou linii spectrale corespunztoare fiecrei frecvene naturale i multiplilor acesteia. A doua operaie de prelucrare primar este cea de netezire, prin intermediul unei tehnici de mediere n frecven combinat cu Metoda verosimilitii maxime [SoSt89], [SCS05], tehnic descris n [StIo03].
112

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09> Vibraii


2 2 ) Magnitude(cm/s (cm/s Magnitude )

Spectre
**Sampling Samplingrate: rate:20000 20000Hz Hz 30 30

0.04 0.04 0.02 0.02 00

<B3850610>

20 20 10 10 00

-0.02 -0.02 00 0.05 0.05 0.1 0.1 0.15 0.2 0.15 0.2 T ime T ime(s) (s) 0.25 0.25
100 ms 0.3 0.3

Zoom Zoomon onaafull fullrotation rotationvibration vibrationdata data


2 2 ) Magnitude(cm/s (cm/s Magnitude )

0.02 0.02

00

-0.02 -0.02 0.16 0.16 0.165 0.165 0.17 0.17 T ime T ime(s) (s) 0.175 0.175 0.18 0.18 100 ms

Spectralpower power(dB) (dB) Spectral

-10 -10 -20 -20 -30 -30 -40 -40 -50 -50 00

1000 1000

2000 2000

3000 3000

4000 4000 5000 5000 6000 6000 Frequency Frequency(Hz) (Hz)

7000 7000

8000 8000

9000 9000

10000 10000

2 2 ) Magnitude(cm/s (cm/s Magnitude )

0.1 0.1 0.05 0.05 00

**Sampling Samplingrate: rate:20000 20000Hz Hz

40 40 30 30 20 20 Spectralpower power(dB) (dB) Spectral 10 10 00

<I3850610>

-0.05 -0.05 00 0.05 0.05 0.1 0.1 0.15 0.2 0.25 0.15 0.2 0.25 T ime T ime(s) (s) Zoom on a full rotation vibration data Zoom on a full rotation vibration data
100 ms 0.3 0.3

-10 -10 -20 -20 -30 -30

2 2 ) Magnitude(cm/s (cm/s Magnitude )

0.05 0.05

00

-40 -40 -50 -50 0.16 0.16 0.165 0.165 0.17 0.17 T ime T ime(s) (s) 0.175 0.175 0.18 0.18 100 ms 00 1000 1000 2000 2000 3000 3000 4000 4000 5000 5000 6000 6000 Frequency Frequency(Hz) (Hz) 7000 7000 8000 8000 9000 9000 10000 10000

-0.05 -0.05

0.06 0.06
2 2 ) Magnitude(cm/s (cm/s Magnitude )

**Sampling Samplingrate: rate:20000 20000Hz Hz 30 30 20 20 10 10 00

0.04 0.04 0.02 0.02 00 Spectralpower power(dB) (dB) Spectral

<E3850610>

-0.02 -0.02 -0.04 -0.04 00 0.05 0.05 0.1 0.1 0.15 0.2 0.25 0.15 0.2 0.25 T ime T ime(s) (s) Zoom on a full rotation vibration data Zoom on a full rotation vibration data
100 ms 0.3 0.3

-10 -10 -20 -20 -30 -30 -40 -40

2 2 ) Magnitude(cm/s (cm/s Magnitude )

0.04 0.04 0.02 0.02 00

-0.02 -0.02 0.16 0.16 0.165 0.165 0.17 0.17 T ime T ime(s) (s) 0.175 0.175 0.18 0.18 100 ms

00 40 40 30 30 20 20 Spectralpower power(dB) (dB) Spectral 10 10 00

1000 1000

2000 2000

3000 3000

4000 4000 5000 5000 6000 6000 Frequency Frequency(Hz) (Hz)

7000 7000

8000 8000

9000 9000

10000 10000

2 2 ) Magnitude(cm/s (cm/s Magnitude )

**Sampling Samplingrate: rate:20000 20000Hz Hz 0.05 0.05

<M3850610>

00

-0.05 -0.05 00

0.05 0.05

0.1 0.1

0.15 0.2 0.15 0.2 T ime T ime(s) (s)

0.25 0.25

100 ms 0.3 0.3

0.06 0.06
2 2 ) Magnitude(cm/s (cm/s Magnitude )

Zoom Zoomon onaafull fullrotation rotationvibration vibrationdata data

-10 -10 -20 -20 -30 -30 -40 -40 -50 -50 00

0.04 0.04 0.02 0.02 00

-0.02 -0.02 -0.04 -0.04 0.16 0.16 0.165 0.165 0.17 0.17 T ime T ime(s) (s) 0.175 0.175 0.18 0.18 100 ms 1000 1000 2000 2000 3000 3000 4000 4000 5000 5000 6000 6000 Frequency Frequency(Hz) (Hz) 7000 7000 8000 8000 9000 9000 10000 10000

Figura 5.27. Segmente de vibraie achiziionate de la 4 rulmeni cu bile.


113

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare Vibraii


0.02 0.02 0.015 0.015 0.01 0.01
2 2 ) Magnitude(cm/s (cm/s Magnitude )

Spectre
**Sampling Samplingrate: rate:20000 20000Hz Hz

**44full fullrotations rotations

00

<B3850610>

-10 -10 Spectralpower power(dB) (dB) Spectral

0.005 0.005 00

-20 -20

-30 -30

-0.005 -0.005 -0.01 -0.01

-40 -40

-50 -50
-0.015 -0.015 00 0.01 0.01 0.02 0.02 0.03 0.03 0.04 0.05 0.04 0.05 TT ime ime(s) (s) 0.06 0.06 0.07 0.07 0.08 0.08 0.09 0.09

-60 -60 00

1000 1000

2000 2000

3000 3000

4000 4000 5000 5000 6000 6000 Frequency Frequency(Hz) (Hz)

7000 7000

8000 8000

9000 9000

10000 10000

0.06 0.06

**44full fullrotations rotations

**Sampling Samplingrate: rate:20000 20000Hz Hz

20 20

10 10
0.04 0.04

<I3850610>

0.02 0.02

00

-0.02 -0.02

-0.04 -0.04

00

0.01 0.01

0.02 0.02

0.03 0.03

0.04 0.05 0.04 0.05 TT ime ime(s) (s)

0.06 0.06

0.07 0.07

0.08 0.08

0.09 0.09

Spectralpower power(dB) (dB) Spectral

00

2 2 ) Magnitude(cm/s (cm/s Magnitude )

-10 -10

-20 -20

-30 -30

-40 -40

-50 -50 00

1000 1000

2000 2000

3000 3000

4000 4000 5000 5000 6000 6000 Frequency Frequency(Hz) (Hz)

7000 7000

8000 8000

9000 9000

10000 10000

0.05 0.05 0.04 0.04

**44full fullrotations rotations

**Sampling Samplingrate: rate:20000 20000Hz Hz

20 20 10 10

<E3850610>

0.03 0.03

00 Spectralpower power(dB) (dB) Spectral


0.01 0.01 0.02 0.02 0.03 0.03 0.04 0.05 0.04 0.05 TT ime ime(s) (s) 0.06 0.06 0.07 0.07 0.08 0.08 0.09 0.09
2 2 ) Magnitude(cm/s (cm/s Magnitude )

0.02 0.02 0.01 0.01 00

-10 -10 -20 -20 -30 -30 -40 -40 -50 -50 -60 -60 -70 -70 00 20 20

-0.01 -0.01 -0.02 -0.02 -0.03 -0.03 -0.04 -0.04 00

1000 1000

2000 2000

3000 3000

4000 4000 5000 5000 6000 6000 Frequency Frequency(Hz) (Hz)

7000 7000

8000 8000

9000 9000

10000 10000

0.04 0.04 0.03 0.03 0.02 0.02 0.01 0.01 00

**44full fullrotations rotations

**Sampling Samplingrate: rate:20000 20000Hz Hz

10 10 00 Spectralpower power(dB) (dB) Spectral -10 -10 -20 -20 -30 -30 -40 -40 -50 -50
-0.04 -0.04 00 0.01 0.01 0.02 0.02 0.03 0.03 0.04 0.05 0.04 0.05 TT ime ime(s) (s) 0.06 0.06 0.07 0.07 0.08 0.08 0.09 0.09

<M3850610>

2 2 ) Magnitude(cm/s (cm/s Magnitude )

-0.01 -0.01 -0.02 -0.02 -0.03 -0.03

00

1000 1000

2000 2000

3000 3000

4000 4000 5000 5000 6000 6000 Frequency Frequency(Hz) (Hz)

7000 7000

8000 8000

9000 9000

10000 10000

Figura 5.28. Segmente de vibraie prelucrate primar, provenite de la 4 rulmeni cu bile.


114

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

Semnalele pregtite pentru Algoritmul GAMP sunt ilustrate n Figura 5.28. Netezirea se poate observa la nivelul spectrelor, prin reducerea densitii oscilaiilor. Aceasta va conduce la reprezentri timp-frecven-scal de asemenea netezite, mai uor de vizualizat. Dicionarul de forme de und rezultat (generat cu ajutorul ferestrei Gaussiene (4.10)) conine peste 4.2 milioane de atomi. ntregul algoritm a fost implementat cu ajutorul mediului de programare MATLAB, n manier secvenal (dei mult mai adecvat ar fi fost implementarea sa pe o main paralel de calcul). Din acest motiv, timpul de rulare pentru un segment de vibraie de 90 ms variaz ntre 1 i 3 ore la nivelul calculatorului portabil. Pentru a putea iniia algoritmul, este necesar precizarea unui ntreg set de parametri, dup cum urmeaz (conform Tabelului 4.2): mrimea populaiei de cromozomi: P = 100 ; probabilitatea de ncruciare: Pcro = 0.85 ; probabilitatea de mutaie: Pmut = 0.08 sau Pmut = Pcro = 0.85 (dac ncruciarea nu s-a produs); probabilitatea de inversiune: Pinv = 0.02 sau Pinv = Pcro = 0.85 ; (dac nici ncruciarea, nici mutaia nu s-au produs); proporia de selecie elitist: pe = 0.1 ;

numrul maxim de generaii ale evoluiei populaiei: T = 100 ; numrul maxim de operaii genetice necesare pentru completarea generaiei urmtoare: M go = 450 ; factorul de supravieuire pentru populaiile iniiale: S0 = 5 ; factorul de supravieuire pentru celelalte populaii: S0 = 3 . 5.3.3. Rezultatele programului de diagnoz GAMP Simulrile efectuate pentru fiecare rulment au condus la semnalele din Figura 5.29. Pe primele linii sunt trasate graficele semnalelor originale (aceleai ca n Figura 5.28). Urmeaz semnalele utile, obinute cu ajutorul celor mai potrivii atomi din dicionar. Pe ultimele linii este figurat zgomotul rezidual, rmas dup scderea semnalelor utile din semnalele originale aferente. Procedeul de deparazitare a fost oprit atunci cnd energia semnalelor reziduale a sczut la mai puin de 30% din energia semnalelor originale aferente (adic pentru o valoare de aproximativ 6 dB a SNR). n acest fel, zgomotul care codific informaia despre defecte este incus n mare parte n componenta util. Zgomotul rezidual se datoreaz de regul interferenelor, perturbaiilor ambientale, distorsiunilor introduse de cuantificarea pe un numr finit de bii, etc. Se observ c prezena defectelor este semnalat de numrul de atomi necesari pentru a reprezenta semnalul util n condiiile unui acelai SNR: numai 252 atomi pentru rulmentul standard, i 494, 414, respectiv 452, pentru ceilali 3 rulmeni n ordinea {I,O,M}. Analiza nu se oprete aici, deoarece defectele nu pot fi nc identificate doar din inspectarea semnalelor menionate. Pentru aceasta, este necesar reprezentarea timpfrecven-scal a vibraiilor, cu ajutorul coeficienilor de proiecie peste atomii cei mai potrivii sau, mai precis, cu ajutorul funciei de potrivire. Cele 4 reprezentri sunt ilustrate n Figurile 5.30-5.33. Acestea se bazeaz pe maniera n care a fost organizat dicionarul de forme de und. Atomii sunt grupai pe 9 scale, indexate de la 0 la 8, n ordinea de cretere a factorului de contracie. n consecin, rezoluia n frecven (numrul de sub-benzi) i numrul de atomi alocai fiecrei scale descresc odat cu creterea indicelui de scal. Pe scala #8 se gsesc numai 6165 atomi cei mai contractai ai dicionarului. Aceasta permite o cutare exhaustiv a atomilor celor mai potrivii, fr utilizarea AG. Pentru celelalte scale, cutarea acestor atomi se efectueaz ns cu ajutorul AG, iar optimele sunt determinate dup cel mult 25 de generaii.
115

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare


* at e: * Sampling Sampling r r at e: 22707 22707 Hz Hz

0. 01 0. 01 0 0 0. 01 0. 01
2) A c c e le r a tio n ( c m /s A c c e le r a tio n ( c m /s )

original
20 40 60 80 20 40 60 80 Denois ed gy at io: 0386 .. Denois ed signal. signal. Ener Ener gy r r at io: 70. 70. 0386 % % * oms: * Number Number of of at at oms: 252 252 20 20 0 0

<B3850610>
100 100

0. 01 0. 01 0 0 0. 01 0. 01

util
20 20 0 0 20 40 60 80 20 40 60 80 Residual noise) .. Ener gy at io: 9614 Residual ( ( noise) Ener gy r r at io: 29. 29. 9614 % % 100 100

0. 01 0. 01 0 0 0. 01 0. 01

zgomot
20 20 0 0 20 20 40 40 Time ms) Time ( ( ms) 60 60 80 80 100 100

0. 05 at e: 0. 05 * * Sampling Sampling r r at e: 22707 22707 Hz Hz 0 0

original

<I3850610>
100 100 120 120

2) A c c e le r a tio n ( c m /s A c c e le r a tio n ( c m /s )

0. 05 0. 05 40 40

20 0 20 40 60 80 20 0 20 40 60 80 Denois ed gy at io: 0356 .. Denois ed signal. signal. Ener Ener gy r r at io: 70. 70. 0356 % % 0. 05 * Number of at oms: 494 0. 05 * Number of at oms: 494 0 0

util
20 20 0 20 40 60 80 0 20 40 60 80 Residual noise) .. Ener gy at io: 9644 Residual ( ( noise) Ener gy r r at io: 29. 29. 9644 % % 100 100 120 120

0. 05 0. 05 40 40 0. 05 0. 05 0 0

zgomot
20 20 0 0 20 20 40 40 Time ms) Time ( ( ms) 60 60 80 80 100 100 120 120

0. 05 0. 05 40 40

0.02 0.02 0 0 0 .. 0 2 0 0 2
2) A c c e le r a tio n ( c m /s A c c e le r a tio n ( c m /s )

* amp li n g at e :: 2 27 07 z *S S amp li n gr r at e 2 27 07 H H z

original

<E3850610>

0.02 0.02 0 0 0 .. 0 2 0 0 2

4 0 2 0 0 2 0 40 6 0 8 0 4 0 2 0 0 2 0 40 6 0 8 0 De no is ed gn al .. Ene r gy tio :: 7 0.0 03 9 De no is ed si si gn al Ene r gy ra ra tio 7 0.0 03 9 %. %. * N umb er o f a to ms : 41 4 * N umb er o f a to ms : 41 4

1 00 1 00

12 0 12 0

util
4 0 4 0 2 0 2 0 0 2 0 40 6 0 8 0 0 2 0 40 6 0 8 0 R es ii d ua ll ( no ii s e) .. E ne r gy a ti o :: 2 9. 99 61 R es d ua ( no s e) E ne r gy r r a ti o 2 9. 99 61 % % 1 00 1 00 12 0 12 0

0.02 0.02 0 0 0 .. 0 2 0 0 2

zgomot
4 0 4 0 2 0 2 0 0 0 2 0 2 0 40 40 T me ms ) Tii me ( ( ms ) 6 0 6 0 8 0 8 0 1 00 1 00 12 0 12 0

0 .. 0 2 0 0 2 0 0 0 .. 0 2 0 0 2

* a mp ll ii n g a tt e :: 2 2 7 0 7 z *S S a mp n gr r a e 2 2 7 0 7H H z

original

<M3850610>

2) A c c e le r a tio n ( c m /s A c c e le r a tio n ( c m /s )

0 .. 0 2 0 0 2 0 0 0 .. 0 2 0 0 2

20 4 0 60 80 10 0 20 4 0 60 80 10 0 D e n o ii s e d ii g n a ll .. E n e rg y a tt ii o :: 7 0. 0 1 0 7 .. D e n o s e ds s g n a E n e rg yr r a o 7 0. 0 1 0 7% % * u mb e r ff a tt o ms :: 4 5 2 *N N u mb e ro o a o ms 4 5 2

2 0 2 0

0 0

12 0 12 0

140 140

util

2 0 2 0 0 .. 0 2 0 0 2 0 0 0 .. 0 2 0 0 2 2 0 2 0

0 0

20 4 0 60 80 10 0 20 4 0 60 80 10 0 R e s ii d u a ll ( n o ii s e ) .. E n e r g y a tt ii o :: 2 9 .. 9 8 9 3 R e s d u a ( n o s e ) E n e r g yr r a o 2 9 9 8 9 3% %

12 0 12 0

140 140

zgomot
0 0 20 20 4 0 4 0 60 60 T ms ) Time ime ( ( ms ) 80 80 10 0 10 0 12 0 12 0 140 140

Figura 5.29. Rezultate de deparazitare a vibraiilor cu ajutorul unui dicionar de undine.


116

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

<B3850610> T for Time-frequency-scale ime-frequency-scale distribution distribution for signal signal <B3850609> <B3850609>
80 80

Fitness Fitness (dB) (dB) -70 -70

60 60

-75 -75

40 40 Time (ms) (ms) Time

-80 -80

20 20 -85 -85 0 0

# of of sub-bands sub-bands #

-90 -90 -20 -20 Frequency Frequency band/scale: band/scale: [0.5 [0.5 ... ... 11.3533] 11.3533] kHz kHz 77 77 39 39 20 20 6 6 10 10 7 7 5 5 3 3 -95 -95 4 5 4 5 Scale Scale order order 8 8 Removed Removed noise: noise: 14.50% 14.50%

-40 308 154 616 308 154 ||-40 --------- 616 0 1 2 3 0 1 2 3

Figura 5.30. Reprezentarea timp-scal-frecven a vibraiei <B3850610>.


T for Time-frequency-scale ime-frequency-scale distribution distribution for signal signal <I3850609> <I3850609> <I3850610 80 80 Fitness Fitness (dB) (dB)

-60 -60

60 60 -65 -65 40 40 Time (ms) (ms) Time

20 20

-70 -70

0 0 # of of sub-bands sub-bands #

-75 -75

-20 -20

Concentrri anormale
Frequency Frequency band/scale: band/scale: [0.5 [0.5 ... ... 11.3533] 11.3533] kHz kHz 77 77 39 39 20 20 6 6 10 10 7 7 5 5 3 3 8 8 Removed Removed noise: noise: 15.26% 15.26% 4 5 4 5 Scale Scale order order -80 -80

-40 -40

308 154 616 308 154 ||--------- 616 0 1 2 3 0 1 2 3

Figura 5.31. Reprezentarea timp-scal-frecven a vibraiei <I3850610>.


117

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare


T for <E3850610> Time-frequency-scale ime-frequency-scale distribution distribution for signal signal <O3850609> <O3850609> 100 100 Fitness Fitness (dB) (dB) -60 -60

Concentrri anormale

-65 -65 50 50 -70 -70 Time (ms) (ms) Time

-75 -75 0 0 -80 -80

# of of sub-bands sub-bands #

Frequency Frequency band/scale: band/scale: [0.5 [0.5 ... ... 11.3533] 11.3533] kHz kHz 77 77 39 39 4 5 4 5 Scale order Scale order 20 20 6 6 10 10 7 7 5 5

-85 -85

-50 -50 308 154 616 308 154 ||--------- 616 0 1 2 3 0 1 2 3

3 3 8 8 Removed Removed noise: noise: 7.90% 7.90%

Figura 5.32. Reprezentarea timp-scal-frecven a vibraiei <E3850610>. <M3850610> T for Time-frequency-scale ime-frequency-scale distribution distribution for signal signal <M3850609> <M3850609>
80 80 Fitness Fitness (dB) (dB)

Concentrri anormale
-65 -65

60 60 -70 -70

40 40 Time (ms) (ms) Time

20 20

-75 -75

0 0 # of of sub-bands sub-bands # -80 -80 -20 -20

Frequency Frequency band/scale: band/scale: [0.5 [0.5 ... ... 11.3533] 11.3533] kHz kHz 77 77 39 39 20 20 6 6 10 10 7 7 5 5 3 3 4 5 4 5 Scale Scale order order

-85 -85

308 154 616 308 154 -40 ||-40 --------- 616 0 1 2 3 0 1 2 3

8 8 Removed Removed noise: noise: 13.89% 13.89%

Figura 5.33. Reprezentarea timp-scal-frecven a vibraiei <M3850610>.


118

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

n Figurile 5.30-2.33, planul timp-frecven a fost replicat pentru fiecare scal de reprezentare, fiind indicat totodat numrul de sub-benzi aferent. Din acest motiv, suprafaa alocat reprezentrii valorilor n dB ale funciei de potrivire variaz de la o scal la alta (crete odat cu indicele de scal), ilustrnd rezoluia variabil de reprezentare. Culorile asociate valorilor funciei de potrivire sunt ilustrate n dreapta planului timpfrecven-scal, pentru a putea identifica mai uor zonele unde acestea prezint valori importante. Cele 4 figuri ilustreaz maniera n care energia vibraiei este disipat peste planul timp-frecven-scal. Studiind cu atenie aceast distribuie, aparent, scalele de indice sczut (n care acioneaz atomi dilatai, dar cu spectru contractat) par a include informaia referitoare la zgomotele structurale interne ale sistemului mecanic, din componena semnalului util, n timp ce n zona scalelor de indice mare reflect mai mult comportamentul mediat al acestuia. Cu toate acestea, zgomotul de defect se poate manifesta la orice scal, n funcie de natura i intensitatea sa. n absena defectelor (Figura 5.30), funcia de potrivire relev o distribuie cvasiuniform peste planul timp-frecven-scal, cu valori aproximativ constante, aa cum era de ateptat. n prezena defectelor, ns, distribuia se schimb, punnd n eviden concentrri anormale de valori ale funciei de potrivire, n general mari, n anumite zone ale planului timp-frecven-scal. n cazul rulmentului <I3850610> (afectat de o crptur pe cmaa interioar), distribuia din Figura 5.31 ilustreaz o concentraie anormal de energie (peste 12% din energia semnalului original), ntr-un numr relativ redus de valori mari de potrivire, la scala de indice nul. Cele dou grupuri de concentrare sunt localizate n sub-banda #571, care, la scala #0, corespunde frecvenei centrale de 10.569 kHz. Ori, aceasta este practic un multiplu ntreg al FTCI (mai precis, este egal aproximativ cu 47FTCI), ceea ce conduce la localizarea defectului cu uurin. Mai mult, efectund o mediere a valorilor de potrivire din aceste grupuri, se poate estima gradul de severitate al defectului. n acest caz, defectul se situeaz aproximativ la nivelul 3.8 (din cele 10 nivele posibile), atingnd maturitatea. Pentru rumentul <E3850610> (care prezint o uzur neuniform a cmii exterioare), concentrri anormale de energie sunt semnalate la dou scale succesive n Figura 5.32: #0 i #1. Sub-benzile de frecven corespunztoare acestora sunt: #512 (la scala #0) i #256 (la scala #1). Frecvenele centrale ale acestor sub-benzi au aceeai valoare, 9.56 kHz, ceea ce reprezint aproximativ 55FTCO (multiplu ntreg). De notat c frecvena central a sub-benzii #571 de pe scala #0, de la rulmentul precedent, este egal cu aproximativ 60.78FTCO, n timp ce frecvena central din cazul acestui rulment este egal cu 42.55FTCI. Localizarea defectului este astfel neambigu i simplu de efectuat, chiar dac FTCI i FTCO au valori relativ apropiate. n ceea ce privete gradul de severitate, n cazul uzurii, n general, el nu poate fi determinat cu precizie prea mare, fiind estimat aici la nivelul 3 (matur, de asemenea). n fine situaia cea mai interesant este reprezentat n Figura 5.33, pentru rulmentul <M3850610> (cu ciobituri repartizate neuniform pe ambele cmi). n acest caz, pot fi puse n eviden 5 concentrri anormale de energie, n sub-benzile: #571 (la scala #0), #256 (la scala #1), #129 (la scala #2) i #64 (la scala #3). Avnd n vedere frecvenele centrale ale acestor sub-benzi (10.569 kHz la scala #0 i 9.56 kHz la celelalte scale), este evident c sunt puse n eviden defectele de pe ambele cmi ale rulmentului, dei informaia relativ la acestea a fost combinat n zgomotul de defect ntr-o manier necunoscut. Mai mult, analiznd valorile medii ale acestor concentrri, se constat c defectele de pe cmaa interioar au un grad de severitate estimat la 2.7 (incipiente spre mature), n timp ce defectele de pe cmaa exterioar la 1.9 (incipiente, dar cu tendin de maturizare). Dup demontarea rulmenilor defeci, rezultatele de diagnoz au fost confirmate att n ceea ce privete localizarea defectelor, ct i n ceea ce privete gradul relativ de
119

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

severitate (crptura de pe cmaa interioar a rulmentului <I3850610> era mai sever dect uzura rulmentului <E3850610>, iar ciobiturile de pe cmaa interioar a rulmentului <M3850610> erau mai multe dect cele de pe cmaa exterioar, unele dintre ele ocupnd caviti mai mari). Aceast aplicaie evideniaz capacitatea undinelor de a decodifica informaii mai puin clare, relativ la comportamentul (anormal) unor sisteme. Extragerea acestor informaii se bazeaz pe focalizarea n frecven a semnalelor. Calculatorul portabil al sistemului UMAPID posed dou procesoare n paralel, fapt care a condus la o uoar scdere a duratei de rulare, fa de un calculator de birou cu un singur procesor i aproximativ aceeai frecven de funcionare. Aceasta sugereaz c Algoritmul GAMP poate fi implementat mai eficient n manier paralel, pentru a reduce semnificativ durata de diagnosticare.

6. Concluzii finale i perspective


La captul celor doi ani alocai acestui proiect, se poate afirma c bilanul general echipei de cercetare este unul pozitiv. Fa de planul de realizare iniial, nu au fost modificri de substan, din punctul de vedere al abordrii tiinifice i inovative, n pofida reducerii drastice treptate a resurselor financiare preconizate (ajungnd n final la numai 51% din valoarea stipulat n contract). Exist totui nerealizri, n special legate de achiziia de senzori activitatea cea mai afectat de aceast reducere. Trusele de senzori sunt mai slab reprezentate dect s-a estimat la nceputul proiectului. Aceasta s-a datorat nu doar diminurii finanrii, ci i faptului c exist extrem de puini productori de senzori cu transmisie radio n alte domenii dect cel meteorologic-ecologic, care, n plus, s ofere preuri corecte. Adaptarea senzorilor cu transmisie prin fir la transmisia radio este o activitate anvizajat de noi pentru viitor, avnd n vedere versatilitatea interfaei VISA. (Aceast activitate nu a fost prevzut explicit n planul de realizare iniial.) Pe parcursul celor 2 ani, echipa de cercetare-inovare s-a ghidat dup cuvintele cheie din titlul proiectului, pentru a realiza sistemul UMAPID: mobilitate, achiziie de date (eventual, transmise pe calea undelor radio), prelucrare a datelor, identificarea sursei care a generat datele, diagnosticarea acestei surse. Mobilitatea este asigurat prin faptul c sistemul poate fi transportat cu uurin de ctre o singur persoan, n vecintatea sau n mijlocul sursei generatoare de date. Achiziia de date este realizat att prin intermediul internetului, ct i direct, pe calea undelor radio, cu ajutorul interfeei VISA (n curs de omologare la OSIM). Prelucrarea datelor se realizeaz pe dou nivele: inferior, n zona senzorilor i a plcii de achiziie; superior, n zona calculatorului mobil. Identificarea i diagnosticarea sunt operaii complexe efectuate cu ajutorul unor programe special concepute i implementate n acest scop, la nivelul calculatorului mobil. Perspectivele tehnice ale acestui produs constau n extinderea truselor de senzori i a capabilitilor lui de diagnoz, ctre alte domenii (n special n medicin). n ceea ce privete valorificarea sistemului UMAPID, se sper ca, dup depirea perioadei actuale de criz economic traversat de majoritatea rilor, acesta s aib un impact mai mare pe pia.

120

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

Anexa A. Redefiniri ale criteriului calitii prediciei (PQ)


Fiecare dintre modelele de identificare utilizate ca predictori poate fi optimizat cu ajutorul unui criteriu numit calitatea prediciei (PQ Prediction Quality), definit n [SPD08]. Justificarea acestor definiii a fost precizat tot n [SPD08]. Simulrile ulterioare cu ajutorul algoritmilor de predicie implementai au relevat ns posibilitatea de a redefini acest criteriu, astfel nct precizia de predicie s creasc. Deficiena major a definiiilor amintite o constituie faptul c normalizarea sumei de la numitor se efectueaz cu factori care anihileaza n mare parte caracteristicile predictorului (sau extrapolatorului). De exemplu, dac tubul de ncredere este foarte larg, criteriul PQ continu s fie mare, deoarece valorile mari ale dispersiei erorii de predicie la fiecare pas sunt anihilate de valoarea mare a mediei lor. n cazul extrapolrii, dispersia semnalului fiind adesea mult mai mare dect suma pe care o pondereaz, diferenele dintre doi extrapolatori diferii sunt adesea insesizabile n valorile lui EQ (Extrapolation Quality definit tot n [SPD08]). Definiiile alternative care urmeaz ncearc s atenueze aceste deficiene. Ele se bazeaz pe urmtoarele variabile (cu notaiile din [SPD08], pe care nu le mai relum): raportul semnal-zgomot: def 2 2 y y SNR = 2 ; (A.1) = 2 1 e variana semnalului predictat/extrapolat pe orizontul de predicie:
def

K = y

1 K

(
K k =1

y N y + k y

) )

, cu y

def K

1 K N y + k y ; K k =1 1 K y N y + k . K k =1

(A.2)

variana semnalului msurat pe orizontul de predicie:

K y =

def

1 K

(
K k =1

y N y + k y

, cu y

def K

(A.3)

Astfel, definiiile lui PQ i EQ din [SPD08] pot fi nlocuite cu definiiile de mai jos, respectiv: def 100 PQ = [%] ; (A.4) K k y N y + k y N y + k 1+ k =1 K SNR K y y

EQ =

def

100

y N
1+
k =1

[%] .

(A.5)

+ k y N y + k

K SNR K y y

Aceste definiii prezint de asemenea un inconvenient. Este normal ca funciile PQ i EQ s creasc odat cu SNR. Este ns anormal ca ele s scad odat ce valorile msurate devin mai plate pe orizontul de predicie (adic odat ce K y nregistreaz o cretere). Normal ar fi ca ele s creasc odat cu creterea SNR pe orizontul de predicie. Acesta se definete astfel:

SNR

def

( ) = ( )
K y

2 K y y

(3.6)

121

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

unde:

K = y y

def

1 K

( y N
K k =1

+ k y N y + k

(A.7)

n aceste condiii, calitatea prediciei se poate redefini ca mai jos:

PQ =

def

100 1+
k =1 K 2 k

[%] .

(A.8)

SNR SNR K e

Analog, calitatea extrapolrii devine:

EQ =

def

1+

100 1 SNR SNR K

[%] .

(A.9)

Definiiile (A.8) i (A.9) au condus la cele mai bune rezultate de predicie n numeroasele experimente de simulare desfurate. Din acest motiv, n acest raport de cercetare, ele vor nlocui vechile definiii din raportul tehnic [SPD08].

122

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

Anexa B. Algoritmi de eantionare stocastic universal


B.1. Algoritmul original al lui Baker Tehnica SUS (Stochastic Universal Sampling) este utilizat n mod tradiional utilizat pentru generarea de secvene pseudo-aleatoare cu distribuie de probabilitate dat n cadrul AG [MiM95] i va fi descris n continuare, n versiunea ei original publicat n [BaJE85] i [BaJE87]. Procedura bazat pe aceast tehnic se numete Algoritmul lui Baker. Acest algoritm rezolv de fapt problema generrii unei valori numerice cu o probabilitate dat. Pentru a formula mai precis aceast problem, se pleac de la o mulime finit de valori numerice

A N = {an }n1,N , pentru care este atribuit urmtoarea densitate de


p : A N [0,1] def ( ) p a a n n = pn .

def

probabilitate (de tip frecven de apariie): (B.1)

Evident, mulimea valorilor frecvenei de apariie, proprietate:

PN = { pn }n1, N , are urmtoarea


(B.2)

def

n =1

pn = 1

Np
n =1

=N.

Egalitatea (B.2) poate fi generalizat prin:

p
n =1

=M,

(B.3)

unde M N Egalitatea adic pot s imediat, prin

este un numr arbitrar fixat. (B.3) arat c numerele mulimii PN pot s nu verifice proprietatea (B.2), nu constituie valorile unei densiti de probabilitate. Aceasta se regsete normalizarea fiecruia dintre numerele mulimii PN cu suma valorilor lor.

Dup normalizare, fiecare valoare pn se nmulete cu ntregul M N i se renoteaz prin pn . Astfel, rezult egalitatea (B.3). n acest context, problema este de a implementa mecanismul SUS, care const n generarea de numere din mulimea A N cu frecvenele de apariie corespunztoare valorilor din PN (fie c aceste valori sunt sau nu returnate de o densitate de probabilitate). Acest mecanism este simulat cu ajutorul unei rulete virtuale, ca n Figura B.1.

pN

p1 p2
Selector

pn
Figura B.1. Mecanismul SUS simulat cu ajutorul unei rulete virtuale ideale. Discul ruletei este segmentat n N sectoare avnd suprafee proporionale cu valorile frecvenelor de apariie din mulimea PN . Astfel, suprafaa total a discului este fie 1, fie,
123

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

mai general, M (n funcie de maniera n care mulimea PN verific egalitile (B.2) sau (B.3)). Fiecare sector corespunde unui numr din mulimea de selecie A N . Un selector (bila ruletei) se mic liber, dar amortizat, n jurul discului. n momentul cnd selectorul s-a oprit, este ales un anumit sector de disc, care indic numrul ce trebuie extras din A N . Astfel, fiecare dintre numerele mulimii A N are ansa de a fi selectat (chiar dac frecvena sa de apariie este mic), numai c aceast ans este proporional cu aria sectorului care l reprezint. Pe termen lung, dac se efectueaz suficient de multe extrageri de numere din A N folosind ruleta, histograma numerelor selecionate se apropie de graficul densitii de probabilitate p . Pentru implementarea mecanismului ruletei virtuale (de fapt a mecanismului SUS) nu se poate opera cu valori fracionare ale ariilor sectoarelor de disc. De aceea, mecanismul anterior este reconsiderat astfel: discul ruletei va trebui s conin un numr de sectoare echivalente (adic de arii identice) egal cu N (n cazul egalitii (B.2)) sau M (n cazul egalitii (B.3)); aria unui sector nu mai are importan, deoarece fiecare sector este ocupat de cte un numr din mulimea A N ;

numrul de sectoare pe care le poate ocupa o aceeai valoare an din mulimea A N , numr notat cu sn N , este determinat de valoarea pn corespunztoare; practic,
mulimea S N = { sn }n1, N constituie histograma dorit a valorilor din A N . Valorile histogramei verific astfel una dintre egalitile urmtoare, n funcie de proprietatea (B.2), respectiv (B.3), a mulimii PN :
def

n =1

sn = N , respectiv

s
n =1

=M.

(B.4)

De notat c unii dintre ntregii sn care particip la sumele din (B.4) pot fi nuli, dac valorile pn corespunztoare sunt prea mici n raport cu valorile mari ale mulimii PN . n noua formulare, mecanismul ruletei este sugerat de Figura B.2.

aN aN an

a1

a2
Selector

an

Figura B.2. Mecanismul SUS implementat cu ajutorul unei rulete virtuale. Astfel, de exemplu, numerele a1 i a2 ocup cte un sector de disc, n timp ce numerele an i a N ocup cel puin dou sectoare de disc, conform distribuiei de probabilitate sugerate de Figura B.1. Noul mecanism funcioneaz acum similar celui anterior, numai c selectorul alege unul dintre sectoarele echivalente care indic n mod direct o anumit valoare din A N . De notat c nu este necesar ca sectoarele ocupate de o anumit valoare s fie adiacente sau grupate n aceeai zon a discului. Ele pot fi repartizate arbitrar pe suprafaa discului, cu condiia s se respecte numrul lor. Acest mecanism poate fi folosit i la generarea unei secvene pseudo-aleatoare cu distribuie uniform (dac fiecare sector este ocupat de o alt valoare dect celelalte).
124

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

Practic, mecanismul generrii de secvene pseudo-aleatoare cu distribuie de probabilitate dat se poate implementa cu ajutorul unui algoritm care genereaz o secven pseudo-aleatoare de numere uniform distribuite [SCS05]. (n mediul de simulare MATLAB, rutina de generare a secvenelor de numere cu distribuie uniform este r ra an nd d.) n general, mulimea de valori ale secvenei este notat prin U N . n mod convenional, aceast mulime poate conine elemente care se repet de un anumit numr de ori. Evident, A N U N (deoarece unele valori din A N pot lipsi n U N ). Dac cel puin una dintre valorile lui A N se repet n U N de un numr de ori diferit de ale celorlalte valori, distribuia de probabilitate este neuniform, altfel ea este uniform. Revenind la implementarea efectiv a mecanismului SUS, practic, algoritmul aferent va returna mulimea U N i numerele S N , plecnd de la mulimile A N i PN . Odat mulimea U N construit, alegerea unei valori din cadrul acesteia se poate efectua folosind orice algoritm de generare a unei secvene uniform distribuite. Procedura original al lui Baker (corespunztoare proprietii (B.2)) este descris de Algoritmul B.1. Algoritmul B.1. Algoritmul (clasic al) lui Baker. Date de intrare: Mulimile A N = {an }n1, N (valorile secvenei pseudo-aleatoare) i

PN = { pn }n1, N (frecvenele de apariie, cu

p
n =1

= 1 ).

1. Iniializare. Se alege arbitrar un numr [0,1) (eventual, generat folosind o distribuie uniform) care va juca rol de indicator de altitudine. Se iniializeaz: tacheta = 0 , mulimea valorilor efective (finale) ale semnalului U N = i mulimea numerelor de sectoare de disc ocupate de valorile din A N , adic S N = {sn = 0}n1, N . 2. Pentru n 1, N , se efectueaz urmtoarele operaii: 2.1. Ridicarea tachetei: + Npn . 2.2. Ct timp indicatorul de altitudine este sub tachet, adic < , reactualizeaz celelalte variabile: a. Adaug valoarea curent la mulimea final U N U N {an } . b. Incrementeaz numrul corespunztor de sectoare: sn sn + 1 . c. Ridic altitudinea cu pai unitari: + 1 . Date de ieire: Mulimea U N a valorilor efective ale semnalului i mulimea

S N = {sn }n1, N a numerelor de sectoare de disc ocupate de valorile din A N .


Au fost utilizate denumiri sugestive ale variabilelor pentru a uura nelegerea logicii sale. Indicatorul de altitudine pleac iniial de la o valoare mic, situat ntre 0 i 1 (dar nu unitar). Dac valoarea este nenul i p1 N < 1 , este posibil ca numrul a1 s nu fie selecionat n mulimea final U N , dei poate c el ar fi fost selecionat n cazul n care ar fi ocupat o alt poziie n mulimea A N . Acesta nu este ns un dezavantaj major (oricum se poate iniializa indicatorul de altitudine cu valoarea nul), mai ales c i situate n alte poziii, numerele cu frecvene extrem de mici de apariie (mai mici dect 1/ N ) pot s nu fie selecionate.
125

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

tacheta este ridicat cu incremente definite de produsele { pn N }n1, N . Pn cnd ea nu este depit de indicatorul de altitudine (care este incrementat cu valori unitare), numrul de sectoare ocupate pe disc de valoarea curent an crete (cu un increment unitar de asemenea). Se poate arta c:
pn N sn pn N , n 1, N i

s
n =1

=N.

(B.5)

Din aceast proprietate rezult c ntregii sn sunt aproape proporionali cu frecvenele de apariie pn . Desigur, unii dintre ntregii sn pot mri, alii pot micora ansele numerelor pe care le reprezint, n raport cu frecvenele de apariie. Dar eroarea este de cel mult un sector n plus, respectiv n minus. Dac numrul total de sectoare este suficient de mare, atunci eroarea de frecven de apariie poate fi neglijat. De notat c numrul total de sectoare este chiar N , acesta fiind i cardinalul mulimii U N . B.2. Algoritmul generalizat al lui Baker O variant generalizat a Algoritmului B.1 este prezentat n Algoritmul B.2, pentru cazul n care proprietatea (B.2) nu se verific, dar se poate fora verificarea proprietii (B.3). Algoritmul B.2. Algoritmul generalizat al lui Baker. Date de intrare: Mulimile A N = {an }n1, N (valorile secvenei pseudo-aleatoare),
PN = { pn }n1, N (valori proporionale cu frecvenele de apariie ale secvenei) i
M N (numrul de sectoare echivalente ale ruletei virtuale).

1. Normalizarea mulimii PN prin: pn M

pn

p
i =1

, n 1, N .

(Noua mulime PN verific acum proprietatea (B.3).) 2. Iniializare. Se alege arbitrar un numr [0,1) (eventual, generat folosind o distribuie uniform) care va juca rol de indicator de altitudine. Se iniializeaz: tacheta = 0 , mulimea valorilor efective (finale) ale semnalului U N = i mulimea numerelor de sectoare de disc ocupate de valorile din A N , adic S N = {sn = 0}n1, N . 3. Pentru n 1, N , se efectueaz urmtoarele operaii: 3.1. Ridicarea tachetei: + pn . 3.2. Ct timp indicatorul de altitudine este sub tachet, adic < , se reactualizeaz celelalte variabile: a. Adaug valoarea curent la mulimea final U N U N {an } . b. Incrementeaz numrul corespunztor de sectoare: sn sn + 1 . c. Ridic altitudinea cu incremente unitare: + 1 . Date de ieire: Mulimea U N a valorilor efective ale semnalului i mulimea

S N = {sn }n1, N a numerelor de sectoare de disc ocupate de valorile din A N .


126

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

n acest caz, se poate arta c:


pn sn pn , n 1, N

s
n =1

=M.

(B.6)

Generalizarea permite operarea cu un numr de sectoare de disc diferit de numrul maximal al valorilor secvenei pseudo-aleatoare. Unul dintre motivele pentru care este necesar aceast generalizare este legat de creterea variabilitii semnalului pseudoaleator rezultat (sau a lrgimii sale de band), n special cnd numrul posibil de valori ale acestuia, N , nu este suficient de mare. Conform algoritmului clasic (Algoritmul B.1), este posibil ca unele dintre numerele din S N s fie nule, datorit valorilor prea mici ale frecvenelor de apariie corespunztoare. Aceasta nseamn c secvena pseudoaleatoare rezultat conine doar o parte din elementele mulimii A N , variabilitatea ei fiind astfel diminuat. Prin amplificarea frecvenei de apariie cu un numr suficient de mare ( M ), care conduce totodat i la creterea numrului de sectoare echivalente ale ruletei virtuale, este posibil ca toate elementele mulimii A N s se regseasc n mulimea U N , cele care anterior fuseser eliminate ocupnd acum cel puin un sector de disc. De notat c algoritmul poate s nu funcioneze foarte corect pentru distribuia de probabilitate uniform n cazul n care M < N .

127

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

128

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

Anexa C. Publicaii selectate

[SCI08]

tefnoiu D., Culi J., Ionescu F. FORWAVER A Wavelet-Based Predictor for Non Stationary Signals, Industrial Simulation Conference ISC-2008, Lyon, France, A publication of EUROSIS-ETI, pp. 377-381, June 911, 2008 (ISIThomson and INSPEC referenced). tefnoiu D., Culi J. PARMAX A Predictor for Distributed Time Series, Industrial Simulation Conference ISC-2009, Loughborough, U.K., A publication of EUROSIS-ETI (ISBN 978-90-77381-4-89), pp. 5-12, June 13, 2009 (ISIThomson and INSPEC referenced).

[StCu09]

[SSCM09] tefnoiu D., Seraficeanu C., Culi J., Musc Gh. Identification of MIMOARMAX Models for Glycemia and Sodium Ions Tests, through Particle Swarm Optimization, accepted at the 7-th International IEEE Conference on Control and Automation, IEEE-ICCA'09, Christchurch, New Zealand, December 9-11, 2009 (ISI-Thomson referenced).

129

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

130

Industrial Simulation Conference ISC-2008, Lyon, France, June 911, 2008

FORWAVER A WAVELET-BASED PREDICTOR FOR NON STATIONARY SIGNALS


Dan Stefanoiu 1, Janetta Culita 1, Florin Ionescu 2
Politehnica University of Bucharest, ROMANIA Dept. of Automatic Control and Computer Science (www.acs.pub.ro) 2 University of Applied Sciences in Konstanz, GERMANY Dept. of Mechatronics (www.htwg-konstanz.de) E-mails: danny@indinf.pub.ro, jculita@yahoo.com, ionescu@htwg-konstanz.de
1

KEYWORDS Prediction, orthogonal wavelet packets, prediction quality. ABSTRACT FORWAVER is a simulator that provides high accuracy time series forecasting with the help of wavelet-based models. Within this paper, the models rely on signal bases consisting of Daubechies orthogonal wavelet packets and ARMA modeling. Such a basis is adaptively selected, depending on data, while the ARMA model is obtained by maximizing a cost function, namely the prediction quality. Simulation on real time series have proven that, when comparing to the classical time series model (built by adding the deterministic trend, the seasonal component and the stochastic autoregressive component) the wavelet-based model is more accurate and less subjective. 1. INTRODUCTION Prediction of natural phenomena (seismic, climatic, celestial, etc.) is nowadays of great importance, because of unexpected and rapid changes they might exhibit. Many engineering processes also require quality forecasting in order to be modeled, simulated, automatically controlled, etc. Some of such phenomena or processes reveal their behavior through finite length data strings { y[ n]}n1, N referred to as time series (ts). Although the governing dynamics of such a ts is unknown, the entity providing the data can be associated to a non stationary model (i.e. with variable frequency contents). Any ts is subsuming two types of behaviors: deterministic and stochastic. Classically, the deterministic component consists of a trend yT and a seasonal (periodic) signal yS , whereas the stochastic component is an auto-regressive (AR) process y AR [Sderstrm, 1989], [Stefanoiu, 2005]. The classical model is then: yT + yS + y AR . y (1) The trend is a low degree polynomial, estimated by using the Least Squares Method (LSM). The periodic behavior is perhaps the most difficult to decode, although the LSM can be employed as well. Finally, a Levinson-Durbin Algorithm (LDA) returns the stochastic component. The accuracy of ts prediction is sensitive to the accuracy of deterministic component. Expressing the deterministic behavior like in (1), inhibits the modeling of non stationary behavior. Thus, the classical model is quite accurate only in case of quasi-

stationary ts. Moreover, the user has to select the optimal period (if any) by considering three sources: the closest average periodic waveform to the ts (in the least squares sense), the maximum point of spectral representation (periodogram) and the preliminary information about the process that generated the data. Therefore, when detecting and selecting the seasonal component, the users subjectivism is crucial and can sensibly increase the prediction error. The non stationary behavior of a ts is more suitably decoded through a time-frequency-scale analysis [Cohen, 1995]. Wavelets are typical instruments of this analysis in context of multi-resolution theory. This theory has mostly been devised within the works of S. Mallat and I. Daubechies, in the late 80s [Daubechies, 1988], [Mallat, 1989]. (A generalization has been introduced in [Coifman, 1992].) Orthogonal wavelets are employed to build bases within the multi-resolution structure endowing the space of stable, finite energy signals. Such a wavelet basis is uniquely associated to a filter bank that produces a specific sub-band segmentation of ts spectrum. Moreover, the filter bank can be configured according to the energy distribution of ts, both in time and frequency. Two modifications are proposed in this paper: the classical deterministic model of a ts is replaced by a wavelet-based model and the AR modeling is replaced by ARMA modeling (auto-regressive, with moving average). 2. ON THE WAVELET-BASED MODEL The deterministic modeling with wavelets is actually a problem of data denoising. Thus, the original data are projected on a subspace of signal space, U , generated by a finite collection of wavelet packets, like in Figure 1.

ry y

vr y
ry yW
D U[ 0 ] [ g ]

Figure 1: Data Denoising Principle The projection, yW , is associated not only to the deterministic component of ts, but also to its useful

377

Industrial Simulation Conference ISC-2008, Lyon, France, June 911, 2008 (denoised) part. The overall model is then: yW + y ARMA . y
c0,0,n = y , 0,0,n = y[ n] ( k n ) .
k =1 N

(2)

(5)

The colored noise corrupting the data, v y yW , is orthogonal on the wavelet subspace and, thus, on the useful component yW , as illustrated in Figure 1. The problem is to build and use the overall model (2). This goal can be reached after completing the following steps: (a) estimate the useful component yW according to the data y and to a given multi-resolution structure; (b) estimate the ARMA (stochastic) component y ARMA starting from the colored noise v ; (c) predict the ts by means of best predictor. All together constitute the core of FORWAVER simulator. The details of its construction can be found in [Stefanoiu, 2007]. Hereafter, only a short description of the three steps above is provided. The U subspace is generated by using wavelet packets and an entropy based criterion. More specifically, the deterministic (useful) component is:
yW (t ) =
( m , p )M P nN m , p

Interestingly, the filter bank can be employed to compute wavelet values as well, according to the recursive equation below:
m, p ,0 (t ) = 2 n m 1, (2t n ) , t R , p / 2 ,0
nZ

(6)

where h , if p is even, or g , otherwise. The recursive equation (6) starts from the father wavelet 0,0,0 . The other wavelets of packet { m, p ,n } are just
nZ

time-shifted versions of m, p ,0 . The structure of filter bank can adaptively be set, by minimization of wavelet coefficients entropy. By definition, the entropy of a discrete time signal x is:

H ( x ) =

| x[ n] | | x[ n] | , log 2 E x E ( x) ( ) nZ

(7)

cm , p , n m , p , n ( t ) , t R ,

(3)

where E ( x ) = nZ | x[ n] |2 is the signal energy. According to Shannons interpretation (given in 1948, see [Shannon, 1948]), the entropy (7) quantifies the average number of bits that are necessary to encode a signal sample. Also, the entropy expresses both the signal redundancy and its intrinsic order. The smaller the entropy, the less redundant and the more ordered the signal. Small redundancy allows the signal information to be concentrated in a small number of samples, due to their high intrinsic order. Note that the entropy is not an additive measure, i.e. the entropy of a signal built by concatenation of two or more signals is different, in general, from the sum of each concatenating signal entropy. Finding the tree leaves that yield minimum entropy is a problem that can be solved by using IDA* from Artificial Intelligence [Russel, 1995]. Hence, the problem of minimum entropy wavelet basis selection is equivalent to searching for the optimum within a tree endowed with costs on the arcs. IDA* strategy relies on a tree pruning mechanism that allows the optimum path to be found very efficiently. In case of QMF banks and the signal entropy, the search of minimum entropy configuration of associated binary tree must be adapted to the context of IDA*. Thus, the search is realized within a meta-tree defined as follows (see Figure 3): (a) meta-nodes are associated to a binary tree shape (or boundary); (b) a meta-node is generated by expanding a binary tree node up to its two children; (c) the meta-node label is the string of indexes associated to binary tree leaves; (d) the cost of a transition from a metanode to one of its children is the entropy of the wavelet coefficients lying on the boundary of the QMF bank associated to the meta-child; (e) the estimated cost is null. The optimal filter bank corresponds to a meta-leaf for which the total entropy on the path from root is minimal. The final version of yW is obtained only after removing the weak wavelet coefficients from representation (3). Thus, for any ( m, p ) M P , all wavelet coefficients whose amplitudes are inferior to E ( cm, p ) (where 0 is the masking threshold) have to be removed (or masked).

where: t is the continuous time,


cm, p ,n = y0 , m, p ,n , ( m, p ) M P , n N m, p

(4)

are wavelet coefficients, m, p ,n is a generic wavelet from the current packet and y0 is the projection of ts y on the subspace U V0 from the multi-resolution structure [Mallat, 1989]. Coefficients are computed by means of the filter bank corresponding to the multi-resolution structure. The finite sets M , P and N m, p determine the structure of such filter bank. Figure 2 displays an example of filter bank (binary tree) together with the frequency segmentation it realizes.
2 6 (2,3) high frequency 12 (3,5) 11 24 (4,9) 23 (4,8) 22 (4,7)

(1,1)

middle frequency

(2,2)

5 (3,4)

Spectrum 15 16 21 22 23 24

0 (0,0)

10 (3,3) 4 (2,1) 21 (3,2) (4,6) 9 (1,0) 8 1 (3,1) 16 (2,0) 3 (4,1) (3,0) 7 15 (4,0) low frequency

12

0 2-4

/4

/2

3/4

Figure 2: A Wavelet Tree and its Frequency Effect In this example, the set of direct product depth-azimuth is: M P = {(2, 3), (3,1), (3, 2), (3,5), (4,0), , (4, 9)} (corresponding to tree leaves), while the time offsets N m, p are determined by accounting the supports of ts and basic couple of father-mother wavelets {, } [Daubechies, 1988]. On the tree branches lie mirrored versions of QMF filters h (lowpass) and g (high-pass), followed by decimators. Wavelet coefficients are provided by the tree leaves, after entering the first projection coefficients (on time-shifted father wavelets):

378

Industrial Simulation Conference ISC-2008, Lyon, France, June 911, 2008


0

then the accuracy of each predicted value is inversely proportional to its variance, defined as below:
2 = 2 2 + 2 + 0 1 k

[1 2]

2 , k 1, K . + k

(11)

By assembling equations (3) and (9), the overall prediction model is then:
[3 4 2] [1 5 6]

[ N + k ] = y

( m , p )M P nN m , p

cm , p , n m , p , n ( N + k ) +

(12)

V [ N + k ], k 1, K . +y
[7 8 4 2] [3 9 10 2] [3 4 5 6] [1 11 12 6] [1 5 13 14]

(The accuracy of predicted values (12) is given by (11).) Usually, the accuracy of predicted values is represented by means of the confidence intervals:
[ N + k ] k , y [ N + k ] + k ] , k 1, K . (13) Ik = [ y

Figure 3: The Meta-Tree of Analysis QMF Banks

And yet, the removed information has not been lost, but just transferred to the colored noise v y yW . This noise is subsequently identified to an ARMA model, by using the Minimum Prediction Error Method [Sderstrm, 1989], [Stefanoiu, 2005]. More specifically, the colored noise is supposed to verify the following differences equation:
v[ k ] + a1v[ k 1] + a2 v[ k 2] + + ana v[ k na ] = + cnc e[ k nc ], = e[ k ] + c1e[ k 1] + c2 e[ k 2] +

In case of normally distributed noises, in definition (13), = 3 and the true value y[ N + k ] belongs to I k with a probability superior to 95%. The larger the confidence interval, the less accurate the prediction. Several predictors are available, by varying the structural indices na and nb . In order to select the best one, the prediction quality criterion has to be employed. This cost function has been introduced in [Stefanoiu, 2007] with the following definition (for a K -length prediction horizon): def 100 PQ[ K ] = [%] , (14) K [N + k] k y [ N + k ] y 1+ k =1 K
y

k N , (8)

where e is a Gaussian white noise with null mean and 2 variance (unknown), while {ai }i1,na and {c j } are model
j1, nc

parameters (unknown, as well as their number). For any couple of structural indices {na , nc} , one can estimate both the parameters from colored noise data and the values of white noise. The ARMA model allows prediction of colored noise, according to the recipe below:
V [ n] = a 1 y V [ n 1] a na y V [ n na ] + y 1e [ n 1] + + c nc e [ n nc ] +c , e 1y n y [ n] = y V [ n] + V [ n 1] + + V [ n n]

k =1

where y is the standard deviation of ts. According to criterion (14), the predictor improves its performance when the confidence tube tightens and/or the predicted values are closer to the true ones. The only problem is to implement definition (14), because the true values are unknown on the prediction horizon. Clearly, the only way is to preserve the last K data of ts, as if they were unknown. The waveletbased and ARMA models are then built by using N K data only. The other K data are used to select the best predictor, by maximizing PQ surface, as function of na and nb .
3. SIMULATION RESULTS AND DISCUSSION

(9)

V y ARMA on the prediction horizon N + 1, N + K where: y


V v , on the measure horizon 1, N . (for K 1 ) and y Notations with a hat mean estimated values. In order to estimate white noise values, a long AR model has been used (with 3( na + nc ) parameters). The model can then be determined by means of LDA.

The white noise corrupting the data constitutes the unpredictable part of ts and is not included into the overall model (2). However, its variance, 2 (that can also be estimated), plays a major role in setting the prediction accuracy. Actually, the accuracy is inversely proportional to 2 and decreases as the prediction instant increases. More are the coefficients of polynomial specifically, if

The FORWAVER simulator has been implemented within MATLAB 7.04 environment. Some parameters have to be set in advance, in order to tune the simulation, such as: the support length of father wavelet, 2 N (which leads to the analysis wavelets {, } , according to Daubechies algorithm [Daubechies, 1988]), the stop test for IDA* procedure ( > 0 ) and the masking threshold for awavelet coefficients ( [0,1) ). Usually, N 2,25 and = 10 7 , whereas the masking threshold can be increased up to 10% . A technical parameter is also employed: the resolution index L N of father wavelet. Thus the projection (5) is computed by using values of wavelet father, which are sampled with period 10 L . Usually, L 0,6 . If L > 0 , the wavelet family of expansion (3) becomes a tight frame of signals space; its

{ }
p

pN

resulted by infinite division:


( z) 1 + c 1 z + C = 1 + a A( z ) 1z + nc z nc +c zp , = p na z na +a pN

(10)

379

Industrial Simulation Conference ISC-2008, Lyon, France, June 911, 2008 constant is determined by means of LSM (see [Stefanoiu, 2007] for details). The predictor has been tested on a collection of 15 ts extracted from various natural phenomena. Note that all the signals are genuine and not artificially generated, as artifacts. The following pictures exhibit the performance of classical and wavelet-based predictors for one of them, representing the evolution of USD-EURO exchange rate, since the formal introduction of European currency. In order to compare the two predictors, the last K = 5 data has completely been removed from the models construction. From the N K remaining data, another K (the most recent ones) have been removed, such that the optimal predictors be found. Thus, the models are actually built by using the oldest N 2 K data. Figure 4 displays the ts variation and the corresponding trend, whereas Figure 5 reveals the performance of classical best predictor. Figure 6 exhibits the performance of wavelet based predictor.

Figure 6: Performance of Wavelet-Based Predictor The improvement is quite obvious, since PQ jumped to 93.86% and the predicted values are close enough to the measured ones, even for far away prediction instants. The father and mother wavelets selected by the simulator after varying N from 2 to 25 are illustrated in Figure 7. Wavelets correspond to the maximum of N in this case (i.e. 25). Also, the resolution index L has been varied in order to reach for the optimal predictor, in PQ sense. One has been found that the optimal value is 6 (which generated a very dense tight frame).

Figure 4: USD-EURO Exchange Rate

Figure 7: Optimal Wavelets Selected by FORWAVER Selection has been made by using the maxima of PQ surface, as shown in Figure 8. One can see that the overall maximum of PQ is 90.3%, for na = 11 and nc = 2 . Interestingly, in this case, the effective PQ is higher (93.86%). (Usually, the PQ decreases after considering the last K data.) In Figure 9, the structure of filter bank corresponding to minimum entropy of wavelet coefficients is displayed. Beside the fact the structure is quite simple and effective, it reveals an interesting phenomenon: the information about prediction is seemingly concentrated into the middle frequency sub-bands for this ts (recall the time-frequency

Figure 5: Performance of Classical Predictor The PQ criterion has been employed to find the best polynomial degree of trend and AR order. One can see that the value of evaluated PQ on the last K data (which did not partake to the model construction or selection) is quite modest: 73.49%. Thereby, Figure 5 shows that the measured data hardly fall inside the confidence tube.

380

Industrial Simulation Conference ISC-2008, Lyon, France, June 911, 2008 correspondence of Figure 2). This characteristic is confirmed by the scalogram represented in Figure 10. seasonal component is difficult to detect and/or derive or the ts does not exhibit periodic variations (like the one taken as example in this paper). While the wavelet-based model can naturally decode the repeatable patterns carried by the ts, the seasonal component is critical for classical prediction (and requires users intervention). In general, the wavelet-based predictor is very likely superior to the classical one, at the expense of complexity increase.
4. CONCLUSION

Figure 8: Prediction Quality Surface and Optimal Indices

This paper integrated two types of signal modeling in order to perform data compression and especially accurate prediction. The deterministic model is concerned with wavelets and adaptive frequency sub-band configurations, while the stochastic model is of ARMA class. The combination led to an overall prediction model with higher prediction accuracy, comparing to the classical model, on all tested ts. Future improvements are concerned with replacing the orthogonal wavelets by a dictionary of waveforms, from which the most fitted ones have to be selected. Removing the orthogonal nature of wavelets might produce superior performance in terms of prediction.
REFERENCES

Figure 9. Optimal Filter Bank Selected by IDA* procedure

Cohen L. 1995. Time-Frequency Analysis, Prentice Hall, New Jersey, USA. Coifman R., Wickerhauser M.V. 1992 Entropy-Based Algorithms for Best basis Selection, IEEE Transactions on Information Theory, Vol. 38, No. 2, pp. 713718. Daubechies I. 1988. Orthonormal Bases of Compactly Supported Wavelets, Communications on Pure and Applied Mathematics, No. XLI, pp. 909996. Mallat S. 1989. A Theory for Multi-resolution Signal Decomposition: the Wavelet Representation, IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 11, No. 7, pp. 674-693. Russel S.J., Norvig P. 1995. Artificial Intelligence A Modern Approach. Prentice Hall, Upper Saddle River, New Jersey, USA. Shannon C.E. 1948. A Mathematical Theory of Communication, Bell Systems Technical Journal, Vol. 27, pp. 379-423 & 623-656. Sderstrm T., Stoica P. 1989. System Identification, Prentice Hall, London, UK. Stefanoiu D., Culita J., Stoica P. 2005. A Foundation to System Modeling and Identification, Printech Press, Bucharest, Romania. Stefanoiu D., Ionescu F. 2007. Modeling and Prediction of Natural Phenomena by Using Adaptive Orthogonal Wavelet Packets, Research Report HTWG.KN-AvHSTIO-09-07, University of Applied Sciences in Konstanz, Germany, (Sep.).

Figure 10: Time Series Scalogram It would be dishonest to claim that the performance of wavelet-based predictor is by far superior to the one exhibited by the classical predictor for all 15 tested ts. For some ts, PQ gained only few percents. This is the case of ts for which the seasonal component is quite easy to determine by classical methods. It seems that wavelets tremendously improve the classical predictor performance when the
ACKNOWLEDGMENTS

This research has been partly supported by Alexander von Humboldt Foundation (Germany) and, subsequently, by AMCSIT Politehnica (Romania). The authors are extremely grateful to both of them.

381

Industrial Simulation Conference ISC-2008, Lyon, France, June 911, 2008

382

Industrial Simulation Conference ISC-2009, Loughborough, United Kingdom, June 13, 2009

PARMAX A PREDICTOR FOR DISTRIBUTED TIME SERIES


Dan Stefanoiu, Janetta Culita Dept. of Automatic Control and Computer Science Politehnica University of Bucharest, 313 Splaiul Independetei 060032 Bucharest, ROMANIA E-mails: danny@indinf.pub.ro, jculita@yahoo.com

KEYWORDS Prediction, MIMO-ARMAX models, distributed signals, prediction quality, Particle Swarm Optimization. ABSTRACT Within this article, the problem of multi-variable signals prediction is approached. Such signals are provided especially by natural phenomena with geographical distribution. Presumably, the set of time series generated by the same source are more or less correlated each other. Instead of processing each time series independently, they can be seen as measurable outputs provided by some open MIMO system. Therefore, modeling and forecasting of system behavior can rely on multi-dimensional ARMAX models. The research based on this idea led us to construction of PARMAX predictor. Optimal structural indices of MIMO-ARMAX model can be found by means of an evolutionary strategy: Particle Swarm Optimization. 1. INTRODUCTION Evolution of many natural phenomena can be monitored with higher accuracy when the observation and measurement are accounting not only the time variation of some parameter, but also its distribution over a geographical area. Take for example the snow thickness monitoring application on White Valley from French Alps (see Figure 1).
Monitoring laptop/notebook VISA Wireless data acquisition interface

with monitoring. In this context, by monitoring, one understands data prediction mainly. When using a stand alone sensor, the main problem is to locate it in such a vast environment. As Figure 1 is suggesting, the thickness varies both in time and space. A network of wireless sensors is seemingly more suitable to perform monitoring than isolated sensors. Several time series (ts), from different locations are thus provided. Data coming from different channels are in general more or less correlated. For example, the snow melting on top may increase the thickness at the bottom of the valley (especially when avalanches are produced). Assume that the monitoring goal is to predict the snow thickness in order to prevent avalanches. It is very likely that better prediction results be obtained when considering the collection of all data sets, rather than when building independent prediction models for each of them. A quick approach to the prediction problem is to use data fusion techniques [Wang 2005], followed by prediction. After fusion, a unique ts results [Stefanoiu 2008a] and, thus, on one hand, some prediction model can easily be implemented. On the other hand, after fusing the data, much of the prediction information provided by each sensor is lost, which strongly limits the prediction accuracy. A different approach is described within this paper. One considers that sensors provide data as result of unknown colored noises that stimulate an open and quasi-ubiquitous system. The system has in fact a continuous collection of variable states. Placing a finite set of sensors at different locations, in order to perform measuring, is equivalent to sampling the system both in time and space. While the time sampling is governed by Shannon-Nyquist rules, sampling the system over space is by far more empirical. To the best of our knowledge, no general rules of space sampling are currently available. However, apparently, simulations have shown that the prediction quality is less affected by the sensors location than by their number. This paper is structured as follows. Section 2 succinctly describes the construction of MIMO-ARMAX predictors. Section 3 is devoted to Particle Swarm Optimisation (PSO) [Kennedy 1995] an evolutionary technique to find optimal structural indices of prediction model. The performance of PARMAX predictor is demonstrated within the last section, within an application of temperature monitoring. A conclusion and the references list complete the article. (More details can be found in [Stefanoiu 2008c].)

eco-node (wireless)

eco-sensor (wireless)

Figure 1: Snow Thickness Measuring on White Valley The monitoring system consists of 3 layers. The lowest level layer includes on-field wireless sensors (eco-sensors). Signals are first gathered by eco-nodes, then labeled and transmitted at middle level layer a versatile acquisition interface referred to as VISA [Stefanoiu 2008a]. VISA performs primary filtering and data organizing, before sending them to the highest level layer a laptop in charge

Industrial Simulation Conference ISC-2009, Loughborough, United Kingdom, June 13, 2009 2. KERNEL OF PARMAX: MIMO-ARMAX MODELS In a previous research [Stefanoiu 2008c], a comparison between classical prediction methods (based on ARMA modeling) and a wavelet-based method has been realized. But the analyzed ts were mono-variable. In case of multivariable ts, the SISO-ARMA model can be extended to a MIMO-ARMAX model [Sderstrm 1989], according to the rationale described in this section. Let Y = { y j } j1,ny be the set of ny ts provided by some distributed set of sensors and denote the maximum number of acquired data by N y . Before any other operation, data of

The main idea is to come back to the unknown perturbations that stimulate the system to evolve. Since the hidden correlations between output channels have been removed, they can partially be reconsidered by selecting colored noises of measured data as inputs. More specifically, let {e j } j1,ny be the white noises corrupting the measured data. By filtering, they are producing colored noises that corrupted output channels. Since the perturbation of channel j has already been accounted by the MA part of equations (2) (the second right term), only noises of the other output channels, {ei }i1,ny ,i j , are affecting the data through input channels. Consequently, nu = ny 1 and u i ei , i 1, ny , i j . Practically, matrix B (of (1)) has null diagonal, in this case. The colored noises are then: v Be . Since the filters are unknown, estimating inputs means estimating filters parameters. Fortunately, the measured data encode the information regarding colored noises. This allows identification of filters with some accuracy. Given the equations of model (2), it is natural to consider that filters belong to the same models class. A simple assumption yields expressing the filters equations: each output data set is a colored noise produced by the corresponding white noise. Consequently, data for each channel can roughly be modeled by means of a (SISO-)ARMA filter: A sj ( q 1 ) y j C sj ( q 1 ) e j , j 1, ny , (3) where A sj and C sj are (singleton) polynomials for each output channel j 1, ny . Identification of models (3) is simply performed via Minimum Prediction Error Method (MPEM) [Sderstrm 1989]. Moreover, the procedure based on MPEM returns estimates of white noise values. (By convention, estimated parameters or signals carry a hat over their notations.) After identification of models (3), the prediction error on each channel can roughly be estimated. This error actually stands for the input on some channel: s q 1 y + 1 C s q 1 e i e i A , i 1, ny , (4) u i i i i Equations (4) allow not only estimating the inputs of model (2), but also predicting them with sufficient accuracy. The final running MIMO-ARMAX models are then: + C j ( q 1 ) e j , j 1, ny , (5) A j ( q 1 ) y j B j ( q 1 ) u

Y have to be synchronized. Synchronization may involve interpolation (e.g. spline type) and re-sampling, such that each data set includes exactly N y samples. This allows
y= y1 yny , which belongs to some MIMO system. Thus, a general MIMOARMAX model can be assigned to data set Y :

construction of output vector

A ( q 1 ) y B ( q 1 ) u + C ( q 1 ) e .

(1)

In equation (1),
CR
ny ny

AR

ny ny

( q ) are matrix polynomials, u R


1

(q ) ,
1

BR

ny nu
nu

(q )
1

and

is the input

vector ( nu channels) and e R ny is the vector of Gaussian uncorrelated white noises. Two main problems have to be solved, to identify the model (1) from data Y : specifying the model structure and estimating the input signals. If all polynomials of matrices A , B and C are non null, then identification is extremely difficult to perform. Firstly, because the number of parameters to estimate is quite large (even for small number of input-output channels). Secondly, because the output channels are mixed within the AR part (the left side of equation (1)). Therefore, some simplifying hypotheses are necessary. One of the most natural assumptions has been adopted within MATLAB environment: each output vary independently on the other outputs, solely as result of stimulation with inputs and noises. This means the matrix A is diagonal. The second assumption regards the white noises: since they are uncorrelated each other, only one noise per output channel can be kept. Thus, the matrix C is diagonal as well. As direct consequence of the two hypotheses, the MIMO-ARMAX model can be split into ny MISO-ARMAX models (with natural notations): A j ( q 1 ) y j B j ( q 1 ) u + C j ( q 1 ) e j , j 1, ny . (2) This time, B j R
1 nu

( )

( )

R ny gathers all rough estimates of white noises where u and B j , j 0 , j 1, ny . After estimation of inputs,

(q )
1

is a row vector of polynomials.

Identification of MIMO-ARMAX model reduces now to estimation of parameters for each MISO-ARMAX model, separately. Although models (1) and (2) are not equivalent (in the second one, correlation between outputs was removed), identification is now affordable. Despite output channels isolation, as it will be shown, prediction can be performed only when solving all equations (2) at each step. Thus, correlations between outputs are indirectly encoded by the collection of MISO-ARMAX models. Obviously, since only the output data set Y is available, it is necessary to derive a method for estimating the inputs u .

identification of model parameters and white noise values relies on MPEM as well. Actually, approximating ARX models return more refined estimated values of white noises:
n ( q 1 ) y j A e j j
i =1, i j

ny

n ( q 1 ) u i , j 1, ny , B j ,i

(6)

where A nj and Bnj , i are polynomials with degrees n and


n , respectively. (Usually, n and n are sensibly larger than the degrees of polynomials in (5).)

After estimation of parameters, the optimal predictor can be enabled. The following equations show how the output predicted data are recursively computed, on a prediction horizon of length K 1 (for any k N y + 1, N y + K ):

Industrial Simulation Conference ISC-2009, Loughborough, United Kingdom, June 13, 2009
j j ,1 y j j ,na j y j y k | N y = a k 1 | N y a k na j | N y + + b j , i ,1u i [ k 1] + + b j , i ,nb j ,i u i k nb j , i + i =1, i j

j ,k } 2j , N y = 0 and { are the coefficients of endless where k N and A (starting from division between polynomials C j j

ny

their free terms). Obviously,


2 = 1 m, j Ny j [ k ]) = (e
2 k =1 Ny

j ,1e j [ k 1] + + c j ,nc j e j +c k nc j ;
j ,k N y y j j ,n y j [ k n] Ny + + +

i =1, i j

(7)

j ,1 y j ,k N y 1 y j [k ] = y j j j e k | N y + k 1| N y + + N y + 1| N y +
ny

1 Ny

( y [k ] y
j k =1

Ny

k | N y

. (13)
T

The bigger the norm of vector PQ = PQ1 PQ ny , the (8) better the performance of PARMAX algorithm. 3. SELECTING OPTIMAL PREDICTORS VIA PSO Despite the simplification applied to MIMO-ARMAX models, their complexity could still be high. Even in case of networks with small number of sensors, accurate prediction requires large number of parameters to be identified. For example, if ny = 4 , and the maximum values of structural indices na (degree of A polynomials), nb (degree of B polynomials), and nc (degree of C polynomials) is 30, then the best predictor (in terms of PQ ) has to be selected among more than 30 28 2.29 10 41 identification models (when accounting the rough SISO-ARMA models as well). One copes thus with an NP hard optimization problem. The problem can be approached by means of an evolutionary strategy, based on some heuristic. From all such strategies, the PSO [Kennedy 1995] has been preferred, for the convenient trade off between convergence speed and algorithm complexity it exhibits. The principle of PSO is illustrated in Figure 2.

j , i ,1u i [ k 1] + + j , i ,n u i [ k n] = u j [ k ].

By definition, predicted outputs are equal to measured outputs on measuring horizon 1, N y . Obviously, as the last equation shows, predicted inputs are equal to predicted white noises on prediction horizon N y + 1, N y + K . Equations (7) and (8) have to be iterated successively for any prediction instant k . Moreover, next predicted values cannot be estimated unless all output channels have previously been predicted (since all inputs must first be predicted). So, before approaching the next prediction step, all channels have to be predicted at the current step. This mechanism expresses the attempt to consider correlations between different outputs, even though the MIMO-ARMAX model is composed by several MISO-ARMAX models. (In case of isolated SISOARMA models, each channel can independently be predicted on the whole prediction horizon, without waiting for the other channels.) The performance of PARMAX predictor can be assessed by means of prediction quality (PQ) criterion, which is defined as follows, for any channel j 1, ny :
PQ j = 1+ 100
k =1 K 2 j ,k

[%],

(9) Figure 2: Principle of Particle Swarm Optimization A population of entities referred to as particles is initiated to run on some trajectories, starting from initial positions. Trajectories are adaptively adjusted on the run, according to some fitness function (that has to be optimized). The goal is to concentrate the population around some optimum of fitness function and to increase the chance that the optimum be global over the searching space. The population of particles is denoted by P = {x p } p1, P . Positions of particles are actually accounted in P (as vectors of some Euclidean space). Usually, the number of particles ( P ) varies from 50 to 500. The population evolves towards optimum through generations. At every generation, particles take new positions, which can be updated by means of additive corrections, like below:
+1 m +1 p 1, P , m 0 , xm = xm p p + x p ,

SNR p , j m , j SNR m , j

where: SNR m, j and SNR p , j are signal-to-noise ratios of data on channel j , during the measuring horizon and j ,k is the estimated prediction horizon, respectively; standard deviation of current prediction error, on channel j ; m , j is the estimated standard deviation of noise e j on measuring horizon. The SNRs are defined as follows:
SNR m, j = 2
2 m, y j m, j

& SNR m, j =

2 p, y j p, j

(10)

where: m, y j is the standard deviation of measured data,


p , y j is the standard deviation of data on prediction horizon 2 is the estimated variance of overall prediction error. and p, j

(14)

The latter is simply expressed below:


2 p, j
2 1 K j = yj y Ny + k Ny + k | Ny . K k =1

(11)

where m is the generation index. Corrections are computed as displacements of particles with some speeds with T +1 +1 delay, i.e.: x m = vm p p T . Speeds can also be updated:
+1 m m vm = m p p v p + p ,c m xm p ,0 x p +1 m p ,c

j ,k , the following recursive equation has been As of

proven:
2 2 2j ,k = 2j ,k 1 + k N y + 1, N y + K , m , j j , k 1 ,

+ m s

m xm P ,0 x p +1 m s

(12)

p 1, P , m 0 , (15)

Industrial Simulation Conference ISC-2009, Loughborough, United Kingdom, June 13, 2009 where: m p [0,1] is the particle mobility factor;
xm p ,0 is the best position of particle, on its way from the

beginning to the current generation; xm P ,0 is the best position reached by a particle of the whole population (from the beginning to the current generation); m p , c [0,2] is the normalized cognitive variance of particle positions with respect to its best position; m s [0,2] is the normalized social variance of all particles positions with respect to the best population position; +1 m is the delay of particle transition from p , c T current position to its best position; +1 m T is the delay of population transition from s current positions of its particles to the best population position. The PSO algorithm has been modified from its traditional design, in order to match PARMAX. Thus, its parameters are adaptively set, according to PQ criterion. The particles are split in 4 parts, depending on the nature of structural indices in PARMAX (which are degrees of polynomials, in fact):
T x= nt x ARMA

In a similar manner, the relative social variance can be evaluated. The absolute value leads to the relative value: m def def m 2 1 P m s s ,min m m m = x x 2 . (23) = p P ,0 s s m P p =1 m s ,max s ,min It is practically impossible to detect the transition delays. Therefore, they are selected at random. More specifically, m +1 +1 the transition frequencies m (cognitive) and p , c = 1/ p , c
+1 +1 m = 1/ m (social) are randomly generated in ( 0,1/ T ] . s s

xT ARMAX

2 ny + 5 xT , am N

(16)

where nt 0,5 is the degree of polynomial trend [Stefanoiu 2008c]. The other compounds in (16) are:

Equation (15) is the searching engine of PSO strategy. Three terms are contributing to update the speed. The first one is based on the current speed. The weight applied by the mobility factor shows that the former speed is strongly attenuated when the particle is close to its best position. This means the particle is rather attracted by such a position. The second term quantifies the cognitive motivation of particle to move, in terms of driven speed. As the population evolves, every particle acquires some experience that can determine its future behavior. As result of particle experience, the cognitive speed becomes important when the trajectory is drifted away with respect to its best position. Finally, the third term expresses the influence of population on each particle behavior, naturally referred to as social speed. Depending on particle position versus population best position and variance, the social speed increases either when the population is dispersed or the particle is far away from the best position. The evolutionary character of PSO algorithm is involved by the randomly selected transition frequencies. Population can thus escape from the capture of some local optimum, by jumping onto another zone. Like most of the evolutionary procedures based on populations, the trade-off between diversity and convergence is important. Diversity of population allows one to check for optimum in many zones of searching space and, thus, to increase the chance of global optimum finding. On the contrary, convergence (or particles swarm) is necessary to avoid searching oscillations. The key parameter of this trade-off monitoring is the absolute social variance. Three populations can evolve in parallel: the current one, the elite (that keeps all the best positions) and the anti-elite (that keeps all the worst positions). Every time the product between social variances of current generation and elite overflows or underflows some bounds, the diversity-convergence trade-off is unbalanced. Over-floating points to abnormal increase of population diversity, i.e. to oscillatory behavior. To reduce it, crossover between current generation and elite can be performed. Under-floating is caused by concentration of both populations around some optimum, which may decrease the chance to reach for the global optimum. In this case, diversity is increased by performing crossover between current generation and antielite. By crossing over two particles x1 and x 2 with speeds v1 and v 2 , respectively, two offspring are obtained:
1 = x1 + (1 )x 2 & x 2 = x 2 + (1 )x1 , x

x ARMA = [ na0

nc0 ] N (for rough ARMA models); (17)


T 2

x ARMAX = na nb1 nbny 1

nc N ny +1

x am = n0

n n1

(for ARMAX models); (18) T ny +1 nny 1 N

(for AR and ARX approximating models); (19) For example, if the number of channels is 4 ( ny = 4 ), then every particle accounts 13 structural indices. Their values are integer, so that the corrections in (14) have to be rounded to the nearest integer. The following definitions are given for arbitrarily set m 0 and p 1, P , in order to express the variables in (15). The mobility factor is:
m m PQ x p ,0 PQ x p = , m m PQ x p ,0 PQ x p ,1 m p

(20)

where x m p ,1 is the worst position of particle, on its way from the beginning to the current generation. The relative cognitive variance is computed in two steps. First, the absolute variance is evaluated:
m p ,c = 1 m xm p ,0 m + 1 i =0

xip

).

(21)

(24) (25)

Then the variance is normalized with respect to minimum and maximum values, after updating them with (21):
m p ,c = 2
def m m p , c p , c ,min m m p , c ,max p ,c ,min

with corresponding speed values: 1 = v1 + (1 )v 2 & v 2 = v 2 + (1 )v1 , v

(22)

where [0,1] is selected at random (uniformly). When crossover is applied on current population and elite or anti-

Industrial Simulation Conference ISC-2009, Loughborough, United Kingdom, June 13, 2009 elite, all of them of size P , the offspring population consists of 2 P particles. Only the most fitted ( P 1) offspring are selected to complete the current population, after removing all its particles, but the most fitted one. (Maybe this one is the global optimum and must be kept.) The PSO algorithm is initiated to run starting from some initial population (usually, uniformly distributed inside the searching space). To stop the procedure, several tests can be performed. Two very effective tests are the following: the maximum number of iterations was touched (say 100) or the most fitted particle succeeded to survive within the elite population for several generations (say at least 5). The overall strategy of PARMAX algorithm consists of the following main steps: 1. Perform data acquisition on several channels. 2. Estimate the optimal SISO-ARMA prediction model (3) for every channel (independently on the other channels). In this case, the particle includes only the structural indices of ARMA models, i.e.: nt , na0 , nc0 and n0 . 3. Perform prediction, like in (7) and (8). In this case, there are no inputs, so the corresponding terms have to be removed in equations (7) and (8). 4. Estimate the input signals (4) on measuring horizon, by means of SISO-ARMA prediction models. 5. Estimate the optimal MISO-ARMAX models (5) from output acquired data and input estimated data. This time, the particle configuration is given by definition (16), i.e. it includes the ARMA structural indices as well. (ARMA indices previously estimated in step 2 are cancelled.) 6. Perform prediction, according to equations (7) and (8). Recall that predicted inputs are actually estimated white noises. Steps 2, 3 and 4 are not really necessary for PARMAX. (They belong to PARMA.) Step 5 actually includes them. Repeating them only for SISO-ARMA models allows comparing the performance of both predictors. Note however that optimal SISO-ARMA models in step 2 are usually different from optimal SISO-ARMA models estimated inside step 5, because the PQ criterion operates with different predicted data.
4. SIMULATION RESULTS AND DISCUSSION

the test data set, the optimal structural indices are just employed to identify a new model based on the whole data set (i.e. including the test data). Usually, the prediction performance decreases on the prediction horizon, comparing to the test horizon. The goal of implementation is to perform a comparison between PARMA and PARMAX algorithms in terms of prediction quality. If data from different channels are intercorrelated, PARMAX is expected to perform better than PARMA. The application consists of temperatures monitoring in two cities, which are located at 60 km each other, slightly below the latitude of 45. For each city, minimum and maximum temperatures are daily acquired, starting from November 23, 2007, until March 24, 2009. Data look like in Figure 3 and were transmitted via internet to the central processing unit.

Channel 4

Channel 2

Channel 3

Channel 1

Figure 3: Minimum and maximum temperatures of two cities Given the short distance between cities and their geographical position (in a middle of a plane), one can easily notice correlations between the four channels. Beside this feature, some other characteristics of data can also be outlined. For example, noises are corrupting in a different manner the channels. Therefore, data are, at the same time, apparently independent. Another property is related to the seasonal behavior. Normally, the measuring horizon is too short to detect the main period (the acquisition period should be almost twice). It follows that PQ will increase whenever the prediction model is able to detect the right periodic variation of each ts. One of the most important advantages of PSO algorithm is the possibility to perform the search either on a parallel machine or on several computers of a network at the same time. When using a single regular computer (e.g. laptop/notebook), finding the optimal structure of prediction model might be a lengthy operation. But ecological or meteorological data are provided by slow systems. For example, the temperature ts above are collected daily. For an amount of 500 data per channel and a population of 10 particles per channel, PARMA runs about 30, while PARMAX needs about one hour on a regular computer. On a parallel machine, the delays are reduced approximately 8 times. In this research, the simulations were performed on 8 regular computers in a network. The population size ( P ) varied in range 5:15 particles per channel. Thus, practically, the overall population included at least 20 particles per computer, which means at least 160 particles. The other configuration parameters have been set as follows:

The PARMAX procedure has been implemented within MATLAB environment. There are many implementation details that cannot be described within this paper (but can be found in [Stefanoiu 2008c]). One can only mention here the strategy of optimal structural indices selection (for both PARMA and PARMAX predictors). Obviously, the PQ fitness function based on definitions (9) cannot be evaluated unless data on prediction horizon are acquired as well. It follows that all ARMA(X) models have to be identified from N y K t data, instead of N y data. The last K t data are preserved as test horizon for the PSO algorithm. More specifically, after identification of some ARMA(X) model, its prediction performance is tested on the last K t data (which have not been involved in identification). Usually, K t max{3, K / 2}, K . After selecting the best predictor on

Industrial Simulation Conference ISC-2009, Loughborough, United Kingdom, June 13, 2009
prediction horizon length ( K ): 5; maximum number of generations ( M ): 100; minimum survival factor ( S ): 5; maximum degree of trend ( NT ): 5; maximum structural index for AR part ( NA ): N y / 3 ; maximum structural index for MA part ( NC ): N y / 3 ; maximum structural index for X part ( NB ): N y / 2 ; maximum structural index for AR part of approximating models ( N ): N y / 2 ; maximum structural index for X part of approximating models ( N ): N y / 2 .

This leaves a large searching space for optimal structural indices. The last K data have been removed completely. They are accounted only after the final prediction data have been estimated, in order to compute PQ. (Thus, when searching for optimal structure of prediction model, only N y Kt K data are employed.) After running PARMA on the temperature ts (with N y = 482 data), the best results are illustrated in Figures 4, 6, 8 and 10 (for each channel). In parallel, Figures 5, 7, 9 and 11 display the best results of PARMAX. Each of which includes 3 variations: the original ts together with its optimal trend (top), the estimated white noise on measuring horizon (middle) and the zoom on prediction horizon (bottom). The PQ values are depicted on the latter. One can see that:
PQT ARMA = [67.83 53.66 49.11 66.52]
PQT ARMAX = [69.97 72.37 59.71 71.82]

The third variations of all figures are grouped in couples (one for each channel). In order to focus on details, the vertical axis has been scaled differently from a variation to another. Actually, scaling is uniquely determined by the confidence tube. Large aperture of tube usually involves small value of PQ, even though the predicted values might be close each other. Prediction on channels 2 and 3 is quite remarkable (even at eastern end of prediction horizon, where, usually, predicted values are less accurate). This is somehow surprising, since the ts belong to different cities and, moreover, are representing opposite temperatures (maximum and minimum, respectively). But the correlations between data are mostly hidden and cannot simply be read on time variation, regardless the users experience. For data with less correlation than the above ones, the superior performance of PARMAX over PARMA is not so obvious. Usually, PARMAX performs better on some channels only and its fitness (the norm of PQ) can even fall below the PARMA fitness. In this case, PARMA should be preferred, due to its smaller complexity and higher speed.
5. CONCLUSION

PQ ARMA 119.65 ;
PQ ARMAX 137.32 .

(26) Since the correlation between channels is so obvious, the superior performance of PARMAX versus PARMA is an expected result. Beside this general remark, the simulation results yield several insights. The fact the measuring horizon is not large enough to allow detection of seasonal variation decreases the performance of both predictors. As one can see from Figures 4, 5 and 9, the trend tried to decode data periodicity by increasing the polynomial degree to its maximum value. However, for the other models the trend degree is bounded by 3. Normally, the trend should not include the periodic variation, because polynomials are unbounded in vicinity of infinity and, thus, the prediction can fail very easily. In this application, higher degree trend is accepted because the prediction horizon is quite short, comparing to the measuring horizon. PARMA detected a period on channel 3, since the ts is closer here to symmetry than for the other channels. The period is almost half of N y . Simulations have proven that, without seasonal compound, PARMA systematically fails on channel 3. Oppositely, PARMAX removed any seasonal variation and tried to replace its contribution by colored noises. As already mentioned, data are affected by different noises on different channels. The second variation of all figures shows that the estimated SNR varies along channels. In general, the higher PQ, the higher SNR and the smaller white noise variance.

Lately, there is an increasing interest in handling and monitoring distributed data, on different purposes. In case of ecological or meteorological data, prediction is an important goal. This article introduced a method of prediction based on multi-dimensional identification models from ARMAX class. An evolutionary strategy (PSO) was employed to speed up the searching for optimum prediction model. The resulting algorithm can be implemented on a mobile computer. Prediction can thus directly be performed inside the system that provides the data. Whenever the measuring channels are correlated, multi-dimensional prediction models should be constructed instead of singleton models for each channel in isolation.
REFERENCES

Kennedy J., Eberhart R. 1995. Particle Swarm Optimization, IEEE International Conference on Neural Networks, Piscataway N.J., USA, pp. 1942-1948. Sderstrm T., Stoica P. 1989. System Identification, Prentice Hall, London, UK. Stefanoiu D., Petrescu C. 2008a. VISA A Versatile Interface of Signal Acquisition and Wavelet Based Data Fusion, Proc. of the 5-th Europe-Asia Mechatronics Congress, Annecy, France, Paper no. 167. Stefanoiu D., Culita J., Ionescu F. 2008b. FORWAVER A Wavelet-Based Predictor for Non Stationary Signals, Proc. of EUROSIS-ISC-2008, Lyon, France, pp. 377-381. Stefanoiu D., Petrescu C. et al. 2008c. Numerical Models and Fast Methods of Ecological Phenomena Prediction, Res. Rep. CNMP.UPB-P4.31050-2007.II/DS.CP. AD.JC12.2008, Politehnica University of Bucharest, Romania. Wang Z., Ziou D., et al. 2005. A Comparative Analysis of Image Fusion Methods, IEEE Trans. on Geoscience and Remote Sensing, Vol. 43, No. 6, pp. 1391-1402.
ACKNOWLEDGMENTS This research was developed with the support of AMCSIT Politehnica (Romania), in the framework of grant #117/2007. The authors wish to address its team grateful and special thanks.

10

Industrial Simulation Conference ISC-2009, Loughborough, United Kingdom, June 13, 2009

Figure 4: PARMA performance on channel 1

Figure 5: PARMAX performance on channel 1

Figure 6: PARMA performance on channel 2

Figure 7: PARMAX performance on channel 2

11

Industrial Simulation Conference ISC-2009, Loughborough, United Kingdom, June 13, 2009

Figure 8: PARMA performance on channel 3

Figure 9: PARMAX performance on channel 3

Figure 10: PARMA performance on channel 4

Figure 11: PARMAX performance on channel 4

12

Accepted for presentation at the 7-th International IEEE Conference on Control and Automation, IEEE-ICCA'09, Christchurch, New Zealand, December 9-11, 2009

Identification of MIMO-ARMAX Models for Glycemia and Sodium Ions Tests, through Particle Swarm Optimization
Dan Stefanoiu, Cristian Seraficeanu, Janetta Culita, Gheorghe Musca
test for calcium Ca 2 + .) Among them, the tests for sodium and glucose are extremely important. Sodium is highly correlated with the hydration status of the body, blood pressure and kidney function. The human body regulates sodium level through water ingestion and a hormone referred to as anti-diuretic. Hydration status is determined by natremia (sodium concentration in serum). Sodium also plays an essential role for the electrical activity at cellular level. They are in charge with transmission of nerve impulses, heart activity, and certain metabolic functions. (Interestingly, although sodium is needed by animals, which maintain high blood sodium and extracellular fluid sodium concentrations, the ions are not needed by plants and is generally phytotoxic.) The normal level of sodium varies between 135 and 147 mmol/L. Relative loss of body water will cause sodium concentration to rise higher than normal, a condition known as hypernatremia. This ordinarily results in thirst. Conversely, an excess of body water caused by drinking will result in smaller sodium concentration in the blood (hyponatremia), causing a loss of water. Cellular activity is however the most affected by abnormal concentration of sodium, which might result in irreversible damage of cell membranes. Glucose is the most important source of metabolic energy for the majority of cells, particularly for some of them (like e.g. neurons and erythrocytes, which are almost totally dependent on it). The concentration of glucose in the blood is referred to as glycemia and is controlled by several physiological processes. It tends to fluctuate to higher levels after meals, due to the gastric and intestinal absorption of carbohydrates of low molecular weight present in the diet or broken down from other kinds of foodstuffs, such as starches (polysaccharides). Lower levels are reached with usage by catabolism, particularly after stress, temperature regulation and physical exertion. Another input to glycemia levels is gluconeogenesis, whereby glycogen stored in the liver and skeletal muscles, or amino acids and lipids are converted to glucose via several metabolic chains. Excess glucose is converted to glycogen or to triglycerides for energy storage. Physiologically, glycemia normally fluctuates within a narrow range: 70-100 mg/dl. Excessively low levels are classed as hypoglycemia. These may result from poor diet, or as a side effect of diabetes medication. Excessively high levels (e.g., 250 mg/dl or more) are classed as hyperglycemia and are a particular threat to diabetes sufferers. The brain requires a fairly stable glycemia in order to function normally. Concentrations of less than about

Abstract In this article, the problem of multivariable data autoregressive identification is approached, in view of prediction. Such data are especially provided by natural phenomena with geographical distribution, but could also be acquired from concentrated systems with several outputs, like medical records of one or more patients. Presumably, data are generated by the same source and exhibit more or less correlations to each other. Instead of processing each data set as an independent time series, the whole data block can be seen as the reaction of some open MIMO system to unknown stimuli. Therefore, modeling and forecasting of system behavior can rely on multi-dimensional ARMAX models. Optimal structural indices of MIMO-ARMAX model are found by means of an evolutionary strategy: Particle Swarm Optimization. I. INTRODUCTION LTHOUGH the governing dynamics of many natural phenomena is unknown, they can be assigned to identification models [1], for some purpose. In this article, the main purpose consists of behavior monitoring and/or prediction of some medical records (like e.g. sodium ions test and glycemia [2], [3]). The major requirement for the success of this attempt is to capture consistent and coherent data from patients. This involves performing accurate measurements (under specific conditions) and acquiring sufficient number of samples (at least few tens). Nowadays, in medical praxis, a complete set of lab data for one person relies on the basic metabolic panel (BMP), also referred to as CHEM-7, which consists of seven blood chemical tests [2]: four electrolytes (sodium Na + , potassium K + , chloride Cl , bicarbonate HCO3 ), blood urea nitrogen (BUN), creatinine and glucose. (Some BMPs also include a
Manuscript received on April 15, 2009. This work was supported by the Romanian National Center for Programs Management (to which the authors are addressing grateful thanks), under Grant #31050/2007. D. Stefanoiu (Ph.D.) is with the University Politehnica of Bucharest, Faculty of Automatic Control and Computer Science, SysIdSigPro Group (Splaiul Independentei no.313, Sector 6, Bucharest-060042, Romania, phone&fax: +40 21 316 9561; e-mail: danny@indinf.pub.ro). C. Seraficeanu (M.D.) is with "N. Paulescu" National Institute for Diabetes, Nutrition and Metabolic Diseases, Bucharest, Romania (e-mail: cristianseraficeanu@yahoo.com). J. Culita (Ph.D.) has the same affiliation as the first author above (e-mail: jculita@yahoo.com). G. Musca (Ph.D.) is with Fresenius Medical Care, Bucharest, Romania, (e-mail: gheorghe.musca@fmc-romania.ro).

145

Accepted for presentation at the 7-th International IEEE Conference on Control and Automation, IEEE-ICCA'09, Christchurch, New Zealand, December 9-11, 2009

30 mg/dl or greater than about 300 mg/dl can produce confusion, unconsciousness and convulsions. Our research aimed to exploit the fact BMP lab data are usually correlated, when provided by the same patient. Thus, its medical evolution can be monitored with higher accuracy by processing the BMP data in integrum than by processing each parameter in isolation. It is even possible that patients living together or being related each other provide correlated medical records, especially if they complied with the same testing rules, approximately at the same time. The goal of this article is to prove that multi-dimensional identification models (such as MIMO-ARMAX) are more accurate than singleton models (such as SISO-ARMA) [1], in terms of prediction quality, when processing BMP lab data. The problem is to build both types of models and to compare their performance on BMP data blocks. Two types of correlations have been considered: between BMP parameters and between related patients. The approach described hereafter starts from the remark that data are provided by an open and quasi-ubiquitous system, which is stimulated by a set of unknown colored noises. The system has in fact a continuous collection of variable states. Picking a finite set of data from different points (e.g. patients and their bodies) is equivalent to sampling the system both in time and non temporal dimensions (such as spatial). While the time sampling is governed by Shannon-Nyquist rules [4], sampling the system over other dimensions is by far more empirical. To the best of our knowledge, no general rules of non temporal (or spatial) sampling are currently available. However, apparently, simulations have shown that the prediction quality is less affected by the sensors location than by their number and patients condition. This paper is structured as follows. Section 2 succinctly describes the construction of MIMO-ARMAX predictors. Section 3 is devoted to Particle Swarm Optimisation (PSO) [5] an evolutionary technique to find optimal structural indices of prediction model. The predictor performance is demonstrated within the last section, for sodium and glycemia monitoring. A conclusion and the references list complete the article. (More details regarding the construction of predictors can be found in [6].) II. CONSTRUCTION OF MIMO-ARMAX PREDICTORS In a previous research [7], a comparison between classical prediction methods (based on ARMA modeling) and a wavelet-based method has been realized. But the analyzed ts were mono-variable. In case of multi-variable time series (ts), the SISO-ARMA model can be extended to a MIMO-ARMAX model, according to the rationale described in this section. Let Y = { y j } j1,ny be the set of ny ts, which are provided by some synchronized distributed set of sensors and denote the maximum number of acquired data by N y . It is then possible to construct the output vector y = y1 yny , which belongs to some MIMO system. Thus, a general
T

MIMO-ARMAX model can be assigned to data block Y :


A ( q 1 ) y B ( q 1 ) u + C ( q 1 ) e .

(1)

In equation (1), A R nyny ( q 1 ) , B R nynu ( q 1 ) and

C R nyny ( q 1 ) are matrix polynomials, u R nu is the input

vector (with nu channels) and e R ny is a vector of Gaussian uncorrelated white noises. To identify the model (1) from data Y , two main problems have to be solved,: setting the model structure and estimating the input signals. If all polynomials of matrices A , B and C are non null, then identification is extremely difficult to perform. Firstly, because the number of parameters to estimate is quite large (even for small number of input-output channels). Secondly, because the output channels are mixed within the AR part (the left side of equation (1)). Therefore, some simplifying hypotheses are necessary. One of the most natural assumptions has been adopted within MATLAB environment: each output varies independently on the other outputs, solely as result of stimulation with inputs and noises. This means the matrix A is diagonal. The second assumption regards the white noises: since they are uncorrelated each other, only one noise per output channel can be kept. Thus, the matrix C is diagonal as well. As direct consequence of the two hypotheses, the MIMO-ARMAX model can be split into ny MISO-ARMAX models (with natural notations):
A j ( q 1 ) y j B j ( q 1 ) u + C j ( q 1 ) e j , j 1, ny .

(2)

This time, B j R1nu ( q 1 ) is a row vector of polynomials. Identification of MIMO-ARMAX model reduces now to estimation of parameters for each MISO-ARMAX model, separately. Although models (1) and (2) are not equivalent (in the second one, correlation between outputs was removed), identification is now affordable. Despite the isolation of output channels, as it will be shown, prediction can be performed only when solving all equations (2) at each step. Thus, correlations between outputs are indirectly encoded by the collection of MISO-ARMAX models. Obviously, since only the output data block Y is available, it is necessary to derive a method for estimating the input u . The main idea is to come back to the unknown perturbations that stimulate the system to evolve. Since the hidden correlations between output channels have been removed, they can partially be reconsidered by selecting colored noises of measured data as inputs. More specifically, let {e j } j1,ny be the white noises corrupting the measured data. By filtering, they are producing colored noises that corrupt output channels. Since the perturbation of channel j has already been accounted by the MA part of equations (2) (the second right term), only noises of the other output channels, {ei }i1,ny ,i j , are affecting the data through input channels. Consequently,
nu = ny 1

and

u i ei ,

146

Accepted for presentation at the 7-th International IEEE Conference on Control and Automation, IEEE-ICCA'09, Christchurch, New Zealand, December 9-11, 2009

i 1, ny , i j . Practically, the matrix B (of (1)) has null diagonal, in this case. The colored noises are then: v Be . Since the filters to produce colored noises are unknown, estimating inputs means estimating filters parameters. Fortunately, the measured data encode the information regarding colored noises. This allows identification of filters with some accuracy. Given the equations of model (2), it is natural to consider that filters belong to the same models class. A simple assumption yields expressing the filters equations: each output data set is a colored noise produced by the corresponding white noise. Consequently, data for each channel can roughly be modeled by means of a simple ARMA filter: A sj ( q 1 ) y j C sj ( q 1 ) e j , j 1, ny ,

j ,1 y j ,k N y 1 y j [k ] = y j j j e k | N y + k 1| N y + + N y + 1| N y + j ,k N y y j j ,n y j [ k n] + Ny + +

i =1, i j ny

j , i ,1u i [ k 1] + + j , i ,n u i [ k n] = u j [ k ].

(8)

By definition, predicted outputs are equal to measured outputs on measuring horizon 1, N y . Obviously, as the last equation shows, predicted inputs are equal to predicted white noises on prediction horizon N y + 1, N y + K . Equations (7) and (8) have to be iterated successively for any prediction instant k . Moreover, next predicted values cannot be estimated unless all output channels have previously been predicted (since all inputs must first be predicted). So, before approaching the next prediction step, all channels have to be predicted at the current step. This mechanism expresses the attempt to consider correlations between different outputs, even though the MIMO-ARMAX model is composed by several MISO-ARMAX models. (In case of isolated SISOARMA models, each channel can independently be predicted on the whole prediction horizon, without waiting for the other channels.) Equations (7) and (8) are the kernel of multi-dimensional predictor, also referred to as PARMAX. Its performance can be assessed by means of prediction quality (PQ) criterion, which is defined as follows, for any channel j 1, ny :
PQ j = 1+ 100
k =1 K 2 j ,k

(3)

where A sj and C sj are (singleton) polynomials for each output channel j 1, ny . Identification of models (3) is performed via Minimum Prediction Error Method (MPEM) [1]. Moreover, the procedure based on MPEM returns estimates of white noise values. (By convention, estimated parameters or signals carry a hat over their notations.) After identification of models (3), the prediction error on each channel can be estimated. This error actually stands for the input on some channel. More specifically:
s q 1 y + 1 C s q 1 e i e i A , i 1, ny , (4) u i i i i Equations (4) allow not only estimating the inputs of model (2), but also predicting them with sufficient accuracy. The final running MIMO-ARMAX models are then:
A j (q
1

( )

( )

[%],

(9)

)y

B j (q

+ C (q ) e , )u
1 j j

j 1, ny ,

(5)

SNR p , j m , j SNR m , j

R ny gathers all rough estimates of white noises where u and B j , j 0 , j 1, ny . After estimation of inputs,

where: SNR m, j and SNR p , j are signal-to-noise ratios of data on channel j , during the measuring horizon and j ,k is the estimated prediction horizon, respectively; standard deviation of current prediction error, on channel j ; m , j is the estimated standard deviation of noise e j on measuring horizon. The SNRs are defined as follows:
SNR m, j = 2 m, y j 2
m, j

identification of model parameters and white noise values relies on MPEM as well. Approximating ARX models returns more refined estimated values of white noises:
n ( q 1 ) y j A e j j
i =1, i j

ny

n ( q 1 ) u i , j 1, ny , B j ,i

(6)

where A nj and Bnj , i are polynomials with degrees n and


n , respectively. (Usually, n and n are sensibly larger than the degrees of polynomials in (5).) The optimal predictor is available after parameters estimation. The following equations show how the output predicted data are recursively computed, on a prediction horizon of length K 1 (for any k N y + 1, N y + K ):
j j ,1 y j j ,na j y j y k | N y = a k 1 | N y a k na j | N y + +
i =1, i j

& SNR m, j =

2 p, y j , 2
p, j

(10)

where: m, y j is the standard deviation of measured data,


p , y j is the standard deviation of data on prediction horizon 2 is the estimated variance of overall prediction error. and p, j

The latter is simply expressed below:


K 2 2 = 1 j y yj Ny + k Ny + k | Ny . p, j K k =1

(11)

ny

b j , i ,1u i [ k 1] + + b j , i ,nb j ,i u i k nb j , i +

j ,k , the following recursive equation has been proven: For 2 2 2j ,k = 2j ,k 1 + k N y + 1, N y + K , m , j j , k 1 ,

j ,1e j [ k 1] + + c j ,nc j e j +c k nc j ;

(7)

(12)

147

Accepted for presentation at the 7-th International IEEE Conference on Control and Automation, IEEE-ICCA'09, Christchurch, New Zealand, December 9-11, 2009

j ,k } 2j , N y = 0 and { where are the coefficients of endless k N and A (starting from division between polynomials C j j

Corrections are computed as displacements of particles with some speeds within some delay T , i.e.: +1 +1 x m = vm p p T . Speed values can also be updated:
+1 m m = m vm p p v p + p ,c m xm p ,0 x p +1 m p ,c

their free terms). Obviously,


2 = 1 m, j Ny j [ k ]) = (e
2 k =1 Ny

1 Ny

(
k =1

Ny

j y j [k ] y k | N y

+ m s

m xm P ,0 x p +1 m s

. (13)
T

The bigger the norm of vector PQ = PQ1 PQ ny , the better the performance of PARMAX algorithm. III. SELECTION OF STRUCTURAL INDICES VIA PSO Despite the simplification applied to MIMO-ARMAX models, their complexity could still be high. Even the number of data channels is small, accurate prediction requires a large number of parameters to be identified. For example, if ny = 4 , and the maximum values of structural indices na (degree of A polynomials), nb (degree of B polynomials), and nc (degree of C polynomials) is 30, then the best predictor (in terms of PQ ) has to be selected among more than 3028 2.29 1041 identification models (when accounting the rough SISO-ARMA models as well). One copes thus with an NP hard optimization problem. The problem can be approached by means of an evolutionary strategy, based on some heuristic. From all such strategies, the PSO [5] has been preferred, for the convenient trade off between convergence speed and algorithm complexity it exhibits. The principle of PSO is illustrated in Figure 1.

p 1, P , m 0 , (15) where: m p [0,1] is the particle mobility factor;

xm p ,0 is the best position of particle, on its way from

the beginning to the current generation; xm P ,0 is the best position reached by a particle of the whole population (from the beginning to the current generation); m p ,c [0,2] is the normalized cognitive variance of particle positions with respect to its best position; m s [0,2] is the normalized social variance of all particles positions with respect to the best population position; +1 m is the delay of particle transition from p , c T current position to its best position; +1 m T is the delay of population transition from s current positions of its particles to the best population position. As a new feature, some of the parameters above are adaptively set, according to PQ criterion. The particles are split in 4 parts, depending on the nature of structural indices in PARMAX (degrees of polynomials, in fact):
T x= nt x ARMA

xT ARMAX

2 ny + 5 xT , am N

(16)

Fig. 1. Principle of Particle Swarm Optimization. A population of entities referred to as particles is initiated to run on some trajectories, starting from initial positions. Trajectories are adaptively adjusted on the run, according to some fitness function (that has to be optimized). The goal is to concentrate (swarm) the population around some optimum of fitness function and to increase the chance to find the global optimum.

where nt 0,5 is the degree of polynomial trend. The other compounds in (16) are:
x ARMA = [ na0
nc0 ] N 2 (for rough ARMA models); (17)
T ny +1 nc N T

x ARMAX = na nb1 nbny 1


x am = n0

The searching technique described next is sensibly modified with respect to the original algorithm from [5]. There are many new features that have been added and some of the genuine features have been modified, so that the searching algorithm matches the optimization problem of PARMAX predictor. The population of particles is denoted by P = {x p }p1, P . Positions of particles are actually accounted in P (as vectors of some Euclidean space). Usually, the number of particles ( P ) varies from 50 to 500. The population evolves towards optimum through generations. At every generation, particles take new positions, which can be updated by means of additive corrections, like below:
x
m +1 p

(for ARMAX models); (18) T n n1 n ny 1 N ny +1

(for AR and ARX approximating models); (19) For example, if ny = 4 , then every particle accounts 13 structural indices. Their values are integer, so that the corrections in (14) have to be rounded to the nearest integer. The following definitions are given for arbitrarily set m 0 and p 1, P , in order to express the variables in (15). The mobility factor is:
m p =
m m PQ x p ,0 PQ x p , m m PQ x PQ x p ,0 p ,1

(20)

= x + x
m p

m +1 p

, p 1, P , m 0 ,

(14)

where x m p ,1 is the worst position of particle, on its way from the beginning to the current generation. The relative cognitive variance is computed in two steps.

where m is the generation index.

148

Accepted for presentation at the 7-th International IEEE Conference on Control and Automation, IEEE-ICCA'09, Christchurch, New Zealand, December 9-11, 2009

First, the absolute variance is evaluated: m p ,c = 1 m xm p ,0 m + 1 i =0

xip

).

(21)

Then the variance is normalized with respect to minimum and maximum values, after updating them with (21):
m p ,c = 2
def m m p ,c p , c ,min m m p ,c ,max p ,c ,min

(22)

oscillatory behavior. To reduce it, crossover between current generation and elite can be performed. Under-floating is caused by concentration of both populations around some optimum, which may decrease the chance to reach for the global optimum. In this case, diversity is increased by performing crossover between current generation and antielite. By crossing over two particles x1 and x 2 with speeds v1 and v 2 , respectively, two offspring are obtained:
1 = x1 + (1 )x 2 & x 2 = x 2 + (1 )x1 , x

(24) (25)

In a similar manner, the relative social variance can be evaluated. The absolute value leads to the relative one:
m s =
def

1 P m x p xm P ,0 P p =1

m s = 2

def

m m s s ,min m m s ,max s ,min

with corresponding speed values: 1 = v1 + (1 )v 2 & v 2 = v 2 + (1 )v1 , v

. (23)

It is practically impossible to detect the transition delays. Therefore, they are selected at random. More specifically, m +1 +1 (cognitive) and the transition frequencies m p , c = 1/ p , c
+1 +1 m = 1/ m (social) are randomly generated in ( 0,1/ T ] s s

(with uniform distribution). Equation (15) is the searching engine of PSO strategy. Three terms are contributing to update the speed. The first one is based on the current speed. The weight applied by the mobility factor shows that the former speed is strongly attenuated when the particle is close to its best position. This means the particle is rather attracted by such a position. The second term quantifies the cognitive motivation of particle to move, in terms of driven speed. As the population evolves, every particle acquires some experience that can determine its future behavior. As result of particle experience, the cognitive speed increases when the trajectory is drifted away with respect to its best position. Finally, the third term expresses the influence of population on each particle behavior, naturally referred to as social speed. Depending on particle position versus population best position and variance, the social speed increases either when the population is dispersed or the particle is far away from the best position. The evolutionary character of PSO algorithm is involved by the randomly selected transition frequencies. Population can thus escape from the capture of some local optimum, by jumping onto another zone. Like most of the evolutionary procedures based on populations, the trade-off between diversity and convergence is important. Diversity of population allows one to check for optimum in many zones of searching space and, thus, to increase the chance of global optimum finding. On the contrary, convergence (or particles swarm) is necessary to avoid searching oscillations. The key parameter of this trade-off monitoring is the absolute social variance. Three populations can evolve in parallel: the current one, the elite (that keeps all the best positions) and the anti-elite (that keeps all the worst positions). Whenever the product between social variances of current generation and elite overflows or underflows some bounds, the diversity-convergence trade-off is unbalanced. Over-floating points to abnormal increase of population diversity, i.e. to

where [0,1] is selected at random (uniformly). When crossover is applied on current population and elite or antielite, all of them of size P , the offspring population consists of 2 P particles. Only the most fitted ( P 1) offspring are selected to complete the current population, after removing all its particles, but the most fitted one. (Maybe this one is the global optimum and must be kept.) The PSO algorithm is initiated to run starting from some initial population (usually, uniformly distributed inside the searching space). To stop the procedure, several tests can be performed. Two efficient tests are the following: the maximum number of iterations was touched (say 100) or the most fitted particle succeeded to survive within the elite population for several generations (say 8). The overall strategy of PARMAX algorithm consists then of the following main steps: 1. Perform data acquisition on several channels. 2. Estimate the SISO-ARMA prediction model (3) for every channel (independently on the other channels), by using the structural indices: nt , na0 , nc0 and n0 . 3. Estimate the input signals (4) on measuring horizon, by means of SISO-ARMA prediction models. 4. Estimate the optimal MISO-ARMAX models (5) from acquired output data and estimated input data. This time, the remaining indices of definition (16) have to be employed. Optimal indices are found via PSO. 5. Perform prediction, according to equations (7) and (8). Recall that predicted inputs are actually estimated white noises. A similar (but simpler) procedure can lead to identification of SISO-ARMA models as independent predictors, also referred to as PARMA. Comparison between PARMAX and PARMA predictors becomes thus possible. IV. SIMULATION RESULTS AND DISCUSSION Both algorithms (PARMA and PARMAX) have been implemented in MATLAB environment. They were tested on BMP lab data coming from several patients. In this article, a block of 4 channels has been selected. The signals are provided by 2 patients: a female (channels 1, 2) and a male (channels 3, 4). They have been monitored simultaneously for glycemia (channels 1, 3) and sodium (channels 2, 4), as displayed in Figure 2.

149

Accepted for presentation at the 7-th International IEEE Conference on Control and Automation, IEEE-ICCA'09, Christchurch, New Zealand, December 9-11, 2009

Channel 3 Channel 1

Channel 2

Channel 4

Fig. 2. BMP lab data from two patients. Data were sampled every 48 hours and the patients provided 193 samples. The last 5 samples were hidden, in order to evaluate the performance of predictors. There is a visible correlation between signals on the left side as well as between signals on the right side. Also, hidden correlation might exist between left and right sides.

There are many implementation details that cannot be described within this paper. One can only mention here the strategy of optimal structural indices selection (for both PARMA and PARMAX predictors). Obviously, the PQ fitness function based on definitions (9) cannot be evaluated unless data on prediction horizon are acquired as well. It follows that all ARMA(X) models have to be identified from N y K t data, instead of N y data. The last K t data are preserved as test horizon for the PSO algorithm. Here, K t max{3, K / 2}, K . After selecting the best predictor, the optimal structural indices are just employed to identify a new model based on the whole data block (i.e. including the test data). Usually, the prediction performance decreases on the prediction horizon, comparing to the test horizon. One of the most important advantages of PSO technique is the possibility to perform the search either on a parallel machine or on several computers of a network at the same time. In this research, simulations were performed on 8 regular computers in a network. The population size ( P ) varied in range 515 particles per channel. Thus, practically, the overall population included at least 20 particles per computer, which means at least 160 particles. After running PARMA on the 4 signals above, the best results are illustrated in Figures 3, 5, 7 and 9 (for each channel). In parallel, Figures 4, 6, 8 and 10 display the best results of PARMAX. Each of which includes 3 variations: the original ts together with its optimal trend (top), the estimated white noise on measuring horizon (middle) and the zoom on prediction horizon (bottom). The PQ values are depicted on the latter. One can notice that:
PQT ARMA = [42.09 42.68 49.62 52.2]
PQ
T ARMAX

The estimated SNR values confirm the visual observation. (In general, the higher PQ, the higher SNR and the smaller white noise variance.) Consequently, the prediction performance is rather modest. Sodium variation is however easier to predict than glycemia variation, as expected. Human body reacts faster to glucose variation than to salt variation. Also, males body is seemingly more stable than females. This is the reason the prediction performance is slightly superior for mans data. Moreover, the prediction models are stable for man and at the stability limit for female (some poles are located nearby the unit circle). The third variations of all figures are grouped in couples (one for each channel). In order to focus on details, the vertical axis has been scaled differently from a variation to another. Actually, scaling is uniquely determined by the confidence tube. Although the predicted values apparently are close each other, large aperture of tube involves small value of PQ. PARMAX has superior performance than PARMA. This assessment is proven not only by the displayed predicted data, but by the fact that PARMAX was better than PARMA on the overwhelming simulations. V. CONCLUSION Lately, there is an increasing interest in handling and monitoring distributed medical data records. This article introduced a method of prediction based on multidimensional identification models from ARMAX class. An evolutionary strategy (PSO) was employed to speed up the searching for prediction model, at the expense of suboptimality. If the measuring channels are correlated, multidimensional identification models should be employed instead of singleton ones, in order to perform prediction. As future work, one can switch to wavelet based models or to Kalman filtering, in order to increase the prediction performance. REFERENCES
[1] [2] [3] Sderstrm T., Stoica P., System Identification, Prentice Hall, London, UK, 1989. Rao A.D. et al., First Aid for the USMLE Step 1, McGraw-Hill Medical, 2007. Osanai T., Fujiwara N., et al., "Relationship between Salt Intake, Nitric Oxide and Asymmetric Dimethylarginine and Its Relevance to Patients with End-Stage Renal Disease", Blood Purification, Vol. 20, pp. 466468, 2002. Proakis J.G., Manolakis D.G., Digital Signal Processing. Principles, Algorithms and Applications., third edition, Prentice Hall, Upper Saddle River, New Jersey, USA, 1996. Kennedy J., Eberhart R., Particle Swarm Optimization, in Proc. of IEEE International Conference on Neural Networks, Piscataway N.J., USA, 1995, pp. 1942-1948. Stefanoiu D., Petrescu C. et al., Numerical Models and Fast Methods of Ecological Phenomena Prediction, Res. Rep. CNMP.UPBP4.31050-2007.II/DS.CP. AD.JC-12.2008, Politehnica University of Bucharest, Romania, 2008. Stefanoiu D., Culita J., Ionescu F., FORWAVER A Wavelet-Based Predictor for Non Stationary Signals, in Proc. of EUROSIS-ISC2008, Lyon, France, 2008, pp. 377-381.

[4]

[5]

PQ ARMA 93.7 ;
PQ ARMAX 117.55 .

= [51.72 54.2 61.99 66.05]

[6]

(26) As a general remark, all 4 signals are corrupted by noises with different intensities (higher for female than for male).
[7]

150

Accepted for presentation at the 7-th International IEEE Conference on Control and Automation, IEEE-ICCA'09, Christchurch, New Zealand, December 9-11, 2009

Fig. 3. PARMA performance on channel 1 (glycemia female).

Fig. 4. PARMAX performance on channel 1 (glycemia female).

Fig. 5. PARMA performance on channel 2 (sodium ions female).

Fig. 6. PARMAX performance on channel 2 (sodium ions female).

151

Accepted for presentation at the 7-th International IEEE Conference on Control and Automation, IEEE-ICCA'09, Christchurch, New Zealand, December 9-11, 2009

Fig. 7. PARMA performance on channel 3 (glycemia male).

Fig. 8. PARMAX performance on channel 3 (glycemia male).

Fig. 9. PARMA performance on channel 4 (sodium ions male).

Fig. 10. PARMAX performance on channel 4 (sodium ions male).

152

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

Bibliografie

[ASTI09] [ABY94]

[BaJE85] [BaJE87] [BaG87] [CaDL96a]

[CaDL96b] [CDF92] [CoL95] [CoWi92] [DaC1859] [DaC1871] [DaI88a] [DaI88b] [DaI90] [DHRS03]

ASTI S.A. UMAPID Manual de utilizare i documentaie tehnic, ASTI S.A., Bucureti, Romnia, 2009. Azovtsev Y.A., Barkov A.V., Yudin I.A. Automatic Diagnostics and Condition Prediction of Rolling Element Bearings Using Enveloping Methods, The 18-th Annual Meeting of the Vibration Institute, Saint Louis, Missouri, USA, pp. 249-258, June 1994. Baker J.E. Adaptive Selection Methods for Genetic Algorithms, Proceedings of the first International Conference on GA and their Applications, Erlbaum Printing House, Ed. J.J. Grefenstette, 1985. Baker J.E. Reducing Bias and Inefficiency in the Selection Algorithm, Proceedings of the second International Conference on GA and their Applications, Erlbaum Printing House, Ed. J.J. Grefenstette, 1987. Battle G. A Block Spin Construction of Ondelettes: I. Lemari Functions., Communications in Mathematical Physics, No. 110, pp. 601-615, 1987. Carter D.L. A New Method of Processing Rolling Element Bearing Signals, The 20-th Annual Meeting of the Vibration Institute, Saint Louis, Missouri, USA, June 1996. http://www.inteltek.com/articles/dlcvi96/anew.htm Carter D.L. Rolling Element Bearing Condition Testing Method and Apparatus, United States Patent No. 5,477,730, December 26, 1996. http://www.uspto.gov/go/ptdl/ Cohen A., Daubechies I., Feauveau J.C. Biorthogonal Bases of Compactly Supported Wavelets, Communications on Pure and Applied Mathematics, No. XLV, pp. 485-560, 1992. Cohen L. Time-Frequency Analysis, Prentice Hall, New Jersey, USA, 1995. Coifman R., Wickerhauser M.V. Entropy-Based Algorithms for Best Basis Selection, IEEE Transactions on Information Theory, Vol. 38, No. 2, pp. 713-718, March 1992. Darwin C.R. On the Origin of Species by Means of Natural Selection, London Press, UK, 1859. http://www.literature.org/authors/darwin-charles/the-origin-of-species/. Darwin C.R. The Descent of Man and Selection in Relation to Sex, London Press, UK, 1871. http://www.literature.org/authors/darwin-charles/the-descent-of-man/. Daubechies I. Orthonormal Bases of Compactly Supported Wavelets, Communications on Pure and Applied Mathematics, No. XLI, pp. 909996, 1988. Daubechies I. Time-Frequency Localization Operators A Geometric PhaseSpace Approach. IEEE Transactions on Information Theory, Vol. 34, No. 4, pp. 605-612, July 1988. Daubechies I. The Wavelet Transform, Time-Frequency Localization and Signal Analysis. IEEE Transactions on Information Theory, Vol. 36, No. 9, pp. 961-1005, September 1990. Daubechies I., Han B., Ron A., Shen Z. Framelets: MRA-Based Constructions of Wavelet Frames, Applied and Computational Harmonic Analysis, No. 14, pp. 1-46, 2003.
153

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

[DaLa88a] Daubechies I., Lagarias J. Two Scale Difference Equations: I. Existence and Global Regularity of Solutions., SIAM Journal of Mathematical Analysis, Vol. 22, pp. 1388-1410, 1991. [DaLa88b] Daubechies I., Lagarias J. Two Scale Difference Equations: II. Local Regularity, Infinite Products of Matrices and Fractals. SIAM Journal of Mathematical Analysis, Vol. 23, pp. 1031-1079, 1992. [DPJ98] Dumitrescu B., Popeea C., Jora B. Metode de calcul numeric matriceal Algoritmi fundamentali, Editura All Educational, Bucureti, Romnia, 1998. [FaSm84] McFadden P.D., Smith J.D. Vibration Monitoring of Rolling Element Bearings by the High-Frequency Resonance Technique. A Review., Tribology International, Vol. 17, No. 1, pp. 3-10, 1984. [FAG97a] FAG OEM & Handel AG Rolling Bearing Diagnosis with FAG Devices and Services, Technical Report Nr.WL 80-60 E, April 1997. [FAG97b] FAG OEM & Handel AG Rolling Bearings FAG Detector 2000, Technical Report Nr.WL 80-62 E, April 1997. [FiVa01] Figueras i Ventura R.M., Vandergheynst P. Matching Pursuit through Genetic Algorithms, Technical Report, Signal Processing Laboratory (LTS), cole Polytechnique Fdrale de Lausanne, Switzerland, 2001. http://ltspc4.epfl.ch/F/PAPERS/REPORTS/R-2001-5.pdf [FVF01] Figueras i Ventura R.M., Vandergheynst P., Frossard P. Evolutionary Multiresolution Matching Pursuit and its relations with the Human Visual System, Technical Report 01.04., Signal Processing Laboratory (LTS), cole Polytechnique Fdrale de Lausanne, Switzerland, April 2001. http://ltspc4.epfl.ch/F/PAPERS/REPORTS/R-2001-3.pdf [FVF02] Figueras i Ventura R.M., Vandergheynst P., Frossard P. Evolutionary Multiresolution Matching Pursuit and its relations with the Human Visual System, Proceedings of EUSIPCO 2002, Toulouse, France, Vol. II, pp. 395-398, September 2002. [GoI86] Gohberg I. Schr Methods in Operator Theory and Signal Processing, Birkhauser Verlag, Stuttgart, Germania, 1986. [GoDE90] Goldberg D.E. A Note on Boltzmann Tournament Selection for Genetic Algorithms and Population-oriented Simulated Annealing, Complex Systems, No. 4, pp. 445460, 1990. [HoJH75] Holland J.H. Adaptation in Natural and Artificial Systems, Prima ediie: University of Michigan Press, USA, 1975. Ediia a doua: The MIT Press, Cambridge, Massachusetts, USA, 1992. [IoSt05] Ionescu F., tefnoiu D. Intelligent and Allied Approaches to Hybrid Systems Modeling, chapter: Fuzzy-Statistical Reasoning in Faults Diagnosis, Steinbeis Press Edition (Editors: F. Ionescu, D. tefnoiu), Stuttgart/Berlin, Germany, December 2005. [IoV85] Ionescu V. Teoria Sistemelor. Sisteme Liniare., Editura Didactic i Pedagogic, Bucureti, Romnia, 1985. [KeEb95] Kennedy J., Eberhart R. Particle Swarm Optimization, IEEE International Conference on Neural Networks, Piscataway New Jersey, USA, pp. 1942-1948, 1995. [LaWM90] Lawton W.M. Tight Frames of Compactly Supported Wavelets, Journal of Mathematichal Physics, No. 31, pp. 1998-1901, 1990. [LePG88] Lemari P.G. Ondelettes localisation exponentielle, Journal des Mathmatiques Pures et Appliqus, No. 67, pp. 227-236, 1988. [LMS99] LMS International LMS Scalar Instruments Roadrunner. User Guide, LMS Scalar Instruments Printing House, Leuven, Belgium, 1999.
154

RAPORT DE CERCETARE [A AMCSIT.UPB-P5.117-2007.III/DS.JC.CP.AD-09.2009] <28-Sep-09>

[MaS89]

[MaZh93]

[MeY87] [MiM95] [NDS07]

[NiVo91] [PNS07]

[PrMa96]

[RaWh93] [RuNo95] [ScI17] [ShC48] [SoSt89] [StD95] [StD96]

[StCu09]

[SCS05] [StIo02]

Mallat S. A Theory for Multiresolution Signal Decomposition: the Wavelet Representation., IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. ll, No. 7, pp. 674-693, July 1989. Mallat S., Zhong S. Matching Pursuits with Time-Frequency Dictionaries, IEEE Transactions on Signal Processing, Vol. 41, No. 12, pp. 3397-3415, December 1993. Meyer Y. Les ondelettes, Pitman Res. Notes Math. Series, Vol. 155, pp. 158-171, 1987. Mitchell M. An Introduction to Genetic Algorithms, The MIT Press, Cambridge, Massachusetts, USA, 1995. Nitu C., Dumitracu A., tefnoiu D. Modele conceptuale i analitice ale sistemelor ecologice, Raport tehnic CNMP.UPB-P4.31050.I/CN.AD.DS12.2007, Universitatea Politehnica din Bucureti, Decembrie 2007. http://www.geocities.com/endeavour_DS/Projects Nix A.E., Vose M.D Modeling Genetic Algorithms with Markov Chains, Annals of Mathematics and Artificial Intelligence, No. 5, pp. 79-88, 1991. Petrescu C., Nicula O., tefnoiu D. Unitate mobil de achiziie, prelucrare, identificare i diagnoz de semnal Proiectarea interfeei numerice a unitii mobile, Raport tehnic AMCSIT.UPB-P5.117-2007.I/CP.ON.DS-12.2007, AMCSIT Politehnica & Universitatea Politehnica din Bucureti, Decembrie 2007. Proakis J.G., Manolakis D.G. Digital Signal Processing. Principles, Algorithms and Applications., third edition, Prentice Hall, Upper Saddle River, New Jersey, USA, 1996. Rawlins G., Whitley L.D Foundations of Genetic Algorithms, Morgan Kaufmann, USA, 1991 & 1993. Russel S.J., Norvig P. Artificial Intelligence A Modern Approach, Prentice Hall, Upper Saddle River, New Jersey, USA, 1995. Schr I. On Power Series which Are Bounded in the Interior of the Unit Circle, Reine Angewandte Mathematik Berlin, Vol. 147, pp. 205-232, 1917. Shannon C. A Mathematical Theory of Communication, Bell Systems Technical Journal, Vol. 27, pp. 379-423 & 623-656, 1948. Sderstrm T., Stoica P. System Identification, Prentice Hall, London, UK, 1989. tefnoiu D. Analiz de semnal prin metode de tip frecven-timp, Tez de doctorat, Universitatea Politehnica din Bucureti, Romnia, Aprilie 1995. tefnoiu D. Introducere n Prelucrarea Numeric a Semnalelor (note de curs), Centrul de multiplicare al Universitii Politehnica din Bucureti, Romnia, Februarie 1996. tefnoiu D., Culi J. PARMAX A Predictor for Distributed Time Series, Industrial Simulation Conference ISC-2009, Loughborough, U.K., A publication of EUROSIS-ETI (ISBN 978-90-77381-4-89), pp. 5-12, June 1-3, 2009 (ISI-Thomson and INSPEC referenced). tefnoiu D., Culi J., Stoica P. Fundamentele Modelrii i Identificrii Sistemelor, Editura Printech, Bucureti, Romnia, 2005. tefnoiu D., Ionescu F. Vibration Faults Classification by Fuzzy-Statistical Reasoning, Research Report AvH-FHKN-StIo0502, University of Applied Sciences in Konstanz (Dept. of Mechatronics) and Alexander von Humboldt Foundation, Konstanz, Germany, May 2002.
155

Algoritmi de identificare, predicie i diagnoz pe baz de semnale nestaionare

tefnoiu D., Ionescu F. Maximum Verisimilitude Frequency Averaging of Signals, IMACS-IEEE Multi-conference on Computational Engineering in Systems Applications, CESA 2003, Lille, France, pp. 271278, July 9-11, 2003. [StIo06] tefnoiu D., Ionescu F. Computational Intelligence in Fault Diagnosis, chapter: Fuzzy-statistical reasoning in fault diagnosis, Springer Verlag (editors: V. Palade, C.D. Bocnial, L. Jain), London, UK, 2006. [SPD08] tefnoiu D., Petrescu C., Dumitracu A. UMAPID Proiectarea, construcia i realizarea unitii mobile, Raport tehnic AMCSIT.UPB-P5.1172007.II/DS.CP.AD-10.2008, AMCSIT Politehnica & Universitatea Politehnica din Bucureti, Octombrie 2008. [SSCM09] tefnoiu D., Seraficeanu C., Culi J., Musc Gh. Identification of MIMOARMAX Models for Glycemia and Sodium Ions Tests, through Particle Swarm Optimization, accepted at the 7-th International IEEE Conference on Control and Automation, IEEE-ICCA'09, Christchurch, New Zealand, December 9-11, 2009 (ISI-Thomson referenced). [StSt07] tefnoiu D., Stnil O. Matematic i Prelucrare de Semnal Analiz timp-frecven-scal cu undine, Editura Printech, Bucureti, Romnia, 2007. [SSP09] tefnoiu D., Stnil O., Popescu D. Undine Teorie i aplicaii, sub tipar la Editura Academiei Romne, Bucureti, Romnia, 2009. [VaPP93] Vaidyanathan P.P. Multirate Systems and Filter Banks, Prentice Hall, S.P. Series (editor: A.V. Oppenheim), 1993. [WaFa93a] Wang W.J., McFadden P.D. Early Detection of Gear Failure by Vibration Analysis I. Calculation of the Time-Frequency Distribution, Mechanical Systems and Signal Processing, Vol. 7, No. 3, pp. 193-203, 1993. [WaFa93b] Wang W.J., McFadden P.D. Early Detection of Gear Failure by Vibration Analysis II. Interpretation of the Time-Frequency Distribution Using Image Processing Techniques, Mechanical Systems and Signal Processing, Vol. 7, No. 3, pp. 205-215, 1993. [WaFa95] Wang W.J., McFadden P.D. Application of Orthogonal Wavelets to Early Gear Damage Detection, Mechanical Systems and Signal Processing, Vol. 9, No. 5, pp. 497-507, 1995. [WaFa96] Wang W.J., McFadden P.D. Application of Wavelets to Gearbox Vibration Signals for Fault Detection, Journal of Sound and Vibration, Vol. 192, No. 5, pp. 927-939, 1996. [YaX91] Yao X. Optimization by Genetic Annealing, Proceedings of the second Australian Conference on Neural Networks, ACNN'91, Sydney, Australia, pp. 9497, 1991.

[StIo03]

156