Sunteți pe pagina 1din 14

Cap.

1 Introducere
Cap.1 Introducere
1.1. Scopul tezei de doctorat
Aceast tez de doctorat are ca scop studiul modalitilor de procesare a semnalelor
mono i bi-dimensionale, n vederea extragerii unor vectori de trsturi, care s poat
fi ulterior folosii n aplicaii de recunoatere a formelor. Semnalul vzut ca un suport
fizic de transmitere a informaiei poate proveni din diverse surse, astfel c putem
procesa diverse tipuri de semnale: semnale vocale, semnale imagistice, semnale
biomedicale, semnale prezise care modeleaz evoluia unui sistem, semnale muzicale,
semnale preluate din mediul nconjurtor cu diverse tipuri de senzori etc. Dat fiind
diversitatea tipurilor de semnale, modul integrator de abordare a metodelor de procesare
a semnalelor i fundamentul teoretic comun sunt abordate mai multe domenii:
analiza dinamicii sistemelor fuzzy cu bucl (feedback) construirea pattern-
urilor de evoluie a unui sistem economic, clasificarea comportamentului dup
duratele regimurilor tranzitorii i dup dinamica complex cu regimuri
oscilante sau haotice ale ieirii/ieirilor;
sisteme de asistarea deciziei folosite la diagnostic medical studiu de caz de:
detecie tumori n imaginile medicale scintigrafice,
analiza, procesarea i recunoaterea semnalului vocal construire de pattern-
uri complexe formate din coeficieni mel-cepstrali (MFCC), cepstrali liniar
predictivi (LPCC), coeficieni autoregresivi (AR), dezvoltarea unui instrument
de extragere a informaiei prozodice (frecven fundamental i formani).
1.2. Scurt stadiu actual. Contextul investigaiilor
Toate domeniile enunate sunt de interes la ora actual, existnd o cretere
important a metodelor i algoritmilor noi de lucru elaborate n ultimele dou decenii
att pentru sistemele care nglobeaz informaii incerte, ambigue descrise folosind ca
suport logica fuzzy, ct i pentru tehnicile de prelucrare, analiz a semnalelor
biomedicale n vederea elaborrii unor sisteme de asistare a deciziei sau de
monitorizare a pacientului i nu n ultimul rnd a tehnologiei vorbirii. Tehnologia
vorbirii vizeaz n special realizarea unei interfari mai eficiente ntre om i
calculator i de aici studiile efectuate pentru codarea semnalului vocal, recunoaterea
vorbirii, respectiv recunoaterea/identificarea vorbitorului, recunoaterea semanticii
(procesarea textului, a limbajului natural), identificarea limbii, sinteza automat a
vorbirii etc.
n cercetrile desfurate n domeniul tehnologiei vorbirii, s-au nregistrat primele
succese notabile la nceput n jurul anilor 60, 70 n analiza semnalului vocal prin
predicie liniar i analiz homomorfic, studii ce au stat la baza sintezei vocale.
Pentru sistemele de recunoatere a vorbirii s-au folosit iniial tehnici DTW (dynamic
8 Cap.1 Introducere
time warping) de comparare a cuvintelor izolate, acestea furniznd o msur a
similaritii a dou secvene de vorbire pronunate cu vitez diferit i ulterior modele
statistice Markov ce au permis apariia n jurul anilor 90 a primelor ASR (automatic
speech recognition).
Un astfel de sistem ASR consacrat este Sphinx i reprezint un grup de sisteme de
recunoatere a vorbirii dezvoltate de CMU-Carnegie Mellon University (Lee K.F.,
1989). Modelul iniial a fost dezvoltat de Kai-Fu Lee n 1986 pentru recunoatere de
vorbire continu, ca sistem de recunoatere independent de vorbitor i includea pe
lng HMM (Hidden Markov Models) i un model lingvistic de tip n-gram. Un model
mai performant Sphinx2 a fost dezvoltat de Xuedong Huang, actualmente existnd o a
patra variant a acestui software scris n limbajul Java, la care au participat i cei de
la MIT (Massachusetts Institute of Technology), Sun Microsystems Laboratories,
Mitsubishi Electric Research Labs (MERL) i Hewlett Packard (HP).
Ca unitate de msur a acurateei unui software de recunoatere se folosete WER
(word error rate), CMU raportnd n 2001 pentru Corpusul Brown (baza de date ce
conine cteva milioane de cuvinte) un procent de recunoatere de 80%, care conform
acelorai cercettori nu s-a schimbat semnificativ la ultimul studiu publicat de Google
pentru un corpus de un trilion de cuvinte (Fiscus et al., 2007). Alte exemple de
programe de recunoatere la fel de cunoscute ca i CMU-Sphinx sunt: Clap
Commander, Tatzi, e-Speaking, Sonic Extractor, etc.
Sistemul SUMIT dezvoltat de cercettorii de la MIT folosete grade de
incertitudine pentru segmentele cu scor sczut de recunoatere.
La noi n ar, studii incipiente n recunoaterea vorbirii sunt raportate nc
ncepnd cu (Nicolau ,1963). Cercetrile desfurate n domeniul tehnologiei vorbirii
sunt concentrate n jurul unor grupuri de cercetare din institute ale Academiei
Romne i instituii de nvmnt superior din Bucureti (Drgnescu, Burileanu C.,
1986), (Burileanu D.,2004), (Tufi 2007), (Vlsan, Gavt, 2002), din Iai (Teodorescu
et al., 1986), (Cristea, 2003), (Jitca et al., 2000, 2002), (Apopei, 2009), (Grigora,
2002). din Cluj-Napoca (Toderean et al. 2005, 2009), (Giurgiu, 1997), (Buza, 2010) i
din Timioara (Boldea, 2003) i sunt desfurate pe trei mari direcii: analiza i
sinteza de semnal vocal, procesarea limbajului natural i recunoaterea vorbirii.
Pentru recunoaterea vorbirii exist abordri cu DTW, HMM, reele neuronale i
metode fuzzy (Vlsan, 1999), dar toate studiile s-au fcut pentru recunoaterea
fonemelor sau a cuvintelor, pe seturi de date relativ mici, fr a se ncerca
recunoaterea vorbirii continue.
Algoritmii de recunoatere implementai de noi, pe baz de seturi de trsturi
MFCC i LPCC, folosesc etape de procesare a semnalului nglobate i de sistemele
ASR Sphinx, scopul cercetrilor efectuate fiind de a analiza relevana diverselor
pattern-uri n recunoaterea ctorva foneme izolate ale limbii romne. Studiul s-a
fcut pe o baz de date de nregistrri redus, de doar cteva sute de pronunii.
Pentru analiza valorilor i traseelor frecvenei fundamentale F
0
i a frecvenelor
formantice am implementat instrumente software nglobate n proiectul SRoL
Sunetele Limbii Romne. Proiectul SRoL a fost iniiat i este coordonat de prof. H.N.
Teodorescu i ofer gratuit pe web utilizatorilor o colecie de nregistrri bine
documentat (vocale, diftongi, consoane, propoziii i fraze cu ncrctur emoional,
voci patologice etc.), mpreun cu instrumente software de procesare a informaiei
vocalice (SRoL, 2006), (Feraru, Teodorescu, Zbancioc 2010).
Cap.1 Introducere 9
Estimarea frecvenei fundamentale reprezint o problem abordat foarte frecvent
n literatura de specialitate prin diverse metode. Datorit dinamicii nestaionare a
semnalului vocal i absenei unui suport matematic pentru a defini exact conceptul de
frecven fundamental i formant, problema rmne destul de complicat i
generatoare de noi abordri. Pentru modelarea melodiei semnalului vocal i sinteza
vorbirii o etap esenial o reprezint implementarea unor algoritmi hibrizi de
extragere a valorii lui F
0
, care s nglobeze att metode de analiz n domeniul timp,
ct i metode de analiz n domeniul spectral (Apopei, 2008).
Fa de alte abordri n care se folosete n analiz lui F
0
i a formanilor doar
informaia spectral, sau detecia punctelor de zero, minim i maxim (Buza 2010), sau
distribuia valorilor din histograma amplitudinilor spectrale (Grigora C., 2006),
instrumentele de analiz a informaiei prozodice propuse de noi (Teodorescu,
Zbancioc, 2008) folosesc mai multe metode de detecie, algoritmi de corecie a
erorilor i un modul decizional pentru a determina cu o acuratee mai mare valoarea
frecvenei fundamentale.
Pentru determinarea formanilor am propus o metod nou care extrage mai multe
spectre netezite (anvelope spectrale), realizeaz o concatenare folosind tehnici
fuzzy printr-un algoritm de data-fusion. Cutarea frecvenelor formantice se face
folosind intervale fuzzy i un nou algoritm de clusterizare de tip FCM (Fuzzy C-
Means) recurent propus de asemenea de noi (Zbancioc, Teodorescu, 2010).

Sistemele fuzzy au fost asociate cu tehnicile de Inteligen Artificial i de la
definirea logicii fuzzy n 1965 de Lotfi A Zadeh au cunoscut o continu dezvoltare n
special n sistemele de control. n Japonia din momentul n care cei de la firma
Hitachi au inclus sistemele fuzzy n controlul acceleraiei, frnrii i opririi trenurilor,
respectiv de la demonstraia stabilitii controlului fuzzy n experimentul pendulului
inversat n 1985, s-au adoptat aceste mecanisme de control n foarte multe aplicaii
de larg consum i industriale. Astfel dup apariia unor microcontrolere dedicate,
sistemele fuzzy au fost incluse n aparatele de uz/confort casnic (aspiratoare, maini
de splat, aparate de aer condiionat etc.), n sistemul de focalizare al aparatelor foto
Canon, n robotic, n aplicaiile de recunoatere a caracterelor i a scrisului de mn,
n controlul vocal al unor echipamente. Firmele din America i Europa au introdus
sistemele fuzzy n aplicaii de eficientizare a consumului motoarelor electrice, n
transmisiile auto, n aplicaii software de procesare a semnalelor i imaginilor, n
algoritmi de segmentare, n sistemele expert bazate pe logic fuzzy, n metodele de
clasificare nesupervizate de tip reele neuronale i algoritmi genetici adaptivi etc.
n aceste condiii introducerea unui sistem fuzzy generalizator (modelul
Teodorescu), care se poate aplica tuturor sistemelor fuzzy existente poate contribui
substanial la evoluia sistemelor fuzzy. Modelul de sistem fuzzy analizat are
coeficieni recureni asociai regulilor de inferen, coeficieni care exprim
ncrederea n reguli n funcie de rezultatele furnizate de acestea. Ieirea sistemului
pentru o configuraie dat a intrrilor nu mai trece printr-o singur stare, ci ia mai
multe valori pn coeficienii de ncredere se stabilizeaz. Acest mecanism adaptiv de
control al valorilor ieirii nu numai n funcie de intrri, dar i n funcie de valoarea
coeficienilor de ncredere recureni, permit o modelare a unor sisteme mai apropiat
de modelele reale. Dat fiind noutatea modelului, nu ne putem raporta la alte studii i
cercetri, s-au putut face doar comparaii cu abordri de sisteme fuzzy ce includ
10 Cap.1 Introducere
ntrzierile n aplicarea intrrilor sau cu sisteme cu recuren aplicat strict n calculul
valorilor ieirii, fr a putea controla execuia regulilor. Mecanismul de control al
regulilor prin intermediul coeficienilor de ncredere permite ponderarea cu valori
mici a regulilor ce au furnizat rezultate slabe i ponderarea cu valori mari a regulilor
ce au condus la obinerea de rezultate bune.

Sistemele de asistare a deciziei n medicin CDSS (clinical decision support
systems) sunt instrumente de analiz utile medicilor mai ales n investigaiile n care
se dorete eliminarea impreciziei/incertitudinii din diagnostic dat de expert. Sunt
instrumente des folosite atunci cnd se dorete extragerea automat a unor
caracteristici dintr-o secven de semnal de dimensiuni mari, care necesit un timp
mare pentru a fi analizat i n care un algoritm de segmentare poate extrage i
evidenia doar zonele de interes. De asemenea un astfel de instrument informatic
poate calcula cu precizie cantitatea informaiei segmentate (a zonelor de interes)
raportat la informaia total, fapt greu de realizat la o inspecie vizual. Calculatorul
a fost inclus ntr-o mare diversitate de echipamente medicale nu numai de
monitorizare, dar chiar i de achiziie. Un exemplu n acest sens este tomograful n
care pentru reconstrucia unui obiect pe baza unor seciuni este necesar un instrument
puternic de calcul capabil s rezolve mii, zeci de mii de ecuaii difereniale.
O mare parte din sistemele CDSS sunt sisteme bazate pe reguli care includ un
motor de inferene, unul din primele sisteme de acest tip fiind MYCIN, folosit la
identificarea bacteriilor ce cauzeaz infecii severe, sistemul avnd o baz de
cunotine de cteva sute de reguli n care medicul rspundea la un set de ntrebri cu
rspunsuri simple de tip da/nu. MYCIN este unul dintre primele sisteme expert care
nglobeaz coeficienii de certitudine n reguli n reprezentarea cunotinelor. Un alt
sistem implementat n jurul anilor 70 CADUCEUS poate oferi diagnostice la peste
1000 de maladii. Sistemele CDSS bazate pe reguli mai recente au evoluat foarte mult,
de exemplu DiagnosisPro poate oferi folosind teoria posibilitilor un diagnostic la
peste 11000 de boli.
Au fost incluse tehnici avansate de segmentare, respectiv metode de recunoatere
bazate pe reele neuronale (des ntlnite n literatur fiind reelele Bayesiene),
algoritmi genetici capabile s extrag dintr-o baz de date cu un numr foarte mare de
fiiere procesate i adnotate, pe cele care au un grad mare de similitudine cu un
semnal/imagine ce se dorete a fi analizat/diagnosticat. De exemplu RODIA
permite diagnoza imaginilor ortopedice achiziionate cu raze X sau ultrasunete, iar
VisualDx ofer acces la o baz de date cu peste 17000 de imagini care n prealabil au
fost adnotate de experi. Aplicaiile CDSS sunt utile i n procesul de nvare, medicii
mai puin experimentai avnd acces la informaia furnizate de specialitii ce au
documentat baza de date.
Cercetrile desfurate n ar, sunt legate de propunerea unor metode de analiz i
implementarea unor algoritmi de procesare a semnalelor biomedicale mono-
dimensionale: semnale EKG electrocardiografice, EMG electromiografice, EEG
encefalografice, dar i de procesarea imaginilor legate de colectivul d-nei prof. R.
Strungaru (Ungureanu, Strungaru , Pasca, 2005, 2006). Studii care s vizeze analiza i
prelucrarea imaginilor scintigrafice de tip SCECT i PET au mai fost realizate de
(Costin H. and Rotariu 2005, 2006, 2008).
Cap.1 Introducere 11
Reele neuro-fuzzy su fost utilizate pentru procesarea semnalelor biomedicale de
tip EKG, EMG, EEG i EP (poteniale evocate), pentru realizare unor modele
electrice ale miocardului n (Teodorescu, Arotriei, 1998).
Metodele de procesare a imaginilor scintigrafice au un grad mare de specificitate,
elaborarea algoritmilor realizndu-se innd cont de cerinele i observaiile
specialistului n funcie de zonele investigate i de particularitile acestora
(tefnescu et al., 2006), (Costin M. et al., 2006), (Zbancioc et al., 2004). n
algoritmii de procesare a imaginilor scintigrafice pe care i-am implementat pentru
identificarea zonelor cu disfuncii, s-au elaborat tehnici de segmentare cu prag fix i
cu prag adaptiv. Pentru a putea realiza comparaii cu alte scintigrafii n vederea
observrii evoluiei bolii i a stabilirii unui diagnostic i medicamentaiei, respectiv
pentru a realiza suprapuneri de imagini (sau regiuni din imagini) scintigrafice au fost
necesare estimarea unor axe de simetrie, respectiv calculul unor scoruri de potrivire,
algoritmii realizai pentru aceasta fiind proprii.
1.3. Clasele de probleme abordate n tez i instrumentele de lucru
Problemele principale abordate n tez sunt:
analiza dinamicii sistemelor fuzzy cu bucla (feedback)
modelarea i analiza sistemelor fuzzy recurente (model Teodorescu)
a) realizarea unui mecanism adaptiv de reprezentare a ncrederii expertului n
regulile sistemului (meta-cunotine), utiliznd coeficieni de certitudine
recureni
b) studiul comportamentului sistemelor fuzzy recurente (model Teodorescu) n
diverse logici necrisipiene;
c) gsirea unor aplicaii (algoritmi de clusterizare, modelare sisteme economice,
aplicaii medicale etc.).
sisteme de asistarea deciziei folosite la diagnostic medical
a) prelucrarea i analiza semnalelor biomedicale, caz particular scintigrafiile (imagini
ale medicinii nucleare) pulmonare, osoase i cerebrale SPECT;
b) determinarea automat prin aplicarea unor algoritmi de segmentare a zonelor cu
disfuncionaliti (ce includ i regiunile tumorale);
c) elaborarea unor tehnici de comparare a zonelor detectate n funcie de tipul de
imagine analizat (algoritmi specifici pentru imaginile cerebrale, respectiv osoase
sau pulmonare).
procesarea vorbirii focalizat pe cinci direcii principale:
a) elaborare algoritmi de prelucrare semnal vocal, n vederea mbuntirii calitii
acestuia (tehnici de filtrare i preaccentuare);
b) analiza semnalului vocal i extragerea de caracteristici semnificative folosite la
construcia unor pattern-uri;
c) recunoaterea automat a vorbirii i studiul influenei trsturilor n rata de
clasificare a fonemelor (secvene scurte din semnalul vocal, care au rolul de a
alctui i diferenia cuvintele ntre ele i formele gramaticale ale aceluiai cuvnt);
d) tehnici de segmentare a semnalului vocal pentru extragerea segmentelor vocalice i
eliminarea zonelor consonantice i a pauzelor ntre rostiri;
12 Cap.1 Introducere
e) extragerea informaiei prozodice ale semnalului vocal, prin detecia automat a
frecvenei fundamentale i a formanilor.

Instrumentele de lucru utilizate sunt: a) sistemele fuzzy pentru reprezentarea
cunotinelor furnizate de expert, cunotine ce includ informaii imprecise, cu un grad
mai mare sau mai mic de ambiguitate; b) transformatele spaiale care permit trecerea
din domeniul timp n domeniul frecvenelor DFT (discret Fourier transform) i
transformata cosinus DCT, transformata cepstral; c) metodele predictive LPC i
autoregresie, d) tehnici de segmentare pe baz de prag fix i prag optim; e) metode de
clasificare automat: reelele neuronale (MLP i RBF) i arborii de decizie.
Reelele neuronale sunt inspirate din funcionarea modelelor biologice i au pstrat
de la acestea o serie de proprieti cum ar fi: adaptabilitatea, gradul mare de
interconectivitate i paralelizare, capacitatea de auto-organizare etc. Pentru ca un
clasificator de tip reea neuronale cu antrenare supervizat s furnizeze o rat de
recunoatere bun pentru un anumit set de antrenare, este important modul n care au
fost definii i alei vectorii de trsturi. Analiza componentelor principale este un
instrument a crui aplicare precede antrenarea i favorizeaz nvarea i calitatea
aproximrii. Alegerea unor seturi de trsturi noi este un procesul empiric.
Identificarea unor parametri relevani n clasificare cere o munc laborioas ce
presupune reluarea procesului de antrenare a reelei pentru un numr ct mai variat de
vectori de trsturi (Dumitra, 1997), (Toderean, 1995).
Arborii de decizie au avantajul c pentru orice set de antrenare furnizeaz o soluie
sub form de reguli, iar aceste reguli pot fi uor introduse ntr-un sistem bazat pe
cunotine (SBC). Un astfel de instrument de analiz este capabil s extrag pattern-
urile eseniale din datele ce constituie setul de antrenare, trsturile care nu sunt
relevante pentru clasificarea datelor nefiind incluse n premisele regulilor generate.
Algoritmul ce st la baza arborilor de decizie C5 utilizai este ID3 propus de Ross
Quinlann, fiind un algoritm iterativ bazat pe calcul entropiei fiecrui atribut pe sub-
arbori generai.
Pentru evaluarea performanelor clasificatorilor am utilizat doar doi parametri mai
importani: rata de recunoatere (procentul de forme din setul de test recunoscut ca
aparinnd corect unei clase de ieire) i viteza de rspuns ce exprim gradul de
convergen al sistemului.
1.4. Structura lucrrii i principalele rezultate

n primul capitol se prezint contextul n care este plasat cercetarea care face
obiectul acestei lucrri, stadiul actual i contextul structural i temporal n care se
situeaz direciile de cercetare abordate n tez, se enun clasele de probleme
abordate i instrumentele de lucru cu care se opereaz problemele abordate. Se
prezint contribuii principale ale tezei pentru studiile i analizele efectuate n fiecare
capitol.
n capitolul al doilea se prezint un model de sisteme fuzzy cu recuren la nivelul
coeficienilor de ncredere asociai regulilor, propus de prof. H.N. Teodorescu, model
Cap.1 Introducere 13
care are avantajul extinderii complexitii modelelor clasice fuzzy. Modelul se poate
aplica oricrui sistem fuzzy existent. Ca mod de abordare este mai apropiat de modul
de gndire al omului, deoarece gradul de ncredere pe care l acord expertul unei
reguli a sistemului, variaz n funcie de rezultatele obinute n urma aplicrii acesteia.
Introducerea unei dependene iterative a ncrederii ntr-o regul n funcie de
rezultatul ieirii crete automat complexitatea modelului, fiind necesare optimizri ale
algoritmilor de calcul.
Contribuiile principale sunt legate de:
- implementarea unui instrument de modelare a sistemelor fuzzy recurente n dou
medii de programare FuzzyCLIPS i C++, cu posibilitatea alegerii de diveri
operatori logici fuzzy (and, or), conective aplicate ntre reguli, de diverse tipuri de
implicaii fuzzy, fapt ce situeaz modelul n alte logici necrisipiene,
- analiza n colaborare cu H.N. Teodorescu, asupra comportrii modelului pentru
sisteme Mamdani, Sugeno cu diverse tipuri de funcii de apartenen asociate
variabilelor de intrare i de ieire: triunghiulare, trapezoidale, gaussiene etc. i
diverse funcii recurente aplicate coeficienilor de ncredere,
- dezvoltarea unui algoritm propriu de clusterizare fuzzy c-means recurent, ce
permite o identificare mai bun a clusterelor din seturile de date aplicate la intrare.
Se rezolv astfel unul din dezavantajele algoritmilor de clusterizare legat de
necunoaterea apriori a numrului de clustere real, pentru a putea gsi o soluie
optim de grupare a datelor.

n capitolul al treilea sunt modelate i analizate sisteme fuzzy cu bucl n decizie.
Pentru modelare se alege un mediu microeconomic cu un numr redus de actori pe
pia, ntre care se stabilesc nite modaliti de relaionare ct mai apropiate de
modelul real. Astfel este stabilit o clas de strategii de modificare a preurilor de
vnzare, n care o firm studiaz evoluia pieei i i adapteaz reaciile n funcie de
competitori, n cazul n care acetia au un profit mai mare. Acest mod de relaionare
bazat pe invidie a fost denumit comp-benefit. O a doua clas de strategii const n a
nu studia beneficiile concurenei i n a-i stabili preul doar prin estimarea profitului
ce s-ar obine dac preul este meninut la aceiai valoare, sau este crescut sau sczut
i alegerea celei mai bune soluii. Clasa de strategii care urmrete doar maximizarea
beneficiului a fost denumit max-benefit. Pentru a face modelul ct mai realist au
fost introduse dou posibiliti de modificare a preului: una cu increment fix, i
cealalt cu increment variabil (adaptat situaiei curente de pe pia) i totodat s-a
presupus c o firm nu cunoate modificrile de pre ale competitorilor dect cu
anumite ntrzieri. ntrzierile mai mici reflect o strategie de marketing mai agresiv
n care o firm este direct interesat de evoluia preurilor pe pia.
Dup o extindere a modelului economic pentru a include un numr mare de firme
am introdus posibilitatea de grupare a firmelor cu definirea a dou strategii de
relaionare la nivel de grup. n primul tip de strategie firma central master impune
tuturor celorlalte firme (worker) preurile de vnzare. Decizia este luat la nivel global
i toate firmele acioneaz solidar, adoptnd acelai tip de strategie i de increment cu
firma central. n al doilea tip de strategie deciziile sunt luate la nivel local, de fiecare
firm, care i stabilete propria strategie n funcie de competitorii nvecinai. n acest
caz apartenena ntr-un grup ofer doar avantajul aflrii cu ntrzieri minime a
reaciilor concurenei.
14 Cap.1 Introducere
Modelele economice mari cu ordin de mrime de peste 100 de firme, necesit timpi
de rulare mari, motiv pentru care s-a realizat o distribuire a algoritmilor pe mai multe
procesoare (noduri de calcul) ntr-o reea GRID. Pentru realizarea acestei
paralelizri/distribuiri a algoritmilor am estimat complexitatea algoritmilor i am
studiat mai multe abordri, fiind aleas cea care a oferit timpii minimi de comunicare,
respectiv timpi minimi de calcul a beneficiilor i preurilor unei firme.
Prin perspectivele abordate aplicaiile realizate, pot fi vzute ca un suport de
asistare a deciziei manageriale.
Sistemele fuzzy cu feedback, cu ntrzieri aplicate intrrilor i strategii de
relaionare ntre sub-componentele sistemului, realizeaz pattern-uri cu semnale care
prezic evoluia sistemului, pattern-uri utile n alegerea tipului de strategie i n
monitorizarea efectelor posibile ale fluctuaiilor de preuri pe termen lung.
Modelul economic iniial a fost propus de prof. H.N. Teodorescu i dezvoltat
ulterior n colaborare pentru un numr extins de strategii, pentru un numr mare de
firme i n variant distribuit.
Contribuiile principale sunt legate de:
- implementarea modelelor n trei medii de programare diferite: ntr-un mediu de
programare bazat pe reguli dedicat Inteligenei Artificiale FuzzyCLIPS, ntr-un
limbaj procedural de nivel nalt C++ i varianta distribuit, cu diferenele ce apar la
trecerea de la un tip de programare la altul;
- analiza n colaborare a comportamentului dinamic neliniar al sistemelor fuzzy cu
bucl (feedback) prin clasificarea tipurilor de regimuri oscilante, a duratei
regimurilor tranzitorii etc. i stabilirea influenei tipului de strategie, a valorilor
ntrzierilor i a tipului de increment aplicat variabilei de intrare (pre) n dinamica
sistemului.

n capitolul al patrulea sunt prezentate metode de procesare a imaginilor
biomedicale scintigrafice. Sunt abordate trei tipuri de imagini scintigrafice: SPECT
cerebrale, pulmonare i osoase pentru fiecare dintre acestea realizndu-se algoritmi de
procesare a informaiilor specifici datelor problemei. Astfel pentru imaginile
scintigrafice SPECT cerebrale se dorete estimarea volumetric a zonelor
disfuncionale i detecia tumorilor cerebrale. Pentru identificarea tumorilor cerebrale
se aplic un algoritm de segmentare cu prag fix (valoarea de prag fiind stabilit de
specialist), iar pentru gsirea zonelor cu disfuncii se realizeaz o comparare a celor
dou emisfere cerebrale pentru fiecare seciune a setului transversal de imagini
SPECT, folosind un prag variabil. Pentru realizarea acestor comparaii este necesar
gsirea unei axe de simetrie. Pragul variabil este calculat printr-un sistem fuzzy
Sugeno cu o intrare i o ieire. Metoda propune i utilizarea matricei de co-ocuren
pentru semnalarea zonelor asimetrice.
Pentru scintigrafiile pulmonare preluate de la pacieni diagnosticai cu TBC se
dorete o detecie a zonelor tumorale i compararea a dou scintigrafii pulmonare
pentru preluate de la acelai pacient la momente diferite de timp. Dificultile
extragerii/segmentrii zonei de interes sunt legate de fixarea agentului chimic (a
radiotrasorului) i n organele interne i esuturile alturate plmnilor i n stabilirea
unei valori de prag. Datorit caracteristicilor specifice a histogramei pentru acest tip
de scintigrafii, am propus un algoritm iterativ de calcul a valorii de prag optime.
Pentru realizarea comparaiei este necesar o suprapunere ct mai bun a celor dou
Cap.1 Introducere 15
scintigrafii. n acest scop se extrage axa de simetrie, folosind metoda regresiei liniare,
pe baza zonei de fixare a glandei tiroide situat n regiunea gtului (zon care respect
restricia de simetrie stnga, dreapta).
Scintigrafiile planare osoase sunt culese n plan anterior i posterior i
determinarea zonelor patologice cu fixare anormal care indic posibile metastaze
osoase se face prin suprapunerea informaiei din cele dou imagini scintigrafice
culese n plan anterior i posterior. Am folosit funcia de autocorelaie
bidimensional, care furnizeaz deplasamentul ce trebuie aplicat pe linie i pe coloan
pentru obinerea celei mai bune suprapuneri. Metoda de segmentare care calculeaz
procentul zonelor cu fixare, raportat la ntreaga suprafa osoas determin valoarea
de prag pe baza distribuiei normale a histogramei (n funcie de valoarea dispersiei).
Dificil de realizat este detecia zonelor simetrice din schelet (brae, antebrae,
picioare, coaste) i compararea informaiei din partea stng cu cea din partea dreapt
pentru a observa dac zonele cu fixare anormal sunt sau nu existente n ambele pri.
Zonele asimetrice ar ntri presupunerea c zona respectiv corespunde unei
metastaze osoase. Pentru extragerea axelor de simetrie, imaginea este preprocesat,
pentru a extrage o anvelop (efect de netezire) a semnalului analizat. Metoda de
extragere a anvelopei semnalului folosit pentru o detecie mai bun a valorilor de
maxim local corespunztoare oaselor, este una folosit la extragerea valorilor
formantice din semnalele vocale numit metoda spectrului netezit.
Cercetrile au fost desfurate n colaborare cu dr. Cipriana tefnescu i CS II
dr.ing. Mihaela Costin.
Contribuiile principale sunt legate de:
- elaborarea n colaborare a unor metode specifice de segmentare tipului de imagine
scintigrafic procesat i anume segmentare cu prag variabil fuzzy pentru imaginile
scintigrafice cerebrale, folosirea unui algoritm iterativ pentru determinarea valorii
optime de prag i o variant de segmentare folosind transformata DWT aplicat de
un numr de N=3 ori consecutiv pentru scintigrafiile pulmonare; respectiv calculul
valorii de prag pe baza distribuiei normale a valorilor de gri din histogramei
pentru scintigrafiile planare osoase;
- implementarea software a aplicaiilor DSS pentru imagini medicale;
- proiectarea n colaborare a unui algoritm pentru determinarea a axelor de simetrie
prin metode specifice tipului de imagine, folosind metoda regresiei liniare pentru
imaginile scintigrafice cerebrale i pulmonare, respectiv folosind o tehnic de
netezire (extragere a anvelopei semnalului) pentru scintigrafiile osoase;

n capitolul al cincilea am studiat relevana diverselor tipuri de vectori de trsturi
n procesul de recunoatere a unor foneme ale limbii romne. Ca prim aplicaie sunt
extrase energiile spectrale din a N=16 benzi de frecven mel (MFSC) i se analizeaz
importan informaiei din fiecare band n identificarea vocalelor {a,e,i,o,u} ale
limbii romne. Toate metodele dezvoltate realizeaz o preaccentuare a semnalului i o
ponderare a informaiei din fereastra de analiz cu o fereastr Hamming. Metoda de
extragere a coeficienilor MFCC, folosete transformata cosinus discret pe vectorul
cu energiile spectrale mel (MFSC). Am propus alternativ i o metod de calcul a
energiilor mel cepstrale bazat pe intervale fuzzy de delimitare a benzilor mel. Sunt
calculai i coeficienii derivativi de ordin 1 MFCC i de ordin 2 MFCC, vectorii
16 Cap.1 Introducere
de trsturi fiind introdui n clasificatori de tip reea neuronal MLP pentru
recunoaterea consoanelor {b,p,c,g,t,d}.
Algoritmul de extragere de coeficieni liniar predictivi LPCC, folosete metoda
Levinson-Durbin aplicat vectorului de autocorelaie i o metod de conversie a
coeficienilor LPC n coeficieni cepstrali LPCC i coeficieni PARCOR. Se includ n
vectorii de trsturi i semnalele LPCC i LPCC i se determin rata de
recunoatere a unor foneme consonantice {p,d,t,c,g,v,f,z,,s,} pentru diverse pattern-
uri.
Algoritmul de extragere de coeficieni autoregresivi folosete metodele Burg i
FCM (Fast Modified Covariance bazat pe ecuaiile Yule-Walker) pentru extragere
trsturi dintr-un spectru nedistorsionat din punct de vedere al modificrii fazei.
Distorsiunea de faz nul (zero-phase transfer functions) se aplic prin dou operaii
de dubl oglindire (inversare stnga-dreapta a valorilor) dup realizarea aplicrii unor
filtre trece band. Frecvenele de tiere a celor N=6 benzi se determin prin
aproximarea semnalului sum a amplitudinilor spectrale cu segmente de dreapt dup
o eroare global maxim stabilit, respectiv alternativ prin stabilirea a N=6 benzi de
frecvene mel. Am studiat importana informaiei coeficienilor autoregresivi de pe
fiecare band n recunoatere a fonemelor nevocalice. Clasificatorii folosii sunt
arbori de decizie C5 i reele neuronale MLP i RBF.
Deoarece baza de nregistrri pe care s-au fcut simulrile este relativ mic, de
doar cteva 200-300 nregistrri provenite de la un numr de 5-10 vorbitori,
rezultatele obinute n clasificare au folosit doar la stabilirea relevanei diverselor
tipuri de pattern-uri n procesul de recunoatere. Este destul de probabil c la
aplicarea metodelor pe seturi mari de date, ca valorile obinute la recunoatere s se
modifice, chiar s scad. O posibil direcie viitoare o constituie adaptarea metodelor
prezentate n acest capitol pentru recunoaterea de vorbirii continu folosind lanuri
Markov ascunse.
Cercetrile au fost realizate n colaborare cu CS II dr. ing. Mihaela Costin.
Contribuiile principale sunt legate de:
- elaborarea n colaborare a metodelor de extragere coeficieni MFCC, LPCC i
coeficieni autoregresivi;
- implementarea aplicaiilor software de extragere vectori trsturi din semnalul
vocal;
- studiul n colaborare a relevanei vectorilor de trsturi n recunoaterea unor seturi
de foneme ale limbii romne.

n capitolul al aselea am prezentat instrumentele de analiz a informaiilor
prozodice. Melodia rostirii (prozodia) reprezint o informaie paralingvistic ce poate
fi corelat cu starea emoional a vorbitorului, cu modul de accentuare a unei silabe
pentru a oferi alt sens semantic unui cuvnt, sau accentuarea unui cuvnt/grup de
cuvinte pentru a schimba tipul unei propoziii (interogativ, exclamativ etc.). Valorile
frecvenei fundamentale i a formanilor sunt des ntlnite n vectorii de trsturi
folosii n aplicaiile de recunoatere a vorbitorului sau a vorbirii.
Algoritmul implementat utilizeaz o metod hibrid de extragere a fundamentalei
bazat pe patru metode clasice: metoda autocorelaiei, metoda diferenelor AMDF,
metoda cepstral i metoda produsului spectrelor armonice HPS. Dup aplicarea unor
metode de corecie a valorilor de ieire furnizate de fiecare extractor de F
0
, valoarea
Cap.1 Introducere 17
final este dat de un bloc decizional neuro-fuzzy. Ponderile asociate fiecrei metode
de detecie a fundamentalei sunt stabilite n funcie de performanele extractorilor,
astfel nct unei metode cu erori mici de detecie i se va asocia o valoare de ponderare
mare, iar o metod cu probabilitate mai mare de a furniza informaii eronate va avea o
contribuie mai mic asupra rezultatului final al ieirii.
Detecia formanilor se realizeaz pe baza anvelopei spectrale a semnalului.
Pornind de la observaia ca metoda spectrului netezit furnizeaz pentru anumii
parametri de rulare anvelope spectrale din care se pot extrage mai uor formanii
inferiori, respectiv formanii superiori am propus un algoritm de data fusion bazat pe
tenici de concatenare fuzzy. Din nfurtoarea semnalului astfel obinut am realizat
cutarea frecvenelor formantice folosind benzi de cutare adaptate valorii lui F
0
i
algoritmul de clusterizare FCM recurent. Am comparat performanele sistemului cu
alte instrumente de analiz similare gsite pe web: Praat, Wasp, Klatt, Goldwave.
Instrumentele sunt disponibile on-line pe site-ul SRoL i au fost nregistrate la
ORDA - Oficiul Romn al Drepturilor de Autor (ANALIV,ORDA
11959/06.05.2010),
Proiectarea sistemului hibrid de extragere a frecvenei fundamentale a fost realizat
sub ndrumarea i n colaborare cu prof. H.N. Teodorescu.
Contribuiile principale din cadrul acestui capitol sunt legate de:
- dezvoltarea unor instrumente software de analiz a informaiilor prozodice dintr-un
semnal vocal;
- implementarea n colaborare a unui algoritm hibrid neuro-fuzzy de detecie a
frecvenei fundamentalei bazat pe mai multe metode ponderate ntr-un bloc
decizional;
- propunerea unei metode proprii de extragere a formanilor folosind tehnici de
procesare a semnalului cepstral (metoda spectrului netezit) i algoritmi de data-
fusion bazate pe tehnici de concatenare fuzzy.

n ultimul capitol, de concluzii, sunt enumerate contribuiile i modul de
valorificare a rezultatelor cercetrilor prin lucrrile publicate n reviste, precum i
articolele prezentate la conferine i simpozioane naionale i internaionale,
rapoartele i contractele de cercetare ce au sprijinit munca de cercetare.
Bibliografie capitol
Apopei V. (2009), Analiza i sinteza prozodic a semnalului vocal, Ed. Performantica, ISBN
978-973-730-632-6, 182 pages, 2009.
Bhiksha Raj, Lorenzo Turicchia, 2 Bent Schmidt-Nielsen, and Rahul Sarpeshkar (2007) An
FFT-Based Companding Front End for Noise-Robust Automatic Speech Recognition,
Hindawi Publishing Corporation, EURASIP Journal on Audio, Speech, and Music
Processing, Volume 2007, Article ID 65420, 13 pages.
Boldea M (2003). - Contribuii la recunoaterea automat a vorbirii continue n limba romn,
Teza de doctorat, Timioara, 2003.
Burileanu C. (1986), Caracterizarea unui vocabular limitat de cuvinte pronunate izolat n
vederea recunoaterii automate. n M. Drgnescu i C. Burileanu (editori),Analiza i
sinteza semnalului vocal, pag. 36-131. Editura Academiei Romne, Bucureti, 1986.
18 Cap.1 Introducere
Burileanu D., Dervis A. (2004), Modeling the Fundamental Frequency Contour for Text-to-
Speech Synthesis, in Romanian, Proceedings of the International Conference
Communications 2004, Bucharest, Vol. 1, pp. 189-192, 2004.
Buza O.(2010) Contribuii la analiza i sinteza vorbirii din text pentru limba romn, Teza de
doctorat, Cluj Napoca, 2010.
Costin H., Cr. Rotariu (2008), PET and CT Images Registration by means of Soft Computing
and Information Fusion, in New Aspects of Biomedical Electronics and Biomedical
Informatics, C. Long et al. (eds.) (Proc. of the Int. Conf. Biomedical Electronics and
Biomedical Informatics-BEBI'08), pp. 150-161, Greece, Aug. 2008.
Costin H., Cr. Rotariu (2006), Fuzzy segmentation system for medical imaging using
information hybridization, Proc. of ECIT2006, European Conference on Intelligent
Technologies, Iai, Romania, 2006.
Costin H., Cr. Rotariu (2005), Image-understanding-based system for visual information
representation using fuzzy logic, Fuzzy Systems and A.I.-Reports and Letters, Romanian
Academy, Vol. 10, Nos.1-2, pp. 89-104, 2005.
Costin M., C. Stefanescu, D. Galea, M. Zbancioc (2005), Image Processing in Pulmonary
Disease Diagnosis, IEEE SOFA 2005, IEEE International Workshop on Soft Computing
Applications, 27-30 August, 2005, Szeged-Hungary i Arad-Romnia, pp. 231-236, ISBN
963-219-001-7
Cristea D. (2003): The relationship between discourse structure and referentiality in Veins
Theory, in Wolfgang Mentzel and Cristina Vertan (eds.) Natural Language processing
between Linguistic Inquiry and System Engineering, pag.9-22, Editura Universitii
Al.I.Cuza Iai, iulie 2003.
Drgnescu M. (1986), Tehnologia vorbirii. n M. Drgnescu i C. Burileanu (editori),
Analiza i sinteza semnalului vocal, pag. 9-16. Editura Academiei Romne, Bucureti, 1986.
Dumitra A. (1997): Proiectarea reelelor neuronale artificiale, Casa Editorial Odeon,
Bucureti, ISBN 973-9008-75-5, 371 pages, 1997.
Feraru M., Teodorescu H.N, Zbancioc M. (2010),SRoL -Web-based Resources for Languages
and Language Technology e-Learning, Int. J. of Computers, Communications & Control -
IJCCC, ISSN 1841-9836, E-ISSN 1841-9844, Vol. V (2010), No. 3, pp. 301-313, (ISI
impact factor=0.373)
Fiscus Jonathan G., Jerome Ajot, John S. Garofolo (2007), The Rich Transcription 2007
Meeting Recognition Evaluation, Multimodal Technologies for Perception of Humans:
International Evaluation Workshops CLEAR 2007 and RT 2007, Baltimore, MD, USA,
May 8-11, pp: 373 - 389, 2007
Giurgiu M (1997), Results on Automatic Speech Recognition in Romanian. In D. Tufi i P.
Andersen (editori), Recent Advances in Romanian Language Technology, pag. 178-187.
Editura Academiei Romne, Bucureti, 1997.
Grigoras Catalin (2006), Forensic Voice Analysis Based on Long Term Formant Distributions,
4
th
European Academy of Forensic Sciences, june 2006.
Grigoras Fl. (2002), Metode Soft-Computing n analiza i sinteza vocal, Ed. Artes, 2002, Iai.
Guinness J., B. Raj, B. Schmidt-Nielsen, L. Turicchia, and R. Sarpeshkar (2005), A
companding front end for noise-robust automatic speech recognition, in Proceedings of
IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 05),
vol. 1, pp. 249252, Philadelphia, Pa, USA, March 2005.
Jitc D., Teodorescu H.N., Apopei V., Grigora Fl., (2002), Improved Speech Synthesis Using
Fuzzy Methods, Speech Technology Journal, 5, pp. 227-235, Kluwer Academic Publishers,
2002.
Jitc D., Apopei V., Teodorescu H. N., Grigora Fl., (2000), Soft computing based speech
analysis and synthesis for the Romanian language, Memoriile Seciilor tiinifice ale
Academiei Romne, Vol. 23, pp.203-230, 2000.
Cap.1 Introducere 19
Lee K.F.(1989), Automatic Speech Recognition; The Development of SPHINX System,
Kluwer Academic Publisher, Boston, 1989.
Lee Y. W., S. Y. Kwon, Y. S. Ji, et al. (2005), Speech enhancement in noise environment using
companding strategy, in Proceedings of the 5th Asia Pacic Symposium on Cochlear
Implant and Related Sciences (APSCI 05), Hong Kong, November 2005.
Nicolau E., I. Weber i t. Gav. (1963), Aparat pentru recunoaterea automat a vocalelor.
Automatica i Electronica, (6), 1963.
(SRoL, 2006), Teodorescu, H.N., Feraru, M., Pistol L., Zbancioc, M. i alii, SRoL Proiectul
Sunetele Limbii Romne (Voiced Sounds of Romanian Language Project), 2005.
[http://www.etc.tuiasi.ro/sibm/romanian_spoken_language/ro/instrumente.htm]
tefnescu C., M. Costin, M. Zbancioc (2006), Image Pre-processing automatic systems for
bone-scan metastasis evaluation, Revista Medico-Chirurgicala A Societatii de Medici i
Naturalisti din Iasi, (RMC-SMN) , Vol. 110 / 2006, Nr. 1, pag. 178-186, (indexed on
Internet, in PubMed), 2006.
Teodorescu H.N., Arotriei D.(1998), Aplicaii Neuro-fuzzy n Bioinginerie, BIT Publishing
House, 204 pages, 1998
Teodorescu H.N., L. Buchholtzer i C. Poa.(1986) Comunicarea oral om-main. Editura
Tehnic, Bucureti, 1986.
Teodorescu H.N., Zbancioc M. (2008), Hybride Analysis Methods for Paralinguistic
Informations, a IX-a Conferinta Nationala de Inginerie Biomedicala INGIMED2008,
Bucureti, Romnia, 13 noiembrie 2008.
Toderean G., Buza O., Bodo A. Zs. (2009), Metode de Sintez a Vorbirii, Editura Risoprint
Cluj-Napoca, ISBN 978-973-53-0114-9, 2009.
Toderean G., Cruntu A. (2005), Metode de recunoatere a vorbirii, ISBN 973-656-832-6,
2005, ed.2., 2009, 127 pagini Editura Risoprint Cluj-Napoca, 2005.
Toderean G., M. Coteiu, M. Giurgiu (1994): Reele neuronale, Editura Microinformatica,
Cluj-Napoca, ISBN 973-9171-01-x, 1994, ed. 2-a, 244 pages, 1995
Tufi D., Ion R. (2007): Parallel Corpora, Alignment Technologies and Further Prospects in
Multilingual Resources and Technology Infrastructure, Proc. of the 4th Conference on
Speech Technology and Human Computer Dialogue SpeD 2007, Iai, Romnia, May 10-
12, pp. 183-194, 2007.
Ungureanu M., Strungaru R., Pasca S., Stanciu R., Datcu M.(2005) - Content-Based Image
Retrieval in Medical Image Databases, ECAI 2005 - International Conference - First
Edition, Electronics, Computers and Artificial Intelligence, 1-2 July, 2005, Pitesti, Romania.
Ungureanu G.M., Strungaru R., Cososchi St. and Ungureanu Al. (2006) - Independent
Component Analysis Applied in Motor Imagery, in: A. Reichert, G. Mihalas, L. Stoicu-
Tivadar, St. Schulz, R. Engelbrecht - Integrating Biomedical Information: from e-Cell to e-
Patient, Proceedings of the European Federation for Medical Informatics - Special Topic
Conference, April 6-8, 2006, Timisoara, Romania, IOS Press, 2006, pp. 233-235, ISBN 973-
625-303-1 (Ed. Politehnica)
Vlsan Z., I. Gavt, et.al. (2002), Statistical and Hybrid Methods for Speech Recognition in
Romanian. International Journal of Speech Technology, No. 5, pp. 259-68, 2002.
Zbancioc M., Costin Mihaela, tefnescu Cipriana (2004), Image Pre-Processing for a
Medical Aide-Decision System in Bone Scintigraphy, vol. Intelligent Systems in Medicine,
H.N. Teodorescu editor, pp. 101, 114, Ed. Performantica, Iai, 2004, ISBN 973-7994-82-5 i
pe CD Third European Conference on Intelligent Systems and Technologies ECIT'2004,
21 - 23 July 2004, Iai, Romania, ECIT, 2004.
Zbancioc M., H.-N. Teodorescu, (2010) Fuzzy methods for automatic extraction of speech
formants, The 3
rd
International conference on Telecommunication, Electronics and
Informatics - ICTEI2010, May 20-23, Chinu, Republica Moldova, Proceedings Volume
II, ISBN 978-9975-45-136-9, pp.57-62, 2010.
20 Cap.1 Introducere
Zica Vlsan (1999), Metode conexioniste i statistice de recunoatere a vorbirii i a
vorbitorului, tez de docotrat, 1999.

S-ar putea să vă placă și