Sunteți pe pagina 1din 73

1.

Introduce

Cancerul reprezintă una dintre cele mai răspândite boli la nivel international,
preconizându-se ca pana în anul 2030 vor exista peste 23.6 milioane de cazuri
depistate în fiecare an. Cele mai răspândite și frecvente tipuri de cancer care apar în
toată lumea sunt : cancerul pulmonar, cancerul de sân, cancerul de prostată și
cancerul de intestin. Patru din zece cazuri depistate fac parte din categoriile
menționate anterior.
Potrivit celor mai recente studii publicate, se estimează ca aproape jumătate din
persoanele de sex masculin de pe glob și aproape o treime din persoanele de sex
feminin se vor confrunta la un moment dat cu un diagnostic sumbru : cancerul. Cu
toate că această previziune face referire la toate tipurile de cancer, nu doar la cazurile
de cancer mamar, tot este un motiv de îngrijorare și o motivație continuă pentru
căutarea unui tratament. Astfel literatura științifică privind patogeneza cancerului
mamar a crescut într-un mod exploziv în ultimele decenii datorită impactului pe care
această maladie l-a avut asupra omenirii. Atât de multe informații ar părea un motiv
de bucurie, dar în realitate cantitatea mare de materiale nu conduce neapărat la
constatări uimitoare.
Din puncte de vedere al diferențierii intre cazurile depistate la persoane de sex
feminin fata de persoanele de sex masculin, cancerul de sân reprezintă cea mai
întâlnită formă de cancer și a 5a cauză de deces în rândul femeilor. Cu toate că
această maladie este considerată a fi specifică persoanelor de sex feminin, s-a
observat că poate apărea și la bărbați. Bineînțeles numărul bărbaților diagnosticați
este cu mult mai mic decât numărul femeilor identificate cu această maladie. Această
afecțiune este de până la 100 de ori mai întâlnită la femei decât la bărbați, cancerul
mamar la bărbați fiind destul de rar, identificându-se la aproape 1% dintre cazuri, în
majoritatea situațiilor fiind diagnosticați bărbați de peste 60 de ani.
Tocmai din acest motiv s-a creat necesitatea implicării din ce în ce mai directe în
cercetări pentru a găsii o soluție, un tratament care să aibă o rată mai mare de succes
în extirparea maladiei. Ratele de supraviețuire în cazul cancerului mamar sunt foarte
variate la nivel mondial, dar în ultimul timp s-a observat o îmbunătățire din punct de
vedere al pacienților care au reușit să supraviețuiască odată ce au fost diagnosticați
cu această boala. Până în prezent, progresul tehnologic nu a fost înregistrat în
depistarea cauzelor ce determină apariția bolii, ci in găsirea unor mijloace prin care
să se îmbunătățească rata de succes în eradicarea acesteia.
Deoarece se consideră ca informația despre maladia oncologică este prea diversă și
dispersată pentru a putea fi analizată în cadrul unei singure științe, este dificil sa
conceptualizăm cercetarea cancerului mamar ca un singur corp coerent al și nu ca o
segmentare a analizei și a descoperirilor ce sunt legate doar de o relație vagă .Deși
principiile de bază ale acestei patologi sunt în prezent destul de clare, detalii critice
și importante continuă să ne ia prin surprindere. Acest lucru explică de ce cercetarea
cancerului modern se afla încă în interesul oamenilor de știință și mai ales de ce
descoperiri utile sunt raportate atât de des.
Progresele ce au fost înregistrate în tratarea cancerului se datorează faptului că acum
medicii dispun de aparaturi și tehnologii performante ce fac posibilă detectarea bolii
în stadii incipiente și astfel strategiile de tratament pot fi îmbunătățite, obţinându-se
un rezultat cat mai favorabil. În numeroase țări, în care există asistență medicală
avansată, rata de supraviețuire de mai mult de 5 ani din momentul diagnosticului, în
cazul depistării cancerului în stadiul incipient, este de 80%-90%, scăzând până la
24% în cazul depistării bolii într-un stadiu mult mai avansat.
Cu toate acestea, există întrebări majore care încă nu au nici un răspuns, sau la care
nu se poate răspunde într-un mod satisfăcător. Este un fapt recunoscut că nu este
înțeles modul în care celulele canceroase creează metastazele ce sunt responsabile
pentru 90% din mortalitatea asociată cancerului. De asemenea, înțelegem destul de
puțin despre rolul sistemului imunitar în prevenirea dezvoltării cancerului.
Cunoștințele și cele mai bune practici în acest domeniu se schimbă în mod constant,
deoarece sunt înregistrate progrese tehnologice din ce în ce mai des. Tocmai datorită
faptului că înțelegerea noastră referitoare la domeniul medical se extinde și se
actualizează în permanență, nu doar de rezultatul cercetărilor conduse în această
sferă ci și de propria experiență acumulată prin experimente, studiu și rezultate,
trebuie luat în considerare un fapt foarte important : schimbările constante în
metodele de cercetare, în practicile profesionale sau în cele medicale și în strategia
de tratament sunt absolut necesare. Cercetătorii si practicanții trebuie să se bazeze
mereu pe propriile lor cunoștințe în evaluarea unui diagnostic și pe utilizarea oricăror
informații, metode sau resurse disponibile, dar în același timp nu trebuie sa fie
reticenți la implicarea progreselor tehnologice în oferirea unui diagnostic.
Diagnosticul oferit de un medic sau de o persoană pregătită din punct de vedere
profesional nu poate fi înlocuit sub nici o formă de diagnosticul oferit de o aplicație,
adică de un dispozitiv special creat și acesta nu este sub nici o formă obiectivul
cercetărilor în domeniu. Scopul vizat este să se ajungă în situația în care sistemele
tehnologice reprezintă un adjuvant în luarea unei decizii, în depistarea unei boli, în
oferirea unui tratament, etc. Caracterul decizional uman nu poate fi substituit sub
nicio formă, dar poate fi oricând susținut prin algoritmi matematici, exacți care
depășesc cu mult puterea de calcul și precizia umană.
În ultimele decenii omenirea a văzut influența tehnologiei informației asupra
domeniului asistenței medicale și medicinei în general. S-a putut observa foarte clar
faptul că imaginile biomedicale reprezintă esența acestei arii deoarece aproape
fiecare diagnostic, fiecare analiză poate avea un suport grafic, o anumită imagine ce
prezintă detalii importante pentru cazul respectiv. Aceste tipuri de reprezentări
digitale ale corpului uman joacă un rol foarte important în încercarea noastră de a
înțelege natura sistemelor biologice umane. Este un fapt deja foarte cunoscut că

2
imaginile, de orice tip, sunt o sursă enormă de informații și tocmai datorită acestui
fapt, acestea trebuie analizate pe deplin pentru a cunoaște cât mai bine sistemul
biologic uman pentru ca eventual să se ofere un diagnostic cât mai precis.
Pentru o mai bună înțelegere a impactului și riscul cancerului mamar, trebuie
evidențiată o clasificare utilizată și recunoscută la nivel internațional ce are rolul de
a transforma limbajul imagistic al reprezentării digitale a imaginilor biomedicale,
definind termenii descriși, definițiile statistice într-un limbaj universal ce poate fi
înțeles de o gamă mai largă de oameni și care simultan poate oferi recomandări
pentru rapoarte radiologice și pentru sistemul de arhivare al datelor. Aceasta schemă
poartă numele de BI-RADS (Breast Imaging and Reporting Data System) și s-a
dovedit a fi un instrument util pentru comunicarea între medicii de diferite specialități
și cercetător, în ciuda limitelor sale. Este foarte important să se evidențieze faptul ca
BI-RADS nu poate înlocui experiența personală, cunoașterea literaturii si materialelor
de specialitate și educație medicală continua. Cunoașterea elementelor de bază este
necesară pentru toți medicii specializați în cancerul mamar și care lucrează cu
screening-ul cancerului de sân. Schema BI-RADS clasifică evoluția cancerul mamar
pe baza rezultatelor și caracteristicilor identificate din mamografii, într-un număr mic
de categorii bine definite, utilizate ulterior pentru a prescrie un tratament, pentru a
construi o strategie de diagnostic, etc.
Pentru a putea fi încadrată într-o clasă BI-RADS patologia trebuie să fie caracterizată
prin următoarele informații: prezența maselor sau a calcificărilor, clasificarea fie a
maselor după formă, contur și structură, fie a calcificărilor după tip, formă, distribuire
și alte proprietăți specifice. Aceste trăsături nu sunt observate doar pe baza unei
mamografii, ci pot fi necesare și alte tipuri de analize detaliate. Este foarte important
de subliniat că BI-RADS se aplică doar în cazul cancerului de sân și nu este singura
metodă disponibilă de clasificare a acestei maladii, dar este metoda aleasă pentru
cercetarea studiului de caz prezentat în această lucrare.
Detectarea și evaluarea caracteristicilor pentru o leziune determinată de apariția
cancerului mamar este posibilă în zilele noastre datorită aplicațiilor software special
concepute pentru a face o corelație între mamografiile reprezentate printr-o imagine
digitală și simptomele și caracteristicile medicale dominante pentru cazul medical
respectiv. Particularitățile CAD (computer aided design) sunt folosite atât pentru
extragerea și cuantificarea informațiilor necesare cât și pentru memorarea valorilor
numerice ale specificațiilor relevante, valori numerice ce sunt organizate in baze de
date fiabile. S-a observat foarte clar faptul că medicii stabilesc existența patologiei
mamare (sau existența oricărei maladii) pe baza experienței profesionale sau pe baza
cunoștințelor anterioare, tehnicile inteligente fiind singurele suficient de puternice
pentru a emula alegerea expertului. Din cauza comportamentului optim observat în
majoritatea situațiilor în prezența zgomotului, a perturbațiilor și a altor factori ce pot
determina apariția erorilor și ce pot crea senzația de incertitudine și de imprecizie, s-
a ajuns la concluzia că utilizarea acestor tehnici împreună cu aprecierile doctorilor
conduce la obținerea unor rezultate mult mai bune și mai exacte decât cele folosirea
metodelor clasice.

3
Create special pentru a înlocui metoda euristică, specific umană, biologică și naturală
de gândire în lumea computerizată, tehnicile inteligente sunt cele mai avansate
modele de lucru, fiind capabile să evalueze si să decidă pe baza unui proces de
inferență, foarte asemănător cu gândirea umană. Cele mai răspândite tehnici de
inteligență artificială sunt : algoritmii de tip fuzzy, rețelele neurale, algoritmii genetici
și sistemele experte / sistemele bazate pe cunoștințe.
Este foarte clar faptul ca odată cu progresele enorme înregistrate in ultimii ani,
punctul de interes al asocierii celor două domenii a trecut de la posibilitățile de
generare și achiziție de imagini la procesarea acestora și extragerea detaliilor
necesare și gestionarea lor pentru a obține o precizie cât mai ridicată. Se poate spune
că această schimbare bruscă a atenției a avut loc deoarece s-a ajuns la următoarea
concluzie : putem dispune de oricâte mijloace și metode de achiziție și generare de
imagini dar dacă nu știm cum să extragem informațiile necesare și să le prelucrăm,
atunci nu am progresat atât de mult cum credeam deoarece nu putem eficientiza la
maxim resursele disponibile.
În zilele noastre doctorii oferă un diagnostic bazat în principal pe propria interpretare
(și conform cu procedurile standard în domeniu) a rezultatelor medicale obținute în
urma testelor medicale. Aceștia prescriu anumite analize ale elementelor de bază și
pe baza acestor rezultate incipiente trec, dacă este cazul, la investigații mai detaliate
și mai în profunzime. Prin urmare, analizele nu se mai fac doar prin implicarea și
acțiune personalului medical ci și prin implicarea unor calculatoare, sisteme,
dispozitive tehnologice special concepute pentru a oferii o precizie mai bună.
Scopul acestei lucrări este de a prezenta o nouă perspectiva asupra legăturii între
imaginile biomedicale si domeniul IT pentru a sublinia aplicabilitatea tehnologiei în
viața de zi cu zi, prin intermediul procesării imaginilor digitale. De asemenea, punctul
de interes al lucrării este o procedura bazată pe tehnica fuzzy ce este special creată
pentru a evalua riscul identificării cancerului mamar pentru o anumită pacientă. Acest
diagnostic implică definirea unui set de parametrii văzuți ca parametrii de tip input și
output, pe baza cărora se creează reguli de diagnostic. Diagnosticul oferit de către
aplicație implică definirea riguroasă a unui set de reguli de tip fuzzy care creează o
legătura simbolică între datele medicale și evoluția pacienților și evaluarea posibilelor
tumori și încadrarea maladiei în anumite clase specifice standardizate la nivel
internațional.
În domeniul procesării imaginilor biomedicale, cercetarea se face simultan pe doua
domenii importante : Achiziție de Imagini ( Image Retrieval) și Procesare de Imagini
(Image Pocessing). Prima componentă se referă la instrumentele ce pot fi utilizate
pentru a căuta și identifica o anumită imagine într-un spectru larg de imagini ce sunt
de obicei stocate în baze de date, iar a doua componentă fac trimitere la metodele
ce pot fi utilizate pentru a îmbunătăți, reconstrui domenii sau zone de interes pentru
utilizator sau pentru a evidenția analiza automată aplicată reprezentării digitale.
Aplicația folosește și înglobează într-o singură abordare tehnici de analiză si procesare
de imagini (aplicate unei mamografii în format digital) și algoritmi de luare a unei

4
decizii bazați pe logică fuzzy, dar după cum se poate observa, diagnosticul final nu
poate fi oferit fără implicarea directă a medicului în întregul proces. Certitudinea
diagnosticului oferit de aplicație este direct proporțională cu corectitudinea
parametrilor validați de medic. Output-ul este rezultatul algoritmului fuzzy de
interpretare a variației input-ului în funcție de opțiunile disponibile pentru selectoare.
Etapa de procesare și analiză de imagini se bazează pe algoritmi de recunoaștere a
modelelor, de detectare a marginilor și de identificare și extragere a trăsăturilor
importante pentru o utilizare viitoare. Scopul acestei etape este de a obține o primă
evaluare a cazului reprezentat prin imaginea digitală și de a avea idee generală
despre drumul ce trebuie parcurs pentru a dispune de un diagnostic de încredere.
Sistemul Suport Decizie acționează pe baza unor criterii și caracteristici specifice
introduse de către un medic în interfața grafică a aplicației. Pe baza informațiilor
existente, algoritmul fuzzy stabilește diagnosticul maladiei oncologice pentru situația
specifică a studiului de caz în cancerul de sân.
Rezultatul final al acestei lucrări îl reprezintă realizarea unei aplicații ce are ca punct
final un Sistem Suport Decizie (SSD). Acest sistem va ajuta medicul în acordarea
unui diagnostic pe baza unei analize adecvate, ce se bazează atât pe implicarea
directă a medicului ce oferă date absolut vitale pentru tot procesul de diagnosticare
cât și pe procesarea unei imagini digitale (i.e. mamografii). Astfel, aplicația finală
este constituită din doua mari componente funcționale : citirea imaginii digitale prin
intermediul și procesarea acesteia pentru extragerea de informații și introducerea
altor parametrii de diagnostic : analize (de sânge, de țesut, etc.). După ce aceste
două etape au fost realizate se trece automat la rularea algoritmului bazat pe logica
fuzzy, care va genera un rezultat (proporțional) în ceea ce privește detectarea
cancerului de sân la pacienta respectivă, propunând o variantă de tratament.
Bineînțeles, varianta de tratament poate suferii modificări fiind vorba de
individualitatea pacientului vs. generalitatea bolii.
In viitorul apropiat se pot identifica foarte multe perspective pentru progresul în
domeniul medical prin aplicarea tehnologiei informațiilor și prin utilizarea metodelor
de procesare de imagini. Se desfășoară în permanență atât de multe cercetări, încât
nu este nevoie decât de o căutare după o mică asociere de cuvinte cheie pentru a
avea la dispoziție o mulțime de cursuri și descoperiri în domeniu. Ce face diferențierea
între aceste mulțimi de rezultate științifice, este aplicabilitatea lor în obținerea unui
progres. Odată cu trecerea timpului, trebuie să se consolideze nevoia de a aplica
tehnicile de procesare de imagini în aplicațiile medicale pentru depășirea limitelor
existente și pentru ca acestea șa poată fi implementate într-un mod util. Utilizarea
concomitentă a noțiunilor tehnologice și a cunoștințelor medicale necesită o
cooperare între oameni cu medii diferite, dar care au un important scop în comun :
lucrul în beneficiul omenirii.

5
2. Date de literatură

Pentru a putea realiza obiectivele propuse și pentru a avea o abordare cât mai
profesională asupra temei acestei lucrări, este nevoie de un studiu de literatura cât
mai complet și mai explicit asupra elementelor și tehnicilor utilizate. Astfel se pot
diferenția două mari componente ce trebuie tratate si studiate separat, dar care
formează un singur corp coerent al științei prin care se reușește conceptualizarea
analizei in domeniul cancerului. Aceste doua parți, formate prin segmentarea
procesului de cercetare sunt : tehnici de inteligență artificială și tehnici de procesare
de imagini. Rezultatul propriu-zis al acestei lucrări, aplicația practică, va conține
îmbinarea și suprapunerea acestor doua elemente importante, creând noi perspective
în cercetarea și diagnosticul maladiei cancerului de sân.

2.1Tehnici de Inteligență Artificială

Progresele extraordinare înregistrare în domeniul digital al tehnologiei computerizate


au făcut posibile tehnici de imagistică noi și sofisticate ce au influențat într-o foarte
mare măsură viziunea umană asupra interpretării imaginilor radiologice. În cazul
mamografiilor, tehnicile de inteligență artificială au fost utilizate cu succes pentru
detectarea și caracterizarea anomaliilor pe un suport reprezentat de o imagine
digitală. Radiologii ce au putut interacționa direct cu aceste tipuri de tehnologii ale
informației, au înregistrat rezultate cu mult superioare, în detectarea și tratarea
maladiei mamare, față de medicii care nu au avut acces la aceste ajutoare. Metodele
de inteligență artificială aplicate în domeniul medicinei pot ajuta în reducerea erorilor
în procesul de interpretare a mamografiilor. Algoritmii implementați nu sunt afectați
de erorile de interpretare care continuă sa afecteze observatori umani.[15]
Progresele remarcabile în tehnologia informatică digitală au permis dezvoltarea
practică a tehnicilor de imagistică precum RMN sau CT. Aceste avansuri au ajutat la
obținerea unei reprezentări din ce în ce mai detaliată a organelor sau a țesuturilor
umane, dar nu au influențat cu aproape nimic modul în care radiologii interpretează
examinările în practica de zi cu zi.[11] Complexitatea acestor reprezentări a creat
necesitatea existenței unor sisteme dezvoltate bazate pe implementarea tehnicilor de
inteligență artificială. Zona care e prezentat cel mai mare grad de interes a fost
dezvoltarea de tehnici automate care, pe baza unei mamografii pot genera un
diagnostic.
Clasificarea manuală a imaginilor este o adevărată provocare ținând cont de volumul
imens de informații cu care trebuie să se lucreze și este în același timp o sarcină
consumatoare de timp. Această abordare manuală este susceptibilă la capacitățile
observatorului uman, fiind dependentă în totalitate de acesta. Prin urmare rezultatele
clasificărilor pot prezenta erori sau pot fi foarte slabe din punct de vedere al calității.

6
Când se discută despre implicarea inteligenței artificiale în procesul medical trebuie
să se ia în considera motivul principal ce a determinat aceasta necesitate : limitările
naturale ale observatorului uman. Este foarte clar faptul că un algoritm este
caracterizat în principal prin precizie, exactitate, putere și viteză mare de calcul,
caracteristici ce nu sunt neapărat specifice procesului de decizie și observație al
oamenilor.
Analiza computerizată a imaginilor poate începe numai după ce acestea sunt
reprezentate în format digital adecvat. În aproape toate investigațiile ce au fost
realizate până în prezent, acest lucru a implicat digitalizarea reprezentării
imaginilor.[15] Cerințele ce trebuie îndeplinite pentru a considera că o mamografie
poate fi inclusă în procesul de analiză automată includ rezoluția spațială ridicată și
sensibilitate mare la contrast.
Achiziționarea digitală directă a imaginilor, acum posibilă prin foarte multe metode și
variante reprezintă punctul de start în sistemele automate de diagnosticare asistată
de calculator. Procesarea imaginilor digitale reprezintă punctul central în procesul de
rulare al algoritmilor implementați. O astfel de prelucrare permite ca anumite
caracteristici dependente de relația semnal-zgomot, să fie percepute ca informații
cheie ce pot fi îmbunătățite pentru eventualele prelucrări ulterioare, pe când detaliile
nedorite sunt suprimate. Imaginile preprocesate sunt apoi analizate și testate pentru
a identifica potențialul obiectelor de interes, această analiză se realizează la nivel de
pixel. Zonele identificate ce prezintă un anumit grad de interes sunt extrase și servesc
ca bază pentru procesul de detectare bazat pe caracterizarea decizională. În
sistemele informatice în care scopul principal este caracterizarea anomaliilor
patologice, rolul principal al algoritmilor de procesare este extracția informațiilor.[12]
Tehnicile viziunii pe calculator au avantajul distinct de a putea fi reproduse ca și codul
de bază al computerului pe care se bazează. Astfel se poate observa că la un anumit
nivel, în execuția multor scheme de diagnostic automat pe calculator, deciziile de
detectare sau chiar cele legate de caracterizarea unor zone de interes, au din ce în
ce mai puțină legătură directă cu ceea ce radiologul ar considera potrivit sau
nepotrivit, în vederea aspectului fizic al imaginii.[11] Mai degrabă, detaliile
matematice ale fiecărei trăsături fizice ce a fost extrasă de către metoda de
procesare, au cea mai mare influență în determinarea rezultatului final. Acest model
de luare a unei decizii poate fi susținut de rata de succes pe care a avut-o în primele
cercetări în domeniu, cercetări ce au înregistrat foarte multe reușite.
Cu toate acestea, punctul de interes al domeniului s-a schimbat în ultimele decenii,
punându-se mai mult accentul pe modele complexe bazate pe tehnici de inteligență
artificială, modele ce sunt mult mai performante, mai personalizabile și mai precise,
acestea fiind dezvoltate prin colaborarea directă dintre matematicieni și fizicieni.
Aceste tehnici ce au la bază inteligența artificială includ: metode de analiză, sisteme
expert bazate pe reguli, algoritmi fuzzy și rețele neurale artificiale. Astfel de tehnici
se pot utiliza simultan, se pot îmbina pentru a beneficia de diverse caracteristici
complementare și în cele mai multe cazuri, dacă sunt implementate corect, sunt mult
mai precise decât factorii de decizie umani.
7
Clasificatorii automatizați ar putea actualiza în mod substanțial procesul de
diagnosticare al cancerului de sân, atât în ceea ce privește exactitatea cât și cerința
de a avea un timp cat mai limitat, prin abilitatea de a diferenția automat modelele
benigne de cele maligne. Analizarea tehnicilor de inteligență artificială ce pot fi
aplicate în procesul de diagnosticare automată începe cu analizarea potențialului
enorm al rețelelor neurale în acest domeniu.
În ciuda numărului mare de cercetări și publicații care încearcă să acopere toate
noțiunile tehnice aferente și să descrie utilizarea rețelelor neurale, sunt disponibile
doar câteva recenzii care ghidează dezvoltarea acestor algoritmi pentru
îmbunătățirea tehnicilor de detectare în ceea ce privește specificitatea și
sensibilitatea.
După cum s-a subliniat până în acest moment, clasificatoarele automate sunt utile
radiologilor pentru a face distincția între caracterul malign sau benign al unei
patologii. În domeniul imagisticii medicale, rețelele neurale artificiale au fost aplicate
la o varietate de sarcini de clasificare a datelor extrase și de recunoaștere a modelor,
devenind astfel un instrument promițător de clasificare, cu potențial enorm în detecția
în stadii cât mai incipiente ale cancerului de sân.
Pornind de la nivelul analizei imaginii digitale, se poate observa că acestea pot fi
deosebite în multe aspecte precum textură, formă, relații spațiale, culoare, etc.
Aceste proprietăți au o importanță foarte crescută în detectarea corectă a unor
variațiuni suspicioase. Astfel, diferitele selecții ale caracteristicilor imaginilor
determină automat decizii de clasificare diferită, maniera în care sunt alese aceste
caracteristici fiind mai bine spus una subiectivă decât una matematică. Aceste
clasificări pot fi împărțite în trei tipuri: metode bazată pe statistici (Vector Machine
Support), metode bazate pe reguli (algoritmi de tip fuzzy) și metode bazate pe rețele
neurale artificiale.
Rețeaua neurală artificială folosește principiul de funcționarea al neuronului biologic,
fiind compusă din neuroni cu straturi diferite, aceștia fiind interconectați prin greutăți
numerice. Greutățile pot fi modificate prin intermediul procesului de învățare al rețelei
care caută în permanență să se apropie de rezultatul optim. De obicei, în aplicațiile
de procesare de imagini, numărul neuronilor este direct proporțional cu numărul de
pixeli din imaginea de intrare[9].
Pentru detectarea și clasificarea cancerului s-a utilizat foarte mult o abordare bazată
pe segmentarea imaginii. Multe metode de segmentare ce se bazează pe caracteristici
ale histogramelor, sau pe detectarea marginilor sau pe clasificarea pixelilor, au fost
realizate prin instruirea unei rețele neurale.

8
Figura 1 - Schema de parcurs a procesului de învățare automată a rețelelor neurale

Algoritmi de segmentare ce au ca punct de pornire principiul rețelelor neurale nu


depind de reguli euristice prezumtive derivate din anatomia de meta-cunoaștere a
unei decizii de clasificare. În schimb, ideea de auto-organizare a clasificatorului este
condusă de principiul învățării prin exemplu și nu prin analiza datelor conform unui
set fixat de reguli date, așa cum se procedează în cazul algoritmilor fuzzy. În acest
context definit, analiza datelor poate fi efectuată prin doua tipuri diferite de
strategii.[12]
Primul model încearcă să identifice proprietățile caracteristice ale distribuției
multidimensionale ale vectorilor de proprietăți neetichetate, adică fără posibilitatea
de a dispune de o interpretare a informațiilor în strânsă legătură cu clasele de
segmentare. Această abordare poartă denumirea de clustering nesupravegheat (UC
– unsupervised clustering). Al doilea model, ce poartă numele de clustering
supravegheat (SC), implică date etichetate, acest lucru însemnând că algoritmul de
învățare necesită și vectorul de caracteristici cât și o funcție țintă care definește
interpretarea vectorului raportat la clasele de segmentare. [10] Pentru o mai bună
înțelegere se poate spune că SC semănă cu procesul de învățare cu un profesor.
9
Cu toate că principiile de bază sunt aceleași, cele doua metode sunt abordate ca fiind
doua entități independente. Acest lucru nu însemnă ca nu putem sa combinăm
principii aferente UC și SC pentru a le utiliza simultan într-o procedură computațională
integrativă, prin aplicarea așa-numitelor funții radiale de bază generalizate (GRBF) în
lucrul cu rețelele neurale.
Arhitectura unei rețele GBFR este prezentată în figura :

Figura 2 - Arhitectura unei rețele GBFR

Procesul de segmentare are o aplicabilitate crescută în detectarea maselor ce prezintă


un grad de risc de malignitate. De exemplu, în examinarea unei mamografii se caută
în primul rând micro calcificări sau formațiuni omogene sau neomogene ce au un
aspect ieșit din comun. Microcalcificările sunt depuneri de calciu în țesuturile moi ale
sânului. Ele pot apărea într-o varietate foarte mare de forme, dimensiuni și modele,
iar împreună cu activitatea extracelulară în zona sânului pot reprezenta un motiv de
suspiciune pentru orice radiolog. [11]
Sistemele de diagnostic automat utilizează o rețea neurală pentru a detecta
microcalcificările cu ajutorul statisticilor de nivel de gri, rezultate din analizarea
histogramei mamografiilor. Clasificarea a fost generată cu ajutorul implementării
rețelei neurale bazate pe percepton (algoritm supervizat folosit pentru procesul de
învățare a clasificatoarelor binare), utilizând un algoritm de backpropagation ce a fost
deja modelat pentru o serie de aplicații de recunoaștere a modelului.[12-13]
10
Entropia, ca și caracteristică, are putere semnificativa de discriminare pentru
clasificare [12]. Această abordare a fost extinsă până la nivelul în care funcțiile
contextuale de histogramă de ordin doi au fost corelate cu gradul de malignitate.
Arhitecturile bazate pe rețele neurale ce au fost utilizate până în prezent au arătat că
s-au obținut rezultate foarte bune pentru clasificarea cazurilor greu de diagnosticat
de microcalcificare mamografică în categorii benigne și maligne utilizând un set bine
definit de caracteristici.
Pe lângă microcalcificări, masele sunt cele mai importante simptome sau formațiuni
ce sunt dificil de identificat, diagnosticat și analizat cu exactitate. Un algoritm bazat
pe rețele neurale artificiale împreună cu un clasificator construit pe structura unui
perceptron multistrat, a fost utilizat pentru ajustarea și filtrarea mamografiei.
Procesul de detecție a înregistrat o rată de succes foarte mare prin utilizarea schemei
CAD – Computer Aided Design, care a determinat obținerea unei precizii de detecție
relativ ridicată și o rată fals pozitiv destul de scăzută, chiar și atunci când a fost cazul
unor formațiuni mai speciale. [10]
În majoritatea aplicațiilor, scopul principal al rețelelor neurale a fost clasificarea și
segmentarea automată. În cazul cancerului, dar mai ales în cel al cancerului de sân,
tipurile de date ce trebuie clasificate includ : calcificarea si necalcificarea, benign sau
malign, prezența sau absența tumorilor și tipul de țesut din care este alcătuit sânul
(dens sau normal). Rețeaua neurală are nevoie de un set de date complex și vast
pentru procesul de instruire. Aceasta învață modele, scenarii ce se desfășoară pe
baza seturilor de date introduse și observă modul în care modificarea unuia dintre
parametrii influențează într-un mod organic și natural evoluția diagnosticului.
În implementările mai rudimentare, seturile de date erau introduse direct în rețeaua
neurală. Abordarea era funcțională doar dacă era disponibil un nivel imens de date
ce declanșa următoarele preocupări : capacitatea de stocare a dispozitivului pe care
se rula procesul de diagnostica, viteza de lucru, timpul de performanță, precizia de
calcul și disponibilitatea datelor. Astfel s-a ajuns la metode ce iau în considerare
rentabilitatea investiției (ROI – Return on Investment) ceea ce a redus foarte mult
necesarul de seturi de date. Următoarea inovație ce a fost înregistrată a fost
antrenarea rețelei neurale cu vectori de trăsături.
Astfel s-a ajuns la concluzia că trăsăturile care pot fi folosite ca date de antrenament
includ : spiculațiile, modelul ramificațiilor, forma, luminozitatea nodului, numărul de
lobulări, marginea, mărimea nodulului, granularitatea și textura. Aceste caracteristici
pot fi introduse, extrase manual prin implicarea observatorului uman sau detectate
automat prin tehnici de procesare de imagini. Introducerea unor seturi de date
complexe și variate a îmbunătățit cu mult performanța rețelelor neurale în ceea ce
privește mărimea datelor de instruire și precizia cu care se implementează
algoritmul.[12-13]
Diferite variații ale rețelelor neurale pot fi utilizate pentru același scop, deci
implementarea acestora este foarte abordabilă și la îndemână. Luând ca exemplu
cazul unor clasificatoare, ce pot fi utilizate într-o mulțime de situații, se poate
11
evidenția faptul că acestea se pot implementa chiar și prin cea mai simplă formă de
rețele neurale și anume „feed-forward backpropagation (FFB)” sau cu transmitere în
avans. După cum sugerează numele acest tip implică faptul că nodurile de intrare nu
nici un fel de relaționare între ele și mai important unitățile nu formează un ciclu
repetitiv sau chiar bucle[12].
FFB poate transmite doar date de la stratul curent de lucru până la stratul următor,
deci datele se deplasează într-o singură direcție deja fixată, și anume de la intrare la
ieșire. Alt tip de rețele neurale este cel cu cascadă, care sunt destul de asemănătoare
cu cele cu transmitere în avans. Singura diferență între cele doua este faptul că cele
cu cascadă includ conexiuni nu numai de la intrare, ci și de la fiecare strat anterior la
cele ulterioare. Rețelele neurale cu convoluție sunt considerate un tip special de rețele
cu transmitere în avans și implică prezența mai multor straturi de colecții de neuroni
mici, care sunt capabile să proceseze porțiuni de dimensiune redusă ale imaginii de
intrare.
Tendințele în dezvoltarea rețelelor neurale se îndreaptă acum spre modele hibride.
Acestea implică utilizarea concomitentă a unor metode statistice, precum bootstrap
și a rețelelor neurale de bază și prezintă avantajul ca necesită date de antrenament
mult mai puține și, prin urmare, sunt utile atunci când nu se dispune de un set de
date complex. În plus, rețele hibride garantează o precizie mult mai bună decât
modele de bază, fiind unul dintre motivele pentru care sunt mult mai utilizate în
aplicațiile medicale, unde precizia de calcul este vitală.
Algoritmi bazați pe logică FUZZY reprezintă o altă metodă de a implementa tehnici
de inteligență artificială în procesul de rulare al algoritmilor de decizie automați. Cu
toate că respectă aceleași principii ca rețelele neurale, logica fuzzy este diferită din
punct de vedere al modului de implementare. Aceștia reprezintă o generalizare a
teoriei seturilor convenționale ce au fost introduse pentru a reprezenta într-un mod
matematic neclaritatea vieții de zi cu zi. Ideea de bază este ușoară și naturală și
poate fi explicată cu ajutorul următorului exemplu.[16] Considerăm o mașină care se
apropie de un semafor ce are aprinsă lumina roșie, deci trebuie apăsat pe frână
pentru a oprii mașina în timp util. Dacă șoferul primește o instrucțiune de forma
„Apăsați pedala de frână când vă aflați la 15m de intersecție” nu va știi exact
momentul când trebuie să acționeze pedala. Aceeași comandă se poate exprima și
prin forma „Apăsați pedala de frână astfel încât să opriți mașina în timp util”.
Prima instrucțiune este mult prea precisă pentru a putea fi executată de șofer și
implicit de orice mașină care își bazează principiul de funcționare pe rularea unor
seturi de reguli. Exemplul anterior ilustrează faptul că precizia clară poate fi destul
de inutilă, în timp ce directivele mai largi și mai vagi pot fi interpretate și executate,
chiar dacă există riscul ca executarea acestora să se realizeze într-o maniera mai
subiectivă. De asemenea, acest tip de nedefinire, nu permite apariția unor elemente
dominate de șansă și astfel algoritmii bazați pe logică fuzzy nu sunt probabilistici.[16]
Metoda de interpretare fuzzy a structurilor de date este foarte naturala și reprezintă
o abordare intuitivă în formularea și rezolvarea diferitelor probleme. Seturile

12
convenționale (clare) sunt cele care conțin obiecte ce satisfac proprietăți specifice,
concrete, absolut necesare pentru aderare și apartenență.

Figura 3 - Exemplificarea modului de acționare a algoritmului fuzzy

După cum se poate observa în schema de mai sus, setul de numere H din intervalul
6, 8 este format din elemente caracterizate prin precizie fiind atribuite prin relația:

𝐻 = {𝑟 ∈ 𝑅|6 ≤ 𝑟 ≤ 8}

Echivalent, H este descris prin calitatea sa de membru (caracteristică sau indicator)


prin funcția 𝑚𝐻 :
1,6 ≤ 𝑟 ≤ 8
𝑚𝐻 = {
0, î𝑛𝑟𝑒𝑠𝑡

Setul de valori stricte H și dependența sa față de 𝑚𝐻 sunt afișate în jumătatea stângă


a figurii de mai sus. Fiecare număr real r se găsește sau nu în elementele componente
ale lui H. Deoarece 𝑚𝐻 mapează toate numerele reale r în o mulțime formată din
doua elemente {0, 1}, se ajunge la concluzia că seturile de valori stricte corespund
unei logici cu două valori ce poate fi interpretată diferit în funcție de situație : 1 sau
0, negru sau alb, există sau nu există, etc.

13
Pentru a evidenția mai bine ideea de funcționare a algoritmilor fuzzy trebuie să
continuam exemplul cu un set F de numere reale care sunt apropiate de valoarea 7.
Din moment ce există propietatea „aproape de 7” cu specific de logică fuzzy,
înseamnă ca nu există o funcție de membru unică pentru F. Mai degrabă, cel ce
implementează algoritmul decizional, trebuie să decidă, pe baza potențialului de
aplicare și pe baza proprietăților dorite F, ce formă ar trebui să aibă 𝑚𝐹 (mulțimea
funcțiilor de membru specifice pentru F). Având în vedere seturi de constrângeri
intuitive, ce nu au o aplicabilitate universală ci trebuie definite pentru fiecare situație
sau caz în parte, oricare dintre funcțiile indicate în figură (în jumătatea din dreapta a
figurii), ar putea fi o reprezentare utilă a F. Funcțiile de membru au avantajul că pot
fi construite cu ușurință și pot fi personalizate astfel încât să acopere toate posibilele
variante de execuție.
Una dintre cele mai mari diferențe dintre seturile clare și cele fuzzy este că cele dintâi
au mereu funcții de membru unice spre deosebire de seturile fuzzy în care fiecare set
are un număr infinit de funcții membru de care pot fi reprezentate. Această
propietatea reprezintă un dezavantaj și un avantaj simultan. Unicitatea este
sacrificată în schimbul câștigului asigurat de flexibilitatea modului de acționare și
procesare, permițând astfel modelarea algoritmilor fuzzy pentru o utilitate la maximul
potențial.
În teoria seturilor convenționale, seturile de obiecte reale, cum ar fi numerele din H,
sunt echivalente și descrise izomorf de către o funcție membru unică, cum ar fi 𝑚𝐻 .
Cu toate acestea, nu mereu există un echivalent teoretic de „obiecte reale” care să
corespundă într-un mod concret funcțiilor de membru 𝑚𝐹 . Seturile de date fuzzy sunt
întotdeauna funcții ce aparțin unui „univers de obiecte infinit”, de exemplu obiecte de
tipul X ce se găsesc în [0,1]. Această apartenență este ilustrată în figura următoare:

Figura 4 - Apartenența dintre un domeniu finit și valoarea unei variabile de execuție, realizată printr-un set fuzzy

După cum se poate observa, setul fuzzy este funcția prin care se realizează
transportul valorii asociate lui X în intervalul determinat [0,1]. Valoarea lui m la x
14
adică 𝑚(𝑥) este o estimare a asemănării lui x cu obiectele ale căror proprietăți se
potrivesc îndeaproape cu proprietățile reprezentate de semantica lui m. [14]
Cel mai mare avantaj al utilizării logicii fuzzy constă în faptul ca oamenii de știința
pot modela sisteme non-liniare, imprecise, complexe prin transpunerea experienței
umane, a cunoștințelor și a experienței acumulate prin numeroase practici în regulile
de deducere (numite și reguli fuzzy) care utilizează în principal variabile lingvistice.
Definiția variabilelor și regulilor fuzzy nu pornește de la definirea precisă a procesului
de funcționare, ci de la observarea și înțelegerea în profunzime a componentelor fizice
ale fenomenelor implicate. Prin utilizarea tehnicilor de inteligență artificială fuzzy,
experiența umană legată de procesul investigat se poate materializa într-o formă
mult mai conceptuală prin intermediul unor reguli de deducere atașate logicii fuzzy.

În esență procedurile de logică fuzzy pot fi rezumate în 3 etape principale: [14]

A. Determinarea variabilelor de intrare și de ieșire care sunt capabile să descrie


fenomenul observat împreună cu selectarea intervalului de variație [14]
B. Pentru fiecare variabilă fuzzy, determinată anterior, se definește un set de
valori lingvistice la care se asociază funcții de membru ce acoperă intervalul
numeric disponibil.[14]
C. Definirea unui set de reguli de inferența fuzzy între variabile fuzzy de intrare
(I) și de ieșire (O). [14]

Figura 5 - Ilustrarea legăturilor simbolice între seturile de valori fuzzy, variabilele lingvistice și regulile de acționare

15
Aplicând logica fuzzy și urmând etapele precizate mai sus pentru figura 1. se pot face
următoarele observații: [14]
- Variabila E este o variabilă de sistem care se regăsește în intervalul [-1, 1]
- Setul de valori lingvistice este A= {-H,- M,-L,0,+L,+M,+H} definit ca o funcție
triangulara de membru ce acoperă intervalul [-1,1]
- Seturile de reguli sunt de forma: dacă I1 este x1 și I2 este x2 ... atunci O1
este y1, O2 este y2... , unde x1, x2, ...,y1, y2,... sunt valori lingvistice.

Procesul de fuzzificare și defuzzificare sunt cele două interfețe care fac legătura între
sistemul logic fuzzy și datele fenomenului măsurat. Fuzzificarea este folosită pentru
transformarea unei valori reale, dobândită din studiul procesului, într-o variabilă de
tip fuzzy ce face parte dintr-un set de valori fuzzy pentru un element specific.
Defuzzificarea este procesul invers care transformă variabila de ieșire fuzzy într-un
mod clar, calculată de setul de reguli de inferență între variabilele de intrare, în valori
reale stricte, ce sunt în mod normal trimise înapoi la proces ca feedback de control.
Există foarte multe criterii pentru a determina fuzzificarea sau defuzzificarea unui set
de valori lingvistice cum ar fi : singleton, triangulare, trapezoidale sau transformări
Gaussiene. [14]
Multiplele modele fuzzy pot fi integrate pentru a distribui în mod esențial un vot
ponderat pentru zonele „semnificative” dintr-o imagine. Utilizarea unor șabloane
pentru luare unor decizii, de exemplu pentru a combina caracteristicile aferente
pixelilor, s-a bucurat de succes atât în procesarea de imagini și în extragerea de
informații din imaginile prelucrate, cât și în multe alte domenii variate, și prin urmare
pare adecvată folosirea ca un mijloc pentru fuziunea mai multor fluxuri de ieșire.

2.2 Procesare de Imagini

Descoperirile fenomenelor fizice seminale precum raze X, ultrasunete, rezonanță


magnetică și radioactivitate au pus în evidență necesitatea existenței unor
instrumente de imagistică performante care să exploateze aceste resurse la
adevăratul lor potențial. Astfel au apărut dispozitive avansate care pe baza unor
operații complexe pot sa prelucreze o imagine digitala și pot extrage informații pentru
o acțiune ulterioară. Comunitatea imagistică medicală este acum capabilă sa
analizeze structura, funcția și patologia organismului uman cu o diversitatea foarte
mare de sisteme competente. Aceste sisteme au o funcționalitate extraordinara fiind
utilizate pentru detectarea bolilor, prescrierea tratamentelor, analiza evoluției,
chirurgie și imagistică biomedicală.
Imagistica biomedicală se concentrează asupra capturii imaginilor și utilizarea lor atât
în scopuri diagnostice cât și în scopuri terapeutice. Momente cheie în evoluția unei

16
patologii pot fi memorate și analizate ulterior prin intermediul unor senzori avansați
și prin tehnologia informației. Inovațiile din domeniul imagisticii medicale au făcut
posibilă achiziționarea imaginilor detaliate prin o multitudine de metode complexe
precum radiografii (scanare CT), sunet (ultrasunete), magnetism (RMN), produse
farmaceutice radioactive (medicină nucleară: SPECT, PET) sau lumină (endoscopie,
ECT). Aceste tipuri de analize pot ajuta la monitorizarea evoluției unui pacient într-o
perioadă lungă de timp și pot facilita întregul proces de diagnosticare și evaluare,
astfel încât sa elimine pe cât posibil erorile și să asigure o precizie cât mai
ridicată.[15]
Procesarea imaginilor medicale este similară conceptului de prelucrare a semnalelor
medicale reprezentate în mai multe dimensiuni. Acest concept implică analizarea
imaginilor captate, îmbunătățirea trăsăturilor cheie absolut necesare pentru a putea
extrage informații și în anumite situații afișarea imaginilor procesate ce au fost
achiziționate prin : raze X, ultrasunete, RMN, medicină nucleară și tehnologii de
imagistică optică.
Știința și ingineria care stă în spatele acestor instrumente capabile, împreună cu
instrumentele software folosite pentru captarea imaginilor biomedicale au evoluat
continuu, datorită impactului imens pe care l-au avut deja în domeniul medical și
datorită interesului pe care îl prezintă pentru medici, cercetători și destul de recent
ingineri și programatori. Considerând faptul că radiografia a fost inventată în 1895
revoluționând domeniul medical, dar având normal și limitările sale, iar radiațiile
moderne folosesc o abordare cu mult superioară care reduce drastic timpul de
expunere al pacientului la câteva milisecunde și doza de raze X necesară pentru
înregistrarea detaliilor, domeniul imagisticii medicale încă reprezintă o zonă de
interes deoarece are un potențial foarte mare pentru a aduce beneficii enorme.

Figura 6 - Aplicarea tehnicilor de procesare de imagini în domeniul medical (metoda simplificată)

Tehnicile de reconstrucție și modelare ce pot fi aplicate asupra reprezentărilor digitale


ale unor cazuri medicale, permit procesarea instantanee a semnalelor 2D pentru a
crea imagini 3D. Scanerul original a fost inventat în anul 1972 și la început era
necesară o perioada de câteva ore pentru a obține un singur set de date
corespunzător unei bucăți dintr-o imagine și mai mult de 24 de ore pentru a
17
reconstrui imaginea pe baza informațiilor captate ce au trecut printr-un proces
preliminar de îmbunătățire.[9-10] Impactul pe care acest scanner l-a adus a fost
imens, dar astfel s-a creat necesitatea de a optimiza procesul și automat de a reduce
timpul de execuție. Astfel aceste tehnici de lucru au fost subiectul cercetărilor pentru
o lungă perioadă de timp, iar progrese substanțiale au fost înregistrate. Astăzi
achiziția și reconstrucția imaginilor are loc în mai puțin de o secundă.
Algoritmii de procesare a imaginilor ajută, prin intermediul software-ului de
prelucrare, la identificarea și analizarea unor trăsături ce nu sunt evidente pentru
ochiul uman. Precizia unui diagnostic nu se mai bazează astfel pe capacitatea
observatorului uman, ci pe modul de acționare al algoritmilor implementați, ce pot fi
foarte ușor particularizați pentru a fi a atinge orice obiectiv dorit.
Aplicabilitatea tehnicilor de imagistică este foarte vastă. În funcție de ce tip de
diagnosticare se dorește, prelucrarea și analizarea imaginilor poate fi utilizată pentru
a determina trăsături volumetrice precum diametru, formă, volum, suprafață, contur
sau trăsături legate strâns de patologie precum vascularizația unei tumori, textura
unui țesut sau structura unui organ. De asemenea, se pot determina trăsături care
clar nu ar putea fi identificate de ochiul uman la o primă observare precum modificări
microscopice care nu au atras în niciun alt fel.[14]
Pentru a putea lucra cu o imagine trebuie ca aceasta sa fie privită ca pe o
reprezentare bidimensională sau tridimensională vizuală a diferite obiecte sau scene.
Există două tipuri de procesare de imagini: analogică și digitală. În procesarea
imaginilor analogice se folosesc tehnici mai rudimentare ce nu permit extragerea de
informații ci doar imprimarea acestora pentru o analiză fizică ulterioară. În cazul
procesării imaginilor digitale acestea sunt convertite în moduluri digitale, putând fi
aplicate transformări, filtre, tehnici de optimizare la nivelul fiecărui pixel, fiind astfel
ușor de integrat în aplicații deoarece sunt facilitate procese esențiale precum :
achiziția, îmbunătățirea sau manipularea. Datorită acestor beneficii este evident de
faptul ca în sistemele medicale moderne se lucrează preponderent cu reprezentări
grafice digitale.
Sistemele de procesare de imagini pot genera seturi de date în doua, trei sau chiar
mai multe dimensiune, în funcție de complexitatea nevoilor, și conțin informații din
ce in ce mai detaliate și mai vaste. Pentru a dispune de rezultate corecte și precise
este nevoie ca aceste informații sa fie prelucrate în timp util și într-un mod cât mai
exact. Examinarea poate fi cantitativa în unele cazuri și calitativă în altele; unele
imagini trebuie sa fie suprapuse, altele comparate între ele, altele comprimate și
arhivate pentru a construi baze de date competente. Pentru a ajuta și asista
interpretarea vizuala a imaginilor medicale, s-au dezvoltat la nivel global numeroase
programe și metode automatizate ce pot acționa ca un adjuvant în întregul proces de
prelucrare a reprezentărilor digitale.
Deoarece scopul final al acestei lucrări este aplicarea tehnicilor de procesare de
imagini într-o aplicație ce aparține domeniului medica, trebuie menționat faptul că
toate noțiunile teoretice ce urmează vor fi explicate într-o manieră generală,

18
insistându-se asupra funcționalităților ce pot fi aplicate în realizarea studiului de caz,
cancerul de sân. Astfel, se vor preciza și metode, aspecte, funcționalități ce fac
legătura între latura tehnologică a informației aplicate și implicarea umană, biologică
a personalului medical. Prin utilizarea noțiunilor teoretice cu potențial de aplicare în
domeniul medical se evidențiază legătura conceptuală între cele două domenii.
În principal, orice metoda de prelucrare a imaginilor este organizata în șase etape
individuale și succesive, după cum se poate observa în schema ilustrată, ce corespund
unor clase fundamentale de algoritmi : îmbunătățire, segmentare, cuantificare,
înregistrare, vizualizare și o secțiune specială ce conține compresia, stocarea și
comunicarea.[15] Este absolut evident faptul că pentru a putea prelucra o imagine
sa dispunem de aceasta într-o formă sau alta, deci este nevoie sa se treacă și prin
etapa de achiziție.
Fiecare etapă are implementați algoritmi specifici ce îndeplinesc o serie de funcții
absolut necesare pentru realizarea unei procesări de imagini reușite. Aceste etape
sunt de fapt câteva procese succesive ce folosesc o imagine digitală ca bază pentru
generarea automată a unui output ce conține informații referitoare la respectivul
input. Nu toate etapele de procesare sunt obligatorii, dar este recomandat să se
urmeze ordinea în care acestea au fost construite. Revine la atitudinea utilizatorului
să implementeze propriul mod de a lucra cu resursele biomedicale, deoarece toate
metodele existente sunt extrem de customizabile.

Figura 7 - Pași fundamentali în procesarea de imagini (abordare detaliată)

19
2.3 Avantaje și inovații aduse de inteligența artificială în domeniul medical

Unul dintre cele mai productive domenii de lucru în domeniul inteligenței artificiale
(AI) a implicat producția de programe cu performanță foarte ridicată ce nu neceită
implicarea constantă a unui observator, expert, etc. Aceste sisteme funcționează în
domenii specifice și limitate din punct de vedere al arii de cunoștințe acoperite, prin
încorporarea experienței unui utilizator uman în automatizarea execuției unui
algoritm, prin construirea unor reguli de decizie.[17] Regulile simulează procesul de
gândire a unei persoane prin întruchiparea abilităților acestuia într-o manieră
indirectă și reproductibilă. Astfel, un sistem expert ce integrează tehnici de procesare
de imagini oferă accesul la o expertiză specifică într-o manieră consecventă, pe o
scară mult mai mare și cu o aplicabilitate crescută deoarece se generalizează foarte
mult toată ideea de transformare.
Rețele neuronale sunt utilizate pe o scară foarte largă în aplicațiile medicale deoarece
garantează un nivel de independență în executarea unui anumit proces, precum
stabilirea unui diagnostic sau analizarea unei anumite patologii. Astfel, acestea fiind
combinate într-un mod creativ cu alte metode pentru a obține o precizie mai bună,
cu o anumită sensibilitate în interpretarea valorilor și diferitelor caracteristici și, de
asemenea, cu o baza de cunoștințe, care să îndeplinească cerințele minime de
dimensiune și complexitate, garantează obținerea unui nivel de precizie și validitate
suficient de ridicat pentru a se considera un output de încredere.
Integrarea acestor două componente într-un singur proces de execuție facilitează
implicarea directă a utilizatorului. Acesta nu trebuie să aibă vreun nivel ridicat de
cunoștințe pentru a pune un diagnostic ci doar trebuie să cunoască modul de execuție
al aplicației sau al sistemului care integrează tot procesul. [17]
Inteligența artificială reprezintă inovația ce a determinat schimbarea radicală a
aplicațiilor informatice utilizate în domeniul medical. Prin integrarea tehnologiei
informației de astăzi, s-a permis lucrurilor care nu sunt vii și automat nu dispun de
noțiunea de liber arbitru, cum ar fi computerele sau roboții, să ajungă la un anumit
grad de independență în aplicarea unor raționamente. Printre beneficiile pe care
aceste inovații le-au adus în domeniul medical se numără [17]:

 Diagnosticarea rapidă și precisă : unele patologii necesită acțiune imediată,


vindecarea lor bazându-se în principal pe diagnosticarea rapidă, în stadii
incipiente. Aplicând principiul de învățare al rețelelor neuronale, un sistem
poate diagnostica rapid și corect boli și alte patologii incluzând chiar cazuri
complexe și dificile precum probleme oculare, melanom malign, etc.
 Reducerea erorilor umane : datorită faptului că se lucrează cu date și informații
foarte precise, diagnosticarea este un proces sensibil. Pentru a reduce
dependența dintre capacitatea observatorului uman și acuratețea stabilirii unui
diagnostic s-a considerat necesara implicarea inteligenței artificiale în acest

20
proces. Uneori, din cauza lipsei de activitate, erorile umane pot periclita
siguranța pacienților. Pentru a elimina posibilitatea unor greșeli, tehnicile de
AI vor acționa ca un fel de verificare suplimentară, și astfel vor ajuta medicii
prin eliminarea eventualelor erori și prin eliberarea lor de sarcini monotone și
consumatoare de timp.
 Reducerea costurilor : prin utilizarea tehnologiilor emergente, în special prin
includerea inteligenței artificiale, un pacient poate obține asistență medicală,
fără a fi prezent fizic în clinici specialitate și spitale, astfel reducându-se
semnificativ costurile.
 Prezența virtuală : Progresele în domeniul informației au făcut posibilă
diagnosticarea pacienților de la distanță. Acest tip de tehnologii ce poartă și
numele de Telemedicină se referă la componentele software și hardware ce
permit specialiștilor să asiste pacienții care nu se află fizic în aceeași locație.
Astfel tot procesul medical se poate desfășura instant, fără a mai lua în
considerare transportul pacienților, al doctorilor, al dispozitivelor etc. Utilizând
un robot de prezență la distanță, medicii pot colabora cu alți doctori, cu
personalul și cu pacienți din alte spitale/clinici pentru a realiza aproape orice
operație medicală. Prin intermediul prezenței virtuale se economisesc resurse
(timp) dar se și reduc costuri suplimentare.

Cu toate că tehnologia referitoare la detectarea cancerului de sân a progresat rapid


în ultimii ani, există o lipsă de revizuire a literaturii critice asupra subiectului, care
reprezintă un dezavantaj distinct pentru dezvoltarea în continuare a tehnologiilor.
Această lucrare este o încercare de a îndeplini acel vid în domeniul procesării
imaginilor în depistarea precoce a cancerului de sân.

2.4. Procesarea Imaginilor– metode tehnice de abordare

Tehnicile de procesare de imagini se bazează pe algoritmi de recunoaștere ale


modelelor. Aceste metode implică faptul că dacă anumite operații sunt aplicate pe o
imagine digitală, rezultatul final poate fi ori o imagine îmbunătățita din punct de
vedere al trăsăturilor caracteristice ori un set de date ce conține informații extrase
din respectiva reprezentare grafică. Transformările realizate presupun aplicarea unor
procedee de procesare a semnalului la intrare (reprezentat de o imagine), rezultatul
oferind un set de caracteristici asociate cu respectiva imagine. Progresele recente în
cercetarea imagistică au arătat potențialul enorm pe care cercetarea în domeniul
imagisticii îl poate avea în a transforma diferite aspecte ale medicinei clinice.
În domeniul procesării imaginilor biomedicale, cercetarea se desfășoară în prezent pe
două mari domenii importante [1-4] :

21
1. Achiziția de imagini – se referă la instrumentele care sunt utilizate pentru a
căuta și identifica o anumită imagine într-un spectru larg de imagini, care sunt
de regulă stocate într-o bază de date sau pentru a obține o reprezentare grafică
a unui obiect, organ, țesut, etc. din lumea reală.
2. Prelucrarea imaginilor – se referă la metodele care pot fi utilizate pentru a
îmbunătății, reconstrui, vizualiza sau pentru a determina analiza automată
astfel încât să se evidențieze domenii sau fapte din imaginea digitală inițială,
care ar putea fi în interesul utilizatorului.

Procesarea imaginilor se bazează pe algoritmi și metode de recunoaștere a modelelor


ce pot fi împărțite în două mari clase : numerice și sintactice, fiecare având trei
abordări de bază posibile : deterministe, statistice și fuzzy. Scopul acestei lucrări este
de a utiliza algoritmii de tip fuzzy în studiul cancerului de sân și în diagnosticarea
automată a acestuia prin integrarea atât acestora cât și a tehnicilor de procesare de
imagini digitale (mamografii). [3-4]
În dezvoltarea sistemelor de imagistică biomedicală, ideea de achiziție a imaginii este
însoțită de nevoia evidentă de a dispune de tehnici speciale pentru prelucrarea
acestora în formă digitală. În plus, metodele de prelucrare de imagini aplicate în
domeniul medical au fost utilizate pentru a ajuta personalul calificat în diagnosticare
și cercetare. Integrarea acestora sub formă algoritmică în cadrul unei aplicații, are ca
rezultat crearea unui adjuvant în procesul de identificare a formațiunilor suspicioase
și clasificarea corespunzătoarea a acestora pentru a genera un diagnostic precis,
corect și neinfluențat de posibilele erori cauzate de capacitățile observatorului uman
[4-6].
Pentru a înțelege mai bine procesul intern de procesare a imaginilor este nevoie de o
prezentare corespunzătoare a noțiunilor teoretice de bază și a operațiilor matematice
sau de oricare alt fel ce se aplică pe reprezentarea digitală. După cum a fost precizat
în capitolul anterior, procesarea de imagini este organizată în șase etape individuale
și succesive [23]:

A. Îmbunătățire
B. Segmentare
C. Cuantificare
D. Înregistrare
E. Vizualizare

22
A. IMBUNĂTĂȚIREA

Această clasă de algoritmi este utilizată pentru a reduce zgomotul dintr-o imagine și
pentru a crește contrastul oricărei zone de interes. În imaginile în care distincția
dintre doua zone este foarte fină, de exemplu între țesutul normal și cel anormal,
interpretarea corectă poate deveni dificilă în cazul în care nivelurile de zgomot sunt
relativ mari. În cele mai multe cazuri, îmbunătățirea imaginii conduce la creșterea
calității imaginii și facilitează diagnosticare prin aplicarea unor metode specifice.
Aceste tehnici sunt utilizare în principal pentru a oferi o imagine mai clară pentru
observatorul uman, dar ele pot forma și un prim pas pentru preprocesarea necesară
în analiza automată ulterioară [23].
Tehnicile de îmbunătățire a imaginii sunt algoritmi matematici incluși în metode
automate ce urmăresc perfecționarea calităților unei anumite reprezentări digitale.
Rezultatul acestor algoritmi îl reprezintă generarea unei alte imagini care evidențiază
trăsăturile esențiale într-un mod mult mai evident decât în cazul imaginii inițiale. De
asemenea, prin intermediul unor funcții se pot obține versiuni ale imaginii originale
care pot arată toate transformările succesive, fiecare prezentând o caracteristică
selectată într-un aspect îmbunătățit. Tehnicile ce pot fi utilizate pentru perfecționarea
unei imagini sunt dezvoltate și aplicate într-o maniera ad hoc, acest lucru însemnând
faptul că: ideea de prelucrare se menține constantă deoarece operațiile matematice
aplicate reprezentării matriceale a imaginii sunt aceleași, doar ca rezultatul este
variabil deoarece depinde de foarte mulți factori precum dimensiune, zonă de interes,
nivel de gri, etc. îmbunătățirea tehnicilor permite utilizatorului să vadă anumite detalii
care nu sunt detectate imediat și observate automat. Aceste situații pot apărea, de
exemplu, atunci când intervalul dinamic al datelor și cel al afișajului nu sunt
proporțional sau atunci când imaginea are un nivel ridicat de zgomot sau când
contrastul nu este suficient. [23]
Deși majoritatea tehnicilor disponibile sunt aplicate cu scopul de a genera imagini
îmbunătățite pentru a fi utilizate ulterior de către un observator uman, unele tehnici
au fost special create pentru a genera imagini special construite pentru a fi integrate
în algoritmi utilizați de sisteme de calcul și/sau sisteme tehnologice. Din prima
categorie fac parte tehnicile de eliminare a zgomotului, de îmbunătățire a contrastului
și de evidențiere (sharpening) a detaliilor dintr-o imagine dată. [23] A doua categorie
este mult mai diversificată și conține mult mai multe metode decât prima, având o
gamă extinsă de posibilități și aplicabilități, inclusiv detectarea marginilor (edge
detection) și segmentare (segmentation). [23]
Trebuie evidențiat un fapt important : dacă metodele menționate pentru
îmbunătățirea detaliilor dintr-o imagine nu sunt utilizate într-un mod optim și
corespunzător pentru fiecare imagine în parte, atunci se poate ajunge într-o situație
nefavorabilă. Aceste tehnici pot spori zgomotul în timp ce îmbunătățesc contrastul,
pot elimina detaliile mici și claritatea muchiilor în timp ce se încearcă eliminarea
posibilelor „imperfecțiuni” si pot genera artefacte.

23
Din punct de vedere al abordării matematice, operațiunea cea mai utila în
îmbunătățirea imaginii este folosirea convoluției operatorilor locali cunoscuți și sub
numele de kernel. Considerând un kernel 𝑤(𝑘, 𝑙) ce este un vector de coeficienți
(2𝐾 + 1𝑥2𝐿 + 1), unde punctul de coordonate (𝑘, 𝑙) = (0,0) este centrul kernelului, se
poate defini convoluția acestuia cu imaginea prin relația :

𝐾 𝐿

𝑔(𝑚, 𝑛) = 𝑤(𝑘, 𝑙) ∗ 𝑓(𝑚, 𝑛) = ∑ ∑ 𝑤(𝑘, 𝑙) ∗ 𝑓(𝑚 − 𝑘, 𝑛 − 𝑙)


𝑘=−𝐾 𝑙=−𝐿

Unde g(m, n) este rezultatul convoluției. [23]


Pentru a realiza convoluția unei imagini cu un kernel, acesta este centrat pe un pixel
din imagine de poziție (m, n). Astfel se obțin produsele punct-cu-punct ale kernel-
ului cu pixelii corespunzători, iar rezultatul adunării corespunzătoare a acestor
produse este utilizat pentru a suprascrie valoarea pixelului de pe poziția (m,n) a
imaginii de ieșire. Rezultatul final este obținut prin repetarea aceleași operații pentru
fiecare pixel constituent al imaginii originale. Un kernel de convoluție poate fi aplicat
unei imagini pentru a realiza o îmbunătățire specifică sau pentru modificarea
caracteristicilor unei imagini. Kernelul este reprezentat de obicei printr-o matrice de
dimensiune 3x3, iar valorile ce formează această matrice depind de modificările ce
se doresc.

B. SEGMENTAREA

Segmentarea este etapa în care se face un angajament semnificativ în timpul analizei


automate prin delimitarea structurilor de interes și diferențierea acestora de
țesuturile de fond [3]. Această separare, care este de regulă, ușoară și rapidă pentru
sistemul vizual, poate deveni o provocare considerabilă pentru dezvoltarea unui
algoritm, mai ales când este vorba de prelucrarea imaginilor biomedicale în care
orice detaliu este important. [23]
În cele mai multe cazuri, etapa de segmentare este cea care dictează rezultatul
întregii analize deoarece operațiile ulterioare și diversele măsurători se bazează pe
segmentele rezultate. Tehnologiile de segmentare se bazează pe variația intensității
și a texturii de fond a unei imagini folosind principii care includ observarea pragului
(treshhold), creșterea regiunii de interes, tehnici de recunoaștere a șabloanelor.
Aceste tehnologii includ variante de algoritmi bazați pe inteligență artificială precum
rețele neurale sau reguli fuzzy. Segmentarea poate fi văzută ca o etapă inițială pentru
vizualizare și compresie.

24
În imagistica medicală delimitarea automată a diferitelor componente ale imaginii
este utilizată pentru analiza structurii anatomice și a tipurilor de țesuturi, distribuția
spațială a funcției și activitatea regiunilor patologice [4]. De obicei, segmentarea unui
obiect se realizează fie prin identificarea tuturor pixelilor sau voxelilor ce aparțin unui
obiect fie prin localizarea acelora care constituie o formă concretă. Prima abordare se
bazează în principal pe caracteristici ale pixelilor precum intensitatea acestora, dar
poate ține cont și de altele precum textura asociată fiecăruia. A doua abordare ce
ține de localizarea pixelilor de graniță utilizează gradientul unei imagini, reprezentare
ce delimitează foarte clar marginile obiectelor prin asocierea acestora cu valori
numerice foarte ridicate. [23]
Datorită faptului că segmentarea necesită o clasificare inițială a pixelilor, aceasta este
adesea tratată ca o problemă de recunoaștere a modelelor și este legată printr-o
relație conceptuală de aceasta prin tehnicile utilizate. Această legătură simbolică este
foarte evidentă mai ales în cazul imagisticii medicale, caz în care variația datelor
poate fi foarte ridicată și astfel fiind necesare tehnici de recunoaștere ale obiectelor
sau ale modelelor care asigură flexibilitate și automatizare convenabilă. O abordare
preferată în domeniul medical o reprezintă clustering-ul de tip fuzzy adică algoritmi
bazați pe modele fuzzy, funcții de membru și reguli de progres. [23]
Printre cele mai importante caracteristici ale oricărui algoritm se numără precizia
rezultatelor și viteza de calcul. Cazurile biomedicale necesită în plus abilitatea de a
procesa cantități mari de date volumetrice acumulate din numeroase aplicații în studii
clinice [4]. Practic, toate tehnicile de segmentare au fost dezvoltate pentru o primă
analiză în cazul imaginilor 2D pentru ca ulterior să fie extinse pentru a suporta imagini
3D. Astfel se poate observa tendința de progres și nevoia constantă de a dispune de
metode și abordări cât mai moderne.
Problema cea mai întâlnită în cazul algoritmilor de segmentare o reprezintă
dificultatea în limitarea diferitelor tipuri de țesut și memorarea acestora sub formă
de date volumetrice. Acest lucru se datorează faptului ca un voxel poate conține un
amestec de materiale. Segmentarea bazată pe algoritmi fuzzy oferă o soluție ce poate
face diferențierea aceasta urmând evoluția funcțiilor de membru.
Principalul scop al algoritmilor de segmentare îl reprezintă partiționarea imaginii în
regiuni (numite și clase sau subseturi) care sunt omogene cu privire la una sau mai
multe caracteristici. [1-4]. Rezultatul operației de segmentare este foarte util în
domeniul medical deoarece așa se poate face clasificarea pixelilor și stabilirea
apartenenței acestora la diverse zone anatomice precum oase, mușchi și vase de
sânge sau la diferite regiuni patologice prezum cancer, țesut deformat sau leziuni de
scleroză multiplă. De asemenea, întrebuințarea segmentării se poate extinde până la
extracția unor structuri specifice ce reprezintă zone de interes pentru operații viitoare
(de exemplu extragerea tumorilor de sân dintr-o mamografie sau dintr-o rezonanță
magnetică).
Cele mai întâlnite tehnici de segmentare se pot clasifica în două mari categorii :
segmentarea regiunii, tehnici care caută regiunile care satisfac un anumit criteriu de

25
omogenitate și segmentarea după margini, tehnici care identifică margini și
construiesc regiuni cu caracteristici diferite.[2,5,6]
Segmentarea reprezintă un pas important în multe aplicații medicale implicând
măsurători, vizualizare 3D și cel mai important diagnosticul asistat de calculator.
Selectarea unei tehnici „corecte” de segmentare pentru o anumită aplicație este o
sarcină dificilă fiind disponibile foarte multe metode iar în multe cazuri, o combinație
de mai multe tehnici poate fi necesară. Foarte des integrarea informațiilor din mai
multe imagini (achiziționate prin metode diferite și la momente diferite de timp) ajută
la segmentarea structurii care altfel nu ar fi putut fi detectate din imaginile originale.
Pe măsura ce se înregistrează progrese continue în cercetarea în domeniu, se observă
necesitatea unei evaluări obiective și cantitative a procedurilor de testare[7-8].

C. CUANTIFICARE

Algoritmii de cuantificare sunt aplicați structurilor segmentate pentru a extrage


informațiile esențiale pentru diagnostic, precum formă, dimensiune, textură, unghiul
și mișcarea. Deoarece tipurile de măsurători și țesuturi variază considerabil , au fost
dezvoltate numeroase tehnici care abordează aplicații specifice. [1-4]
Utilizarea practică a noțiunilor de cuantificare poate conduce la transformarea datelor
în formate bidirecționale și tridimensionale, la folosirea transformărilor de formă
pentru caracterizarea structurilor, analizarea în profunzime a reprezentării digitale a
mamografiilor la nivel de pixel, etc. [23] În aplicațiile practice în care trebuie
clasificate diferite tipuri de țesut, eficacitatea cuantificării depinde, în mod
semnificativ, de selecția bazei de date și de proprietățile imaginii.
Aceste măsurători cantitative contribuie la analiza structurii și funcției în cazuri
considerate normale și anormale prin abordări succesive ce vizează multe aspecte
ale seturilor de date disponibile cum ar fi: forma țesuturilor, mărimea, textura,
cinematica, mișcarea ventriculară, tulpina miocardică, fluxul sanguin, creșterea
tumorala sau caracteristicile citometrice. Forma și textura structurilor de țesut sau a
organelor prezintă un interes deosebit pentru interpretarea vizuală a imaginilor, iar
tehnicile automate disponibile oferă numeroase măsuri cantitative care pot contribui
la examinare.
Cuantificarea imaginilor este utilizată, de asemenea, în analiza imaginilor oncologice
deoarece se dorește o analiză complexă a tumorilor. Această analiză depinde foarte
mult de structura maselor din punct de vedere al texturii deoarece prin intermediul
său se oferă o nouă perspectivă asupra unor alte aspecte mai puțin vizate. Creșterea
în dimensiune a formațiunilor necesită o atenție deosebită și tocmai datorită acestui
fapt, reprezintă un foarte mare punct de interes pentru studii clinice și cercetare. [23]
Au fost dezvoltate numeroase modele matematice pentru a descrie dinamica internă
a celulelor tumorale, interacțiunile dintre aceste celule și țesutul înconjurător,
dinamică substanțelor chimice și alte fenomene posibile. [2]
26
Interpretarea mamografiilor se află într-o strânsă legătură cu algoritmii de
cuantificare datorită importanței analizei detaliate asupra formei și texturii, două
elemente ce prezintă un interes deosebit. Riscul de apariție al cancerului mamar a
fost corelat cu densitatea mamografiilor, cuantificată din punct de vedere al luminii
și texturii.

D. INREGISTRAREA

Înregistrarea a două imagini ce redau același obiect este esențială pentru multe
aplicații în care corespondența și „suprapunerea” celor două imagini transmite
informațiile dorite. Aceste două reprezentări pot avea surse, pot fi achiziționate prin
metode diferite, pot fi luate de la același pacient cu același instrument dar la
momente diferite de timp sau pot aparține pur și simplu unor subiecți diferiți. [23]
Comparația imaginilor obținute cu șabloane digitale anatomice necesită realizarea de
operații specifice ce sunt implementate direct prin intermediul algoritmilor de
înregistrare. Acești algoritmi sunt cei care explică distorsiunile dintre cele două
imagini, cauzele acestora, cât și diferențele între metodele imagistice, artefactele lor,
elasticitatea țesuturilor noi și variabilitatea dinte subiecții celor două reprezentări.
Scopul algoritmilor de înregistrare este de a determina o transformare spațială care
va aduce punctele ce sunt omoloage, din imaginile cu care se lucrează, în
corespondență. În cele mai simple cazuri, forma matematică a transformării spațiale
căutate poate fi limitată de fenomene fizice, [3] de exemplu, atunci când se lucrează
cu imagini achiziționate de la același subiecte, se poate presupune că partea sau
obiectul reprezentat poate fi tratat ca un corp rigid, presupunere care conduce la un
model de transformare spațială extrem de constrâns.
Un dezavantaj al acestui proces îl reprezintă faptul că procesele fizice implicate în
achiziționarea și reconstrucția imaginilor medicale poate provoca apariția artefactelor
și a defectelor ce ulterior pot cauza erori. Sursele potențiale ale acestor defecte ar
trebui corectate într-un mod explicit utilizând metode care estimează parametrii de
corecție corespunzători, independent de procesul de înregistrare în sine. Aceasta
abordare va determina îmbunătățirea atât a vitezei de lucru cât și precizia cu care se
pot estima mișcările corpului rigid analizat. [23]
Distorsiunile ce pot apărea, de exemplu în analiza țesutului moale considerând
situația imaginilor biomedicale, pot conduce la efecte neliniare care încalcă ipotezele
referitoare la corpul rigid. Astfel de distorsiuni sunt gestionate de propietați
complexe, cum ar fi elasticitatea caracteristicilor determinate, deoarece sunt mult
mai dificil de modelat decât factorii fizici asociați cu procesul de achiziție al imaginii
sau cu cel de reconstrucție. Înregistrarea imaginilor ce au ca proveniență subiecți
diferiți reprezintă limita extremă a spectrului, unde factorii de dezvoltare includ și
noțiuni de genetică, mediu și influențe aleatorii, toate acestea contribuind la crearea
unui set de diferențe complexe între subiecți. [1-4]

27
O mare parte a lucrărilor care au fost realizate până în prezent, în legătură cu procesul
de înregistrare al imaginilor, s-a referit la transformările spațiale ce sunt centrate în
jurul constrângerilor lineare. Modelul specific corpului rigid este setul de constrângeri
liniare ce este cel mai frecvent utilizat, dar cu toate acestea, există și modele mai
„relaxate” care sunt în întregime potrivite pentru a face față anumitor tipuri de
distorsiuni ale imaginii, precum calibrarea distanței. Chiar și în contextul cazurilor în
care este necesară prelevarea de imagini de la subiecți diferiți și automat ar fi nevoie
de transformări neliniare astfel încât să se obțină înregistrarea perfectă, se pot utiliza
transformări liniare care pot genera aproximări utile. Modelele liniare prezintă
avantajul imens că este necesară doar o cantitate mica de informații pentru a defini
o transformare spațială.[2]
În mod normal, imaginile medicale conțin o cantitate mult mai mare de informații
spațiale decât cerința minimă a modelelor liniare. Astfel această redundanță poate fi
exploatată în diverse moduri pentru a obține rezultate de înregistrare foarte precise,
cu erori chiar mai mici decât dimensiunea unui voxel. Redundanța ce a rezultat în
urma procesului de înregistrare al imaginilor, oferă un mecanism prin care precizia
înregistrării poate fi analizată din punct de vedere obiectiv. Pe măsură ce modelul de
transformare spațială devine din ce în ce mai puțin constrâns de limitări, redundanța
se reduce din ce în ce mai mult, ajungându-se chiar la situația în care aceasta devine
nulă. Validarea rezultatelor generate prin folosirea algoritmilor, devine mult mai
complicată atunci când forma matematică a transformării spațiale este neliniară și
implica multe grade de libertate. [1-4]
În cele mai multe situații, scopul principal al înregistrării imaginilor este cuantificarea
evoluției mișcărilor obiectelor de interes, astfel încât influența acestora asupra
seturilor de date generate să poată fi minimalizată sau chiar eliminată complet.
Procesul de înregistrare este, în esență, un proces de eliminare a efectelor generate
de variația mișcărilor obiectelor în cadrul aceleași reprezentări. Odată ce
transformarea spațială dorită a fost derivată, modelele de reeșantionare a imaginii și
de interpolare trebuie să fie utilizate pentru a compensa mișcarea și pentru a crea
imaginile înregistrate. Deși interpolarea imaginilor poate fi privită ca o problemă
strâns legată de cuantificarea imaginii, anumite aspecte unice apar doar în contextul
procesului de înregistrare al imaginilor.
Din perspectiva utilizatorului, precizia este una dintre cele mai importante proprietăți
ale unei metode de înregistrare. Într-un cadru de cercetare, precizia relativă poate fi
o bază pentru selectarea unei metode în detrimentul alteia, iar într-un context clinic,
acuratețea absolută trebuie cunoscută măcar la nivel teoretic pentru a lua deciziile
adecvate. În măsura în care acuratețea are variații substanțiale, metodele utilizate
pentru a reprezenta această acuratețe trebuie să respecte întocmai aceste oscilații.
Validarea preciziei înregistrărilor nu este o sarcină ușoară prin faptul că răspunsurile
corecte (seturi de date ce sunt folosite ca valori de referință) nu sunt, în general,
disponibile. Chiar și atunci când sunt disponibile standarde de estimare, se dovedește
ca un anumit grad de incertitudine legat de acestea, limitează capacitatea de a evalua
exactitatea reală. [23]
28
E. VIZUALIZAREA

Vizualizarea este o zonă relativ nouă în domeniul procesării de imagini, ce contribuie


semnificativ atât în medicină cât și în biologie. In timp ce sistemele automatizate sunt
foarte bune în efectuarea unor măsurători cantitative precise, examinarea completă
a imaginilor, și în special a imaginilor biomedicale, este realizată de sistemul vizual
și de experiența observatorul uman.
Domeniul de vizualizare include atât părți de hardware cât și de software special
concepute pentru a facilita inspecția vizuală a datelor medicale, biologice, etc. În
anumite cazuri, cum ar fi cel al datelor volumetrice, tehnicile de vizualizare sunt
esențiale pentru a permite eficiența inspecției vizuale. [1-4]
Tehnicile rapide de extragere a suprafeței, de vizualizare a volumelor și endoscopia
virtuală reprezintă aplicații practice ale procesului de vizualizare, aplicații ce pot fi
ilustrate în doua sau trei dimensiuni. [4]
Vizualizarea joacă un rol important în structurare aplicațiilor ce au ca specific
domeniul imagisticii medicale. Formularea de noi teorii și rafinarea algoritmilor deja
existenți, dezvoltarea și implementarea de instrumente și extinderea atribuțiilor
acestora până la un nivel foarte ridicat și precis au accelerat la un nivel foarte crescut.
Procesul de vizualizare aplicat direct în cercetarea medicală a apărut ca o disciplină
unică care vizează dezvoltarea de abordări care să permită cercetătorilor,
practicanților și oricăror altor utilizatori sa înțeleagă sistemele vii care reprezintă de
fapt punctul de interes al aplicațiilor [7]. Subiectele de investigare și dezvoltare
pornesc de la teorii de bază și sunt extinse până la nivelul în care acestea reprezintă
un fundament foarte bun pentru crearea de instrumente care să realizeze tot procesul
de vizualizare automat.[6]
Vizualizarea biomedicală depinde foarte mult de mediul de calcul, de dispozitivele
grafice hardware disponibile și de mecanismele software care facilitează interacțiunea
om – mașină de date pentru a facilita explorarea și analizarea sistemelor biologice
complexe. Abordările biomedicale vizuale includ generarea unor realități virtuale în
care se pot prezenta imaginile și informațiile aferente în două, trei sau patru
dimensiuni.
Dezvoltarea de aplicații interactive și automatizate de manipulare a imaginilor
multidimensionale și a datelor parametrice asociate și implementarea instrumentelor
de măsurare pentru evaluarea cantitativă a imaginilor și a datelor ce sunt extrase din
acestea implică integrarea unor procese interpretative de luare a deciziilor aplicate
direct în aplicațiile biomedicale. Această idee de a genera procese automatizate de
luare a unei decizii implică utilizarea și implementarea tehnicilor de inteligență
artificială. Astfel se face legătura între doua domenii foarte variate : procesarea și
lucrul cu imagini digitale și transpunerea acestora într-un mediu propice pentru o
evaluare vizuală.

29
2.5. MAMOGRAFIE – INFORMAȚII GENERALE

După foarte multe cercetări în domeniu, s-a ajuns la următoarea concluzie


categorică: cu cât cancerul este descoperit, diagnosticat și clasificat corespunzător,
mai repede, cu atât ratele de supraviețuire sunt mai mari și șansele ca pacienta să
trăiască mai mult de 5 ani, din momentul identificării maladiei, sunt mai ridicate.
Detectarea cancerului de sân se poate face prin mai multe metode, unele mai sigure
sau mai evazive decât altele, revenind la latitudinea medicului sa aleagă între
acestea. Cea mai întâlnită metodă este mamografia.
Mamografia este o imagine radiografică a sânului și se poate utiliza pentru a verifica
prezența cancerului de sân la femeile care nu prezintă semne sau simptome
caracteristice bolii. Acest tip se numește mamografie de screening deoarece este
făcută preventiv, fără a avea un motiv evident.
Mamografiile de screening implică, de cele mai multe ori, două sau mai multe imagini
cu raze X ale fiecărui sân, ce permit adesea detectarea prezenței tumorilor sau
maselor ce pot reprezenta un factor de risc. De asemenea, prin acest tip de
radiografie se poate detecta prezența microcalcificărilor (depozite mici de calciu),
care de cele mai multe ori garantează existența maladiei mamare.
Un alt tip de mamografii, care nu se încadrează în categoria screening, și anume de
diagnostic, este cel ce se utilizează pentru a verifica evoluția bolii sau pentru a se
valida diagnosticul, după ce s-a identificat un semn sau vreun simptom caracteristic.
Pe lângă prezența unui nodul, printre alte semne caracteristice pentru această
patologie se numără : durerile de sân, îngroșarea pielii sânului, evacuarea
mameloanelor sau cel mai întâlnit schimbări în dimensiunea și forma sânului. Cu toate
că detecția caracteristicilor anterioare determină un anumit factor de risc, acestea nu
garantează malignitatea ci pot fi semne de condiții benigne. O mamografie de
diagnosticare poate fi, de asemenea, utilizată pentru evaluarea evoluției condițiilor
patologice și modificărilor survenite în timpul unui tratament sau pentru vizualizarea
țesutului mamar atunci când este dificilă obținerea unei mamografii de screening din
cauza unor circumstanțe speciale.
O mamografie este o imagine realizată cu ajutorul razelor X ce înfățișează sânul.
Diferențele de țesut vor apărea ca nuanțe diferite de gri, iar grăsimea fiind relativ
radiolucentă, adică permite trecerea razelor X, este reprezentată prin culoarea negru.
De asemenea, tumorile vor apărea ca nuanțe de gri, în timp ce calcificările sau
microcalcificările sunt zone mai mici, dense, de culoare albă.
Eforturile de îmbunătățire a specificațiilor mamografiei de screening au condus la
dezvoltarea și acceptarea extinsă a monitorizării pe termen scurt a rezultatelor
probabil benigne. Scopul algoritmilor de evaluare a evoluției pe termen scurt al
rezultatelor fals pozitive este reducerea constatărilor fals pozitive, păstrând simultan
o sensibilitate ridicată pentru detectarea cancerului de sân în stadiu incipient [17].

30
Toate mamografiile sunt supravegheate și interpretate de către radiologi. Aceștia
sunt specialiști în domeniu și care au dobândit un anumit nivel de expertiză, astfel
dispunând de capacitatea de a interpreta aceste reprezentări grafice ale sânului. De-
a lungul timpului s-a observat clar faptul că în urma analizei corecte ale
mamografiilor, cancerul mamar a fost descoperit în stadii incipiente, a fost
diagnosticat corespunzător și tratat conform recomandărilor doctorilor, și astfel
numărul deceselor determinate de această maladie s-a redus considerabil. Trebuie
menționat că acest rezultat îmbucurător s-a înregistrat și datorită faptului că aceste
seturi de analize au fost realizate periodic și nu doar în cazuri extreme în care apăruse
deja simptome specifice. [17] Cu toate acestea, realizarea și interpretarea
mamografiilor este un proces complex, de durată dar care este absolut necesar
pentru creșterea șansei de viață. Pe lângă faptul că este un proces durabil, se pot
strecura foarte ușor erori atât în interpretarea acestora cât și în detectarea efectivă
a maselor cu caracteristice suspicioase, datorită faptului că observatorul uman nu
este o mașinărie automată, ci poate fi foarte ușor influențată de propriile limite. [18]
Experiența și cunoștințele acumulate sunt foarte importante, fără acestea nu s-ar fi
putut realiza atâtea descoperi, dar acestea nu sunt suficiente într-o lume aflată în
continuă dezvoltare. Se pune mai mult accentul pe rezultate și precizie decât pe
posesia de cunoștințe. S-a ajuns astfel la concluzia că este nevoie de mijloace și
metode performante, precise și clare de a interpreta mamografiile.
Pentru a ajunge la crearea unor aplicații sau aparate special concepute pentru
detectarea cancerului de sân a fost necesară o standardizare în interpretarea
mamografiilor. Colegiul American de Radiologie (ACR) a lucrat la o abordare ce a
vizat raportarea la mamografii pentru a reduce confuzia în citirea imaginilor mamare
și pentru a facilita monitorizarea rezultatelor. Astfel a apărut standardul BI-RADS
[17].

2.6. BI-RADS

Setul de clase BI-RADS reprezintă un standard internațional creat de Colegiul


American de Radiologie. Acesta este de fapt un lexicon ce reprezintă un sistem de
raportare a imaginii mamare și a seturilor de date existente care standardizează
distincțiile caracteristicilor mamografiei și de asemenea, terminologie folosită pentru
a le descrie [17].
Lexiconul BI-RADS include în primul rând descriptorii care sunt folosiți pentru a
prezice boala benignă sau malignă și are rolul de a ghida radiologii și medicii în
procesul de luare a deciziilor privind cancerul de sân și simultan pentru a facilita
managementul pe termen lung al pacientului. Mai mult, rezultate pot fi compilate
într-un format standard care permite colectarea, întreținerea și analiza datelor
demografice, mamografice și a output-urilor.

31
Cu toate că există reguli deja implementate și generalizate pentru caracterizarea
patologiei ca malignă sau benignă, radiologii se găsesc de multe ori într-o
imposibilitate de a clasifica toate leziunile ca problematice sau nu. Generarea unui
diagnostic de succes necesită utilizarea unor modele de căutare sistematice
construite în jurul prezenței unei multitudini de factori și caracteristici extrase din
imaginea analizată. Extinderea acestor modele sistematice se poate face până la
nivelul creării unor metode automate de diagnosticare, ce nu necesita implicarea
permanentă a unui factor uman și care pot fi lăsate sa proceseze informațiile
disponibile și să genereze un rezultat pe baza acestora. Bineînțeles este necesară
construirea unor funcții de sistem (reguli) în prealabil. Un astfel de sistem poate fi
alcătuit pe baza principiului de acționare și învățare al inteligenței artificiale, mai
exact prin intermediul unui algoritm de tip fuzzy, însă pentru a beneficia de
potențialul unui asemenea algoritm este necesară definirea unor reguli clare care să
determine apartenența output-ului la anumite clase.
Clasele trebuie să fie limitate din punct de vedere al caracteristicilor. Scopul este de
a avea un rezultat cât mai precis și personalizat. Încadrarea unei patologii doar în
doua cazuri posibile malign și benign nu mai este suficientă deoarece se urmărește
obținerea unei concluzii cât mai concrete ce nu lasă nici o șansă de interpretări
ulterioare. Atunci când variabilele predictive sunt numeroase și pot interacționa între
ele în atât de multe moduri diverse, strategiile ad-hoc bazate doar pe baza
experienței și a memoriei, metoda clasică de diagnosticare a radiologilor conduce, în
cele mai multe cazuri, la erori [18] și variabilitate în practică [19]. Astfel a apărut
interesul intens în elaborarea unor instrumente care să poată calcula o probabilitate
exactă de cancer pentru a ajuta la luarea deciziilor.
Pentru a realiza diagnosticarea automata a unei paciente, având ca punct de pornire
mamografia deja existentă și un set de caracteristici definitorii dobândite prin alte
mijloace, s-a ales ca metodă de abordare implementarea unui algoritm fuzzy care va
avea ca output clasa în care se încadrează patologia pacientei analizate. Clasa este
reprezentată de către clasificarea stabilită prin standardul BI-RADS.
Clasele utilizate pentru stabilirea unei apartenențe la BI-RADS sunt enumerate în
Tabel 1. În realizarea studiului de caz (cancerul de sân) s-a utilizat această clasificare
pentru a stabilii un diagnostic final și pentru a recomanda o posibilă strategie de
tratament. După cum a fost menționat anterior, sunt necesare anumite caracteristice
patologice, ce nu sunt identificate prin intermediul mamografiei, ci trebuie extrase
prin intermediul altor procedee medicale și introduse manual de către utilizatorul
aplicației în interfața grafică. Aceste proprietăți sunt diferite în funcție de formațiunile
identificate : mase sau calcificări. Astfel pentru mase se identifică : forma, conturul
și structura. În cazul calcificărilor caracteristicile sunt un pic mai diversificate
deoarece prima dată se determină tipul acestora : tipic beninge și microcalcificări. A
doua categorie reprezintă de fapt zona de interes pentru diagnosticare deoarece
prezintă un grad de suspiciune mai ridicat, aceasta împărțindu-se după tip în : izolate,
distribuite difuz, focare și formă. De asemenea criteriul „focare” și criteriul „formă”

32
mai sunt împărțite în câteva subcategorii, dar asupra acestora se va reveni într-un
mod mult mai detaliat în capitolul următor. [17]
Beneficiul major al acestui standard este faptul ca încadrează un anumit mod de
gândire ce limitează generalitatea constatărilor și le impune o apartenență la o
anumită categorie, astfel încât atunci când se atribuie un anumit set de informații
preliminare să fie posibilă calcularea statisticilor aferente. Această încadrare nu este
o cerință absolut necesară pentru a prezice un tratament corespunzător, dar cei mai
mulți radiologi o folosesc ca pe un punct intermediar în stabilirea unui diagnostic.
[17]

O scurtă descriere a clasificării după standardul BI-RADS și o recomandare minimă și


foarte generală pentru o schemă de tratament este prezentată în tabelul următor:

Categorie Evaluare Recomandare


Este necesară o evaluare Sunt necesare imagini suplimentare
0 suplimentară a imaginii pentru a stabilii o evaluare
Se continuă mamografiile de
1 Negativ screening
Constatări benigne Se continuă mamografiile de
2 (necanceroase) screening
Este necesară o mamografie de
3 Probabil benign urmărire după 6 luni

4 Anomalie suspectă Se poate să fie necesară o biopsie


Foarte suspect de
5 malignitate Este necesară o biopsie
Biopsia confirmă prezența
Biopsie cu caracter malign
cancerului înainte de începerea
sigur
6 tratamentului

Până la 9% din mamografiile de screening pentru cancerul mamar primesc o


categorie BI-RADS de 3, 4 sau 5, ceea ce înseamnă ca există anumite motive de
îngrijorare și că vor fi necesare investigații ulterioare.
BI-RADS 3 este foarte rar folosit astăzi pentru că prezintă un anumit grad de
generalitate și implică într-o oarecare măsură BI-RADS 4 sau 5, ce sunt categorii ce
conduc la biopsii pentru a da un diagnostic definitiv. Simultan clasa 3 are tendința de
a avea o valoare predictivă foarte redusă (mai mică decât 2%) ceea ce înseamnă că
șansa de a se obține un rezultat pozitiv din punct de vedere al diagnosticării cu cancer
de sân este infimă. O mamografie din categoria BI-RADS 4 are o valoare predictivă

33
de aproape 30%, pe când categoria 5 semnifică un rezultat pozitiv aproape sigur,
având valoarea predictivă de aproximativ 95%.
O altă trăsătură importantă vizată de acest standard este împărțirea densității sânului
în patru categorii care pot fi raportate. Radiologul care citește mamografia alege
categoria care descrie cel mai bine nivelul densității mamare observat pe filmul de
mamografie [18].

Aceste categorii sunt:


1. Țesut aproape exclusiv gras
2. Țesut dens
3. Țesut dens glandular combinat cu țesut conjunctiv fibros (densitate
fibroglandulară)
4. Țesut eterogen dens

34
3. Implementarea algoritmilor Fuzzy în procesarea de imagini medicale

În acest moment accentul se pune pe tehnicile fuzzy, în special pe segmentarea


imaginilor cu ajutorul clusterizării fuzzy. Ideea de bază a seturilor fuzzy este ușoară
și naturală. Aceasta se bazează pe faptul ca precizia strictă poate fi inutilă, în timp
ce direcțiile mai vagi pot fi interpretate într-o manieră mai personificată și prin astfel
pot fi urmate. În plus, acest tip particular de neclaritate nu prezintă un element
dependent de schimbare, ceea ce înseamnă că nu este probabilist, pe când multe
alte situații posibile implică în mod clar un element de șansă. Tocmai din această
cauză, modelele computaționale prin care se realizează o reprezentare matematică
și exactă ale sistemelor de viață, ar trebui să fie capabile să recunoască, să
interpreteze și să utilizeze, nu numai incertitudinile statistice, cât și cele fuzzy, care
sunt mult mai probabile.
Procesarea mamografiilor implică realizarea unei etape importante pentru procesul
de detectarea formațiunilor suspecte: segmentarea. Obiectivul acesteia este de a
împărți o imagine în regiuni semnificative, grupate după anumite trăsături cheie.
Erorile survenite în această etapă, vor afecta toate operațiile viitoare, deci se scopul
este să se folosească metode care încorporează incertitudinea definițiilor de obiect și
regiune și siguranța caracteristicilor, astfel încât să se reprezinte diverse obiecte
(regiuni). În mod ideal, într-o imagine segmentată, fiecare regiune trebuie să fie
omogenă dintr-un anumit punct de vedere precum nivelul de gri sau textura, în
același timp fiind necesar ca regiunile adiacente să fie semnificativ diferite.
Înainte de dezvoltarea tehnologiilor performante utilizate în domeniul medical ce au
condus la diagnosticul medical asistat de calculator, se identificaseră probleme în
ariile în care designeri de sistem erau experții umani. Cu toate acestea, analiza
imaginilor biomedicale necesită o abordare mult mai complexă ce implică integrarea
mai multor tipuri de tehnologii, foarte diferite din punct de vedere constituent.
Aplicația practică ce urmărește realizarea studiului de caz este realizată prim
compunerea a două părți importante : analizare și procesarea imaginilor și evaluarea
unor criterii prin intermediul unui algoritm fuzzy și oferirea unui output. Acesta este
reprezentat de determinarea apartenenței patologiei la o clasă BI-RADS. De
asemenea, aplicația conține și o interfață grafică ce facilitează comunicarea între
utilizatorul aplicației și procesele interne ce se desfășoară pe baza informațiilor
introduse. Pentru a putea explica în întregime tehnologiile integrate în dezvoltarea
aplicației, acestea se vor explica pe parcurs în secțiunile următoare, insistându-se
asupra caracteristicilor esențiale și vitale pentru elaborarea studiului de caz.

35
3.1. Etapa de procesare de imagini

Mărimea de intrare a aplicației este reprezentată de o mamografie. Se consideră ca


mamografia este obținută anterior și este deja în format digital. Pentru procesarea
acesteia s-a folosit un algoritm implementat în limbajul de programare C++, fiind
construit cu ajutorul editorului Microsoft Visual Studio 2017. Acesta este un mediu
integrat de dezvoltare (integrated development environment) sau IDE dezvoltat de
către Microsoft și este utilizat pentru a dezvolta programe de calculator, site-uri web,
aplicații și servicii web precum și aplicații mobile.
După cum a fost precizat anterior, pentru a putea extrage informații importante dintr-
o imagine digitală este necesar ca aceasta să treacă printr-o serie de transformări
preliminare, specifice întregului proces de procesare de imagini. Etapele necesare
sunt [23] :

 Îmbunătățire
 Segmentare
 Cuantificare
 Înregistrare
 Vizualizare

Ordinea acestor etape poate fi înțeleasă mai bine din următoarea figură:

36
Figura 8 - Etapele procesării de imagini

Pentru a putea realiza aceste operații într-un mod optim și corespunzător, în


implementarea acestei aplicații a fost utilizată biblioteca OpenCV 3. Aceasta este o
bibliotecă nativa cross-platform C++ ce se folosește în special în viziunea pe
calculator, în implementarea procesului învățarea automată și în algoritmii de
procesare de imagini.
Principiul de funcționare al aplicației este următorul : după lansarea în execuție a
acesteia, va fi disponibilă o interfață grafică prin intermediul căreia utilizatorul poate
alege ce imagine digitală să încarce pentru procesarea ulterioară. Imaginea digitală
este de fapt reprezentarea mamografiei i.e. punctul de pornire al procesului automat
de diagnosticare. Se verifică dacă imaginea a fost încărcată corespunzător și în cazul
în care nu sunt îndeplinite condițiile necesare atunci se va afișa un mesaj cu eroarea
apărută pentru a informa utilizatorul.
În momentul în care este încărcată imaginea, se deschide o fereastră ce afișează
imaginea citită și care permite utilizatorului să selecteze o zonă de interes pentru
analizele ulterioare. Este foarte important ca imaginile procesate să fie generalizate
într-o anumită măsură. Acest lucru implică transformarea imaginii într-o reprezentare
alb-negru, aducerea la o anumită dimensiune stabilită anterior, etc. Această
uniformizare se face deoarece este mult mai ușor să se analizeze un nivel mare de
date în momentul în care seturile de date existente și învățate de către procesul de
diagnosticare, sunt similare.
După cum este evidențiat în schema de mai sus, procesarea conține în primul rând
un set de transformări impuse. Se pune accentul pe modificarea histogramei, pe
aplicarea unor filtre pentru a elimina zgomotele străine (defectele sau obiectele care
pot atrage interpretări greșite), pe evidențierea anumitor trăsături, etc. De
37
asemenea, este necesar să se precizeze faptul că dacă se lucrează cu o imagine cu
fundal alb, atunci este bine ca acesta să fie transformat în negru deoarece acest lucru
va facilita discriminarea obiectelor de interes atunci când se vor aplica transformări
pentru detectarea marginilor pentru procesul de segmentare.
Există o multitudine de filtre disponibile pentru eliminarea zgomotelor dintr-o
imagine, acestea fiind implementate în biblioteca OpenCV. Alegerea unui anumit tip
de filtru pentru îmbunătățirea imaginii se face în funcție de rezultatul care se dorește
să se obțină și preferințele sunt câteodată alese într-o manieră subiectivă de către
cine implementează algoritmul. Același rezultat (sau aproximativ același) se poate
obține prin intermediul mai multor metode și tocmai datorită acestui fapt, alegerea
unei metode de filtrare nu este un proces singular și unic. Pentru a ilustra cu mai
multă exactitate efectul filtrelor și diferențele între metodele disponibile, ce sunt deja
implementate în OpenCV, a fost adăugată următoarea figură, obținută din
documentația oficială a bibliotecii utilizate.
Se pot observa foarte clar diferențele între imaginile succesive afișate. Sub fiecare
reprezentare este notată metoda de filtrare aplicată. Nu se poate spune că există o
singură abordare posibilă și universală, aceasta se alege în funcție de cazul existent.

Figura 9 - Exemplificarea efectului aplicării diferitelor metode de filtrare

Pentru a putea detecta formațiuni suspecte (din punct de vedere onco-medical) din
reprezentarea digitală a mamografiei, este necesar ca după procesul de filtrare să se
aplice tot un filtru, dar de evidențiere a marginilor. Acest tip particularizat de filtru
sharpening este util atunci când se dorește îmbunătățirea contururilor/marginilor
dintr-o imagine ce nu este suficient de clară. Procesul de evidențiere al trăsăturilor
specifice ale imaginilor se poate observa din următorul set de reprezentări:

38
Figura 10 - Ilustrarea schimbărilor determinate de aplicarea filtrului de evidențiere a trăsăturilor

Detecția formațiunilor cu aspect suspicios se face prin detectarea marginilor


obiectelor identificate prin procesul de segmentare. Acesta împarte mamografia în
mai multe zone în funcție de anumite trăsături definitorii. Datorită faptului ca din
imaginea inițială a fost extrasă și salvată doar o anumită zonă ce din punctul de
vedere al observatorului uman prezintă un anumit factor de risc, identificarea
obiectelor se face prin căutarea tuturor contururilor din imagine și prin evidențierea
grafică a celui mai mare contur.
Rezultatul final al algoritmului de procesare al imaginii digitale îl reprezintă
evidențierea zonei de interes în cadrul mamografiei inițiale. Acest rezultat este
punctul de plecare pentru construirea algoritmului fuzzy de diagnosticare automată.
Dacă se considera (în funcție de caracteristici pertinente) că formațiunea identificată
nu prezintă nici un factor de risc sau dacă nu se extrage nici un obiect suspicios,
atunci este afișat un mesaj corespunzător pentru a informa utilizatorul că sistemul a
terminat procesarea imaginii, indiferent de rezultatul trimis.

3.2. Etapa de implementare a algoritmului fuzzy de decizie automată

Performanța înaltă a tehnicilor de inteligență fuzzy a fost demonstrată practic în


numeroase situații prin intermediul a numeroase aplicații, la nivel mondial.
Rezultatele excelente împreună cu implementarea ușoară au arătat influența pe care
algoritmii bazați pe logică fuzzy au avut-o în implementarea dispozitivelor sau
tehnicilor din diferite domenii precum : controlul automat al diverșilor parametrii,
capacitatea de a detecta și recunoaște automat forme și margini (în special cu
ajutorul clasificatorilor de tip fuzzy), măsurare, psihologie cognitivă, etc. Cel mai
mare avantaj al utilizării inteligenței artificiale prin intermediul algoritmilor de tip
fuzzy este faptul ca se utilizează un model non-liniar, imprecis, complex obținut prin

39
transpunerea experienței și tehnologiei umane în reguli sau seturi de reguli de
deducere care utilizează variabile lingvistice. [21]
Pentru a putea realiza o analiză a studiului de caz prezentat în această lucrare a fost
necesară dezvoltarea unui algoritm fuzzy, ce pe baza unor funcții de sistem
predefinite, să fie capabil să ofere ca variabilă de ieșire, o clasificare a patologiei
pacientului analizat, clasificare ce se încadrează în standardul BI-RADS. Ca orice alt
algoritm, și cel de tip fuzzy are nevoie de variabile de intrare, acestea fiind fundația
pe care este construit raționamentul. În acest caz, datele de intrare sunt reprezentate
de caracteristici definitorii pentru maladia mamară, caracteristici ce se consideră a fi
identificate anterior și introduse în aplicație de către un utilizator, de cele mai multe
ori acesta fiind medicul.
Algoritmul fuzzy este construit cu ajutorul programului Matlab R2016a dezvoltat de
către MathWorks prin intermediul Fuzzy Logic Toolbox. Conceptul de bază care stă
la baza logicii fuzzy este acela al unei variabile lingvistice, adică o variabilă ale cărei
valori este reprezentată mai degrabă prin cuvinte decât prin numere. [21] O mare
parte din această abordare poate fi privită ca o metodologie de calcul cu cuvinte și
nu cu numere [22]. Deși, în mod normal cuvintele sunt în mod inerent mai puțin
precise decât numerele, utilizarea lor este mult mai apropiată de intuiția umană. Mai
mult, calculul cu cuvinte exploatează toleranța pentru imprecizie și, prin urmare,
scade costul soluției. Un alt concept de bază în logica fuzzy, care joacă un rol central
în majoritatea aplicațiilor sale, este cel al unei reguli fuzzy de tip if – then, sau pur și
simplu a unei reguli fuzzy [22]. Deși sistemele bazate pe reguli au o istorie lungă de
utilizare în inteligentă artificială, ceea ce lipsește în astfel de sisteme este un
mecanism de abordare a consecințelor fuzzy și a antecedentelor existente.

40
În logica specifică acestor tipuri de algoritmi, acest mecanism este furnizat de calculul
regulilor fuzzy. Calculul acestora servește ca bază pentru ceea ce se poate numi
Limbajul de Dependență și Comandă Fuzzy (Fuzzy Dependency and Command
Language - FDCL).
Fuzzy Logic Toolbox implementat de către Matlab folosește FDCL, dar nu într-un mod
explicit. În caseta de instrumente există funcții deja integrate care traduc soluția
umană în limbaj FDCL pentru a fi interpretat mai ușor în implementarea algoritmilor
viitori.[21-22]
După cum a fost menționat, algoritmul fuzzy se bazează pe regulile fuzzy ce au ca
punct de pornire variabilele lingvistice. Interfața Fuzzy Logic Toolbox oferă un
adjuvant grafic în construirea acestor reguli, în vizualizarea output-ului pe baza
acestora și în realizarea mai multor operații specifice, absolut necesare pentru
implementarea unei situații reale în reguli lingvistice.

O tendință care crește în popularitate se referă la utilizarea logicii specifice fuzzy în


combinație cu neurocomputing și algoritmi genetici. În general, cele trei elemente
menționate anterior, pot fi văzute ca și constituenți principali a ceea ce se poate numi
soft computing. Spre deosebire de calculatoarele tradiționale, care sunt
dezavantajate de viteza și greutatea întâlnită în procesul de rulare, calculatoarele
caracterizate de ideea de „soft computing” suportă imprecizia lumii reale. Principiul
de bază îl reprezintă : toleranța pentru imprecizie, incertitudine și adevărul parțial ce
trebuie exploatată până la momentul în care se obține și se garantează fezabilitatea
, robustețea și costul scăzut al soluției. În viitor, calculul soft ar putea juca un rol din
ce în ce mai important în conceperea și proiectarea sistemelor în care capacitățile și
performanțele sunt mult mai bune decât cel al sistemelor proiectate prin metode
convenționale.

41
4. Implementarea practică și analizarea rezultatelor obținute

Cancerul de sân reprezintă una dintre cauzele principale pentru creșterea mortalității
în rândul femeilor, fiind una dintre cele mai răspândite boli la nivel internațional.
Tocmai datorită acestui fapt sumbru, a apărut necesitatea dezvoltării unor sisteme
performante, capabile să asiste atât în tratarea acestei maladii și în creșterea
speranței de viață din momentul identificării, cât și în diagnosticarea în stadii cât mai
incipiente. Progresul tehnologic înregistrat în ultimele decenii, a fost vital pentru
înțelegerea unui aspect foarte pertinent : cu cât implicarea cercetătorilor, inginerilor,
medicilor sau oricăror persoane capabile din punct de vedere profesional, este mai
mare, cu atât rata de succes în tratarea pacientelor, este mult mai mare.

4.1. Analiza Datelor

Cercetările în domeniul onco-medical se împart în două mari categorii : detectarea și


tratarea. Acest studiu de caz urmează traiectoria detectării, având ca scop final
oferirea unei analize complexe, bazată atât pe studiul unei mamografii digitale, cât
și pe implementarea unui algoritm ce este capabil să automatizeze foarte mult tot
procesul de diagnosticare. Datorită faptului că înțelegerea umană referitoare la
domeniul medical se extinde și se extinde permanent, nu doar de rezultatele obținute
în cadrul acestei sfere de cercetare, ci și de propria experiență acumulată prin studiu
și experimente practice, trebuie precizat un lucru foarte important : schimbările
constante în domeniul cercetării medicale sunt absolut vitale pentru a obține rezultate
îmbucurătoare.

42
Influența tehnologiei asupra cercetărilor din domeniul oncologiei a putut fi observată
foarte clar prin implicarea acesteia în întregul proces medical, fără a elimina maniera
specific umană de diagnostic. Cu toate că scopul final este de a obține o automatizare
la nivel general din punct de vedere al identificării maladiei mamare, diagnosticul
oferit de un medic nu poate fi înlocuit sub nici o formă de diagnosticul oferit de o
aplicație. Se urmărește crearea sistem tehnologic, modern ce poate acționa ca un
adjuvant în luarea unei decizii, în depistarea unei afecțiuni, etc. Caracterul decizional
uman nu poate fi substituit sub nici o formă, dar poate fi susținut de algoritmi
implementați pe un sistem de calcul, ce garantează precizie, exactitate, viteză și
putere mare de calcul și care nu sunt influențați de erorile umane.

Imaginile biomedicale reprezintă chiar esența domeniului medical, pentru că aproape


orice analiză, mai mult sau mai puțin invazivă, necesită un suport grafic. Acestea
sunt modul prin noi putem înțelege mai în profunzime natura sistemelor biologice
umane. Orice imagine este de fapt o sursă imensă de informații și este absolut normal
să încercăm să profităm cât mai mult de această resursă.

În cazul specific al cancerului de sân, mamografia este punctul de pornire în


încercarea de diagnosticare și tratare. Pornind de la această reprezentare digitală se
pot realiza o multitudine de analize, operațiuni și interpretări care pot avea un impact
foarte mare în evoluția bolii. Dacă se dorește fie generarea unui diagnostic, fie
analizarea predispoziției la apariția acestei maladii, fie evoluția în timp, trebuie să se
ia în considerare că există o multitudine de factori de risc ce pot influența într-un mod
radical orice aspect. Printre acești factori se numără :

A. Vârsta
B. Istoricul familial al cancerului de sân la persoanele de sex feminin
C. Factori hormonali – menopauză decalată față de normal ( declanșată prea
devreme sau prea târziu), menstruație precoce
D. Stil de viață
E. Istoric personal al afecțiunilor maligne sau benigne
F. Iradieri în zona mamară
G. Boli de sân proliferative – în cazul pacientelor care nu au avut copii, care nu
au alăptat niciodată sau care au avut copii după vârsta de 30 de ani

Pentru a putea oferii un diagnostic corect, personalul medical trebuie să ia în


considerare acești factori și să ii interpreteze corespunzător. Implicarea acestor
factori este inclusă în clasificarea BI-RADS. Standardul internațional de încadrare a
evoluției cancerului de sân și a elementelor caracteristice, înglobează o serie de
proprietăți ce pot fi utilizate în automatizarea procesului de diagnosticare.

În cadrul acestui studiu de caz se pot identifica două mari procedee e facilitează
implicarea progreselor tehnologice : analiza mamografiilor cu ajutorul tehnicilor de
procesare de imagine și analiza unui set de caracteristici introduse manual, analiza
realizată cu ajutorul unui algoritm de tip fuzzy. Deoarece toate noțiunile teoretice

43
necesare pentru înțelegerea acestor două etape importante au fost prezentate în
capitolele anterioare, în cele ce urmează se va insista doar pe modurile în care
acestea au fost implementate în realizarea SSD-ului (Sistem Suport Decizie).

După cum a fost menționat, procesarea mamografiilor și analizarea caracteristicilor


prin intermediul algoritmului fuzzy sunt realizate separat, fiecare având o abordare
total diferită, prin intermediul a două tehnologii ce nu se aseamănă sub nici o formă,
și astfel vor fi tratate în mod individual. Singura legătură fizică, pe lângă subiectul
comun în jurul cărora acestea sunt construite, cancerul de sân, este înglobarea într-
o aplicație fizică, ce reprezintă realizarea practică a SSD. Aplicația construită reușește
să creeze un mod de comunicare între utilizator (medic sau asistentă) și partea
tehnica, algoritmică ce se află în spatele procesului automat de diagnosticare.

Explicarea modului de lucru al aplicației se va face într-o manieră secvențială ce va


urmării cu exactitate abordarea propusă pentru obținerea unor rezultate cât mai
concrete. Se va porni de la lansarea în execuție și automat pornirea proceselor și se
va ajunge la interpretarea, vizualizarea, stocarea și organizarea datelor introduse.
Stocarea și organizarea fac referite la faptul că datele introduse, atât factorii
caracteristici interpretați de personalul medical, cât și mamografiile analizate și
rezultatul procesării și identificării, vor fi memorați într-o unitate de stocare specială,
făcându-se o corelație între pacientul respectiv și rezultatele sale.

Pentru realizarea practică a analizei mamografiilor se consideră ca există deja o bază


de date ce conține suficiente imagini digitale. Cu toate că domeniul imagisticii, în
special domeniul imagisticii medicale, conține și achiziția de imagini, în analiza acestui
studiu de caz, s-a sărit peste această parte, deoarece punctul de interes nu este
considerat a fi reprezentat de modurile prin care aparatura medicală prelevă aceste
reproduceri biomedicale. Astfel, focusul primar al aplicației este aplicarea
tehnologiilor moderne de procesare de imagini, într-un mod cât mai detaliat, la nivel
de pixel, pentru a extrage zone de interes și caracteristicile aferente ale acestora,
ce pot prezenta un anumit grad de suspiciune în vederea diagnosticării cu maladia
mamară. Imaginile introduse sunt aduse la anumite standarde din punct de vedere
al dimensiunii, reprezentării grafice, astfel încât în momentul în care se aplică
algoritmi de procesare, să nu existe șansa ca rezultatele să fie în vreun fel alterate
de erori, generate de diferențe între culori, raport lungime lățime, etc.

De asemenea, algoritmi mai sus menționați au anumite particularități ce trebuie


îndeplinite pentru a putea fi aplicați și pentru a se garanta obținerea unor date de
ieșire corecte, precise, conforme cu realitatea și în special neinfluențate de limitările
observatorului uman. Astfel, se schimbă modul de execuție al unei analize sau modul
în care se ajunge la un diagnostic. Dacă inițial orice proces medical se baza doar pe
expertiza umană și pe abilitățile de observare a detaliilor ale unui medic, acum s-a
reușit să se ajungă la un mod de a corela atât abilitățile tehnice și progresul
tehnologic din domeniul ingineriei cu gândirea bazată pe intuiție și liber arbitru al
unui doctor.
44
Scopul acestei lucrări este de a propune o abordare pentru combinarea acestor două
mari domenii, într-o manieră concretă prin aplicarea exclusivă în studiul cancerului
de sân, și de a automatiza procesul de diagnosticare astfel încât acesta să nu fie
dependent de factori precum : timp de execuție, distanță fizică între pacientul în
cauză și medic, precizie de calcul, etc. După cum o să se poată observa în explicațiile
următoare că analiza mamografiilor se face aproape instant, se poate personaliza
prin alegerea unei zone de interes, astfel eliminându-se posibilele artefacte din
imagini care pot genera apariția erorilor, iar rezultatele sunt stocate pentru a putea
fi observate ulterior și pentru a se putea studia evoluția fiecărui caz.

Este foarte important de menționat faptul că datorită reglementărilor recente la nivel


european, anonimitatea datelor prelucrate este foarte importantă. Astfel nu se
lucrează cu numele persoanelor sau cu date confidențiale, ci numai cu un număr de
identificare unic pentru fiecare pacient, care este ulterior corelat cu persoana în
cauză. De asemenea, toate imaginile analizate și toate datele introduse sunt reale,
acestea reprezintă informații adevărate, lucrarea de față fiind realizată în colaborare
cu Institutul Oncologic București.

4.2. Analiza Imagistică în domeniul medical. Studiu de caz: Cancerul de Sân

După cum a fost menționat anterior, mamografia reprezintă punctul de plecare în


analiza imagistică medicală aplicată în cazul cancerului de sân. Prin definiție,
mamografia este o imagine radiografică a sânului și este utilizată primordial pentru
a verifica prezența cancerului de sân la femeile care nu prezintă încă semne sau
simptome caracteristice bolii. După realizarea unei astfel de reprezentări biomedicale,
se dorește ca printr-un proces complex de analiză să se determine în primul rând
dacă sunt prezente mase cu aspect ieșit din comun sau microcalcificări (depozite mici
de calciu). De cele mai multe ori, prezența acestora garantează existentă maladiei
mamare.

Pentru a înțelege mai bine detectarea formațiunilor în țesutul mamar și dacă acestea
au fost identificate corespunzător prin rularea analizei automate, este necesar ca
inițial să se prezinte o serie de imagini ce arată : țesut mamar sănătos și țesut mamar
cu diferite formațiuni identificate.

45
Figura 11 - Diferite tipuri de țesut mamar

După cum se poate observa din Figura 1 există o serie de interpretări ce se poate
face asupra mamografiilor din punct de vedere al țesutului constituent care poate
influența foarte mult rezultatul final al algortimilor de prelucrare și automat
diagnosticul. În toate cele patru imagini este reprezentat câte un caz benign sau
probabil bening, care nu prezintă motive de suspiciune sau vreun risc evident. Cu
toate că există diferențe foarte clare, ce ar putea conduce la concluzia că este

46
prezentat vreun caz cu tumoră, nu trebuie confundate diferențele de densitate ale
țesutului sau compoziția acestuia, cu prezența vreunei mase.

Figura 12 - Țesut mamar cu fibroadenom (tipic benign)

Figura 13 - Identificarea maselor (formă : rotunda, contur :circumscris )

Din punct de vedere al microcalcificărilor, acestea sunt mai greu de confundat cu


țesuturi normale, dar simultan sunt și mai dificil de observat cu ochiul liber. Tocmai
din această cauză, metoda automată și implementată cu ajutorul resurselor
tehnologice este preferată.

47
Figura 14 – Microcalcificări

Figura 15 - Tipuri de focare de microcalcificări

4.3. Analizarea caracteristicilor pentru implementarea algoritmului Fuzzy

Pentru a realiza partea de analiză a datelor și pentru a oferii o încadrare în clasificarea


internațională BI-RADS se studiază un set de caracteristici ce sunt observate și din
alte tipuri de analize anterioare și din studiul mamografiei curente. Clasele BI-RADS
reprezintă un standard recunoscut internațional, ce nu oferă o precizie de calcul
foarte strictă, dar care urmează foarte bine modelul unui algoritm de tip fuzzy, în
care chiar strictețea datelor poate conduce la apariția erorilor.

48
Probabilitate
BI-RAD Descriere Recomandare
de malignitate

Este nevoie de analize


0 - Analize suplimentare
suplimentare

Mamografie de
1 Mamografie normală 0
screening anuală

Mamografie de
2 Leziune beningnă 0
screening anuală

Mamografie de
screening la un
3 Leziune probabil benignă <2%
interval de maxim 6
luni

Leziune cu suspiciune de
4 ~20% Biopsie
malignitate

Leziune cu suspiciune
5 ~90% Biopsie
crescută de malignitate

Malignitate cusoscută
6 100% Tratament
prin intermediul biopsiei

Tabel 1 - Clasificare BI-RADS a leziunilor mamografice


Setul de proprietăți este introdus în etapa de
definire a parametrilor de intrare pentru algoritmul de tip fuzzy, stabilindu-se în
același timp și parametrii de ieșire ce sunt reprezentați de clasele de tip BI-RADS.
Aplicația dezvoltată este de fapt Sistemul Suport Decizie (SSD), ce integrează analiza
imagistică a tumorilor în cancerul de sân și analiza acestora cu ajutorul tehnicilor de
inteligență artificială prin intermediul unui algoritm de tip fuzzy.

49
Caracteristicile observate de medic și analizate și procesate de algoritmul fuzzy în
urma introducerii prin intermediul interfeței grafice sunt următoarele :

I. Mase
a. Formă
1. Neregulată
2. Rotundă
3. Ovală
4. Lobulară

b. Contururi
1. Microlobulate
2. Șterse
3. Spiculații
4. Circumscrise

c. Structură
1. Omogenă
2. Neomogenă
II. Calcificări

a. Tipic BENIGNE

b. MICROCALCIFICĂRI (calcificări sub 1mm)

1. IZOLATE

2. DISTRIBUITE DIFUZ

3. FOCARE (peste 5𝑐𝑚2 )


A. Rotunde
B. Alte forme

4. FORMĂ MICROCALCIFICĂRI
A. Rotunde
B. Inelare
C. Pulverulente ~ prea mici
D. Neregulate
E. Lineare regulate
F. Lineare neregulate
G. Arborescente

4.4. Realizarea practică Sistem Suport Decizie

50
În realizarea practică a sistemului automat de diagnosticare au fost combinate mai
multe tehnologii după cum urmează :

A. Pentru partea de procesare de imagini și imagistică medicală a fost dezvoltat


un algoritm în limbajul de programare C++, la care a fost adăugată biblioteca
OpenCV. Această bibliotecă are ca scop fix prelucrarea de imagini, având o
serie de funcții deja implementate, ce au ușurat foarte mult nivelul de muncă
necesar pentru analizarea mamografiilor. Cu ajutorul OpenCV a fost realizată
și detectarea formațiunilor ce prezentau un grad de risc și extragerea de
informații referitoare la acele formațiuni, informații precum : dimensiunea
conturului, suprafața obiectului identificat, evidențierea acestuia, etc.
Dezvoltarea a fost realizată în Microsoft Visual Studio Community 2017.

B. Pentru partea de implementare a algoritmului fuzzy a fost utilizat Matlab


R2016a dezvoltat de către MathWorks deoarece acest program dispune de un
instrument numit Fuzzy Logic Toolbox. Prin intermediul acestuia a fost
construit întregul algoritm fuzzy, de la definirea mărimilor de intrare și de
ieșire, până la definirea regulilor de execuție și a funcțiilor de sistem. Fuzzy
Logic Toolbox oferă un adjuvant grafic în reprezentarea algoritmică a situațiilor
reale prin regulile lingvistice.

C. Interfața grafică a fost realizată cu ajutorul unui framework numit QT ce a fost


integrat în IDE-ul Microsoft Visual Studio, astfel construindu-se o legătură
fizică între interfața grafică (partea de front-end) și componentele de
algoritmică și procesare de date (partea de back-end).

Este foarte important de precizat faptul ca aplicația dezvoltată conține mai multe
module. Aceste trei module sunt reprezentate de tipul de acțiune desfășurată : un
modul conține analiza propriu-zisă a mamografiei cu tot cu stocarea imaginilor
rezultate în urma prelucrării, un modul conține introducerea și analizarea
caracteristicilor identificate anterior de către o persoană calificată medical și
generarea unui output, care este de fapt apartenența la o anumită clasă BI-RAD și
un alt modul care permite observarea unor analize deja existente pe baza identificării
pacientului cu un anumit număr de identificare. Aceste module sunt foarte importante
pentru că urmăresc sensul de execuție al oricărei analize și pot fi realizate ori simultan
ori fiecare pe rând, după cum este intenția utilizatorului.

51
4.4.1 Pornirea aplicației

În momentul lansării în execuție al aplicației va apărea un ecran de logare. Pe lângă


informațiile normale care sunt introduse la orice operație de login, se obeservă
existență unui câmp extra și anume: tip utilizator. Pentru aceasta informație,
utilizatorul trebuie să aleagă între cele 3 opțiuni disponibile : admin, doctor și
asistentă. Această selecție este foarte importantă pentru acțiunile următoare din
aplicație.

Fiecare tip de utilizator are un set de drepturi și permisiuni specifice referitoare la


fiecare modul din cadrul aplicației. În funcție de tipul utilizatorului logat se
facilitează sau se restricționează accesul la un anumit modul.

Figura 16 - Pagina de logare

Drepturile de utilizare a aplicației și acces la cele trei module în funcție de tipul


utilizatorului autentificat sunt următoarele :

52
 Utilizatorul de tip Admin : are drepturi absolute în cadrul aplicației, are acces
la toate cele trei module și poate să gestioneze restul utilizatorilor, poate
adăuga sau șterge utilizatori noi.
 Utilizatorul de tip Medic : are acces la toate modulele din aplicație, poate
realiza cele doua tipuri de analize, poate stoca informații despre pacienți și
poate vizualiza evoluția pacienților prin încărcarea rezultatelor anterioare.
 Utilizatorul de tip Asistent/Asistentă : are acces doar la modulul de
vizualizare al analizelor anterioare și nu poate realiza nici un tip de analiză
(nici a unei mamografii, nici a caracteristicilor definitorii)

În urma acționării butonului de Login se verifică în primul rând dacă toate câmpurile
au fost completate. Dacă această cerință nu a fost îndeplinită se afișează o alertă cu
un mesaj corespunzător :

Figura 17 - Eroare apărută la Login

Dacă numele de utilizator și/sau parola introduse, nu sunt corecte, atunci se afișează
un mesaj de eroare și procesul de logare este oprit până când validarea datelor
introduse a fost realizată cu succes.

53
Figura 18 - Eroare apărută în cazul introducerii a unor date de logare invalide

Dacă utilizatorul și parola sunt corecte, după apăsarea butonul de Login apare un
mesaj corespunzător și utilizatorul accesează automat pagina principală a aplicației.

Figura 19 - Confirmarea autentificării corecte

54
De asemenea, în pagina de Login mai există un buton de Reset care prin acționarea
sa șterge toatei informațiile completate, pentru a ajuta utilizatorul să realizeze
această operație mult mai repede.

În momentul în care utilizatorul ajunge în pagina principală poate alege una dintre
cele patru opțiuni disponibile : accesarea modului de analizare a mamografiei,
accesarea modulului de analizare a criteriilor prin intermediul algoritmului fuzzy,
accesarea modului de încărcare a rezultatelor deja existente ale pacienților anteriori
sau pur și simplu închiderea aplicației.

Figura 20 - Pagina principală a aplicației

În acest moment se face diferențierea clară între utilizatorii de tip Doctor și


Administrator și utilizatorii de tip Asistent. După cum a fost precizat anterior, accesul
este restricționat pentru Asistent, iar dacă se încearcă acționarea butonului Analize
Image sau Insert Criteria se va afișa o eroare cu un mesaj corespunzător, fără a se
redirecționa automat către paginile modulelor respective.

55
Figura 21 - Eroare lipsă acces

4.4.2 Modulul de procesare și analiză a mamografiilor

Figura 22 - Prezentare generală a modulului de procesare și analiză a mamografiilor

După cum se poate observa din imaginea de mai sus, acțiunile posibile din această
interfață sunt diversificate și urmăresc un mod de parcurgere al operațiilor într-o
anumită ordine specifică. Modul în care se realizează operațiile este următorul :

56
 Se completează câmpul Patient Id cu numărul unic de identificare al
pacientului; dacă acesta nu a fost completat, aplicația nu permite trecerea la
următorul pas deoarece va afișa o eroare corespunzătoare:

Figura 23 - Eroare generată de lipsa numărului de identificare al pacientului

 Se încarcă o imagine din calculator, din baza de mamografii locală; dacă


imaginea a fost încărcată corespunzător se afișează un mesaj de confirmare.
În caz contrar se afișează eroarea care a generat oprirea procesului de
execuție.

Figura 24 - Eroare generată de lipsa unui fișier încărcat

Figura 25 - Confirmare apărută după încărcarea unei imagini pentru procesare

 În momentul în care se încarcă imaginea cu succes aceasta se va vedea în


aplicație pentru a vedea evoluția și rezultatul analizei. Sub eticheta Uploaded
Image se poate vedea imaginea ce va fi analizată. Dimensiunea acesteia este
modificată doar în interfață pentru a fi vizualizată mai bine de către utilizator.

57
Figura 26 - Afișarea imaginii inițiale în interfața grafică

 După ce imaginea a fost încărcată, se trece la selectarea zonei de interes prin


intermediul unui selector de tip Region of Interest facilitat de biblioteca
OpenCV. După selectarea zonei cu ajutorul dreptunghiului albastru, se apasă
tasta Enter .Algoritmul de procesare implementat în OpenCV va utiliza această
nouă imagine creată ca punct de pornire pentru toate procesele de analiză.

Figura 27 - Selectarea regiunii de interes

58
 Prin intermediul regiunii selectate se creează o imagine nouă ce va fi afișată
sub eticheta Region of Interest.

 Prin acționarea butonului Perform Analysis se execută algoritmii de procesare


implementați în partea de back-end cu ajutorul OpenCV. Rezultatul final al
procesării se va încărca automat în spațiul special destinat, sub eticheta
Analysis Result. De asemenea, toate informațiile extrase din imagine, precum
suprafața regiunii determinate, dimensiunea conturului se va afișa în regiunea
Patient Information.
 Prin apăsarea butonului Reset se golesc toate câmpurile și se poate realiza o
nouă analiză.
 Prin apăsarea butonului Close se închide fereastra curentă și se ajunge din nou
în meniul principal.
 Prin acționarea butonului Insert Criteria se lansează în execuție modului de
analizare a caracteristicilor specifice pentru mase sau micro-calcificări.
 În momentul în care s-a terminat analiza din punct de vedere imagistic, au fost
salvate toate informațiile în fișiere (.jpg, .txt), în denumirea cărora s-a adăugat
și numărul de identificare al pacientului, pentru o mai ușoară prelucrare/afișare
ulterioară.

Figura 28 - Afișarea imaginii rezultate în urma selectării regiunii de interes în interfața grafică

59
Cu toate că în interfața grafică
de comunicare cu
utilizatorul sunt afișate doar
două dintre etapele prin care
trece mamografia
digitală în procesul de
prelucrare, trebuie
menționat că aceasta trece prin
mai multe stagii de
prelucrare care vor fi
exemplificate în următoarea
serie de imagini.
A. B.
C.

Figura 29 - Afișarea rezulatelor finale ale procesării de imagini

D. E. F.

60
G. H.

A. Imaginea inițială cu selectorul regiunii de interes (ROI)


B. Noua imagine generată prin ROI
61
C. Imaginea care are fundalul negru asigurat
D. Aplicarea unui filtru de ascuțire/evidențiere a trăsăturilor
E. Aplicarea filtrului Laplace
F. Aplicare transformatei Canny ce ajută la extragerea trăsăturilor importante din
imagine
G. Aplicarea unui filtru de estompare a defectelor și artefactelor ce pot determina
apariția erorilor ~ filtru bilateral
H. Rezultatul final al algoritmului de procesare

62
4.4.3 Modulul de inserare a caracteristicilor și interpretare a acestora

Caracteristicile de definire a posibilelor mase sau microcalcificări sunt introduse


manual de către un medic și sunt interpretate automat prin intermediul unui
algoritm de tip fuzzy. Construirea algoritmului a fost făcută, după cum a fost
precizat anterior cu ajutorul Fuzzy Logic Toolbox. Acesta oferă un instrument
grafic, intuitiv de a crea regulile semantice, funcțiile de sistem și de a defini
variabilele de intrare și ieșire. În cazul concret al studiului de caz ce vizează
diagnosticarea cancerului de sân variabilele de intrare sunt caracteristici ce
definesc masele (formă, contururi și structură) și depozitele mici de calciu (tipul,
distribuirea, forma și tipul).

După definirea sistemului DiagnosticFuzzy în Matlab s-au stabilit următoarele :

 Variabile de intrare :
o Formă ~ neregulată, rotundă, ovală, lobulară
o Contur ~ microlobulate, șterse, spiculații, circumscrise
o Structură ~ omogenă, neomogenă
o Calcificări ~ tip : tipic benigne, microcalcificări
o TipuriMicrocalcificări ~ izolate, distribuite difuz, focare
o FormăMicrocalcificări ~rotunde, inelare, purvelurente, neregulate,
liniare regulate, lineare neregulate, arborescente
o TipuriFocare ~ rotunde, alte forme
 Variabile de ieșire :
o Diagnostic: negativ, benign, probabilBenign, suspiciuneDeMalign,
probabilMalign, malign

Figura 30 - Definiea algoritmului fuzzy în Fuzzy Logic Toolbox


Pe baza variabilelor de mai sus se creează reguli lingvistice ce urmează modelul
unor funcții de apartenență / sistem. Prin definirea acestor funcții se construiește
de fapt principiul de acționare al algoritmului de inteligență artificială. Regulile
de apartenență ajută sistemul în cauză să învețe un anumit principiu de acționare
prin care se simulează capacitatea umană de decizie centrată în jurul idee de
liber arbitru.

Este nevoie ca pentru a se asigura eficiența și precizia acestui tip de algoritm să


se asigure definirea oricărei situații posibile ce poate rezulta din combinarea
parametrilor introduși. Dacă se ajunge în situația în care variabilele de intrare
sunt introduse într-o anumită formă ce nu este definită anterior printr-o regulă
lingvistică, sistemul nu va ști cum să „reacționeze” și atunci se va ajunge într-o
situație în care nu există vreun rezultat definit (în cazul curent: diagnostic).

Modul de construire al algoritmului fuzzy în Matlab este ilustrat în următoarea


serie de imagini.

Figura 31 - Definirea variabilelor de intrare și de ieșire în Fuzzy Logic Toolbox


Figura 32 - Ilustrarea regulilor de sistem în Fuzzy Logic Toolbox

Toate regulile sunt construite cu ajutorul unei interfețe grafice special creată cu
acest scop urmând structura :

Dacă (inputVariabilă este ... ) și (inputVariabilă este ... ) și (inputVariabilă este


... ) ... atunci (outputVariabilă este ...)

Din această interfață se pot stabilii mai mulți parametrii precum : conectorul (și
/ sau), se pot nega parametrii pentru a valida valoarea de adevăr a acestora și
se poate stabilii importanța acestora.

Figura 33 - Definirea regulilor bazate pe variabile lingvistice în Fuzzy Logic Toolbox


În momentul în care algoritmul fuzzy este bine construit și definit, se poate trece
la încărcarea acestuia în programul C++. Fișierul generat de către Matlab
(DiagnosticareFuzzy.fis) nu este încărcat în forma sa cea mai de bază ci regulile
sunt prelucrate pentru a putea fi importate direct de către interfață și de către
algoritmii implementați în limbajul C++.

Din punct de vedere al aplicației ce urmărește realizarea practică a SSD-ului,


utilizatorul poate să introducă parametrii anteriori prin intermediul unei interfețe
grafice. Parametrii sunt organizați în două categorii principale : cei ce definesc
masele și cei ce definesc calcificările. Fiecare dintre cele două categorii este
evidențiată prin încadrarea într-o regiune specifică, fiecare având și un buton de
Reset pentru ștergerea rapidă a valorilor introduse fără a fi nevoie de intervenția
utilizatorului asupra fiecărui câmp (selector).

Figura 34 - Analizarea criteriilor


Dacă se acționează butonul Analyse fără a fi completate toate câmpurile, se va
afișa o eroare cu un mesaj corepunzător:

Figura 35 - Eroare generată de lansarea în execuție a modulului de analizare a criteriilor, fară a avea completate toate
varibilele

După ce au fost introduse caracteristicile de către medic, se acționează butonul


Analyse și astfel se pornește procesul de diagnosticare automată.

Figura 36 - Rezultatul generat de rularea cu succes a diagnosticării automatizate


Algoritmul fuzzy implementat este rulat și se generează un output automat.
Informațiile rezultate vor fi afișate în interfața grafică, în câmpurile special create.
Pentru ca rezultatele generate să fie mai ușor interpretate de către orice utilizator
și nu numai de o persoană ce deține cunoștințe medicale, se afișează și o
interpretare scurtă.

După cum a fost menționat anterior, output-ul acestui sistem este reprezentat de
către apartenența la o clasă BI-RAD. Standardul internațional oferă și o
recomandare, din punct de vedere imagistic pentru viitoare acțiuni ce trebuie
urmate pentru a stabilii un diagnostic corespunzător și pentru a studia evoluția
cazurilor analizate.

Fiecare selector are prevăzută și o varianta nu se identifică (not applicable) ce


are rolul de a acoperi și cazul în care o anumită caracteristică nu este identificată
în mamografia sau analiza anterioară. Existența acestei variante a apărut din
necesitatea de a avea o opțiune pentru fiecare caz posibil, deoarece se pot analiza
și mamografii care nu prezintă nici o leziune și care apar a fi perfect sănătoase,
din punct de vedere al analizei imagistice, bineînțeles. Oferirea unui diagnostic
100% corect presupune mai mult decât analiza unei mamografii. Trebuie luat în
considerare că pentru a diagnostica maladia oncologică sunt necesare și alte
analize de sânge, de hormoni, de țesut, etc. Tocmai din acest motiv se poate
discuta despre anumite limitări ce pot apărea în implementarea unui astfel de
sistem.

4.4.4 Modulul de încărcare a datelor pacienților

Acest modul este singurul în care utilizatorul de tip Asistent/Asistentă are acces și
are ca scop încărcarea datelor rezultate în urma analizelor anterioare.

Figura 37 - Interfața grafică pentru vizualizarea datelor aferente unui anumit pacient
Încărcarea fișierelor se face pe baza ID-ului pacientului. Dacă pacientul cu ID-ul
introdus nu se găsește în lista analizelor efectuate anterior se va afișa o eroare cu
un mesaj corespunzător. De asemenea, dacă se dorește încărcarea datelor fără a
introduce un id de pacient, se va afișa următoarea eroare:

Figura 38 - Eroare generată de lipsa numărului unic de identificare pentru pacient

Aceast modul conține și un buton de Reset care prin acționare șterge toate
câmpurile, astfel încât să se poată realiza o noua vizualizare a datelor instant.

Prin acționarea butonului Load Data se vor căuta în unitatea de stocare fișierele
aferente pacientului respectiv și se vor afișa în cămpurile aferente.
Figura 39 - Afișarea datelor/analizelor corespunzătoare unui anumit pacient

Modulul acesta poate fi accesat atât din pagina principală cât și din pagina de
procesare a mamografiilor.

Prin integrarea acestor module într-o singură aplicație s-a realizat abordarea
practică a Sistemului Suport Decizie (SSD) în diagnosticarea maladiei oncologice
mamare. Studiul de caz conține o analiză complexă a mai multor cazuri reale,
prelevate cu ajutorul unei colaborări cu Institutul Oncologic din București.
Imaginile digitale utilizate pentru exemplificarea diferitelor operațiuni, analize și
procedee aparțin unor cazuri reale, astfel ilustrându-se rata de succes aplicației în
cauză.

Trebuie evidențiat faptul că în explicarea detaliilor aferente procesului de execuție,


s-au punctat doar detaliile vitale pentru executarea unui proces automatizat de
diagnosticare din punctul de vedere al unui utilizator ce nu este familiar cu modul
de lucru al aplicației. Pașii ce au fost urmați au reprezentat doar o proiectare
practică a algoritmilor de procesare de imagini și de integrare a inteligenței
artificiale în imagistica medicală. Deoarece printre obiectivele acestei lucrări se
numără și implementarea unei metode complexe și moderne de generare
automată a unui diagnostic precis, care să fie aplicabilă în viată de zi cu zi, s-a
considerat că realizarea comunicării utilizatorului cu abordarea tehnică, prin
intermediul interfeței grafice, să se realizeze printr-o abordare, care încă de la
prima vedere este și ușor de utilizat și sugestivă din punct de vedere al pașilor ce
trebuie urmați.

Modulele integrate se pot utiliza individual, nu este obligatorie o utilizare


secvențială, impusă după o anumită regulă de parcurs, dar pentru o mai mare
acuratețe a rezultatului final, este recomandat să se realizeze atât o analiză a
mamografiei cât și o analiză a caracteristicilor aferente.
Aplicația dezvoltată acoperă toate cazurile posibile din punct de vedere al
procesului de diagnosticare cu cancer de sân, urmărind o traiectorie de execuție
ce are ca punct de pornire o reprezentare biomedicală a țesutului mamar. Nu se
analizează doar cazurile în care există o siguranță în ceea ce privește prezența
maladiei oncologice, ci și cele în care pacientele sunt sănătoase și nu prezintă nici
un factor de risc. Astfel, gradul de aplicabilitate al acestei abordări practice crește
substanțial, deoarece poate fi inclusă în evaluarea mamografiei de screening, care
după cum a fost menționat anterior se realizează ca un control de rutină la o
anumită perioadă de timp, preferabil anual, și poate oferi un rezultat și o
recomandare în funcție de evoluția pe parcursul unei perioade mai lungi de timp.

5. Concluzie
Bibliografie :
1. Bezdek JC, Hall LO, Clarke LP. Review of MR image segmentation
techniques using pattern recognition. MedPhys. 1993;20(4):1033–1048.
2. Castleman KR. Digital Image Processing. Upper Saddle River: Prentice Hall;
1996.
3. Rosenfeld A, Kak AC. Digital Image Processing. New York: Academic Press;
1982.
4. Sonka M, Hlavac V, Boyle R. Image Processing, Analysis, and Machine
Vision. Pacific Grove, CA: PWS Publishing; 1999.
5. Gonzalez RC, Woods RE. Digital Image Processing. Reading, MA: Addison-
Wesley Publishing Company; 1993.
6. Mitiche A, Aggarwal JK. Image segmentation by conventional and
information-integrating techniques: A synopsis. Image and Vision
Computing. 1985;3(2):50–62.
7. Cardoso JS, Corte-Real L. Toward a generic evaluation of image
segmentation. IEEE Trans Image Process. 2005;14(11):1773–1782.
8. Mitiche A, Aggar JK. Image segmentation by conventional and information-
integrating techniques: A synopsis. Image and Vision Computing.
1985;3(2):50–62.
9. Ranganath H. S., Kuntimad G., Johnson J. L. Pulse coupled neural networks
for image processing. Proceedings of the IEEE Southeastcon '95. “Visualize
the Future”; 1995; pp. 37–43.
10.Balakumaran T., Vennila I. L. A., Shankar C. G. Detection of
microcalcification in mammograms using wavelet transform and fuzzy shell
clustering. International Journal of Computer Science and Information
Technology. 2010;7(1):121–125. Diego, CA, USA, 2008. – 984 p.
11.Dhawan A. P., Chitre Y. S., Moskowitz M., Eric G. Classification of
mammographic microcalcification and structural features using an artificial
neural network. Proceedings of the Annual International Conference of the
IEEE Engineering in Medicine and Biology Society; 1991; pp. 1105–1106.
12.Widrow B., Winter R. G., Baxter R. A. Layered neural nets for pattern
recognition. IEEE Transactions on Acoustics, Speech, and Signal
Processing. 1988;36(7):1109–1118. doi: 10.1109/29.1638
13.I.Dumitrache, “Ingineria Reglarii Automate (Automatic Control
Engineering), Politehnica Press, 2005
14. https://www.embs.org/about-biomedical-engineering/our-areas-of-
research/biomedical-imaging-image-processing/
15.IMAGE PROCESSING AND ARTIFICIAL INTELLIGENCE FOR. DETECTION
AND INTERPRETATION OF ULTRASONIC TEST SIGNALS* INTRODUCTION
Keith s. Pickens, John C. Lusth, Pamela K. Fink, Karol K. Palmer, Ernest A.
Franke Southwest Research Institute San Antonio, Texas
16.Mehdy, M. M. et al. “Artificial Neural Networks in Image Processing for Early
Detection of Breast Cancer.” Computational and Mathematical Methods in
Medicine 2017 (2017): 2610628. PMC. Web. 9 June 2018.
17.Sickles EA. Periodic mammographic follow-up of probably benign lesions:
results in 3,184 consecutive cases. Radiology. 1991;179(2):463–468. doi:
10.1148/radiology.179.2.2014293.
18. American College of Radiology. Breast Imaging Reporting and Data
System (BIRADS) 4th edition. Reston, Va, USA: American College of
Radiology; 2003.
19.Kahneman D, Slovic P, Tversky A. Judgment under Uncertainty: Heuristics
and Biases. Cambridge, UK: Cambridge University Press; 2001.
20. Elmore JG, Wells CK, Lee CH, Howard DH, Feinstein AR. Variability in
radiologists’ interpretations of mammograms. The New England Journal of
Medicine. 1994;331(22):1493–1499.
21. https://www.mathworks.com/help/fuzzy/what-is-fuzzy-logic.html
22. https://www.mathworks.com/help/fuzzy/foundations-of-fuzzy-logic.html

23.Handbook of Medical Image Processing and Analysis, 2nd Edition, I.N.


Bankman (Ed.), Academic Press, ISBN 0123739047, San Diego, CA,
USA, 2008. – 984 p.

S-ar putea să vă placă și