Sunteți pe pagina 1din 27

Clasificarea și detecția

tumorilor cerebrale

Student Nicolin Delia


Cuprins

INTRODUCERE.......................................................................................................................................3

2. PREZENTARE GENERALĂ PRIVIND ÎNVĂȚAREA PROFUNDĂ...............................................................5

2.1 Introducere.................................................................................................................................5

2.2 Rețelele neuronale......................................................................................................................8

2.2.1 Rețeaua neuronală artificială profundă( ANN)......................................................................9

2.2.2 Rețele neuronale recurente (RNN).....................................................................................11

2.3 Aplicațiile învățării profunde (deep learning)............................................................................13

3. Metodologie....................................................................................................................................14

3.1 Achiziția de date........................................................................................................................15

3.2 Segmentarea imaginilor.............................................................................................................16

3.3 Extragerea și reducerea caracteristicilor..............................................................................21

3.4 Clasificarea.................................................................................................................................21
INTRODUCERE
O tumoare cerebrală sau neoplasm intracranian apare atunci când celule anormale se formează în
creier. Există două tipuri principale de tumori: malignă sau canceroasă și benignă. Tumorile
canceroase pot fi împărțite în tumori principale, ce apar direct pe creier și acelea care s-au răspândit
din altă parte, cunoscute ca și tumori- metastaze cerebrale. Acest articol se axează, în principal, pe
tumorile ce apar pe creier. Toate tipurile de tumori cerebrale produc simptome ce variază în funcție
de partea implicată a creierului. Acestea pot include dureri de cap, convulsii, tulburări de vedere,
stări de vomă și schimbări mentale. Durerea de cap este, în mod clasic, mai puternică dimineața și
dispare după vomitare. Mai multe probleme specifice pot include dificultăți la mers, în timpul vorbirii
sau senzoriale. Pe măsură ce boala progresează, se pot întâlni cazuri de pierdere a cunoștinței.

Cauza celor mai multe dintre aceste cazuri este necunoscută. Factorii de risc ce ar putea fi implicați
ocazional, includ un număr de sindromuri genetice precum neurofibromatoza, dar și expunerea la
substanța chimică clorură de vinil, virusul Epstein-Barr și radiații ionizante.Deși există semne de
îngrijorare privind utilizarea telefonului mobil, dovezile nu sunt clare. Cele mai uzuale tipuri de
tumori primare, la adulți, sunt: meningiomul și astrocitomul, precum glioblastomul. La copii, tipul cel
mai întâlnit este meduloblastomul.[3] Diagnosticul este dat în general prin examinare medicală,
împreună cu o tomografie computerizată sau imagistică prin rezonanță magnetică.După
diagnosticare, boala este, în general, confirmată prin biopsie.Plecând de la constatarea tumorilor,
acestea sunt împărțite în diferite grade de severitate.

Se cunosc aproximativ 120 de tipuri de tumori cerebrale, diferentiate prin modul de aparitie,
localizare si evolutie. Pot fi primare - aparute initial la nivelul sistemului nervos central sau
secundare, generale de un cancer care vizieaza inital un alt organ.

Principalele tipuri sunt :

 Neurinomul acustic, la nivelul aparatului vestibular;


 Gliomul este un tip de tumoare care apare in creier si maduva spinarii, fiind format din celule
gliale, care se dezvolta haotic. Sunt cele mai frecvente tipuri de tumori cerebrale primare
(mereu maligne), peste 50%; include astrocitoamele, ependimoamele.
 Astrocitomul, printre cele mai frecvente tipuri de tumori cerebrale, poate sa fie benign sau
malign si se poate localiza oriunde la nivelul creierului sau maduvei spinarii;
 Ependimom - un tip de tumora maligna rara, dar foarte agresiva (face parte din categoria
glioamelor);
 Carcinomul plexului coroid - un tip rar de carcinom cerebral, care afecteaza mai ales copiii;
 Craniofaringiom - un tip rar de tumora cerebrala benigna, care apare in vecinatatea glandei
pituitare;
 Meningiomul este cel mai des o tumora benigna, dezvoltata din celulele arahnoidei (una din
membranele care imbraca si protejeaza creierul). Reprezinta circa 20% din tumorile primitive
intracraniene, fiind pe locul al doilea dupa glioame. Apare la adulti, mai ales la feme
 Metastazele cerebrale - sunt tumori secundare prin migrarea unor celule canceroase de la
alte organe afectate
 Tumori hipofizare (pituitare), sunt tumori ale glandei pituitare (glanda situata intre
emisferele cerebrale), cu rol endocrin.

Tratamentul poate include o combinație de intervenții chirurgicale, terapie prin radiere și


chimioterapie. Medicamentația anticonvulsivă este necesară pentru persoanele ce au convulsii.
Dexametazona și furosemidul pot fi administrate pentru a reduce umflăturile din jurul tumorii.
Unele tumori cresc suficient de lent încât este necesară doar monitorizarea acestora. Sunt
studiate tratamente ce folosesc sistemul imunitar al persoanei. Rezultatul variază considerabil, în
funcție de tipul tumorii și de cât de mult s-a răspândit în momentul diagnosticării.
Glioblastoamele au, în general, rezultate slabe, în timp ce meningioamele au rezultate bune.
Media de cinci ani rată de supraviețuire pentru cancerul cerebral este de 33% in Statele Unite
ale Americii.
2. Prezentare generală privind învățarea profundă

2.1 Introducere
Învățarea profundă este o funcție de inteligență artificială (AI) care imită funcționarea creierului
uman în procesarea datelor și crearea de modele pentru utilizare în luarea deciziilor. Învățarea
profundă este un subset de învățare automată în inteligența artificială care are rețele capabile să
învețe nesupravegheate din date nestructurate sau nemarcate. De asemenea, cunoscut sub numele
de învățare neuronală profundă sau rețea neuronală profundă.

Învățarea profundă a evoluat mână în mână cu era digitală, care a adus o explozie de date sub toate
formele și din fiecare regiune a lumii. Aceste date, cunoscute pur și simplu ca big data, sunt extrase
din surse precum rețelele sociale, motoarele de căutare pe internet, platformele de comerț
electronic și cinematografele online, printre altele. Această cantitate enormă de date este ușor
accesibilă și poate fi partajată prin aplicații fintech precum cloud computing.

Învățarea profundă nu este doar o îmbunătățire a rețelelor neuronale artificiale, ci și un nou


domeniu de cercetare a învățării automate . Aplicarea cu succes a învățării profunde aduce învățarea
automată mai aproape de inteligența artificială. Ideea rețelelor artificiale neuronale apare din
înțelegerea noastră a creierului uman, care cuprinde interconectări între neuroni. Diferența dintre
rețelele neuronale artificiale și creierul uman este că orice neuron din creierul uman este conectat la
alți neuroni printr-o cale fizică specifică, în timp ce rețelele neuronale conțin straturi discrete,
conexiuni și direcții de propagare a datelor. Întrucât învățarea profundă constă în mai multe straturi
ascunse în comparație cu rețelele neuronale artificiale, o reprezentare mai abstractă a
caracteristicilor la nivel înalt pentru diferite clase se formează prin utilizarea mai multor straturi
ascunse pentru a combina caracteristici de nivel scăzut. creierul pentru a analiza procesul de
învățare al rețelei neuronale, care simulează mecanismul de învățare al creierului uman atunci când
încearcă să înțeleagă concepte necunoscute.

Reprezentarea caracteristicilor joacă un rol important în procesarea și analiza imaginilor medicale.


Ca tehnologie, metodele de învățare profundă au două avantaje evidente în reprezentarea
caracteristicilor:

 Învățarea profundă poate fi utilizată pentru a găsi automat caracteristici dintr-un set de date
dat pentru fiecare aplicație specifică. În general, metodele tradiționale de extragere a
caracteristicilor se bazează pe anumite cunoștințe prealabile pentru a extrage caracteristici
într-o anumită aplicație. Astfel, aceste metode sunt metode de învățare semi-automate.
 Învățarea profundă poate găsi noi caracteristici care sunt potrivite pentru aplicații specifice,
dar care nu au fost niciodată descoperite anterior de către cercetători.

Există două elemente care afectează rezultatele procesării și analizei imaginilor medicale sunt
achiziția imaginii și interpretarea imaginii, după cum urmează:

 Achiziția imaginii: rezultatele bune obținute în procesarea și analiza imaginilor este una
foarte importantă depind de calitatea imaginii însă calitatea imaginii depinde de achiziția
imaginii. Imagistica prin rezonanță magnetică (RMN) nu are doar caracteristicile
contrastului țesutului moale neinvaziv și bun, dar nu expune subiecții la radiații
ionizante. Deoarece RMN poate oferi o mulțime de informații neprețuite despre
structurile țesuturilor, cum ar fi forma, dimensiunea și localizarea, aceasta atrage tot mai
multă atenție pentru rutina clinică și diagnosticul asistat de computer.
 Interpretarea imaginii: În practica clinică, cele mai multe interpretări medicale ale
imaginilor sunt practic realizate de către medici pentru a determina dacă subiecții sunt
anormali. rezultate precise de interpretare a imaginii, este imperativ să se dezvolte un
sistem automat de interpretare a imaginii care include multe funcții, cum ar fi
detectarea imaginii, înregistrarea magică, segmentarea imaginii și clasificarea imaginii.
Pentru a realiza acest sistem, multe metode de învățare a mașinilor au fost aplicate pe
scară largă.

Rețelele neuronale artificiale(RNA) sunt sisteme de calcul inspirat de rețelele neuronale biologice
care constituie creierul animalelor. Astfel de sisteme învață (își îmbunătățesc progresiv capacitatea
lor) să execute sarcini prin observarea de exemple, de obicei fără a fi nevoie de re-programare în
funcție de domeniu. De exemplu, în recunoașterea de imagini, ar putea învăța să identifice imaginile
care conțin pisici analizând exemple de imagini care au fost manual etichetate ca „pisică” sau „nici o
pisică”, iar ulterior să aplice aceste cunoștințe unor imagini noi. Astfel de algoritmi sunt utilizați în
aplicații care nu pot fi modelate ușor folosind algoritm tradișionali, precum programarea bazată pe
reguli.

O RNA se bazează pe o colecție de unități conectate numite neuroni artificiali, (similar cu neuronii
biologici în creierul biologic). Fiecare conexiune (sinapsă) dintre neuroni poate transmite un semnal
între neuroni. Neuronul receptor (postsinaptic) poate procesa semnalul și apoi transmite mai
departe către următorii neuroni la care este conectat. Neuronii pot avea stare, în general
reprezentată de numere reale, de obicei între 0 și 1. Neuronii și sinapsele pot, de asemenea, avea o
greutate care variază pe măsură ce învățarea are loc și care poate mări sau micșora puterea
semnalului cu o rețea neuronală profundă (RNP) este o rețea neuronală artificială (RNA) cu mai
multe straturi între straturile de intrare și ieșire. RNP găsește modalitatea potrivită de manipulare
matematică pentru a transforma semnalul de intrare în cel de ieșire, fie că este vorba de o relație
liniară sau neliniară. Rețeaua se mișcă prin straturi calculând probabilitatea fiecărui rezultat. De
exemplu, o RNP care este instruită să recunoască rasele de câini v procesa o anumită imagine și
calcula probabilitatea ca animalul din imagine să fie dintr-o anumita rasă. Utilizatorul poate revizui
rezultatele și selecta care probabilități ar trebui să fie afișate de rețea (peste un anumit prag, etc.).
Fiecare astfel de manipulare matematică este considerată un strat, iar RNP complexe au mai multe
straturi, de unde și numele de rețele „profunde”.

RNP pot modela relații neliniare complexe. Arhitecturile RNP generează modele compoziționale în
care obiectul este exprimat ca o compoziție stratificată de primitive[18]. Straturile suplimentare
permit compoziția caracteristicilor din straturile inferioare, cu potențial de modelare a datelor
complexe cu mai puține unități decât rețea superficială de performanță similară/.

Arhitecturile profunde includ multe variante bazate pe doar câteva metode elementare. Fiecare
arhitectură are succes în domenii specifice. Diversele arhitecturi nu pot fi întotdeauna comparate, cu
excepția cazului în care acestea sunt evaluate pe aceleași seturi de date. are este transmis mai
departe.

Figure 1 Diferența dintre învățare profundă și învățare automată


2.2 Rețelele neuronale
Există diferite tipuri de rețele neuronale, dar acestea constau întotdeauna din aceleași componente:
neuroni, sinapse, greutăți, părtiniri și funcții. Aceste componente funcționează similar cu creierul
uman și pot fi antrenate ca orice alt algoritm ML.

2.2.1 Rețeaua neuronală artificială profundă( ANN)


O rețea neuronală profundă combină multiple straturi de procesare neliniare, folosind elemente
simple care funcționează în paralel și inspirate din sistemele nervoase biologice. Se compune dintr-
un strat de intrare, mai multe straturi ascunse și un strat de ieșire. Straturile sunt interconectate prin
noduri sau neuroni, cu fiecare strat ascuns folosind ieșirea de stratul anterior ca intrare.

Un ANN se bazează pe o colecție de unități conectate numite neuroni artificiali (analogi cu neuronii
biologici dintr-un creier biologic). Fiecare conexiune (sinapsă) între neuroni poate transmite un
semnal către alt neuron. Neuronul receptor (postsinaptic) poate procesa semnalul (semnalele) și
apoi semnaliza neuronii din aval conectați la acesta. Neuronii pot avea stare, reprezentată în general
de numere reale, de obicei între 0 și 1. Neuronii și sinapsele pot avea, de asemenea, o greutate care
variază pe măsură ce învață învățarea, ceea ce poate crește sau reduce puterea semnalului pe care îl
trimite în aval.

De exemplu, în recunoașterea imaginilor, ar putea învăța să identifice imagini care conțin pisici
analizând exemple de imagini care au fost etichetate manual ca „pisică” sau „fără pisică” și folosind
rezultatele analitice pentru a identifica pisicile din alte imagini. Aceștia au găsit cea mai mare
utilizare în aplicații dificil de exprimat cu un algoritm tradițional de calculator folosind programarea
bazată pe reguli.
Componentele unei ANN:

 Neuroni : care sunt derivați conceptual din neuroni biologici. Fiecare neuron artificial are
intrări și produce o singură ieșire care poate fi trimisă către alți neuroni multipli. Intrările pot
fi valorile caracteristicilor unui eșantion de date externe, cum ar fi imagini sau documente,
sau pot fi ieșirile altor neuroni. Ieșirile neuronilor de ieșire finale ale rețelei neuronale
îndeplinesc sarcina, cum ar fi recunoașterea unui obiect într-o imagine.
 Conexiuni: Rețeaua constă din conexiuni, fiecare conexiune furnizând ieșirea unui neuron ca
intrare către un alt neuron. Fiecărei conexiuni i se atribuie o pondere care reprezintă
importanța sa relativă. Un neuron dat poate avea mai multe conexiuni de intrare și ieșire.
 Funcția de propagare : calculează intrarea într-un neuron din ieșirile neuronilor predecesori
și conexiunile lor ca o sumă ponderată. [38] La rezultatul propagării se poate adăuga un
termen de părtinire.
 Organizare : Neuronii sunt de obicei organizați în mai multe straturi, în special în învățarea
profundă. Neuronii unui strat se conectează numai la neuronii straturilor imediat precedente
și imediat următoare. Stratul care primește date externe este stratul de intrare. Stratul care
produce rezultatul final este stratul de ieșire. Între ele sunt zero sau mai multe straturi
ascunse. Se folosesc, de asemenea, rețele cu un singur strat și fără strat. Între două straturi,
sunt posibile mai multe modele de conexiune. Ele pot fi complet conectate, fiecare neuron
dintr-un strat conectându-se la fiecare neuron din stratul următor. Ele pot fi combinate, în
cazul în care un grup de neuroni dintr-un strat se conectează la un singur neuron din stratul
următor, reducând astfel numărul de neuroni din acel strat.
 Parametrul hyper : este o constantă a cărei valoare este setată înainte ca procesul de
învățare să înceapă.
 Învățarea: este adaptarea rețelei pentru a gestiona mai bine o sarcină luând în considerare
probe de observații. Învățarea presupune ajustarea ponderilor (și a pragurilor opționale) ale
rețelei pentru a îmbunătăți acuratețea rezultatului. Acest lucru se face prin minimizarea
erorilor observate. Învățarea este completă atunci când examinarea observațiilor
suplimentare nu reduce în mod util rata de eroare. Chiar și după învățare, rata de eroare nu
ajunge de obicei la 0. Dacă după învățare, rata de eroare este prea mare, rețeaua trebuie de
obicei să fie reproiectată. Practic, acest lucru se realizează prin definirea unei funcții de cost
care este evaluată periodic în timpul învățării. Atâta timp cât producția sa continuă să scadă,
învățarea continuă. Costul este frecvent definit ca o statistică a cărei valoare poate fi doar
aproximată. Ieșirile sunt de fapt numere, deci atunci când eroarea este mică, diferența
dintre ieșire (aproape sigur o pisică) și răspunsul corect (pisică) este mică. Învățarea încearcă
să reducă totalul diferențelor între observații.
 Rata de învățare : definește mărimea etapelor corective pe care modelul le ia pentru a le
ajusta pentru erori în fiecare observație. O rată de învățare ridicată scurtează timpul de
antrenament, dar cu o precizie finală mai mică, în timp ce o rată de învățare mai mică
durează mai mult, dar cu potențialul unei precizii mai mari.

O problemă comună în toate aceste rețele neuronale este Gradientul de dispariție și explozie.
Această problemă este asociată cu algoritmul de propagare back . Ponderile unei rețele neuronale
sunt actualizate prin intermediul acestui algoritm de propagare înapoi prin găsirea gradienților. ANN
nu poate capta informații secvențiale în datele de intrare necesare pentru tratarea datelor
secvențiale

Figure 2 Propagarea

2.2.2 Rețele neuronale recurente (RNN)


O rețea neuronală recurentă (RNN) este o clasă de rețele neuronale artificiale în care conexiunile
dintre noduri formează un grafic direcționat de-a lungul unei secvențe temporale. Acest lucru îi
permite să prezinte un comportament dinamic temporal. Derivate din rețelele neuronale feed-
forward, RNN-urile își pot utiliza starea internă (memorie) pentru a procesa secvențe de lungime
variabilă ale intrărilor.
Acest lucru le face aplicabile sarcinilor precum recunoașterea scrisă de mână nesegmentată,
conectată sau recunoașterea vorbirii.

Termenul „rețea neuronală recurentă” este folosit pentru a se referi la două clase largi de rețele cu o
structură generală similară, în care una este impuls finit, iar cealaltă este impuls infinit. Ambele clase
de rețele prezintă un comportament dinamic temporal. [7] O rețea recurentă cu impuls finit este un
grafic aciclic direcționat care poate fi derulat și înlocuit cu o rețea neuronală strict avansată, în timp
ce o rețea recurentă cu impuls infinit este un grafic ciclic direcționat care nu poate fi derulat.

Atât rețelele recurente cu impuls finit, cât și impulsul infinit pot avea stări stocate suplimentare, iar
stocarea poate fi sub control direct de către rețeaua neuronală. Spațiul de stocare poate fi, de
asemenea, înlocuit cu o altă rețea sau grafic, dacă acesta include întârzieri sau are bucle de
feedback.

Acest tip de rețele neuronale recurente se împart în mai multe variante :

 Recurente în totalitate(FRNN) : conectează ieșirea tuturor neuronilor cu intrarea tuturor


neuronilor. Acest tip este unul dintre cele mai generale tipologii deoarece toate celelelate
tipologi pot fi reprezentate prin setarea unor conexiuni la 0 pentru a simula lipsa conexiuni
între acei neuroni.

Figure 3 Rețeaua neuronala recurentă în totalitate

 Rețelele Elman și rețelele Jordan

O rețea Elman este o rețea cu trei straturi (aranjată orizontal ca x, y și z în ilustrație) cu adăugarea
unui set de unități de context (u în ilustrație). Stratul de mijloc (ascuns) este conectat la aceste
unități de context fixate cu o greutate de unul. [23] La fiecare pas de timp, intrarea este avansată și
se aplică o regulă de învățare. Conexiunile din spate fixe salvează o copie a valorilor anterioare ale
unităților ascunse în unitățile de context (deoarece se propagă peste conexiuni înainte de aplicarea
regulii de învățare). Astfel, rețeaua poate menține un fel de stare, permițându-i să îndeplinească
sarcini precum predicția secvenței care sunt dincolo de puterea unui perceptron multistrat standard.

Rețelele din Jordan sunt similare cu rețelele Elman. Unitățile de context sunt alimentate din stratul
de ieșire în loc de stratul ascuns. Unitățile de context dintr-o rețea Iordania sunt, de asemenea,
denumite stratul de stat. Au o conexiune recurentă cu ei înșiși.

Figure 4 Rețea Elam

Rețeaua Elman Reteaua Jordan

ht =ϑ h(W h x t + U h ht−1 +bh ) ht =ϑ h(W h x t + U h y t −1+ bh )

y t =ϑ y (W h h t +b y ) y t =ϑ y (W y ht +b y )

Unde
x t = vectorul de intrare

ht = vectorul straturilor ascunse

y t = vectorul de ieșire

W,U ,b= parametrii matricilor și vectoului

ϑh , ϑ y=funcția de activare
2.3 Aplicațiile învățării profunde (deep learning)
 Recunoașterea automată a vorbirii Recunoașterea automată a vorbirii la scară largă este
primul și cel mai convingător caz de succes al învățării profunde. RNN-urile LSTM pot învăța
sarcini de „Învățare foarte profundă” [2] care implică intervale de mai multe secunde care
conțin evenimente de vorbire separate prin mii de pași de timp discreți, în care un pas de
timp corespunde cu aproximativ 10 ms.
 Recunoașterea imaginilor Un set de evaluare comun pentru clasificarea imaginilor este setul
de date al bazei de date MNIST. MNIST este compus din cifre scrise de mână și include
60.000 de exemple de instruire și 10.000 de exemple de testare. Ca și în cazul TIMIT,
dimensiunea sa mică permite utilizatorilor să testeze mai multe configurații. Este disponibilă
o listă cuprinzătoare de rezultate pentru acest set. Recunoașterea imaginii bazată pe
învățarea profundă a devenit „supraomenească”, producând rezultate mai precise decât
concurenții umani.
 Prelucrarea artei vizuale În strânsă legătură cu progresul înregistrat în recunoașterea
imaginilor este aplicarea tot mai mare a tehnicilor de învățare profundă la diferite sarcini de
artă vizuală. DN-urile s-au dovedit capabile, de exemplu, să a) identifice perioada de stil a
unei picturi date, b) Neural Style Transfer - surprinderea stilului unei opere de artă date și
aplicarea sa într-un mod plăcut vizual unei fotografii sau videoclipuri arbitrare și c) generarea
de imagini izbitoare pe baza câmpurilor de intrare vizuale aleatorii.
 Prelucrarea limbajului natural
 Descoperirea și toxicologia medicamentelor Un procent mare din medicamentele candidate
nu reușesc să obțină aprobarea de reglementare. Aceste eșecuri sunt cauzate de o eficiență
insuficientă (efect asupra țintei), interacțiuni nedorite (efecte în afara țintei) sau efecte
toxice neprevăzute. Cercetările au explorat utilizarea învățării profunde pentru a prezice
țintele biomoleculare, obiectivele neobișnuite și efectele toxice ale substanțelor chimice din
mediu în nutrienți, produse de uz casnic și medicamente.
 Analiza imaginilor medicale S-a demonstrat că învățarea profundă produce rezultate
competitive în aplicații medicale, cum ar fi clasificarea celulelor canceroase, detectarea
leziunilor, segmentarea organelor și îmbunătățirea imaginii.
3. Metodologie
Metodologia se bazeaza pe învățarea profundă unde tumorile sunt clasificate cu ajutorul imaginilor
RMN.

În acest capitol sunt prezentați pașii pentru clasificarea tumorilor cerebrale :

1. Achiziția datelor rezultate în urma unor scanări RMN.

2. Segmentarea imaginilor

3. Extragerea trăsăturilor din imagini

4. Clasificarea imaginilor, în funcție de trăsăturile extrase la pasul anterior, cu una din cele
două metode menționate în secțiunea 1.

Achiziția de imagini

Segmentarea imaginilor

Extragerea și reducerea
caracteristicilor

Clasificare

Fig.1 –Diagrama algoritmilor de detecție

3.1 Achiziția de date


Achiziția de date este procesul de eșantionare a semnalelor care măsoară condițiile fizice din lumea
reală și de conversie a mostrelor rezultate în valori numerice digitale care pot fi manipulate de un
computer.
Informația vizuală este o funcție a două variabile independente. Este un semnal 2-D. În prezent,
camerele digitale produc imagini digitale. Aceste camere folosesc o serie de dispozitive fotosensibile
pentru a produce semnale electrice proporționale cu scena
Aceste camere folosesc o serie de dispozitive fotosensibile pentru a produce semnale electrice
proporționale cu scena

strălucire peste mici petice ale unei scene. Lumina incidentă de pe aceste dispozitive creează
purtători de încărcare (găuri și electroni), iar o tensiune aplicată pe dispozitiv determină conducerea
curentului. Diferența de potențial între un rezistor pe traseul acestui curent este proporțională cu
intensitatea medie a luminii primite de dispozitiv. Tensiunile rezultante ale tabloului reprezintă
scena capturată ca imagine. Acest set de semnale analogice este convertit într-o imagine digitală
printr-o interfață, numită framegrabber. Această interfață este o parte componentă a camerelor
digitale, iar imaginea digitală este livrată într-un format standard printr-o interfață către computer.
Desigur, se înțelege că rezoluțiile de eșantionare și cuantificare sunt stabilite după cum este necesar,
la momentul fotografierii. În mod invariabil, imaginea digitală necesită unele prelucrări, fie pentru a
o îmbunătăți în raport cu anumite criterii și / sau pentru a extrage informații utile pentru diferite
aplicații. Aceasta este prelucrarea digitală a imaginii.

Figure 5 Imagini craniene RMN normale

a) b) c) d)

Figure 6 a)- RMN normal b) RMN cu tumoare glioma c)RMN cu tumoare meningiala d)RMN cu tumoare pituitara
3.2 Segmentarea imaginilor

Segmentarea reprezintă împărțirea imaginii în zone de interes, după anumite criterii. Fiecărui pixel i
se va atribui o valoare, 0 sau 1, reprezentând apartenența acestuia la o anumită zonă sau regiune de
interes. De regulă, segmentarea urmărește extragerea, identificarea sau recunoașterea unui anumit
obiect dintr-o imagine. Zonele sau regiunile care alcătuiesc o imagine poartă numele de segmente.
Pentru o imagine f(m, n), segmentarea reprezintă împărțirea lui f într-un număr N de zone fi(m, n),
cu i = 1..N,

a) b) c)

Figure 7a) imagine originală/inițială b)imagine segmentată folosind un algoritm c) Imaginea cu tumoarea segmentată

Metodele de segmentare a imaginilor se pot clasifica în :


 metode de segmentare orientate pe regiuni
 metode de segmentare orientate pe contururi

1)Segmentarea orientată pe regiuni

În general, operația de segmentare orientată pe regiuni urmărește extragerea din imagine a


regiunilor ocupate de diversele obiecte prezente în imagini. Un obiect se definește ca o entitate
caracterizată de un set de parametri ale căror valori nu se modifică în diferite puncte ce aparțin
entității considerate. Unul dintre cei mai simplu parametri de definiție este nivelul de gri al pixelului.
Dacă nivelul de gri caracterizează în mod suficient obiectele din imagine, atunci histograma imaginii
va prezenta o structură de moduri dominante- adică de intervale de nivele de gri ce apar cu
probabilitate mai mare.
1.1) Prăguirea histogramei
Separarea modurilor histogramei, și deci identificarea obiectelor din imagine, se face prin alegerea
unor nivele de gri, numite praguri de segmentare. De obicei aceste praguri se aleg ca fiind
corespunzătoare minimelor locale ale histogramei. Din imaginea inițială f se construiește o imagine
de etichete g (imagine etichetată), conform unei transformări de forma:

In cazul unei histograme bimodale (care conține două moduri dominante)

Figure 8 Histograma a) bimodală b) cu trei moduri dominante

1.2) Segmentarea prin creștere de regiuni

Principiul pe care se bazează creșterea regiunilor este următorul: se aleg în imagine pixeli
reprezentativi pentru fiecare obiect individual, pe baza cărora are loc un proces de aglomerare a
pixelilor vecini acestora, ce au acelea¸si proprietăți cu pixelii reprezentativi. În urma acestui proces
de aglomerare se obțin zone de pixeli cu acelea și caracteristici. Procesul se oprește în momentul în
care fiecare pixel al imaginii a fost alocat unei regiuni. Metoda are două etape esențiale: alegerea
punctelor de start (puncte inițiale), numite germeni sau semințe, ¸si creșterea propriu-zisă a
regiunilor. Numărul final de regiuni rezultate este egal cu numărul de germeni aleși inițial pentru
creștere. În principiu, este de dorit ca fiecare obiect individual aflat în imagine, să fie marcat de un
germene. Daca în interiorul unui obiect se găasesc mai mult și germeni, pentru fiecare dintre ei va fi
crescută o regiune, fapt ce duce la o segmentare artificială nedorită a obiectului respectiv. Acest
neajuns poate fi corectat printr-o etapă de fuziune a regiunilor adiacente ce au proprietăți
asemănătoare.
Metode bazate pe pixeli

Cea mai simplă și comună metodă de segmentare bazată pe pixeli este pragul în care toți pixelii cu
valori de intensitate peste sau sub un anumit nivel sunt clasificați ca parte a segment. Pragul este o
parte integrantă a conversiei unei imagini de intensitate într-o imagine binară așa cum este
demonstrat în exemplul 14.2. Chiar și atunci când este precedat de alte abordări, pragul este de
obicei necesar pentru a produce o mască de segmentare, o imagine alb-negru a caracteristicii de
interes. Pragul este de obicei destul de rapid și poate fi realizat în timp real, permițând
interactivitatea ajustarea pragului. Conceptul de bază al pragului poate fi extins pentru a include
ambele limite superioare și inferioare, o operațiune denumită feliere, deoarece izolează o gamă
specifică de pixeli intensități. Felierea poate fi generalizată pentru a include un număr de limite
superioare și inferioare diferite, fiecare codificat într-un număr diferit. Un exemplu de feliere
multiplă a fost prezentat în Capitolul 12 folosind rutina gray2slice a MATLAB. În cele din urmă, atunci
când este implicată o imagine RGB, pragul poate fi aplicat fiecărui plan de culoare separat. Imaginea
rezultată poate fi fie a imagine RGB pragată sau o singură imagine compusă dintr-o combinație logică
(ȘI sau SAU) de cele trei planuri de imagine după prag. Un exemplu al acestei abordări este văzut în
probleme.

Ajustarea niveluli de prag

O preocupare majoră în metodele bazate pe pixeli este stabilirea corespunzătoare a pragului sau
nivelului de tranșare. De obicei, aceste niveluri sunt stabilite de program, deși, în unele situații, sunt
stabilite interactiv de către utilizator. Găsirea unui nivel de prag adecvat poate fi ajutată de un grafic
al distribuțiilor de intensitatea pixelilor peste imagine, indiferent dacă reglați interactiv sau automat
nivelul pixelilor. Un astfel de complot este denumit histograma intensității și este susținut de rutina
MATLAB imhist descrisă mai jos.

Când imaginile color RGB sunt analizate, histogramele de intensitate pot fi obținute din toate cele
trei planuri de culoare și diferite.

Histogramele de intensitate pot fi foarte utile în selectarea nivelurilor de prag, nu numai pentru
imaginea originală, ci și pentru imaginile produse de diferiți algoritmi de segmentare descriși mai
târziu. Histogramele de intensitate pot fi, de asemenea, utile în evaluarea eficacității diferitelor
scheme de procesare: pe măsură ce separarea dintre structuri se îmbunătățește, vârfurile
histogramei ar trebui să devină mai distinctive
Figure 9 Imagine cu raze X a coloanei vertebrale, stânga sus și histograma intensității asociate acesteia, graficul inferior.
Imaginea din dreapta sus este obținută prin pragul imaginii originale la o valoare corespunzătoare linie verticală pe
diagrama histogram

Figure 10 Imaginea celulelor sanguine cu și fără limite intermediare îndepărtate. Histogramele


asociate arată separabilitatea îmbunătățită atunci când limitele sunt eliminate

O abordare pentru a îmbunătăți determinarea minimelor histogramei se bazează pe observare că


multe puncte de graniță poartă valori intermediare celor de ambele părți ale graniței. Aceste valori
intermediare se situează între valorile limită reale și pot masca optimul valoarea pragului. Totuși,
aceste puncte intermediare au, de asemenea, cel mai mare gradient și ar trebui să fie posibil să le
identificați utilizând un filtru sensibil la gradient, cum ar fi filtrul Sobel sau Canny. După identificarea
acestor puncte limită, ele pot fi eliminate din imagine și dintr-o nouă se poate calcula histograma
care are o distribuție mai definitivă. Exemplul 7 și Figura 6 prezintă imaginile și histogramele asociate
înainte și după eliminarea punctelor limită identificate folosind filtrarea Canny.

Figure 11 Imagini cu celule sanguine praguri. Praguri bazate exclusiv pe histogramă au fost aplicate
imaginilor cu celule sanguine din figura 11

2) segmentarea orientate pe contururi


Metode bazate pe continuitate

Abordările bazate pe continuitate caută similitudinea sau consistența în căutarea elementelor


caracteristice. Aceste abordări pot fi foarte eficiente în sarcini de segmentare, dar toate tind să se
reducă definirea muchiei. Acest lucru se datorează faptului că acestea se bazează pe operațiuni de
cartier care operează o zonă locală și estompa distincția între regiunile de margine și regiunile
caracteristice. Cu cât este utilizat cartierul mai mare, cu atât vor fi definite marginile mai slab.
Creșterea dimensiunii cartierului de obicei îmbunătățește puterea oricărei operațiuni date bazate pe
continuitate, stabilind un compromis între capacitatea de identificare și definirea muchiei.

Figure 12 Imaginea BW a muchiilor produse de rutina de margini MATLAB folosind filtrul Canny
O tehnică simplă bazată pe continuitate este filtrarea lowpass. Deoarece un filtru low-pass este o
alunecare operațiune de vecinătate care are o medie ponderată pe o regiune, îmbunătățește
caracteristici consistente.

După filtrarea cu trecere joasă, cele două regiuni sunt evidente în histogramă (de mai jos) și limita
găsită prin varianță minimă rezultă în segmente perfect izolate .Pragul utilizează aceeași tehnică de
varianț minimă iar îmbunătățirea adusă prin simpla filtrare low-pass este remarcabilă.

Caracteristicile imaginii legate de textură pot fi deosebit de utile în segmentare. Figura 13 prezintă

trei regiuni care au aproximativ aceleași valori ale intensității medii, dar se disting ușor vizual din
cauza diferențelor de textură. Mai multe operațiuni de cartier pot se utilizează pentru a distinge
texturi: transformata Fourier cu segment mic, varianța locală (sau deviația standard), operatorul
Laplacian, operatorul intervalului (diferența dintre maxim și valorile minime ale pixelilor din
vecinătate), operatorul Hurst (diferență maximă ca o funcție de separare a pixelilor) și operatorul
Haralick (o măsură a momentului distanței).

Figure 13 Histograma

Figure 14Imagine care conține trei regiuni având aproximativ aceeași intensitate, dar diferite
Figure 15 Modelul de textură prezentat în Figura 14 după aplicarea operației de gamă neliniară. Acest operator
convertește proprietățile texturale din figura originală într-o diferență de intensități.

3.3 Extragerea și reducerea caracteristicilor


Extragerea caracteristicilor este cel mai esențial pas care transformă datele de intrare în
caracteristici necesare. Această etapă extrage caracteristici semnificative ale regiunii de interes
segmentate și aceste caracteristici servesc drept intrare pentru clasificarea imaginilor scanate RMN.

După segmentarea imaginilor în 5 secțiuni, caracteristicile tumorii segmentate sunt extrase folosind
transformata discretewavelet (DWT). DWT are avantajul de a extrage cele mai relevante
caracteristici la diferite direcții și salări, deoarece oferă informații localizate de frecvență de timp ale
unui semnal folosind filtrare în cascadă de filtre de trecere înaltă și de trecere joasă pentru a extrage
caracteristici într-un mod de ierarhie.

3.4 Clasificarea
În multe circumstanțe, ieșirea unui algoritm de procesare a semnalului sau de procesare a imaginilor
poate fi trimise direct unui operator uman printr-un fel de grafică sau afișare de imagine. De
exemplu, o imagine MR reconstituită poate fi utilizată direct de un radiolog pentru a face un
diagnostic medical; Nueste necesară o analiză computerizată suplimentară. Cu toate acestea, uneori
este potrivit pentru computer a utiliza fructele analizei semnalului sau a imaginii pentru a sugera
diagnostice indicate de date, adică a asociați modele de măsurători cu o anumită stare sau stare de
boală. Sunt două situații obișnuite în care computerele sunt chemate să evalueze o afecțiune: în
timp real monitorizarea stării și situațiilor unui pacient în care datele disponibile sunt prea vaste sau
prea complex pentru o interpretare ușoară de către un medic sau un tehnician medical. Un exemplu
simplu de prima situație se găsește în monitorizarea ritmului cardiac în care se aude o alarmă atunci
când ritmul cardiac devine anormal.
Determinarea unei boli sau afecțiuni dintr-o serie de date este o aplicație de clasificare. Un
clasificator face o asociere între un model de date și două sau mai multe clase sau condiții. Un
clasificator poate fi privit ca doar un alt dispozitiv de intrare-ieșire în care intrarea este un set de
datele de măsurare și ieșirea sunt clasa cea mai probabilă asociată cu acel set de date. De multe ori,
numai două clase sunt utilizate în aplicații medicale care reprezintă condiții normale sau anormale.

Aplicațiile medicale care implică mai multe categorii pot apărea, de exemplu, identificarea tipurilor
de celule din imagini de microscopie sau clasificarea bătăilor ectopice ale inimii din semnal ECG.

Figure 16 Un clasificator este un dispozitiv de intrare-ieșire care acceptă un număr de intrări și, pe baza acestor intrări, se
determină condiția asociată acelui tipar

Un clasificator conţine, în general, trei module: modulul de clasificare propriu-zis, un modul de


învăţare (presupune prezenţa unui set de eşantioane / imagini de antrenare) şi un modul de selecţie
şi extragere a caracteristicilor. Setul de antrenare poate conţine de exemplu o bază de date cu
diferite caracteristici ale obiectelor ce pot apare în scenă (de exemplu, obiecte spectrale sau
geometrice). Învăţarea presupune existenţa acestui set de antrenare, set ce cuprinde eşantioane
pentru care se ştie apartenenţa la clase; prezenţa setului de antrenare este necesară în cadrul
clasificării supervizate.

Clasificarea include o gamă largă de abordări teoretice ale deciziei pentru identificarea imaginilor
(sau a unor părți ale acestora). Toți algoritmii de clasificare se bazează pe presupunerea că imaginea
în cauză prezintă una sau mai multe caracteristici (de exemplu, părți geometrice în cazul unui sistem
de clasificare de fabricație sau regiuni spectrale în cazul teledetecției, așa cum se arată în exemplele
de mai jos) și că fiecare dintre aceste caracteristici aparține uneia dintre mai multe clase distincte și
exclusive
Clasele poate fi

 Clasificare supravegheata( a priori) de către un analist


 Clasificare nesupravegheată (automată) în seturi de clase de prototipuri, unde analistul
specifică doar numărul de categorii dorite.
Clasificarea supravegheată se bazează pe ideea că un utilizator poate selecta pixeli eșantion într-o
imagine care sunt reprezentativi pentru anumite clase și apoi poate direcționa software-ul de
procesare a imaginii pentru a utiliza aceste site-uri de instruire ca referințe pentru clasificarea
tuturor celorlalți pixeli din imagine. Site-urile de instruire (cunoscute și ca seturi de testare sau clase
de intrare) sunt selectate pe baza cunoștințelor utilizatorului. Utilizatorul stabilește, de asemenea,
limitele pentru cât de asemănători trebuie să fie alți pixeli pentru a le grupa împreună. Aceste limite
sunt adesea stabilite pe baza caracteristicilor spectrale ale zonei de antrenament. De asemenea,
utilizatorul desemnează numărul de clase în care este clasificată imaginea. Odată ce s-a realizat o
caracterizare statistică pentru fiecare clasă de informații, imaginea este apoi clasificată examinând
reflectanța pentru fiecare pixel și luând o decizie cu privire la care dintre semnături seamănă cel mai
mult. Clasificarea supravegheată utilizează algoritmi de clasificare și tehnici de regresie pentru a
dezvolta modele predictive. Algoritmii includ regresia liniară, regresia logistică, rețelele neuronale,
arborele de decizie.

Clasificarea nesupravegheată este locul în care rezultatele (grupări de pixeli cu caracteristici


comune) se bazează pe analiza software a unei imagini fără ca utilizatorul să ofere clase de eșantion.
Computerul folosește tehnici pentru a determina ce pixeli sunt corelați și îi grupează în clase.
Utilizatorul poate specifica ce algoritm va utiliza software-ul și numărul dorit de clase de ieșire, dar
altfel nu ajută la procesul de clasificare. Cu toate acestea, utilizatorul trebuie să cunoască zona
clasificată atunci când grupările de pixeli cu caracteristici comune produse de computer trebuie să
fie legate de caracteristicile reale de la sol. Unii dintre cei mai comuni algoritmi utilizați în învățarea
nesupravegheată includ analiza clusterelor, detectarea anomaliilor, rețelele neuronale și abordările
pentru învățarea modelelor variabile latente.

În clasificarea supravegheată, procesele statistice (adică bazate pe o cunoaștere a priori a funcțiilor


de distribuție a probabilităților) sau procesele fără distribuție pot fi utilizate pentru extragerea
descriptorilor de clase. Clasificarea nesupravegheată se bazează pe algoritmi de grupare pentru a
segmenta automat datele de instruire în clase de prototipuri. În ambele cazuri, criteriile motivante
pentru construirea orelor de instruire sunt că acestea sunt:

 independent, adică o modificare a descrierii unei clase de antrenament nu ar trebui să


schimbe valoarea alteia,
 discriminatoriu, adică diferite caracteristici ale imaginii ar trebui să aibă descrieri
semnificativ diferite și
 fiabile, toate caracteristicile de imagine din cadrul unui grup de instruire ar trebui să
împărtășească descrierile definitive comune ale acelui grup
4 Rezultate experimentale și discuții

Imagine primită Imagine filtrată Imagine conturată

Tumoare extrasă Conturul Tumorii Tumoare detectată

Pentru proiect am ales să filtrez imaginea întrodusă cu tehnica de difuzie anisotropică.

Care este o tehnică menită să reducă zgomotul imaginilor fără a elimina părți semnificative din
imagine, cum ar fi linii, colțuri care sunt importante in interpretarea imaginilor.

Difuzia anizotropă seamănă cu procesul care creează un spațiu la scară, unde o imagine generează o
familie parametrizată de imagini succesive din ce în ce mai neclare pe baza unui proces de difuzare

Operațiile morfologice afectează structura sau forma unui obiect. ei sunt aplicate de obicei pe
imagini binare (imagini alb-negru - imagini cu doar 2 culori: alb-negru). Acestea sunt utilizate în pre-
sau post-procesare (filtrare, subțire și tăiere) sau pentru obținerea unei reprezentări sau descrieri a
formei obiectelor / regiunilor (limite, scheletele corpurilor convexe)..

Cele două operații morfologice principale sunt dilatarea și eroziunea

Dilatarea permite obiecte pentru a se extinde, umplând astfel găuri mici și conectând obiecte
disjuncte.
Eroziunea micșorează obiectele prin eliminarea (erodarea) limitelor lor.

În cazul în care nu se identifică nici o tumoare se afișează un mesaj.

Concluzie

Învățarea profundă nu este doar o îmbunătățire a rețelelor neuronale artificiale, ci și un nou


domeniu de cercetare a învățării automate

Învățarea profundă a evoluat mână în mână cu era digitală, care a adus o explozie de date sub toate
formele și din fiecare regiune a lumii.

Bibliografie
[1] https://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.695.7913&rep=rep1&type=pdf
[2] https://rria.ici.ro/wp-content/uploads/2018/02/08-art-Laura.pdf

[3] http://www.ace.tuiasi.ro/users/103/2011-Herghelegiu%20Rezumat%20final.pdf

[4] https://rria.ici.ro/wp-content/uploads/2018/02/08-art-Laura.pdf

[5]https://www.analyticsvidhya.com/blog/2020/02/cnn-vs-rnn-vs-mlp-analyzing-3-types-of-neural-
networks-in-deep-learning/

[6]https://en.wikipedia.org/wiki/Artificial_neural_network

[7]https://en.wikipedia.org/wiki/Deep_learning#Applications

[8] https://www.reginamaria.ro/utile/dictionar-de-afectiuni/tumorile-cerebrale

[9] https://ro.wikipedia.org/wiki/Tumoare_cerebral%C4%83

[10] https://www.investopedia.com/terms/d/deep-learning.asp

[11] https://en.wikipedia.org/wiki/Data_acquisition

S-ar putea să vă placă și