Sunteți pe pagina 1din 52

6.

Elemente privind procesarea de


imagini
6.1. Elemente introductive
Scopul procesrii automate computerizate a imaginilort este considerat
n general de a oferi capabilitti asemntoare cu cele umane. Printre
caracteristicile urmrite n vederea obinerii unor sisteme inteligente avem:
1. posibilitatea extragerii unor informaii prelucrabile (pertinente) din detalii, n
general irelevante,
2. posibilitatea de a inva din exemple i de a generaliza cunotine astfel nct
ele s poat fi folosite n circumstane noi i diferite,
3. posibilitatea de a efectua inferene din informaii incomplete.
Structura general a unui sistem cu viziune artificial este dat n
Figura 6.1.

Figura 6.1. Structura general a unui sistem cu viziune artificial


1

Etapele urmrite de ctre un sistem cu viziune artificial sunt:


a) achiziia imaginii, care duce la digitizarea imaginii ntr-o memorie de
imagini,
b) pretratarea, prin metode de restaurare a imaginii i eliminarea zgomotelor i
a defectelor de iluminare,
c) determinarea de caracteristici din imagine, prin extragere de atribute,
determinare de primitive n vederea stabilirii unui procedeu de invare pentru
sistemul cu viziune,
d) descrierea simbolic i clasificarea, care pregtete interpretarea final prin
gsirea zonelor de interes cu ajutorul tehnicilor de segmentare a imaginii i
eventual caracterizarea acestor zone de interes cu atribute sau descrieri
structurale. Pe baza acestor date se face o clasificare a zonelor de interes, care
va fi validat de urmtoarea etap,
e) interpretarea, prin care scena de analizat va fi neleas, ceea ce implic
cunoaterea domeniului de aplicabilitate.
n ultima perioad, un lucru tot mai important de care trebuie s in
seama un sistem de procesare a imaginilor l reprezint transmiterea datelor i a
imaginilor. Pentru a realiza o transmisie de date la distan cu ajutorul
sistemelor de calcul, datele trebuie codificate ntr-o form adecvat att
sistemelor de calcul, ct i dispozitivelor prin care acestea sunt transmise.
Sistemele de calcul nmagazineaz datele ca semnale digitale exprimate n bii,
n timp ce dispozitivele de comunicare utilizeaz semnale analogice care sunt
exprimate sub forma unor frecvene.

6.2. Caracteristicile de baz ale domeniului procesrii


de imagini
Procesarea imaginilor const din utilizarea informaiilor
bidimensionale sau tridimensionale de la un captor vizual, utiliznd tratri
numerice, cu ajutorul calculatoarelor n procesul de analiz.
Patru factori au influentat n mod decisiv dezvoltarea unor sisteme de
analiz a imaginilor de cost redus:
-larga disponibilitate a unor sisteme de calcul relativ ieftine
(compatibile IBM PC sau Macintosh) cu posibiliti de calcul i memorare
ridicate precum i cu posibiliti de interfaare la dispozitive de stocare a
imaginilor de tip frame-grabber sau plci multimedia
-dezvoltarea unor circuite integrate care permit o conversie a
semnalelor video de nalt calitate i la o rat de transfer ridicat

-creterea calittii dispozitivelor de achiziie de imagini combinat cu


reducea preurilor de vnzare i apariia n ultima vreme a camerelor digitale la
preuri accesibile
-disponibilitatea att hardware, ct i software pentru calculatoare
compatibile IBM PC sau Macintosh, a unor plci de achiziie de imagini
precum i a unor programe aplicative sau biblioteci de funcii (API) la un pre
din ce n ce mai redus i cu posibiliti de calcul din ce n ce mai mari.

6.2.1. Achiziia i pstrarea imaginilor


Prin digitizare, scena din realitate este convertit ntr-o imagine
compus din uniti digitizate (pixeli n cadrul spaiului 2D, voxeli n spaiul
3D) crora n general le este asociat o valoare, valoarea de gri, cuprins uzual
ntre 0 i 255, reprezentnd intensitatea spotului luminos convertit.
Scena reprezint acea zon "vzut" de ctre captor format dintr-o
mulime de obiecte fizice ntr-o zon a mediului, iar imaginea reprezint n
general o matrice de pixeli stocat ntr-o memorie de imagini care urmeaz a fi
prelucrat de ctre un sistem de calcul, reprezentnd proiecia scenei pe un plan
bidimensional.
In Figura 6.2. se prezint definirea imaginii i a scenei.

Figura 6.2. Definirea imaginii i a scenei

6.2.1.1. Camerele video i achiziia imaginilor


Prima diferen important ntre vederea uman i imaginea analizat
de sistemul de calcul este modul n care se achiziioneaz imaginea. Cei mai
obinuii senzori utilizai pentru a capta imagini sunt camera video i scanerul.
In general imaginile se memoreaz n calculator ca i o matrice
bidimensional de numere. Aceste numere corespund diferitelor informaii cum
ar fi:
-intensitatea nivelelor de gri
-luminana
-crominana, etc.
Pentru a putea procesa o imagine, ea trebuie trecut n calculator ntr-o
form digital. Pentru a digitiza imaginile analogice ele trebuie eantionate i
cuantizate.
Eantionarea presupune procesul de captur de eantioane din
semnalul analogic, adic preluarea punctelor de informaie aflate la diferite
distane unele de altele.
Cuantizarea reprezint procesul asignrii unei valori binare pentru
fiecarea valoare eantionat.
Un digitizor (camer sau scaner analogic) consider iniial imaginea
analogic i continu. Digitizorul eantioneaz imaginea convertind de fapt
lumina ntr-un semnal ce reprezint strlucirea. Acest lucru se realizeaz cu
ajutorul unor traductoare. Dup aceea un convertor A/D cuantizeaz semnalul
produs care apoi poate fi memorat digital n calculator. Aceste valori memorate
reprezint intensiti astfel nct de obicei Negru = 0 i Alb este valoarea
maxim posibil (de obicei 255).
Camerele de achiziie a imaginilor pot fi mprite n:
a) Camere standard, care utilizeaz cipuri care au o mulime de senzori pentru
pixeli (elemente de imagine) cca. 500.000 senzori /cmp. Senzorii funcioneaz
ca numrtori de fotoni, astfel c semnalul sumat i amplificat de la fiecare
linie a acestor senzori produce un voltaj analog. Exist diferite circuite care
citesc informaia dat de senzori CCD (charge couple device) circuite cu
transfer de sarcina, CID (charge injection device) sau altele. Efectul dat de
diferenele acestea este c sunt camere care permit acumularea n cip a unor
imagini intunecoase pe perioade mai lungi de timp sau din contr capturarea
rapida a imaginii intr-o scurt perioad de timp. Camerele utilizate pentru a
capta imagini de intensitate foarte joas sunt utilizate n astronomie,
microscopia fluorescent, etc.

Figura 6.3. Dispozitiv CCD


Dispozitivele CCD execut 2 funcii:
-convertesc fotonii ntr-o sarcin electric
-permit deplasarea sarcinii (bucket brigade) astfel inct citirea reprezint un
flux serial de date.
Aceste circuite CCD reprezint inima camerelor i scanerelor, avnd
un rspuns foarte liniar, Figura 6.4.

Figura 6.4. Rspunsul camerelor CCD i vidicon


5

b)Camerele cu vidicon -camere de tip vechi cu tub de vacuum sunt


camere mai ieftine i servesc ca prototip de comparaie cu camerele solide, iar
principiul de funcionare este cel al fotoconductibilitii, o imagine ce ptrunde
pe suprafaa tubului, altereaz conductibilitatea unui nveli al acestuia. Un
fascicul de electroni bombardeaz faa posterioar a acestui nveli fotosensibil
i prin neutralizarea sarcinilor electrice creeaz o diferen de potenial care
produce pe un electrod colector un curent. Prin eantionarea i cuantificarea
acestui semnal se obine imaginea digital. (Figura 6.5.)

Figura 6.5. Camera cu vidicon


Camerele standard i cele cu vidicon produc un semnal analogic ce
corespunde intensitii luminoase a diferitelor puncte ale imaginii, ns intre
camerele standard i cele cu vidicon exist unele diferene (Figura 6.4.) n
camerele cu vidicon poate aprea o mrire a spotului luminos (datorit
mprtierii luminii sau electronilor n nveli) sau poate aprea efectul cozii
de comet lng spotul luminos sau pot aprea diferite deformri ale imaginii
n pern sau n butoi, (Russ, 1999). Tot aceste camere au materiale de
nveli care au rspuns spectral i astfel poate surveni o modificare a culorilor
adic acelai obiect apare diferit la iluminare diferit. Sistemul de lentile i
neizolarea individual a tranzistorilor din interiorului camerelor cu cip (care s-a
micorat progresiv de la 1 inch la 1/3 inch) fac ca lumina s se mprtie de la
un tranzistor la altul i astfel un procent uneori pn la 50 % din lumin este
pierdut. Soluia este de a asocia o singur lentil de dimensiuni mici fiecrui
tranzistor i astfel colectarea luminii este de 100%. De asemenea camerele
standard au senzitivitate mare la partea de sfrit a spectrului vizibil mai ales la
rou sau chiar lumina infraroie care dac nu este eliminat din sistemul optic al
camerei produce nceoarea sau ptarea imaginilor.
c) Camereler digitale - majoritatea nc nu sunt potrivite pentru aplicaii tehnice
datorit unor limitri de optic i a rezoluiei limitate, datorit faptului c
folosesc compresii de tip JPEG ceea ce poate produce pierderi. Sunt unele
camere mai avansate care nu pierd prin compresie i acestea s-ar preta la
6

aplicaii tehnice. Camerele utilizate n domeniul tehnic nu au faciliti de


comprimare, ele folosind sistem optic flexibil i asigurnd o rezoluie nalt.
Exist trei tipuri principale de camere digitale n acest moment:
- cu cip monocrom; se pot realiza capturi color dac se folosesc trei filtre
RGB i trei secvene de imagini
- cu scanare liniar; au rezoluie mare i timp ndelungat de scanare, sunt
folositoare doar pentru imagini statice
- care utilizeaz cipuri de megapixel de provenien RGB. O camer de
aceast tip este lent, direct legat la interfeele SCSI ale sistemelor de calcul, nu
realizez compresii, posibiliti mari de depozitare a imaginilor; nc sunt foarte
costisitoare.
Tendina actual este de a mbunti camerele standard prin
mbuntirea continu a rezoluiei spaiale (numrul senzorilor individuali),
uniformitatea realizrii lor i reducerea costurilor acestor camere. Rmne de
vzut n ce msura HDTV (High Definition TeleVision televiziune de nalt
rezoluie), va aduce mbuntiri remarcabile camerelor video n viitorul
apropiat. De asemenea camerele digitale sunt ntr-o continu dezvoltare piaa
oferind in acest moment camere la preuri rezonabile i cu faciliti tot mai
mari. Exist camere de tip firewire care respect standardul IEEE 1394 i care
astfel permit prin intermediul unor plci simple de achiziie introducerea direct
n memoria calculatorului a imaginilor. De asemenea standardul USB mai ales
varianta 2.0 permite interfaarea simpl ntre un sistem de calcul i o camer
digital care introduce direct datele n cadrul memoriei calculatorului.
Indiferent de camera care se poate folosi pentru achiziia de imagini
este important ca sistemul optic al camerei s focalizeze corect pentru a captura
detalii fine ale imaginii. Exist camere care realizeaz acest lucru automat
sisteme de microscopie automat sau unele sisteme de urmrire (ex. de trafic).
Uneori acest lucru se face cu ajutorul unui circuit electronic ataat camerei sau
realizat cu ajutorul unui software dedicat care ncearc s determine o serie de
parametrii alegnd astfel parametrii care duc la obinerea imaginii celei mai
bune.
Focalizarea automat n imaginile macroscopice utilizeaz tehnologii
de msurat distana cum ar fi sunet de nalt frecven sau n infrarou pentru a
determina distana fa de subiect i astfel se ajusteaz sistemul optic
obinndu-se imaginea cea mai bun. Exist algoritmi pentru a detecta calitatea
imaginii i acestea sunt aplicabile tuturor imaginilor n care exist un bun
contrast i detalii fine. Acestea se realizeaz cu ajutorul unor filtre care sunt
aplicate fie hardware fie software.
Intre camere i convertorul analog-digital exist cabluri, conectori care
mpreun cu circuitele de compensare ale luminozitii i care in n mod
obinuit de camer, ele producnd pierderi de semnal i modificri ai
parametrilor imaginii (ex., modificri de contrast). Achiziia imaginilor folosind
7

camere video este considerat achiziie n timp real, n multe aplicaii rata de
achiziie nu trebuie ns s fie foarte mare.
Achiziia imaginilor folosind dispozitive CCD poate fi fcut folosind
o singur linie CCD sau o matrice bidimensional care ofer o rezoluie mrit
i un tip de achiziie mai scurt ns la un pre mai ridicat. In acest sens
distingem noiunile de scanare:
-intreesut, linii pare/impare
-neintreesut sau progresiva, utilizat mai ales la HDTV.
Tehnica progresiv este folosit de:
-camerele de nalt performan
-microscoapele cu scanare direct, SEM - Scanning Electron Microscope,
STM Scanning Tunneling Microscope, AFM Atomic Force Microscope
-digitizoare de film i cadre, etc.
In HDTV densitatea pixelilor este mare n raportul 16:9 fa de
raportul 4:3 existent actualmente la norma NTSC. Pixelul este considerat i n
acest caz patrat iar o imagine tipic este de 1920x1080 la o rat de 30 cadre/sec
rezult c se vehiculeaz mult informaie care trebuie prelucrat.
Scanerele se pot clasifica n:
- reflective, cele care msoar lumina reflectat de sursa original
- transmisive, cele care masoar lumina transmisa de surs.
Aceste scanere pot scana imagini:
- alb-negru
- color, folosind diferite tehnici. Se prefer n general nti o prescanare i
apoi o sanare final. n domeniul razelor X se folosec scanere SEM, Scanning
Electron Microscope.
Plcile de achiziie a imaginilor sunt dispozitive intercalate ntre
camerele video i sistemul de calcul. Ele pot fi de tip frame-grabber, sau mai
nou plcile multimedia de cost relativ sczut pot indeplini rolul acestor plci de
achizitie n cadrul unor aplicaii uzuale. Aceste plci de achiziie au ajuns astzi
la performane deosebite att ca vitez de achiziie, ca rezoluie dar i ca
posibilitai de a prelucra ntr-o oarecare masur imaginea capturat.
Tendina actual pe piaa plcilor de achiziie este de a realiza plci
extrem de performante cu soft de analiz i prelucrri de imagini care sunt
utilizate mai ales n scopuri profesionale. Stereoviziunea a impulsionat
dezvoltarea plcilor de achiziie multicanal care permit achiziia simultan pe
mai multe canale a semnalelor provenite de la mai multe dispozitive de
achiziie.
6.2.1.2. Stocarea imaginilor digitale
Cnd se lucreaz cu un sistem de analiz computerizat a imaginilor,
imaginile trebuie salvate pe disc sub form de fiiere care sunt oarecum
asemntoare cu celelalte tipuri de fiiere, (text, programe, etc.), dar din
8

anumite motive, fiierele cu imagini digitale trebuie s fie considerate distincte


din anumite puncte de vedere.
Fiierele de imagini sunt de obicei mari. O singur imagine de
640x480 pixeli monocrom ocup aproximativ 300 KB n timp ce o imagine
color necesit aproximativ 1 MB. Imaginile 3D sunt mult mai mari (de exemplu
500 x 500 x 500 imagine de reconstrucie tomografic 3D ocup aproximativ
125 MB), deci necesit o mare capacitate de stocare.
6.2.1.3. Memorarea imaginilor
O imagine digital pe 8 bii de dimensiuni 1024 x 1024 pixeli necesit
106 bii, adic un spaiu foarte mare, de aceea memoria ocup un loc important
n sistemele de prelucrare de imagini.
Pentru aplicaii de prelucrare a imaginilor se poate realiza:
- memorare pe termen scurt, necesar procesrii propiu-zise, ea
reprezint memoria temporar de lucru, ntr-un calculator fiind memoria de tip
RAM
- memorarea on-line, necesar pentru accesare rapid sau memoria de
scurt durat de obicei fiind realizat pe discuri de tip Whinchester. Tendina
actual este de a folosi suporturi magneto-optice i chiar stocarea holografic.
- memorarea n vederea arhivrii, de lung durat n care accesul la
imagine este mai puin frecvent.
Memoria de arhivare se caracterizeaz prin capacitti foarte mari de
memorare necesare dar cu accesare mai puin frecvent. Acestea sunt discurile
optice i benzile magnetice. CD-ROM-ul este o modalitate ieftin de stocare i
de aceea CD-urile reprezint modalitatea cea mai frecvent de a avea la
dispoziie bilioteci de imagini. Exist CD-uri de inalt densitate (DVD
Digital Video Disk) care ofer stocarea unei cantiti mai mari de informaie pe
acelai format.
Discurile optice (WORM drives = write once read many) ofer mai
multe posibiliti ca CD-ROM-ul, oferindu-ne att arhivarea i stocarea
imaginilor ct i accesul acestora prin citire / scriere. Acestea sunt utile mai ales
n medicin dar i n alte domenii n care imaginile trebuie stocate n mod
permanent acestea avnd o capacitate mare, n medie de aproximativ 1GB/disc.
Floppy discurile sunt de capacitate redus i astzi sunt mai puin utilizate
pentru transportul i stocarea unui numr extrem de mic de imagini (una
singur), cu capaciti ntre 1.4 i 120MB acestea din urm fiind denumite
floptical disc deoarece au nevoie de o unitate prevazut cu senzor optic necesar
pentru citirea informaiei.
Discurile de mare capacitate (ZIP-drive), cu o capacitate n medie de
peste 100MB, sunt astzi competitive ca pre i performan cu discurile optice,
avnd o vitez de acces sub cea a hard-discurilor dar sunt mult mai rapide dect
CD-urile.
9

Benzile magnetice sunt extrem de lente, dar au capacitate mare de


stocare.
La alegerea mediului de stocare a imaginilor trebuie avut n vedere volumul
de imagini care va fi stocat, scopul utilizarii acestor imagini (viteza de acces ) i
preul de cost al stocarii.
6.2.1.4. Formate de imagine
Tentaia de a realiza un format de imagine propriu este foarte mare,
mai ales n cazul firmelor de marc care doresc sa-i impun standardele,
ajungndu-se astfel la multe formate de imagini diferite. Acestea pot fi
apreciate dup mai multe criterii cum ar fi, gradul de compresie pe care l
realizeaz i timpul necesar mpachetrii i despachetrii acestora. Cele mai
importante formate din aceasta categorie sunt: PCX, BMP, IMG, TARGA,
IBM, TIFF, GIF, WPG, JPEG, PIC, CDR, PCD, PNG, PPG, PPM,etc.
O imagine 2D este un tablou bidimensional de pixeli, denumit adesea
rastru (raster). Fiecare linie orizontal este numit linie de scanare, sau linie de
rastru. n calculator, culoarea fiecrui pixel este reprezentat printr-una din
urmtoarele metode:
- dac imaginea este binar, culoarea fiecrui pixel este exprimat
printr-o valoare de 1 bit 1 0, iar dac e monocrom fiecare pixel va avea o
intensitate ntr-o plaj de obicei 0,255.
- pentru o imagine True Color, culoarea fiecarui pixel este exprimat
n general, n termenii intensitilor de rou (R), verde (G) i albastru (B) care
creeaz culoarea. De obicei, fiecare component a unei culori este reprezentat
pe un octet, astfel exist 256 de nivele pentru fiecare component de culoare.
Aceast abordare necesit trei octei pentru fiecare pixel i permite pn la 256
x 256 x 256 = 16777216 sau peste 16 milioane de combinaii distincte ale
valorilor RGB (culori).
- pentru o imagine bazat pe o palet de culori, valoarea fiecarui pixel
este interpretat ca un index ntr-un tabel cu valori RGB cunoscut sub numele
de palet de culori, sau hart de culori (Colormap). Pentru fiecare pixel se
afiez valoarea RGB corespunztoare coninutului acelui pixel. Numrul de
bii necesari pentru stocarea valorii fiecrui pixel depinde de numrul de culori
din palet. Dimensiunile obinuite ale paletelor de culori sunt 16 (necesit 4 bii
pe pixel) i 256 (necesit 8 bii pe pixel).
Caracteristici comune ale fiierelor de imagine
Pentru a v asigura c putei citi, interpreta i afia o imagine stocat
electronic, imaginea trebuie s conin cel puin urmtoarele informaii:
- dimensiunile imaginii limea i nlimea
- numrul de bii pe pixel
10

- tipul imaginii dac valorile pixelilor trebuie interpretate ca fiind


culori RGB sau elemente ntr-o palet de culori
- paleta de culori dac imaginea folosete vreuna
- datele imaginii, care reprezint tabloul cu valorile pixelilor
Aproape toate fiierele imagine (vezi Figura 6.6. ) conin acest set de
informaii, dar fiecare format specific de fiier organizeaz aceste informaii
ntr-un alt mod.
Antet
Paleta de culori
(dac exist)
Datele imaginii
(tabloul de pixeli)
Figura 6. 6. Format tipic de fiier imagine
Aceast figur reprezint structura unui fiier imagine tipic. Fiierul
ncepe cu un scurt antet avnd de la civa, pna la 128 sau chiar mai muli
octei. Urmeaz apoi o palet de culori dac valorile pixelilor din imagine
folosesc paleta de culori. Datele imaginii tabloul cu valorile pixelilor apar
dup paleta de culori. De obicei tabloul de pixeli este stocat linie cu linie.
Tabloul de pixeli ocup cea mai mare parte a fiierului imagine. De exemplu, o
imagine de dimensiune 640 x 480 pixeli cu 256 culori necesit 640 x 480 =
307200 octei pentru stocare, deoarece valoarea fiecrui pixel ocup un octet.
Desigur, spaiul de stocare necesar pentru datele imaginii poate fi redus
recurgnd la compresia datelor, fie printr-un algoritm de codare pe baza
lungimii, fie cu alte scheme de compresie.
Cu toate c multe fiiere imagine au un aspect similar celui prezentat
anterior este loc pentru mai multe variaii:
- ordinea informaiilor din antet poate s difere de la un format de
fiier la altul.
- formatele dependente de ecran sar peste ntreaga paleta de culori i
stocheaz numai tabloul de pixeli.
- tabloul de pixeli poate fi stocat de sus n jos sau de jos n sus.
- dac valorile pixelilor sunt componente RGB, ordinea rou, verde,
albastru poate fi modificat.
- valorile pixelilor pot fi stocate n format mpachetat sau ca planuri de
bii. n formatul mpachetat, toi biii aparinnd unui pixel sunt stocai unul
dup altul. Cnd imaginea este stocat pe planuri de bii, biii pentru fiecare
11

pixel sunt separai conform poziiei bitului, cei mai puin semnificativi bii ai
tuturor pixelilor sunt stocati linie cu linie, apoi se trece la biii urmtoarei
poziii de bit i asa mai departe.
- valorile pixelilor pot fi stocate ntr-un format comprimat.
Formate uzuale pentru fiiere imagine
Exist mai multe metode de stocare a unei imagini ntr-un fisier, acesta
fiind motivul pentru care vei gsi att de multe tipuri diferite de formate pentru
fiiere imagine. Iat cteva dintre cele mai populare formate de fiiere imagine:
-Formatul PCX, folosit la nceput de programul Paint Brush al
companiei Zsoft, este un format pentru fiiere imagine pe care-l suport multe
programe de desenare si scanere. Fiierele PCX folosesc o schem de codare pe
baza lungimii (Run-Length-Encoding RLE) pentru a stoca imaginea ntr-o
form comprimat.
- Formatul BMP Windows sau DIB (un format introdus de Microsoft
Windows 3.0) stocheaz imaginea ca pe o hart de bii independent de
dispozitiv. Formatul DIB include o palet de culori i stocheaz datele imaginii
ntr-o manier standard pentru a face fiierul imagine independent de dispozitiv.
Formatul Windows BMP poate stoca imagini folosind 1 (monocrom), 4 (16
culori), 8 (256 culori) sau 24 (16 milioane de culori) de bii pe pixeli. Formatul
BMP nu este la fel de eficient ca PCX i alte formate, dar interpretarea
fiierelor BMP este relativ uoar.
-Formatul pe 24 de bii Truevision Targa provine de la adaptoarele de
ecran de nalt performan pentru PC-uri Truevision. Exist cteva tipuri
diferite de fiiere Targa. Cea mai popular este versiunea cu 24 de bii pe pixel
care foloseste 8 bii pentru fiecare dintre componentele R, G i B. Acest format
poate stoca fiiere imagine cu pna la 16 milioane de culori. Totui,
dimensiunea fiierului pentru o imagine pe 24 de bii este foarte mare o
imagine 640 x 480 pe 24 de biti necesit 3 x 640 x 480 = 921600 octei, adic
aproximativ un 1Mb.
-TIFF, sau Tagged Image File Format a fost dezvoltat n colaborare de
Microsoft Corporation i Aldus Corporation ca un format flexibil, independent
de sistem, pentru stocarea de imagini monocrome pna la imagini cu culori pe
24 de bii. Multe programe de tehnoredactare computerizat i procesoare de
texte pot citi i folosi imagini TIFF. n plus, toate scannerele dispun de
programe de control care pot salva imagini n formatul TIFF.
-GIF sau Graphics Interchange Format a fost dezvoltat de
CompuServe pentru stocarea ntr-o form compact a imaginilor cu pn la 256
de culori. Fiierele GIF stocheaz imagini folosind schema de compresie LZW
(denumit astfel dup autorii ei, Lempel-Ziv-Welsh).

12

-JPEG (Joint Photographers Expert Group) este cel mai utilizat format
de imagine n reeaua Internet. Este un format comprimat de imagine ceea ce i
confer avantaje extrem de mari n comparatie cu celelalte formate de imagine.
6.2.1.5. Metode de compresie a imaginilor
Metodele de compresie ale imaginilor faciliteaz comunicarea rapid
ntre diferite sisteme pe baza imaginilor, precum i stocarea lor n vederea unei
utilizri ulterioare. n ultimii ani s-a trecut la standardizarea procesului de
compresie a imaginilor n vederea utilizrii imaginilor n diverse aplicaii de
prelucrri de imagini.
Prin rata de compresie, Cr ntelegem raportul dintre cantitatea iniial
de date necompresate i cantitatea de date compresat.

Cr

date originale
date compresate

Exist metode de compresie a imaginilor care conduc la degradarea


informaiilor n momentul decompresiei lor, funcie de gradul de compresie ales
(lossy compression). Aceste metode duc la pierderea informaiilor neeseniale i
redundante. Ratele de compresie sunt relativ mari necesitnd ns algoritmi mai
complicai i mai multe calcule. Aceste metode pot fi folosite la imagini care
urmeaz doar s fie vizualizate, omul nesesiznd pierderile.
Exist i metode de compresie a imaginilor, metode care nu duc la
degradarea informaiilor (lossles compresion) prin refacerea lor prin
decomprimare, ns eficiena acestor metode este relativ sczut fiind tot mai
puin folosite. Un sistem care suport compresia datelor trebuie sa conin in
configuraia sa un codor i un decodor (Figura 6.7.).

Figura 6.7. Sistem care suport compresia datelor


Cele mai importante trei standarde de compresie de imagini (care s-au
impus n mod deosebit la nceput n domeniul compresiilor de date) sunt:
- JPEG (Joint Photographic Experts Group), utilizat n cazul
imaginilor statice. Codorul JPEG convertete imaginea ntr-o reprezentare de
frecven spaial folosind o transformare DCT (Discret Cosine Transform) 2D.
- MPEG (Moving Pictures Expert Group), utilizat n cadrul imaginilor
n micare, cu diverse variante care s-au dezvoltat n ultimii ani. Codorul
MPEG este mult mai complex dect codorul JPEG. Acest codor caut s fac o
13

predicie asupra evoluiei unei imagini, printr-un estimator de micare,


transformnd i codificnd apoi diferena ntre imaginea prevazut i imaginea
n sine. Predicia imaginilor poate fi facut pe baz imaginilor viitoare precum
i pe baza celor trecute. Astfel codorul trebuie s reordoneze imaginile punnd
imaginea de referin naintea celor prevzute. Decodorul pune imaginile napoi
ntr-o ordine de afiare corect.
- P*64 , reprezint standardul CCITT H.261, ca i codor/decodor n
videotelefonie. Codorul P*64 codific de asemenea imagini prevzute a fi
eronate, dar care trebuie s le ia aa cum vin. Poate alege ntre o imagine
curent i una prevazut cu ajutorul unui sistem " block-by-block". Predicia
codorului este bazat n mod normal pe acelai bloc al imaginii precedente,
codorul putnd include ca i optiuni un estimator de micare, precum i un
filtru.
Alte considerente referitor la compresia imaginilor
Compresia este necesar stocarii i transmisiei imaginilor deoarece
reduce mrimea lor. Stocarea este esenial n mai multe domenii, unul
important fiind tehnica video digital, n timp ce transmisia de imagini se
ntlnete la reelele de telecomunicaii , teleconferine, etc.
Exist mai multe criterii dup care metodele de compresie pot fi
judecate, i anume:
- timpul necesar comprimrii/decomprimrii acest criteriu este
important mai ales n transmisiile n timp real, cum ar fi videoconferinele
- gradul de conservare al imaginii
- costurile impuse de algoritmii alei i resursele de calcul
- standardul de compresie utilizat, dac este sau nu universal pentru a
putea fi utilizat i de ctre alii.
Metodele de compresie
Metodele de compresie sau codare a imaginilor se mpart n dou
categorii:
- codarea predictiv
- codarea prin transformri.
Codarea predictiv exploateaz redundan existent n imagine, n
vreme ce codarea prin transformri realizeaz modificarea structurii de date a
imaginii ntr-o alt matrice, astfel c o mare cantitate de informaii este
impachetat ntr-un numr mai mic de eantioane.
Exist algoritmi care combin aceste categorii. n primul caz este
vorba, mai bine zis, de o codificare dect o compresie i permite reconstructia
imaginii iniiale. Aceast codificare este utilizat mai ales n transmisiile de
imagini. Se bazeaz pe asemnarea (diferena) dintre pixelii unei imagini astfel
14

c se folosesc un numr mai mic de bii pe pixel pentru a memora ceea ce au


comun aceti pixeli. Viitoarea abordare a compresiei de imagini este de a utiliza
algoritmi predictivi, care examinnd mai muli pixeli precedeni anticipeaz i
stocheaz diferenele dintre acetia.
RLE (Run Length Encoding) este una din metodele cele mai simple de
compresie fiind folosit n cazul n care avem date care se repet (zone din
imagine care au aceeai valore a pixelilor). Astfel, secvena de caractere:
AAAABBBBBCCCCCCCCDEEEE
devine,
4A5B8C1D4E
i deci, n acest caz:
Cr = 22/10 = 2.2
n cazul n care zona care urmeaz a fi codat nu este repetitiv,
metoda este foarte ineficient putnd duce chiar la factori de compresie
subunitari. De aceea metoda RLE va pstra aceste zone nemodificate i deci
necodate, urmnd a fi codate doar zonele repetitive, lucru ce va fi precizat
printr-un caracter special. Astfel secvena:
ABCDDDDDDDDEEEEEEEEE
ar deveni ,
ABC+8D+9E
Formatul PCX folosete metoda RLE de compresie pe planele
separate ale imaginii. Metoda se preteaz imaginilor specifice desenelor
animate i nu imaginilor naturale.
O metod care d rezultate mai bune folosete mai puini bii pentru a
reprezenta datele ce apar mai fercvent i cele ce apar mai puin frecvent
necesit mai muli bii. Aceast codare de lungime variabil reprezint ideea
codrii Huffman. Aceast metod furnizeaz o densitate mai mare a datelor
dect tehnicile de codare de lungime fix. Lungimea datelor codate este invers
proporional cu frecvena datelor. Se aseamn cu tehnica Morse care folosete
mai puine linii i puncte pentru literele care apar mai frecvent. Codarea
Huffman necesit dou treceri, prima determin frecvena caracterelor, a doua
face compresia. Se pot folosi tabele fixe care nu vor duce la compresii
optimale dar vor avea o singur trecere. Exist i alte metode de compresie cum
ar fi Huffman modificat utilizat pentru date de la fax-uri sau metoda READ
derivat din Huffman folosit pentru imagini alb-negru inclusiv fax-uri. Aceste
metode se limitau la codarea unui caracter la un moment dat.

15

LZW (Lempel Ziv Welch) este un algoritm care permite codarea unor
iruri de caractere folosind tabele de codare existnd i ali algoritmi care
permit aceast codare.
Standardul JPEG (Joint Photographers Expert Group) reprezint
efortul colaborrii ntre CCITT (International Telegraph and Telephone
Consultative Committee) i ISO (International Standard Organization).
Acest standard definete trei sisteme diferite de codare:
- un sistem de codare de baz cu pierderi, care este bazat pe transformata DCT
i este adecvat pentru o gam larg de aplicaii,
- un sistem de codare extins pentru aplicaiile de precizie nalt sau
reconstrucie progresiv fr pierderi,
- un sistem de codare cu pierderi mai mici pentru conversia reversibil.
Modul de compresie progresiv JPEG se obine prin realizarea unui set
de subimagini i fiecare subimagine va fi codat cu un set specific de
coeficieni DCT. Compresia progresiv JPEG poate fi obinut folosind trei
tipuri de algoritmi: un algoritm progresiv de selecie spectral, un algoritm
progresiv de aproximri succesive i un algoritm progresiv combinat.
Standardul JPEG permite i folosirea unor algoritmi de compresie fr
pierderi, respectiv un algoritm de compresie predictiv n locul transformrii
DCT.
Compresia ierarhic JPEG permite o reprezentare progresiv a
imaginii decodate, ntr-un mod similar cu algoritmul progresiv, dar permite n
plus fa de acesta, imagini codate cu rezoluii multiple. JPEG nu specific un
format de fiier fiind considerat doar printr-un flux de bii. Sunt mai multe
formate de imagini care memoreaz imagini JPEG cele mai folosite fiind JFIF
si JPEG pentru TIFF 6.0.
Standardul H.261 este dezvoltat pentru aplicaii de telecomunicaii
video. Deoarece acestea sunt n general aplicaii care nu implic modificri
importante ale coninutului cadrelor succesive datorate micrii obiectelor din
imagine, algoritmul folosit limitez strategiile de cutare i estimare a micrii,
n scopul obinerii unei rate de compresie ct mai ridicate. Folosind acest
standard se pot atinge rate de compresie ntre 100:1 i 2000:1.
Compresia fractalic, este o metod diferit de compresie prin care se
memoreaz instruciuni sau formule de creare a imaginilor. De aceea metoda
este independent de rezoluie, imaginile putnd fi scalate la o rezoluie mai
mare dect imaginea original.
Fractalii sunt imagini compuse din imagini mai mici. Metoda permite
rate de compresie de peste 100 fiind considerat o metod asimetric. Aceast
metod duce la un timp mare de compresie dar decompresia este rapid.
Compresia fractalic ncearc s gseasc relaiile din imagine care leag
16

imaginile mai mici prin formule matematice. Decompresia ine cont de aceste
formule i d rezultate foarte bune pornind practic de la ori ce set de date,
practic contnd relaiile matematice i nu imaginile. Cu ct codarea este mai
bun ea este mai lent i decodarea oferind imagini de calitate superioar.
Compresia Wavelet, se aseaman cu cea DCT, care ns este limitat la
utilizarea funciei cosinus. Wavelet folosete funcii mai simple, complexitatea
calculelor scznd fr ns a sacrifica major calitatea imaginii obinute.
Compresia holografic este o nou metod care se bazeaz pe o
reprezentare frecvenial 3D a imaginilor. Metoda este n curs de elaborare.
Rezultatele pe care le ofer par s fie spectaculos de bune.
In cadrul imaginilor dinamice iniial au existat standardele Apple
Qucktime si Microsoft Video for Windows, VfW. Actualmente Microsoft
ncearc s introduc standardul DirectX respectiv Direct Shaw un standard
mai flexibil i mai eficient.
In acest caz se utilizeaz variate metode de compresie i decompresie,
denumite CODECs (Compressor DECompressor).
Standardul de compresie MPEG (Motion Picture Experts Group) a
fost propus pentru aplicaii video care se caracterizeaz prin modificri
importante ntre dou cadre succesive, datorate micrii obiectelor din imagine.
Metoda de compresie utilizeaz un algoritm de codare intercadre i poate
realiza o compresie de pna la 200:1 prin memorarea numai a diferenelor
dintre cadre succesive. Totodat standardul MPEG prevede i compresia unui
canal audio cu rata de 5:1 pna la 10:1. Se bazeaz pe similitudinea unor
blocuri de pixeli al unor imagini succesive transmind doar 2 frame-uri pe
secund, restul fiind informaie codificat ca diferena dintre frame-uri prin aa
numitele keyframe-uri. Standardul MPEG este n continu dezvoltare,
actualmente folosindu-se cu precdere MPEG4.

6.2.2. Analiza modulului de ameliorare a imaginilor


Modulul de ameliorare (preprocesare) a imaginii urmrete restaurarea
imaginii numerice degradate de diveri factori cum ar fi: zgomote, defecte de
iluminare, micarea sau defocalizarea imaginii, etc.
Preprocesarea imaginii se efectueaz naintea operaiei de analiz
efectiv a ei. Preprocesarea imaginilor are ca scop eliminarea erorilor aprute n
cursul procesului de achiziie, erori cauzate de procesul de conversie a
semnalului video analogic n semnal digital sau datorate paraziilor indui
aleator pe calea de achiziie a semnalului analogic.

17

6.2.2.1. Restaurarea imaginilor digitale


Corectarea (restaurarea) imaginilor digitale se refer la nlturarea sau
minimizarea degradrii cunoscute ntr-o imagine. Orice imagine achiziionat
prin mijloace optice, electro-optice sau electronice este degradat ntr-o
anumit proporie. Degradarea se poate datora zgomotului, proastei focalizri a
camerei, micrii relative obiect-camer, etc. Restaurarea se face prin filtrarea
efectelor degradrii.
Reducerea zgomotului unei imagini se poate realiza prin nlocuirea
unui pixel cu media lui i a vecinilor lui pe o regiune variabil i este cu att
mai eficient cu ct regiunea este mai mare (filtru de mediere), ins astfel
imaginea apare mai nceoat. Acesta metod de a reduce zgomotul unei
imagini mbuntete calitatea imaginii, ns se repercuteaz asupra rezoluiei
imaginii.
O alta metod este cea a filtrului Olympic; pe o anumit zon se
elimin pixelii cu valori extreme ale intensitii luminoase ale pixelilor vecini i
pe urm se face o medie a pixelilor rmai, ns rezultatele metodei nu sunt
bune deoarece imaginea rmne nceoat i zgomotul nu este eliminat n
totalitate.
Filtrul median este utilizat mai ales pentru a elimina zgomotul produs
de pixelii care sunt distrui sau lipsesc din imagine, nlocuindu-i cu valoarea de
mijloc (ca poziie) a pixelilor nvecinai care sunt ordonai n funcie de
intensitatea luminoas.
Eliminarea zgomotelor se poate face apelnd i la unii operatori ai
morfologiei matematice. Eroziunea i dilatarea imaginilor de intensitate, este o
metod de filtrare care utilizeaz minimul si maximul valorilor intensitilor
luminoase. Astfel, valoarea pixelului cu cea mai mare intensitate luminoas n
fiecare regiune este utilizat pentru a nlocui valorile originale ale pixelilor. Ca
i operator morfologic n vederea mbuntirii imaginii se mai poate folosi i
operatorul top hat. Acest operator nlocuiete supradenivelrile cu valori medii
sau mediane luate din marginea top hat.
Entropia maxim poate fi utilizat i ea n procesul mbuntirii
imaginilor. Imaginile conin alte defecte cum ar fi nceosarea datorat micrii
obiectului sau focalizarea defectuoas. n aceste conditii se vor aplica filtrele
inverse. Acestea sunt utile pentru corectarea semnalului de intrare anticipnd
degradrile cauzate de sistem.
Creterea contrastului este operaia prin care se imbunatateste
vizibilitatea structurilor unei imagini. Pixelii intunecai din imagine devin negri,
cei deschisi devin albi, iar cei gri din imaginea original iau valori noi care sunt
interpolate liniar ntre negru si alb. Reasignarea valorilor pixelilor din imaginea
18

original crete contrastul vizual al pixelilor prezeni dar nu crete abilitatea de


a discrimina variaii subtile n nuanele de gri.
6.2.2.2. Imbuntirea imaginilor
Exist metode care cresc vizibilitatea unei poriuni a imaginii, a unui
aspect sau a unei componente a imaginii, scopul fiind de accentuare a anumitor
caracteristici (contrast, contururi), etc., (pentru analiza sau redarea acestora fr
modificri de date din structura imaginilor). Avnd n vedere utilitatea lor
practic n toate aplicaiile legate de prelucrri de imagini, aceste metode sunt
extrem de importante.
Din punctul de vedere al algoritmului utilizat pentru mbuntirea
imaginii se disting patru categorii mari de tehnici de mbuntire:
Operaii punctuale: mrirea contrastului, atenuarea zgomotului,
operaiuni de tip fereastr (transformri, pseudocolorri, etc) i atenuarea
imaginii prin histograme;
Operaii spaiale (pe arii): filtarea de zgomot, filtrarea median,
tehnica de zooming a imaginii, alte tipuri de filtrri;
Operaii de tranformare a imaginilor: filtrarea liniar, filtrarea de tip
radical sau filtrarea homomorfic;
Operaii de pseudocolorare ntre care se disting tehnicile de colorare
i pseudocolorare a imaginilor, Look Up Table (LUT).
Modificarea de contrast este necesar mai ales n cazul imaginilor cu
contrast mic datorat iluminrii slabe, aceast trasformare mbuntete
vizibilitatea pixelilor de amplitudine mic fa de pixelii de amplitudine mare.
Negativarea imaginilor sau inversarea acestora este utilizat mai ales
n medicin, imaginile fiind mai uor de interpretat.
Histogramele sunt reprezentarea frecvenei de apariie a diferitelor
nivele de gri ntr-o imagine. Egalizarea histogramelor modific intensitatea
luminoas a pixelilor permind astfel evidenierea unor detalii n anumite arii.
Amplificarea Laplacian accentueaz contururile mai ales cele liniare,
permind interpretatea mai uoar a imaginilor.
Scderea imaginilor este util cnd este necesar compararea a dou
imagini complexe cu elemente avnd ns deosebiri relativ mici ntre ele.
n ceea ce privete mrirea i interpolarea imaginilor (zoom-ul) exist
mai multe modliti ca: dublarea imaginii, interpolarea liniar sau bazat pe
alte metode. n cazul dublrii imaginii fiecare pixel de-a lungul unei linii i
fiecare linie este repetat. Interpolarea liniar este o multiplicare a imaginii la
care pixelii care se intercaleaz pot fi media aritmetic a pixelilor vecini din
imaginea original. Aceast transformare este necesar pentru a vizualiza i
msura anumite detalii din imagine.
19

6.2.2.3. Operaii specifice modulului de ameliorare a imaginilor


O prim metod specific preprocesrii de imagini o constituie
corecia optic.
a) Corecia optic urmrete:
- pstrarea n timp a nivelului de gri al obiectului de analizat n
condiii de achiziii multiple de imagini,
- eliminarea imperfeciunilor sistemului optic,
- accentuarea contrastului n imaginea achiziionat.
b)Histograma este funcia care asociaz la fiecare nivel de gri un
anumit numr de pixeli avnd acest nivel de gri din imaginea analizat.
La reprezentarea ei grafic, pe axa x sunt trecute intensitile
disponible ale pixelilor, iar pe axa y sunt trecute numrul de apariii pentru
fiecare intensitate.

Figura 6.8. Histograma unei imagini


Imaginile ntunecate au histograma grupat n partea stng, cele
luminoase o au grupat n partea dreapt, iar imaginile complet luminate au
histograma n toat plaja de distribuie.
De obicei, histograma este folosit pentru identificarea simpl a
obiectelor, obiectele similare avnd de obicei intensiti similare.
De asemenea, vrfurile i vile permit separarea obiectelor de
intensiti diferite din imagine, vile permind definirea pragurilor de separare.
c)Egalizare de histogram imaginile care nu au o distribuie
uniform a intensitilor pot fi modificate, fr ns a le uniformiza. Intensitile
se vor redistribui astfel nct, dac histograma iniial avea vrfuri i vi i dup
egalizare se vor pstra, dar vor fi shiftate (deplasate). Practic, histograma va fi
ntins (mprtiat).
Egalizarea histogramei se efectueaz n urmtorii pai:
1). se calculeaz histograma obinnd un vector de 256 de elemente (pentru o
imagine cu 8 bii/pixel)
20

2). Se calculeaz suma normalizat a histogramei, obinnd tot un vector de 256


de elemente, astfel:
-elementul 0 este neschimbat,
-elementul 1 va fi suma dintre elementul 1 i 0,
-elementul 2 va fi suma dintre elementul 2, 1 i 0,

-elementul 255 va fi suma dintre elementul 255, 254, 1 i 0.


Aceste valori vor fi apoi normalizate, nmulind fiecare element cu:

valoarea_maxim_pixel
numr_total_pixeli

255

x y

n acest mod (ajustnd la cel mai apropiat ntreg) se obine un LUT


care poate fi folosit pentru pasul urmtor.
3). se modific imaginea n imaginea destinaie, folosind acest LUT.
Egalizarea histogramei lucreaz cel mai bine pe imaginile care au
detalii fine n zona ntunecoas.
d)Specificarea histogramei egalizarea histogramei aproximeaz o
histogram, relativ uniform, dar uneori se dorete ntunecarea sau iluminarea
ei, sau mrirea contrastului. n aceste cazuri se folosete specificarea
histogramei, care necesit:
-o imagine ca intrare,
-o histogram dorit.
Ea se efectueaz astfel:
-se egalizeaz histograma imaginii originale,
-se determin inversa histogramei egalizate pornind de la imaginea
egalizat i histograma dorit.

21

Figura 6.9. Specificarea de histogram


Determinarea inversei histogramei egalizate necesit s generm LUT
corespunztor histogramei dorite i apoi sa calculm transformarea invers a
LUT. Acest transformare invers este calculat analiznd ieirile lui LUT. Cea
mai apropiat ieire pentru o intrare particular devine valoarea invers.
e)Normalizrea imaginii (extinderea contrastului, contrast stretching)
aa cum am artat, contrastul unei imagini este dat de distribuia pixelilor
luminoi i ntunecoi.
Imaginile cu contrast sczut au histograme n care pixelii sunt
concentrai la stnga, la dreapta sau n mijloc. Practic, se folosete un domeniu
redus de valori din histogram.
Imaginile care au contrastul mare au regiuni largi de intensiti nchise
i luminoase. n general, imaginile de contrast ridicat au dou vrfuri mari, unul
n zona inferioar, iar cellalt n zona superioar.
Normalizarea este aplicat la o imagine pentru a extinde histograma
astfel nct s umple tot domeniul dinamic al imaginii. Este utilizat pentru a
mbunti imagini de contrast redus, lucrnd cel mai bine pe imagini care au o
distribuie Gaussian sau aproape Gaussian.
Exist dou metode de normalizare:
-normalizarea de baz (basic contrast stretching)
Aceasata lucreaz bine pe imaginile care au toi pixelii concentrai
ntr-o parte a histogramei. Metoda va expanda histograma imaginii astfel nct
s fie acoperit tot domeniul pixelilor.
Relaia de transfer este:

Pixel _ nou

Pixel _ vechi low


255
high low

unde low i high reprezint extremele domeniului de expandare.


-ends-in-search
22

Aceast metod lucreaz pentru imaginile care au toate intensitile,


dar au o concentrare de pixeli ntr-o parte a histogramei. n acest caz, relaia
care permite calculul LUT pentru transfer este:

iesire x

0
,
x low
x low
255
, low x high
high low
255
,
x high

f)Transformarea intensitii are rolul de a converti un pixel vechi


ntr-unul nou folosind o funcie predefinit. Aceste transformri sunt
implementate cu LUT. Se prefer o reprezentare grafic (pe x, valorile pixelilor
originali, iar pe y valorile pixelilor de ieire).
Ca i transformri avem:
-transformare null pixel_nou = pixel_vechi
-negativare se vor negativa valorile
-corecie gama ieire = intrare 1/
care este folost la compensarea rspunsurilor neliniare.
Pentru:
< 1.0 curb exponenial,
= 1.0 null,
> 1.0 curb logaritmic.
Monitoarele RGB au cuprins ntre 1.4 i 2.8.
g)O alt metod utilizat n preprocesarea imaginii o reprezint
netezirea (filtrarea) imaginilor. La achiziia oricror semnale de frecven
nalt peste semnalul dat apare o component de zgomot. Acest zgomot dac nu
este nlturat, poate influena negativ analizele ulterioare.
n cazul procesrii imaginilor, un accent important s-a pus pe gsirea
unui filtru care s nlture zgomotul alb (datorat componentelor aleatoare de
nalt frecven a semnalului video digitizat). Aceste zgomote apar n cmpul
imaginii sub forma unor pixeli izolai cu nuane mult diferite de nuana
pixelilor nconjurtori i poart numele de zgomot sare i piper.
De remarcat c pierderea frecvenelor nalte din imagine poate duce i
la pierderea unor detalii semnificative pentru procesul de recunoatere. De aici
rezult c alegerea filtrului este deosebit de important.
Netezirea imaginilor poate fi realizat cu:

23

1. filtre spatiale liniare - aceste filtre se caracterizeaz prin rspunsul lor


impulsional h(m,n) caz n care filtrarea unei imagini f(i,j) se obine prin
convoluie discret:

filtr

(i, j ) h(m, n) f (i m, j n)
m

Dac limitele m si n sunt finite, filtrul este cu rspuns impulsional finit


(RIF), n caz contrar avem filtre cu rspuns impulsional infinit (RII). Cele mai
utilizate filtre sunt de tip RIF, de dimensiune redus (3 x 3) din cauza
procesoarelor de convoluie specializate.
Convoluia este folosit n procesarea de imagini pentru:
-netezire (smoothing)
-accentuare a contrastelor (crispening)
-detecie de contur, etc.
n principiu, convoluia reprezint o sum ponderat de pixeli preluai
din vecintatea pixelului curent, sum utilizat pentru a determina noua valoare
a pixelului central.
Ponderile sunt determinate de o matrice relativ mic (3 x 3, 37 x 37)
numit matrice masc, nucleu de convoluie. n general dimensiunea este
impar, putndu-se astfel localiza centrul care va corespunde pixelului de
ieire.
Aceast matrice se va plimba peste toat imaginea iniial, obinnd
astfel valorile pixelilor de ieire (vezi Figura 6.10.).
Trebuie avut grij ca la procesarea pixelilor de ieire s nu stricm
valorile celorlali pixeli, de aceea se prefer ca rezultatul s fie memorat ntr-o
alt matrice, altfel se obine un sistem cu rspuns infinit n impuls, ceea ce nu
este de dorit.
Dac suma ponderilor din matricea de convoluie este 1, atunci
imaginea obinut va avea aceeai intensitate cu cea original. Dac aceast
sum este 0 (sunt i coeficieni negativi), n mod obinuit se adaug la valoarea
obinut o constant i dac tot se obine un pixel negativ el va fi setat pe 0.
O alt problem care se pune la convoluie este modul n care sunt
tratate marginile imaginii. Pentru aceasta sunt mai multe cazuri:

24

noua valoare = I0 x M0 + I1 x M1 + + I7 x M7 + I8 x M8

Figura 6.10. Modul de calcul pentru convoluia imaginii, cazul wrap


-se consider pixelii care nu aparin imaginii ca fiind egali cu 0,
-se pornete convoluia doar din locul n care se suprapune pe imagine,
-dublarea marginilor pentru o matrice de 3 x 3,
-considerarea valorilor n celelalte extremiti (wrap).
Multe mti de convoluie sunt considerate separabile, adic,
convoluia poate fi efectuat prin execuia a dou convoluii cu o masc
unidimensional.
O funcie separabil satisface relaia:
f(x,y) = g(x) x h(y) ,
ele reducnd numrul de calcule atunci cnd se folosesc mti de dimensiuni
mari. De exemplu, convoluia cu masca:

25

2
1
1
0
0
0

1 2 1
poate fi operat prin,

1
0 1 2 1

1
ns economia nu e spectaculoas (6 nmuliri n loc de 9).
Printre filtrele spaiale liniare amintesc:
Scoaterea n relief (embossing) se poate obine cu matricea

1 0 0
0 0 0

0 0 1
dup convoluie adugnd valoarea 128.
n cadrul imaginilor color exist n general dou tehnici care se aplic:
-lucrul cu imagini HSI, caz n care se lucreaz doar asupra intensitii, culoarea
fiind pstrat (cea mai des folosit),
-lucrul cu cele trei planuri R, G, B, caz care ofer rezultate mai bune, dar e
costisitoare ca timp de calcul.
Blurring (contururi neclare)
Reprezint un filtru trece jos care elimin detaliile fine din imagine. E
folosit pentru a simula defocalizarea unei camere, a nu scoate n eviden
fondul, etc.
Tehnica este folosit n domeniul fotografierii cnd se introduc diverse filtre. Ea
se poate realiza cu o masc de convoluie n care toi coeficienii sunt egali:
- la 3 x 3 , toi au valoarea 1/9 caz n care masca h(3,3) este:

26

1
9
1

9
1
9

1
9
1
9
1
9

1
9
1

9
1
9 ,

fiind un filtru trece jos.


Ca i valori n matricea de convoluie pot avea toi valoarea 1 i n
fa folosesc 1/9 sau1/25.
Acest filtru reduce zgomotul Gaussian din imagine nefiind ns
eficient pentru zgomotul n impuls, care reprezint un zgomot cu valori extreme
0 i 255 (zgomot sare i piper). Filtrul elimin zgomotele din imagine, fiind
eficace n cazul regiunilor uniforme. El deterioreaz marginile contururilor,
efectul lui fiind o uoar defocalizare a imaginii ce poate fi corectat prin
deconvoluie.
Medierea micoreaz contrastul, valorile tinznd s se alinieze la
valori de mijloc.
Pentru blurring se mai folosete urmtoarea masc:

1
16
1

8
1
16

1
8
1
4
1
8

1
16
1

8
1
16

care se apropie cel mai mult de profilul Gaussian.


Suma coeficienilor este egal cu 1 i deci, intensitatea imaginii de
ieire nu este afectat.
Filtrele Gaussiene de netezire sunt de forma:

G[ x, y ]

( x2 y 2 )
2 2

2 2

unde controleaz mprtierea efectiv.

27

Mtile care au valoare mic pentru sunt ascuite, iar cele cu mare
sunt late. influeneaz i dimensiunea mtilor. Ele trebuie s fie suficient de
mari ca s conin toi coeficinii diferii de zero.
Pentru:
= 2.0 este nevoie de o masc de 15x15
= 3.0 este nevoie de o masc de 23x23
Pentru 3x3 se folosesc valorile (-1,-1) , (-1,0) , (-1,1) , (-1,0) , (0,0) ,
(0,-1) , (1,0) , (0,1) i (1,1) pentru coordonatele x i y.
Filtrele trece jos elimin zgomotele, dar contururile devin neclare, de
aceea filtrul median este mai eficient.
Sharpening, ascuirea detaliilor are efect opus celui de blurring. Este
referit ca accentuarea contrastelor (crispening), dar scond n eviden
detaliile din imagine. Aceast tehnic poate fi folosit la restaurarea imaginilor,
mrind n acelai timp i contrastul. Matricea de convoluie are un coeficient
pozitiv n centru i n general negativi n rest. Ca i mti de convoluie avem:

0 1 0
1 5 1

0 1 0
sau masca

1 1 1
1 9 1

1 1 1

Filtrele trece sus, se pot constitui din dou filtre liniare a caror ieire
reprezint estimarea gradientului din imagine.

grad

f x, y

f x, y x
f x, y y g x x g y y
x
y

Amplitudinea gradientului poate fi estimat cu:

g g x2 g y2
sau
g = max ( |gx | , |gy | )
Orientarea dup care variaia intensitii este maxim, este dat de:

28

gy
gx

arctg

In cazul discret avem :


Dx f(x,y) = gx = f(x,y) - f(x-1,y)
Dy f(x,y) = gy = f(x,y) - f(x,y-1)
Derivata funciei imagine fa de o direcie a, este dat de:
Da f(x,y) = gx cos a + gy sin a
Operatorul Laplace, este un operator derivativ de ordin par, cu rol de
accentuare izotropic. Se definete ca :

2 f x, y

2
2

f
x
,
y

f x, y
x 2
y 2

n cazul discret derivatele pariale de ordinul al doilea pe direciile x i


y, sunt aproximate prin relaiile:

2
Dxx f x, y f x 1, y 2 f x, y f x 1, y
x 2
2
D yy f x, y f x, y 1 2 f x, y f x, y 1
y 2
Nucleul de convoluie este o singur matrice de 3 x 3 care poate fi:

0 1 0
1 4 1
0 1 0

Pentru mrirea preciziei se lucreaz cu un nucleu de convoluie de


forma:

29

1 1 1
1 8 1
1 1 1
,

care sintetizeaz media laplacianului corespunztor axelor originale, cu


laplacianul unui sistem de axe ortogonale rotite cu 45 o fa de axele originale,
sau cu matricea:

1 2 1
2 4 2
1 2 1

Imaginea accentuat va fi | 2 f(x,y) | .


Filtrele trece sus mresc detaliile dar i amplific zgomotele din
imagine.
2. filtre spaiale neliniare
Aceste filtre se constituie ca o multitudine de metode care depind n
general de aplicaia utilizat. Unul dintre aceste filtre l constituie filtrul
median.
Filtrul median nlocuiete valoarea fiecrui punct al imaginii cu
valoarea median a tuturor pixelilor din vecintatea punctului ales. Rezultatele
sunt foarte bune, nsa costul e destul de mare din cauza necesitii sortrii n
fiecare punct. Filtrul elimin zgomotele izolate din regiunile uniforme, pstrnd
tranziiile dintre regiuni.
Zgomotul Gaussian este nlturat de filtrele trece-jos. Zgomotul n
impuls este cel mai bine eliminat cu filtrul median.
Filtrul median pstreaz contururile i detaliile i deci frecvenele
nalte din imagine. Omul este foarte sensibil la frecvenele nalte din imagine.
Filtrul median const din suprapunerea i translatarea unei ferestre n general cu
un numr impar de linii i coloane. Pixelii din imagine peste care se suprapune
fereastra sunt ordonai cresctor, iar pixelul din mijloc va fi introdus n locul
pixelului curent (cel din mijlocul ferestrei). Ca i fereastr se ia de obicei un
bloc patrat impar, dar dac se doresc anumite operaii speciale putem avea:
- filtrul vertical
X
30

care elimin zgomotul corelat orizontal, cum ar fi o linie scanat care a


disprut.
- dac aplicm un filtru orizontal, atunci pixelul disprut va fi mprtiat n
ambele direcii. Acest filtru elimin zgomotele care apar n coloane de pixeli.
- se pot alege elemente i n form de X sau de diamant.
La alegerea unui bloc pentru filtrul median trebuie s se in cont de
timpul de procesare i de faptul c un filtru median de lime 3 pixeli elimin
zgomotele din imagine de pe o linie, iar un filtru median de lime 5 pixeli,
elimin zgomotele din imagine de pe dou linii, s.a.m.d.
Filtrul median poate fi aplicat i n spaiul 3D (2D + timp) mai ales n
televiziune, fiind numit filtru median temporal. Se elimin zgomotele de burst
(vrf), pstrnd de asemenea i micarea, mai bine dect filtrul temporal clasic.
Se pune problema de a optimiza acest filtru median pentru c odat ce
este aplicat pe o fereastr, n pasul urmtor, cnd se trece la urmtorul pixel, se
va modifica doar o coloan. Sunt metode care in cont de pixelii procesai
realiznd un algoritm de sortare adaptiv.
Se poate considera i un filtru median separabil. Acest lucru implic,
mai nti filtrarea imaginii cu un filtru orizontal i apoi urmat de o filtrare
vertical. Acest lucru va reduce timpul de calcul, sortnd 2n numere, fa de n x
n = n2. Ieirea filtrului separabil este similar cu cea a filtrului neseparabil.
n cadrul imaginilor color, algoritmul de calcul este diferit. Se poate
aplica pe fiecare plan R, G, B, i n final se combin cele trei planuri, dar se
pierde corelaia dintre componentele lor. O proprietate important a filtrului
median este aceea c el nu inventeaz alte valori, n pixelul curent fiind
introdus un pixel din imagine ales ca urmare a sortrii. Deci, un pixel obinut
din filtrarea median color trebuie s fie un pixel din imaginea iniial. n
cadrul filtrrii mediane color se poate exploata proprietatea c suma
diferenelor dintre valoarea median i toate celelalte valori va fi mai mic
dect suma diferenelor pentru orice alte valori din mulime:
N

x
i 1

med

xi y xi
i 1

unde: N = 9 pentru un bloc 3 x 3,


y este o valoare arbitrar i xmed este valoarea median.

31

Pe baza acestei proprieti putem nsuma diferenele dintre


componentele R, G i B. Pixelul avnd cea mai mic sum va fi considerat ca i
ieire a filtrului median.
Pentru a face calculele pentru filtrul median color se pornete cu N
elemente aflate n fereastra filtrat. Pentru fiecare pixel color se determin
distana:
N

Di red i red j greeni green j bluei blue j


j 1

unde i reprezint pixelul procesat i j sunt ceilali pixeli din fereastr. Valorile x
i y din ecuaia precedent vor fi componentele R, G i B.
x i = {red i , green i , blue i}

min Di
i 1, N , va corespunde ieirii filtrului, x .
i
Metoda poate fi folosit pentru ferestre pare i impare, ins cum,
tradiional, pixelul de ieire este asociat valorii centrale din fereastr, este de
preferat ca numrul pixelilor de intrare ai filtrului s fie impar.
Filtrul minim/maxim este un filtru asemntor cu cel median, doar c
n loc de a nlocui cu valoarea median pixelul din centru, el va fi nlocui cu
valoare minim sau maxim. Aceste filtre elimin zgomotele impulsionale
extreme (minimul elimin vrfurile albe, iar maximul elimin vrfurile negre).
Filtrul minim/maxim poate fi folosit pentru a lrgi trsturile din cadrul unei
imagini cu contrast ridicat. Acest filtru nu poate elimina zgomotele impulsive
mixte atta timp ct mbuntesc vrfurile negative i cele pozitive. O cascad
de filtre minim/maxim poate elimina sarea i piperul.
Un filtru maxim urmat de un filtru minim se numete un filtru de
nchidere (closing). Un filtru minim urmat de un filtru maxim se numete un
filtru de deschidere (opening).
Filtrul median poate fi uor transformat n filtru minim/maxim.
3. filtrarea temporal a imaginilor
Acest tip de filtru reuete s pstreze detaliile fine din imagine fr a
deteriora informaia util din imagine.
32

Metoda const n preluarea mai multor cadre ale aceleiai scene de


analizat i medierea rezultatelor. Dei mbuntirea este spectaculoas, ea este
aplicabil doar n cazul unor scene statice i necesit un timp destul de mare
afectat doar procesului de achiziie.
h) Operaii de adiacen
Operaiile de adiacen formeaz structuri din pixelii individuali. Sunt
impuse reguli de conectivitate (care din pixelii din vecintate sunt considerai
pentru expansiunea structurii) i de admisie (ce valori ale pixelilor candidai pot
fi luate pentru expansiune).
1.Concatenarea reprezint cel mai simplu exemplu de operaie de
adiacen. Ea poate opera asupra imaginilor binare folosind n general
conectivitatea pentru 8 pixeli nvecinai. Toti pixelii candidai cu o valoare de 1
sunt admii. Concatenarea repetat d un obiect.
2.Operaia de nlnuire n cadrul imaginilor binare reprezint un mod
de a obine conturul unui obiect. Operaia caut n mod secvenial n sensul
acelor de ceasornic printre pixelii aflai n adiacena punctului curent. Primul
pixel avnd valoarea 1 reprezint urmtorul centru de cutare. Printr-o operatie
repetat de nlnuire se obine conturul ordonat cu condiia ca punctul de start
s fie pe contur.
3.Cu ajutorul morfologiei matematice se pot extrage dintr-o imagine
anumite caracteristici specifice, funcie de scopul urmrit prin aplicarea unei
succesiuni de operatori adecvai.
O transformare morfologic elementar f este caracterizat prin:
- tipul ei : erodare, dilatare, etc.,
- elementul structural, B,
- iteratorul sau : o constant n, o limit,
- o masc, n cazul transformrilor geodezice.
Morfologia matematic a fost dezvoltat i pentru cazul digital n
vederea utilizrii n cadrul aplicaiilor de prelucrri de imagini. Exist operatori
definii n cazul imaginilor binare precum i n cazul imaginilor de intensitate.
Principalii operatori morfologici sunt:
a). Dilatarea
Dac notm:
- X ansamblul de puncte (albe) din imagine marcate cu 1 ce reprezint
obiectul, fondul fiind marcat cu 0,
- B, un ansamblu de puncte, numite element structural. Unul din
punctele elementului structural yo, e numit centrul lui B, celelalte puncte fiind
numite marcatoare,
- By reprezint translatarea lui B cu y, yo = y,
- B simetricul lui B fa de originea reperului,
33

atunci, dilatarea lui X cu B este definit ca :


Y = X + B' ,
ca un ansamblu de puncte
Y = { y : By X 0 }
Operaia de dilatare revine la marcarea (cu alb) a tuturor punctelor
interceptate de elementul structural B atunci cnd centrul elementului structural
baleiaz ansamblul punctelor multimii X. Dac elementul structural e o bul
(sfer, cerc) dilatarea lrgete obiectul cu o grosime constant.
b). Erodarea
Erodarea lui X cu B este dat prin :
Y = X - B'
i reprezint ansamblul de puncte,
Y = { y : By X } ,
adica Y e format din punctele y astfel nct elementul structural centrat n y ,
By, s fie inclus n X, deci plasnd centrul elementului structural pe punctele
ansamblului de puncte erodate, toi marcatorii reacoper un punct al obiectului
ce a fost erodat..
Dac elementul structural e o bul, erodarea subiaz obiectul cu o
grosime constant.
Erodarea i dilatarea sunt duale fa de complement,
( X + B')C = XC - B',
adic e echivalent a dilata punctele albe sau a eroda punctele negre.
Erodarea i dilatarea reprezint cazuri speciale ale operatorilor de
votare. Votarea majoritar sau minoritar admite pixelul dac un set de pixeli
din conectivitate are valoarea 1. Dac setul este 1 peste tot operaia de votare
degenereaz la dilatare sau erodare.
c). Deschiderea
Deschiderea este definit ca o erodare urmat de o dilatare,
X = ( X - B') + B ,
reprezentnd domeniul B baleiat de toate translatrile lui B incluse n X.
Operaia netezete contururile, suprim neregularitile, taie istmurile.
34

Dac elementul structural este o bul, operaia rotunjete unghiurile,


suprimnd unicele regiuni conexe.
d). nchiderea
Inchiderea este definit ca o dilatare urmat de o erodare,
XB = ( X + B') - B,
unghiurile fiind rotunjite, iar gurile umplute.
Deschiderea i nchiderea sunt duale prin complementaritate:
( X B)C = ( XC ) B i

( XC )B = ( XB )C

Ca i operaii asupra imaginilor, nchiderea i deschiderea reduc mult


din complexitatea datelor ce reprezint conturul corpurilor, reinnd
caracteristicile lor cele mai pregnante.
e). Scheletizarea unei imagini binare
Scheletul unei forme X oarecare poate fi definit ca centrul bulelor
maximale incluse n form. Putem de asemenea considera c, contururile
formelor sunt erodate din exterior pna cnd fronturile eroziunilor se
rentlnesc n puncte care reprezint scheletul.
Algoritmii morfologiei matematice, prin abstractizare elimin
informaia redundant n sensul scopului, punnd n eviden corpul de analizat.
Cu ajutorul morfologiei matematice se pot extrage din imagine o
sumedenie de caracteristici cu o succesiune de primitive adecvate.
Primitivele morfologiei matematice pot fi privite din dou puncte de
vedere:
- al coninutului matematic i algoritmic, ca i primitive operator, de
transformare,
- al efectului pe care l au asupra imaginii ca i primitive de efect, de
criteriu, de caracteristic.
Primitivele se clasific funcie de gradul de selectivitate ntr-o scar
ierarhic, complexitatea crescnd cu selectivitatea.
Operatorii morfologici pentru imagini de intensitate au la baz
definirea operatorilor definii pentru imagini binare, doar c selectarea valorii
care urmeaz a fi nscris n imagine ca urmare a unei transformari morfologice
se face pe baza unui criteriu de minim sau maxim, aplicat asupra pixelilor din
vecintatea de lucru.
Prin operaiile de adiacen definite pentru imaginile de intensitate se
poate obine o mai mare flexibilitate.

35

6.2.3. Procesarea geometric a imaginilor


Acest mod de procesare modfic arnjamentul pixelilor pornind de la
unele transformri geometrice. Ideea const doar din deplasarea pixelilor n
cadrul imaginii astfel nct n mod ideal valorile s nu fie modificate. El poate
fi efectuat att n etapa de preprocesare ct i n cea de analiz a imaginilor.
Dac acest proces se refer la un pixel a crui localizare nu exist,
atunci el va fi generat. Aceast generare se numete interpolare. Interpolarea nu
este un proces geometric, dar este utilizat de multe transformri geometrice.
a). Inverse mapping
n cazul n care se utilizez transformri geometrice asupra imaginilor,
deseori se folosesc coordonatele imaginii destinaie pentru a genera
coordonatele imaginii surs. Acest proces se numete potrivire invers
(inverse mapping).
b). Forward mapping
Procesarea punctual permite transferul unui pixel de intrare de
coordonate (x,y) n unul de ieire printr-un proces numit potrivire nainte
(forward mapping). La aceast potrivire apar dou probleme:
-gurile (holes) reprezint pixeli nedefinii, pixelii destinaie neavnd
coresponden n surs,
-suprapunerile (overlaps) apar atunci cnd doi pixeli de intrare se
potrivesc pe acelai pixel de ieire.
c). Interpolarea
Din cauza potrivirii putem avea anumite probleme. Fie transformarea:

xdestinatie
2
y
destinatie
2

x sursa
y sursa

Pixelul de la destinaia [0][0] va porni de la sursa [0][0]. Pentru


destiania [1][1] sursa ar trebui s fie [0.5][0.5], pixel care, ns, nu exist n
imagine (doar la rezoluie subpixel).
Interpolarea reprezint procesul generrii de valori ce pot aparine
ntre pixeli, deci pentru domeniul subpixel. Ea genereaz un pixel nou
analiznd pixelii din jur, astfel nct s poat face o asociere ct mai corect n
funcie de transformarea dorit i de pixelii din jur.
36

Funcia de interpolare este dependent de aplicaia dedicat, astfel


nct cu ct procesul de interpolare este mai sofisticat, procesul de calcul va fi
mai complicat i mai lung.
Principalele tehnici de interpolare sunt:
-interpolarea bazat pe cel mai apropiat vecin, pixelul fiind asignat
pixelului cel mai apropiat adresei nou generate, ca i pixel de ieire. Adresele
fracionare calculate pentru pixelii surs vor fi rotunjite la cel mai apropiat
pixel, valid ca adres.
-interpolarea biliniar, noul pixel generat fiind o surs ponderat a patru
pixeli, cei mai apropiai. Ponderile sunt direct proporionale cu distana de la
fiecare pixel existent. Sunt necesare trei interpolri liniare pe pixel rezultnd o
imagine mai neted (smoother) dect la metoda precedent.
-interpolare de nivel nalt, folosete zone mai mari pentru pixelii din vecintate
in vederea generrii pixelului de ieire. La acest nivel avem tehnicile de
interpolare cubice i B-spline care folosesc aisprezece pixeli vecini pentru a
genera pixelul de ieire. Principiul se bazeaz pe convoluia unidimensional.
Convoluia unidimensional cubic este dat de relaia:

a 2 x 3 a 3 x 2 1

, 0 x 1

f x a x 5a x 8a x 4a , 1 x 2

0
,
2 x

cu valori pentru a:
- 0.5 pentru precizie aritmetic mare,
- 0.75 i
- 1.0 pentru vizualizare bun.
n procesul de calcul se impun optimizri pentru a crete viteza de calcul.
Funcia ideal de interpolare reprezint un filtru trece jos, n acest caz
interpolarea B-spline oferind un rezultat foarte bun. Funcia este strict pozitiv,
oferind netezirea cea mai bun. Funcia unidimensional B-spline este dat de
relaia:

37

1 3
2
2
x x
2
3

, 0 x 1

1 3
4
2
f x x x 2 x
, 1 x 2
3
6
0
,
2 x

d). Scalarea imaginilor


Scalarea permite modificarea anumitor dimensiuni dintr-o imagine.
Procesul prin care o imagine sau o poriune din imagine este scalat se
numete:
-magnificare
-scaling up
-zooming
-upsampling
-stretching, dac se face prin mrire, respectiv:
-shrinking
-scaling down
-decimare
-downsampling
-minificare, dac se face prin micorare.
Prin scalare nu se va mbunti rezoluia pentru c nu sunt mai multe
date dect cele capturate. Prin interpolare se mai pot genera noi valori, dar ele,
practic, vor altera imaginea original.
Scalrile se fac avnd ca referin imaginea original, imaginea
rezultat va fi modificat innd cont de anumii factori de scal, iar dac se
revine la mrimea iniial, noua imagine va fi deteriorat fa de cea original
datorit procesului de interpolare.
n principiu, scalarea este un proces simplu:
-magnificare repetri de pixeli, n funcie de metoda de interpolare aleas,
-shrinking duce la posibilitatea pierderii detaliilor fine din imagine.
De aceea pot fi folosite diverse tehnici, cum ar fi:
-reprezentarea median a unui bloc de pixeli, care nlocuiete blocul cu
valoare lui median,
-reprezentarea medie a unui bloc de pixeli, care nlocuiete blocul cu
valoare lui medie, etc.
e). Rotaia imaginii
Rotaia imaginii se face centrat la un pixel sau la origine, cu un unghi
dat , pe baza relaiilor:
38

xsurs = xdestinaiecos + ydestinaiesin


ysurs = ydestinaiecos xdestinaiesin ,
referitor la origine.
Aceast relaie rotete imaginea raportat la punctul (0,0), dar dac
imaginea este centrat n (xcentr,ycentr), relaia devine:
xsurs = (xdestinaie xcentr)cos + (ydestinaie ycentr)sin
ysurs = (ydestinaie ycentr)cos (xdestinaie xcentr)sin
f). Translaia
Const din deplasarea unei seciuni a imaginii la o alt locaie n
imagine. Este posibil ca destinaia s se suprapun peste surs i n acest caz
trebuie memorate aceste valori pentru a evita distrugerea imaginii.
g). Oglindirea
Reprezint oglindirea imaginii dup axa Ox sau Oy. Oglindirea
orizontal se face dup axa Oy, iar oglindirea vertical se face dup axa Ox.
Practic, pixelii vor fi reorganizai, neefectundu-se nici o operaie de
transformare.

6.2.4. Procesarea pe cadre


Implic considerarea a dou sau mai multe imagini, imaginea de ieire
obinndu-se ca urmare a unei operaii care se efectueaz ntre mai multe
imagini.
Principalele operaii care se efectueaz sunt:
-adunarea,
-scderea,
-operaii logice (I / SAU),
-media.
a)Adunarea
De obicei nu se face adunare simpl pentru c poate s apar depire.
De aceea se folosete relaia:
Noul_pixel = pixel1 + (1 ) pixel2
39

Astfel, poate fi specificat astfel nct una dintre imagini s fie predominant.
b)Scderea
Este folosit pentru a determina diferenele dintre imagini, folosit mai
ales n procesul de supraveghere. n acest caz se consider un prag care
declaneaz alarma (algoritmii mai complicai se ghideaz i n funcie de
strlucire, etc.).
c)Operaii logice
Operaia AND (I)se folosete pentru a masca o parte din imagine.
Operaia OR (SAU)este folosit pentru a aduga pri dintr-o alt
imagine peste imaginea iniial.
d)Media
Practic, reprezint filtrul temporal i deci imaginile trebuie s fie
statice.
Media elimin doar zgomotele necorelate.

6.2.5. Modulul de segmentare a imaginilor


Etapa de separare respectiv detectare a corpurilor din cmpul imaginii
are ca efect o reducere important a volumului informaiilor prin definirea
indicilor de imagine care posed o semnificatie. Distincia dintre fond i obiect,
numit segmentare, poate fi fcut prin punerea n eviden a zonelor de
variaie rapid a intensitii luminoase.
n cazul unei imagini de intensitate, procesul de segmentare depinde
de geometria obiectelor, reflectana suprafeei vizibile, iluminarea scenei i
originea captorului.
Segmentarea se poate face n mai multe moduri:
- Binarizare - o segmentare care mparte imaginea n dou clase,
obiect i non-obiect.
- Extragere de contur - segmentarea care mparte imaginea n zone de
contur i non-contur.
Conturul reprezint zone din imagine a cror valoare a pixelilor
variaz ntr-un mod brusc. Conturul fizic este reprezentat n general prin linii de
discontinuitate a suprafeei, margini tangeniale ale suprafeei, limitele
umbrelor sau refleciilor sau linii de discontinuitate date de reflectana diferit a
unor zone.

40

Pornind de la conturul fizic, conturul unei imagini este dat n general


printr-o aproximare prin segmente de dreapt care pot fi considerate indici de
imagine.
- Extragere de regiuni - o segmentare care detecteaz regiunile din
imagine, ca indici de imagine.
Regiunile reprezint zone omogene ale imaginii innd cont de un
anumit criteriu cum ar fi, nivelul de gri, culoare, textur, etc.
Formarea regiunilor poate fi facut printr-un procedeu bazat pe
aplicarea pragurilor deduse din histograma imaginii sau prin metode mai
complicate cum ar fi cele bazate pe aproximare funcional.
n cazul segmentrii bazate pe intensitate, deseori apar detectate
regiuni false. Apariia regiunilor false este dat n general de zgomotul de nalt
frecven i de tranzitia neted ntre regiuni uniforme. Rafinarea regiunilor
poate fi fcut n mod interactiv sau automat.
Principiile generale ale segmentrii se refer la faptul ca obiectul de
interes poate fi gsit prin descoperirea zonelor unde valorile pixelilor sunt
omogene i n cazul n care obiectele nu difer apreciabil fa de vecini, trebuie
s ne bazm pe detecia de muchii.
6.2.5.1. Detecia de prag (Thresholding)
Pe baza deteciei de prag putem efectua:
-binarizarea unei imagini, caz n care o imagine de intensitate (cu
nivele de gri) va fi convertit ntr-una alb-negru (binarizare). Aceast nou
imagine trebuie s conin toate informaiile necesare referitor la numrul,
poziia i forma obiectelor.
-extragere de contur,
-extragere de regiuni.
Utilizarea nivelelor de gri ale pixelilor face ca anumii pixeli avnd
nivele de gri apropiate s poat fi mprii pe baza unei proceduri de clasificare
n obiect sau nou obiect.
Detectia de prag, aproape intotdeauna este esenial nainte de:
-subierea contururilor (thinning)
-vectorizare
-operaii morfologice, etc.
Cea mai folosit metod de conversie a unei imagini de intensitate
ntr-una alb-negru este de a selecta un singur prag, T. n acest mod:
-dac I(i,j)<T , I(i,j)=0 , colecia pixelilor negrii
I(i,j)T , I(i,j)=1 , colecia pixelilor albi

41

Selectia pe baza unui singur prag ne ofer o solutie brut de


segmentare, oferind o soluie global utilizabil mai ales n cazul n care
imaginile se preteaz a fi tratate astfel (documente scanate, imagini simple de
test, etc.)
Algoritmii de detecie de prag se pot baza:
-pe histograma imaginii
-pe anumite valori din imagine, etc.
O metod simpl, dar relativ ineficient const din a considera
valoarea medie a intensitilor din imagine ca i prag. Aceasta implic, c
imaginile au aceeai pondere pentru negru i alb, lucru care nu este realist. n
general procentul de negru poate fi constant, dar nu egal cu cel de alb. La o
foaie tiprit el variaz n general ntre 8,46% i 15,67%, n funcie de existena
formelor, imaginilor, etc
n general histograma este cea mai folosit n procesul deteciei de
prag. Adesea pragul este considerat a fi punctul cel mai de jos ntre dou vrfuri
semnificative ale histogramei. Dac histograma este doar cu dou vrfuri,
aceast alegere este cea mai bun.
Segmentarea bazat pe prag a imaginilor se bazeaz pe faptul c o
muchie (edge) este dat de pixelii care sunt apropiai de contur, ntre obiect i
fond sau ntre dou obiecte care aproape se ating. Histograma punctelor care
constituie muchia este foarte regulat i din acest motiv se pot detecta muchiile
pornind de la Laplacian, care este un operator de detecie de muchii
nedirecional. Cel mai simplu mod n acest caz este de a folosi un nucleu de
convoluie adecvat pentru acest Laplace.
n continuare se vor considera doar acei pixeli care au valori largi ale
Laplacian-ului. Acei pixeli care au Laplacian-ul mai mare cu 85% fa de
veciniii lor vor fi pstrai n imagine; dup aceea pragul va fi determinat
pornind de la noua histogram a imaginii obinute.
O metod de detecie de prag care nu se bazeaz pe histogram
consider valoarea medie Tmed a intensitii din imagine ca un prim prag, care
apoi este rafinat printr-un proces de selecie iterativ. Urmtorul prag se
determin considernd media nivelelor de gri a tuturor pixelilor de la 0 la T med ,
Tb , respeciv de la Tmed la 255, de unde obinem To . Noua valoare va fi:

Tb To
2
.

42

Procesul se repet pn cnd nu mai avem o schimbare a pragului.


Acest proces poate fi implementat hardware, varianta software se poate
implementa mai usor, pornind de la histogram.
La detecia de prag se poate folosi i entropia. Entropia este o msur
a coninutului informaional a unei imagini.
Mulimile fuzzy pot fi i ele folosite la detecia de prag, precum i alte
diverse metode.
Oricum, procesul de detecie de prag n vederea segmentrii este foarte
dependent de natura i calitatea imaginilor utilizate.
6.2.5.2. Detecia de contur (muchii)
Muchiile dintr-o imagine permit izolarea obiectelor, determinarea
formei, dimensiunii i anumite informaii legate de textur.
O muchie reprezint locul n care intensitateta unei imagini se
modific brusc de la o valoare low la o valoare high sau invers.
Sunt multe aplicaii, uneori folosite doar ca i efecte speciale unde
ieirea unui detector de muchii se poate suprapune peste imaginea iniial
pentru a accentua muchiile.
Detecia de muchii reprezint cel mai complex element din
procesarea imaginii, neexistnd o metod universal valabil pentru c
muchiile sunt foarte diverse.
De multe ori se fac diferite experimente pentru a alege cea mai bun
tehnic de detecie de contur.
Cel mai simplu i rapid detector de muchii determin valoarea maxim
prin scderea din valoarea pixelului central a celor opt vecini (separat),
valoarea de ieire fiind maximul valorii absolute a fiecrei diferene. Acesta
este operatorul de omogenitate.
Operatorul diferen este mai rapid, el fcnd mai puine operaii,
fcnd scderi n vecintate n modul urmtor:

Ceilali detectori globali de contur folosesc unele mti de convoluie


i putem avea n acest caz:

43

a) Operatori derivativi de ordin 1


-Operatorii de tip gradient obinuit, (sau gradient ortogonal) detecteaz
muchii orizontale i verticale. Aceti operatori lucreaz prin convoluie. Mtile
cele mai utilizate sunt:
Hr
Hc

0 0 1
0 1 0

0 0 0

1 0 0
0 1 0

0 0 0

Roberts

1 0 1
1 0 1

1 0 1

1 1 1
0 0 0

1 1 1

1 0 1
2 0 2
1 0 1

1 2 1
0
0
0
1
2
1

1
2

0
0
0

1 2

0
0
1
2

1
2
1

0
1

Prewitt

Sobel

Frei - Chen

Amplitudinea poate fi determinat calculnd vectorul sum al Hr i


Hc:

H x, y H r x, y H c x, y
2

Orientarea muchiilor poate fi gsit prin:

tan 1

H c x, y
H r x, y

-Operatorul gradient compass, detecteaz muchii pentru opt orientri


diferite. Practic, imaginea va fi convoluionat cu opt mti, ieirea fiind
maximul dintre cele opt valori obinute.
44

Ceea ce este de remarcat este faptul c mtile de dimensiune mic


sunt senzitive la zgomote.
b) Operatori derivativi de ordin 2
Operatorii gradient au un rspuns larg asupra zonei tratate. Ei sunt
buni pentru muchiile care au o ramp lent.
Detectarea oricrui contur se numete localizare, dar n general este
dificil a detecta conturul muchiilor de civa pixeli. De multe ori se folosete un
proces de subiere (thinning) pentru a reduce limea muchiilor la un pixel.
Operatori derivativi de ordin 2 ofer rezultate mai bune. De asemenea,
contururile obinute sunt inchise.
Operatorul Laplacian este cel care este untilizat cel mai frecvent fiind
prezentat anterior. El va produce muchii mai ascuite dect majoritatea
celorlalte tehnici.
Utiliznd anumite mti, n imagine apar valori ale pixelilor care duc
la o schimbare de semn la muchiile imaginii. Aceste schimbri de semn sunt
numite treceri prin zero sau zero crossing. Dup convoluie imaginea trebuie
s fie procesat pentru a detecta aceste treceri prin zero i pentru a seta pixelii
de ieire n mod adecvat.
Operatorul Laplace este sensibil la zgomote, i de aceea trecerile prin
zero indic mai multe muchii dect sunt n realitate. De aceea se folosete un
prag pentru a determina magnitudinea muchiilor care vor fi marcate. De multe
ori se prefer folosirea Laplacianului Gaussianului, LOG, care este un operator
mai eficient. El presupune, mai nti, aplicarea netezirii Gaussiene i apoi a
Laplacianului. Se poate defini astfel masca:

1
LOG x, y
2

x2 y2
1

2
2

x2 y2
2 2

Funcia este numit filtrul plria Mexican.


Primul punct zero crossinga lui LOG este la 2 .
De obicei acest operator este folosit cu mti de dimensiuni mari mai
mari de 7x7 i de aceea numrul de calcule este foarte mare. Pentru cazul
37x37 se prefer a se folosi o aproximare dat de operatorul DoG (Difference
of Gaussians):

x2 y2
2 12

x2 y2
2

e
e 2 2
DoG x, y

2 12
2 22
45

Practic se va face convoluia cu DoG prin scderea a dou mti Gaussiene cu


valori diferite. Raportul 1/2=1.6 d o aproximare bun pentru LOG. Un
avantaj a lui DoG este abilitatea de a specifica limea muchiilor de detectat
modificnd valorile lui 1 i 2 ; masca de 9 x 9 va detecta muchii mai largi
dect masca de 7 x 7.
De asemenea, DoG nchide contururile detectate.
c) Filtrul Canny
A fost propus n 1986 de ctre John Canny. Acesta propunea ca un
detector de muchii este necesar s satisfac trei criterii:
-detecie bun,
-localizare bun,
-un singur rspuns la o singur muchie.
Acest filtru se implementeaz considernd urmtorii pai:
-se face o convoluie a imaginii cu o masc Gaussian,
-se calculeaz componentele gardientului pentru fiecare pixel,
-se calculeaz direcia gradientului pentru fiecare pixel rezultat,
-se calculeaz derivata de ordin 2 n lungul acestei direcii a
gradientului pentru fiecare pixel,
-se localizeaz valorile de zero n aceast derivat de ordin 2,
-se clasific valorile de zero ca puncte de pe contur.
d) Detecia color
ntr-o imagine color trebuie vzut care este diferena muchiilor. n
cazul n care suntem n spaiul HSI (sau unul corespondent), detecia se face
innd cont de canalul de intensitate. n spaiul RGB, detecia de contur se face
pe cele trei planuri separate, dup care, combinnd cele trei planuri, rezult o
imagine color segmentat. Cele trei componente pot fi i adunate pentru a crea
o scal de gri, sau pot fi adunate vectorial rezultnd tot nivele de gri, astfel:

G x, y GR2 GG2 GB2


n general majoritatea muchiilor detectate n spaiul HSI se gsesc i in
spaiul RGB, deci este suficient a se face detecia pornind de la componenta de
intensitate.
n cazul n care avem imagini de contrast sczut, detecia pornind de la
intensitate nu este suficient i atunci se face o detecie innd cont i de
crominana imaginii.

46

6.2.6. Modulul de analiz i interpretare a imaginilor


Analiza i interpretarea imaginilor grupeaz dou tehnici principale i
fundamentale de abordare:
a) tratri numerice, care permit dup ameliorarea imaginilor, utiliznd
diferite tehnici de segmentare, extragerea de caracteristici generale cum ar fi,
linii de contrast, segmente i unghiuri de referin, etc. Algoritmii asociai n
acest caz depind ntr-o mic msura de natura problemei de tratat, ei fiind
algoritmi generali de recunoatere de forme.
b) metode de judecat, fondate pe cunotinte explicite precum i pe
reprezentarea lor. Cunotinele sunt legate de problemele puse spre rezolvare,
domeniul de aplicaie, tehnica utilizat, etc.
Majoritatea metodelor practice de recunoatere a formelor permit
identificarea obiectelor pe baza corespondenei cu o baz de modele. Modelele
pot fi perceptuale, funcionale sau semantice.
Aceste cunotinte sunt organizate n cadrul unui sistem de
reprezentare, sistem n cadrul cruia se definesc:
-tipul de cunotinte care se dorete a fi reprezentat, utiliznd:
- atribute caracteriznd forma obiectelor, cum ar fi factor de form,
factor de ondulaie, factor de aplatizare, orientare, etc.,
- atribute depinznd de natura suprafeei obiectelor cum ar fi textur,
culoare, etc.,
- relaii ntre obiecte, de apartenen sau de poziie relativ.
-reprezentarea informatic a acestor cunotine prin, reguli de producie,
reprezentri procedurale, utilizarea de limbaje orientate obiect, etc.
Combinarea metodelor de analiz a imaginilor, n special n cazul
tratrilor imaginilor de o calitate mediocr, faciliteaz obinerea unor rezultate
deosebit de utile.
n vederea vizualizrii imaginilor prelucrate att n cazul unor sisteme
cu posibiliti de lucru cu imagini de intensitate ct i color, se pune problema
recodificrii lor n vederea scoaterii n eviden a unor detalii de interes care
duc la o metod de interpretare ct mai precis a rezultatelor.
Metodele de recodificare a imaginilor pe baza de LUT (Look Up
Table) sunt intens folosite datorit vitezei mari de prelucrare a volumului de
informaie coninut de semnalul imagine. Aceast vitez se datorez i setului
ortogonal de instruciuni al procesoarelor moderne.
n principiu, metoda const n schimbarea intensitii i/sau a nuanei
pixelilor unei imagini conform unei tabele construite n prealabil. n vederea
pstrrii intensitii pixelilor din imagine se prefer ca recodificarea s fie
facut innd cont doar de crominan, astfel c ulterioarele prelucrri care se
47

efectueaz asupra imaginii s beneficieze de aceleai valori pentru intensiti.


n sistemele moderne de prelucrri de imagini LUT-ul este un dispozitiv hard.
Tabelele de recodificare, LUT implementeaz cel mai uor algoritmii referitor
la operaiile punctuale asupra imagnilor.
Deci LUT sunt tablouri simple, care folosesc valoarea curent a
pixelului ca un index n cadrul acestor tabele, de unde se va lua o nou valoare
care va fi introdus n imaginea de ieire n aceeai poziie n care a fost n
imaginea de intrare.
Imaginea de intrare

LUT

7754276430764316
642055310

001021314
2536475

Imaginea de ieire
5532133100

Figura 7.11. Tabele de recodificare LUT


Utilizarea LUT evit efectuarea de operaii de calcul inutile. n cazul
de mai sus (3 bii / pixel), practic, doar trei valori sunt procesate, indiferent de
dimensiunea imaginii (n general, la imagini cu opt bii per pixel sunt procesate
256 de valori).

6.2.7. Tehnici specifice utilizate n procesarea imaginilor


6.2.7.1. Analiza textural
Analiza textural este inclus n cadrul analizei imaginilor fiind o parte
integrant a vederii artificiale. innd cont de diferena existent ntre teoria
elaborat n vederea definirii texturilor i aplicaiile practice care urmeaz a le
implementa este necesar definirea i descrierea unor primitive care s
caracterizeze textura.
Analiza textural se ncadreaz n cadrul analizei imaginilor
nonfigurative. n acest caz imaginile conin anumite modele care se repet dup
o anumita regul. Printre domeniile n care analiza textural ii gsete diferite
aplicaii avem medicina cu deosebire genetica, morfopatologia, histopatologia,
biofizica etc.
48

Uneori diferena ntre dou texturi e dat de acest aspect aleator al


texturii sau de distribuia statistic gsit ntre textoni (abloane care se pot
repeta fie n mod exact, fie cu unele mici modificri).

Figura 6.12. Imagini avnd regiuni caracterizate prin texturi


(a, b) Textura arificiala
(c, d, e) Textura naturala delimitata din imagini reale
n Figura 6.12. este prezentat o mic colecie de texturi, cteva
naturale i altele artificiale. Analiza textural este strns legat de procesul de
segmentare a texturilor mai degrab dect de caracterizare a lor.
O textur este considerat a fi o structur spaial construit prin
organizarea unor primitive cu aspect aleator. Este extrem de dificil a segmenta
texturi. Liniile de separaie desenate ntre texturi deseori sunt arbitrare, funcia
de percepie deseori este matematic. Este posibil ca anumite combinaii de
operaii s ofere rezultate rezonabile. Noi metode se incearc a fi utilizate, n
general metode bazate pe fractali i analiza fractalic.
Se pot ncerca unele metode simple de detecie a texturilor folosind
intensitatea din cadrul unor ferestre (de 3 x 3, pna la 37 x 37) unde se poate
determina intensitatea medie precum si unii parametrii statistici specifici.
Utlizarea unor ferestre care se suprapun printr-un anumit algoritm asupra
imaginii poate s ofere unele rezultate acceptabile. Acest lucru este explicabil
innd cont de faptul c textura se refer la regiuni de pixeli si nu la pixeli
individuali. n consecint delimitarea texturilor se poate face considernd o
distan de W pixeli, unde W reprezint limea ferestrei alese.

49

Figura 6.13. Segmentarea texturilor folosind fereastra de


suprapunere
(a) Media intensitatilor intr-o fereastra de 14x14 considerand imaginea
din 7.12.b.
(b) Binarizarea acestei imagini.
(c) Zona de separatie apartine unei plaje de separatie incerte
In Figura 6.13. este ilustrat urmtorul principiu. Se folosete media
intensitilor pentru a segmenta imaginea din Figura 6.12.b.
Valoarea medie d rezultate acceptabile n acest caz dar n general n
cadrul altor tipuri de imagini rezultatele sunt nesatisfctoare. Se mai poate
considera n acest sens i deviaia standard a nivelelor de gri.
Figura 6.14. ne arat regiunile identificate folosind deviaia standard local la
segmentarea texturilor. Asfel, Figura 6.12.a poate fi segmentat prin aceast
metoda i chiar i celelalte imagini cu excepia 6.12.d.

Figura 6.14. Utilizarea deviaiei standard la segmentarea imaginilor


din Figura 6.12.
50

6.3. Bibliografie
1. Albert R., Schindewolf Th., Baumann I., Harms H.,
Three-Dimensional Image Processing for Morphometric Analysis of Epithelium
Sections, Cytometry, Vol. 13, 1992, pp. 759-765
2. Ammeral Lendert, Programming Principles in Computer Graphics,
Academic Press, 1992
3. Canny J., A Computational Approach to Edge Detection, IEEE
Trans. on PAMI, Vol. 8, nr. 6, november 1986, pp. 679-698
4. Crane R., A Simplified Approach to Image Processing: Classical
and Modern Techniques in C, Prentice Hall, 1997
5. Glassner Andrew S., 3D Computer Graphics. A User's Guide for
Artists and Designers, The Herbert Press, London, 1991
6. Goldfarb L., On the foundation of intelligent processes. An
evolving model for pattern learning, Pattern Recognition, nr. 6, 1990, pp.
595-616
7. Marr D., Hilderth E., Theory of Edge Detection, Proc. Royal Soc.
London, Vol. B207, 1980, pp. 187-217
8. Marshal Garry, Student's Guide to Expert Systems, Heinemann
Newnes, Halley Court, Jordan Hall, Oxford, 1990
9. Meyer F. , Feature Extraction by Mathematical Morphology in the
Field of Quantitative Cytology, Biomedical Image and Computer, Ed. Sklansky
J. and Bisconte J. C. , France Seminar, 1980, pp. 56-65
10. Olinici C.D., Vaida M.-F., Metode de analiza cantitativa si
morfologica in biologie si medicina, Edit. Tehnica Bucuresti, 1997
11. Parker J.R., Algorithms for Image Processing and Computer
Vision, Wiley Computer Publishing, John Wiley & Sons, 1996
12. Pavlidis T., Algorithms for Graphics and Image Processing,
Springer-Verlag, Berlin-Heidelberg, 1982
51

13. Quinnell R. A., Image compression- Part 1, EDN, january 21,


1993a, pp. 62-71
14. Quinnell R. A., Image compression- Part 2, EDN, march 4, 1993b,
pp. 120-126
15. Rosenfeld A., Kak A. C., Digital Picture Processing, Second
Edition, Academic Press, 1982
16. Schmitt M., Des algoritmes morphologiques a l'intelligence
artificielle, These docteur, Universit Paris-sud, 1989
17. Selinger S., Kovacs S., Analiza si clasificarea texturilor
microscopice, Raport de cercetare 811 IS Software-ITC Bucuresti, filiala ClujNapoca, mai 1993
18. Serra J., Image Analysis and Mathematical Morphology, Vol. 1,
Academic Press, 1982
19. Serra J., Image Analysis and Mathematical Morphology, Vol. 2,
Academic Press, 1988
20. Russ J.F.C., The Image Processing Hand book, Third Edition,
CRC Press with IEEE Press, Springer, 1999
21. Mircea-Florin Vaida, Procesarea Imaginilor medicale. Ingineria
programrii n vederea dezvoltrii de aplicaii n domeniul bio-medical, Casa
Crii de Stiin, 2000

52

S-ar putea să vă placă și