Sunteți pe pagina 1din 12

Capitolul 1

Consideraţii generale privind prelucrarea imaginilor

INTRODUCERE
Subiecte
1.1. Domeniul prelucrărilor de imagini
1.2. Percepţia vizuală

1.1. Domeniul prelucrărilor de imagini


Între toate simţurile cu care suntem dotaţi, sistemul vizual ne
furnizează cea mai mare cantitate de informaţii referitoare la mediul
înconjurător. Cu toate că percepţia vizuală este departe de a fi complet
înţeleasă, ingineria modernă se preocupă intens de problema realizării
unor sisteme de vedere artificială, capabile să emuleze, fie şi parţial,
capabilităţile sistemului vizual uman. În acest demers, s-au acumulat
progrese importante în decursul ultimelor decenii, prin contribuţiile
conjugate ale cercetărilor din matematică, fizică, electronică, tehnică de
calcul, biologie, fiziologie, psihologie, inteligenţă artificială etc. Aflat
într-un proces de dezvoltare rapidă, domeniul prelucrării imaginilor este
unul interdisciplinar şi pluridisciplinar.

În sens restrâns, obiectivul prelucrării numerice a imaginilor


constă în transformarea imaginii în scopul facilitării interpretării
vizuale sau al reducerii cerinţelor de memorie pentru reprezentare sau
stocare, respectiv al debitului de date sau benzii de frecvenţă necesare
transmiterii la distanţă. În sensul cel mai larg, prelucrarea poate urmări
măsurarea unor parametri de poziţie, viteză de mişcare sau formă al
unor obiecte, recunoaşterea obiectelor dintr-un cadru de imagine,
interpretarea scenei sau recunoaşterea tipului de activităţi ce sunt
surprinse în videosecvenţe. O reprezentare generală schematizată a
etapelor de prelucrare a unei imagini este redată în Fig. 1.1. Nu
întotdeauna toate etapele reprezentate sunt necesare.
Imaginile supuse prelucrării sunt adesea afectate de ceea ce
denumim generic “zgomot”. Agitaţia termică a electronilor în senzorii
de imagine şi în dispozitivele şi circuitele electronice utilizate în
amplificarea şi conversia digitală a imaginii este doar una din
numeroasele surse ce afectează calitatea acesteia. Imperfecţiuni ale
sistemului optic, turbulenţa atmosferică, fenomenele meteo, iluminarea
neuniformă, sau umbrele sunt alţi factori ce fac necesară dezvoltarea
tehnicilor de preprocesare. Tehnicile de preprocesare sunt clasificate în
Capitolul 1
Consideraţii generale privind prelucrarea imaginilor

tehnici de ameliorare şi de tehnici de restaurare a imaginilor. În


restaurare, prelucrarea este ghidată de un model fizic riguros al
procesului de degradare ce se doreşte a fi inversat.

ACHIZIŢIE
IMAGINE

PREPROCESARE

SEGMENTARE

MODEL

DESCRIERE

RECUNOAŞTERE
FORME

ANALIZĂ/
INTERPRETARE

Fig. 1.1. Etape ale procesului de prelucreare şi analiză a imaginii.

Un exemplu de operaţie de preprocesare este eliminarea zgomotului, cu


ajutorul unui filtru de netezire, aşa cum se ilustrează pentru imaginea de
angiocardiografie radionuclidică de echilibru din Fig. 1.2.

Fig. 1.2. Exemplu de filtrare de netezire a unei imagini.


Capitolul 1
Consideraţii generale privind prelucrarea imaginilor

Prin segmentare, se umăreşte fragmentarea imaginii într-o serie de


regiuni, pe baza unor atribute ale imaginii ce sunt aproximativ constante
în fiecare regiune dar diferă semnificativ de la regiune la regiune. Ideal,
regiunile corespund obiectelor sau unor părţi de sine stătătoare ale
acestora. Un exemplu de segmentare a ventriculului stâng în imaginea
din exemplul anterior se găseşte în Fig. 1.3.

Fig. 1.3. Exemplu de segmentare a ventriculului stâng (mărit la scara


2:1).

În aplicaţiile de recunoaştere a formei, obiectul segmentat este supus


unor operaţii de extragere de trăsături caractetistice, ce descriu forma
sau textura segmentului şi stau la baza procesului ulterior de clasificare,
pe baza vectorului descriptor al caracteristicilor. În aplicaţie de analiză
a imaginii scintigrafice, segmentarea are ca obiectiv măsurarea
volumului de sânge din ventriculul stâng în imaginile corespunzătoare
celor două faze extreme (sistolă şi diastolă) ale ciclului cardiac. Pe baza
lor, se poate determina fracţia de ejecţie a ventriculului stâng,

FE = (Vmax-Vmin) / Vmax ,

reprezentând un indicator important al sinergiei mişcării de contracţie şi


stării de sănătate a inimii.

1.2. Percepţia vizuală

Înţelegerea principiilor de bază ale percepţiei vizuale este importantă


pentru oricine este implicat în prelucrarea imaginilor din motive
multiple. În analiza imaginilor, rezultatul prelucrării este o imagine în
care utilizatorul trebuie să “perceapă” mai uşor ceea ce îl interesează. În
compresie, rezultatul este o imagine reprezentată concis, în care
utilizatorul trebuie să nu perceapă, pe cât posibil, diferenţa faţă de
imaginea originală. Pe de altă parte, progresele în înţelegerea percepţiei
vizuale ajută la elaborarea metodelor de prelucrare.

1.2.1 Ochiul uman


Lumina incidentă pe ochi străbate un sistem optic compus dintr-o
lentilă (cristalinul) şi o diafragmă (pupila), formînd o imagine pe retina
Capitolul 1
Consideraţii generale privind prelucrarea imaginilor

situată pe fundul ochiului. Retina conţine două categorii de elemente


fotosensibile: conuri, în număr de aproximativ 6.000.000 şi bastonaşe,
în număr de aproximativ 120.000.000. Zona centrală, foveea, conţine
numai conuri, care au densitatea maximă în această regiune. Pe măsură
ce ne îndepărtăm de zona centrală, densitatea conurilor scade. Treptat,
apar şi bastonaşele, a căror densitate este mai redusă. Conurile sunt
răspunzătoare de acuitatea spaţială şi de vederea colorată la niveluri de
iluminare ridicate, corespunzătoare luminii zilei (vedere fotopică).
Există trei tipuri de conuri, cu sensibilităţi maxime la roşu, verde-gălbui
şi albastru. Primele două tipuri de conuri sunt dispuse numai în zona
foveală, în timp ce conurile albastre se găsesc şi în afara ei. Bastonaşele
sunt mult mai sensibile la lumină decât conurile şi sunt răspunzătoare de
vederea la iluminare redusă (vederea scotopică). Deoarece bastonaşele
sunt toate de acelaşi tip, la iluminare redusă percepţia culorilor nu este
posibilă. La niveluri de iluminare intermediare, ambele tipuri de vedere
se îmbină (vedere mesopică).

Lumina absorbită de receptori iniţiază reacţii chimice care dispersează


pigmentul fotosensibil, reducând sensibilitatea generală. Acest
mecanism acţionează ca un sistem de reglare automată a sensibilităţii.
Mecanismul menţionat este lent, adaptarea la nivelul general de
iluminare a scenei necesitând un timp de reacţie de ordinul minutelor.

Celulele fotoreceptoare sunt interconectate lateral prin


intermediul celulelor amacrine. Conexiunile produc o reducere a
semnalului furnizat de o celulă când vecinii sunt iluminaţi (fenomenul
de inhibiţie laterală). În acest mod se explică procesul de accentuare a
contururilor la nivelul sistemului vizual, ce poate fi pus în evidenţă de
exemplu prin fenomenul Mach, prezentat puţin mai jos.

Conexiuni pe verticală se stabilesc prin celulele ganglionare la


fasciculul nervului optic. Acesta conţine numai aproximativ 800.000 de
nervi, ceea ce demonstrează că informaţia vizuală suferă o prelucrare la
nivelul retinei. Informaţia transportată de nervul optic se bazează pe
impulsuri electrice. Se presupune că informaţia este codificată prin
frecvenţa acestor impulsuri, cuprinsă între 200 cicli pe secundă la
întuneric şi 300 cicli pe secundă la lumină, la saturaţie. Informaţiile
preluate de cele două fascicule de nervi optici (stâng şi drept) se
încrucişează şi se despart în chiasma optică, combinându-se în nucleii
geniculaţi, pentru a se proiecta în final în zona cortexului vizual, situată
în lobii occipitali. Se presupune că, până la proiectarea pe cortex,
informaţia mai este prelucrată intensiv.

1.2.2 Percepţia luminanţei

Datorită mecanismelor de adaptare, gama dinamică a intensităţilor


percepute de sistemul vizual uman (SVU) este uriaşă, de ordinul 10 10.
Cu toate acestea, pentru un anumit nivel de adaptare (ce se poate
schimba relativ încet datorită naturii chimice a proceselor responsabile)
Capitolul 1
Consideraţii generale privind prelucrarea imaginilor

gama dinamică percepută este mai mică decât 102. Percepţia luminanţei
este influenţată de mai mulţi factori.
Pentru lumină acromatică, factorii principali sunt:
a) iluminarea fundalului
b) schimbările de luminanţă în zone apropiate stimulului
c) forma spaţială şi variaţia temporală a stimulului
Efectele de mai sus interacţionează, dar pentru mai multă claritate, le
vom analiza independent.

Iluminarea fundalului are efecte ce pot fi studiate folosind aranjamentul


din Fig.1.4

Zonă stimul
Zonă fundal Zonă fundal
îndepărtat apropiat

Lb+L

Ls Lb

1.5
grd.

Fig. 1.4. Schema experimentului pentru studiul percepţiei luminanţei.

Subiectul trebuie să stabilească pragul  L la care zona stimulului se


distinge pe fundalul apropiat, la diferite iluminări ale fundalului apropiat
şi îndepărtat. Rezultatele acestor experimente sunt redate în Fig.1.5. Se
observă că raportul  L/L, denumit fracţie Weber, este aproximativ
constant, ceea ce implică o percepţie logaritmică a luminanţei,
asemenea celorlalte simţuri. La luminanţe reduse, fracţia Weber creşte
uşor. O valoare orientativă a fracţiei Weber este 2%, ceea ce corespunde
capacităţii de a se distinge aproximativ 50 de niveluride luminanţă într-o
imagine cu contrast ridicat. Pe un ecran de calculator sau TV, numărul
lor este uşor redus faţă de această cifră.
Capitolul 1
Consideraţii generale privind prelucrarea imaginilor

L
<mL> Ls=50mL
Ls=Lb
5
2 L/Lb=ct
1 .
0.5
0.2
0.1
0.05
0.02

1 2 5 10 20 50 100 Lb <mL>

Fig. 1.5. Rezultatele experimentelor privind percepţiei luminanţei.

Influenţa fundalului îndepărtat este de fapt o manifestare a efectului


menţionat la punctul b), denumit fenomen de mascare. Datorită
conturului ce se formează între fundalul apropiat şi cel îndepartat, se
produce o creştere a pragului de sensibilitate. Rezultatul este util în
compresia imaginilor pentru că el relevă faptul că zonele cu texturi
complicate pot fi redate cu un număr redus de niveluri de gri, fără ca
acest lucru să fie sesizat de observatorul uman. Prezenţa fundalului
afectează nu numai pragul de sensibilitate ci şi nivelul de luminanţă
perceput.

Un experiment interesant ce pune în evidenţă relativitatea percepţiei


luminanţei este ilustrat în Fig. 1.6. Cele două regiuni pătrate cu
luminanţe identice sunt percepute cu luminanţe diferite când sunt
separate şi plasate pe fundal diferit.

Fig. 1.6. Relativitatea percepţiei luminanţei.

Relativitatea percepţiei nu se limitează la luminanţă. Dimensiunile


percepute sunt supuse unei legi similare (Fig. 1.7). Cercurile interioare
par de dimensiuni diferite. Linia superioară pare mai lungă.
Capitolul 1
Consideraţii generale privind prelucrarea imaginilor

Fig. 1.7. Iluzii optice ce ilustreză relativitatea percepţiei dimensiunilor

Trebuie evitată confuzia care se face uneori între fenomenul de


mascare şi fenomenul Mach. Ultimul este o manifestare directă a
inhibiţiei laterale, care operează o filtrare de tip trece-sus, ce poate fi
modelată prin convoluţia cu un operator obţinut prin derivarea de
ordinul doi a unei funcţii gaussiene. În Fig. 1.8 se ilustrează fenomenul
Mach cu ajutorul mirei cu trepte de gri. O bandă uniformă este
percepută mai luminoasă în stânga ei şi mai întunecată în partea dreaptă
prin efectul derivativ al inhibiţiei laterale.

Fig. 1.8. Fenomenul benzilor Mach


Efectul de mascare se manifestă şi în domeniul temporal.
Percepţia obiectelor aflate în mişcare este dependentă de faptul dacă
observatorul urmăreşte obiectul de-a lungul traiectoriei sau atenţia nu
este fixată pe un anumit obiect. Este util să reţinem orientativ că, în
cazul mişcărilor violente, rezoluţia obiectului aflat în mişcare poate fi
redusă de zece ori fără a fi percepută, cu condiţia de a fi restabilită la
valoarea normală în mai puţin de o jumătate de secundă de la încetarea
mişcării.
O formă importantă de manifestare a pragului de vizibilitate
temporală este frecvenţa critică de fuziune a imaginilor. Presupunând că
stimulul este descris de o lege de variaţie de forma:

S(t)=L+  L cos(2ft), (1.1)


Capitolul 1
Consideraţii generale privind prelucrarea imaginilor

Se poate determina vizibilitatea stimulului în funcţie de L,  L şi f.


Pentru o curbă L = ct.,  L are un maxim în jurul frecvenţei de 15 cicli
pe secundă. La frecvenţe mari, răspunsul se anihilează rapid în jurul
valorii de 70 Hz. Mărimea suprafeţei stimulului de pâlpâire
influenţează, de asemenea, vizibilitatea lui. Este un aspect ce a fost deja
exploatat în televiziune, prin alegerea modului de explorare întreţesută
şi reducerea frecvenţei cadrelor la numai 25 Hz.

1.3 Acuitatea vizuală

Acuitatea vizuală reprezintă capaciatea SVU de a detecta detalii în


imagine. Efectul formei spaţiale asupra vizibilităţii stimulului se poate
determina considerând SVU un sistem liniar bidimensional
(neliniaritatea poate fi neglijată la amplitudini mici ale stimulului).
Pentru a-i determina funcţia de transfer, se generează un stimul de
forma unei sinusoide spaţiale:

S(xx)=L+  L cos(xx), (1.2)

unde s-a notat:

x=2fx. (1.3)

O miră cu un semnal stimul modulat în amplitudine (  L) pe verticală


şi în frecvenţă (x) pe orizontală este ilustrată în Fig. 1.9. Rezultatele
experimentale se prezintă uzual sub forma caracteristicii senzitivităţii
contrastului, reprezentând caracteristica percepută,  L / L funcţie de
frecvenţa spatială, x, măsurată în cicli pe grad. Forma este de filtru
trece-bandă. Practic, acest lucru înseamnă că ochiul este mai puţin
sensibil la variaţii spaţiale foarte lente sau foarte rapide ale luminanţei.
Căderea răspunsului la frecvenţe joase se poate atribui fenomenului de
inhibiţie laterală, ce ridică frecvenţele înalte. Se obţine un efect de
accentuare a contururilor ce au un rol central în interpretarea informaţiei
vizuale. La frecvenţe foarte înalte, căderea este datorată sistemului optic
şi rezoluţiei finite a fotoreceptorilor. Răspunsul este mai slab la
marginile câmpului vizual, pentru vederea periferică. Senzitivitatea
contrastului prezintă maxime pe direcţiile orizontală şi verticală, având
o cădere maximă (de 3dB) pe direcţiile diagonale. În optică, rezoluţia
este definită de inversul valorii unghiului de vedere maxim
(aproximativ 2 minute) la care două puncte alăturate nu pot fi distinse.
Rezoluţia este maximă la distanţa de 250 mm şi iluminarea de 500 lux
(furnizabilă de un bec de 60 W la distanţa de 400 mm). În aceste
condiţii, distanţa dintre două puncte ce pot fi distinse este de
aproximativ 0.16 mm.
Capitolul 1
Consideraţii generale privind prelucrarea imaginilor

Fig. 1.9. Semnal 2D pentru studiul dependenţei acuităţii vizualede


contrast

Experimente mai generale fac apel la modulaţia spaţio-


temporală. Stimulul generat este de forma:

L(x,y,t) = L+  L cos[2fv (xcos  y sin)] cos(2ft (1.4)


t)

Se confirmă faptul că SVU se comportă ca un filtru trece-bandă şi în


domeniul temporal. Teste cu mixaje de semnale sinusoidale de frecvenţe
diferite arată că stimulii interacţionează numai dacă frecvenţele lor sunt
separate cu mai puţin de o octavă. Aceste constatări pot fi sintetizate
într-un model al SVU de tipul unei bănci de filtre trece bandă. Pe
această bază sunt construite compresoarele de imagine de tip sub-bandă.

1.4 Percepţia culorilor

Culoarea este o proprietate foarte importantă a imaginilor, deoarece


ochiul distinge într-o imagine mult mai multe culori decât trepte de gri.
Sistemul vizual uman percepe senzaţia de culoare în funcţie de
lungimile de undă ale radiaţiilor electromagnetice vizibile (sau
luminoase). Spectrul radiaţiilor electromagnetice vizibile (Fig. 1.10) se
întinde de la lungimea de undă de aproximativ 700 nm, corespunzătoare
culorii roşii, la aproximativ 400 nm, corespunzătoare culorii violet.
Capitolul 1
Consideraţii generale privind prelucrarea imaginilor

Raze Raze Ultra- Radiaţii Infra- Micro- Radio-


gama X violet vizibile roşu unde frecvenţ
ă
0,001nm 1nm 10nm 400nm 0,7m 25m 0,1m 1km

violet albastr verde galben orange roşu


u
400 450 480 550 580 610 700

Fig. 1.10. Spectrul radiaţiilor vizibile

În natură, culorile reprezintă rezultatul amestecului unui număr mai


mare sau mai mic de radiaţii cu lungimi de undă diferite. Lumina albă
conţine toate lungimile de undă din domeniul menţionat în proporţii
egale, altfel spus, are o distribuţie spectrală uniformă. Obiectele absorb
o parte din lumina ambiantă, partea din spectru neabsorbită fiind
transmisă de obiectele transparente sau translucide, respectiv reflectată
de cele opace. Culoarea obiectului este determinată de lumina reflectată,
mai precis de lungimile de undă ale radiaţiilor reflectate şi de proporţiile
dintre energiile acestor radiaţii.

Orice culoare poate fi sintetizată prin amestecul în proporţii adecvate a


unui număr de culori de bază. Din colorimetrie se cunoaşte faptul că,
folosind numai trei culori de bază, se poate obţine practic orice culoare.
Suficienţa unui număr de trei culori de bază este legată direct de
existenţa pe retină a trei tipuri de conuri, cu sensibilitate maximă la
roşu, verde şi albastru. În televiziune, au fost adoptate aceleaşi culori de
bază: roşu, verde şi albastru (sistemul de coordonate color RGB). Este
interesant că decizia a fost luată înaite de a se fi demonstrat existenţa
celor trei tipuri de conuri.

Observaţie: folosind un sistem unic de culori de bază, de exemplu


RGB, se poate reproduce un număr foarte mare de culori, dar nu orice
culoare din spectrul natural.

Amestecul culorilor pe ecran unui tub cinescop are loc aditiv,


adică prin însumarea radiaţiilor emise de luminoforii roşu, verde şi
albastru activaţi de fasciculul de explorare. În tipografie, amestecul
culorilor se produce substractiv. De exemplu, o cerneală roşie depusă pe
hârtie absoarbe din spectrul uniforma al unei surse de lumină albă ce se
proiectează pe ea toate radiaţiile cu excepţia celor situate într-un interval
de lungimi de undă corespunzător culorii roşii. Culorile primare folosite
în televiziune şi tipografie şi modul lor de compunere sunt ilustrate în
Fig. 1.11.
Capitolul 1
Consideraţii generale privind prelucrarea imaginilor

roşu

galben magent Compunerea aditivă


alb a a culorilor primare
în televiziune
verde cian albastr
u

magenta

roşu albastr Compunerea substractivă


negru u a culorilor primare
în tipografie
galben verde cian

Fig. 1.11. Culorile primare şi compunerea lor în televiziune şi


tipografie

1.5 Atributele culorilor


Presupuând că o culoare este reprezentată prin vectorul RGB,
intensitatea ei poate fi calculată cu ajutorul relaţiei:

Y=0,3R+0,59G+0,11B. (1.5)

Ecuaţia de mai sus, reflectă faptul că ochiul prezintă sensibilităţi diferite


pentru radiaţiile luminoase cu lungimi de undă diferite. În cazul
culorilor de bază, sensibilitatea este maximă pentru verde şi minimă
pentru albastru.
Un alt atribut al culorii este nuanţa ei, semnificând lungimea de
undă dominantă din componenţa ei spectrală. Nuanţa depinde exclusiv
de proporţiile în care sunt prezente culorile primare şi nu de valorile
absolute. Aceste proporţii sunt exprimate de coeficienţii tricromatici:

R
r ,
RG B
G
g , (1.6)
RG B
B
b .
RG B
Capitolul 1
Consideraţii generale privind prelucrarea imaginilor

De observat că toţi coeficinţii sunt subunitari şi suma lor este


întotdeauna egală cu 1.

Saturaţia defineşte proporţia de alb în componenţa culorii.


Folosind coeficienţii tricromatici, saturaţia se poate calcula simplu cu
ajutorul ecuaţiei:

S=1-3min{r, g, b}. (1.7)

Culorile saturate (saturaţie 100%) au unul din coeficienţii tricromatici


nul, semnificând absenţa totală a uneia din culorile primare. Saturaţia de
0% presupune egalitatea coeficienţilor tricromatici, respectiv un obiect
incolor (alb, negru sau gri, în funcţie de intensitate). Culorile nesaturate
pot fi considerate un amestec ponderat între o culoare saturată şi alb.
Culorile saturate nu conţin lumină albă. Roşul saturat este culoarea
metalului încins. Rozul se obţine prin amestecul roşului cu alb, deci prin
desaturare. Cerul într-o zi fără nori are culoarea albastră nesaturată.
Principalii factori ce afectează percepţia unui stimul color sunt:
a) densitatea spectrală de putere a sursei ce iluminează scena
b) caracteristicile de reflectivitate ale obiectelor prezente în imagine
c) aranjamentul spaţial, forma şi dimensiunile obiectelor
d) răspunsul spectral al observatorului uman (dependent de conţinutul
scenei şi obiectul pe care se fixează atenţia)
Între aceşti factori există interacţiuni de tipul celor menţionate la
imagini acromatice, dar în general mai complexe. De exemplu,
fenomenul de adaptare cromatică, nu pe deplin elucidat încă, modifică
percepţia culorii într-o regiune a imaginii în funcţie de conţinutul
spectral al scenei observate anterior şi de culorile zonelor aflate în
proximitate. Adaptarea, la fel ca sensibilitatea logaritmică sau
fenomenul de mascare, este o proprietate mai generală a organelor de
simţ.

Problema 1.1

Un element de imagine este caracterizat prin tripletul


RGB = [100 150 200].
Calculați saturația culorii elementului de imagine.

S-ar putea să vă placă și