Sunteți pe pagina 1din 10

UNIVERSITATEA DIN PITEȘTI

Facultatea de Științe ale Educatiei, Științe Sociale şi Psihologie

REFERAT PSIHOLOGIE
COGNITIVĂ:
NIVELURI ALE PROCESĂRII
VIZUALE

1
Există tendinţa generală de a împărţi procesarea informaţiei vizuale la nivel
computaţional în două mari stadii: procesare primară şi procesare secundară.
Procesarea primară cuprinde prelucrările preatenţionale, cu o durată de aproximativ
200 de milisecunde, care au ca rezultat reprezentarea, în sistemul cognitiv, a caracteristicilor
fizice ale stimulului. Ele realizează separarea stimulului de fond, ne arată unde anume este
acesta, nu ce anume este. Sunt incluse aici mecanismele de detectare a contururilor, a texturii,
mişcării, culorii şi a dispunerii spaţiale.
Procesarea secundară vizează mecanismele implicate în recunoaşterea figurii şi
obiectelor. Ele au ca input rezultatele procesărilor primare şi ca output – imaginea
tridimesională a unui obiect în mediu, identificat, recunoscut. Această dihotomie a prelucrării
stimulilor vizuali nu este riguroasă, dar este utilă şi este larg răspândită în literatura de
specialitate. Intensitatea stimulilor luminoşi face obiectul unor prelucrări iniţiale care
conturează o schiţă primară a obiectului perceput. Asupra acestei schiţe primare se exercită o
mulţime de tratamente sau prelucrări de stabilire a adâncimii în spaţiu prin calculul disparităţii
binoculare, de reprezentare a mişcării, texturii, culorii şi orientării în spaţiu a suprafeţelor unui
obiect. Toate aceste procesări sunt executate în paralel de mecanisme modulare. Rezultatul lor
constă în alcătuirea unei reprezentări intermediare a obiectului din câmpul vizual, notată cu
2½D tocmai pentru a arăta caracterul ei intermediar între imaginea retiniană bidimensională şi
obiectul tridimensional. Această imagine intermediară serveşte ca input pentru alte procesări
al căror produs final este reprezentarea completă, tridimensională a obiectului, notată cu 3D.
Procesarea vizuală primară
Toate prelucrările primare posedă câteva caracteristici comune care le individualizează
faţă de procesările secundare sau alte tipuri de prelucrări mentale.
1) Procesările primare sunt organizate pe module, care funcţionează simultan, în paralel.
Organizarea modulară implică caracterul irepresibil,preatenţional şi impermeabilitatea
cognitivă a acestor procese.
2) Aceste procese sunt independente de natura stimulului.
3) Buna desfăşurare a acestor prelucrări presupune o mulţime de asumpţii apriorice
despre realitatea obiectuală, adică regularităţi statistice ale mediului în care trăim. Ele sunt
necesare pentru a specifica stimulul vizual supus prelucrării. Nu se ştie dacă aceste asumpţii
care dezambiguează stimulul sunt înnăscute sau dobândite. În orice caz, ele nu sunt rezultatul
unor deducţii iar majoritatea studiilor probează existenţa lor încă de la o vârstă foarte timpurie
(asumpţia rigidităţii este deja prezentă la vârsta de cinci luni, iar percepţia adâncimii în spaţiu
pe baza disparităţii binoculare este operantă la copilul de 2-3 luni). Aceste asumpţii sunt
nespecifice, aplicându-se irepresibil, automat, la orice obiect. Ele preced recunoaşterea
obiectelor ca obiecte distincte.
Schiţa primară şi detectarea contururilor (edge detection). Una din cele mai
importante operaţii care trebuie să aibă loc pentru ca organismul să se adapteze constă în
diferenţierea figurii de fond, a obiectului de mediul (fundalul) său, a obiectelor sau figurilor
unele de altele. Această segregare se poate realiza prin mai multe mecanisme: stabilirea
contururilor, detectarea texturii, a diferenţelor de colorit sau de viteză de deplasare etc.
Extragerea contururilor (edge detection) din patternurile de luminozitate pe care
obiectele le transmit retinei este modulul principal implicat în constituirea schiţei primare. Un
contur marchează limita unei suprafeţe, a unei figuri sau a unui obiect. Contururile surprind
multe dintre caracteristicile invariante ale stimulului (proporţii ale părţilor componente,
dispunere spaţială a acestora) şi permit o procesare economică a informaţiei despre stimul,
deoarece reduc detaliile la esenţial.

2
Stabilirea contururilor se bazează pe procesarea diferenţelor de luminozitate.Mai mult,
variaţia intensităţii stimulilor luminoşi este accentuată la nivel neurofiziologic şi subiectiv
pentru a permite o mai uşoară segregare a figurii de fond. Cercetările neurofiziologice de până
acum nu oferă date cu privire la modalitatea concretă de prelucrare a diferenţelor de
luminozitate pentru detectarea contururilor.
Cele mai cunoscute modele formale care încearcă să expliciteze aceste procesări sunt
filtrajul (stabilirea contururilor pe baza filtrajului [calcul diferenţial] intensităţii pixelilor) şi
analiza Fourier (reprezentarea stimulului vizual s-ar face pe baza analizei şi sintezei
armonicelor sale).

Figura 1. Rezultatele aplicării unui algoritm de detecţie a contururilor cu praguri diferite


(de la înalt la scăzut).
Calculul adâncimii. Deşi pe retină apar numai imagini bidimensionale, totuşi percepem
lumea în 3D. Unul din mecanismele cele mai importante de detecţie a distanţelor şi adâncimii
are la bază fenomenul numit stereopsis, care se referă la faptul că cei doi ochi au unghiuri
diferite de recepţie a stimulilor vizuali, apărând o disparitate retinală. Plecând de la această
disparitate se poate calcula distanţa unui obiect faţă de observator, deci şi adâncimea în spaţiu.
Deplasarea obiectelor în spaţiu şi deplasarea noastră faţă de ele sunt alte surse de
informaţii asupra adâncimii sau distanţei. De asemenea, Gibson (1950, 1966) a arătat că
informaţiile pot fi conţinute de gradientul unei texturi, adică micşorarea sistematică a
dimensiunilor elementelor texturii şi distanţei dintre acestea.

3
Figura 2. Creierul preia informaţia primită de la cei doi ochi şi o combină într-o imagine
unică, printr-un proces numit stereopsis.
Procesarea mişcării. Percepţia deplasării unui obiect joacă un rol essential pentru
supravieţuirea organismelor în medii dinamice. Multe date experimentale susţin teza
procesării deplasării în spaţiu a unui obiect de către un modul independent. Se pare că aceste
procesări sunt chiar mai rapide decât cele care sunt implicate în recunoaşterea formei şi/sau
semnificaţiei sale. De exemplu, tendinţa generală a subiectului uman de a-şiferi capul din
calea obiectelor aflate în mişcare a fost evidenţiază din primele săptămâni de viaţă (Regan et
al., 1986). Celulele nervoase implicate în detectarea mişcării sunt specifice în funcţie de
direcţia acestei mişcări; acelaşi obiect, deplasat în direcţii diferite, este procesat de celule
nervoase diferite.
Extragerea formei din prelucrarea umbrelor. Mărimea, forma sau dispunerea umbrei
unui obiect constituie elemente importate din prelucrarea cărora se pot obţine informaţii
despre forma şi poziţia obiectului într-un anumit context. Şi aceste procesări constituie un
modul independent. Se consideră că cunoştinţele tacite ale subiectului joacă un rol important
în prelucrarea umbrelor.
Procesarea texturii; textonii. Textura unei suprafeţe este alcătuită dintr-o combinaţie
de elemente. Elementele primitive, nedecompozabile care sunt specifice unei texturi se
numesc textoni (Jules, 1981). Una din funcţiile lor este aceea de a segrega figura de fond sau
obiectul de mediu acolo unde diferenţele de luminozitate nu sunt suficiente pentru extragerea
contururilor.
Detectarea textonilor se poate face fie automat, preatenţional, sau prin antrenarea
atenţiei vizuale. Procesarea vizuală primară se referă doar la primul caz.

4
Figura 3. Contururile pot fi stabilite pe baza texturii, în acest caz (Leung şi Malik,
1999).
Detectarea culorii. Detectarea culorii poate constitui o finalitate în sine dar poate servi
şi la segregarea mai rapidă a figurii de fond. Culoarea este obţinută prin mecanisme exclusiv
chimice.
Sistemul vizual realizează o reconstrucţie a stimulului prezentat pornind de la proiecţia
sa pe retină. Percepţia obiectelor nu se face instantaneu, nemijlocit, ci prin medierea unor
mecanisme de tip modular, care au ca input proiecţia retinală, iar ca output schiţa 2½D .
Astfel, la sfârşitul unei faze de procesare care durează mai puţin de 200 ms, subiectul
surprinde contururile, adâncimea, deplasarea, forma şi culoarea obiectelor. Pe baza acestor
procese se realizează segregarea figurii de fond sau a obiectelor de mediul în care se află.
Schiţa 2½D este o reprezentare intermediară a stimulului, care încă nu a fost recunoscut. Ea
este „centrată pe subiect”, adică depinde de alinierea ochi-stimul – privit din unghiuri diferite,
un obiect îşi relevă contururi diferite.
3.2. Procesarea vizuală secundară
Rostul prelucrărilor secundare este ca dintr-o schiţă intermediară 2½D luată ca input să
producă, pe baza unor prelucrări variate, schiţa 3D, adică recunoaşterea obiectului.
Prelucrările secundare realizează descentrarea reprezentărilor intermediare ale obiectului.
Recunoaşterea ar putea fi definită ca punere în corespondenţă a imaginii perceptive a
obiectului cu reprezentarea sa în memorie.
Recunoaşterea obiectelor este atât flexibilă cât şi rapidă. Este plauzibil ca reprezentarea
stocată în memorie, simbolică sau neurală, să reprezinte obiectul indiferent de unghiul sau
perspectiva din care este văzut. Acest fapt este facilitat de existenţa unor detalii spaţiale
constante sau proprietăţi neaccidentale (Lowe, 1984), cum ar fi paralelismul sau simetria.
Acest fapt ar explica flexibilitatea recunoaşterii. Un obiect simplu poate fi identificat după o
expunere de numai 100 ms, iar după alte 800 ms acesta poate fi chiar numit. De asemenea este
avansată prezenţa unor mecanisme de organizare a stimulilor complecşi în unităţi mai simple,
reducând diversitatea pe baza unor mecanisme de grupare a elementelor unei figuri. Acest fapt
ar explica rapiditatea recunoaşterii.
Principiile gestaltiste. Întrucât primii care au studiat principiile de grupare ale
elementelor unei figuri au fost psihologii şcolii gestaltiste, acestea le poartă numele. Numărul
total al acestor principii nu este cu exactitate cunoscut, dar pentru obiectele sau figurile statice,
mai cunoscute sunt următoarele: principiul proximităţii, care afirmă că elementele aflate în
proximitate spaţială sunt grupate într-o singură unitate perceptivă; principiul similarităţii, care

5
afirmă că elementele similare sunt grupate în aceeaşi unitate perceptivă, care este contrapusă
altora; principiul bunei-continuări, care afirmă că la intersecţia a două contururi, ele sunt
percepute după continuarea cea mai simplă; şi principiul închiderii, potrivit căruia conturul
ocluzat al unei figuri este închis după configuraţia sa vizibilă. Versiunea generalizată a acestor
principii poartă numele de legea lui Prägranz, postulând că stimulii vizuali sunt în aşa fel
grupaţi încât să rezulte configuraţia cea mai simplă.
Se pune problema dacă aceste mecanisme de grupare a stimulilor vizuali sunt înnăscute
sau nu. Prezenţa lor poate fi constatată încă din primele luni de viaţă (Spelke, 1990). Chiar
dacă nu sunt integral determinate genetic, cu siguranţă există o predispoziţie (preparedness) a
sistemului nervos în această direcţie.

Figura 4. Ilustrare a unor principii gestaltiste: proximitate, similaritate, închidere,


continuitate şi simetrie.
Modele ale recunoaşterii obiectelor. Identificarea caracteristicilor nonaccidentale ale
obiectelor care sunt prezentate în schiţa 2½D şi organizarea gestaltistă a stimulilor vizuali nu
sunt suficiente pentru a explica procesul de recunoaştere. Modelele computaţionale încearcă
să ofere o soluţie plauzibilă cu privire la care sunt prelucrările ulterioare care se finalizează în
recunoaştere.
Un model computaţional interesant al recunoaşterii obiectelor este modelul RBC
(recognition-by-components), al lui Biederman (1987, 1988, 1990). Acesta porneşte de la
tendinţa naturală a subiectului de a segmenta obiectele complexe în părţile lor componente.
De exemplu, un om este alcătuit din cap, corp, braţe, picioare etc. Părţile în care sunt
descompuse obiectele pot fi considerate ca nişte volume primitive sau geoni (de la geometrical
icons).
Astfel, un obiect complex poate fi specificat prin geonii componenţi şi modul de
dispunere a lor. Aceiaşi geoni, aflaţi în relaţii diferite, reprezintă obiecte diferite. Modelul
susţine că întreaga diversitate obiectuală ar putea fi redusă la 24 de geoni şi la combinaţiile
dintre aceştia. Segmentarea obiectelor în părţile componente – generând astfel geonii

6
respectivi – se face în zonele de concavitate. Toţi geonii pot fi descrişi matematic printr-o
teorie generalizată a conurilor.

Figura 5. Geoni şi stimuli alcătuiţi din geoni.

Un alt model este modelul analizei de trăsături (feature analysis). Acesta pleacă de la
asumpţia potrivit căreia recunoaşterea obiectelor se bazează pe detectarea unor caracteristici
sau trăsături fizice distincte ale acestora. O trăsătură distinctă este orice caracteristică fizică
vizibilă a unui obiect pe baza căreia acesta poate fi identificat indiferent de circumstanţe. De
exemplu, ea rămâne neschimbată indiferent de distanţa dintre subiect şi obiectul recunoscut.
Modelul presupune că orice obiect poate fi definit printr-o mulţime unică de caracteristici
fizice. În urma unor serii de studii, pentru detectorii de trăsături au fost postulate câteva
proprietăţi generale comune: sunt organizaţi modular, sunt în cea mai mare măsură
predeterminaţi genetic, au o funcţionare abstractă (de ex., un detector de contururi se activează
pentru orice fel de contur, indiferent de obiect).
Pornind de la aceste date, au fost elaborate o serie de modele ale recunoaşterii bazate pe
analiza trăsăturilor. Primul dintre acestea a fost modelul Pandemonium al lui Selfridge (1959).
Recunoaşterea era rezultatul colaborării unei mulţimi de „demoni”, organizaţi ierarhic: la bază
se află demonii imagistici (care receptează imaginea unui obiect); imaginea este descompusă
în trăsături de către o suită de demoni de trăsături; fiecare trăsătură este prelucrată de un
demon anume; mesajele lor sunt sintetizate în unităţi comprehensive de către demonii
cognitivi; în fine, întrucât aceştia propun mai multe interpretări posibile, un demon decident
stabileşte care dintre candidaţii la recunoaştere este cel mai potrivit pentru a identifica obiectul
iniţial.

7
Figura 6. Modelul Pandemonium al lui Selfridge (1959).

Totuşi, trebuie reţinut că, pe măsură ce obiectele devin mai complexe, unitatea de bază a
recunoaşterii devine combinaţia de trăsături fizice, nu trăsătura în sine. Am putea spune că
modelul RBC nu exclude analiza de trăsături fizice, ci o include, ca pe un caz particular.
Procesări descendente în recunoaştere. Recunoaşterea este locul de întâlnire al
procesărilor ascendente cu cele descendente, al prelucrărilor ghidate de datele fizice ale
stimulului (data driven) cu cele marcate de cunoştinţele subiectului (knowledge driven).
Un proces mental condus de date [engl. data-driven] este unul care se bazează aproape
exclusiv pe „date”, adică pe informaţia-stimul prezentă în mediu. În timp ce procesele data-
driven sunt asistate foarte puţin de informaţia deja cunoscută, procesele conduse de concepte
[engl. conceptually driven] sunt cele care se bazează puternic pe astfel de informaţii. Astfel,
un proces condus de concepte foloseşte informaţia deja prezentă în memorie şi orice expectaţii

8
care sunt prezente în situaţie pentru a executa sarcina; procesele data-driven folosesc numai
informaţia stimul. Distincţia dintre procesele data-driven şi conceptually driven a fost studiată
intens, printre altele, în aria recunoaşterii pattern-urilor. De exemplu, modelele percepţiei
încearcă să explice, în mare parte, cum sunt recunoscute pattern-urile. Modelele timpurii
asumau că acest proces era, în primul rând, data-driven. Totuşi, rezultatele unor cercetări mai
recente sugerează că recunoaşterea pattern-urilor este de asemenea influenţată de procese
conceptuale descendente (top-down).
Analiza descendentă influenţează recunoaşterea. Pe de altă parte, violarea unor
constrângeri impuse de cunoştinţele noastre tacite despre realitate blochează sau încetineşte
recunoaşterea.
Sintetizând rezultatele experimentale, putem vorbi despre procesări descendente în cazul
recunoaşterii stimulilor verbali, în cazul recunoaşterii obiectelor şi în cazul recunoaşterii
scenelor şi feţelor umane.
1. Procesări descendente în cazul recunoaşterii stimulilor verbali. Experimentele au
condus la concluzia potrivit căreia cunoştinţele lexicale funcţionează ca nişte constrângeri ale
recunoaşterii unei configuraţii ambigue, putând conduce la decodări diferite. Recunoaşterea
mai rapidă a unei litere dacă este prezentată în contextul unui cuvânt a fost demonstrate
experimental în repetate rânduri. Acest efect a fost denumit „efectul superiorităţii cuvântului”
(word superiority effect, Reicher, 1969). Devine evident faptul că, în recunoaştere, prelucrarea
ascendentă este dublată de cea descendentă. Acest lucru nu are loc în cazul procesării primare
a informaţiei vizuale, deoarece aceasta este efectuată de module cognitiv impenetrabile.

Figura 7. Exemplu de procesare descendentă „THE CAT”.

2. Procesări descendente în cazul recunoaşterii obiectelor. Ca şi în cazul recunoaşterii


stimulilor verbali, prin analogie cu efectul superiorităţii cuvântului, studiile lui Weinstein şi
Harris (1974) au demonstrat efectul superiorităţii obiectului (object superiority effect): o
trăsătură sau o caracteristică fizică a unui obiect este mai uşor de recunoscut dacă ea este
plasată în contextul reprezentării unui obiect, decât dacă este prezentată independent sau ca
element al unui obiect imposibil.

Figura 8. Exemplu de procesare descendentă: obiect „normal” vs. „atipic”.

3. Procesări descendente în cazul recunoaşterii scenelor şi feţelor umane. Cunoştinţele


de care dispunem, prin iniţierea unor procesări descendente, sunt responsabile şi de

9
recunoaşterea mai rapidă a elementelor unor feţe umane în contextul feţelor respective decât
dacă acestea sunt prezentate independent (Palmer, 1975). Elementele feţei aveau nevoie de o
reprezentare mult mai detaliată pentru a putea permite recunoaşterea lor în afara contextului.
De asemenea, experienţa noastră cu obiectele din mediul în care trăim îşi pune amprenta
asupra modului în care recunoaştem şi procesăm scenele sau situaţiile statice. În mod obişnuit,
obiectele dintr-o scenă nu formează o aglomerare haotică, ci sunt organizate după anumite
regularităţi (sintactica scenei). În acelaşi timp, scena are o anumită semnificaţie (o stradă, un
birou etc.; semantica scenei). Regularităţile sintactice şi semantice sunt în număr limitat şi
sunt dobândite de individ în cursul ontogenezei pe baza unei învăţări implicite, acţionând ca
nişte constrângeri în identificarea scenelor. Principalele regularităţi vizează suportul fizic al
obiectelor, interpoziţia (ocluzarea obiectelor), probabilitatea ocurenţei, poziţia obiectelor,
mărimea relativă a obiectelor.
Modelarea neoconexionistă a recunoaşterii. Recunoaşterea patternurilor figurale sau
obiectuale este domeniul în care modelele neuronale au avut cel mai mare succes. De altfel, în
acest domeniu s-au obţinut de la început primele rezultate, perceptronul lui Rosenblatt
încercând tocmai modelarea recunoaşterii într-o reţea binivelară. Ulterior, în 1981,
McClelland şi Rumelrhart reuşesc primul model de recunoaştere a grafemelor. Actualmente,
asistăm la o diversificare exponenţială a modelării neoconexioniste a recunoaşterii. Reţinem
că reţelele neuronale pot modela cu succes cel puţin o parte din procesările implicate în
recunoaşterea stimulului. Ele pot asigura interfaţa dintre modelele computaţionale şi datele
neurobiologice, fiind compatibile cu ambele categorii de rezultate. Rezultatele din acest
domeniul au importante aplicaţii tehnologice.
De reţinut:
În mod obişnuit, cea mai mare parte a informaţiilor despre mediul în care trăim este
obţinută prin intermediul văzului. Circa jumătate din suprafaţa neocortexului este implicată în
procesarea informaţiei vizuale.
Există tendinţa generală de a împărţi procesarea informaţiei vizuale la nivel
computaţional în două mari stadii: procesare primară şiprocesare secundară.
Procesarea primară cuprinde prelucrările preatenţionale care au ca rezultat
reprezentarea, în sistemul cognitiv, a caracteristicilor fizice ale stimulului. Ele realizează
separarea stimulului de fond, ne arată unde anume este acesta, nu ce anume este. Sunt incluse
aici mecanismele de detectare a contururilor, a texturii, mişcării, culorii şi a dispunerii
spaţiale.
Procesarea secundară vizează mecanismele implicate în recunoaşterea figurii şi
obiectelor. Ele au ca input rezultatele procesărilor primare şi ca output – imaginea
tridimesională a unui obiect în mediu, identificat, recunoscut.

10

S-ar putea să vă placă și