Sunteți pe pagina 1din 6

Tema curs 2.

PROCESAREA INFORMAŢIEI VIZUALE

De la „senzaţii” şi „percepţii” la „procesarea informaţiei”. În psihologia cognitivă s-a


renunţat la tratarea distinctă a senzaţiilor şi percepţiilor, precum şi la terminologia
specifică psihologiei clasice.
Psihologii cognitivişti sunt interesaţi de maniera de procesare a informaţiei.
Sintagma aceasta sugerează faptul că nu este vorba doar de „banale” prelucrări de tip
senzorial, ci de o succesiune de procesări, inclusiv de tip conceptual (semantic). Şi deşi
pot fi analizate procesările informaţionale specifice tuturor modalităţilor senzoriale
(vizuale, auditive etc.), ne vom opri în continuare asupra căii vizuale – aceasta
reprezentând modalitatea preponderentă de obţinere a informaţiilor despre lume.
Date cu privire la procesarea informaţiei vizuale au fost obţinute folosind metoda
experimentală, metoda neuroştiinţelor şi metode specifice inteligenţei artificiale. Date
utile au fost obţinute şi analizând „eşecurile” sau biasările în procesarea informaţiei:
iluziile perceptive, imaginile duble, agnozia facială (un deficit în recunoaşterea feţelor
umane1).
Modelările propuse în domeniu au fost numeroase, multe dintre ele discutabile
însă sub aspectul plauzibilităţii neuronale şi al validităţii ecologice. Eficienţa tehnologică
a unora dintre modele este totuşi satisfăcătoare; aşa au fost realizate sisteme vizuale
artificiale capabile să „recunoască” obiecte / feţe umane (vezi exemplul sistemelor de
securitate bazate pe recunoaşterea facială).

Baza neurobiologică a procesării informaţiei în sistemul vizual. Procesarea informaţiei


în sistemul vizual implică o rută complexă şi multe arii cerebrale (pentru detalii, a se
vedea Anderson, 1985).
Vom începe prin a spune că input-ul pentru sistemul vizual îl constituie stimulii
luminoşi (undele electromagnetice cu lungimi de undă în spectrul vizibil). Segmentul
receptor este retina, care conţine celule specializate în transformarea energiei
electromagnetice, specifice stimulilor vizuali, în energie chimică şi, ulterior, în energie
neuronală, „recunoscută” de sistemul nervos central (impulsuri nervoase). Aceste celule
specializate (celule cu conuri şi celule cu bastonaşe) sunt, de fapt, neuroni receptori
(fotoreceptori), în funcţie de gradul de stimulare ei descărcând potenţiale de acţiune cu o
anumită frecvenţă.
Aceşti neuroni receptori intră în alcătuirea unei reţele, fiind conectaţi pe
orizontală cu alte celule receptoare şi pe verticală cu celule neuronale bipolare care, la
rândul lor, fac sinapsă cu celule neuronale ganglionare. S-a arătat că aceste ultime tipuri
de celule sunt de două mari feluri, după modul în care răspund la stimularea luminoasă:
unele se activează pentru spoturi luminoase (sunt denumite celule on-off), iar altele,
pentru puncte negre înconjurate de fascicule luminoase (celule off-on). Modul acesta de
funcţionare a celulelor ganglionare retinale permite sesizarea contrastelor şi, prin urmare,
detectarea contururilor obiectelor.
Axonii celulelor ganglionare retinale formează nervii optici. Pe calea nervilor
optici informaţia merge spre cortexul vizual. A se reţine că în procesarea informaţiei
1
Este celebru în acest sens studiul neurologului Oliver Sacks intitulat „Omul care şi-a confundat nevasta cu
o pălărie”. Pacientul descris de Sacks avea, de fapt, o problemă mai vastă, de conştientizare.

1
vizuale sunt implicate, de fapt, multe arii cerebrale, specializate pentru procesarea culorii,
a mişcării, a formei obiectelor etc.; se estimează că aproape jumătate din suprafaţa
neocortexului este implicată în acest proces.
La nivelul cortexului cerebral există alte celule specializate care răspund la
trăsături specifice ale stimulilor vizuali, numite „detectori de trăsături”. Aceste celule îşi
derivă numele de la aceea că sunt specializate în a procesa anumite caracteristici fizice
ale stimulilor (linii, contururi, fante luminoase, unghiuri, stimuli în mişcare, localizare în
saţiu, orientare, dimensiune a stimulului). După trăsăturile procesate, detectorii de
trăsături se subîmpart în celule simple, complexe şi hipercomplexe (pentru detalii, vezi
Miclea, 2003).
Încheiem prin a spune un lucru esenţial: fiecare celulă receptoare are un câmp
receptor specific, o anumită porţiune a lumii la care răspunde (o regiune a spaţiului în
care prezenţa unui stimul va afecta rata cu care respectiva celulă neuronală descarcă
potenţiale de acţiune). De exemplu, un anumit neuron detector de trăsături va răspunde
doar la stimulii având o anumită locaţie. Noţiunea de câmp receptor se foloseşte nu doar
în relaţie cu celulele receptoare, ci şi în relaţie cu organele receptoare. De pildă, dacă ne
fixăm privirea asupra unui obiect aflat înaintea noastră, acea parte a lumii pe care o
vedem constituie câmpul receptor al ochilor noştri (Kolb & Whishaw, 2004).

Sarcina sistemului cognitiv. Stimulii exteriori sunt tridimensionali. Dar ceea ce se


proiectează pe retină este o imagine bidimensională (numită „schiţă primară a
obiectului”) – şi, în plus, este o imagine răsturnată şi nu tocmai „dreaptă” (ea este
„tremurată”, pentru că în drumul spre retină a străbătut umoarea vâscoasă). Iar sistemul
cognitiv uman trebuie să plece de la aceste date şi să le „corecteze” pentru a ajunge la
outputul final al procesării informaţiei vizuale: recunoaşterea obiectelor.
În acest sens sistemul cognitiv se foloseşte de o serie de mecanisme ascendente şi
descendente de procesare a informaţiei2, puse în joc în cadrul a două etape distincte, pe
care le vom analiza în continuare: procesarea primară şi procesarea secundară a
informaţiei vizuale.

Procesarea primară a informaţiei vizuale. Inputul este reprezentat aici de imaginea 2D


retinală, iar outputul de imaginea 2 ½ D („reprezentarea intermediară a stimulului”, un
concept specific în psihologia cognitivă). Analiza implicată este de tip ascendent,
automat (preatenţional, „inconştient”) şi modular.
Acest ultim aspect este esenţial. Jerry Fodor (1983) a propus teoria modulară
asupra cogniţiei, printre proprietăţile sistemelor modulare el amintind: operarea asupra
unor stimuli specifici; impermeabilitatea cognitivă; rapiditatea procesării; caracterul
bazal, simplu al output-urilor. Cu referire la prelucrarea informaţiei vizuale, modularitate
înseamnă că există mai mulţi moduli ce lucrează în paralel (simultan), fiecare procesând
aspecte specifice ale stimulilor: conturul, adâncimea în spaţiu, mişcarea (deplasarea în
spaţiu), textura, culoarea etc. Conturul are aici o importanţă aparte, el servind la
extragerea figurii din fond (mediu). Marcând limita unei suprafeţe, conturul conţine într-

2
Procesarea ascendentă (bottom-up sau dirijată de datele concrete; pleacă de la caracteristicile fizice spre
baza de cunoştinţe) se desfăşoară în mare parte automat, modularitatea fiind trăsătura sa esenţială.
Procesarea descendentă (top-down sau dirijată de concept) este în mare parte atenţională, conştientă, şi
depinde de baza de cunoştinţe.

2
un format simplu o mulţime de informaţii. Informaţii despre conturul obiectelor se pot
obţine analizând variaţiile de intensitate a luminii, dar şi umbrele, textura sau culoarea3.
Deşi operează distinct, modulii sus-menţionaţi se presupune a fi în interacţiune;
din combinarea informaţiilor pe care ei le aduc4 rezultă ceea ce se numeşte „reprezentarea
intermediară a stimulului”. Această reprezentare conţine date cu privire la caracteristicile
fizice ale stimulului, fără a se produce recunoaşterea acestuia. Ea intră ca input în
următoarea etapă a procesării informaţiei vizuale.

Procesarea secundară a informaţiei vizuale. După formarea reprezentării intermediare a


stimulului intră în joc şi o serie de mecanisme de tip descendent, care dublează
procesările modulare cu scopul de a se identifica obiectul (recunoaşterea obiectului, care
este pus în corespondenţă cu imaginea sa tridimensională din memorie, este outputul
procesărilor secundare).
Aceste mecanisme sunt atenţionale, presupunând alocarea de resurse cognitive
speciale.
Identificarea proprietăţilor non-accidentale ale obiectelor este un mecanism de
acest tip. Proprietăţile non-accidentale sunt detalii spaţiale constante ale reprezentării
stimulului, detalii cum ar fi rectiliniaritatea, paralelismul sau simetria contururilor. S-a
constatat că sistemul vizual are tendinţa de a neglija micile abateri de la detaliile sus-
menţionate (de exemplu, sesizează simetria chiar dacă aceasta nu este „perfectă”), tocmai
pentru a facilita flexibilitatea recunoaşterii.
Un alt mecanism descendent este reprezentat de organizarea gestaltistă a
stimulilor în câmpul vizual. Astfel, s-a observat că sistemul cognitiv uman prezintă şi o
altă tendinţă: spre gruparea stimulilor din câmpul vizual în unităţi mai simple. Această
organizare se face urmând aşa-numitele „principii gestaltiste”:
 elementele aflate în proximitate spaţială tind să fie grupate în aceeaşi unitate
perceptivă (principiul proximităţii);
 elementele similare (ca formă, culoare, mărime sau strălucire) tind sa fie grupate
împreună (principul similarităţii);
 elementele simetrice sunt percepute ca o unitate, chiar în ciuda distanţei dintre ele
(principiul simetriei);
 conturul ocluzat al unei figuri tinde să fie închis după configuraţia sa vizibilă
(principiul închiderii) etc.
Toate aceste principii sunt reunite sub „legea lui Pragranz” (în germană: concizie),
care afirmă că stimulii vizuali sunt grupaţi astfel încât să rezulte configuraţia cea mai
simplă, şi aceasta deoarece mintea umană tinde a organiza experienţa într-un mod cât mai
„ordonat” şi mai simplu, mai „economic”. Iar această economie de resurse cognitive
asigură aici rapiditatea recunoaşterii.
Cu privire la gestalt, facem aici o precizare utilă. Este adevărat că noi
conştientizăm mai întâi întregul (deci, cum afirmau gestaltiştii, gestaltul primează asupra
părţilor), dar de procesat, procesăm mai întâi părţile! (deci, primatul gestaltului este
numai sub aspectul conştientizării).

3
Au fost propuse, de altfel, o serie de modele ale extragerii conturului (vezi Miclea, 2003).
4
Se presupune că interacţionează, dar mecanismul prin care o fac nu a fost elucidat.

3
Modelări ale recunoaşterii obiectelor. Cum ajungem efectiv să recunoaştem un obiect
este o întrebarea deschisă. Mai multe modelări au fost propuse, dintre care prezentăm aici
trei (apud Miclea, 2003).
Menţionăm mai întâi un model relativ simplist, modelul calchierii tiparelor, care
afirmă că recunoaşterea se realizează prin punerea în corespondenţă (în termeni de
suprapunere) a imaginii vizuale a unui obiect cu „întipărirea” sa mnezică. Modelul are o
validitate empirică limitată, noi putând recunoaşte şi obiecte pe care le-am perceput
anterior dintr-o altă perspectivă (deci, suprapunerea ar „eşua”). El are însă unele aplicaţii
(cum ar fi scanner-ul optic pentru citirea cardurilor).
Irving Biederman (1987, 1990) a propus aşa-numitul modelul al recunoaşterii prin
componente (RBC, recognition by components). Conform acestui model, atunci când
privim la un obiect noi îl descompunem pe acesta în elemente de bază numite geoni
(geometrical ions - cilindru, con, sferă etc.)5. De exemplu, o îngheţată la cornet este
„descompusă” vizual într-un con şi o sferă (sau mai multe, depinde de câte cupe de
îngheţată este vorba...). Biederman afirma că geonii rezultaţi vor activa în memoria
noastră reprezentări specifice, care ne permit recunoaşterea obiectului în cauză.
Un alt cercetător, Oliver G. Selfrige (1959), a conceput ceea ce este cunoscut
drept modelul „Pandemonium” (o denumire metaforică, desigur). Selfrigde pleacă de la
cadrul mai larg al analizei de trăsături fizice, operată de neuroni specializaţi („detectori de
trăsături”). Aceşti neuroni, aşa cum menţionam anterior, procesează trăsături fizice ale
obiectelor – şi uneori şi o singură trăsătură (dacă este suficient de distinctivă) ne poate
ajuta să recunoaştem un obiect. De exemplu, dacă de sub pat văd apărând un vârf de
gheruţă, recunosc acest element ca fiind specific pisicii mele. Chiar şi numai acest indiciu
implică prezenţa pisicii. Acest mod de procesare a informaţiei este, desigur, unul
economicos! Revenind la modelul lui Selfridge, amintim că acesta vorbeşte despre o
„colaborare” a mai multor „entităţi”, organizate ierarhic: unele recepţionează imaginea
obiectului; următoarele procesează fiecare trăsătură în parte; următoarele sintetizează
mesajele primite în unităţi cu sens; şi în sfârşit, altele analizează posibilele interpretări ale
stimulului şi se decid pentru una.

Ce tipuri de “stimuli” recunoaştem pe cale vizuală? Patru mari categorii de stimuli, de


fapt, procesarea fiecăreia dintre aceste categorii prezentând caracteristici specifice:
stimuli verbali; obiecte; feţe umane; scene.
Procesarea stimulilor verbali6, desprinderea semnificaţiei acestora, este mult
facilitată de contextul în care apar. S-a demonstrat experimental faptul că o literă este
recunoscută mai rapid dacă este prezentată în contextul unui cuvânt cu sens decât dacă
este prezentată independent sau într-o configuraţie lingvistică fără sens (efectul
superiorităţii cuvântului). Există şi o superioritate a recunoaşterii cuvântului în contextul
unei propoziţii, comparativ cu prezentarea sa independentă. De asemenea, contextul
conversaţional ajută la descifrarea sensului cuvintelor ambigue.
În ceea ce priveşte recunoaşterea obiectelor, începem prin a spune că oamenii
recunosc cu uşurinţă o multitudine de obiecte, în ciuda faptului că imaginea acestora
poate varia ca şi perspectivă sau mărime, ca o consecinţă a rotirii lor în spaţiu sau a

5
Geonii sunt numiţi şi „volume primitive”, deoarece pe baza lor pot fi compuse (teoretic) toate obiectele
lumii reale.
6
Cele spuse aici sunt valabile şi pentru stimulii auditivi.

4
ocluzării lor parţiale. Contextul, „scena” în care obiectele se găsesc ajută mult în acest
sens. S-a demonstrat experimental faptul că o caracteristică a unui obiect este recunoscută
mai uşor dacă este plasată într-un context posibil, comparativ cu prezentarea sa
independentă sau în cadrul unui obiect imposibil (efectul superiorităţii obiectului).
Feţele umane reprezintă un tip distinct de stimuli, cu mare semnificaţie
comportamentală, fiind structural diferite de majoritatea claselor de obiecte şi necesitând
strategii perceptuale distincte. Se pare că neuronii sunt clar specializaţi aici: unii răspund
la trăsături distinctive (cum ar fi o sprânceană), alţii la orientarea feţei (vedere din profil
sau frontală), alţii la direcţia privirii (în spate, în lateral), alţii la expresii faciale
particulare etc. Elemente faciale distinctive pentru un individ sunt reprezentate de poziţia
relativă, mărimea şi /sau forma ochilor, bărbiei, pomeţilor, nasului, de textura pielii etc. O
serie de experimente au arătat faptul că recunoaştem mai rapid elementele faciale în
contextul feţelor umane, comparativ cu prezentarea lor independentă (în acest din urmă
caz, este nevoie de foarte multe detalii pentru a se realiza recunoaşterea).
Recunoaşterea scenelor are şi ea particularităţi specifice. O „scenă” reprezintă o
situaţie statică ce poartă o anumită semnificaţie – reprezintă ceva: o sală de curs, o
parcare etc. Scenele se recunosc uşor deoarece sunt predictibile, iar informaţia conţinută
este redundantă; de exemplu, într-o sală de curs ne aşteptăm să găsim bănci, catedră,
tablă, videoproiector etc. – nici nu trebuie să procesăm toate elementele scenei pentru a o
recunoaşte!
Mai mult, obiectele dintr-o scenă nu sunt dispuse aleatoriu, ci sunt organizate
respectând o serie de regularităţi – fapt ce ne permite să vorbim despre o adevărată
„semantică a scenei”. Biederman şi colab. (1982) au arătat că aceste regularităţi sunt
produsul învăţării neintenţionate. Astfel, noi „învăţăm” din viaţa cotidiană faptul că, de
regulă, obiectele sunt aşezate pe un suport fizic, că sunt opace şi, deci, vor ocluza (total
sau parţial) obiectele situate în spatele lor, că au o mărime relativă „obişnuită” şi o poziţie
„obişnuită” şi că se găsesc, cu anumite probabilităţi, în contexte specifice. De exemplu,
mă pot gândi la pisica mea aflându-se acasă pe canapea, în poziţia ei obişnuită de somn,
ocluzând o parte a canapelei (scena este, deci, „perfectă”). Dacă aş vedea-o în amfiteatrul
301, sau ar apărea ca transparentă, nu aş recunoaşte cele văzute. Încălcarea cunoştinţelor
tacite pe care le avem despre mediul înconjurător îngreunează recunoaşterea.

Rolul contextului şi al aşteptărilor (expectanţelor) în recunoaştere. În recunoaştere


oamenii aleg, din mulţimea de interpretări alternative pentru o imagine, pe cea care se
pliază cel mai bine aşteptărilor şi cunoştinţelor lor despre lume.
Presupunerile şi inferenţele despre ce anume ar putea însemna un obiect sunt
rapide, în mare parte inconştiente şi, de regulă, acurate. Ulterior sunt examinate alte
trăsături ale imaginii, pentru a vedea dacă presupunerile se verifică sau se infirmă.
De exemplu, deschidem o uşă de la un amfiteatru şi ne aşteptăm să vedem bănci,
o tablă, poate şi studenţi. Dacă aceste elemente sunt prezente în scenă, sunt rapid
interpretate. Elementele incongruente cu scena tind să fie greşit interpretate; de exemplu,
Biederman (1981) a raportat erori mari când subiecţii încercau să identifice canapele
plutind pe străzile oraşelor.
Iată şi următorul exemplu.
Te întorci seara acasă de la cursuri, hotărât să scrii un referat la calculator. Deschizi uşa camerei
tale şi, în semiîntuneric, observi pe tastatura ta un obiect de mărime medie, formă nedefinită şi
culoare neagră (s-au activat automat modulele de contur, culoare ). Modelul lui Biederman se

5
dovedeşte nefolositor, pentru că singurul geon disponibil are formă ambiguă; în plus, nu remarci
nicio trăsătură fizică distinctă pentru a opera analiza de trăsături. Ai mai multe variante între care
trebuie să te decizi:
1. este hanoracul tău, pe care nu l-ai pus în şifonier, ci l-ai aruncat la întâmplare;
2. este căciula de blană a mamei tale;
3. este o găină neagră, ajunsă cumva acolo;
4. este orice altceva;
5. este propria ta pisică.
Noi indicii te pot hotărî într-o direcţie sau alta.
De ex., dacă modulul de textură îţi spune că este vorba despre ceva blănos, rămâi cu variantele 2.
şi 5.
Dacă percepi o vagă mişcare (s-a activat modulul specific de mişcare), ai de ales între 3. şi 5.
Dacă informaţia vizuală este completată de un stimul auditiv, problema este ca şi rezolvată…
Dar dacă toate acestea lipsesc, intră în joc contextul şi aşteptările tale. De pildă, varianta 3. este
foarte puţin probabilă, şi având în vedere că motanul tău de obicei stă pe biroul tău sau pe
lucrurile tale, alegi varianta 5.
Odată aleasă această variantă, vei interpreta, de pildă, un fir oblic ataşat de „obiect” drept o
mustaţă – şi asta îţi va confirma semnificaţia atribuită obiectului. În plus, pisica stă aşezată (pe un
suport), în poziţia ei obişnuită, are mărimea ei obişnuită, ocluzează obiectele (tastatura) şi,
evident, are o probabilitate mare de apariţie acolo; se integrează perfect în scena biroului tău.
Analizând astfel situaţia ai putea înţelege maniera de procesare descendentă a informaţiei
vizuale. Contextul, „scena” şi aşteptările facilitează recunoaşterea obiectelor.

S-ar putea să vă placă și