Documente Academic
Documente Profesional
Documente Cultură
Referat
1
PROCESAREA INFORMAŢIEI VIZUALE
1 Este celebru în acest sens studiul neurologului Oliver Sacks intitulat „Omul care şi-a confundat nevasta
cu o pălărie”. Pacientul descris de Sacks avea, de fapt, o problemă mai vastă, de conştientizare.
2
vizuale sunt implicate, de fapt, multe arii cerebrale, specializate pentru procesarea culorii,
a mişcării, a formei obiectelor etc.; se estimează că aproape jumătate din suprafaţa
neocortexului este implicată în acest proces.
La nivelul cortexului cerebral există alte celule specializate care răspund la
trăsături specifice ale stimulilor vizuali, numite „detectori de trăsături”. Aceste celule îşi
derivă numele de la aceea că sunt specializate în a procesa anumite caracteristici fizice
ale stimulilor (linii, contururi, fante luminoase, unghiuri, stimuli în mişcare, localizare în
saţiu, orientare, dimensiune a stimulului). După trăsăturile procesate, detectorii de
trăsături se subîmpart în celule simple, complexe şi hipercomplexe (pentru detalii, vezi
Miclea, 2003).
Încheiem prin a spune un lucru esenţial: fiecare celulă receptoare are un câmp
receptor specific, o anumită porţiune a lumii la care răspunde (o regiune a spaţiului în
care prezenţa unui stimul va afecta rata cu care respectiva celulă neuronală descarcă
potenţiale de acţiune). De exemplu, un anumit neuron detector de trăsături va răspunde
doar la stimulii având o anumită locaţie. Noţiunea de câmp receptor se foloseşte nu doar
în relaţie cu celulele receptoare, ci şi în relaţie cu organele receptoare. De pildă, dacă ne
fixăm privirea asupra unui obiect aflat înaintea noastră, acea parte a lumii pe care o
vedem constituie câmpul receptor al ochilor noştri (Kolb & Whishaw, 2004).
2 Procesarea ascendentă (bottom-up sau dirijată de datele concrete; pleacă de la caracteristicile fizice spre
baza de cunoştinţe) se desfăşoară în mare parte automat, modularitatea fiind trăsătura sa esenţială.
Procesarea descendentă (top-down sau dirijată de concept) este în mare parte atenţională, conştientă, şi
depinde de baza de cunoştinţe.
3
un format simplu o mulţime de informaţii. Informaţii despre conturul obiectelor se pot
obţine analizând variaţiile de intensitate a luminii, dar şi umbrele, textura sau culoarea3.
Deşi operează distinct, modulii sus-menţionaţi se presupune a fi în interacţiune;
din combinarea informaţiilor pe care ei le aduc4 rezultă ceea ce se numeşte „reprezentarea
intermediară a stimulului”. Această reprezentare conţine date cu privire la caracteristicile
fizice ale stimulului, fără a se produce recunoaşterea acestuia. Ea intră ca input în
următoarea etapă a procesării informaţiei vizuale.
3 Au fost propuse, de altfel, o serie de modele ale extragerii conturului (vezi Miclea, 2003).
4 Se presupune că interacţionează, dar mecanismul prin care o fac nu a fost elucidat.
4
Modelări ale recunoaşterii obiectelor. Cum ajungem efectiv să recunoaştem un obiect
este o întrebarea deschisă. Mai multe modelări au fost propuse, dintre care prezentăm aici
trei (apud Miclea, 2003).
Menţionăm mai întâi un model relativ simplist, modelul calchierii tiparelor, care
afirmă că recunoaşterea se realizează prin punerea în corespondenţă (în termeni de
suprapunere) a imaginii vizuale a unui obiect cu „întipărirea” sa mnezică. Modelul are o
validitate empirică limitată, noi putând recunoaşte şi obiecte pe care le-am perceput
anterior dintr-o altă perspectivă (deci, suprapunerea ar „eşua”). El are însă unele aplicaţii
(cum ar fi scanner-ul optic pentru citirea cardurilor).
Irving Biederman (1987, 1990) a propus aşa-numitul modelul al recunoaşterii prin
componente (RBC, recognition by components). Conform acestui model, atunci când
privim la un obiect noi îl descompunem pe acesta în elemente de bază numite geoni
(geometrical ions - cilindru, con, sferă etc.)5. De exemplu, o îngheţată la cornet este
„descompusă” vizual într-un con şi o sferă (sau mai multe, depinde de câte cupe de
îngheţată este vorba...). Biederman afirma că geonii rezultaţi vor activa în memoria
noastră reprezentări specifice, care ne permit recunoaşterea obiectului în cauză.
Un alt cercetător, Oliver G. Selfrige (1959), a conceput ceea ce este cunoscut
drept modelul „Pandemonium” (o denumire metaforică, desigur). Selfrigde pleacă de la
cadrul mai larg al analizei de trăsături fizice, operată de neuroni specializaţi („detectori de
trăsături”). Aceşti neuroni, aşa cum menţionam anterior, procesează trăsături fizice ale
obiectelor – şi uneori şi o singură trăsătură (dacă este suficient de distinctivă) ne poate
ajuta să recunoaştem un obiect. De exemplu, dacă de sub pat văd apărând un vârf de
gheruţă, recunosc acest element ca fiind specific pisicii mele. Chiar şi numai acest indiciu
implică prezenţa pisicii. Acest mod de procesare a informaţiei este, desigur, unul
economicos! Revenind la modelul lui Selfridge, amintim că acesta vorbeşte despre o
„colaborare” a mai multor „entităţi”, organizate ierarhic: unele recepţionează imaginea
obiectului; următoarele procesează fiecare trăsătură în parte; următoarele sintetizează
mesajele primite în unităţi cu sens; şi în sfârşit, altele analizează posibilele interpretări ale
stimulului şi se decid pentru una.
5 Geonii sunt numiţi şi „volume primitive”, deoarece pe baza lor pot fi compuse (teoretic) toate obiectele
lumii reale.
6 Cele spuse aici sunt valabile şi pentru stimulii auditivi.
5
ocluzării lor parţiale. Contextul, „scena” în care obiectele se găsesc ajută mult în acest
sens. S-a demonstrat experimental faptul că o caracteristică a unui obiect este recunoscută
mai uşor dacă este plasată într-un context posibil, comparativ cu prezentarea sa
independentă sau în cadrul unui obiect imposibil (efectul superiorităţii obiectului).
Feţele umane reprezintă un tip distinct de stimuli, cu mare semnificaţie
comportamentală, fiind structural diferite de majoritatea claselor de obiecte şi necesitând
strategii perceptuale distincte. Se pare că neuronii sunt clar specializaţi aici: unii răspund
la trăsături distinctive (cum ar fi o sprânceană), alţii la orientarea feţei (vedere din profil
sau frontală), alţii la direcţia privirii (în spate, în lateral), alţii la expresii faciale
particulare etc. Elemente faciale distinctive pentru un individ sunt reprezentate de poziţia
relativă, mărimea şi /sau forma ochilor, bărbiei, pomeţilor, nasului, de textura pielii etc. O
serie de experimente au arătat faptul că recunoaştem mai rapid elementele faciale în
contextul feţelor umane, comparativ cu prezentarea lor independentă (în acest din urmă
caz, este nevoie de foarte multe detalii pentru a se realiza recunoaşterea).
Recunoaşterea scenelor are şi ea particularităţi specifice. O „scenă” reprezintă o
situaţie statică ce poartă o anumită semnificaţie – reprezintă ceva: o sală de curs, o
parcare etc. Scenele se recunosc uşor deoarece sunt predictibile, iar informaţia conţinută
este redundantă; de exemplu, într-o sală de curs ne aşteptăm să găsim bănci, catedră,
tablă, videoproiector etc. – nici nu trebuie să procesăm toate elementele scenei pentru a o
recunoaşte!
Mai mult, obiectele dintr-o scenă nu sunt dispuse aleatoriu, ci sunt organizate
respectând o serie de regularităţi – fapt ce ne permite să vorbim despre o adevărată
„semantică a scenei”. Biederman şi colab. (1982) au arătat că aceste regularităţi sunt
produsul învăţării neintenţionate. Astfel, noi „învăţăm” din viaţa cotidiană faptul că, de
regulă, obiectele sunt aşezate pe un suport fizic, că sunt opace şi, deci, vor ocluza (total
sau parţial) obiectele situate în spatele lor, că au o mărime relativă „obişnuită” şi o poziţie
„obişnuită” şi că se găsesc, cu anumite probabilităţi, în contexte specifice. De exemplu,
mă pot gândi la pisica mea aflându-se acasă pe canapea, în poziţia ei obişnuită de somn,
ocluzând o parte a canapelei (scena este, deci, „perfectă”). Dacă aş vedea-o în amfiteatrul
301, sau ar apărea ca transparentă, nu aş recunoaşte cele văzute. Încălcarea cunoştinţelor
tacite pe care le avem despre mediul înconjurător îngreunează recunoaşterea.
6
Te întorci seara acasă de la cursuri, hotărât să scrii un referat la calculator. Deschizi uşa camerei
tale şi, în semiîntuneric, observi pe tastatura ta un obiect de mărime medie, formă nedefinită şi
culoare neagră (s-au activat automat modulele de contur, culoare ). Modelul lui Biederman se
dovedeşte nefolositor, pentru că singurul geon disponibil are formă ambiguă; în plus, nu remarci
nicio trăsătură fizică distinctă pentru a opera analiza de trăsături. Ai mai multe variante între care
trebuie să te decizi:
1. este hanoracul tău, pe care nu l-ai pus în şifonier, ci l-ai aruncat la întâmplare;
2. este căciula de blană a mamei tale;
3. este o găină neagră, ajunsă cumva acolo;
4. este orice altceva;
5. este propria ta pisică.
Noi indicii te pot hotărî într-o direcţie sau alta.
De ex., dacă modulul de textură îţi spune că este vorba despre ceva blănos, rămâi cu variantele 2.
şi 5.
Dacă percepi o vagă mişcare (s-a activat modulul specific de mişcare), ai de ales între 3. şi 5.
Dacă informaţia vizuală este completată de un stimul auditiv, problema este ca şi rezolvată…
Dar dacă toate acestea lipsesc, intră în joc contextul şi aşteptările tale. De pildă, varianta 3. este
foarte puţin probabilă, şi având în vedere că motanul tău de obicei stă pe biroul tău sau pe
lucrurile tale, alegi varianta 5.
Odată aleasă această variantă, vei interpreta, de pildă, un fir oblic ataşat de „obiect” drept o
mustaţă – şi asta îţi va confirma semnificaţia atribuită obiectului. În plus, pisica stă aşezată (pe un
suport), în poziţia ei obişnuită, are mărimea ei obişnuită, ocluzează obiectele (tastatura) şi,
evident, are o probabilitate mare de apariţie acolo; se integrează perfect în scena biroului tău.
Analizând astfel situaţia ai putea înţelege maniera de procesare descendentă a informaţiei
vizuale. Contextul, „scena” şi aşteptările facilitează recunoaşterea obiectelor.