Sunteți pe pagina 1din 16

4.

ANALIZA SISTEMULUI COGNITIV

4.1. Definirea sistemului cognitiv


Un sistem cognitiv este un sistem fizic care poseda doua proprietăţi: de reprezentare
şi de calcul.

 Reprezentarea este o reflectare într-un mediu intern a realităţii exterioare (Miclea,


1994). O definiţie mai riguroasă a ceea ce înseamnă reprezentare în ştiinţele cognitive e
oferită de Newel (1992). Să presupunem că în mediul extern apare un eveniment: o
variabilă X se transformă într-o variabilă Y. Acest eveniment îl vom nota sub forma X-T-Y.
O reprezentare a evenimentului X-T-Y într-un mediu intern se realizează atunci când o
proiecţie x a lui X şi o proiecţie t a lui T în acest mediu pot genera o variabilă y care să
corespundă variabilei Y. Esenţialul în cazul unei reprezentări este stabilirea unei relaţii
sistematice între domeniul ce trebuie reprezentat şi mediul intern în care el este
reprezentat (Miclea, 1994).

Reprezentările utilizate de sistemul cognitiv uman pot să fie simbolice (=imagini,


conţinuturi semantice etc.) sau subsimbolice (=patternuri de activare ale reţelelor neuronale).

 Calculul, cealaltă proprietate de care trebuie să dispună un sistem fizic pentru a fi


socotit un sistem cognitiv, constă în manipularea reprezentărilor pe baza unor reguli.
Dacă reprezentările sunt simbolice atunci avem de-a face cu reguli de manipulare ale
simbolurilor. De exemplu, regulile de efectuare a operaţiilor matematice, regulile sintactice
sau gramaticale, regulile semantice etc., sunt reguli pe baza cărora realizăm diverse
combinaţii de simboluri. Dacă reprezentările sunt subsimbolice sau neuromimetice, avem
de-a face cu reguli de modificare a valorilor de activare (de exemplu, regula lui Hebb).
Corespunzător celor două tipuri de reprezentări şi de reguli au fost dezvoltate două tipuri
de modelări în ştiinţele cognitive: clasic-simbolice şi neuromimetice.
4.2. Niveluri de analiză a sistemului cognitiv
Orice sistem cognitiv, deci implicit cel uman, poate fi analizat la cel puţin patru niveluri: (1)
nivelul cunoştinţelor; (2) nivelul computaţional; (3) nivelul reprezentaţional-algoritmic; (4) nivelul
implementaţional.

4.2.1. Nivelul cunoştinţelor


Comportamentele sau mecanismele psihice care se modifică în funcţie de cunoştinţele pe
care le are subiectul se numesc cognitiv-penetrabile (Pylyshyn şi Fodor, 1988). De exemplu,
recunoaşterea unei litere se realizează mai rapid dacă ea este prezentată într-un cuvânt cu sens
decât într-o combinaţie lingvistică fără sens. Comportamentele sau procesările cognitive care nu
sunt influenţate de cunoştinţele de care dispune subiectul sau de intenţiile sale se numesc
cognitiv-impenetrabile. De exemplu, extragerea contururilor unui obiect pe baza variaţiei
intensităţii luminii nu depinde de cunoştinţele pe care le are subiectul. (Miclea, 1994).

4.2.2. Nivelul computaţional


Stabilirea exhaustivă a procesărilor la care sunt supuse datele problemei (=inputul) pentru
a obţine soluţia (=outputul) este principala finalitate a abordării sistemului cognitiv la nivel
computaţional. Pe scurt, este funcţia input-output. De exemplu, dată fiind o reprezentare
bidimensională formată dintr-o mulţime de pixeli, să se afle obiectul tridimensional care a produs-
o. Proiecţia bidimensională de pe retină intră ca input într-o serie de prelucrări al căror output
este recunoaşterea obiectului tridimensional care a generat-o (Miclea, 1994). Pentru ca aceste
calcule să poată fi finalizate într-un timp real ele trebuie să ia în considerare caracteristicile
mediului fizic şi ale sistemului fizic care realizează procesarea stimulului în cauză. Aceste
proprietăţi exprimă regularităţi statistice, aproape întotdeauna adevărate şi sunt cunoscute în
jargonul ştiinţelor cognitive sub numele de constrângeri naturale (Miclea, 1994).

Spre exemplu, în perceperea adâncimii, cercetătorii de la MIT au ajuns la concluzia că


este suficientă considerarea a două astfel de regularităţi: a) constrângerea unicităţii, conform
căreia, de regulă, suprafeţele stimulilor fizici nu sunt transparente, ceea ce înseamnă că unui
pixel dintr-o imagine de pe retină i se asignează o singură adâncime; acest lucru n-ar fi valabil
dacă am trăi într-un univers în care majoritatea corpurilor sunt transparente; b) constrângerea
continuităţii care arată că majoritatea suprafeţelor unui obiect sunt continue, adică dacă unui
punct i se asignează o anumită adâncime, punctele din imediata sa vecinătate au o adâncime
similară. Odată integrate aceste asumpţii sau caracteristici ale lumii fizice în calculul disparităţii
binoculare, se rezolva problema corespondenţei imaginilor de pe cele două retine fiind posibilă
estimarea adâncimii în spaţiu (Miclea, 1994).

Analiza computaţională a sistemului cognitiv pune în evidenţă existenţa a două tipuri de


prelucrări: a) modulare; b) non-modulare. Procesările modulare nu pot fi influenţate de
cunoştinţele de care dispune subiectul (adică sunt cognitiv impenetrabile), se realizează automat,
preatenţional, sunt încapsulate şi au o locaţie neuroanatomică relativ precisă. Procesările non-
modulare sunt acele tratamente la care e supusă informaţia care pot fi influenţate de baza de
cunoştinţe a subiectului. De pildă, procesarea primară a informaţiei se realizează modular;
recunoaşterea obiectelor este însă un mecanism cognitiv nonmodular (Miclea, 1994).

4.2.3. Nivelul algoritmic-reprezentaţional


Dacă abordarea computaţională porneşte de la analiza sarcinii şi îşi pune problema
stabilirii prelucrărilor (=calculelor) care fac posibilă transformarea inputului în output, analiza
reprezentaţional-algoritmică îşi pune problema algoritmului care realizează funcţia input-output şi
a modalităţilor de reprezentare a inputului, respectiv outputului. Un algoritm este o secvenţă de
calcule pe baza căreia, printr-un număr finit de paşi, din datele de intrare se obţin datele de
intrare se obţin datele de ieşire (=soluţia corectă la o problemă) (de ex: algoritmii de calcul a
rădăcinii pătrate) (Miclea, 1994).
Reprezentările se referă la modul de codare a inputului, cum anume este el reprezentat în
sistemul cognitiv: semantic, imagistic, serial, prin valori de activare, etc. Reprezentările şi
algoritmii îşi impun reciproc constrângeri: o anumită reprezentare poate favoriza un anumit
algoritm şi nu altul, după cum o anumită procedură de calcul poate facilita utilizarea unei
reprezentări specifice (Miclea, 1994).

4.2.4. Nivelul implementaţional


Orice sistem cognitiv este un sistem fizic, fiind format din celule nervoase (=creierul), din
cipuri de siliciu (=calculatorul) sau alte materiale. Funcţionarea lui poate fi analizată inclusiv la
nivelul proceselor fizice sau biochimice concomitente procesărilor informaţionale. Putem analiza
sistemul cognitiv uman în funcţie de ce cunoştinţe şi intenţii are, care sunt cerinţele şi prelucrările
prin care ajunge de la datele problemei la soluţie, cum îşi reprezintă sarcina şi cum o realizează
efectiv, în fine, ce procese neurobiologice au loc în momentul efectuării sarcinii efective (Miclea,
1994). De investigarea nivelului implementaţional – în cazul subiectului uman – se ocupă
neuroştiinţele. Acel segment al neuroştiinţelor care nu se interesează exclusiv de fenomenele
biologice ci de modul în care o anumită structură neurobiologică realizează o anumită procesare
a informaţiei poartă numele de neuroştiinţe cognitive.

5. PERCEPŢIA VIZUALĂ

Cea mai mare parte a informaţiilor noastre despre mediul înconjurător ne este furnizată
prin intermediul sistemului vizual. Prelucrarea informaţiei vizuale este esenţială adaptării la mediu
– ea furnizează de pildă detalii privind forma, mărimea, culoarea, strălucirea, poziţia obiectelor în
spaţiu, în urma procesării acestor informaţii realizîndu-se recunoaşterea obiectelor. Aşadar,
realitatea fizică, obiectivă este „recreeată” la nivel perceptiv pentru a ne oferi imaginea unor
obiecte coerente şi a unui mediu stabil, predictibil.
Datorită rolului crucial pentru adaptare, sistemul vizual şi mecanismele de procesare a
informaţiei vizuale au fost subiectul cercetărilor minuţioase din neurofiziologie, psihofizică sau
psihologie cognitivă. Modelele teoretice elaborate în cadrul acesteia din urmă (ex. privind
recunoaşterea obiectelor) trebuie să satisfacă cel puţin trei constrângeri:

 plauzibilitate neuronală – să nu încalce regulile ce guvernează sistemul nervos la nivel


neurochimic;
 validitate tehnologică – să permită construcţia unor sisteme artficiale inteligente capabile
să „simuleze” vederea umană
 validitate ecologică – să explice comportamentul uman în diferite situaţii- în care sunt
implicate de pildă erori sau distorsiuni în procesarea informaţiei vizuale (ex. iluziile
perceptive)

 În concepţia tradiţională se realizează distincţia între două procese psihice diferite:

 senzaţii – se referă în general la recepţia stimulilor din mediu şi codarea iniţială a acestor
informaţii la nivelul sistemului nervos .
 percepţii – se referă la organizarea, interpretarea şi recunoaşterea informaţiilor senzoriale
(Aschraft, 1994).
Valoarea acestei distincţii senzaţii/percepţii este mai mult istorică decât practică sau
funcţională. Abordările recente din psihologia cognitivă propun o viziune integrativă a acestor
procese, în care esenţială este procesarea informaţiei vizuale, fie că este vorba de o procesare
primară, automată, modulară (detecţia culorii, adâncimii sau a contururilor obiectelor) fie că este
o procesare secundară, mai elaborată, implicată în recunoaşterea tridimensională a obiectelor.

5.1. Abordări teoretice în studiul percepţiei vizuale

 Structuralismul –– este curentul dominant al secolului al XIX-lea, reprezentând


perioada de debut a psihologiei ca ştiinţă experimentală (W. Wundt este fondatorul
acestei şcoli experimentale în 1879, la Leipzig). Denumirea acestei orientări este dată de
preocupările ştiinţifice de la acea vreme, centrate pe descoperirea structurii elementelor
de bază a materiei – atomi, molecule, celule, etc. În domeniul percepţiei E.B. Titchener
(1867-1927) afirma că studiul psihologic al percepţiei trebuie să vizeze identificarea
elementelor ultime, structurale, ale experienţei conştiente şi anume senzaţiile elementare.
Acestă perspectivă este reducţionistă şi definitiv depăşită, cu valoare pur istorică, însă ea
a generat un alt curent cu influenţă îndelungată în studiul percepţiei şi anume
Gestaltismul.

 Gestaltismul – a debutat în Germania, în jurul anului 1910, ca o reacţie la


abordarea structuralistă şi având ca asumpţie teoretică ideea că „întregul este diferit de
suma părţilor” . Argumentul principal al disputei cu structuraliştii este acela că analiza
structurală ignoră relaţiile dintre elemente; cu alte cuvinte, noi percepem întregul
(abordare holistică), configuraţia elementelor („gestalt”), care nu se regăseşte în suma
senzaţiilor independente. Deşi psihologia gestaltistă are relativ puţini adepţi în zilele
noastre, ideile ei privind organizarea perceptivă au fost absorbite în cercetările ulterioare
privind procesarea informaţiei vizuale (vom reveni la aceste principii gestaltiste într-un
subcapitol ulterior).

 Constructivismul – (reprezentanţi Bruner (1957), Neisser (1967) I.Rock,


J. Hochberg, R.L. Gregory) - este o abordare teoretică ce subliniază rolul activ al
subiectului în procesul perceptiv. Asumpţia sa este că percepţia este o construcţie
mentală, influenţată de strategiile cognitive de care dispune subiectul, de experienţa
anterioară, expectanţe, motive, cunoştinţe, atitudini, etc. Cu alte cuvinte, percepţia este
rezultatul inferenţelor pe baza informaţiilor provenite din mediu, această construcţie a
realităţii având loc „în interiorul subiectului” şi mediind între realitatea fizică obiectuală şi
percepţia ei. Prin urmare, această construcţie subiectivă este sistematic supusă erorii
perceptive – teoriile constructiviste şi-au vădit influenţa mai ales în explicarea fenomenului
iluziilor perceptive. Valoarea expectanţelor şi a cunoştinţelor în percepţie este
recunoscută (vezi analiza descendentă în recunoaştere) însă rolul lor a fost supraestimat
de constructivişti, ea rezumându-se mai cu seamă la situaţiile ambigue sau în condiţii
experimentale cu prezentare scurtă sau cu stimuli degradaţi, şterşi (condiţii improbabile în
viaţa cotidiană) (Eysenck, 1992)

 Perspectiva ecologică – reprezentată în principal de James J. Gibson


(1904-1979) - este diametral opusă constructivismului şi avansează asumpţia că stimulii
din mediu conţin informaţia necesară şi suficientă pentru realizarea percepţiei directe,
nemediate, a realităţii fizice – (este o teorie de tip “bottom-up”). De pildă detaliile privind
adâncimea şi poziţia obiectelor în spaţiu au ca sursă principală modificările gradate în
textura obiectelor (gradientul texturii). Această abordare şi-a căpătat denumirea de
perspectivă ecologică deoarece susţine ideea că percepţia este un fenomen natural, care
se desfăşoară şi evoluează în mediul real – prin urmare studiul percepţiei trebuie să se
realizeze în situaţii reale şi nu artificiale, în condiţii de laborator.

 Abordarea computaţională – este atribuită în special lui D. Marr (1945-


1980) – de inspiraţie matematică, modelele propuse sunt derivate din simulările pe
calculator şi inteligenţa artificială. Asumpţia principală a modelului propus de Marr în
studiul percepţiei este aceea că percepţia caracteristicilor obiectelor din mediu (formă
sau mărime, etc)presupune o serie de calcule sau procesări ale informaţiei – respectiv
extragerea, într-o formă simbolică, a trăsăturilor imaginii vizuale – linii, contururi, mişcare,
lumnozitate. Calculele presupun un fel de analiză matematică a acestor modificări, în mod
similar unui calculator ce discriminează între diferite forme, paternuri, etc (prin analiza
informţaiei senzoriale)

 Abordarea neurofiziologică – vizează substratul neuronal al percepţiei


vizuale şi mecanismelel fiziologice ce o determină. Se ştie de pildă că există structuri
neuronale specializate pentru detectarea unor trăsături specifice ale stimulilor din mediu –
(de ex. orientare, lungime, mărime, culoare) – studiile recente realizate de Hubel şi Wiesel
au pus în evidenţă acest lucru (vezi detectorii de trăsături). Deşi promiţătoare, această
abordare este insuficientă în a explica complexitatea mecanismelor de procesare a
informaţiei în parcursul de la stimularea fotochimică a sistemului vizual până la percepţia
conştientă a realităţii fizice.

În cele ce urmează vom parcurge pe scurt mecanismele fiziologice ale percepţiei vizuale
şi mai apoi vom descrie modelele principale care s-au consacrat în studiul computaţional al
percepţiei vizuale.
5.2. Neurobiologia procesării informaţiei vizuale

Sistemul vizual începe la nivelul ochiului care este similar cu un aparat fotografic.
Sistemul vizual recepţionează unde electromagnetice cu lungimi de undă între 440-810 mm care
determină o activitate fotochimică la nivelul receptorilor, formaţi din conuri (cu sensibilitate pentru
culori şi acuitatea detaliilor) şi bastonaşe (specializate in detectarea luminii de slabă intensitate) .
Ambele tipuri de receptori conţin pigmenţi sensibili la lumină. Fotonii stimulilor luminoşi provoacă
descompunerea acestor pigmenţi, dând naştere unor potenţiale electrice în celulele nervoase.
Receptoriii sunt conectaţi pe verticală de celule bipolare, ceule ganglionale şi nervii optici. Nervii
optici de la fiecare ochi converg în chiasma optică şi proiectează apoi în nucleii geniculaţi laterali
din talamus (LGN). De aici proiectează în cortexul vizual, lobul occipital. Lezarea nervului optic
produce deficite ale inputului vizual de la ochiul respectiv, însă lezarea fibrelor care traversează
chiasma optică produce deficite la nivelul ambelor câmpuri vizuale, tulburare numită hemianopie
bilaterală. Lezarea parţială a cortexului vizual produce „puncte oarbe” sau scotoame în câmpul
vizual, iar lezarea cortexului vizual primar produce orbire corticală, respectiv incapacitatea de a
distinge forme sau paternuri, cu păstrarea capacităţii de a percepe lumina

Receptorii sunt conectaţi pe verticală de celulele bipolare, ganglionale şi nervii optici. Pe


de altă parte, între celulele nervoase există conexiuni pe orizontală, asigurate de celulele
amacrine şi celulele orizontale. Aceste tipuri de conexiuni conferă retinei o structură laticeală, cu
funcţii excitative – pe verticală – şi inhibitive – pe orizontală – care fac posibile procesări
sofisticate ale informaţiei vizuale (Miclea, 1994).

Distribuţia receptorilor la celulele ganglionale este diferenţială, fiecare con din zona
foveală este conectat la un ganglion, însă cu cât ne îndepărtăm spre periferia retinei, cu atât
numărul de receptori, adică de bastonaşe, conectaţi la o celulă nervoasă creşte, ajungând de
ordinul sutelor (Miclea, 1994).

5.2.1. Câmp receptor; celule on-off şi off-on


Numărul mare de receptori ce revine pentru o celulă ganglională (aprox. 130:1) face ca
aceste celule să nu reacţioneze la stimularea unui singur punct de pe retină, ci la stimularea unei
arii sau suprafeţe mai mari, care include mai mulţi receptori. Zona sau suprafaţa de pe retină care
modifică funcţionarea celulei nervoase se numeşte câmp receptor al celulei respective (Miclea,
1994).

Mărimea câmpului receptor se stabileşte înregistrând activitatea celulei nervoase în


condiţiile stimulării retinei cu un stimul luminos. Se înregistrează şi se consemnează dacă
activitatea celulei (=frecvenţa potenţialelor de descărcare) creşte fie la apariţia luminii (+), fie la
dispariţia acesteia (-), fie nu se constată nici o schimbare (0). Utilizând această metodologie au
fost detectate două tipuri de celule: a) celule on-off; b) celule off-on. Ambele au câmpuri
receptoare circulare şi concentrice, dar polaritatea acestor câmpuri este diferită.

În cazul celulelor on-off stimularea luminoasă intensifică rata descărcărilor electrice


dacă lumina cade în centrul câmpului receptor şi reduce activitatea celulei dacă spotul luminos se
află spre periferie. Celulele on-off având un câmp receptor cu o polaritate pozitivă în centru şi
negativă spre periferie se activează pentru spoturi luminoase (Miclea, 1994)

Celulele off-on au o funcţie complementară celulelor on-off. Activitatea lor este maximă
dacă în zona centrală a câmpului receptor e expus un punct negru, mărginit sau circumscris de
fascicule luminoase. Dacă punctul sau pata neagră se decentrează, activitatea ganglionului se
reduce revenind, odată cu mărirea decentrării, la rata spontană de descărcare (Miclea, 1994).

Celulele cu câmp receptor on-off şi off-on sunt caracteristice ganglionilor vizuali şi


celulelor nervoase din corpii geniculaţi laterali talamici. Dacă prelucrarea stimulilor luminoşi s-ar
rezuma doar la activitatea celulelor on-off şi off-on am putea percepe doar spoturi luminoase şi
puncte. Neuronii din cortexul vizual realizează însă procesări mult mai complexe.

5.2.2. Detectorii de trăsături

 Celulele simple detectează contururi, fante luminoase sau linii. De fiecare dată
când în câmpul vizual stâng sau drept e prezentată o fantă luminoasă, un contur sau o
linie, se constată o intensificare a frecvenţei potenţialelor de acţiune ale neuronului
respectiv. Specializarea acestor celule nervoase este atât de pregnantă încât ele
reacţionează numai la o anumită orientare şi localizare a elementelor respective. Celulele
care detectează linii verticale într-o anumită locaţie din câmpul vizual – deci care îşi
intensifică rata descărcărilor la apariţia unor astfel de stimuli – sunt diferite de neuronii
care-şi sporesc potenţialele de acţiune în prezenţa unei linii orizontale sau a unei linii
verticale aflate în altă locaţie. Câmpul receptor al celulelor simple nu mai este circular, ca
în cazul celulelor on-off şi off-on ci elongat (Miclea, 1994). O celulă simplă însumează
acivitatea mai multor celule on-off şi/sau off-on din nucleii geniculaţi laterali talamici.

 Celulele complexe se găsesc în ariile striate şi parastriate ale cortexului vizual, şi


au un nivel mai ridicat de generalitate. Spre deosebire de celulele simple, celulele
complexe răspund la aceşti stimuli indiferent de locaţia lor în câmpul vizual. Rămâne
importantă ca şi la celulele simple, orientarea stimulilor. În plus, celulele complexe
reacţionează şi la stimuli aflaţi în mişcare; pentru orientări sau direcţii diferite ale unui
stimul se activează celule complexe diferite (Miclea, 1994).

 Celulele hipercomplexe sunt numite astfel deoarece complexitatea stimulului pe


care îl prelucrează este mai mare decât în cazul celulelor simple sau complexe. Până în
prezent s-a constatat existenţa a două tipuri de celule hipercomplexe. Primul tip vizează
celule funcţional identice cu celulele complexe, cu o singură deosebire: ele reacţionează
la orice stimul simplu (linii, fante, contururi) cu condiţia ca acestea să aibă o anumită
dimensiune. Stimulii de dimensiuni diferite activează celule hipercomplexe diferite (Miclea,
1994). Cel de-al doilea tip, detectează unghiuri, deci stimuli mai complecşi decât cei
menţionaţi anterior. Selectivitatea acestor celule hipercomplexe este însă considerabilă,
unele răspunzând doar la prezenţa unor unghiuri drepte, altele la prezenţa unor unghiuri
ascuţite (Miclea, 1994)

Rezumând cele menţionate până acum, cortexul vizual este sediul unor celule care
detectează stimuli de complexitate tot mai mare. Din punct de vedere funcţional, aceste celule au
fost numite detectori de trăsături. Dincolo de proprietăţile lor specifice, neuronii detectori de
trăsături au câteva note comune: a) manifestă o reactivitate maximă la un anumit tip de stimul-
trăsătură, dar răspund, în măsură mai redusă şi la stimuli similari; b) sunt fatigabili; c) se
activează, semnalând prezenţa unui anumit stimul-trăsătură, iar prin inhibiţie laterală reduc
activitatea unor neuroni învecinaţi care detectează caracteristici similare, într-o zonă învecinată a
câmpului vizual (Miclea, 1994).

5.3. Nivele ale procesării vzuale


Există tendinţa generală de a împărţi procesarea informaţiei vizuale la nivel computaţional
în două mari stadii: procesare primară şi procesare secundară.

 Procesarea primară cuprinde prelucrările preatenţionale, cu o durată de


aproximativ 200 de milisecunde, care au ca rezultat reprezentarea, în sistemul cognitiv, a
caracteristicilor fizice ale stimulului. Ele realizează separarea stimulului de fond, ne arată
unde anume este acesta, nu ce anume este. Sunt incluse aici mecanismele de detectare
a contururilor, a texturii, mişcării, culorii şi a dispunerii spaţiale.

 Procesarea secundară vizează mecanismele implicate în recunoaşterea figurii şi


obiectelor. Ele au ca input rezultatele procesărilor primare şi ca output – imaginea
tridimesională a unui obiect în mediu, identificat, recunoscut. Această dihotomie a
prelucrării stimulilor vizuali nu este riguroasă, dar este utilă şi este larg răspândită în
literatura de specialitate.

5.3.1. Procesarea primară a informaţiei vizuale


Procesarea primară a informaţiei vizuale are loc la nivelul cortexului vizual primar situat în
lobii occipitali. Hubel şi Wiesel (1962, 1968) au descoperit la acest nivel celule ale cortexului
vizual care răspund preferenţial la stimuli cu proprietăţi lineare (linii şi bare). Aceste celule se mai
numesc şi „detectori de trăsături” şi au fost clasificate de cei doi autori în celule simple, complexe
şi hipercomplexe. Celulele simple sunt mai mici şi sunt activate de linii dispuse intr-o orientare
particulară, a căror imagine cade pe o anumită porţiune a retinei. Celulele complexe sunt mai
mari şi răspund la poziţia şi mişcarea unui stimul dar şi la linii cu o orientare particulară, în orice
loc al retinei. Celulele hipercomplexe procesează unghiuri şi joncţiuni.
Studiile au demonstrat existnţa a două sisteme disctincte de pocesare a informaţiei în
cortexul vizual: un sistem identifică locaţia unui stimul, unde anume se află acesta iar alt sistem
identifică ce anume este stimulul respectiv. Perceperea identităţii unui obiect este localizată în
cortexul inferotemporal, numită şi calea ventrală, în timp ce locaţia este procesată în cortexul
parietal posterior, numită şi calea dorsală.
Procesarea primară a informaţiei vizuale are ca input imaginea bidimensională de pe
retină şi ca output, în urma procesării paralele a informaţiei, culoarea, poziţia, forma, mişcarea,
orientarea şi frecvenţa spaţială a stimulilor. Procesările primare sunt preatenţionale, au o durată
de aproximativ 200 milisecunde şi au ca rezultat reprezentarea, în sistemul cognitiv, a
caracteristicilor fizice ale stimulului, putând spune unde anume este situat acesta dar încă nu
ştim, la acest nivel, ce anume este stimulul respectiv.
Toate prelucrările primare posedă câteva caracteristici comune care le individualizează
faţă de procesările secundare sau alte tipuri de prelucrări mentale:
 Sunt organizate pe moduli, care funcţionează simultan, paralel; modulii au un caracter
preatenţional, irepresibil şi sunt impermeabili cognitiv (activitatea lor nu poate fi
modificată volunatr)
 Procesările sunt independente de natura stimulului, adică se realizează aceleaşi
prelucrări indiferent dacă stimulul este un scaun sau o faţă umană
 Buna desfaşurare a prelucrarilor presupune o serie de asumpţii depre realitatea
obiectuală. Una din aceste asumpţii este cea a rigiditătii obiectelor, care ne permite să
percepem adâncimea şi deplasarea obiectelor în spaţiu.

Calculul adâncimii.
Deşi pe retină apar numai imagini bidimensionale, totuşi percepem lumea în 3D. Unul din
mecanismele cele mai importante de detecţie a distanţelor şi adâncimii are la bază fenomenul
numit stereopsis, care se referă la faptul că cei doi ochi au unghiuri diferite de recepţie a
stimulilor vizuali, apărând o disparitate retinală. Plecând de la această disparitate se poate
calcula distanţa unui obiect faţă de observator, deci şi adâncimea în spaţiu. Deplasarea
obiectelor în spaţiu şi deplasarea noastră faţă de ele sunt alte surse de informaţii asupra
adâncimii sau distanţei. De asemenea, Gibson (1950, 1966) a arătat că informaţiile pot fi
conţinute de gradientul unei texturi, adică micşorarea sistematică a dimensiunilor elementelor
texturii şi distanţei dintre acestea.

 Alte repere importante în percepţia adâncimii sunt cele studiate de pictori în


redarea perspectivei tridimensionale prin intermediul unei lucrări bidimensionale. Aceste
repere sunt:
1. Perspectiva liniară – liniile paralele par să se unească la o anumită distanţă.
2. Mărimea relativă – cu cât obiectul se află mai la distanță, cu atât va părea mai mic. Un
pictor care dorește să creeze impresia de adâncime va include în tabloul său figuri de mărimi
diferite. Privitorul va presupune că o figură umană sau orice alt obiect pe care îl recunoaște își
conservă mărimea si va vedea obiectele mai mici ca fiind situate în depărtare.
3. Suprapunerea obiectelor – în situația în care un obiect este suprapus peste altul
(acoperindu-l parțial) primul va apărea mai aproape.
4. Claritatea – obiectele aflate mai aproape par mai clare, mai bine definite comparativ cu
cele situate mai departe.
5. Lumina si umbra – părțile mai întunecate ale unei imagini par mai depărtate decât cele
mai luminoase; efectul de lumini si umbre amplifică efectul tridimensional.
6. Textura – cu cât textura unui obiect este mai brută, mai lipsită de finete, cu atât acesta
pare mai apropiat.

Alte repere:
7. Mișcarea aparentă – când noi ne mișcăm, obiectele din jurul nostru care se mișcă au o
viteză cu atât mai mică, cu cât acestea sunt situate mai la distanță de noi. Dacă ați circulat
vreodată cu mașina pe o șosea pustie vi s-a părut cu siguranță că mergeți mult mai încet decât
pe o șosea aglomerată.
8. Acomodarea – cristalinul îsi modifică forma pentru a focaliza pe retină razele
luminoase, cu mai multă acuratete. Imaginea obiectelor mai depărtate se proiectează pe retină
prin contractia muschilor ciliari, care determină alungirea cristalinului. În cazul obiectelor mai
apropiate, muschii ciliari se relaxează pentru a permite rotunjirea cristalinului. Informatiile
kinestezice, de la nivelul acestor muschi, ajung la nivel cortical si furnizează informații despre
apropierea sau depărtarea obiectului în câmpul vizual.
Procesarea mişcării.
Percepţia deplasării unui obiect joacă un rol esenţial pentru supravieţuirea organismelor în
medii dinamice. Multe date experimentale susţin teza procesării deplasării în spaţiu a unui obiect
de către un modul independent. Se pare că aceste procesări sunt chiar mai rapide decât cele
care sunt implicate în recunoaşterea formei şi/sau a semnificaţiei sale. De exemplu, tendinţa
generală a subiectului uman de a-şi feri capul din calea obiectelor aflate în mişcare a fost
evidenţiază din primele săptămâni de viaţă (Regan et al., 1986). Celulele nervoase implicate în
detectarea mişcării sunt specifice în funcţie de direcţia acestei mişcări; acelaşi obiect, deplasat în
direcţii diferite, este procesat de celule nervoase diferite.

Extragerea formei din prelucrarea umbrelor.


Mărimea, forma sau dispunerea umbrei unui obiect constituie elemente importante din
prelucrarea cărora se pot obţine informaţii despre forma şi poziţia obiectului într-un anumit
context. Şi aceste procesări constituie un modul independent. Se consideră că cunoştinţele tacite
ale subiectului joacă un rol important în prelucrarea umbrelor.

Procesarea texturii; textonii.


Textura unei suprafeţe este alcătuită dintr-o combinaţie de elemente. Elementele
primitive, nedecompozabile care sunt specifice unei texturi se numesc textoni (Jules, 1981). Una
din funcţiile lor este aceea de a segrega figura de fond sau obiectul de mediu acolo unde
diferenţele de luminozitate nu sunt suficiente pentru extragerea contururilor. Detectarea textonilor
se poate face fie automat, preatenţional, sau prin antrenarea atenţiei vizuale. Procesarea vizuală
primară se referă doar la primul caz.

Detectarea culorii.
Detectarea culorii poate constitui o finalitate în sine dar poate servi şi la segregarea mai
rapidă a figurii de fond. Culoarea este obţinută prin mecanisme exclusiv chimice. Sistemul vizual
realizează o reconstrucţie a stimulului prezentat pornind de la proiecţia sa pe retină. Percepţia
obiectelor nu se face instantaneu, nemijlocit, ci prin medierea unor mecanisme de tip modular,
care au ca input proiecţia retinală, iar ca output schiţa 2½D. Astfel, la sfârşitul unei faze de
procesare care durează mai puţin de 200 ms, subiectul surprinde contururile, adâncimea,
deplasarea, forma şi culoarea obiectelor. Pe baza acestor procese se realizează segregarea
figurii de fond sau a obiectelor de mediul în care se află. Schiţa 2½D este o reprezentare
intermediară a stimulului, care încă nu a fost recunoscut. Ea este „centrată pe subiect”, adică
depinde de alinierea ochi-stimul – privit din unghiuri diferite, un obiect îşi relevă contururi diferite.

5.3.2. Schema generală a procesării informaţiei vizuale


A fost circumscrisă de D. Marr (1982). Intensitatea stimulilor luminoşi face obiectul unor prelucrări
iniţiale care conturează o schiţă primară a obiectului conceput. Asupra acestei schiţe primare se
exercită o mulţime de tratamente sau prelucrări de stabilire a adâncimii în spaţiu prin calculul
disparităţii binoculare, de reprezentare a mişcării, texturii, culorii şi orientarea în spaţiu a
suprafeţelor unui obiect. Toate aceste procesări sunt executate în paralel de mecanisme
modulare. Rezultatul lor constă în constituirea unei reprezentări intermediare a obiectului din
câmpul vizual, notată cu 2 ½ D tocmai pentru a arăta caracterul intermediar între imaginea
retiniană şi obiectul tridimensional. Această imagine intermediară serveşte ca input pentru alte
procesări al căror produs final este reprezentarea tridimensională a obiectului, notată cu 3 D.

Stimuli vizuali

Schiţa primară

Detectarea
Procesarea poziţiei şi Procesarea Culoarea
Procesarea
distanţei şi formei din texturii
mişcării
a adâncimii procesarea
umbrelor

Schiţa intermediară 2 1/2D

Reprezentarea 3 D

Fig. nr. 10. Schema generală de procesare a informaţiei vizuale (Miclea, 1994)

5.3.3. Procesarea secundară a informaţiei vizuale.


Recunoaşterea obiectelor
Rostul prelucrărilor secundare este ca dintr-o schiţă intermediară 2½D luată ca input să
producă, pe baza unor prelucrări variate, schiţa 3D, adică recunoaşterea obiectului. Prelucrările
secundare realizează descentrarea reprezentărilor intermediare ale obiectului. Recunoaşterea
ar putea fi definită ca punere în corespondenţă a imaginii perceptive a obiectului cu
reprezentarea sa în memorie.
Recunoaşterea obiectelor este atât flexibilă cât şi rapidă. Este plauzibil ca reprezentarea
stocată în memorie, simbolică sau neurală, să reprezinte obiectul indiferent de unghiul sau
perspectiva din care este văzut. Acest fapt este facilitat de existenţa unor detalii spaţiale
constante sau proprietăţi neaccidentale (Lowe, 1984), cum ar fi paralelismul sau simetria. Acest
fapt ar explica flexibilitatea recunoaşterii. Un obiect simplu poate fi identificat după o expunere de
numai 100 ms, iar după alte 800 ms acesta poate fi chiar numit. De asemenea este avansată
prezenţa unor mecanisme de organizare a stimulilor complecşi în unităţi mai simple, reducând
diversitatea pe baza unor mecanisme de grupare a elementelor unei figuri. Acest fapt ar explica
rapiditatea recunoaşterii.
 Principiile gestaltiste. Întrucât primii care au studiat principiile de grupare ale
elementelor unei figuri au fost psihologii şcolii gestaltiste, acestea le poartă numele.
Numărul total al acestor principii nu este cu exactitate cunoscut, dar pentru obiectele sau
figurile statice, mai cunoscute sunt următoarele:
 principiul proximităţii, care afirmă că elementele aflate în proximitate spaţială sunt
grupate într-o singură unitate perceptivă;
 principiul similarităţii, care afirmă că elementele similare sunt grupate în aceeaşi
unitate perceptivă, care este contrapusă altora;
 principiul bunei-continuări, care afirmă că la intersecţia a două contururi, ele sunt
percepute după continuarea cea mai simplă;
 principiul închiderii, potrivit căruia conturul ocluzat al unei figuri este închis după
configuraţia sa vizibilă.
Versiunea generalizată a acestor principii poartă numele de legea lui Prägranz,
postulând ideea că stimulii vizuali sunt în aşa fel grupaţi încât să rezulte configuraţia cea mai
simplă.
Se pune problema dacă aceste mecanisme de grupare a stimulilor vizuali sunt înnăscute
sau nu. Prezenţa lor poate fi constatată încă din primele luni de viaţă (Spelke, 1990). Chiar dacă
nu sunt integral determinate genetic, cu siguranţă există o predispoziţie (preparedness) a
sistemului nervos în această direcţie.

RBC - un model computațional de recunoaștere a obiectelor

Identificarea caracteristicilor nonaccidentale ale obiectelor care sunt prezentate în schiţa


21/2 D şi organizarea gestaltistă a stimulilor vizuali nu sunt suficiente pentru a explica procesul
de recunoaştere. Care sunt prelucrările ulterioare care se finalizează în recunoaştere? Abordarea
computaţională a acestei probleme încearcă să ne ofere o soluţie interesantă şi plauzibilă.

Una dintre cele mai interesante modelări computaţionale ale recunoaşterii obiectelor -
RBC (recognition by components) a fost realizată de I. Biederman (1987, 1988, 1990).
Psihologul american porneşte de la tendinţa cotidiană, naturală a subiectului de a segmenta
obiectele complexe în părţile lor componente. Un elefant, de pildă, e considerat ca fiind compus
din corp, trompă, cap, picioare şi coadă. Un om - din cap, corp, braţe, picioare etc. Uşurinţa
segmentării obiectelor complexe în părţile lor componente e vizibilă şi în desenele sau schiţele de
desen pe care le facem aproape la orice vârstă.

Părţile în care sunt descompuse obiectele pot fi considerate ca nişte volume primitive
numite geoni (de la geometrical ions). Un obiect complex poate fi specificat prin geonii
componenţi şi modul de dispunere a lor. Aceeaşi geoni aflaţi în relaţii diferite reprezintă obiecte
diferite. Bazându-se pe o estimare a numărului de obiecte concrete, semnificativ diferite din
universul cunoscut nouă până în prezent, Biederman susţine că întreaga diversitate obiectuală ar
putea fi redusă la 24 de geoni şi a combinaţiilor dintre aceştia. În figura nr.11 sunt prezentaţi 10
astfel de geoni şi câteva din obiectele care pot fi constituite prin compunerea lor.
Fig.nr.12. Stimuli fizici (a) şi
segmentarea lor în zonele de
maximă concavitate locală (c)
sau în alte zone (b). (apud
Biederman, 1987)

Fig.nr.11. Geoni şi obiecte complexe (apud Zimbardo, 1992).

Segmentarea obiectelor în părţile componente - generând astfel geonii respectivi - se


face, de regulă, în zonele de concavitate. Segmentarea obiectului în aceste zone oferă maximum
de informaţie asupra structurii şi părţilor sale (vezi figura nr.11).
După extragerea contururilor din imaginea obiectului real, sunt iniţiate două module
paralele, de detectare a proprietăţilor nonaccidentale şi de segmentare a obiectelor în zonele de
concavitate locală. Rezultatul acestor procesări paralele constă în reducerea oricărui obiect
complex la un set de geoni aflaţi în anumite relaţii topologice. Această reprezentare activează
diverse modele ale obiectelor, existente în memorie, modele reductibile la geoni şi combinaţiile
dintre aceştia. Pe baza acestei corespondenţe se realizează identificarea obiectului. Biederman
susţine că e suficientă identificarea a trei geoni dintr-un obiect pentru a putea recunoaşte obiectul
respectiv (Biederman, 1990). Liniile punctate arată eventuala intervenţie a unor procesări
descendente.
Implementarea pe calculator a unor variante ale modelului RBC s-a dovedit viabilă şi
promiţătoare. Din punct de vedere psihologic nu atât performanţele sale tehnologice ne
interesează, (deşi ele sunt esenţiale pentru IA), ci validitatea ecologică a acestui model.

Prima coloană reprezintă o mulţime de obiecte reale. Celelalte două coloane


reprezintă aceleaşi obiecte dar cu contururile incomplete. Deosebirea dintre ele este că, în
coloana (c) contururile sunt şterse în zonele de concavitate locală iar în coloana (b), aceeaşi
suprafaţă este radiată dar în alte zone. Dacă segmentarea obiectelor se face în zonele de
concavitate, atunci recunoaşterea obiectelor pe baza schiţelor din coloana (c) va fi mult mai
dificilă decât dacă se prezintă imaginile din (b). Cititorul poate verifica singur această conjectură
inspectând figura 12.. Ea a fost probată experimental de Biederman (1987): numărul de erori şi
timpul de reacţie sunt mai mari în cazul deteriorării contururilor din zona de concavitate locală
decât din orice altă zonă, aria deteriorată fiind constantă.
În rezumat, procesarea secundară a informaţiei porneşte de la schiţa 21/2 D. La acest
nivel sistemul cognitiv cunoaşte contururile obiectului (depistate fie pe baza variaţiei de
luminozitate, fie datorită diferenţei de culoare sau textură), cunoaşte dacă obiectul se deplasează
sau nu, adâncimea sa în spaţiu sau depărtarea faţă de observator. Această reprezentare este
centrată pe subiect.
Apoi, în schiţa 21/2 D sunt identificate caracteristicile nonaccidentale iar contururile prezente sunt
organizate pe baza principiilor gestaltiste de mecanisme speciale. Imaginea intermediară e
segmentată în zonele de concavitate locală (maximă), generând geonii. Aceştia activează în
memorie obiectele formate din geonii respectivi aflaţi în relaţii topologice specifice, recunoaşterea
finalizându-se prin punerea în corespondenţă a reprezentării stocate în memorie cu imaginea
intermediară.
Se poate observa că toate aceste procesări sunt unidirecţionale, de jos în sus. Cu alte cuvinte,
ele sunt prelucrări ascendente (botom-up analysis). Recunoaşterea obiectelor sau figurilor
implică însă şi o mulţime de procesări descendente, care vor fi tratate în cele ce urmează.
(Miclea, 1994)

Procesãri descendente în cazul recunoaşterii stimulilor verbali

O serie de cercetări au probat efectul catalizator al contextului adecvat în recunoaşterea


stimulilor verbali. Înainte de a citi mai departe acest text, priviţi figura nr.13

/ \AI / \CASĂ!

Fig.nr.13. Un exemplu de procesare descendentă

Fără prea multă dificultate aţi redus ambiguitatea mesajului percepând propoziţia HAI
ACASĂ! Aceeaşi configuraţie ambiguă / \ este interpretată, în contextul primului cuvânt ca fiind
litera H iar în contextul celui de-al doilea cuvânt ca fiind A . Cunoştinţele noastre de limba
română şi despre semnificaţia semnului exclamării au iniţiat un proces de analiză descendentă
care au dus la specificarea configuraţiilor. Analiza ascendentă - pe trăsături - ar fi fost insuficientă
în acest caz. Cunoştinţele noastre lexicale au funcţionat ca nişte constrângeri ale recunoaşterii
configuraţiei ambigue astfel încât, cele două cuvinte impunând constrângeri diferite au determinat
decodări diferite. Perceput independent de context, configuraţia ambiguă ar fi fost lipsită de
constrângeri, putând s-o interpretăm în chipuri diferite.
Recunoaşterea mai rapidă a unei litere dacă ea este prezentată în contextul unui cuvânt a
fost demonstrată experimental în repetate rânduri. G. Reicher (1969) a prezentat la tahistoscop
un caracter ţintă - să zicem "K" în trei situaţii diferite: a) în contextul unui cuvânt cu sens (ex:
"WORK"); b) în contextul unei configuraţii lingvistice fără sens (ex: "WKOR"); c) independent (ex:
"K"). Pentru fiecare dintre aceste situaţii subiecţii trebuiau să decidă dacă, la tahistoscop, au
văzut litera "K" sau litera "D". S-a constatat că recunoaşterea - operaţionalizată atât prin numărul
de erori cât şi prin timpul de reacţie - este cea mai eficace în situaţia a). Mai exact, numărul de
erori înregistrate la discriminarea dintre D şi K este cu 10% mai mic dacă literele sunt
prezentate în contextul unui cuvânt decât dacă sunt prezentate independent. El a numit acest
rezultat efectul superiorităţii cuvântului, (superiority word effect), subliniind că recunoaşterea
unei litere e mai rapidă dacă ea e încadrată într-un cuvânt cu sens decât dacă ea este prezentată
independent sau într-o configuraţie fără sens.
La prima vedere suntem în faţa unui efect paradoxal, procesarea unei singure litere fiind
realizată într-un timp mai îndelungat decât procesarea unei secvenţe (cu sens) de patru litere.
Rumelhart & Siple (1974) oferă o explicaţie acestui efect. Ei susţin că pentru a discrimina între
"D" şi "K" trebuie realizată o analiză pe trăsături completă dacă aceste caractere sunt prezentate
independent. În schimb, dacă sunt prezentate în cadrul unui cuvânt e suficientă procesarea unei
singure trăsături (ex: ) de la D sau de la K) pentru a le discrimina, deoarece, prin analiză
descendentă, activarea sensului posibil al cuvântului circumscrie semnificaţia ultimei litere,
nemaifiind necesară prelucrarea ei completă.
Ulterior, McClelland & Rumelhart (1981) au construit o reţea neuromimetică în stare să
producă acest efect pe care o vom prezenta într-un subcapitol ulterior. Explicaţia lui Rumelhart &
Siple ne atrage atenţia asupra caracterului puternic redundant al majorităţii stimulilor complecşi.
Oricine poate constata acest lucru cînd, fiind pus să citească un text în care părţi din litere erau
şterse a putut face acest lucru fără dificultăţi deosebite. Secvenţa: scxiu x frxză xn cxre xiexarx a
txeix lixerx esxe x xar xoaxe fx cixitx poate fi într-adevăr citită, datorită procesărilor descendente,
chiar dacă lipsesc foarte multe caractere. Devine acum evident faptul că, în recunoaştere,
prelucrarea ascendentă este dublată de analiza descendentă. Acest lucru nu are loc în cazul
procesării primare a informaţiei vizuale deoarece este efectuată de moduli impenetrabili cognitiv.

În mod similar, s-a putut pune în evidenţă superioritatea recunoaşterii cuvântului în


contextul propoziţiei faţă de recunoaşterea sa în situaţia prezentării sale independente. Pollack
& Pickett (1964) au înregistrat pe bandă de magnetofon conversaţiile dintre diade de subiecţi.
Ulterior ei au izolat unele cuvinte şi le-au prezentat în combinaţii aleatoare subiecţilor participanţi
la aceste conversaţii. Deşi iniţial conversaţia se desfăşurase în bune condiţiuni, subiecţii
înţelegând toate cuvintele, ulterior doar 47% dintre acestea au fost înţelese! Generalizând, dacă
într-o conversaţie înţelegem aproximativ 100% din cuvintele vehiculate, atunci cam jumătate din
această înţelegere nu se datorează proprietăţilor stimulilor lingvistici auditivi ci cunoştinţelor
noastre sintactice şi semantice care iniţiază prelucrări descendente ale informaţiei.

Procesãri descendente în cazul recunoaşterii scenelor şi feţelor umane

Cunoştinţele de care dispunem, prin iniţierea unor procesări descendente sunt


responsabile şi de recunoaşterea mai rapidă a elementelor unor feţe umane în contextul feţelor
respective decât dacă aceste elemente sunt prezentate independent. Palmer (1975) a prezentat
părţi ale unei feţe umane asociate cu prezentarea integrală a acesteia din urmă. Recunoaşterea
lor s-a făcut cu uşurinţă, într-un timp foarte scurt (figura nr.14 A). Aceleaşi elemente, prezentate
însă independent aveau nevoie de o reprezentare mult mai detaliată pentru a putea permite
recunoaşterea lor (figuranr.14 B).
Aceleaşi caracteristici ale feţei (nasul, urechea, buzele) sunt recunoscute cu uşurinţă în
contextul feţei umane, dar când sunt prezentate independent.

Fig.nr.14. În fine, experienţa noastră difuză cu obiectele din


Recunoaşterea elementelor mediul în care trăim îşi pune amprenta asupra modului în care
unei feţe umane; (A) în context; recunoaştem şi procesăm scenele sau situaţiile statice. În mod
(B) independent. obişnuit, obiectele dintr-o scenă nu formează o aglomerare
haotică ci sunt organizate după anumite regularităţi. Aceste
regularităţi specifică sinteza scenei respective - modul de
organizare sau combinare a obiectelor în interiorul scenei. În
acelaşi timp, scena are o semnificaţie: ea reprezintă o stradă, un
pasaj, o staţie de metrou sau un stadion etc. Regularităţile care
guvernează semnificaţiile scenelor formează semantica scenei.
Biederman şi colab. (1982) susţin că regularităţile sintactice şi semantice sunt în număr limitat.
Ele sunt dobândite de individ în decursul ontogenezei pe baza unei învăţări implicite,
neintenţionate şi acţionează ca nişte constrângeri în identificarea scenelor. Toate au o formulare
probabilistică, fiind generalizări difuze ale experienţei cotidiene proprii.

 Principalele regularităţi vizează:


a) suportul fizic al obiectelor; de regulă, obiectele din univers au un suport, sunt
aşezate pe ceva; zborul lor, atunci când există, e o situaţie vremelnică. Un obiect e
recunoscut mai rapid dacă e aşezat pe un suport, decât dacă e suspendat.
b) interpoziţia (ocluzarea reciprocă); majoritatea obiectelor sunt opace, astfel încât
un obiect ocluzează parţial sau total obiectele situate în spatele său (din punct de vedere
al observatorului). Recunoaşterea unui obiect este îngreunată dacă el nu ocluzează
obiectele din spatele său.
c) probabilitatea ocurenţei; de regulă obiectele apar cu o probabilitate mai mare
într-un anumit context. Recunoaştem mai rapid un obiect dacă e prezentat în contextul
său specific decât într-un mediu nespecific.

d) poziţia obiectelor; chiar dacă apar într-un context, de regulă obiectele au o


anumită poziţie, obişnuită. Obiectele prezentate în poziţii neuzuale, inedite, sunt mai greu
de recunoscut.
e) mărimea relativă a obiectelor; de regulă, orice obiect are o anumită mărime cu
care suntem obişnuiţi sau familiarizaţi. Aşadar, dacă aceste generalizări difuze ale
experienţei noastre cotidiene organizate ca nişte "cunoştinţe tacite" sunt încălcate,
recunoaşterea obiectelor este îngreunată. De pildă, avem dificultăţi în a recunoaşte un
fotoliu zburător (încălcarea constrângerii suportului), a unui capac transparent (încălcarea
interpoziţiei). De asemenea, recunoaştem cu dificultate o vacă lângă pian (probabilitatea
ocurenţei), pe profesorul de psihologie mergând în mâini prin universitate (poziţia), sau un
şoarece de mărimea unui elefant (mărimea).

Violarea cunoştinţelor tacite nu duce numai la sporirea timpului de reacţie necesar pentru
recunoaşterea scenelor ci adesea provoacă surpriză şi efecte comice. Să ne închipuim, de pildă,
un şoarece cât un motan căutând să se ascundă de un motan cât un şoricel, sau că cel mai
sever profesor pe care-l cunoaştem a devenit transparent, umblă în mâini prin mijloacele de
transport în comun după care, brusc, se ridică la cer.

Sumar

Informaţia vizuală este prelucrată în două stadii. În prima fază (= prelucrarea primară),
caracteristicile fizice ale stimulului sunt procesate în paralel, de mai multe mecanisme modulare.
Din schiţa primară sunt extrase contururile, textura, deplasarea, poziţia, forma, adâncimea şi
culoarea. Outputul lor este o imagine intermediară a stimului, dependentă de punctul de vedere
al subiectului (= schiţa 21/2D). Caracteristicile nonaccidentale ale schiţei inermediare şi gruparea
după principii gestaltiste a stimulilor iniţiază a doua etapă a procesărilor vizuale. Ea are ca
rezultat recunoaşterea obiectului pe baza construirii imaginii sale integrale, 3D. Diversitatea
stimulilor complecşi este redusă prin descompunerea lor în geoni. Geonii rezultă din
segmentarea (automată) a obiectelor în zonele de maximă concavitate locală. Orice obiect poate

S-ar putea să vă placă și