Sunteți pe pagina 1din 15

PROCESAREA VIZUALĂ ŞI

RECUNOAŞTEREA PATTERNURILOR

Unul din primele domenii care au beneficiat de pe urma revoluţiei


cognitive a fost cel al procesării vizuale şi recunoaşterii pattern-urilor, studiul
modului în care oamenii percep şi recunosc obiecte. Abordarea cognitivă a
furnizat o perspectivă generală cu două stadii a recunoaşterii obiectelor:
a) descrierea obiectului input în termeni ai unor trăsături relativ primitive
(de ex., „are două linii diagonale şi o linie orizontală care le conectează”); şi
b) potrivirea acestei descrieri a obiectului cu descrieri stocate ale obiectului în
memoria vizuală şi selectarea celei mai bune potriviri ca identitatea
obiectului input („această descriere se potriveşte cel mai bine literei A”).
Această perspectivă cu două stadii nu era complet nouă în psihologie, dar
exprimarea ei în termeni ai procesării informaţiei permitea conectarea
studiilor empirice ale percepţiei obiectului cu modele computerizate ale
procesului. Psihologul Ulrich Neisser (1964) a folosit un model pe calculator al
recunoaşteri pattern-urilor (Selfridge, 1959) pentru a-şi orienta studiile sale
empirice şi a oferi dovezi dramatice că un obiect poate fi potrivit cu
reprezentări mnezice vizuale multiple în paralel.

Alţi cercetători au indicat că procesarea subiacentă percepţiei obiectului ar


putea persista după ce stimulul a fost îndepărtat. Pentru a se întâmpla acest
fapt, trebuia să existe o memorie vizuală a stimulului. Dovezi pentru o astfel
de memorie „iconică” au fost furnizate de Sperling în experimente clasice
din anii 1960. Dovezi pentru o memorie auditivă de scurtă durată
asemănătoare au fost curând oferite de asemenea (de ex., Crowder şi
Morton, 1969). Mare parte a lucrărilor asupra recunoaşterii obiectelor şi
memoriilor senzoriale au fost integrate în lucrarea influentă a lui Neisser din
1967, Cognitive Psychology (Neisser, 1967). Cartea a servit ca prima afirmare
comprehensivă a cercetărilor existente în psihologia cognitivă şi a dat noului
domeniu numele său.

Elemente de neurobiologia procesării vizuale


În mod obişnuit, cea mai mare parte a informaţiilor despre mediul în care
trăim este obţinută prin intermediul văzului. Circa jumătate din suprafaţa
neocortexului este implicată în procesarea informaţiei vizuale. Analizatorul
vizual este relativ bine cunoscut din punctul de vedere al procesări informatiei.
Sistemul vizual uman receptează şi procesează unde elecotromagnetice cu
lungimi de undă între 440-810 nm, adică spectrul dintre ultraviolete şi
infraroşii. Principala proprietate a acestor unde este aceea de a fi vizibile.Un
fenomen fizic este vizibil dacă provoacă activitate fotochimică la nivelul
receptorilor care determină formarea unor potenţiale de acţiune, transportate
şi prelucrate de sistemul nervos vizual.

Razele luminoase traversează corneea, camera anterioară, pupila,


cristalinul şi umoarea apoasă înainte de a ajunge să formeze o imagine pe
retină. Aria cea mai sensibilă a retinei se numeştef ovee. Retina conţine două
tipuri de receptori: conuri şi bastonaşe. Conurile, circa 6 milioane, sunt
plasate în
centrul retinei şi au o mare sensibilitate pentru culori şi acuitatea
detaliilor.Bastonaşele, circa 120 de milioane, se află în zona periferică a
retinei, sunt
specializate în detectarea luminii de slabă intensitate şi nu au acuitate pentru
detalii şi culoare. Ambele tipuri de receptori conţin pigmenţi sensibili la
lumină care se descompun sub acţiunea fotonilor, creând potenţiale de
acţiune în celulele nervoase şi variaţii ale frecvenţei de descărcare a
acestora. Receptorii sunt conectaţi pe verticală de celulele bipolare, celulele
ganglionare şi nervii optici (Figura 3). Între celulele nervoase există conexiuni
pe orizontală, asigurate de celulele amacrine şi celulele orizontale. Distribuţia
receptorilor la celulele ganglionare este diferenţiată: dacă fiecare con din
zona foveală este conectat la un ganglion, cu cât ne depărtăm spre periferia
retinei, cu atât numărul de receptori (bastonaşe) conectaţi la o celulă
nervoasă creşte, ajungând să fie de ordinul sutelor.

Câmp receptor; celule on-off şi off-on


Fiecărei celule ganglionare din structura retinei îi revine un număr mare
de receptori (în medie, circa 130 : 1). În consecinţă, aceasta va reacţiona la
stimularea unei arii care include mai mulţi receptori. Suprafaţa de pe retină
care modifică funcţionarea celulei nervoase se numeşte câmpul receptor al
celulei respective.
Au fost detectate două tipuri de celule: celuleon- off şi celuleof f- on.
Ambele au câmpuri receptoare circulare şi concentrice, dar polaritatea
acestor câmpuri este diferită. Celulele on-off au un câmp receptor cu o
polaritate pozitivă în centru şi negativă spre periferie şi se activează pentru
spoturi luminoase. Celulele off-on au o funcţie complementară celulelor on-off.
Activitatea lor este maximă dacă în zona centrală a câmpului receptor este
expus un punct negru, mărginit sau circumscris de fascicule luminoase.
.Celulele cu câmp receptor on-off şi off-on sunt caracteristice ganglionilor
vizuali şi celulelor nervoase din corpii geniculaţi laterali implicaţi în
procesarea informaţiei vizuale. Dacă prelucrarea stimulilor luminoşi s-ar
rezuma doar la activitatea celulelor on-off şi off-on, am surprinde doar spoturi
şi puncte. Neuronii din cortexul vizual realizează procesări mult mai
complexe.
Prin cercetările îndelungate ale laureaţilor Nobel D. Hubel şi T. Wiesel, au fost
identificaţi neuronii din cortexul vizual care îşi modificau activitatea la
prezentarea unor stimuli vizuali foarte simpli: benzi luminoase albe sau
întunecate, linii albe sau negre, unghiuri etc. Aceştia au fost denumiţi
detectori de trăsături( e ng l. features detectors). În funcţie de complexitatea
caracteristicilor fizice la care reacţionau, au fost identificate trei tipuri de
astfel de celule nervoase: simple, complexe şi hipercomplexe.
1. Celulele simple detectează contururi, fante luminoase sau linii.
Specializarea lor este atât de pregnantă, încât reacţionează numai la o
anumită orientare şi localizare a caracteristicilor respective. Frecvenţa
potenţialelor de acţiune este maximă dacă stimulul corespunde exact
trăsăturii la care reacţionează detectorul respectiv. O celulă simplă
însumează activitatea mai multor celule on-off şi/sau off-on din nucleii
geniculaţi laterali.
2. Celulele complexe, localizate în ariile striate şi parastriate ale cortexului
vizual, prelucrează informaţia vizuală cu un nivel mai ridicat de generalitate.
Celulele complexe reacţionează la aceleaşi tipuri de stimuli- trăsături ca şi
celulele simple, dar indiferent de locaţia lor în câmpul vizual, detectând
mişcarea.
3. Celulele hipercomplexe sunt actual clasificate în două tipuri: cele
funcţional identice cu celulele complexe, care reacţionează la orice stimul
simplu dacă acesta are o anumită dimensiune şi cele care detectează
unghiuri, deci stimuli mai complecşi. Se pune întrebarea cât de complex
poate fi stimulul detectat de o astfel de celulă? Unii cercetători susţin
existenţa unor neuroni care par să detecteze stimuli complecşi, precum
triunghiuri, pătrate, palma sau chiar expresia facială la maimuţe. Totuşi, este
improbabil ca stimuli mult mai complecşi să fie detectaţi de neuroni specifici,
cu o locaţie dată, şi numai de aceştia.

Cortexul vizual este sediul unor celule (simple, complexe şi


hipercomplexe)care detectează stimuli de complexitate tot mai ridicată. Din
punct de vedere funcţional, aceste celule au fost numite detectori de
trăsături. Dincolo de proprietăţile lor specifice, neuronii detectori de trăsături
au câteva note comune: manifestă o reactivitate maximă la un anumit tip de
stimul- trăsături, dar răspund, în măsură mai redusă, şi la stimuli similari;
sunt fatigabili, sensibilitatea lor scăzând în condiţiile expunerii repetate la
acelaşi stimul; formează structuri de reţea în cadrul cărora funcţionează
mecanismul inhibiţiei laterale.

3. Niveluri ale procesării vizuale

Există tendinţa generală de a împărţi procesarea informaţiei vizuale la nivel


computaţional în două mari stadii: procesare primară şi procesare secundară.
Procesarea primară cuprinde prelucrările preatenţionale, cu o durată de
aproximativ 200 de milisecunde, care au ca rezultat reprezentarea, în
sistemul cognitiv, a caracteristicilor fizice ale stimulului. Ele realizează
separarea stimulului de fond, ne arată unde anume este acesta, nu ce anume
este. Sunt incluse aici mecanismele de detectare a contururilor, a texturii,
mişcării, culorii şi a dispunerii spaţiale.
Procesarea secundară vizează mecanismele implicate în recunoaşterea figurii
şi obiectelor. Ele au ca input rezultatele procesărilor primare şi ca output –
imaginea tridimesională a unui obiect în mediu, identificat, recunoscut.
Această dihotomie a prelucrării stimulilor vizuali nu este riguroasă, dar este
utilă şi este larg răspândită în literatura de specialitate.
Intensitatea stimulilor luminoşi face obiectul unor prelucrări iniţiale care
conturează o schiţă primară a obiectuluiper cep ut. Asupra acestei schiţe
primare se exercită o mulţime de tratamente sau prelucrări de stabilire a
adâncimii în spaţiu prin calculul disparităţii binoculare, de reprezentare a
mişcării, texturii, culorii şi orientării în spaţiu a suprafeţelor unui obiect. Toate
aceste procesări sunt executate în paralel de mecanisme modulare.
Rezultatul lor constă în alcătuirea unei reprezentări intermediare a obiectului
din câmpul vizual, notată cu 2½D tocmai pentru a arăta caracterul ei
intermediar între imaginea retiniană bidimensională şi obiectul
tridimensional. Această imagine intermediară serveşte ca input pentru alte
procesări al căror produs final este reprezentarea completă, tridimensională a
obiectului, notată cu 3D.

Procesarea vizuală primară

Toate prelucrările primare posedă câteva caracteristici comune care le


individualizează faţă de procesările secundare sau alte tipuri de prelucrări
mentale.

1) Procesările primare sunt organizate pe module, care funcţionează


simultan, în paralel. Organizarea modulară implică caracterul irepresibil,
preatenţional şi impermeabilitatea cognitivă a acestor procese.
2) Aceste procese sunt independente de natura stimulului.
3) Buna desfăşurare a acestor prelucrări presupune o mulţime de asumpţii
apriorice despre realitatea obiectuală, adică regularităţi statistice ale
mediului în care trăim. Ele sunt necesare pentru a specifica stimulul vizual
supus prelucrării. Nu se ştie dacă aceste asumpţii care dezambiguează
stimulul sunt înnăscute sau dobândite. În orice caz, ele nu sunt rezultatul
unor deducţii iar majoritatea studiilor probează existenţa lor încă de la o
vârstă foarte timpurie (asumpţia rigidităţii este deja prezentă la vârsta de
cinci luni, iar percepţia adâncimii în spaţiu pe baza disparităţii binoculare este
operantă la copilul de 2-3 luni). Aceste asumpţii sunt nespecifice, aplicându-
se irepresibil, automat, la orice obiect. Ele preced recunoaşterea obiectelor ca
obiecte distincte.
Schiţa primară şi detectarea contururilor (edge detection). Una din cele mai
importante operaţii care trebuie să aibă loc pentru ca organismul să se
adapteze constă în diferenţierea figurii de fond, a obiectului de mediul
(fundalul) său, a obiectelor sau figurilor unele de altele. Această segregare se
poate realiza prin mai multe mecanisme: stabilirea contururilor, detectarea
texturii, a diferenţelor de colorit sau de viteză de deplasare etc.
Extragerea contururilor (edge detection) din patternurile de luminozitate pe
care obiectele le transmit retinei este modulul principal implicat în
constituirea schiţei primare. Un contur marchează limita unei suprafeţe, a
unei figuri sau a unui obiect. Contururile surprind multe dintre caracteristicile
invariante ale stimulului (proporţii ale părţilor componente, dispunere
spaţială a acestora) şi permit o procesare economică a informaţiei despre
stimul, deoarece reduc detaliile la esenţial.
Stabilirea contururilor se bazează pe procesarea diferenţelor de luminozitate.
Mai mult, variaţia intensităţii stimulilor luminoşi este accentuată la nivel
neurofiziologic şi subiectiv pentru a permite o mai uşoară segregare afigur i i
de fond. Cercetările neurofiziologice de până acum nu oferă date cu privire la
modalitatea concretă de prelucrare a diferenţelor de luminozitate pentru
detectarea contururilor.
Cele mai cunoscute modele formale care încearcă să expliciteze aceste
procesări sunt filtrajul (stabilirea contururilor pe baza filtrajului [calcul
diferenţial] intensităţii pixelilor) şi analiza Fourier (reprezentarea stimulului
vizual s-ar face pe baza analizei şi sintezei armonicelor sale)
Calculul adancimii. Deşi pe retină apar numai imagini bidimensionale,
totuşi percepem lumea în 3D. Unul din mecanismele cele mai
importante de detecţie a distanţelor şi adâncimii are la bază fenomenul
numitster eopsis, care se referă la faptul că cei doi ochi au unghiuri
diferite de recepţie a stimulilor vizuali, apărând o disparitate retinală.
Plecând de la această disparitate se poate calcula distanţa unui obiect
faţă de observator, deci şi adâncimea în spaţiu.
Deplasarea obiectelor în spaţiu şi deplasarea noastră faţă de ele sunt
alte surse de informaţii asupra adâncimii sau distanţei. De asemenea,
Gibson (1950, 1966) a arătat că informaţiile pot fi conţinute de
gradientul unei texturi, adică micşorarea sistematică a dimensiunilor
elementelor texturii şi distanţei dintre acestea.

Procesarea mişcării.Percepţia deplasării unui obiect joacă un rol


esenţial pentru supravieţuirea organismelor în medii dinamice. Multe
date experimentale susţin teza procesării deplasării în spaţiu a unui
obiect de către un modul independent. Se pare că aceste procesări
sunt chiar mai rapide decât cele care sunt implicate în recunoaşterea
formei şi/sau semnificaţiei sale. De exemplu, tendinţa generală a
subiectului uman de a-şi feri capul din calea obiectelor aflate în mişcare a
fost evidenţiază din primele săptămâni de viaţă (Regan et al., 1986).
Celulele nervoase implicate în detectarea mişcării sunt specifice în
funcţie de direcţia acestei mişcări; acelaşi obiect, deplasat în direcţii
diferite, este procesat de
celule nervoase diferite.
Extragerea formei din prelucrarea umbrelor. Mărimea, forma sau
dispunerea umbrei unui obiect constituie elemente importate din
prelucrarea
cărora se pot obţine informaţii despre forma şi poziţia obiectului într-un
anumit context. Şi aceste procesări constituie un modul independent.
Se consideră că cunoştinţele tacite ale subiectului joacă un rol
important în
prelucrarea umbrelor.
Procesarea texturii; textonii. Textura unei suprafeţe este alcătuită
dintr-o combinaţie de elemente. Elementele primitive,
nedecompozabile care sunt specifice unei texturi se numesctextoni
(Jules, 1981). Una din funcţiile lor este aceea de a segrega figura de
fond sau obiectul de mediu acolo unde diferenţele de luminozitate nu
sunt suficiente pentru extragerea contururilor.
Detectarea textonilor se poate face fie automat, preatenţional, sau prin
antrenarea atenţiei vizuale. Procesarea vizuală primară se referă doar la
primul caz.
Detectarea culorii. Detectarea culorii poate constitui o finalitate în sine dar
poate servi şi la segregarea mai rapidă a figurii de fond. Culoarea este
obţinută prin mecanisme exclusiv chimice.
Sistemul vizual realizează o reconstrucţie a stimulului prezentat
pornind de la proiecţia sa pe retină. Percepţia obiectelor nu se face
instantaneu,
nemijlocit, ci prin medierea unor mecanisme de tip modular, care au ca
input proiecţia retinală, iar ca output schiţa 2½D . Astfel, la sfârşitul unei
faze de procesare care durează mai puţin de 200 ms, subiectul
surprinde contururile, adâncimea, deplasarea, forma şi culoarea
obiectelor. Pe baza acestor procese se realizează segregarea figurii de
fond sau a obiectelor de mediul în care se află. Schiţa 2½D este o
reprezentare intermediară a stimulului, care încă nu a fost recunoscut. Ea
este „centrată pe subiect”, adică depinde de alinierea ochi-stimul –
privit din unghiuri diferite, un obiect îşi relevă contururi diferite.

Procesarea vizuală secundară

Rostul prelucrărilor secundare este ca dintr-o schiţă intermediară 2½D


luată ca input să producă, pe baza unor prelucrări variate, schiţa 3D,
adică recunoaşterea obiectului. Prelucrările secundare realizează
descentrarea reprezentărilor intermediare ale obiectului.
Recunoaşterea ar putea fi definită ca punere în corespondenţă a
imaginii perceptive a obiectului cu
reprezentarea sa în memorie.

Recunoaşterea obiectelor este atât flexibilă cât şi rapidă. Este plauzibil


ca reprezentarea stocată în memorie, simbolică sau neurală, să
reprezinte obiectul indiferent de unghiul sau perspectiva din care este
văzut. Acest fapt este facilitat de existenţa unor detalii spaţiale
constante sau proprietăţi
neaccidentale (Lowe, 1984), cum ar fi paralelismul sau simetria. Acest
fapt
ar explica flexibilitatea recunoaşterii. Un obiect simplu poate fi
identificat după o expunere de numai 100 ms, iar după alte 800 ms
acesta poate fi chiar numit. De asemenea este avansată prezenţa unor
mecanisme de organizare a stimulilor complecşi în unităţi mai simple,
reducând diversitatea pe baza
unor mecanisme de grupare a elementelor unei figuri. Acest fapt ar
explica rapiditatea recunoaşterii.
Principiile gestaltiste. Întrucât primii care au studiat principiile de
grupare ale elementelor unei figuri au fost psihologii şcolii gestaltiste,
acestea le poartă numele. Numărul total al acestor principii nu este cu
exactitate cunoscut, dar pentru obiectele sau figurile statice, mai
cunoscute sunt următoarele: principiul proximităţii, care afirmă că
elementele aflate în proximitate spaţială sunt grupate într-o singură
unitate perceptivă;principiul similarităţii, care afirmă că elementele
similare sunt grupate în aceeaşi
unitate perceptivă, care este contrapusă altora; principiul bunei-
continuări, care afirmă că la intersecţia a două contururi, ele sunt
percepute după continuarea cea mai simplă; şi principiul închiderii,
potrivit căruia conturul ocluzat al unei figuri este închis după
configuraţia sa vizibilă. Versiunea generalizată a acestor principii
poartă numele de legea lui Prägranz, postulând că stimulii vizuali sunt
în aşa fel grupaţi încât să rezulte configuraţia cea mai simplă.
Se pune problema dacă aceste mecanisme de grupare a stimulilor
vizuali sunt înnăscute sau nu. Prezenţa lor poate fi constatată încă din
primele luni de viaţă (Spelke, 1990). Chiar dacă nu sunt integral
determinate genetic, cu siguranţă există o predispoziţie
(preparedness) a sistemului nervos în această direcţie.

.
Modele ale recunoaşterii obiectelor. Identificarea caracteristicilor
nonaccidentale ale obiectelor care sunt prezentate în schiţa 2½D şi
organizarea gestaltistă a stimulilor vizuali nu sunt suficiente pentru a
explica procesul de recunoaştere. Modelele computaţionale încearcă să
ofere o soluţie plauzibilă cu privire la care sunt prelucrările ulterioare
care se finalizează în recunoaştere.
Un model computaţional interesant al recunoaşterii obiectelor este
modelul RBC (recognition-by-components), al lui Biederman (1987,
1988, 1990).
Acesta porneşte de la tendinţa naturală a subiectului de a segmenta
obiectele complexe în părţile lor componente. De exemplu, un om este
alcătuit din cap, corp, braţe, picioare etc. Părţile în care sunt
descompuse obiectele pot fi considerate ca nişte volume primitivesau
geoni (de la geometrical icons). Astfel, un obiect complex poate fi
specificat prin geonii componenţi şi modul de dispunere a lor. Aceiaşi
geoni, aflaţi în relaţii diferite, reprezintă obiecte diferite. Modelul
susţine că întreaga diversitate obiectuală ar putea fi redusă la 24 de
geoni şi la combinaţiile dintre aceştia. Segmentarea obiectelor în
părţile componente – generând astfel geonii respectivi – se face în
zonele de concavitate. Toţi geonii pot fi descrişi matematic printr-o
teorie generalizată a conurilor.

Totuşi, trebuie reţinut că, pe măsură ce obiectele devin mai complexe,


unitatea de bază a recunoaşterii devine combinaţia de trăsături fizice,
nu trăsătura în sine. Am putea spune că modelul RBC nu exclude
analiza de trăsături fizice, ci o include, ca pe un caz particular.
Procesări descendente în recunoaştere.Recunoaşterea este locul de
întâlnire al procesărilor ascendente cu cele descendente, al
prelucrărilor
ghidate de datele fizice ale stimulului (data driven) cu cele marcate de
cunoştinţele subiectului (knowledge driven).
Un proces mental condus de date [engl.data- d riven] este unul care se
bazează aproape exclusiv pe „date”, adică pe informaţia-stimul
prezentă în mediu. În timp ce proceseledata- driv en sunt asistate
foarte puţin de informaţia deja cunoscută, procesele conduse de
concepte [engl.
conceptually driven] sunt cele care se bazează puternic pe astfel de
informaţii. Astfel, un proces condus de concepte foloseşte informaţia
deja
prezentă în memorie şi orice expectaţiicar e sunt prezente în situaţie
pentru a executa sarcina; proceseledat a- dri ven folosesc numai
informaţia stimul.
Distincţia dintre proceseledata- driven şi conceptually driven a fost
studiată intens, printre altele, în aria recunoaşterii pattern-urilor. De
exemplu,
modelele percepţiei încearcă să explice, în mare parte, cum sunt
recunoscute pattern-urile. Modelele timpurii asumau că acest proces
era, în primul rând, data-driven. Totuşi, rezultatele unor cercetări mai
recente sugerează că recunoaşterea pattern-urilor este de asemenea
influenţată de procese conceptuale descendente (top-down).
Analiza descendentă influenţează recunoaşterea. Pe de altă parte,
violarea unor constrângeri impuse de cunoştinţele noastre tacite
despre realitate blochează sau încetineşte recunoaşterea.
Sintetizând rezultatele experimentale, putem vorbi despre procesări
descendente în cazul recunoaşterii stimulilor verbali, în cazul
recunoaşterii obiectelor şi în cazul recunoaşterii scenelor şi feţelor
umane.
1. Procesări descendente în cazul recunoaşterii stimulilor verbali.
Experimentele au condus la concluzia potrivit căreia cunoştinţele
lexicale funcţionează ca nişte constrângeri ale recunoaşterii unei
configuraţii ambigue, putând conduce la decodări diferite.
Recunoaşterea mai rapidă a unei litere dacă este prezentată în
contextul unui cuvânt a fost demonstrată experimental în repetate
rânduri. Acest efect a fost denumit „efectul superiorităţii cuvântului”
(word superiority effect, Reicher, 1969). Devine evident faptul că, în
recunoaştere, prelucrarea ascendentă este dublată de cea
descendentă. Acest lucru nu are loc în cazul procesării primare a
informaţiei vizuale, deoarece aceasta este efectuată de module
cognitiv impenetrabile.
2. Procesări descendente în cazul recunoaşterii obiectelor. Ca şi în
cazul recunoaşterii stimulilor verbali, prin analogie cu efectul
superiorităţii cuvântului, studiile lui Weinstein şi Harris (1974) au
demonstrat efectul superiorităţii obiectului (object superiority effect):
o trăsătură sau o
caracteristică fizică a unui obiect este mai uşor de recunoscut dacă ea
este plasată în contextul reprezentării unui obiect, decât dacă este
prezentată independent sau ca element al unui obiect imposibil.

Procesări descendente în cazul recunoaşterii scenelor şi feţelor


umane.
Cunoştinţele de care dispunem, prin iniţierea unor procesări
descendente, sunt responsabile şi de recunoaşterea mai rapidă a
elementelor unor feţe umane în contextul feţelor respective decât dacă
acestea sunt prezentate independent (Palmer, 1975). Elementele feţei
aveau nevoie de o reprezentare mult mai detaliată pentru a putea
permite recunoaşterea lor în afara contextului. De asemenea,
experienţa noastră cu obiectele din mediul în care trăim îşi pune
amprenta asupra modului în care recunoaştem şi procesăm scenele
sau situaţiile statice. În mod obişnuit, obiectele dintr-o scenă nu
formează o aglomerare haotică, ci sunt organizate după anumite
regularităţi (sintactica scenei). În acelaşi timp, scena are o anumită
semnificaţie (o stradă, un birou etc.; semantica scenei). Regularităţile
sintactice şi semantice sunt în număr limitat şi sunt dobândite de
individ în cursul ontogenezei pe baza unei învăţări implicite, acţionând
ca nişte constrângeri în identificarea scenelor. Principalele regularităţi
vizează suportul fizic al obiectelor, interpoziţia (ocluzarea obiectelor),
probabilitatea ocurenţei, poziţia obiectelor, marimea relativa a obiectelor.

Modelarea neoconexionistă a recunoaşterii. Recunoaşterea patternurilor


figurale sau obiectuale este domeniul în care modelele neuronale au
avut cel mai mare succes. De altfel, în acest domeniu s-au obţinut de
la început primele rezultate,percept ronul lui Rosenblatt încercând
tocmai modelarea recunoaşterii într-o reţea binivelară. Ulterior, în
1981, McClelland şi Rumelrhart reuşesc primul model de recunoaştere
a grafemelor.

Actualmente, asistăm la o diversificare exponenţială a modelării


neoconexioniste a recunoaşterii. Reţinem că reţelele neuronale pot
modela cu succes cel puţin o parte din procesările implicate în
recunoaşterea stimulului. Ele pot asigura interfaţa dintre modelele
computaţionale şi datele
neurobiologice, fiind compatibile cu ambele categorii de rezultate.
Rezultatele din acest domeniul au importante aplicaţii tehnologice.
De reţinut:
 În mod obişnuit, cea mai mare parte a informaţiilor despre mediul în
care trăim este obţinută prin intermediul văzului. Circa jumătate din
suprafaţa neocortexului este implicată în procesarea informaţiei
vizuale.

Există tendinţa generală de a împărţi procesarea informaţiei vizuale la


nivel computaţional în două mari stadii: procesare primară şi
procesare secundară.

 Procesarea primară cuprinde prelucrările preatenţionale care au ca


rezultat reprezentarea, în sistemul cognitiv, a caracteristicilor fizice
ale stimulului. Ele realizează separarea stimulului de fond, ne arată
unde anume este acesta, nu ce anume este. Sunt incluse aici
mecanismele de detectare a contururilor, a texturii, mişcării, culorii şi a
dispunerii spaţiale.

 Procesarea secundară vizează mecanismele implicate în


recunoaşterea figurii şi obiectelor. Ele au ca input rezultatele
procesărilor primare şi ca output– imaginea tridimesională a unui
obiect în mediu, identificat, recunoscut.

BIBLIOGRAFIE
1. Anderson, J. R. (1983). The architecture of cognition. Cambridge,
MA: Harvard University

Press.
2. Anderson, J. R. (1993). Rules of the mind. Hillsdale, NJ: Erlbaum.
3. Anderson, J. R. (2000). Cognitive psychology and its implications
(5th ed.). New York: Worth.
4. Barsalou, L. W. (1983). Ad hoc categories. Memory & Cognition, 11,
211-227.
5. Bartlett, F. C. (1932). Remembering. Cambridge: Cambridge
University Press.
6. Bechtel, W., & Abrahamsen, A. A. (2002). Connectionism and the
mind: Parallel processing,
dynamics, and evolution in networks (2nd ed.). Oxford: Basil Blackwell.
7. Block, N. (1978). Troubles with functionalism. In C. W. Savage (Ed.),
Perception and
cognition. Minneapolis: University of Minnesota Press.
8. Bruner, J. (1990). Acts of meaning. Cambridge, MA: Harvard
University Press.
9. Bruner, J. S., Goodnow, J. J., & Austin, G. A. (1956). A study of
thinking. New York: Wiley.
10. Chalmers, D. J. (1996). The conscious mind. Oxford: Oxford
University Press.
11. Cheng, P. W., & Holyoak, K. J. (1985). Pragmatic reasoning
schemas. In Cognitive
Psychology.

12. Chi, M. (1992). Conceptual change within and across ontological


categories: Examples from learning and discovery in science. In R.
Giere (Ed.), Cognitive Models of Science, Minnesota Studies in the
Philosophy of Science (Vol. 15, pp. 129-186). Minneapolis: University of
Minnesota Press.

13. Chomksy, N. (1959). Review of B. F. Skinner, Verbal Behavior.


Language, 35, 26-58.
14. Chomsky, N. (1957). Syntactic structures. The Hague: Mouton.
15. Churchland, P. M. (1989). A neurocomputational perspective.
Cambridge, MA: MIT Press.
16. Clark, A. (1997). Being there: Putting brain, body, and world
together again. Cambridge, MA:
MIT Press.
17. Damasio, A. R. (1994). Descartes' error. New York: G. P. Putnam's
Sons.
18. Dehaene, S., Spelke, E., Pinel, P., Stanescu, R., & Tsivkin, S. (1999).
Sources of mathematical

thinking: Behavioral and brain-imaging evidence. Science, 284, 970-


974. 19.Delacour J. (2001) Introducere în neuroştiinţele cognitive.
Polirom, Iaşi. 20. Dennett, D. (1991). Consciousness explained. Boston:
Little, Brown.
21. Feldman, J. A. (1981). A connectionist model of visual memory. In
G. E. Hinton & J. A.

Anderson (Eds.), Parallel models of associative memory (pp. 49-81).


Hillsdale, NJ: Erlbaum.
22. Finke, R. (1989). Principles of mental imagery. Cambridge, MA: MIT
Press.
23. Fodor, J. (1975). The language of thought. New York: Crowell.
24. Frege, G. (1960). Translations from the philosophical writings of
Gottlob Frege. Oxford: Basil
Blackwell.
25. French, R. M. (2002). The computational modeling of analogy-
making. Trends in Cognitive - Sciences, 2000-2005
26. Gardner, H. (1985). The mind's new science. New York: Basic Books.
27. Gibson, J. J. (1979). The ecological approach to visual perception. Boston:
Houghton-Mifflin.
28. Gick, M. L., & Holyoak, K. J. (1980). Analogical problem solving. Cognitive
Psychology, 12,
306-355.
29. Gigerenzer, G. (2000). Adaptive thinking: Rationality in the real world. New
York: Oxford
University Press.
30. Glucksberg, S., & Keysar, B. (1990). Understanding metaphorical
comparisons: Beyond

similarity. Psychological Review, 97, 3-18.


31. Hebb, D. O. (1949). The organization of behavior. New York: Wiley.
32. Hempel, C. G. (1965). Aspects of scientific explanation. New York: The Free
Press.
33. Hinton, G. E., & Anderson, J. (Eds.). (1981). Parallel models of associative
memory. Hillsdale,
NJ: Erlbaum.
34. Hofstadter, D. (1995). Fluid concepts and creative analogies: Computer
models of the
fundamental mechanisms of thought. New York: Basic Books.
35. Johnson-Laird, P. N. (1983). Mental models. Cambridge, MA: Harvard
University Press.
36. Kahneman, D., Slovic, P., & Tversky, A. (1982). Judgment under uncertainty:
Heuristics and
biases. New York: Cambridge University Press.
37. Kintsch, W. (1988). The role of knowledge in discourse comprehension: A
construction-
integration model. Psychological Review, 95, 163-182.
38. Kosslyn, S. M. (1980). Image and mind. Cambridge: Harvard University
Press.

39.Lakoff, G. (1994). What is metaphor? In J. A. Barnden & K. J. Holyoak (Eds.),


 Advances in connectionist and neural computation theory, Vol. 3: Analogy,
metaphor, and reminding (Vol. 3, pp. 203-257). Norwood, NJ: Ablex.
40. Lave, J., & Wenger, E. (1991). Situated learning: Legitimate peripheral
participation.

Cambridge: Cambridge University Press.


41. LeDoux, J. (2002). The synaptic self. New York: Viking.
42. Marr, D. (1982). Vision. San Francisco: Freeman.
43. Marr, D., & Poggio, T. (1976). Cooperative computation of stereo disparity.
Science, 194, 283-
287.
44. McClelland, J. L., & Rumelhart, D. E. (1989). Explorations in parallel
distributed processing.
Cambridge, MA: MIT Press.
45.Miclea M. (1999) Psihologie cognitivă. Polirom, Iaşi.
46. Miller, G. A. (1956). The magical number seven, plus or minus two:
Some limits on our
capacity for processing information. Psychological Review, 63, 81-97.
47. Miller, G. A. (1991). The science of words. New York: Scientific
American Library.
48. Minsky, M. (1975). A framework for representing knowledge. In P.
H. Winston (Ed.), The
psychology of computer vision (pp. 211-277). New York: McGraw-Hill.
49. Newell, A. (1990). Unified theories of cognition. Cambridge, MA:
Harvard University Press.
50. Newell, A., & Simon, H. A. (1972). Human problem solving.
Englewood Cliffs, NJ: Prentice Hall

77
51. Newell, A., Shaw, J. C., & Simon, H. (1958). Elements of a theory of human
problem solving.

Psychological Review, 65, 151-166.


52. Nisbett, R. E. (Ed.). (1993). Rules for reasoning. Hillsdale, NJ: Erlbaum.
53. Norman, D. A. (1989). The design of everyday things. New York: Doubleday.
54. Norman, D. A. (2003). Emotional design: Why we love (or hate) everyday
things. New York:
Basic Books.
55. O'Reilly, R. C., & Munakata, Y. (2000). Computational explorations in
cognitive neuroscience.
Cambridge, MA: MIT Press.
56. Paivio, A. (1971). Imagery and verbal processes. New York: Holt, Rinehart,
and Winston.
57. Piaget, J., & Inhelder, B. (1969). The psychology of the child (H. Weaver,
Trans.). New York:
Basic Books.
58. Pinker, S. (1999). Words and rules: The ingredients of language. New York:
HarperCollins.
59. Posner, M. I., & Keele, S. W. (1970). Retention of abstract ideas. Journal of
Experimental

Psychology, 83, 304-308.


60. Posner, M. I., & Raichle, M. E. (1994). Images of mind. New York: Freeman.
61. Putnam, H. (1975). Mind, language, and reality. Cambridge: Cambridge
University Press.
62. Pylyshyn, Z. (1984). Computation and cognition: Toward a foundation for
cognitive science.
Cambridge, MA: MIT Press.
63. Pylyshyn, Z. (2002). Mental imagery: In search of a theory. Behavioral and
Brain Sciences, 25,
157-237.
64. Resnick, L., Levine, J., & Behrend, S. (Eds.). (1991). Socially shared
cognitions. Hillsdale, NJ:
Erlbaum.
65. Rumelhart, D. E., & McClelland, J. L. (Eds.). (1986). Parallel distributed
processing:
Explorations in the microstructure of cognition. Cambridge MA: MIT
Press/Bradford Books.
66. Russell, S., & Norvig, P. (2003). Artificial intelligence: A modern approach
(second ed.).

Upper Saddle River, NJ: Prentice Hall.


67. Salomon, G. (Ed.). (1993). Distributed cognitions. Cambridge: Cambridge
University Press.
68. Sternberg, R. J. (2003). Cognitive Psychology (third ed.). Belmont, CA:
Wadsowrth.
69. Thagard, P. (1988). Computational philosophy of science. Cambridge, MA:
MIT
Press/Bradford Books.
70. Tversky, A., & Kahneman, D. (1983). Extensional versus intensional
reasoning: The
conjunction fallacy in probability judgments. Psychological Review, 90, 293-315.
71. Ward, L. M. (2002). Dynamical cognitive science. Cambridge, MA: MIT
Press.
72. Winograd, T., & Flores, F. (1986). Understanding computers and cognition.
Reading, MA:

Addison-Wesley.
73. Winston, P. (1993). Artificial intelligence (3rd ed.). Reading, MA: Addison
Wesley.
74.Zlate M. (1999) Psihologia mecanismelor cognitive. Polirom, Iaşi.