Fodor Conexionism

CONEXIONISM I ARHITECTUR COGNITIV: O ANALIZ CRITIC*
Jerry A. FODOR, Zenon W. PYLYSHYN

Cognition, vol. 28, 1988
INTRODUCERE
Modelele conexioniste sau PDP [parallel distributed processing - procesri paralele distribuite] "prind" din ce n ce mai mult. Aproape n fiecare zi au loc conferine sau apar cri noi, iar publicaiile de popularizare a tiinei salut acest nou val teoretic, considerndu-l un eveniment crucial n nelegerea psihicului (un exemplu tipic l constituie articolul din Science 86, numrul din mai, intitulat How we think: A new theory). Exist, de asemenea, inevitabil, descrieri ale emergenei conexionismului ca o schimbare de paradigm n sens kuhnian. (Vezi Schneider 1987, pentru un exemplu de acest gen i pentru dovezi suplimentare ale tendinei de vedea conexionismul drept noul val al tiinei cognitive). Fan club-ul include cele mai neateptate categorii de oameni. Conexionismul ofer consolare acelor filosofi care consider c faptul de a se baza pe noiunile intenionale sau semantice pseudotiinifice ale psihologiei simului comun (precum scopuri sau credine) i induce pe psihologi n eroarea demersului computaional (de ex., P.M. Churchland, 1981; P.S. Churchland, 1986; Dennett, 1986); dar i consoleaz i pe cei din tabra opus, care consider psihologia computaional falimentar, pentru c nu i pune problema intenionalitii sau a sensului (de ex. Dreyfus & Dreyfus, in press). n tiina computerelor, conexionismul este mbriat de teoreticienii care cred c mainile seriale sunt prea slabe, trebuind s fie nlocuite de maini noi, paralele, radical diferite (Fahlman & Hinton, 1986), n timp ce n tabra biologiei este adoptat de cei care consider c nu putem nelege cogniia dect ca neurotiin (de ex., Arbib, 1975; Sejnowsky, 1981). Conexionismul este totodat atractiv i pentru psihologii care consider c o mare parte a psihicului (inclusiv acea parte implicat n imagerie) nu este de natur discret (de ex., Kosslyn & Hatfield, 1984), sau pentru cei care cred c tiina cognitiv nu a acordat suficient atenie mecanismelor stohastice sau mecanismelor holistice (de ex., Lakoff, 1986), i aa mai departe. Totodat este mbriat i de muli reprezentani tineri ai tiinelor cognitive, care vd aceast abordare nu doar anti-establishment (i deci dezirabil), dar i riguroas i matematic (vezi, totui, nota 2). Aproape oricine nu e mulumit cu psihologia cognitiv contemporan i cu modelele curente ale procesrii informaiei alearg n braele alternativei conexioniste. Atunci cnd este considerat drept modalitate de modelare a arhitecturii cognitive, conexionismul reprezint ntr-adevr un demers diferit de cel al tiinei cognitive clasice, pe care ncearc s l nlocuiasc. Modelele clasice ale psihicului au fost derivate din structura mainilor Turing sau Von Neumann. Bineneles, ele nu sunt reductibile la detaliile acestor maini, ca, de
*
Traducerea: Oana Benga, UBB, Cluj-Napoca
exemplu, n formularea original a lui Turing sau n computerele comerciale tipice; angajamentul acestor modele este doar fa de ideea de baz c modul de calcul care e relevant pentru nelegerea cogniiei implic operaii asupra simbolurilor (vezi Fodor 1976, 1987; Newell, 1980, 1982; Pylyshyn, 1980, 1984a, b). Prin contrast, conexionitii i propun s proiecteze sisteme ce pot manifesta comportamente inteligente fr stocare, reactualizare sau alte operri asupra expresiilor structurate simbolic. Stilul de procesare realizat n interiorul acestor modele este, astfel, profund diferit de ceea ce se ntmpl atunci cnd mainile convenionale realizeaz o anumit funcie. Sistemele conexioniste sunt reele constituite dintr-un numr foarte mare de uniti simple, dar puternic interconectate. n general, se fac anumite asumpii att n privina unitilor ct i n privina conexiunilor dintre ele. Fiecare unitate se presupune c primete o activare cu valoare real (fie excitatorie, fie inhibitorie, fie de ambele feluri) de-a lungul liniilor sale input. n mod tipic, unitile nu fac dect s nsumeze activarea i s-i modifice starea n funcie (de obicei funcie prag) de aceast sum. Fiecare conexiune are dreptul s moduleze aceast activare, pe care o transmite, datorit unei proprieti intrinseci (dar modificabile) numit pondere. Deci, activarea unei linii input este n mod tipic o funcie non-linear a strii de activare a surselor sale. Comportamentul unei reele, luat ca ntreg, este dat de starea de activare iniial a unitilor sale i de ponderile conexiunilor dintre uniti, ce servesc drept unica sa form de memorie. Numeroase elaborri ale acestei arhitecturi conexioniste de baz sunt posibile. De exemplu, modelele conexioniste au adesea mecanisme stohastice pentru determinarea nivelului de activare sau al strii unei uniti. Mai mult chiar, unitile pot fi conectate la medii exterioare. n acest caz, se presupune uneori c unitile rspund doar la o serie restrns de combinaii ale valorilor parametrice i se spune despre ele c au un anumit cmp receptiv n spaiul parametric. Acestea sunt numite uniti de valoare/valorice (value units) (Ballard, 1986). n anumite versiuni ale arhitecturii conexioniste, proprietile mediului sunt codate de un pattern al strilor unor ntregi populaii de uniti. Astfel de tehnici de codare brut sunt printre modalitile de obinere a ceea ce conexionitii numesc reprezentare distribuit.1 Termenul de model conexionist (ca i cel de main Turing sau de main Van Neumann) se aplic astfel unei familii de mecanisme, ce difer n privina detaliilor, dar care au n comun o galaxie de angajamente arhitecturale. Vom reveni la caracterizarea acestor angajamente n continuare.
Diferena dintre reelele conexioniste n care starea unei singure uniti codeaz proprieti ale lumii (de ex., aa numitele reele localizaioniste) i cele n care patternul strilor unei ntregi populaii de uniti realizeaz codarea (aa numitele reele de reprezentri distribuite) este considerat important de ctre muli dintre cei care lucreaz la modele conexioniste. Dei conexionitii dezbat meritele relative ale reprezentrilor localizaioniste (sau compacte) versus reprezentri distribuite (de ex., Feldman, 1986), distincia va avea n general consecine minore pentru scopurile noastre, din raiuni pe care le vom expune mai trziu. Pentru simplificare, indiferent dac vom dori s ne referim la coduri ale unei singure uniti sau la coduri distribuite unor agregate, ne vom referi la noduri ntr-o reea. Cnd distincia va fi relevant pentru discuia noastr, totui, vom marca explicit diferena, fcnd referiri fie la uniti, fie la agregate de uniti.
2
Pentru muli, una dintre atraciile conexionismului o reprezint faptul c implic o mainrie matematic puternic, dup cum se poate vedea, dintr-o privire, n multe din capitolele celor dou volume ale lui Rumelhart, McClelland i ale grupului de cercetare PDP (1986). Dar n contrast cu multe alte arii sofisticate matematic ale tiinei cognitive, cum ar fi teoria automatelor, sau pri ale inteligenei artificiale (n particular studiul cutrii, sau al raionamentului i al reprezentrii cunotinelor), matematicile nu au fost folosite pentru a arta care sunt limitele a ceea ce o clas propus de mecanisme poate realiza. Ca i o mare parte din cercetarea din inteligena artificial, demersul conexionist rmne aproape n ntregime experimental; mecanismele care arat interesant sunt propuse i explorate prin implementarea lor pe computere, i supuse la ncercri empirice pentru a vedea ce anume vor face. n consecin, dei exist un volum mare de studiu matematic nuntrul tradiiei conexioniste, i poi face o idee foarte vag despre utilitatea general a diferitelor reele i mecanisme conexioniste.
Reelele conexioniste au fost analizate extensiv - n unele cazuri folosind tehnici matematice avansate 2. Ele au fost, de asemenea, simulate pe computer i s-a artat c prezint interesante proprieti globale. De exemplu, ele pot fi cablate pentru a recunoate patternuri, pentru a manifesta regulariti comportamentale de tipul regulilor i pentru a realiza, virtual, orice coresponden de la anumite patternuri de parametri (input) la alte patternuri de parametri (output) - dei n cele mai multe cazuri aceste corespondene multiparametrice, cu multiple valori, necesit un numr foarte mare de uniti. De un i mai mare interes este faptul c astfel de reele pot fi fcute s nvee; acest lucru se poate realiza prin modificarea ponderilor conexiunilor, n funcie de anumite tipuri de feedback (modul precis n care se realizeaz acest lucru constituie o preocupare a cercetrii conexioniste i a dus la dezvoltarea unor tehnici importante de tipul retropropagrii). Pe scurt, studiul mainilor conexioniste a dus la un numr de descoperiri neateptate i spectaculoase; este surprinztor ct de multe computaii se pot realiza de ctre o reea uniform, constituit din elemente simple, interconectate. Mai mult chiar, aceste modele par a avea plauzibilitate neuronal, lucru care lipsete uneori arhitecturilor clasice. nct, poate c o nou tiin cognitiv, bazat pe reele conexioniste, ar trebui s ia locul vechii tiine cognitive, bazate pe computerele clasice. n mod cert aceasta este o propunere care trebuie luat n serios; dac e justificat, atunci implic o redirecionare major a cercetrii. Din nefericire, totui, discuiile asupra meritelor relative ale celor dou arhitecturi au fost pn acum marcate de o serie de confuzii i argumente irelevante. Prerea noastr este c, atunci cnd se elimin aceste concepii greite, ceea ce rmne este un real dezacord n privina naturii proceselor mentale i a reprezentrilor mentale. Ni se pare ns c acest subiect a fost pus de o parte n urm cu vreo treizeci de ani; i argumentele care atunci preau s militeze decisiv n favoarea paradigmei clasice par s fie nc valabile. n aceast lucrare vom proceda n felul urmtor. nti, vom discuta anumite chestiuni metodologice legate de nivelurile explicative care au fost prinse n plasa controversei reale asupra conexionismului. n al doilea rnd, vom ncerca s artm ce anume face ca teoriile conexioniste i teoriile clasice ale structurii mentale s fie incompatibile. n al treilea rnd, vom trece n revist i vom extinde anumite argumente tradiionale n favoarea arhitecturii clasice. Dei aceste argumente au fost ntr-un fel reformulate, foarte puin din ceea ce vom avea de spus este n ntregime nou. Dar sperm s clarificm modul n care diferite aspecte ale doctrinei clasice sunt coerente i s lmurim din ce cauz respingerea modului clasic de gndire i face pe conexioniti s afirme acele lucruri implauzibile despre logic i semantic. n partea a patra, vom reveni la ntrebarea legat de ce anume face ca demersul conexionist s fie atractiv pentru att de muli. Pentru aceasta, vom considera anumite argumente care au fost oferite n sprijinul reelelor conexioniste ca modele generale de procesare cognitiv.
1. NIVELE EXPLICATIVE
Exist dou mari tradiii n teoretizarea modern a psihicului, una pe care o vom numi reprezentaionalist i o alta pe care o vom numi eliminativist. Reprezentaionalitii consider c a postula stri reprezentaionale (sau intenionale sau semantice) este esenial pentru o teorie a cogniiei; dup ei, exist stri ale psihicului a cror funcie este de a coda stri ale lumii. Eliminativitii, prin contrast, cred c teoriile psihologice se pot dispensa de noiuni semantice precum cea de reprezentare. Potrivit acestora, vocabularul corespunztor teoretizrii psihologice este unul neurologic, sau poate unul comportamental, sau poate unul sintactic; n orice caz, nu un vocabular care caracterizeaz strile mentale n termeni de ceea ce acestea
2
reprezint. (Pentru o versiune neurologic a eliminativismului, vezi P.S.Churchland, 1986; pentru o versiune comportamental, vezi Watson, 1930; pentru o versiune sintactic, vezi Stich, 1983.) Conexionitii sunt de partea reprezentaionalist a acestei probleme. Dup cum afirmau Rumelhart i McClelland (1986a, p.121), procesrile paralele distribuite sunt explicit legate de problema reprezentrii interne. Adic, a specifica ce anume reprezint strile unei reele constituie o parte esenial dintr-un model conexionist. S considerm, de exemplu, binecunoscuta explicaie conexionist a bistabilitii cubului Necker (Feldman & Ballard, 1982). Uniti simple, reprezentnd trsturile vizuale ale celor dou alternative, sunt organizate n ansambluri concurente, cu legturi...inhibitorii ntre trsturile rivale i legturi pozitive nuntrul fiecrui ansamblu... Rezultatul este o reea care are dou stri dominante stabile (vezi figura 1). De notat c, n acest caz, ca i n cadrul altor modele conexioniste de acelai tip, angajamentul fa de reprezentrile mentale este explicit: denumirea unui nod exprim coninutul reprezentaional al strii n care se afl mecanismul atunci cnd nodul este excitat, i exist noduri care corespund proprietilor monadice, respectiv celor relaionale ale cubului reversibil, atunci cnd el este vzut ntr-un fel sau n altul.
E A F C D B G
A mai aproape ca B
H mai aproape ca G
G mai aproape ca H
C mai aproape ca D
A este un Y convex
G ascuns
G vizibil
G este un y convex
Cub cu A n prim-plan
Cub cu G n prim-plan
Fig. 1. Un model de reea conexionist care ilustreaz cele dou reprezentri stabile ale cubului Necker. (Reprodus dup Feldman i Ballard, 1982, p.221, cu permisiunea editorului, Ablex Publishing Corporation.)
Exist, desigur, momente cnd conexionitii par s oscileze ntre reprezentaionalism i afirmaia c nivelul cognitiv este dispensabil, n favoarea unui nivel teoretic mai precis i mai motivat biologic. n particular, se vorbete mult n literatura conexionist despre procese care sunt sub-simbolice- n consecin, probabil non-reprezentaionale. Dar acest lucru induce n eroare: modelarea conexionist este consistent reprezentaionalist n practic, i reprezentaionalismul este n general acceptat chiar i de teoreticienii crora le place ideea emergenei cogniiei din subsimbolic. nct, Rumelhart i McClelland (1986a, p.121) insist c modelele PDP sunt ... profund angajate n studiul reprezentrii i procesului. n mod similar, dei Smolensky (1988,
p.2) folosete conexionismul pentru a articula regulariti la nivelul sub-simbolic de analiz, se dovedete c strile sub-simbolice au o semantic, chiar dac nu semantica reprezentrilor de la nivelul conceptual. Dup Smolensky, distincia semantic ntre teorii simbolice i teorii subsimbolice const n faptul c entitile care n mod tipic sunt reprezentate n paradigma simbolic de simboluri (unice) sunt reprezentate n paradigma sub-simbolic de un mare numr de sub-simboluri.3 Att nivelul conceptual ct i cel sub-simbolic postuleaz, aadar, stri reprezentaionale, dar n cazul teoriilor sub-simbolice aceste stri sunt tiate n felii mai subiri. Accentum caracterul reprezentaional al teoretizrii conexioniste, deoarece o mare parte din lucrrile metodologice conexioniste s-au preocupat cu ntrebarea Care este nivelul explicativ corespunztor arhitecturii cognitive? (vezi, de exemplu, dialogul dintre Broadbent, 1985, i Rumelhart & McClelland, 1985). i, dup cum vom vedea, ceea ce afirm cineva n problema nivelelor depinde n mare msur de poziia pe care el se plaseaz n problema existenei strilor reprezentaionale. Pare cert faptul c lumea are o structur cauzal la foarte multe niveluri de analiz, indivizii recunoscui la nivelurile cele mai joase fiind, n general, foarte mici, iar indivizii recunoscui la nivelurile cele mai nalte fiind, n general, foarte mari. Deci exist un scenariu tiinific ce poate fi povestit despre quarcuri; i unul despre atomi; i unul despre molecule... de asemenea, despre roci i pietre i ruri...de asemenea, despre galaxii. i povestea pe care o spun oamenii de tiin despre structura cauzal pe care o are lumea la oricare din aceste niveluri poate fi cu totul diferit de cea pe care o spun despre structura cauzal a nivelului urmtor, superior sau inferior. Implicaia metodologic pentru psihologie este aceasta: dac vrei s ai un argument legat de arhitectura cognitiv, trebuie s specifici nivelul de analiza care se presupune c e n discuie. Dac nu eti un reprezentaionalist, acest lucru e de-a dreptul complicat, pentru c n acest caz nu e evident ce anume face ca un fenomen s fie cognitiv. Dar specificarea nivelului de analiz relevant pentru teoriile arhitecturii cognitive nu constituie o problem nici pentru clasiciti, nici pentru conexioniti. ntruct att clasicitii ct i conexionitii sunt reprezentaionaliti, pentru ei orice nivel la care strile sistemului sunt puse s codeze proprieti ale lumii conteaz ca nivel cognitiv; nici un alt nivel nu e relevant. (Reprezentrile lumii includ, bineneles, reprezentri ale simbolurilor; de exemplu, conceptul CUVNT este un construct la nivel cognitiv, deoarece reprezint ceva, i anume cuvinte). nct, discuiile despre arhitectura cognitiv sunt de fapt despre arhitectura strilor i proceselor reprezentaionale. Altfel spus, arhitectura sistemului cognitiv const dintr-un set de operaii, resurse, funcii, principii etc. fundamentale (n general acele tipuri de proprieti care ar fi descrise n manualul utilizatorului, dac acea arhitectur ar fi disponibil pe un computer), al cror domeniu i a cror arie sunt date de strile reprezentaionale ale organismului. 4 Prin urmare, dac vrei s faci din teoria conexionist o bun teorie a arhitecturii cognitive, trebuie s ari c procesele care opereaz asupra strilor reprezentaionale sunt cele
3
Smolensky pare s cread c ideea postulrii unui nivel al reprezentrilor cu o semantic de trsturi subconceptuale aparine n mod unic teoriilor reelelor. Acesta este un punct de vedere extraordinar, considernd msura n care teoreticienii clasici s-au preocupat de analiza trsturilor n fiecare arie a psihologiei, de la fonetic la percepie vizual i lexicografie. De fapt, ntrebarea dac exist trsturi sub-conceptuale este neutr relativ la problema naturii clasice sau conexioniste a arhitecturii cognitive.
4
Uneori, totui, chiar reprezentaionalitii nu realizeaz faptul c reprezentarea este cea care distinge nivelurile cognitive de cele noncognitive. Astfel, de exemplu, Smolensky (1988) dei e clar un reprezentaionalist, rspunznd oficial la ntrebarea Ce distinge sistemele dinamice cognitive de cele ce nu sunt cognitive ? face greeala de a apela la complexitate n loc de intenionalitate: Un ru ...nu poate fi un sistem dinamic cognitiv, numai pentru c nu poate satisface o gam larg de scopuri, ntr-o gam larg de condiii. Dar, desigur, aceasta depinde de modul n care individualizezi scopurile i condiiile; rul care vrea s ajung n mare vrea nti s strbat jumtate din distana pn la mare, i apoi cealalt jumtate...i aa mai departe; de fapt, o mulime de scopuri. Problema real e de fapt c strile care reprezint scopuri joac un rol n etiologia comportamentelor oamenilor, nu i n etiologia comportamentelor rurilor.
specificate de o arhitectur conexionist. De exemplu, nu are nici un sens , din punctul de vedere al psihologului cognitivist, s ari c strile nonreprezentaionale (de exemplu, neurologice, sau moleculare, sau cuantic-mecanice) ale organismului constituie o reea conexionist, deoarece acest lucru va lsa deschis ntrebarea dac psihicul este o astfel de reea la nivel psihologic. n particular este perfect posibil ca strile neurologice nonreprezentaionale, dar nu i strile reprezentaionale, s fie interconectate n modul descris de modelele conexioniste. Aceasta deoarece, aa cum e posibil s implementezi o arhitectur cognitiv conexionist ntr-o reea de elemente nonreprezentaionale ce interacioneaz cauzal, este perfect posibil i s implementezi o arhitectura cognitiv clasic ntr-o astfel de reea.5 De fapt, problema considerrii reelelor conexioniste drept modele pentru un anumit nivel de implementare este controversat i va fi discutat mai pe larg n seciunea 4. Aceast problem a nivelurilor este important de clarificat, pentru a nu trivializa pur i simplu chestiunile legate de arhitectura cognitiv. S considerm, de pild, urmtoarea remarc a lui Rumelhart: De civa ani ncoace mi se pare c trebuie s existe un demers unificat, n care aa-numitele cazuri guvernate de reguli i cazurile excepionale s fie explicate printr-un proces fundamental unificat - un proces care produce comportamente de tipul regulilor, dar i de tipul excepiei de la regul prin aplicarea unui singur proces...[n acest proces]... att comportamentul de tipul regulilor ct i cel de tipul non-regulilor sunt produse ale interaciunii unui mare numr de procese sub-simbolice (Rumelhart, 1984, p.60). Reiese clar din context c Rumelhart folosete aceast idee n mod foarte tendenios; un conexionist afirm c teoriilor clasice li se impune s nege. De fapt nu e aa. Pentru c, desigur, exist interaciuni sub-simbolice care implementeaz deopotriv un comportament de tipul regulilor i unul de tipul violrii regulilor, cum o fac, de exemplu, procesele mecanicii cuantice. Nu acest lucru este negat de teoreticienii clasici; ntr-adevr, nu e negat de nimeni care este, chiar vag, un materialist. Teoreticianul clasic nu neag nici faptul c att comportamentul de conformare la reguli ct i cel de violare a regulilor sunt implementate de aceeai mainrie neurologic. Pentru un teoretician clasic, neuronii implementeaz toate procesele cognitive n exact acelai fel: prin susinerea operaiilor de baz necesare pentru procesarea de simboluri. Ceea ce ar putea fi o afirmaie interesant i tendenioas, ns, este faptul c nu exist nici o distincie ntre procesarea conformrii la reguli i cea a violrii regulilor la nivel cognitiv sau reprezentaional sau simbolic; n mod specific, c n acest caz etiologia comportamentului de conformare la reguli nu este mediat de reprezentarea unor reguli explicite. 6 Vom considera aceast idee n seciunea 4, unde vom argumenta c nici acest lucru nu este cel care distinge arhitectura clasic de cea conexionist; modelele clasice permit o distincie, pe baz de principii, ntre etiologii ale proceselor mentale care sunt, respectiv nu sunt explicit guvernate de reguli; dar ele nu oblig la o astfel de distincie. Pe scurt, controversa ntre arhitectura clasic i cea conexionist nu este legat de explicitarea regulilor; dup cum vom vedea, arhitectura clasic nu este, per se, devotat ideii c reguli explicite mediaz etiologia comportamentului. Nu este nici despre realitatea strilor reprezentaionale; clasicitii i conexionitii sunt toi realiti reprezentaionali. Nu este nici despre
5
C arhitecturile clasice pot fi implementate n reele nu este un fapt disputat de conexioniti; vezi de exemplu, Rumelhart i McClelland (1986, p.118):... se poate realiza o main computaional arbitrar din uniti prag lineare, inclusiv, de exemplu, o main care poate realiza toate operaiunile necesare implementrii unei maini Turing: unica limitare este c sistemele biologice reale nu pot fi maini Turing, deoarece ele dispun de un hard finit.
6
Exist o idee diferit, care apare frecvent n literatura conexionist, i cu care aceasta e uor confundat: anume, c distincia dintre regulariti i excepii este doar stohastic (ceea ce face ca went s fie un trecut neregulat nu e dect faptul c o construcie mai frecvent este cea prezent n walked). Pare evident c, dac acest enun este corect, el poate fi uor asimilat arhitecturii clasice (vezi seciunea 4).
arhitectura nonreprezentaional; o reea neuronal conexionist poate implementa perfect o arhitectur clasic la nivel cognitiv. i atunci, n ce const de fapt dezacordul dintre arhitectura clasic i cea conexionist?
2. NATURA DISPUTEI
i clasicitii i conexionitii asigneaz un coninut semantic la ceva anume. n principiu, conexionitii asigneaz coninut semantic nodurilor (altfel spus, unitilor sau ansamblurilor de uniti; vezi nota 1) - adic acelor tipuri de obiecte care n mod tipic sunt etichetate drept diagrame conexioniste; n schimb, clasicitii asigneaz coninut semantic expresiilor - adic acelor tipuri de obiecte care sunt nscrise pe benzile mainilor Turing i stocate la adrese n cazul mainilor Von Neumann.7 Dar teoriile clasice nu sunt de acord cu teoriile conexioniste n legtur cu relaiile primare care exist ntre aceste entiti purttoare de coninut. Teoriile conexioniste recunosc doar conectivitatea cauzal ca relaie primar ntre noduri; cunoscnd modul n care activarea i inhibiia circul ntre noduri, poi ti totul despre felul n care sunt legate nodurile unei reele. Din contr, teoriile clasice recunosc nu numai relaii cauzale ntre obiectele evaluabile semantic pe care le postuleaz, dar i o serie de relaii structurale, a cror constituen este paradigmatic. Aceast diferen are consecine cu btaie lung pentru modul n care cele dou tipuri de teorii trateaz o varietate de fenomene cognitive, dintre care unele vor fi ndat examinate pe larg. Dar la baza nenelegerilor de detaliu stau dou diferene arhitecturale ntre aceste tipuri de teorii: (1) Semantica i sintaxa combinatoric a reprezentrilor mentale . Teoriile clasice - dar nu i cele conexioniste - postuleaz un limbaj al gndirii (vezi, de exemplu, Fodor, 1975); ei consider c reprezentrile mentale au semantic i sintax combinatoric, ceea ce presupune c (a) exist o distincie ntre reprezentri structural atomice i reprezentri structural moleculare; (b) reprezentrile structural moleculare au constitueni sintactici care sunt ei nii fie structural moleculari, fie structural atomici; i (c) coninutul semantic al unei reprezentri (moleculare) este o funcie a coninuturilor semantice ale prilor sale sintactice, luate mpreun cu structura sa constituent. Din raiuni convenionale, vom abrevia uneori (a)-(c) i vom vorbi despre teoriile clasice ca fiind devotate reprezentrilor mentale complexe sau structurilor simbolice. 8 (2) Sensibilitatea la structur a proceselor. n modelele clasice, principiile pe baza crora sunt transformate strile mentale, sau prin care un input selecteaz outputul corespunztor, sunt definite relativ la proprietile structurale ale reprezentrilor mentale. Deoarece reprezentrile mentale clasice au o structur combinatoric, e posibil ca operaiile mentale clasice s li se aplice n raport cu forma lor. Rezultatul este c un proces mental clasic paradigmatic opereaz asupra oricrei reprezentri mentale care satisface o descripie structural dat, i o transform ntr-o alt
7
Aceast formulare corespunde scopurilor prezente. Dar un cititor mai subtil al teoriilor conexioniste ar putea considera c strile totale ale mainii sunt cele care au coninut, de exemplu, starea de a avea cutare sau cutare nod excitat. A postula conexiuni ntre noduri denumite ar fi, deci, echivalent cu a postula relaii cauzale ntre strile corespunztoare purttoare de coninut ale mainii: a spune c excitarea nodului denumit dog este cauzat de excitarea nodurilor denumite [d], [o], [g] este totuna cu a spune c reprezentarea de ctre main a inputului su, ca fiind constituit din secvena fonetic [dog], cauzeaz reprezentarea inputu-lui drept cuvntul dog. i aa mai departe. Cel mai adesea distincia ntre aceste dou moduri de a pune problema nu conteaz pentru scopurile noastre, nct le vom considera alternativ convenabile.
8
Uneori diferena ntre a postula pur i simplu stri reprezentaionale i a postula reprezentri cu semantic i sintax combinatoric este marcat de distingerea ntre teorii care postuleaz simboluri i teorii care postuleaza sisteme simbol. Cele din urm, dar nu i primele, sunt devotate limbajului gndirii. Pentru aceast accepiune, vezi Kosslyn i Hatfield (1984) care iau refuzul de a postula sisteme simbol drept aspectul caracteristic prin care arhitecturile conexioniste difer de cele clasice. Suntem de acord cu acest diagnostic.
reprezentare mental care satisface o alt descripie structural. (Deci, de exemplu, ntr-un model al inferenei se poate recunoate o operaie care se aplic oricrei reprezentri de forma P&Q i o transform ntr-o reprezentare de forma P.) De notat c, atta timp ct proprietile formale pot fi definite la diferite niveluri de abstractizare, o astfel de operaie se poate aplica n mod egal unor reprezentri ce difer n mare masur n privina complexitii structurale. Operaia ce se aplic reprezentrilor de forma P&Q, pentru a produce P, este satisfcut, de exemplu, de o expresie ca (AvBvC) & (DvEvF), din care deriv expresia (AvBvC). Considerm (1) i (2) drept principiile ce definesc modelele clasice, i le lum n considerare literalmente; ele constrng realizrile fizice ale structurilor simbolice. n particular, se presupune c structurile simbolice dintr-un model clasic corespund unor structuri fizice reale ale creierului, iar structura combinatoric a unei reprezentri se presupune c are un duplicat n relaiile structurale dintre proprietile fizice ale creierului. De exemplu, relaia parte a , care exist ntre un simbol relativ simplu i unul mai complex, se presupune c ar corespunde unei relaii fizice ntre stri ale creierului. 9 De aceea Newell (1980) vorbete despre sisteme computaionale precum creierul i computerele clasice ca despre sisteme simbolice fizice. Acest fapt trebuie accentuat, deoarece angajamentul teoriei clasice nu este doar fa de existena unui sistem de simboluri instaniate fizic, dar i fa de afirmaia c proprietile fizice ce corespund structurii simbolurilor sunt chiar proprietile care determin sistemul s se comporte n felul n care o face. Cu alte cuvinte, corespondenii fizici ai simbolurilor i proprietile lor structurale cauzeaz comportamentul sistemului. Un sistem care are expresii simbolice, dar ale crui operaii nu depind de structura acestor expresii, nu poate fi calificat drept o main clasic, deoarece nu satisface condiia (2). n aceast privin, un model clasic este foarte diferit de unul n care comportamentul este cauzat de mecanisme precum minimizarea energiei, care nu sunt sensibile la encodarea fizic a structurii reprezentrilor.
Poate ideea c relaiile dintre proprietile fizice ale creierului instaniaz (sau codeaz) structura combinatoric a unei expresii comport o anume elaborare. Un mod de a nelege ce anume implic aceast idee este acela de a considera care sunt condiiile care trebuie s stea la baza punerii n coresponden a expresiilor cu stri ale creierului (la care ne vom referi ca la physical instantiation mapping), pentru ca relaiile cauzale dintre strile creierului s depind de structura combinatoric a expresiilor encodate. n definirea acestei puneri n coresponden nu e destul doar s specifici o encodare fizic a fiecrui simbol; pentru ca structurile expresiilor s aib roluri cauzale, relaiile structurale trebuie s fie encodate de proprietile fizice ale strilor creierului (sau de seturi de proprieti fizice, echivalente funcional cu starea creierului). Deoarece, n general, modelele clasice presupun c expresiile care sunt instaniate fizic n creier au o sintax generativ, definiia unei corespondene de instaniere fizic trebuie s fie construit n termeni de (a) definirea unei corespondene primare ntre simboluri atomice i stri fizice relativ elementare, i (b) specificarea modului n care structura unor expresii complexe corespunde structurii unor stri fizice compozite sau relativ complexe. O atare coresponden care conserv structura este dat, n mod tipic, recursiv, folosind sintaxa combinatoric prin care expresiile complexe sunt construite din unele mai simple. De exemplu, corespondena de instaniere fizic F pentru expresii complexe va fi definit recursiv, fiind dat definiia lui F pentru simboluri atomice i fiind dat structura expresiilor complexe, ultima fiind specificat n termeni de reguli de construire a structurii care constituie sintaxa generativ pentru expresii complexe. S lum, de exemplu, expresia (A&B)&C. O definiie potrivit a corespondenei n acest caz poate s conin afirmaia c oricare ar fi expresiile P i Q, F(P&Q) = B(F[P], F[Q]), unde funcia B specific relaia fizic dintre strile fizice F[P] i F[Q]. Aici proprietatea B servete la encodarea fizic, (sau instanierea) relaiei dintre expresiile P i Q, pe de-o parte, i expresiile P&Q, pe de alt parte. n folosirea acestei reguli n exemplul de mai sus, P i Q ar avea valorile A&B i respectiv C, aa nct regula de punere n coresponden ar trebui s fie aplicat de dou ori pentru a distinge structurile fizice relevante. Definind corespondena recursiv n acest fel, ne asigurm c relaia dintre expresiile Ai B i expresia compozit A&B este encodat n termenii unei relaii fizice ntre stri constituente, care este identic (sau funcional echivalent) cu relaia fizic folosit la encodarea relaiei dintre expresiile A&B i C, i expresia lor compozit (A&B)&C. Acest tip de coresponden este binecunoscut datorit folosirii sale de Tarski n definiia interpretrii unui limbaj ntr-un model. Ideea de punere n coresponden a expresiilor simbolice cu structura strilor fizice este discutat de Pylyshyn (1984a, pp. 54-69), unde se face referire la o funcie de instaniere i de Stabler (1985), unde este numit realization mapping.
De acum nainte, cnd vom vorbi despre modele clasice vom avea n minte orice model care are reprezentri mentale complexe, precum cele caracterizate de (1), i procese mentale sensibile la structur, ca cele caracterizate de (2). Demersul nostru relativ la arhitectura clasic este, deci, neutru n ceea ce privete chestiuni de tipul existenei sau a nonexistenei unei instane executive distincte. De exemplu, mainile clasice pot avea o arhitectur orientat pe obiect, ca limbajul Smalltalk sau o arhitectur de transmitere a mesajelor, precum cea a Actorilor lui Hewett (1977) - atta timp ct obiectele sau mesajele au o structur combinatoric ce e implicat cauzal n procesare. Arhitectura clasic este totodat neutr i n problema operaiilor asupra simbolurilor - a faptului c operaiile sunt constrnse s apar pe rnd sau dimpotriv, mai multe pot s apar n acelai timp. Prin urmare, iat planul pentru ceea ce urmeaz. n ce a mai rmas din aceast seciune, vom schia propunerea conexionist de arhitectur computaional care nu are de-a face cu reprezentri mentale complexe i operaii sensibile la structur. (Dei scopul nostru este doar explorator, se dovedete c a descrie exact care sunt angajamentele conexionitilor necesit o reconstrucie substanial a remarcilor i practicilor lor. ntruct exist o mare varietate de puncte de vedere nuntrul comunitii conexioniste, suntem pregtii s descoperim c unii conexioniti de marc nu aprob ntru totul programul expus de noi n ceea ce considerm a fi esena sa pur). n continuarea acestei discuii generale expozitive (sau reconstructive), seciunea 3 va oferi o serie de argumente n favoarea teoriei clasice. Restul lucrrii va lua n considerare cteva raiuni pentru care conexionismul pare a fi atractiv pentru muli, i va oferi comentarii generale relativ la relaia dintre demersul conexionist i cel clasic.
2.1. Reprezentri mentale complexe

Pentru nceput, s considerm unul din exemplele cele mai banale: dou maini, una construit n spirit clasic, cealalt n spirit conexionist. 10 Iat cum ar putea raiona maina conexionist. Exist o reea de noduri etichetate, ca n figura 2. Legturile dintre noduri indic rutele de-a lungul crora se distribuie excitaia (adic, indic ce consecine are excitarea unuia dintre noduri pentru determinarea nivelului de excitaie al altora). A face o inferen de la A&B la A corespunde, deci, excitrii nodului 2 datorit excitrii nodului 1 (alternativ, dac sistemul este ntr-o stare n care nodul 1 este excitat, eventual atinge o stare n care nodul 2 este excitat; vezi nota 7).
A&B
3 B
Fig. 2. O posibil reea conexionist pentru stabilirea inferenelor de la A&B la A sau la B.
S considerm acum o main clasic. Aceast main are o band pe care i nscrie expresiile. Printre expresiile ce pot s apar pe aceast band sunt: A, B, A&B, C, D, C&D, A&C&D... etc. Constituia cauzal a mainii este dup cum urmeaz: de cte ori un simbol de forma P&Q apare pe band, maina scrie un simbol de forma P. O inferen de la A&B la A corespunde, deci, unei simbolizri de tipul A&B pe band, care cauzeaz o simbolizare de tip A. i atunci, n ce const diferena arhitectural dintre cele dou tipuri de maini? n cazul mainilor clasice, obiectele crora le este atribuit coninutul A&B (adic, simboluri ale expresiei A&B) conin literal, ca pri veritabile, obiecte crora le este atribuit coninutul A (adic, simboluri ale expresiei A). Mai mult chiar, semantica (de ex., condiiile de satisfacere) ale expresiei A&B sunt determinate n mod uniform de ctre semantica propriilor si constitueni. 11 Prin contrast, n cazul mainii conexioniste, nimic din aceasta nu e adevrat; obiectul cruia i este atribuit coninutul A&B (adic, nodul 1) este conectat cauzal la obiectul cruia i este atribuit coninutul A (adic, nodul 2); dar ntre ele nu exist o relaie structural (de ex., parte/ntreg). Pe scurt, este caracteristic pentru sistemele clasice, dar nu i pentru cele conexioniste, s exploateze un domeniu de simboluri, dintre care unele sunt atomice (de ex., expresii ca A), dar dintre care un numr nedefinit de mare au ca pri sintactice sau semantice alte simboluri (de ex., expresii ca A&B). Este uor s treci cu vederea aceast diferen dintre arhitecturile clasice i cele conexioniste, cnd citeti polemica din literatura conexionist sau examinezi un model
10
Aceast ilustrare nu vizeaz un model conexionist particular, dei caricatura prezentat este de fapt o versiune simplificat a sistemului care dovedete teorema conexionist a lui Ballard (1987) (care de fapt folosete o procedur de demonstraie mai restrns, bazat pe unificarea clauzelor lui Horn). Pentru a simplifica aceast expunere, am presupus un demers localizaionist, n care fiecare nod interpretat semantic corespunde unei singure uniti conexioniste; dar nu se modific nimic relevant pentru aceast discuie, dac nodurile constau de fapt din patternuri constituite dintr-un cluster de uniti.
11
Acest lucru face din compoziionalitatea structurilor de date o proprietate definitorie a arhitecturii clasice. Dar, binenteles, las deschis problema gradului n care limbajele naturale (ca engleza) sunt la rndul lor compoziionale.
conexionist. Exist cel puin 4 moduri n care cineva poate fi determinat s o fac: (1) nu este neleas diferena ntre ceea ce fac irurile de simboluri n mainile clasice i ceea ce fac etichetele nodurilor n cazul mainilor conexioniste; (2) se confund ntrebarea dac nodurile reelelor conexioniste au o structur constituent cu ntrebarea dac ele sunt distribuite neurologic; (3) nu se face distincia ntre o reprezentare ce are constitueni sintactici i semantici, i un concept codat n termeni de microtrsturi; (4) se presupune c, ntruct reprezentrile din reelele conexioniste au o structur de tipul grafurilor, nodurilor reelelor le corespunde o structur constituent. Vom avea nevoie acum de o digresiune mai lung pentru a clarifica aceste nenelegeri. 2.1.1. Rolul etichetelor n teoriile conexioniste n cursul elaborrii unui model conexionist, coninutul intenional va fi asignat strilor mainii, iar expresiile unui limbaj sau ale altuia vor fi, bineneles, folosite pentru a exprima aceast asignare; de exemplu, nodurile pot fi etichetate n scopul indicrii coninutului lor reprezentaional. Astfel de etichete au adesea i semantic i sintax combinatoric; n aceast privin, pot arta la fel cu reprezentrile mentale clasice. Ceea ce trebuie accentuat, totui, este c acest lucru nu nseamn (i nu este adevrat c) nodurile crora le sunt asignate aceste etichete au o sintax i semantic combinatoric. Expresia A&B, de exemplu, poate fi simbolizat pe banda unei maini de tip clasic i poate, de asemenea, s apar ca etichet ntr-o main conexionist ca n diagrama 2 de mai sus. i, desigur, expresia A&B este sintactic i semantic complex: are un simbol al lui A drept unul din constituenii si sintactici, iar semantica expresiei A&B este o funcie a semanticii expresiei A. Dar din citirea diagramei nu reiese faptul c nsui nodul 1 are constitueni; nodul - spre deosebire de eticheta sa - nu are pri interpretate semantic. Este, pe scurt, important s nelegem diferena dintre etichetele conexioniste i simbolurile prin care sunt definite computaiile clasice. Diferena este aceasta: strict vorbind, etichetele nu joac nici un rol n determinarea tipului de operaie al unei maini conexioniste; n particular, operaiile mainii sunt neafectate de relaiile sintactice i semantice dintre expresiile folosite ca etichete. Altfel spus, etichetele nodurilor unei maini conexioniste nu fac parte din structura cauzal a mainii. nct, maina descris n figura 2 va continua s fac aceleai tranziii de stare indiferent de ce asigneaz etichetele nodurilor. Pe cnd, prin contrast, tranziiile de stare ale mainilor clasice sunt determinate cauzal de structura - inclusiv structura constituent - a irurilor de simboluri pe care le transform maina: schimb simbolurile i maina se va comporta diferit. (De fapt, ntruct comportamentul unei maini clasice este sensibil la sintaxa reprezentrilor asupra crora face calcule, chiar a schimba ntre ele reprezentri sinonime semantic echivalente - afecteaz cursul calculului). Aa nct, dei att etichetele conexioniste ct i structurile de date clasice constituie limbaje, doar cele din urm limbaje constituie un mijloc de calcul.12
12
Etichetele nu sunt parte a structurii cauzale a unei maini conexioniste, dar pot juca un rol esenial n istoria sa cauzal , atta timp ct proiectanii i construiesc mainile ca s respecte relaiile semantice pe care le exprim etichetele. De ex., n modelul conexionist de demonstrare a teoremei al lui Ballard (1987), exist o procedur mecanic de construire a unei reele care va aduce dovezi prin unificare. Aceast procedur este o funcie de la un set de etichete ale nodurilor la o main cablat. Este, deci, un aspect interesant i revelator n care etichetele nodurilor sunt relevante pentru operaiile care sunt realizate atunci cnd funcia este executat. Dar, desigur, maina asupra creia au efect etichetele nu e maina ale crei stri sunt etichetate; i efectul etichetelor apare cnd maina de demonstrare a teoremelor este construit, i nu n momentul n care procesul de raionare este realizat. Acest tip de situaie n care etichetele au efect este diferit de modul n care simbolurile (de ex., structurile de date simbolice) pot afecta procesele cauzale ale mainii clasice.
2.1.2. Reele conexioniste i structuri de grafuri Al doilea motiv pentru care lipsa structurii sintactice i semantice n reprezentrile conexioniste a fost n mare msura ignorat poate fi faptul c reelele conexioniste arat ca grafurile generale; i, desigur, este perfect posibil s foloseti grafuri pentru a descrie structura intern a unui simbol complex. Este exact ceea ce fac lingvitii cnd folosesc arbori pentru a arta structura constituent a propoziiilor. n mod corespunztor, cineva i poate imagina o notaie tip graf care s exprime structura intern a reprezentrilor mentale folosind arcuri i noduri etichetate. Deci, de exemplu, se poate exprima sintaxa unei reprezentri mentale care corespunde ideii c John iubete fata n felul urmtor: John (John loves iubete the girl fata)
n interpretarea intenionat, aceasta ar fi descrierea structural a reprezentrii mentale al crei coninut este c John iubete fata, i ai crei constitueni sunt: o reprezentare mental care se refer la John, o reprezentare mental care se refer la the girl (fata) i o reprezentare mental care exprim relaia bilocalizat reprezentat de loves ". Dar dei grafurile pot susine o interpretare ce specific sintaxa logic a unei reprezentri mentale complexe, aceast interpretare este nepotrivit pentru grafurile reelelor conexioniste. Grafurile conexioniste nu sunt descrieri structurale ale reprezentrilor mentale; ele sunt specificri ale relaiilor cauzale. Tot ceea ce poate un conexionist s neleag printr-un graf de forma X Y este: strile nodului X afecteaz cauzal strile nodului Y. n particular, graful nu nseamn c X este constituent al lui Y sau c X este legat gramatical de Y etc., deoarece aceste tipuri de relaii nu sunt, n general, definite pentru tipurile de reprezentri mentale pe care le recunosc conexionitii. Un alt mod de a spune acest lucru este c legturile n diagramele conexioniste nu sunt pointeri generalizai, care primesc semnificaie funcional diferit de la un interpretator independent, ci nelesul lor este ceva de genul a trimite activarea ctre. Interpretarea legturilor drept conexiuni cauzale este intrinsec teoriei. Dac ignori acest lucru, eti gata s consideri conexionismul ca oferind o noiune mai bogat despre reprezentarea mental dect o face de fapt. 2.1.3. Reprezentri distribuite A treia greeal ce poate duce la a nu constata faptul c n modelele conexioniste, reprezentrilor mentale le lipsete structura semantic i sintactic de tip combinatoric este faptul c muli conexioniti vd reprezentrile ca fiind neurologic distribuite; i, probabil, orice este distribuit trebuie s aib mai multe pri. Totui, aceasta nu nseamn c orice este distribuit trebuie s aib constitueni; a fi neurologic distribuit este foarte diferit de a avea structur constituent sintactic sau semantic. Exist o structura constituent atunci cnd (sau doar atunci cnd) prile entitilor semantic evaluabile sunt ele nsele semantic evaluabile. Relaiile de constituen, deci, se stabilesc ntre obiecte care sunt toate la nivel reprezentaional; ele sunt, n acest sens, relaii nuntrul nivelului.13 Prin contrast, distribuirea neural - tipul de relaie care se presupune c exist ntre noduri i unitile prin care ele sunt realizate - este o relaie ntre niveluri:
13
Orice relaie specificat dintre strile reprezentaionale este, prin definiie, nuntrul nivelului cognitiv. Ceea ce nu nseamn c relaiile ce sunt nuntrul nivelului dup acest criteriu nu pot conta ca fiind ntre niveluri dac utilizm criterii mai fine. De exemplu, nu exist nimic care s mpiedice existena unor ierarhii ale nivelurilor strilor reprezentaionale.
nodurile, nu i unitile, conteaz ca reprezentri. A afirma c un nod este distribuit neural nseamn probabil a afirma c strile sale de activare corespund patternurilor de activitate neural - ansamblurilor de uniti neurale - mai degrab dect activrilor unor neuroni singulari. Este important faptul c nodurile, care sunt n acest sens distribuite, pot fi foarte bine atomice sintactic sau semantic: implementarea complex spaial-distribuit nu implic n nici un fel structura constituent. Exist, totui, un sens diferit n care strile reprezentaionale dintr-o reea pot fi distribuite, i acest tip de distribuire ridic la rndul su ntrebri relevante pentru chestiunea constituenei. 2.1.4. Reprezentrile distribuite la nivel de microtrsturi Muli conexioniti consider c reprezentrile mentale care corespund unor concepte comune (CHAIR [SCAUN], JOHN, CUP [CAN]) sunt distribuite n galaxii de uniti de nivel inferior care au ele nsele coninut reprezentaional. Pentru a folosi terminologia conexionist uzual (vezi Smolensky, 1988), unitile de nivel superior sau conceptual corespund unor vectori dintr-un spaiu sub-conceptual de microtrsturi. Modelul prezent este ceva asemntor cu relaia dintre o expresie definit i analiza trsturilor prin care se definete: astfel, conceptul BACHELOR [BURLAC] ar putea fi gndit corespunznd unui vector n spaiul trsturilor care include ADULT, HUMAN, MALE [BRBAT], MARRIED [CSTORIT]; de ex., prin asignarea valorii + primelor dou trsturi i - ultimei. De notat c distribuia la nivel de microtrsturi (spre deosebire de distribuia la nivel de uniti neurale) este o relaie ntre reprezentri, deci o relaie la nivel cognitiv. Deoarece se presupune c microtrsturile deriv automat (de ex., via proceduri de nvare) din proprietile statistice ale unor eantioane de stimuli, le putem gndi ca exprimnd acele tipuri de proprieti care sunt relevate prin analiza multivariat a seturilor de stimuli (ex., scaling multidimensional al judecilor de similaritate). n particular, nu trebuie s corespund unor cuvinte englezeti; ele pot fi mai fine dect, sau cumva atipice comparativ cu termenii de care are nevoie un non-specialist pentru a avea un cuvnt. Dincolo de aceasta, ns, sunt trsturi semantice perfect obinuite, de felul celor pe care lexicografii le folosesc pentru a-i reprezenta nelesurile cuvintelor. n cele mai frecvente evaluri conexioniste, teorii articulate n termeni de vectori de microtrsturi sunt presupuse a arta cum conceptele sunt de fapt codate, i de aici cum vectorii de trsturi sunt menii s nlocuiasc specificri mai puin precise ale conceptelor de macronivel. De exemplu, acolo unde un teoretician clasic ar putea recunoate o stare psihologic ce conine conceptul CUP[CAN], un conexionist realizeaz doar o stare grosier analoag de marcare a vectorului de trstur corespondent. (Un motiv pentru care analogia este doar grosier este c acel vector de trstur care corespunde unui concept dat poate fi vzut ca fiind foarte dependent de context). Generalizrile pe care le susin teoriile de nivel conceptual sunt doar cu aproximare adevrate, adevrul adevrat fiind statuabil doar n vocabularul microtrsturilor. Smolensky, de exemplu (p.11), este explicit n a nota acest lucru: Descrieri precise i formale ale procesorului intuitiv sunt n general detectabile nu la nivelul conceptual, ci doar la cel subconceptual.14 Aceasta abordare a relaiei dintre concepte uzuale i microtrsturi este exact
14
Smolensky (1988, p.14) remarca faptul c spre deosebire de semnele simbolice, aceti vectori se gsesc ntr-un spaiu tipologic, n care unii sunt foarte apropiai, iar alii foarte deprtai. Oricum, aceasta pare s combine la modul radical afirmaiile asupra modelului conexionist i cele asupra implementrii sale (o combinare care nu este neobinuit n literatura conexionist, dup cum vom vedea n partea a 4-a). Dac spaiul n discuie este fizic, atunci Smolensky este de partea unor foarte puternice afirmaii despre relaiile de adiacen din creier; afirmaii care, de fapt, nu prezint nici un motiv pentru a fi crezute. Dar dac, aa cum pare mai plauzibil, spaiul n discuie este semantic, atunci ceea ce Smolensky spune nu e adevrat. Practic orice teorie cognitiv va implica msurtori ale distanei dintre reprezentrile mentale. n teoriile clasice, de exemplu, distana dintre dou reprezentri este n mod plauzibil legat de numrul de pai computaionali necesari pentru a deriva o reprezentare din alta. n teoriile conexioniste, aceast distan este n mod plauzibil legat de numrul de noduri care intervin (sau de gradul de ntreptrundere dintre vectori, n funcie de versiunea conexionist pe care o are cineva n vedere). Afirmaia interesant nu este aceea c arhitectura ofer o
analoag abordrii standard conexioniste a regulilor; n ambele cazuri, teoria de macronivel este presupus a avea un vocabular adecvat pentru a formula generalizri care s aproximeze n mare dovezile asupra regularitilor de comportament. Dar structurile macroteoriei nu corespund mecanismelor cauzale care genereaz aceste regulariti. Dac se dorete o teorie a acestor mecanisme, e nevoie s se nlocuiasca discuia despre reguli i concepte cu discuia despre noduri, conexiuni, microtrsturi, vectori i aa mai departe. 15 Acum, ntre cele mai mari neajunsuri ale literaturii conexioniste se afl faptul c problema reprezentrii conceptelor uzuale prin seturi de microtrsturi s-a amestecat complet cu problema structurii combinatorice a reprezentrilor mentale. Enigma acestui amestec const n aceea c seturile de microtrsturi pot s se suprapun, astfel nct, de exemplu, dac o microtrstur corespunznd lui + are-un-mner este parte a ansamblului de noduri peste care este distribuit conceptul uzual CUP[CAN], atunci ne putem gndi c aceast teorie reprezint pe + are-un-mner ca i constituent al conceptului CUP[CAN]; de unde se poate conchide c i conexionitii au, n cele din urm, o noiune de constituen, fapt care contravine afirmaiei potrivit creia conexionismul nu este o arhitectur a limbajului gndirii (a se vedea Smolensky, 1988). O reflecie de moment va arta, totui, clar cum, chiar i atunci cnd considerm conceptele ca fiind distribuite la nivelul microtrsturilor, + are-un-mner nu este constituent al CUP[CAN] n sensul n care Mary (cuvntul) este constituent al (propoziiei) John o iubete pe Mary. n acest ultim caz, constituena" este folosit (abuziv) pentru a face referire la o relaie semantic ntre predicate; n mare, ideea este c acele predicate de macronivel precum CUP[CAN] sunt definite printr-un set de microtrsturi precum are-un-mner, astfel nct ne gsim n faa unui fel de adevr semantic cnd CUP[CAN] se aplic unui subset al setului la care se aplic are-un-mner. A se nota c n vreme ce extensiile acestor predicate se gsesc ntro relaie de set/subset, predicatele nsele nu se afl n nici o relaie de tip parte-a-ntregului. Expresia are-un-mner nu mai este parte a expresiei CUP[CAN], dup cum nici fraza englezeasc is an unmarried man [este un om necstorit] nu este parte a frazei englezeti is a bachelor [este burlac]. Constituena real are de-a face cu pri i ntreguri; simbolul Mary este, literal, o parte a simbolului John loves Mary [John o iubete pe Mary]. Aceasta deoarece simbolurile lor intr n relaiile de constituen real pe care le au limbajele naturale - att limbajele atomice ct i cele complexe. Prin contrast, relaia de definiie poate s reziste ntr-un limbaj n care toate simbolurile sunt atomice sintactic; de ex., un limbaj ce conine att cup[can] ct i has-ahandle[are-un-mner] ca predicate atomice. Acest punct merit s fie accentuat. ntrebarea dac un sistem reprezentaional are constituen real este independent de ntrebarea legat de analiza microtrsturilor; ea este ridicat deopotriv n sisteme n care CUP[CAN] e primitiv semantic, i n sisteme n care primitivele semantice sunt de tipul + has-a-handle[are-un-mner] iar CUP[CAN] i altele asemntoare sunt definite n termenii acestor primitive. Este ntr-adevr
distan.
15
Utilizarea primar a microtrsturilor de ctre conexioniti se afl n demersurile lor de generalizare i abstractizare (a se vedea, spre exemplu, Hinton, McClelland, & Rumelhart, 1986). n mare, se ajunge la generalizare prin folosirea suprapunerii de microtrsturi pentru a defini un spaiu de similaritate, i se poate ajunge la abstractizare transformnd vectorii care corespund unor tipuri n subvectori ai celor ce corespund semnelor lor. Propuneri similare au o destul de ndelungat istorie n analiza empirist tradiional; i au fost criticate cu succes de-a lungul secolelor. (Pentru o discuie despre abstracionism a se vedea Geach, 1957; c aceast similaritate este o relaie primitiv - deci ireductibil la identitatea parial a seturilor de trsturi - a constituit, desigur, o dogm principal a Gestalt psihologiei, ca i a demersurilor mai recente bazate pe prototipuri). Tratarea microtrsturilor n literatura conexionist apare foarte apropiat de variantele timpurii propuse de Katz i Fodor (1963) i Katz i Postal (1964), unde au fost sprijinite att ideea de analiz a trsturilor aplicat la concepte, ct i ideea c relaiile de delimitare semantic dintre concepte ar trebui identificate cu relaiile teoretice de set dintre iruri de trsturi.
foarte important s nu se confunde distincia semantic ntre expresii primitive i expresii definite cu distincia sintactic dintre simboluri atomice i simboluri complexe. Din cte tim, nu s-au fcut ncercri n literatura conexionist de a trata problemele sintactice i semantice ridicate de relaia de constituen real. Exist, totui, o propunere care apare din cnd n cnd: anume, c cele ce n mod tradiional au fost considerate drept simboluri complexe s fie vzute ca seturi de uniti, avnd relaiile de rol, care tradiional sunt codate de structura constituent, reprezentate de uniti aparinnd acestor seturi. nct, de exemplu, reprezentarea mental corespunztoare ideii c John o iubete pe Mary poate fi vectorul trstur {+John-subject; +loves; +Mary-object}. Aici John-subject [John-subiect], Mary-object [Mary-obiect] i altele asemntoare sunt etichetele unitilor; adic, ele sunt trsturi atomice (deci microtrsturi), al cror status e analog cu has-a-handle [are-un-mner]. n particular, ele nu au o analiz sintactic intern, i nu exist o relaie structural (cu excepia celei ortografice) ntre trstura Mary-object care apare n setul {+John-subject; +loves; +Mary-object} i trstura Mary-subject ce apare n setul {+ Mary- subject; +loves; + John- object }. (Vezi, de ex., discuia n Hinton, 1987, despre descriptorii specifici rolului ce reprezint conjuncia unei identiti i a unui rol [prin intermediul crora] putem implementa ierarhii parte-ntreg folosind intersecia de set ca regul de compoziie. Vezi i McClelland, Rumelhart i Hinton, 1986, p. 8285, unde ceea ce pare a fi aceeai concepie este propus n termeni oarecum diferii.) Deoarece, dup cum am remarcat, aceste tipuri de idei nu au fost elaborate n literatura conexionist, o discuie detaliat nu e probabil ndreptit aici. Dar merit spus mcar un cuvnt pentru a clarifica n ce tip de problem ai intra dac ar fi s i iei n serios. Din cte nelegem noi, propunerea are ntr-adevr dou pri: pe de-o parte, s-a sugerat c, dei reprezentrile conexioniste nu pot avea constituen real, totui distincia clasic dintre simbolurile complexe i constituenii lor poate fi nlocuit cu distincia dintre seturi de trsturi i subseturi ale acestora; i, pe de alt parte, este sugerat faptul c relaiile de rol pot fi prinse de trsturi. Vom considera aceste idei pe rnd. (1) n loc de a avea simboluri complexe precum "John o iubete pe Mary" n sistemul reprezentaional, vom avea seturi de trsturi de tipul { +John-subject; +loves; +Mary-object}. ntruct acest set are pe { +John-subject},{ +loves; +Mary-object} i aa mai departe ca subseturi, se poate presupune c fora relaiei de constituen a fost prins prin implicarea relaiei subset. Totui, e clar c aceast idee nu va funciona, ntruct nu toate subseturile de trsturi corespund unor constitueni adevrai. De exemplu, ntre subseturile setului { +John-subject; +loves; +Mary-object} sunt incluse seturile {+John-subject; +Mary-object} i setul {+Johnsubject; +loves } care, bineneles, nu corespund constituenilor simbolului complex John loves Mary. (2) n loc de a defini rolurile n termeni de relaii ntre constitueni, ca n cazul arhitecturii clasice, le vom introduce ca microtrsturi. S considerm un sistem n care reprezentarea mental ce e antrenat cnd cineva se gndete c John o iubete pe Mary este setul de trsturi { +John-subject; +loves; +Maryobject}. Ce reprezentare corespunde ideii c John o iubete pe Mary i Bill o urte pe Sally? S presupunem, ntr-un mod convingtor pentru propunerea prezent, c e setul { +John-subject; +loves; +Mary-object; +Bill-subject; +hates; +Sally-object}. Acum problema este de a o distinge de ideea c John o iubete pe Sally i Bill o urte pe Mary; i de ideea c John o urte pe Mary i Bill o iubete pe Sally; i de ideea c John le urte pe Mary i pe Sally i Bill o iubete pe Mary etc., ntruct aceste credine vor corespunde toate precis aceluiai set de trsturi. Problema este, bineneles, c nimic din reprezentarea lui Mary ca +Mary-object nu specific dac ea este obiectul iubirii sau al urii; mutatis mutandis, pentru reprezentarea lui John ca +Johnsubject. Ceea ce merge prost nu e (nc) dezastruos. Nu se cere dect s se mbogeasc sistemul de reprezentri prin recunoaterea trsturilor ce corespund nu doar faptului de a fi (de ex.) subiect, ci mai degrab faptului de a fi subiect al iubirii de Mary (proprietatea lui John atunci
cnd John o iubete pe Mary) i de a fi subiect al urii de Sally (proprietatea lui Bill atunci cnd Bill o urte pe Sally). nct, reprezentarea lui John care e antrenat cnd cineva se gndete c John o iubete pe Mary i Bill o urte pe Sally ar putea fi ceva de genul +John-subject-hatesMary-object. Dezavantajul acestei propuneri este c necesit o mulime de microtrsturi. 16 Ct de multe? Un numr n jurul ordinului de mrime al propoziiilor unui limbaj natural (presupunnd c cineva s-ar putea descurca cu un vocabular al expresiilor de baz, care s nu fie cu mult mai bogat dect lexiconul unui limbaj natural; n fapt, limbajele naturale sunt mai bogate). Lsm la latitudinea cititorului s estimeze numrul microtrsturilor de care ar fi nevoie, presupunnd c exist o idee distinct, corespunztoare fiecrei propoziii gramaticale din englez care are n jur de 15 cuvinte lungime, i presupunnd c exist o medie de, s zicem, 5 roluri asociate fiecrei idei. (Sugestie: George Miller estima odat c numrul propoziiilor de 20 de cuvinte, bine structurate, din englez este de ordinul magnitudinii numrului de secunde din istoria universului.) Alternativa pentru aceast explozie grotesc de simboluri atomice ar fi s avem semantica i o sintax combinatoric pentru aceste trsturi. Dar, desigur, asta nseamn s renuni, de vreme ce relaiile sintactice i semantice dintre prile trsturii complexe + (( Johnsubject) loves (pe Mary - object )) sunt exact aceleai care se manifest n modelele clasice ntre constituenii simbolului complex John o iubete pe Mary; acestea includ relaiile de rol pe care conexionitii le propuseser pentru reconstrucie folosind doar seturi de trsturi atomice. Nu este, desigur, nici un accident c varianta conexionist de a proceda cu relaiile de rol se izbete de aceste tipuri de probleme. Subiect, obiect-complement direct i toate celelalte sunt definite n maniera clasic, respectndu-se geometria arborilor sructurii constituente. Iar reprezentrile conexioniste nu au constitueni. Ideea c ar trebui s surprindem relaii de rol permind trsturi precum John-subiect se dovedete astfel a fi falimentar; i se pare c nu exist nici un alt mod de a obine fora simbolurilor structurate ntr-o arhitectur conexionist. Sau, dac exist, nimeni nu a dat nici o indicaie despre cum se poate s o faci. Acest lucru devine clar odat ce problema crucial a structurii n reprezentrile mentale este desprit de problema relativ secundar (i ortogonal) a reprezentrii distribuite" a conceptelor uzuale (i.e., de ntrebri de tipul care din cele dou: CUP[CAN] sau are-un-mner, sau amndou, sunt semantic primitive n limbajul gndirii). Merit adugat c aceste probleme despre exprimarea relaiilor de rol sunt de fapt doar un simptom al unei dificulti mai penetrante: o consecin a restrngerii vehiculelor de reprezentare mental la seturi de simboluri atomice este o notare care aproape niciodat nu reuete s exprime felul n care conceptele se grupeaz n propoziii. Pentru a vedea acest lucru, vom continua s presupunem c avem o reea n care nodurile reprezint concepte, mai degrab dect propoziii (astfel nct ceea ce corespunde gndului c John o iubete pe Mary este o distribuire a activrii la nivelul unui set de noduri {JOHN; LOVES (IUBETE); MARY} mai degrab dect activarea unui singur nod desemnat prin JOHN LOVES MARY (JOHN O IUBETE PE MARY)). A se nota c nu se poate presupune n mod plauzibil c toate nodurile care se ntmpl s fie active la un moment dat vor corespunde conceptelor care sunt constituenii unei aceleiai propoziii; n sfrit dac arhitectura este masiv paralel astfel nct sunt permise multe lucruri nuntrul ei multe concepte sunt lsate s fie ntreinute - n mod simultan ntr-un sistem psihic dat. S ne imaginm atunci situaia urmtoare: n momentul t un om privete cerul (astfel nct nodurile corespunznd lui SKY [CER] i BLUE [ALBASTRU] sunt active) i se gndete c John l iubete pe Fido (astfel nct nodurile corespunznd lui JOHN, LOVES [IUBETE] i FIDO sunt active), iar nodul FIDO este legat de nodul DOG [CINE] (care este la rndul su legat de nodul
16
Alt dezavantaj este c, strict vorbind, nu funcioneaz: dei ne permite s distingem convingerea c John o iubete pe Mary i c Bill o urte pe Sally de convingerea c John o iubete pe Sally i Bill o urte pe Mary, nu avem nc o modalitate de a distinge credina c (John o iubete pe Mary fiindc Bill o urte pe Sally) de cea potrivit creia (Bill o urte pe Sally pentru c John o iubete pe Mary).
ANIMAL), astfel nct i DOG [CINE] i ANIMAL sunt la rndul lor active. Putem, dac dorii, susine c omul are o mncrime, astfel nct ITCH [MNCRIME] este i el activ. Potrivit teoriei n vigoare a reprezentrii mentale, mintea omului la momentul t este specificat de un vector {+ JOHN, + LOVES (IUBETE), + FIDO, + DOG (CINE), + SKY (CER), + BLUE (ALBASTRU), + ITCH (MNCRIME), + ANIMAL}. i ntrebarea este: care subvectori ai acestui vector corespund gndurilor pe care le gndete omul? Mai exact, ce determin n starea reprezentaional a omului ca activarea simultan a nodurilor, {JOHN, LOVES (IUBETE), FIDO} s constituie gndul lui c John l iubete pe Fido, dar activarea simultan a nodurilor FIDO, ANIMAL i BLUE (ALBASTRU) s nu constituie gndul lui c Fido este un animal albastru? Se pare c simplificm foarte mult cnd identificm gndul c John o iubete pe Mary cu vectorul su {+ JOHN, + LOVES (IUBETE), + MARY}; n cel mai bun caz acest lucru funcioneaz doar pentru presupunerea c JOHN, LOVES (IUBETE) i MARY sunt singurele noduri active cnd cineva gndete acel gnd. i aceasta este o presupunere la care nu este ndreptit nici o teorie a reprezentrii mentale. Este important s constatm c aceast problem se pune tocmai pentru c teoria ncearc s foloseasc seturi de reprezentri atomice pentru a realiza ceva pentru care e nevoie realmente de reprezentri complexe. Astfel, ntrebarea la care dorim s rspundem este urmtoarea: dat fiind setul total de noduri active simultan, ce poate distinge subvectorii care corespund propoziiilor de cei care nu le corespund? Aceast ntrebare are un rspuns foarte direct dac, contrar ncercrii de fa, sunt presupuse reprezentri complexe: cnd reprezentrile reprezint concepte care aparin aceleiai propoziii, ele nu sunt numai active n mod simultan, ci nc n construcie unele cu celelalte. Prin contrast, reprezentrile care exprim concepte care nu aparin aceleiai propoziii pot fi simultan active; dar ele nu sunt ipso facto n construcie una cu cealalt. Pe scurt, ai nevoie de dou grade de libertate pentru a specifica ideile pe care un sistem intenional le are la un moment dat: un parametru (activ vs inactiv) selecteaz nodurile ce exprim concepte pe care le are sistemul n minte; cellalt (n construcie vs nonconstrucie) determin n ce fel conceptele pe care le are sistemul n minte sunt distribuite n propoziiile pe care le produce. Pentru ca simbolurile s fie n construcie n acest sens trebuie ca ele s fie constitueni ai unui simbol complex. Reprezentrile care sunt n construcie formeaz pri ale unui ntreg geometric, unde relaiile geometrice sunt ele nsele semnificative semantic. Deci, reprezentarea care corespunde gndului c John l iubete pe Fido este nu un set de concepte, ci ceva asemntor unui arbore de concepte, i relaiile geometrice din interiorul acestui arbore sunt cele care marcheaz (de ex.) diferena dintre gndul c John l iubete pe Fido de gndul c Fido l iubete pe John. Ocazional am auzit sugerndu-se faptul c s-ar putea rezolva prezenta problem, n consonan cu restricia mpotriva reprezentrilor complexe, dac s-ar permite o reea de tipul: SUBJECT-OF [SUBIECT AL]
FIDO
BITES [MUC]
Conform interpretrii intenionate, gndul c Fido muc ar corespunde activrii simultane a acestor noduri; adic, vectorului {+FIDO, +SUBJECT OF, + BITES} - cu vectori similari, dar mai lungi pentru relaiile de rol mai complexe. Dar, la o examinare mai profund, aceast propunere abia dac aduce n discuie problema pe care o are de rezolvat. Pentru c, dac exist o problem n legtur cu ceea ce justific asignarea propoziiei John loves Fido drept coninut al setului {JOHN, LOVES, FIDO}, cu siguran exist aceeai problem n legatur cu ceea ce justific asignarea propoziiei Fido is
the subject of bites (Fido este subiectul mucturilor) setului {FIDO, SUBJECT-OF, BITES}. Coninutul propoziional este c Fido muc sau c John muc ? 17 Destul de surprinztor, argumentul adus de noi n ultimele paragrafe este foarte aproape de cel al lui Kant mpotriva asociaionitilor vremii sale. n Deducia transcendent a Primei Critici, Kant remarca: ...dac eu cercetez...relaia dintre modalitile de cunoatere date n orice judecat, i o disting, ca aparinnd nelegerii, de relaia corespunztoare legilor imaginaiei reproductive [de ex., potrivit principiilor asociaiei], care are doar validitate subiectiv, gsesc c o judecat nu e altceva dect maniera n care modalitile de cunoatere date sunt aduse la unitatea obiectiv a apercepiei. Acesta este lucrul intenionat prin copula is [este]. El este implicat pentru a distinge unitatea obiectiv a reprezentrilor date de cea subiectiv... Doar n acest fel din relaie apare o judecat, care este o relaie obiectiv valid, i aa poate fi distins de o relaie dintre aceleai reprezentri care ar avea doar validitate subiectiv - ca atunci cnd sunt conectate potrivit legilor asociaiei. n cel din urm caz, tot ce a putea spune ar fi If I support a body, I feel an impression of weight [Dac sprijin un corp, am o impresie de greutate]; nu a putea spune It, the body, is heavy [El, corpul, este greu]. nct a spune The body is heavy [Corpul este greu] nu nseamn doar a afirma c cele dou reprezentri au fost ntotdeauna legate n percepia mea...ceea ce asertm este faptul ca ele sunt combinate n obiect...(CPR, p.159; sublinierile i aparin lui Kant). O parafraz modern ar putea fi: O teorie a reprezentrii mentale trebuie s disting cazul n care dou concepte (de ex., THIS BODY [acest corp], HEAVY [greu]) doar apar simultan de cazul n care, n principiu, proprietatea pe care o exprim un concept este predicat (afirmat) de obiectul pe care cellalt concept l denoteaz (ca n ideea: THIS BODY IS HEAVY). Distincia relevant este c, dac ambele concepte sunt active n ambele cazuri, n cel din urm caz, dar nu i n primul, conceptele active sunt n construcie. Kant crede c acesta este lucrul intenionat prin copula is [este]. Dar bineneles c exist alte mijloace notaionale ce pot servi la specificarea faptului c aceste concepte sunt n construcie; remarcabil e structura arborilor de constituen. Exist, pentru a reitera, dou probleme la care trebuie s rspunzi pentru a specifica n ce const coninutul strii mentale: Care concepte sunt active? i Care din conceptele active sunt n construcie cu care altele ? Identificarea strilor mentale cu seturile de noduri active ofer resurse pentru a rspunde la prima, dar nu i la a doua din aceste ntrebri. Este motivul pentru care acea versiune a teoriei reelei care postuleaz seturi de reprezentri atomice dar nu i de reprezentri complexe nu reuete, ntr-un numr mare de cazuri, s disting ntre stri mentale care sunt de fapt distincte. Dar noi nu afirmm c nu se poate reconcilia o arhitectur conexionist cu o teorie adecvat a reprezentrilor mentale (n mod specific cu o semantic i sintax combinatoric a reprezentrilor mentale). Din contr, bineneles c se poate: tot ceea ce se cere este s foloseti o reea pentru a implementa o main Turing, i s specifici o structur combinatoric pentru
17
n acest punct este important n mod special s nu facem greeala de a confunda diagramele reelelor conexioniste cu diagramele structurii constituente (vezi seciunea 2.1.2 de mai sus). A conecta SUBJECT-OF cu FIDO i BITES nu nseamn c atunci cnd toate acestea trei sunt activate FIDO este subiectul lui BITES. O diagram a reelei nu e o specificare a structurii interne a unei reprezentri mentale complexe. Mai degrab, e o specificare a unui pattern de dependene cauzale ntre stri de activare ale nodurilor. Conectivitatea ntr-o reea determin care seturi de noduri activate simultan sunt posibile; dar nu are semnificaie semantic. Diferena ntre legturile dintre nodurile pe care le prezint diagramele reelelor i legturile dintre nodurile diagramelor structurii constituente este exact aceea c cele din urm, dar nu i primele, specific parametri ai reprezentrilor mentale. (n particular, ele specific relaii parte/ntreg ntre constituenii simbolurilor complexe). n timp ce teoriile reelelor definesc interpretrile semantice pe baza unor seturi de reprezentri de concepte (interconectate cauzal), teoriile care recunosc simbolurile complexe definesc interpretrile semantice pe baza unor seturi de reprezentri ale conceptelor mpreun cu specificaiile relaiilor de constituen care se stabilesc ntre aceste reprezentri.
limbajul su computaional. Ceea ce se pare c nu poi realiza, totui, este s ai att un sistem reprezentaional combinatoric ct i o arhitectur conexionist la nivel cognitiv.
2.2 Operaii sensibile la structur

Att clasicitii ct i conexionitii ofer explicaii ale proceselor mentale, dar teoriile lor difer semnificativ. n particular, teoria clasic se bazeaz pe concepia de form logico/sintactic a reprezentrilor mentale, pentru a defini ariile i domeniile operaiilor mentale. Aceast concepie este, totui, absent la conexionitii ortodoci, deoarece presupune c exist reprezentri mentale nonatomice. Concepia clasic despre procesele mentale se bazeaz pe dou idei, fiecare corespunznd unui aspect al teoriei clasice a computaiei. mpreun, ele explic de ce viziunea clasic postuleaz cel puin trei niveluri distincte de organizare n sistemele computationale: nu doar un nivel fizic i un nivel semantic (sau al cunoaterii), dar i un nivel sintactic. Prima idee este c e posibil s construieti limbaje n care anumite trsturi ale structurilor sintactice ale formulelor corespund sistematic anumitor trsturi semantice. Intuitiv, ideea este c n astfel de limbaje sintaxa unei formule codeaz sensul su; n special, acele aspecte ale sensului care i determin rolul su n inferen. Toate limbajele artificiale care sunt folosite pentru logic au aceast proprietate i limba englez le are i ea, mai mult sau mai puin. Clasicitii cred c aceasta este o proprietate crucial a limbajului gndirii. Un exemplu simplu al modului n care limbajul poate utiliza structura sintactic pentru a coda roluri i relaii infereniale ntre sensuri poate fi util pentru ilustrarea acestui fapt. Deci, s considerm relaia dintre urmtoarele dou propoziii: (1) John went to the store and Mary went to the store. (John a mers la magazin i Mary a mers la magazin.) (2) Mary went to the store. (Mary a mers la magazin.) Desigur, inferenele de la (1) la (2) conserv valoarea de adevr. Pe de alt parte, din punct de vedere sintactic, (2) e un constituent al lui (1). Aceste dou lucruri pot fi aduse la un numitor comun exploatnd principiul c propoziiile cu structura sintactic (S1 i S2)S determin constituenii propoziiei. Observai c acest principiu face legtura dintre sintaxa acestor propoziii i rolurile lor infereniale. Observai, de asemenea, c totul se bazeaz pe realiti ale gramaticii limbii engleze; lucrurile n-ar fi funcionat ntr-un limbaj n care formularea care exprim coninutul conjunctiv John went to the store and Mary went to the store ar fi atomic din punct de vedere sintactic.18 S considerm un alt exemplu. Putem reconstrui astfel de inferene care conserv valoarea de adevr, cum ar fi if Rover bites then something bites pe baza presupunerii c (a) propoziia Rover bites este de tipul sintactic Fa, (b) propoziia something bites este de tipul sintactic x (Fx) i (c) fiecare formulare de primul tip determin o formulare corespunztoare de cel de-al doilea tip (unde noiunea formulare corespunztoare este relativ la sintax; n mare, cele dou formulri trebuie s difere doar prin faptul c una dintre ele conine o variabil legat existenial n poziia sintactic ocupat de o constant n cealalt). nc o dat, ideea care trebuie observat este amestecarea noiunilor sintactice cu cele semantice: regula generalizrii existeniale se aplic formulrilor n virtutea formei lor sintactice. Dar proprietatea remarcabil
Aceasta nu funcioneaz uniform pentru conjunciile din limba englez. Comparai: John and Mary are friends John are friends; sau The flag is red, white and blue The flag is blue. Astfel de cazuri arat fie c limba englez nu este limbajul gndirii, fie c, dac este, relaia dintre sintax i semantic este mult mai subtil pentru limbajul gndirii dect este pentru limbajele logice standard.
18
care se pstreaz n urma aplicrii regulii este semantic: ceea ce se afirm n legtur cu transformarea realizat de regul este faptul c aceasta conserv valoarea de adevr.19 Exist, ns, i exemple care sunt mult mai complicate dect acestea. ntreaga ramur a logicii cunoscut drept teoria demonstraiei e dedicat explorrii acestora. 20 Nu ar fi rezonabil s descriem tiina cognitiv clasic drept o ncercare extins de a aplica metodele teoriei demonstraiei asupra modelrii gndirii (i n mod similar asupra oricror altor procese mentale care sunt vzute, n mod plauzibil, ca implicnd inferene; n special nvarea i percepia). Construcia teoriei clasice se bazeaz pe sperana c analogii sintactici pot fi construii pentru inferene nondemonstrative (sau pentru raionarea informal, uzual) ntr-un mod asemntor celui n care teoria demonstraiei a pus la dispoziie analogi sintactici pentru validitate. A doua idee principal care st la baza concepiei clasice despre procesele mentale este c e posibil s se proiecteze maini ale cror funcie este transformarea simbolurilor, i ale cror operaii sunt sensibile la structura sintactic a simbolurilor asupra crora opereaz. Aceasta este concepia clasic despre computer: este ceea ce au n comun toate tipurile variate de arhitecturi care provin din mainile Turing sau Von Neumann. Poate c este evident modul n care cele dou idei principale se potrivesc una cu cealalt. Dac, n principiu, relaiile sintactice pot fi fcute paralele cu relaiile semantice, i dac, n principiu, poi avea un mecanism ale crui operaii asupra formulelor sunt sensibile la sintaxa acestora, atunci poate fi posibil de construit o main care s fie acionat sintactic, ale crei tranziii de stare s satisfac criteriile semantice de coeren. O astfel de main ar fi exact ceea ce se cere unui model mecanic al coerenei semantice a gndirii; n mod corespunztor, ideea c creierul este o astfel de main este ipoteza de la baza tiinei cognitive clasice. i cam att despre povestea clasic a proceselor mentale. Povestea conexionist trebuie s fie, bineneles, diferit. ntruct conexionitii se abin de la a postula reprezentri mentale cu o structur combinatoric sintactic/semantic, ei sunt exclui de la postularea proceselor mentale care opereaz asupra reprezentrilor mentale ntr-un mod care e sensibil la structura acestora. Tipurile de operaii pe care le au modelele conexioniste sunt de dou feluri, depinznd de procesul n discuie, care este fie nvarea, fie raionamentul. 2.2.1. nvarea
19
N-ar fi obligatoriu, oricum, ca exact conservarea valorii de adevr s fac aspectul sintactic relevant pentru cogniie. Alte proprieti semantice ar putea fi conservate n urma transformrii sintactice pe parcursul procesrii mentale - de exemplu, garanie, plauzibilitate, valoare euristic sau pur i simplu non-arbitraritate semantic. Ideea modelrii clasice nu este caracterizarea gndirii umane, n mod suprem, drept logic; mai degrab este demonstrarea felului n care o familie de tipuri de raionri coerente semantic (sau dependente de cunotine) este posibil din punct de vedere mecanic. Inferena valid este o paradigm numai prin aceea c este cel mai bine neles membru al familiei sale; cel pentru care analogiile sintactice pentru relaiile semantice au fost elaborate ct mai sistematic.
20
Nu este neobinuit pentru conexioniti s fac remarci peiorative n legtur cu relevana logicii pentru psihologie, dei ei accept ideea c inferena este implicat n raionare. Uneori, sugestia pare s fie c, dei conexionismul nu poate reconstrui acea teorie a inferenei pe care o furnizeaz logica formal deductiv, totul este n regul, atta timp ct el are de oferit ceva mult mai bun. De exemplu, n raportul lor pentru U.S. National Science Foundation, McClelland, Feldman, Adelson, Bower & McDermott (1986) afirm c ...modelele conexioniste realizeaz o logica evidenial (verificat) n contrast cu logica simbolic a modului de calcul convenional (sublinierea ne aparine) i c logicile evideniale devin din ce n ce mai importante n tiina cognitiv i au un corespondent natural n modelarea conexionist (p. 7). Este oricum greu de neles contrastul implicit, de vreme ce, pe de o parte, logica evidenial trebuie s fie, cu siguran, o extensie destul de conservativ a logicii simbolice a modului de calcul convenional (de exemplu, cele mai multe din teoremele celei din urm trebuie s fie demonstrate ca adevrate de ctre prima) i, pe de alt parte, nu este nici cel mai mic motiv s ne ndoim c o logica evidenial va rula pe o main clasic.
Dac un model conexionist este conceput pentru nvare, vor exista procese care s determine ponderile conexiunilor dintre unitile sale n funcie de caracterul antrenamentului su. n mod tipic, ntr-o main conexionist (ca maina Boltzman) ponderile conexiunilor sunt ajustate pn cnd comportamentul sistemului ajunge s modeleze proprietile statistice ale inputurilor sale. La limit, relaiile stohastice dintre strile mainii recapituleaz relaiile stohastice dintre evenimentele mediului pe care le reprezint. Acest lucru ar trebui s ne aminteasc de vechiul principiu asociaionist, care spune c tria asociaiilor dintre idei este o funcie a frecvenei cu care ele formeaz perechi n experien, i de principiul teoriilor nvrii, care afirm c tria conexiunii stimul-rspuns este o funcie a frecvenei cu care rspunsul este ntrit n prezena stimulului. Dar dei conexionitii, ca i ali asociaioniti, sunt devotai proceselor de nvare care modeleaz proprietile statistice ale inputurilor i outputurilor, mecanismele simple bazate pe statistici de co-ocuren, care au fost semnul distinctiv al asociaionismului de mod veche, au fost augmentate n modelele conexioniste de un numr de procedee tehnice. (De aici elementul nou al neoconexionismului). De exemplu, unele din limitrile anterioare ale mecanismelor asociative au fost depite prin faptul c reelelor li s-a permis s conin uniti (sau ansambluri de uniti) ascunse, care nu sunt direct conectate la mediu i al cror scop este, de fapt, s detecteze patternurile statistice din activitatea unitilor vizibile incluznd, poate, patternuri care sunt mai abstracte sau mai globale dect cele care au putut fi detectate de perceptronii de mod veche. 21 Pe scurt, versiuni sofisticate ale principiilor asociative pentru ajustarea ponderii sunt oferite de ctre literatura conexionist. Totui, problema abordrii prezente o constituie ceea ce toate versiunile acestor principii au n comun unele cu altele i cu tipuri mai vechi de asociaionism: anume, toate aceste procese sunt sensibile la frecven. Pentru a ne ntoarce la exemplul discutat anterior: dac o main conexionist pentru nvare converge ntr-o stare n care este pregtit s infereze A din A&B (de ex., o stare care, cnd nodul A&B este excitat, tinde s se transforme ntr-o stare n care nodul A este excitat) convergena va fi cauzat n mod tipic de proprietile statistice ale experienei de nvare a mainii: de ex., prin corelaia ntre activarea nodului A&B i activarea nodului A, sau prin corelaiile dintre activrile ambelor noduri i un semnal de feedback. Ca i asociaionismul clasic, conexionismul consider nvarea ca fiind n esen un gen de modelare statistic. 2.2.2. Raionamentul Asociaia opereaz pentru a altera structura unei reele n mod diacronic, n funcie de experiena sa. Modelele conexioniste conin, de asemenea, o varietate de tipuri de procese de relaxare care determin comportamentul sincronic al unei reele: n mod specific, ele determin ce output ofer mecanismul pentru un pattern dat de inputuri. n aceast privin, cineva se poate gndi la un model conexionist ca la un tip de main analoag construit pentru a realiza o anumit funcie. Inputurile funciei sunt (i) o specificare a conectivitii mainii (a nodurilor care sunt interconectate); (ii) o specificare a poderilor legturilor; (iii) o specificare a valorilor unei varieti de parametri idiosincratici ai nodurilor (de ex., praguri intrinseci; timpul de la ultima activare etc.) (iv) o specificare a patternului de excitare a nodurilor input. Outputul funciei este o specificare a unui pattern de activare a nodurilor output; intuitiv, maina alege patternul output care este cel mai puternic asociat cu inputul su. n mare msur aparatul matematic sofisticat al teoretizrii conexioniste a fost devotat proiectrii de soluii analoage pentru problema gsirii celui mai puternic asociat output corespunznd unui input arbitrar; dar, din nou, detaliile nu trebuie s ne preocupe. Ceea ce e important, pentru scopurile noastre, este o alt proprietate pe care teoriile conexioniste o au n
21
A se compara micii s i micii r ai asociaionitilor mediaionali de formaie neohullean, precum Charles Osgood.
comun cu alte forme de asociaionism. n asociaionismul tradiional, probabilitatea c o idee va scoate la iveal o alta este sensibil la tria asociaiei dintre ele (incluznd i asociaii mediatoare, dac exist). i tria acestei asocieri este la rndul su sensibil la msura n care ideile au fost anterior corelate. Tria asociativ nu a fost, totui, socotit sensibil la trsturile coninutului sau la structura reprezentrilor per se. n mod similar, n modelele conexioniste, selecia unui output corespunztor unui input dat este o funcie a proprietilor legturilor dintre ele (incluznd ponderile, strile unitilor intermediare etc.) i ponderile, la rndul lor, sunt o funcie a proprietilor statistice ale evenimentelor din mediu (sau a relaiilor dintre patternuri de evenimente din mediu i predicii implicite fcute de ctre reea etc.). Dar structura sintactic/semantic a reprezentrii unui input nu se presupune c ar fi un factor n determinarea seleciei unui output corespunztor, ntruct, dup cum am vzut, structura sintactic/semantic nu este definit pentru tipurile de reprezentri pe care le recunosc modelele conexioniste. Pentru a sumariza: teoriile clasice nu sunt de acord cu cele conexioniste n legtur cu natura reprezentrilor mentale; pentru primele, dar nu i pentru cele din urm, reprezentrile mentale prezint n mod caracteristic o structur constituent combinatoric i o semantic tot combinatoric. Teoriile clasice nu cad de acord cu cele conexioniste nici n legtur cu natura proceselor mentale; cele dinti, spre deosebire de celelalte, consider procesele mentale ca fiind sensibile la structura combinatoric a reprezentrilor asupra crora opereaz. Considerm c aceste dou chestiuni definesc disputa prezent legat de natura arhitecturii cognitive. Ne propunem acum s argumentm c n ambele probleme conexionitii greesc.
3. NEVOIA DE SISTEME SIMBOL: PRODUCTIVITATE, SISTEMATICITATE, COMPOZIIONALITATE I COE-REN INFERENIAL

Teoriile psihologice clasice apeleaz la structura constituent a reprezentrilor mentale pentru a explica trei trsturi strns legate ale cogniiei: productivitatea sa, compoziionalitatea sa i coerena sa inferenial. Argumentul tradiional a fost c aceste trsturi ale cogniiei sunt, pe de-o parte, pervasive i, pe de alt parte, explicabile doar pe baza asumpiei c reprezentrile mentale au structur intern. Acest argument - familiar n versiuni mai mult sau mai puin explicite ale ultimilor peste treizeci de ani - este nc intact, dup prerea noastr. El pare s ofere ceva apropiat unei demonstraii a faptului c o teorie cognitiv adecvat din punct de vedere empiric trebuie s recunoasc nu doar relaii cauzale ntre stri reprezentaionale, dar i relaii de constituen sintactic i semantic; nct psihicul nu poate fi, n structura sa general, o reea conexionist.
3.1 Productivitatea gndirii

Exist un argument clasic al productivitii, adus n favoarea existenei unei structuri combinatorice n orice sistem reprezentaional bogat (inclusiv n limbajele naturale i n limbajul gndirii). Capacitile reprezentaionale ale unui astfel de sistem sunt, se presupune, nelimitate, n aceast idealizare; n particular exist un numr nedefinit de propoziii pe care sistemul le poate coda.22 Totui, aceast capacitate expresiv nelimitat trebuie c poate fi obinut prin mijloace
22
Formulat n acest mod, argumentul productivitii poate fi identificat cu teza lui Chomsky (1965, 1968). Totui, nu este necesar ca argumentul s se bazeze pe asumpia fundamental a unei capaciti generative infinite. Capacitatea generativ infinit poate fi vzut ,n schimb, ca o consecin sau ca un corolar al unor teorii, formulate astfel nct s surprind un numr maxim de generalizri cu ajutorul unui numr minim de principii independente. De fapt, cel mai neutru demers poate fi formulat n spiritul a ceea ce vom propune n continuare. Am folosit formularea prezent din raiuni expozitorii i istorice.
finite. Modul de a realiza acest lucru este cel de a trata sistemul de reprezentri ca i cum ar consta din expresii aparinnd unui set generat. Mai precis, corespondena ntre o reprezentare i propoziia pe care o exprim este, n multe cazuri n mod arbitrar, construit recursiv nafara corespondenelor ntre pri ale expresiei i pri ale propoziiei. Dar, desigur, aceast strategie poate opera doar atunci cnd un numr nelimitat de expresii sunt non-atomice. Aa nct reprezentrile lingvistice (i mentale) trebuie s constituie sisteme simbol (n sensul notei 8). Deci psihicul nu poate fi constituit din procesri paralele distribuite. Foarte adesea, cnd oamenii resping acest mod de a raiona, este din cauz c ei se ndoiesc de aprecierea corect a capacitilor cognitive umane ca fiind productive. Nu pot exista argumente a priori pentru (sau mpotriva) idealizrii acestor capaciti drept capaciti productive; a accepta idealizarea depinde de faptul de a crede c inferena de la performan finit la capacitate finit este justificat, sau a crede c performana finit este n mod tipic rezultatul interaciunii unei competene nelimitate cu constrngerile resurselor. Clasicitii au oferit n mod tradiional un amestec de consideraii metodologice i empirice n favoarea celei din urm perspective. Sub aspect metodologic, minimumul ce poate fi spus pentru a presupune productivitatea este c ea exclude soluii bazate pe stratageme necorespunztoare (cum ar fi stocarea tuturor perechilor care definesc o funcie); stratageme care ar fi irealizabile practic chiar i pentru rezolvarea unor sarcini finite, care impun solicitri suficient de mari memoriei. Idealizarea unei capaciti productive nelimitate foreaz teoreticianul s separe specificarea finit a unei metode de rezolvare a problemei computaionale de factori precum resursele pe care sistemul (sau persoana) le pune la dispoziia problemei n orice moment. Argumentele empirice ale productivitii au fost cel mai adesea concepute n conexiune cu competena lingvistic. Ele sunt familiare prin scrierile lui Chomsky (1968), care a afirmat (convingtor, dup prerea noastr) despre cunoaterea ce st la baza competenei lingvistice c este generativ - adic ne permite n principiu s generm (/nelegem) un numr nelimitat de propoziii. Fr a spune c nimeni nu poate, sau n-ar putea de fapt s pronune sau s neleag mai multe simboluri dect cele ale unui numr finit de propoziii; aceasta este o consecin banal a faptului c nimeni nu poate s pronune sau s neleag mai mult dect un numr finit de simboluri propoziionale. Dar exist un numr de consideraii care sugereaz c, n ciuda constrngerilor de facto impuse performanei, cunotinele cuiva despre propriul limbaj sprijin o capacitate productiv nelimitat cam n acelai fel n care cunotinele despre adunare susin un numr nelimitat de sume. Printre aceste consideraii este, de exemplu, i faptul c performana unui vorbitor asculttor poate fi mbuntit prin slbirea constrngerilor temporale, creterea motivaiei sau punerea la dispoziie de creion i hrtie. Pare foarte natural s consideri c astfel de manipulri afecteaz starea tranzitorie a memoriei i ateniei vorbitorului, mai degrab dect cunotinele sale despre - sau modul n care el i reprezint - propriul limbaj. Dar acest mod de a vedea lucrurile este valabil doar pornind de la asumpia c natura performanei subiectului este determinat de interaciunea dintre baza de cunotine disponibile i resursele computaionale disponibile. Teoriile clasice sunt n stare s accepte aceste tipuri de consideraii, deoarece presupun arhitecturi n care exist o distincie funcional ntre memorie i program, ca, de exemplu, n cazul mainii Turing. Prin contrast, ntr-un automat cu stri finite sau ntr-o main conexionist, adugarea unor elemente noi la memorie (de ex., prin adugarea de noduri la o reea) duce la alterarea relaiilor de conectivitate dintre noduri i astfel afecteaz structura computaional a mainii. Arhitecturile cognitive conexioniste nu pot, prin nsi natura lor, s susin o memorie expandabil, deci nu pot susine nici capaciti cognitive productive. Rezult c, dac sunt luate n considerare argumentele productivitii, arhitectura psihicului nu poate fi de tip conexionist. Conexionitii nii au recunoscut acest lucru; de aceea ei au fost forai s resping argumentele productivitii.
Testul unei bune idealizri tiinifice este pur i simplu faptul de a avea producii tiintifice de succes pe termen lung. Ni se pare c idealizarea productivitii i-a ctigat toate drepturile, n special n lingvistic i n teoriile raionamentului. Conexionitii, totui, nu au fost convini. De exemplu, Rumelhart i McClelland (1986a, p.119) spun c ... nu suntem de acord c esena procesrii de informaie de ctre psihicul uman o reprezint capacitile [productive]. Cum poate arta oricine care a ncercat vreodat s proceseze propoziii precum The man the boy the girl hit kissed moved, capacitatea noastr de a procesa chiar grade moderate de structuri imbricate (center-embedded structure) este puternic afectat relativ la un analizator ATN [Augmented Transition Network]... Ceea ce este necesar, deci, nu e un mecanism pentru procesarea fr imperfeciuni i fr efort a construciilor imbricate... Provocarea const n a explica n ce fel acele procese pe care alii au ales s le explice n termeni de mecanisme recursive pot fi mai bine explicate de ctre acele tipuri de procese naturale pentru reelele PDP. Aceste remarci sugereaz c Rumelhart i McClelland consider dificultatea propoziiilor imbricate drept un impediment pentru teoriile care vd capacitile lingvistice ca fiind productive. Dar bineneles c nu este un impediment, atta timp ct, n acord cu aceste teorii, performana este un efect al interaciunilor ntre o competen productiv i resurse restrnse. Exist, de fapt, demersuri clasice destul de plauzibile ce motiveaz de ce asemenea imbricri (centerembeddings) trebuie s impun anumite cerine dificile resurselor, i exist o cantitate considerabil de dovezi experimentale n sprijinul acestor modele (vezi, spre exemplu, Wanner & Maratsos, 1978). n orice caz, ar trebui s fie clar c dificultatea de a analiza imbricrile (centerembeddings) nu poate fi o consecin a recursivitii lor per se, atta timp ct exist multe structuri recursive care sunt surprinztor de uor de neles. S considerm fraza: acesta este cinele care a fugrit pisica ce a mncat obolanul care a trit n casa pe care a construit-o Jack. Argumentul clasic n favoarea capacitilor productive de analiz se bazeaz pe transparena unor propoziii de acest fel.23 Pe scurt, faptul c propoziiile imbricate ( center embedded) sunt tari indic probabil c exist unele structuri recursive pe care nu le putem analiza. Dar ipoteza de care au nevoie Rumelhart i McClelland pentru a nega productivitatea capacitilor lingvistice este aceea, mult mai tare, c nu exist nici o structur recursiv pe care o putem analiza; iar aceast ipotez mai tare ar aprea ca fiind pur i simplu fals. Cu toate acestea, discuia lui Rumelhart i McClelland despre recursivitate (pp. 119-120) merit o atenie sporit. Ei par s fie pregtii s admit c PDP-urile pot modela capaciti recursive numai indirect - adic, prin implementarea unor arhitecturi clasice cum ar fi ATN-urile; aa nct, n cazul n care cunoaterea uman ar prezenta capaciti recursive, aceasta ar fi suficient pentru a arta c sistemele psihice au mai degrab o arhitectur clasic dect una conexionist. "Noi nu am continuat cu implementri PDP de maini Turing i motoare de procesare recursive, deoarece noi nu suntem de acord cu cei care argumenteaz c asemenea capaciti in de esena computaiei umane" (p.119, sublinierea noastr). Argumentul lor relativ la capacitile recursive care nu in "de esena computaiei umane" const, oricum, numai din materialul neconvingtor despre imbricare ( center-embedding) citat mai sus. Aa nct punctul de vedere al lui Rumelhart i McClelland pare a fi acela c dac presupunem ca fiind - n mod independent - evident faptul c unele capaciti cognitive sunt
23
McClelland i Kawamoto (1986) discut acest tip de recursivitate pe scurt. Sugestia lor pare a fi ca n analiza unor astfel de propoziii recursive s se detecteze contextul local al expresiilor. O reprezentare de acest fel poate fi suficent pentru a ne permite s reconstruim legturile corecte ale substantivelor cu verbele i prepoziiile din studiul substantivelor i verbelor nvecinate (p. 324; sublinierea ne aparine). Nu este ns nici pe departe adevrat c toate relaiile gramaticale relevante semantic, ce sunt uor inteligibile n propoziiile imbricate, ar fi locale n structura de suprafa. S lum n considerare propoziii de tipul " Unde a spus omul care are pisica ce a urmrit obolanul care a speriat-o pe fat c urmeaz s se mute (X)?" sau " Ce a spus fata pe care copiii o ascult cu plcere c a promis prietenilor ti c le va citi (X)?" Este de notat faptul c n asemenea exemple elementul de legtur (scris cu caractere italice) poate fi arbitrar mutat din poziia a crei interpretare o controleaz (marcat cu "X") fr a modific sensul propoziiei.
productive, atunci ar trebui s considerm existena acestor capaciti ca argument n favoarea arhitecturii cognitive clasice i, deci, putem trata conexionismul ca, cel mult, o teorie implementaional. Credem c aceasta este o interpretare destul de plauzibil a consecinelor pe care aspectele legate de productivitate i recursivitate le au asupra problemelor arhitecturii cognitive; n seciunea 4 ne vom ntoarce la sugestia c modelele conexioniste pot fi interpretate n mod plauzibil ca modele ale implementrii arhitecturii clasice. ntre timp, oricum, propunem s punem n discuie statutul argumentelor productivitii n arhitecturile clasice; urmeaz s prezentm un argument de tip diferit pentru ipoteza c reprezentrile mentale necesit o structur intern articulat. Aceasta este puternic legat de argumentul productivitii, dar nu necesit idealizarea ctre o competen nelimitat. Presupunerile ei ar trebui astfel s fie acceptabile chiar i pentru teoreticieni care - ca i conexionitii - consider caracterul finitistic (finitistic) al capacitilor cognitive intrinsec arhitecturii lor.
3.2 Sistematicitatea reprezentrii cognitive

Forma argumentului este aceasta: indiferent de natura realmente productiv sau nonproductiv a capacitilor cognitive, pare indubitabil faptul c ele sunt ceea ce vom numi capaciti 'sistematice'. i vom vedea c sistematicitatea cunoaterii furnizeaz, la fel de bine ca i productivitatea cunoaterii, un motiv pentru postularea structurii combinatorice n reprezentarea mental: se obine, ca efect, aceeai concluzie, dar pornind de la o premis mai slab. Cea mai uoar cale de nelegere a ceea ce cuprinde sistematicitatea capacitilor cognitive este de a ne ndrepta atenia spre sistematicitatea nelegerii limbajului i a producerii limbajului. De fapt, argumentul de sistematicitate pentru structurile combinatorice din gndire reitereaz exact argumentul structuralist tradiional cu privire la structura constituent a propoziiilor. Dar ne oprim acum cu remarcile asupra unui punct pe care l vom trata mai amnunit mai trziu; capacitatea lingvistic este o paradigm a cunoaterii sistematice, dar este foarte improbabil c acesta este singurul exemplu. Din contr, exist toate motivele s credem c sistematicitatea este o trstur universal profund a gndirii umane i infraumane. Cnd spunem despre capacitile lingvistice c sunt sistematice nelegem faptul c abilitatea de a produce/nelege unele propoziii este conectat intrinsec cu abilitatea de a produce/nelege alte propoziii. Puterea acestei conexiuni se poate vedea dac se compar nvarea limbajelor n modul n care noi le nvm efectiv, cu nvarea unui limbaj prin memorarea unui volum enorm de fraze. Chestiunea nu este c volumele de fraze sunt finite i, ca urmare, permit specificarea exhaustiv doar a limbajelor non-productive; acest lucru e adevrat, dar noi ne-am propus s nu ne bazm pe argumente de productivitate pentru scopurile noastre actuale. Prerea noastr e mai degrab aceea c se poate nva orice parte a unui volum de fraze fr nvarea restului. Astfel, n modelul volumului de fraze, ar fi perfect posibil s nvm c pronunarea formei cuvintelor "Granny's cat is on Uncle Arthur's mat" [Pisica bunicii st pe covoraul unchiului Arthur] este modul de a spune (n limba englez) c pisica bunicii st pe covoraul unchiului Arthur, i totui s nu avem nici o idee despre cum s spunem c plou (sau, n context, c pisica unchiului Arthur st pe covoraul bunicii). Probabil este de la sine neles c scenariul cu volumul de fraze trateaz greit nvarea limbajelor, deoarece cunotinele unui vorbitor despre limba sa matern nu sunt niciodat de acest fel. De exemplu, nu vom gsi un vorbitor nativ care s tie s spun (n englez) c John o iubete pe fat, dar s nu tie cum s spun (n englez) c fata l iubete pe John. S observm, n trecere, c sistematicitatea este o proprietate a stpnirii sintaxei unui limbaj. i s ne imaginm cum ar fi s nvei vocabularul limbii engleze aa nct atunci cnd nvei vocabularul limbii engleze s dobndeti o mulime de aptitudini fundamental independente. Aa ai putea foarte bine s nvei c folosirea expresiei "cat" [pisic] este modul n
care te referi la pisici i, totui, s nu ai nc idee c folosind expresia "conifer foios" te referi la coniferele foioase. Sistematicitatea, ca i productivitatea, este tipul de proprietate a aptitudinilor cognitive pe care ai putea s-o scapi din vedere dac te concentrezi asupra psihologiei nvrii i a listelor de cutare. Exist, aa cum am remarcat, un argument direct (i destul de tradiional) din partea sistematicitii capacitii lingvistice, n favoarea concluziei c propoziiile trebuie s aib o structur sintactic i (una) semantic: dac presupunem c propoziiile sunt formate din cuvinte i expresii, i c multe secvene diferite de cuvinte pot fi expresii de acelai tip, faptul c o anumit formulare este o propoziie a limbajului va implica adesea c i alte formulri trebuie s fie la fel: de fapt, sistematicitatea decurge din postularea structurii constituente. S presupunem, de exemplu, c avem o regul n limba englez care spune c formulele cu structura constituent 'NP Vt NP' sunt corect formate; considerm c 'John' i 'the girl' sunt NP-uri i 'loves' este un Vt. Rezult din aceste ipoteze c 'John loves the girl', 'the girl loves the girl' i 'the girl loves John' trebuie s fie toate propoziii. Rezult, de asemenea, c oricine i nsuete gramatica limbii engleze trebuie s aib aptitudini lingvistice care sunt sistematice relativ la aceste propoziii; el nu poate dect s presupun c toate sunt propoziii dac presupune c vreuna dintre ele este. S comparm aceast situaie cu cea n care toate propoziiile din limba englez sunt atomice. Atunci nu exist nici o analogie structural ntre 'John loves the girl' i 'the girl loves John' i, deci, nici un motiv pentru care nelegerea unei propoziii s implice i nelegerea celeilalte; nu mai mult dect nelegerea termenului 'iepure' implic nelegerea termenului 'copac'. 24 n ideea c propoziiile sunt atomice, sistematicitatea capacitilor lingvistice reprezint un mister; n ideea c acestea au o structur constituent, sistematicitatea capacitilor lingviste este exact acel lucru la care ne-am atepta. Deci ar trebui s preferm ultima variant. Observai c acest argument pentru o structur constituent a propoziiei poate fi adus fr a fi necesar idealizarea unor aptitudini computaionale astronomice. Exist argumente de productivitate pentru structura constituent, dar ele sunt n legtur cu abilitatea noastr - n principiu - de a nelege propoziii de lungime arbitrar. Sistematicitatea, prin contrast, apeleaz la premise mult mai familiare, cum ar fi consideraii ca cele menionate anterior, c nici un vorbitor nu nelege grupul de cuvinte 'John loves the girl' dac nu nelege i grupul de cuvinte 'the girl loves John'. Presupunerea c aptitudinile lingvistice sunt "n principiu" productive este una pe care un conexionist ar putea s refuze s-o garanteze. Dar c acestea sunt sistematice de fapt nimeni nu poate nega n mod convingtor. Putem acum, n sfrit, s ajungem la ideea principal: argumentul adus de sistematicitatea capacitilor lingvistice n favoarea structurii constituente a propoziiei este destul de clar. Dar i gndirea este sistematic la rndul ei , deci exist un argument exact paralel adus de sistematicitatea gndirii n favoarea structurii sintactice i semantice a reprezentrilor mentale. Ce nelegem atunci cnd spunem c gndirea e sistematic? Ei bine, la fel cum nu putei gsi oameni care s poat nelege propoziia 'John loves the girl' dar nu i 'the girl loves John', nu vei gsi oameni care gndesc c John o iubete pe fat, dar care nu pot gndi c fata l iubete pe John. ntr-adevr, n cazul organismelor verbale sistematicitatea gndirii rezult din sistematicitatea limbajului, dac presupunem - ca cei mai muli psihologi - c nelegerea unei propoziii presupune asmiliarea ideii pe care aceasta o exprim; pe baza acestei presupuneri, nimeni nu ar putea nelege ambele propoziii despre John i fat dac n-ar fi capabil s gndeasc ambele afirmaii despre John i fat. Dar dac abilitatea de a gndi c John o iubete pe fat este intrinsec legat de abilitatea de a gndi c fata l iubete pe John, acest fapt ar trebui cumva explicat. Pentru un reprezentaionalist (cum, aa cum am vzut, sunt conexionitii) explicaia este evident:
24
Vezi Pinker (1984, Capitolul 4) pentru dovezi despre faptul c niciodat copiii nu trec printr-o etap n care fac distincie ntre structurile interne ale NP-urilor n funcie de poziia acestora (subiect sau obiect); dialectele pe care le vorbesc copiii sunt ntotdeauna sistematice n raport cu structurile sintactice care apar...
abordarea gndurilor necesit ca acestea s fie n stri reprezentaionale (adic, necesit reprezentri mentale simbolice). i, la fel cum sistematicitatea limbajului arat c trebuie s existe relaii structurale ntre propoziia 'John loves the girl' i propoziia 'The girl loves John', la fel arat sistematicitatea gndirii c trebuie s existe relaii structurale ntre reprezentarea mental care corespunde gndului c John o iubete pe fat i reprezentarea mental care corespunde gndului c fata l iubete pe John; 25 i anume, cele dou reprezentri mentale, ca i cele dou propoziii, trebuie s fie construite din aceleai pri componente . Dar dac aceast explicaie e corect, (i nu par a fi i altele disponibile), atunci reprezentrile mentale au o structur intern i exist un limbaj al gndirii. Atunci arhitectura minii nu este o reea conexionist. 26 Pentru a rezuma discuia de pn acum: argumentele productivitii deduc structura intern a reprezentrilor mentale din presupunerea faptului c nimeni nu are o competen intelectual finit. Prin contrast, argumentele sistematicitii deduc structura intern a reprezentrilor mentale din faptul evident c nimeni nu are o competen intelectual punctat (punctate). Aa cum nu gsii aptitudini lingvistice care s consiste din abilitatea de a nelege aizeciiapte de propoziii fr legtur ntre ele, la fel nu vei gsi capaciti cognitive care s consiste n abilitatea de a gndi aptezeciipatru de idei diferite. Noi afirmm c nu este, n nici un caz, un accident: o teorie lingvistic care a admis posibilitatea limbajelor punctate nu s-ar fi dovedit doar greit ci profund greit. Fapt similar i pentru o teorie cognitiv care ar admite posibilitatea unor sisteme psihice punctate. Dar probabil proprietatea de a nu fi punctate este caracteristic numai sistemelor psihice ale celor care folosesc limbajul; oare capacitile reprezentaionale ale organismelor infraverbale au acelai fel de lacune ca i cele permise de modelele conexioniste? Un conexionist ar putea atunci s afirme c poate face totul "pn la limbaj" pe baza presupunerii c reprezentrile mentale sunt lipsite de structur combinatoric sintactic i semantic. Totul pn la limbaj poate s nu fie tot, dar este mult. (Pe de alt parte, mult poate fi mult, dar nu este tot. Arhitectura cognitiv infraverbal nu trebuie reprezentat astfel nct achiziia ulterioar a limbajului n filogenie i ontogenie s necesite un miracol.) Nu este plauzibil, oricum, ca doar sistemele psihice verbale s fie sistematice. Gndii-v ce ar nsemna aceasta. Ar fi ceva destul de obinuit s gsim animale capabile s reprezinte starea aRb, dar incapabile s reprezinte starea bRa. Astfel de animale ar fi receptive la aRb dar nu i la bRa, de vreme ce, probabil, capacitile de reprezentare ale minii lor afecteaz nu numai ceea ce poate gndi un organism, dar i ceea ce acesta poate percepe. n consecin, astfel de animale ar fi capabile s nvee s rspund selectiv la situaiile aRb, dar incapabile s nvee s rspund selectiv la situaii bRa. (Astfel c, dei ai putea nva creatura s aleag imaginea cu ptratul
25
Ar putea fi util s subliniem cum complexitatea structural a reprezentrii mentale nu este aceeai cu i nu decurge din complexitatea structural a coninutului su propoziional (adic ceea ce numim "gndul care i trece cuiva prin minte"). Atunci, conexionitii i clasicitii pot stabili c sunt de acord asupra faptului c ideea c P&Q este complex (i conine ideea c P) n timp ce pot stabili c nu sunt de acord c reprezentrile mentale au structura sintactic intern.
26
Aceste consideraii pun ntr-o nou lumin o propunere pe care am discutat-o n seciunea 2. Presupunem c reprezentarea mental corespondent gndului c John o iubete pe fat este vectorul caracteristic {+ John-subject; +loves; +the-girl-object} unde 'John-subject' i 'the-girl-object' sunt caracteristici atomice; astfel acestea nu dau natere la mai multe relaii structurale ntre ' John-subject' i 'the-girl-object' dect o fac ntre ele sau dect n raport cu, s zicem, "has-a-handle" [are-un-mner]. De vreme ce aceast teorie nu recunoate relaii structurale ntre 'John-subject' i 'John-object', nu ofer motive ca un sistem reprezentaional care deine mijloacele de a exprima unul dintre aceste concepte, ar trebui s furnizeze i mijloacele de exprimare ale celuilalt. Aceast tratare a relaiilor dintre roluri face atunci un mister din faptul (presupus) c oricine care poate procesa ideea c John o iubete pe fat poate, de asemenea, procesa ideea c fata l iubete pe John (i, mutatis mutandis, c orice limbaj natural care poate exprima propoziia c John o iubete pe fat poate exprima i propoziia c fata l iubete pe John). Consecina propunerii ca relaiile de rol s fie tratate de "descriptori specifici rolului care reprezint conjuncia unei identiti cu un rol" (Hinton, 1987) ofer un exemplu particular evident despre modul n care eecul de a postula structura intern a reprezentrilor mentale duce la eecul n surprinderea sistematicitii sistemelor reprezentaionale.
mai mare dect triunghiul, nu ai putea s o nvai, chiar dac ai ncerca toat viaa, s o facei s aleag imaginea cu triunghiul mai mare dect ptratul.) Dac aa sunt structurate adesea capacitile cognitive ale organismelor infraverbale este, desigur, o problem empiric, dar noi suntem pregtii s pariem c nu e aa. Cazurile etologice sunt excepiile care probeaz regula. Exist exemple unde configuraii remarcabile de mediu reacioneaz ca "gestalten": n astfel de cazuri e rezonabil s ne ndoim c reprezentarea mental a stimulului e complex. Dar ideea este exact aceea c astfel de cazuri sunt excepionale; sunt exact acele cazuri de la care te-ai atepta s afli ceva special despre semnificaia ecologic a stimulului: aceasta este forma unui rpitor, sau cntecul unui conspecific... etc. Invers, atunci cnd nu e nimic special de aflat, atepi ca stimuli similari din punct de vedere structural s solicite n mod corespunztor capaciti cognitive similare. Acesta, cu siguran, este ultimul lucru pe care ar trebui s-l necesite un principiu respectabil al generalizrii stimulului. Faptul c, n general, cogniia infraverbal e destul de sistematic pare a fi, pe scurt, la fel de sigur pe ct poate fi o premis empiric n acest domeniu. i, aa cum tocmai am vzut, e o premis din care inadecvarea modelelor cognitive ca teorii cognitive decurge destul de direct; la fel de direct, n orice caz, cum ar decurge din afirmaia c astfel de capaciti sunt n general productive.
3.3. Compoziionalitatea reprezentrilor

Compoziionalitatea este n relaie apropiat cu sistematicitatea; poate c ele sunt cel mai bine privite ca aspecte ale aceluiai fenomen. Vom urma, deci, un curs foarte asemntor cu cel din discuia anterioar: mai nti vom introduce conceptul, reamintind argumentele standard n favoarea compoziionalitii limbajelor naturale. Vom sugera apoi c argumente paralelele garanteaz compoziionalitatea reprezentrilor mentale. Dac compoziionalitatea are nevoie de structuri sintactice i semantice combinatorice, compoziionalitatea gndirii este dovada c psihicul nu este o reea conexionist. Am afirmat c sistematicitatea competenei lingvistice consist n faptul c "abilitatea de a produce/nelege unele dintre propoziii este intrinsec legat de abilitatea de a produce/nelege unele dintre celelalte". Adugm acum c dintr-un punct de vedere semantic, nu este arbitrar care anume dintre propoziii sunt legate sistematic. De exemplu, capacitatea de a nelege c "John loves the girl" merge mpreun cu capacitatea de a nelege c "The girl loves John", i exist n mod corespunztor strnse relaii semantice ntre aceste dou propoziii: pentru ca prima s fie adevrat, John trebuie s fie fa de fat n aceeai relaie pe care adevrul celei de-a doua o impune fetei fa de John. Prin contrast, nu exist nici o legtur intrinsec ntre nelegerea vreuneia dintre propoziiile referitoare la John/fat i nelegerea unor formulri nelegate semantic cum ar fi "quarks are made of gluons" [quarcurile sunt compuse din gluoni] sau "the cat is on the mat" [pisica este pe covora] sau "2+2=4"; se pare c, totui, nrudirea semantic i sistematicitatea se regsesc adesea mpreun. Ai putea presupune c aceast covarian e acoperit de aceeai explicaie ca i sistematicitatea per se; n mare, aceea c propoziiile care sunt legate sistematic sunt compuse din aceiai constitueni sintactici. Dar, de fapt, vei avea nevoie de o presupunere suplimentar, pe care o vom numi "principiul compoziionalitii": atta timp ct un limbaj e sistematic, un element lexical trebuie s aib aproximativ aceeai contribuie semantic la fiecare expresie n care apare. De exemplu, numai atta timp ct "the" "girl", "loves" i "John" au aceeai contribuie semantic la "John loves the girl" ct i la "The girl loves John", nelegerea uneia dintre propoziii implic i nelegerea celeilalte. Similaritatea structurii constituente sprijin nrudirea semantic dintre propoziiile legate sistematic numai n msura n care proprietile semantice ale constituenilor comuni sunt independente de context. Iat expresii care demonstreaz regula: capacitatea de a nelege termenii "the", "man" [brbat], "kicked" [a lovit cu piciorul] i "bucket" [gleat] nu e de mare ajutor n nelegerea
expresiei "the man kicked the bucket" [brbatul a murit], de vreme ce "kicked" i "bucket" nu au semnificaiile lor obinuite n acest context. i, exact cum v-ai atepta, "the man kicked the bucket" nu e sistematic nici chiar n raport cu propoziii apropiate sintactic ca "the man kicked over the bucket" (din acest motiv, nu e sistematic nici n raport cu "the man kicked the bucket", citit literal). Nu se tie exact ct de compoziionale sunt de fapt limbajele naturale (la fel cum nu se tie exact ct de sistematice sunt). Noi bnuim c mrimea variaiei introduse de context a semnificaiei lexicale este adesea supraestimat din cauza altor tipuri de senzitivitate contextual care sunt greit construite ca violri ale compoziionalitii. De exemplu, diferena dintre "feed the chicken" [a hrni puii] i "chicken to eat" [(carne de) pui pentru mncare] implic o ambiguitate animal/hran la nivelul lui "chicken", mai degrab dect o violare a compoziionalitii, de vreme ce, dac contextul "feed the ..." ar induce (mai degrab dect ar selecta) semnificaia de animal, v-ai atepta la propoziii de genul 'feed the veal' [a hrni carnea de viel] sau 'feed the pork' [a hrni carnea de porc]. 27 Similar, diferena dintre 'good book' [carte bun], 'good rest' [odihn bun] i 'good fight' [lupt, btaie bun] are probabil nu semnificaia de schimbare, ci de sincategorematicitate (syncategorematicity). 'Good NP' [noun phrase-substantiv] nseamn ceva de genul NP care rspunde interesului nostru fa de NP-uri: o carte bun este una care rspunde nevoii noastre de cri (cu alte cuvinte, e bun de citit); o odihn bun este una care rspunde nevoii noastre de odihn (cu alte cuvinte, te reface); o btaie bun este una care rspunde nevoii noastre de bti (cu alte cuvinte, e distractiv s-o priveti sau s participi la ea, sau descarc atmosfera); i aa mai departe. Asta deoarece semnificaia lui 'good' este sincategorematic i conine o variabil pentru interese relevante, astfel nct ne putem da seama c un flurg bun este un flurg care rspunde interesului nostru n flurgi fr ca s tim ce sunt flurgii sau care este interesul fa de acetia. (vezi Ziff, 1960). n orice caz, principalul argument este: sistematicitatea depinde de compoziionalitate, astfel nct n msura n care un limbaj natural este sistematic el trebuie s fie, de asemenea, compoziional. Aceasta ilustreaz un alt aspect n care argumentele sistematicitii pot nlocui argumentele productivitii. Argumentul tradiional n favoarea compoziionalitii este c aceasta e necesar pentru a explica cum un limbaj reprezentabil finit poate conine un numr infinit de expresii nesinonime. Consideraiile asupra sistematicitii ofer un argument pentru compoziionalitate; consideraiile de determinare ofer un altul. S considerm predicate ca '...it's a brown cow' [este o vac maro]. Aceast expresie d natere la o relaie semantic direct ntre predicatele '... is a cow' [este o vac] i '... is brown' [este maro]; cu alte cuvinte, primul predicat este adevrat despre un anumit obiect dac i numai dac urmtoarele predicate sunt ambele adevrate. Adic, '... is a brown cow' determin simultan '... is brown' i '... is a cow' i e determinat de conjuncia acestora. n plus - i asta e important - modelul semantic nu e caracteristic cazurilor citate. Din contr, e valabil pentru un mare numr de predicate (vezi '... is a red square' [este un ptrat rou], '...is a funny old German soldier' [este un soldat german btrn i caraghios], '...is a child prodigy' [este o minune de copil]; i aa mai departe). Cum am putea califica aceste tipuri de regulariti? Rspunsul pare destul de clar: '...is a brown cow' implic '...is brown' deoarece (a) a doua expresie e un element constituent al primeia; (b) formularea sintactic '(adjectiv substantiv)' are (n multe cazuri) fora semantic a unei conjuncii, i (c) 'brown' i impune valoarea sa semantic n urma simplificrii conjunciei. Observm c avem nevoie de (c) pentru a elimina posibilitatea ca 'brown' s nsemne maro cnd e legat de un substantiv, dar s nsemne mort cnd e un adjectiv predicativ; n care caz '... it's a brown cow' nu ar implica deloc c '...is brown'. S observm i c (c) este doar un caz particular al principiului compoziiei.
27
i sntem datori lui Steve Pinker pentru aceast idee.
Deci, ideea de pn acum este urmtoarea: trebuie s presupunem un anume grad de compoziionalitate a propoziiilor din limba englez, ca rspuns la faptul c propoziiile nrudite sistematic sunt ntotdeauna nrudite semantic; i ca rspuns la un anume paralelism regulat ntre structura sintactic a propoziiilor i semnificaiile lor. Deci, n afara oricrei ndoieli serioase, propoziiile din limba englez trebuie s fie ntr-o mare msur compoziionale. Dar principiul compoziionalitii guverneaz relaiile semantice dintre cuvinte i expresiile constituite cu ajutorul acestora. Deci, compoziionalitatea implic faptul c (anumite) expresii au constitueni. Deci, compoziionalitatea aduce argumente pentru o structur sintactic/semantic (caracteristic, se presupune) a propoziiilor. Dar ce putem spune despre compoziionalitatea proceselor mentale? Exist, aa cum v ateptai, un argument corelativ bazat pe presupunerea psiholingvistic uzual c limbajul este folosit pentru exprimarea gndurilor: propoziiile sunt folosite pentru a exprima gndurile cuiva; deci, dac abilitatea cuiva de a folosi anumite propoziii este legat de abilitatea de a le folosi pe altele, nrudite semantic cu acestea, atunci abilitatea gndirii unor idei trebuie s fie conectat corespunztor cu abilitatea de gndire a altora, legate semantic de acestea. Dar nu putei gndi dect ideile pe care reprezentarea dumneavoastr mental le poate exprima. Deci, dac abilitatea de a gndi anumite idei e interconectat, atunci capacitile de reprezentare corespunztoare trebuie s fie, de asemenea, interconectate; i anume, capacitatea siturii n anumite stri reprezentaionale trebuie s implice abilitatea siturii n alte stri reprezentaionale, nrudite semantic cu acestea. Dar atunci apare urmtoarea problem: cum poate s fie alctuit psihicul astfel nct abilitatea de a fi ntr-o stare reprezentaional s fie legat de abilitatea de a fi n altele, alturate semantic acesteia? Ce consecin va avea aceasta asupra reprezentrii mentale? Rspunsul este exact cel pe care l-ai atepta de la discuia asupra materialului lingvistic. Reprezentrile mentale trebuie s aib structuri interne, la fel cum au propoziiile. n particular, trebuie ca reprezentarea mental care corespunde gndului c John o iubete pe fat s aib ca pri componente aceiai constitueni ca i gndul c fata l iubete pe John. Aceasta ar explica de ce aceste gnduri sunt legate sistematic; i, n msura n care valoarea semantic a acestor pri componente este independent de context, aceasta ar putea explica de ce aceste gnduri legate sistematic sunt de asemenea legate semantic. Deci, urmnd acest fir al argumentaiei, dovada pentru compoziionalitatea propoziiilor este o dovad pentru compoziionalitatea strilor reprezentative ale asculttorilor vorbitorului. n sfrit, ce putem spune despre compoziionalitatea gndirii infraverbale? Argumentele nu sunt prea diferite de cele pe care tocmai le-am trecut n revist. Noi presupunem c gndirea animal e puternic sistematic: organismele care pot percepe (deci nva) c aRb pot n general s perceap (/nvee) c bRa. Dar, gndurile nrudite sistematic (ca i propoziiile nrudite sistematic) sunt n general i nrudite semantic. Nu e o surpriz c faptul de a fi capabil s nvei c triunghiul e situat deasupra ptratului implic i capacitatea de a nva c ptratul e deasupra triunghiului; pe de alt parte, ar fi foarte surprinztor ca abilitatea de a nva situaiile ptrat/triunghi s implice abilitatea de a nva c quarcurile sunt compuse din gluoni sau c Washington a fost primul preedinte al Americii. Exist, deci, o corelaie ntre relaiile sistematice i cele semantice n gndirea infraverbal? n mod clar, modelele conexioniste nu-i pun aceast ntrebare; faptul c o reea conine un nod etichetat cu X nu are, n ceea ce privete constrngerile impuse de arhitectura conexionist, nici o implicaie asupra etichetrilor celorlalte noduri din reea; n particular, nu implic faptul c vor exista noduri care reprezint gnduri apropiate semantic de X. Acesta este doar aspectul semantic al faptului c arhitecturile de tip reea permit viei mentale arbitrar punctate. Dar dac, pe de alt parte, pornim de la presupunerea obinuit clasicist (cu alte cuvinte, aceea c gndurile nrudite sistematic au constitueni comuni i c valorile semantice ale acestor constitueni sunt independente de context) corelaia dintre sistematicitate i nrudire semantic
este imediat. Pentru un clasicist, aceast corelaie e o proprietate 'arhitectural' a sistemelor psihice, ce nu poate dect s susin c reprezentrile mentale au proprietile generale presupuse de modelele clasice. Ce au conexionitii de spus n legtur cu aceste chestiuni? Exist unele dovezi textuale c ei sunt tentai s nege n bloc argumentele compoziionalitii. De exemplu, Smolensky (1988) afirm: "Cu siguran... am obine o reprezentare destul de diferit a termenului 'coffee' [cafea] dac am examina diferena dintre 'can with coffee' [cutie cu cafea] i 'can without coffee' [cutie fr cafea] sau 'tree with coffee' [arbore cu cafea] i 'tree without coffee' [arbore fr cafea]; sau dintre 'man with coffee' [om cu cafea] i 'man without coffee' [om fr cafea] ... insenzitivitatea fa de context nu e ceva care ne-am atepta s fie oglindit n reprezentrile conexioniste...". Este adevrat, compoziionalitatea nu e n general o caracteristic a reprezentrilor conexioniste. Conexionitii nu pot asimila realitile compoziionalitii, deoarece ei presupun reprezentri mentale care nu au o structur combinatoric. Dar renunarea la compoziionalitate este ca i cum am considera 'kick the bucket' ca model pentru relaia dintre sintax i semantic, iar consecina ar fi, aa cum am vzut, c sistematicitatea limbajului (i a gndirii) devine un mister. Pe de alt parte, a spune c 'kick the bucket' e aberant, i c modelul corect pentru relaia sintax/semantic este (de exemplu) 'brown cow', nseamn a te lansa ntr-o ncercare care conduce, destul de inevitabil, la asimilarea structurii combinatorice a reprezentrilor mentale, deci la respingerea faptului c reelele conexioniste sunt modele cognitive. Nu credem c asimilarea compoziionalitii limbajelor naturale i a reprezentrilor mentale poate fi evitat. Oricum, s-a sugerat (vezi Smolensky, op cit.) c, dac principiul compoziionalitii e fals (deoarece coninutul nu este invariant fa de context), nu exist, cu toate acestea, o "asemnare familial" ntre diferitele semnificaii pe care un simbol le are n contextele diferite n care apare. Dat fiind c astfel de propuneri nu sunt n general elaborate, nu este clar modul n care vor trata realitile pregnante despre sistematicitate i inferen. Dar cu siguran vor aprea probleme serioase. S considerm, de exemplu, nite inferene de genul: (i) estoasele sunt mai lente dect iepurii. (ii) Iepurii sunt mai leni dect Ferrari-urile. ....... (iii)estoasele sunt mai lente dect Ferrari-urile. Soliditatea acestei inferene pare s depind de (a) faptul c aceeai relaie (cu alte cuvinte, slower than [mai lent dect]) leag, pe de o parte, estoasele de iepuri i, pe de alt parte, iepurii de Ferrari-uri; i de (b) faptul c aceast relaie e tranzitiv. Dac, totui, se presupune (contrar principiului compoziionalitii) c 'mai lent dect' are o semnificaie diferit n premisele (i) i (ii) (i probabil i n (iii)) - astfel nct, strict vorbind, relaia care leag estoasele de iepuri nu e aceeai cu cea care leag iepurii de Ferrari-uri - atunci e greu de vzut de ce ar fi valid inferena. Discuia despre 'similaritatea' relaiilor tapeteaz numai dificultile, de vreme ce problema devine stabilirea unei noiuni de similaritate care va garanta c dac (i) i (ii) sunt adevrate, atunci i (iii) este adevrat. i, cel puin pn acum, n-a aprut nici o astfel de noiune de similaritate. S observm c n-ar fi de ajuns doar s cerem ca toate relaiile s fie similare relativ la tranzitivitatea lor, adic, s fie toate tranzitive. Pe baza acestui fapt, inferena de la 'estoasele sunt mai lente dect iepurii' i 'iepurii sunt mai mblnii dect Ferrari-urile' la 'estoasele sunt mai lente dect Ferrari-urile' ar fi valid dac 'mai mblnit' ar fi i el tranzitiv. Atta timp ct ne vom lovi de acest gen de probleme, propunerea de a nlocui principiul compoziional al invarianei de context cu o noiune de "aproximare a echivalenei...ntre contexte"(Smolensky, 1988) pare a nu fi dect un gest gratuit.
3.4. Sistematicitatea inferenei
n capitolul 2 am vzut c, n concordan cu teoriile clasice, sintaxa reprezentrilor mentale se interpune ntre proprietile lor semantice i rolul lor cauzal n procesele mentale. S lum un caz simplu: e un principiu 'logic' acela c, conjunciile i determin constituenii (deci din P&Q se deduc i P i Q). Corespunztor, exist o lege psihologic care spune c ideea c P&Q tinde s conduc la ideea c P i la ideea c Q, toate celelalte fiind egale. Teoria clasic cerceteaz structura constituent a reprezentrilor mentale astfel nct s in cont de ambele lucruri, de primul, presupunnd c semantica de tip combinatoric a reprezentrilor mentale e senzitiv la sintaxa acestora, iar de al doilea, presupunnd c procesele mentale se aplic reprezentrilor mentale n virtutea structurii lor constituente. O consecin a acestor presupuneri este c teoriile clasice duc la urmtoarea afirmaie frapant: inferenele care sunt de tip logic similar ar trebui, n general, 28 s extrag n mod corespunztor capaciti cognitive similare. N-ar trebui, de exemplu, s gsii vreun tip de via mental n care s avei inferene de la P&Q&R la P, dar s nu avei inferene de la P&Q la P. Aceasta pentru c, n concordan cu prerea clasic, aceast clas omogen logic de inferene este rezultatul unei clase omogene corespunztoare de mecanisme psihologice: premisele ambelor inferene sunt exprimate prin reprezentri mentale care satisfac aceeai analiz sintactic (adic, S1&S2&S3&... SN); iar procesele de trasare a inferenei corespund, n ambele cazuri, aceleiai operaii formale de detaare a constituentului care exprim concluzia. Ideea c organismele ar trebui s prezinte capaciti cognitive similare relativ la inferene logice similare este att de natural nct ar putea prea inevitabil. Dar, dimpotriv: nu ne mpiedic nimic, n principiu, s excludem un gen de model cognitiv, n care inferenele care sunt destul de asemntoare din punctul de vedere al logicianului s fie cu toate acestea realizate de mecanisme destul de diferite; sau n care unele inferene de un anume tip logic s fie realizate, iar alte inferene de acelai tip s nu fie. S considerm, n particular, punctul de vedere conexionist. Un conexionist poate cu siguran s modeleze o via mental n care, dac poi raiona de la P&Q&R la P, atunci poi raiona i de la P&Q la P. De exemplu, aa face reeaua din (Figura 3):
Fig. 3. O posibil reea conecionist care traseaz inferene
P&Q&R P&Q R
de la P&Q&R la P i, de asemenea, de la P&Q la P.
Dar observai c un conexionist poate la fel de bine modela o via mental n care se obine una din aceste inferene, dar nu i o alta. n cazul de fa, dat fiind c nu exist o relaie structural ntre nodul P&Q&P i nodul P&Q (s ne reamintim c toate nodurile sunt atomice; nu v lsai indui n eroare de etichetrile nodurilor), nu exist nici un motiv pentru care un sistem psihic care o conine pe una trebuie s o conin i pe a doua, sau vice versa. Prin analogie, nu exist nici un motiv pentru care s nu poi obine sisteme psihice care simplific premisa John o iubete pe Mary i Bill o urte pe Mary , dar nu i alte premise; sau care simplific premise cu
28
Legtura se presupune c exclude cazurile n care inferene de acelai tip logic pot totui s difere la nivel de complexitate n virtutea, de exemplu, a lungimii premiselor lor. Inferena de la (AvBvCvDvE) i (-B&-C&-D&-E) la A este de acelai tip logic ca i inferena de la AvB i -B la A. Dar n-ar fi foarte surprinztor, sau foarte interesant, dac ar exista sisteme psihice care s poat trata cea de-a doua inferen, dar nu i pe prima.
1, 3 sau 5 conjuncii, dar nu simplific i premise cu 2, 4 sau 6 conjuncii; sau care simplific doar premise care au fost nsuite mari ... etc. De fapt, arhitectura conexionist este absolut indiferent la aceste posibiliti. Aceasta fiindc nu recunoate nici o noiune de sintax potrivit creia idei cu rol inferenial asemntor (de ex. idei care sunt toate subiecte ale simplificrii conjunciei) sunt exprimate prin reprezentri mentale ale unei forme sintactice similare corespunztoare (de ex. prin reprezentri mentale care sunt toate conjunctive sintactic). Deci, arhitectura conexionist tolereaz lacune n capacitile cognitive; nu are un mecanism care s impun necesitatea ca inferenele logic omogene s fie executate prin procese de calcul omogene corespunztoare. Dar noi susinem c nu gsii capaciti cognitive care au acest gen de lacune. De ex., nu gsii sisteme psihice care s deduc John went to the store [John a mers la magazin] din John and Mary and Susan and Sally went to the store [John i Mary i Susan i Sally au mers la magazin] i din John and Mary went to the store [John i Mary au mers la magazin], dar nu i din John and Mary and Susan went to the store [John i Mary i Susan au mers la magazin] . Fiind dat o noiune de sintax logic - chiar acea noiune necesar teoriei clasice a gndirii pentru a se urni din loc n abordarea proceselor mentale - este un truism faptul c nu gseti asemenea sisteme psihice. n absena unei noiuni de sintax logic, este un mister faptul c nu le gseti.
3.5. Rezumat
Probabil c n momentul de fa este evident c toate argumentele pe care le-am trecut n revist - argumentul de sistematicitate, argumentul de compoziionalitate i argumentul de coeren inferenial - sunt n mare parte la fel: dac susinei acel gen de teorie care accept reprezentrile structurate, aceasta trebuie neaprat s accepte reprezentri cu structuri similare sau identice. n cazurile lingvistice, analiza constituent implic o taxonomie a propoziiilor pe baza formei lor sintactice, iar n cazurile infereniale, implic o taxonomie a argumentelor pe baza formei lor logice. Deci, dac teoria voastr accept i procesele mentale care sunt sensibile la structur, atunci aceasta va prezice c reprezentri similar structurate vor avea n general roluri similare n gndire. O teorie care spune c propoziia John loves the girl este format din aceleai componente, i prin aplicarea acelorai reguli de compunere, ca i propoziia the girl loves John, va trebui s se dea peste cap pentru a explica o competen lingvistic ce accept una, dar nu i pe cealalt din propoziii. n mod similar, dac o teorie spune c reprezentarea mental care corespunde raionamentului P&Q&P are aceeai sintax (conjunctiv) ca i reprezentarea mental care corespunde raionamentului P&Q, i c procesele mentale de deducie includ reprezentri mentale n virtutea sintaxei lor, aceast teorie va trebui s se dea peste cap pentru a explica acele capaciti deductive care accept un raionament, dar nu i pe cellalt. O asemenea competen ar fi n cel mai bun caz un neajuns pentru teorie, iar n cel mai ru caz, un motiv pentru a o refuta. Dimpotriv, de vreme ce arhitectura conexionist nu recunoate structuri combinatorice n reprezentrile mentale, lipsurile din competena cognitiv ar trebui s prolifereze n mod arbitrar. Nu numai c te-ai atepta s le gseti din cnd n cnd; dar n povestea fr-structur, lacunele sunt cazul nespecific/neremarcat. Teoria trebuie s trateze competena sistematic drept piedic. Dar, de fapt, competenele infereniale sunt ostentativ sistematice. Deci, trebuie s fie ceva n neregul cu arhitectura conexionist. Eroarea profund a arhitecturii conexioniste este aceasta: fiindc nu accept n reprezentrile mentale nici structura sintactic, nici pe cea semantic, le trateaz vrnd-nevrnd ca pe o list i nu ca pe un set generat. Dar listele nu au structur; orice colecie de elemente este o posibil list. Iar dup principiile conexioniste, prin analogie, orice colecie de stri reprezentaionale (conectate cauzal) este un posibil sistem psihic. Deci, n ceea ce privete arhitectura conexionist, nu exist nimic care s mpiedice existena unor sisteme care sunt n mod arbitrar nesistematice. Dar acest rezultat este absurd. Capacitile cognitive vin n grupuri nrudite structural; sistematicitatea lor este pervasiv. Toate dovezile sugereaz c nu exist
sisteme psihice punctate. Acest argument prea decisiv mpotriva conexionismului lui Hebb, Osgood i Hull acum douzeci sau treizeci de ani. Din cte tim noi, de atunci nu s-a ntmplat nimic important care s schimbe situaia.29 Un comentariu final pentru a rotunji aceast parte a discuiei. Este posibil de imaginat un conexionist pregtit s admit c dei sistematicitatea nu rezult din - i din aceast cauz nu este explicat de - arhitectura conexionist, ea este totui compatibil cu acea arhitectur. Pn la urm, este perfect posibil s urmezi o politic de construire de reele care au noduri a Rb doar dac au i noduri bRa ...etc. Astfel nu exist nimic care s-l opreasc pe conexionist de la a stipula - ca un postulat independent al teoriei sale asupra psihicului - c toate reelele instaniate biologic sunt, de facto, sistematice. Dar aceasta omite un punct crucial: nu este de ajuns s stipulezi sistematicitatea; se cere i s specifici un mecanism care s poat impune stipulaia. Altfel spus, nu este de ajuns pentru un conexionist s fie de acord c toate sistemele psihice sunt sistematice; el trebuie s i explice cum reuete natura s produc doar sisteme psihice sistematice . Probabil c ar trebui s aib un anumit tip de mecanism, nafara celor pe care conexionismul per se le postuleaz, a crui funcionare asigur sistematicitatea reelelor instaniate biologic; un mecanism n virtutea operrii cruia orice reea s aib un nod a Rb i un nod bRa ...i aa mai departe. Oricum, nu exist propuneri pentru un astfel de mecanism. Sau, mai degrab, exist numai o singur propunere. Singurul mecanism care se tie c poate produce sistematicitate pervasiv este arhitectura clasic. i, dup cum am vzut, arhitectura clasic nu este compatibil cu conexionismul, de vreme ce necesit reprezentri structurate intern.
4. TENTAIA CONEXIONISMULUI
Popularitatea prezent a concepiei conexioniste printre psihologi i filosofi te intrig din perspectiva tipurilor de probleme ridicate mai sus, probleme care au fost n mare msur rspunztoare pentru dezvoltarea unei noiuni (demonstrate teoretic) de calcul bazat pe sintax, i n primul rnd a unei noiuni de arhitectur cognitiv n stil Turing, de procesare a simbolurilor. Exist, totui, o sum de argumente aparent plauzibile, ntlnite n mod repetat n literatur, care accentueaz anumite limitri ale computerelor convenionale ca modele ale creierului. Acestea ar putea fi considerate ca favoriznd alternativa conexionist. Vom schia cteva dintre acestea, nainte de a discuta problemele generale pe care par s le ridice. Rapiditatea proceselor cognitive n relaie cu vitezele neurale: constrngerea celor o sut de pai. S-a observat (de ex., Feldman & Ballard, 1982) c timpul de execuie a instruciunilor
29
Not istoric: conexionitii sunt asociaioniti, dar nu orice asociaionist afirm c reprezentrile mentale sunt nestructurate. Hume, de exemplu, nu a fcut-o. Hume considera c reprezentrile mentale sunt ca imaginile, iar imaginile au o semantic a lor compoziional: prile imaginii unui cal sunt n general imagini ale prilor calului. Pe de alt parte, a permite o semantic de tip compoziional pentru reprezentrile mentale nu i face unui asociaionist mult bine, atta timp ct el este cu adevrat n spiritul asociaionismului. Calitatea de a avea reprezentri mentale cu structur este cea care permite operaiilor sensibile la structur s fie definite asupra acestora; n mod specific, o permite pentru acel tip de operaii care se rezolv prin productivitate i sistematicitate. Asociaia nu este totui o astfel de operaie; tot ceea ce poate ea face este s construiasc un model intern al redundanelor n experien prin alterarea probabilitilor tranziiilor ntre strile mentale. n privina problemelor productivitii i sistematicitii, un asociaionist care recunoate reprezentrile structurate este n poziia celui care are conserva, dar nu are deschiztorul de conserve. Hume, de fapt, a triat: el i-a permis nu doar asociaia, ci i imaginaia, pe care a considerat-o o facultate activ care poate produce concepte noi din pri vechi prin procesul de analiz i recombinare. (Ideea de unicorn este alctuit din ideea de cal i ideea de corn, de ex.). Ca asociaionist, Hume nu avea nici un drept s activeze facultile mentale. Dar a permite imaginaia ca Hume este exact ceea ce lipsete conexionitilor moderni: adic, un rspuns la ntrebarea: n ce fel procesele mentale pot fi productive? Morala este c, dac ai reprezentri structurate, tentaia de a postula operaii sensibile la structur i o capacitate executiv care s le aplice este practic irezistibil.
computerului este de ordinul nanosecundelor, n timp ce neuronii au nevoie de zeci de milisecunde pentru a fi activai. n consecin, n timpul necesar oamenilor pentru a duce la ndeplinire multe dintre sarcinile pe care le realizeaz uor (ca de ex. s recunoasc un cuvnt sau un desen, amndou activitile necesitnd mult mai puin de o secund) un program serial instaniat neural va fi n stare s ndeplineasc aproximativ 100 de instruciuni. i totui, asemenea sarcini necesit n mod tipic cteva mii - sau chiar milioane - de instruciuni n computerele zilelor noastre (n cazul n care pot fi ndeplinite). Deci, s-a spus, creierul trebuie c este organizat ntr-o manier extrem de paralel (masiv paralel este termenul preferat). Dificultatea realizrii unei capaciti de recunoatere a pattern-urilor de capacitate mare i a unei capaciti de reactualizare bazate pe coninut n arhitecturile convenionale. Strns legat de problemele constrngerilor temporale este faptul c oamenii pot stoca i folosi o cantitate enorm de informaii - aparent fr efort (Fahlman & Hinton, 1987). O nsuire spectaculoas a oamenilor este capacitatea de recunoatere a patternurilor dintre zeci sau chiar sute de mii de alternative (de ex., recunoaterea cuvintelor sau a fizionomiilor). De fapt, exist motive s credem c multe abiliti ale experilor se bazeaz pe memoria de recunoatere foarte rapid (vezi Simon & Chase, 1973). Dac ar trebui ca cineva s-i cerceteze memoria serial, aa cum o fac computerele convenionale, complexitatea ar coplei orice main. Astfel, modul n care oamenii stocheaz i regsesc cunotinele trebuie s fie diferit de felul n care o fac computerele convenionale. Modelele computerelor convenionale prezint o etiologie diferit pentru comportamentul guvernat de reguli", respectiv pentru comportamentul excepional. Teoriile psihologice clasice, bazate pe ideea de computer convenional, fac distincie ntre mecanisme care cauzeaz comportamentul obinuit i cele care cauzeaz comportamentul divergent, postulnd sisteme de reguli incontiente explicite pentru a le explica pe primele, i apoi atribuind abateri de la aceste reguli unor factori secundari (de performan). Cum comportamentele divergente au loc foarte des, o strategie mai bun ar fi ncercarea de a explica ambele tipuri de comportament n termenii aceluiai mecanism. Lipsa progresului n abordarea proceselor care sunt nonverbale sau intuitive. Marea parte a abilitilor noastre cognitive fluente nu constau n accesarea cunotintelor verbale sau n raionarea contient i deliberat (Fahlman & Hinton, 1987; Smolensky, 1988). Se pare c tim multe lucruri pe care ar fi foarte greu s le descriem verbal, de ex. cum s mergi pe biciclet, cum arat prietenii notri apropiai sau cum s ne amintim numele preedintelui etc. Se spune c aceste cunotine nu trebuie stocate n form lingvistic, ci ntr-o alt form implicit. Faptul c n mod tipic computerele convenionale opereaz ntr-un mod lingvistic, dat fiind c proceseaz informaii prin operarea asupra unor expresii structurate sintactic, poate explica de ce modelarea cunotinelor implicite a avut destul de puin succes. Sensibilitatea acut a arhitecturilor convenionale la deteriorare i zgomot. Spre deosebire de circuitele digitale, circuitele creierului trebuie s tolereze zgomotul provenit de la activitatea neuronal spontan. Mai mult, ele trebuie s suporte un grad moderat de deteriorare fr a se prbui complet. Cu puine excepii notabile, dac o parte din creier este deteriorat, degradarea funcionrii nu este de obicei catastrofal, ci variaz mai mult sau mai puin gradual cu proporiile deteriorrii. Acest lucru se ntmpl mai ales cu memoria. Deteriorarea cortexului temporal (de obicei considerat sediu al memoriei) nu are ca rezultat o pierdere selectiv a anumitor date sau amintiri. Acest lucru, ca i alte date similare despre pacieni cu leziuni cerebrale, sugereaz c reprezentrile memoriei umane, i probabil i alte abiliti cognitive, sunt distribuite spaial, mai degrab dect localizate neural. Aceasta pare s contrasteze cu computerele convenionale, unde controlul de tip ierarhic pstreaz deciziile importante n locaii precise i unde stocarea n memorie const ntr-un ir de registre cu locaie adresabil.
Stocarea n structuri convenionale este pasiv. Computerele convenionale au un stoc de memorie pasiv, care poate fi accesat prin aa-numitul fetch and execute cycle [ciclul extrage i execut]. Acest lucru pare s fie destul de deosebit de memoria uman. De exemplu, dup Kosslyn i Hatfield (1984, pp.1022, 1029): n computere memoria este static: odat ce o intrare este pus ntr-o locaie dat, ea rmne acolo pur i simplu, pn CPU [unitatea central] opereaz asupra ei... Dar s considerm un experiment foarte simplu: s ne imaginm litera A n mod repetat... apoi s trecem la litera B. ntr-un model care folosete o arhitectur Von Neumann, oboseala care inhib imaginarea lui A ar trebui s se datoreze unui tertip n modul n care CPU execut o instrucie dat... O asemenea oboseal ar trebui s se generalizeze la toate obiectele imaginate, deoarece rutina responsabil pentru imaginare a fost mai puin eficient. Dar experimentele au demonstrat c acest lucru nu e adevrat: obiecte specifice devin mai greu de imaginat, nu toate obiectele. Acest fapt este mai uor de explicat printr-o analogie cu modul n care cerneala invizibil dispare de bun voie...: cu cerneal invizibil, reprezentarea nsi face ceva - nu exist un procesor separat care opereaz asupra ei... Sistemele convenionale bazate pe reguli descriu cogniia n termeni de totul-sau-nimic. Dar aptitudinile cognitive par a fi caracterizate de diferite tipuri de continuiti. De exemplu: Variaia continu n gradul de aplicabilitate al diferitelor principii, sau n gradul de relevan al diferitelor constrngeri, reguli sau proceduri. Exist cazuri frecvente (mai ales n percepie i reactualizare) n care se pare c o varietate de constrngeri diferite exercit simultan presiuni asupra unei probleme, iar rezultatul este un efect combinat al diferiilor factori (vezi, de ex., discuia informal propus de McClelland, Rumelhart & Hinton, 1986, pp.3-9). De aceea tehnicilor de propagare constrns li se acord o mare atenie n inteligena artificial (vezi Mackworth, 1987). Nondeterminismul comportamentului uman. Procesele cognitive nu sunt niciodat determinate rigid sau precis replicabile. Mai degrab, ele par s aib o component semnificativ aleatoare sau stohastic. Acest lucru se datoreaz poate aleatorului de la nivel microscopic, cauzat de activitate biochimic sau electric ntmpltoare sau chiar de procese de mecanic cuantic. Modelarea acestei activiti cu ajutorul unor reguli deterministe rigide nu poate duce dect la predicii slabe, deoarece ignor natura fundamental stohastic a mecanismelor de baz. Mai mult chiar, modelele deterministe, de tip totul-sau-nimic nu pot s explice aspectul gradual al nvarii sau al dobndirii de aptitudini. Eecul n manifestarea unei degradri fine. Cnd oamenii nu sunt n stare s realizeze o sarcin perfect, ei fac totui ceva raional. Dac o sarcin particular nu se potrivete exact cu un pattern cunoscut, sau dac e doar parial neleas, persoana nu va renuna la ea i nici nu va avea un comportament lipsit de sens. Din contr, dac un program al unui computer clasic, bazat pe reguli, nu recunoate sarcina, sau nu reuete s potriveasc un pattern cu reprezentrile regulilor stocate n memoria sa, de obicei nu va fi n stare s fac nimic. Acest fapt sugereaz c pentru a manifesta o degradare fin trebuie s fim n stare s ne reprezentm prototipuri, s potrivim patternuri, s recunoatem probleme etc. n grade diferite. Modelele convenionale sunt impuse de trsturile tehnice curente ale computerelor i nu in seama dect ntr-o mic msur sau chiar deloc de datele din neurotiine. Sistemele clasice de procesare de simboluri nu ofer nici o indicaie despre modul n care tipurile de procese pe care le postuleaz pot fi realizate de ctre creier. Faptul c aceast bre ntre sistemele de nivel superior i arhitectura creierului este att de mare ar putea fi o indicaie a faptului c aceste modele sunt pe o pist greit. n vreme ce arhitectura psihicului a evoluat sub presiunile seleciei naturale, unele din ipotezele clasice asupra sistemului psihic pot deriva din caracteristici pe care le au calculatoarele doar pentru c acestea au fost proiectate n folosul programatorilor. Acest fapt include probabil
chiar i ipoteza c descrierea la nivel cognitiv a proceselor mentale poate fi separat de descrierea realizrii lor fizice. n mod minimal, construindu-ne modelele astfel nct s in cont de ceea ce se cunoate despre structurile neuronale, putem reduce riscul de a fi indui n eroare de ctre metafore bazate pe arhitecturile contemporane ale calculatoarelor. Replic: Din ce cauz nu sunt valide motivele invocate n mod obinuit n favoarea unei arhitecturi conexioniste? Dup prerea noastr, ca argumente mpotriva arhitecturii cognitive clasice, toate aceste motive sufer de unul sau altul dintre urmtoarele dou defecte: (1) Obieciile depind de proprieti care nu sunt de fapt intrinseci arhitecturilor clasice, de vreme ce pot exista modele clasice perfect naturale care nu prezint caracteristicile criticate. (Credem c acest lucru este adevrat, de exemplu, pentru argumentele c regulile clasice sunt explicite i c operaiile clasice sunt de tipul "tot sau nimic".) (2) Obieciile sunt corecte relativ la arhitecturile clasice, n msura n care acestea sunt implementate pe calculatoarele curente, dar nu e necesar s fie corecte dac ele sunt implementate diferit (de ex. prin reele neuronale). Cu alte cuvinte, acestea sunt direcionate mai degrab ctre nivelul implementaional dect ctre nivelul cognitiv, aa cum au fost ele difereniate n discuia anterioar. (Credem c acest lucru este adevrat, de exemplu, pentru argumentele privind viteza, rezistena la deteriorare i zgomot i pasivitatea memoriei.) n continuarea acestei seciuni vom dezvolta aceste puncte i le vom corela cu unele din argumentele prezentate anterior. Dup aceast analiz vom prezenta ceea ce noi credem a fi cea mai solid perspectiv asupra conexionismului; i anume c este o teorie despre modul n care sistemele cognitive (clasice) pot fi implementate, fie n creiere reale, fie ntr-o "neurologie abstract".
Calculul paralel i problema vitezei

Fie argumentul c procesele cognitive trebuie s implice un calcul paralel pe scar larg. n forma pe care o ia n cadrul discuiilor tipic conexioniste, aceast problem este irelevant din punct de vedere al adecvrii arhitecturii cognitive clasice. "Constrngerea celor 100 de pai", de exemplu, este n mod clar introdus la nivel implementaional. Toate acestea conduc la ipoteza (absurd) c arhitecturile cognitive sunt implementate n creier n acelai fel n care sunt implementate n calculatoarele electronice. Dac ai avut vreodat ndoieli n legtur cu nivelul, implementaional sau simbolic, la care se refer o anumit propunere, o euristic folositoare ar fi s v ntrebai dac ceea ce se presupune despre un calculator convenional - cum ar fi DEC VAX - este adevrat la nivelul implementaional. Astfel, dei cei mai muli algoritmi care ruleaz pe VAX sunt seriali 30, la nivel implementaional astfel de calculatoare prezint un "masiv paralelism"; funcionarea lor presupune efectiv activiti electrice simultane n cadrul aproape al ntregului dispozitiv. De exemplu, fiecare ciclu de acces la memorie presupune propagarea fiecrui bit ntr-o fraciune semnificativ a regitrilor de memorie ai sistemului - ntruct accesul la memorie const practic dintr-un proces de citire destructiv i rescriere, ceasul sistemului pulseaz regulat, activnd cea mai mare parte a unitii centrale, i aa mai departe.
30
n cazul unui calculator convenional, acesta poate fi vzut ca executnd fie un algoritm serial, fie unul paralel, n funcie de ce "main virtual" este considerat n cazul respectiv. La urma urmei, un computer poate fi folosit pentru a simula (implementa) o main virtual cu arhitectur paralel. n acest caz algoritmul su va fi unul paralel.
Morala este c viteza absolut a unui proces e prin excelen o proprietate a implementrii sale. (Prin contrast, viteza relativ de rspuns a sistemului la diferite semnale de intrare are adesea valoare diagnostic pentru procesele individuale; dar aceasta a fost ntotdeauna o prim baz empiric de alegere ntre algoritmi alternativi n psihologia prelucrrii informaiei). Astfel, faptul c neuroni individuali au nevoie de zeci de milisecunde pentru a reaciona nu are legtur cu viteza estimat de rulare a unui algoritm n afar de cazul n care exist cel puin o teorie parial, motivat independent, despre modul n care operaiile arhitecturii funcionale sunt implementate la nivelul neuronilor. Dac, n cazul creierului, nu este absolut sigur c excitaia31 neuronilor este invariabil proprietatea semnificativ a implementrii (cel puin pentru procesele cognitive de nivel nalt, cum ar fi nvarea i memoria), "constrngerea" celor 100 de pai nu exclude nimic. n final, constrngeri absolute asupra numrului de pai seriali necesari unui proces sau asupra timpului necesar execuiei sale furnizeaz argumente insuficiente mpotriva arhitecturii clasice, pentru c arhitectura clasic nu exclude n nici un fel execuia paralel a proceselor simbolice multiple. ntr-adevr, pare extrem de probabil c multe procese simbolice clasice funcioneaz n paralel n cadrul procesului de cunoatere i c aceste procese interacioneaz ntre ele (de ex. pot fi implicate ntr-o anumit propagare a unei constrngeri simbolice). Operarea cu simboluri poate implica chiar organizri "masiv paralele"; ceea ce ar putea ntr-adevr s duc la noi arhitecturi, dar acestea sunt toate clasice n accepiunea noastr, deoarece toate mprtesc concepia clasic a calculului ca procesare de simboluri. (Pentru exemple de propuneri serioase i interesante pentru organizarea procesoarelor clasice n cadrul unor reele paralele de dimensiuni mari, vezi sistemul Actor al lui Hewett (1977), "Connection Machine" a lui Hillis (1985), ca i oricare dintre noile maini comerciale multi-procesor). Ideea este c un argument pentru o reea de calculatoare paralele nu este n sine nici un argument mpotriva arhitecturii clasice, nici un argument n favoarea arhitecturii conexioniste.
Rezistena la zgomot i distrugere fizic (i argumentul pentru reprezentarea distribuit)

Unele dintre celelalte avantaje pretinse de arhitecturile conexioniste asupra arhitecturilor clasice sunt la fel de clar localizate la nivelul implementaional. De exemplu, criteriul "rezistenei la distrugere fizic" este att de evident o chestiune de implementare nct cu greu ar putea fi luat n discuie de teoriile de nivel cognitiv. Este adevrat c un anumit tip de rezisten la distrugere pare a fi incompatibil cu localizarea, i este de asemenea adevrat c reprezentrile n PDP-uri sunt distribuite pe grupuri de uniti (cel puin cnd e folosit "codarea brut"). Dar distribuirea pe uniti prezint rezisten la distrugere numai dac presupune c reprezentrile sunt de asemenea distribuite neuronal32.
31
Exist de fapt un anumit numr de de mecanisme diferite de interaciune neuronal (de ex. "interaciunile locale" descrise de Rakic, 1975). De asemenea, un mare numr de procese chimice au loc la nivelul dendritelor, la diferite scale temporale, astfel nct chiar dac transmisia dendritic ar fi unicul mecanism relevant, nu putem ti ce scal temporal s folosim pentru a estima activitatea neuronal n general (vezi de ex. Black., 1986).
32
Exceptnd cazul n care "unitile" unei reele conexioniste sunt presupuse a avea diferite localizri spaiale n cadrul creierului, pare a fi absolut greit s vorbim despre reprezentare distribuit. n particular, dac acestea sunt individualizate n primul rnd funcional, orice grad de distribuire a entitilor funcionale e compatibil cu orice grad de solidaritate spaial a reprezentrilor neuronale corespunztoare. Dar nu este evident c unitile o fac, n vreun mod corespunztor unei locaii identificabile anatomic din creier. Dup felul n care sunt proiectate mecanismele conexioniste, pare a fi potrivit s vedem unitile i legturile dintre ele ca entiti funcionale/matematice (ceea ce psihologii ar numi "construcii ipotetice") a cror interpretare neurologic rmne nc deschis. (Acesta este, de fapt, punctul de vedere al unor conexioniti; vezi Smolensky, 1988). Ideea este c distribuia ntlnit n construciile
Oricum, distribuirea neuronal a reprezentrilor este compatibil n aceeai msur i cu arhitecturile clasice i cu reelele conexioniste. n cazul clasic nu avei nevoie dect de regitrii de memorie care i distribuie coninutul n spaiul fizic. Putei obine aceasta cu sisteme de memorie fanteziste cum ar fi cele optice sau cele chimice sau chiar cu regitrii formai din reele conexioniste. Gndii-v c distribuirea deja exista la vechile memorii cu "inele de ferit"! Necesitile din punct de vedere fizic ale unui sistem clasic de prelucrare a simbolurilor sunt destul de uor nelese n mod greit. (Confuzia dintre proprietile fizice i cele funcionale este foarte rspndit n teoretizarea psihologic n general; pentru o dezbatere asupra acestei confuzii, n legtur cu proprietile metrice n modelele imagisticii mentale, vezi Pylyshyn 1981.) De exemplu, arhitectura convenional necesit existena unor expresii simbolice distincte pentru fiecare stare pe care o poate reprezenta. Deoarece aceste expresii prezint adesea o structur constituit din pri concatenate, relaia de adiacen va trebui instaniat printr-o anumit relaie fizic la momentul implementrii arhitecturii. (vezi discuia din nota 9). Oricum, dac relaia care trebuie s fie realizat fizic este de adiacen funcional, nu este necesar ca instanierile fizice ale simbolurilor adiacente s fie spaial adiacente. Similar, dei expresii complexe sunt alctuite din elemente atomice, iar deosebirea dintre simbolurile atomice i cele complexe trebuie s fie cumva instaniat fizic, nu este necesar ca semnului unui simbol atomic s-i fie asignat o zon din spaiu mai mic dect semnului unui simbol complex, chiar dac e vorba de un simbol complex care l conine. n arhitecturile clasice, ca i n cele conexioniste, elemente funcionale pot fi distribuite fizic sau localizate n orice msur. La VAX (pentru a ne folosi din nou euristica), perechi de simboluri pot fi adiacente funcional, semnele simbolurilor sunt - cu toate acestea - rspndite spaial prin multe zone din memoria fizic. Pe scurt, faptul c o proprietate (cum ar fi poziia unui simbol n cadrul unei expresii) este local din punct de vedere funcional nu are implicaii de nici un fel asupra rezistenei la distrugere sau asupra toleranei la zgomot, n afar de cazul cnd metrica vecintii funcionale corespunde unei dimensiuni fizice potrivite. n acest caz, am putea fi capabili s estimm reaciile adverse pe care variaia proprietii fizice le produce asupra obiectelor localizate n spaiul funcional (de ex, variind tensiunea sau frecvena am putea afecta partea stng a unei expresii). Dar, desigur, situaia este identic pentru sistemele conexioniste: chiar dac acestea sunt rezistente la distrugeri locale din punct de vedere spaial, ele ar putea s nu fie rezistente la distrugeri locale la nivelul altor dimensiuni fizice. Deoarece distrugerea local din punct de vedere spaial este frecvent n mod special n traumele din lumea real, aceasta poate avea importante consecine practice. Dar atta timp ct cunotinele noastre despre modul n care procesele cognitive sunt implementate n esutul cerebral rmn att de inconsistente, mesajul su ctre tiinele cognitive rmne ndoielnic.
Constrngeri "uoare", mrimi continue, mecanisme stohastice i simboluri active

Prerea c acele constrngeri "uoare", care pot varia continuu (ca i gradele de activare), sunt incompatibile cu sistemele clasice simbolice bazate pe reguli e un alt exemplu al imposibilitii de a pstra separate nivelul psihologic (sau al prelucrrii de simboluri) de nivelul implementaional. Ar putea exista un sistem clasic bazat pe reguli, n care aplicarea unei anumite reguli e decis la nivelul arhitecturii funcionale i depinde de mrimi care variaz continuu. ntradevr, aceasta se ntmpl de obicei n cazul "sistemelor expert" clasice care, de exemplu, folosesc n cadrul interpretorului de reguli al sistemului de producere un mecanism Bayesian. Uurina sau natura stohastic a proceselor bazate pe reguli apare din interaciunea regulilor deterministe cu proprietile reale ale implementrii sau cu intrrile zgomotoase sau cu transmisia de informaie zgomotoas.
matematice nu asigur rezistena la distrugere; doar distribuia neuronal o poate face.
Ar trebui de asemenea remarcat c aplicrile de reguli nu trebuie s conduc la comportamente de tip "totul sau nimic", deoarece mai multe reguli pot fi activate simultan i pot avea efecte interactive n cadrul rezultatului. Sau, pe de alt parte, fiecare din regulile activate poate genera efecte paralele independente, care ar putea fi ordonate mai trziu - n funcie de, s zicem, care dintre curenii paraleli atinge primul un anumit scop. Un punct de vedere important, dei uneori neglijat, asupra unor asemenea proprieti agregate de comportament deschis, cum ar fi continuitatea, "neclaritatea" (fuzziness), randomizarea etc, este c acestea nu provin neaprat din mecanismele de la nivel inferior, care sunt la rndul lor fuzzy, continue sau aleatoare. Nu numai c n principiu este posibil, dar adesea este chiar rezonabil practic s presupunem c unele comportri aparent variabile sau nondeterministe apar din interaciunea mai multor surse deterministe. O idee similar poate fi emis n legtur cu problema "degradrii fine". Arhitectura clasic nu necesit ca, atunci cnd condiiile necesare aplicrii regulilor disponibile nu sunt complet ndeplinite, procesul s eueze pur i simplu. Aa cum am remarcat anterior, regulile pot fi activate ntr-o anumit msur n funcie de ct de apropiate sunt condiiile reale de cele necesare. Ceea ce se ntmpl exact n astfel de cazuri poate depinde de modul n care e implementat sistemul de reguli. Pe de alt parte, s-ar putea ca imposibilitatea manifestrii "degradrii fine" s fie o limit intrinsec a clasei curente de modele sau chiar a abordrilor actuale n proiectarea sistemelor inteligente. Pare evident c modelele psihologice disponibile n momentul de fa sunt inadecvate fa de un spectru larg de msurtori, aa nct problemele lor relativ la degradarea fin pot fi doar un caz particular al lipsei lor generale de inteligen: ele ar putea ca pur i simplu s nu fie suficient de inteligente pentru a ti ce trebuie s fac atunci cnd un set limitat de reguli nu pot fi aplicate. Dar aceasta nu trebuie s fie o limitare principial a arhitecturilor clasice: nu exist, dup cunotinele noastre, nici un motiv ca ceva de tipul "ierarhiei metodelor slabe" a lui Laird i Rosenberg sau de tipul "subscopurilor universale" ale lui Newell (1986) s fie incapabil principial s trateze problema degradrii fine. (Dup cunotinele noastre, n-a fost oferit nc nici un argument c arhitecturile conexioniste ar putea fi principial capabile s trateze aceast problem. De fapt, modelele conexioniste curente sunt, punct cu punct, la fel de lipsite de finee n modul lor de eec ca i cele bazate pe arhitecturile clasice. De exemplu, contrar unor estimri, modele ca cele ale lui McClelland i Kawamato, 1986, eueaz destul de nenatural la primirea unor informaii incomplete.) Pe scurt, teoreticienii clasici pot vedea proprietile stohastice ale comportamentului ca o consecin a interaciunilor dintre model i proprietile intrinseci ale mediului fizic n care acesta este realizat. Este esenial s amintim c, din punctul clasic de vedere, comportamentul deschis este prin excelen un efect al interaciunii, i c manipulrile simbolurilor sunt presupuse a fi unicele cauze ale interaciunii. Aceleai consideraii se aplic remarcilor lui Kosslyn i Hatfield (citai anterior) n legtur cu angajarea modelelor clasice n reprezentri "active" / "pasive". Este adevrat c, aa cum spun Kosslyn i Hatfield, reprezentrile manipulate de mainile Von Neumann "nu fac nimic" fr ca o CPU [unitate central] s acioneze asupra lor (ele nu se deterioreaz, de exemplu). Dar chiar dac presupunem prin absurd c mintea uman ar avea exact aceeai arhitectur ca i unele computere contemporane (Von Neumann), este evident c nici comportamentul lor, i deci nici comportamentul unui organism, nu e determinat doar de maina logic pe care o instaniaz psihicul, ci i de maina protoplasmatic ce implementeaz logica. Reprezentrile instaniate sunt, deci, obligatoriu active, chiar n contextul modelelor clasice; ntrebarea este dac tipul de activitate pe care acestea l prezint ar trebui s fie explicat de modelul cognitiv sau de teoria implementrii sale. Aceast problem este una empiric i nu trebuie pus n sprijinul punctului de vedere conexionist. (Aa cum este, de exemplu, n pasaje ca "Creierul nsui nu manipuleaz simboluri; creierul este mediul n interiorul cruia plutesc simbolurile, activndu-se unul pe cellalt. Nu exist un manipulator central sau un program central. Exist pur i simplu o vast colecie de "echipe" - patternuri de activare neuronal care,
ca nite echipe de furnici, activeaz alte patternuri de activare neuronal ... . Simim aceste simboluri agitndu-se n interiorul nostru cam n acelai fel n care simim agitaia din stomac" (Hofstadter, 1983, p.279). Acesta pare a fi un caz grav de Formicidae ex machina: furnici n stomacul duhului mainii.)
Caracterul explicit al regulilor

n concordan cu McClelland, Feldman, Adelson, Bower i McDermott (1986, p.6), "...modelele conexioniste conduc la o reconceptualizare a unor probleme psihologice cheie, cum ar fi natura reprezentrii cunotinelor... . O abordare tradiional a unor astfel de probleme trateaz cunotinele drept un corp de reguli consultate de mecanismele de procesare pe parcursul procesrii; n cazul modelelor conexioniste, aceste cunotine sunt reprezentate, adesea ntr-o form puternic distribuit, prin conexiunile dintre unitile de procesare." Aa cum observam n introducere, noi credem c att afirmaia c cele mai multe procese psihologice sunt bazate implicit pe reguli, ct i afirmaia corespondent c anumite comportamente divergente sunt rezultatul acelorai mecanisme cognitive, sunt deopotriv interesante i tendenioase. Noi vedem aceste probleme ca fiind n ntregime empirice i, n multe cazuri, deschise. Oricum, nimeni n-ar trebuie s fac o confuzie ntre distincia reguli implicite/reguli explicite i distincia dintre arhitectura clasic i cea conexionist 33. Confuzia este omniprezent tocmai n literatura conexionist: este universal asumat de ctre conexioniti c modelele clasice consider comportamentele uzuale derivate din reguli explicite codate. Dar aceasta pur i simplu nu e adevrat. Nu numai c nu exist nici un motiv pentru care modelele clasice s aib obligatoriu reguli explicite, dar - de fapt - argumentele dup care regulile sunt explicit reprezentate mental au fost ironizate de zeci de ani n tabra clasicitilor. (Vezi, pentru exemple relativ recente, discuiile despre caracterul explicit al regulilor gramatice n Stabler, 1985; pentru o dezbatere filozofic vezi Cummings, 1983.) Unicul fapt cu care teoreticienii clasici sunt de acord este c nu se poate ca toate comportrile uzuale s fie determinate de reguli explicite; cel puin unele dintre cauzele de determinare a comportamentului trebuie s fie implicite. (Argumentele pentru aceasta sunt n paralel cu observaiile lui Lewis Caroll din "Ce i-a spus estoasa lui Ahile"; vezi Caroll 1956). Toate celelalte probleme legate de caracterul explicit al regulilor sunt vzute de clasiciti ca fiind discutabile; i o mulime de nuane de opinii pe marginea acestui subiect pot fi gsite n tabra clasicitilor. Ideea principal este aceasta: nu toate funciile unui calculator clasic pot fi codificate sub forma unui program explicit; unele dintre ele trebuie cablate n interiorul su. De fapt, ntregul
33
Un exemplu n mod special flagrant despre cum problemele legate de arhitectur sunt confundate cu problemele legate de caracterul explicit al regulilor n literatura conexionist apare n PDP, Capitolul 4, unde Rumelhart i McClelland afirm c modelele PDP asigur "... o explicaie destul de plauzibil a modului n care putem ajunge s avem "cunotine" nnscute. La proporia de cunotine stocate, presupuse a se afla sub form de reguli explicite, inaccesibile ..., e greu de imaginat cum ar putea acestea "intra n capul" nou-nscutului. Ni se pare implauzibil ca nou-nscutul s posede sisteme elaborate de simboluri, i sistemele necesare pentru interpretarea acestora i formarea de reguli explicite, inaccesibile, care vor fi folosite n ghidarea comportamentului. Dup prerea noastr, nu e nevoie s-i atribuim o mainrie att de complex. Dac prin cunotine nnscute nelegem pur i simplu conexiunile pre-cablate, acestea sunt codificate din start n forma necesar mecanismelor de procesare." p.42. O anticipare a ceea ce pare sau nu pare s posede nou-nscutul ni se pare o cale greit pentru a face psihologia cognitiv a dezvoltrii. Dar argumentul lui Rumelhart i McClelland este de dou ori pe lng subiect, din moment ce un clasicist care le mprtete prejudecile se poate folosi la rndul su de aceeai rezolvare. Arhitectura clasic nu necesit o "mainrie complex" pentru "interpretarea" regulilor explicite, deoarece mainile clasice nu necesit deloc reguli explicite. Arhitectura clasic este, deci, neutr fa de problema empirism/nativism (la fel ca i conexionismul, aa cum corect remarcau Rumelhart i McClelland n alt parte).
program poate fi cablat hard n cazul n care el nu necesit modificri ulterioare. n aceste cazuri, mainile clasice pot fi bazate pe reguli implicite relativ la programele lor, iar mecanismul lor de tranziie ntre stri e n ntregime subcomputaional (adic subsimbolic). Ceea ce trebuie s fie explicit n cazul unei maini clasice nu este programul su, ci simbolurile pe care le nscrie pe benzile sale (sau le memoreaz n regitrii). Acestea, oricum, nu corespund regulilor mainii de tranziie ntre stri, ci structurilor sale de date. Structurile de date sunt obiectele pe care maina le transform, i nu regulile transformrii . n cazul programelor care analizeaz limbajul natural, de exemplu, arhitectura clasic pretinde o reprezentare explicit a descrierilor structurale ale propoziiilor, dar este total indiferent fa de caracterul explicit al gramaticilor, contrar credinei multor conexioniti. Una dintre inveniile importante din istoria calculatoarelor - calculatorul cu program memorat - face posibil ca programele s preia rolul structurilor de date. Dar nimic din cadrul arhitecturii nu ne impune ca aceasta s se ntmple ntotdeauna. Asemntor, Turing a demonstrat existena unei maini abstracte (aa numita Main Universal Turing) care poate simula orice main int (de tip Turing). O main universal e "bazat pe reguli explicite" relativ la maina pe care o simuleaz (n sensul c deine o reprezentare explicit a mainii, care e suficient pentru a specifica n mod unic comportamentul acesteia). n acelai timp, maina int poate foarte bine s fie "bazat pe reguli implicite" relativ la regulile care i guverneaz comportamentul. Deci, nu putei ataca teoriile clasice ale arhitecturii cognitive artnd c un proces cognitiv e bazat pe reguli implicite; arhitectura clasic permite procese bazate pe reguli explicite, dar nu le impune. Pe de alt parte, putei ataca arhitecturile conexioniste artnd c un proces cognitiv e bazat pe reguli explicite deoarece, prin definiie, arhitectura conexionis exclude tipurile de capaciti logico-sintactice necesare codificrii regulilor, precum i tipurile de mecanisme de execuie necesare aplicrii acestora. 34 n acest caz, ar fi foarte stnjenitor pentru conexioniti dac s-ar dovedi c exist argumente convingtoare n favoarea proceselor cognitive bazate pe reguli explicite. Un loc potrivit n care s cutm aceste argumente ar fi teoria achiziiei competenelor cognitive. De exemplu, multe lucrri tradiionale din domeniul lingvistic (vezi Prince & Pinker, 1988) i toate lucrrile recente din teoria nvrii matematice (vezi Osherson, Stov, & Weinstein, 1984), afirm c outputul caracteristic unui dispozitiv de achiziie cognitiv este un sistem recursiv de reguli (n cazul lingvistic, o gramatic). S presupunem c astfel de teorii se dovedesc a fi bine fundamentate; atunci acest lucru ar fi incompatibil cu presupunerea c arhitectura cognitiv a calitilor dobndite e conexionist.
34
Desigur, e posibil s fie simulat un "proces bazat pe reguli explicite" de ctre o reea conexionist, implementnd nti o arhitectur clasic n reea. Trecerea de la reele privite ca arhitecturi la reele considerate ca implementri este omniprezent n lucrrile conexioniste, aa cum am remarcat anterior.
A modela "stilul creierului"

Relaia modelelor conexioniste cu neurotiina e favorabil multor interpretri. Pe de o parte, oameni ca Ballard (1986) i Sejnowski (1981) ncearc n mod explicit s construiasc modele bazate pe proprietile neuronilor i ale organizrilor neuronale, chiar dac respectivele uniti neuronale sunt puin idealizate (s-ar putea spune chiar mai mult dect puin idealizate: vezi, de exemplu, comentariile despre Ballard, 1986, articol). Pe de alt parte, Smolensky (1988) consider unitile conexioniste ca fiind obiecte matematice crora li se poate da o interpretare fie n termeni neuronali, fie n termeni psihologici. Cei mai muli conexioniti se situeaz pe o poziie intermediar, referindu-se frecvent la ncercrile lor ca teoretizri ale "stilului creierului".35 nelegerea att a principiilor psihologice ct i a modului n care acestea sunt implementate neurofiziologic este mult mai folositoare (i, ntr-adevr, mult mai sigur empiric) dect nelegerea doar a uneia dintre ele. Acest lucru este indiscutabil. ntrebarea este dac avem ceva de ctigat proiectnd modele "stil creier" care nu spun nimic despre felul n care modelul se proiecteaz la nivelul creierului . Probabil c ideea modelrii "stil creier" este aceea c teoriile procesrii cognitive ar fi influenate de fapte biologice (n mod special de cele ale neurotiinei). Printre faptele biologice care influeneaz modelele conexioniste par a fi urmtoarele: conexiunile neuronale sunt importante pentru patternurile activitii creierului; "engrama" memoriei nu pare s fie localizat spaial; la o prim aproximare, neuronii par a fi elemente prag care nsumeaz activitatea recepionat la nivelul dendritelor lor; mare parte din neuronii din cortex posed "cmpuri receptive" multidimensionale, sensibile la o scar ngust de valori ca numr de parametri; tendina ca activitatea unei sinapse s duc la "excitarea" unui neuron e modulat de frecvena i recena excitrilor anterioare. S presupunem c aceste afirmaii, ca i altele asemntoare, sunt deopotriv adevrate i relevante pentru modul n care funcioneaz creierul - o presupunere care nu pune nici un fel de probleme. ntrebarea pe care noi am putea s-o punem este: ce anume rezult din aceste fapte, rezultat care s fie relevant pentru deducerea naturii arhitecturii cognitive? Rspunsul inevitabil este c foarte puin. Aceasta nu este o afirmaie a priori. Gradul relaiei dintre faptele de la diferite nivele ale organizrii unui sistem este o chestiune empiric. Oricum, n-avem motive s fim sceptici dac tipurile de proprieti listate anterior se reflect n vreun fel mai mult sau mai puin direct asupra structurii sistemului care realizeaz raionarea. S considerm, de exemplu, una dintre cele mai proeminente proprieti ale sistemelor neuronale: sunt reele care transmit activri care culmineaz cu schimbri de stare ale unor elemente quasi-prag. Cu siguran, afirmaia c raionamentul este rspndirea excitaiei de-a lungul reprezentrilor, sau chiar de-a lungul componentelor semantice ale reprezentrilor n-ar fi o concluzie garantat. La urma urmei, un VAX poate fi la fel de bine caracterizat ca fiind o reea de-a lungul creia sunt transmise excitaii care culmineaz cu schimbri de stare ale elementelor. Chiar i la nivelul la care opereaz cu reprezentri, un VAX are literal o arhitectur Von Neumann. Ideea este c structura "nivelelor mai nalte" ale unui sistem este foarte rar izomorf, sau mcar similar, cu structura "nivelelor mai joase" ale sistemului. Nimeni nu se ateapt ca teoria protonilor s fie foarte asemntoare cu teoria stncilor sau a rurilor, dei putem fi siguri c din aa ceva sunt "implementate" i stncile i rurile. Lucretius se nela cu siguran creznd c
35
Grupul de Cercetare PDP vede scopul su ca fiind "nlocuirea 'metaforei calculatorului' ca model al psihicului cu 'metafora creierului' ..." (Rumelhart & McClelland, 1986a, Ch. 6, p.75). Dar problema nu e deloc care metafor ar trebui adoptat; metaforele (fie 'calculator' fie 'creier') tind s fie o acreditare a ceea ce afirm cineva cnd are la dispoziie mai puin dect o ipotez serioas. Aa cum arta Pylyshyn (1984a), afirmaia c mintea uman ar avea arhitectura unui calculator clasic nu este o metafor, ci o ipotez literal empiric.
trebuie s existe o coresponden simpl ntre structura teoriilor de macronivel i cea a teoriilor de micronivel. El credea, de exemplu, c atomii sunt legai prin crlige i guri. Aa cum s-a demonstrat, el greea. Exist, fr ndoial, cazuri n care consideraii empirice speciale sugereaz corespondene detaliate structur/funcie sau alte analogii ntre nivele diferite ale organizrii unui sistem. De exemplu, inputul pentru stadiile periferice ale controlului percepiei vizuale i ale locomoiei trebuie s fie specificat n termenii unor patternuri proiectate anatomic (ale luminii, n primul caz, i ale activitii musculare, n cel de-al doilea); iar independena dintre structur i funcie este probabil mai redus n cazul unui sistem ale crui inputuri i outputuri trebuie specificate somatotopic. Deci, n aceste stadii e rezonabil s ne ateptm ca o structur distribuit anatomic s fie reflectat n cadrul unei arhitecturi distribuite funcional. Atunci cnd procesul cognitiv investigat este la fel de abstract ca raionamentul, nu exist nici un motiv s ne ateptm la izomorfism ntre structur i funcie: aa cum, ntr-adevr, demonstreaz cazul calculatorului. Poate c totul este prea evident pentru ca s merite s fie spus. ns se pare c trecerea la modelarea "stil creier" conduce la multe din caracteristicile pe care conexionitii le atribuie psihologiei, i c asta se ntmpl prin intermediul afirmaiei implicite - i negarantate - c ar putea s existe o asemnare ntre diferitele nivele ale organizrii unui sistem de calcul. Acest lucru este suprtor, deoarece cea mai mare parte a psihologiei care a cutat s gseasc analogii structurale este puternic recidivist. nct ideea c creierul este o reea neuronal motiveaz revenirea unei puternic discreditate psihologii asociaioniste. Similar, ideea c activitatea creierului este distribuit anatomic conduce la reprezentri distribuite funcional ale unor concepte care, la rndul lor, duc la presupunerea unor microtrsturi; iar erorile teoriilor despre concepte bazate pe caracteristici sunt binecunoscute i, dup cunotinele noatre, teoria microtrsturilor n-a fcut nimic pentru corectarea acestora (vezi Bolinger, 1965; J.D. Fodor, 1977). i din nou, ideea conform creia tria unei conexiuni dintre neuroni e afectat de frecvena co-activrilor lor e proiectat la nivel cognitiv. Consecina este o revenire a modelelor statistice ale nvrii care sunt arhicunoscute (att n psihologie ct i n IA) pentru extrema lor limitare din punct de vedere al aplicabilitii (Minsky & Papert, 1972; Chomsky, 1957). Atunci dei, n principiu, cunotinele despre funcionarea creierului ar putea direciona modelarea cognitiv ntr-o manier benefic, n practic o strategie de cercetare trebuie judecat dup rezultatele sale. Principalul rezultat al "modelrii stil creier" a fost renvierea unor teorii psihologice ale cror limitri au fost cunoscute anterior pe scar larg. Pe scar larg, pentru c presupuneri asupra structurii creierului au fost adoptate ntr-o manier prea direct ca ipoteze asupra arhitecturii cognitive; este un paradox instructiv faptul c ncercrile actuale de a fi absolut modern i de "a lua creierul n serios" ar duce la o psihologie greu de difereniat de cele mai nereuite modele ale lui Hume i Berkeley. Morala pare s fie c ar trebui s fim puternic suspicioi fa de tipul eroic de modelare a creierului care pretinde c se adreseaz problemelor cunoaterii. Simpatizm cu dorina pentru teorii biologice respectabile pe care o au muli psihologi. Dar, dac avem de ales, adevrul este mult mai important dect onorabilitatea.
Comentarii finale: conexionismul ca o teorie a implementrii

O tem recurent n discuia anterioar este aceea c multe din argumentele n favoarea conexionismului sunt cel mai bine construite ca postulnd o arhitectur cognitiv implementat printr-un fel de reea (de "uniti" abstracte). Vzute astfel, aceste argumente sunt neutre relativ la
ntrebarea ce este arhitectura cognitiv. 36 n cadrul acestor concluzii vom considera pe scurt conexionismul din acest punct de vedere. Aproape fiecare student care ncepe un curs de modele computaionale sau de procesare a informaiei ale cogniiei trebuie c e dezorientat de o foarte des ntlnit nenelegere privind rolul calculatorului fizic n astfel de modele. Studenii sunt aproape ntotdeauna sceptici n legtur cu "calculatorul ca model al cunoaterii" pe motive de tipul: "calculatoarele nu uit i nu fac greeli", "calculatoarele funcioneaz pe baza unei cutri complete", "calculatoarele sunt prea logice i nemotivate", "calculatoarele nu pot nva singure: ele pot doar s fac ceea ce li s-a spus" sau "calculatoarele sunt prea rapide (sau prea lente)" sau "calculatoarele nu obosesc i nu se plictisesc niciodat" i aa mai departe. Dac adugm la aceast list unele critici ceva mai sofisticate cum ar fi "calculatoarele nu prezint degradare fin" sau "calculatoarele sunt prea sensibile la degradare fizic" lista ncepe s semene cu argumentele avansate de conexioniti. Rspunsul la toate aceste critici a fost ntotdeauna c implementarea, i toate proprietile asociate cu realizarea particular a algoritmului pe care teoreticianul l folosete ntr-un caz particular, este irelevant pentru teoria psihologic; numai algoritmul i reprezentrile asupra crora opereaz acesta sunt presupuse a fi ipoteze psihologice. Studenii sunt nvai noiunea de "main virtual", i li se demonstreaz c anumite maini virtuale pot nva, uita, face greeli, se pot plictisi, i orice altceva ar putea dori cineva, cu condiia ca acel cineva s aib o teorie asupra originii fenomenului empiric respectiv. Fiind dat aceast distincie principial dintre un model i implementarea sa, un teoretician impresionat de virtuile conexionismului are posibilitatea de a propune PDP-urile ca teorii ale implementrii. Dar atunci, departe de a furniza noi baze revoluionare pentru tiina cognitiv, aceste modele sunt n principiu neutre fa de natura proceselor cognitive De fapt, ele ar putea fi vzute ca promovnd scopurile psihologiei clasice a prelucrrii informaiei, prin ncercarea de a explica modul n care creierul (sau poate o reea idealizat de tip creier) poate realiza tipurile de procese pe care le presupune tiina cognitiv tradiional. Conexionitii i consider uneori explicit propriile modele ca fiind teorii ale implementrii. Ballard (1986) se refer chiar la conexionism ca la "ncercarea implementaional (...)". Touretzky (1986) i privete n mod clar astfel modelul su BoltzCONS; el folosete tehnicile conexioniste pentru a implementa mecanisme convenionale de procesare simbolic, cum ar fi stive pushdown sau faciliti LISP.37 Rumelhart i McClelland (1986a, p.117), care sunt convini c prin conexionism se d semnalul unei despriri radicale de ncercrile convenionale de tip procesare de simboluri, se refer cu toate acestea la "implementri PDP" ale unor
36
Rumelhart i McClelland susin c modelele PDP sunt mai mult dect doar teorii ale implementrii, fiindc (1) ajut la o mai bun nelegere a problemei (p.116), (2) studiul PDPurilor poate conduce la presupunerea unor diferite procese de la nivel macro (p. 126). Ambele puncte se refer la valoarea euristic a teoretizrii "brain style". Deci, dei corecte n principiu, acestea sunt irelevante pentru ntrebarea crucial dac conexionismul este neles mai degrab ca o ncercare de implementare a modelului neuronal sau ntr-adevr .....o " nou teorie a psihicului" incompatibil cu modelele clasice de procesare a informaiei. Este o problem empiric dac valoarea euristic a acestei ncercri se va demonstra a fi pozitiv sau negativ. Noi ne-am spus deja prerea despre istoria recent a acestei ncercri.
37
Chiar n acest caz, cnd modelul este proiectat special pentru a implementa caracteristici de tip LISP, unii conexioniti uit s pstreze distincte nivelele implementaional - algoritmic. Aceasta conduce la discuii despre "proprieti emergente " i la afirmaia c, chiar atunci cnd implementeaz mecanisme de tip LISP, sistemele conexioniste "pot face lucrurile n moduri n care mainile Turing sau calculatoarele Von Neumann nu pot." (Touretzky, 1986). O asemenea afirmaie sugereaz c Touretzky face deosebire ntre diferite "moduri de calcul" nu n termeni de algoritmi diferii, ci n termeni de diferite moduri de implementare ale aceluiai algoritm. Dat fiind c nimeni nu deine o definiie brevetat a unor termeni ca "mod de calcul", acesta pare un mod eronat de a pune problema; nseamn c o main DEC folosete un "mod diferit de calcul" fa de o main IBM atunci cnd execut acelai program.
mecanisme cum ar fi atenia. Mai trziu, n acelai eseu, ei i afirm explicit poziia: contrar "reducionitilor", ei cred " ... c noi i folositoare concepte apar la diferite nivele de organizare". Dei ei astfel apr afirmaia c nivelele mai nalte ar putea fi nelese "... cu ajutorul studiului interaciunilor dintre unitile de la nivelele inferioare", ideea de baz c exist nivele autonome apare implicit pe tot parcursul eseului. Dar odat ce cineva admite c exist cu adevrat principii de nivel cognitiv diferite de principiile arhitecturale (prezumtive) pe care le susin conexionitii, par s rmn foarte puine de dezbtut. Evident c nu are sens s ne ntrebm dac cineva ar trebui sau nu s abordeze tiina cognitiv prin intermediul studiului "interaciunii dintre nivelele inferioare" sau -dimpotriv- prin intermediul studiului proceselor de la nivel cognitiv, de vreme ce cu siguran trebuie fcute amndou. Unii oameni de tiin studiaz principiile geologice, alii studiaz "interaciunea unitilor de la nivelul inferior", adic moleculele. Dar de vreme ce faptul c exist principii originale, autonome, ale geologiei nu este niciodat pus n discuie, cei care construiesc modele la nivel molecular nu afirm c ar fi inventat "o nou teorie a geologiei" care va renuna la toat discuia aceea de mod veche de tip "folclor geologic" despre stnci, ruri i muni! Nu avem, pe scurt, nici o obiecie fa de ideea reelelor ca modele poteniale de implementare, nici nu presupunem c vreunul din argumentele pe care vi le-am oferit sunt incompatibile cu aceast propunere. Problema este, oricum, c n cazul n care conexionitii vor ca modelele lor s fie construite aa, atunci vor trebui s-i modifice radical practica. Pentru c pare absolut evident c cele mai multe din modelele conexioniste, care au fost efectiv propuse, trebuie interpretate ca teorii ale cunoaterii i nu ca teorii ale implementrii. Aceasta reiese din faptul c este intrinsec acestor teorii faptul c atribuie un coninut reprezentaional unitilor (i/sau ansamblurilor de uniti) pe care le presupun. i, aa cum am remarcat la nceput, o teorie a relaiilor dintre strile reprezentaionale este ipso facto o teorie la nivelul cogniiei i nu la nivelul implementrii. A fost un refren al discuiei noastre faptul c, atunci cnd e neles mai degrab ca o teorie cognitiv dect ca una a implementrii, conexionismul pare s prezinte limitri fatale. Problema cu modelele conexioniste este c toate motivele care ne fac s credem c ele ar putea fi corecte ne conduc la a crede c aceasta nu poate fi psihologie.
CONCLUZIE
Care sunt, n concluzie, opiunile pentru dezvoltarea ulterioar a teoriilor conexioniste? Att ct ne putem da seama, exist patru ci pe care acestea le-ar putea urma: (1) S menin reprezentrile mentale nestructurate mpotriva punctului de vedere clasicist conform cruia reprezentrile mentale au semantic i sintax combinatoric. Argumentele productivitii i sistematicitii fac ca aceast opiune s nu par atractiv. (2) S abandoneze arhitectura de tip reea n favoarea reprezentrilor mentale structurate, dar s continue s insiste asupra unui demers asociaionist al naturii proceselor mentale. Aceasta este, n fapt, o revenire la abordarea psihicului de ctre Hume (vezi nota de subsol 29), i prezint o problem care noi nu credem c poate fi rezolvat: dei reprezentrile mentale sunt, dup presupunerile actuale, obiecte structurate, asociaia nu este o relaie sensibil la structur". Problema e atunci cum s reconstruim coerena semantic a gndirii fr a presupune procese psihologice sensibile la structura reprezentrilor mentale. (Echivalent, n termeni mai moderni, ar fi: cum s facem relaiile cauzale din cadrul reprezentrilor mentale s oglindeasc relaiile semantice fr s presupunem o tratare n spiritul teoriei demonstraiei a inferenei i - mai general - o tratare a coerenei semantice care e exprimat sintactic, n spiritul acestei teorii.) Aceasta este problema n care s-a mpotmolit asociaionismul tradiional, iar perspectivele actuale de soluionare nu par mai bune dect acum dou sute de ani. Altfel spus: dac ai nevoie de structur n reprezentrile mentale, fr
a ine cont de productivitatea i sistematicitatea sistemelor psihice, de ce s nu postulezi procese mentale care sunt senzitive structural n contul coerenei proceselor mentale? Pe scurt, de ce s nu fii un clasicist? n orice caz, observai c opiunea curent d imaginii clasiciste o mare parte din ceea ce i dorete: anume, identificarea strilor semantice cu relaii ntre iruri structurate de simboluri i identificarea proceselor mentale cu transformrile acestor iruri. Observai de asemenea c, aa cum stau acum lucrurile, aceast propunere e utopic, dat fiind faptul c nu exist propuneri serioase de ncorporare a structurilor sintactice n cadrul arhitecturilor conexioniste. (3) S trateze conexionismul ca o teorie a implementrii. Nu avem obiecii principiale fa de acest punct de vedere (dei exist, aa cum unii conexioniti au descoperit, motive tehnice pentru care reelele reprezint adesea o cale ciudat de a implementa maini clasice). Aceast opiune ar necesita rescrierea unei mari cantiti de material polemic, legat de ceea ce fac reelele opernd asupra structurilor simbolice, mai degrab dect rspndind activarea de-a lungul unor noduri interpretate semantic. Pe deasupra, aceast revizuire a politicii va duce cu siguran la pierderea multor fani ai micrii. Aa cum am artat, muli oameni au fost atrai de ncercrile conexioniste datorit promisiunilor de a: (a) desfiina nivelul simbolic al analizei, i (b) de a ridica neurotiina la tratarea direct a problemelor cogniiei. Dac conexionismul e considerat pur i simplu ca o teorie a modului n care cogniia este implementat neuronal, el nu poate constrnge modelele cognitive mai mult dect teoriile din biofizic, biochimie sau, n acest caz, din mecanica cuantic. Toate aceste teorii se ocup de asemenea cu procesele care implementeaz cogniia, i toate par a presupune structuri destul de diferite de arhitectur cognitiv. Ideea este c "implementeaz" este tranzitiv, i se aplic descendent. (4) S renune la ideea c reelele ofer (ca s-i citm pe Rumelhart i McClelland, 1986a, p.110) "... o baz rezonabil pentru modelarea proceselor cognitive n general". S-ar putea nc pstra ideea c reelele susin unele procese cognitive. E probabil c ele susin procese care pot fi evideniate prin inferene statistice; att ct ne putem da seama, modelele de tip reea sunt doar maini analogice pentru calcularea acestor inferene. De vreme ce ne ndoim c procesarea cognitiv ar consta n mare parte din analizarea relaiilor statistice, aceasta ar fi o estimare modest a perspectivelor teoriei reelelor comparativ cu ceea ce au oferit nii conexionitii. Aceasta e, de exemplu, o cale de a nelege ce se ntmpl n dialogul dintre Rumelhart i McClelland (1986b), respectiv Prince i Pinker (1988), dei nici un articol nu pune problema exact n aceti termeni. n fapt, Rumelhart i McClelland presupun un mecanism care, primind ca date de intrare un set de stimuli-perechi furnizate de un "profesor", calculeaz corelaia statistic dintre forma fonologic a terminaiei verbului i forma fonologic a articulrii la participiu trecut. (Mrimea corelaiilor astfel calculate este reprezentat analogic prin ponderile pe care reeaua le arat pe asimptot). Dat fiind problema articulrii unei noi rdcini verbale cu terminaia specificat fonologic, maina alege forma de participiu trecut cel mai des corelat cu secvena din setul de antrenament. Prin contrast, Prince i Pinker argumenteaz (de fapt) c, n nvarea morfologiei timpului trecut, trebuie s fie implicat mai mult dect simpla estimare de corelaii, deoarece ipoteza statistic verific prea puin din datele ontogenetice. Exist o alternativ la ideea empirist, care afirm c toat nvarea const ntr-un fel de inferen statistic, realizat prin ajustarea unor parametri; aceasta este ideea raionalist, ce postuleaz c un anumit tip de nvare este un fel de costrucie a unei teorii, realizat prin formularea de ipoteze i testarea acestora. Ni se pare c am mai vzut acest argument undeva. Ne aflm n faa unei senzaii chinuitoare de deja vu.
REFERINE
Arbib, M.(1975). Artificial intelligence and brain theory: Unities and diversities. Biomedical Engineering, 3, 238-274. Ballard, D.H. (1986). Cortical connections and parallel processing: Structure and function. The Behavioral and Brain Sciences, 9, 67 -120. Ballard, D.H. (1986). Parallel Logical Inference and Energy Minimization. Report TR142, Computer Science Department, University of Rochester. Black, I.B. (1986). Molecular memory mechanisms. In Lynch, G. (Ed.), Synapses, circuits, and the beginnings of memory, Cambridge, MA: M.I.T. Press, A Bradford Book. Bohnger. D. (1965). The atomization of meaning. Language, 41, 555-573. Benadbent, D. (1985). A question of levels: Comments on McClelland and Rumelhart. Journal of Experimental Psyhology: General,144, 189-192. Caroll, L. (1956). What the tortoise said to Achilles and other riddles. In Newman, J.R. (Ed.), The world of mathematics: Volume Four. New York: Simon and Schuster. Chomsky, N. (1957).Syntactic structures. The Hague: Mouton. Chomsky, N. (1965). Aspects of the theory of syntax. Cambridge: MA; M.I.T.Press. Chomsky, N. (1968). Language and mind. New York: Harcourt, Brace and World. Churchland, P.M. (1981). Eliminative materialism and the propositional attitudes. Journal of Philosophy, 78, 67-90. Churchland, P.S. (1986). Neurophilosophy. Cambridge, M.A.: M.I.T. Press. Cummings (1983). The nature of psyhological explanation. Cambridge, M.A.: M.I.T. Press. Denett, D. (1986).The logical geography of computational approaches: A view from the east pole. In Brand, M., & Harnish, M.(Eds.), The representation of knowledge. Tuscon, AZ: The University of Arizona Press. Dreyfus, H., & Dreyfus, S. (in press). Making a mind vs. modelling the brain: A.I. back at a branch point. Daedalus. Fahlman, S.E., & Hinton, G.E. (1987). Connectionist architectures for artificial intelligence. Computer, 20, 100-109. Feldman, J.A. (1986). Neural representation of conceptual knowledge. Report TR189. Department of Computer Science, University of Rochester. Feldman, J.A., & Ballard, D.H. (1982). Connectionists models and their properties. Cognitive science, 6. 205-254. Fodor, J. (1976). The language of thought. Harvester Press, Sussex. (Harvard University Press paperback). Fodor, J.D. (1977). Semantics: Theory of meaning in generative grammar. New York: Thomas Y. Crowell. Fodor, J. (1987). Psychosemantics. Cambridge, MA: M.I.T. Press. Geach, P. (1957). Mental acts. London: Routledge and Kegan Paul. Hewett, C. (1977). Viewing control structures as patterns of passing messages. The Artificial Intelligence Journal, 8, 232-364. Hillis, D. (1985). The connection machine. Cambridge, MA: M.I.T. Press. Hinton, G. (1987). Representing part-whole hierarchies in connectionist networks. Unpublished manuscript. Hinton, G.E., McClelland, J.L., & Rumelhart, D.E. (1986). Distributed representations. In Rumelhart, D.E., McClelland, J.L. and the PDP Research Group, Parallel distributed processing: Explorations in the microstructure of cognition. Volume I: Foundations. Cambridge, MA: M.I.T. Press/Bradford Books.
Hofstadter, D.R. (1983). Artificial intelligence: Sub-cognition as computation. In F. Machlup & U. Mansfield (Eds.), The study of information: Interdisciplinary messages. New York: John Wiley & Sons. Kant, I. (1929). The critique of pure reason. New York: Harper & Row. Katz, I. (1929). Semantic theory. New York: Harper & Row. Katz, J.J., & Fodor, J.A. (1963). The structure of a semantic theory, Language, 39, 170210. Katz, J., & Postal, P. (1964). An integrated theory of linguistic descriptions. Cambridge, MA: M.I.T. Press. Kosslyn, S.M., & Gatfield, G. (1984). Representation without symbol systems. Social Research, 51, 1019-1054. Laird, J.E., Rosenbloom, P.S., & Newell, A. (1986). Universal subgoaling and chunking: The automatic generation and learning of goal hierarchies . Boston, MA, Kluwer Hingham Publishers. Lakoff, G. (1986). Connectionism and cognitive linguistics. Seminar delivered at Princeton University, December 8, 1986. Makworth, A. (1987). Constraint propagatio. In Shapiro, S.C. (Ed.), The encyclopedia of artificial intelligence, Volume 1. New York: John Wiley & Sons. McClelland, J.L., Feldman, J., Andelson, B., Bower, G., & McDermott, D. (1986). Connectionist models and cognitive science: Goals, directions and implications. Report to the National Science Foundation, June 1986. McClelland, J.L., & Kawamoto, A.H. (1986). Mechanism of sentence processing: Assigning roles to constituents. In McClelland, Rumelhart and the PDP Research Group (Eds.), Parallel distributed processing: volume 2. Cambridge, MA: M.I.T. Press, Bradford Books. McClelland, J.L., Rumelhart, D.E., & Hinton, G.E. (1986). The appeal of parallel distributed processing. In Rumelhart, McClelland and the PDP Research Group, (Eds.), Parallel distributed processing: volume 1. Cambridge, MA: M.I.T. Press/Bradford Books. Minsky, M., & Papert, F. (1972). Artificial Intelligence Progress Report, AI Memo 252, Massachusetts Institute of Technology. Newell, A. (1969). Heuristic programming: Ill-structured problems. In Aronofsky, J. (Ed.), Progress in operations research, III. New York: John Wiley & Sons. Newell, A. (1980). Physical symbol systems. Cognitive Science, 4, 135-183. Newell, A. (1982). The knowledge level. Artificial Intelligence, 18, 87.127. Osherson, D., Stov, M., & Weinstein, S. (1984). Learning theory and natural language. Cognition, 17, 1-28. Pinker, S. (1984). Language, learnability and language development . Cambridge: Harvard University Press. Prince, A., & Pinker, S. (1988). On language and connectionism: Analysis of a parallel distributed processing model of language acquisition. Cognition, 28, this issue. Pylyshyn, Z.W. (1980). Cognition and computation: Issues in the foundations of cognitive science. Behavior and Brain Sciences, 3:1, 154-169. Pylyshyn, Z.W. (1981). The imagery debate: Analogue media versus tacit knowledge. Psychological Review, 88, 16-45. Pylyshyn, Z.W. (1984a). Computation and cognition: Toward a foundation for cognitive science. Cambridge, MA: M.I.T. Press, A Bradford Book. Pylyshyn, Z.W. (1984b). Why computation requires symbols, Prooceedings of the Sixth Annual Conference of the Cognitive Science Society, Bolder, Colorado, August, 1984 . Hillsdale, NJ: Erlbaum. Rakic, P. (1975). Local circuit neurons. Neurosciences Research Program Bulletin, 13 , 299-313.
Rumelhart, D.E. (1984). The emergence of cognitive phenomena from sub-simbolic processes. In Proceedings of the Sixth Annual Conference of the Cognitive Science Society, Bolder, Colorado, August, 1984, Hillsdale, NJ: Erlbaum. Rumelhart, D.E., & McClelland, J.L. (1985). Levels indeed! A response to Broadbent. Journal of Experimental Psychology: General, 114, 193-197. Rumelhart, D.E., & McClelland, J.L. (1986a). PDP Models and general issues in cognitive science. In Rumelhart, D.E., McClelland and PDP Research Group (Eds.), Parallel distributed processing, volume 1. Cambridge, MA: M.I.T. Press, A Bradford Book. Rumelhart, D.E., & McClelland, J.L. (1986b). On learning the past tenses of English verbs. In Rumelhart, D.E., McClelland and PDP Research Group (Eds.), Parallel distributed processing, volume 1. Cambridge, MA: M.I.T. Press, A Bradford Book. Schneider, W. (1987). Connectionism: Is it a paradigm shift for psychology? Behavior Research Methods, Instruments, & Computers, 19, 73-83. Sejnowsky, T.J. (1981). Skeleton filters in the brain. In Hinton, G.E., & Anderson, A.J. (Eds.), Parallel models of associative memory. Hillsdale, NJ: Erlbaum. Simon, H.A., & Chase, W.G. (1973). Skill in chess. American Scientist, 621, 394-403. Smolensky, P. (1988). On the proper treatment of connectionism. The Behavioral and Brain Sciences, 11, 1-74. Stabler, E. (1985). How are grammars represented? Behavioral and Brain Science, 6 , 391-420. Stich, S. (1983). From folk psychology to cognitive science. Cambridge, MA: M.I.T. Press. Touretzky, D.S. (1986). BoltzCONS: Reconciling connectionism with the recursive nature of stacks and trees. Proceedings of the Eighth Annual Conference of the Cognitive Science Society. Amherst, MA, August, 1986, Hillsdale, NJ: Erlbaum. Wanner & Maratsos, M. (1978). An ATN approach to comprehension. In Halle, M., Nresnan, J., & Miller, G.A. (Eds.), Linguistic theory and psychological reality. Cambridge, MA: M.I.T. Press. Watson, J. (1930). Behaviorism. Chicago: University of Chicago Press. Ziff, P. (1960). Semantic analysis. Ithaca, NY: Cornell University Press.

Fodor Conexionism

Încărcat de

Informații document

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Fodor Conexionism

Încărcat de

Drepturi de autor:

Formate disponibile

CONEXIONISM I ARHITECTUR COGNITIV: O ANALIZ CRITIC*

Jerry A. FODOR, Zenon W. PYLYSHYN

Traducerea: Oana Benga, UBB, Cluj-Napoca

2.1. Reprezentri mentale complexe

Fig. 2. O posibil reea conexionist pentru stabilirea inferenelor de la A&B la A sau la B.

2.2 Operaii sensibile la structur

3. NEVOIA DE SISTEME SIMBOL: PRODUCTIVITATE, SISTEMATICITATE, COMPOZIIONALITATE I COE-REN INFERENIAL

3.1 Productivitatea gndirii

3.2 Sistematicitatea reprezentrii cognitive

3.3. Compoziionalitatea reprezentrilor

i sntem datori lui Steve Pinker pentru aceast idee.

3.4. Sistematicitatea inferenei

de la P&Q&R la P i, de asemenea, de la P&Q la P.

Calculul paralel i problema vitezei

Rezistena la zgomot i distrugere fizic (i argumentul pentru reprezentarea distribuit)

Constrngeri "uoare", mrimi continue, mecanisme stohastice i simboluri active

Caracterul explicit al regulilor

A modela "stilul creierului"

Comentarii finale: conexionismul ca o teorie a implementrii

S-ar putea să vă placă și