Teoria asupra învăţării elaborată de psihologul american Edward Thorndike
(1874 - 1949) a dominat aproape o jumătate de secol. Deosebita ei influenţă asupra teoriilor ce au fost construite ulterior în acest domeniu, poate fi explicată prin existenţa în această teorie a unor intuiţii majore. Aceste intuiţii vor avea un rol deosebit în stimularea cercetărilor pe animale, în condiţii de laborator, a procesului de învăţare. Experimentul standard al lui Thorndike, devenit clasic, constă în plasarea unui pisici care în prealabil a fost înfometată, într-o cuşcă-problemă. În afara cuştii este plasată o farfurie cu mâncare aflată în raza vizuală a pisicii. Aceasta nu poate evada din cuşcă şi ajunge la mâncare decât în condiţiile în care apasă pe o clapă care permite deschiderea unei uşi. Primele mişcări ale animalului ce vizau părăsirea cuştii au fost zgârieturi, muşcături, lovituri în pereţii cuştii etc. Aceste mişcări, efectuate de animal la întâmplare au fost considerate de Thorndike „încercări” şi majoritatea au fost lipsite de efectul pozitiv scontat, de aceea au fost numite „erori”. În condiţiile în care pisica reuşeşte din întâmplare să atingă clăpiţa ce activează mecanismul de deschidere a uşii şi ajunge la hrană, Thorndike a observat că, pusă din nou în cuşca-problemă, pisica face mai puţine erori şi are nevoie de mai puţine încercări pentru a ieşi din cuşcă. Diferenţa dintre comportamentul iniţial haotic al pisicii şi cel ulterior, mult mai bine orientat spre scop a fost considerată ca punând în evidenţă existenţa unui proces de învăţare. Conform experimentului lui Thorndike, învăţarea nu are loc dintr- o dată, ci este un proces destul de lent de eliminare treptată a erorilor şi de reţinere a comportamentelor urmate de un efect pozitiv. Un rol deosebit de important în teoria lui Thorndike îl ocupă termenii de sancţiune şi de recompensă. Deşi la început Thorndike a preferat să utilizeze termenii de plăcere şi neplăcere, sub presiunea criticilor venite dinspre psihologii behaviorişti care considerau că aceşti termeni trimit la presupuse procese psihice motivaţionale inaccesibile cercetării ştiinţifice obiective, mai târziu el a adoptat termenii preferaţi de behaviorişti, cei de sancţiune şi recompensă. Toate acţiunile animalului care nu conduc la rezultatul urmărit de acesta, (deschiderea uşiţei), sunt considerate a fi urmate de sancţiune. Eroarea este întotdeauna sancţionată, în timp ce comportamentul recompensat este învăţat. Procesul de învăţare prin încercare-eroare în accepţiunea lui Thorndike, poate fi sintetizat astfel. Aflat într-o situaţie problematică, comportamentul unui animal poate fi iniţiat numai de existenţa unui stimul suficient de puternic, în cazul nostru foamea asociată cu vederea hranei. Foamea este cea care asigură starea de pregătire a animalului pentru acţiune, (în absenţa unui stimul cauzal suficient de puternic pisica se poate lungi în mijlocul cuştii pentru a toarce), în timp ce vederea hranei este necesară pentru a-i confirma animalului că efortul lui de a ieşi din situaţia problematică va fi recompensat adecvat. Între stimulul determinant şi recompensă trebuie să existe o bună potrivire. În condiţiile în care stimulul determinant este foamea, recompensa trebuie neapărat să corespundă acestei trebuinţe a pisicii. Dacă vom plasa în afara cuştii o farfurie de grăunţe, această hrană nefiind adecvată, nu o va motiva pe pisică să facă încercări de părăsire a cuştii. Existenţa stimulului determinant conduce la răspuns, (acţiune, comportament), iar răspunsul la rândul lui, poate fi urmat de două tipuri de efecte: pozitiv sau negativ, sancţiune sau recompensă. În condiţiile în care toate organismele vii luptă pentru conservarea energiei, viaţa lor depinzând de aceasta, este normal ca orice răspuns urmat de sancţiune, orice eroare, să aibă un sens negativ, să fie nedorită. Este motivul pentru care, crede Thorndike, numai răspunsul urmat de efect pozitiv, adică recompensa poate conduce la învăţare. Stimul Æ Răspuns Concluzia psihologului american a fost că învăţarea constă în realizarea cu ajutorul recompensei a unei legături, (conexiuni) între stimul şi răspuns. În lipsa recompensei învăţarea nu se realizează, deoarece comportamentele urmate de sancţiune nu se reţin. Stimul Æ Răspuns Importanţa deosebită a învăţării a ieşit şi mai puternic în evidenţă atunci când Thorndike a descoperit că repetiţia, mult prea adesea considerată ca fiind veritabila „mamă a învăţării”, nu conduce decât la o întărire uşoară (şi aceasta nu întotdeauna) a conexiunilor. Dar această întărire uşoară a conexiunilor nu o face responsabilă în nici un caz şi de producerea lor, singura care reuşeşte să producă învăţare nouă fiind, în teoria lui Thorndike, doar recompensa. Astfel, deşi legea repetiţiei a ocupat iniţial un loc deosebit de important în teoria conexiunii, importanţa ei a ajuns mai târziu să fie serios reconsiderată. După ce Thorndike a stabilit că învăţarea apare numai în condiţiile în care răspunsul dat de animal este urmat de un efect pozitiv, recompensa repetată întărind (reinforcement) treptat probabilitatea emiterii răspunsului adecvat, o nouă problemă importantă se cerea rezolvată şi anume Recompensă Sancţiune + Recompensă – Sancţiune aceea a rolului şi a ponderii exacte a recompensei şi a sancţiunii în învăţare. Dacă recompensa, ca efect pozitiv al comportamentului, este cea care produce conexiuni şi, prin aceasta învăţare, am fi tentaţi prin deducţie logică, să credem că sancţiunea este cea care determină efectul contrar, şi anume distrugerea conexiunilor sau uitarea comportamentelor învăţate. În acest caz, recompensa şi pedeapsa ar produce efecte contrare, una creând învăţare, cealaltă conducând la uitare dar, în ciuda sensului contrar al acţiunii lor, rolurile lor ar fi complementare, ele având o pondere şi o importanţă similară în procesul învăţării. Pentru a se lămuri în privinţa ponderii recompensei şi pedepsei în învăţare Thorndike a realizat un nou experiment derivat din experimentul standard. Astfel, după ce pisica a fost introdusă în situaţia experimentală iniţială şi a învăţat în urma încercărilor repetate să apese pe clăpiţă şi să iasă afară din cuşcă, este făcută o modificare esenţială. În noua situaţie experimentală, reintrodusă în cuşcă, pisica va găsi de data aceasta clăpiţa blocată. În aceste condiţii, tot ceea ce a învăţat ea în cadrul primului experiment se dovedeşte a fi lipsit de utilitate în cadrul celui de al doilea. Dacă ipoteza de la care s-a pornit, şi anume că ponderea sancţiunii şi a pedepsei în învăţare este egală în ciuda rolului lor contrar ar fi fost adevărată, iar sancţiunea ar urma să aibă un rol distructiv anulând învăţarea, aceasta ar fi însemnat ca pisica să uite complet ceea ce a învăţat în situaţia anterioară. Observaţiile lui Thorndike au condus însă la infirmarea acestei ipoteze. În primă instanţă, după ce a încercat fără succes să deschidă uşiţa aşa cum învăţase, pisica a reînceput să se comporte din nou aleatoriu, prin încercare-eroare. Dar, din când în când, pisica revine la comportamentul învăţat, încercând să deschidă uşiţa prin apăsarea clapei. Aceasta arată că, sub influenţa sancţiunii nu s-a produs uitarea şi, astfel, sancţiunea s-a dovedit a avea o pondere mai puţin importantă în învăţare. Ea nu are puterea de a distruge legăturile create prin efectul de recompensare. Astfel, dacă recompensa este cea datorită căreia se produce învăţarea prin determinarea apariţiei de noi conexiuni S – R (stimul - răspuns), sancţiunea este cea care fără să determine uitarea, declanşează din nou comportamentul de tip încercare – eroare. Ea afectează numai răspunsul, provocând multiplicarea lui, nu şi conexiunile deja formate. Descoperirea acestei diferenţe de pondere şi rol între recompensă şi sancţiune este una dintre cele mai importante contribuţii a lui Thorndike. O nouă provocare pentru Thorndike a apărut atunci când a trebuit să explice de ce nu este necesar ca animalul să înveţe un comportament nou într-o situaţie în care apar diferenţe faţă de situaţia experimentală iniţială. Concret, dacă după ce animalul a învăţat să deschidă uşiţa sunt realizate de către experimentator mici modificări ale formei cuştii, de poziţionare a clăpiţei sau a hranei din afara cuştii etc., animalul nu se arată a fi prea mult derutat, reuşind totuşi să iasă din cuşcă şi dovedind că învăţarea anterioară nu a fost afectată de apariţia acestor modificări. Pentru a explica această permanenţă a învăţării în condiţiile apariţiei unor modificări în situaţia experimentală iniţială, Thorndike a elaborat teoria elementelor identice şi a transferului asociativ, o teorie care a avut şi are încă foarte mulţi adepţi, dar care a avut, aşa cum am văzut deja, şi puternici critici precum G. Allport sau psihologii gestaltişti. Conform acestei teorii, într-o situaţie în care apar modificări faţă de situaţia experimentală iniţială nu este necesară realizarea de noi conexiuni şi, astfel, de o nouă învăţare, în condiţiile în care există elemente identice între cele două situaţii. Aceste elemente identice trebuie însă cu necesitate să depăşească cantitativ şi calitativ diferenţele ce apar în situaţia experimentală nouă. Existenţa elementelor identice între situaţii face să se producă ceea ce Thorndike a numit transfer asociativ. Cu alte cuvinte, psihologul american va înţelege prin transfer asociativ identificarea de către animal a elementelor identice dintre cele două situaţii concomitent cu ignorarea de către el a diferenţelor minore ce apar în noul montaj experimental. Rezultatul observabil al acestui proces de evaluare prin comparare a celor două situaţii este rezolvarea situaţiei – problemă noi prin realizarea aceluiaşi comportament învăţat anterior. În concluzie, putem spune că efortul lui Thorndike a fost canalizat spre descoperirea elementelor prime ale învăţării, considerate a fi conexiunile dintre stimul şi răspuns. Învăţarea debutează prin comportamente de tip încercare – eroare, acestea fiind selectate de către recompensă. În aceste condiţii, legea fundamentală sub care se află procesul de învăţare este legea efectului. Potrivit acestei legi, recompensa este cea care conduce la progres în învăţare, în timp ce sancţiunea reduce doar probabilitatea de apariţie a comportamentului care a condus la insatisfacţie. Teoria lui Thorndike se dovedeşte a fi o teorie a elementelor, asociaţionistă (conexiunile pot fi considerate asocieri între stimul şi răspuns) şi cantitativistă. Ea urmează îndeaproape principiile enunţate de filosofii empirişti englezi privind achiziţionarea experienţei de viaţă. Deşi nu a fost un psiholog behaviorist declarat, el folosind ocazional termeni „mentalişti” precum impuls, satisfacţie şi insatisfacţie ce trimit la presupuse procese psihice, interne, Thorndike a fost de acord cu majoritatea principiilor behavioriste. Astfel, în teoria lui se realizează o întărire automată a conexiunilor, fără participarea sau influenţa conştiinţei. A fi inteligent, după Thorndike, înseamnă a poseda un număr cât mai mare de conexiuni şi de a avea acces la acestea rapid, pentru a identifica elementele identice şi a realiza în mod optim transferul asociativ. Dacă am folosi termenii lui J. Piaget, am putea spune că teoria lui Thorndike pune accent mai mult pe procesul asimilării decât pe cel al acomodării şi astfel, adaptarea nu este surprinsă în complexitatea sa.