Sunteți pe pagina 1din 10

TEORIILE ÎNVĂŢĂRII

1. Conceptul de învăţare
Viaţa este un proces care presupune schimbare permanentă. Din copilărie până la
maturitate şi moarte oamenii sunt în continuă schimbare. Există mai mulţi factori care contribuie
la producerea acestor modificări, dintre aceştia învăţarea este unul dintre cei mai importanţi. Pe
parcursul experienţei se însuşesc noi informaţii, atitudini, deprinderi şi modalităţi de
comportament. În psihologie, termenul de învăţare face referire la schimbarea relativ
permanentă a comportamentului, ca rezultat al experienţei, al interacţiunii cu mediul. Nu toate
schimbările de comportament sunt considerate ca fiind rezultatul învăţării. Conceptul de învăţare
se referă la modificări care sunt rezultatul experienţei şi nu la cele care au cauze biologice, cum
ar fi ingerarea de droguri, oboseala, maturizarea..
Învăţarea nu trebuie confundată cu reflexele, instinctele sau cu procesul de maturizare.
Reflexul este un răspuns înnăscut la un stimul specific (de exemplu, tragerea mâinii atunci când
este atins un obiect fierbinte). Instinctul este un comportament complex înnăscut specific
membrilor unei specii (de exemplu, construirea cuibului este un comportament instinctual întâlnit
la păsări). Maturizarea este procesul în care un comportament apare ca rezultat al dezvoltării
normale a individului (de exemplu, mersul este rezultat al maturizării).
Trebuie reţinut că învăţarea nu are întotdeauna rezultate vizibile imediat. De exemplu,
dacă cineva vizionează iarna la Tv. un film în care se explică cum se loveşte corect mingea de
tenis, rezultatele vor fi vizibile abia în primăvar[, c\nd individul va avea ocayia s[ joace din nou
tenis. De asemenea, schimbările produse în comportament nu sunt întotdeauna intenţionate. De
exemplu, o persoana care a făcut indigestie în urma consumării unui anumit produs, va evita pe
viitor să mai consume respectivele produse.
Cele mai simple forme de învăţare sunt adaptarea şi sensibilizarea. Adaptarea apare
atunci când o persoana se obişnuieşte cu un stimul prezentat repetat. De exemplu, dacă în faţa
geamului locuinţei se începe repararea străzii, primele zgomote vor face persoana să tresară, dar
dacă acestea zgomote vor continua organismul se obişnuieşte, persoana respectivă nu va mai
reacţiona. Este vorba despre învăţare deoarece individul respectiv a învăţat să nu mai reacţioneze,
aceasta fiind rezultatul experienţei. Este un proces prin care organismul nu mai răspunde reflexiv
la stimuli necondiţionaţi, care au fost prezentaţi repetat. Modificările comportamentale darotate
adaptării pot să nu fie permanente. Unii cercetători vorbesc despre o adaptare de scurta durată şi
de una de lungă durată. Se pare că există mecanisme cerebrale de control diferite pentru fiecare
dintre ele (Leaton & Suplle, 1986), în sensul că adaptarea de lungă durată poate fi rezultat al
învăţării. Adaptarea permite ignorarea stimulilor nocivi sau lipsiţi de importanţă şi orientarea
atenţiei spre stimuli noi.
Sensibilitatea apare atunci când organismul este expus unui stimul care este asociat de
senzaţia de durere. Dacă o persoana devine sensibilă la un stimul, la următoarea apariţie a
aceluiaşi stimulul aceasta va reacţiona mai uşor. Un sunet de clopoţel nu face, în mod normal, o
persoană să tresară. Dacă însă acest sunet a fost asociat cu senzaţia de durere, persoana va
reacţiona puternic când îl va auzi.
2. Tipuri de învăţare
Psihologii consideră că există trei tipuri de învăţare: condiţionarea clasică (sau învăţarea
prin asocierea stimulilor), condiţionarea operantă (învăţarea este rezultatul asocierii
comportamentelor cu consecinţele acestora) şi învăţarea cognitivă (prin manipularea mentală a
informaţiei).
a. Condiţionarea clasică
Originile acestei teorii le găsim la Aristotel, care considera că învăţarea depinde de
contiguitate, adică de apariţia apropiată a evenimentelor în timp şi spaţiu. J. Lock şi D. Hume
sunt cunoscuţi ca asociaţionişti, ei considerând că învăţarea depinde de asocierea evenimentelor
unele cu altele. În anul 1890, psihologul rus I. Pavlov a raportat un experiment de învăţare
asociativă, realizat în timp ce analiza rolul salivei în procesul de digestie. Pentru a studia
răspunsul reflex al glandelor salivare se măsura cantitatea de salivă, atunci când hrana se afla pe
limba animalului. În timpul experimentelor autorul a constat că adesea câini salivau înainte ca ei
să primească mâncarea. Semnalele (aprinderea luminii, paşii experimentatorului) provocau un
răspuns reflex pe care doar mâncarea îl producea. Aceasta reacţie a apărut atunci când s-a realizat
o asociaţie de contiguitate între prezentarea mâncării şi alt stimul.
Pavlov considera condiţionarea clasică o formă de învăţare prin asociaţie, şi anume
asocierea în timp a unui stimul neutru (care nu produce un răspuns) cu un stimul care produce
răspuns. Pavlov a utilizat aparate pentru măsurarea progresului în învăţare şi a folosit hrana ca
stimul pentru producerea răspunsului (salivarea). El a folosit ca stimul neutru sunetul unui
metronom. După un interval de timp bine măsurat el hrănea animalul cu o mică cantitate de
hrană pentru a măsura cantitatea de salivă. După fiecare 15 minute procedeul era reluat, curând
animalul salivând doar la auzul sunetului metronomului. Cu cât mai frecvent era asociat sunetul
metronomului cu hrana, cu atât mai des metronomul producea salivare. Timpul la care se succed
stimulii este foarte important. Pavlov a constat că cele mai bune rezultate se obţin atunci când
sunetul precede mâncarea cu jumătate de secundă. Timpul mai lung este mai puţin eficient, iar
când sunetul apărea odată cu mâncarea sau când hrana preceda sunetul nu mai apărea învăţarea.
Pavlov foloseşte o noua terminologie:
• stimulii care produc un răspuns ne-învăţat sunt denumiţi stimuli necondiţionaţi (SNC). Cu
alte cuvinte, răspunsul la aceşti stimuli este înnăscut. În experimentul lui Pavlov stimulul
necondiţionat este hrana;
• salivarea este un răspuns necondiţionat (RNC). Este un răspuns ne-învăţat, o reacţie
înnăscută la un stimul necondiţionat;
• sunetul metronomului este un stimul condiţionat (SC). Acest sunet singur nu putea
declanşa răspunsul de salivare. Acest lucru este posibil prin formarea abilităţii de a produce un
răspuns prin procesul de condiţionare clasică;
• când animalul a început să saliveze la stimulul condiţionat, salivarea a devenit răspuns
condiţionat (RC). Când un răspuns, care este similar sau identic cu un răspuns necondiţionat este
produs de către un stimul condiţionat, atunci avem de a face cu un răspuns condiţionat.
În rezumat: Hrana era stimul necondiţionat (SNC), sunetul stimul condiţionat (SC),
salivaţia era un răspuns necondiţionat (RNC), iar când salivaţia era produsă de un stimul
condiţionat, ea devine un răspuns condiţionat (RC).
Condiţionarea clasică este o formă de învăţare în care un stimul anterior neutru (SC)
asociat în timp cu un stimul necondiţionat (SNC) produce un răspuns condiţionat (RC).
Rezultatul acestei asocieri a stimulului condiţionat cu un stimul necondiţionat, este că stimulul
condiţionat produce un răspuns condiţionat identic sau foarte asemănător cu un răspuns
necondiţionat.
Condiţionarea clasică este considerată o formă de învăţare pentru că un nou
comportament este însuşit dar şi pentru că un comportament mai vechi poate fi produs de un

66
stimul nou, comportamentul este “schimbat” doar în acest sens. Elementul critic al acestui tip de
învăţare este că stimulii, cel necondiţionat şi cel condiţionat, trebuie să fie asociaţi în timp.
Sunt o serie de factori care influenţează condiţionarea. În general, cu cât intensitatea
stimulului necondiţionat este mai mare şi există un număr mai mare de asocieri a stimulului
necondiţionat cu cel condiţionat, cu atât condiţionarea este mai puternică. Intervalul de timp între
SNC şi SC influenţează achiziţionarea răspunsului condiţionat. De asemenea ordinea de
prezentare în timp a stimulilor, SNC şi SC, are efecte asupra apariţiei condiţionării.
În condiţionarea clasică, răspunsul condiţionat poate să apară şi la stimuli asemănători
stimulului condiţionat. Acest fenomen este denumit generalizarea stimulilor. Astfel, un câine
condiţionat la sunetul unui clopoţel, salivează şi la sunetul clopoţelului de la uşă sau de la
telefon. Poate să apară şi fenomenul de discriminare a stimulilor, când răspunsul condiţionat nu
mai apare la stimuli asemănători celui condiţionat. Acest lucru se întâmplă atunci când câinele a
învăţat că alte sunete de clopoţel nu sunt urmate de hrană.
Dacă stimulul condiţionat (sunetul clopoţelului) este în mod repetat prezentat fără a fi
urmat de stimulul necondiţionat, răspunsul condiţionat se diminuează şi chiar poate să dispară.
Fenomenul este denumit extincţie. Dacă un câine a fost învăţat să saliveze la sunetul unui
clopoţel înainte de masa de dimineaţă, răspunsul condiţionat va dispărea dacă sunetul nu va fi
urmat de prezentarea hranei (SNC). Extincţia poate să inhibe răspunsul condiţionat, fără să îl
elimine.
Un RC care a fost supus unei extincţii, poate să apară mai târziu dacă răspunsul
condiţionat este re-întărit. În cazul condiţionării clasice, întărirea se referă la capacitatea unui
stimul condiţionat de a produce un răspuns condiţionat prin asociaţie cu un stimul necondiţionat.
Acest proces prin care un stimul condiţionat supus extincţiei produce iarăşi un răspuns
condiţionat poartă numele de refacere spontană. Răspunsul condiţionat este mai slab, iar
extincţia apare mai repede.
Aplicaţiile condiţionării clasice
Psihologii din domeniul publicitar au utilizat condiţionarea clasică pentru a asocia
produsele cu stimuli atractivi, cum ar fi: atracţie sexuală, distracţie. De exemplu, în reclamele
pentru maşini, acestea sunt asociate femeilor frumoase, determinând o sexualizare a relaţiei
client-maşină. Ideea implicită este că având maşină vei avea şi companie plăcută. Atribuirea de
valenţe sexuale unor obiecte neutre s-a demonstrat experimental pe animale. Într-un experiment,
şobolanii masculi erau plasaţi în tuburi de plastic şi separaţi de femele printr-un grilaj. Femelele
şobolani (stimul necondiţionat) produceau excitaţie sexuală (răspuns necondiţionat). După mai
multe repetări ale situaţiei simpla aşezare a masculilor în tuburile de plastic (stimul condiţionat)
era suficientă pentru a produce excitaţie sexuală (răspuns necondiţionat), masculii angajându-se
mai rapid în actul sexual (Rachman, 1966; Zamble, Mitchell & Findlay, 1986).
Condiţionarea clasică poate fi o explicaţie posibilă a fetişismului, când oamenii sunt atraşi
sexual de obiecte neobişnuite: pantofi, articole din piele etc.
S-a demonstrat că pot apărea reacţii fobice la stimuli neutri. J. Locke a constat că atunci
când copii sunt pedepsiţi la şcoală ei încep să se teamă de manuale şi alte obiecte asociate şcolii.
Putem considera că aceşti copii au fost condiţionaţi să-şi dezvolte teama de şcoală. Cel mai
faimos studiu de condiţionare clasică a fobiei a fost realizat de Watson (1920). Subiectul era un
copil de 11 luni, care se juca cu diferite animale. Când copilul a atins un şobolan alb Watson a
produs un stimul puternic în spatele lui. Copilul a răspuns la zgomot (SNC) cu frică (RNC),
sărind violent şi îndepărtându-se de animal. După 7 asocieri ale şobolanului alb cu zgomotul,
copilul răspundea la vederea şobolanului (SC) cu teamă (RC), plângând şi evitându-l. Când a fost
testat câteva zile mai târziu copilul a indicat o generalizare a stimulilor. El avea reacţii de teamă
la obiecte albe asemănătoare: câine, iepure, părul alb a lui Watson şi chiar la masca lui Moş

67
Crăciun. Din motive etice experimentul nu a mai continuat, dar a demonstrat că fobia este
rezultatul învăţării prin condiţionare clasică.
Acest tip de învăţare poate explica dependenţa de drogurile psihoactive. Când se
administrează un drog psihoactiv (SNC), cum ar fi heroina, apar o serie de efecte fiziologice
(RNC). În timp, pentru a obţine aceleaşi efecte, este nevoie de creşterea dozei. Toleranţa poate fi
considerată, în parte, ca fiind rezultatul condiţionării. Stimulii asociaţi administrării drogului
acţionează ca stimuli condiţionaţi care produc răspunsuri fiziologice condiţionate opuse efectelor
produse de drog. De exemplu, deşi heroina induce depresie respiratorie, stimulii asociaţi
administrării ei produc excitaţie respiratorie. Probabil este vorba despre un mecanism adaptativ,
un proces compensator, care nu permite ca răspunsurile la acţiunea drogului să fie extreme.
Toleranţa la heroină poate să apară deoarece stimulii asociaţi administrării ei, de exemplu
hipotermia, pot acţiona ca stimuli condiţionaţi pentru a îndepărta efectele produse de heroină.
În anii ΄60 Clark Kenneth a realizat un experiment în care a folosit două păpuşi, una albă
şi cealaltă neagră, întrebând copiii albi şi de culoare: “Care dintre păpuşi arată ca tine?”, “Care
păpuşă este o păpuşă bună?”, “Care dintre păpuşi este rea?”. Copiii au răspuns că păpuşa albă
arată ca ei. Cei mai mulţi dintre ei au indicat, de asemenea că păpuşa alba este “bună”, iar cea
neagra este “rea”, păpuşa albă este “drăguţă”, în timp ce cea neagră este “murdară”. Cum au
învăţat copii aceste asociaţii? Pe parcursul formării prejudecăţii, pielea neagră a fost asociată cu
sărăcia şi inferioritatea, astfel copiii au învăţat să atribuie aceste caracteristici persoanelor de
culoare neagră.
Această atitudine rasistă a fost însuşită atât de copii albi cât şi de cei de culoare, deoarece
ei au trăit în acelaşi mediu social. La fel ca şi albii, copii de culoare îi văd pe albi mai buni, iar pe
ceide culoare ca fiind mai răi. În experimentul lui Clark majoritatea copiilor negri au ales păpuşa
albă ca fiind bună, iar cea neagră ca fiind rea.
Experimentul de condiţionare realizat de Straats şi Straats (1958) ajută la explicarea
condiţionării observate de Clark. Subiecţilor li s-a cerut să pronunţe anumite cuvinte în timp ce
priveau alte cuvinte. Astfel, erau asociate cuvintele plăcute şi neplăcute cu nume de persoane sau
o naţionalităţi. În scurt timp, subiecţii au manifestat atitudini diferite faţă de anumite nume sau
naţionalităţi, în funcţie de cuvintele pozitive sau negative care le-au fost asociate. Reclamele
publicitare, politicienii, producătorii de filme încearcă să folosească acest tip de condiţionare
pentru a influenţa emoţiile oamenilor. Când un politician îşi asociază un simbol pozitiv, de
exemplu un steag, când un regizor foloseşte o muzică dramatică sau o persoană se îmbracă bine
pentru un interviu de angajare, fiecare dintre ei încearcă să se pună în valoare asociindu-se cu
stimuli pozitivi.

b. Condiţionarea operantă
În condiţionarea clasică un stimul particular produce un răspuns care deja există în
repertoriul organismului (în experimentele lui Pavlov sunetul clopoţelului produce salivarea).
Fiinţa umană, însă, are capacitatea de a învăţa comportamente care nu sunt înnăscute, cum are fi
de exemplu abilitatea de a citi. Achiziţionarea noilor comportamente este rezultatul unui tip
diferit de condiţionare, numit condiţionare operantă. Cea mai mare parte din ceea ce oamenii
învaţă pe parcursul vieţii este rezultatul condiţionării operante. Oamenii cresc sau descresc
frecvenţa acţiunilor lor în funcţie de consecinţele acestor acţiuni. Comportamentele au anumite
efecte, care vor determina dacă aceste comportamente vor mai fi sau nu angajate în viitor. Putem
defini condiţionarea operantă ca formă de învăţare în care consecinţele comportamentului
influenţează probabilitatea de apariţie a acestora.
În timp ce Pavlov studia comportamentul câinilor, E. L. Thorndike observa
comportamentul pisicilor. Thorndike a pus o pisică înfometată într-o cutie de lemn, a cărei uşă

68
era prevăzută cu zăvor. Animalul putea ieşi din cuşcă dacă acţiona zăvorul care închidea uşa.
Hrana era aşezată în faţa cuştii, în câmpul vizual al pisicii. La început pisica realiza acţiuni
ineficiente: lovea în şipcile de lemn ale cuştii sau încerca să se strecoare printre ele. Accidental
animalul realiza acţiunea corectă, deschidea zăvorul şi iaşea în afara cutiei ajungând la hrana.
Repetând experimentul de mai multe ori, Thorndike a constat că pisicii îi ia tot mai puţin timp să
se elibereze din cuşcă şi să ajungă la mâncare.
Observaţiile l-au făcute să emită ipoteza că efectele unei acţiuni au un rol important în
apariţia viitoare a acţiunii. Orice act care într-o situaţie dată produce satisfacţie, se asociază cu
situaţia respectivă, iar atunci când situaţia respectivă reapare este mult mai probabil ca şi actul
respectiv să reapară. Orice act care într-o situaţie dată produce disconfort se disociază de acea
situaţie şi este mai puţin probabil ca actul să reapară atunci când situaţia aparea din nou.
Thorndike consideră această învăţare o învăţare instrumentală, deoarece
comportamentele sunt instrumental determinate de anumite consecinţe. Explicaţiile sunt
cunoscute sub numele de legea efectului. Acest tip de învăţare este menţinut sau schimbat în
funcţie de consecinţele care urmează un răspuns. Răspunsul este întărit dacă consecinţele sunt
plăcute şi inhibat dacă efectele sunt neplăcute.
Principiile condiţionării operante
B. F. Skinner denumeşte condiţionarea instrumentală drept condiţionare operantă
deoarece oamenii şi animalele învaţă să “opereze” asupra mediului pentru a obţine consecinţele
dorite, în loc să răspundă flexibil la stimuli. Skinner a continuat cercetările începute de
Thorndike. Pisicile lui Thorndike nu foloseau exact acelaşi răspuns pentru a deschide cutia,
uneori foloseau laba stângă, alteori pe cea dreaptă sau se frecau de zăvor în sens invers. S-a pus
problema dacă fiecare dintre aceste acţiuni pot fi considerate ca fiind răspunsuri diferite. Skinner
a argumentat că oricare ar fi acţiunea de deschidere, laba stângă, dreaptă sau corpul, aveam de a
face cu acelaşi răspuns deoarece efectul asupra mediului este acelaşi: pisica iese din cuşcă.
Skinner introduce termenul de condiţionare operantă pentru a se referi la învăţarea instrumentală
a răspunsurilor care au acelaşi efect asupra mediului (nu se va învăţa exact aceeaşi mişcare
musculară). Aceşti operatori pot fi făcuţi mai puternici dacă ei sunt urmaţi de o consecinţă
pozitivă (la fel cum Thorndike sugerează în legea efectului). În această perspectivă un răspuns
este iniţial emis fără a avea un motiv. Probabilitatea emiterii unui răspuns poate fi prezisă în
funcţie de efortul pe care l-a avut acest răspuns în experienţa trecută a organismului.
Răspunsurile care au avut consecinţe pozitive au o probabilitate mai mare de a apărea în situaţii
similare, în timp ce răspunsurile cu consecinţe negative au probabilitate mai mică să reapară.
Dworetzky consideră că cele două condiţionări, operantă şi instrumentală, sunt echivalente.
Skinner a denumit relaţiile dintre comportamente şi consecinţele acestora contingenţe
comportamentale. Sunt mai multe tipuri de astfel de contingenţe: întărire pozitivă, întărire
negativă, extincţie şi pedeapsă.
Întărirea pozitivă se referă la o consecinţă a comportamentului care duce la creşterea
probabilităţii de apariţie a aceastuia. Comportamentul care îşi creşte frecvenţa este denumit
răspuns operant, iar consecinţa pozitivă a răspunsului este denumită întărire pozitivă. Trebui
precizate trei aspecte importante ale întăririi pozitive:
1. Sincronizarea. Se referă la faptul că întărirea trebuie să apară în scurt timp după
răspuns, altfel învăţarea va progresa lent sau deloc. Un timp mai lung între răspuns şi întărirea
pozitivă reduce eficienţa învăţării, procesul purtând numele de întărire întârziată.
2. Consistenţa întăririi. Pentru ca să apară învăţarea, întărirea pozitivă trebuie să fie
făcută consistent după fiecare (aproape fiecare) răspuns. După câteva învăţări nu mai este necesar
să se întărească fiecare răspuns, consistenţa întării fiind esenţială la începutul învăţării.

69
3. Ceea ce folosim ca întărire pozitivă trebuie să fie de fapt întărit. Nu întotdeauna ceea
ce folosim ca întărire este de fapt întărire. Când se utilizează intenţionat o întărire, trebuie să fim
siguri că ceea ce utilizăm are valoare de întărire pentru persoana al cărei comportamnet vrem să-l
întărim.
Există două tipuri de întăriri: primară şi secundară. Întărirea primară este înnăscută, deci
nu este rezultatul învăţării. Mâncarea, apa, căldura, activitatea fizică, noutatea sau gratificaţiile
sexuale sunt exemple de întărire primară. Întărirea secundară este învăţată. Interesant este că
acest tip de întărire, care joacă un rol important în condiţionarea operantă, este învăţată prin
condiţionare clasică. Condiţionarea clasică implică asocierea a doi stimuli: un stimul neutru poate
deveni întărire secundară prin asociere repetată cu un stimul care reprezintă o întărire primară.
Atunci când un câine este învăţat să realizeze mişcări complexe, la început se foloseşte întărirea
primară. Este mult mai convenabil însă să întărim răspunsul câinelui spunându-i “eşti un câine
bun!”, fără să-l mai hrănim cu biscuiţi de fiecare dată. Acest lucru se realizează foarte uşor, dacă
de fiecare dată când îi dăm biscuiţi îi spunem “eşti un câine bun!”. După un anumit număr de
asocieri între aceşti doi stimuli, cuvintele vor deveni întărire secundară şi efectiv vor întări
comportamentul câinelui.
Multe dintre lucrurile pe care oamenii sunt motivaţi să le facă (absolvirea şcolii, obţinerea
statului social) sunt rezultatul asocierii cu întăriri primare. Realizarea unui comportament este
influenţată de lista de întăriri. Psihologii au distins mai multe tipuri de liste de întăriri (Ferster &
Skinner, 1957).
1. Întărirea continuă, când fiecare răspuns este întărit. De exemplu, hrănirea unui şobolan
de fiecare dată când acesta apasă pe o pedală. Stingerea apare repede dacă întărirea devine
discontinuă. Şobolanul nu va mai apăsa pedala dacă nu va mai primi hrana. Acest tip de întărire
este recomandabilă pentru etapa iniţială a învăţării.
2. Lista cu un raport fix al întăririlor, se referă la faptul că întărirea este dată după un
număr specific de răspunsuri. Un exemplu, de astfel de întărire apare la o persoană care este
plătită la fiecare şase rochii pe care le coase la maşină. Acest tip de întărire produce o rată mai
mare a răspunsului, deoarece este nevoie de mai multe răspunsuri pentru a obţine întărirea, iar
după fiecare întărire obţinută este nevoie de o pauză.
3. Raport variabil. Întărirea este obţinută după un număr variabil de răspunsuri care au
fost date. În acest caz întărirea produce o rată foarte mare de răspunsuri iar învăţarea este aproape
permanentă. Să luăm exemplul agenţilor de vânzări. Ei ştiu din experienţa trecută că o vânzare se
face după aproximativ şase prezentări. Dar ei nu ştiu la care dintre prezentări vor face şi
vânzarea, acest lucru menţinându-i activi.
4. Interval fix. În alte cazuri întărirea nu se bazează pe numărul de răspunsuri ci pe durata
de timp. Termenul de “interval fix” este utilizat atunci când este întărit răspunsul care apare după
un interval de timp predeterminat. Aceasta duce la creşterea numărului de răspunsuri care apar în
intervalul fixat.
5. Interval variabil. Este întărit răspunsul dat după o anumită perioadă de timp. Acesta
produce o rată înaltă a răspunsurilor, deşi acest tip de întărire nu este recomandat în etapa iniţială
a învăţării. Se ajunge la o învăţare de durată când răspunsul a fost deja parţial învăţat printr-o
întărire continuă.
Prin condiţionare operantă se însuşesc cele mai multe dintre deprinderile şi abilităţile pe
care oamenii le achiziţionează de la naştere (mersul pe bicicletă, deschiderea uşii, pregătirea cinei
etc.). Întărirea pozitivă poate fi aplicată cu succes în domeniul educaţiei, industriei etc. Conceptul
de formare adaugă utilitate principiului întăririi pozitive permiţând întărirea unor comportamente
care nu au apărut încă. Înainte de a lua în considerare aplicaţiile practice ale acestui concept, să
revenim la experimentele de învăţare animală, care sunt utile pentru înţelegerea învăţării umane.

70
În multe situaţii, răspunsul pe care dorim să-l întărim nu apare niciodată. În aceste cazuri se
întăresc răspunsurile care sunt progresiv mai asemănătoare cu răspunsul pe care în final dorim să-
l întărim (răspuns ţintă). Astfel, treptat creşte probabilitatea ca răspunsul ţintă să apară şi putem
să-l întărim în momentul în care acesta apare. Formarea este denumită şi metoda aproximărilor
succesive deoarece se “formează” răspunsuri ţintă plecând de la comportamente care sunt cele
mai apropiate de acesta. Să presupunem că dorim să învăţăm un şobolan să apese o pârghie
pentru a primi hrana. Dacă şobolanul se ridică şi se deplasează spre pârghie, i se dă hrana.
Repetând acest lucru şobolanul se va deplasa mult mai repede spre pârghie. Apoi vom aştepta
până când şobolanul atinge pârghia şi întărim această mişcare. În momentul în care şobolanul
apasă pârghia mişcarea trebuie să fie suficient de întărită pentru a o menţine, evitându-se
regresul. În acest fel vă creşte probabilitatea ca şobolanul să apese suficient de puternic pârghia
pentru a obţine singur hrana. Similar, în cazul copiilor, părinţii nu trebuie să aştepte până la
vârsta de trei ani pentru ca aceştia să facă ordine în cameră. Orice tendinţă a copiilor, orientată în
această direcţie trebuie întărită în momentul apariţiei ei.
Întărirea negativă presupune evitarea comportamentelor care au consecinţe negative.
Sunt două tipuri de învăţare operantă bazate pe întărire negativă: ieşirea din condiţionare şi
evitarea condiţionării. În ieşirea din condiţionare, comportamentul care are consecinţe negative
este oprit. De exemplu, dacă un copil este pus să stea singur într-o cameră după ce a făcut o
poznă, după un timp el va începe să plângă afirmând că nimeni nu-l iubeşte. Impresionaţi de
acest comportament, părinţilor li se face milă şi îi permit să părăsească încăperea. În acest caz,
creşte probabilitatea ca într-o situaţie asemănătoare, copilul să înceapă să plângă pentru a evita
izolarea într-o încăpere. Ieşirea din condiţionare este o formă de întărire negativă deoarece ceva
negativ este înlocuit pentru a scăpa de consecinţele neplăcute.
În evitarea condiţionării, comportamentul care poate avea consecinţe neplăcute nu se
produce fiind înlocuit cu altul. De exemplu, dacă unui copil îi este frică de câinii pe care-îi
întâlneşte în drumul său spre şcoală, va evita acest drum, căutând altul pe care nu sunt câini. Este
o condiţionare prin evitare, deoarece comportamentul de alegere a unei noi rute este întărit prin
evitarea consecinţelor negative.
Pedeapsa este o consecinţa negativă a unui comportament care duce la scăderea,
frecvenţei comportamentului respectiv. Dacă este folosită raţional, pedeapsa poate întări
comportamentele potrivite şi descuraja pe cele neadecvate. Dar, sunt foarte multe pericole ale
utilizării pedepsei:
a. Pedeapsa poate fi un întăritor pentru cel care pedepseşte. De exemplu, dacă un părinte
loveşte copilul care plânge, iar aceste lovituri opresc copilul din plâns, atunci părintele va
continua să lovească copilul de fiecare dată când plânge până când acesta se opreşte din plâns.
b. Pedeapsa are efect inhibitor generalizat asupra individului. Dacă un copil este lovit
repetat pentru a vorbi mai tare, atunci efectul va fi contrar, copilul va vorbi mai încet.
c. Datorită faptului că pedeapsa este dureroasă, indivizii pot reacţiona agresiv faţă de
persoana care le produce durerea sau pot manifesta aversiune faţă de aceasta.
d. Sunt cazuri în care pedeapsa nu are efectul aşteptat de cel care pedepseşte. Mulţi
profesori şi părinţi cred că prin critică se pedepseşte un comportament. Sunt multe situaţii, în
care se lucrează cu copiii, în care critica este adesea o întărire pozitivă, ducând la creşterea
frecvenţei comportamentului criticat. De exemplu, părinţii sau profesorii pot critica un
comportament considerat neadecvat. În acest caz comportamentul copiilor este întărit datorită
atenţiei care li se dă. În acest fel critica întăreşte în loc să pedepsească comportamentul.
e. Chiar dacă pedeapsa contribuie la suprimarea unui comportament nepotrivit, individul
nu învaţă cum să acţioneze într-o manieră potrivită. De aceea este necesară înlocuirea
comportamentului neadecvat.

71
În anumite situaţii pedeapsa poate fi folosită ca metodă de modificare a
comportamentelor neadecvate. Pentru ca pedeapsa să fie benefică, trebuie să fie minimalizate
efectele negative ale acesteia:
1. Utilizarea pedepsei mai puţin dureroase, pentru a evita reacţiile negative la durere ale
persoanei pedepsite. De exemplu, aşezarea unui copil de 4 ani, la colţ pe un scaun are acelaşi
efect ca şi pedeapsa fizică, dar este mai umană;
2. Cel care foloseşte pedeapsa trebuie să se asigure că întăreşte un comportament adecvat
care-l va înlocui pe cel nepotrivit. Pedeapsa nu va avea nici un efect atât timp cât nu este însoţită
de întărirea unui comportament adecvat;
3. Individul trebuie să ştie pentru care dintre comportamente este sancţionat. De asemenea
pedeapsa trebuie să înceteze în momentul în care comportamentul sancţionat nu mai apare. Nu
oamenii trebuie pedepsiţi ci anumite comportamente ale acestora;
4. Pedeapsa nu trebuie combinată cu răsplata. De exemplu, nu trebuie îmbrăţişat şi sărutat
copilul care abia a fost pedepsit. Acest amestec creează confuzie, iar învăţarea devine ineficientă;
5. Odată începută pedepsirea unui comportament nu trebuie să dăm înapoi. Adică nu
trebui încurajat plânsul, tânguiala ca mijloace de a scăpa de pedeapsă.
Între condiţionarea clasică şi condiţionarea operantă există o serie de diferenţe.
Condiţionarea clasică implică comportamente reflexive controlate de sistemul nervos autonom
(frica, salivaţia şi alte comportamente involuntare). Condiţionarea operantă implică
comportamente mai complicate mediate de sistemul nervos somatic. Cea mai importantă
diferenţă se referă la modul de realizare a condiţionării. In condiţionarea clasică stimulul
necondiţionat este asociat cu stimulul condiţionat independent de comportamentul individual. În
condiţionarea operantă consecinţele întăririi apar doar dacă răspunsul condiţionat se produce.
Consecinţele întării sunt legate de apariţia răspunsului.

c. Învăţarea cognitivă
Unii autori consideră că învăţarea reprezintă o schimbare în cogniţie. Termenul de
cogniţie se referă la procesele individuale de gândire, percepţie etc. Adepţii acestei teorii susţin
că indivizii (oameni sau animale) îţi schimbă cogniţiile despre o situaţie dată în timpul procesului
de învăţare. Fiinţele umane gândesc, iar gândurile afectează comportamentele. Behavioriştii
tradiţionali considerau că mintea umană şi procesele gândirii nu pot fi studiate deoarece nu sunt
direct observabile. De atunci, teoreticienii învăţării au explorat procesul de gândire, rezolvarea de
probleme etc. Studiul gândirii şi influenţei acesteia asupra comportamentelor formează obiectul
de studiu al psihologiei cognitive.
Se ştie că oamenii utilizează abilităţi mentale sau cognitive când interacţionează cu lumea
externă. Este discutabil, însă, dacă şi animalele posedă o reprezentare mentală a lumii în care
trăiesc. Cu ajutorul reprezentării mentale se pot manipula şi modifica mental lucrurile, cu scopul
de a examina rezultatele posibile înainte de desfăşurarea acţiunii propriu-zise. Oamenii utilizează
înţelegerea cognitivă pentru a se orienta într-o problemă particulară. Un şobolan care aleargă
într-un labirint în căutarea hranei trebuie să înveţe direcţiile în care trebuie să meargă pentru a o
găsi. După un anumit număr de încercări şobolanul învaţă la care colţ trebuie să facă la dreaptă,
la care la stânga pentru a găsi hrana. În mod similar, când ajungem într-un oraş nou învăţăm
drumul prin încercare şi eroare sau prin memorarea anumitor detalii. Informaţiile sunt
achiziţionate sub forma unei hărţi cognitive, ca expresie a localizării obiectelor în relaţie unele cu
altele.
În anii ΄40 Ed. Tolman a ajuns la concluzia că şobolanii îşi formează harţi cognitive. El a
lucrat cu şobolani care au învăţat drumul prin labirint. Tolman a constat că dacă drumul spre
hrană este blocat, şobolanii încearcă să găsească o altă cale de acces pe care nu au mai folosit-o

72
înainte şi care este situată în aceeaşi direcţie cu hrana (Tolman, Ritchie & Kalish, 1946). Această
tendinţă a fost denumită învăţarea locului Această învăţare apare nu numai la mamifere. Gould
(1986) a constat că şi albinele se bazează pe învăţarea locului pentru a găsi hrana şi pentru a se
întoarce la stup. Similar oamenilor, multe specii de animale pot învăţa relaţiile dintre elemente.
Tolman (Tolman & Honzik, 1930) a realizat un alt experiment pentru a evalua latura
cognitivă a învăţării. S-au folosit trei grupe de şobolani înfometaţi: primul grup era întărit pozitiv
de fiecare dată când găseau hrana. Astfel şobolanii din acest grup au învăţat să ajungă repede la
aceasta. Şobolanii din al 2-lea grup nu erau răsplătiţi atunci când ajungeau la hrană. Timpul în
care parcurgeau labirintul până la hrană a rămas aproximativ acelaşi. Al 3-lea grup nu a fost
întărit pentru a ajunge la mâncare în primele 10 zile. Când şobolanii au început să fie
recompensaţi pentrucă ajungeau la hrană, s-a constatat o descreştere rapidă a timpului necesar
pentru a ajunge la hrană, ajungând foarte repede la timpii şobolanilor din grupul 1, care erau
recompensaţi de fiecare dată. Tolman a interpretat aceste rezultate ca un indicator al faptului că
şobolanii care nu au avut un motiv pentru a ajunge cât mai repede la cutia cu hrană au învăţat
localizarea hranei la fel de bine ca şi cei care au avut motiv (erau hrăniţi). Acest tip de învăţare
este cunoscută sub denumirea de învăţare latentă.
Probabil cele mai evidente dovezi ale laturii cognitive a învăţării provin din
experimentele lui W. Köhler. Aceasta a introdus o maimuţă într-o încăpere împreună cu un
mănunchi de banane şi două beţe de bambus care puteau fi montate una în prelungirea celelalte.
Maimuţa a petrecut mult timp încercând cu ajutorul unui singur băţ să dea jos mănunchiul de
banane agăţat de tavan, fără a reuşi. Abia când a montat cele două beţe, obţinând unul singur mai
lung, maimuţa a reuşit să ajungă la banane. Când aceeaşi problemă a fost prezentată din nou
cimpanzeului, acesta a rezolvat-o imediat. Köhler a dat maimuţei spre rezolvare şi alte probleme,
de exemplu trebuia să aşeze cutiile una peste alta pentru a ajunge la banane. La început maimuţa
nu făcea nici un progres, apoi deodată învăţa cu să ajungă la banane. Köhler considera că
învăţarea era rezultatul unei schimbări cognitive, când se dezvolta o nouă înţelegere a problemei.

d. Învăţarea socială
Bandura este unul dintre reprezentanţii de marcă ai psihologiei cognitive. Cea mai
importantă contribuţie a sa constă în demonstrarea faptului că oamenii învaţă şi prin observarea
comportamentelor celorlalţi. Acest fenomen a fost denumit de Bandura, modelare. Modul de
vorbire, stilul de îmbrăcare, modalitatea de creşterea a copilului sunt exemple de comportamente
care sunt însuşite prin modelare. Bandura consideră că modelarea demonstrează rolul cogniţiei în
învăţare. Un copil care-şi priveşte fratele mai mare jucând baschet va fi apropiat de jocul
respectiv. Din punctul de vedere al autorului, un rol important în învăţarea cognitivă îl are
observarea, înainte de apariţia modificărilor comportamentale şi întărirea lor. Modelarea poate
furniza comportamente potrivite într-o situaţie dată, reduce inhibiţiile privitoare la anumite
comportamente sau sugerează că acţiunile noastre ar putea şi răsplătite / întărite.
În studiile de laborator realizate de Bandura, copiii învăţau să fie mai agresivi şi mai puţin
temători doar observând comportamentele personajelor din film. Într-unul dintre studii un grup
de copii a vizionat un film în care un adult lovea, smuncea o păpuşă. Când copiii erau plasaţi în
camera de joacă şi frustraţi pentru că nu aveau o altă păpuşă să se joace, ei erau semnificativ mai
agresivi faţă de păpuşă decât copii care nu au văzut filmul. Autorii au considerat că agresivitatea
se datorează modelului pe care copiii l-au văzut.
Oamenii nu imită toate comportamentele pe care le observă. Sunt imitate
comportamentele care au fost recompensate / întărite şi nu cele care sunt pedepsite. Sunt imitate
comportamentele care au statut înalt, sunt atractive, plăcute deoarece se presupune că acestea ar
fi mai curând urmate de întărire pozitivă.

73
În ultimii ani a fost mult discutată problema tipurilor de modele care sunt prezentate
copiilor prin mas-media. Din nefericire există dovezi experimentale destul de solide care să
confirme temerile existente. Se pare că televiziunea învaţă copiii să prefere dulciurile,
încurajează rolurile de sex stereotipice şi probabil cel mai dăunător este faptul că-i învaţă să fie
mai violenţi. Deşi nu toţi psihologii acceptă aceste concluzii, există numeroase studii care au
demonstrat creşterea violenţei datorită modelelor oferite de televizor, de la filmele de desene
animate până la westernuri, care încurajează comportamentele agresive ale copiilor şi
adolescenţilor.

74