Sunteți pe pagina 1din 3

 Condiționarea clasică (ÎNVĂȚAREA CONDIȚIONATĂ DE RĂSPUNS)

Condiționarea clasică a fost descrisă și explicată de fiziologul rus, laureat al Premiului


Nobel, Ivan Petrovici Pavlov (1849-1936). Prin teoria propusă cu privire la mecanismele de
producere a reflexelor condiționate, Pavlov a reușit să explice fundamentele generale ale
învățării. El a constatat că praful de carne (stimul S1) introdus în gura unui câine înfometat
produce, în mod constant, înainte de orice condiționare, o reacție salivară (R). În schimb, alți
stimuli, cum ar fi sunetul unui metronom (S2) nu au acest efect. Dacă sunetul se asociază în mod
repetat cu introducerea prafului de carne în gura câinelui, sunetul poate deveni capabil să
producă el însuși o reacție salivară. Răspunsul (salivația) provocat în mod necondiționat de
praful de carne (stimul necondiționat- SN) a devenit condiționat la sunetul metronomului (stimul
condiționat- SC). Potrivit lui Pavlov, realitatea unei asemenea condiționări demonstrează că un
animal poate crea o asociere între un stimul, inițial neutru (sunetul metronomului nu avea puterea
de a produce salivația) și un răspuns comportamental (salivația). Această asociere (S-R)
constituie traseul extern și observabil al instaurării unei cunoștințe noi, stabilite prin experiență.
Prezentăm schema de producere a reflexului condiționat descrisă de Pavlov:
1) SN (hrană)
2) SC (sunet) SN (hrană)
3) SC (sunet)
RN
RN
RC

SN= hrana este un stimul necondiționat; ea provoacă, în mod natural, fără condiții, o
reacție de salivare;
SC= sunetul este un stimul condiționat; el nu provoacă salivația decât cu condiția
asocierii cu SN și a respectării anumitor reguli;
RN= salivația este un răspuns necondiționat atunci când este provocată de vederea hranei
și este un răspuns condiționat atunci când ea este RC provocată doar de sunetul metronomului.
Pentru ca răspunsul condiționat să se producă, este necesar să existe contiguitate
temporală între cei doi stimului (SC și SN) și, la fiecare asociere, stimulul condiționat trebuie să
preceadă stimulul necondiționat (ordinea anterogradă: SC-SN)- legea ordinii anterograde.
Ordinea inversă, prezentarea simultană a celor doi stimuli, precum și asocierea lor aleatorie nu
produc condiționarea sau au o eficiență redusă.
Continuând cercetările în acest cadru al condiționării, Pavlov a descris legile ce
caracterizează instaurarea legăturilor SR:
a) legea stingerii- dacă SC este prezentat de un număr de ori fără a fi însoțit de hrană,
răspunsul de salivație se va stinge; după stingere, RC (salivația) poate să reapară la o nouă
prezentare a SC; această reapariție este cunoscută ca revenire spontană;
b) legea generalizării- indică apariția RC și la stimuli apropiați de stimulul original
(stimuli conecși); dacă un câine învață să dea un RC la un sunet de o anumită înălțime, apoi i se
prezintă un sunet nou, mai grav sau mai ascuțit decât SC, câinele va emite un RC la acest nou
sunet; răspunsul este cu atât mai puternic cu cât sunetele sunt mai apropiate;
c) legea discriminării-indică faptul că un subiect poate să răspundă diferențiat la doi
stimuli apropiați; dacă sunt emise două sunete cu înălțimi diferite, dar hrana a fost asociată

1
numai cu unul dintre ele, câinele va învăța să facă diferența dintre acestea și să saliveze doar la
sunetul asociat cu hrana.
 Conexionismul sau învățarea prin încercare și eroare
Psihologul america E. Thorndike (1874-1949) este precursorul teoriilor învățării
dezvoltate în cadrul psihologiei behavioriste. El a descris modelul de învățare numit încercare și
eroare („trial and eror“). Experimentele făcute pe animale pleacă de la ideea că cel ce învață se
confruntă cu o situație-problemă. Rezolvarea problemei se face prin selectarea răspunsului
potrivit dintr-un număr de răspunsuri posibile. Această concepție este ilustrată de următorul
experiment: o pisică flămândă este închisă într-o cușcă în apropierea căreia se afla o bucată de
pește. Cușca poate fi deschisă prin apăsarea unei pârghii de lemn. Pisica se zbate, izbește pereții,
până când, din întâmplare, apasă pârghia care deschide ușa și ajunge astfel la hrană.Thorndike
numește acest comportament încercare și eroare. Dacă pisica este așezată de mai multe ori în
cușcă, se poate constata că ea efecuează mișcările adecvate care duc la deschiderea cuștii cu tot
mai mare rapiditate și precizie. Pe această bază, psihologul american a stabilit că învățarea
implică o succesiune de încercări și erori. Tentativele încununate de succes sunt reținute, cele
care duc la eșec sunt inhibate.
Thorndike a formulat legile acestei forme de învățare, și anume: legea stării de pregătire,
legea exercițiului și legea efectului. Legea stării de pregătire este un principiu accesoriu,
deoarece descrie substratul fiziologic al legii efectului. Aceasta atestă circumstanțele în care cel
ce învață tinde să fie satisfăcut sau nesatisfăcut, să accepte sau să respingă. Thorndike înțelege
starea de pregătire ca o tendință spre acțiune, iar împlinirea acțiunii este satisfăcătoare, în timp de
neîmplinirea ei devine supărătoare. Astăzi, legea stării de pregătire este reconsiderată și analizată
ca o lege a dezvoltării, referindu-se la nivelurile de maturizare necesare pentru achiziționarea
unui anumit conținut ori pentru desfășurarea unei anumite activități de învățare. Legea
exercițiului exprimă faptul că soliditatea unei legături S-R este dependentă de numărul
repetițiilor. Legea efectului se referă la întărirea sau slăbirea unei legături ca rezultat al
consecințelor pe care aceasta le are. Dacă o legătură între S și R este urmată de satisfacție, ea se
întărește, iar dacă este urmată de insatisfacție, legătura slăbește. Comportamentele care sunt
urmate de consecințe pozitive vor avea tendința să fie repetate, iar comportamentele urmate de
consecințe negative se vor manifesta cu o frecvență mai mică. Învățarea depinde deci de ceea ce
se întâmplă după reacție. Plăcerea sau satisfecția finală a unei activități va determina ce anume
rămâne învățat.
 Condiționarea instrumentală (ÎNVĂȚAREA INSTRUMENTALĂ)
Legea efectului a constituit baza cercetărilor asupra unui alt tip de învățare, numit
condiționare instrumentală (operantă), al cărui promotor a fost psihologul american B.F.Skinner
(1904-1990). În experimentele sale, Skinner a utilizat o cușcă asemănătoare cu cea a lui
Thorndike. Animalul (un porumbel, un șobolan) închis în cușcă poate să obțină hrana dând un
răspuns determinat: lovește o placă, apasă pe o pârghie, etc. Dacă în condiționarea clasică
operația de bază constă în asocierea a doi stimuli (SN și SC), în condiționarea instrumentală
asocierea se face între un comportament (C), produs spontan (de exemplu-apăsarea pârghiei) și
un eveniment (E)-obținerea hranei- care-i urmează lui C la un interval foarte scurt. Atât timp cât
nu se produce comportamentul (C), animalul nu primește nimic de mâncare. Comportamentul
(C) controlează obținerea hranei. Hrana reprezintă o recompensă cu efect de întărire a
comportamentului. Într-un alt experiment desfășurat de Skinner, un șobolan ajungea să învețe să
apese pârghia pentru a evita un lucru neplăcut, cum ar fi un șoc electric. Comportamentul
2
dezirabil (apăsarea pârghiei) a fost numit comportament operant sau instrumental, întrucât el
acționează asupra mediului înconjurător pentru a obține consecințele dorite. În concepția lui
Skinner, comportamentul este modelat prin consecințele sale.
Condiționarea operantă este deci acea formă de învățare în care consecințele
comportamentului influențează posibilitatea apariției acestuia. B.F.Skinner a acordat un rol
important întăririi în învățare. Întărirea poate fi realizată în două moduri: furnizând direct
animalului ceva care-i place sau are nevoie, ceea ce se numește întărirea pozitivă, sau permițând
animalului să evite comportamentele care au consecințe neplăcute, ceea ce se numește întărire
negativă. Pedeapsa este o consecință negativă a unui comportament care duce la scăderea
frecvenței comportamentului în cauză. Totuși, Skinner susține că pedeapsa nu este o tehnică
potrivită pentru controlul comportamentului, deoarece suprimă comportamentul nedorit, fără
întărirea comportamentului dezirabil. Tehnicile de întărire sunt importante atât pentru formarea
unor noi comportamente, cât și pentru consolidarea celor deja existente. Psihologul american a
demonstrat, printr-un proces numit modelare comportamentală, cum pot fi folosite tehnicile
condiționării operante pentru producerea unui comportament mai complex la animale.
Comportamentul dorit este modelat prin recompensarea unei serii de răspunsuri care constituie
aproximări succesive, adică se apropie din ce în ce mai mult de comportamentul dezirabil.
Astfel, el a ajuns să învețe porumbeii să joace tenis de masă și să ghideze rachete. Realizarea
comportamentului dorit și rezistența lui la stingere sunt dependente și de programul de întărire
folosit. Ferster și Skinner (1957) au descris următoarele programe de întărire:
a) întărirea continuă, în situația în care fiecare răspuns este întărit; acest tip de întărire
este recomandabil pentru etapa inițială a învățării;
b) întărirea la interval fix, referitoare la situația în care întărirea se produce la intervale
regulate de timp (de exemplu, din cinci în cinci secunde sau la intervale mai mari de timp);
c) întărirea la interval variabil, ce are loc atunci când perioada de timp care trebuie să
treacă până la o nouă întărire a comportamentului se modifică de fiecare dată; acest tip de
întărire nu este recomandabil în faza inițială a învățării, dar, o dată ce răspunsul a fost parțial
învățat prin întărire continuă, el determină o rată de răspuns constantă și foarte rezistentă la
stingere;
d) întărirea în proporție fixă, ce trimite la situația în care întărirea se aplică după un
număr fix de răspunsuri (de exemplu, după fiecare cinci răspunsuri); acest tip de întărire produce
o rată mai mare de răspunsuri, deoarece este nevoie de mai multe răspunsuri pentru a obține
întărirea; în schimb, când întărirea încetează, comportamentul dispare foarte repede;
e) întărirea în proporție variabilă, referitoare la situația în care întărirea este obținută
după un număr variabil de răspunsuri date; raportul dintre reacțiile întărite și reacțiile care se
produc fără a fi întărite variază în jurul unei valori medii; acest program de întărire produce o
rată mare de răspunsuri care sunt foarte rezistente la stingere.
Fiecare program de întărire are un efect diferit asupra învățării. Întărirea continuă
produce cea mai rapidă învățare, în timp ce întărirea parțială produce învățarea care durează mai
mult în absența întăririi. Valabile la animale, principiile condiționării operante au fost repede
extinse la oameni către sfârșitul anilor ’50. Instrucția este, în concepția lui Skinner, un
aranjament al relațiilor de întărire. Putem modela comportamentul dorit dacă știm cum să
administrăm aceste întăriri.

S-ar putea să vă placă și