Documente Academic
Documente Profesional
Documente Cultură
REFERAT
Pentru a putea patrunde in tainele psihicului uman este necesar sa intelegem si
mecanismele care stau la baza invatarii.
Plecand de la rezultate experimentale s-a constata ca exista doua procese de
invatare distincte si anume:
- invatarea asociativa in care orientarea catre scop presupune un algoritm
invatare-raspuns-rezultat sau stimul-raspuns-rezultat, cu localizare in partea
frontala, in care sistemul face in permanenta up-datarea unei actiuni, trebuind sa
stocheze asocieri de tip actiune-rezultat si rezultat-valoare, chiar daca in multe
cazuri rutinele nu sunt asociate cu o recompensa sau cu o pedeapsa imediata, ci
joaca rolul intaririi invatarii
- invatarea deprinderilor presupune invatarea asocierii dintre stimuli si
raspunsuri, cu localizare in corpii striati, proiectiile neuronilor dopaminergici in
aceasta zona realizand invatarea valorii actiunilor, in care rutinele actiune-rezultat
sunt invatate de diverse sisteme, folosindu-le ulterior intr-un nou mod sau intr-un
alt context.
Teoriile clasice pornind de la Aristotel afirma ca invatarea se produce in
conditiile in care un stimul va fi asociat cu o recompense sau o pedeapsa.
Astfel, se definesc doua procese de invatare afectiva:
- unul in care se asociaza stimulul cu intarirea, respectiv recompensa sau
pedeapsa denumita conditionare clasica, in care daca o intarire creste posibilitatea
emiterii unui raspuns este denumita intarire pozitiva sau recompensa iar daca
aceasta scade acesta posibilitate este denumita intarire negativa sau pedeapsa.
Sunt de referinta experimentele din 1890 a fiziologului rus Ivan Pavlov, The
Lillie Alberl Experiment din 1920 a psihologului John Watson si cel din 1960 a
psihologului Clark Kenneth.
- al doilea in care se asociaza actiunea cu raspunsul sau intarirea, fie ca aceasta
este recompensa sau pedeapsa denumita conditionare operanta sau conditionare
instrumentala.
De referinta sunt experimentele psihologului Edward Thorndike si a
psihologului american Burrhus F. Skinner
Orice organism va tinde sa obtina o recompense si sa evite o pedeapsa.
In plan social se evidentiaza trei aspecte asociate unei actiuni:
- riscurile asociate obtinerii rezultatelor,
- intarzierea obtinerii rezultatelor,
- contextul social.
Experimente recente sugereaza ca invatarea apare in special cand se manifesta
intr-un context dat o eroare de predictie prediction error caz in care neuronii
dopaminergici din mezencefal encodeaza eroarea in predictie, constatand diferenta
dintre recompense asteptata (predictia, aspectanta) si cea reala, rezultand trei ipostaze:
- la o intarire negative, neuronii vor fi inhibati,
- la primirea recompensei asteptate neuronii nu vor emite nici un fel de raspuns,
- la o intarire pozitiva, neuronii vor fi activati.
Pag. 1 din 4
Masura in care este revizuita discrepanta, este data de produsul dintre eroarea de
predictie si rata invatarii:
Espectanta revizuita = eroare de predictie x rata invatarii, vine cu un impact
major asupra evenimentelor viitoare, creindu-se astfel o functie a espectantei.
Functie de erorile de predictie, atentia subiectului este indreptata catre
incertitudinile unei intariri, invatarea depinzand de atentie.
Se constata astfel ca atentia inseamna eroare de predictie sau predictie in curs de
verificare, care dupa verificare , plecand de la binomul atentie invatare, face ca
eroarea de predictie sa fie insusita si invatata dictand comportamentul ulterior ca si
convingere sau rutina.
Functie de felul in care sistemul viu isi revizuieste predictia apar raspunsuri la
nivelul sistemului dopaminergic mezencefal si anume:
- in sens pozitiv se constata o crestere a activitatii
- in sens negativ se induce o scadere a activitatii.
Eroarea este encodata in diferite regiuni ale corpilor striati, rezultand diverse
emisii de unde alfa sau theta, functie de aparitia recompensei:
- cand scade activitatea dopaminergica mezencefalica este generat un semnal de
eroare negativa in predictie ERN ( o componenta in unde theta) masurabil
prin ERPs la nivelul cortexului cingulat anterior a zonei dorsomediane
prefrontale produs de o dezinhibare a dendritelor apicale ale neuronilor
dopaminergici generand o crestere a nivelului dopaminei in medianul
prefrontal, ca raspuns la rezultatul obtinut, mai nefavorabil decat asteptarile,
ERN fiind mai mare in acest caz decat cel asteptat, existand posibilitatea ca in
cazul in care nonrecompensa era previzionata acesta sa fie mai mic,
desprinzandu-se doua scenarii:
1) la finalul secventei este omisa recompensa;
2) recompense este diminuata
- in conditiile in care subiectii primeau o recompense neasteptata sau realizau
alegeri riscante dar nu primeau o intarire negativa, se decansa potentialul EP
(o componenta in unde alfa) in zona prefrontala cingulat anterior, rezultand o
crestere a nivelului activitatii dopaminergice mezencefalice, generand un
semnal de eroare de predictie pozitiv denumit EP masurabil prin ERPs la
nivelul zonei mediane prefrontale, asociata cu activarea cingulatului anterior
dorsal, a cortexului insular anterior, a cortexului orbitofrontal, a nucleului
accumbens, a putamenului si nucleului caudat care preceseaza eficienta unei
actiuni a substantei negre si a amigdalei., rezultand trei scenarii:
1) omisiunea pedepsei la finalul unei secvente
2) pedeapsa este inlocuita cu recompensa
3) recompensa este mai mare decat cea previzionata in derularea aceluiasi
scenariu.
Circuitul invatarii instrumentale realizeaza trinoame informationale de tip
actiune-timp- intarire si stimul-timp-intarire, denumit invatare probabilistica luand in
calcul urmatoarele aspecte:
- care ar fi probabilitatea ca o actiune proprie sau observata sa fie recompensata
sau penalizata
- dupa cat timp de la actiune apare intarirea
- cat de mare poate fi intarirea
Pag. 2 din 4