Sunteți pe pagina 1din 90

TEORIA SI METODOLOGIA EVALUARII SCOLARE

autor: prof.univ.dr. C. MOISE

SCOPUL UNITĂŢII DE CURS


• cunoaşterea de către student a elementelor de bază ale teoriei evaluării, odată cu
dobândirea capacităţii de aplicare a lor în procesul didactic

OBIECTIVE NOMINALE
• familiarizarea studenţilor cu definiţiile, accepţiunile, terminologia aferente domeniului;
• însuşirea activă a relaţiei logice dintre teoria evaluării şi teoria instruirii;
• însuşirea relaţiei indisolubile dintre predare, învăţare - pe de o parte şi evaluare, pe de altă
parte;
• însuşirea şi stăpânirea accepţiunilor conceptului de evaluare, în context didactic;
• însuşirea, stăpânirea, aplicarea de către student a demersurilor vizând definirea şi
interpretarea funcţiilor evaluării şcolare;
• stăpânirea informaţiei şi criteriilor necesare interpretării, sistematizării, aplicării corecte a
funcţiilor evaluării şcolare;
• dobândirea capacităţii de compatibilizare şi armonizare în sistem a tipurilor de evaluare
după diferite criterii raţionale;
• înţelegerea şi însuşirea de către student a sistemului general al metodelor de evaluare
şcolară;
• dobândirea informaţiei şi capacităţilor necesare de corelare, în plan teoretic şi practic, a
entităţilor metodologice tradiţionale şi moderne;
• familiarizarea studenţilor cu modernizarea practicii evaluative, în consens cu reforma
actuală a şcolii româneşti;
• însuşirea activă a interpretării şi proiectării modalităţilor moderne de evaluare;
• dobândirea capacităţii de corelare a aspectelor vizând evaluarea randamentului şcolar cu
cele aferente evaluării procesului didactic.

EVALUARE
Descriptori de evaluare
După ce vor studia această unitate de curs, studenţii vor fi capabili:
• să definească evaluarea şcolară în general şi evaluarea randamentului şcolar în
special;
• să distingă, să redea, să explice esenţa fiecărei componente a evaluării
randamentului elevului (examinare, măsurare, descriere calitativă, judecăţi de valoare,
notare);
• să surprindă corect sensurile conceptului de evaluare a rezultatelor elevului,
aşa cum apar în teorie şi în practică;
• să selecteze şi să interpreteze corect terminologia evaluării;
• să analizeze şi să sistematizeze logic funcţiile evaluării, pe fondul opiniilor
existente şi prin reflecţie proprie;
• să selecteze opiniile reprezentative privind tipurile de evaluare a randamentului
şcolar;
• să interpreteze corect diferitele sistematizări ale grupelor de metode de
evaluare;

-1-
CONSTANTIN MOISE

• să prezinte clar metodologia tradiţională, estimând resursele ei instrumentale în


context contemporan;
• să selecteze raţional şi să integreze în sistem calităţile pretinse instrumentelor
de evaluare în general;
• să caracterizeze concret şi corect metodele tradiţionale de evaluare orală,
scrisă, practică; curentă, periodică, globală, invocând avantajele şi limitele fiecăreia;
• să prezinte şi să explice corect testul psihologic în general şi testul docimologic
în special;
• să definească şi să prezinte inteligibil tipurile de itemi de test, respectând
exigenţele;
• să se orienteze fie după sistematizarea tipurilor de itemi de către autorii
americani din curs, fie după cea a Serviciului Naţional de Examinare şi Evaluare
(SNEE);
• să prezinte câte două exemple din fiecare categorie de itemi (obiectivi,
semiobiectivi, subiectivi) pe care să le definească şi să le explice;
• să puncteze trei avantaje şi trei limite în dreptul fiecăreia; să redea câte trei -
patru exigenţe de construire pentru fiecare, cu exemplificări;
• să explice corect calităţile obligatorii ale testului docimologic (nu neapărat cu
calcule minuţioase, dar cu menţionarea şi integrarea lor într-un discurs inteligibil);
• să prezinte algoritmul de proiectare a testului docimologic, cu redarea, în
context, a calităţilor şi cu calculul doar al indicilor ce reies din analiza de item (nivelul
de dificultate, capacitatea de discriminare, calitatea distractorilor);
• să abordeze cel puţin două metode complementare;
• să prezinte şi să explice tipurile de notare;
• să redea şi să analizeze abaterile de la notarea corectă, cu posibilităţile de
contracarare, respectiv remediere;
• să formuleze consideraţii esenţiale privind evaluarea componentelor şi
factorilor implicaţi în procesul didactic (elevul, conţinuturile, personalitatea
educatorului).
I. DELIMITĂRI GENERALE NECESARE

Cum am afirmat şi în cursul de Teoria instruirii, evaluarea poate fi considerată a treia


dimensiune a preocupărilor didactice, alături de predare şi învăţare. Importanţa ei este în afară
de orice îndoială, motivându-se atât prin necesitatea certificării şi ierarhizării rezultatelor
obţinute de elevi, cât şi prin rolul ei de feedback, deopotrivă pentru elev şi pentru
factorii responsabili de proiectarea şi de bunul mers al procesului. Amploarea preocupării
este subliniată în ultimii ani în termenii următori: "Se evaluează peste tot şi totul, iar educaţia
nu a scăpat acestui val." (Vogler, J., coord., 2000).
Definiţii şi explicaţii iniţiale. "A evalua trimite la mai multe verbe, dar între ele există o
sinonimie variabilă şi întotdeauna imperfectă: a aprecia, a constata, a estima, a examina, a
cântări, a judeca, a măsura, a nota, a valida (sau a invalida), a valoriza (sau a devaloriza)…
mai recent, a expertiza…" (idem), iată un punct de sprijin posibil pentru o definire a acestei
dimensiuni a procesului educaţional, dar nu o definiţie propriu-zisă.
Dintre definiţiile care i s-au formulat evaluării, în context pedagogic, atrag atenţia mai
multe, având conotaţii nuanţate diferit de fiecare autor. O cităm mai întâi pe cea aparţinând
lui N. Gronlund, recunoscut ca autoritate notabilă în teoria evaluării: "Din unghiul de vedere
educaţional, evaluarea poate fi definită ca un proces sistematic de determinare a nivelului la
care obiectivele educaţionale sunt realizate de către elev", cu precizarea că din definiţie
trebuie reţinute două aspecte: că ea implică un proces sistematic şi că nu ar fi posibilă fără
identificarea anterioară a obiectivelor (Gronlund, N.E., 1971, pp.7-8). Acelaşi autor susţine că
interdependenţa celor trei demersuri (predarea, învăţarea, evaluarea) se poate dovedi prin
însăşi prezenţa lor solidară în toţi "paşii" esenţiali ai procesului educaţional, respectivii paşi
fiind:
1) "identificarea şi definirea obiectivelor în termeni de schimbări dezirabile în
comportamentul elevului" (ce cunoştinţe, ce capacităţi de înţelegere, ce interese, ce
atitudini va trebui să posede elevul la sfârşitul procesului?);
2) "planificarea şi direcţionarea experienţelor de învăţare în armonie cu
obiectivele stabilite" (când "conţinuturile şi metodele sunt integrate în experienţele de
învăţare planificate astfel încât comportamentele elevului să se schimbe în direcţia
dorită"); este etapa în care "accentul este mai curând pe proces decât pe produs";
3) "stabilirea progresului elevului în direcţia obiectivelor desemnate" (răspunzând
la întrebările: cum să definim, să selectăm, să administrăm tehnicile de evaluare? cum să
interpretăm şi să aplicăm rezultatele constatate?);
4) "utilizarea rezultatelor evaluării în îmbunătăţirea procesului de învăţare şi
instruire", pas care se împleteşte strâns cu cel anterior. Este etapa când elevul este
informat despre progresul său, este ajutat să-şi recunoască dificultăţile, i se indică
pregătirea necesară pentru viitoarele sale activităţi de învăţare, ceea ce este folositor în
măsură egală pentru educator, în vederea alcătuirii reperelor viitoarei activităţi cu elevul;
CONSTANTIN MOISE

când se constituie, de asemenea, informaţiile necesare pentru părinţi şi pentru conceptorii


curriculumului) (Idem, pp. 8-12).
Se înţelege de la sine că "paşii" menţionaţi trebuie să hotărască şi asupra
ierarhizării elevilor după rezultatele lor.
Dintr-un recent dicţionar de pedagogie, aflăm o definiţie care, în ciuda aspectului ei
de "loc comun", nu este lipsită de interes, servind cel puţin ca element de comparaţie în
contextul dat: "…prin evaluarea randamentului se înţelege atât măsurarea cât şi aprecierea
randamentului. Procesul evaluării începe cu planificarea şi descrierea obiectivelor şi a
conţinuturilor care vor fi controlate mai târziu. În stabilirea succesului şcolar se analizează în
ce măsură elevul a făcut progrese, ce poziţie ocupă în grup" (H. Schaub, K. Zenke, 2001,
p.101).
Putem cita, apoi, nişte definiţii inscriptibile în contururi mai largi. Una aparţine lui
R. Lindeman: "Aplicată în domeniul instruirii, evaluarea este procesul de apreciere a calităţii
sistemului educaţional sau a unei părţi a acestui sistem. Astfel, evaluarea este procesul prin
care se stabileşte dacă sistemul îşi îndeplineşte funcţiile pe care le are, adică dacă obiectivele
lui sunt realizate. Procesul de evaluare include: 1) redarea obiectivelor sistemului sau ale unei
secţiuni a lui într-o formă în care realizarea lor poate fi măsurată; 2) obţinerea de dovezi
experimentale, sau de altă natură, pe care să se bazeze aprecierea; 3) folosirea acestor date
pentru a elabora aprecierea finală." (Lindeman, R., 1978, p. 473). O altă definiţie, aparţinând
lui I.T. Radu, reia fidel opinia lui Lindeman: evaluarea este "procesul menit să măsoare şi să
aprecieze valoarea rezultatelor sistemului de educaţie sau a unei părţi a acestuia, eficacitatea
resurselor, a condiţiilor şi a operaţiilor folosite în desfăşurarea activităţii, prin compararea
rezultatelor cu obiectivele propuse, în vederea luării deciziilor privind ameliorarea activităţii
în etapele următoare" (Radu, I. T., 1981, pp. 17-18).
Precum se constată, primele surse citate fac trimitere strictă la activitatea elevului şi la
rezultatele lui, potrivit căror rezultate el va fi apreciat, orientat, clasificat în grupul din care
face parte, certificându-i-se totodată drepturile ce i se cuvin în contextul social dat. Ultimii doi
autori menţionaţi, în schimb, ne sugerează că activitatea de evaluare vizează un "sistem", deci
nu se limitează la activitatea şi rezultatele elevului. Această extensie (de la rezultatele elevului
la întregul sistem) este exprimată şi în mod explicit de către ambii citaţi mai sus. Drept
dovadă, afirmaţiile lui Lindeman că "procedeele evaluative oferă jaloane de control pentru
întregul sistem ca şi pentru porţiuni individuale ale sistemului", asigurând astfel "menţinerea
unei maxime eficienţe în funcţionarea sistemului" (lucr.cit., p. 474 urm.); sau opiniile lui
I.T. Radu, în acord cu precedentul, după care teoria evaluării "nu se poate limita la
examinarea şi aprecierea rezultatelor obţinute în pregătirea elevilor, ci, în mod necesar,
trebuie să-şi extindă investigaţiile asupra eficienţei sistemului şcolar în ansamblul său", ceea
ce implică şi "structura sistemului, dezvoltarea învăţământului, conţinutul său, metodele şi
mijloacele de învăţământ "şi, se pot adăuga personalitatea educatorului, relaţiile din cadrul
procesului (vezi I.T. Radu, lucr.cit., p.13, 275 urm.). În acelaşi sens se exprimă o lucrare
foarte recentă despre evaluarea şcolară: "Evaluarea modernă nu se mai rezumă la a aprecia
dacă elevii au învăţat bine, ci caută să aprecieze şi eficacitatea ansamblului de procese care
trebuie să conducă la învăţare. Obiectul evaluării nu mai este deci doar produsul-elev, ci şi
ansamblul sistemului de producţie (sistemul naţional şi unităţile de producţie care sunt
instituţiile). Contrar evaluării tradiţionale, evaluarea modernă implică sistemul instituţional la
diferitele sale niveluri: programe naţionale, politice, educative, funcţionarea instituţiilor,
metode pedagogice…" (cf. J. Vogler, coord., 2000, p. 159). Este ceea ce ne convinge să avem
în vedere accepţiunile diferite ale conceptului de evaluare: una limitată strict la rezultatele
elevului, care poate fi denumită şi evaluare docimologică sau latură docimologică a evaluării
educaţionale sau evaluare de produs; alta dedicată diverselor alte variabile incluse în procesul
didactic, denumită evaluare de proces; alta foarte cuprinzătoare, care vizează şi sistemul
(instituţiile, programele naţionale, politicile educaţionale; aşadar, accepţiunea largă a
conceptului le cuprinde pe toate. Şi tot adevărat este că, în mai toate lucrările de până în
prezent dedicate evaluării, spaţiul majoritar îi este destinat aspectului docimologic al
problemei, linie pe care o vom urma şi în acest curs, dar nu fără să nu acordăm o minimă
atenţie variabilelor din proces. Dintre variabilele de dincolo de rezultatele elevului, singurele
care se bucură de o atenţie constantă sunt: elevul ca premisă a activităţii de învăţare, evaluat
sub aspectul aptitudinilor sale la debutul procesului, deci nu al achiziţiilor sale în finalul
învăţării; conţinuturile, ca suport de bază al învăţării; profesorul, ca principal actant care să
mânuiască şi să le pună în valoare pe toate celelalte. Ceea ce se va constata şi pe întinsul
cursului de faţă.
Terminologia evaluării pedagogice în general. În sfera evaluării pedagogice s-au
statornicit o întreagă pleiadă de termeni, reprezentând tot atâtea concepte cu care este posibil
să operăm în demersul de faţă. Astfel, termenul docimologie exprimă numele ştiinţei "care are
ca obiect studierea sistematică a examenelor, în special a sistemelor de notare şi a comportării
examinatorilor şi a celor examinaţi". Termenul docimastică desemnează aspectul tehnic al
examenului. Vocabula doxologie denumeşte "studierea sistematică a rolului aprecierii în
învăţământul şcolar", preocupându-se concret de "efectele stimulante sau inhibitoare ale
diverselor forme de examinare"; a "reacţiilor elevilor…faţă de hotărârile profesorului"; a
"influenţei părerii profesorului despre elevi asupra predării şi învăţării"; a notării
automatizate, a internotării, notării în echipă, lipsei notării şi a rezultatelor lor (pentru
explicaţiile despre toţi cei trei termeni, vezi şi Gilbert De Landsheere, 1975). Sintagma
randament şcolar defineşte nivelul de pregătire şi dezvoltare a personalităţii prin raportare la
programă (cf. T. Şuteu, în Dicţionar de pedagogie, 1979) şi la obiectivele educaţiei, am
susţine noi azi. Alături de randamentul şcolar, randamentul pedagogic nu trebuie socotit o
simplă preţiozitate lingvistică sau logică, ci rezultat al educatorului, datorat "capacităţii lui de
a alege mijloacele, metodele, procedeele" …"şi de a le folosi cu maximum de eficienţă"
(Idem). Înrudită cu cele două anterioare trebuie considerată eficienţa învăţământului,
caracterizată drept "capacitate a unui sistem de învăţământ de a produce, în bune condiţii,
rezultatele proiectate, adică de a promova, la fiecare nivel al său, seriile de elevi (studenţi)
planificate, cu pregătirea instructiv-educativă corespunzătoare necesităţilor social-
economice"; implică atât aspectele pedagogice (funcţionalitatea sistemului de învăţământ,
metodele, pregătirea personalului didactic, rezultatele elevilor), cât şi pe cele administrative
(planificarea şi amplasarea unităţilor şcolare), pe cele economice (investiţii pentru fiecare elev
sau student, raportate la posibilitatea de recuperare prin munca profesională a acestora) şi pe
CONSTANTIN MOISE

cele sociale (contribuţia absolvenţilor la bunul mers al societăţii prin munca prestată) (cf.
D. Muster, în Dicţionar de pedagogie, 1979). La rândul lui, conceptul de eficienţă a învăţării
(e.î.) este definit ca indicator redând "raportul dintre capacitatea de utilizare a cunoştinţelor
(U) şi capacitatea de învăţare (Î); acest Î rezultă din produsul dintre volumul (V) şi
complexitatea (C) cunoştinţelor, produs ce trebuie raportat la timpul (T) necesar asimilării lor.

De unde: e.î . = U ; Î = VC e.î . = U ⋅ T


Î T ; deci VC (potrivit opiniei lui P. Mureşan, în
acelaşi Dicţionar de pedagogie), fără ca autorul să explice care ar fi valoarea ideală a acestui
raport. Termenii performanţă (şcolară) şi progres (la învăţătură) sunt consideraţi a avea
conţinuturi (chiar dacă numai puţin) diferite; primul semnifică, după unii autori (vezi şi P.
Popescu şi I.T. Radu, 1982, p. 192) "rezultatul obţinut de un elev în pregătirea sa", fără altă
precizare de nuanţă valorică (deşi unul dintre autorii citaţi aici se exprimă şi pentru identitatea
termenilor performanţă şi randament - cf. I.T. Radu, 1981, p.31); după alţii, performanţa este
un rezultat cu valoare notabilă, chiar excepţională; cel de al doilea termen, cel de progres
şcolar, exprimă realizarea unei noi calităţi, superioară celor anterioare. În fine, termenii
evaluator şi evaluand, menţionaţi de documente de referinţă ale teoriei evaluării (cf.
Enciclopedia internaţională a evaluării educaţionale, Oxford Pergamon, 1990 şi 1994):
evaluator, adică "agentul" evaluării; evaluand, adică obiectul evaluării (de pildă, această
enciclopedie menţionează şase mari evaluanzi: programe, produs, politici, specialişti, scopuri,
performanţe).
II. EVALUAREA REZULTATELOR ELEVULUI:
COMPONENTE, CORELAŢII, OBIECT

Comentariul de până aici (atât asupra definiţiilor cât şi a terminologiei) a îngăduit


concluzia că există o evaluare mai cuprinzătoare, vizând întregul edificiu al procesului şi al
sistemului educaţional şi o evaluare cu sferă mai restrânsă, care priveşte numai rezultatele
elevului, rezultate pe baza cărora să fie conştientizat asupra situaţiei lui, orientat, îndrumat,
clasificat. În titlul de faţă încercăm lămurirea unor întrebări legate strict de această ultimă
specie de evaluare menţionată.
Una dintre întrebări ar fi: care sunt acţiunile componente ale evaluării văzute în
aceste limite restrânse şi, odată cu aceasta, ce corelaţii logice pot fi considerate între
conceptul de evaluare a rezultatelor (randamentului) elevului şi alte entităţi implicate în acest
context? Ce se poate constata la prima vedere este că, în mai toate sursele teoretice şi
demersurile normative, conceptul de evaluare este însoţit de cel de măsurare, iar în cele
româneşti, şi de altele, sinonime sau apropiate măsurării, cum ar fi cele de verificare,
examinare, apreciere, notare. Se poate semnala, de asemenea, în literatura dedicată acestui
domeniu, intenţia şi efortul unora dintre autori, îndreptate mai ales spre definirea măsurării în
raport cu evaluarea, precum şi a relaţiei dintre evaluare şi descriere calitativă.
Între autorii care atrag atenţia, în acest sens, îl putem menţiona pe D. Payne (1968),
care, prin referire la evaluare şi măsurare, ne sugerează doar (deci nu rosteşte explicit) relaţia
dintre cele două entităţi: "Cuvântul evaluare este cel mai cuprinzător", reprezentând "procesul
general de formulare de judecăţi şi decizii", iar măsurarea i se subordonează şi constă din
"colectare sistematică, cuantificare şi ordonare a datelor" (lucr.cit., p 3).
O lămurire mai minuţioasă este întreprinsă de Norman Gronlund, ca o completare
necesară la definiţia pe care i-o datorăm şi pe care contextul ne obligă să o repetăm: prin
restricţie la activitatea elevului, "evaluarea poate fi definită ca proces sistematic de
determinare a nivelului la care obiectivele educaţionale au fost realizate de către elev".
Completarea pe care o face autorul vizează o "confuzie" care se face uneori prin utilizarea
drept sinonimi a termenilor evaluare şi măsurare: "Astfel, când un profesor administrează un
test de randament, se poate spune şi că măsoară şi că evaluează, dar cu prea puţină grijă
pentru înţelesul specific al celor doi termeni" (lucr.cit., p.7). Acelaşi teoretician, după ce
acceptă includerea măsurării în evaluare (căreia i se subordonează), contestă prezenţa
măsurării în orice act de evaluare. Mai precis, susţine el, există situaţii când măsurarea
(denumită şi "descriere cantitativă") este perfect practicabilă (să zicem, pentru volumul
informaţiilor elevului); în altele, însă, este hotărâtoare "descrierea calitativă", (de pildă, când
trebuie să evaluăm nivelul şi însuşirile stilului de gândire al elevului), aceasta nemaifiind
măsurare. Concluzia este: "Evaluarea include atât descrierea cantitativă, cât şi calitativă a
CONSTANTIN MOISE

comportamentului elevului, plus judecăţile de valoare despre dezirabilitatea acestui


comportament". Ceea ce autorul prezintă şi sub formă cvasialgebrică (lucr.cit., p. 8):
"Evaluare = descriere cantitativă (măsurare) + judecăţile de valoare
Evaluare = descriere calitativă (nonmăsurare) + judecăţile de valoare".

Concluzia reiese de la sine: aşa trebuie interpretată relaţia dintre evaluare şi cele trei
componente, descrierea cantitativă, descrierea calitativă şi judecata de valoare care încheie
demersul.
Un ajutor în definirea măsurării şi distingerea ei de alte entităţi implicate în evaluare
ne este oferit şi de către J.P. Guilford, care afirmă că "a măsura înseamnă a atribui un număr
unui obiect sau unui eveniment" (apud Landsheere, 1975, p.12). În sprijinul acestei precizări
vine şi Landsheere, care subliniază că "măsurarea se exprimă obligatoriu prin cifre", ceea ce
nu poate precede orice act de apreciere, dată fiind natura obiectului aprecierii, de pildă, "în
domeniul atitudinilor şi în cazul tuturor producţiilor de mare complexitate" (Idem). Ceea ce
înseamnă o acceptare şi o încurajare tacită a promovării opiniei lui Gronlund, şi în privinţa
incluziunii măsurării în evaluare (alături de apreciere), şi în cea a conotaţiei cantitative a
măsurării.
Ce putem reţine de aici este mai ales acel sens "comprehensiv" al evaluării rezultatelor
elevului, luând seama că mulţi dintre autorii sau comentatorii de azi pe acesta îl promovează.
Există însă destule situaţii în care nu acest sens să-i fie atribuit evaluării. Lucrările româneşti
ne oferă mai multe exemple de acest fel. Formulările de felul: "..metode de verificare şi
evaluare" (I. Radu şi M. Ionescu, 1979); "…activitate de verificare şi evaluare", "… probe de
examinare şi evaluare" (P. Popescu, I.T. Radu, 1982); "…metode de verificare şi evaluare",
sau chiar distincţia şi mai de amănunt din sintagma "procesul de evaluare şi notare" (I. Radu,
1995 - altul decât I.T. Radu) sunt toate probe că noţiunea de evaluare a randamentului şcolar
este văzută (cu sau fără "teorie") în două accepţiuni: una aşa cum o prezintă Gronlund,
incluzând măsurarea (vs. descrierea calitativă) împreună cu judecata de valoare aferentă; alta
mai restrânsă, exprimând doar judecata de valoare, care urmează examinării (deci măsurării,
ori, după caz, descrierii calitative); în plus, unii autori fac distincţie şi între evaluare şi notare
(vezi, de exemplu, I. Radu, 1995).
Cât despre distincţia dintre descrierea calitativă (considerată nonmăsurare) şi cea
cantitativă (singura socotită măsurare), nu ne putem da seama cine a acceptat-o, dar, oricum,
e bine de reţinut şi aceasta.

TEMĂ DE REFLECŢIE
Încercaţi să formulaţi argumente pro sau contra definiţiei şi nuanţărilor susţinute de
Gronlund.

O altă problemă care se pune în acest context se referă la obiectul sau ţinta evaluării.
Aşadar ce rezultate ale învăţării trebuie puse în relief ? Autorii preocupaţi de această temă
menţionează categoriile (vezi I.T. Radu 1981, p. 161 urm.): cunoştinţe acumulat (cu
precizările: volumul informaţiei, precizia, rapiditatea actualizării, capacitatea de transfer);
dezvoltarea capacităţilor intelectuale (concretizată şi valorificată mai ales în "deprinderea
elevilor de a învăţa cum să înveţe şi cum să gândească pentru a folosi cele învăţate");
capacităţile de aplicare a cunoştinţelor (obiectivată în "capacităţi de investigare …şi cu
deosebire în capacitatea lor de a le folosi în rezolvarea unor probleme teoretice sau practice);
capacităţile de creaţie, adică de elaborare de lucrări personale (cu punerea în relief a
indicatorilor lor de măsurare şi apreciere: dimensiunile şi calitatea documentării, ordonarea
logică a ideilor, modul de argumentare, exactitatea exprimării corectitudinea frazelor, eleganţa
exprimării, ortografia şi punctuaţia, acurateţea elaborării); trăsături de personalitate şi de
conduită dobândite de elev. Pe scurt, tot ceea ce găsim ordonat ierarhic în fiecare dintre
taxonomiile existente, aşa cum au fost elaborate pe fiecare domeniu comportamental, cel mai
mare spaţiu fiindu-i acordat domeniului cognitiv.
CONSTANTIN MOISE

III. FUNCŢIILE EVALUĂRII RANDAMENTULUI ŞCOLAR

Destul de mulţi autori şi-au rostit opinia pe această temă. La fel de adevărat pare că
mai puţini dintre ei şi-au raportat opinia la punctul de vedere al precursorilor lor, ceea ce face
să avem azi un adevărat mozaic de funcţii ale evaluării. Să concretizăm. G. De Landsheere,
referindu-se doar la o latură a evaluării (aprecierea), îi atribuie trei roluri. Unul este cel de
prognosticare, echivalent cu prevederea succesului (sau insuccesului) elevului în următoarea
etapă de învăţare, pe baza achiziţiilor pe care le deţine în prezent: "este oare elevul înzestrat
cu calităţile intelectuale şi de caracter şi, totodată, dispune el de cunoştinţele necesare pentru a
aborda o materie nouă, sau un ciclu de studii superioare?". Altă funcţie este cea de
„cântărire”, concretizându-se în "verificarea achiziţiilor", "aprecierea progresului" elevului
prin compararea "cu el însuşi" şi prin plasarea lui într-o ierarhie, în cadrul unei colectivităţi,
cum ar fi o clasă, un grup de clase, o serie definită de şcoli (într-un judeţ, o regiune etc.). A
treia, de diagnosticare, obiectivată în precizarea insuficienţelor şi a cauzelor lor: "Care
materii sau procedee sunt insuficient însuşite de cel ce studiază, care sunt procesele
intelectuale responsabile pentru aceasta ?" (cf. 1975, p.11). După alt autor, funcţiile apar mult
mai detaliate: unele sunt funcţiile sociale, altele sunt cele pedagogice (cf. I.T. Radu, 1981).
Între cele sociale sunt exprimate clar două, adică "de a confirma sau a infirma acumularea de
către subiecţii care învaţă a informaţiilor şi abilităţilor necesare unei activităţi social-utile" şi a
dezvălui societăţii realizarea unei anume eficienţe economice a investiţiilor în educaţie. Cele
pedagogice trebuie să se obiectiveze în: stimularea elevului să se dezvolte (ştiut fiind rolul
mobilizator al aprecierii); influenţa asupra preciziei, trăiniciei, caracterului operant al
achiziţiilor elevului; formarea însuşirilor lui de personalitate; orientarea şcolară şi
profesională a acestuia; sprijin pentru profesor să cunoască elevul, să-l îndrume şi să-l
clasifice. Reluate într-o lucrare ulterioară, aceleaşi funcţii aveau să apară în altă nuanţare:
funcţia de control (controlul societăţii asupra derulării procesului); funcţia de clasificare şi de
selecţie a elevilor; o funcţie educativă (de conştientizare a elevului); o funcţie socială
(informarea societăţii asupra rezultatelor instruirii); o funcţie didactică (de autoperfecţionare a
educatorului) (cf. P. Popescu, I.T. Radu, 1982, p. 196). Tabloul funcţiilor îşi schimbă din
nou nuanţa în ultimul deceniu, cel puţin pe terenul didacticii româneşti. Concret, într-o
lucrare datorată unui prestigios colectiv, apare o variantă menţionând funcţiile de: moment al
conexiunii inverse (feedback); măsurare a progresului elevului; factor motivaţional; reper
al autoevaluării; factor reglator pentru activitatea elevului, a profesorului, a părinţilor (I.
Radu, 1995, pp.258-259). Cum se vede, deşi ideea nu este departe de sistematizările
anterioare, secvenţierea explicaţiilor este alta. La rândul lui, Serviciul Naţional de Evaluare şi
Examinare (mai departe în text, va apărea numai abreviat SNEE) difuzează în întreaga reţea
de educaţie varianta sa privind funcţiile aici în discuţie, grupându-le pe două categorii:
generale şi specifice. Funcţiile generale se concretizează în: una diagnostică, adică de
depistare a minusurilor elevului, în vederea înlăturării lor; una prognostică, adică de
anticipare a performanţelor posibile în viitor; alta de selecţie, care să permită clasificarea
elevilor; alta de certificare, adică dovada posedării unor cunoştinţe şi competenţe la
încheierea unei perioade semnificative de studiu: un ciclu, o formă de şcolarizare (aceasta din
urmă nefiind specificată peste tot); cele specifice, în: una motivaţională, constând din
stimularea activităţii de învăţare prin feedback-ul pozitiv oferit de apreciere; alta de orientare
şcolară şi profesională, obiectivată în furnizarea de informaţii utile în vederea alegerii şcolii
convenabile, sau a profesiei compatibile cu înclinaţiile şi deschiderile elevului. În acelaşi timp
cu aceste formulări ale SNEE, apăreau alte propuneri de funcţii ale evaluării, în cadrul unei
lucrări special consacrată evaluării şcolare (Strungă, C., 1999), după cum urmează: o funcţie
"praxiologică" (zisă şi "operaţională", adică de activizare a procesului didactic); una
"axiologică" (de asigurare a "comunicării între lumea valorilor şi universul cunoaşterii"); una
"constatativă" (cu rol diagnostic, adică de învederare a realizărilor şi nereuşitelor, în
perspectiva măsurilor de optimizare); una "de echilibrare" sau ("de reglare" a procesului,
graţie feedback-ului); una "prognostică" (explicată la fel ca în celelalte surse); una "morală"
(concretizată în ţinuta imparţială a aprecierii, care să fie transferabilă din şcoală în toate
instituţiile sociale) (lucr. cit., p.27 urm.).
O renuanţare a opiniei unuia dintre autori aduce o nouă configuraţie a funcţiilor în
discuţie, astfel: funcţii generale, "revenind acţiunilor evaluative, oricare ar fi obiectul
acestora"; funcţii specifice, "decurgând din caracteristicile domeniului de desfăşurare a actului
de evaluare" (cf. I.T. Radu, 2000, p. 68). Nominalizate, cele generale constau din:
"constatare" a stării de fapt (însoţită de aprecierea necesară), "diagnoză etiologică" (adică de
relevare a factorilor care au determinat-o), "predicţie" (anticipare, pe baza celor constatate, a
rezultatelor viitoare); la rândul lor, cele trei funcţii specifice vizează relaţia dintre procesul de
învăţământ şi societate şi se concretizează în: informarea sistemului social asupra eficienţei
procesului; "medierea relaţiei dintre produsele sistemului şcolar şi nevoile sociale", în
perspectiva punerii lor de acord; asigurarea feedback-ului necesar reglării interne a procesului
(Idem, p. 68-71).
Autorii contemporani de "ultimă oră” fac şi ei sistematizări ale funcţiilor evaluării,
încercând să redea, în relativ puţine cuvinte, nuanţările pe care le socotesc destul de
cuprinzătoare. Astfel, C. Stan (cf. 2001) menţionează funcţiile: constatativă (de a informa
asupra "gradului de optimalitate a procesului de învăţământ"); diagnostică (de a scoate în
relief insuficienţele pregătirii elevului şi cauzele lor); prognostică (cum să fie restructurate
strategiile didactice, ca rezultatele viitoare să se îmbunătăţească); motivaţională (sancţiunea
sau recompensa stimulează elevul să înveţe); decizională (asupra locului elevului în ierarhia
clasei, conform normelor docimologice); informaţională (pentru elev, părinţi, societate, cu
privire la nivelul de realizare a obiectivelor educaţionale). În principiu aceeaşi opţiune cu
C. Stan îşi exprimă C. Cucoş (2002), diferenţa dintre cei doi constând din adăugarea de către
ultimul a unei singure funcţii, cea "pedagogică", detaliată în conştientizarea, motivarea,
stimularea, orientarea elevului, precum şi în feedback pentru profesor.
Aflaţi la finele acestui lung repertoriu de opinii asupra funcţiilor, ne întrebăm dacă este
posibilă o compatibilizare a lor, pe baza căreia să rezulte o sinteză acceptabilă şi totodată o
linie de urmat pe ansamblul demersului de faţă. Răspunsul este unul optimist, adică afirmativ,
păstrând, fireşte, o marjă de relativitate, adică o deschidere pentru eventuale alte intervenţii
CONSTANTIN MOISE

analitice şi propuneri. Oscilaţia opiniilor trebuie văzută ca un semn că teoria evaluării este
încă în curs de formare. Iar între puţinele merite pe care ni le apropriem este acela de a fi pus
faţă în faţă, relativ amănunţit, opţiunile atâtor autori, încercând să valorificăm din fiecare câte
ceva.
Primul lucru pe care vrem să-l susţinem este că din toate variantele enumerate (sau
aproape din toate) reies două categorii de funcţii, cum cu dreptate remarca I.T. Radu (1981):
funcţii sociale de o parte, funcţii pedagogice de alta. În rândul funcţiilor sociale, esenţială
este una: asigurarea feedback-ului necesar societăţii, cu privire la realizarea obiectivelor
proiectate de ea şi puse în sarcina şcolii, vizând atât nivelul pregătirii elevilor (pe tot
parcursul procesului) cât şi numărul de absolvenţi şi calităţile lor culturale, profesionale,
umane, la finele procesului. În cadrul funcţiilor pedagogice, primordiale şi generice pentru
toate celelalte sunt două: una orientativ -ameliorativă şi una de decizie prin notare. Toate
celelalte, menţionate de autorii citaţi, pot fi cuprinse foarte bine în fondul acestora două, ca
aspecte implicite ale lor. Drept urmare, prognoza, diagnoza, orientarea şcolară, feedback-ul
pentru profesor pot fi interpretate ca aspecte alcătuitoare ale funcţiei orientativ-ameliorative,
după cum certificarea, clasificarea, selecţia se înscriu foarte clar în funcţia de decizie prin
notă, decizie care va contribui la întocmirea portretului axiologic şi social al subiectului care
învaţă.
În ce priveşte celelalte funcţii, menţionate singular de unii dintre autori, le vom putea
socoti nuanţări personale, pe fondul celor de mai sus (cum este cazul funcţiei educative, după
P. Popescu şi I.T. Radu; al celei morale, praxiologice, axiologice, după C. Strungă ş.a.).
Precizăm, de asemenea, că în tot demersul nostru care va urma, va trebui să ne
raportăm la nomenclatura (adică la cele şase funcţii: prognostică, diagnostică, de certificare,
de clasificare, motivaţională, de orientare şcolară şi profesională), propusă de către
oficialităţile în domeniu, respectiv de către SNEE, date fiind reglementările existente pe
"teren" românesc, prin care această nomenclatură a devenit deja un "instrument de lucru" în
reţeaua şcolară.

IV. TIPURI DE EVALUARE A RANDAMENTULUI ŞCOLAR

Şi acest subiect a prilejuit o pluralitate de opinii şi nuanţări, mergând de la simplitate


absolută până la preţiozitate. Cauza multiplelor structuri în care se face asamblarea tipurilor
se află fie în criteriul utilizat (şi uneori insuficient clarificat), fie în orientarea doctrinară
particulară a autorilor, fie pur şi simplu în modul personal de mânuire a limbajului
specialităţii. De aici va decurge necesitatea prezentării şi explicării unui eşantion de opinii
comparabil ca întindere cu cel de mai sus, privitor la funcţiile evaluării. Prezentarea de mai
jos va cuprinde şi un minim de istorie, pentru a sugera cât mai bine cauza divergenţelor de
opinie actuale, multe dintre ele fiind datorate simplelor influenţe de conjunctură, sau grabei cu
care a fost acceptat un punct de vedere sau altul.
IV.1. După cum este citată de diferiţii comentatori, prima tipologie (în ordine
cronologică) pare să aparţină lui Michael Scriven (1967) şi cuprinde tipurile: evaluare
formativă şi evaluare sumativă. Ceea ce este interesant de constatat este că ea nu se limitează
la rezultatele şi la îndrumarea elevului, accentul căzând pe evaluarea procesului în scopul
ameliorării lui. Ce este drept, constatarea calităţii procesului se realizează prin intermediul
rezultatelor elevului.
Ce înseamnă evaluare formativă, ce înseamnă evaluare sumativă, în acest context?
Aflăm prin intermediul lui R. Gagne şi colaboratorilor săi: "Unul din scopurile pentru care se
culeg date asupra valorii unui program instrucţional este acela de a lua decizii asupra
modalităţilor de revizuire a acestuia în timpul desfăşurării sale (s.n. - C.M.). Cu alte cuvinte,
datele adunate şi interpretate în cadrul fazei de desfăşurare sunt folosite, pentru a forma
programul instrucţional însuşi. Dacă se descoperă prin evaluare … că tema propusă nu-şi
atinge obiectivele, această informaţie este folosită pentru a se revizui lecţia sau a se înlocui
părţi ale temei (s.n.-C.M.), în încercarea de a înlătura defectele care au ieşit la iveală" (cf.
M. Scriven, apud Gagné şi Briggs, 1977, p. 258). Cum se precizează în text, avem a face cu o
evaluare pentru optimizarea programului de instruire, iar nu în scopul clasificării elevilor.
Când aceasta se produce pe părţi limitate, chiar pe parcursul derulării programului, evaluarea
se cheamă formativă. Spre deosebire de ea, deşi urmăreşte prioritar tot ajustarea programului
de instruire, evaluarea sumativă se referă la părţi mai cuprinzătoare din curs sau la cursul
întreg, ea având loc la finele acelor părţi sau la finele cursului în ansamblu: "Evaluarea
sumativă are loc de obicei atunci când s-a terminat desfăşurarea unei unităţi instrucţionale,
mai degrabă decât în timpul acestei desfăşurări ….". În general, evaluarea sumativă se ocupă
de eficacitatea unui sistem instrucţional, a unui curs întreg sau a unei teme întregi. Evaluarea
se numeşte sumativă deoarece urmăreşte obţinerea unor date despre efectele sumative ale unui
set de lecţii care alcătuiesc o unitate mai mare a instruirii"; iar decizia "pentru care sunt utile
datele evaluării sumative se referă la faptul dacă un curs nou sau altă unitate este mai bună
decât unitatea înlocuită …" (Idem).
Din cele exprimate aici de către Scriven despre evaluarea formativă vs. sumativă,
reiese efectul acestora asupra procesului. Nu este rostit şi impactul celor două tipuri de
evaluare - formativă şi sumativă - asupra elevului, adică: îl orientează îl clasifică? NU se
precizează. Acest impact va fi arătat mai târziu, de către Bloom şi colaboratorii săi, într-o
lucrare consacrată special celor două tipuri de evaluare (cf. Bloom şi colab., 1971).
IV.2. Tipologia pe care Bloom o propune este cea care include evaluarea iniţială,
alături de evaluarea continuă (denumită şi formativă) şi de evaluarea sumativă (lucr.cit.,
p.14); aşadar, cu un tip în plus faţă de Scriven. Începând de aici, această nouă formulă, cu trei
tipuri de evaluare (iniţială, formativă, sumativă) va apărea, în opinia mai tuturor autorilor, cu
unele diferenţieri de nuanţă, până la noi.
Evaluarea iniţială, adică cea concepută şi înfăptuită înainte de începerea procesului,
are rolul să constate şi să diagnosticheze aptitudinea şi starea de pregătire a elevului şi să
hotărască asupra plasamentului lui la un profil şcolar sau într-o grupă de nivel potrivită. Se
realizează prin înregistrarea achiziţiilor anterioare, teste de diagnostic şi de plasament, sau
CONSTANTIN MOISE

teste de aptitudini, relevante pentru alegerea, de către sau pentru elev, a alternativei de studiu
în etapa care urmează.
Este locul unde trebuie să facem o observaţie, anume: enumerarea de către autor, între
instrumentele acestei evaluări, şi a altor teste decât cele de randament (adică în afara celor
docimologice în sens strict) ne sugerează de ce autorii americani preferă termenul evaluare
celui de docimologie: pentru că, aşa cum vom vedea mai departe, evaluarea rezultatelor
elevului (deci cea din sfera docimologiei) se împleteşte cu cea de determinare a aptitudinilor
elevului la un moment dat, ceea ce nu mai "cade" în domeniul docimologiei, ci în cel al
investigării psihologice (vezi mai departe definirea testelor docimologice).

TEMĂ DE REFLECŢIE
Explicaţi şi conchideţi de ce autorii menţionaţi mai sus nu consideră proprie folosirea
termenului docimologie, respectiv expresiei activitate docimologică.

Evaluarea formativă, la rândul ei, este pusă în discuţie pornind de la punctul de vedere al lui
Scriven. Bloom afirmă: „În concepţia sa (a lui Scriven - n.n.- C.M.), evaluarea formativă
implică culegerea datelor relevante pe timpul constituirii şi probării unui nou curriculum,
astfel că revizuirile curriculumului să se poată baza pe aceste evidenţe. Noi privim evaluarea
formativă ca fiind utilizată nu numai pentru alcătuirea programului de instruire…” (s. n.
-C.M.); "Evaluarea formativă înseamnă pentru noi folosirea sistematică a evaluării în procesul
construirii curriculumului, în cel al predării şi al învăţării, cu scopul îmbunătăţirii oricăruia
dintre aceste trei procese" (s.n. - C.M.) (Bloom şi colab., 1971, p.117). Cum se poate observa,
Bloom vrea să sublinieze că opinia lui Scriven nu este destul de lămuritoare în privinţa ariei
de cuprindere a evaluării formative. Mai precis, nu sunt puse în relief nici preocupările vizând
activitatea profesorului (predarea) şi nici cele privind îmbunătăţirea muncii elevului
(învăţarea). Şi completează Bloom: "Principalul scop al observaţiilor formative este de a
determina gradul de stăpânire a sarcinilor de învăţare date, sau de a preciza partea de sarcini
încă nestăpânite … Scopul evaluării formative este nu să-l clasifice sau să-l certifice pe elev,
ci să-l ajute şi pe elev şi pe profesor să se concentreze asupra efortului de învăţare special
care să-l propulseze pe elev spre această stăpânire".
Şi în legătură cu evaluarea sumativă, Bloom reia opiniile lui Scriven într-o formulă
mai completă de interpretare. El consideră că, spre deosebire de cea formativă, evaluarea
sumativă este îndreptată spre o "mult mai generală apreciere a gradului în care rezultatele au
fost atinse, prin raportare la un întreg curs, sau la o parte substanţială a lui", ceea ce susţinuse
şi precedentul. În plus faţă de acesta, Bloom afirmă că alt scop esenţial al evaluării sumative
este de "a clasifica elevul şi a raporta acest lucru părinţilor şi administratorilor" (lucr. cit., p.
61). Deosebirea dintre cele două tipuri este semnalată şi prin ritmul lor în timp: dacă testele
formative au o frecvenţă curentă, cele sumative se aplică de două sau de trei ori de - a lungul
unui curs (Idem). Testelor sumative (ca instrumente proprii acestui tip de evaluare) le atribuie
şi alte roluri, interferente cu ale testelor formative: certificarea deprinderilor şi abilităţilor,
predicţia succesului în cursurile următoare, moment al iniţierii instruirii în studiul următor,
feedback pentru subiectul care învaţă (elevul, studentul), compararea rezultatelor şcolare ale
diferitelor grupuri.
Pe ţesătura schemei de interpretare datorată lui Bloom şi preluată de cei care au urmat,
se vor alcătui o mulţime de nuanţări particulare ale tipurilor citate, precum şi adăugiri de la
autor la autor.
IV.3. În anii ’70, G. De Landsheere venea cu altă sistematizare. Aceasta prelua de la
Bloom tipurile: formativă şi sumativă, pe care le va explica în felul său, generând unele
clarificări importante, dar şi o nouă relativă complicaţie, cum se va vedea. Iată opinia
cunoscutului docimolog belgian: „Aprecierea formativă constă deci în a descompune o
sarcină, un curs, o materie … în unităţi şi a determina, pentru fiecare unitate, în ce măsură un
elev a învins o dificultate. Este vorba deci de o operaţie diagnostică. … În orice caz,
aprecierea formativă are ca unic scop să recunoască unde întâmpină elevul o dificultate, în ce
constă ea şi să-l informeze asupra celor constatate.” Această apreciere nu se exprimă în note şi
cu atât mai puţin în scoruri. La rândul ei şi spre deosebire de cea formativă, evaluarea
sumativă "se adresează fie unei părţi importante dintr-un curs, fie chiar cursului întreg …
Deosebirea fundamentală constă mai puţin în volumul procesului de învăţare (sublinierea
noastră - C. M.), cât în obiectul aprecierii. Aprecierea sumativă se exprimă printr-un scor"
(Idem, p. 223). Complicaţia pe care o anticipam mai sus se concretizează chiar în această
interpretare a evaluării sumative Este vorba despre un feedback pentru elev şi pentru
profesor" (cf. 1975, p. 213), nu esenţial asociată cu volumul învăţării, cât cu încheierea
aprecierii prin notă.
Odată cu cele de mai sus, Landsheere lansa conceptele de evaluare normativă şi
evaluare criterială, pe care le comenta pe fondul etalonării testelor, în vederea notării
obiective. Aprecierea normativă face trimitere la o normă, adică la "media grupului de
referinţă. Testele etalonate în acest mod se numesc din ce în ce mai des teste normative (norm
referenced tests), denumire care, desigur, nu este cea mai fericită, dar care a şi intrat în uz"
(idem, p. 152). Definirea mai clară apărea într-o ediţie ulterioară a lucrării citate mai sus:
"Prin evaluarea normativă se interpretează scorul obţinut în urma unui test clasic de
inventariere a cunoştinţelor sau de inteligenţă, iar acest scor este plasat într-o distribuţie
statistică: performanţa unui individ este judecată prin raportare la performanţa altuia …
distribuţia performanţelor constituind norma" (apud G. Meyer, 2000, p. 27). Cât priveşte
evaluarea criterială, acelaşi autor afirmă că "nu mai avem a face cu un grup de referinţă", ci
cu raportarea comportamentului realizat de elev doar la obiectivele propuse, însuşi
instrumentul măsurării fiind testele axate pe obiective (criterion referenced tests). Altfel spus,
raportul se face între nivelul rezultatelor elevului la un moment dat şi fiecare obiectiv ce
trebuie atins (cf. De Landsheere, 1975, p. 152).

TEMĂ DE REFLECŢIE
Redaţi noutatea pe care o aduce, dar şi complicaţia pe care o provoacă Landsheere prin
această nuanţare.
CONSTANTIN MOISE

IV.4. Când Bloom revenea (1979) şi adopta aceeaşi distincţie ca şi Landsheere, făcea şi alte
precizări, privind atât definirea mai limpede a celor două tipuri de evaluare (normativă şi
criterială), cât şi raportul dintre acestea şi alte tipuri: evaluarea sumativă are două ipostaze,
adică una normativă (care stabileşte gradul în care au fost atinse obiectivele, comparându-i
pe elevi între ei) şi alta criterială (care compară performanţele realizate de fiecare numai cu
cele aşteptate) (cf. Bloom, B., 1979, apud Meyer, 2000). Aşadar, cele două sunt nuanţe ale
evaluării sumative, cea formativă îmbrăcând doar nuanţa criterială.
IV.5. O intervenţie ulterioară celor de mai sus, datorată lui R. Tousignant (1982),
operează nuanţări noi în cadrul evaluării formative. Concret, evaluarea formativă se poate
obiectiva, după criteriul temporal, în trei variante: una iniţială, "pentru a rezuma cunoştinţele
dobândite anterior şi pentru a-l ajuta pe profesor să aleagă activităţile cele mai potrivite
nevoilor fiecărui elev" (deci de orientare); una pe parcursul învăţării, "pentru a sugera noi
activităţi apte să remedieze dificultăţile", numită diagnostică sau continuă; alta la finele
procesului, denumită de autor sumativă (sic), care "face bilanţul obiectivelor realizate, pentru
a planifica mai bine cursurile viitoare" (loc cit., apud Meyer, 2000, p.28). Alte două precizări
propuse de acest autor apar astfel: "instrumentarea ei privilegiată (a evaluării formative - n.n.,
C.M.) este evaluarea criterială" (s.n.- C.M.); "actorul" ei poate fi însuşi elevul, evaluarea
formativă devenind astfel şi autoevaluare.
IV.6. La rândul lor, autorii J.-J. Bonniol, G. Nunziati (1990) consideră mai potrivit, în
loc de atributul "formativă", pe cel de "formatoare": "Obiectivelor de reglare pedagogică,
de gestionarea erorilor şi de întărire a reuşitelor, obiective comune diferitelor modele de
evaluare formativă, dispozitivul de evaluare formatoare le mai adaugă o exigenţă, care îl
priveşte pe elev: reprezentarea corectă a scopurilor, planificarea acţiunii, însuşirea criteriilor şi
autogestionarea erorilor"; altfel spus, "evaluarea formatoare îl ajută pe elev să înveţe
cerându-i să anticipeze" (cf. Meyer, lucr.cit., p. 33). Reţinem şi acest tip, dată fiind
eventualitatea apariţiei lui în context şi necesitatea explicaţiilor de rigoare.
IV.7. Opinia autoarei Genevieve Meyer (cf. 2000, pp. 38-39), rostită la sfârşitul unei
analize, este una de maximă simplificare: să se renunţe la toate atributele ataşate evaluării,
reţinându-se numai două, care să individualizeze două tipuri de evaluare, adică: evaluare
formativă şi evaluare normativă (în loc de "sumativă"); cea formativă, cu funcţie de
reechilibrare a procesului pe tot parcursul învăţării; cea normativă, cu funcţie de orientare (la
începutul procesului), funcţie de ierarhizare (pe parcursul învăţării, prin evaluări fracţionate)
şi rol de atestare (la sfârşitul itinerarului); cea formativă are ca obiect procesele implicate în
învăţare, este internă şi multireferenţială, iar ca instrumente foloseşte concluziile teoriilor
învăţării; cea normativă are ca obiect produsul învăţării (capacităţi, competenţe), este
externă şi unireferenţială, folosind ca instrumente notele şi calificativele (instrumente
relative) pe de o parte, iar pe de alta dihotomiile da/nu, reuşit/nereuşit (instrumente binare)
(Meyer, 2000, p.40).
IV.8. Variantele româneşti ale tipurilor de evaluare se păstrează, în linii mari, pe
aceleaşi coordonate cu cele prezentate până aici, şi ele fiind marcate pe alocuri de nuanţări ce
ţin de firescul discursului fiecărui autor. Astfel putem conchide că, de regulă, comentariul
autorilor români gravitează doar în jurul evaluării formative şi sumative, deşi le cuprind pe
acestea în noţiunea gen de strategie, iar nu în cea de tip, cum apar la Bloom, De Landsheere,
Meyer etc. Iată câteva dintre aceste opinii. I.T. Radu, de pildă, expune următoarea listă de
"tipuri de strategii de evaluare", identificate după o multitudine de criterii (Radu, 2000, p.
137 urm.): după "situaţia de evaluare" (rezultând tipurile: evaluare în circumstanţe obişnuite
vs. evaluare specifică, bazate pe o elaborare adecvată); după funcţia dominantă (evaluare
diagnostică, din care să reiasă punctele tari şi cele slabe ale elevului şi cauzele lor, vs.
evaluare prognostică, cu rol predictiv); după "dimensiunea secvenţei evaluate" (evaluare "de
bilanţ", la final de semestru, an şcolar, ciclu şcolar; evaluare "dinamică", efectuată pe
parcursul procesului de instruire, pentru a marca progresele sau regresele elevului"; evaluare
formatoare, care să învedereze - pe lângă rezultatele elevului - şi procesele de ordin cognitiv
şi atitudinile aflate la baza acestor rezultate); după "autorul acţiunii evaluative"
(heteroevaluare, când este efectuată de altcineva decât elevul însuşi; autoevaluare, când o
face elevul asupra sieşi); după conţinutul predominant evaluat ("evaluare preponderent
pedagogică", referindu-se la achiziţiile elevilor pe parcursul instruirii, vs. "preponderent
psihologică", vizând aptitudinea de învăţare a subiecţilor, deci ce "ar putea" să realizeze);
după "modul de integrare" în procesul didactic (tipurile: evaluare iniţială; evaluare pe
parcursul procesului didactic - denumită din nou "dinamică" - având nuanţele: "formativă" şi
"cumulativă"; "evaluare finală" cu caracter de bilanţ). Atenţia acestui autor (şi meritul, în
acelaşi timp) nu se focalizează doar asupra delimitării tipurilor exprimate aici, cât mai ales
asupra caracterizării, prin opoziţie, a celei cumulative şi a celei formative, cu o pledoarie
consistentă în favoarea celei formative. La obiect (lucr. cit., p. 153 urm.), cea sumativă are
caracterele: este efectuată "punctual" şi se încheie cu cea de bilanţ; efectuându-se prin sondaj,
nu poate oferi informaţii complete asupra tuturor conţinuturilor esenţiale; este moştenită din
tradiţie; arată la ce nivel a ajuns învăţarea, sancţionând-o prin notă, pozitiv sau negativ;
funcţiile de bază constau din verificare, comunicare, certificare; are fidelitate scăzută şi efect
slab de reglare a procesului. La rândul ei (idem, p.164 urm.), cea formativă: se extinde şi
asupra procesului; prezintă interes pentru evoluţia subiectului care învaţă, putând reliefa atât
reuşitele, cât şi lacunele; are efecte reglatorii decisive; se produce predominant pe parcurs,
prin interpătrundere cu predarea şi învăţarea; diminuează caracterul de sondaj, până la
excludere; se instituie ca un feedback continuu, în sprijinul activităţii de învăţare; face
posibilă abordarea mai analitică a învăţării, deschizând drumul unei "reglări punctuale" a
procesului; pe baza ei, poate fi promovată o pedagogie "corectivă".
IV.9. Alţi autori care şi-au exprimat opiniile pe teren românesc s-au arătat fideli în
principiu aceleiaşi linii împărtăşite de I.T. Radu. Îi menţionăm pe scurt. C. Strungă se arată de
acord cu cele două "strategii" (formativă şi sumativă), folosind drept criteriu "raportul dintre
predare, evaluare, învăţare": separarea de predare şi învăţare este specifică evaluării sumative;
"împletirea celor trei este condiţia sine qua non a evaluării formative (C. Strungă, 1999, p. 89
urm.). În fine, C. Cucoş (2002, p. 379), sintetizând şi alte opinii, conchide că diferitele
"forme" de evaluare reies din aplicarea a trei criterii: cel cantitativ, rezultând evaluarea
parţială şi globală; cel temporal, din care rezultă evaluarea iniţială, cea continuă şi cea
finală; criteriul sistemului de referinţă (după C. Stan, 2000), conducând la tipurile: evaluare
formativă, evaluare clasificatorie, evaluare "autocentrică".
CONSTANTIN MOISE

Cum se poate constata, există diferenţe între opiniile atâtor autori, dar există şi destule
puncte comune; în intervenţiile lor sunt multe aspecte clare, încât consideraţi fiecare separat,
fiecăruia i s-ar putea da dreptate; neclarităţile apar, de regulă, când îi situăm împreună, iar
diferitele tipuri de evaluare, propuse după criterii diferite sunt aşezate în aceeaşi listă.
Poziţia cea mai raţională trebuie să fie una de valorificare a tuturor acestor contribuţii,
meritorii prin însuşi faptul că au fost formulate, fiecare conţinând „partea ei de adevăr”. Vom
considera astfel că Scriven are meritul de a fi delimitat primul cele două tipuri de evaluare:
sumativă vs. formativă; că Bloom le-a raportat, tot primul, la urmările lor asupra elevului şi a
propus tipul de evaluare iniţială; că De Landsheere a făcut delimitările între normativ şi
criterial; că G. Meyer a conceput simplificarea tipurilor până la formula: evaluare normativă
- evaluare formativă; că I.T. Radu şi C. Stan propun şi alte criterii de determinare a tipurilor
de evaluare; că C. Strungă şi C. Cucoş întreprind nişte interpretări diferenţiatoare sau
unificatoare, lista putând continua.
Dar nu poate fi ignorată, pe acest fond, existenţa unor interferenţe de criterii sau chiar
numai unor nuanţări lingvistice, conducând la neclarităţile care persistă. De pildă, aşezarea
evaluării iniţiale în aceeaşi clasificare cu cea formativă şi cea sumativă pare să încalce
unitatea de criteriu; stabilirea şi unei specii de evaluare sumativă, inclusă în cea formativă (cf.
Tousignant, 1982),apare ca o excepţie ciudată; inexistenţa, încă, a unei explicaţii clare privind
caracterul final sau nonfinal al evaluării sumative, a determinat-o pe G. Meyer să renunţe la
această titulatură, înlocuind-o cu cea de evaluare normativă; conceperea unor prea complicate
criterii de grupare de către unii autori (cf. I.T. Radu, 2000), ceea ce generează apariţia unuia şi
aceluiaşi tip după criterii diferite(de pildă, tipul evaluare dinamică); accepţiunea dată de către
unii autori evaluării criteriale (cf. C. Stan, lucr.cit.), diferit de toţi autorii precedenţi, face să
apară alte complicaţii de interpretare; ca să cităm pe cele mai vizibile dintre cauzele care iscau
judecata: "De altfel, ca simplu "cititor" al literaturii din domeniu, sesizăm o literatură prolixă,
deosebit de deturnantă, fiecare autor propunând clasificări, viziuni, valorizări ce cu greu pot fi
compatibilizate, sintetizate " (cf. C. Cucoş, 2002).
Procedând optimist, putem încerca o compatibilizare: să continuăm demersul
întreprins şi de toţi autorii citaţi, considerând că într-adevăr este necesară o clasificare
nuanţată, după mai multe criterii relevante. Astfel, după criteriul timp, putem delimita o
evaluare iniţială, practicată prin concursul de admitere, prin testările la începutul unui nou
"parcurs" şcolar (de pildă, profesorul de matematică testează nivelul elevilor la începutul
clasei a cincea, pentru a şti la ce nivel să desfăşoare predarea în anul de studiu respectiv), sau
prin testele de aptitudini, tot în vederea abordării unei materii încă nestudiate (acestea
nemaiîncadrându-se în sfera docimologică); una concomitentă şi prin alternare sau chiar
interpătrundere cu predarea şi învăţarea (continuă sau nu, deci nu neapărat continuă),
obiectivată în ascultarea curentă, lucrările de control curente sau, mai nou, fişele de evaluare
(înlocuite, începând cu clase gimnaziale, de extemporalul tradiţional sau de test), verificarea
la sfârşitul fiecărui capitol, şi verificarea periodică, fie scrisă (teza tradiţională), fie practică;
una finală, la noi practicându-se, în învăţământul preuniversitar, după mai mulţi ani de
studiu, cum este cazul examenului de capacitate şi al bacalaureatului.
După criteriul volumului de conţinuturi vizate, se pot identifica: evaluarea
secvenţială de o parte, globală de alta. În acest caz, nu mai putem opera cu mărimi absolute.
Concret se pot încadra în chip absolut în evaluarea globală respectiv secvenţială numai
extremele, adică verificarea din fiecare lecţie - întotdeauna secvenţială, sau examenul -
întotdeauna încadrat în cea globală; celelalte îşi capătă statutul de secvenţiale sau globale
după elementul de comparaţie (de pildă, dacă o verificare la sfârşit de capitol este comparată
cu teza, este secvenţială; dacă este pusă alături de cea din fiecare lecţie, este globală), astfel că
probabil mai adecvată ar fi titulatura: de mai mare sau mai mică globalitate. Considerarea
criteriului de faţă ar fi şi modul de a ieşi din dilema evaluării sumative, care pentru unii
autori face obligatoriu trimitere la cantitatea de conţinuturi, în timp ce pentru alţii această
cantitate nu mai contează, esenţială devenind atribuirea unui scor, din care să rezulte nota
celui examinat (cum se exprimă De Landsheere mai sus).
Ar trebui invocat, de asemenea, criteriul funcţiei îndeplinite sau al scopului urmărit
de fiecare act de evaluare, după care rezultă tipurile evaluare de orientare şi ameliorare vs.
evaluare de decizie prin notă, sub "umbrela" celei dintâi încăpând cea formativă, cea
prognostică şi cea diagnostică, iar cea din urmă asumându-şi funcţiile şi luând denumirile: de
certificare, de selecţie, de clasificare şi, din nou, prognostică. Este replica noastră la
propunerea autoarei G. Meyer (evaluare formativă vs. evaluare normativă), propunere de
altfel valoroasă, pe fondul complicat al atâtor opţiuni anterioare, mai ales având în vedere
definirea neclară a evaluării sumative, când se doreşte ca aceasta să fie raportată obligatoriu la
parametrii timp şi cantitate. Am putea exemplifica pentru evaluarea formativă cu acele lecţii
organizate special fie pentru revederea materiei pentru teză, fie ca recapitulări pentru
bacalaureat sau alt examen, ele meritându-şi în măsură egală numele de lecţii de evaluare
formativă; după cum am putea consacra lecţii speciale ascultării şi notării elevilor,
intitulându-le lecţii de evaluare finalizată prin notă.
Elementul de referinţă constituie şi el un criteriu foarte limpede. După el vom
delimita evaluarea criterială şi evaluarea normativă, prima având ca element de referinţă
numai obiectivele de atins, în timp ce ultima adaugă acestui reper un grup de referinţă (de
pildă, grupul-clasă), din care face parte cel examinat şi cu rezultatele căruia sunt comparate
rezultatele lui, stabilindu-i-se un loc pe scara rezultatelor grupului. După acelaşi criteriu, am
putea reţine, fie şi în subsidiar, propunerea tipului evaluare autoreferenţială (cf. C. Stan,
lucr.cit.), elementul de referinţă fiind însuşi subiectul evaluat.
Deşi aceste criterii ar putea părea suficiente, nu putem lăsa neluat în considerare unul
care a devenit deja loc comun, autori semnificativi acordându-i spaţiu şi importanţă
apreciabile: criteriul care răspunde la întrebarea "Cine este examinatorul?". După el
rezultă tipurile evaluare internă vs. evaluare externă. Prima este săvârşită de cel care a
predat la clasa respectivă, având loc pe parcursul întregului proces şi cumulând toate funcţiile
şi relaţionările cu tipurile delimitate după celelalte criterii, fiind deci realizată de fiecare
profesor la clasa lui. Cea de a doua se realizează de alţii decât cel care a predat, având ca
obiect , de regulă, un volum mare de conţinuturi (ca în cazul examenelor de capacitate, de
bacalaureat etc.). Rostul ei este nu numai unul de prevenire a eventualei subiectivităţi a
CONSTANTIN MOISE

examinatorului "intern", ci şi de a asigura o exigenţă unitară a examinării, pe tipurile de


instituţii şi pe spaţii teritoriale semnificative.
Aşadar, diferenţiind criteriile, vom reţine tipurile:
• iniţială, concomitentă (continuă, integrată), finală;
• secvenţială, globală;
• de orientare şi ameliorare (formativă, prognostică, diagnostică), de decizie prin notă
(sumativă) (de certificare, de clasificare, de selecţie);
• normativă, criterială, autoreferenţială;
• internă, externă.
Iată rezumatul cel mai simplu, după opinia noastră, al unui demers de delimitare a
tipurilor de evaluare. Finalizarea lui se bazează pe toate contribuţiile menţionate; în mod
special pe sugestiile lui Genevieve Meyer privind simplificarea tipurilor şi renunţarea la
atributul "sumativă", pe care noi îl mai păstrăm doar ca echivalent aproximativ al perifrazei
"de decizie prin notă", din respect pentru tradiţie; pe multitudinea criteriilor propuse de toţi
autorii citaţi, preluându-le selectiv şi adăugând nuanţările ce ne aparţin
Mai facem precizarea că aceste tipuri se pot combina şi pot "convieţui" în unul şi
acelaşi act evaluativ, în cele mai diverse formule. Ca să ne limităm la un singur exemplu, un
concurs de admitere poate fi considerat în acelaşi timp în categoriile: evaluare iniţială,
globală, de decizie prin notă în scopul selecţiei, normativă, externă; ceea ce s-ar putea
demonstra si cu alte exemple
V. METODE DE EVALUARE

V.1. PREZENTARE GENERALĂ

Analog demersului de predare şi celui de învăţare, şi evaluarea şi-a constituit sistemul


său de metode prin care să se realizeze. Situaţia existentă în diversele surse actuale ne obligă
la câteva explicaţii preliminare. De pildă, sursele româneşti actuale menţionează:
1) metode de verificare (constatare):
a) de bază: chestionarea orală curentă (în fiecare lecţie mixtă sau în lecţii special
destinate); verificarea scrisă curentă (tradiţionalul extemporal, sau, la clasele mici,
lucrarea de control); verificarea practică curentă (impusă de conţinutul specific al
unor discipline de învăţământ); verificarea periodică în scris (teza trimestrială sau
semestrială); verificarea practică periodică; verificarea cu caracter global, fie în
varianta examenului final, fie a examenului concurs de admitere, fiecare dintre ele
putând lua forma orală, scrisă, practică, sau a unei combinaţii dintre cele trei
forme; verificarea la sfârşitul fiecărui capitol; testul docimologic cu toate
variantele lui, respectiv: curent, periodic, final;
b) complementare: observarea sistematică a elevilor; investigaţia; proiectul;
portofoliul; autoevaluarea;
2) metode de apreciere: aprecierea verbală, cu rol de orientare; notarea.

Iată şi categoriile de metode de evaluare după sistematizarea aparţinând unui areal


pedagogic diferit drastic de concepţia noastră tradiţională (cf. N. Gronlund, 1965;1971;
D. Payne, 1968):
1) teste de tot felul (focalizate fie în jurul determinării aptitudinii de învăţare, fie al
randamentului şcolar), sistematizate dihotomic sau trihotomic, astfel: orale vs. scrise;
informale vs. standardizate; obiective vs. tip eseu; de "stăpânire"; de orientare, diagnostice;
de performanţă, verbale, nonverbale; de viteză vs. de forţă;
2) tehnici de autoprezentare: interviul şi chestionarul;
3) tehnici observaţionale: înregistrări "anecdotale" (după relatare); liste de control
(checklists); scale ierarhice (rating scales); tehnici sociometrice (teste de "preferinţe" şi de
autopercepere).
Am citat şi acest al doilea "inventar" de metode, având în vedere eventuala necesitate a
explicării unor deosebiri faţă de sistemul metodelor noastre autohtone, sau posibilele
interferenţe între cele două planuri, sau unele adaptări ale lor pe teren românesc.
Trebuie să reţinem unele observaţii privind sistemul de metode prezentat de autorii
americani. Una, că evaluarea la care se referă autorii citaţi vizează nu numai rezultatele
obţinute de elev la învăţătură, ci şi premisele acestor rezultate (vezi testele diagnostice), sau,
în măsură egală, dimensiunile sociale ale personalităţii elevului (vezi tehnicile sociometrice).
Alta, că nu pe toate le consideră instrumente de măsurare (vezi tehnicile prin care se
CONSTANTIN MOISE

realizează descrieri calitative), distincţie pe care Gronlund a subliniat-o şi în mod expres, cum
s-a văzut în paginile anterioare.
Înainte de a aborda analitic metodele menţionate, este necesar să avertizăm şi asupra
calităţilor pe care acestea ar trebui să le îndeplinească. Iată cum apar ele detaliate de un alt
autor american (D. Payne, 1968):
• relevanţa (validitatea), calitatea de a reda comportamentul cerut astfel încât să reiasă clar
legătura cu obiectivul aferent;
• echilibrul - adică gradul în care proporţia rezultatelor parţiale coincide cu ansamblul
conţinuturilor, ceea ce poate fi schiţat de un tabel de specificaţii;
• eficienţa - este redată de cantitatea de răspunsuri raportată la timp;
• obiectivitatea - calitatea de a permite evaluatorilor să cadă de acord cu precizie asupra
răspunsului corect;
• specificitatea - să măsoare ceea ce este necesar de măsurat în domeniul dat;
• dificultatea - conceperea probei în aşa fel încât fiecare item să fie rezolvat de jumătate din
grupul testat;
• discriminarea - calitatea itemilor de a reflecta corect, prin rezultat, diferenţa dintre elevii
buni şi cei slabi din grup;
• siguranţa (fidelitatea) - calitatea de a conduce la răspunsuri stabile (neschimbate odată cu
repetarea măsurării);
• corectitudinea (caracterul nepărtinitor) - calitatea de a oferi fiecărui examinat şansa de a-şi
dovedi cunoştinţele;
• viteza - calitatea probei conform căreia rapiditate rezolvării să nu aibă influenţă
semnificativă asupra calculării scorului.

Cu toate că aceste însuşiri sunt raportate de autorul citat numai la test, făcând precizări
până la nivel de item (vezi, la titlul dedicat testului, ce este itemul), ele pot fi considerate
aplicabile oricărei probe, tradiţională sau modernă. Pentru a nu complica prea mult demersul,
le vom reţine şi comenta numai pe unele dintre ele, anume: obiectivitatea, fidelitatea,
validitatea, dificultatea (rezonabilă), capacitatea de discriminare, cărora le vom adăuga
practicabilitatea, având în faţă modelul mai multor autori semnificativi, preocupaţi de
tema evaluării: Ausubel şi Robinson (1969; traducerea românească din 1981), De Landsheere
(traducerea românească din 1975), Lindeman (traducerea românească din 1978).

V.2. PREZENTARE ANALITICĂ

V.2.1. Metode tradiţionale


Sub acest titlu cuprindem toate acele modalităţi de evaluare care, cronologic văzute, au
apărut şi s-au statornicit primele, constituind zestrea tradiţională a teoriei şi practicii
româneşti a evaluării şcolare. Constituirea sistemului lor s-a produs treptat, prin contribuţia,
nuanţată mai mult sau mai puţin personal, a tuturor autorilor semnificativi de teorie didactică
din România, în opera lor putându-se identifica preocupări exprese în acest domeniu. Astfel:
I.P. Eliade (1868, p. 101-113) scria despre "forme examinatoare" (pe atunci, conceptul de
metodă de azi era redat prin termenul "formă"), concepute "la fiecare lecţie sau în ore special
destinate pentru examen"; E.M. Brandza (1932, p. 172 urm.) menţiona examenele cu caracter
global şi termen fix (finale sau de trecere într-un ciclu nou) şi examene "nesorocite", adică
fără dată precisă, deci pe tot parcursul procesului; Şt. Bârsănescu (1935) menţiona: "lecţia
obişnuită de ascultare", "ascultarea lecţiei de sinteză", "ascultarea scrisă", "ascultarea
examen" (lucr. cit., p. 122 urm.), ceea ce se "traduce" prin: verificare orală curentă,
extemporal, teză, examen. Aceste modalităţi vor fi reluate de toate cursurile de pedagogie de
după al doilea război mondial, cu adăugiri minime. De exemplu, I.Gh. Stanciu le menţiona
(1961), adăugându-le "observarea curentă a muncii şi comportării elevilor"; D. Todoran
(1964), adăugând verificarea frontală a temelor efectuate acasă; V. Ţârcovnicu (1975) cu
adăugarea lucrărilor practice; I. Radu (1979); I. Nicola (1980 şi 1994), încât până azi ele au
devenit locuri comune, nemaifiind atribuite unuia sau altuia dintre autori.
Văzute după forma acţiunii care le pune în valoare, metodele de verificare (denumite
azi şi "de măsurare"), au fost grupate pe trei categorii: de verificare orală, de verificare
scrisă, de verificare practică.

V.2.1.1. Metodele de verificare orală


Sunt utilizate în cele mai diverse circumstanţe, date fiind resursele fie de eficienţă, fie
de claritate a demersului, fie de ordin formativ, pe care le implică. O viziune dialectică asupra
lor ne obligă să vedem şi eventualele relative inconveniente cu care se însoţesc, chiar dacă nu
în mod sistematic.
Verificarea orală curentă (denumită prin tradiţie şi ascultare sau chestionare) se poate
produce în două variante, atât după extensia diferită a conţinuturilor pe care le vizează, cât şi
după contextul sau tipul de lecţie în care se produc: ascultarea în fiecare lecţie mixtă, de o
parte, realizarea mai amplă a aceleiaşi confruntări, în lecţii întregi, de altă parte.
Chestionarea în fiecare lecţie mixtă, reprezentând partea de debut a acestui tip de
lecţie, se prezintă ca o conversaţie selectivă, din care să reiasă gradul de însuşire de către elev
a conţinuturilor predate în limitele stricte ale lecţiei imediat anterioare. Conţinuturile
implicate aici ne apar sub forme multiple, adică: cunoştinţe stăpânite de elevi, dar şi dovezi
ale înţelegerii lor de către elev, capacităţi de prelucrare, aplicare, interpretare, includere în
"sinteze" mai scurte sau mai largi, sau (în dependenţă de vârsta şi experienţa de învăţare a
elevului) chiar de formulare a judecăţilor de valoare corelabile acestor conţinuturi. În această
enumerare trebuie să se recunoască suprapunerea ascultării pe nişte obiective, care la rândul
lor să se repartizeze pe spaţiul unei întregi taxonomii, cea mai la îndemână fiindu-ne
taxonomia lui Bloom (aceasta este şi "etalonul" prezent în toate comentariile americane pe
tema evaluării rezultatelor cognitive ale învăţării).
Durata de 15-25 de minute nu îngăduie audierea a mai mult de 3-5 elevi la disciplinele
socioumane, până la 6-8 la cele reale, iar în condiţii de dotare modernă (de pildă, existenţa
cabinetelor de specialitate înzestrate cu table, dispozitive diverse folosite pentru demonstraţii
etc.) acest număr poate fi chiar mai mare.
CONSTANTIN MOISE

Cât priveşte funcţiile acestui fel de evaluare, plecăm de la premisa că principial se au


în vedere atât o funcţie orientativ-ameliorativă (formativă), cât şi una decizională prin notă
(clasificare). Situaţia concretă nu exclude, însă, schimbarea de accent, acesta putând rămâne
prioritar aşezat pe prima funcţie - cea formativă.
Desfăşurarea concretă a verificării de acest fel s-a instituit treptat după "cutumă",
ajungând azi la încadrarea în nişte algoritmi, consideraţi de cea mai convenabilă optimalitate.
De exemplu, cum se exprimă un autor consacrat în domeniu (I. Radu, 1979 - altul decât I.T.
Radu), foarte obişnuită este "formula" care începe cu o conversaţie frontală succintă, după
care se stabilesc cu precizie conţinuturile de discutat şi sunt numiţi elevii care, "din bancă"
sau "la tablă", vor fi actorii principali ai trecerii în revistă a conţinuturilor proximei lecţii
anterioare. În ce îi priveşte pe ceilalţi, participarea lor este necesară din cel puţin următoarele
motive: să contribuie la un caracter animat şi nuanţat al evaluării; să-şi verifice propria
pregătire prin comparaţie cu principalii chestionaţi (deci să se iniţieze în autoevaluare); să nu-
şi formeze, prin neparticipare, tendinţa de a se înstrăina de lecţie.
Întrebările care se formulează sunt grupate de tradiţie în două categorii: întrebări de
bază (de "pornire") şi întrebări ajutătoare. Odată pusă întrebarea de bază, se consideră ca o
regulă importantă ca elevul să fie lăsat să-şi dezvolte până la capăt răspunsul care i-a fost
solicitat. Dacă rezolvarea este corectă, pot urma eventuale intervenţii de adâncire din partea
clasei; dacă greşeşte, cea mai indicată procedare este aceea de a fi sprijinit să se
autocorecteze; dacă nu reuşeşte, trebuie să intervină ceilalţi; numai dacă şi această încercare
este fără succes, se impune rezolvarea de către educator. Nu se consideră indicată
"dezmembrarea" răspunsurilor elevului, prin intervenţii la fiecare amănunt greşit, pe
parcursul formulării acestora; profitabilă cu adevărat este aprecierea la finele răspunsului,
care să vizeze ansamblul lui şi numai pe acest fond erorile din fiecare parte; procedarea
contrarie ar produce, pe fondul greşelii, şi un fel de bruiaj absolut în mintea elevului,
inducându-i impresia că este incapabil să formuleze un răspuns complet, deci necesitând
obligatoriu tutela educatorului. Tot în rândul regulilor elementare se înscrie aceea că, pentru
aprecierea elevului cu notă, nu este suficientă solicitarea lui chiar şi foarte restrânsă, ceea ce
ar denatura aprecierea, fie în favoarea, fie în defavoarea celui examinat (vezi şi Muster,
Hazgan; Popescu, 1969); în această idee a fost propusă o "notare fragmentară", bazată pe o
evidenţă de amănunt, în "catalogul educatorului", a prestaţiilor parţiale ale elevului, prin
însumarea mai multora trebuind să rezulte o notă "sintetică" (cf. P. Popescu, 1978).
Autorii de teorie pe această temă, arată şi greşelile cele mai frecvente ale începătorilor
(dar, adăugăm noi, nu numai ale lor): fie examinarea doar frontală (prin dialog cu întreaga
clasă, neglijând deci situarea în prim plan a celor care să fie notaţi), fie exagerarea în sens
invers (dialogul doar cu cei "condamnaţi", clasa fiind neglijată); fie insuficienta elaborare a
întrebărilor de bază (de pildă, prin formularea imprecisă, de unde suprapunerea lor şi
generarea de confuzie; prin enunţul lor în prea multe cuvinte şi idei etc.); fie interpretarea fără
discernământ a conceptului de întrebare ajutătoare (de exemplu, în loc să dirijeze elevul spre
reflecţie pentru a se autocorecta, îi pun întrebări formale ca: "Mai departe?"; "Şi?",
"Altceva?", care nu sunt chiar … ajutătoare); fie limitarea ascultării la repovestirea lecţiei
anterioare (deci fără selecţia celor mai semnificative întrebări); fie atribuirea pur formală a
notelor etc.
Pe acest fond şi cu aceste restricţii, trebuie motivată practicarea acestei metode, pe de
o parte, şi surprinse dezavantajele ei, pe de alta. Cât priveşte avantajele, s-ar putea menţiona:
• faptul că uzează de comunicarea directă, îi conferă avantajul de a se putea replia
imediat, asigurând evaluării mersul cel mai convenabil sub aspectul relevanţei şi al
nuanţării necesare; altfel zis, examinatul poate fi solicitat să dezvăluie nu numai ce ştie, ci
şi ce ar mai trebui să ştie; poate fi dirijat fie doar să "puncteze" aspectele care interesează
în prim plan şi să trateze la un nivel analitic mai pronunţat altele, după cum elevul ar
trebui să - şi pună în relief o capacitate sau alta;
• implică un feedback imediat, ceea ce îi conferă virtutea de a informa elevul chiar "pe viu"
asupra nivelului său, din care va decurge şi justificarea eventualei notări; tot din caracterul
imediat al feedback-ului decurge conştientizarea rapidă a elevului asupra direcţiei
eventualei ameliorări, precum şi posibilitatea scurtării perioadei de producere a
ameliorării;
• pentru că se realizează pe secvenţe atât de mici, permite cea mai severă continuitate,
având împletirea cea mai intimă cu procesul de predare şi deci cele mai vizibile valenţe
formative.

La rândul lor, dezavantajele sunt şi ele o realitate, adică:


• confruntarea directă, în ritmul pe care îl pretinde în mod necesar acest fel de verificare, se
însoţeşte de stări emoţionale stresante pentru aproximativ 60% dintre elevi (cf. I. Radu,
1979), ceea ce, prin procedare excesivă numai pe această cale, poate conduce la stări de
veritabilă aversiune faţă de evaluare; este cazul fie al elevilor emotivi, fie al celor cu ritm
lent de activitate;
• ascultarea pe fragmente mici are, la nivelul unor ansambluri de conţinuturi cuprinzătoare,
din principiu o validitate mică;
• fărâmiţarea excesivă face, pe de altă parte, ca notarea să nu fie total concludentă;
• ţinuta orală conduce inevitabil la transparenţă totală; de aici nevoia de a solicita fiecărui
examinat răspuns la alt subiect, ceea ce generează inegalitatea de sarcini;
• verificările de acest fel sunt mari consumatoare de timp.

Cum verificarea orală curentă reprezintă o specie de conversaţie, ea împletindu-se cel


mai strâns cu învăţarea, este necesar ca în limitele ei să fie respectate exigenţele calitative ale
întrebărilor şi răspunsurilor, aşa cum au fost formulate în cursul de Teoria instruirii. În
sprijinul cursanţilor, le reluăm pe scurt. Astfel, întrebărilor li se pretinde:
♦ să fie corect formulate, atât din punct de vedere logic, cât şi gramatical, pentru a fi
înţelese fără efort prea solicitant şi pentru a nu oferi elevului "sugestii" negative de
exprimare sau de gândire;
♦ să fie precise (dacă se introduc prin "cum este?", "cum sunt?", "ce poţi spune despre ?", să
se enunţe şi criteriul (sub ce aspect "cum"; în ce sens să "putem spune"), fiind chiar mai
indicat, în multe cazuri, să renunţăm la astfel de introduceri;
CONSTANTIN MOISE

♦ să aibă concizie convenabilă şi "limită de conţinut" (să nu aibă formulare "dublă" sau
"triplă", cerând mai multe răspunsuri în cadrul aceluiaşi enunţ);
♦ să aibă varietate suficientă de cerinţe, tradusă în varietatea nivelului efortului ce trebuie
depus de elev (întrebări de simplă reproducere, introduse prin "cine", "când", "care",
"unde", "cât"; care pretind explicaţii cauzale, introduse prin "cum", "de ce"; care exprimă
situaţii problematice, introduse prin corelativele "dacă…atunci…?"), ceea ce ar asigura
acoperirea de principiu a tuturor nivelelor taxonomice din domeniul cognitiv;
♦ să i se asigure elevului timpul de gândire necesar, în funcţie de dificultatea fiecărei
întrebări şi prin raportare la individualitatea lui;
♦ să fie evitate sau să fie completate cu cerinţe de justificare a răspunsului întrebările care
solicită răspunsuri monosilabice ("da", "nu");
♦ să fie evitate întrebările voit derutante, sau dacă se folosesc să fie conştientizat elevul
asupra "regulii jocului".

La rândul lui, răspunsul trebuie "îngrădit" de nişte exigenţe nedezminţite, ştiind că


ascultarea constituie, dincolo de verificare, şi o ocazie de exersare a deprinderii elevului de a
dialoga corect şi coerent. Drept urmare:
♦ şi răspunsului trebuie să i se pretindă corectitudine logică şi de asemenea gramaticală,
examinatorul obligând elevul să se corecteze ori de câte ori se abate de la această exigenţă,
indiferent de materia de învăţământ (chiar dacă atunci când se atribuie note, se consideră
că logic ar fi, după mai multe opinii, ca greşelile de formă gramaticală să nu fie
"penalizate" decât la disciplina la care au fost predate şi exersate, în cazul nostru la limba
română);
♦ răspunsul să acopere întreaga sferă a întrebării, exigenţă realizabilă fie prin enumerare
("Care sunt calităţile ale…?" "…sunt următoarele: …"), fie prin exprimarea unei
echivalenţe ("Ce înseamnă validitate de conţinut?". "Validitate de conţinut înseamnă…")
etc.;
♦ să vizeze precis esenţa întrebării, fără colaterale, fără introduceri care consumă timp şi
denaturează răspunsul;
♦ să se conformeze convenţiei stabilite de la început, adică: sunt admise numai răspunsuri
sub formă de comunicări complete, sau şi prin comunicări mai concise, chiar eliptice;
♦ să fie drastic evitate, iar când se ivesc, să fie subliniate şi respinse de către examinator,
formulările fragmentate, trenante, marcate de adaosuri inestetice şi nefireşti în cadrul
comunicării specific umane ("ăăăă…", "îîîîî…"), emisii care pur şi simplu "parazitează"
prestaţia examinatului.

Verificarea orală în lecţii special organizate se poate realiza la intervale variabile, în


funcţie de vârsta elevilor sau de dificultatea temelor vizate. Diferenţa faţă de verificarea în
lecţia mixtă este prezentă şi în planul conţinutului, şi al formei: al conţinutului, constând din
cuprinderea materiei predate în mai multe lecţii anterioare (4-6, după experienţa de învăţare a
elevilor, dificultatea temelor etc.); al formei şi extensiei în timp (putând ocupa în principiu
întreaga durată a orei de clasă şi desfăşurându-se sub forma seriilor de sarcini de rezolvat de
către elevi). În cadrul structurii orientative a acestei lecţii (cu etapele: precizarea temelor de
verificat; verificarea sistematică a conţinuturilor; aprecierea rezultatelor; precizări pentru
viitor, pe baza rezultatelor verificării), locul esenţial îi revine celei de a doua etape menţionate
(cf. I. Roman şi colab., 1970; M. Momanu, 1998). Numărul elevilor ce urmează să fie notaţi
se înţelege că este mai mare, iar combinaţia cu forma scrisă devine mai frecventă, ea fiind
dictată de diversele exigenţe ale verificării în acest context: problemele de rezolvat, analizele,
demonstraţiile concrete, toate văzute ca încheieri aplicative ale demersului teoretic; încât se
impune precizarea că demersul verbal este cel predominant, dar nu exclusiv. Şi efortul de
elaborare a acestei variante de verificare orală este, fireşte, de mai mare anvergură,
presupunând frecvente corelaţii pe fondul temelor incluse, precum şi mai numeroase materiale
didactice implicate în lecţie. Funcţia dominantă, în cadrul acestei forme de verificare, capătă o
altă orientare, prin comparaţie cu ascultarea în fiecare lecţie mixtă: accentul trece mai mult pe
apreciere prin notă.
Avantajele prezentate de această formulă de evaluare, în raport cu precedenta, se
concretizează în:
♦ validitate mai mare, date fiind conţinuturile mai cuprinzătoare; lucrul este firesc, atâta
vreme cât dintr-un conţinut mai larg se pot selecta mai multe teme reprezentative;
♦ notarea este mai concludentă, din acelaşi motiv legat de volumul conţinuturilor; nu poate
avea aceeaşi semnificaţie valorică nota luată la fiecare lecţie mixtă (în partea consacrată
verificării) cu cea dobândită pe baza prestaţiei sintetice, bazată pe conţinutul mai multor
lecţii, ceea ce poate presupune şi efort mai mare de a face corelaţii în cadrul lor.

V.2.1.2. Metode de evaluare în scris


Cum am putut constata din prezentarea metodelor de evaluare pe cale orală, ele nu ar
putea acoperi în nici un caz întreaga varietate de conţinuturi, de situaţii şi de competenţe ce
trebuie să facă obiectul şi ţinta actului evaluativ. De unde necesitatea ca alături de ele să fie
abordate şi puse în valoare seria celor de verificare în scris. Utilizarea lor se motivează prin
nişte argumente de cea mai limpede francheţe. Plecând de la motivul de principiu că omul
trebuie să-şi exprime competenţele şi în scris, exerciţiu pe care şcoala i-l pune sistematic la
îndemână, iată mai jos alte motive care descind din el şi se obiectivează în mai multe
avantaje:
♦ identitatea exigenţelor este argumentul şi avantajul care contracarează inegalitatea
sarcinilor potenţial existentă în toate probele orale; este ceea ce, în cadrul acestora din
urmă, afectează actul evaluativ atât din punct de vedere tehnic, cât şi moral; cum vom
vedea mai departe, identitatea probelor scrise va fi punctul de plecare pentru alte avantaje;
♦ productivitatea mult crescută a probelor scrise (care se poate multiplica chiar şi peste
1000%) este de asemenea un avantaj; este uşor de dovedit acest adevăr dacă socotim că,
de pildă, o lucrare de control de 15-20 minute îmi permite să verific o întreagă clasă de
30-35-40 elevi, timp în care, pe cale orală, aş fi ascultat 3-4 sau cel mult 7-8, în funcţie de
specificul materiei şcolare;
CONSTANTIN MOISE

♦ pornind de la identitatea sarcinilor, devine posibilă comparaţia rezultatelor tuturor


participanţilor, ceea ce deschide perspectiva unei obiectivităţi a notării superioară celei
realizate în urma aprecierii probelor orale;
♦ modul cum trebuie să fie finalizată proba, la rândul său, reprezintă un avantaj tehnic;
plaja de capacităţi şi competenţe puse în relief este mai largă decât în cazul probelor
orale: elevul trebuie să probeze capacitatea de elaborare a unei lucrări, ceea ce presupune
efort de analiză, sinteză, interpretare, dozare în timp a sarcinilor, adică etalarea unei mai
mari complexităţi de rezultate, ele putându-se extinde pe toate nivelele taxonomiilor
cognitive;
♦ însuşi suportul material al probei (hârtia) constituie garanţia transparenţei şi revenirii, în
caz de necesitate, asupra fiecăreia dintre probe; concret, rezultatele astfel înregistrate se
pot păstra mai mult timp, putând fi fie controlate, fie recorectate, cu atât mai mult cu cât
există posibilitatea comparării;
♦ aceeaşi natură materială a suportului utilizat, împreună cu posibilitatea comparării
lucrărilor, vor îngădui evaluatorului să identifice erorile comune mai multor elevi, între ei
chiar elevi de nivel constant-superior; aceasta va reprezenta indicatorul de evaluare a
propriei munci şi totodată punctul de plecare spre îmbunătăţirea ei;
♦ timpul de gândire mai cuprinzător şi ritmul neimpus prin presiunea întrebărilor (prin
comparaţie cu probele orale) reprezintă un ajutor pentru cei timizi sau cu un ritm mai lent
de elaborare, să -şi poată realiza performanţele proprii la nivel convenabil.

Toate aceste avantaje trebuie văzute în corelaţie cu cele câteva dezavantaje


contracarate prin folosirea probelor orale, deci care constituiau avantajele acestora din urmă,
adică: lipsa feedback-ului imediat, lipsa întăririi pozitive încurajatoare, lipsa posibilităţii de
împletire riguroasă a evaluării cu învăţarea prin dirijarea dialogului etc.
Există mai multe variante de probe scrise, fiecare avându-şi locul şi funcţia ei
dominantă, care este dependentă atât de extensia probei, cât şi de împrejurarea concretă în
care se foloseşte.

PROBA SCRISĂ CURENTĂ TRADIŢIONALĂ (lucrare de control, la clasele mici, extemporal, la


clasele şcolii secundare) alternează de câteva ori pe an cu chestionarea orală, îndeplinind,
principial în măsură egală, funcţia de consemnare prin notă a achiziţiilor elevului şi
funcţia de orientare continuă a acestuia asupra propriului nivel, care se finalizează în plan
formativ. Rosturile ei, distincte de ale celorlalte probe scrise, se sintetizează în:
♦ menţinerea permanentă a elevului în activitate de învăţare sistematică, tocmai prin
frecvenţa neprevăzută a acestei probe, ceea ce îl ajută să-şi însuşească şi consolideze în
ritm omogen conţinuturile învăţate;
♦ contribuţia acestei probe la interpătrunderea pe secvenţe mici a învăţării cu evaluarea,
determinând astfel un progres continuu şi precis al capacităţilor elevului;
♦ semnalarea, de asemenea continuă şi în timp util, a minusurilor existente în repertoriul
achizitiv al elevilor, fie în plan informaţional fie mai ales în cel al deprinderii de
exprimare în scris; li se oferă astfel şansa de remediere, înainte de a se fi acumulat o
cantitate greu surmontabilă.

Cel puţin următoarele exigenţe însoţesc proba scrisă curentă:


• subiectul să se justifice fie prin caracterul său reprezentativ (să nu se reducă la un
amănunt neimportant, prin care profesorul pretinde că ar controla "minuţiozitatea"
pregătirii elevului), fie prin cel formativ;
• modul de administrare a probei să fie complet elaborat înainte de intrarea în clasă,
pentru a nu se consuma din timpul destinat efectuării (se stabileşte, de pildă, dacă este
cazul să se dea subiecte pe numere diferite, în care caz trebuie reflectat asupra unor
subiecte de dificultate identică; se elaborează strict explicaţiile necesare privind
rezolvarea, instrucţiunile privind instrumentele de lucru şi eventualele surse de informare
permise, precum şi obiectele "prohibite";
• punctajul aferent fiecărui subiect să le fie comunicat examinaţilor, pentru a-şi doza
energia pe măsură (împotriva procedării nepedagogice de a ţine secret acest punctaj până
după efectuarea probei); D. Muster, cunoscut cercetător docimolog, afirmă: "Punctajul
poate fi anunţat, spre a fi cunoscut dinainte şi a-i stimula pe candidaţi, în orice caz spre a-i
determina să-şi organizeze munca în modul de valorificare cel mai favorabil" (cf. 1970,
p.103);
• cum probele scrise tradiţionale se înscriu de regulă în tipul "compunere", fiind notate prin
una dintre metodele "subiective" (de exemplu, prin impresia globală, scara de specimene,
determinarea frecvenţelor, metoda analitică) (cf. De Landsheere, 1975, pp.110-148; vezi
mai departe la tema "Notarea"), corectura poate deveni cu adevărat utilă numai dacă se
foloseşte un ghid, alcătuit dintr-o simbolistică sui generis, care să asigure interpretarea
unitară a calităţilor şi tarelor fiecărei lucrări (de pildă, semn-simbol pentru eroare de fond,
eroare de ortografie, caracter incomplet etc.);
• intervalul dintre efectuarea probei şi comunicarea rezultatelor, după corectură, să fie pe
cât posibil mai scurt (ideal ar fi chiar în lecţia imediat următoare), pentru ca elevul să nu fi
"ieşit" din atmosfera prilejuită de proba de verificare dată; întârzierea prea mare ar cauza
anularea până la totalitate a efectului educativ al lucrării în cauză.

TEZA (fostă trimestrială, azi semestrială) este proba scrisă periodică tipică pentru
învăţământul nostru secundar. Este probă cu funcţie dominantă de decizie prin notă asupra
certificării capacităţilor şi competenţelor elevului, precum şi asupra locului acestuia în
ierarhia grupului din care face parte. Funcţia orientativ-ameliorativă nu este total absentă,
putând fi considerată "implicită" şi fiind interpretabilă ca exerciţiu de organizare şi exprimare
scrisă monologată a propriilor cunoştinţe acumulate, în perspectiva confruntărilor evaluative
cele mai cuprinzătoare (examen final, examen de admitere etc.). Ponderea ei în cadrul deciziei
a fost variabilă: 50% din medie, când a fost trimestrială, 25% de când se foloseşte semestrial,
fără a se fi formulat o motivaţie a acestei schimbări.
Avantajele speciale ale tezei semestriale (adăugate celor comune tuturor probelor
scrise, menţionate mai sus) se pot sintetiza după cum urmează. Mai întâi, că, prin comparaţie
CONSTANTIN MOISE

cu probele curente, ea poate asigura o validitate mai mare, dat fiind că pe o "masă" de
conţinuturi de pe un semestru întreg se poate identifica mai clar eşantionul cel mai
reprezentativ de conţinuturi de verificat. Apoi, că, pe baza ei, notarea este mai concludentă.
Globalitatea ei mai accentuată poate fi considerată prin sine tot un avantaj, oferind şi
educatorului oportunitatea de a-şi aprecia randamentul propriei munci pe porţiuni mai mari
de conţinuturi.
Ceea ce teza are deficitar este posibilitatea redusă ca feedback-ul pe care îl oferă să
fie valorificat în amănunt în optimizarea procesului de instruire.
Tot spre deosebire de verificările scrise curente, teza implică nişte exigenţe specifice
(vezi P. Popescu, 1978, p. 101 urm.; I. Roman şi colab., 1970; P. Popescu, I. Roman, 1980).
Una dintre ele se referă la necesitatea existenţei unor activităţi destinate anume pregătirii ei,
constând fie din recapitulare imediat anterioară, fie din "punctări" în cadrul verificărilor la
sfârşit de capitol, având trimitere specială la ea. Rigoarea acestei pregătiri trebuie să fie cu atât
mai stringentă cu cât am avea a face cu elevi de clase secundare mici, deci care se află în faza
de iniţiere în această modalitate de exprimare. Altă exigenţă vizează formularea subiectelor.
Potrivit aceloraşi surse menţionate mai sus, subiectele de teză ar putea fi formulate în diverse
maniere, cu condiţia ca ele să se adapteze la experienţa de învăţare a elevului:
 subiecte-titluri de lecţie, "la începerea studierii unei discipline, ele contribuind la însuşirea
vocabularului şi noţiunilor corespunzătoare necesare redactării lucrărilor de sinteză";
 subiecte de sinteză, al căror loc "se cuvine să fie în fruntea preferinţelor", ele oferind
forma cea mai convenabilă de valorificare de către fiecare elev a propriului potenţial
intelectual;
 subiecte multiple (alcătuite, de pildă, din: o enumerare + o definiţie + aprecierea
corectitudinii sau incorectitudinii modului de formulare a unei idei + interpretarea unui
citat scurt + rezumarea unui articol), "succesul" lor în faţa candidaţilor bazându-se pe
varietatea solicitărilor şi pe posibilitatea de abordare la mai multe nivele;
 subiecte reprezentând tematica unui capitol (de exemplu, 4-6 subiecte, în ordinea
expunerii în capitol), vizând redarea rezumativă a unei părţi sau a capitolului întreg. Cu
sau fără rezerve, potrivit sondajelor noastre în şcoli, această gamă de subiecte este
promovată în măsuri variabile cu toate componentele ei. Lucrul este firesc, ştiut fiind că şi
în examinări cu caracter global se practică aproximativ aceleaşi variante.
Odată cu propunerea tipurilor de subiecte de teză, autorii citaţi formulează şi motivări
specifice pentru fiecare tip. Astfel, se consideră că subiectele-titluri îşi pot exercita valoarea
formativă dacă sunt alese în aşa fel încât să solicite elevilor nu numai abilităţi de reproducere,
ci şi "capacităţi intelectuale superioare"; subiectele de sinteză, la rândul lor, trebuie să fie
precedate de iniţierea elevilor în abordarea lor, pe baza modelelor prezentate de profesor;
subiectele multiple, ca şi cele axate pe conţinutul tematic al unui capitol sunt practicabile cu
succes numai dacă: sunt concepute astfel încât să fie rezolvabile în timpul rezervat tezei;
dificultăţile pe care le conţin sunt ordonate gradat, deci fiecare elev le poate aborda până la un
punct, altfel riscându-se descurajarea unei părţi dintre examinaţi.
Între tipurile de subiecte de teză, trebuie să le cităm şi pe cele aparţinând stilului nou
de formulare, potrivit cu mersul reformei. Ele descriu o linie de adaptare generală a probelor
scrise la structura testului docimologic, rezultând astfel veritabile stocuri de modele de
subiecte pentru fiecare materie de învăţământ (cf. A. Stoica, I. Neacşu, coord., 1996; vezi, de
asemenea, toate lucrările care conţin aceste noi modele, în cadrul titlului alocat examenului
scris).
Şi între exigenţele tezei putem specifica necesitatea comunicării punctajelor
eventualului barem de notare, cum am menţionat în cazul lucrărilor scrise curente.

APLICAŢIE
Consultând (în acest curs, mai jos) tema "Testul docimologic", stabiliţi din ce constă tendinţa
de "mulare" a subiectelor de teză pe modelul acestui test.

Verificarea la sfârşit de capitol. Ultimele decenii au scos la iveală o metodă aparte de


verificare în scris (completată, după caz, cu varianta orală), anume evaluarea la sfârşitul
fiecărui capitol, cu excepţia acelora care coincid cu perioada tezelor. Este probabil ca metoda
să fi fost promovată, la iniţiativa fiecărui educator, şi mai înainte de această perioadă, dar cert
este că în anii ’70 devenea temă de cercetare pe bază de experiment (cf. P. Popescu, lucr. cit.;
de asemenea I. Roman, P. Popescu, 1980, p.116 urm.). Rezultatele experimentului şi
popularizarea care I se făcea avea să determine extinderea ei, fără să fie impusă prin
reglementări formale. Rezumativ, aplicarea acestei variante de evaluare se integra în
următoarea procedare: stabilirea, de la începutul anului, a ciclurilor de lecţii corespunzătoare
fiecărui capitol, odată cu conştientizarea elevilor asupra naturii fiecărei lecţii (lecţie
introductivă, de predare, de exersare, de recapitulare, de încheiere prin verificare scrisă
obligatorie); dialogul profesor-clasă de la începutul fiecărei lecţii să urmărească nu numai
ascultarea cu scop de verificare, ci mai ales felul cum elevii fac legăturile necesare în cadrul
capitolului în care se încadrează lecţia (întrebările fiind adresate şi de către elevi
profesorului); participarea la verificare în fiecare lecţie să fie evidenţiată chiar şi pe
"subunităţi" de răspuns ale fiecărui elev, în "catalogul profesorului" (un caiet special destinat
acestor notări parţiale, din care se va compune la un moment dat o notă şi se va consemna în
catalogul oficial al clasei); prestaţia slabă din cadrul dialogului iniţial nu se notează, pentru a
nu descuraja elevii să participe în număr cât mai mare; data lucrării scrise la sfârşit de capitol
se cunoaşte, astfel că fiecare elev o vizează pe tot parcursul predării; în cazul că un elev nu se
consideră "apt" pentru probă, atunci când este programată, are dreptul să o reprogrameze.
Motivaţia folosirii acestei probe se află în avantajele pe care le dovedeşte:
 asigură omogenitatea însuşirii materiei şi ritmul cel mai convenabil al învăţării, dată
fiind regula ca elevul să aibă notă la fiecare capitol şi conştientizarea lui asupra acestui
fapt;
 asigură caracterul sistematic şi temeinic al pregătirii, date fiind legăturile realizate
lejer în fiecare parte de conţinut studiată;
 are un foarte vizibil caracter formativ, putând constitui un antrenament al elevului în
vederea confruntărilor mai cuprinzătoare, adică făcând trecerea, fie spre exprimarea unor
conţinuturi de dimensiunea tezei semestriale, fie mai ales spre capacitatea de a face faţă
unui examen, în cazul că materia respectivă nu este prevăzută cu teză;
CONSTANTIN MOISE

 realizează o diagnoză precisă, fiind posibil de constatat, pe secvenţe concrete, care


sunt părţile tari şi cele slabe ale fiecărui elev;
 înlătură stările afective defavorizante pentru elev şi pentru desfăşurarea optimă a
procesului didactic, adică frica şi aversiunea faţă de acest proces, datorate nestăpânirii
corelaţiilor din fiecare dintre structurile lui alcătuitoare;
 determină optimizarea relaţiei profesor - elev: elevul nu se mai consideră "pândit" de
profesor să fie verificat şi notat când nu este pregătit, iar profesorul beneficiază
permanent de sprijinul elevului, atât pe parcursul predării, cât şi în privinţa planificării şi
pregătirii lucrării finale;
 însăşi transparenţa rezultatelor în faţa organelor de control şi a altor factori interesaţi
este net îmbunătăţită.

Rămâne ca singur şi mare inconvenient volumul de muncă pe care această procedare îl


pretinde din partea profesorului. Este şi motivul semnului de întrebare asupra extinderii ei în
terenul practicii didactice largi, în urma experimentării şi popularizării pozitive care i s-a
făcut.

V.2.1.3. Verificarea practică, atât curentă cât şi periodică, îşi are motivaţia fie în
natura conţinuturilor, cum este cazul educaţiei fizice, sau educaţiei artistice, sau educaţiei
profesionale în toate specialităţile ei; fie în necesitatea constatării exprese a efectelor
formative în plan "instrumental" ale instruirii, pentru partea aplicativă a celor mai diverse
materii de învăţământ: fizica, biologia, chimia, studiul limbii materne sau al limbilor străine,
enumerarea putându-se extinde asupra mai tuturor. Obiectul evaluării poate să fie, în măsură
egală, produsul activităţii elevului sau însuşi modul de organizare şi "execuţie" de către acesta
a activităţii în cauză. Potrivit lucrărilor pedagogice în materie (vezi Ausubel şi Robinson, lucr.
cit., p. 694 urm.), am putea alcătui o listă foarte cuprinzătoare de astfel de probe: lucrările de
laborator, activitatea clinică medicală, probele practice profesionale, rapoartele de cercetare şi
actul de cercetare însuşi, desenele de tot felul (afectând disciplinele chiar şi cu pronunţat
caracter teoretic), probele sportive şi muzicale, creaţiile artistice şi tehnice, probele de
utilizare optimă a instrumentelor, inclusiv a instrumentelor de informare şi prelucrare a
informaţiei, între care, în vremea noastră, calculatorul devine pe zi ce trece "cap de afiş". În
practica evaluativă actuală sunt denumite şi prin expresia "studiu de caz", luând numele uneia
dintre metodele utilizate în învăţare, cu care prezintă similitudini marcante. Acest gen de
probe pot îndeplini, după caz, toate funcţiile actului evaluativ: de feedback şi de orientare a
învăţării, când au loc prin alternare secvenţială cu predarea; de certificare, ierarhizare,
selecţie, diagnoză, prognoză, când fac determinări de mai mare globalitate. Dincolo de
acestea, ele pun în evidenţă şi achiziţii în sfera trăsăturilor de personalitate: "flexibilitate,
inventivitate, perseverenţă, creativitate", dovedindu-se "mult mai valide decât examinările
prin întrebări şi răspunsuri" (ibidem).
Dezavantajele pe care le presupun se obiectivează mai ales în: consum mare de timp şi
fonduri; necesitatea de extensie în spaţiu, greu de realizat pentru unele dintre acestea; marea
dificultate de eşantionare pentru o parte dintre ele (de pildă pentru probele medicale, în care
examinarea se face pe "cazuri" diferite), ceea ce generează şi dificultăţi de cotare exactă
(ibidem).
Din prezentarea de mai sus a caracteristicilor fiecărui tip de probe, cu virtuţile,
aplicabilitatea specifică şi insuficienţele fiecăruia, rezultă clar complementaritatea lor. Ceea
ce unele prezintă ca valoare certă, altora le lipseşte, rezolvarea realizându-se prin folosirea în
completare sau prin alternare a celorlalte. Altfel spus, chiar dacă nici unele nu sunt infailibile,
toate pot să-şi acopere insuficienţele prin apel la celelalte.

V.2.1.4. Examenul ca probă cu caracter global


În ciuda tuturor protestelor care s-au exprimat din partea elevilor şi părinţilor (vezi
De Landsheere, 1975, p. 17 urm.), examinarea cu caracter global rămâne o probă necesară,
atât în varianta scrisă, cât şi orală, iar în unele situaţii şi în ipostaza practică. Motivaţia acestei
decizii se focalizează în jurul validităţii mai mari a acestei probe, prin comparaţie cu cele de
cuprindere mai limitată, precum şi al caracterului net mai relevant pe care îl asigură notării;
lucru normal, dacă ea vizează stăpânirea de către elev a unor conţinuturi atât de extinse şi a
unor capacităţi pe măsură. Dar mai trebuie observat că aceste calităţi nu vin de la sine, ci
depind, fireşte, de efortul proiectanţilor şi al examinatorilor de a contura şi desfăşura proba
după reguli cu adevărat ştiinţifice.
În sistemul nostru şcolar actual, probele globale sunt legate în principal de examenele
finale, respectiv de bacalaureat şi de examenul de finalizare a ciclului gimnazial.

PROBELE SCRISE DE EXAMEN. Cum bine se ştie, conceperea lor nu mai cade în sarcina
fiecărui profesor pentru elevii săi, aceasta fiind realizată pe plan central şi în forme care se
metamorfozează treptat pe linia modernizării. Este ceea ce a făcut ca în ultimii ani să asistăm
la o continuă tatonare, pentru instituirea celor mai viabile soluţii, atât de proiectare cât şi de
administrare. Profesorul nu trebuie să rămână însă în expectativă absolută. Pentru ca elevul să
poată face faţă acestei dinamici, profesorul trebuie să-l orienteze, iar orientarea să fie "mulată"
pe noile structuri, aşa cum sunt propuse în mulţimea de ghiduri de evaluare care "stochează "
un adevărat univers de subiecte de examen scris (vezi, de pildă: C. Niţă, coord.,1999;
G. Chirleşan, coord., 1999; R. Doicescu, coord., 2001; B. Vîlceanu, coord., 2001), sau cum
sunt administrate în cadrul simulărilor pe plan naţional. Drept urmare, chiar dacă nu el
formulează subiectele de examen, le poate analiza pe cele difuzate, iniţiind elevul în
abordarea lor, ceea ce este posibil chiar şi prin nuanţarea subiectelor tezei semestriale pe linia
acelor modele. De pildă, cum azi se tinde spre "turnarea" tipurilor tradiţionale de subiecte în
"tipare" proprii itemilor de test (vezi mai departe, la tema despre teste, tipurile de itemi),
urmează ca şi subiectele de teză trimestrială, de verificare curentă sau de recapitulări speciale,
înainte de examen, să adopte treptat aceeaşi ţinută. Aceasta ar veni realmente în sprijinul
elevului în acţiunea de pregătire a examenului, în termenii reformei şi în circumstanţa
generalizării examinării "externe" (adică cu examinatori din afara şcolii).
Problemele pe care le-au pus până în prezent examenele şi despre care profesorii în
general îşi pot exprima opinia sunt legate atât de proiectarea şi administrarea probelor, cât şi
de realizarea corecturii şi notării. Disfuncţiile proiectării şi administrării pot rezulta mai ales
CONSTANTIN MOISE

din lipsa cunoaşterii foarte bune, de către managerii examenului, a relaţiei dintre conţinuturile
pretinse la examen şi profilul de şcolarizare vizat, de unde eventualitatea administrării
improprii a subiectelor, prin raportare la aceste profiluri (s-au citat cazuri, de pildă, în care, la
clase cu profil umanist, s-au dat subiecte de matematică proprii claselor de profil real). De
aici, sugestia ca în echipele centrale de formulare şi administrare să fie cooptaţi şi profesori
din reţeaua practică, pentru toate specializările. La rândul lor, corectarea şi notarea sunt şi
rămân dificile la nivel naţional, dată fiind natura subiectivă a multora dintre probe şi deci şi a
modalităţii de notare. Sugestia ar fi, în această privinţă, să se elaboreze din timp mai multe
variante de scheme de notare, făcând posibilă flexibilitatea alegerii uneia sau alteia dintre ele,
după cum ar indica un prim sondaj de corectură (adică o corectură iniţială "de probă", asupra
unui eşantion de teze, pentru a vedea dacă în ele se regăsesc criteriile baremului de notare; în
cazul că nu se regăsesc, să fie revizuiţi conform cu cei rezultaţi după sondaj) (vezi şi
A. Stoica, coord., 2000, p. 85).
Dacă se doreşte cu adevărat ca statutul examenului, cu deosebire a celui scris, să se
îmbunătăţească, conceptorii lui ar avea la îndemână un ghid de elaborare destul de
concludent, pe care De Landsheere îl propune, pe următorii paşi: precizarea scopului
examenului (fie prognostic, fie diagnostic, fie "inventar") şi a obiectivelor lui (pe o schemă
taxonomică dată, de pildă cea a lui Bloom, precum şi pe specificul disciplinei vizate);
elaborarea concretă a probelor de examen (a "întrebărilor", cum le denumeşte Landsheere);
experimentarea probelor prin aplicări multiple, premergătoare examenului (ceea ce şi la noi
se încearcă, prin deja cunoscutele "simulări"); finalizarea probelor, după ce prin
experimentare li s-a stabilit validitatea, fidelitatea, dificultatea, capacitatea de discriminare
(vezi De Landsheere, 1975, p. 55 urm.).

PROBELE ORALE DE EXAMEN. Îşi au, şi ele, specificul şi problemele lor, pe care profesorul,
în calitatea sa de examinator, trebuie să le cunoască. Interesează, în plan esenţial, cum va
aborda actul examinării, văzut atât sub aspect tehnic, cât şi psihologic şi etic. Sub aspect
psihologic, de pildă, este foarte clar justificabil faptul ca, imediat după extragerea biletului de
examen, examinatorul să lămurească împreună cu examinatul ce anume pretind subiectele de
pe bilet, prevenind eventualele confuzii, consumatoare de timp şi prejudiciante pentru
candidat. Apoi, a permite candidatului să abordeze subiectele în ce ordine doreşte este foarte
firesc, reprezentând pentru el un sprijin moral, dacă admitem că tot în limitele normalului este
ca nu toţi cei examinaţi să răspundă foarte bine la toate subiectele. În lipsa acestei permisiuni,
cei timizi, dată fiindu-le sensibilitatea naturală mai accentuată, pot aluneca chiar situaţii de
"criză", obiectivate în blocaj (sau plâns, la fete), ambele putând compromite întreaga
performanţă.
Cât priveşte desfăşurarea ascultării propriu-zise (cf. I. Roman şi colab., 1970), ea
trebuie să respecte în principiu aceeaşi regulă ca în cazul ascultării curente, adică: să se evite
fragmentarea răspunsului prin intervenţii frecvente pe parcursul formulării acestuia,
aprecierile, corecturile trebuind făcute, iar întrebările suplimentare puse, la încheierea
rezolvării fiecărui subiect (cu excepţia doar a situaţiilor când examinatul comite confuzii care
pur şi simplu anulează răspunsul).
PROBELE PRACTICE DE EXAMEN. Desfăşurarea lor este foarte diversificată, în funcţie de
fiecare specialitate în care se organizează. Lucrul de principiu de care trebuie să se ţină seama
este respectarea unei serii de exigenţe, aplicabile în măsură egală probelor practice în general,
fie de mai mică sau mai mare anvergură. Aceste exigenţe se rezumă astfel (Ausubel şi
Robinson, lucr. cit., p. 695; de asemenea, Roman şi colab., 1970, p. 300):
 probele să exprime cazuri tipice şi să se asigure uniformitatea lor pentru toţi cei examinaţi;
 criteriile fiecărei performanţe să fie bine precizate dinainte, în sprijinul îmbunătăţirii
cotării probelor;
 examinatorii să precizeze şi să dezbată anticipat trăsătura de personalitate şi deprinderea
ce vor fi evaluate şi distribuite pe scala de apreciere;
 pentru contracararea efectului halo (vezi efectul halo, în cadrul temei privind abaterile de
la notarea corectă), aprecierea să nu se facă pe întreaga probă odată pentru toţi
examinaţii, ci pe fiecare item pe întreg grupul (de exemplu, dacă proba are 5 itemi şi este
susţinută de 10 candidaţi, se apreciază: primul item la toţi 10, al doilea item la toţi 10
ş.a.m.d.), în acest mod fiind posibilă comparaţia pe fiecare secvenţă.

V.2.2. Testul docimologic ca metodă de evaluare

V.2.2.1. Teste psihologice şi teste docimologice: definiţii, delimitări, tipuri


În ultimele trei decenii, în teoria şi practica evaluării din ţara noastră şi-a făcut intrarea
şi şi-a consolidat continuu statutul un anumit tip de test: cel docimologic, denumit în unele
surse si test de cunoştinţe, sau test pedagogic (vezi Muster, 1970; de asemenea, A. Stoica,
coord., 2001), sau test de randament (cf. I.T. Radu, 2000, p. 240). Trebuie să recunoaştem,
însă, că suflul nou pe care l-a adus cu sine nu este total lipsit de ambiguităţi, fiind în
continuare necesare noi precizări.
Pentru definirea testului în general şi a celui docimologic în special, calea etimologică
nu ne este de ajuns, căci faptul că în limba engleză cuvântul test înseamnă probă nu ne
sugerează un sprijin relevant în acest sens. În consecinţă, vom porni de la definiţia logic-
aristotelică a testului psihologic în general, formulată de către Asociaţia Internaţională de
Psihotehnică, astfel: testul "este o probă definită, implicând o sarcină de îndeplinit, identică
pentru toţi subiecţii examinaţi, cu o tehnică precisă de apreciere a succesului sau eşecului,
precum şi pentru notarea numerică a rezultatului" (cf. H. Pieron - coord., Vocabulaire de la
Psychologie, P.U.F., Paris, 1968, apud L. Gavriliu, 1969). Definiţia trebuie completată cu
precizările: "sarcina poate presupune o punere în aplicare a cunoştinţelor achiziţionate (teste
pedagogice), fie a funcţiilor senzorial-motrice sau mintale (teste psihologice)" (Ariane
Lussato, apud A. Stan, 2002, p.106). Testul se compune din articole sau teme sau întrebări ce
trebuie rezolvate de către cel examinat, denumite itemi şi fiind cotate cu punctaje riguros
precizate (scoruri), prin totalizarea, analiza, compararea, etalonarea cărora se conchide asupra
performanţei realizate de cel examinat.
Iată, într-o viziune foarte rezumativă, categoriile de teste psihologice, stabilite după
criterii diverse şi autori diferiţi şi prezentate în perechi "opozitive", din care să constatăm
interferarea lor cu cele docimologice (cf. A. Stan, lucr.cit., p.111 urm.):
CONSTANTIN MOISE

 psihometrice, nepsihometrice (după gradul de standardizare);


 individuale, colective (după numărul examinaţilor simultani);
 tip creion-hârtie, de reacţie verbală, de manipulare şi prelucrare a materialelor, teste pe
display, teste aparative (după "mediul informaţional al testului");
 verbale, nonverbale (după forma de exprimare);
 unidimensionale, multidimensionale (după cuprinderea uneia sau mai multor variabile
psihologice);
 de rapiditate (speed test), de nivel (power test sau level test), după calitatea prioritar vizată
la cel examinat;
 de aptitudini (aptitude test), de achiziţie (achievement test), primele vizând performanţa
posibilă, ultimele referindu-se la performanţa realizată la finele unui act de învăţare
şcolară;
 teste normative, teste ipsative (după elementul de referinţă: grupul, la prima categorie
menţionată; examinatul însuşi, la a doua);
 formale, informale (după rigoarea exigenţelor de interpretare a răspunsurilor la itemii
testului).

Atributul "docimologic", ataşat unei categorii de teste utilizate în şcoală, face


trimitere la specificul acestei categorii, adică la folosirea lor ca instrumente ale examenului
şcolar (atributul citat fiind derivat din grecescul dokime = probă de examen). Deosebirea
acestei categorii faţă de testul psihologic văzut în general este, aşadar: în timp ce cel
psihologic vizează, în interesul cercetării, constatarea unor însuşiri "date" (existente) la un
moment dat, cel docimologic constată rezultatele procesului de învăţare, rezultate care fie
vor fi convertite în note şcolare, fie vor constitui premisele unor măsuri ameliorative în
sprijinul elevilor în activitatea de învăţare. Consacrarea termenilor emanaţi din acest etimon
(dokime) se datorează lui H. Pieron, considerat fondatorul docimologiei.
Având la îndemână lista de mai sus a testelor psihologice, care ne va folosi pentru
eventuale comparaţii, încercăm mai jos să constituim un tablou, cât mai apropiat de unul
complet, al testelor utilizate în evaluarea şcolară, pe fondul căruia să-l delimităm pe cel
docimologic.
Ca punct de plecare, vom folosi opiniile şi enumerarea aparţinând lui Gronlund, care
consideră că testele pot fi folosite în şcoală pentru determinarea aptitudinilor, achiziţiilor,
atitudinilor şi "pot fi clasificate după trăsăturile lor tehnice în următoarele tipuri
contrastante: orale şi scrise; informale şi standardizate; obiective şi eseu; de stăpânire, de
sondaj, diagnostice; individuale, colective; de performanţă, verbale, nonverbale; de viteză
(speed), de nivel (power)" (cf. Gronlund, lucr.cit., p.25).
Adăugând analiza opiniilor lui De Landsheere (1975), ale lui Bloom şi colaboratorilor
(1971), sugestiile altor autori români (vezi I.T. Radu, 2000; Stoica, 2001; Cucoş, 2002) şi
ideea criteriilor multiple, adoptată de toţi cei menţionaţi, putem constitui următoarele
categorii de teste şcolare, tot în cupluri "contrastante":
 teste formative vs. teste sumative, după scopul lor (autori de referinţă: B. Bloom,
J.T. Hastings, G.F. Madaus, 1971, p. 60 urm., 116 urm.); primele, aplicate curent sau
periodic, au scopul de a determina nivelul şi mai ales deficitul elevului şi de a-l orienta în
procesul învăţării; ultimele, aplicate pe secvenţe mai mari (capitole, semestre) sau pe
ansambluri semnificative (an şcolar, ciclu de învăţământ), au ca scop notarea şi
clasificarea elevilor (vezi şi A. Stoica, 2001, p.77);
 teste obiective vs. teste eseu, după modul de prezentare a răspunsului şi după posibilitatea
de notare exactă (autor de referinţă: Gronlund, lucr.cit.); primele solicită şi permit
răspunsuri strict identice, precum şi notare exactă; ultimele implică răspunsuri formulate
diferit de fiecare candidat, iar corectura şi notarea au, de asemenea, o doză de
subiectivitate; variantă actuală: teste obiective vs. teste subiective (cf. Stoica şi colab.,
2001);
 teste iniţiale, teste de progres, teste finale (după criteriul timp, care corelează obligatoriu
cu volumul conţinuturilor evaluate şi scopul urmărit); primele, practicate înaintea
începerii unui program şcolar, trebuie" să furnizeze date despre cunoştinţele şi abilităţile
elevului raportate la exigenţele noii etape de parcurs, având scop prognostic şi diagnostic
(cf. I.T. Radu, 2000, p. 241), iar o variantă a lor fiind testul de plasament, adică de
încadrare a elevilor în programe care le sunt compatibile sau necesare (Stoica, lucr.cit.,
p. 78); următoarele, cu tentă diagnostică, sunt utilizate pe parcursul programului de
instruire, în interesul reglării acestuia (I.T. Radu, idem); ultimele, folosite la încheierea
unor secvenţe însemnate ale programului (ibidem), sau la finele programului întreg
(Stoica, lucr. cit.);
 teste elaborate de profesor (teacher made tests) vs. teste standardizate (după rigoarea
elaborării şi administrării), al căror model îl întâlnim începând tot cu Gronlund; primele
pot apărea în forme fără mari pretenţii de formalizare şi se folosesc în cadrul evaluării
interne, nefiind concludente în afara grupului (clasei) pentru care autorul lor le-a
conceput; ultimele menţionate sunt concepute după norme riguros formalizate, sunt
experimentate şi etalonate pe eşantioane de elevi foarte cuprinzătoare, sunt administrate şi
notate după norme identice (vezi cele trei identităţi care le caracterizează: identitate de
conţinut, de condiţii de aplicare, de criterii de apreciere - după I.T. Radu, 1981,
pp.224-225);
 teste de achiziţii vs. teste de aptitudini (după felul conţinuturilor evaluate); cum spune
însăşi denumirea, primele vizează conţinuturi dobândite printr-un proces şcolar
(cunoştinţe şi abilităţi), având şi alte variante de denumire: teste de cunoştinţe (cf. Stoica,
idem), sau teste de randament, sau docimologice (cf. I.T. Radu, 1981; idem, 2000);
ultimele se referă dezvoltarea subiectului testat (la zestrea lui psihologică din acel
moment) fără a corela aceasta cu o anume activitate de învăţare (altă variantă de
denumire: test de "randament posibil", după I.T. Radu, 2000);
 teste normative vs. teste criteriale (după entitatea care serveşte ca reper a evaluării), ideea
acestor tipuri provenind de la Bloom şi De Landsheere şi fiind legată de teoria despre
evaluarea criterială şi despre evaluarea normativă, prezentă în concepţia acestor autori
(vezi G. Meyer, 2000, pp.25-26); primele compară performanţele elevului numai cu
obiectivele instruirii; ultimele folosesc ca referinţă atât obiectivele instruirii cât şi
CONSTANTIN MOISE

performanţele grupului în care se încadrează cel testat (de pildă, elevul X, care a realizat
performanţa Y, ce loc ocupă în clasa sa, în rândul celor promovaţi).

Cele două inventare sumare de mai sus, adică de o parte cel al testelor psihologice, iar
de alta cel al testelor utilizate în scopuri evaluative în şcoală, ne oferă sprijinul de rigoare
pentru formularea unor consideraţii clarificatoare.
Cea dintâi constatare care se impune este aceea că, în destule cazuri, tipurile propuse
de pedagogii evaluatori urmează modelele formulate de psihologi. Să se pună alături, de
exemplu, tipurile: teste formale vs. teste informale, sau psihometrice vs. nepsihometrice,
propuse de psihologi, cu cuplul: teste construite de profesor vs. teste standardizate, după
pedagogi, şi se va dovedi comunitatea de "tipare" între categoriile din sfera evaluării şi cele
ale cercetării psihologice; de asemenea, cuplul teste normative vs. teste ipsative, din
psihologie, şi cel al testelor criteriale vs. normative, din teoria evaluării; să se ia în
considerare conceptele "speed test", "power test"; teste de achiziţie vs. teste de aptitudini,
menţionate la fel în ambele domenii, conducând la aceeaşi concluzie. Să se ţină seama, însă,
şi de eventualele nuanţări ale acestor tipuri, care sunt încadrate diferit în unele cazuri (de
pildă, psihologii, care au primul cuvânt de spus, concep inteligenţa ca pe o aptitudine, în timp
ce pedagogii o interpretează altfel; categoriile: speed test, power test nu sunt explicate
complet; titulaturile: teste obiective vs. teste subiective fac trimitere la alte entităţi în limbajul
psihologilor, faţă de cel al pedagogilor evaluatori; vezi, de pildă, A. Stoica, lucr. cit., p.77;
A. Stan, 2002, p. 113), rezultând concluzia că interpretarea acestor categorii încă mai este
afectată de unele ambiguităţi, de care trebuie să fim conştienţi.
Altă observaţie care se impune, pe acest fond, este aceea că nu toate testele folosite în
evaluarea şcolară pot fi calificate drept docimologice. Autorii români sau străini
contemporani, aproape fără excepţie, învederează acest fapt prin menţionarea, tot în sfera
evaluării, a testelor de aptitudini în general şi a celor de inteligenţă în special, a testelor de
rapiditate (speed tests) şi de nivel (power tests) (cf. Payne, 1968; Gronlund, 1971; I.T. Radu,
2000). Rezultă, din această realitate de fapt, că lista de mai sus cuprinde un ansamblu de teste
implicate cu toate în activitatea evaluativă din cadrul şcolii. Denumirea cea mai convenabilă,
pentru toate la un loc, ar fi aceea de teste de evaluare folosite în şcoală. În rândul lor sunt
încadrabile de o parte testele "de clasă" (classroom tests sau achievement tests, denumire
tradusă de către docimologi fie prin teste de cunoştinţe, fie prin teste docimologice, fie prin
teste de achiziţii, fie prin teste de randament), iar alături de ele testele "de aptitudini"
(aptitude tests) şi celelalte (speed tests, power tests etc.), fiecare dintre ele fiind folosite în
scopuri bine definite: cele de achiziţie, pentru evaluarea strictă a rezultatelor realizate prin
învăţare de către elevi; cele de aptitudini şi celelalte de factură strict psihologică, pentru
evaluarea posibilităţilor de abordare a învăţării şi altor coordonate ale persoanei elevului.
Celelalte denumiri din tabloul prezentat rezultă din nuanţarea celor enumerate în fraza
anterioară după diferite alte criterii, cum printr-o analiză chiar sumară se poate conchide.
Ca urmare a preocupării sale de bază, profesorul (indiferent de specialitate) va fi
interesat strict numai de cele docimologice, pe care le va folosi în mod sistematic, iar în cazuri
frecvente le va şi construi. Celelalte se află în sfera preocupărilor psihologului.
Cât priveşte avantajele testelor docimologice, ele pot fi rezumate în termenii următori:
permit evaluarea rezultatelor şcolare, pe orice dimensiune, în condiţii de economicitate, de
precizie şi concizie, de validitate (concretizată mai ales în exprimarea pe spaţii mici şi în timp
scurt a conţinuturilor cele mai reprezentative) şi de notare cât mai apropiată de valoarea reală
a răspunsurilor examinaţilor (vezi şi I.T. Radu, 1981, p. 227). Dezavantajele notate cu decenii
în urmă în dreptul acestor instrumente docimologice (de pildă, că ar recurge excesiv la detalii,
că nu ar favoriza destul capacitatea de sinteză şi nici dezvoltarea creativităţii) apar revolute în
vremea noastră, dată fiind tocmai "modelarea" pe tiparul testului a majorităţii probelor
tradiţionale.

TEMĂ DE REFLECŢIE
Cum explicaţi faptul că azi nu mai putem susţine nişte dezavantaje ale testului docimologic?

V.2.2.2. Tipuri de itemi ai testului docimologic


Pentru a înţelege complet esenţa şi modul de utilizare a testului docimologic, este
normal să ne întrebăm: cum arată părţile lui alcătuitoare, adică itemii din care se compune ?
Drept răspuns, va trebui să prezentăm mai întâi lista sistematică a acestor tipuri de itemi, apoi
să definim fiecare tip, cu exemplificări, cu precizări legate de înscrierea fiecăruia în plan
taxonomic, ce utilizări are, ce reguli implică să fie respectate etc.
În ce priveşte lista sistematică menţionată, putem prezenta două "modele" care se
cunosc şi "circulă" deja în terenul teoriei şi practicii evaluării.
Primul model aparţine americanului N. Gronlund (1971, p. 149 urm.) şi propune
următoarele categorii de tipuri de itemi:
1. itemi obiectivi, cuprinzând tipurile:
a. itemi tip răspuns formulat de către cel examinat (engl.: tip supply), din care:
a1. tip răspuns scurt;
a2. tip completare;
b. itemi cu răspuns ales (engl.: selected type), din care:
b1. tip răspuns alternativ;
b2. tip împerechere;
b3. tip alegere multiplă
c. tip interpretare;
2. itemi tip eseu, cuprinzând:
a. cu răspuns extins;
b. cu răspuns restrâns
CONSTANTIN MOISE

Al doilea model, lansa şi explicată de către SNEE (cf. M. Mândruţ, în: A. Stoica şi
colab., 2001, p. 95 urm.; d.a., I. Neacşu, A. Stoica, coord., 1996, p. 39 urm.), propune tipurile:
1. itemi obiectivi, cuprinzând:
a. itemi cu alegere duală;
b. itemi de asociere (sau de tip pereche);
c. itemi cu alegere multiplă;
2. itemi semiobiectivi, cuprinzând:
a. tip răspuns scurt;
b. tip completare;
c. întrebări structurate;
3. itemi subiectivi, din care:
a. itemi tip rezolvare de probleme;
b. itemi tip eseu, diferenţiaţi după dimensiune în: eseu cu răspuns scurt şi
eseu cu răspuns extins, iar după gradul de detaliere a cerinţelor şi
criteriilor de elaborare", în: eseu structurat şi eseu liber.

APLICAŢIE
Încercaţi o privire paralelă asupra celor două modele de grupare a tipurilor de itemi şi
surprindeţi asemănările, deosebirile, precum şi posibilităţile de compatibilizare.

Prezentăm mai jos o relativă detaliere, pe care am dori-o şi suficient de inteligibilă.


Vom lua ca repere atât tipurile sugerate de primul autor citat, cât a celor propuse de următorii.

ATENŢIE

Pentru a înţelege cele exprimate din acest punct al cursului şi mai departe, luaţi-vă
alături taxnomia lui Bloom (din cursul de teoria instruirii, sau dintr-o altă lucrare care
o detaliază). Motivul este că pe tot parcursul prezentării tipurilor de itemi se va vorbi de
"nivelele taxonomice" în care se înscrie fiecare tip de item, în cadrul taxonomiei respective.
Uitaţi-vă, de asemenea, la descriptorii de evaluare aflaţi în preambulul cursului, ca să vedeţi
ce vi se pretinde la examen, din această temă. Notaţi-vă schematic, de la fiecare item: definire
(descriere); exemplificare, după modelele din curs; avantaje şi inconveniente; cerinţe de
construire a fiecărui fel de itemi. Altfel este greu de înţeles şi de reţinut.

V.2.2.2.1. Itemii obiectivi sunt caracterizaţi printr-o structurare riguroasă, astfel încât
examinaţii să formuleze răspunsul corect strict identic toţi, iar examinatorii să corecteze de
asemenea identic. De altfel, în cea mai bună parte, aceşti itemi sunt prevăzuţi cu răspunsuri
gata construite, examinatul trebuind doar să opteze pentru cel considerat corect.
Itemii cu răspuns alternativ sunt denumiţi în unele surse şi itemi cu răspuns dual. Se
prezintă sub forma unor enunţuri complete, pe care examinatul să le accepte sau să le
respingă. Marcarea răspunsurilor corecte se face cu ajutorul unor iniţiale ("A", "F", "O", după
cum enunţul exprimă un adevăr, o eroare, o opinie) sau al cuvintelor "DA" vs. "NU", plasate
în faţa fiecărui enunţ. Un item se alcătuieşte din: o instrucţiune pentru examinat, unu sau mai
multe enunţuri conţinând sarcina de rezolvat, acestea fiind precedate de "pârghiile
răspunsului", adică de "DA", "NU" etc.
Itemii de acest fel pretind aprecierea de către examinat a exactităţii unor judecăţi şi
pot fi folosiţi în cele mai diverse discipline de învăţământ; nivelele taxonomice predominante
ale comportamentelor probate sunt cel al recunoaşterii şi al înţelegerii (reperul invocat de toţi
autorii este taxonomia lui Bloom), de la recunoaşterea corectă a unor aspecte concrete din
realitate, până la recunoaşterea unor relaţii cauză - efect, celelalte nivele fiind reprezentate în
forme simple, cum ar fi aprecierea (tot limitată la recunoaştere) corectă a aplicării unor
principii, rezolvarea unor probleme simple prin aplicarea unor operaţii numerice etc.
Exemplele care urmează pot demonstra aceste afirmaţii.
Exemplul unu:
INSTRUCŢIUNE: Citeşte cu atenţie enunţurile de mai jos. Dacă ceea ce exprimă este adevărat,
încercuieşte litera A, dacă nu, încercuieşte litera F.
A F 1. Substanţa de culoare roşie din sânge este numită plasmă colorată.
A F 2. Substanţa incoloră din sânge este numită plasmă.
Itemul vizează evaluarea unui comportament simplu, respectiv recunoaşterea
unei denumiri; nivel taxonomic: achiziţia informaţiei; răspuns corect la1: F;
răspuns corect la 2: A.
Puţin mai complicate vor apărea exemplele de mai jos.
INSTRUCŢIUNE: Citeşte…….. Reaminteşte-ţi ce înseamnă "opinie". Aşadar, vei încercui fie A, fie
F, fie O (adevărat, fals, opinie).
A F O 1. Toate metalele se dilată prin încălzire.
A F O 2. Apa îşi măreşte volumul la frig.
A F O 3. În atomii metalelor radioactive se pot izola zeci de categorii de
particule.
Cum se observă, examinatul trebuie să facă efort de înţelegere (ceea ce
corespunde nivelului taxonomic "comprehensiune"), şi pentru a se pronunţa
asupra celui de al doilea răspuns, şi pentru a conchide că la al treilea este
vorba doar de o opinie (atâta vreme cât nu s-a cercetat şi nu s-a descoperit
acest lucru, afirmaţia respectivă nu poate fi considerată nici adevărată, nici
falsă; este doar o "părere").
Alte exemple pot ilustra exigenţe tot la nivelul înţelegerii, cu uşoară tendinţă spre
aplicare, cum este cazul celor de mai jos.
INSTRUCŢIUNE: ……….. se încercuieşte "DA" sau "NU".
DA/ NU 1. Procentul 51% din 23 este mai mare decât 12.
DA/NU 2. Jumătate din 4/10 este egal cu 2/5.
Sunt vizate, de această dată, comportamente mai complicate, examinatul
trebuind să-şi reactualizeze calculul procentelor, respectiv compararea
fracţiilor.
CONSTANTIN MOISE

În alt tip de exemple putem identifica pretinderea unor achiziţii aflate tot în sfera
comprehensiunii, axate pe altă dominantă: surprinderea relaţiilor cauzale sau a relaţiilor dintre
judecăţi. În exemplul de mai jos, itemii sunt alcătuiţi din două părţi, fiind adevărate ambele,
când sunt luate separat; dar puse la un loc pot exprima un neadevăr.
Elevului I se cere să spună dacă a doua parte explică corect de ce prima este adevărată
DA/NU 1. Cămilele sunt mamifere DEOARECE au corpul acoperit cu păr.
DA/NU 2. Găinile sunt animale ovipare DEOARECE îşi clocesc ouăle.

Opţiunea pentru acest tip de itemi decurge din avantajele:


- extensia mare a comportamentelor evaluabile, cum s-a constatat şi din exemplele
prezentate;
- productivitate mare a răspunsurilor, datorată "preformulării" acestora de către examinator;
- fidelitate şi obiectivitate mare, dată fiind simplitatea şi precizia cerinţelor, precum şi a
punctajelor;
Avantajele enumerate nu-i conferă totuşi o folosire fără limite. Cele mai de seamă
limite sunt:
• validitate în principiu mică (cf. Gronlund, 1971, p. 160), fiind greu de acoperit prea multe
conţinuturi, ceea ce determină utilizarea mai ales pentru nivele taxonomice inferioare;
aceasta tocmai datorită formulării categorice în care se prezintă acest tip de itemi;
exemplele plasate pe nivele taxonomice mai pretenţioase, sunt de regulă greu de întâlnit şi
pretind autorului o pregătire de cea mai mare minuţiozitate;
• caracterul lapidar şi fix al răspunsurilor nu permite aprecierea destul de nuanţată a
prestaţiei elevului, mare parte din aceasta trebuind "reconstituită" mental de către
examinator; astfel valoarea diagnostică este şi ea restrânsă;
• este tipul de item cu cea mai mare probabilitate de ghicire a răspunsurilor corecte, teoretic
fiind de 50% din totalul acestora.
Cerinţele de construire a acestor itemi sunt următoarele (cf. Payne, 1971, p. 56 urm.;
Gronlund, 1971, p. 162 urm.; Mândruţ, 2001, p. 100):
• să fie evitate adevărurile banale, irelevante, inutile în situaţia de utilizare a testului
(exemplu: "Senzaţia este un proces psihic", dacă acest enunţ intră în componenţa unui
item de evaluare, în teza semestrială);
• să fie evitate enunţurile negative şi cu deosebire dublu negative, dată fiind potenţialitatea
lor derutantă (spre exemplu, enunţul: "Nici unul dintre numerele 2, 3, 5, 17, 19, 31 nu sunt
numere neprime" să i se prefere "Toate numerele 2, 3, 5, 17, 19, 31 sunt numere prime");
• să se evite formulările lungi şi complicate, care nu permit orientarea elevului cu precizie
asupra unui răspuns corect (exemplu, enunţul: "Dacă admitem că 0 este altceva decât
nimic, putem afirma că împărţirile exacte au rest 0", trebuie înlocuit cu "Restul 0 este
caracteristica împărţirilor exacte");
• să se evite includerea în acelaşi enunţ a două idei care nu se află în relaţie de cauză-
efect (spre exemplu, enunţul: "Şarpele nu este mamifer, deoarece nu are sânge cald" pune
elevul în imposibilitatea de a da vreunul din răspunsurile A, F sau O);
• lungimea enunţurilor adevărate să fie aproximativ egală cu a celor false, când i se prezintă
elevului în acelaşi item; lungimea diferită sprijină elevul să ghicească răspunsul (exemplu,
dacă enunţurile: " Mamiferele îşi nasc puii" şi "Mamiferele îşi gestează puii în propriul
corp, îi nasc vii şi îi hrănesc cu lapte propriu" sunt prezentate împreună, enunţul mai lung
îi va atrage atenţia, prin minuţiozitatea precizărilor, că este adevărat);
• numărul enunţurilor adevărate să fie în relativ echilibru cu al celor false, şi acesta putând
determina elevul să ghicească, după cum constată care dintre enunţuri sunt de regulă mai
frecvente (cele adevărate, sau cele false).

TEMĂ DE REFLECŢIE
Găsiţi şi alt exemplu de item cu răspuns alternativ care derutează prin conţinerea a mai mult
de o idee de apreciat ca adevărată sau falsă.

Itemii de tip împerechere (matching items) îşi capătă numele după procedura pe care
trebuie să o utilizeze examinatul (cf. Gronlund, 1971, p. 164 urm.; Payne, 1968, p. 73urm.):
împerecherea unor date care i se prezintă pe două coloane: coloana A, numită a premiselor
sau stimulilor; coloana B, a răspunsurilor. Relaţia pe cele două coloane se stabileşte între:
evenimente şi date; invenţii şi inventatori; termeni şi definiţii; reguli şi exemple; simboluri şi
concepte; autori şi tiluri de cărţi; plante, animale şi clasificări; principii şi aplicaţii; a nivele
mai nuanţate şi dificile
(Payne, lucr. cit.), se pot "împerechea" şi: cauze - efecte; afirmaţii teoretice -
experimente; fenomene - explicarea lor pe bază de principii, teorii, generalizări.
Cităm un exemplu, adaptat după modelele celor doi autori invocaţi mai sus:
INSTRUCŢIUNE: Citeşte cu atenţie formulările din cele două coloane. Scrie în faţa fiecărui număr
din coloana A litera din coloana B, astfel încât să reiasă legătura necesară
între cele două formulări. Fiecare formulare de pe coloana B ar putea fi
folosită o dată, de mai multe ori sau deloc.
Coloana Ă Coloana B
(E) (F) 1. o răscoală ţărănească A. 1848
(A) (C) 2. o revoluţie B. 1877
(B) 3. Războiul de independenţă C. 1989
(G) 4. Marea unire a teritoriilor româneşti D. 1359
E. 1784
F. 1907
G. 1918
H. 1889

Autorii de teorie atrag atenţia că, în funcţie de specificul materiei de învăţământ, există
şi alte moduri de formulare a stimulilor, respectiv a variantelor de răspuns, prin folosirea unor
materiale mai concrete (hărţi, pictoriale, diagrame), care să vină în sprijinul clarităţii
cerinţelor către cel examinat. De asemenea, se afirmă că, în cazul şcolarilor mici, se poate
utiliza şi alt procedeu de marcare a relaţiei dintre elementele din cele două coloane, cum ar fi
unirea directă a lor prin linii, ori prin săgeţi,
CONSTANTIN MOISE

Cum se vede din prezentarea generală, aria de utilizare este foarte cuprinzătoare, ceea
ce constituie un avantaj şi deci o motivaţie în favoarea promovării acestui fel de itemi
obiectivi. La rândul lui, exemplul de mai sus ne arată că, în unele ipostaze cel puţin, avem a
face cu o modalitate complexă, pe care o putem socoti o îmbinare de mai mulţi itemi cu
alegere multiplă (mai multe propuneri de răspuns, cerând simultan mai multealegeri corecte;
mai mulţi posibili distractori). Conjugată cu omogenitatea obligatorie a conţinuturilor
prezentate (pe ambele coloane este prezentat material din acelaşi domeniu, ceea ce împiedică
elevul să procedeze prin excludere) şi cu modalitatea de construire a răspunsurilor, această
complexitate se constituie într-un obstacol împotriva ghicirii soluţiei. Este ceea ce reprezintă
virtutea "de rezistenţă" a itemilor în discuţie. Uşurinţa alcătuirii şi mânuirii itemilor simpli,
este un alt avantaj, făcând posibilă abordarea unei cantităţi mari de comportamente în timp
scurt.
În mod simetric cu abordarea celorlalte tipuri, iată şi aici neajunsurile esenţiale: se
utilizează, în majoritatea situaţiilor pentru determinarea informaţiei de tip factual, deci fără
profunzime; este de regulă dificil de asamblat, în astfel de itemi, un material mai complicat,
respectând în acelaşi timp exigenţa omogenităţii (vezi şi D. Payne, lucr.cit., p. 75-76).
Iată regulile construirii corecte a itemilor de tip împerechere (Payne, lucr.cit., p. 73;
Gronlund, lucr.cit., p. 167; Stoica, coord., 2001, p. 105):
• pe fiecare coloană (coloana A, a premiselor şi pe coloana B, a răspunsuri -lor propuse) să
fie plasat material omogen; adică să nu fie menţionate pe coloana A, de pildă, opere
literare, alături de evenimente istorice şi de enunţuri despre mari descoperiri geografice,
iar în coloana B, nume de scriitori, date istorice şi nume de exploratori, aceasta ajutând
elevul să procedeze prin excludere şi să ghicească răspunsul;
• numărul premiselor să fie inegal faţă de răspunsurile propuse (unii autori optează pentru
un număr mai mare al premiselor, alţii pentru varianta inversă), din acelaşi motiv al
evitării ghicirii răspunsului corect;
• instrucţiunile date elevului să fie bine direcţionate şi complete, ferindu-l să înţeleagă alte
sarcini pe care să încerce a le rezolva, sau să-şi consume timpul de răspuns recitind în mod
repetat datele;
• lista răspunsurilor să aibă o regulă, de exemplu ordinea cronologică, în cazul numerelor şi
datelor istorice; ordinea alfabetică, în cazul numelor sau cuvintelor în general; prin
aceasta, elevul va fi pe de o parte ajutat să se orienteze repede, pe de alta va fi împiedicat
să încerce deducţii nefolositoare;
• când este cazul, elevul să fie prevenit dacă unele răspunsuri se pot împerechea cu
premisele o dată, mai mult de o dată sau deloc, pentru a nu-l expune riscului de a greşi
prea mult;
• după unii autori, numărul premiselor nu trebuie să fie mai mare de 10-15 (vezi Payne),
după alţii, să nu depăşească 4-5 (vezi Mândruţ, loc.cit.), tot în scopul ca elevul să nu fie
derutat de mărimea itemului;
• unii autori (vezi Gronlund, loc.cit.) optează pentru aşezarea pe aceeaşi pagină a tuturor
itemilor, pentru ca elevul să se poată orienta sinoptic asupra lor şi pentru a se limita
foşnetul întoarcerii filelor pe timpul rezolvării.
Itemul tip răspuns cu alegere multiplă este considerat de autorii americani citaţi cel mai
suplu, mai flexibil, mai adaptabil la diverse conţinuturi implicate în evaluare (Gronlund, 1971,
p. 173 urm.; Payne, lucr. cit.), de unde concluzia că, dintre itemii obiectivi, el are pe drept cea
mai largă folosire. Este utilizat pe scară largă în componenţa testelor standardizate. Poate
servi la măsurarea unor achiziţii comune cu celelalte tipuri de itemi obiectivi, dar remarcabilă
este mai ales utilizarea lui (în unele ipostaze) la nivele taxonomice înalte: analiză, interpretare.
Se prezintă sub forma unei structuri cu două elemente alcătuitoare: de o parte tulpina (engl.
stem), sau problema, sau, după unii autori (vezi M. Mândruţ, loc cit.) "premisa", formulată fie
printr-o întrebare directă, fie printr-un enunţ incomplet; de altă parte un grupaj de răspunsuri
propuse ca posibile, denumite alternative, din care una este corectă sau cea mai bună, iar
celelalte (nevalabile) au rolul de distractori, constituind obstacole ce trebuie depăşite de către
examinaţi. Distractorii nu trebuie interpretaţi atât ca factori derutanţi, cât mai ales stimulativi,
mobilizatori ai energiilor şi capacităţilor elevului.
Itemii aici în discuţie pot apărea în două ipostaze de complexitate (vezi Gronlund, loc
cit.): ipostaza răspuns corect şi cea tip răspunsul cel mai bun. Încercăm mai jos
exemplificări din fiecare, după sugestiile oferite de autorii americani şi cei români menţionaţi
în frazele anterioare.
Prima variantă este cea mai simplă, asemănându-se flagrant cu itemii semiobiectivi
tip răspuns scurt, respectiv tip completare (vezi la titlul dedicat itemilor semiobiectivi),
diferenţa constând doar din efortul elevului de a alege unicul răspuns corect. Nivelul
taxonomic al obiectivului de evaluare rămâne de regulă unul inferior, de pildă recunoaşterea
unui fapt, unui fenomen, unei însuşiri.
EXEMPLU:
TULPINĂ: Care dintre conceptele psihologice notate mai jos redă o entitate cuprinsă în
categoria procese şi activităţi reglatoare ?
ALTERNATIVE DE RĂSPUNS:
A percepţia
B gândirea
C limbajul
D atenţia
E imaginaţia
Elevul trebuie să încercuiască litera antepusă răspunsului corect. Acelaşi
item poate fi construit prin utilizarea, în loc de întrebare, a unui enunţ
incomplet: Dintre conceptele psihologice notate mai jos, cel care se
cuprinde în categoria procese reglatoare este:
A percepţia
B gândirea
C limbajul
D atenţia
E imaginaţia
Preferinţa pentru întrebarea directă sau pentru enunţul incomplet depinde de diverşi
factori, între care vârsta şi experienţa de învăţare a elevului, relevanţa sau eficienţa în context
etc.
CONSTANTIN MOISE

Varianta tip răspunsul cel mai bun ilustrează un nivel taxonomic net mai înalt, fiind
mult mai dificil de rezolvat. De această dată, elevul se află în faţa unor alternative de răspuns
dintre care mai multe pot prezenta grade diferite de acceptabilitate, el trebuind să o indice pe
cea considerată superioară tuturor.

EXEMPLU:
TULPINĂ: Care dintre următorii factori condiţionează cel mai mult creativitatea
individuală?
ALTERNATIVE DE RĂSPUNS:
A voinţa
B imaginaţia
C grupul
D calităţile gândirii divergente
Nivelul taxonomic reprezentativ pentru această variantă de item cu alegere multiplă
poate fi situat între comprehensiune şi analiză, dominantă fiind analiza datelor factuale şi
obligând elevul la un efort de elaborare mai accentuat decât varianta anterioară (de tip
răspuns corect). Pentru formularea problemei de rezolvat (tulpina itemului) se poate adopta,
şi în acest caz, alternativa enunţului incomplet.
Adăugând consideraţiilor din preambulul prezentării acestui tip de item pe cele care
reies din exemplificările de mai sus, credem că nu mai sunt necesare altele, pentru a
demonstra avantajele itemilor de tipul "alegere multiplă".
Nu putem trece, însă, peste unele limite pe care le prezintă. De pildă, înseşi
formulările fixe pe care le foloseşte împiedică elevul să-şi demonstreze şi capacităţile de felul
celei de organizare a conţinuturilor posedate de el, precum şi eventualele lui capacităţi
creative. Altă limită se referă la dificultatea construirii, mai ales a conceperii distractorilor;
este posibil, de exemplu, ca distractorii să fie atât de contrastanţi cu răspunsul corect, sau să
se facă atâtea precizări în varianta de răspuns corectă, încât să sugereze foarte transparent
alegerea necesară. Se poate menţiona apoi dificultatea corecturii, când alternativele corecte de
răspuns nu se limitează la una singură, sau când nuanţările de acceptabilitate sunt prea
dificile, astfel că elevul le rezolvă doar parţial, de unde incertitudinea notării (vezi şi Mândruţ,
lucr. cit., p.101 urm.).

TEMĂ DE REFLECŢIE
Menţionaţi două asemănări şi două deosebiri între itemii de tip împerechere şi cei de tip
alegere multiplă.

Regulile de construire a itemilor tip alegere multiplă sunt foarte numeroase (vezi
Gronlund, loc. cit., p. 183 urm.; vezi Payne, loc.cit., p. 63 urm.). Încercăm o sinteză a acestora
cu nuanţările de rigoare, după cum urmează:
• problema ("tulpina" sau "trunchiul") itemului să fie clară prin sine şi complet formulată
din punct de vedere logic, nu "eliptică" sau "neterminată", această ultimă formă inducând
un răspuns tot imprecis; spre exemplu,
NU în forma: "Eminescu:
A A fost poet naţional.
B A fost luptător social.
C A fost un poet romantic.
D A murit sărac ".
CI în forma: "Prin felul cum şi-a conceput creaţia, Eminescu trebuie considerat:
A. un poet naţional
B. un poet simbolist
C. un poet romantic
D. un poet revoluţionar";
• tulpina să nu includă elemente fără legătură cu itemul; de pildă, dacă între răspunsurile
propuse în această ultimă variantă a itemului de mai sus am fi introdus şi alternativa: "un
mare amator de petrecere", nefiind nici o legătură între un anumit mod de a crea şi
petrecere;
• pentru simplificarea analizei de către elev a răspunsurilor propuse, este de dorit ca
elementele posibil-repetitive în răspunsuri, să fie incluse în premisă; de pildă,
NU: "Sterilizarea instrumentelor medicale se face prin:
A. fierberea lor în apă la 80 grade C.
B. fierberea lor în apă la 85 grade C.
C. fierberea lor în apă la 95 grade C.
D. fierberea lor în apă la 100 grade C,
CI: "Sterilizarea instrumentelor medicale se face prin fierberea lor în apă la:
A 80 grade C
B 85 grade C
etc.;
• să se evite la maximum premisele de formă negativă, care conduc la "voalarea" itemului şi
la dificultate de clarificare; de exemplu,
NU forma: "Nici o entitate psihologică din cele următoare nu se încadrează categoria
însuşirilor de personalitate, afară de:
A memorie
B atenţie
C laşitate
D sentiment";
CI forma: "Care dintre entităţile psihologice următoare se încadrează în categoria
însuşiri de personalitate ? (şi din nou: A, B etc.);
• să se evite, de asemenea, formulările negative care contorsionează itemul, făcându-l
neclar; spre exemplu,
formularea: "Care dintre activităţile de mai jos reprezintă suportul unor funcţii vitale
pentru fiinţa umană ?
A. alergarea
B. mişcarea
C. mersul pe jos
D. nici una din cele de mai sus"
nu ar fi profitabilă pe măsura efortului elevului, trebuind să i se prefere
cea care înlocuieşte enunţul D cu unul care exprimă concret un proces
vital;
• poziţia răspunsului corect, între celelalte, să nu fie fixă, pentru a nu sugera elevului
"calcule" care să-l conducă la ghicirea răspunsului corect; de exemplu, să nu obişnuim
elevul cu plasarea răspunsului corect numai în mijlocul, sau numai la începutul, sau numai
la sfârşitul suitei de răspunsuri propuse spre acceptare.;
CONSTANTIN MOISE

• distractorii (răspunsurile incorecte adică) să fie astfel aleşi încât să aibă o aparenţă
plauzibilă, deci să nu fie de uşurinţă ridicolă; de pildă, plasarea răspunsului cuprinzând
numele lui Cristofor Columb, ca descoperitor al Americii, alături de altele care l-ar
menţiona în aceeaşi postură pe Twain, sau pe Ludovic al XIV-lea ar fi o absurditate,
furnizîndu-i elevului drumul cel mai scurt către răspunsul exact, fără nici un alt efort.
O variantă cu totul specială de itemi obiectivi este reprezentată de itemii tip
interpretare, considerată de autorii americani cea mai complexă. Rezultatele pe care le
măsoară sunt foarte cuprinzătoare: capacitatea de a aplica principii, de a interpreta relaţii, de a
formula şi susţine ipoteze, de a recunoaşte şi a argumenta valabilitatea unor generalizări etc.,
aşadar la nivelul cel puţin al analizei, fiind puntea dintre itemii obiectivi şi cei de tip eseu
(vezi Gronlund, loc cit, p. 197 urm.). Iată un exemplu de item care poate fi folosit pentru a
măsura capacitatea de selecţie a informaţiei relevante, capacitate formată prin exerciţii
speciale de învăţare, să zicem, într-o şcoală de poliţie.

PROBLEMĂ: Unui bătrân i se fură câinele de companie, fapt pe care îl reclamă şi solicită
ca animalul să fie identificat. Oferă informaţii cuprinse în propoziţiile de
mai jos. Încercuieşte cuvântul DA sau NU antepus, după cum consideri
folositoare sau indiferentă informaţia pe care o cuprinde.
DA NU 1. Câinele a fost primit cadou de când avea trei luni.
DA NU 2.Este de rasa dog german.
DA NU 3. Reacţionează la semnalul "Jar ".
DA NU 4. Are ambele urechi "netunse".
DA NU 5. Şchioapătă cu piciorul stâng.
DA NU 6. Este negru şi are o pată albă între ochiul şi urechea dreaptă.
DA NU 7. Are coada scurtă.
Candidatul va fi obligat la un travaliu apreciabil, socotind că chiar dacă informaţiile
aflate din propoziţiile 2 şi 6 sunt primele necesare, ele ar putea să nu fie şi suficiente, trebuind
completate cu 4, sau cu 3.

TEMĂ DE REFLECŢIE
Găsiţi elemente de asemănare şi de deosebire între itemii tip alegere multiplă şi cei tip
interpretare.

Şi în acest caz se pot sublinia avantaje, precum şi limite. Ambele dimensiuni sunt
comparabile cu cele exprimate în dreptul celui de mai sus. Măsurarea componentelor înalte
ale comportamentului elevului, odată cu notarea prin procedee obiective, utilizarea posibilă
în scopuri formative, respectiv pentru exersarea competenţei de interpretare, reprezintă
avantajele esenţiale. Limitele se constituie în jurul dificultăţii de construire a unui număr
suficient, al consumului mare de timp pentru prelucrarea datelor şi notare, sau al necuprinderii
întregii anverguri taxonomice, nici de către aceşti itemi, capacitatea de organizare a propriului
discurs şi creativitatea rămânând tot în afara evaluării pe această cale.
Ca reguli de construire se menţionează:
• să fie ales materialul introductiv întotdeauna în legătură cu nivelul obiectivului cursului
(cf. Gronlund, idem, p. 211), deci nici sub, nici peste dificultatea acestuia, într-un caz fiind
neformativ, în celălalt fiind greu de relaţionat de către elev cu conţi-nuturile care se
discută;
• materialul introductiv să fie pe măsura experienţei de învăţare a copiilor; nu vom solicita
elevul să interpreteze fapte despre care nu are nici cunoştinţele, nici exerciţiul de abordare
necesar; de exemplu, pentru copiii din treptele inferioare să fie folosit mai ales material
pictorial, cel bazat pe relatarea scrisă fiind recomandabil pentru cei mari;
• noutatea materialului introductiv să fie promovată obligatoriu, cu fiecare item, dar
respectând regula evoluţiei treptate, fără salturi descurajatoare pentru elev;
• în privinţa raportului dintre lungimea materialului introductiv şi numărul de enunţuri, este
de regulă preferabil un material introductiv scurt şi un număr de enunţuri mare, sau un
relativ echilibru; este total ineficient raportul bazat pe material stimul lung şi număr mic
de enunţuri de interpretare, acesta putând fi înlocuit cu un item cu răspuns alternativ.

V.2.2.2.2. Itemii semiobiectivi îşi datorează denumirea faptului că, fiind vorba de
răspunsuri formulate de elev (deci nu alese dintre cele propuse), ei implică o filtrare a
răspunsurilor prin individualitatea acestuia din urmă şi deci o nuanţare diferită a notării. Cum
deja am stabilit în paginile anterioare, în rândul lor se înscriu: itemii de tip răspuns scurt, cei
de tip completare şi cei de tip întrebări structurate.
Itemii tip răspuns scurt fac în realitate corp comun cu cei de tip completare, ambele
variante exprimând strict aceleaşi exigenţe. Deosebirea este că în primul caz răspunsul se cere
printr-o întrebare directă, în timp ce al doilea se bazează pe un enunţ incomplet, răspunsul
costând din completarea necesară a acestuia. Sunt denumiţi în unele surse şi cu titlul de itemi
cu răspuns oferit (supply), spre a-i deosebi de cei cu răspuns ales, adică de cei tip răspuns
alternativ, de tip împerechere, de tip alegere multiplă şi de tip interpretare. Spre exemplu:
Cine este autorul poemului Luceafărul? (Eminescu) (variantă cu întrebare directă),
sau:
Poemul Luceafărul a fost scris de ………….. (variantă tip completare).

Cum se observă, avem a face cu o formă foarte simplă ca alcătuire şi foarte uşor
abordabilă ca instrument de evaluare. Acest tip de item este utilizat pentru măsurarea unei
multitudini de rezultate ale învăţării, de regulă tot foarte simple. Exemple:
1. Cunoaştere de terminologii:
Ansamblul unităţilor de măsură se numeşte……………..(sistem metric)
2. Interpretare simplă de date:
În cadrul cuvântului oaie, grupul de sunete oa reprezintă un ….. (diftong)
3. Cunoaştere de reguli:
Apa îngheaţă la temperatura ……….(sub O grade)
4. Cunoaşterea de metode şi procedee de acţiune:
Ordinea operaţiilor aritmetice este: ………………………….
(întâi înmulţire şi împărţire, apoi adunare şi scădere)
5. Abilitatea de a reda echivalentele verbale ale unor conţinuturi prezentate prin
desene, hărţi, diagrame etc.
De pildă, pe baza hărţii şi cu sprijinul semnelor convenţionale, elevul să
completeze numele zăcămintelor minerale din fiecare localitate.
CONSTANTIN MOISE

6. Chiar capacitatea de a mânui simboluri matematice sau din ştiinţele naturii, sau de a
rezolva probleme matematice, reprezentând simple aplicaţii ale operaţiilor
aritmetice:
Dacă 4 x b = 36, atunci b= ………….(36: 4).

Iată şi un exemplu, din această categorie de itemi, cules din propunerile SNEE, pentru
învăţământul primar:
INSTRUCŢIUNE: Citeşte cu atenţie cuvintele următoare: ger, argint, Macela, Maricica. Care
cuvânt conţine grupul ce? (………..). Care cuvânt conţine grupul ci?
(………..). Care cuvânt conţine grupul ge? (……). Care cuvânt conţine
grupul gi? (………) (cf. V. Păuş, coord., 1999).
Iată altul, propus pentru disciplina Logică şi argumentare, clasa a IX-a (cf. Fl. Oţet,
coord., 2000, p. 38 urm.):
ENUNŢ: Completează spaţiile punctate astfel încât să obţii afirmaţii adevărate:
"Într-un raport de subalternare se pot afla două propoziţii care au………………"
(răspuns corect: "aceeaşi calitate").

TEMĂ DE REFLECŢIE
Ce factori consideraţi că influenţează mai mult, în specialitatea dumneavoastră, folosirea
acestui tip de itemi?

Ce argumente s-au rostit în favoarea, respectiv ce limite au fost semnalate, în dreptul


acestor itemi? Cât priveşte argumentele pentru utilizarea lor, toate sursele le menţionează pe
următoarele (vezi Payne; Gronlund; vezi ghidurile SNEE): sunt o categorie dintre cele mai
uşor de construit; sunt uşor aplicabili pretutindeni; dacă sunt riguros elaboraţi, sunt chiar uşor
de corectat şi notat; ghicitul răspunsurilor este practic exclus, atâta vreme cât nu i se oferă
elevului variante pe fondul cărora să ghicească. Noi adăugăm unu: dată fiind uşurinţa
rezolvării lor, sunt chiar încurajatori pentru oricare categorie de elevi (dovadă, însuşi faptul
că, în structura testelor şcolare, de regulă ei sunt plasaţi primii). Dar nici limitele nu pot fi
ignorate, adică: exceptând acele probleme matematice elementare şi ecuaţii tot simple, din
matematică, fizică, chimie, nivelul taxonomic este exclusiv cel al achiziţiei informaţiei, partea
preponderentă a acestei informaţii fiind neînsoţită de explicaţii; corectarea şi notarea
întâmpină dificultatea "contaminării" (adică a intervenţiei, în acest plan, a unor entităţi
colaterale conţinuturilor de evaluat, cum ar fi insuficienţele de exprimare, erorile de scriere,
aspectele estetice, împiedicând sau denaturând notarea corectă).

Regulile de construire a acestor itemi se rezumă astfel (Payne, loc.cit. p. 54 urm.;


Gronlund, loc.cit., p. 154 urm.):
• sarcina pentru elev să fie formulată cu concizie, dar şi destul de explicit; de exemplu,
formulării insuficiente:
"Ion Creangă a scris ………………………………………………."
să i se prefere:
"Autorul poveştii Soacra cu trei nurori a fost ………………………"
• itemii să nu includă prea multe spaţii albe, fiindcă devin greu de înţeles; de pildă, itemul:
"Păsările care …..şi……….anual se numesc……………."
nu poate fi decriptat decât cu preţul unui mare efort (pentru a defini categoria "păsări
migratoare");
• nu este recomandată preluarea din manual a itemilor de acest fel; spre exemplu,
formularea
"Numărul 17 este un număr ……",
odată scoasă din textul în care era precedată de definirea numerelor prime, devine
improbabil de completat cu cuvântul prim (număr prim);
• spaţiile albe să fie egale ca lungime, chiar dacă dimensiunea răspunsurilor unor enunţuri,
prezentate în acelaşi item, sunt diferite; de exemplu, dacă spaţiul alb din primul din
enunţurile:
"Cuvintele care, în cadrul comunicării, fac legătura între elemente din categorii
gramaticale diferite se numesc…………………"
şi
"Cuvintele care, în cadrul comunicării, fac legătura între entităţi lingvistice din aceeaşi
categorie gramaticală se numesc ……………."
ar fi mai lung decât cel din al doilea, ar putea sugera elevului răspunsul corect
("prepoziţie"), tocmai prin această deosebire;
• se mai precizează de unii autori că, în itemii de completare, spaţiul alb conferă itemului
mai multă claritate dacă este plasat la sfârşitul enunţului, mai puţină în mijloc, iar la
început cea mai puţină (cf. Payne, loc. cit., p. 55).

Întrebările structurate (o noutate românească?) sunt definite ca "sarcini formate din


mai multe subîntrebări, de tip obiectiv şi semiobiectiv, legate între ele prin înţeles", menite să
"acopere spaţiul liber" între itemii obiectivi şi cei subiectivi (M. Mândruţ, 2001, p. 111; Stoica
şi Neacşu, 1996). Alcătuirea unui astfel de item constă din: un element stimul (un desen, un
tabel statistic, o hartă, un text), urmat de subîntrebările orientatoare, care concretizează
sarcinile de rezolvat de către cel examinat; acestea din urmă sunt însoţite de punctaje-le ce se
acordă. Iată un exemplu foarte convingător pentru concretizarea definiţiei de mai sus, extras
din modelele de subiecte pentru examenul de capacitate din 2001 (cf. B.Vîlceanu, coord.,
2001):
Citiţi cu atenţie textul de mai jos:
I-a trecut cuiva prin minte să nege sau să conteste continuitatea poporului
francez în Galia, a celui spaniol şi portughez în Peninsula Iberică sau a celui
italian în Italia?
Pornind de la acest text, răspundeţi următoarelor cerinţe:
1. Transcrieţi trei popoare înrudite cu poporul român………….……………….3p.
2. Numiţi teoria la care face referire autorul ……………………………………3p.
3. Menţionaţi două argumente ale contestatarilor continuităţii daco-romane şi
două contraargumente prin care să combateţi argumentele acestora ………..4p.
4. Menţionaţi o cauză care a determinat disputa asupra continuităţii daco-romane
la nordul Dunării ……………………………………………………….……2p.
Calităţile care susţin acest tip de itemi sunt rezumate astfel:
CONSTANTIN MOISE

• faptul că se bazează pe întrebări deschise face posibilă exprimarea elevului la nivele mai
înalte decât recunoaşterea sau reproducerea de cunoştinţe, cum a fost cazul itemilor
obiectivi şi a celor semiobiectivi simpli, prezentaţi anterior; întrebările structurate deschid
drumul spre explicaţii mai nuanţate, la nivelul analizei, invitând la interpretare ştiinţifică
autentică;
• prin intermediul subîntrebărilor, înşişi itemii subiectivi pot fi "modelaţi" în aşa fel încât să
devină accesibili unui număr cât mai mare de elevi, fiecare putându-şi arăta pregătirea
până la un punct.
Acestea sunt valorificabile, însă, cu condiţia depăşirii următoarelor limite:
• construirea subîntrebărilor este de mare dificultate, tratarea lor cu superficialitate
compromiţând toate avantajele;
• autorii care le promovează reclamă şi costurile ridicate pentru unele ipostaze ale acestor
itemi.
Exigenţele de construire a întrebărilor structurate, deşi nu sunt puţine, sunt mai ales
schiţate, şi mai puţin explicate (vezi Mândruţ, 2000, p. 112):
• cum vom vedea că este necesar pe ansamblul testului în general, subîntrebările trebuie să
traseze o linie continuă de creştere a dificultăţii, începând cu cele mai uşoare, în interesul
prevenirii unei descurajări premature a examinatului;
• răspunsul la fiecare subîntrebare să fie astfel solicitat, încât să fie formulat scurt,
consistent, concludent, ştiut fiind că răspunsurile lungi, în astfel de circumstanţe, diluează
ideile vizate;
• subîntrebările să fie independente, adică răspunsul fiecăreia să nu fie condiţionat de cel al
alteia;
• prin elementele pe care le conţin, subîntrebările să facă trimitere clară la aspecte existente
evident în materialul stimul, deci să nu facă apel prioritar la imaginaţia elevului;
• conţinuturile stimul să fie de asemenea concepute cu claritatea necesară, pentru a nu
constitui prin sine obstacole în calea formulării precise a răspunsurilor; nu sunt
recomandate, de pildă, textele prolixe sau întortochiate, nici materialele intuitive şterse sau
"stufoase" ca înfăţişare;
• să i se asigure elevului suficient spaţiu "alb" pe fişa de răspuns, pentru a nu fi nevoit să
restrângă în mod artificial răspunsul, ceea ce ar include eventualitatea de a nu mai fi exact;
• punctajul fiecărei subîntrebări să fie stabilit odată cu alcătuirea ei, ceea ce îi conferă
acestuia concreteţea şi minuţiozitatea optimă.

V.2.2.2.3. Itemii de tip subiectiv figurează, în literatura domeniului, în mai multe


ipostaze. Mai întâi numai ca itemi de tip eseu, în lucrările autorilor americani, fără a face
diferenţieri pe subcategorii (Bloom, 1971, p. 201 urm.; Payne, 1968, p. 83-90). Apoi, prin
nuanţarea categoriei de item eseu în subcategoriile: itemi eseu tip extins, deosebiţi de itemi
eseu tip restrictiv (Gronlund, 1971, p. 219 - 233). În fine, ipostaza lansată de autorii români
(Stoica şi Neacşu, coord., 1996; Mândruţ, 2001; toate ghidurile de evaluare ale SNEE), care
este cea mai detaliată. Pe de o parte, ea conferă o mai mare cuprindere categoriei itemi
subiectivi, încadrând în ea itemii tip rezolvare de probleme alături de itemii tip eseu; pe de altă
parte, delimitează itemii eseu în subcategorii, după două criterii: criteriul dimensiunii, după
care rezultă itemii tip eseu cu răspuns restrâns şi itemii tip eseu cu răspuns extins; criteriul
"tipul răspunsului aşteptat" (cf. R.Doicescu, coord., 2001, p. 47 urm.), sau al "gradului de
detaliere a cerinţelor" (Mândruţ, 2001, p. 118), rezultând itemii tip eseu structurat şi itemii tip
eseu liber. Pe această ultimă schemă, vom încerca să alcătuim comentariul de mai jos.

Itemii de tipul "rezolvare de probleme" sunt prezentaţi numai în documentele SNEE,


cu precizarea că este mai corect spus "rezolvare de situaţii problemă" (cf. Mândruţ, loc. cit.),
făcând probabil trimitere la definiţia rezolvării de probleme după R. Gagné (vezi, în cursul de
teoria instruirii, metoda problematizării şi tipurile de învăţare după R. Gagné, unde se găseşte
şi definiţia rezolvării de probleme). Caracterizarea acestui tip de item este următoarea (cf.
A. Stoica şi colab., 2001): elevul este pus în faţa unei situaţii noi pentru el (Gagné i-a spus
inedită), care nu are "o soluţie predeterminată "; sunt fel şi fel de situaţii problematice, de la
cele mai simple, "închise", pentru care îi sunt oferite elevului cele mai importante date, de
unde şi rezolvarea este simplă, până la cele mai complicate, complet "deschise"; acestea din
urmă necesită, din partea elevului, un travaliu foarte minuţios, derulat pe etape, cele mai de
seamă fiind:
 identificarea problemei;
 culegerea şi selectarea datelor de bază (relevante);
 formularea şi validarea unor ipoteze;
 identificarea metodei de rezolvare;
 propunerea unei soluţii;
 evaluarea soluţiei;
 formularea concluziei asupra rezolvării realizate.
Ca exemplu pentru variantele simple, l-am imaginat pe următorul:
I se prezintă elevului de clasa a IV-a o fişă pe care sunt desenate: o păstaie de
fasole, o ceapă, un morcov, un măr. I se formulează cerinţa ca, pe baza
cunoştinţelor lui despre felul cum se formează fructul unei plante, să grupeze
conţinutul desenului pe trei categorii de entităţi. Se stabileşte şi o schemă de
notare, cuprinzând câte trei puncte pentru fiecare categorie. Rezolvarea exactă
este: categoria fructe: mărul; legume: morcovul şi ceapa; legume dar şi fructe:
păstaia).
Exemplul pentru situaţiile complexe l-am preluat din ghidul din anul 2000 pentru
evaluarea rezultatelor şcolare la ştiinţele socioumane (cf. Fl. Oţet, coord., 2000, p.50), după
cum urmează:
"Activitatea se desfăşoară pe trei etape:
 în prima etapă, elevii răspund individual, în scris, la două întrebări:
Când învăţ la psihologie, de ce învăţ?
Când nu învăţ la psihologie, de ce nu învăţ?
 în a doua etapă, profesorul formează grupe de câte 5 elevi, fiecare grupă având
următoarele sarcini:
CONSTANTIN MOISE

a. Grupaţi răspunsurile la cele două întrebări conform formei de motivaţie în care se


încadrează fiecare;
b. Identificaţi forma de motivaţie dominantă;
c. Formulaţi două soluţii posibile pentru asigurarea suportului motivaţional adecvat şi
creşterea performanţei în învăţare;
 în a treia etapă, fiecare grupă îşi alege un raportor care să prezinte modul în care s-a
realizat activitatea de rezolvare a sarcinii şi soluţiile propuse. Activitatea se încheie cu o
discuţie frontală asupra soluţiilor propuse şi posibilităţilor de aplicare a lor.
Schema de notare va ţine cont de:
 corectitudinea grupării răspunsurilor conform formei de motivaţie în care se încadrează
fiecare;
 corectitudinea identificării dominantei motivaţionale;
 caracterul adecvat şi fezabil al soluţiilor propuse."
Motivaţia utilizării acestei variante de item subiectiv este axată tot pe nişte avantaje.
Le transcriem după documentele SNEE astfel:
 stimulează gândirea creativă, prin felul cum formulează sarcinile;
 contribuie la transferul de proceduri de rezolvare între domenii diferite sau în interiorul
aceluiaşi domeniu;
 după autorii care o propun, dezvoltă chiar şi abilităţile de cooperare, comunicare, lucru în
echipă; dezvoltă capacităţile autoevaluative; favorizează punerea în relief a capacităţii de
"raţionare flexibilă şi operantă" (Fl. Oţet, coord., 2000).
Dezavantaje:
 timpul îndelungat necesar pentru proiectare, dată fiind complexitatea probei;
 subiectivitatea şi dificultatea notării, dezavantaje care se complică o dată în plus în cazul
lucrului în echipă (idem).

TEMĂ DE REFLECŢIE
Analizaţi acest exemplu şi conchideţi în ce tip de evaluare se poate încadra, după criteriul
funcţiei dominante.

Probabil datorită dezbaterii mai restrânse asupra acestui tip de itemi regulile şi
restricţiile de construire sunt în mai mică măsură exprimate, limitându-se la câteva, adică
(cf. Mândruţ, 2001, p. 119):
 -sarcinile puse în faţa elevului să fie destul de diversificate, pentru ca rezolvarea de
probleme să fie şi un exerciţiu formativ, şi o modalitate de a aprecia nişte capacităţi
realmente superioare; spre exemplu, dacă elevului i se vor prezenta de regulă probleme
de acelaşi tip, capacitatea pe care o vizăm va degenera în simplă rutină;
 -sarcinile să se axeze precis pe obiectivul de evaluare vizat; exemplul simplu de mai sus,
de pildă, trebuie să se "muleze" precis pe obiectivul: "elevul să probeze capacitatea de a
încadra (prin analiză) în categorii diferite unul şi acelaşi obiect (păstaia).
Itemii de tip eseu. Înainte de analiza lor pe variantele menţionate, iată cum justifică
Gronlund necesitatea folosirii itemilor eseu văzuţi în general: "Unele aspecte ale achiziţiilor
complexe nu pot fi măsurate în mod obiectiv (adică prin itemi de tip obiectiv - n.n., C.M.).
Rezultatele şcolare care arată că elevii trebuie să genereze idei … să organizeze şi să exprime
idei … şi să le integreze într-o abordare globală a unei probleme pretind o mai mare libertate
a răspunsului, care este conferită de testul eseu " (loc.cit., p.218).
Reiese foarte limpede, din acest citat, justificarea de principiu a tuturor variantelor
subiective ale itemilor de examinare, ele fiind necesare pentru măsurarea la nivelele
taxonomice cele mai înalte.
Itemii tip eseu cu răspuns restrâns (numiţi, în documentele SNEE, şi cu termenul de
itemi minieseu) sunt caracterizaţi mai întâi de către autorii americani citaţi mai sus ca fiind
marcaţi de anume restricţii sau limitări, formulate chiar prin enunţul întrebării, limitări care
vizează în măsură egală forma şi conţinutul răspunsurilor pretinse. Adaptăm un exemplu după
sugestia oferită de către Gronlund:
"Prezintă, pe o jumătate de pagină, două asemănări şi două deosebiri între
gândire şi imaginaţie. Nu relua exemplele comentate deja în clasă."
Caracterizarea tipului de itemi în discuţie de către autorii documentelor SNEE este
realizată prin invocarea aceloraşi însuşiri ca mai sus, adică: itemii eseu cu caracter restrictiv
sunt cei cărora li se precizează "dimensiunea maximă admisă a răspunsului aşteptat",
respectiv număr de paragrafe, de rânduri, de cuvinte (cf. Fl. Oţet, loc. cit.; de asemenea,
Stoica, coord., 2001). Mai trebuie adăugată doar observaţia că, în comentariile autorilor
români, eseul scurt nu este nuanţat pe variantele eseu structurat vs. eseu nestructurat, ca în
cazul celui cu răspuns extins.
Itemii eseu cu răspuns extins sunt comentaţi şi concretizaţi prin exemple mai întâi de
autorii americani Payne (1968) şi Bloom (1971), apoi detaliaţi de către Gronlund astfel: sunt
itemi eseu care, prin felul cum sunt concepuţi, permit elevului "să aleagă orice informaţii
factuale pe care le consideră pertinente, să organizeze răspunsul în acord cu raţionamentele
considerate cele mai bune, să- şi integreze şi evalueze ideile cum socoteşte că este mai
potrivit" (lucr.cit., p. 220). Este făcută, de asemenea, menţiunea că un item de acest fel
alcătuieşte de regulă singur un test întreg. Ca exemplu, potrivit sugestiei autorului, l-am putea
prezenta pe următorul:
"Elaborează o lucrare despre tematica "scrisorilor" eminesciene. Poţi invoca
orice idee, cu condiţia să încerci a o susţine prin argumente" şi să te încadrezi în
timpul de trei ore".

Varianta conceptuală a SNEE, privind itemii eseu cu răspuns extins, face delimitarea
între itemii tip eseu structurat şi itemii de tip eseu liber (cf. G. Chirleşan, coord., 1999;
Fl. Oţet, 2000; A. Stoica, coord., 2001; R. Doicescu, coord., 2001).
Itemii de tip eseu structurat sunt definiţi prin relativa limitare a libertăţii examinatului
în ce priveşte modul de organizare şi aspectele de tratat: "răspunsul aşteptat este orientat prin
cerinţele formulate, libertatea de organizare nefiind totală" (M. Mândruţ, loc. cit., p.118);
"prin cerinţe explicite, indicaţii sau sugestii, răspunsul elevului este orientat, structurat,
organizat, ordonat (cf. Fl. Oţet, loc cit., p. 52). Pentru ilustrare, iată un exemplu din disciplina
Fizica (cf. G. Chirleşan, loc. cit., p. 77):
CONSTANTIN MOISE

"OBIECTIV DE EVALUARE: Elevii vor fi capabili să analizeze fenomene, situaţii, fapte,


date cu conţinut fizic din realitate.
ENUNŢ: Alcătuiţi un eseu cu tema Electricitatea cea de toate zilele, în care să folosiţi
următorul plan de idei:
a. curentul electric (prezentarea fenomenului fizic);
b. utilitatea curentului electric în viaţa cotidiană;
c. probleme ce pot apărea la utilizarea necorespunzătoare a curentului electric;
d. norme de protecţie în utilizarea curentului electric."
În conformitate cu regula prezentă în mai toate ghidurile de evaluare elaborate în
prezent la noi, acest fel de itemi ar trebui să se însoţească şi de o schemă de corectare şi
notare, care să stabilească, analitic, punctajele care să alcătuiască scorul probei.
Iată şi un alt exemplu din disciplina Limba şi literatura română , mai detaliat decât cel
de mai sus (cf. Stoica, coord., 2001, p. 119):
"OBIECTIV DE EVALUARE: Elevul să probeze capacitatea de elaborare, prin îmbinarea
diferitelor categorii de cerinţe.
ENUNŢ: Scrie o compunere prin care să redai statutul psihologic şi social al
personajului Costache Giurgiveanu, din romanul Enigma Otiliei. Vei avea în
vedere următoarele:
 prezentarea pe scurt a formulei estetice folosite de romancier în construcţia
personajelor;
 identificarea tipului uman reprezentat de Costache Giurgiuveanu;
 argumentarea, pornind de la întrebări şi situaţii selectate din cuprinsul
romanului, a tipologiei identificate;
 prezentarea raporturilor dintre Costache Giurgiuveanu şi cel puţin două
dintre personajele romanului".
Se dau instrucţiuni despre lungimea compunerii, detalii despre modul de notare şi se
anunţă punctajul total. În privinţa schemei de corectare şi notare, de această dată se fac
menţiuni despre punctajul acordat pe o mulţime de "dimensiuni" sau "indicatori", cum ar fi:
prezentarea metodei utilizate de autorul romanului în alcătuirea estetică a situaţiilor; indicarea
modelului de personaj promovat de autor; organizarea ideilor; abilităţile analitice şi critice ale
examinatului; folosirea limbii; ortografie; punctuaţie; aşezare în pagină; menţiuni care să fie
bine însuşite de către examinator şi aplicate în mod unitar.

TEMĂ DE REFLECŢIE
Apreciaţi în ce măsură alcătuirea în mod diferit a itemilor de acest fel, de la o specialitate la
alta, are influenţă (pozitivă sau negativă) asupra înţelegerii şi aplicării în activitatea
evaluatorilor.

Cât despre itemii de tip eseu liber, văzuţi în varianta conceptuală a SNEE, ei sunt
prezentaţi, definiţi, concretizaţi în aceeaşi termeni în care americanii citaţi îi descriu pe cei
de tip extins. Se pot menţiona unele exemple interesante de astfel de itemi, cuprinse în
respectivele documente, cum ar fi: "Explicaţi repartiţia precipitaţiilor medii anuale pe
întinderea teritoriului ţării noastre " (Mândruţ, lucr.cit.), sau "Compară regimurile totalitare
din perioada interbelică, stabilind asemănări şi deosebiri " (cf. R. Doicescu, coord., 2001,
p.59).
Este firesc ca şi în cazul itemilor de tip eseu, în toate variantele prezentate, să fie
invocate nişte avantaje care să le susţină şi nişte limite şi dificultăţi care să îndemne la
prudenţă în utilizarea lor. Facem aceste precizări, aşezând itemii în discuţie pe linia unui
continuum, începând cu itemii cu răspuns restrictiv, continuând cu cei tip eseu structurat şi
încheind cu cei tip răspuns extins, sau, după cealaltă denumire, cu itemii tip eseu liber. După
definiţiile şi exemplificările prezentate, atât avantajele, cât şi limitele fiecărei categorii sunt
lesne de intuit. Altfel spus, dacă ne aflăm în sfera variantei răspuns restrictiv, sau a celei
structurate, vom beneficia de avantajele:
 uşurinţa mai mare a alcătuirii şi corectării;
 orientarea mai precisă a examinatului şi rezolvarea mai rapidă;
 notarea de regulă mai precisă;
 fidelitate bună
fiind prezentă totodată o limită majoră:
 posibilitatea redusă de măsurare a competenţelor de nivel maxim.
Dacă, dimpotrivă, promovăm varianta răspuns extins, ne vom confrunta cu avantajele
şi limitele exact în sens invers:
 posibilitatea cvasinelimitată de măsurare a capacităţilor de nivel taxonomic
maxim, bazate pe structura raţionamentului interpretativ, originalitate, reactivitate,
iar necesitatea fiindu-i simţită mai ales în domeniul ştiinţelor socioumane, dar fără
excluderea utilităţii în toate domeniile (vezi şi Bloom, 1971, p. 193 urm.);
ca avantaj esenţial, dar şi limitele:
 dificultatea proiectării, în concordanţă cu disponibilităţile elevului (de pildă, este
posibil ca proiectantul să pretindă anume parametri, iar examinatul să-şi focalizeze
prestaţia pe alţii);
 notare mai dificilă şi cu alocare de timp mai mare;
 o fidelitate mai mică.

TEMĂ DE REFLECŢIE
Formulaţi concluzia care vi se pare convenabilă, după constatarea, în paralelă, a avantajelor şi
limitelor de mai sus.

Testul eseu, în diferitele lui variante, trebuie să se conformeze următoarelor reguli de


proiectare:
 să fie folosit doar când nu este posibilă măsurarea obiectivă; aceasta din cauza
subiectivităţii pe care o implică în actul notării;
 utilizarea să ţină seama cu stricteţe de nivelul de înţelegere al elevilor; nu credem necesară
neapărat formula "Scrie un eseu despre………", fie şi la clasele gimnaziale (de cele
primare nici nu poate fi vorba, în această privinţă), dacă elevul încă nu şi-a definit bine
acest concept, mai proprie fiind "Scrie o lucrare ….."; un lucru nelămurit de la început în
modul optim este susceptibil să producă confuzie pe termen lung;
 în cazul eseului restrictiv precizia (până foarte aproape de testul obiectiv) cu care este
formulată sarcina trebuie să fie calitatea sa prioritară; de pildă:
CONSTANTIN MOISE

NU în forma: "De ce s-au rărit rândunelele ?",


CI în varianta: "Formulaţi trei-patru ipoteze pentru a explica dispariţia unei bune părţi
a rândunelelor", trebuie prezentată sarcina elevului;
 în cazul aceleiaşi variante, să i se facă, de asemenea precizările privind spaţiul de tratare şi
timpul alocat, astfel elevul fiind sprijinit să- şi organizeze prestaţia în formula cea mai
productivă.
 prin cerinţa formulată, să se facă trimitere exactă la nivelul taxonomic vizat; de pildă,
odată cu enunţarea conţinuturilor (temei) de tratat, să i se precizeze elevului şi aspectele ce
vor fi notate, cum ar fi: complexitatea şi organizarea logic-cauzală a ideilor, relevanţa
argumentelor, capacitatea de interpretare, toate ţinând vizibil de cele mai înalte nivele
taxonomice (analiză, sinteză, evaluare);
 punctajul şi schema de corectură să fie foarte minuţios elaborate, dată fiind subiectivitatea
potenţial mare a notării; la nevoie, schema de notare se poate chiar revizui, după începerea
corecturii şi constatarea nonrelevanţei ei în contextul prestaţiei examinatului.

V.2.2.3. Calităţile necesare testului docimologic


Testului docimologic i se pretind următoarele calităţi: obiectivitate, aplicabilitate,
validitate, fidelitate, fiind preluate de la testul psihologic, a cărui variantă aplicativă este. Sunt
menţionate, de asemenea, calităţile dezirabile pentru fiecare item de test, anume: un nivel
semnificativ de dificultate şi o capacitate de discriminare suficientă. Dintre autorii care au
fost preocupaţi special de problema evaluării şcolare (cf. Payne, 1971, p. 155 urm.; Ausubel şi
Robinson, 1981, p.677 urm.; Gronlund, 1971, p. 74 urm. şi 101 urm.; De Landsheere, 1975, p.
164 urm.; Lindeman, 1978, p. 479 urm.; I.T. Radu, 1981, p. 239 urm.), unii (I.T. Radu,
lucr.cit.) le specifică pe toate; alţii ignoră obiectivitatea, socotind-o, poate, absorbită în
celelalte, iar asupra aplicabilităţii nu se opresc prea amănunţit, probabil din aceleaşi
considerente. Dat fiind caracterul didactic al demersului de faţă, considerăm că este normal să
le menţionăm şi definim şi pe acestea, în context pedagogic. Adăugăm observaţia că autorii
Ausubel şi Robinson citează în plus, drept calitate obligatorie a testului docimologic,
caracterul reprezentativ al testului, care, la ceilalţi, este inclus în validitate. El înseamnă acea
calitate a testului de cuprinde ceea ce este relevant în curs, deci nu amănunte fără
semnificaţie.
Obiectivitatea se defineşte ca: acea calitate a testului constând din obţinerea aceloraşi
rezultate, indiferent de examinatorul (competent) care îl aplică. Este denumită şi prin expresia
"concordanţă interpersonală", cu referire la "persoana" celor care examinează. Fireşte că este
foarte necesară, putându-se asigura prin diverse măsuri: acordul prealabil al examinatorilor,
identitatea administrării, identitatea aplicării instrucţiunilor de notare. Mai trebuie notat că
identitatea rezultatelor este relativă (unele surse folosesc sintagma "rezultate comparabile", în
loc de "aceleaşi rezultate") (vezi şi L. Gavriliu, 1969, p. 18; de asemenea, A. Stan, 2002,
p.139).
Aplicabilitatea testului însumează în sine mai multe variabile: utilitatea informaţiei
pentru explicarea randamentului elevilor testaţi; potrivirea sarcinilor de rezolvat, ca formă şi
conţinut, cu nivelul de vârstă al subiecţilor; modul de corectare destul de simplu şi rapid;
timpul de aplicare destul de convenabil ca lungime; costuri convenabile. Şi ea este
importantă, dar se ia în discuţie numai după satisfacerea celorlalte.
Fidelitatea (denumită şi consecvenţă, precizie, siguranţă) constă din calitatea de a
măsura la fel de fiecare dată şi pe întreaga cuprindere a testului; sau: calitatea dată de "cât de
statornic este scorul unui test de la o măsurare la alta" (Gronlund, 1971, p. 100); sau din
calitatea de a da rezultate "consecvente cu ele însele" (Ausubel şi Robinson, 1981, p. 682). Se
poate determina în mai multe feluri. Unul dintre procedee este repetarea aplicării uneia şi
aceleiaşi variante de test, numit şi procedeul test-retest, în urma căruia prin statistici specifice
şi calcule matematice se poate determina coeficientul de stabilitate. Alt procedeu constă din
aplicarea, în paralelă cu testul ce se experimentează, a unei variante cu itemi echivalenţi, prin
el putându-se calcula coeficientul de echivalenţă. În fine, putem menţiona procedeul care
recurge la gruparea de o parte a itemilor impari, iar de alta a itemilor pari, apoi la stabilirea
corelaţiei dintre rezultatele celor două jumătăţi ale testului, fără să mai fie nevoie de repetarea
aplicării; se numeşte procedeul înjumătăţirii sau procedeul perechi-neperechi, iar din calcul
rezultă tot un coeficient de echivalenţă, numit (doar în acest caz) şi coeficient de fidelitate de
clivaj. Toţi aceşti coeficienţi pot fi denumiţi cu termenul generic de coeficienţi de corelaţie,
termen utilizat şi pentru stabilirea validităţii, cu deosebirea că, în acel caz, el are alte conotaţii.
Mai la îndemână ne este, şi în aceste situaţii, coeficientul de corelaţie Pearson.
Iată mai jos o scurtă demonstraţie de calcul al fidelităţii, prin metoda înjumătăţirii
(adică între itemii pereche şi cei nepereche). Pornim de la rezultatele obţinute la itemii impari
şi cei pari, centralizate în tabelul de mai jos.

Itemi X Y
X y X2 y2 xy
Subiecţi it.impari it. pari
1 6 3 2,64 -0,18 6,97 0,03 -0,48
2 5 4 1,64 0,82 2,69 0,67 1,34
3 4 4 0,64 0,82 0,41 0,67 0,52
4 1 2 -2,36 -1,18 5,57 1,39 2,78
5 1 4 -2,36 0,82 5,57 0,67 - 1,94
6 4 3 0,64 -0,18 0,41 0,03 -0,12
7 5 2 1,64 -1,18 2,69 1,39 -1,94
8 4 5 0,64 1,82 0,41 3,31 1,16
9 2 3 -1,36 -0,18 1,85 0,03 0,24
10 1 2 -2,36 -1,18 5,75 1,39 2,78
11 4 3 0,64 -0,18 0,41 0,03 -0,12
Media Media
Σ=32,55 Σ= 9,64 Σ= 4,27
3,36 3,18

Cum se vede, este un tabel cu două intrări: pe intrarea coloanelor sunt redaţi itemii, iar
pe cea a rândurilor sunt redaţi subiecţii examinaţi. Datele din tabel reprezintă prelucrarea
rezultatelor obţinute la un test (presupus) de 12 itemi de către un număr de 11 subiecţi,
numerotaţi pe rânduri, în stânga, de la 1 la 11. Coloana X reprezintă rezultatele de la itemii
impari, redate în dreptul fiecărui subiect respondent, iar coloana Y cuprinde rezultatele la
itemii pari. Coloana x redă variabila de deviaţie pentru itemii impari, rezultată din diferenţa
CONSTANTIN MOISE

între fiecare scor din coloana X şi media acestor scoruri, notată sub coloana X, adică 3,36
(deci: X - media coloanei X = 6 - 3,36 = 2,64 etc.). Coloana y redă aceeaşi variabilă de
deviaţie, dar pentru itemii pari (adică Y – media Y = 3-3,18= -0,18). Coloana x2 redă pătratele
variabilei de deviaţie pentru itemii pari, iar coloana y2 redă pătratele acestei variabile pentru
itemii pari. Coloana xy reprezintă produsul dintre valorile variabilelor de deviaţie ale itemilor
impari şi valorile variabilelor de deviaţie pentru itemii pari. Sub coloanele x2, y2 şi xy sunt
notate totalurile lor. De la aceste date pornind, calculăm coeficientul de corelaţie Pearson (r),
astfel:
Σxy
r=
Σx 2 ⋅ Σy 2

În cazul nostru, fiind vorba doar de o „jumătate” de test, „r”-ul lui Pearson se va
nuanţa sub forma r12. Deci:
Σxy 4,27
r12 = = = 0,24
Σx ⋅ Σy
2 2
32 ,55 ⋅ 9,64

Pe baza acestei corelaţii între jumătăţi, se calculează fidelitatea pe întregul test rt,
recurgând la o corecţie, cu ajutorul formulei Spearman-Brown, astfel:
2 ⋅ r12 2 ⋅ 0,24
rt = = = 0,38
1 + r12 1 + 0,24
Această cifră reprezintă o corelaţie slabă, considerându-se că valorile acceptabile sunt
între 0,70-0,90, iar cele ideale, peste 0,90 (cf. A. Stan, lucr. cit. p.147).
În finalul comentariului privind calculul fidelităţii, trebuie reţinute nişte precizări. Una
este că acest calcul pe bază de înjumătăţire este aplicabil doar testelor alcătuite din itemi cu
punctaje identice, de pildă de tip 1 punct pe fiecare item. În cazul celor cu punctaje inegale,
trebuie recurs la celelalte metode citate, de regulă la metoda test-retest, iar coeficientul de
corelaţie să fie stabilit fie tot prin formula Pearson, fie prin alte metode (vezi, de pildă,
metoda diferenţei de rang, în: Smith, G.M., 1971, pp.128 urm.).
Iată un exemplu de aplicare a unei formule dintre acestea „altele” citate în fraza
anterioară. Formula ilustrează calculul corelaţiei (în cazul nostru, al fidelităţii) prin metoda
diferenţei de rang. Ce înseamnă „rang” ştim de la cursul de Statistică, aşadar doar reamintim
conceptul pe scurt (rang = loc ierarhic al unui indicator în cadrul unei serii, loc indicat
numeric), fără să-l mai explicăm pe larg. Pentru aplicarea formulei de calcul în discuţie,
pornim de la datele din următorul tabel. Tabelul redă rezultatele obţinute de un număr de 15
subiecţi la un test, la prima aplicare (cea numită „test”) şi la aplicarea repetată identic (cea
numită „retest”).
Rezultat la Rezultat
Pătratul
prima la Rang la Rang la Diferenţă
Subiecţi diferenţei
aplicare repetare „test” „retest” de rang (D)
(D2)
(„test”) („retest”)
1 74 83 7 5 -2 4
2 86 89 2 4 2 4
3 73 76 8 7 -1 1
4 75 90 6 3 -3 9
5 63 68 12 13 1 1
6 72 92 9 2 -7 79
7 68 74 10,5 9 1,5 2,25
8 58 70 13 11,5 -1,5 2,25
9 45 36 15 15 0 0
10 90 94 1 1 0 0
11 78 70 4 11,5 -7,5 56,25
12 68 73 10,5 10 -0,5 0,25
13 48 54 14 14 0 0
14 81 80 3 6 3 9
15 77 75 5 8 3 9
n = 15 TOTAL 147

De aici pornind, datele se sintetizează în formula coeficientului de corelaţie (notat în


unele locuri cu ρ, în altele cu r’.
6ΣD 2 6 ⋅147 882
Iată formula: ρ = 1 − =1− =1− = 1 − 0,262 = 0,738 ; ceea
n ( n −1)
2
15 (15 −1)
2
3360
ce ar reprezenta un indice de fidelitate acceptabil.
Între factorii care pot influenţa fidelitatea se pot număra (vezi Gronlud, 1971, p. 112
urm; reluare în: Stoica, coord., 2001, p. 75; Ausubel şi Robinson, 1981, p. 684): lungimea
testului este în favoarea ei, ca şi dispersia mai mare a scorurilor (punctajelor acordate),
ambele generând probabilitatea unei corelaţii mai mari, în cazul repetării, cu răspunsurile de
la aplicarea anterioară; tipul itemilor utilizaţi, ştiut fiind că cei obiectivi sunt mai proprii
pentru o astfel de calitate; caracterul constant al motivaţiei şi rigoarea schemei de corectare şi
notare, de asemenea favorabile unei mai bune fidelităţi.
Validitatea în general este calitatea testului de a măsura ceea ce trebuie să măsoare,
sau, altfel spus, calitatea constând din coincidenţa dintre scopul în care a fost construit şi
măsurarea concretă pe care o realizează. Sunt menţionate în literatura domeniului mai multe
feluri de validitate (Landsheere, 1975; Grondlund, 1971; Lindeman, 1978; A. Stan, 2002, p.
159 urm.): validitate de conţinut, validitate de predicţie, validitate concurentă şi validitate de
construct. Fiecare dintre acestea are semnificaţia şi importanţa ei. Validitatea de conţinut
constă din corespondenţa între: de o parte obiectivele proiectate şi conţinuturile predate, de
altă parte rezultatele (comportamentele) pe care testul îşi propune să le verifice. După
sugestiile pe care ni le oferă autorii citaţi, în formularea de mai sus s-ar cuprinde următoarele
idei: dat fiind că un test nu poate cuprinde absolut toate conţinuturile tratate, el trebuie să se
orienteze asupra celor cu adevărat semnificative (De Landsheere, loc. cit., p. 167); pe de altă
parte, testul să nu se axeze pe conţinuturi "puţin subliniate" (Lindeman, lucr.cit., p.480) sau
capacităţi neexersate în cadrul procesului de învăţare parcurs (De Landsheere, idem, p. 168);
spre exemplu, în cadrul gramaticii din clasele primare, nu am predat nici un fel de informaţie
despre morfologie şi sintaxă, iar într-un test de selecţie la începutul ciclului următor îi cerem
candidatului să precizeze ce reprezintă o anumită expresie "pe plan morfosintactic"; sau, deşi
pe parcursul şcolarizării am cerut elevului, la matematică, să rezolve problemele "cum poate"
pur şi simplu, în cadrul aceluiaşi test de selecţie citat îi cerem să le rezolve "pe mai multe căi".
La rândul ei, validitatea de predicţie, denumită în unele surse validitate externă (I.T. Radu,
CONSTANTIN MOISE

1981, p. 244), se concretizează în calitatea testului de a anticipa corect un succes viitor al


celui examinat. De pildă, dacă examinăm elevul printr-un test care cuprinde itemi de înmulţire
şi împărţire, acordându-i un punctaj foarte bun, iar în etapa următoare de instruire el deprinde
uşor ridicarea la putere şi extragerea rădăcinii pătrate, este semnul unei bune validităţi de
predicţie. Validitatea concurentă (sau concordantă) este dată de corespondenţa dintre
rezultatelor unui test dat cu rezultatele obţinute prin alte probe, "paralele" cu ele, sau altfel
spus, de măsura în care rezultatele testului pe care îl experimentăm sunt confirmate de alte
probe, aplicate "sincronic" şi axate pe acelaşi comportament (Lindeman, idem, p. 481). Să
presupunem că testul nostru pune în evidenţă nivelul bun al aptitudinilor matematice bazate
pe gândirea divergentă (rezolvarea problemelor prin metode inedite, de pildă), iar aprecierile
noastre sunt în acord cu cele obţinute de elev în competiţiile şcolare concomitente, axate pe
aceleaşi aptitudini. În fine, pentru prezentarea validităţii de construct (a cărei definire pare
mai controversată; cel puţin aşa reiese din unele surse menţionate mai sus) facem apel la
spusele lui Gronlund: "Validitatea de construct poate fi definită ca măsura în care
performanţele testului pot fi interpretate în funcţie de anumite constructe psihologice";
"Exemple obişnuite de constructe sunt inteligenţa, atitudinea ştiinţifică, gândirea critică,
înţelegerea lecturii, abilităţile de studiu, aptitudinea matematică" (1971, p. 90). Dacă, de
exemplu, printr-un test ne-am propus să măsurăm abilitatea de a rezolva un anumit tip de
probleme, itemii lui să se muleze pe acel "model de comportament" (construct); dacă,
dimpotrivă, aceştia se pierd în formulări complicate, care sunt proprii mai ales abilităţii
lingvistice sau retorice, el nu măsoară coordonatele constructului vizat.
Şi validitatea poate face obiectul unor calcule matematice. De pildă, pentru validitatea
de conţinut, avându-se în vedere marea autoritate a experţilor în materie, a fost propusă o
formulă care pune în valoare în mod prioritar opinia lor, bazată pe analiza, în paralelă, a
conţinuturilor propuse spre măsurare şi a celor reflectate de test. Este formula "validităţii
logice de conţinut" (engl. content validity ratio), redată astfel:
N
Ne −
CVR = 2
N
2
în care Ne = numărul evaluatorilor experţi; N = numărul total al evaluatorilor (experţi şi
decidenţi nonexperţi). Exprimat cifric, coeficientul de validitate de conţinut poate varia între
+1 şi -1; va fi cu atât mai bun cu cât numărul experţilor este mai bine reprezentat.
Despre determinările matematice privind celelalte tipuri de validitate, putem face, în
acest context, doar afirmaţia generală că cele mai accesibile se limitează la coeficienţii de
corelaţie între predictor şi criteriu; predictorul este rezultatul obţinut prin testul pe care îl
experimentăm, iar criteriul este rezultatul altei probe, care trebuie să-l confirme sau infirme pe
acesta. De exemplu: rezultatul unui examen de admitere este predictor pentru rezultatele la
învăţătură din anul imediat următor, iar acestea sunt criteriul, confirmând sau infirmând
validitatea examenului de admitere. Se poate calcula, între altele, tot prin formula
coeficientului de corelaţiei după K. Pearson, ca în cazul calculului fidelităţii (vezi, pentru
detalii, A. Stan, 2002, p.156 urm.). Nivelele acceptabile ale acestui coeficient variază între
0,30-0,39 (limită minimă de acceptabilitate), 0,40 - 0,49 (nivel bun) şi 0,50 - peste 0,50
(excelent) (idem, p. 173).
Care sunt factorii care pot influenţa negativ validitatea (vezi şi Gronlund, 1971, p. 93
urm.)? Unii dintre ei "sălăşluiesc" în testul însuşi, cum ar fi: neclaritatea instrucţiunilor, care
poate devia răspunsurile de la linia lor normală; dificultatea prea mare, datorată fie
vocabularului, fie modului de formulare a itemilor, conducând la abordarea insuficientă de
către elevi; lungimea prea mică, de unde lipsa reprezentativităţii conţinuturilor testate;
aşezarea şablon a propunerilor de răspuns (de exemplu, itemi cu patru enunţuri, ale căror
răspunsuri corecte să fie mereu în ordinea A A F F). Alţi factori emană din modul de
administrare, respectiv: timpul limitat de răspuns, determinând parcurgerea incompletă a
probei; eventualul sprijin prea mare cerut şi căpătat de elev, făcând ca testul să măsoare nu ce
şi-a propus, ci "meritul" celui care l-a ajutat. În fine, se pot cita factori ţinând de starea
examinatului pe parcursul probei, cum ar fi emotivitatea crescută sau lipsa de motivare,
ambele determinând ineficienţa concentrării. Se înţelege că toţi aceşti factori trebuie
preîntâmpinaţi, prin măsurile cele mai proprii.
Redăm un minim de idei şi despre calităţile fiecărui item din alcătuirea testului.
Astfel, nivelul de dificultate normal al itemului, se poate defini drept calitatea care asigură
abordarea concludentă a acestuia de către subiecţii testaţi, în raport cu scopul urmărit.
Exagerarea dificultăţii sau, dimpotrivă, minimalizarea ei denaturează rezultatele în măsură
egală: cea dintâi, prin generarea imposibilităţii de abordare pentru o parte însemnată din
grupul examinat; cea de a doua, prin desfiinţarea diferenţei dintre grupele de nivel conţinute
de grup.
Capacitatea de discriminare a itemului, la rândul ei, reprezintă puterea fiecărui item
de a delimita corect grupele de nivel, ale examinaţilor, pe ansamblul testului dat, contribuind
la o clasificare echitabilă a acestora din urmă. Cum reiese chiar din frazele imediat anterioare,
capacitatea de discriminare poate fi influenţată de nivelul de dificultate; ceea ce dovedeşte
legătura indisolubilă dintre cele două.
Ambele însuşiri ale itemilor (nivelul de dificultate şi capacitatea de discriminare) vor
influenţa cel puţin unele calităţi ale testului în general, respectiv validitatea şi aplicabilitatea.
Trebuie spus, de asemenea, că atât nivelul de dificultate cât şi capacitatea de discriminare pot
fi determinate matematic (vezi, în capitolul destinat proiectării testului, analiza de item, cu
calculele aferente).

TEMĂ DE REFLECŢIE
Cum explicaţi influenţa nivelului de dificultate şi al capacităţii de discriminare asupra
aplicabilităţii şi validităţii?

V.2.2.4.Proiectarea testului docimologic


Cu acest titlu desemnăm demersul de alcătuire conform cu scopurile anticipate, de
experimentare şi ajustare a fiecărui test, în contextul practic dat. Demersul în discuţie a fost
trasat în mai multe forme şi nuanţe, începând cu schema cea mai simplă, schiţată de Bloom
(cf. 1971, p. 63 urm.), continuând cu cele aparţinând lui Payne (cf. 1971, p.27 urm.), lui
CONSTANTIN MOISE

Gronlund (cf. 1971, p. 149 urm.), lui Lindeman (cf. R. Lindeman, 1978) şi încheind cu
contribuţiile aplicative româneşti (cf. I. T. Radu, 1981 şi 2000; A. Stoica, coord., 2001; C.
Cucoş, 2002 ş.a.).Cum expunerea tuturor opţiunilor şi nuanţelor sugerate de fiecare autor ar fi
prea complicată şi nu în totul utilă, vom puncta doar aspectele esenţiale şi modul de
implementare a lor într-un demers practic.
Iată cum se prezintă algoritmul acestei proiectări, după Bloom (loc. cit.):
 se întocmeşte un tabel de specificaţii;
 se elaborează itemii corespunzători fiecărei celule din cadrul tabelului (vom explica mai
jos ce este o "celulă");
 se selecţionează , din total, itemii care vor intra în alcătuirea testului;
 se asamblează itemii pe subgrupe de comportamente, după un plan sistematic;
 se stabileşte o schemă de notare (scoring);
 se elaborează indicaţiile necesare pentru subiecţii examinaţi;
 se probează calităţile tehnice ale testului, în vederea eventualei revizuiri.

Vom aborda mai jos acelaşi algoritm, valorificând în linii mari şi completările
relevante datorate celorlalţi autori citaţi şi subliniind că el este axat net prioritar pe tipul: test
elaborat de profesor (şi doar tangenţial se fac referiri la cel standardizat).
Pasul 1: stabilirea tipului de test; de pildă, într-un caz construim un test criterial, în
altul, un test normativ; într-un caz, unul prognostic, în alt caz, unul diagnostic etc. Necesitatea
acestei precizări este impusă de scopul diferit pe care îl vizează, de conţinuturile diferite cu
care poate opera, precum şi de modul diferit în care este interpretat şi eventual revizuit.
Pasul 2: alcătuirea unui tabel de specificaţii (denumit şi matrice de specificaţii).
Tabelul este axat pe o temă concretă şi are rostul de a delimita conţinuturile ce vor fi cuprinse
în test şi nivelele taxonomice ale obiectivelor cu care ele sunt corelate. Pentru o mai uşoară
înţelegere, iată un asemenea tabel, având o temă din sfera matematicii, să zicem, pentru clasa
a IV-a:

TEMA: Operaţii cu numere naturale


Conţinuturi
Achiziţia informaţiei Înţelegere Aplicare Analiză Total
Obiective
1. Terminologie 5/ 1.1, 2.1. 5
2. Relaţii, transformări 5 20/.... 5 30
3. Utilizări, aplicaţii 5 20 25
4. Probleme 5 5 30 40
Total 15 30 25 30 100

Cum se vede, avem în faţă un tabel cu două intrări: intrarea pe rânduri se referă la
categoriile de conţinuturi cu care vom opera în cadrul testului; intrarea pe coloane indică
obiectivele reflectate în itemii testului, pe nivele taxonomice (după taxonomia lui Bloom,
redată numai până la nivelul analizei). La fiecare întretăiere a rândurilor cu coloanele se
delimitează o "celulă", iar în celulă un număr redă procentele de itemi (din totalul itemilor
consacraţi întregii teme) ce vor fi folosiţi în alcătuirea testului. Să spunem că este preconizat
ca testul să fie format din 40 itemi; înseamnă că 5% din total (identificaţi-l în tabel), adică 2
itemi, vor fi alocaţi celulei care vizează terminologia de recunoscut sau de redat din memorie
(celulă rezultată din intersectarea conţinuturilor constând din terminologie, cu nivelul
taxonomic achiziţia informaţiei); 30%, adică 12 itemi, pentru celula vizând rezolvarea de
probleme, la nivelul taxonomic analiză (rezultată din întretăierea rândului conţinuturilor
constând din probleme cu coloana reprezentând analiza) etc.
Pasul 3: construirea primei variante a testului (o numim prima, pentru că este posibil
să fie revizuită). Este compus din mai multe operaţii, adică (vezi şi I.T. Radu, 2000, p. 242):
a) formularea, pentru fiecare celulă, a itemilor aferenţi; din diversele surse reiese că
este indicat să fie construiţi şi unii în plus faţă de cifra din celulă, dată fiind eventualitatea
renunţării la unii, propuşi iniţial şi înlocuirii cu alţii dintre cei construiţi în plus; odată cu
aceasta, s-ar impune formularea instrucţiunilor pentru elev şi a obiectivelor de evaluare
(în scopul orientării punctajului la fiecare răspuns), din care să rezulte atât
comportamentul observabil, cât şi nivelul de dificultate (potrivit sugestiei din
documentele SNEE, de a însoţi ca fiecare item să fie însoţit şi ghidat de un obiectiv de
evaluare);
b) selectarea, din itemii formulaţi, a celor consideraţi mai semnificativi pentru redarea
comportamentelor vizate;
c) construirea concretă a testului, prin asamblarea itemilor selectaţi
d) adoptarea unei scheme de corectare şi notare;.
Câteva precizări sunt strict necesare pentru operaţiile menţionate la punctele a), c) şi
d). Precizările pentru punctul a) se rezumă astfel: fiecare item conceput trebuie să respecte
lista de cerinţe privitoare la modul de construire a tipului în care el se încadrează. De pildă, să
zicem că testul nostru cuprinde un număr de itemi de tip răspuns alternativ, în acest caz
trebuind să respectăm cerinţele de alcătuire ale acestui tip de itemi; că ar conţine şi itemi de
tip alegere multiplă, cu alte cerinţe de respectat etc. (vezi lista detaliată a acestor cerinţe la
titlul dedicat tipurilor de itemi).
Pentru punctul c), precizările se referă la reguli vizând asamblarea testului, pe de o
parte, şi conceperea timpului necesar pentru abordarea testului de către elevi, pe de altă parte.
Astfel, mai mulţi autori citaţi mai sus (cf. Bloom, lucr.cit., p. 63; Gronlund, loc.cit., p. 237;
Lindeman, loc.cit.) menţionează că itemii trebuie să fie grupaţi pe secţiuni omogene (adică
fiecare secţiune să cuprindă un singur fel de itemi), iar în interiorul fiecărei secţiuni
dificultatea itemilor să apară ordonat, de la mai mică la mai mare. Raţiunea care stă la baza
acestei exigenţe constă din evitarea fie a derutei elevului, fie a unui consum mare de energie
din partea acestuia, fie din sprijinirea tuturor categoriilor de elevi în abordarea testului, până
la nivelul de care este capabil fiecare. În acelaşi scop, al înlesnirii cel puţin a abordării
testului în întregime, lungimea lui trebuie concepută astfel încât timpul să permită parcurgerea
lui de către aproximativ 80% dintre elevii cărora li se adresează (cf. Lindeman, lucr.cit.
p.493). Precizările la punctul d) trebuie să hotărască modul de realizare concretă a corectării şi
notării testului pe care tocmai îl proiectăm. Referinţele la acest subiect etalează demersuri şi
concluzii diverse. Astfel, un autor român contemporan (A. Stoica, coord., 2001, p.85) afirmă
despre notarea itemilor obiectivi şi semiobiectivi că ea ar fi destul de simplă, implicând doar
CONSTANTIN MOISE

însumare de puncte, care au fost stabilite cu rigoare pentru fiecare răspuns. După opinia lui G.
De Lansheere, exprimată cu mai mulţi ani în urmă (cf. 1975, p. 51 urm.), când avem a face cu
teste formate numai din itemi obiectivi, notarea capătă chiar denumirea de notare obiectivă şi
trebuie efectuată după o anume formulă (vezi explicaţia pe larg, la titlul despre notare),
precedată de unele demersuri statistice. Mai dificil de realizat se consideră notarea itemilor
subiectivi, respectiv a testelor formate numai din itemi de acest fel. Acelaşi autor român citat
mai sus (Stoica, lucr. cit.), citându-i pe unii autori occidentali, (de pildă, L. Carey, 1988;
J.L. Thyne, 1978) propune utilizarea a două tehnici de notare pentru itemii de acest fel,
anume: notarea analitică şi notarea holistică (globală). La rândul său, De Landsheere descrie
patru tehnici de notare "subiectivă": metoda impresiei generale, metoda scărilor de specimene,
metoda analitică şi metoda însumării frecvenţelor. Luând notă şi de schemele de notare
propuse de autorul român, le vom prefera pe cele descrise de De Landsheere, părând mai
accesibile şi mai lesne de aplicat. Le vom prezenta mai detaliat în capitolul special consacrat
notării.
Pasul 4: pretestarea variantei iniţiale. Este etapa de probă, sau de încercare, constând
din aplicare asupra populaţiei şcolare căreia i se va adresa. Rostul acestei etape este de a
constata calităţile testului, iar în funcţie de constatări, să se poată opera eventuale
îmbunătăţiri. Mai trebuie menţionat că amploarea şi rigoarea experimentării vor fi diferite
după statutul testului. Dacă avem a face cu un test "intern" (făcut de profesor în vederea
evaluării propriilor elevi), aplicarea va fi de amploare mai mică şi numai în interiorul propriei
şcoli, cu sprijinul altor colegi (cf. De Landsheere, lucr.cit., p. 80). Dacă este vorba de un test
"extern" şi standardizat , aplicarea este mult mai minuţioasă, implicând o populaţie de subiecţi
foarte cuprinzătoare şi fiind realizată de specialişti în domeniul evaluării. Oricum, şi într-un
caz, şi în altul, pe baza rezultatelor ce se vor obţine, se vor încerca determinările cuvenite
asupra celor patru parametri de primă importanţă ai testului, în atare situaţie: validitatea,
fidelitatea, nivelul de dificultate şi capacitatea de discriminare.
Validitatea interesează în diversele ei nuanţe: de conţinut, de predicţie, concurentă.
Cea de conţinut este normal să fi fost deja asigurată odată cu construirea testului; de către
profesor - cel puţin empiric, prin compararea cerinţelor testului cu conţinuturile cele mai
reprezentative pe care le-a predat şi exerciţiile tipice realizate cu elevii; de către specialişti -
inclusiv prin consultarea experţilor şi realizarea, odată cu aceasta, a unui bun coeficient al
validităţii logice de conţinut (vezi calculul, în capitolul unde este prezentată validitatea). Cea
concurentă se poate determina de către ambii conceptori şi pe calea observării concomitente a
rezultatelor "concordante" obţinute prin alte probe, şi prin eventual calcul al coeficientului de
corelaţie Pearson (dacă structura testului este adecvabilă acestui calcul, ştiind că testul
docimologic nu se suprapune total cu "tiparul" testului psihologic în general). Aceleaşi
afirmaţii ca în cazul validităţii concurente considerăm valabile în ce priveşte stabilirea
validităţii de predicţie; şi ea este pretabilă aceloraşi proceduri, cu aceleaşi condiţii.
Fidelitatea ar putea fi stabilită, de asemenea de ambii conceptori - profesorul, pentru
testul intern; grupul de specialişti, pentru cel standardizat - uzând de una din procedurile de
calcul prezentate în capitolul anterior: metoda înjumătăţirii, dacă testul conţine itemi cotaţi la
fel (fiecare item cu acelaşi punctaj), în acest caz recurgându-se la coeficientul Pearson,
corectat prin formula Spearman-Brown; metoda test-retest (aplicare repetată) şi stabilirea, pe
această bază, tot a corelaţiei după formula Pearson. Mai trebuie reţinut că, în cazul testului
alcătuit din itemi diferiţi, grupaţi pe secţiuni omogene (de pildă, o secţiune conţine itemi tip
alegere duală, alta conţine de cei cu alegere multiplă etc.), psihologii sugerează recurgerea la
comparaţie "pe subscale", adică prin gruparea itemilor pe categorii reprezentate de itemi cu
acelaşi punctaj.
Este posibil ca, la finele demersului de constatare a validităţii şi fidelităţii, să găsim
nişte valori neconvenabile ale coeficienţilor vizaţi. În acest caz trebuie să "consultăm" lista
factorilor care le influenţează (vezi în capitolul anterior) şi să încercăm a-i modifica în sensul
unei mai bune calităţi a testului.
Ultimele operaţii din cadrul pretestării se obiectivează în determinarea calităţilor
fiecărui item: nivelul de dificultate, puterea de discriminare, iar pentru unele tipuri de itemi,
chiar şi calitatea distractorilor, ceea ce se realizează prin analiza de item, comentată mai
mult sau mai puţin detaliat în toate sursele citate mai sus.
Iată ce secvenţe parcurge această metodă şi cum se finalizează ea în fiecare caz de
utilizare (vezi mai ales: Lindeman, lucr.cit., p. 495 urm.; I.T. Radu, 1981, p. 236 urm.). Să
presupunem că am aplicat, de probă, testul preconizat odată cu întocmirea tabelului de
specificaţii, pe un eşantion de 40 de elevi. Facem mai întâi o situaţie din care să reiasă ce scor
total a realizat fiecare subiect respondent. Împărţim apoi totalul respondenţilor, după
punctajul realizat la întregul test, în patru segmente egale (unii autori preferă cinci segmente,
dar acest amănunt nu este important), astfel: un segment superior (primii 10), două segmente
mijlocii (următorii 20), un segment inferior (ultimii 10). Reţinem, pentru calcule, numai
segmentele extreme, adică primii 10 clasaţi şi ultimii 10. Pe baza lor, calculăm pe rând cei doi
indicatori pentru fiecare item, adică indicele de dificultate şi cel de discriminare, iar unde este
cazul, şi puterea de discriminare a distractorilor.
Pentru calculul indicelui de dificultate (Idif) al fiecărui item se procedează astfel: se
constată, să presupunem, că un item anume a fost rezolvat de 7 elevi din segmentul superior şi
2 elevi din segmentul inferior; aplicăm formula:

Cs + Ci 7 + 2
Idif = = = 0,45 , adică 45% din subiecţi.
2⋅n 2 ⋅ 10

Simbolurile din formulă au semnificaţiile: Cs = răspunsuri corecte în segmentul


superior; Ci = răspunsuri corecte în segmentul inferior; n = numărul subiecţilor dintr-un
segment. Indicele ce se poate realiza variază între 0 şi 1 (notat şi în procente). Cu cât este mai
aproape de 0, avem a face cu un item mai greu, după cum apropierea mai mare de 1 denotă o
dificultate mai mică. Se consideră că, în cazul unui test normativ, dificultatea optimă este
între 0,4 - 0,5, ceea ce dovedeşte că în cazul nostru concret indicele 0,45 este foarte bun.
Discriminarea, la rândul ei, trebuie să se facă între elevii buni şi cei slabi pe
ansamblul testului (adică nu după cum îi ştim din activitatea anterioară). Pentru calculul
indicelui de discriminare (Idis) se foloseşte o formulă bazată pe numărul răspunsurilor greşite
CONSTANTIN MOISE

din fiecare segment. Procedând prin eliminare, în cazul nostru vom avea 3 răspunsuri greşite
în segmentul superior şi 8 în cel inferior. De această dată aplicăm formula:

Gi − Gs 8 − 3
Idis = = = 0,5 , adică 50%.
n 10

Simbolurile nou apărute sunt: Gi = răspunsuri greşite în segmentul inferior; Gs =


răspunsuri greşite în segmentul superior, n fiind deja cunoscut din formula anterioară.
Rezultatul posibil al acestui calcul este între -1 şi +1; când este +1, avem a face cu o
discriminare maximă în favoarea subiecţilor buni; -1 indică o discriminare negativă, după care
toţi din segmentul superior au greşit, iar din segmentul inferior nici unu, ceea ce este absurd,
sugerând renunţarea la acel item. În cazul unui test normativ, discriminarea optimă se
consideră a fi peste 0,7. De unde rezultă că rezultatul itemului nostru (0,5) nu este destul de
discriminant.
Am făcut mai sus menţiunea că observaţiile privind nivelul optim al dificultăţii şi
discriminării trebuie raportate numai la testele normative, utilizate în special în scopul
clasificării elevilor. Adăugăm că în cazul testelor criteriale, deşi se pot calcula, atât
dificultatea cât şi discriminarea, nici una dintre ele nu mai pun probleme de optimalitate şi de
revizuire a itemilor. Fiindcă rostul testelor criteriale este să reliefeze realizarea oricăruia dintre
obiective (oricât de grele, oricât de uşoare), în perspectiva sprijinirii elevului să-şi
îmbunătăţească rezultatele, ele având, deci, scopuri prioritar formative.
În fine, să explicăm din ce constă determinarea forţei distractorilor, adică a
variantelor de răspuns neadevărate, ele având rostul de a-i obliga pe examinaţi să facă efort
pentru a găsi răspunsul corect. Precizăm mai întâi că această determinare este necesară doar în
cazul itemilor cu răspunsuri la alegere, în special alegere multiplă. De dorit este: pe de o
parte, fiecare distractor să atragă măcar un minim de opţiuni, adică să fie ales de unii dintre
subiecţi; pe de alta, cei care optează pentru distractori să fie mai frecvent din segmentul
inferior. Iată un exemplu de item cu mai multe alegeri posibile (apud Lindeman, loc. cit., p.
497):
Variante de răspuns
Total răspunsuri
A B C D E
Alegeri subiecţi din segmentul superior 3 5 1 1 0 10
Alegeri subiecţi din segmentul inferior 6 0 1 1 2 10

Răspunsul corect este B. Toţi distractorii "funcţionează", dovada fiind că fiecare (adică
A,C, D, E) au atras cel puţin câte o opţiune. Cel mai puternic distractor este A, cu 9 alegeri;
semnificaţia distragerilor este normală, ele fiind mai mult în segmentul inferior.
Pasul 5: definitivarea testului după constatarea atât a aspectelor normale, cât şi a
eventualelor insuficienţe, potrivit analizelor din cadrul pasului 4.
Observaţie: elaborarea se opreşte aici, dacă este vorba de teste pentru examene interne. În
cazul celor externe, este nevoie şi de definitivarea instrucţiunilor de administrare, precum şi a
celor de corectare şi notare.
V.2.3. Metode complementare de evaluare şcolară
Este vorba despre o suită de proceduri, determinate pe alocuri şi cu atributul
alternative. După părerea noastră, este bine să preferăm determinantul complementare, care
învederează cel mai bine locul şi rolul lor pe lângă cele de bază, descrise până aici, adică de a
completa cu ceva demersul acestora, însă nu de a le înlocui. Sunt prezentate şi descrise sub
nume şi în număr variabile, de surse diferite: metode "nontest", de către D. Payne (1968, p.30
urm.), "tehnici observative" (observational technics) şi de autoapreciere, de către Gronlund
(1971, p.409 urm.), metode complementare, după documentele SNEE (cf. M. Mândruţ, 2001,
p.51 urm.). Nominalizate, metodele înscrise în cele trei surse citate se prezintă astfel:
observarea sistematică a activităţii şi comportamentului elevilor, investigaţia, proiectul,
portofoliul, autoevaluarea. Motivaţia utilizării lor, pe lângă cele de bază, se rezumă astfel:
metodele de bază (ascultare, probe scrise tradiţionale, probe practice cu scopuri docimologice,
probe tip test) scot în relief mai ales informaţia posedată de elev şi capacităţile lui de ordin
cognitiv şi practic-aplicative, în condiţii de confruntare strictă între examinatorul care
întreabă şi elevul care răspunde; metodele complementare aduc ceva în plus şi în privinţa
rezultatelor măsurate, şi a avantajelor rezultate din forma de aplicare: drept rezultate
măsurate, ele scot la iveală şi comportamente de ordin afectiv, şi comportamente sociale
bazate pe însuşiri de personalitate, şi capacităţi cognitive deosebit de complexe, chiar
capacităţi evaluative, nici unele dintre acestea neputând fi decelate amănunţit prin metodele
de bază; ca mod de aplicare, prezintă avantajele că nu întotdeauna solicită prezenţa ambilor
actori (evaluator şi evaluat), permiţând derularea simultană cu alte procese, sau că în cea mai
bună parte angajează plenar elevul, deprinzându-l să -şi întocmească singur "cartea de
vizită", inclusiv să se autoevalueze.
Observarea sistematică a activităţii şi comportamentului elevilor este definită
aproape în întregime de titulatura ei, la aceasta adăugând că ea trebuie să fie planificată,
repetată pentru a deveni reprezentativă, înregistrată precis în vederea prelucrării.
Instrumentele sau suporturile de care dispune se suprapun cu trei tehnici observative descrise
de Gronlund: fişele de evaluare (anecdotal reckords), scările de apreciere (rating scales) şi
listele de control (checklists).
O FIŞĂ DE EVALUARE are o rubricaţie specifică, cuprinzând: numele elevului, data
înregistrării evenimentului, clasa din care face parte elevul, disciplina în cadrul căreia se
înregistrează evenimentul, care este evenimentul, cum îl interpretăm. Pe baza evenimentelor
cu adevărat relevante, stabilim concluziile care se impun, cu privire la calităţile proprii
fiecărui elev, iar odată cu acestea, modul în care să fie orientat, îndrumat, sprijinit. Ca avantaj
esenţial, se reţine "independenţa" observatorului faţă de elev, în sensul că, pe parcursul
observării, nu trebuie să comunice neapărat cu acesta din urmă. Dezavantajul cel mai
important este consumul de timp, ca în cazul metodei observaţiei în genere.
SCARA DE CLASIFICARE (rating scale) este un fel de grilă, pe care se înregistrează nivelul
de intensitate a unor atitudini sau rangul unei calităţi, stabilite în cooperare cu cel evaluat. Ca
exemple concrete în limitele acestei proceduri, se pot prezenta nişte modele de enunţuri,
CONSTANTIN MOISE

însoţite de o scară ierarhică a unei însuşiri sau a unei atitudini; de pildă, pe scara Likert (cf.
Stoica, coord., 2001, p. 54; vezi şi Gronlund, lucr. cit.), după cum urmează:
ENUNŢ PENTRU ELEV: "Agreez postura de a accepta şi punctul de vedere al altuia".
TREPTE DE INTENSITATE: "acord puternic"; "acord"; "nedecis"; "dezacord";
"dezacord puternic".
Enunţului de mai sus i se adaugă altele, cu care să alcătuiască împreună un set de
enunţuri, pentru a face posibile nişte concluzii suficient de semnificative. Elevul trebuie să
"bifeze" treapta care îi este proprie. Elementul de referinţă din cadrul treptelor poate fi şi altul,
de pildă frecvenţa: mereu, frecvent, ocazional, rar, niciodată.
LISTA DE CONTROL (checklist) este construită mai simplu, sub forma unor enunţuri cu
numai două variante: da - nu. Rostul ei este să marcheze doar prezenţa sau absenţa unei
însuşiri, deprinderi, atitudini, unui anume comportament etc., deci fără a o mai ierarhiza. Spre
exemplu, pe parcursul participării elevului la o suită de manifestări comemorative şi ştiinţifice
din şcoală, el a fost investit cu o anume responsabilitate. Considerându-i-se această calitate,
s-au înregistrat aspecte semnificative ale comportamentului său, pe următoarea listă de
enunţuri:
Elevul X:
 s-a conformat sarcinilor încredinţate da nu
 a colaborat bine cu toţi organizatorii da nu
 a fost remarcat ca bun organizator da nu
 a asigurat o bună comunicare între participanţi da nu
 s-a remarcat prin calm şi politeţe da nu
Atât prima listă formulată, cât şi aceasta din urmă sunt utile pentru completarea
tabloului evaluativ al fiecărui elev, cu condiţia unei întocmiri clare şi a unei interpretări
competente.
Investigaţia poate fi considerată un fel de studiu de caz solicitat elevului spre
soluţionare, cu care ocazie el îşi va aplica în mod conştient achiziţiile şcolare, în măsura
posibilităţilor chiar creativ. O putem defini, de asemenea, ca un suport al evaluării "învăţării
de a învăţa" sau "învăţării de a cunoaşte"(vezi şi I.T. Radu, 2000, p. 224). Se poate concepe ca
o temă de lucru pentru elev, cu durata fie de o singură oră, fie de mai multe ore, pe care să o
organizeze (împreună cu profesorul) şi să o finalizeze (de preferinţă singur).
EXEMPLU: "Stabiliţi printr-o cercetare proprie calităţile esenţiale ale unei cărţi şcolare". Se
înţelege că studiul va dura mai mult de o oră.
Lucrările teoretice existente menţionează o suită bine definită de indicatori implicaţi în
acest demers, parte dintre ei vizând profesorul, dar cea mai mare fiind în sarcina elevului (cf.
Mândruţ, 2001). Astfel, înainte de lansarea investigaţiei, profesorul să aibă bine definite
următoarele: ce informaţii, deprinderi, abilităţi posedate de elev vor trebui angajate în
demers; la ce nivel de complexitate se va situa cercetarea; care vor trebui să fie rezultatele
investigării şi cum vor fi apreciate. Profesorul are de asemenea obligaţia de a participa la
unele etape ale investigaţiei, cu deosebire la definirea problemei de investigat şi la alegerea
metodologiei adecvate. Şi pentru elev sunt rezervate atribuţii precise: participare la toate trei
etapele demersului (definirea problemei, alegerea metodelor, identificarea soluţiilor) şi
angajare deplină în acţiunile concrete alcătuitoare ale acestuia (descrierea caracteristicilor
obiectelor prezente în investigaţie, utilizarea mijloacelor specifice de cercetare, identificarea
factorilor implicaţi în cercetare). Se menţionează, apoi, capacităţile pe care trebuie să le
probeze elevul şi care să fie evaluate, oferind metodei specificul necesar (cf. Stoica, coord.,
2001): creativitate şi iniţiativă; capacitate de preluare a conducerii grupului; capacitate de
cooperare; perseverenţă; deschidere spre noi idei.
Proiectul, potrivit menţionatelor documente ale SNEE, este definit ca "un demers
evaluativ mult mai amplu decât investigaţia", dar evident de aceeaşi esenţă cu aceasta. Începe
în clasă odată cu definirea sarcinii şi cu explicaţii asupra soluţionării. Continuă mai multe zile
sau săptămâni, în afara clasei, pe "teren", cu adunarea de date, cu prelucrarea lor, cu realizarea
unui "produs". Se încheie în clasă prin prezentarea unui raport sau chiar a produsului realizat.
Este conceput şi realizat pe un algoritm specific unei acţiuni de mare anvergură, cuprinzând
paşii: stabilirea domeniului de interes; stabilirea cadrului conceptual şi metodologic;
identificarea surselor de informare; precizarea elementelor de conţinut ale proiectului. Un
exemplu de proiect ar fi următorul: "Evoluţia intelectuală a copiilor instituţionalizaţi".
Derularea lui se poate produce mai ales ca o suită de studii de caz, realizate prin efort
individual şi de grup. Sursele documentare folosite sunt fie primare (obţinute prin observări,
anchete, experimente etc.), fie secundare (lucrări de specialitate, articole, studii pe aceeaşi
temă etc.). Aprecierea se face atât asupra procesului (înţelegerea sarcinii de către elev;
calităţile documentării; creativitatea), cât şi asupra produsului (validitatea proiectului;
completitudinea proiectului; structurarea proiectului etc.). În plus, sunt exprimate nişte
calităţi proprii elevului participant, anume: capacitatea de prezentare a proiectului;
adecvarea metodelor la obiectivele propuse; adecvarea materialelor şi echipamentelor la
specificul acţiunii; determinarea corectă a soluţiilor; posibilitatea de generalizare a
soluţiilor.
Sursele care susţin cele afirmate în dreptul ambelor ultime metode de mai sus
consideră că aceste afirmaţii sunt dovezi suficiente că ele (metodele) reprezintă cele mai
proprii modalităţi de reliefare a calităţilor elevului de eventual om de ştiinţă în formare.

APLICAŢIE
Propuneţi-vă o temă de investigaţie sau de proiect şi schiţaţi derularea ei.

Portofoliul este definit, în lucrările de cultură generală, drept totalitatea lucrărilor aflate
la dispoziţia unei edituri, la un moment dat, în vederea publicării. Aşa trebuie să se fi gândit şi
iniţiatorul metodei de evaluare cu acest nume, utilizată în plan şcolar. Denumită de unii
autori şi cu expresia "raport de evaluare" (vezi I.T. Radu, 2000), iar de alţii "cartea de vizită
a elevului" (vezi Stoica, coord., 2001), această procedură fiinţează deja în limbajul şi
preocupările chiar şi ale copiilor de şcoală primară, pătrunşi deopotrivă de sonoritatea
termenului şi, probabil, de misterul pe care îl ascunde în sine. Este definit ca metodă
complexă integrativă, înmănunchind şi rezultate culese de elev prin celelalte metode: ce
lucrări reprezentative a realizat, fie în programul strict şcolar, fie în nişte activităţi
"paraşcolare"; care i-a fost ascensiunea valorică în îndeletnicirea sa de bază, învăţătura, pe
perioade mai lungi sau mai scurte; ce deprinderi sau însuşiri s-au sedimentat treptat în zestrea
CONSTANTIN MOISE

subiectului care învaţă; pe scurt, cum s-a edificat portretul "longitudinal" (vezi şi C. Cucoş,
2002) al şcolarului la care se referă. Se consideră posibilă axarea portofoliului pe fiecare
disciplină şcolară, cum ne dovedesc exemplificările propuse în teoria recentă. După sugestiile
oferite de aceasta, imaginăm mai jos un exemplu de portofoliu al unui elev, pentru disciplina
Biologie, cuprinzând:
 exemple de lucrări de control şi teze semestriale;
 exemple de teste formative;
 lucrări de cerc la care a fost autor sau coautor;
 protocoale de cercetare întocmite;
 liste de autori şi lucrări reprezentative studiate;
 contribuţii la publicaţiile şcolare în domeniu;
 grupaje de diapozitive, desene, postere pe teme de specialitate;
 rapoarte în urma unor experimente.
În mod normal, toate componentele portofoliului trebuie să fi fost proiectate împreună
cu profesorul, acesta din urmă trebuind să le fi şi văzut şi apreciat la momentul realizării lor.
Aceasta pentru că numai astfel se poate stabili caracterul real al contribuţiei elevului. Cât
priveşte semnificaţia unui portofoliu în evaluarea generală a elevului, ea se axează atât pe
aprecierea în planul notei la pregătirea informaţională, cât mai ales pe estimarea motivaţiei şi
competenţelor lui, care să prognozeze orientarea spre un anumit tip de studii viitoare.
Autoevaluarea,ca metodă curentă a activităţii şcolare, a fost semnalată de mai multă
vreme în teoria didactică românească. De exemplu, în anii "80, se afirma că elevul poate şi
trebuie să devină "coparticipant în evaluarea rezultatelor obţinute" (vezi I.T. Radu, 1981, p.
261). Tot atunci se iniţiau dezbateri şi acţiuni experimentale pe tema "notării reciproce" sau a
"autonotării controlate", aducându-se în sprijinul ideii fie unele experienţe internaţionale, fie
iniţiative autohtone (idem). Astăzi se revine asupra problemei, accentul căzând nu asupra
notării propriei performanţe de către elev, ci asupra formării şi exersării capacităţilor lor de
a-şi evalua corect mai ales comportamentul profesional şi însuşirile de personalitate proprii.
Autorii de teorie în domeniu (Stoica, Musteaţă, 1997) ne pun la îndemână nişte instrumente
specifice acestui demers: chestionare de autoapreciere, scări de clasificare. Chestionarele
cuprind itemi orientaţi spre autoaprecierea unor realizări sau insuficienţe privind o anume
activitate, individualizată. Iată itemii adresaţi sau autoadresaţi elevului:
1."Care sunt etapele parcurse în vederea rezolvării sarcinii propuse ?
…………………………………………………………………………
…………………………………………………………………………
2.Prin rezolvarea acestei sarcini, am învăţat:
a)……………………………………………………………………….
b)……………………………………………………………………….
c)……………………………………………………………………….
3.Am întâmpinat dificultăţile:
………………………………………………………………………….
………………………………………………………………………….
4.Mi-aş îmbunătăţi performanţa, dacă:
…………………………………………………………………………
…………………………………………………………………………
5. Consider că activitatea mea ar putea fi apreciată ca fiind:
…………………………………………………………………………"
La rândul lor, scările de clasificare vizează un fel de inventar de rezultate, de însuşiri
şi de comportamente aferente unei perioade date, pe care elevul să şi le evalueze singur.
Concret, se prezintă ca nişte tabele cu două intrări:
 pe rânduri sunt notaţi indicatorii ce se impun evaluaţi (performanţe şcolare ale
perioadei vizate; motivaţie; spirit de iniţiativă; spirit de cooperare; asumarea
responsabilităţii în realizarea sarcinilor; disciplina de lucru; progresul realizat);
 pe coloane, se notează calificativul considerat corespunzător fiecărui indicator de pe
rânduri (slab; mediu; bun; foarte bun; excelent).
În ce priveşte modul de finalizare şi valorificare a autoevaluării, aflăm din sursele mai
sus citate că ea poate servi: într-o măsură ca feedback al interacţiunii profesor-elev; ca piesă
de portofoliu, ea nuanţându-l pe acesta prin adăugarea componentei autocritice a elevului; ca
mijloc de informare a părinţilor şi, în consecinţă, de stimulare a lor ca parteneri educogeni ai
şcolii.

VI. NOTAREA CA METODĂ DE APRECIERE ÎN CADRUL EVALUĂRII ŞCOLARE

VI.1. PROBLEME GENERALE

Notarea reprezintă forma cea mai concretă de apreciere şi consemnare în documente a


rezultatelor şcolare. Se realizează în moduri diverse, după cum s-a instituit prin tradiţie în
fiecare ţară, nefiind excluse unele încercări de reaşezare. Astfel, în unele ţări se notează prin
numere, pe scări de diferite anverguri: 20 de trepte (Franţa); 13 trepte (Danemarca); 10 trepte
(România, Finlanda); 7 trepte (Suedia, Norvegia); 6 trepte (Elveţia, Bulgaria, Germania); 5
trepte (Rusia, Polonia). În altele, prin litere (Marea Britanie, SUA; literele A,B,C,D,E,F, nota
A fiind cea mai mare, celelalte având valoare descrescândă). Temporar, în România, s-au
acordat calificative (de pildă, în licee, o perioadă, după 1948, s-au utilizat calificativele:
insuficient, suficient, bine, foarte bine), iar azi au fost adoptate din nou în învăţământul
primar, în sistemul de pregătire postuniversitară prin doctorat, în aprecierea performanţelor în
cadrul unor concursuri etc. (vezi, pe această temă, şi I.T. Radu, 2000, p. 267 urm.; A. Stoica,
coord., 2001; Cucoş, 2002, p. 391 urm.). Ceea ce se poate reţine, din detalierea de mai sus,
este că fiecare dintre manierele de consemnare a notelor are avantajul şi dezavantajul ei.
Scările mai lungi au avantajul de a face diferenţieri mai fine, necesare mai ales în cadrul
demersurilor evaluative cu scop de selecţie, dar şi dezavantajul dificultăţii mai mari, iar
pentru a evita erorile, care "pândesc" la tot pasul, solicită o minuţiozitate şi un efort
considerabile. La rândul lor, cele de anvergură mai mică au avantajul unei aprecieri mai puţin
afectată de eroare (oricum, este mai puţin probabil să confundăm o prestaţie de "bine" cu una
de "suficient", decât o notă de 5 cu una de 6, sau a oricăror note vecine), dar se însoţesc de
insuficienţa nuanţării, încadrând în acelaşi interval elevi destul de diferiţi. În plus de aceasta,
cele care operează cu indicatori "noncifrici" (calificativele, de exemplu) nu permit o
CONSTANTIN MOISE

cuantificare riguroasă, pentru stabilirea mediei recurgând la o convenţie statistică, respectiv la


calificativul cel mai frecvent obţinut. În cele din urmă, problema care rămâne de pus în ordine
nu este într-atât numărul de intervale, ci cum să se ajungă la tehnica cea mai proprie de
efectuare a acestei discerneri, în funcţie de diversitatea situaţiilor existente în sfera activităţii
şcolare.

VI.2. TIPURI ŞI METODE DE NOTARE

Pentru a ne face o idee despre anume modalităţi în care se poate face notarea, vom
schiţa mai întâi o scurtă prezentare a notării practicate în şcoala românească, potrivit tradiţiei,
foarte probabil preluată după şcolile europene, în special cea germană (după Şt. Bârsănescu,
note de curs, 1961-1962; de asemenea, I. Roman şi colab., 1970, p. 303): notele 2 şi 3,
considerate proprii stării de lipsă totală de cunoştinţe şi deprinderi de muncă şcolară, sau
comiterea unor confuzii grave, care anulează orice rudiment de pregătire; nota 4, atribuită
când elevul posedă doar o parte, insuficientă, a conţinuturilor de bază (adică a acelora fără de
care, în acel moment, ar fi imposibil de abordat conţinuturile următoare ca dificultate); notele
5 şi 6, nuanţe ale calificativului "suficient", acordate pentru nivelul minim mulţumitor al
stăpânirii cunoştinţelor şi deprinderilor de bază; notele 7 şi 8, corespunzătoare calificativului
"bine", atribuibile pentru dovada că elevul cunoaşte bine conţinuturile de bază şi de amănunt,
mai întâmpinând dificultăţi de generalizare şi nuanţare fină, în proporţie diferenţiată între cele
două valori exprimate numeric; notele 9 şi 10, corespunzătoare nivelului foarte bun al
posedării conţinuturilor şi capacităţilor vizate, până la distincţie de mare fineţe, deosebirea
ilustrată de cele două cifre rezultând din comparaţia cantitativă, dar mai ales în sfera acurateţii
raţionamentului. Demers destul de simplu şi clar aplicabil, iar în lipsa altuia, a rămas cel mai
frecvent utilizat, cu toate urmările pe care le vom semnala mai jos.
În ultimele decenii ale secolului trecut, G. De Landsheere (cf. 1975) a făcut o
prezentare detaliată a tipurilor şi tehnicilor sau metodelor de notare şcolară: de o parte tipul
numit notare subiectivă, de alta notarea obiectivă.
Notarea subiectivă include "orice apreciere făcută de profesori în mod global, fie
imediat după examinarea performanţei elevilor, fie după ce au căpătat o vedere de ansamblu a
scorurilor individuale"; "orice notă la care s-a ajuns printr-un procedeu ce nu poate fi
automatizat este o notă subiectivă" (lucr. cit., p. 122). Este notarea aplicabilă de regulă în
cadrul probelor care fie cer elevilor interpretarea personală a conţinuturilor tratate, fie se
referă la conţinuturi în general imposibil de "turnat" în forme fixe, forme care să oblige
examinatorii la apreciere strict identică. Se înţelege că aici se pot încadra probele teoretice
care presupun dezvoltări "verbale" de amănunt (denumite în unele surse "probe de tip
compunere"), fie din sfera disciplinelor zise "exacte", fie a disciplinelor socioumane, precum
şi cele din terenul exprimării estetice. Varietatea situaţiilor în care trebuie procedat aşa este
destul de mare, astfel că a fost nevoie să fie instituite mai multe metode de notare subiectivă,
fiecare rezolvând cerinţele situaţiei cu care este cel mai mult compatibilă. Apelând, pe lângă
lucrările autorului De Landsheere, şi la alte surse (D. Muster, 1970; Pelaghia Popescu, 1978),
putem identifica şi pune în valoare, ca principale metode ale notării subiective: metoda
impresiei generale, metoda scărilor de specimene, metoda analitică şi metoda determinării
frecvenţelor.
Metoda impresiei generale, recognoscibilă şi în exemplul tradiţiei româneşti, constă
din aprecierea unei prestaţii (fie scrise, fie orale) printr-o privire rapidă de ansamblu, în urma
căreia să fie aproximată nota.
Fireşte că ea nu trebuie să se rupă de orice sprijin instrumental; tradiţia didactică, de
exemplu, a instituit nişte indicatori, cum ar fi cantitatea de informaţii şi deprinderi, iar pe de
altă parte calitatea acestora: profunzimea informaţiei, caracterul conştient al însuşirii acesteia,
posibilităţile de aplicare şi sistematizare, sau capacitatea celui examinat de a emite judecăţi de
valoare etc. Conform autorilor citaţi, ea se potriveşte cel mai bine cu complexitatea lucrărilor
de tip compunere şi, adăugăm noi, cu prestaţiile de alt gen ale elevului (de pildă, cu
răspunsurile formulate oral, şi ele trebuind notate într-un fel, cel mai potrivit fiind tot în
limitele acestei metode). Metoda se justifică mai ales prin ritmul în mod necesar "expeditiv"
al aprecierii răspunsurilor orale, dar având în vedere şi faptul că nici în cazul corecturii
lucrărilor de tip compunere nu dispunem de timp nelimitat, pentru compararea lor cu
eventuali parametri de detaliu.
Supunându-ne, însă, necesităţii perceperii "sinoptice" a răspunsului, pe de o parte, şi
rapidităţii necesare, pe de alta, prin utilizarea metodei impresiei globale, trebuie să fim
conştienţi că deschidem calea celei mai mari subiectivităţi a notării. Vrând sau nevrând,
aceasta este o realitate de care examinatorii trebuie să ţină seama când folosesc metoda în
discuţie, asociind această utilizare cu posibile măsuri de apropiere de valoarea reală a notei.
Metoda scărilor de specimene se concretizează în identificarea (printr-un sondaj
suficient de cuprinzător) a unor "modele" (specimene) de lucrări. Ele sunt aşa numitele
"lucrări robot", care se utilizează ca repere de nivel, cantitativ şi calitativ, prin comparaţie cu
ele fiind făcută aprecierea tuturor celorlalte. În practica docimologică, mai frecvent se
preferă cinci specimene. Metoda este motivată tocmai prin faptul că asigură o clasificare cu o
bază echitabilă, fiecare loc din ierarhie justificându-se prin acea comparaţie; or, aceasta ar
reprezenta un fel de împlinire şi a dimensiunii etice a notării. Dezavantajele ce o pot însoţi nu
sunt însă chiar neglijabile (vezi şi De Landsheere, lucr. cit., p. 139). Unul ar fi acela că nu
toate lucrările elevilor se croiesc pe acelaşi "tipar" (un elev tratează prioritar unele aspecte,
altul altele; unul o construieşte într-un număr de părţi, altul, în alt număr etc.), astfel că
lucrările sunt doar parţial comparabile. Alt dezavantaj constă din orientarea examinatorilor
numai asupra aspectelor comune; or, această procedare poate genera neajunsuri importante:
neglijarea părţilor "necomune", dar valoroase, va face o nedreptate celui examinat; neglijarea,
pe acelaşi motiv, a unor părţi cu greşeli va determina acordarea pe nedrept a unor avantaje. În
al treilea rând, sunt necesare scări diferite, după natura subiectului de tratat şi nivelul elevilor.
Metoda analitică nu este interpretată la fel de toţi autorii care au abordat-o. De pildă,
Payne (cf. 1971, p. 87) şi documentele SNEE (cf. Stoica, coord., 2001, p. 85), o interpretează
diferit faţă de C. Remondino (cf. Etude factorielle sur la notation de compositions scolaires
portant sur la langue maternelle, apud D. Muster, 1970, p. 117), modelul acestuia din urmă
fiind preluat de De Landsheere şi de D. Muster. Modelul cuprinde în sine 17 factori, ordonaţi
în 4 grupe:
CONSTANTIN MOISE

 forma exterioară, cuprinzând lizibilitatea, estetica, prezentarea;


 folosirea limbii, adică corectitudinea ortografică, exactitatea morfologică, corectitudinea
sintactică, caracterul propriu al limbajului, stilul;
 conţinutul şi organizarea expunerii, respectiv structura expunerii, bogăţia de idei,
pertinenţa ideilor, precizia informării, gradul de completitudine;
 aspecte personale ale fondului, adică originalitate, maturitate, imaginaţie.
Deşi Remondino şi comentatorii modelului său se referă strict la compunerile care au
rostul să pună în valoare capacitatea examinatului de a organiza conţinuturile şi de a-şi
exprima creativ ideile în limba maternă, schema menţionată este adaptabilă, cu corecturile de
rigoare, la oricare dintre lucrările de tip compunere. Avantajele asigurate prin adoptarea
acestei secvenţieri sunt vizibile, fiindcă chiar dacă nu toţi indicatorii menţionaţi sunt complet
aplicabili, modelul reprezintă un punct de plecare încurajator şi în acelaşi timp perfectibil.
Metoda determinării frecvenţelor , considerată de De Landsheere mai mult de natură
obiectivă decât subiectivă, constă din acordarea notei pe baza fie a însumării aspectelor
pozitive proiectate în raport cu obiectivele urmărite, fie a scăderii de puncte pentru fiecare
greşeală, după ce în prealabil au fost stabilite tipurile de greşeli probabile în cadrul fiecărei
lucrări. Concret, când trebuie să se adauge puncte, se porneşte de la limita minimă, care se va
augmenta (cu puncte sau fracţiuni de puncte) pe măsura satisfacerii de către examinat a
exigenţelor proiectate; procedeul scăderii, dimpotrivă, va avea ca punct de plecare nota
maximă, care s-ar putea diminua pe măsura acumulării de greşeli. În ce priveşte observaţiile
asupra acurateţii tehnice şi chiar implicaţiilor morale ale acestei modalităţi, ele au pus în relief
două tendinţe, corelate fiecare cu "sensul" procedeului în discuţie, adică fie cu adăugarea, fie
cu scăderea de puncte (vezi şi Pelaghia Popescu, lucr. cit., p. 127 -128). Astfel, tendinţa care
însoţeşte procedeul adăugării este una spre rigoarea "cântăririi" fiecărei fracţiuni adăugate, în
timp ce procedeul opus ne dezvăluie tendinţa de a "tăia" chiar puncte întregi cu mult mai
multă uşurinţă; cu alte cuvinte, este dominantă tendinţa "de a da puţin" şi "de a lua mult" din
ceea ce i se cuvine elevului, conform concluziei autoarei citate. Ceea ce denotă că, pentru a
ajunge cât mai aproape de adevăr, procedeele amintite trebuie să se acompanieze reciproc.
Notarea obiectivă reprezintă varianta considerată cea mai concretă şi potenţial cea mai
apropiată de valoarea reală a prestaţiei examinaţilor. A fost definită prin "atribuirea unor
valori numerice pentru eşantioane comportamentale destul de limitate, definite şi controlate,
aptă să permită un acord general al judecătorilor sau examinatorilor" (cf. J.C. Flanagan, apud
De Landsheere, 1975, p. 151). Cum reiese din definiţie, virtutea obiectivităţii este datorată
felului cum sunt concepute probele de examinare, trimiterea fiind făcută limpede la testele
obiective, sau, şi mai precis, la cele standardizate. În cazul unui test cu răspunsuri la alegere,
exemplifică De Landsheere, notarea se poate face "prin simpla numărare a răspunsurilor alese
corect". Realizată doar empiric, notarea este posibilă într-adevăr şi aşa, prin simplă numărare.
În acest fel, însă, ar rezulta prea multe note, după diferenţa de fracţiuni de la un rezultat la
altul. Canoanele normative pretind şi determinarea poziţiei relative a fiecărei note, în
ansamblul notelor din grupul examinat cu aceleaşi probe. "Interpretarea oricărei note necesită
un punct de referinţă, un criteriu, o normă", afirmă De Landsheere (idem), odată cu toţi
psihologii implicaţi în măsurători de acest fel. Norma menţionată aici constă din "distribuţia
performanţelor individuale pentru o sarcină sau un ansamblu de sarcini" (idem). Pe această
bază se află nota obiectivă sau nota etalon în limitele căreia se înscrie rezultatul fiecărui elev
examinat.
Unul dintre procedeele la îndemână, pentru calculul notelor etalon, este cuantilajul
(nuanţat în centilaj, adică din procent în procent; decilaj, din 10 în 10 procente; cvartilaj, din
25 în 25 etc.). Pentru demonstraţie, vom aborda mai întâi un exemplu de calcul prin decilaj, la
un eşantion de 108 elevi (deci 108 note), pentru scoruri (punctaje) între 1 şi 50 puncte, după
un model sintetizat de către A. Stan (cf. 2000, p. 392). Algoritmul este următorul:
 determinarea amplitudinii de distribuţie a scorurilor, după formula:
Xmax - Xmin + 1,
în cazul nostru, Xmax = 50, Xmin = 1, deci: 50 - 1 + 1 = 50;
 gruparea convenabilă a rezultatelor pe intervale (clase), astfel ca să se poată constitui
acelaşi număr "întreg" de trepte pe fiecare interval (adică numărul 50 să se împartă exact),
de pildă să stabilim un număr fie de 5, fie de 10 clase, astfel:
A
i= ,
K
unde i = număr de trepte pe interval; A = amplitudine; K = numărul de clase (intervale)
convenit; deci 50 / 5 = 10 trepte pe interval;
 ordonarea scorurilor într-un tabel, pe intervale:
Intervale
Frecvenţă simplă (fs) Frecvenţă cumulată (fc)
(i)
1 - 10 6 6
11 - 20 20 26
21 - 30 44 70
31 - 40 26 96
41 - 50 12 108

Urmează calculul propriu-zis al notelor etalon, pe fiecare decil, pornind de la toate


datele de mai sus. Pentru fiecare, se procedează astfel:
 se calculează indicele quota al decilului (calculul se face pe decile);
 se stabileşte frecvenţa cumulată în care se încadrează; dacă nu se suprapune exact pe una
dintre frecvenţele din tabel, se optează pentru frecvenţa următoare;
 se aplică formula:
i ⋅ (q − fca )
N ed =Vsia +
fsi
unde: Ned - nota etalon a decilului; i - întinderea fiecărui interval (în cazul nostru, 10
trepte); Vsia - valoarea superioară a scorului din intervalul anterior; q - indicele quota,
calculat prin împărţirea la 100 a produsului dintre numărul de note şi procentul la care ne
referim; fca - frecvenţa cumulată anterioară; fsi - frecvenţa simplă a intervalului în care
ne aflăm.

EXEMPLE:
CONSTANTIN MOISE

108 ⋅10
Pentru decilul 1: q = = 10 ,8
100
acestuia îi găsim locul pe coloana frecvenţelor cumulate între 6 şi 26; optăm pentru
frecvenţa mai mare, adică 26 (opţiunea pentru valoarea mai mare este dictată de regula
calculului după acest procedeu); introducem în formula notei etalon 1:
10 ⋅ (10,8 − 6) 10 ⋅ 4,8
N ed 1 = 10 + = 10 + = 10 + 2,4 = 12,4
20 20

Se observă că Vsia este 10; i este invariabil 10; fca este 6; fsi este 20. Rezultatul
obţinut se rotunjeşte, devenind 12. Aceasta înseamnă că nota etalon 1 (Ned 1) se acordă
tuturor celor care au obţinut până la 12 puncte inclusiv.
108 ⋅ 20
Pentru decilul 2: q = = 21,6 .
100
Corespunde aceleiaşi frecvenţe cumulate, de 26. Introducem în formulă:
10 ⋅ ( 21,6 − 6) 156
N ed 2 = 10 + = 10 + = 10 + 7,8 = 17 ,8
20 20
Se rotunjeşte şi devine 18. Deci nota etalon 2 se va acorda scorurilor între 13 şi 18.
Şi calculul poate continua până la Ned 10, dat fiind că avem 10 decile.
Pe baza aceluiaşi caz am putea explica, apoi, atribuirea notelor etalon după alt model,
foarte asemănător, oferit de G. de Landsheere (lucr.cit., p. 154) procedând prin centilaj, adică
detaliind datele din procent în procent. Formula este:
N ⋅C
−fc
C x = l + 100 ×i ,
fs
unde: Cx = rangul notei corespunzătoare unui centil dat; l = media între limita inferioară a
intervalului precedent şi limita superioară a intervalului în care se află centilul căutat; N =

numărul de note; N ⋅ C
100= valoarea notei exprimată în centile (quota – n.n. – C.M.); fc =
frecvenţa cumulată a intervalului precedent; fS = frecvenţa simplă a intervalului centilului
căutat.
Exemplu de calcul al notei etalon, să zicem, pentru centilul 10.
108 ⋅10
−6
100 10 ,8 − 6 4,8 48
N ec 10 = 10 ,5 + ×10 = 10 ,5 + ×10 = 10 ,5 + ×10 = 10 ,5 + = 10 ,5 + 2,4 = 12 ,9
20 20 20 20
; aşadar punctajul corespunzător notei etalon a centilului 10 şi, implicit, a decilului 1, potrivit
procedeului anterior prezentat.
Cum se vede între nota calculată prin cele două procedee, pentru aceeaşi treaptă,
rezultă o diferenţă de 0,5 puncte (adică între 12,4, după primul procedeu, şi 12,9, după al
doilea). Diferenţa va apărea în cadrul calculului fiecărei note, dar ea poate fi considerată
neglijabilă socotind că ordinea notelor şi distanţa dintre ele rămân aceleaşi.

În încheierea celor de mai sus, conchidem că: chiar dacă profesorul nu aplică în mod
curent această metodă de calcul, în cadrul testelor pe care le alcătuieşte, este bine să fie
informat asupra ei, pentru înţelegerea eventualelor notări "externe" a propriilor elevi, în ocazii
determinate.

VI.3. ABATERI POSIBILE DE LA NOTAREA CORECTĂ

Cum se ştie, sunt destule situaţii evaluative în care recurgem la itemi subiectivi, de
unde şi metoda de notare obligatoriu tot subiectivă. Şi, în mod firesc, unul din marile
inconveniente ale acestora constă din posibilitatea, la unele mai mare, la altele mai mică, de
abatere de la notarea corespunzătoare valorii reale a prestaţiei elevilor. Să ne gândim numai
la tehnica aprecierii generale sau globale, despre care am spus că deschide foarte larg calea
acestor abateri, nici celelalte nefiind total ferite de astfel de eventualităţi. Dar mobilul acestor
anomalii nu trebuie căutat numai în modalitatea obligatorie de notare, aceasta fiind mai ales
condiţie; cauzele cele mai multe se află în altă parte, adică în personalitatea celor care
notează.
În ce feluri se concretizează aceste anomalii? Numeroşi autori enumeră o gamă largă
de astfel de situaţii, datorate tot atâtor factori perturbanţi (vezi De Landsheere, 1975, p. 31
urm.; I.T. Radu, 1981, p. 254 urm. şi 2000, p. 286 urm.; D. Muster, 1970, p. 99 urm.;
C. Moise, 1986, p. 120 urm.; C. Cucoş, 2002, p. 400 urm.). Iată o listă aproximativă a
factorilor distorsionanţi.
Efectul halo (numit aşa probabil prin asociere cu un fenomen optic, studiat de Fizică)
este menţionat la loc de frunte de toţi autorii, deşi nu toţi îl definesc la fel, în toate ipostazele
lui. Cea mai frecventă descriere îl prezintă ca tendinţă de a favoriza elevii cu rezultate în
general bune, în acelaşi timp cu defavorizarea celor aflaţi pe trepte mai de jos, acceptând un
fel de iradiere a mediei pe ansamblul situaţiei şcolare. Ca exemplu, examinând un elev care
are majoritatea notelor 9 şi 10, chiar dacă răspunsul lui se ridică la nivelul doar al notei 5-6,
examinatorul ţine seama de situaţia lui generală, acordându-i 1-2 puncte în plus, pe când cu
cel cu note mici devine mult mai "principial". Unii autori (vezi De Landsheere) afirmă că
acest efect se concretizează şi altfel, de exemplu în calitatea scrisului, acolo unde ea n-ar
trebui avută în vedere; în prezentarea fizică sau "atitudinală" agreabilă; în supradimensionarea
calităţilor de ordin estetic sau afectiv ale dicţiei celui examinat.
"Ruda" foarte apropiată a efectului halo este efectul oedipian sau efectul Pygmalion,
numit astfel prin aluzie fie la personajul sofoclian, Oedip, considerat predestinat să fie
nefericit, fie la miticul Pigmalyon, care şi-a însufleţit propria operă cioplită din materie
moartă. Se concretizează în notarea marcată în permanenţă de o atitudine inflexibilă a
examinatorului faţă de examinat, atitudine datorată imaginii preconcepute asupra unui elev
sau altul. Spre exemplu, profesorul consideră , fie şi printr-o privire superficială, că elevul X
are capacităţi cu totul limitate şi, deci, nu poate lua decât note cel mult mediocre. Atitudinea
în cauză este de neacceptat şi din punct de vedere moral, ştiut fiind că subaprecierea elevului
îl descurajează, sporind frecvenţa eşecurilor, din care se vor naşte alte eşecuri.
Efectul ordine concretizează fenomenul de denaturare a notei, datorat "poziţiei
cronologice" a examinării fiecărui elev. Mai precis, ordinea corectării sau ascultării
CONSTANTIN MOISE

influenţează mărimea notei. Cauzele stau atât în dispoziţia diferită a examinatorului în


momente diferite, cât şi în existenţa sau nonexistenţa unor repere ale evaluării, corelate cu
aceste momente: la începutul actului de ascultare sau de corectură a lucrărilor scrise,
capacitatea de efort necesar analizei este mai mare, de unde tendinţa de verificare mai
riguroasă, precum şi eventuala ţinută mai "strânsă" a notării, pe când spre sfârşit aceste
caracteristici se schimbă (intervine ori oboseala, ori "saturaţia" afectivă), devenind inerentă o
analiză mai sumară, iar odată cu ea o notare mai neglijentă; de asemenea putem lua în
considerare că la început (de exemplu, pentru prima teză corectată sau primul răspuns
ascultat), nu există reper pentru comparaţie, în vederea unei notări nuanţate; apariţia treptată a
acestui reper poate schimba ţinuta notării. Unii autori subsumează ordinii efectul de contrast:
dacă o teză este corectată după alta vizibil mai bună, sau mai ales după mai multe cu această
calitate, va apărea tendinţa notării acesteia cu o notă mai slabă decât merită; şi invers, dacă
aceasta este precedată de altele mai slabe.
Este menţionată destul de accentuat şi infidelitatea examinatorului faţă de sine, în
eventualitatea repetării neprevenite (deci fără să se fi anunţat de la prima corectură) a actului
de notare. Exemplificarea făcută de un autor britanic (apud De Landsheere, loc.cit., p. 31) este
convingătoare în acest sens:14 profesori de istorie au corectat 15 teze tip "compunere" (sau,
după denumirea modernă "test de tip eseu extins"); la recorectare, după 12-19 luni, de către
aceiaşi, s-au înregistrat 92 de note diferite, din cele 210 iniţiale (adică 15 teze x 14 corectori).
Tendinţei spre valoarea centrală (cf. I.T. Radu, 1981) noi îi adăugăm o tendinţă spre
echilibrarea ansamblului notelor. Prima dintre acestea două este definită ca "tendinţă de a
formula aprecieri moderate, de a evita pe cele extreme, izvorâte din precauţia de a nu greşi "
(Radu, 1981, p. 259). Cea de a doua apare numai la examinatorii obsedaţi de curba lui Gauss,
cei care pleacă de la preconcepţia că într-o colectivitate şcolară este obligatoriu ca notele să se
repartizeze cât mai echilibrat; cei care, dacă pe parcursul corectării constată că nu s-au luat
toate notele (de exemplu, notele 6 şi 7 sunt prea puţin reprezentate), încep să le "caute" pe
fiecare; şi reuşesc să le "găsească".
Ecuaţia personală a fiecărui examinator, la rândul ei, reprezintă un factor
distorsionant destul de însemnat, manifestându-se în feluri multiple: unii ţin seamă în mod
deosebit de "îndrăzneala" cu care elevul abordează diferitele conţinuturi, alţii pun accent mai
mare pe multitudinea unghiurilor de vedere abordate; unii profesori din una şi aceeaşi şcoală
şi în cadrul aceleiaşi materii sunt de exigenţe net diferite, fiecare justificând în felul său. Cele
mai frapante diferenţe apar în cadrul disciplinelor care presupun interpretări multiple, punând
cu adevărat probleme serioase în plan docimologic. Se citează, de pildă, constatarea făcută de
către I.M. Nestor (cercetător român interbelic) privind notele acordate de 54 de profesori de
filosofie unei teze din acest domeniu, adică (vezi I. Radu, 1979, p. 244): nota 3 - 1
examinator; nota 4 - de 6 ori; nota 5 - de 9 ori; nota 6 - de 11 ori; nota 7 - de 8 ori; nota 8 - de
12 ori; nota 9 - de 5 ori; nota 10 - 1 examinator.
Prudenţa examinatorilor, semnalabilă mai rar, există totuşi, grevând adevărata
valoare a notelor acordate, în condiţia utilizării metodei impresiei globale, indiferent de natura
materiei de învăţământ. Astfel, se citează pe alocuri profesori sau colective didactice întregi,
care adoptă o exigenţă foarte mare în fiecare primă parte a perioadelor şcolare specifice
(trimestre, semestre); "cazul" a fost semnalat mai ales în unele licee cu prestigiu deosebit, iar
motivarea este următoarea: dacă se vor acorda note mari de la început, vor fi posibile perioade
însemnate de delăsare a elevilor, bazate pe "calcule" şi comoditate (de pildă, obţinerea unui 8,
îi permite unui elev "comod" să ia un 4 şi un 3, fără să fie corijent); nu credem, totuşi, că
trebuie să judecăm elevii neapărat cu aceste "unităţi de măsură". Se remarcă şi altfel de
prudenţă, de astă dată favorabilă elevului: unii profesori, în perioada de început a conlucrării
cu un nou colectiv de elevi, acordă note conştient majorate, din dorinţa de a aştepta să
cunoască mai bine elevii.

TEMĂ DE REFLECŢIE
Ce opinie vă exprimaţi şi cum o motivaţi, privitor la această ultimă abatere de la valoarea
reală a notei?
Ar mai fi de menţionat şi alţi factori distorsionanţi, mai mult sau mai puţin frecvenţi.
Ne limităm la unul singur, dar nu foarte izolat: relaţia "specială" între examinatori şi
examinaţi (de pildă, relaţia dintre diriginte şi clasa aflată în grija sa, simpatie sau opusul ei,
relaţiile "de familie"), influenţând notarea de regulă în sens favorizant.
Cât priveşte propunerile de preîntâmpinare ale acestor tendinţe, ele au fost formulate
şi susţinute în câteva variante nu lipsite de interes, chiar în cadrul unora dintre sursele care le-
au menţionat şi explicat. Dat fiind că cel mai mult incriminată este notarea după impresia
globală, iar la ea nu se poate renunţa total, primul remediu care se propune este arbitrul
multiplu, adică corectarea de către mai mulţi examinatori. Se consideră că în acest fel
"ecuaţiile personale" ale fiecărora dintre examinatori se pot anula reciproc, posibilitatea fiind
cu atât mai mare cu cât sunt mai mulţi examinatori care să aprecieze acelaşi răspuns.
Perspectiva acestei soluţii, dezvăluită printr-un experiment de către H. Pieron (apud Muster,
1970), nu pare încurajatoare. Concluzia a fost următoarea: pentru anularea mulţumitoare a
diferenţelor, la o teză de matematică teoretică este nevoie de 13 corectori; pentru una de
fizică, 16; pentru o compunere în limba maternă, 78; pentru o teză de filosofie, 127. Ideea a
fost totuşi reţinută, cel puţin pentru examenele de importanţă crucială (capacitate, bacalaureat,
admitere), în toate fiind utilizaţi cel puţin doi corectori simultani, care notează fără să se
influenţeze unul de nota dată de celălalt.
O altă propunere este aceea de extindere a examinării prin itemi obiectivi sau
semiobiectivi, pe cât este posibil în paralelă cu probele bazate pe itemi subiectivi. Şi în acest
caz apar impedimente, posibilităţile în domeniul ştiinţelor socioumane fiind restrânse pentru
itemii obiectivi. Itemii semiobiectivi, de felul întrebărilor structurate ar putea avea mai mari
şanse.
Se poate menţiona, apoi, propunerea de utilizare a baremelor pe fiecare subiect la
probele scrise, punctajele totale (deci nu în detaliu) pe fiecare subiect trebuind comunicate
candidaţilor înainte de efectuarea probei , în scopul orientării lor asupra organizării propriei
munci de rezolvare în varianta cea mai productivă (vezi Muster, lucr.cit., p. 103). Deşi în
sfera disciplinelor reale această soluţie este relativ simplu de adoptat, în celelalte domenii este
mai dificil de ajuns la o soluţie mulţumitoare; aceasta din cauză că, în domeniul disciplinelor
socioumane, baremul poate fi interpretat diferit de către fiecare examinator, iar, pe de altă
parte, nu este sigur că elevii "cad" exact pe componenţa baremului (să zicem că baremul
prevede o definiţie, câteva precizări anume, exemplificări, aplicaţii etc., iar elevul pune accent
CONSTANTIN MOISE

pe alte aspecte, realizând totuşi o lucrare destul de bună). Din acestea rezultă că folosirea
baremelor presupune mai mult decât simpla elaborare; condiţia aplicării lor judicioase vizează
şi punerea de acord foarte minuţioasă a examinatorilor, iar în cazul nepotrivirii baremului
cu pregătirea reală a elevilor să se procedeze la reformularea schemei de notare.
Se mai propune extinderea notării analitice, conform indicatorilor concepuţi de
C. Remondino şi E. Valin. Cercetătorul român D. Muster, de pildă, propune o adaptare a
acestor indicatori la scara de 10 note, potrivit sistemului românesc, pentru lucrările de tip
compunere, după cum urmează (lucr.cit., p. 104 - 105): pentru fondul lucrării - 7 puncte, din
care 6 pentru conţinutul de idei, iar 1 pentru prezentarea lor logică; pentru forma lucrării - 2
puncte, din care 1şi 1/2 pentru stil şi ortografie, iar 1/2 pentru prezentarea grafică; pentru
factorul personal (sensibilitate, originalitate, caracter excepţional) - 1 punct. Această schemă
ar avea şanse de aplicare pentru întreaga sferă a conţinuturilor socioumane, caz în care trebuie
hotărât un statut diferenţiat pentru "factorul personal", nefiind sigur că fiecare subiect tratat
implică neapărat originalitate. Şi de această dată, ca şi în cazul baremelor, apar din nou: atât
problema interpretării diferite a punctajelor de către corectori, cât şi cea a axării candidaţilor
pe aceeaşi sumă de indicatori; de unde din nou, pe de o parte obligaţia punerii de acord foarte
clară a tuturor examinatorilor în privinţa aplicării unitare a schemei analitice proiectate, iar pe
de alta eventualitatea reorientării schemei, în raport cu prestaţia elevilor.
Un cuvânt trebuie rostit şi despre reducerea efectului halo şi a celui oedipian.
Asigurarea anonimităţii lucrărilor, prin examen extern (adică realizat de alţi examinatori
decât cei care au predat), cum se pronunţă unii autori (vezi Cucoş, lucr.cit., p. 400), ar fi o
posibilitate, dar mult prea limitată, dată fiind frecvenţa atât de mică a acestor ocazii. Se
impune încercarea de completare a soluţiei, prin intensificarea pregătirii docimologice a
profesorului, în privinţa efectului halo şi mai ales a celei psihologice, pentru a înţelege deplin
că efectul oedipian implică in primul rând o tară morală, lucru deloc lăudabil pentru un
educator.
În fine, nu este de neglijat propunerea unor descriptori de performanţă, meniţi să
redea în amănunt calităţile fiecărui răspuns, concretizat pe specificul materiei de învăţământ
vizate, corelat cu obiectivele cadru şi cele de referinţă ale fiecărei discipline şcolare şi axat
pe o anume capacitate specifică. Altfel spus, ce calităţi să îndeplinească un răspuns, în cadrul
unei capacităţi date, pentru a fi cotat cu o notă anume? Deocamdată au fost alcătuiţi
descriptorii în cauză numai pentru învăţământul primar, deci numai pentru calificativele
(foarte bine, bine, suficient) utilizate în şcoala primară. Aducem un exemplu de descriptori
din sfera matematicii: capacitatea vizată - înţelegerea şi efectuarea operaţiilor cu numere
naturale; subcapacitatea - înmulţirea numerelor naturale în concentrul 0-100; calificativul
foarte bine: elevul scrie o adunare dată, cu termeni egali, (interpretată) ca înmulţire şi invers
(fără nici un sprijin - n.n. C.M.); calificativul bine: elevul scrie o adunare dată, cu termeni
egali, (interpretată) ca înmulţire şi invers, dirijat prin întrebări; calificativul suficient: elevul
scrie o adunare dată, cu termeni egali, (interpretată)ca înmulţire şi invers, după model.
Iniţiativa este lăudabilă, dar dificultăţile răsar şi ele de pretutindeni, asociindu-se cu
cunoaşterea "psihologică" a fiecărui fragment de conţinut şi cu pregătirea celui care concepe
descriptorii, fiind obligatorie formularea tot "psihologică" a fiecăreia dintre calităţile
răspunsului.
La ce concluzie trebuie să ajungem după toată dezbaterea de mai sus, despre
optimizarea actului de notare? O propunem pe următoarea: atitudinea noastră trebuie să fie
una optimistă, dar să nu ne iluzionăm că am putea rezolva problema notării echitabile doar
printr-o singură cale din cele citate mai sus; rezolvarea mulţumitoare se obţine prin
combinarea necesară, în fiecare caz concret, a două sau mai multe dintre soluţiile propuse;
şi nu este exclus ca experienţa practică viitoare să scoată la iveală şi alte soluţii.

TEMĂ DE REFLECŢIE
Consideraţi că s-ar putea alcătui o ordine de preferinţă a remediilor prezentate mai sus? Dacă
da, exprimaţi-o şi motivaţi-o.

VII. ASPECTE ALE EVALUĂRII PROCESULUI DE INSTRUIRE

Ceea ce interesează în mod prioritar pe un pedagog practician sunt rezultatele pe care


le obţine elevul şi pe care el, educatorul, trebuie să le evalueze în primul rând. Cum afirmam,
însă, chiar din debutul acestui curs, evaluarea nu se poate limita doar la rezultatele elevilor.
Ca să avem imaginea completă a procesului ce trebuie permanent optimizat, nu numai aceste
rezultate (adică "produsul" obţinut) trebuie determinate. Este nevoie şi de o aplecare specială
asupra componentelor şi factorilor acestui proces, pentru a le pune de acord atât cu
imperativele sociale ale comunităţii, cât şi între ele, în interesul unei funcţionări cât mai
productive. Ideea apare exprimată, chiar dacă numai incomplet, în lucrări cu orientare
pedagogică generală destul de vechi (R. Hubert, 1965, p. 623 urm.), sau mai "recente"
(I. Roman şi colab., 1970), fiind exprimată strict "la obiect" în anii "80, odată cu referirea la
evaluarea factorilor actului pedagogic (cf. I.T. Radu, 1981, p.275 urm.). Ca să fim mai
convingători, facem apel la o lucrare foarte recentă, care afirmă acest imperativ: "Astăzi
coexistă două sisteme de evaluare. Primul este tradiţional … centrat pe indivizi şi în mod
special pe elevi, clasându-i la diferite niveluri de instrucţie sau de merit. Sancţionează prin
reuşită şi eşec". Pe lângă aceasta, "s-a dezvoltat şi o altfel de evaluare", cu două ramuri: "o
ramură pedagogică" şi "o ramură de gestiune" (cf. J. Vogler, coord., 2000, p.269). În acea
"ramură de gestiune" s-ar include şi evaluarea factorilor procesului, invocaţi în frazele de mai
sus.
Care sunt aceşti factori? I.T. Radu îi enumeră pe următorii: conţinuturile, metodele,
mijloacele, formele de organizare a procesului, organizarea colectivităţilor şcolare,
personalitatea profesorului, relaţiile din procesul educaţional, toate acestea fiind considerate
condiţiile interne ale procesului; fără să fie lăsate, însă, total în afara discuţiei obiectivele
instruirii, particularităţile elevilor, contextul social dat, condiţiile didactico-materiale şi
resursele financiare. Ceea ce putem susţine şi azi este că toate trebuie să facă obiectul
evaluării, pedagogul practician fiind interesat cel puţin de o parte dintre ele. Este ceea ce
justifică şi formularea, despre acestea, a câtorva idei, explicaţii, sugestii, în plan evaluativ.
Referirile noastre vor fi numai selective, focalizându-se doar asupra acelor entităţi care
interesează în primul rând educatorul practician.
Elevul poate face obiectul evaluării nu numai odată cu aprecierea rezultatelor sale
şcolare, ci şi înaintea procesului, adică în calitatea sa de factor implicat în actul instruirii, mai
CONSTANTIN MOISE

precis, ca "punct de plecare" în periplul pe care îl va întreprinde de-a lungul procesului. Sub
acest aspect, el va face obiectul uneia sau mai multor evaluări, mai ales iniţiale, pe baza cărora
va fi declarat apt sau nu pentru începerea instruirii, la diferite nivele de complexitate. Un
exemplu de acest fel poate fi considerată evaluarea elevului la intrarea în clasa întâi: pe baza
probelor fizice, a testelor de aptitudine intelectuală, a observării în planul comportamentului
social, se stabileşte maturitatea de şcolarizare a lui. Aceasta se exprimă în: dezvoltare şi
sănătate fizică normală, un IQ de cel puţin 90-100, adică limita de jos a normalului capacităţii
intelectuale, precum şi deprinderi care dovedesc un comportament social normal. Probele
trebuie privite cu toată răspunderea, iar dacă copilul dovedeşte nişte deficite acceptabile pe
fiecare din cele trei planuri, să poată fi îndrumat, în cunoştinţă de cauză, în cadrul unui
program de recuperare sau fortificare. Importanţa probei nu trebuie nesocotită, mai ales în
plan intelectual, unde o eroare de cunoaştere poate genera alte erori (vezi, de pildă, efectul
oedipian, semnalat între abaterile de la notarea corectă). Evaluarea aptitudinilor va trebui să
fie promovată, apoi, la începutul fiecărui nou ciclu şcolar, dată fiind eventualitatea dezvăluirii
treptate a unor aptitudini speciale, cu atât mai mult cu cât, sub alte aspecte, apar semne de
relativ deficit; lipsa acestei orientări poate genera veritabile ratări. Se cunosc destule cazuri, în
care copii de vârsta gimnaziului, declaraţi slabi intelectual în timpul cursului primar, şi-au
găsit domeniul de realizare la nivel foarte bun, după ce au fost orientaţi fie spre artă plastică,
fie spre cultură fizică şi sport, fie spre muzică.
Conţinuturile instruirii pot fi evaluate "oficial" de către tehnocraţii acestui domeniu,
adică de către cei care (calificaţi fiind în materie) sunt încadraţi în forurile academice ale
specialităţii, sau în cele de organizare şi control. Dar nici pedagogul practician nu poate
rămâne total în afara acestui demers, putând face chiar evaluări meticuloase la toate nivelele
de detaliere a conţinuturilor, adică asupra planurilor de învăţământ, a programelor fiecărei
materii, a manualelor şi celorlalte instrumente de prelucrare a conţinuturilor (culegeri, cărţi
de exerciţii caiete speciale etc.), făcând observaţii şi propuneri de rigoare. Cât priveşte
planurile de învăţământ, evaluările pot avea ca repere cel puţin cantitatea, raportată la timpul
de învăţare al elevului. De pildă, în perioada postdecembristă au fost introduse în planuri
unele discipline noi (să luăm doar exemplul religiei şi al educaţiei civice, respectiv culturii
civice), fără să se reducă altele; se pune întrebarea: ce măsuri să fie luate, ca ele să fie
"acoperite" în timpul de învăţare al elevului şi în condiţiile săptămânii şcolare de numai cinci
zile? La rândul lor, programele fiecărei materii, manualele şi celelalte mijloace de prelucrare
didactică pot fi şi trebuie evaluate, toate la un loc, sub aspectul conformării la principiile
didactice: programele, prin raportare doar la un principiu al cantităţii optime şi la cel al
accesibilităţii (cine cercetează, de exemplu, programa actuală de matematică la clasa a V-a,
poate constata un salt foarte mare şi al cantităţii, şi al dificultăţii temelor; şi se pot găsi multe
alte exemple); manualele şi celelalte, prin raportare şi la alte principii invocate, pe lângă
cele două de mai sus, adică la cele care vizează în mod expres prelucrarea didactică a
conţinuturilor, astfel încât elevul să le însuşească fără dificultăţi majore şi cu cel mai bun
beneficiu cultural. Este vorba despre principiile: al sistematizării şi continuităţii, al legăturii
între teorie şi practică, urmând ca, în cazul fiecărui manual şi suport de prelucrare dintre
celelalte, să constatăm: cât de "încărcat" de informaţie pe unitate de conţinut este (conform
principiului cantităţii optime), cât de inteligibil (după principiul accesibilităţii), cât de clar se
"leagă" conţinuturile în fiecare unitate de conţinut şi pe ansamblul cărţii (cum pretinde
principiul sistematizării şi continuităţii), cât de bine reprezentate sunt exemplificările,
exerciţiile aplicative, problemele (cum cere principiul legăturii între teorie şi practică). Şi
considerăm că în mod sigur s-ar găsi multe observaţii de făcut, mai ales pe fondul abundenţei
de manuale din ţara noastră, abundenţă nu se mai ştie cât de benefică, dată fiind
imposibilitatea unei analize comparative, care să separe versiunile valoroase de simplele
"emanaţii" de conjunctură.
Personalitatea educatorului, ca obiect al evaluării, ne interesează şi mai pe larg, din
motivul că, fie în calitate de educatori ce vom fi, fie în calitate de eventuali manageri care
vom avea în subordine educatori, vom fi în postura de a evalua sau de a ne autoevalua.
Evaluarea personalităţii educatorului poate fi concepută pe trei grile de calităţi, diferenţiate
după unghiul de vedere promovat de fiecare (cf. R. Hubert, lucr.cit.; I. Roman, lucr.cit.;
I.T. Radu, lucr.cit.; Ausubel şi Robinson, lucr.cit.): calităţi de ordin general, calităţi de ordin
didactic, calităţi în postura de manager.
Calităţile de ordin general pot fi descrise detaliat după cum urmează:
1. Calităţi de ordin fizic. Trebuie să menţionăm aici pe cele esenţiale: sănătate, rezistenţă,
integritate fizică, în limite care nu stânjenesc desfăşurarea în ritm şi cu randament
normale. Motivaţia este simplă: o sănătate structural şubredă generează întreruperi cu
efecte greu de recuperat, ştiut fiind că practica recuperărilor nu este compatibilă decât
prin excepţie cu ritmicitatea specială a programului de instruire; un deficit al rezistenţei la
efort şi al integrităţii fizice pot fi admise doar în limitele care nu afectează semnificativ
buna desfăşurare a tuturor activităţilor specifice profesiei.
2. Calităţi intelectuale. În acest titlu se înscriu mai multe.
Inteligenţa. Prin tradiţie, educatorul trebuia să posede o inteligenţă teoretică deosebită.
Azi pretenţia este mai moderată, fiind îngăduit un nivel nu neapărat foarte mare, în
ideea că un nivel normal conjugat cu conştiinciozitatea şi cu o muncă sistematică
sistematică poate conduce la o condiţie profesională mai mult decât onorabilă. Sunt
autori care admit că nu inteligenţa foarte mare este factorul de bază al succesului în
profesia didactică (vezi Ausubel şi Robinson, 1981, p.534 şi 633; de asemenea,
R. Hubert, lucr. cit., p. 631).
Cultura de specialitate şi psihopedagogică. Un nivel înalt al culturii de specialitate şi o
capacitate de a formula raţionamente de mare fineţe sunt calităţi ideale ale
educatorului. Se obţine prin efort continuu şi prin dorinţa de a fi "la zi" cu informaţia.
Acestea sunt cu atât mai mult necesare cu cât, în ritmul actual de generare a
informaţiei, apar fie multiplicări rapide ale acesteia, fie schimbări de interpretare a
unor adevăruri mai vechi. Cultura psihopedagogică îi este la fel de necesară unui
educator bine cotat, ea făcând parte tot din cultura profesională a lui. O poate realiza
prin informare continuă în sfera psihologiei educaţiei, a pedagogiei, a metodicii.
Capacitatea de a stăpâni ansamblul logic al informaţiei. Este una dintre calităţile cheie
(dacă nu cea mai definitorie) ale profesiei didactice. Educatorul o poate proba,
încercând să exprime rezumativ, simplu, accesibil conţinuturile cele mai complicate.
În consecinţă, comportamentul invers (a reda complicat ceea ce este simplu) este
semn de inaptitudine, iar exprimarea voit alambicată reprezintă în realitate dovada
nestăpânirii domeniului.
CONSTANTIN MOISE

Capacitatea de a distinge valorile de nonvalori, indiferent de domeniul cultural, moral


etc. în care face valorizări în faţa elevilor, reprezintă de asemenea o calitate
obligatorie a educatorului. Ea este un corolar al altor calităţi, cum ar fi cultura
multidisciplinară şi inteligenţa. Inexistenţa ei ar fi un pericol de contaminare negativă
a elevilor.
Intuiţia psihologică şi capacitatea de analiză psihologică. Sunt calităţi de asemenea de
primă mărime în contextul profesiei didactice. Corolarul lor cel mai de seamă este
capacitatea de empatie, trăsătură încadrabilă în măsură egală în sfera calităţilor
morale.

APLICAŢIE
Un profesor de biologie obişnuia să facă şi consideraţii despre măsuri de ordin medical
pentru funcţionarea normală a organismului uman. El spunea, de pildă, despre un
medicament că este recomandabil în tratamentul unei boli cardiace. Între timp, nu s-a
mai informat, spunând în continuare că acel medicament asigură bunul mers al
sistemului circulator. A fost de-a dreptul şocat, aflând întâmplător că, la acea dată,
medicamentul era considerat nociv pentru sistemul circulator, fiind suspectat de a
produce accidente grave.
Ce avea deficitar acel profesor ?

3. Calităţi moral-afective
Empatia. A fost deja anticipată mai sus. Poate fi considerată tot o capacitate, anume aceea
de a se transpune rapid în situaţia celui de vis-à-vis de el, de a-l înţelege pe acesta
înainte de a-l judeca sau a-l pedepsi. O putem socoti însuşire de prim rang între cele
din această categorie, având un impact major asupra conştiinţei elevului.
Capacitatea de a accepta, iniţial, educatul aşa cum este, bun sau rău. Coincide unei teze
de mare valoare a pedagogiei generale, după care unii autori au formulat principiul
ipotezei optimiste în educaţie (vezi A. Dancsuly, 1979). Este însuşirea cea mai
autentic umană a celui chemat să-i formeze sau să-i îndrepte pe cei care i-au fost
încredinţaţi într-un astfel de scop. Însuşirea opusă acesteia este intoleranţa absolută şi
absurdă a celui care vrea ca educatul să fie perfect de la început.
Capacitatea de a renunţa şi, cel puţin moral, de a se sacrifica. Aceasta reprezintă semnul
tradiţiei cu adevărat înălţătoare, potrivit căreia educatorul are o misiune comparabilă
cu cea a apostolilor. Tradiţia în cauză face trimitere la rolul pe care educatorii trebuie
să şi-l asume în momentele de răscruce din viaţa colectivităţilor.
Probitate în faţa adevărului obiectiv. Constă, pe de o parte, în capacitatea de a se supune
adevărului, indiferent că îi convine sau nu, că îl avantajează sau îi produce suferinţă
morală; pe de altă parte, în forţa, tot morală, de a-şi recunoaşte şi propriile eşecuri.
Acestea reprezintă primele semne ale speranţei de îndreptare şi în acelaşi timp un
puternic exemplu pentru propriii elevi.
Credinţa în progresul educaţilor şi capacitatea de a se bucura de succesele lor. Este
prelungirea firească a atitudinii optimiste, având rolul de încurajare şi mobilizare
permanentă a elevilor, ceea ce joacă un rol la fel de mare ca ajutorul concret pe care
li l-ar oferi.
Calitatea de a avea umor şi de a reacţiona adecvat la umor. Este o calitate cu atât mai
uşor de susţinut cu cât ne este sugerată de "o voce", pe care ne-o reprezentam sobră
şi gravă, a unui pedagog-filosof, R. Hubert (1965, p. 633): "Toate dificultăţile se vor
aplana fără suferinţă, dacă educatorul îşi va aborda misiunea cu seninătate şi umor.
Nu poate exista educaţie fără veselie."

Calităţile educatorului în activitatea didactică (vezi şi I.T. Radu, 1981). Există şi o


serie de calităţi pe care educatorul le poate proba în activitatea strict didactică, adică în lecţie
şi pot fi constatate prin asistenţă, repetată de un număr de ori, care să confere observaţiilor
relevanţă suficientă. După o schemă simplificată, ele se descriu pe următoarele puncte:
1. Nivelul clasei. Se poate pune în relief prin înregistrarea răspunsurilor orale ale
elevilor şi prin analiza lucrărilor scrise sau aplicative ale acestora. Simpla constatare nu
este suficientă, căci se poate ca acest nivel să se datoreze şi altor factori, exteriori
activităţii comune a educatorului cu elevii.
2. Măsura în care urmăreşte sistematic obiectivele proiectate pentru fiecare lecţie.
Se poate aprecia prin constatarea, la finele lecţiei sau mai în amănunt în lecţia
următoare, a coincidenţei dintre comportamentele dobândite de elevi şi obiectivele
nominale ale fiecărei lecţii.
3. Realizarea metodologică a lecţiei. Este aspectul care completează cel mai
concludent impresia despre nivelul clasei şi mai ales despre factorii cărora el li se
datorează. La acest titlu pot fi apreciaţi următorii indicatori:
a. dacă este pusă în valoare metodologia specifică disciplinei predate (ne aflăm la o
lecţie de geografie, demonstraţia cu harta; la matematică sau gramatică, sprijinul
permanent pe exerciţiul propriu temei studiate etc.);
b. dacă în lecţie acordă atenţie suficientă tuturor categoriilor de elevi, dovedind mai
ales capacitatea de a evita generarea unor sentimente de frustrare în rândul elevilor
mai slabi;
c. dacă procedarea concretă corespunde nivelului elevilor, fie pe ansamblul clasei, fie
pe fiecare grupă de nivel;
d. capacitatea de a folosi varietatea de întrebări necesară (de reproducere, de
descriere, de aplicare etc.) şi de a le mânui cu destulă precizie;
e. dacă "stilul" adoptat pe parcursul lecţiei este cel mai potrivit cu materia, cu anul de
studiu, cu obiectivul urmărit, cu individualitatea elevului, având în vedere cele două
stiluri opuse: stilul "soratic" (bazat pe dialog) şi stilul "recitativ" (obiectivat în
forma expunerii) (vezi I.T. Radu, 1981);
f. dacă este capabil să transforme dialogul în dezbatere (conversaţie polilogică), dând
astfel şi elevilor posibilitatea de a pune întrebări sau a-şi spune şi susţine opinia.
4. Capacitatea de a-şi evalua corect munca didactică. Se poate constata prin
autoanaliza lecţiei, după susţinere. Dacă această capacitate există, ea reprezintă dovada
spiritului său obiectiv şi un punct de plecare spre autodepăşire.
CONSTANTIN MOISE

Evaluarea educatorului-manager. Este vorba, în acest caz, despre situaţia în care el


are în subordine alte persoane cu acelaşi nivel de pregătire şi de cele mai diverse specialităţi.
Calităţile ce trebuie evaluate, din această perspectivă, se focalizează în jurul următoarelor:
1. Pregătirea profesională deosebită. Aceasta este garanţia atât de ordin tehnic
cât şi moral că el este îndreptăţit să-i aprecieze pe ceilalţi. Nu credem că mai este
necesar să exprimăm în amănunt consecinţele posibile ale evaluării profesionale a unui
educator strălucit, de către un manager ignorant.
2. Capacitatea de "infiltrare", măcar de principiu, în informaţia şi
metodologia fiecărei specialităţi profesate de colegii subordonaţi. Este o probă dificilă,
dar strict necesară, numai ea făcând posibilă comunicarea profesională relevantă dintre
cele două părţi.
3. Capacitatea de empatie. Şi aici, ca şi în cazul relaţiei cu elevii, ar fi dovada
suficientă că îşi înţelege colegii şi îi respectă.
4. Capacitatea de a rezolva şi mai ales de a preveni conflictele. Experienţa
vieţii noastre profesionale ne-a dovedit că în orice colectiv pot apărea, din varii motive,
o multitudine de interese divergente, apte să genereze microgrupuri aflate mereu în
contradicţie. Anihilarea influenţei frenatorii a respectivelor contradicţii asupra bunului
mers al activităţii colectivului este posibilă mai ales prin priceperea managerului de a
comunica, de a fi echidistant şi de a se impune în spiritul dreptăţii.
5. Pregătire suficientă în plan legislativ. Avem în vedere că el va fi în postura
de a lua decizii în sfera obligaţiilor şi drepturilor personalului a cărui activitate o
coordonează.
6. Calităţi administrativ-gospodăreşti. Le poate dovedi şi prin implicarea
directă în această dimensiune a procesului educativ, dar mai ales prin abilitatea de a-şi
recruta colaboratorii cei mai apţi să-şi asume această misiune.

APLICAŢIE
Selectaţi din fiecare categorie de calităţi (generale, didactice, manageriale) câte două-trei pe
care le consideraţi cele mai relevante, iar pe baza lor construiţi profilul ideal al educatorului.

BIBLIOGRAFIE
• * * *, Dicţionar de pedagogie, 1979, E.D.P
• Bârsănescu, Şt., Tehnologia didactică. Prelegeri universitare, 1939, Albina Românească,
Iaşi
• Bloom, B., Hastings, J.T., Madaus, G., Sumative and formative evaluation of student
learning, 1971, McGrow Hill Company
• Brandza, E., Pedagogie şcolară, 1932, Ed. Cartea Românească, Bucureşti
• Chirleşan, G., Ghid de evaluare la fizică, 1999, SNEE
• Cucoş, C., Pedagogie, 2002, Ed. Polirom, iaşi
• Dancsuly, Principiile fundamentale ale educaţiei, în: Dancsuly, Ionescu, Salade, Radu,
Pedagogie, 1979, E.D.P.
• Doicescu, R., Ghid de evaluare pentru istorie, 2001, Editura ProGnosis, Bucureşti
• Eliade, I.P., Elemente de pedagogie şi metodologie teoretică şi practică, 1868,
Imprimeria Statului, Bucureşti
• Gagné, R., Briggs, L., Principii de design al instruirii, 1977, E.D.P
• Gavriliu, L., Introducere în psihologia educaţiei, litogr. vol. I, 1969, IP Suceava
• Gronlund, N.E., Measurement and evaluation in teaching, 1971, McMillan Company,
New York
• Landsheere, G. De, Evaluarea continuă şi examenele, 1975, E.D.P.
• Lindeman, R., Evaluarea în procesul instruirii, în: Ball şi Davitz, Psihologia procesului
educaţional, 1978, E.D.P.
• Lisievici, P., Calitatea învăţământului, EDP. R.A., Bucureşti, 1997
• Liţoiu, N., Metode şi instrumente de evaluare, Stoica (coord.), Evaluarea curentă şi
examenele, 2001, Editura ProGnosis, Bucureşti
• Mândruţ, M., Tipologia itemilor, în: Stoica (coord.), Evaluarea curentă şi examenele,
2001, Editura ProGnosis, Bucureşti
• Meyer, G., De ce şi cum evaluăm, 2000, Ed. Polirom, Iaşi
• Moise, C., Evaluarea randamentului şcolar, în Văideanu (coord.), Pedagogie. Ghid pentru
profesori, vol. II, litogr., 1986, UAIC
• Momanu, M., Proiectarea şi desfăşurarea activităţii didactice în: Cucoş, C. (coord.),
Psihopedagogie pentru examen de definitivare şi grade didactice, 1998, Ed. Polirom, Iaşi
• Muster, D., Hazgan, A., Popescu, P., Metodologia examinării şi notării elevilor, 1969,
E.D. P.
• Muster. D., Verificarea progresului şcolar prin teste docimologice, 1970, E.D.P.
• Neacşu, I., Stoica, A., Ghid general de evaluare, 1996, Editura Aramis, Bucureşti
• Nicola, I., Pedagogie, 1994, E.D.P.
• Niţă, C. (coord.), Ghid de evaluare la matematică, 1999, SNEE
• Oţet, Fl., Ghid de evaluare pentru ştiinţe socio-umane, 2000, Editura ProGnosis,
Bucureşti
• Payne, D., The specification and measurement of learning outcomes, 1968, Blaisdell
Publishing Company, Waltham Massachusetts, Toronto, London
• Păuş, V., Ghid de evaluare pentru învăţământul primar, 1999, SNEE
• Popescu, P., Examinarea şi notarea curentă, 1978, E.D.P.
• Radu, I. T. şi Popescu, P., Evaluarea randamentului şcolar, în: Salade (coord.), Didactica,
1982, E.D.P.
• Radu, I. T., Teorie şi practică în evaluarea eficienţei învăţământului, 1981, E.D.P.
• Radu, I., Elemente de docimologie didactică, în: Ionescu şi Radu (coord.), Didactica
modernă, 1995, Editura Dacia, Cluj
• Radu, I., Metode de verificare şi evaluare, în Dacsuly, Ionescu, Radu, Salade, Pedagogie,
1979, E.D.P.
• Radu, I.T., Evaluarea în procesul didactic, 2000, E.D.P.
• Roman, I. (coord.), Tehnologii didactice active, 1984, Iaşi, Centrul de Şt. Sociale, UAIC
• Roman, I., Moise, C., Curs de pedagogie, vol. II Didactica, litogr., 1970, IP Suceava
• Roman, I., Popescu, P., Lecţii în spiritul metodelor active, 1980, E.D.P.
• Smith, G.M., Ghid simplificat de statistică pentru psihologie şi pedagogie, E.D.P.
Bucureşti, 1971
• Stan, A., Testul docimologic, 2002, Ed. Polirom, Iaşi
• Stan, C., Evaluare şi autoevaluare în procesul didactic, în: Ionescu, M. (coord.),
Pedagogie, 2001, Ed. Presa Universitară Clujeană, Cluj
• Stanciu, I.Ghe., Metodele de învăţământ în: Stoian, St., Curs de pedagogie generală,
1961, E.D.P.
• Stoica, A. (coord), Evaluarea curentă şi examenele, 2001, Editura ProGnosis, Bucureşti
• Stoica, A., Musteaţă, S., Evaluarea rezultatelor şcolare, 1997, Ed. Liceum, Chişinău
• Strungă, C., Evaluarea şcolară, 1999, Ed. De Vest, Timişoara
• Todoran, D., Metodele de învăţământ, în: Dancsuly, Manolache, Chircev, Pedagogie,
1964, E.D.P., Bucureşti
CONSTANTIN MOISE

• Ţîrcovnicu, V., Pedagogie generală, 1975, Facla, Timişoara


• Vîlceanu, B. (coord.), Capacitate 2001 – Modele de subiecte, 2001, Editura ProGnosis,
Bucureşti
• Vogler, J., Evaluarea în învăţământul preuniversitar, 2000, Ed. Polirom, Iaşi
• Walberg, H.J., Haertel, G. D. (eds.), The International Encyclopedia of Educational
Evaluation, 1994, Oxford, Pergamon Press