Sunteți pe pagina 1din 72

TEORIA ȘI METODOLOGIA EVALUĂRII

Scopul unităţii de curs:


• Formarea competențelor de evaluare a rezultatelor preșcolarilor și școlarilor mici

Obiective
• Să identifice elementele de specificitate în evaluarea elevilor, a profesorilor și a
instituțiilor școlare;
• Să explice funcțiile evaluării în context educațional și legătura dintre evaluare și
curriculum, predare, învățare;
• Să compare diferite forme și tipuri de evaluare (formativă/sumativă,
inițială/continuă/finală, criterială/normativă etc.);
• Să descrie metode tradiționale și alternative de verificare (inclusiv testul docimologic);
• Să elaboreze secvențe și instrumente de evaluare specifice învățământului preșcolar și
primar;
• Să descrie metode de apreciere a performanțelor elevilor și elementele de specificitate
în învățământul preșcolar și primar (notarea și aprecierea verbală; standarde și
descriptori de performanță);
• Să explice erorile posibile în evaluare și modalitățile de evitare a acestora.

Tematică generală

1. Delimitări conceptuale generale


1.1. Terminologia specifică teoriei evaluării
1.2. Elemente de specificitate în evaluarea rezultatelor elevului
1.3. Relația dintre evaluare, curriculum, predare și învățare
2. Funcții ale evaluării rezultatelor elevilor
3. Tipuri de evaluare a rezultatelor elevilor
4. Metode de evaluare a rezultatelor elevilor
4.1. Clasificări ale metodelor de evaluare
4.2. Metode tradiționale de verificare
4.2.1. Metode de verificare orală
4.2.2. Metode de verificare în scris
4.2.3. Metode de verificare practică
4.3. Testul docimologic
4.3.1. Definiții și tipologie
4.3.2. Definiţia itemului din perspectiva evaluării. Tipuri de itemi
4.3.3. Itemii obiectivi
4.3.4. Itemii semiobiectivi
4.3.5. Itemii subiectivi
4.3.6. Calitățile testului docimologic
4.3.7. Proiectarea testului docimologic
4.4. Metode alternative (complementare) de verificare
4.4.1. Portofoliul
4.4.2. Proiectul
4.4.3. Investigația
4.4.4. Observarea sistematică a activității și a comportamentului elevului
4.4.5. Autoevaluarea și interevaluarea
5. Metode de apreciere
5.1. Notarea
5.1.1. Notarea analitică și notarea holistică
5.1.2. Notarea subiectivă și notarea obiectivă
5.1.3. Notarea criterială, notarea normativă și notarea în raport cu progresul
individual
5.2. Aprecierea verbală
6. Erori (factori perturbatori) în evaluarea rezultatelor școlare
1. Delimitări conceptuale generale

Teoria și metodologia evaluării completează imaginea despre elementele fundamentale ale


activității didactice, deja creionată prin intermediul teoriei curriculumului și a instruirii. Nu vom
încerca să argumentăm evidența, ci să atragem atenția asupra importanței actului evaluativ. Prin
impactul său, evaluarea constituie o punte de legătură între școală, familie și comunitate, iar orice
reglaj slab în activitatea de evaluare determină incongruențe nu doar în clasă sau în școală, ci și
dincolo de zidurile acestora. Importanța evaluării este poate mai evidentă în ultimii ani, în
contextul politicilor naționale privind certificarea studiilor (vezi exemplul examenului de
bacalaureat) și al celor privind evaluarea elevilor la finalul ciclurilor școlare (evaluarea națională
la sfârșitul claselor a IV-a, includerea în sistemele de evaluare internațională a elevilor din clasele
a VII și a VIII-a, sistemul „tezelor unice” care va fi reconsiderat etc.).
Pornind de la aceste premise, vă propunem o sinteză a reperelor majore privind evaluarea,
în vederea pregătirii dumneavoastră pentru cariera didactică.

1.1. Terminologia specifică teoriei evaluării


În mod evident, primul termen pe care ar trebui să-l definim este chiar cel de evaluare,
prin raportare la contextul educațional. O definiție sintetică este însă dificil de formulat, având în
vedere abundența de termeni „concurenți” care sunt invocați în literatura de specialitate: a
aprecia, a constata, a estima, a examina, a cântări, a judeca, a măsura, a nota, a valida (sau
a invalida), a valoriza (sau a devaloriza), a expertiza (Vogler, 2000). Nici unul dintre
termenii amintiți nu explică însă complet conceptul de evaluare și, de aceea, facem apel la o
definiție propusă de A. J. Nitko (2001, pp. 4-5), pe care încercăm să o adaptăm nevoilor
noastre de înțelegere: în context educațional, evaluarea, în sensul său cel mai larg, se referă la
procesul de colectare, prelucrare și interpretare a informațiilor necesare pentru a lua decizii
despre elevi, curriculum, programe educaționale și chiar politici în domeniul educației.
Deciziile privind elevii se pot referi la selecția acestora pentru anumite programe
educaționale, verificarea continuă a achizițiilor școlare, certificarea finală a studiilor,
consilierea remedială, orientarea în carieră etc. Deciziile cu privire la curriculum și programe
educaționale pot include revizuirea finalităților, a conținuturilor și a chiar a modalităților de
evaluare. În plus, la acest nivel al evaluării se poate discuta și despre evaluarea cadrelor
didactice și chiar a instituțiilor școlare. Politicile educaționale pot fi, de asemenea, afectate de
procesele evaluative, iar un exemplu în acest sens poate fi decizia de a reforma segmente ale
vieții școlare, după realizarea unei evaluări a întregului sistem de învățământ.
O definiție românească a evaluării pedagogice atrage atenția asupra acelorași
elemente: potrivit lui I.T. Radu (1981, pp. 17-18), evaluarea este "procesul menit să măsoare
şi să aprecieze valoarea rezultatelor sistemului de educaţie sau a unei părţi a acestuia,
eficacitatea resurselor, a condiţiilor şi a operaţiilor folosite în desfăşurarea activităţii, prin
compararea rezultatelor cu obiectivele propuse, în vederea luării deciziilor privind
ameliorarea activităţii în etapele următoare".
Evaluarea educațională este, așadar, o activitate cu adevărat complexă care poate viza
orice actor din spațiul educațional, orice instituție, orice segment al vieții școlare. În contextul
pregătirii pentru cariera didactică accentul va cădea întotdeauna pe evaluarea elevilor, deși
profesorii ar trebui să fie informați și cu privire la alte paliere ale evaluării (mai ales evaluarea
cadrelor didactice și a instituțiilor de învățământ).

Temă de reflecție
Încercați să realizați un tabel cu argumente pro și contra evaluării naționale a elevilor la
sfârșitul clasei a IV-a și să sintetizați concluziile într-o frază.
Teoria evaluării operează constant cu o serie de termeni care necesită clarificări:
• Docimologia este știința sau domeniul care are ca obiect studierea sistematică a
examenelor, în special a sistemelor de notare şi a comportării examinatorilor şi a celor
examinaţi (De Landsheere, 1975).
• Termenul doxologie se referă la studierea sistematică a rolului aprecierii în învăţământul
şcolar, efectele stimulante sau inhibitoare ale diverselor forme de examinare, reacțiile
examinatorilor și a celor examinați (De Landsheere, 1975).
• Sintagma randament şcolar defineşte nivelul de pregătire şi dezvoltare a personalităţii
elevului prin raportare la finalitățile educaționale.
• Termenii performanţă şcolară şi progres școlar sunt utilizați cu acepțiuni diferite în
teoria evaluării. Performanța școlară poate fi considerată orice rezultat al elevului (indiferent
de calitatea acestui rezultat), însă poate fi concepută și restrictiv, ca rezultat notabil sau de
valoare al unui elev. Termenul de progres școlar surprinde orice salt calitativ al unui elev,
care se poate observa prin compararea performanțelor actuale cu cele anterioare (Radu şi
Popescu, 1982).

1.2. Elemente de specificitate în evaluarea rezultatelor elevului


Orice inițiere în evaluarea rezultatelor elevilor impune delimitarea unor termeni
importanți, care sunt utilizați frecvent în literatura de specialitate. O primă triadă este alcătuită
din evaluare, măsurare și apreciere. Evaluarea rezultatelor elevului se referă la două seturi de
activități: 1) aplicarea unor metode și proceduri diverse se colectare a informațiilor despre
performanțele elevului și 2) elaborarea unor judecăți de valoare privind performanțele
observate (Linn și Gronlund, 2000).
Așadar, evaluarea nu se confundă nici cu măsurarea, nici cu aprecierea. De asemenea,
metodele de colectare a informațiilor despre rezultatele elevului nu conduc întotdeauna la
descrieri cantitative (măsurare). Mai mult, este chiar recomandat ca descrierile cantitative
(numerice) ale rezultatelor elevilor să fie completate cu descrieri calitative (nonmăsurare).
Astfel, distincția între măsurare și evaluare devine mai evidentă: nu toate acțiunile evaluative
se finalizează cu atribuirea unei valori numerice în relație cu rezultatele elevului. În plus,
măsurarea rezultatelor elevului nu presupune cu necesitatea testarea, existând și forme
alternative de colectare a informațiilor.
Aprecierea însoțește întodeauna activitatea de măsurare și se traduce în acele judecăți
de valoare privind dezirabilitatea rezultatelor elevului.
R. L. Linn și N. E. Gronlund (2000) descriu relația dintre evaluare, măsurare și
apreciere ca proces: descrierea calitativă (non-măsurare) și cantitativă (măsurare) a
rezultatelor elevului determină judecățile de valoare (aprecierea), iar acestea determină
regândirea secvențelor evaluative ulterioare.

O altă problemă care trebuie clarificată atunci când discutăm despre evaluarea elevilor
se referă la obiectul evaluării, cu ale cuvinte trebuie să răspundem la întrebarea „Ce rezultate
ale elevilor evaluăm?”. Nici răspunsul la această întrebare nu este simplu, pentru că profesorul
nu evaluează doar cunoștințe, deși, cel mai adesea, acestea constituie obiectul principal al
eforturilor evaluative. Atât literatura românească de specialitate, cât și cea străină accentuează
faptul că rezultatele elevului pot consta în cunoştinţe, capacităţi intelectuale, capacităţi de
aplicare a cunoştinţelor, capacitatea de a crea produse personale, trăsături de personalitate
şi de conduită (Radu, 1981; Moise, 2007; Linn și Gronlund, 2000; Nitko, 2001). Dacă
rememorați cunoștințele dobândite la cursul de Teoria și metodologia instruirii, vă veți
reaminti că obiectivele sunt elaborate și pentru a orienta activitatea de evaluare, ori acestea se
referă nu doar la domeniul cognitiv, ci și la cel afectiv și psihomotor. Nu este mai puțin
adevărat că domeniul cognitiv ocupă cel mai mare spațiu atât în pregătirea viitorilor profesori,
cât și în evaluarea rezultatelor elevilor. Există însă o preocupare evidentă pentru evaluarea
achizițiilor complexe ale elevilor, atât în domeniul cognitiv, cât și în cel afectiv și psihomotor,
mai ales în contextul reformelor educaționale comprehensive care au loc în aproape toate
țările lumiii (vezi deziderate precum dezvoltarea gândirii critice, dezvoltarea cetățeniei
democratice etc.)

R. L. Linn și N. E. Gronlund (2000) prezintă un set de principii generale în evaluarea


rezultatelor elevului:
a. Primul pas în proiectarea unei secvențe de evaluare constă întotdeauna în
stabilirea caracteristicilor care vor fi evaluate. Acuratețea și eficiența evaluării depind în
mare măsură de claritatea cu care sunt circumscrise caracteristicile care vor fi evaluate. În
acest sens, reperele profesorului sunt obiectivele cadru și de referință din programele școlare,
standardele de performanță pentru elevi și obiectivele operaționale.
b. Metodele de evaluare a rezultatelor elevilor trebuie alese în așa fel încât să
conducă cu adevărat la evaluarea caracteristicilor pe care le avem în vedere. Deși metodele
de evaluare trebuie să îndeplinească o serie de condiții generale (acuratețe, obiectivitate etc.)
acestea nu sunt suficiente pentru a decide în situații de evaluare specifice. De exemplu, dacă
intenționăm să evaluăm conduite, nu este recomandat să folosim testul docimologic, ci
observarea sistematică a comportamentului elevului.
c. Evaluarea comprehensivă presupune utilizarea unor metode și instrumente de
evaluare variate. Cu alte cuvinte, se recomandă utilizarea în complementaritate a unui set de
metode și instrumente care să conducă la judecăți realiste și fundamentate despre o
caracteristică a elevilor.
d. Utilizarea adecvată a metodelor și a instrumentelor de evaluare presupune și
conștientizarea limitelor acestora. Nici o metodă sau instrument de evaluare nu este
infailibilă/infailibil. Ele pot conduce la judecăți de valoare corecte în anumite situații
particulare de evaluare, dar pot genera erori grave în altele. Toate metodele de evaluare au
limite și, de aceea, se recomandă utilizarea lor în combinații care să optimizeze deciziile
profesorului.
e. Evaluarea se constituie într-o cale de a determina nivelul performanțelor elevilor în
vederea optimizării proceselor de predare-învățare și nu este un scop în sine. Evaluarea are
ca finalitate majoră luarea unor decizii educaționale și nu are sens în condițiile în care
rezultatele nu sunt utilizate în interesul elevului.

Temă de reflecție
Comentați principiile generale ale evaluării enunțate mai sus. Ați mai putea formula și alte
principii ale evaluării?

1.3. Relația dintre evaluare, curriculum, predare și învățare


Literatura pedagogică românească îşi asumă şi dezvoltă perspectiva structurală asupra
curriculumului, accentuând nevoia de centrare pe interacţiunile dintre componentele acestuia.
Astfel, se apreciază că dacă în urmă cu mai mult de trei secole termenul de curriculum
desemna un plan de învăţământ, în prezent poate fi definit ca un întreg program sau parcurs de
învăţare.
În sens restrâns, termenul desemnează strict conţinuturile învăţământului (sau doar
obiectivarea acestora în documente de tipul planului de învăţământ, programei şcolare,
manualelor şcolare, auxiliarelor etc.), în timp ce accepţiunea largă trimite la un întreg program
de acţiuni educaţionale, cu toate componentele şi conexiunile dintre acestea (Creţu, 1999;
Cucoş, 2002).
De asemenea, se sugerează faptul că utilizarea termenului în teoria şi practica
pedagogică se justifică şi se impune în contextual abordării sistemice a proceselor
educaţionale, acordându-se atenţie sporită componentelor procesului de învăţământ şi a
relaţiilor dintre acestea, abordate în mod tradiţional de didactică (Negreţ-Dobridor, 2001).
O încercare de conceptualizare comprehensivă a termenului de curriculum (Potolea,
2002) propune ca premise admiterea caracterului multidimensional al acestuia, a faptului că el
poate fi definit doar în asociere sau conjuncţie cu alţi termeni şi a caracterului extrem de
dinamic (este permanent redefinit şi îmbogăţit). Discursul se centrează asupra caracterului
multidimensional al curriculumului, o perspectivă care facilitează şi expunerea ideilor noastre
cu privire la evaluare. Potolea analizează două modele structurale ale curriculum-ului:
modelul triunghiular care include finalităţile educaţionale, conţinuturile instruirii şi timpul de
instruire/învăţare, şi modelul pentagonal care conservă componentele modelului triunghiular
la care se adaugă strategiile de predare-învăţare şi strategiile de evaluare. Acest ultim model
justifică întreg demersul de cercetare, dar şi de reformă curriculară în sistemul educaţional
românesc. Termenul se legitimează tocmai prin acest tip de abordare, care subliniază
deopotrivă extensiunea şi nuanţele sale.
De ce sunt importante aceste precizări asupra curriculumului, în contextul unui discurs
pedagogic despre evaluare? Răspunsul ţine de evidenţă, dacă analizăm tipologia definiţiilor
termenului de curriculum, dezbaterile despre structura, componentele acestuia şi tipurile de
curriculum delimitate. Mai mult decât atât, unul dintre tipurile de curriculum, curriculum evaluat
sau testat (care se referă la acele secvenţe de conţinuturi actualizate în procesul de evaluare -
Creţu, 1999; Cucoş, 2002) conectează cele două concepte şi în plan verbal.
Relația dintre curriculum și evaluare poate fi abordată și din perspectiva efectelor
educaționale, care se manifestă bidirecțional în sensul că orice construcție curriculară
influențează evaluarea, iar evaluarea, la rândul său are impact asupra curriculumului (Mihail,
2001). Literatura de specialitate descrie două seturi de efecte care ar putea lămuri natura
relației dintre curricum și evaluare:
a) Efectul de feedback se referă la posibilitatea ca profesorul să utilizeze informațiile
rezultate din activitatea de evaluare în optimizarea procesului de predare-învățare, prin
luarea unor decizii adecvate, fundamentate pe rezultatele elevului. Feedback-ul formativ,
obținut ca urmare a evaluării continue, permite diagnosticarea punctelor tari și punctelor
slabe ale elevului, precum și revizuirea deciziilor educaționale în concordanță cu acestea.
Feedback-ul sumativ permite profesorului să comunice elevilor, părinților, factorilor de
decizie etc. care este nivelul de achiziții în raport cu prescripțiile din curriculum.
b) Efectul retroactiv sau de siaj (engl. backwash sau washback) surprinde influența evaluării
asupra metodelor de predare-învățare utilizate la clasă, asupra calității interacțiunilor
dintre profesor și elevi, asupra nivelului motivațional al elevului și chiar asupra strategiilor
evaluative ce vor fi utilizate ulterior la clasă. Specialiștii vorbesc și despre un efect de tip
washbefore care explică modul în care evaluarea (în special cea sumativă, la nivel
național, organizată pentru elevii care încheie un ciclu școlar) poate conduce la
modificarea întregului curriculum (finalități, conținuturi, metode de predare-învățare și
evaluare recomandate etc.).
Un viitor profesor trebuie să conștientizeze faptul că evaluarea rezultatelor elevului
presupune utilizarea corectă a unui set de metode și instrumente specifice, dar procesul
evaluativ depășește granițele înguste ale colectării și interpretării de informații despre
achizițiile educabililor. Evaluarea debutează cu formularea obiectivelor educaționale și se
finalizează cu judecăți privind nivelul de atingere a acestor obiective (Linn și Gronlund,
2000).
Evaluarea trebuie abordată în strânsă legătură cu finalităţile educaţionale,
conţinuturile şi strategiile de predare-învăţare, la care s-ar putea adăuga – potrivit unor
pedagogi – mijloacele de învăţământ şi timpul şcolar. Orice modificare la nivelul uneia dintre
componentele curriculumului, va genera în mod logic, transformări, ajustări la nivelul
celorlalte.

Temă de reflecție
Recitiți fragmentele din cursul de Teoria și metodologia instruirii cu privire la obiectivele
educaționale. Încercați apoi să răspundeți la întrebarea „În ce mod influențează obiectivele
educaționale activitățile de predare, învățare și evaluare?”.

2. Funcţiile ale evaluării

Funcțiile evaluării constituie răspunsuri la întrebarea „În ce scop evaluăm?”. Dacă


evaluarea nu este un scop în sine, trebuie să determinăm rațiunile pentru a consuma timp,
efort și energie pentru proiectarea și realizarea sa. Trebuie să facem de la bun început
precizarea că nu există consens terminologic asupra funcțiilor evaluării, literatura de
specialitate fiind presărată cu clasificări și descrieri ale acestora. Vom prezenta selectiv câteva
seturi de funcții și vom sintetiza într-un tabel alte opțiuni privind utilitatea și finalitatea
procesului evaluativ.
O sinteză a abordărilor din literatura de specialitate ar conduce la determinarea a două
categorii fundamentale de funcții ale evaluării (I.T. Radu, 1981; Moise, 2007): funcţii sociale
și funcţii pedagogice. Dintre funcțiile sociale cea mai importantă este aceea de asigurare a
feedback-ului către societate, în raport cu finalitățile educaționale împărtășite la un moment
dat și care trebuie să orienteze în permanență viața școlii. Mai precis, școala are datoria de a
informa factorii sociali (familii, comunitate, decidenți în materie de educație) cu privire la
nivelul pregătirii elevilor (pe tot parcursul procesului educațional) şi la numărul de absolvenţi
pe cicluri de învățământ şi profilul lor (la finalul procesului). Dintre funcțiile pedagogice cele
mai importante pot fi considerate: orientarea și ameliorarea activității educaționale și luarea
deciziilor cu privire la rezultatele elevului prin notare. Toate celelalte funcții descrise în
lucrările dedicate evaluării școlare pot fi asociate celor enumerate mai sus. Astfel, funcția de
prognoză (anticiparea rezultatelor viitoare ale elevului pe baza celor obținute în prezent),
funcția de diagnoză (stabilirea nivelului elevului la un moment dat, în scopul adecvării
activităților educaționale la nevoile sale de învățare), funcția de orientarea şcolară (stabilirea
profilului aptitudinal al elevului în vederea orientării sale în etapele următoare de școlarizare
sau în viața profesională), funcția de feedback pentru profesor (utilizarea rezultatelor evaluării
pentru ameliorarea activității de predare) sunt parte a setului de funcții pedagogice de
orientare și ameliorare. Funcția de certificare (a competențelor la finalul unui ciclu de
învățământ), funcția de ierarhizare (clasificarea elevilor după nivelul rezultatelor școlare) pot
fi considerata aspecte ale funcției decizionale.
Cele mai multe dintre funcțiile descrise anterior se regăsesc și în clasificarea propusă
de fostul Serviciu Naţional de Evaluare şi Examinare (SNEE, în prezent departament al
Centrului Național pentru Curriculum și Evaluare în Învățământul Preuniversitar) care a
coordonat evaluările și examenele naționale românești în ultimii ani (Stoica et al, 2001).
Funcțiile evaluării sunt grupate în funcții generale şi specifice. Funcţiile generale sunt cea
diagnostică, cea prognostică, cea de certificare și cea de selecție, iar funcțiile specifice sunt
cea motivaţională (stimularea elevului în activitatea de învățare prin feedback pozitiv), cea de
consiliere (orientare școlară și profesională).

Tabelul nr. 1. Funcții ale evaluării descrise în literatura de specialitate


Autor Funcții ale evaluării
I. Radu (1995, pp. 257 - 1) Conexiunea inversă în procesul de instruire
260) 2) Măsurarea progresului realizat de elevi
3) Valoare motivaţională
4) Stimularea autoevaluării și a formării conştiinţei de sine
5) Reglare
I. Jinga şi E. Istrate (1998, 1) Funcţia de control
pp. 322 – 323) 2) Funcţia de reglare a sistemului
3) Funcţia de predicţie
4) Funcţia de clasificare şi selecţie
5) Funcţia educativă
6) Funcţia socială
J. Vogler (2000, p. 31) 1) Recompensarea sau pedepsirea elevilor în funcţie de natura
performanţelor obţinute de aceştia în activitatea de învăţare;
2) Clasarea şi compararea rezultatelor în funcţie de probele comune, cu
scopul de a provoca emulaţia;
3) Informarea autorităţilor şcolare şi a părinţilor în legătură cu meritele sau
deficienţele fiecărui elev
C. Cucoş (2002, p. 373) 1) Funcția de constatare
2) Funcția de informare
3) Funcția de diagnosticare
4) Funcția de pronosticare
5) Funcția de selecţie
6) Funcția pedagogică
I. Cerghit (2002, pp. 301 - 1) Funcţia constatativ-explicativă sau de diagnoză
303) 2) Funcţia de supraveghere (de control sau monitorizare)
3) Funcţia de feed-back
4) Funcţia de ameliorare
5) Funcţia de motivaţie, de stimulare
6) Funcţia de prognoză
7) Funcţia de stimulare a dezvoltării capacităţii de autoevaluare la elevi

Temă de reflecție
Citiți cu atenție funcțiile evaluării enumerate în tabel și încercați să descoperiți similarități și
diferențe între propunerile diverșilor autori.

3. Tipuri de evaluare a rezultatelor elevilor

Ca și în cazul funcțiilor pe care le poate îndeplini evaluarea, tratarea tipurilor de evaluare


a rezultatelor elevilor a beneficiat de multă atenție în rândul pedagogilor, fiind enunțate în acest
sens mai multe criterii de clasificare însoțite de tipologiile aferente. Din dorința de a simplifica
tabloul tipurilor de evaluare, vom prezenta sintetic clasificările pe care le considerăm relevante
pentru formarea dumneavoastră, fără a intra în detalii privind eventualele suprapuneri ori
incongruențe conceptuale.

a. Cea mai cunoscută clasificare a tipurilor de evaluare se realizează prin raportare la


relația între procesele de predare-învățare și cele de evaluare. Pe baza acestui criteriu se face
distincția între evaluarea formativă și cea sumativă (De Landsheere, 1975). Evaluarea formativă
se realizează în paralel cu activitățile de predare-învățare și vizează mai degrabă reglarea
procesului educațional pe parcursul său (prin feedback-ul pentru elevi și pentru profesor), decât
aprecierea rezultatelor elevului prin notă. În lucrările recente, se utilizează din ce în ce mai des
sintagma evaluare dinamică (Radu, 2000), care se substituie evaluării formative, dar păstrează
definițiile și caracteristicile acesteia. Evaluarea sumativă se realizează după finalizarea unei
secvențe de predare-învățare (fie că aceasta conduce la un volum relativ mic de achiziții ale
elevului, fie că este vorba chiar despre un întreg ciclu de învățământ) și se soldează întotdeauna
cu aprecierea rezultatelor elevului prin notă.

b. Dacă ne referim la elementul de referință în aprecierea rezultatelor elevului, putem


distinge evaluarea normativă şi evaluare criterială (De Landsheere, 1975). Evaluarea
normativă presupune compararea rezultatelor fiecărui elev cu media (sau norma) grupului,
prin raportarea la rezultatele obținute de către ceilalți elevi. Prin contrast, evaluarea criterială
presupune raportarea la un set de criterii constituite din obiectivele educaționale. Această
tipologie a fost dezvoltată în contextul discuțiilor despre testele docimologice și modul în care
trebuie interpretate scorurile obținute (în secțiunea dedicată testului docimologic, veți
descoperi că și testele docimologice pot fi normative, respectiv criteriale).
Din combinarea celor două criterii de clasificare deja prezentate, rezultă faptul că
evaluarea sumativă poate fi normativă și criterială (deoarece nu se finalizează prin notare,
evaluarea formativă nu poate îmbrăca aceste forme).

c. Dacă avem în vedere momentul în care se realizează evaluarea în raport cu un


program educațional, putem identifica evaluarea inițială, evaluarea continuă și evaluarea
finală (Bloom, 1971, citat de Moise, 2007). Evaluarea inițială se realizează înainte de debutul
unui program educațional, cu scopul de a stabili nivelul de pregătire al elevului și se poate
realiza prin teste de aptitudini, teste de plasament, teste docimologice etc. Evaluarea continuă
este echivalentul evaluării formative, în timp ce evaluarea finală este, evident, sumativă.

d. Volumul de achiziții ale elevului care se are în vedere constituie criteriul de


diferențiere între evaluarea secvențială și evaluarea globală (Cucoș, 2002). În timp ce
evaluarea secvențială surprinde un volum redus de achiziții ale elevului, evaluarea globală
presupune investigații de amploare de tipul celor care se organizează la finalul unui ciclu școlar.

e. Dacă ne raportăm la funcția dominantă, putem distinge între evaluarea diagnostică și


cea prognostică (Radu, 2000). Evaluarea diagnostică vizează sesizarea progreselor sau a
regreselor elevului, cu scopul de a ameliora procesul de predare-învățare, în timp ce evaluarea
prognostică are un scop predictiv, de anticipare a evoluțiilor viitoare ale elevului.

f. În funcție de apartenența instituțională a evaluatorului, putem diferenția evaluarea


internă de cea externă. Evaluarea internă se realizează de către profesorul care predă la clasă,
în timp ce evaluarea externă se realizează de către alte persoane. De regulă, evaluarea externă
se realizează la finalul unui ciclu școlar și are ca scop limitarea subiectivității în aprecierea
rezultatelor elevilor, dar și aplicarea unor criterii și exigențe unitare la nivelul întregului
sistem educațional.

Temă de reflecție
Comentați eventualele suprapuneri conceptuale și clasificări derivate, pe baza tipurilor de
evaluare prezentate în curs.

4. Metode de evaluare a rezultatelor elevilor

4.1. Clasificări ale metodelor de evaluare


Literatura pedagogică românească a consacrat o clasificare a metodelor de evaluare pe
care o vom utiliza și noi în prezentarea analitică a acestora (Radu, 2000; Moise, 2007; Cucoș,
2008). Potrivit acestei clasificări, metodele de evaluare pot fi plasate fie în categoria metodelor de
verificare, care sunt utilizate pentru a constata care este nivelul achizițiilor elevului, fie în rândul
metodelor de apreciere care sunt utile în interpretarea rezultatelor obținute de elevi.
La rândul lor, metodele de verificare sunt fundamentale sau tradiționale și
complementare sau alternative. Metodele de verificare tradiționale sunt probele orale, scrise și
practice (în toate variantele lor: curente, periodice, finale sau globale), precum și testele
docimologice. Dacă metodele de verificare tradiționale pot fi enumerate în manieră exhaustivă, nu
se poate face aceeași afirmație cu privire la metodele complementare de evaluare. Acestea au un
încă un statut problematic, datorită faptului că în anumite ipostaze pot fi considerate mai degrabă
metode de predare-învățare, decât metode de evaluare (vezi pentru exemplificare situația hărților
conceptuale, care pot fi utilizate și ca metode de predare-învățare). În acest curs vom prezenta o
parte dintre metodele complementare de evaluare, și anume: portofoliul, proiectul, investigația,
observația sistematică a comportamentului elevului, autoevaluarea și interevaluarea.
Considerăm că se impun câteva observații privind utilizarea metodelor de evaluare, mai
ales în condițiile în care există o tendință a practicienilor de a supraaprecia o categorie de metode
sau alta. Nici o metodă nu este lipsită de limite sau dezavantaje, de unde rezultă și nevoia de
îmbinare a metodelor și instrumentelor, pentru a crește acuratețea și credibilitatea evaluării.
Metodele de evaluare nu se utilizează aleatoriu în relație cu niște conținuturi care au fost predate și
despre care presupunem că au fost învățate, ci trebuie alese prin raportare la obiectivele
educaționale care indică ce tip de achiziții trebuie să surprindem (cunoștințe, capacități,
deprinderi, atitudini etc.).

Pentru a exemplifica diversitatea punctelor de vedere din literatura pedagogică dedicată


evaluării, prezentăm și idei alternative de clasificare, care nu sunt specifice spațiului educațional
românesc. Pedagogii americani au rafinat în ultimii ani clasificările metodelor de evaluare,
meționând testul și metodele de evaluare autentică sau metodele alternative, precum și metodele
de notare (e.g. Gallagher, 1998; Linn și Gronlund, 2000; Nitko, 2001). Manualele străine de
teoria evaluării discută nu doar despre testul docimologic (care surprinde cunoștințe și capacități
intelectuale ale elevului), ci și despre alte tipuri de teste care se utilizează în școală (teste de
aptitudini, de creativitate etc.). Metodele de evaluare autentică constituie o alternativă la test, în
viziunea pedagogilor străini. Domeniul evaluării are însă cu totul alte tradiții în alte sisteme de
învățământ, iar acest fapt poate fi exemplificat prin utilizarea îndelungată a standardelor de
perfomanță pentru elevi și a testului în evaluarea inițială, continuă și finală. Procesul elaborării
standardelor de performanță, precum și utilizarea intensivă a testelor, mai ales în evaluarea
națională (examene de bacalaureat, teze unice, evaluarea națională la finalul clasei a IV-a etc.)
sunt elemente relativ noi în evaluarea românească. În acest fel se explică și opțiunile diferite
pentru clasificarea, dar și pentru utilizarea metodelor de evaluare.

4.2. Metode tradiționale de verificare


Tipologia metodelor tradiţionale de evaluare este tratată detaliat în majoritatea
lucrărilor predagogice. Metodele tradiționale de verificare sunt probele de evaluare orale,
scrise şi practice (Radu, 2000; Liţoiu, 2001; Moise, 2007; Cucoş, 2008). Unii autori preferă
utilizarea conceptelor de verificare orală, scrisă și practică, pentru a diferenția aceste metode
de examen, care este considerat o formă specială a probelor de verificare tradiționale. Fiecare
dintre aceste probe se poate aplica la clasă fie în mod curent, fie periodic, fie la finalul unor
secvențe consistente de predare-învățare (verificare globală).

4.2.1. Metodele de verificare orală sunt utilizate în mod frecvent în evaluarea la clasă
și pot îmbrăca cel puțin două forme: ascultarea sau chestionarea în fiecare lecție mixtă și
verificarea orală în lecții special organizare (lecțiile de evaluare).
Verificarea orală curentă (ascultarea) constituie substanța secvenței de „verificare a
cunoștințelor anterioare” din fiecare lecție mixtă, alături de verificarea temei pentru acasă. Ea
constă în chestionarea elevilor din conținutul lecției de zi, nefiind recomandată verificarea
cunoștințelor anterioare dintr-un set de lecții anterioare. Proiectarea și desfășurarea corectă a
probelor de evaluare curentă constituie premise pentru a obține informații suficient de precise
despre achizițiile elevului. Prin intermediul verificărilor orale curente se pot evalua
comportamente corespunzătoare unor niveluri taxonomice diferite, de la cunoștințe și
capacități până la judecăți de valoare asupra unor conținuturi, iar caracterul formativ al acestei
metode este evident. Practic, verificarea orală curentă îndeplinește în principal funcția de
orientare și ameriorare, dar poate acoperi și funcția decizională, în cazul în care se finalizează
prin notare.
O secvență de chestionare dintr-o lecție mixtă trebuie să se încadreze în limitele
temporale specifice (15-25 de minute), ceea ce permite evaluarea unui număr mic de elevi, de
la 3-5 elevi în cazul disciplinelor socio-umane, până la 6-8 elevi în cadrul disciplinelor reale.
Ascultarea începe, de regulă, printr-o conversație frontală de scurtă durată care se încheie cu
precizarea conținuturilor și a comportamentelor ce vor fi evaluate (Radu, 1979) și desemnarea
elevilor care vor fi ascultați. Restul elevilor din clasă participă la evaluare, fie prin implicare
directă (li se poate cere să formuleze și ei întrebări de verificare pentru colegii lor, să
completeze sau să corecteze răspunsurile), fie prin autoevaluarea propriilor achiziții în
comparație cu cele ale colegilor evaluați.
Întrebările care se adresează au fost grupate în mod tradițional în întrebări de bază și
întrebări ajutătoare, iar dialogul evaluator-evaluat trebuie să respecte toate regulile
conversației ca metodă didactică, deoarece verificarea orală curentă se constituie într-o formă
de factură conversațională. Se recomandă ca profesorul să asculte până la capăt răspunsul
formulat de elev, indiferent de gradul de corectitudine al acestuia și abia la final să intervină.
Dacă răspunsul este corect se poate continua secvența de evaluare, dar dacă răspunsul este
greșit se stimulează autocorectarea. În cazul în care elevul nu își poate corecta răspunsul, se
cere celorlalți elevi din clasă să intervină. În cazul în care nici această formulă de rezolvare a
sarcinii nu se soldează cu un succes, poate interveni profesorul. Nu se recomandă ca
profesorul să fragmenteze răspunsul elevului cu observații, deoarece acest comportament ar
genera și mai multă nesiguranță și neîncredere la elev. De asemenea, nu se recomandă
aprecierea prin notă a răspunsurilor izolate, a intervențiilor foarte scurte care produc
dezechilibre în apreciere. Profesorul poate utiliza un catalog personal, în care să noteze mai
multe intervenții ale elevului, pe baza cărora să se aprecieze apoi achizițiile acestuia.
Literatura de specialitate sintetizează și alte erori pe care profesorii le pot face în
verificarea orală curentă cum ar fi:
• Reducerea verificării la ascultarea lecției de zi, reprodusă mecanic de către elev fără o
selecție a conținuturilor semnificative, foarte importante indicate de către profesor prin
întrebări;
• Examinarea exclusiv frontală, fără a se nominaliza elevii ce vor fi ascultați și, eventual,
notați sau neglijarea completă a clasei, prin concetrarea atenției doar pe interacțiunea cu
elevii chestionați;
• Elaborarea defectuoasă a întrebărilor ajutătoare, care devin inutile ca mijloc de sprijinire a
elevului în formularea răspunsului.

Temă de reflecție
Analizați secvența de verificare a cunoștințelor anterioare dintr-un proiect didactic pentru o
lecție mixtă (elaborat de dvs., de către un coleg, de către un cadru didactic), concentrându-vă
atenția asupra calității întrebărilor. Încercați să corectați eventualele erori în proiectarea
întrebărilor.
Verificarea orală în lecţii special organizate (periodică) poate fi utilizată în
învățământul preșcolar și primar, cu precauția impusă de caracteristicile specifice vârstei și
având în vedere complexitatea conținuturilor vizate. Spre deosebire de verificarea orală
curentă care se realizează în fiecare lecție mixtă, verificarea orală periodică poate fi o
secvență consistentă a lecției de evaluare și poate viza conținuturi mai ample (un set de lecții,
o unitate de învățare etc.). Această metodă de evaluare presupune formularea unor sarcini de
rezolvat care sunt prezentate elevului în etape succesive. Verificarea orală periodică are
câteva avantaje în comparație cu cea curentă: în principal, permite evaluarea unui număr mai
mare de elevi și a unor conținuturi mai extinse. În cadrul lecțiilor de evaluare, verificarea
orală se poate combina cel mai adesea cu verificarea scrisă. Dacă demersul verbal este
dominant, metoda de evaluare utilizată este verificarea orală periodică, iar în cazul unei
dominante scrise avem de-a face cu o verificare scrisă periodică (cu alte cuvinte, schimbul
verbal de întrebări și răspunsuri poate fi însoțit de sarcini scrise, dar ponderea acestora din
urmă trebuie să fie mai redusă).
Datorită complexității conținuturilor și comportamentelor vizate, verificarea orală
periodică presupune eforturi mai mari de proiectare și de realizare. Spre deosebire de forma
curentă a verificării orale, acoperă mai degrabă necesitatea aprecierii elevului prin notă decât
orientarea acestuia în activitatea de învățare. Validitatea evaluării prin verificare orală
periodică este mai mare decât în cazul evaluării orale curente, deoarece volumul
conținuturilor surprinse este mai mare, iar profesorul are posibilitatea de a selecta teme,
subiecte reprezentative. Evident, notarea este mai concludentă din același motiv.

În ciuda subiectivității metodelor de verificare orală, se poate afirma că ele prezintă o


serie de avantaje, care decurg tocmai din caracterul viu al schimbului de întrebări și
răspunsuri dintre evaluator și evaluat. Profesorul are posibilitatea de a surprinde imediat
nivelul de achiziții al elevului și eventuale lacune care pot fi acoperite prin măsuri
educaționale remediale. Deși verificările orale permit mai ales colectarea de informații despre
volumul de cunoștințe asimilate de către elev, ele permit și evaluarea unor capacități mai
complexe, cum ar fi capacitatea de argumentare a elevului, capacitatea de a construi o serie de
raţionamente şi de a le susţine în manieră convingătoare.
Probele orale, în general, au marele avantaj de a-i permite profesorului să ofere suport
elevului în elaborarea răspunsului, prin reformularea întrebărilor sau prin adresarea unor
întrebări ajutătoare. În acest mod, elevii aflați în dificultate pot fi ajutați să surmonteze
momentele dificile.
Printre alte avantaje ale verificării orale curente am putea menționa: flexibilitatea în
formulare și reformularea sarcinilor de rezolvat de către elev, posibilitatea de a alterna tipul
întrebărilor şi gradul lor de dificultate, în funcţie de calitatea răspunsurilor oferite de către elev,
oportunitatea de a clarifica şi de a corecta imediat eventualele erori sau neînţelegeri ale elevului,
formularea întrebărilor și a răspunsurilor potrivit logicii şi dinamicii unui discurs oral,
interacţiunea directă între profesor şi elev.
Toate probele de verificare orală au o serie de limite, generate tocmai de caracterul
direct și, uneori, greu controlabil și predictibil al intracțiunilor dintre profesor și elev.
Numărul de elevi care poate fi evaluat prin probe orale într-o anumită unitate de timp este
relativ mic, indiferent dacă verificările sunt curente, periodice sau globale. Acest dezavantaj
este resimțit de profesor mai ales în cazul disciplinelor pentru care este alocat un număr mic
de ore prin planul de învățământ. De asemenea, volumul de conținuturi care poate fi antrenat
în evaluarea orală este relativ redus, verificarea realizându-se practic prin sondaj. În acest fel,
cunoștințe foarte importante pentru etapele următoare de predare și învățare pot fi omise, ceea
ce poate genera dificultăți.
Verificarea orală este dificilă din perspectiva elevului, mai ales dacă acesta este
introvertit sau emotiv, ceea ce presupune ca profesorul să anticipeze asemenea situații și
creeze o atmosferă de evaluare lipsită de încordare, astfel încât elevul să poată depăși
eventualele momente critice.
Unii dintre factorii perturbatori ai evaluării rezultatelor elevului au un efect mult mai
puternic în contextul probelor orale și, de aceea, profesorul este obligat să reflecteze la
posibilitățile de reducere a erorilor, mai ales dacă verificările orale se soldează cu apreciere
prin notă. Din perspectiva evaluatorului, conservarea aceluiași nivel de exigență este un
deziderat, însă realitatea educațională demonstrează că, în cele mai multe cazuri, evaluatorul
este mai exigent la începutul verificării și tinde să devină mai indulgent spre sfârșit. În plus,
nivelul de dificultate al întrebărilor este greu de echilibrat, iar acest fapt conduce la
diferențieri eronate între nivelurile de achiziții ale elevilor ascultați. În timp ce unii vor avea
de rezolvat sarcini ușoare, alții vor trebui să răspundă la întrebări complexe și, astfel, pot
apărea dezechilibre în evaluare.
Pentru a reduce subiectivitatea în verificările orale, se pot utiliza fișe de apreciere a
răspunsurilor formulate de elev, care să includă repere generale precum (Jinga et al, 1996, pp.
46-47): a) conţinutul răspunsului (profesorul trebuie să aprecieze corectitudinea şi
completitudinea acestuia, prin raportare la obiectivele şi la conţinuturile vizate); b)
organizarea conţinutului (profesorul va analiza și modul de structurare a conţinutului, precum
şi coerenţa în formularea răspunsului); c) prezentarea conţinutului (profesorul va lua în calcul
claritatea, siguranţa şi acurateţea în redarea conținuturilor vizate). La aceste elemente, s-ar
putea adăuga elementele de originalitate din răspunsurile elevului.

Temă de reflecție
Recitiți descrierea conversației ca metodă didactică din cursul de teoria instruirii și încercați să
adaptați exigențele pe care trebuie să le respecte întrebările și răspunsurile la situația de verificare
orală curentă, respectiv periodică.

4.2.2. Metode de verificare în scris


Varietatea de obiective și de conținuturi implicate în activitatea didactică impune cu
necesitate și utilizarea metodelor de verificare în scris. În funcție de nivelul de generalitate al
obiectivelor și de volumul de cunăștințe vizat, probele scrise pot fi (Manolescu, 2002; Moise,
2007):
• Probe scrise curente (lucrarea de control în învățământul primar și extemporalul în
învățământul gimnazial și liceal);
• Lucrări de control la sfârşitul unui capitol sau al unei unități de învățare;
• Lucrări scrise semestriale (care pot îmbrăca și forma tezelor în gimnaziu și liceu) care sunt
precedate de lecții de recapitulare și sistematizare.
Probele scrise sunt preferate în multe dintre situațiile de evaluare, deoarece prezintă o
serie de avantaje în comparație cu metodele de verificare orală:
• Cea mai importantă caracteristică a probelor scrise este aceea că presupun elaborarea unor
sarcini sau subiecte strict identice pentru toți elevii. În acest fel, profesorul poate evita
eventualele inconsecvențe în formularea sarcinilor de rezolvat, fapt greu de controlat în
cadrul probelor orale care au ca potențial risc elaborarea de întrebări cu nivele de
dificultate diferite, ceea ce poate conduce la erori în aprecierea rezultatelor elevilor.
• Spre deosebire de probele orale, care sunt cronofage, lucrările scrise permit evaluarea unui
număr mare de elevi (întreaga clasă, în cazul lucrărilor scrise curente și a celor proiectate
la sfârșitul unui capitol) într-un interval de timp relativ scurt.
• Probele scrise permit evaluarea unui volum mare de achiziții ale elevului și pot surprinde
comportamente specifice tuturor nivelelor taxonomice pentru domeniul cognitiv, de la
cunoașterea conceptelor și a terminologiei la analiză, sinteză și chiar evaluare.
• Subiectivitatea evaluatorului poate fi “controlată”, acesta având posibilitatea de a reveni
asupra unor lucrări, a le recorecta, a regândi deciziile privind aprecierea prin notă, ceea ce
este imposibil în cazul probelor orale.
• Metodele de verificare în scris respectă ritmul individual de lucru al elevilor, în sensul că
fiecare dintre aceștia rezolvă fiecare subiect potrivit posibilităților, fără limită de timp
(doar pentru întreaga lucrare există, de regulă, o limită de timp, dar elevul are libertatea de
a gestiona timpul pe care îl alocă fiecărui subiect). În plus, probele scrise constituie o
oportunitate de exprimare pentru elevii mai timizi, care sunt dezavantajați în situațiile de
evaluare orală.
• Pe baza analizei detaliate a lucrărilor dintr-o clasă, profesorul poate identifica lacune și
erori repetitive, ceea ce îi permite să proiecteze activități didactice cu caracter remedial, de
recuperare, și chiar să regândească demersurile didactice cu scopul de a sprijini procesul
de învățare al elevilor.

Dincolo de aceste avantaje, trebuie avute în vedere şi o serie de limite ale probelor scrise:
• Profesorul nu îi poate sprijini pe elevi în formularea răspunsurilor, iar unele erori nu pot fi
corectate imediat, ceea ce înseamnă că feedback-ul este mai întârziat decât în cazul
probelor orale.
• Evaluarea prin probe scrise nu este la fel de intens conectată cu activitățile de predare și
învățare și nu permite reglaje didactice fine.
• În cazul în care subiectele sunt formulate neglijent, evaluarea se reduce la surprinderea
volumului de cunoștințe asimilate de către elev.

În mod evident, probele scrise nu se pot utiliza în învățământul preșcolar decât în


forme mult simplificate, adaptate cu grijă la specificul obiectivelor și al conținuturilor. Vom
prezenta detaliat probele scrise curente și cele aplicate la sfârșitul unui capitol sau al unei
unități de învățare. Nu vom trata teza ca probă scrisă periodică, având în vedere faptul că nu
se utilizează în învățământul preșcolar și primar.

Temă de reflecție
Imaginați o probă scrisă care poate fi aplicată în învățământul preșcolar. Reflectați la faptul că
instrucțiunile de rezolvare trebuie prezentate oral de către profesor, iar sarcinile nu trebuie să
depășească nivelul indicat de programa școlară pentru învățământul preșcolar. Care sunt
dificultățile în proiectarea unei astfel de probe?

Proba scrisă curentă (lucrare de control, la clasele mici) constituie o alternativă la


proba orală curentă (ascultarea sau chestionarea) și nu se confundă cu testul docimologic
aplicat în formă scrisă, deoarece subiectele sunt elaborate în manieră tradițională (probele
scrise curente includ subiecte de tip compunere). Probele scrise înlocuiesc chestionarea din
fiecare lecție mixtă de câteva ori într-un an școlar și se finalizează, de regulă, cu aprecierea
prin notă a performanțelor elevului. În acest fel, probele scrise curente contribuie la motivarea
continuă a elevului pentru activitatea de învățare și la orientarea acestuia asupra propriului
progres. Atât profesorul, cât și elevii pot identifica eventualele lacune sau erori în înțelegerea
materiei și pot interveni pentru îndepărtarea acestora, înainte ca procesul de învățare să fie
iremediabil afectat.
Pentru a putea contribui în mod veritabil la reglarea și îmbunătățirea activităților de
predare-învățare, proba scrisă curentă trebuie să respecte o serie de repere, precum:
• Subiectele trebuie să surprindă achiziții reprezentative ale elevului, fără a se centra pe
detalii nesemnificative care nu oferă informații relevante pentru etapele viitoare ale
activităților de predare și învățare. În plus, se recomandă ca subiectele să se refere strict la
lecția de zi, întrucât probele scrise curente nu sunt anunțate anterior.
• Toate detaliile privind modul de administrare, subiectele și instrucțiunile de rezolvare
trebuie proiectate înainte de începerea lecției, pentru a nu genera confuzii și a nu irosi din
timpul alocat rezolvării probei.
• Proba scrisă este întodeauna însoțită de un punctaj care se comunică elevilor înainte ca
aceștia să înceapă rezolvarea subiectelor, pentru a-și putea gestiona singuri timpul și
efortul.
• De asemenea, proiectarea probelor scrise presupune elaborarea unor scheme de corectare
sau adoptarea unei metode de notare. Având în vedere natura subiectelor incluse în
probele scrise tradiționale, acestea se notează prin metode subiective precum impresia
globală, scara de specimene, determinarea frecvenţelor și metoda analitică (De
Landsheere, 1975), pe care le vom prezenta detaliat în secțiunea dedicată metodelor de
apreciere.
• Intervalul de timp în care se corectează lucrările trebuie să fie cât mai scurt, astfel încât
rezultatele să fie comunicate elevilor cât mai repede, pentru a se păstra impactul formativ
și motivațional al probei scrise curente.

Verificarea la sfârşit de capitol s-a impus ca probă periodică de evaluare în scris în


ultimele decenii (Roman şi Popescu, 1980; Moise, 2007) şi acoperă obiective şi conţinuturi
parcurse într-o serie de lecţii, conectate prin legături logice. Această formă de verificare scrisă
impune organizarea riguroasă a activităţii de predare şi învăţare, în sensul că profesorul şi
elevii urmăresc împreună firul logic al unui capitol care se reflectă şi în tipologia lecţiilor
(parcurgerea unui capitol debutează cu lecţii de predare, continuă cu lecţii mixte şi de
consolidare şi se încheie cu lecţii de recapitulare şi sistematizare, urmate de o lecţie de
evaluare).
Verificarea la sfârșit de capitol are o serie de avantaje în comparaţie cu alte tipuri de
probe scrise şi orale:
• Ritmicitatea evaluării îi constrânge pe elevi să acorde atenţie egală fiecărui capitol,
evitându-se astfel ruperile de ritm în procesul de învăţare şi asigurându-se caracterul
sistematic şi temeinic al pregătirii elevului.
• Caracterul formativ al verificărilor de sfârşit de capitol este mai vizibil decât în cazul
evaluărilor scrise curente, prin pregătirea elevului pentru viitoarele examene (în cazul
elevilor din învăţământul primar, examenul naţional de la sfârşitul clasei a IV-a).
• Acoperă cu destulă rigoare funcţia diagnostică a evaluării, oferind informaţii despre
nivelul de achiziţii al elevului şi facilitând orientarea activităţilor didactice viitoare.
• Poate contribui la optimizarea relaţiilor didactice: verificarea la sfârşit de capitol este
întotdeauna anunţată şi pregătită anterior prin lecţii de recapitulare şi sistematizare, spre
deosebire de lucrările de control care nu sunt, de regulă, anticipate de către elev.
• Acoperă într-o oarecare măsură chiar funcţia socială a evaluării, în sensul că permite
comunicarea unor informaţii mai valide despre achiziţiile elevului către factorii interesaţi,
în special părinţii şi decidenţii în domeniul educaţional.
În contextul apariţiei unei noi structuri curriculare – unitatea de învăţare – verificarea
la sfârşit de capitol ar trebui să fie regândită, în sensul adaptării sale la noua modalitate de
organizare a conţinuturilor şi al elaborării de exigenţe specifice. În condiţiile introducerii
examenului naţional la finalul clasei a IV-a cu caracter obligatoriu (până în acest an școlar,
evaluarea naţională la finalul clasei a IV-a s-a realizează cu caracter experimental pe un
eşantion reprezentativ de elevi), verificarea la sfârşit de capitol sau de unitate de învăţare ar
putea avea un rol important în pregătirea elevilor (inclusiv emoţională).

Temă de reflecţie
Proiectaţi o probă scrisă curentă (lucrare de control) sau periodică (lucrare la sfârşit de
capitol/unitate de învățare) pentru o disciplină la alegere din planul de învăţământ pentru clasa
a II-a.

4.2.3. Metodele de verificare practică sunt utilizate pentru a evalua achiziţii în


contextul unor discipline precum educaţia fizică, educaţia plastică şi muzicală etc., dar şi în
situaţiile în care sunt vizate deprinderi şi capacităţi complexe în domenii diverse precum
matematica, ştiinţele, studiul limbilor străine etc. Profesorii cad adesea în eroarea de a privi
probele practice în asociere restrânsă doar cu anumite discipline, ignorând posibilităţile de
utilizare a acestora în domenii pentru care sunt “rezervate” probele scrise şi cele orale (de
exemplu, limba şi literatura română sau matematica). Mai mult decât atât, datorită
dificultăţilor în a distinge şi a aprecia contribuţiile individuale, se pierde adesea din vedere
faptul că probele practice pot fi realizate şi în grup.
În cazul probelor practice, profesorul poate evalua fie produsul activităţii elevului, fie
procesul parcurs în realizarea acestuia (Gallagher, 1998). Proiectarea probelor practice
presupune parcurgerea unor etape, care facilitează şi orientează finalizarea acestora prin
notare (Gallagher, 1998, pp. 244-271): 1) Stabilirea scopului probei practice; 2) Determinarea
obiectivelor ce vor fi vizate şi specificarea domeniului (cognitiv, afectiv, psihomotor) şi a
nivelului taxonomic la care se situează; 3) Proiectarea detaliată a sarcinilor de lucru şi a
instrucţiunilor de rezolvare; 4) Stabilirea criteriilor de apreciere a produselor sau a procesului;
5) Elaborarea unei scheme de notare pe baza criteriilor stabilite anterior; 6) Aplicarea
experimentală a probei practice şi 7) Revizuirea probei practice (inclusiv a criteriilor de
apreciere şi a schemelor de notare). Deşi acest demers de proiectare pare logic, fără dificultăţi
majore, natura comportamentelor şi a conţinuturilor vizate poate genera numeroase probleme.
De aceea, pentru domeniul afectiv şi psihomotor se recomandă folosirea complementară a
observării activităţii şi comportamentului elevilor (prin fişe de evaluare, scări de clasificare şi
liste de control), o metodă alternativă de evaluare pe care o vom prezenta într-o secţiune
ulterioară a cursului. Observarea activităţii şi comportamentului elevului este utilă mai ales în
etapele de stabilire a criteriilor de apreciere şi de elaborare a schemei de notare.
Se apreciază că probele practice pot îndeplini toate funcţiile actului evaluativ şi permit
evidenţierea unor achiziţii de tipul trăsăturilor de personalitate, care nu pot fi vizate prin alte
metode de verificare (Moise, 2007). Probele practice sunt însă mai cronofage decât cele orale
şi scrise, presupun accesul la resurse materiale substanţiale şi antrenează dificultăţi în
aprecierea rezultatelor elevului.

Temă de reflecţie
Proiectaţi o probă practică curentă (într-o lecţie mixtă) sau periodică (într-o lecţie de evaluare,
la sfârşitul unui capitol sau al unei unităţi de învăţare) pentru disciplina matematică.

La începutul prezentării analitice a probelor orale, scrise și practice făceam observația


că acestea pot fi curente, periodice sau globale în funcție de complexitatea obiectivelor și
volumul cunoștințelor vizate. Descrierea noastră s-a limitat doar la la forma curentă și
periodică a probelor de evaluare, forma globală fiind examenul (oral, scris și chiar practic).
Deoarece examenul nu este specific învățământului preșcolar și primar, am considerat că nu
este necesară tratarea sa în acest curs. Atragem însă atenția asupra faptului că examenul scris
ar putea deveni (în viitor, în condițiile unui nou val de reforme educaționale) o probă de
evaluare sumativă, care să fie adminstrată elevilor la finalul clasei a IV-a. În ultimii ani, în
România au fost organizate evaluări naționale pentru elevii claselor a IV-a, pe eșantioane
reprezentative la nivel național, care au acoperit însă mai degrabă funcția socială a evaluării.
Subiectele nu au fost formulate însă în spiritul examenului scris ca formă de verificare
globală, ci au constat în itemi specifici testelor docimologice.

4.3. Testul docimologic

4.3.1. Definiții și tipologie1


O primă observaţie care se impune în prezentarea testului docimologic este aceea că
nu toate probele scrise sunt sau trebuie să fie teste docimologice. Deşi o parte din literatura
românească recentă destinată problematicii evaluării sugerează exact acest fapt, ne exprimăm
convingerea că proba scrisă tradiţională (lucrarea de control sau extemporalul) nu îmbracă
întotdeauna forma unui test. Nu e mai puţin adevărat că se recomandă utilizarea mai frecventă
a testelor docimologice în evaluarea la clasă, cel puţin în perspectiva pregătirii elevilor pentru
evaluările şi examenele naţionale. În ultimii ani, acestea din urmă sunt cu certitudine elaborate
în acord cu exigenţele testelor docimologice.
Literatura pedagogică abundă în definiţii ale testului (în engleză probă, examinare,
încercare), de la definiţii de dicţionar până la definiţii asociate unor nume mari ale psihologiei
și pedagogiei (L. Cronbach sau A. Anastasi). Testul poate fi definit ca „o probă de evaluare a
unei persoane în raport cu o serie de criterii, cu scopul de a obţine informaţii despre raportul
dintre acea persoană şi aria de referinţă” (Karmel şi Karmel, 1978, p. 5) sau ca „instrument
care presupune rezolvarea unui set de întrebări/ sarcini standard, aceleaşi pentru fiecare
subiect. Răspunsurile la întrebări se traduc în expresii sau valori numerice, suma lor
reprezentând o formă de caracterizare a subiectului în ceea ce priveşte anumite procese şi
abilităţi” (McMillan, 1992, p. 114).
Dacă aceste definiţii ne pot lămuri cu privire la accepţiunea testului în spaţiul
educaţional, nu putem afirma că maniera de clasificare a acestora este la fel de clară. În mod
evident, testul docimologic utilizat în evaluarea școlară s-a dezvoltat în strânsă legătură cu
testul psihologic, iar toate criteriile de clasificare, precum şi exigenţele de elaborare sunt
aceleaşi ca în cazul acestuia. Practic, în spaţiul educaţional se utilizează atât teste psihologice,
cât şi teste docimologice, iar acestea din urmă trebuie să răspundă aceloraşi exigenţe de
construcţie şi de elaborare ca şi cele dintâi. Cele două categorii de teste diferă doar în ceea ce
priveşte obiectul evaluării: în timp ce testele psihologice vizează procese cognitive, trăsături
de personalitate etc., testele docimologice vizează cunoştinţe sau alte tipuri de achiziţii
şcolare.
Testele docimologice, ca şi cele psihologice pot fi clasificate în funcţie de mai multe
criterii (McMillan, 1992; Radu, 2000; Moise, 2007; Gall, Gall, şi Borg, 2007)2:
• În funcţie de rigurozitatea procedurilor de administrare şi de calculare a scorurilor,
testele pot fi standardizate şi nestandardizate. Testele standardizate au o procedură de
administrare riguroasă: sunt stabilite cu precizie limitele de timp pentru rezolvarea fiecărui
item, materialele care trebuie utilizate (inclusiv ordinea şi forma de prezentare). Ele sunt
elaborate de specialişti şi sunt însoţite de manuale de utilizare care specifică condiţiile de
administrare, modalităţile de calculare a scorurilor, precum şi detalii privind fidelitatea şi
validitatea instrumentului. Avantajul testelor standardizate constă în aria largă de

1
Această secțiune introductivă privind testul docimologic constituie o reluarea a cunoștințelor despre testul
docimologic asimilate anterior de cursanți în cadrul disciplinei Metodologia cercetării pedagogice (anul II,
semestrul I).
2
Din rațiuni didactice, nu vom prezenta toate tipurile de teste descrise în literatura de specialitate, ci ne vom
centra doar pe tipologiile relevante în contextul activității de evaluare a profesorului.
aplicabilitate, de unde decurge însă şi cea mai evidentă limită: ele nu pot fi utilizate în
evaluarea curentă, deoarece se referă la cunoştinţe sau achiziţii generale. Testele
nestandardizate, cunoscute şi ca teste elaborate de profesor (din engl. teacher-made tests) sunt
aplicabile doar unei situaţii particulare sau unui anumit grup de elevi şi nu permit comparaţii
cu alte grupuri.
• În funcţie de modalitatea de interpretare a rezultatelor distingem testele normative de
testele criteriale. Testele normative presupun compararea rezultatelor unui subiect cu
rezultatele grupului de referinţă. Ele permit realizarea unui „clasament” al subiecţilor, fiind
valorizată posibilitatea de comparare inter-individuală. Testele criteriale presupun raportarea
rezultatelor unui subiect la un nivel prestabilit al performanţei în domeniul de interes.
Scorurile obţinute de un elev sunt interpretate în raport cu un criteriu, nu în contextul
rezultatelor grupului de referinţă. Distribuţia scorurilor la testele criteriale este asimetrică,
rezultatele concentrându-se la polul negativ.
• În funcţie de scopul aplicării lor şi a volumului conţinuturilor vizate, testele pot fi
formative şi sumative: primele contribuie la determinarea nivelului şi deficitului elevului şi la
orientarea sa în procesul învăţării, în timp ce ultimele sunt aplicate pe secvenţe mari (unităţi
de învăţare, semestre, ani şcolari, cicluri de învăţământ) şi au ca scop clasificarea elevilor și
chiar certificarea acestora (Stoica et al., 2001; Moise, 2007).
• După modul de prezentare a răspunsului, se disting teste obiective şi teste subiective.
Testele obiective solicită răspunsuri stricte, iar testele subiective implică răspunsuri formulate
diferit de fiecare subiect (Stoica et al., 2001; Moise, 2007).
• În funcţie de modalitatea de adminstrare, testele pot fi orale (aceasta este o variantă
preferabilă pentru preşcolari, de exemplu) şi scrise.
• În funcţie de limitele temporale impuse pentru rezolvarea testului, putem distinge testele
de randament (engl. speed-test) şi testele de nivel (engl. power-test). Spre deosebire de testele
de nivel sau de performanţă, testele de randament presupun rezolvarea itemilor între limite de
timp clar precizate.
• În funcţie de momentul în care sunt aplicate (Radu, 2000), testele pot fi iniţiale
(administrate înainte ca orice intervenţie educaţională să fi avut loc), de progres (administrate
în timpul desfăşurării intervenţiei educaţionale) şi finale (administrate după încheierea
intervenţiei educaţionale).

4.3.2. Definiţia itemului din perspectiva evaluării. Tipuri de itemi


Din perspectiva evaluării şcolare prin teste docimologice, itemul poate fi definit ca
unitate de măsurare care include un stimul şi o formă prescriptivă de răspuns, fiind formulat
cu intenţia de a suscita un răspuns de la cel examinat, pe baza căruia se pot face inferenţe cu
privire la nivelul achiziţiilor acestuia (Osterlind, 1998; Downing şi Haladyna, 2006). Itemul
poate fi prezentat izolat sau în strânsă relaţie cu alţi itemi de acelaşi tip sau din tipologii
diferite, poate presupune alegerea sau elaborarea răspunsului, într-un timp strict determinat
sau fără limită de timp. Itemii trebuie să respecte aceleaşi exigenţe de proiectare, administrare
şi scorare, indiferent de natura testului în care sunt incluşi (teste elaborate de profesor sau
teste standardizate; teste formative sau teste sumative etc.).
Tipologia itemilor include itemi obiectivi, semiobiectivi şi subiectivi (Radu, 2000;
Mândruţ, 2001; Moise, 2007; Cucoş, 2008).
Itemii obiectivi permit măsurarea exactă a rezultatelor şi sunt utilizaţi mai ales în
testele standardizate şi pot fi (Evans, 1985; Crocker şi Algina, 1986; Radu, 2000; Moise,
2007):
• itemi cu alegere duală care solicită subiectului să aleagă unul din cele două posibilităţi
de răspuns de tipul: adevărat-fals, corect-greşit, potrivit/nepotrivit;
• itemi cu alegere multiplă care solicită alegerea unui răspuns dintr-o listă de alternative;
• itemi de asociere care presupun stabilirea unei corespondenţe între două liste de
afirmaţii sau concepte.
Itemii semiobiectivi pot fi itemi cu răspunsuri scurte, fiind formulaţi concis şi
specificând clar natura răspunsului corect; itemi de completare care presupun completarea
unui cuvânt sau a unei sintagme într-un text lacunar; itemi structuraţi care se constituie dintr-
un set de întrebări care au în comun un element sau se referă la acelaşi fenomen, concept
(Mândruţ, 2001; Radu, 2000).
Itemii subiectivi solicită formularea unui set de enunțuri ample sau restrânse din punct
de vedere al volumului (Radu, 2000; Moise, 2007). Itemii de tip rezolvare de probleme şi cei
de tip eseu (structurat sau nestructurat) constituie variantele de itemi subiectivi utilizaţi în
evaluarea şcolară (Mândruţ, 2001; Cucoş, 2007). Natura acestor itemi imprimă o notă
subiectivă şi calculării scorurilor, a punctajelor chiar dacă se elaborează un barem de
corectare foarte riguros.
Fiecare dintre tipurile de itemi are avantaje şi limite specifice şi trebuie să respecte
criterii de formulare, de care depinde calitatea globală a testului (Radu, 2000; Moise, 2003).
În elaborarea unui test docimologic, trebuie avută în vedere complementaritatea şi dificultatea
gradată a tipurilor de itemi. Vom prezenta sistematic toate cele trei categorii de itemi,
prezentând exemple, dar și avantaje și limite.

4.3.3. Itemii obiectivi


Itemii obiectivi presupun întotdeauna alegerea răspunsului/răspunsurilor corect/e
dintr-o listă anterior elaborată de către evaluator și pusă la dispoziţie celui examinat (de aceea,
sunt cunoscuți şi ca itemi cu răspuns dat). Răspunsul corect este identic pentru toţi cei
examinaţi, iar evaluatorii corectează aceşti itemi strict identic.
Putem delimita trei categorii de itemi obiectivi, diferenţiaţi atât în funcţie de natura
stimulului, cât şi în funcţie de natura răspunsurilor solicitate: itemi cu răspuns dual
(alternativ), itemi cu răspuns de tip alegere multiplă şi itemi de asociere.

4.3.3.1. Itemii cu răspuns dual se elaborează sub forma unor enunţuri complete, pe
care examinatul trebuie să le accepte sau să le respingă. Răspunsurile sunt marcate cu ajutorul
unor inţiale (A – F, dacă răspunsul este considerat adevărat, respectiv fals; menţionăm că se
poate introduce şi varianta O reprezentând faptul că enunţul este o opinie, nefiind nici
adevărat, nici fals) sau al cuvintelor DA - NU, plasate în faţa fiecărui enunţ sau după acesta.
Acest tip de item este alcătuit dintr-o instrucţiune pentru cel examinat și unul sau mai
multe enunţuri conţinând sarcina de rezolvat, însoţite de variantele de răspuns (DA - NU;
Adevărat - Fals etc.). Există şi alternativa ca examinatul să plaseze (nu să bifeze) aprecierile
de tip A - F, Da – Nu, în relaţie cu itemii corespunzători. În general, itemii cu răspuns dual
conduc la evaluarea unor comportamente corespunzătoare nivelelor taxonomice inferioare
(cunoaşterea şi înţelegerea), însă pot fi utilizaţi în elaborarea testelor pentru majoritatea
disciplinelor de învăţământ.

Exemplul 13 – Limba română, Varianta 2, Itemul 4

Încercuieşte cuvântul “DA” dacă enunţul este scris corect şi cuvântul “NU” dacă enunţul este scris
incorect.
Ei hrănesc păsările. DA NU
Ei hrăneşte păsările. DA NU
Ele se joc în ogradă. DA NU

3
Toate exemplele de itemi sunt preluate din testele administrate în contextul Evaluării naționale pentru clasa a
IV-a din anul 2005. Vezi Raportul SNEE pe site-ul www.edu.ro
Ele se joacă în ogradă. DA NU
Copiii harnici îngrijeşte puişorii. DA NU
Copiii harnici îngrijesc puişorii. DA NU

Exemplul 2 – Științe, Varianta 1, Itemul 2

Scrie “X” în caseta din dreptul fiecărui enunţ adevărat.

Corpurile gazoase au formă şi volum proprii.

Corpurile solide au formă şi volum proprii.

Corpurile solide iau forma vasului în care sunt puse.

Corpurile lichide au formă şi volum proprii.

Avantaje ale itemilor cu răspuns dual


• Precizia şi simplitatea sarcinilor de rezolvat creşte fidelitatea şi obiectivitatea acestui tip de
itemi.
• Permit evaluarea unui număr relativ mare de comportamente (se pot acoperi conţinuturi
extinse) într-un timp scurt, dat fiind faptul că răspunsurile sunt anterior formulate, iar elevul
indică doar valoarea de adevăr a acestora.
• Favorizează evaluarea unor comportamente asociate unor nivele taxonomice diferite
(cunoaştere, înţelegere şi, în condiţii speciale, aplicare).
• Proiectarea lor este relativ simplă, rezultatele fiind uşor de cuantificat.

Limite ale itemilor cu răspuns dual


• Validitatea itemilor cu răspuns dual este relativ mică, datorită simplităţii, ceea ce conduce
la orientarea spre nivelele taxonomice inferioare.
• Acești itemi nu permit nuanţări în evaluarea elevului, dat fiind caracterul fix şi scurt al
răspunsului, având valoare diagnostică redusă (nu oferă evaluatorului informaţii cu privire la
raţiunile pentru care elevul a ales una sau alta dintre cele două variante).
• Dacă este comparat cu toate celelalte tipuri de itemi, se poate aprecia că permite cea mai
mare probabilitatea de a ghici din partea elevului. Teoretic, există 50% „şanse” ca elevul să
ghicească răspunsul corect.

Exigenţe de proiectare a itemilor cu răspuns dual


• Se recomandă evitarea adevărurilor banale şi inutile.
• Trebuie evitate enunţurile negative (mai ales a celor care includ o dublă negaţie).
• Trebuie evitate și formulările lungi ori inexacte, care nu permit orientarea elevului către
răspunsul corect.
• În același enunţ nu se pot include două idei care nu se află în relaţie directă, pentru că o
asemenea formulare ar putea dezorienta elevul.
• Lungimea enunţurilor adevărate şi false trebuie să fie aproximativ aceeaşi, pentru a nu întinde
elevului capcana de a „ghici” răspunsul corect, speculând că enunţul mai elaborat este adevărat.
• Numărul enunţurilor adevărate şi false trebuie să fie echilibrat pentru a nu determina
elevul să greşească prin generalizarea unei reguli pe care poate considera că a desprins-o din
rezolvarea itemilor anteriori („dacă toate răspunsurile au fost false şi acesta e tot fals”).
4.3.3.2. Itemii cu răspuns de tip alegere multiplă
Itemii cu răspuns de tip alegere multiplă pot servi atât la evaluarea unor
comportamente specifice nivelelor taxonomice inferioare, cât şi a comportamentelor asociate
cu analiza şi evaluarea (Berk, 1999 citat de Schreerens, Glas şi Thomas, 2003).
Acest tip de item este alcătuit din două elemente:
• Tulpina (engl. stem), problema sau premisa (Mândruţ, 2001; Popham, 2003), formulată
printr-o întrebare directă sau printr-un enunţ incomplet;
• O serie de alternative de răspunsuri propuse elevului, dintre care una este corectă sau cea
mai bună, iar celelalte au rolul de distractori, constituind obstacole ce trebuie depăşite de către
elevi în alegerea răspunsului corect (distractorii au caracter mai degrabă stimulativ, decât
derutant).
Având în vedere natura răspunsului care se poate solicita elevului, itemii cu răspuns de
tip alegere multiplă pot fi proiectaţi în două variante (Moise, 2007):
• Itemii cu răspuns corect presupun alegerea răspunsului corect care completează un enunţ,
dintr-o listă de alternativă pusă la dispoziţie elevului. Se aseamănă cu itemii semiobiectivi
tip răspuns scurt (de completare), singura diferenţă constând în faptul că elevul alege
răspunsul, nu îl elaborează el însuşi. Itemii de acest tip se cantonează la nivelul cunoaşterii
din taxonomia domeniului cognitiv.
• Itemii cu răspunsul cel mai bun sunt preferaţi pentru evaluarea pe nivele taxonomice mai
înalte (analiză şi evaluare). Mai multe dintre răspunsurile pe care elevul trebuie să le analizeze
sunt acceptabile, dar în măsură diferită, elevul trebuind să indice cea mai potrivită variantă.

Exemplul 1 – Ştiinţe, Varianta 1, Itemul 1

1. Scrie “X” în caseta din dreptul ilustraţiei care prezintă evaporarea apei.

Exemplul 2 – Matematică, Varianta 1, Itemul 5

Încercuieşte litera potrivită răspunsului corect.


Dacă diferenţa a două numere este 150, iar scăzătorul este 112, atunci descăzutul este:
a. 38; b. 162; c. 226; d. 262.

Avantaje ale itemilor de tip alegere multiplă


• Pot fi utilizaţi atât în evaluarea unor comportamente simple, de natură reproductivă, cât şi
în evaluarea unor comportamente complexe, specifice nivelelor taxonomice înalte.
• Pot acoperi conţinuturi diverse, la un nivel de profunzime satisfăcător.
• Proiectarea, administrarea şi scorarea itemilor cu alegere multiplă este relativ simplă.
Dificultăţi în proiectare pot fi invocate doar în cazul itemilor cu alegere multiplă de tip „cel
mai bun răspuns”, care trebuie să fie atent conectate cu elementele de conţinut
corespunzătoare.
• Indiferent de forma în care sunt utilizaţi, au eficienţă crescută, având în vedere volumul
mare de conţinuturi care poate fi evaluat.
Limite ale itemilor de tip alegere multiplă
• Faptul că răspunsurile sunt gata elaborate nu permite evaluarea capacităţilor creative ale
elevului, a capacităţilor de organizare a informaţiilor (sinteză).
• Itemii care solicită precizarea celui mai bun răspuns sunt dificil de proiectat – distractorii
trebuie să fie suficient de contrastanţi prin raport cu răspunsul corect, însă alternativele trebuie
să fie totodată omogene.
• Scorarea itemilor cu alegere multiplă, în varianta răspunsul cel mai bun poate genera
dezacorduri între evaluatori, în cazul în care există mai mult de o variantă de răspuns corectă
(Mândruţ, 2001).

Exigenţe de proiectare a itemilor de tip alegere multiplă


• „Tulpina” itemului trebuie să fie formulată clar, complet şi logic, evitându-se impreciziile
şi ambiguităţile.
• Distractorii trebuie să fie relativ omogeni, fără a se introduce alternative de răspuns fără
nici o legătură cu problema ilustrată în enunţ.
• Trebuie evitate redundanţele verbale în prezentarea variantelor de răspuns, pentru a uşura
lectura şi rezolvarea itemulului de către elev.
• Tulpina sau premisa trebuie să evite formulările negative, care generează dificultăţi în
interpretarea itemului de către elev.
• Deşi recomandarea de mai sus se aplică şi distractorilor, există voci care susţin necesitatea unei
alternative de răspuns de tipul „nici o variantă din cele de mai sus” (dar nu de tipul „toate
răspunsurile de mai sus”), deoarece acesta ar reprezenta o reală provocare pentru elev (Popham,
2003).
• Dacă un test include mai mulţi itemi cu alegere multiplă, poziţia răspunsului corect trebuie
să varieze, pentru a descuraja elevul să speculeze asupra locului alternativei de răspuns care
trebuie bifată.
• Distratorii trebuie să constituie răspunsuri plauzibile, nu evident nepotrivite cu enunţul
problemei, astfel încât să stimuleze elevul în analiza fiecărui posibil răspuns.

4.3.3.3. Itemii de asociere


Itemii de asociere (engl. matching items) sau tip pereche solicită elevului să
stabilească corespondenţa între două seturi de concepte, date, informaţii etc., plasate de regulă
în două coloane diferite: o primă coloană este destinată premiselor sau stimulilor, iar în a doua
coloană sunt incluse răspunsurile. Premisele şi răspunsurile pot fi perechi de evenimente şi
date, termeni şi definiţii, reguli şi exemple, simboluri şi concepte, autori şi titluri de cărţi,
plante, animale şi clasificări, principii şi aplicaţii, cauze şi efecte, afirmaţii teoretice şi
experimente etc. (Moise, 2007). În funcţie de natura conţinuturilor, există şi moduri
alternative de prezentare a premiselor şi a răspunsurilor, cu ajutorul hărţilor, diagramelor,
imaginilor etc., care să-l ajute pe elev în rezolvarea sarcinii. În cazul preșcolarilor și a
şcolarilor mici se poate sugera marcarea relaţiilor dintre premise şi răspunsuri prin săgeţi sau
linii simple.

Exemplul 1 – Limba română, Varianta 1, Itemul 3

Uneşte, printr-o linie, cuvintele din coloana A cu acelea care au înţeles opus din coloana B.
A B
rea tristeţe
mult încet
repede bună
s-a bucurat puţin
piticii urâţenie
frumuseţe uriaşii
s-a întristat

Exemplul 2 – Ştiinţe, Varianta 2, Itemul 10

Trasează săgeţi, indicând hrana fiecărei fiinţe din ilustraţiile de mai jos:

Avantaje ale itemilor de asociere


• Itemii de asociere pot fi consideraţi cei mai complecşi dintre itemii obiectivi, fiind practic
constituiţi dintr-o serie de itemi de alegere multiplă. Posibilitatea ca elevul să ghicească
răspunsul corect este redusă prin elaborarea listei de răspunsuri, în aşa fel încât să includă şi
distractori (răspunsuri care nu trebuie asociate cu nici o premisă).
• Sunt relativ uşor de proiectat şi de administrat, făcând posibilă abordarea unui număr mare
de comportamente în timp scurt.
• Pot viza deopotrivă nivele taxonomice inferioare şi superioare.

Limite ale itemilor de asociere


• În majoritatea situaţiilor evaluative, sunt utilizaţi pentru a aprecia acurateţea asimilării
informaţiilor de tip factual, deşi se pretează şi în evaluarea comportamentelor asociate
înţelegerii, aplicării şi chiar analizei.
• Proiectarea itemilor de asociere poate fi dificilă în cazul în care se vizează respectarea
omogenităţii premiselor şi a alternativelor de răspuns.

Exigenţe de proiectare a itemilor de asociere


• Premisele şi alternativele de răspuns trebuie să acopere un spectru omogen (concepte
similare), astfel încât elevul să nu poată asocia elementele din cele două liste prin excluderea
răspunsurile atipice, fără legătură logică cu celelalte (Popham, 2003).
• Se recomandă ca numărul premiselor să fie inegal faţă de răspunsurile propuse, cei mai
mulţi autori recomandând un număr mai mare al răspunsurilor, astfel încât să se evite
relaţionarea elementelor prin excludere.
• Răspunsurile trebuie prezentate în acord cu o regulă clară: fie în ordine cronologică, fie în
ordine alfabetică, astfel încât să se evite dezorientarea elevului, dar şi încercarea de a
generaliza greşit o anumită manieră de prezentare a itemilor.
• Descrierea sarcinii de rezolvat trebuie să fie clară, precizându-se logica asocierilor pe care
trebuie să le realizeze elevul.
• Trebuie precizat de câte ori poate fi utilizat un răspuns în realizarea asocierilor (sau, după
caz, de câte ori premisele pot fi utilizate în stabilirea relaţiilor cu răspunsurile).
• Numărul premiselor şi a răspunsurilor trebuie să fie rezonabil (4-5 premise, respectiv 5-6
răspunsuri).
• Se recomandă ca întreg corpul itemului să fie plasat pe o singură pagină, pentru a nu
genera confuzii sau omisiuni.
4.3.4. Itemii semiobiectivi
Itemii semiobiectivi sunt incluşi în unele clasificări alături ce cei subiectivi într-o
categorie mai largă de itemi – cu răspunsuri elaborate de către cel examinat (Schreerens, Glas
şi Thomas, 2003). Dat fiind faptul că răspunsurile sunt construite de către elev,
scorarea/notarea acestora respectă alte exigenţe decât itemii obiectivi, antrenând calităţile de
evaluator ale corectorilor. Se pot delimita trei categorii de itemi semiobiectivi: itemi cu
răspuns scurt, itemi de completare şi întrebările structurate.

4.3.4.1. Itemii cu răspuns scurt și de completare


Itemii cu răspuns scurt şi cei de completare sunt similari, în sensul că proiectarea,
administrarea şi notarea răspunsurilor se supun aceloraşi exigenţe. În cazul itemilor cu
răspuns scurt, acesta se solicită printr-o întrebare directă sau printr-un enunţ direct, în timp ce
itemii de completare constau în enunţuri lacunare, incomplete, răspunsul costând din
completarea spaţiilor libere.
Cele două tipuri de itemi permit evaluarea de rezultate diverse ale activităţii de
învăţare, dar la nivele taxonomice inferioare: cunoaşterea terminologiei, a regulilor, a
metodelor şi a procedeelor de acţiune, interpretarea simplă a unor date, abilitatea de a reda
conţinuturi prezentate prin desene, hărţi, diagrame etc., capacitatea de a utiliza simboluri
matematice sau utilizate în ştiinţele naturii, capacitatea de rezolvare a unor probleme simple
din ştiinţele exacte (Moise, 2007).

Exemplu de item cu răspuns scurt – Ştiinţe, Varianta 1, Itemul 4

Scrie, pe spaţiul punctat, o caracteristică specifică animalelor care trăiesc în:


mediul terestru ………………………………………………………………
mediul acvatic ……………………………………………………………..

Exemplu de item de completare – Limba română, Varianta 1, Itemul 7

Completează spaţiile punctate, alegând forma corectă dintre cuvintele scrise între paranteze.
Pisica ……………………. aşezat lângă sobă.
(s-a / sa)
Pisica ………………… doarme lângă sobă.
(s-a / sa)
Păsările călătoare ………………… întors.
(sau / s-au)
Tu cumperi cărţi ………………… caiete?
(s-au / sau)
Tata ……………… recomandat lui Ion să ………………… patinele.
(ia / i-a) (ia / i-a)
Vasile ……………… văzut pe Marin ……………… muzeu.
(la / l-a) (l-a / la)
Copiii …………………spus mamei că ………………... calificative bune.
(iau / i-au) (iau / i-au)
El …………………….. promis că ……………. merge în excursie.
(va / v-a) (v-a / va)

Avantaje ale itemilor cu răspuns scurt şi de completare (Mândruţ, 2001; Moise, 2007;
Cucoş, 2008)
• Atât itemii cu răspuns scurt, cât și cei de completare sunt relativ uşor de proiectat, de
aplicat şi de corectat/ notat.
• Au un grad ridicat de obiectivitate, în condiţiile elaborării unei scheme de notare adecvate.
• Permit evaluarea unei game largi de conţinuturi.
• Evită dezavantaje specifice itemilor obiectivi, de tipul ghicitului răspunsurilor, deoarece
nu i se oferă elevului variante de răspuns.
• Permit chiar mai multe variante corecte de răspuns, dacă acestea sunt incluse în schema de
notare.

Limite ale itemilor cu răspuns scurt şi de completare


• Nivelul taxonomic vizat este aproape exclusiv cel al achiziţiei de informaţii, deşi sunt
posibile şi sarcini care să pună în lumină comportamente specifice înţelegerii sau chiar
aplicării.
• Corectarea şi notarea pot fi „contaminate” de probleme de exprimare, erori de scriere,
aspecte estetice ale răspunsului.

Exigenţe de proiectare ale itemilor cu răspuns scurt


• Întrebările sau enunţurile trebuie să fie formulate clar, pentru a nu genera confuzii.
• În cazul solicitării unui răspuns numeric trebuie precizat tipul de răspuns aşteptat şi
nivelul de precizie al acestui răspuns.
• Dacă răspunsurile numerice sunt însoţite de unităţi de măsură corespunzătoare, acestea
trebuie să fie clar precizate atât în întrebare, cât şi după spaţiul liber.

Exigențe de proiectare a itemilor de completare


• Sarcina de rezolvat trebuie formulată concis, dar suficient de explicit pentru a nu lăsa loc
de interpretare.
• Itemii nu trebuie să includă prea multe spaţii albe (de completat de către elevi), pentru că
se îngreunează procesul de înţelegere a sarcinii.
• Nu se recomandă decontextualizarea definiţiilor, deoarece s-ar putea ajunge la confuzii în
formularea răspunsului.
• Se recomandă ca spaţiile albe în care elevul trebuie să completeze răspunsurile să fie egale
ca lungime, chiar dacă dimensiunea răspunsurilor este diferită, pentru a nu determina fie
răspunsuri prea scurte, fie răspunsuri de tip eseu.
• Este preferabil ca spaţiile albe să fie plasate la finalul enunţului.

4.3.4.2. Întrebările structurate


Întrebările structurate sunt definite ca „sarcini formate din mai multe subîntrebări, de
tip obiectiv şi semiobiectiv, legate între ele printr-un element comun", menite să acopere
spaţiul liber aflat între itemii obiectivi şi cei subiectivi (Mândruţ, 2001, p. 111). Un asemenea
item este alcătuit dintr-un material-stimul (care poate fi reprezentat dintr-un desen, un text, un
tabel etc.) şi o suită de subîntrebări care sunt conectate prin conţinut cu materialul-stimul.
Practic, subîntrebările ghidează răspunsurile elevului şi îi oferă un cadru în care îşi realizează
demersul de rezolvare a sarcinii.

Exemplul 1 – Limba română, Varianta 2, Itemii 1-2

Citeşte cu atenţie următorul text, pentru a răspunde cerinţelor de mai jos!


“După atâta frig şi ceaţă
Iar s-arată soarele.
De-acum nu ne mai îngheaţă
Nasul şi picioarele!

Păsările migratoare
Se re-ntorc din tropice.
Gâzele depun la soare
Ouă microscopice.

Toată lumea din ogradă


Cântă fără pauză.
Doi cocoşi se iau la sfadă
Nu ştiu din ce cauză.”
(George Topârceanu - Primăvara - fragmente)

1. Scrie „X” în caseta corespunzătoare răspunsului corect.


a. Autorul unei poezii se numeşte:
compozitor povestitor poet prozator

b. În această poezie este prezentat anotimpul:


vara toamna iarna primăvara

c. Strofele de mai sus sunt alcătuite fiecare din:


două versuri trei versuri
patru versuri cinci versuri

2. Scrie, pe spaţiul punctat, câte o expresie cu înţeles asemănător pentru:


a. “cântă fără pauză” ……………………………………………………………………………..…
b. “se iau la sfadă” …………………………………………………………………………..………
c. “se re-ntorc din tropice” …………………………………………………………….……………

Exemplul 2 – Matematică, Varianta 1, Itemul 7

Imaginează-ţi că eşti automobilist şi pleci în excursie. Câţi kilometri parcurgi pe fiecare din următoarele trasee:

a) Bucureşti – Ploieşti – Braşov ………………………..


b) Giurgiu – Bucureşti – Piteşti ………………………..
c) Piteşti – Bucureşti – Braşov ..…..…………………..

Avantaje ale întrebărilor structurate (Mândruţ, 2001; Moise, 2007)


• Se presupune că plasarea unui număr suficient de itemi obiectivi şi semiobiectivi în relaţie
cu acelaşi material-stimul, poate favoriza evaluarea unor comportamente corespunzătoare
unor nivele taxonomice mai înalte (aplicare şi chiar analiză).
• Fiind vorba de mai mulţi itemi, de regulă organizaţi în funcţie de nivelul de dificultate,
facilitează abordarea întrebărilor de către un număr mare de elevi, inclusiv cei mai slabi (cel
puţin în prima parte).
• Permit utilizarea unor materiale-stimul de tipul graficelor, hărţilor, diagramelor etc., ceea
ce la face mai atractive pentru elevi şi mai pertinente în evaluarea unor capacităţi dificil de
abordat prin intermediul altor categorii de itemi.
• Permit transformarea unor itemi de tip eseu într-o serie de itemi obiectivi şi semiobiectivi,
acest fapt având ca efect creşterea fidelităţii actului de evaluare.

Limite ale întrebărilor structurate


• Precizăm că majoritatea exemplelor de întrebări structurate ce pot fi identificate în
subiectele testelor şi examenelor naţionale româneşti conţin itemi semiobiectivi de tip răspuns
scurt sau de completare. Cu toate acestea, surse din literatura pedagogică străină amintesc
întrebările structurate în conexiune cu o serie de itemi cu alegere multiplă. Astfel, Schreerens,
Glas şi Thomas (2003) introduc în tipologia itemilor cu răspuns elaborat de către elev itemii
contextuali (engl. context-dependent item), similari întrebărilor structurate, despre care se
spune că ar conţine un număr rezonabil (4-5) de itemi de alegere multiplă, care sunt puşi în
relaţie cu acelaşi material-stimul. Exemplul furnizat de autori este un item contextual de
evaluare a capacităţii de comprehensiune verbală, în care se dă un material-stimul, în legătură
cu care se formulează mai mulţi itemi cu alegere multiplă.
• Materialele-stimul pot ridica probleme tehnice în proiectare, legate de acurateţea şi
claritatea imaginilor, a graficelor etc.
• Costurile de proiectare şi de administrare sunt mai ridicate în cazul întrebărilor structurate,
decât în cazul altor tipuri de itemi.
• În unele situaţii, răspunsurile la subîntrebări sunt conectate între ele, ceea ce trebuie să se
evidenţieze clar în schema de notare.
• Elaborarea schemelor de corectare şi de notare este mai dificilă.

Exigenţe de proiectare a întrebărilor structurate (Mândruţ, 2001; Moise, 2007)


• Subîntrebările trebuie proiectate gradat, în ceea ce priveşte nivelul de dificultate, din cel
puţin două motive: pentru a asigura evaluarea unor capacităţi cu nivele crescânde de
complexitate, dar şi pentru a încuraja abordarea subiectului de către toți elevii.
• Itemii ataşaţi materialului-stimul trebuie să solicite răspunsuri simple şi scurte. În acest
sens se recomandă nu doar formularea cât mai clară a itemilor, astfel încât să ghideze
elaborarea răspunsului de către elev, ci şi alocarea unui spaţiu de răspuns care să orienteze
elevul cu privire la volumul de informaţii care trebuie utilizat.
• Se recomandă ca subîntrebările să fie independente, astfel încât să nu condiţioneze
răspunsurile la un item de răspunsurile la itemi anteriori.
• Itemii trebuie să fie strict conectaţi la conţinutul materialului-stimul, pentru a nu-l orienta
eronat pe elev către speculaţii inutile.
• Calitatea tehnică a materialului-stimul trebuie să fie adecvată, fără a crea dificultăţi
suplimentare în calea rezolvării corecte a cerinţelor de către elev.
• Spaţiul alocat răspunsului trebuie să sugereze lungimea aşteptată a răspunsului, fără a
limita posibilitatea de exprimare a elevului, dar şi fără a încuraja exagerările în dezvoltarea
ideilor.
• Schema de notare trebuie elaborată cu atenţie. În cazul subîntrebărilor conectate între ele
(situaţie nerecomandată), acest fapt trebuie ilustrat prin schema de notare propusă.

4.3.5. Itemii subiectivi


Itemii subiectivi sunt prezentaţi în maniere diverse în literatura pedagogică, diferenţele
putând fi identificate chiar şi la nivelul denumirii lor (itemi cu răspuns elaborat de către elev,
itemi nonobiectivi, itemi cu răspuns deschis). În literatura pedagogică românească şi în
documentele SNEE este prezentată o clasificare comprehensivă a itemilor subiectivi, care
combină criteriul dimensiunii răspunsului aşteptat cu cel al tipului de răspuns solicitat (sau
gradul de detaliere al cerinţelor) pe care o prezentăm mai jos (Neacşu şi Stoica, coord., 1996;
Mândruţ, 2001; Cucoş, 2008):
• Itemi de tip rezolvare de probleme;
• Itemi de tip eseu, cu patru variante rezultând din combinarea criteriului de clasificare
dimensiune (restrâns şi extins) şi cu cel de nivel de structurare a sarcinii (eseu
structurat şi eseu liber).
Itemii subiectivi permit evaluarea unor comportamente, capacităţi complexe din
etajele taxonomice superioare, valorificând şi dimensiunea creativă a elaborării răspunsurilor,
capacitatea elevului de formula explicaţii, de a argumenta, de a descrie modalităţi de lucru în
situaţii particulare. Deşi elaborarea schemelor de notare este evident mai dificilă decât în
cazul itemilor obiectivi şi semiobiectivi, antrenând toate resursele de obiectivitate ale
evaluatorului, itemii subiectivi nu pot fi evitaţi mai ales în evaluările sumative de tipul
examenelor naţionale, date fiind avantajele lor în evaluarea competenţelor complexe.

4.3.5.1. Itemi de tip rezolvare de probleme


Itemii de tip rezolvare de probleme presupun prezentarea unor situaţii-problemă
nefamiliare, inedite pentru elev, care nu dispun de o soluţie predeterminată, precum şi
antrenarea acestuia pentru identificarea unor soluţii prin parcurgerea unor etape: identificarea
problemei, culegerea şi selectarea datelor de bază (relevante), formularea şi validarea unor
ipoteze, identificarea metodei de rezolvare, propunerea unei soluţii, evaluarea soluţiei,
formularea concluziei asupra rezolvării realizate (Mândruţ, 2001). Aceste etape de soluţionare
a situaţiilor-problemă nu pot fi strict parcurse în toate ipostazele de prezentare a acestei
categorii de itemi, constituind doar un reper orientativ pentru explicarea procesului rezolutiv.
Situaţiile problemă pot fi simple sau „închise”, atunci când elevului îi sunt puse la
dispoziţie toate datele necesare rezolvării, scopul este precizat clar, iar succesiunea cerinţelor
sugerează şi etapele de rezolvare şi situaţii problemă „deschise”, atunci când elevul dispune
doar de datele cele mai importante, procesul de rezolvare este doar sugerat, iar demersul
propriu-zis trebuie ales de către cel examinat.

Exemplu – Matematică, Varianta 1, Itemul 12

Clădirea unei şcoli are 8 săli de clasă a câte 30 de locuri fiecare. La şcoală sunt 105 băieţi şi 125 fete. Câte
locuri vor rămâne libere dacă toţi elevii sunt prezenţi la şcoală?
Completează datele problemei în schema de mai jos şi scrie semnul potrivit pe spaţiul punctat, apoi
rezolvă.

Avantaje ale itemilor de tip rezolvare de probleme (Mândruţ, 2001; Moise, 2007; Cucoş,
2008)
• Modalitatea de elaborare a acestor itemi stimulează gândirea creativă a elevilor şi
încurajează transferul de proceduri şi metode de rezolvare a problemelor în interiorul aceluiaşi
domeniu sau între domenii diferite.
• Favorizează activităţile de rezolvare în echipă (dacă sunt proiectaţi în acest sens) şi
dezvoltarea abilităţilor autoevaluative.
• Încurajează elevul să analizeze comparativ mai multe metode, căi de rezolvare a unei
probleme şi să ia decizii cu privire la cea mai adecvată dintre ele.
• Permit utilizarea unor materiale diverse, unele dintre ele favorizând contactul cu elemente
ale vieţii cotidiene.
Limite ale itemilor de tip rezolvare de probleme
• Proiectarea acestor itemi este cronofagă.
• Elaborarea schemei de corectare şi de notare este dificilă, lăsând uneori loc interpretărilor
subiective ale evaluatorului.
• Timpul de administrare şi de corectare este mai îndelungat decât în cazul itemilor
obiectivi şi semiobiectivi.

Exigenţe de proiectare a itemilor de tip rezolvare de probleme (Mândruţ, 2001)


• Pentru a asigura caracterul formativ al evaluării prin probe care includ itemi de tip
rezolvare de probleme, sarcinile de lucru trebuie să fie diversificate pentru a evita rutina.
• Sarcinile de rezolvat trebuie conectate la obiectivul de evaluare vizat.
• Schema de corectare şi de notare trebuie elaborată cu deosebită atenţie, pentru a minimiza
efectele subiectivităţii evaluatorului.

4.3.5.2. Itemii de tip eseu


Itemii de tip eseu presupun elaborarea de către elev a unor răspunsuri complexe, acesta
având suficientă libertate în jalonarea liniilor de explicare, argumentare etc., având avantajul
de a surprinde comportamente plasate la nivele taxonomice înalte (Radu, 2000; Mândruţ,
2001; Cucoş, 2008).
Deşi se vehiculează patru categorii de itemi de tip eseu, clasificate după două criterii
distincte – cu răspuns restrâns şi cu răspuns extins, după dimensiunea aşteptată a răspunsului;
eseu structurat şi eseu liber, după natura cerinţelor specificate în cadrul itemului, ele sunt co-
extensive în sensul că eseul cu răspuns restrâns se apropie de eseul structurat, iar cel cu
răspuns extins se apropie de eseul liber.
Itemii tip eseu cu răspuns restrâns (eseu scurt, minieseu) implică respectarea de către
elev a unor cerinţe în elaborarea răspunsului, care pot viza forma şi/ sau conţinutul acestuia.
Exigenţele de formă se pot referi la numărul de pagini, linii sau pragrafe, în timp ce reperele
privind conţinutul pot face trimitere la anumite elemente de conţinut care trebuie să se
regăsească în răspuns.
Itemii eseu cu răspuns extins solicită elevului să elaboreze un răspuns amplu,
valoricând toate achiziţiile anterioare, dar introducând şi elemente de originalitate.
Itemii de tip eseu structurat includ în enunţul lor cerinţe, repere explicite care să
orienteze elevul într-o anumită manieră în organizarea, argumentarea ideilor expuse. Acest tip
de itemi trebuie întotdeauna completat cu o schemă de corectare şi de notare care să indice
punctajele aferente elementelor de reper, care să fie aduse la cunoştinţă elevului într-o formă
sau alta.
Itemii de tip eseu liber sunt elaborați ca sarcini de lucru deschise pentru orice răspuns,
fără a include precizări cu privire la maniera de organizare şi la procedura de evaluarea
analitică a acestuia.

Exemplul 1 (item de tip eseu structurat / scurt) – Limba română, Varianta 2, Itemul 8

Compune un text despre primăvară.


▪ Textul trebuie să fie alcătuit din cel puţin 6 şi cel mult 10 enunţuri.
▪ Scrie un titlu potrivit textului.
▪ Aşază corect textul în pagină.
▪ Respectă regulile de ortografie şi punctuaţie.

Exemplul 2 (item de tip eseu liber) – Ştiinţe, Varianta 2, Itemul 14


Dintre experimentele efectuate în clasă, la Ştiinţe ale naturii, descrie în câteva enunţuri pe cel care ţi-a plăcut cel
mai mult. Ce ai aflat în urma realizării lui?

Avantaje ale itemilor de tip eseu structurat şi cu răspuns restrâns


• Sunt mai uşor de proiectat decât alte categorii de itemi.
• Dacă sunt însoţiţi de scheme de corectare şi de notare clare, sunt relativ uşor de corectat.
• Ghidează elevul, în manieră explicită, în elaborarea răspunsului, ajutându-l să-şi organizeze
ideile.
• Notarea este mai riguroasă decât în cazul itemilor de tip eseu liber şi cu răspuns extins, de
unde decurge şi o fidelitate mai ridicată a evaluării.

Limite ale itemilor de tip eseu structurat şi cu răspuns restrâns


• Restricţionarea răspunsului prin introducerea cerinţelor nu permite evaluarea la nivelul
taxonomic cel mai înalt.
• Proiectarea itemilor, a schemelor de corectare şi de notare este dificilă şi consumatoare de
timp.
• În ciuda preciziei cu care se pot formula cerinţele, subiectivitatea evaluatorului poate
interveni în aprecierea răspunsului.

Avantaje ale itemilor de tip eseu liber şi cu răspuns extins


• Sunt itemii care permit măsurarea capacităţilor asociate nivelului taxonomic cel mai înalt,
permiţând şi evidenţierea calităţilor de tipul creativității, coerenţei argumentative etc.
• Dacă sunt utilizaţi de către profesor în evaluarea curentă, pot constitui reale ocazii de
dezvoltare a capacităţii de exprimare şi organizare a ideilor la elevi.
• Sunt relativ uşor de proiectat.

Limite ale itemilor de tip eseu liber şi cu răspuns extins


• Ridică mari probleme în corectare şi notare, în sensul că aceste acțiuni trebuie strict
orientate de scheme de corectare şi de notare suficient de detaliate şi de precise.
• Datorită timpului mai îndelungat de administrare, nu permit evaluarea unui set larg de
capacităţi ale elevului.
• Fidelitatea este, în general, redusă.

Exigenţe de proiectare a itemilor de tip eseu


• Se recomandă ca itemii de tip eseu să fie utilizaţi numai în situaţiile în care capacităţile
vizate nu pot fi măsurate prin intermediul itemilor obiectivi şi semiobiectivi, datorită nivelului
ridicat de subiectivitate în aprecierea răspunsurilor.
• În cazul eseului structurat, cerinţele trebuie formulate clar şi precis, astfel încât să
constituie un sprijin veritabil pentru elev în formularea răspunsului (inclusiv cerinţe clare
privind dimensiunea răspunsului şi/ sau limita de timp impusă pentru redactarea acestuia).
• În cazul tuturor tipurilor de eseu, schema de corectare şi de notare necesită atenţie ridicată,
pentru evitarea aprecierii răspunsurilor în contextul impresiei globale. În toate situaţiile în
care este posibil, elementele acesteia trebuie aduse la cunoştinţa elevului, odată cu prezentarea
itemului.

Temă obligatorie 1
Elaboraţi un set de exemple de itemi obiectivi, semiobiectivi și subiectivi (câte două exemple
pentru fiecare tip de item, adaptate la specificul învățământului preșcolar și primar).
4.3.6. Calităţile testului
Pentru a putea aplica un test este necesară verificarea calităţilor sale globale (Karmel
şi Karmel, 1978; Radu, 2000; Moise, 2007) - obiectivitate, aplicabilitate, fidelitate şi
validitate, precum şi a calităţilor fiecărui item – dificultate şi putere de discriminare.
Obiectivitatea unui test docimologic se referă la caracterul explicit şi la claritatea
itemilor, care să permită obţinerea de scoruri comparabile în cazul unor evaluatori competenţi.
Dacă scopul administrării unui test nu este clarificat înainte de începerea proiectării sau dacă
sunt omise etape de proiectare a acestuia, există riscul de a genera erori în calcularea și
interpretarea scorurilor, care nu se datorează evaluatorului, ci neglijenței celui care a elaborat
testul.
Aplicabilitatea se referă la adecvarea itemilor la conţinuturile vizate, la volumul de
timp şi resurse materiale necesar administrării care trebuie să fie rezonabil, la claritatea
modalităţii de calculare a scorurilor. Numărul de itemi și timpul alocat rezolvării testului
trebuie să fie rezonabil, iar instrucțiunile de aplicare trebuie să fie clare și precise. Scorurile la
testele docimologice sunt importante pentru a lua decizii educaționale potrivite și, de aceea,
treuie să fie deopotrivă ușor de calculat și de interpretat. De asemenea, ele trebuie să permită
explicații și pentru alți actori educaționali decât profesorul (în special elevii și părinții).
Fidelitatea şi validitatea sunt adesea folosite în mod eronat ca sinonime, însă cele
două concepte au accepţiuni diferite – în timp ce fidelitatea se referă la consistenţa sau
stabilitatea unui test, validitatea indică proporția în care un test surprinde ceea ce şi-a propus
să măsoare. Un instrument de evaluare poate avea o fidelitate ridicată, fără a fi valid, însă un
test valid are cu siguranţă o fidelitate ridicată.

Validitatea unui test se referă la proporția în care acesta surprinde ceea ce se


presupune că trebuie să măsoare. În cazul unui test, se pot estima mai multe tipuri de
validitate (Anastasi, 1976; Evans, 1985; Linn și Gronlund, 2000; Moise, 2007):
A) Validitatea de conţinut reflectă măsura în care itemii unui test acoperă problema de
studiat, în cazul nostru măsura în care surprinde comportamentele pe care dorim să le
măsurăm la elevi. Este considerată adesea o valoare subiectivă (Stan, 2002) deoarece
presupune ca unul sau mai mulţi experţi să evalueze măsura în care itemii contribuie la
cunoaşterea caracteristicii studiate. Există cel puţin două modalităţi de utilizare a metodei
experţilor în evaluarea validităţii de conţinut: experţilor li se poate cere să judece măsura în
care itemii instrumentului ilustrează comportamentul sau trăsătura investigată (Evans, 1985)
şi/sau li se poate solicita să formuleze un set de itemi care să surprindă comportamentul sau
trăsătura investigată (Stan, 2002).
În cazul testului docimologic, atunci când facem aprecieri privind validitatea de
conținut ar trebui să avem în vedere o serie de întrebări la care să găsim răspunsuri prin
analiza itemilor din test: Domeniul comportamental vizat (cognitiv, afectiv, psihomotor) este
ilustrat de itemii incluși în test? Itemii din test sunt elaborați în concordanță cu standardele de
perfomanță pentru elevi, cu obiectivele cadru și de referință, respectiv cu cele operaționale?
Care este corespondența între conținuturile sugerate în programa școlară și cele acoperite prin
itemii testului? Testul este echilibrat pe nivele taxonomice sau vizează doar nivele
taxonomice inferioare, respectiv superioare?

B) Validitatea criterială (de criteriu) presupune o concordanţă ridicată între rezultatele


subiecţilor în urma aplicării unui test şi un criteriu. Cele două forme ale validităţii criteriale
sunt validitatea concurenţială şi validitatea predictivă (Gliner şi Morgan, 2000; Stan, 2002,
Gall, Gall şi Borg, 2007).
Validitatea concurenţială presupune compararea rezultatelor între instrumentul de
evaluare şi criteriu sau un alt instrument (al cărui validitate a fost anterior determinată şi este
ridicată). În acest caz, coeficientul de validitate exprimă corelaţia între instrument şi criteriu.
Un exemplu de analiză a validității concurențiale ar putea fi calcularea coeficientului de
corelație între un rezultatele la testul docimologic analizat și rezultatele la un test de aptitudini
academice (dacă acesta ar fi disponibil și am avea date privind validitatea sa).
Validitatea predictivă surprinde relaţia între valorile obţinute prin aplicarea
instrumentului şi un criteriu, în condiţiile în care măsurarea criteriului este realizată ulterior,
deci puterea instrumentului de a anticipa comportamente, performanţe viitoare. În acest caz,
coeficientul de validitate exprimă corelaţia între un predictor (valorile unui test) şi valorile
criteriului. Pentru evaluarea coeficientului de validitate se pot utiliza coeficientul de regresie
şi punctajele critice multiple (engl. cut-offs) (Crocker şi Algina, 1986; Stan, 2002, pp. 182-
183). În cazul în care un profesor ar dori să analizeze validitatea criterială a unui test sumativ
pe care l-a aplicat la sfârșitul semestrului I unei clase a IV-a, ar putea corela rezultatele
elevilor săi cu rezultatele pe care aceștia le-ar obține ulterior la evaluarea națională sau cu
notele de la primele evaluări sumative din clasa a V-a.
Validitatea criterială, în ambele sale forme, este influenţată de natura criteriului ales şi
de caracteristicile eşantionului. De aceea, raportarea coeficienţilor de validitate pentru un test
trebuie însoţită de specificarea şi descrierea clară a criteriului şi a eşantionului pe care s-a
realizat evaluarea.

C) Validitatea de construct sau conceptuală se referă la cât de bine este transpus într-
un instrument un concept (o competenţă, un comportament etc.). Evaluarea validităţii de
construct presupune atât un demers teoretic, cât şi un demers empiric: parcurgerea
bibliografiei de specialitate ce cuprinde date anterioare cu privire la acelaşi construct/concept
şi claritatea raţionamentelor ipotetico-deductive sunt la fel de importante ca procedurile
bazate pe date empirice.
Cu alte cuvinte, dacă un profesor ar dori să proiecteze un test pentru o unitate de
învățare despre „viețuitoare acvatice” ar trebui să studieze cu atenție programa școlară pentru
a identifica obiectivele de referință aplicabile, elementele de conținut care trebuie avute în
vedere, dar și schițele de proiecte pentru a-și reaminti gama de comportamente vizate la elevi
în fiecare lecție. De asemenea, ar trebui să analizeze teste proiectate de alți colegi, eventual
publicate în culegeri, pentru a se asigura că va selecta un eșantion reprezentativ de
comportamente și de conținuturi care vor fi vizate. În cazul testelor docimologice, tabelul sau
matricea de specificații (pe care o com prezenta detaliat în secțiunea destinată proiectării
testului) constituie un instrument de asigurare a validității de construct.

D) Validitatea convergentă estimează măsura în care două teste măsoară acelaşi


construct, iar validitatea discriminatorie se referă la relaţia non-corelaţională cu teste care
măsoară alte constructe decât cel studiat. Matricea centralizatoare include corelaţii între teste
care măsoară aceeaşi trăsătură, corelaţii între teste care măsoară trăsături diferite şi corelaţii
între acestea din urmă în cazul utilizării unor metode diferite de măsurare (vezi pentru
exemple Anastasi, 1976, p. 157 şi Stan, 2002, p. 192).
Pentru a aprecia validitatea globală a unui test este necesară atât specificarea mai
multor coeficienţi de fidelitate, cât şi prezentarea unor consideraţii legate de toate tipurile de
validitate.
Unii dintre factorii care influențează validitatea țin de evidență și pot fi relativ ușor
de controlat, în timp ce alții au efecte subtile, greu sesizabile și ridică dificultăți conceptorilor
de teste. Este evident că un profesor nu poate elabora un test pentru elevii unei clase a III-a
făcând apel la conţinuturi din programa clasei a V-a, după cum nu putem evalua printr-un test
la matematică comportamente pe care le vizăm la elevi prin activităţile educaţionale din
domeniul ştiinţe. În ambele situaţii, dacă am proceda contrar evidenţei am obţine teste cu
validitate scăzută. Dacă un profesor ar elabora testul de matematică având ca reper
standardele de performanţă, obiectivele, conţinuturile etc., dar ar folosi în explicarea sarcinilor
(în instrucţiuni) termeni pe care nu toţi elevii îi înţeleg, rezultatul ar fi ti un test cu validitate
scăzută, dar factorul care a determinat acest fapt este mai subtil decât în primul exemplu.
Aceşti factori subtili care pot influenţa validitatea unui test docimologic pot fi grupaţi în
funcţie de sursa potenţialei erori (Linn şi Gronlund, 2000; Nitko, 2001):
• Erori de proiectare a testului. O examinare atentă a fiecărui item ar trebui să fie
suficientă pentru a stabili concordanţa cu finalităţile şi conţinuturile disciplinei. În plus, sunt şi
alţi factori care ţin de proiectarea testului şi pot afecta validitatea acestuia: instrucţiunile
formulate neclar care îi pot dezorienta pe elevi; ambiguitatea în formularea itemilor; timpul
prea scurt alocat rezolvării testului (atunci când variabila timp nu este legată de nivelul
achiziţiilor elevului); supradimensionarea părţilor din test care surprind achiziţii uşor de
măsurat, în detrimentul itemilor care măsoară achiziţii dificil de măsurat (de exemplu,
capacităţi intelectuale complexe); erori în proiectarea itemilor, în sensul că aceştia includ
„indicii” prea clare către răspunsurile corecte sau alternative de răspuns ordonate după tipare
evidente pentru elevi (de exemplu, întotdeauna primul răspuns din lista alternativelor este cel
corect); numărul prea mic de itemi poate afecta validitatea prin slaba reprezentare a
obiectivelor şi a conţinuturilor.
• Erori în activitatea de predare anterioară administrării testului sau lipsa de
concordanţă între itemii testului şi modul în care s-a realizat predarea. Dacă un tip de sarcină
a fost rezolvat în clasă după un anumit algoritm, iar testul îl pune pe elev în situaţia de a
rezolva în alt mod o sarcină similară, validitatea ar avea de suferit. Nu e mai puţin adevărat
că, dacă includem într-un test o sarcină rezolvată deja în clasă, vom măsura comportamentul
elevului doar la nivelul de cunoaştere, indiferent de nivelul taxonomic pe care l-am vizat.
• Erori în administrare şi în calcularea scorurilor. Dacă profesorul acordă ajutor,
explicaţii suplimentare etc. în timpul adminstrării testului, validitatea acestuia scade. De
asemenea, copiatul sau ajutorul între elevi, precum şi greşelile din timpul corectării testelor
afectează validitatea.
• Factori personali care ţin de pregătirea elevilor pentru situaţia de testare. Dacă elevii
nu sunt familiarizaţi cu atmosfera de administrare a unui test şi trăiesc momentul testării ca pe
o ameninţare, scorurile nu vor reflecta achiziţiile lor reale.
• Compoziţia grupului şi natura criteriului. Validitatea unui test se discută întotdeauna
în legătură cu un anumit grup de subiecţi. Dacă aplicăm acelaşi test de matematică unui grup
de elevi de clasa a II-a şi unui alt grup de elevi de clasa a IV-a, în condiţiile în care
instrumentul a fost proiectat pentru aceştia din urmă, validitatea nu va fi comparabilă.
Validitatea unui test este afectată de factori precum vârsta, genul, nivelul aptitudinal, biografia
educaţională a elevilor, apartenenţa culturală.
În ceea ce priveşte natura criteriului, corelaţia între scorurile la un test şi un criteriu va
fi mai redusă în situaţiile în care caracteristicile măsurate sunt diferite, împrăştierea sau
variabilitatea scorurilor este mică, stabilitatea scorurilor este şi ea redusă sau timpul dintre
aplicarea testului şi măsurarea criteriului folosit pentru estimarea validităţii predictive este
foarte îndelungat.

Fidelitatea se poate estima prin intermediul a patru modalităţi diferite (Thomas, 1998;
Gliner şi Morgan, 2000):
A) Fidelitatea test-retest (exprimată statistic prin coeficientul de stabilitate) presupune
ca aplicarea instrumentului de evaluare aceloraşi subiecţi, în momente diferite, să conducă la
obţinerea unor rezultate comparabile. Evaluarea acestui tip de fidelitate poate conduce la erori
provenite din familiarizarea subiecţilor cu întrebările, fiind posibil ca stabilitatea rezultatelor
să fie dată de memorarea întrebărilor şi a răspunsurilor, nu de calităţile instrumentului. De
aceea, evaluatorul trebuie să se asigure că intervalul de timp între cele două aplicări este
suficient de lung pentru a evita acest tip de eroare.

B) Fidelitatea prin forme alternative (exprimată statistic prin coeficientul de stabilitate)


presupune ca rezultatele subiecţilor în urma aplicării unui test să fie comparabile cu cele
obţinute de aceiaşi subiecţi în urma aplicării unui test cu itemi similari. Estimarea acestui tip
de fidelitate implică fie ca cercetătorul să formuleze aceiaşi itemi în formă diferită, fie să
schimbe ordinea itemilor în cadrul aceluiaşi instrument.
Indicatorul statistic al coeficientului de stabilitate şi al coeficientului de echivalenţă
este coeficientul de corelaţie Pearson. Cele mai multe lucrări consideră că un coeficient de
corelaţie egal sau mai mare de 0,70 este suficient pentru a asigura cele două tipuri de
fidelitate. Anastasi (1976, p. 109) şi Evans (1985, p. 79) menţionează însă valori ale
coeficientului de corelaţie cuprinse între 0,80-0,90, pentru a putea avea certitudinea unei
fidelităţi ridicate.

C) Fidelitatea estimată prin consistenţa internă sau omogenitatea unui test se referă
pe de o parte, la măsura în care toţi itemii relaţionează între ei şi, pe de altă parte, la măsura în
care fiecare item relaţionează cu rezultatul total obţinut de subiecţi. Au fost elaborate şi sunt
utilizate mai multe metode de calcul a coeficientului de consistenţă internă, dintre care cele
mai cunoscute sunt (Gliner şi Morgan, 2000): metoda înjumătăţirii (engl. split-half), metoda
Kuder-Richardson și metoda de calcul a coeficientului alpha Cronbach.

Metoda înjumătăţirii se recomandă atunci când nu există o formă alternativă a


instrumentului de evaluare sau nu s-a parcurs etapa de retest. Metoda presupune împărţirea
rezultatelor unui test în două jumătăţi comparabile şi obţinerea unui coeficient de corelaţie a
acestora. Împărţirea se poate realiza fie strict numeric (dacă avem un instrument cu 30 de
întrebări, 15 sunt incluse în prima jumătate, 15 în a doua) – ceea ce nu conduce la erori dacă
itemii au fost ordonaţi în funcție de dificultate; fie prin reunirea itemilor similari într-o
jumătate şi a celor singulari în cealaltă jumătate. Coeficientul de corelaţie al celor două
jumătăţi de test este utilizat în calcularea coeficientului de consistenţă internă, corectat prin
formula Spearman-Brown (Anastasi, 1976, pp. 115-116; Gliner şi Morgan, 2000, pp. 314-
315).

Exemplu de calcul a fidelității unui test prin metoda înjumătățirii


În tabelul de mai jos sunt prezentate rezultatele rezultatele a 10 elevi la un test care
conține 10 itemi (pentru fiecare item rezolvat corect un elev primește 1 punct, iar răspunsurile
greșite se notează cu 0). După cum se poate observa, tabelul are două intrări: pe coloane sunt
prezentate etapele intermediare de calcul a coeficientului de fidelitate, iar pe rânduri sunt
prezentate rezultate elevilor (respectiv, prelucrări corespunzătoare scorurilor fiecărui elev).
Coloana X include rezultatele elevilor la itemii impari (scorurile totale pentru o jumătate a
testului), iar coloana Y include rezultatele la itemii pari (scorurile totale pentru cealaltă
jumătate a testului). Coloana x include abaterea de la medie pentru itemii impari (diferenţa
între fiecare scor din coloana X şi media scorurilor X). Coloana y include abaterea de la medie
pentru itemii pari. Coloana x2 include abaterea pătratică de la medie pentru itemii pari, iar
coloana y2 abaterea pătratică de la medie pentru itemii pari. Coloana xy reprezintă produsul
dintre valorile abaterilor de la medie ale itemilor impari şi valorile abaterilor de la medie
pentru itemii pari. Sub coloanele x2, y2 şi xy sunt notate totalurile corespunzătoare.

Itemi/ Itemi impari Itemi pari


subiecţi X Y X Y X2 y2 xy
1 4 4 1,30 1,50 1,69 2,25 1,95
2 3 2 0,30 -0,50 0,09 0,25 -0,15
3 2 3 -0,70 0,50 0,49 0,25 -0,35
4 5 3 2,30 0,50 5,29 0,25 1,15
5 4 3 1,30 0,50 1,69 0,25 0,65
6 3 3 0,30 0,50 0,09 0,25 0,15
7 2 2 -0,70 -0,50 0,49 0,25 0,35
8 1 2 -1,70 -0,50 2,89 0,25 0,85
9 2 2 -0,70 -0,50 0,49 0,25 0,35
10 1 1 -1,70 -1,50 2,89 2,25 2,55

M= 2,70 M= 2,50 ∑= 16,10 ∑= 6,50 ∑= 7,50

Având în vedere aceste date, calculăm coeficientul de corelaţie Pearson (r), utilizând
formula:
Σxy
r=
Σx 2 ⋅ Σy 2
În exemplul nostru, dacă înlocuim rezultatele noastre în formulă, vom obține:

7,50
r12 = = 0,73
16,10 ⋅ 6,50

Pe baza acestei corelaţii între cele două jumătăţi ale testului, se calculează fidelitatea
întregul test rt, utilizând corecţia Spearman-Brown:

2 ⋅ r12 2 ⋅ 0,73
rt = = = 0,84
1 + r12 1 + 0,73

Această cifră reprezintă o corelaţie puternică, dacă avem în vedere faptul că unii autori
sugerează că valorile acceptabile sunt cuprinse între 0,70 - 0,90, iar cele ideale, peste 0,90
(Anastasi, 1975; Evans 1985).
Metoda înjumătăţirii pentru estimarea fidelităţii este adecvată doar în cazul testelor
alcătuite din itemi cu punctaje identice (de exemplu, itemi cu răspuns dual pentru care
răspunsurile pot fi notate cu 1 şi 0; itemi cu alegere multiplă, varianta răspuns corect etc.).

Metoda Kuder-Richardson de calculare a consistenţei interne estimează omogenitatea


itemilor unui test. Omogenitatea inter-itemi poate fi afectată de două tipuri de erori de
varianţă: eşantionarea conţinutului (adică alegerea iniţială a itemilor) şi eterogenitatea
domeniului comportamental la care se referă itemii. Cu cât domeniul comportamental surprins
prin intermediul itemilor este mai omogen, cu atât creşte consistenţa inter-itemi. Coeficientul
Kuder-Richardson este potrivit pentru estimarea consistenţei interne pentru acele instrumente
care au un sistem de cotare al răspunsurilor de tipul corect-greşit sau „totul sau nimic”
(răspunsurile corecte sunt notate cu 1, iar cele greșite cu 0).

Exemplu de calcul a fidelității unui test prin metoda Kuder-Richardson


Există două formule Kuder-Richardson care pot fi utilizate pentru calcularea fidelității: KR 20
și KR 21.

k Σpq
Formula KR 20 rKR20 = (1 − 2 )
k −1 s

k M (k − M )
Formula KR 21 rKR21 = (1 − )
k −1 k * s2

Iată și semnificația simbolurilor din cele două formule:


k – numărul de itemi incluși în test
p – frecvența relativă pentru numărul de răspunsuri corecte la fiecare item (numărul de
răspunsuri corecte / numărul total de itemi)
q – frecvența relativă pentru numărul de răspunsuri greșite la fiecare item (numărul de
răspunsuri greșite / numărul total de itemi)
s2 – dispersia sau varianța
M – media scorurilor totale obținute la test

Să presupunem că am aplicat un test docimologic cu 10 itemi unui număr de 10 elevi. Pentru


fiecare item rezolvat corect elevul primește un punct, iar răspunsurile eronate sunt notate cu 0.
Rezultatele celor 10 elevi pentru fiecare dintre cei 10 itemi sunt prezentate în tabelul de mai
jos.

ITEMI X x
Elevi 1 2 3 4 5 6 7 8 9 10 Scor total test (X-M) x2
A 1 1 1 1 1 0 1 1 1 1 9,00 2,80 7,84
B 1 1 1 0 0 1 1 0 1 1 7,00 0,80 0,64
C 1 1 1 1 1 0 0 1 1 0 7,00 0,80 0,64
D 1 1 1 0 1 1 1 0 0 0 6,00 -0,20 0,04
E 1 1 1 1 0 0 0 0 0 0 4,00 -2,20 4,84
F 0 1 1 1 1 0 0 0 0 0 4,00 -2,20 4,84
G 1 1 1 1 1 1 1 1 1 0 9,00 2,80 7,84
H 1 1 0 0 0 0 1 0 0 0 3,00 -3,20 10,24
I 1 1 0 0 1 1 1 1 0 0 6,00 -0,20 0,04
J 1 1 1 0 0 0 1 1 1 1 7,00 0,80 0,64
∑ 9 10 8 5 6 4 7 5 5 3
M= 6,20 0,00 ∑x2= 37,60

Pe lângă rezultatele elevilor, în tabel sunt prezentate scorurile totale obținute de fiecare elev
pentru întregul test (X), media scorurilor obținute de elevi (M), abaterea de la medie a fiecărui
scor (x= X-M) și abaterea pătratică de la medie (x2)4.
Înlocuind aceste valori în formula dispersiei pe care o cunoaștem [s2= Σ(X – M)2 / N-1],
obținem valoarea acesteia s2= 4,17.

În tabelul următor sunt prezentate valorile lui p și q, reprezentând frecvența relativă a


răspunsurilor corecte, respectiv greșite pentru fiecare item, precum și produsele pq pentru
fiecare item și suma produselor pq.

4
Toate detaliile de calcul pentru aceste valori vă sunt cunoscute de la cursul de Metodologia cercetării
pedagogice.
Valorile p 0,90 1,00 0,80 0,50 0,60 0,40 0,70 0,50 0,50 0,30
Valorile q 0,10 0,00 0,20 0,50 0,40 0,60 0,30 0,50 0,50 0,70
p*q 0,09 0,00 0,16 0,25 0,24 0,24 0,21 0,25 0,25 0,21
∑ pq 2,04

Dacă înlocuim aceste date în formula KR 20 obținem:

k Σpq 10 2,04 10
rKR20 = (1 − 2 ) = (1 − ) = (1 − 0,49) = 1,11 * 0,51 = 0,56
k −1 s 10 − 1 4,17 9

Dacă înlocuim aceste date în formula KR 21 obținem:

k M (k − M ) 10 6,20(10 − 6,20)
rKR21 = (1 − 2
) = (1 − ) = 1,11 * 0,44 = 0,48
k −1 k *s 9 10 * 4,17

Dacă vom compara cele două valori ale coeficienților de corelație, vom observa că cea
obținută prin aplicarea formulei KR 21 este mai mică, deoarece aceasta este, în fapt, o
estimare simplă a formulei KR 20, care are la bază asumpția că toți itemii dintr-un test au un
nivelul de dificultate apropiat. În ciuda acestui dezavantaj, formula KR 21 este mai simplu de
utilizat, deoarece presupune doar calcularea mediei și a dispersiei.

Coeficientul Alpha Cronbach (α) este utilizat frecvent pentru a estima consistenţa
internă a testelor care includ itemi care au și răspunsuri parțial corecte, acestea fiind notate cu
mai mult de două scoruri diferite (de exemplu, 0, 1, 2 și 3). Un bun exemplu în acest sens sunt
itemii de tip eseu, pentru care se notează și răspunsurile parțiale (Linn și Gronlund, 2000;
Gallagher, 1998; Nitko, 2001). De asemenea, se recomandă şi în cazul testelor care includ mai
multe tipuri de itemi. Coeficientul de fidelitate Alpha Cronbach este o variantă a formulelor
Kuder-Richardson și, ca și acestea, estimează media coeficienților de fidelitate care ar fi
obținuți prin metoda înjumătățirii, dacă aceștia ar fi calculați pentru toate variantele posibile
de împărțire a unui test în două jumătăți.

Exemplu de calcul a coeficientului de fidelitate Alpha Cronbach

Coeficientul Alpha Cronbach se calculează folosind formula:

2
k Σs
(1 − k2 ) ,
r=
k −1 sx
unde k este numărul de itemi dintr-un test, sk reprezintă dispersia fiecărui item, iar sx2 este
2

dispersia scorurilor totale la test.

În tabelul de mai jos sunt notate valorile dispersiei pentru fiecare item din testul utilizat ca
exemplu, precum şi valoarea dispersiei pentru scorurile totale.

ITEMI X
1 2 3 4 5 6 7 8 9 10 Scor total test
sk2 0,10 0 0,17 0,27 0,26 0,26 0,23 0,27 0,27 0,23 sx2=4,17
∑ sk2=2,06
Înlocuind aceste valori în formulă obţinem:

2
k Σs 10 2,06
r = (1 − k2 ) = (1 − ) = 1,11 * (1 − 0,49) = 1,11 * 0,51 = 0,56
k −1 sx 9 4,17

Dacă vom compara valoarea coeficientului de fidelitate obţinut prin formula KR 20 şi cel
obţinut prin formula Alpha Cronbach vom observa apropierea lor (doar primele două
zecimale sunt prezentate, ceea ce ar putea conduce la concluzia că cele două valori sunt chiar
identice). Dată fiind această similitudine, nu se recomandă utilizarea amândurora pentru
acelaşi test, deoarece nu furnizează informaţii suplimentarea privind fidelitatea acestuia.
Cea mai frecventă eroare în interpretarea coeficienților de fidelitate derivați din
formulele Kuder-Richardson este aceea că se confundă consistenţa internă cu validitatea de
construct: deşi este un bun estimator al fidelităţii unui instrument, acest coeficient nu
garantează validitatea de construct a unui instrument, ci faptul că rezultatul pentru fiecare
item considerat separat corelează cu rezultatele pentru ceilalți itemi și cu rezultatul pentru
întregul test (Gliner şi Morgan, 2000).

Fidelitatea inter-evaluatori se referă la concordanţa între evaluările realizate de doi


sau mai mulţi evaluatori care corectează și calculează scoruri la un test pentru aceiași subiecţi.
Cea mai directă modalitate de a estima fidelitatea inter-evalauatori este calculul coeficientului
de corelație între scorurile acordate de doi sau mai mulți evaluatori. Există însă și o modalitate
mai simplă, dar mai inexactă de estimare a fidelității între doi sau mai mulți evaluatori prin
calcularea procentajului de acord între scorurile acordate de aceștia.

Exemplu de estimare a fidelității inter-evaluatori prin procentajul de acord

Să presupunem că doi evaluatori au corectat și notat același test, rezolvat de aceiași elevi.
Scorurile pe care le-au acordat pentru 5 elevi sunt sintetizate în tabelul de mai jos.

Evaluator/ Evaluator 1 Evaluator 2 Acord între cei doi


Elevi evaluatori
A 8 7 -
B 5 5 X
C 3 4 -
D 4 5 X
E 9 9 X

Procentajul de acord între cele două seturi de scoruri poate fi cuprins între 100% și 0% și se
calculează după formula:
N
Pa = a ⋅ 100 ,
Ns
unde Ns este numărul total de scoruri calulate de către fiecare evaluator, iar Na este numărul
situațiilor în care cei doi evaluatori au fost acordat același scor.
Cei doi evaluatori din exemplul nostru au acordat același scor în 3 (Na) cazuri din 5
(Ns). Dacă înlocuim aceste date în formulă obținem:
N 3
Pa = a ⋅ 100 = ⋅ 100 = 60%
Ns 5
Așadar, precentajul de acord între cei doi evaluatori este de 60%. Am putea considera
că acesta este suficient de mare, dar după unii autori valoarea sa ar trebuie să fie de peste 80%
(Nitko, 2001).
Ca şi în cazul validităţii, există o serie de factorii care pot influenţa fidelitatea unui
test (Linn şi Gronlund, 2000; Nitko, 2001):
• Numărul itemilor poate influenţa fidelitatea unui test, în sensul că fidelitatea testului
creşte odată cu numărul acestora. Un test cu un număr mai mare de itemi scade şi posibilitatea
ca elevii să ghicească răspunsul corect. Această regulă a fost oarecum sugerată de calculul
fidelităţii prin înjumătăţire, dacă avem în vedere că aplicarea formulei Spearman-Brown a
generat un coeficient de fidelitate mai mare.
• Variabilitatea sau împrăştierea scorurilor are un efect asupra fidelităţii, în sensul că cu
cât aceasta este mai mare cu atât creşte şi valoarea coeficienţilor de fidelitate. Această relaţie
se explică prin faptul că fidelitatea unui test creşte odată cu scăderea posibilităţii ca un elev să
îşi schimbe poziţia în ierarhia grupului. Dacă variabilitatea scorurilor este mică, probabilitatea
ca un elev să obţină un scor care să-l plaseze în altă zonă a clasamentului la o eventuală re-
aplicare a testului creşte.
• Obiectivitatea testului influenţează şi fidelitatea sa. În cazul testelor obiective, pentru
care schemele de corectare şi notare sunt foarte precise, acest factor nu reprezintă o problemă
majoră. Un plus de atenţie trebuie, aşadar, acordat elaborării baremelor de corectare şi de
notare pentru testele obiective, astfel încât doi evaluatori să ajungă la rezultate finale
comparabile. Excluderea itemilor subiectivi din evaluare nu constituie o soluţie, întrucât o
asemenea decizie ar afecta validitatea testului, cea mai importantă calitate a acestuia.
Comportamentele complexe, corespunzătoare nivelelor taxonomice înalte nu pot fi măsurate
întodeauna cu itemi obiectivi sau semiobiectivi. Aşadar, soluţia constă în precizia baremelor
de corectare şi notare, care va conduce şi la o creştere a fidelităţii inter-evaluatori.
• Fidelitatea depinde şi de metoda utilizată pentru calcularea sa. Aşa cum aţi observat
şi din exemplele utilizate pentru calculul coeficienţilor de fidelitate, metoda pentru care optăm
are impact direct asupra valorii acestora. Astfel, coeficientul de stabilitate poate fi mai mare
decât cel obţinut prin metoda înjumătăţirii, dacă intervalul de timp dintre măsurări este scurt.
În cazul fidelităţii estimate prin teste alternative, coeficienţii sunt mai mici decât în situaţia în
care aplicăm metoda înjumătăţirii sau calculăm coeficientul de stabilitate. În plus, cu cât
intervalul de timp dintre aplicări creşte, coeficientul de fidelitate scade. Coeficientul de
fidelitate calculat prin metoda înjumătăţirii este mai ridicat în cazul testelor de randament
(acele teste care au limită de timp). Toţi coeficienţii de fidelitate derivaţi din metoda Kuder-
Richardson au valori mai mici decât cei obţinuţi prin metoda înjumătăţirii şi sunt afectaţi în
sens pozitiv în cazul în care testul are limită de timp.

Analiza validității și a fidelității unui test sunt completate prin analiza calităților
fiecărui item sau analiza de item care presupune estimarea dificultății și a puterii de
discriminare pentru fiecare item, precum și analiza distractorilor. De regulă, indicele de
dificultate şi cel de discriminare se calculează pentru testele normative. Valoarea lor poate fi
calculată şi pentru testele criteriale, dar este lipsită de relevanţă, deoarece acestea nu vizează
ierarhizarea elevilor prin comparaţii intra-grup, ci raportarea achiziţiilor elevului la
obiectivele educaţionale care constituie criteriile. Analiza distractorilor este, evident, posibilă
doar în cazul itemilor care includ asemenea variante de răspuns.

Indicele de dificultate al unui item (Anastasi, 1976; Karmel şi Karmel, 1978; Radu,
2000; Moise, 2007) este, în fapt, o estimare a procentului de subiecţi care rezolvă corect un
item și se poate calcula folosind formula:
C + Ci
I dif = s ,
2⋅n
unde Cs reprezintă numărul de răspunsuri corecte din segmentul superior al clasamentului
elevului, realizat în funcție de scorurile totale la test; Ci reprezintă numărul de răspunsuri
corecte din segmentul inferior al clasementului; iar n este numărul de subiecţi dintr-un
segment sau subgup.
Practic, grupul de subiecți cărora li s-a administrat testul se împarte în trei, patru sau
cinci grupuri egale, în funcție de scorul total obținut la test, iar în calculul indicelui de
dificultate de iau în considerare doar cazurile extreme (cei mai buni 20-30% și cei mai slabi
20-30%). Valoarea indicelui de dificultate variază între 0 şi 1 (în formă procentuală). Cu cât
este mai aproape de 0, cu atât itemul este mai dificil, iar apropierea de valoarea 1 sugerează
un nivel mai scăzut de dificultate. Itemii prea uşor sau prea dificil de rezolvat nu oferă
informaţii relevante despre subiecţi şi sunt eliminaţi în etapa de revizuire a testului. Din punct
de vedere strict statistic, itemul „ideal” ar fi cel care este rezolvat corect de 50% dintre
subiecţi. În cazul unui test normativ, dificultatea optimă este între cuprinsă între 0,40 - 0,50,
dar, în general, se acceptă un coeficient de dificultate cuprins între 25% şi 75%.

Exemplu de calcul a indicelui de dificultate

Iată cum ar trebui să procedăm dacă am dori să calculăm indicele de dificultate al itemului 7
dintr-un test aplicat unui număr de 10 elevi, ale căror scoruri sunt prezentate în tabelul de mai
jos.

ITEMI
Elevi 1 2 3 4 5 6 7 8 9 10 Scor total test
A 1 1 1 1 1 0 1 1 1 1 9,00
B 1 1 1 0 0 1 1 0 1 1 7,00
C 1 1 1 1 1 0 0 1 1 0 7,00
D 1 1 1 0 1 1 1 0 0 0 6,00
E 1 1 1 1 0 0 0 0 0 0 4,00
F 0 1 1 1 1 0 0 1 0 0 5,00
G 1 1 1 1 1 1 1 1 1 0 9,00
H 1 1 0 0 0 0 1 0 0 0 3,00
I 1 1 0 0 1 1 1 1 0 0 6,00
J 1 1 1 0 0 0 1 1 1 1 7,00

După ce am calculat scorurile total la test, vom împărți grupul de 10 elevi în 5 grupuri (fiecare
grup va fi alcătui din câte 2 elevi). Dacă îi vom ierarhiza în funcție de scorurile totale, vom
obține următorul tabel:
ITEMI
Elevi 1 2 3 4 5 6 7 8 9 10 Scor total test
H 1 1 0 0 0 0 1 0 0 0 3
E 1 1 1 1 0 0 0 0 0 0 4
F 0 1 1 1 1 0 0 1 0 0 5
D 1 1 1 0 1 1 1 0 0 0 6
I 1 1 0 0 1 1 1 1 0 0 6
B 1 1 1 0 0 1 1 0 1 1 7
C 1 1 1 1 1 0 0 1 1 0 7
J 1 1 1 0 0 0 1 1 1 1 7
A 1 1 1 1 1 0 1 1 1 1 9
G 1 1 1 1 1 1 1 1 1 0 9
Pentru a calcula indicele de dificultate al itemului 7, avem nevoie de scorurile pentru acest
item al primilor doi și al ultimilor doi elevi. Ambii elevi din segmentul superior (A și G),
precum și un elev in segmentul inferior (H) au rezolvat itemul. Dacă înlocuim aceste date în
formulă, obținem:
C + Ci 2 + 1
I dif = s = = 0,75
2⋅n 4
Așadar, itemul 7 din exemplu nostru este relativ ușor, deoarece valoarea sa este mai aproape
de 1 decât de 0.

Indicele de discriminare (Anastasi, 1976; Karmel şi Karmel, 1978; Radu, 2000;


Moise, 2007) indică măsura în care un item face diferenţa între subiecţii cu performanţe înalte
şi cei cu performanţe scăzute la un test. Se poate calcula ca diferenţă între procentul de
subiecţi care au rezolvat corect itemul analizat din cincimea superioară a clasamentului,
realizat pe baza scorurilor totale la test (primii 20% dintre subiecţi) şi procentul de subiecţi
care a rezolvat corect itemul analizat din cincimea inferioară a clasamentului (ultimii 20%
dintre subiecţi). Ca și în cazul indicelui de dificultate, grupul de subiecți poate fi împărțit și în
trei sau patru segmente.
Formula după care se calculează indicele de discriminare este:
G − Gs
I dis = i ,
n
în care Gi reprezintă numărul de răspunsuri greşite în segmentul inferior, Gs numărul de
răspunsuri greşite în segmentul superior, iar n este este numărul de subiecţi dintr-un segment.
Valoarea indicelui de discriminare poate varia între -1 şi +1. Când are valoarea +1,
itemul discriminează la nivel maxim în favoarea subiecţilor buni, iar valoarea -1 indică o
discriminare negativă (toţi elevii din segmentul superior au greşit itemul, iar cei din segmentul
inferior l-au rezolvat corect). În situaţia absurdă a unei discriminări negative, se recomandă
excluderea itemului. În cazul unui test normativ, valoarea optimă a indicelui de discriminare
ar trebui să se situeze peste 0,70.

Exemplu de calcul a indicelui de dificultate

Revenim la exemplul pe baza căruia am calculat indicele de dificultate şi analizăm puterea de


discriminare a itemului 7. Un elev din segmentul inferior (E) a greşit itemul, în timp ce în
segmentul superior nu avem nici un răspuns greşit. Dacă înlocuim aceste date în formulă,
obţinem:
G − Gs 1 − 0
I dis = i = = 0,50
n 2
Aşadar, indicele de discriminare al itemului 7 este de 0,50, o valoare mai mică decât 0,70,
ceea ce înseamnă că acest item nu discriminează foarte bine între elevii buni şi elevii slabi.

Analiza distractorilor (răspunsurile incorecte) se recomandă în special pentru itemii


cu alegere multiplă sau pentru cei de asociere pentru a determina eficienţa acestora.
Răspunsurile incorecte ar trebui să-l stimuleze pe elev, fără a permite „ghicirea” răspunsului
corect fără nici un fel de efort. Analiza distratorilor se poate realiza prin calcularea indicelului
de discriminare pentru fiecare distractor, cu precizarea că acesta ar trebui să aibă valori mai
degrabă negative pentru ca varianta de răspuns incorectă să poată fi considerată un distractor
eficient (Linn şi Gronlund, 2000; Nitko, 2001). Cu alte cuvinte, distractorul ar trebui să atragă
mai multe alegeri din rândul elevilor slabi şi mai puţine din rândul celor buni. Dacă această
soluţie pare complicată şi minuţioasă, se poate proceda la o analiză detaliată a distractorilor,
care să respecte principiile enunţate anterior, evitând totodată calculele matematice. Vom
exemplifica un asemenea demers, pentru a facilita înţelegerea acestei proceduri de analiză a
distractorilor.
Să presupunem că am aplicat un test care include itemi cu alegere multiplă care au câte
patru variante de răspuns unui grup de 40 de elevi. Ca şi în cazul calculării indicelui de
discriminare, trebuie să stabilim segmentul superior şi segmentul superior în funcţie de
rezultatele totale la test. În acest caz, presupunem că vom împărţi grupul nostru în patru
segmente a câte 10 elevi. Rezultatele detaliate pentru unul dintre itemi, pentru care răspunsul
corect este A, iar B, C şi D sunt distratori sunt prezentate în tabelul de mai jos.

Alternative de Varianta de Varianta de Varianta de Varianta de Non-răspunsuri


răspuns răspuns A răspuns B răspuns C răspuns D
Segmentul superior 6 4 1 0 0
Segmentul inferior 3 2 5 0 0

Puterea de discriminare a itemului este relativ redusă, valoarea indicelelui de


discriminare fiind 0,33. Alternativa de răspuns B este un distractor nepotrivit, deoarece a atras
mai multe alegeri din segmentul superior al grupului de elevi. Varianta de răspuns C este un
distractor adecvat deoarece a atras mai multe alegeri din segmentul inferior al grupului, în
timp ce alternativa D este un distractor lipsit de eficienţă, nefiind ales de nici un elev. Ca
urmare a aceste analize, profesorul ar trebui să înlocuiască variantele de răspuns B şi D sau să
revizuiască itemul în întregime, în cazul în care sarcina a fost formulată într-o manieră
ambiguă, generând astfel problemele de discriminare între elevii buni şi cei slabi.

Deşi analiza itemilor constituie un demers obligatoriu cel puţin în vederea proiectării
mai corecte testelor pentru o secvenţă de evaluare viitoare, ar trebui avute în vedere o serie de
nuanţe privind interpretarea sa (Lin şi Gronlund, 2000; Nitko, 2001):
• Puterea de discriminare a unui item nu oferă informaţii şi despre validitatea acestuia. În
calcularea coeficientului de discriminare se folosesc scorurile de la întregul test pentru a
împărţi grupul se elevi în subgrupuri, adică un criteriu intern şi nu unul extern. O valoarea
adecvată a indicelui de discriminare ilustrează validitatea unui item, doar în cazul în care
validitatea întregului test a fost deja demonstrată. În evaluarea pe care o realizăm la clasă,
rareori ne putem permite să realizăm o analiză de validitate completă şi, de aceea, indicele
de discriminare trebuie interpretat cu precauţie.
• Un indice scăzut al discriminării nu indică întotdeauna un item formulat în completă
eroare. Itemii care nu discriminează între elevii buni şi cei slabi trebuie analizaţi în special
sub aspectul formulării, care poate fi ambiguă, inexactă sau poate induce unor elevi
răspunsul corect. Testele elaborate de profesor pentru utilizarea la clasă sunt proiectate
pentru a măsura comportamente pe mai multe nivele taxonomice (cunoaştere, înţelegere,
aplicare etc). Dacă un test cu 20 de itemi care vizează cunoaşterea şi înţelegerea include
15 itemi pentru nivelul cunoaştere şi 5 itemi pentru nivelul înţelegere, puterea de
discriminare a itemilor care măsoară înţelegerea va fi cu siguranţă mai mică. Un prim
motiv este acela că itemii care vizează înţelegerea sunt mai puţin reprezentaţi în întregul
test, iar un al doilea ar fi slaba corelaţia între itemii care măsoară cunoaşterea şi cei care
măsoară înţelegerea pe care cercetătorii au demonstrat-o anterior (Linn şi Gronlund,
2000). Dacă am exclude aceşti itemi din test, am obţine un test mai omogen, dar
validitatea sa ar scădea pentru că nu am mai surprinde întreaga gamă de comportamente
pe care le-am vizat în activitatea de predare-învăţare.
• Între indicele de dificultate şi indicele de discriminare se stabilesc relaţii complexe care
trebuie avute în vedere în interpretarea lor. Astfel, în principiu, un item cu dificultatea
0,50 (itemul „ideal”) poate avea un indice de discriminare maxim (1), dar această relaţie
între cele două valori ale indicilor nu este garantată. Dacă jumătate dintre elevii din
segmentul superior şi, respectiv, din segmentul inferior ar rezolva corect un item, indicele
de dificultate ar rămâne 0,50, dar valoarea indicelui de discriminare ar fi 0. Cu cât ne
îndepărtăm de valoarea 0,50 a indicelui de dificultate, iar itemii devin fie mai uşori, fie
mai dificili, valoarea indicelui de discriminare scade. Aşadar, itemii cu nivel foarte scăzut
sau foarte ridicat de dificultate au o putere de discriminare redusă. În luarea deciziilor
privind excluderea unor itemi trebuie avute în vedere cel puțin două considerații
importante: pe de o parte, o slabă putere de discriminare poate indica probleme în
formularea clară a cerințelor și nu deficiențe de conținut, iar pe de altă parte, testele
elaborate de către profesor pentru a fi aplicate la clasă nu vizează întotdeauna
discriminarea de finețe între rezultatele elevilor. Astfel, eliminarea itemilor cu putere de
discriminare mică poate influența negativ validitatea testului.
• Analiza de itemi trebuie întotdeauna interpretată cu precauție atunci când se realizează pe
grupuri mici de elevi, cum sunt clasele. În mod evident, rezultatele analizei de itemi sunt
influențate de volumul lotului de elevi cărora li se administrează testul și, de aceea,
rezultatele sale pentru o clasă de elevi trebuie interpretate prudent. Vor fi excluși din test
doar acei itemi care sunt în mod evident prea dificili ori prea facili și care discriminează
negativ, dar fără a interpreta rigid limitele numerice sugerate de specialiști.

4.3.7. Proiectarea testului


Elaborarea unui test docimologic presupune parcurgerea mai multor etape (Evans,
1985; Crocker şi Algina, 1986; Radu, 2000) pe care le vom prezenta detaliat în cele ce
urmează.
A) Stabilirea scopului (diagnostic, pronostic; formativ, sumativ etc.) şi tipului probei
(normativă/criterială; inițială, de progres, finală) determină structura şi conţinutul acesteia.

B) Selectarea obiectivelor şi a conţinuturilor corespunzătoare care vor fi vizate prin intermediul


testului este sintetizată într-un tabel sau matrice de specificaţii (Crocker şi Algina, 1986; Mason şi
Bramble, 1997; Radu, 2000; Stoica, 2001; Gall, Gallşi Borg, 2007). Acest tabel de specificaţii
include pe verticală conţinuturile care vor fi evaluate, iar pe orizontală obiectivele
corespunzătoare, ierarhizate în acord treptele unei taxonomii a domeniului cognnitiv (în cazul
taxonomiei lui Bloom: cunoaştere, comprehensiune, aplicare, analiză, sinteză şi evaluare).
Matricea (tabelul) de specificaţii este prezentată în literatura pedagogică în strânsă
conexiune cu filosofia evaluării prin raportare la obiective (engl. objective-based evaluation),
consituind o veritabilă punte de legătură între obiective, conţinuturi şi evaluare, în calitate de
componente ale curriculumului (Mason şi Bramble, 1997; Gall, Gall şi Borg, 2007). Demersul
de elaborare a matricei de specificaţii constituie una dintre etapele proiectării testului
docimologic, care urmează celei în care se stabileşte tipul de test vizat.
Fără a intra în detalii inutile, prezentăm succint linia de reflecţie care a condus la ideea
necesităţii elaborării matricei de specificaţie, înainte de proiectarea itemilor. Demersul îşi are
orginea în aşa numita abordare Tyler-Bloom a curriculumului (Mason şi Bramble, 1997; Gall,
Gall şi Borg, 2007) care presupune selecţia şi organizarea conţinuturilor în acord cu un set de
obiective de nivel general, care să orienteze activitatea conceptorilor de planuri de
învăţământ, programe şcolare, manuale alternative etc. şi care să fie reflectate în metodele şi
instrumentele de evaluare. Obiectivele de nivel general care orientează activitatea de selecţie
şi organizare a conţinuturilor nu pot constitui repere directe de măsurare a performanţelor
elevilor, de unde şi necesitatea exprimării acestora în termeni de comportamente observabile
şi măsurabile (vezi contribuţia lui B. Bloom în acest sens). Dincolo de argumentele solide
care pot fundamenta utilizarea matricei de specificaţii în proiectarea testelor docimologice, ca
element derivat din contribuţiile lui R. Tyler şi B. Bloom la clarificarea relaţiilor dintre
componentele curriculumului, nu putem ignora inconsistenţa prezentării sale în lucrările
româneşti de teoria evaluării.
Matricea de specificaţii constă într-un tabel cu două intrări care serveşte la proiectarea
şi organizarea itemilor dintr-un test docimologic, în care sunt precizate, pe de o parte,
conţinuturile care vor fi vizate, şi, pe de altă parte, nivelele taxonomice la care se plasează
obiectivele de evaluare (Mason şi Bramble, 1997; Linn şi Gronlund, 2000; Schreerens, Glas şi
Thomas, 2003; Gall, Gall şi Borg, 2007; Stoica, 2001). Câteva precizări se impun în legătură
cu obiectivele de evaluare, insuficient discutate în literatura pedagogică românească. Ele nu
se suprapun perfect peste obiectivele cadru şi de referinţă. În fond curriculum recomandat,
curriculum predat şi curriculum evaluat nu se suprapun perfect! Deşi practicienii pot
considera menţionarea acestora un artificiu inutil, ea este crucială în proiectarea unor teste
docimologice (mai ales a celor sumative) de calitate, în condiţiile în care se operează decupaje
în obiectivele şi conţinuturile avute în vedere.
Liniile matricei de specificaţii includ elementele de conţinut vizate, iar coloanele
se referă la nivelele taxonomice le care vor fi măsurate performanţele elevilor în raport
cu aceste conţinuturi. Cea mai utilizată taxonomie pentru domeniul cognitiv este cea a lui B.
S. Bloom, însă există suficiente alternative prezentate detaliat, inclusiv cu exemple în lucrări
traduse în limba română (vezi lucrările lui V. şi G. De Landsheere, 1979, Definirea
obiectivelor educaţiei, Bucureşti, EDP şi Ausubel, D., Robinson, Fl., 1981, Învăţarea în
şcoală. O introducere în psihologia pedagogică, Bucureşti, E.D.P.). Unii pedagogi recomandă
utilizarea combinată a taxonomiilor, pentru a pune în evidenţă o gamă largă de capacităţi,
abilităţi ale elevului prin aceeaşi probă de evaluare (Stoica, 2001; Schreerens, Glas şi Thomas,
2003).
Celulele tabelului, aflate la intersecţia dintre elementele de conţinut şi nivelele
taxonomice pentru nivelul cognitiv cuprind procentele de itemi (din totalul itemilor
consacraţi întregului test) ce vor fi folosiţi în proiectatea testului. Dacă testul va include
20 itemi, înseamnă că 5% din total, adică 2 itemi, vor fi alocaţi celulei care vizează
terminologia de recunoscut sau de redat din memorie (celulă rezultată din intersectarea
conţinuturilor constând din terminologie, cu nivelul taxonomic achiziţia informaţiei); 30%,
adică 12 itemi, pentru celula vizând rezolvarea de probleme, la nivelul taxonomic analiză
(rezultată din întretăierea rândului conţinuturilor constând din probleme cu coloana
reprezentând analiza) etc.

Conţinuturi/
Achiziţia informaţiei Înţelegere Aplicare Analiză Total
Obiective
Element de conţinut 1 10 (2) - - - 10 (2)
Element de conţinut 2 10 (2) 10 (2) 5 (1) - 25 (5)
Element de conţinut 3 - 10 (2) 25 (5) - 35 (7)
Element de conţinut 4 10(2) 10 (2) - 10 (2) 30 (6)
Total 30 (6) 30 (6) 30 (6) 10 (2) 100 (20)

Pentru a uşura activitatea de elaborare a matricei de specificaţii se poate opta pentru trecerea
în fiecare celulă a numărului de itemi care vor fi proiectaţi (în exemplul de mai sus, numărul
de itemi este notat în paranteză). Atât procentele, cât şi numerele de însumează pe verticală şi
pe orizontală.
În funcţie de scopul şi tipul testului care trebuie proiectat, se poate elabora o matrice
de specificaţii generală sau detaliată (Stoica, 2001).
Matricea de specificaţii generală este utilă în proiectarea testelor sumative care
vizează conţinuturi largi şi obiective cu nivele de complexitate ridicate. Ele specifică unităţi
mari de conţinut şi nivele taxonomice generale (ca în exemplul general sugerat inițial).
Matricea de specificaţii detaliată este recomandată în cazul testelor sumative care
vizează conţinuturi mai restrânse (evaluare la finalul unei unităţi de învăţare, la finalul unui
semestru etc.) şi chiar în cazul testelor formative (care pot viza conţinutul unei singure lecţii
şi, în mod evident, nu pot ţinti decât anumite nivele taxonomice). Ea poate detalia
conţinuturile care vor fi acoperite prin test sau nivelele taxonomice, dar poate include
informaţii amănunţite şi despre ambele dimensiuni.

Exemplu - Matrice de specificaţii pentru un test de evaluare la unitatea de învăţare Adunarea


şi scăderea numerelor naturale, în care sunt detaliate nivelele taxonomice

Cunoaşterea Înţelegere Analiză


Conţinuturi/
Cunoaşterea Cunoşterea Cunoaşterea Aplicare Căutarea Căutarea Total
Obiective Traspunere Extrapolare
terminologiei convenţiilor metodelor elementelor relaţiilor
1. Termeni
10% (2) - - - - - 10% (2)
specifici
2. Relaţii,
5% (1) 5% (1) 10% (2) - 5% (1) - - 25% (5)
transformări
3. Utilizări,
5% (1) 5% (1) 25% (5) - - 35% (7)
aplicaţii
4. Probleme 10% (2) - 10% (2) - 5% (1) 5% (1) 30% (6)
100%
Total 10% (2) 5% (1) 15% (3) 15% (3) 15% (3) 30% (6) 5%(1) 5% (1)
(20)

C) Formularea itemilor constituie cea mai laborioasă etapă a elaborării unui test pedagogic.

D) Stabilirea unei grile de corectare care să includă răspunsurile corecte pentru fiecare item
uşurează considerabil activitatea evaluatorului.

E) Elaborarea baremului de notare sau a modalităţii de calculare a scorurilor va permite


evaluarea precisă şi identică a răspunsurilor formulate de fiecare elev. În cazul itemilor
subiectivi, baremul de corectare include elemente ale răspunsului care vor fi punctate.

Dacă este vorba de teste nestandardizate sau elaborate de profesor, etapa următoare
include aplicarea testului, în timp ce în cazul testelor standardizate această etapă este
pregătită de etapele de pretestare şi de revizuire, reformulare şi definitivare a acestuia. A.
Anastasi (1976, p. 413) indică însă că şi în cazul testelor nestandardizate trebuie realizată o
pretestare care să includă o analiză a itemilor (calcularea coeficientului de dificultate şi a celui
de discriminare, analiza distractorilor).

F) Pretestarea are în vedere verificarea calităţilor globale ale testului (Karmel şi Karmel,
1978; Radu, 2000; Moise, 2007) - obiectivitate, aplicabilitate, fidelitate şi validitate, precum şi
a calităţilor fiecărui item – dificultate şi putere de discriminare, calitatea distractorilor.

G) În ultima etapă de construire a unui test – revizuirea acestuia, o parte dintre itemi sunt fie
reformulaţi, fie eliminaţi în funcţie de rezultatele analizei privind caracteristicile prezentate
anterior. Pentru a fi corect aplicat un test docimologic standardizat, ca şi un test psihologic
trebuie însoţit de un manual de utilizare care să includă toate detaliile tehnice, precum şi
informaţii complete privind administrarea şi maniera de calculare a scorurilor.

Avantajele şi limitele testului în general, şi a celui docimologic, în special, au fost


îndelung dezbătute: în timp ce unii au subliniat faptul că ele constituie mijloace eficiente de
cunoaştere a performanţelor subiecţilor, de selecţie a acestora (atunci când acesta este scopul
aplicării lor) şi poate contribui la luarea deciziei de tratare diferenţiată, alţii au invocat lipsa de
rigoare în elaborarea şi administrarea unora dintre teste. Testele normative au fost adesea
criticate pentru raportarea la rezultatele unui grup de referinţă, care nu întotdeauna este
potrivită (vezi situaţia persoanelor din minorităţi etnice, care vorbesc altă limbă decât cea în
care este administrat testul sau a persoanelor cu dizabilități). Testele care includ prea mulți
itemi obiectivi au fost criticate pentru faptul că evaluează mai degrabă capacitatea de
memorare a subiecţilor, în timp ce testele cu itemi de tip eseu sunt considerate prea subiective.
Valoarea testelor depinde în mare măsură de competenţa celor care le elaborează şi de
pregătirea celor care le aplică şi calculează scorurile, de unde şi nevoia de pregătire riguroasă
a acestora.
Este incontestabilă contribuţia testelor nu doar în reglarea activităţii educaţionale
(elaborarea programelor de recuperare sau accelerare), ci şi în realizarea unor cercetări
educaţionale credibile. În ciuda acestui fapt, testul trebuie utilizat cu precauţie, în condiţiile
respectării tuturor etapelor şi condiţiilor de elaborare, de administrare şi de calculare a
scorurilor.

Temă obligatorie 2
Proiectaţi un test docimologic pentru învățământul primar (proiectat după regulile prezentate
în curs, însoțit de schema de corectare și de notare și de descriptori de perfomanță5).

4.4. Metode alternative (complementare) de verificare


Clasificările metodelor de evaluare pe care le-am invocat într-o secțiune anterioară a
acestui curs, includ între metodele de verificare nu doar pe cele tradiționale (probele orale,
scrise și practice, testul docimologic), ci și metode alternative sau complementare de
verificare. O observație interesantă se impune în legătură cu sintagma evaluare autentică,
pusă adesea în relație cu metodele complementare de verificare: ea este utilizată foarte rar în
literatura de specialitate românească (vezi Stoica, 2003), iar literatura pedagogică
internațională include între metodele de evaluare autentică și probele practice (Gallagher,
1998; Linn și Gronlund, 2000). Evaluarea autentică presupune, de fapt, colectarea de
informații despre achiziții ale elevului demonstrate în situații cât mai aproape de cele din viața
reală și formularea unor aprecieri pe baza acestor date. Mai mult decât atât, de cele mai multe
ori, procesul și nu produsul constituie obiectul evaluării autentice. Conceptul de evaluare
autentică s-a cristalizat pe fondul nemulțumirii actorilor educaționali, în contextul
generalizării standardelor de performanță pentru elevi și a testelor docimologice, care nu oferă
informații suficient de credibile despre achizițiile elevului deoarece surprind comportamente
artificial antrenate în școală.
În contextul pregătirii dvs. pentru cariera didactică în învățământul preșcolar și primar,
cunoașterea metodelor complementare de verificare și formarea competențelor de utilizare
corectă a acestora este deosebit de importantă, având în vedere faptul că evaluarea în
învățământul preșcolar se poate proiecta și realiza mai ales prin aceste metode. Deși nu am
acordat un spațiu extins discuțiilor despre posibilitățile de aplicare a metodelor de verificare
descrise în paginile anterioare în învățământul preșcolar, este de la sine înțeles faptul că
probele scrise sunt rar utilizabile în verificarea achizițiilor preșcolarilor. În forme adaptate la
specificul vârstei, probele orale, probele practice și testul docimologic pot fi utilizate. Testul
docimologic poate fi aplicat fie oral, fie în scris (dacă itemii includ imagini și nu text, iar
instrucțiunile de rezolvare se pot comunica oral).

5
Descriptorii de performanță vor fi descriși în secțiunea destinată notării ca metodă de apreciere a rezultatelor
elevului.
Având în vedere spectrul redus de metode de verificare tradiționale la care se poate
face apel în învățământul preșcolar, metodele complementare pot constitui un suport real în
activitatea evaluativă. Din păcate, acestea nu beneficiază de „tratament egal” în competiția cu
metodele tradiționale de verificare, fiind prezentate în literatură destul de sumar. Acest fapt
conduce la erori în înțelegerea și aplicarea acestor metode, ceea ce se răsfrânge apoi în
activitatea de evaluare din școli și din clase: elevii pregătesc portofolii imprimând diverse
materiale care se pot găsi on-line și nu înțeleg motivele pentru care iau note mai mici decât
alți colegi care, poate, au procedat la fel; părinții fie se implică prea mult în realizarea unui
portofoliu împreună cu copilul lor, fie sunt nemulțumiți de utilizarea acestuia ca metodă de
evaluare; în sfârșit, profesorii nu obțin informații suplimentare privind achizițiile elevului, pe
care nu le pot verifica prin apelul la metode tradiționale, mai puțin costisitoare și cronofage
decât cele complementare.
Așadar, o introducere în utilizarea mai riguroasă a metodelor complementare de
verificare se impune cu necesitate. În acest curs nu vom aborda unele dintre metodele
complementare de verificare (de exemplu, referatul, harta conceptuală, jurnalul reflexiv)
pentru că le considerăm mai puțin aplicabile în învățământul preșcolar și primar, ci ne vom
concentra atenția asupra celor care pot fi utilizate în evaluarea copiilor de vârste mici:
portofoliul, proiectul, investigația, observaţia sistematică a activităţii şi comportamentului
elevului, autoevaluarea şi interevaluarea.

4.4.1. Portofoliul poate fi definit ca o colecție de produse ale activității elevului, care
sunt reunite pentru a documenta fie achiziții ale elevului, fie progresul sau dezvoltarea
acestuia (Gallagher, 1998; Linn și Gronlund, 2000). Realizarea unui portofoliu presupune
stabilirea unui scop clar pentru care sunt colectate lucrări și produse ale elevului.
Scopul pentru care se elaborează portofoliile se poate constitui într-un criteriu general
de clasificare a tipurilor de portofolii care pot fi folosite în școală (Arter, Spandel și Culham,
1995 citați de Linn și Gronlund, 2000). Astfel, portofoliile pot fi instrucționale sau evaluative.
Cu alte cuvinte, putem utiliza portofoliul nu doar ca metodă de evaluare, ci și ca metodă
didactică, pentru a încuraja elevii să se pregătească permanent, dar și pentru a le forma
deprinderile de a selecta cele mai bune lucrări pe care le realizează de-a lungul unei perioade
de timp. Evident, portofoliul instrucțional are o dimensiune evaluativă, dacă avem în vedere
faptul că elevii sunt încurajați să-și autoevalueze activitatea și produsele. Portofoliul de
evaluare poate fi folosit ca produs global al elevului pentru stabilirea unei note și constrânge
la stabilirea unui set bine precizat de produse, lucrări etc. care vor fi realizate de către toți
elevii unei clase, pentru a asigura justețea actului de evaluare și posibilitatea de a compara
achizițiile demonstrate de fiecare elev. Această metodă complementară poate fi folosită atât în
evaluarea continuă, formativă, cât și în evaluarea sumativă, cu precizarea că utilizarea sa în
evaluarea formativă nu trebuie să se finalizeze în mod obligatoriu prin notă. Portofoliile
pregătite în contextul evaluării formative pot fi considerate oportunități pentru feedbackul
continuu atât de necesar profesorului și elevului, dar și pentru încurajarea autoevaluării la
elev.
Literatura pedagogică internațională descrie și alte modalități de clasificare a
portofoliilor (Gallagher, 1998; Linn și Gronlund, 2000):
• Portofoliile pot include produse ale activității elevului care să ilustreze achizițiile elevului
la un moment dat, dar poate fi utilizat și cu scopul de a analiza progresul sau devoltarea
elevului. Portofoliul de achiziții al elevului se poate realiza într-o perioadă de timp relativ
scurtă și include doar lucrări sau produse finalizate, care pot fi apreciate global printr-o
notă. Prin contrast, portofoliul de progres sau de dezvoltare poate include și lucrări sau
produse neterminate de către elev și chiar mai multe versiuni ale acelaiași lucrări care să
pună în lumină evoluția într-o perioadă mai lungă de timp. Portoliul de progres poate fi
proiectat pentru un întreg ciclu de învățământ și poate însoți copilul pe parcursul mai
multor ani, astfel încât profesorii să poată avea informații despre achizițiile anterioare ale
acestuia. În plus, portofoliul de progres poate constitui o modalitate eficientă de a
comunica părinților puntele tari și punctele slabe ale copilului și de a stimula implicarea
familiei în viața educațională a copilului.
• Portofoliul poate reuni cele mai bune lucrări ale elevului (așa-numitul portofoliu de
prezentare), dar poate avea și rolul de a documenta achizițiile elevului (portofoliul de
documentare). Portofoliul de prezentare îl are ca actor principal pe elev, care alege singur
sau sprijinit de colegi și profesor, cele mai bune lucrări ale sale pentru a ilustra nivelul
achizițiilor sale. Portofoliul de documentare are ca actor principal profesorul, care
selectează lucrări și produse ale activității elevului pe care le consideră importante pentru
a contura volumul și profunzimea achizițiilor.
• Portofoliul finalizat include doar lucrări și produse terminate, gata pentru a fi prezentate
unui public-țintă (gândiți-vă la portofoliul de angajare sau la portofoliul de lucrări necesar
pentru admiterea în învățământul superior artistic), în timp de portofoliul de lucru
documentează activitatea zilnică fiind util mai ales pentru evaluarea formativă. Portofoliul
de lucru este deschis și permite reveniri, corecturi, îmbunătățiri sau chiar înlocuirea
completă a unor piese.
• Portfoliul individual include lucrări ale unei singure persoane, în timp ce portofoliul
colectiv reunește lucrări realizate în grup, prin cooperare între două sau mai multe
persoane.
În învățământul preșcolar și primar românesc portofoliile nu sunt o noutate absolută:
cadrele didactice au alcătuit dintotdeauna mai ales portofolii de dezvoltare sau de progres
pentru elevi sau pentru întreaga clasă, fără a le asocia însă cu termenologia vehiculată în
prezent în teoria evaluării. Confuziile, nemulțumirile și erorile în utilizarea portofoliilor survin
mai ales ca urmare a lipsei de preoucupare pentru stabilirea unui scop clar pentru care acestea
sunt elaborate. Scopul și tipul portofoliului determină structura acestuia și posibilitățile de
utilizare pentru aprecierea prin notă.

Temă de reflecție
Încercați să rememorați 2-3 situații educaționale în care au fost utilizate portofolii. În ce
categorie din tipologia de mai sus ați putea încadra acele portofolii?

Repere în utilizarea portofoliului de evaluare. Pentru a folosi portofoliul în scop


evaluativ, trebuie să conferim acestuia o notă de rigoare pentru a nu se putea pune la îndoială
deciziile exprimate de profesor prin notă. Pentru a acoperi acest deziderat trebuie să
parcurgem o serie de pași sau etape în proiectarea și realizarea evaluării pe bază de portofoliu
(Gallagher, 1998; Linn și Gronlund, 2000):
a) Scopul pentru care se solicită elevilor să realizeze un portofoliu trebuie articulat cu
maximă claritate, astfel încât să indice cu suficientă precizie ce lucrări sau produse ale
activității elevului vor fi selectate, cine le va selecta, cine va contribui la realizarea lor. Sunt
necesare precizări cu privire la eventuala implicare a părinților, dacă o parte dintre piesele
prevăzute pentru portofoliu se realizează sau se finalizează acasă, după cum există și
posibilitatea ca una sau mai multe piese ale portofoliului să se realizeze în grup și nu
individual. În cazul în care portofoliul va fi analizat și apreciat prin notă, este preferabil să se
utilizeze portofolii individuale, iar elevii să fie informați cu privire la toate regulile de
elaborare.
În acestă etapă a proiectării evaluării prin portofoliu trebuie stabilite și piesele care
sunt solicitate și intervalul de timp pe care elevul îl are la dispoziție pentru a le realiza. De
asemenea, toți factorii educaționali (în special părinții și familiile) trebuie informați în
legătură cu aceste detalii, pentru ca intervenția lor să nu interfereze cu scopul evaluativ al
portofoliului.
b) Obiectivele educaționale care vor fi avute în vedere în contextul evaluării prin
portfoliu, precum și conținuturile care vor fi acoperite trebuie clar precizate pentru a
fundamenta stabilirea lucrărilor, a pieselor care vor fi realizate de către elevi. Ca în orice altă
situație de evaluare, utilizarea portfoliului nu se reduce la un artificiu didactic, ci trebuie să se
raporteze la criterii clare, care, în cazul activității educaționale sunt reprezentate de obiective.
Obiectivele sunt întodeauna corelate cu un set de conținuturi, care vor fi vizate în evaluare.
c) Profesorul trebuie să precizeze care sunt piesele obligatorii (compuneri, desene,
imagini, fotografii, rezumate etc.) care vor fi incluse în portofoliu. Un cadru didactic nu poate
folosi corect portofoliul de evaluare dacă nu precizează ce așteaptă de la elevi și dacă nu
clarifică și pentru sine ce criterii de corectare va folosi pentru fiecare piesă inclusă în
portofoliu. Chiar și portfoliile de progres sau de devoltare trebuie însoțite de aceste precizări,
pentru a crește rigoarea și obiectivitatea evaluării.

Exemplu. Să presupunem că dorim să utilizăm portofoliul pentru evaluarea sumativă


(semestrială) la Limba și Literatura română în învățământul primar, pentru elevii unei clase a
III-a. În acest sens, propunem elevilor realizarea unui portofoliu individual (fără contribuții
directe sau indirecte ale părinților, familiei, colegilor) în care trebuie să includă:
• O compunere de maxim 2 pagini pe tema Duminica în parc.
• Trei fișe de lectură pentru trei povestiri scrise de autorii cu care elevii fac cunoștință
prin intermediul textelor din manual (fiecare fișă de lectură trebuie să aibă minumum o
pagină).
• O scurtă biografie a unui autor despre care elevii vor învăța în acel semestru (o
fotografie însoțită de o jumătate de pagină cu informații biografice).
• O analiză gramaticală a unui text dat, în care elevul să utilizeze toate elementele de
gramatică parcurse anterior (textul poate fi diferit pentru fiecare elev, dar sarcinile
trebuie alese în așa fel încât să fie comparabile).

Pentru fiecare dintre aceste patru piese, profesorul trebuie să stabilească o schemă de
corectare și de notare, iar portofoliul în ansamblu trebuie prevăzut cu o schemă generală de
notare. Schema generală de notare a pieselor din portfoliu presupune o analiză a sarcinilor din
punct de vedere al complexității și al volumului de conținuturi acoperite, dar și o estimare a
efortului pe care elevul trebuie să-l depună. Punctajele acordate pentru fiecare piesă pot fi
diferențiate, printr-o asemenea analiză minimală, astfel încât elevul să se poată orienta în
activitatea de realizare a portofoliului.
Dacă avem în vedere același exemplu, schema generală de notare pentru portfoliul
nostru ar putea fi:

Piesa din portofoliu Punctaj


Compunerea 30 puncte
Trei fișe de lectură pentru trei povestiri 30 puncte
O scurtă biografie a unui scriitor 10 puncte
O analiză gramaticală a unui text dat 30 puncte
Puncte din oficiu 10 puncte
Total 100 puncte

Deoarece punctajele nu sunt note care pot fi consemnate în catalog, profesorul trebuie
să stabilească și corespondanța între punctajele ce vor fi obținute de elevi și sistemul de notare
utilizat. În cazul învățământului primar românesc, sistemul de notare constă în calificative –
foarte bine, bine, suficient și insuficient. Iată cum am putea ilustra corespondența punctaj –
calificative pentru exemplul nostru:

Calificativ Punctaj
Foarte bine 86-100 puncte
Bine 61-85 puncte
Suficient 41-60 puncte
Insuficient 10-40 puncte

Așadar, dacă un elev va obține 82 de puncte pentru portofoliu, va primi calificativul bine.
Observați că stabilirea limitelor superioare și inferioare ale punctajelor se face ca în cazul
intervalelor din analiza de frecvențe grupate, fără a repeta limita superioară a unui interval de
puncte ca limită inferioară a intervalului următor.
De asemenea, pentru fiecare piesă prevăzută a fi inclusă în portofoliu, trebuie
construită o schemă de corectare și de notare, dar modalitățile de elaborare ale acesteia vor fi
detaliate în secțiunea din curs destinată notării, ca metodă de apreciere.

d) Profesorul trebuie să monitorizeze procesul de realizare a portfoliului și să ofere


feedback elevului pe parcursul pregătirii. Dacă prin regulile stabilite inițial, la anunțarea
portofoliului, se stabilește și faptul că elevul poate reface una sau mai multe piese după ce
primește feedback de la profesor, acest lucru trebuie urmărit și înregistrat.
e) Portofoliul poate fi utilizat în complementaritate cu alte metode alternative de
evaluare, cum ar fi observația sistematică a activității și comportamentului elevului, proiectul,
investigația etc. Acest lucru trebuie precizat și anunțat de la începutul activității de pregătire a
portofoliilor. Dacă s-a optat pentru observarea sistematică a elevului, profesorul trebuie să se
asigure că are suficient timp pentru a prelucra și pentru a înregistra informațiile de care are
nevoie.
f) Evaluarea propriu-zisă a portofoliului se realizează prin aplicarea schemei de corectare
și de notare elaborată de profesor într-o etapă anterioară și presupune asamblarea rezultatelor
pentru fiecare piesă din portofoliu într-un punctaj, respectiv calificativ global.

Dacă nu se respectă aceste repere, crește riscul ca factorii perturbatori să afecteze


aprecierea performanțelor elevului, iar portfoliul ca metodă de evaluare să-și piardă
credibilitatea. Dacă elevii au libertatea de a include ce doresc într-un portofoliu crește și riscul
de a aprecia accesul la resurse al elevilor și nu achizițiile sau rezultatele acestuia. Elevii care
provin din familii cu statut socio-economic scăzut, cu acces restrâns la resurse de
documentare, pot prezenta portofolii nesatisfăcătoare tocmai datorită situației dezavantajante.
De aceea, se recomandă stabilirea unei structuri clare a portofoliului, aplicabilă pentru toți
elevii, precum și o schemă de corectare și de notare riguroasă.
Portofoliul are o serie de avantaje care îl delimitează de alte metode de verificare, fie
tradiționale, fie complementare (Gallagher, 1998; Linn și Gronlund, 2000):
• În primul rând, portofoliul ca metodă de evaluare poate fi asociat cu tendințele de a-l plasa
pe elev în centrul activității educaționale și cu nevoia de întrepătrundere a activităților de
predare, învățare și evaluare. De asemenea, poate contribui la dezvoltarea competențelor
de autoevaluare ale elevului.
• Portfoliile de dezvoltare sunt extrem de importante în a documenta progresul copilului și
în a-i informa pe părinți și pe profesori cu privire la evoluția acestuia. El oferă și
posibilitatea de a regândi activitățile educaționale prin prisma nivelului de achiziții al
copilului, creionând o imagine realistă a punctelor tari și slabe.
• Prin varietatea pieselor ce pot fi incluse în portofolii, profesorul se poate asigura că fiecare
elev poate demonstra că deține achizițiile minime necesare pentru a trece în următoarea
etapă de pregătire. Cu alte cuvinte, chiar și pentru cei mai slabi dintre elevi se poate crea
oportunitatea exprimării acelor achiziții pentru care poate fi valorizat.
• Dacă este folosit în forma sa colectivă, portofoliul poate contribui la formarea
deprinderilor de lucru în echipă, a abilităților de dialog și de negociere.
• Portfoliul se poate combina cu alte metode de verificare, inclusiv cele tradiționale, oferind
astfel informații complexe despre achizițiile elevului.
Ca toate celelalte metode de verificare, portofoliul are o serie de limite pe care
profesorul trebuie să le conștientizeze atunci când optează pentru o strategie de evaluare:
• Portofoliile se numără printre cele mai cronofage și energofage metode de verificare. De
aceea, volumul portofoliului și efortul de elaborare din partea elevului și de evaluare din
partea profesorului trebuie atent cântărite.
• Fidelitatea evaluării prin portofoliu este în mare suferință, mai ales atunci când sarcinile
sunt neclar stucturate, iar criteriile de corectare și de notare sunt vagi. Pe de altă parte,
structurarea rigidă a portofoliului și a criteriilor de evaluare poate submina validitatea
acestuia, mai ales dacă scopul utilizării sale este formarea abilităților de autoevaluare la
elev, prin alegerea pieselor celor mai potrivite.
• Există și un risc major de erori grave în utilizarea portfoliului determinat de naivitatea
profesorilor și a elevilor, care pleacă de la premisa că acesta poate fi realizat, asamblat cu
mare ușurință. Colecțiile dezordonate de lucrări și produse ale elevului nu pot fi numite
portofolii, de unde și nevoia de rigoare în proiectarea și realizarea evaluării prin
portofoliu.
• Utilizarea portofoliului în evaluarea școlară nu reprezintă o noutate, însă cercetarea
educațională pe teme corelate este relativ sumară. Profesorii trebuie să conștientizeze
avantajele și limitele portofoliului, dar și să se informeze asupra noutăților cu privire la
alternativele în evaluare.

Aplicații
a. Descrieți piesele care ar putea fi incluse într-un portofoliu de dezvoltare sau de progres al
unui preșcolar, elaborat pentru a-i informa pe părinți și, ulterior pe profesorul pentru
învățământ primar/învățător cu privire la evoluția copilului.
c. Exemplificați structura și schema generală de notare a unui portofoliu pentru disciplina
Științe (învățământ primar).
d. Reflectați la structura unui portofoliu de evaluare sumativă pentru absolvenții de
învățământ superior care doresc să obțină certificarea de formare inițială pentru cariera
didactică. Ce piese ar putea include un asemenea portofoliu?

4.4.1. Proiectul este o metodă de verificare complexă, care presupune realizarea de


către elev a unui model, a unui obiect funcțional, a unui raport, a unei colecții de materiale
diverse etc., prin apelul de cunoștințe, deprinderi, abilități variate. De regulă, proiectul
presupune stabilirea unei perioade timp pentru elaborare, de la câteva zile la câteva săptămâni.
În funcție de obiectivele și de conținuturile vizate proiectele pot fi individuale,
colective și combinate (Nitko, 2001). Proiectele individuale sunt cele mai indicate pentru
evaluări sumative încheiate prin notare și presupun activarea unui set de cunoștințe, deprinderi
etc. complexe pentru realizarea unui produs final care trebuie să fie prezentat în fața clasei.
Dacă proiectul constă, de exemplu, în realizarea unei machete a școlii ideale (clădire,
arhitectură, organizarea spațiilor etc.), elevul trebuie să activeze cunoștințe și deprinderi
complexe, de factura transdiciplinară. De regulă, proiectele antrenează și creativitatea, spiritul
critic sau simțul estetic al elevului.
Pentru a fi credibile ca metode de verificare, proiectele individuale trebuie să respecte
o serie de condiții: a) obiectivele educaționale vizate trebuie să fie clare atât pentru profesor,
cât și pentru elevi; b) fiecare elev trebuie să lucreze constant pentru finalizarea proiectului; c)
elevii trebuie să aibă acces egal la resurse de documentare și resurse materiale necesare în
realizarea proiectului; d) profesorul trebuie să fie conștient de posibilele erori pe care le poate
face în aprecierea proiectelor realizate de elevi. De asemenea, proiectele care presupun doar
activitate de documentare și redactare a unui text trebuie alternate cu acelea care stimulează
realizarea de produse originale de către elev. Ca și în cazul portfoliului, se recomandă
proiectarea unei scheme detaliate de notare, care să aibă în vedere toți pașii pe care elevii
trebuie să-i parcurgă în realizarea proiectului, precum și ponderea acestora în nota finală.
Proiectele de grup sau colective (doi sau mai mulți elevi pregătesc același proiect) se
folosesc în evaluare doar atunci când vizăm deprinderile de lucru în echipă și, de regulă, nu
se încheie prin notare decât dacă se poate documenta cu suficientă precizie contribuția fiecărui
membru al grupului la realizarea produsului final.
Proiectele combinate presupun alternarea sarcinilor individuale și a celor de grup în
realizarea unui produs final.
Pentru a asigura un minim de rigoare în realizarea proiectelor, profesorul trebuie să
aibă în vedere și următoarele aspecte: a) elevii trebuie monitorizați în permanență, pentru a se
asigura progresul continuu; b) profesorul trebuie să acorde sprijin individual sau fiecărui grup
în surmontarea eventualelor dificultăți de parcurs în realizarea proiectelor; c) elevii trebuie să
prezinte periodic un raport asupra stadiului proiectului; d) obiectivele, termenele de finalizare
și schema de notare a proiectelor trebuie să fie foarte clare atât pentru profesor, cât și pentru
elevi.
Printre avantajele proiectului ca metodă de evaluare se numără posibilitatea de a
evalua cunoștințe, capacități, depinderi etc. complexe în situații cât mai apropriate de cele
reale, stimularea elevului pentru studiu și activitate independentă sau pentru colaborarea cu
alți colegi, creșterea motivației pentru învățare prin stabilirea unor sarcini atractive,
dezvoltarea creativității și a spiritului critic. Ca și în cazul portofoliului, dezavantajele
proiectului sunt generate de lipsa de atenție pentru proiectarea activităților asociate, de la
stabilirea vagă a obiectivelor, până la neclarități asupra schemei de notare. Deși pot furniza
informații importante despre achizițiile elevului, proiectele pot fi un eșec dacă profesorul nu
acordă suficientă atenție proiectării sale. În lipsa unei planificări riguroase, notarea proiectelor
individuale este mai vulnerabilă în față factorilor perturbatori decât alte metode de verificare.

4.4.3. Investigaţia poate consta în experimente sau aplicații de mică amploare pe care
elevii trebuie să le planifice, să le realizeze, să le interpreteze și să le comunice adecvat. În
ciuda percepției comune care plasează investigația în sfera științelor, se pot imagina asemenea
situații evaluative și în cadrul științelor socio-umane. De exemplu, elevii dintr-o clasă a IV-a
ar putea fi solicitați să răspundă la întrebarea “Ce cred școlarii mici despre programele after-
school?” printr-un mic sondaj de opinie în rândul colegilor din școală. Ca și proiectul,
investigația se poate realiza fie individual, fie în grup, dar spre deosebire de acesta și de
portofoliu nu este recomandat pentru evaluări sumative care să se finalizeze prin notare.
Investigația este o metodă de verificare potrivită pentru evaluarea formativă, pentru că are
avantajul de a putea fi concepută în condiții naturale sau în condiții de laborator, pentru mai
toate disciplinele de învățământ și permite profesorului să surprindă atât volumul de
cunoștințe asimilat, cât și nivelul altor achiziții de tipul deprinderilor, atitudinilor etc.
Pentru a fi o sursă credibilă de informații pentru profesor, investigația trebuie
proiectată astfel încât să se respecte următoarele recomandări (Nitko, 2001): a) investigația
trebuie precedată de o conversație în care elevii, asistați de profesor, să formuleze ipoteze,
predicții privind fenomenul studiat și să stabilească modalitățile concrete prin care vor aduna
informații; b) elevii trebuie monitorizați pe tot parcursul procesului de colectare a
informațiilor relevante, dar și atunci când analizează și pregătesc un mic raport asupra
investigației; c) investigația se încheie prin prezentarea rezultatelor de către elevi, dar și prin
formularea unor concluzii pe baza datelor colectate; d) profesorul oferă elevilor feedback
privind modalitățile de colectare a datelor și concluziile formulate, sugerând care au fost
eventualele surse de erori.

Temă de reflecție
Exemplificați utilizarea investigației ca metodă de evaluare în învățământul preșcolar și
primar.

4.4.4. Observarea sistematică a activității și a comportamentului elevului constă în


înregistrarea unor date relevante sau considerate importante de către profesori cu privire la
achiziții sau reacții ale elevului care nu se pot măsura, investiga cu ușurință prin alte metode
de evaluare. Această metodă complementară de evaluare se poate realiza prin apelul la trei
tipuri de instrumente, care se diferențiază între ele prin natura observațiilor și prin gradul de
structurare al acestora: fișa de evaluare (engl. anectodal record), lista de control (engl.
checklist) și scala de clasificare (engl. rating scale) (Gallagher, 1998; Linn și Gronlund, 2000;
Nitko, 2001).
Fișa de evaluare este un instrument observațional simplu, care presupune înregistrarea de
către profesor a unor incidente, evenimente sau comportamente considerante relevante, sub forma
unor descrieri factuale care trebuie realizate la scurt timp după consumarea situației prezentate.
Pentru a putea fi utilizate ulterior, fișele de evaluare trebuie să includă observații despre locul și
data la care s-a înregistrat evenimentul observat, clasa și numele elevului (ca în exemplul de mai
jos).

Clasa______________ Numele elevului_______________________


Data ______________ Locul (în clasă, în curtea școlii)___________
Incidentul / evenimentul observat
…………………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………………
…………………………………………………………
Interpretare
…………………………………………………………………………………………………………………………
………………………………………………………………………………
Literatura pedagogică subliniază faptul că utilizarea fișelor de evaluare se recomandă mai
ales în situațiile în care vizăm relațiile sociale din clasa de elevi, caracteristicile personale ale
elevilor sau dificultăți de învățare care nu pot fi detactate prin intermediul altor metode. Fișa de
evaluare constă, practic, în consemnarea unor observații spontane, realizate în mediul natural al
subiecților (dacă școala poate fi considerată un mediu natural pentru elevi și profesori).
Observațiile trebuie să respecte regulile metodei de cercetare cu care v-ați familiarizat în
semestrul trecut, în sensul că profesorul trebuie să vizeze un număr rezonabil de comportamente și
de elevi. Fișa de evaluare este întotdeauna individuală, iar relatarea cât mai fidelă a evenimentului
sau a comportamentului trebuie să se distingă de interpretarea pe care o generează profesorul.
Fișa de evaluare este utilă în special în învățământul preșcolar, dar poate fi folosită și în
cazul școlarilor mici. Pe baza observațiilor colectate de-a lungul unui interval mai lung de timp,
profesorul poate genera un raport mai vast, care poate constitui fundamentul proiectării unor
măsuri educaționale adecvate (activități de recuperare sau accelerare, remediale etc.), dar și o
modalitate mai structurată de a prezenta părinților și familiei nivelul de achiziții al copilului. Mai
mult decât atât, fișele de evaluare sunt recomandate în învățământul preprimar nu doar datorită
posibilităților limitate de comunicare în scris specifice vârstei copiilor, ci și pentru că preșcolarii
sunt mai spontani iar comportamentele lor sunt mai ușor de interpretat într-un context dat.
Cel mai important avantaj al fișelor de evaluare este acela că includ informații cu privire
la comportamente reale ale copilului, care au loc în situații naturale oferind astfel și posibilitatea
de a verifica rezultatele elevilor așa cum au fost anterior evaluate prin alte metode. De exemplu,
un preșcolar poate defini în termeni proprii ce este prietenia, poate spune cât de importanți sunt
prietenii etc. într-o evaluare orală, dar comportamentul său egocentric îi îndepărtează pe colegii de
grupă și conduce la izolarea sa socială. În plus, fișele de evaluare pot fi mărturii ale unor
comportamente excepționale (în sensul că sunt singulare, izolate), care pot constituie puncte de
plecare în luarea unor decizii educaționale ulterioare. Exemplele clasice în acest sens sunt copiii
apatici care manifestă brusc interes pentru un anumit tip de sarcină, copiii conformiști care rezolvă
în manieră originală o sarcină, copiii cu un comportament în general ostil care fac gesturi de
prietenie față de un coleg etc. Nici unul dintre aceste exemple de comportamente nu poate fi
surprins prin alte metode sau instrumente de evaluare.
Cea mai importantă limită a fișelor de evaluare derivă din consumul mare de timp pentru
completarea formularelor de înregistrare a datelor semnificative. Profesorul trebuie să stabilească
o limită maximă realistă de fișe de evaluare care pot fi completate într-o zi, într-o săptămână etc.
și trebuie să aloce timp suplimentar pentru analiza și interpretarea comportamentelor observate
într-un interval mai lung de timp, pe care care îl consideră semnificativ.
Un alt dezavantaj rezidă în subiectivitatea informațiilor înregistrate. În mod ideal, ar trebui
ca profesorul să noteze întocmai un comportament observat la un elev și apoi să încerce
interpretarea acestuia. În realitatea, observațiile noastre sunt întotdeauna marcate de convingeri,
percepții, stereotipuri pe care nu întodeauna le putem controla. Un comportament atip al unui
copil poate trece cu ușurință neobservat, pentru că nu se potrivește cu imaginea noastră despre
acel copil. O dificultate corelată cu subiectivitatea profesorului în înregistrarea evenimentelor
semnificative este obținerea unui set de observații relevant pentru a descrie comportamentul unui
copil. Un copil timorat și anxios în timpul activităților didactice se poate manifesta zgomotos în
pauze sau în timpul jocurilor în aer liber. Plecând de la asemenea exemple, profesorul trebuie să
identifice un interval de timp și o paletă variată de situații care să îi permită o interpretare cât mai
aproape de adevăr a comportamentului unui copil.
Pentru a optimiza utilizarea fișelor de evaluare, profesorul poate avea în vedere
următoarele recomandări: a) circumscrierea comportamentelor care vor fi observate, dar păstrarea
unei anumite deschideri în privința comportamentelor neașteptate și atipice; b) analiza fișelor de
evaluare prin prisma eventualelor prejudecăți, stereotipuri care le-ar putea afecta conținutul
(eventual, cu ajutorul unui coleg); c) înregistrarea unei cantități suficiente de informații pentru a
putea genera concluzii pertinente privind comportamentul unui copil; d) completarea fișelor de
evaluare la cel mai scurt timp posibil după observarea comportamentului, a evenimentului; e)
înregistrarea în rubrici distincte a descrierilor factuale și a posibilelor interpretări; f) fișele de
evaluare trebuie să includă atât comportamentele, evenimentele pozitive, cât și exemplele
negative; g) profesorul trebuie să stabilească care este volumul rezonabil de informații colectate
pe baza fișelor de evaluare care îi va permite să genereze concluzii și recomandări; h) completarea
cu acuratețe a fișelor de evaluare necesită antrenament îndelungat și, de aceea, se recomandă
exerciții care să îl formeze pe profesor în calitate de observator.

Lista de control este un instrument observațional pe baza căruia comportamentul unui


copil poate fi evaluat ca adecvat sau inadecvat, pozitiv sau negativ, prezent sau asent. O listă de
control include două secțiuni: o secțiune în care sunt prezentate comportamentele ce urmează a fi
observate și o secțiune în care se notează dacă acel comportament este adecvat sau inadecvat,
absent sau prezent etc. În general, comportamentele ce trebuie observate sunt precizate succint, în
cuvinte cheie pentru a minimaliza timpul necesar citirii acestora și a maximiza timpul destinat
observației propriu-zise (vezi exemplul de mai jos, în care sunt prezentate comportamente ce ar
putea fi observate în timpul activitățillor în grup). Există și posibilitatea de a introduce alte
coloane în structura listei de control cum ar fi cea destinată notării faptului că un comportament
nu a putut fi observat sau cea destinată eventualelor comentarii ale profesorului.

Exemplu de listă de control


Nr. Comportamentul vizat Prezent Absent Comentarii/observații
1 Comunică cu ceilalți membri ai grupului
2 Manifestă tendința de a monopoliza discuțiile din grup
3 Îi contrazice în permanență pe ceilalți membri ai grupului
4 Nu colaborează cu ceilalți membri ai grupului

Lista de control poate fi însoțită și de un spațiu în care să se totalizeze punctajul obținut de


către fiecare copil, deși acesta nu este întodeauna relevant. Trebuie să menționăm însă faptul că
lista de control poate fi utilizată și pentru a evalua produse ale activității elevului de tipul
desenelor, machetelor, modelajelor etc. În acest caz, se recomandă folosirea unui sistem de
calculare a scorurilor (de regulă, se notează cu 1 calitățile și cu 0 erorile sau omisiunile în
realizarea produsului). Mai mult decât atât, lista de control poate fi un instrument util în cazul în
care dorim să evaluăm nu doar produsul activității unui copil, ci și procesul de realizare a acestuia.
Reflectați la o activitate de modelaj, care nu se încheie doar cu produse reușite. Cu toate acestea
procesul de realizare a produsului final îi poate plasa pe unii dintre copiii care nu au reușit să
finalizeze produsul sau care au obținut produse incomplete ori inestetice în categoria celor
motivați prin evaluare să încerce mai mult la următoarea sarcină de lucru similară.
Avantajul listei de control constă tocmai în posibilitatea de a înregistra și elemente ale
procesului de învățare sau de realizare a unei lucrări. Cel mai adesea, este preferată scalei de
clasificare pentru că este mai ușor de urmărit și permite colectarea unui volum mare de informații
în același interval de timp.
Limitele acestei metode de verificare sunt similare cu cele descrise în cazul fișelor de
evaluare: este cronofagă, necesită atenție și pregătire prealabilă din partea profesorului, iar
rezultatele sunt sensibile la variabilitatea factorilor subiectivi ai evaluatorului. În plus, în ciuda
aparențelor de mai mare acuratețe, nici listele de control nu permit discriminări fine între copii, pe
baza eventualelor punctaje totale calculate.

Scara de clasificare nu este nimic altceva decât o listă de control în care


comportamentele sau produsele activității sunt evaluate utilizând o scală cu un număr variabil de
trepte (de obicei, se utilizează o scală Likert în cinci trepte, dar se poate opta și pentru alte
variante). Ea se aplică atunci când evaluatorul vizează obținerea unor informații mai complexe
despre comportamente sau produse ale copiilor (vezi exemplul de mai jos, care este o adaptare a
listei de control din exemplul anterior).
Exemplu de scară de clasificare
Nr. Comportamentul vizat Întodeauna Foarte des Rar Foarte rar Niciodată
1 Comunică cu ceilalți membri ai grupului
2 Manifestă tendința de a monopoliza
discuțiile din grup
3 Îi contrazice în permanență pe ceilalți
membri ai grupului
4 Nu colaborează cu ceilalți membri ai
grupului

Folosirea numerelor sau a variantelor de răspuns le conferă un aer de acuratețe, dar acest
lucru nu este întotdeauna adevărat. De exemplu, deși nu există recomandări explicite privind un
număr maxim de trepte ce pot fi incluse într-o scară de clasificare, dacă acestea sunt mai multe de
șapte orice evaluator va avea dificultăți. Scara de clasificare are aceleași limite ca cele identificate
pentru lista de control, dar între avantaje câștigă unul suplimentar: permite documentarea
progresului unui elev, în cazul în care se aplică în mod repetat.

Aplicație
Proiectați o listă de control și o scară de clasificare pe care să le puteți utiliza în evaluarea
comportamentelor creative ale preșcolarilor.

4.4.5. Autoevaluarea și interevaluarea


Deși în mod tradițional profesorul era privit ca unic evaluator al elevului, indiferent
dacă era vorba despre evaluarea rezultatelor școlare, a comportamentelor sociale, a
atitudinilor, a intereselor, a motivației pentru învățare etc., literatura pedagogică românească
și internațională a accentuat în ultimele decenii pregătirea elevului pentru viața independentă
de adult, încă de la cele mai mic vârste, prin trasformarea sa în evaluator (Radu, 1981;
Gallagher, 1998; Linn și Gronlund, 2000; Nitko, 2001). Opțiunea pentru încurajarea
autoevaluării și interevaluării se înscrie în tendințele de modificare a atmosferei educaționale
din clase dinspre individualism și competiție către cooperare, situație în care și rolul
profesorului cunoaște transformări. Autoreglarea activităților de învățare și dezvoltarea
deprinderilor metacognitive consitutie deziderate ale educației contemporane, fără nici o urmă
de îndoială. În acest context, autoevaluarea și interevaluarea capătă valențe noi, fiind
determinante în formarea pentru viața de adult, capabil să-și analizeze și să-și gestioneze
propriile resurse de învățare.
Dacă profesorul nu are în registrul său didactic suficient tact pentru a controla
situațiile de auto și interevaluare sau dacă relațiile sociale din clasă (profesor-elevi, elevi-
elevi) nu sunt bazate pe încredere reciprocă, aceste metode nu sunt recomandate pentru că pot
genera experiențe academice și emoționale negative. Pedagogii au formulat o serie de
recomandări pentru profesorii care decid să utilizeze aceste metode de evaluare (Gallagher,
1998, pp. 272-274):
a) Interevaluarea nu ar trebuie folosită niciodată ca unic element în luarea deciziilor privind
notarea, deoarece o asemenea decizie poate conduce la dezechilibre în clasă. Ea se poate
folosi pentru a-i antrena pe levi ca evaluatori și pentru a încuraja onestitatea și tactul în
exprimarea opiniilor. Notarea este o responsabilitate a profesorului și nu ar trebui să apese pe
umerii elevilor. Feedbackul între elevi este benefic, dar acesta nu trebuie să constituie unicul
reper în notare.
b) Interevaluarea are succes mai ales în clasele în care se stimulează spiritul de cooperare, în
detrimentul competiției bazate pe performanțe individuale.
c) Orice opinie evaluativă, indiferent de evaluator trebuie să fie privită ca un îndemn către
îmbunătățirea performanțelor, nu ca o critică lipsită de sens. Elevii trebuie să fie asistați în
procesul de stabilire a unor obiective personale realiste, care să îi ajute să progreseze.
d) Evaluarea trebuie să se concentreze asupra peformanțelor sau produselor elevului, nu
asupra persoanei.
e) Interevaluarea trebuie să aibă o structură clară: în primă instanță trebuie să fie menționate
punctele tari din prestația unui coleg de clasă, apoi punctele slabe însoțite de recomandări.
Dacă se începe cu aspectele pozitive ale unei performanțe sau ale unui produs, feedbackul va
fi întotdeauna receptat ca fiind binevoitor.
f) Ori de câte ori este posibil, autoevaluarea și interevaluarea trebuie să se realizeze pe baza
unor criterii clare, precizate de către profesor. În acest sens, se recomandă familiarizarea
elevilor cu listele de control și scările de clasificare, care pot constitui instrumente utile în
autoevaluare și interevaluare.
g) Dacă intenționați să utilizați aceste metode la clasă, începeți întodeauna cu deprinderea
strategiilor de autoevaluare și abia apoi introduceți interevaluarea. Elevii care sunt capabili să
își aprecieze realist propriile performanțe și produse ale activității sunt mai credibili ca
evaluatori ai colegilor și sunt capabili de mai multă acuratețe în aprecieri.
Literatura românească menționează printre tehnicile ce pot fi utilizate în autoevaluare
scările de clasificare și chestionarele (Stoica et al., 2001). Scările de clasificare au fost deja
prezentate și evident, se pot utiliza și listele de control care au o structură și mai simplă. În
ceea ce privește chestionarele, autorii recomandă utilizarea de întrebări deschise pentru a
stimula reflecția asupra aspectelor pozitive și negative în contextul rezolvării unei sarcini, dar
și pentru a încuraja elevul să identifice autonom modalități de îmbunătățire a propriei prestații
(„Ce etape am parcurs în realizarea acestei sarcini?”; „Ce am greșit în rezolvarea acestei
sarcini?”; „Ce aș putea face pentru a-mi îmbunătăți performanța”). Dacă sunt folosite pentru a
obține informații despre trăsături de personalitate sau de caracter, atitudini etc., chestionarele
de autoevaluare includ, de regulă, itemi închiși cu răspunsuri măsurate pe scale ordinale sau
de interval (practic, sunt chestionare care se utilizează în context școlar în scop formativ și
mai puțin în scop de cercetare).
Printre tehnicile de interevaluare, R. L. Linn și N. E. Gronlund (2000) menționează
nominalizarea (numită și tehnica „Cine e?”) și tehnicile sociometrice. Acestea din urmă vă
sunt deja cunocute și nu necesită lămuriri suplimentare. Nominalizarea este o tehnică de
interevaluare foarte simplă și se poate folosi pentru copii de orice vârstă. Fiecare elev dintr-o
clasă trebuie să răspundă la un set de două întrebări, una pozitivă și una negativă, care se
referă la descrierea succintă a unui comportament; elevul trebuie să indice ce coleg
corespunde cel mai bine cu descrierea respectivă. Unii profesori preferă să folosească doar
descrieri de comportamente pozitive, în timp ce alții optează pentru ambele variante. În cazul
copiilor de vârstă mică, această tehnică poate fi introdusă sub forma unui joc („Ghici ce copil
din grupă/clasă am descris?”) și permite colectarea de informații cu privire la
comportamentele sociale din grupul de elevi sau la caracteristicile personale ale elevilor, dar
poate fi folosită și pentru interevaluare în cazul unor caracteristici precum creativitate, gândire
critică, abilități de rezolvare a problemelor.

Exemple de întrebări ce pot fi folosite pentru interevaluare prin tehnica nominalizării:


1. Cine este cel mai prietenos copil din grupă/clasă?
2. Cine are întodeauna curajul de a adresa întrebări atunci când nu înțelege ceva?
3. Cine poate să formuleze cu ușurință o problemă după o imagine dată?
4. Cine găsește întodeauna și altă soluție la o problemă rezolvată în clasă?
5. Cine își împarte întotdeauna materialele cu colegii?

Pentru a obține un tablou general al interevaluărilor, profesorul trebuie doar să numere


de câte ori a fost nominalizat un copil în asociere cu descrierea pozitivă. Dacă același copil a
fost nominalizat și pentru descrierea negativă, scorul total se calculează ca diferență între
preferințe și respingeri.
Tehnica nominalizării are avantajul simplității și al aplicabilității la orice vârstă. De
asemenea, se poate utiliza în condiții de maximă economie de timp. Limita acestei tehnici de
interevaluare rezidă în excluderea din interevaluare a elevilor timizi sau introvertiți, care nu
vor fi niciodată nominalizați de colegi pentru că sunt probabil excluși.
Atât autoevaluarea cât și interevaluarea pot fi utilizate și în combinație cu alte metode
de evaluare, atât tradiționale, cât și complementare. De asemenea, ele contribuie la
optimizarea relațiilor pedagogice, stimulează comunicarea și cooperarea și, în condițiile
utilizării consecvente, conduce la formarea competențelor evaluative la elev, care sunt
relevante în procesul de autonomizare al acestuia.

Aplicație
Propuneți cinci exemple de întrebări utilizabile în procesul de interevaluare prin tehnica
nominalizării la vârsta preșcolară și școlară mică.

Temă obligatorie 3
Redactaţi un eseu de 3-4 pagini în care să comparaţi metodele tradiţionale şi complementare
(alternative) de evaluare.

5. Metode de apreciere

5.1. Notarea

Notarea constituie cea mai concretă modalitate de apreciere a rezultatelor școlare, se


realizează prin consemnarea în documente școlare (catalogul) a unor simboluri (numere sau
litere) și comunică celor interesați (profesori, elevi, părinți) care este nivelul achizițiilor
elevului la un moment dat. Scările de notare diferă de la un sistem educațional la altul și au
fost instituite prin tradiție. De exemplu, scara de notare franceză are 20 de trepte (20 este nota
maximă), scara de notare germană are 6 trepte (1 este nota maximă), scara de notare britanică
are tot șase trepte, dar simbolurile asociate sunt litere (A, B, C, D, E, F, unde A este nota
maximă, iar E și F nu reprezintă note de trecere) etc. În sistemul educațional românesc se
aplică două scări de notare diferite: o scală în patru trepte în învățământul primar în care
notele, numite calificative sunt simbolizate prin litere (FB-foarte bine; B-bine; S-suficient; I-
insuficient) și o scală în 10 trepte în învățământul secundar și terțiar (note de la 1 la 10).
Fiecare dintre scările de notare are avantaje și dezavantaje: scările cu un număr redus
de trepte nu permit diferențieri de nuanță între rezultatele elevilor, plasând performanțe foarte
diferite în aceeași categorie, în timp ce scările de notare care includ o plajă foarte largă de
valori sunt dificil de aplicat și necesită eforturi analitice foarte mari din partea evaluatorilor.
În general, se acceptă faptul că scările cu un număr mai mic de trepte au impact emoțional
mai puțin negativ asupra elevilor. Scările de notare care utilizează alte simboluri decât
numerele (cum este și cazul calificativelor din învățământul primar românesc) au dezavantajul
că nu permit prelucrări ulterioare exacte (de exemplu, calcularea mediei). Pentru a stabili un
calificativ semestrial la o disciplină în învățământul primar, profesorul are două opțiuni: fie
indică prin acest calificativ dominanta de-a lungul semestrului, prin simpla calculare a
frecvențelor calificativelor obținute de către elev, fie înregistrează prin acest calificativ
progresul sau regresul elevului pe parcursul unui semestru. Nici una dintre soluții nu este
foarte precisă și antrenează dificultăți nu doar în stabilirea calificativelor semestriale, ci și în
comunicarea semnificației acestora într-o formă inteligibilă pentru elevi și părinți.
În învățământul preșcolar, sunt folosite scări de notare informale care folosesc
simboluri precum fețele zâmbitoare sau triste (☺  ), imagini ale unor gesturi
semnificative pentru rezultate foarte bune, bune și slabe (  ), imagini de diverse
culori asociate cu nivele diferite ale performanțelor copiilor etc. Acestea sunt cunoscute
practicienilor sub numele de stimulente, deoarece ele acoperă mai ales funcția de feedback și
funcția motivațională a evaluării. Deși opiniile privind utilizarea stimulentelor în învățământul
preșcolar sunt împărțite, considerăm că ele trebuie folosite nu doar pentru a acoperi cele două
funcții deja menționate, ci și pentru a-i obișnui pe copii cu procesul de apreciere a rezultatelor,
pentru a monitoriza progresul acestora și pentru a răspunde funcției sociale a evaluării (mai
ales prin comunicare rezultatelor către părinți, familie etc.). Varietatea stimulentelor utilizate
în aprecierea performanțelor la preșcolari depinde de creativitatea profesorului, care are și
libertatea de decide numărul de trepte pe care le are în vedere în aplicarea unei scări informale
de notare (rețineți însă faptul că, pentru vârstele mici se recomandă scări de notare cu un
număr mic de trepte).
În aprecierea rezultatelor preșcolarilor se pot folosi listele de control și scările de
clasificare în variante mai precise, eventual însoțite de valori numerice care apoi să fie
transformate în calificative informale. Profesorul are și opțiunea evaluării calitative prin
rapoarte narative în care să prezinte detaliat nivelul achizițiilor preșcolarului în contrast cu
obiectivele educaționale. Acestea pot constitui instrumente de apreciere care să suplinească
notele/calificativele, care nu sunt considerate adecvate cu particularitățile vârstei și cu
finalitățile majore ale învățământului preșcolar.

Aplicație
Dați exemple de cel puțin două scări informale de notare care pot fi utilizate în învățămîntul
preșcolar. Argumentați oportunitatea și utilitatea lor în aprecierea rezultatelor preșcolarilor.

În luarea deciziilor privind notarea elevilor, profesorul trebuie să conștientizeze faptul


că acestea sunt influențate de caracteristicile și funcțiile procesului de evaluare (factorii
perturbatori propriu-ziși vor fi descriși într-o secțiune distinctă a cursului):
• Evaluarea nu este un proces facil, nici nici din perspectiva evaluatorului, nici din
perspectiva evaluatului. Ea necesită eforturi susținute de reflecție, planificare și
interpretare.
• Fiecare profesor își construiește propria “filosofie” cu privire la evaluare, care este
influențată nu doar de experiența sa didactică, ci și de experiența sa de elev, student etc.
evaluat.
• Notarea implică elaborarea unor judecăți de valoare cu privire la rezultatele elevului, iar
acestea nu au întodeauna un caracter pozitiv, ceea ce poate genera un anumit disconfort
emoțional al evaluatorului.
• Notarea trebuie să fie însoțită întodeauna de argumente, care să poată fi comunicate într-o
formă accesibilă pentru elevi și pentru părinți. În multe situații, simpla consemnare și
comunicare a unui calificativ nu este suficientă, pentru că nu oferă date relevante pentru
nivelul de achiziții al elevului sau despre elementele de referință.
• Notele pot avea o funcție motivațională foarte puternică, dar profesorul nu trebuie să
abuzeze de acest fapt prin supra-aprecierea sau sub-aprecierea rezultatele unor elevi,
pentru că poate declanșa dezechilibre chiar la nivelul relațiilor sociale din clasă.
• Notele sunt importante și în stabilirea calității activității profesorului și, de regulă, sunt
comunicate în forme sintetice factorilor decizionali din domeniul educațional (direcțiunii
școlii, inspectoratelor județene etc.), dar acest fapt nu trebuie să distorsioneze procesul de
apreciere a rezultatelor elevilor.
În materie de notare, puterea decizională a profesorului este foarte mare, iar opțiunea
pentru un model sau altul de apreciere depinde în mare măsură de percepțiile sale subiective
asupra actului evaluativ. De aceea, pentru a-și cristaliza opțiunile privind aprecierea prin notă
a rezultatelor elevului, profesorul trebuie să se familiarizeze cu mai multe modele de notare.
În acest curs vom prezenta doar o parte dintre aceste opțiuni și vom încerca să sugerăm
eventualele avantaje sau dezavantaje ale fiecărui model de notare, fără a fi părtinitori și fără a
avea pretenția că putem decide obiectiv care este cea mai potrivită pentru învățământul
preșcolar sau primar.

5.1.1. Notarea analitică și notarea holistică


Modelul care evidențiază variantele analitice și holistice (sau globale) de notare a fost
difuzat în învățământul românesc odată cu reforma sistemului de evaluare și a introducerii
evaluărilor/examenelor naționale (Stoica et al, 2001), deși lucrarea lui G. de Landsheere tradusă în
limba română și publicată în 1975 privind evaluarea curentă și examenele descrie modele de
notare similare.
Notarea analitică este aplicată mai ales în contextul evaluării formative, atunci când
accentul cade pe identificarea și analiza erorilor frecvente ale elevilor, în scopul ameliorării
secvențelor educaționale ulterioare. Aceasta presupune descrierea răspunsurilor adecvate pe care
elevii ar trebui să le formuleze pentru o sarcină și asocierea fiecărui răspuns corect cu un punctaj.
Însumarea simplă a punctajelor conduce la stabilirea unui scor, care își găsește corespondența într-
o notă. Cel mai important dezavantaj al notării analitice este acela că profesorul nu poate anticipa
toată gama de răspunsuri corecte pe care le poate formula elevul, iar acest fapt poate afecta nota
finală. În cazul probelor și a testelor docimologice scrise, acest dezavantaj poate fi restrând prin
regândirea schemei de notare după corectarea a aproximativ 20% dintre lucrări, prin includerea
altor variante de răspunsuri corecte între cele punctate. Chiar și în aceste condiții, efortul de
evaluare este considerabil și trebuie asigurată fidelitatea notării prin participarea a cel puțin doi
evaluatori.
Notarea holistică sau globală se recomandă atunci când scopul aprecierii este acela de a
oferi un feedback asupra naturii erorilor frecvente ale elevului și presupune formarea unei impresii
generale asupra unui răspuns și încadrarea sa într-o categorie prestabilită. A. Stoica et al (2001)
citează un model de notare globală elaborat de L. Carey (1998), care presupune parcurgerea a
șapte etape: a) stabilirea categoriilor de răspunsuri care vor fi utilizate (în cazul învățământului
primar românesc, logica ar indica stabilirea a patru categorii: foarte bine, bine, suficient,
insuficient); b) descrierea comportamentelor pe care elevul trebuie să le demonstreze pentru ca
răspunsul său să fie încadrat în fiecare categorie; c) analiza rapidă a tuturor răspunsurilor și
formarea unei impresii generale cu privire la calitatea acestora; d) plasarea răspunsurilor într-o
categorie corespunzătoare; e) reanalizarea răspunsurilor incluse în aceeași categorie; f) reluarea
procesului de stabilire a categoriilor pentru acele răspunsuri care trebuie plasate într-o categorie
superioară sau inferioară; g) acordarea aceleiași note pentru toate răspunsurile incluse într-o
anumită categorie.
În aceeași lucrare citată anterior (Stoica et al, 2001) se detaliază pașii c și d prin apelul la
opinia lui I.M. Thyne care propune următorul algoritm de analiză a răspunsurilor, aplicabil însă
numai în cazul probelor și a testelor docimologice scrise: dacă profesorul are în vedere cinci
categorii în care vor fi plasate rezultatele finale ale elevilor, după o analiză globală a tuturor
lucrărilor, va alege inițial câte un model de lucrare pentru fiecare dintre categoriile extreme; în
etapa următoare, profesorul va izola un model de lucrare pentru categoria de mijloc și, apoi, câte
un model pentru categoriile intermediare. Cele cinci modele de lucrări sau teste vor fi apoi folosite
care reper în notarea tuturor celorlalte lucrări.
Notarea prin calificative este prezentată ca alternativă la notarea analitică și holistică,
deoarece presupune formularea coerentă a descriptorilor de performanță. În fapt, notarea prin
calificative poate îmbrăca fie forma analitică, fie forma holistică, în funcție de opțiunea
profesorului. Notarea analitică are o dominantă criterială, pentru că se centrează pe o tipologie
prestabilită a răspunsurilor corecte, fără a presupune comparații între elevi, în timp ce notarea
holistică are conotații mai degrabă normative, datorită faptului că implică o serie de comparații
între răspunsurile elevilor.

5.1.2. Notarea subiectivă și notarea obiectivă


Lucrarea lui G. De Landsheere Evaluarea continuă şi examenele (1975) introducea în
spațiul educațional românesc două modele de notare – notarea subiectivă și notarea obiectivă.
Notarea subiectivă include "orice apreciere făcută de profesori în mod global, fie
imediat după examinarea performanţei elevilor, fie după ce au căpătat o vedere de ansamblu a
scorurilor individuale"; "orice notă la care s-a ajuns printr-un procedeu ce nu poate fi
automatizat" (De Landsheere, p. 122). Această modalitate de notare se utilizează mai ales în
cazul în care s-a apelat la metode de verificare tradiționale sau în cazul testelor care includ
doar itemi de tip eseu. Profesorul C. Moise (2007) reunește contribuțiile lui De Landsheere și
ale unor autori români (e.g. Muster, 1970; Popescu, 1978), pentru a descrie patru metode de
notare subiectivă: metoda impresiei generale, metoda scărilor de specimene, metoda analitică
şi metoda determinării frecvenţelor.
Metoda impresiei generale are o îndelungată tradiție în spațiul educațional românesc și
constă într-o apreciere de ansamblu a unui răspuns pentru o sarcină de evaluare și
aproximarea imediată a notei. Tradiția didactică a impus o serie de criterii de notare prin
impresia generală precum volumul și profunzimea cunoștințelor pe care le demonstrează
elevul, capacitățile de aplicare, analiză, sinteză și evaluare a informațiilor asimilate,
eventualele elemente de orginalitate din răspunsurile elevilor etc.
Acestă metodă de notare are avantajul economiei de timp și al aplicabilității pentru
toate tipurile de metode de verificare, fie tradiționale, fie complementare. Evident,
dezavantajul major al notării prin impresia globală este acela că deschide larg poarta
subiectivității evaluatorului și tuturor factorilor perturbatori.
Metoda scărilor de specimene constă în identificarea unor modele sau specimene de
lucrări care sunt utilizate ca reper de ordin cantitativ și calitativ în evaluarea tuturor celorlalte
lucrări. Acestă metodă de notare a fost anterior prezentată în asociere cu notarea holistică, așa
cum este descrisă de A. Stoica et al (2001). În practica evaluativă se preferă opțiunea pentru
cinci categorii de lucrări, care vor constitui repere în notarea prin comparație a tuturor
celorlalte. Avantajul acestei metode ar consta în faptul că permite o ierarhizare acceptabilă a
elevilor pe baza calității răspunsurilor, însă limitele sunt de asemenea demne de luat în
considerare: scările de specimene pot fi utilizate doar pentru notarea probelor scrise; lucrările
elevilor sunt uneori imposibil de comparat deoarece sunt structurate în manieră diferită;
evaluatorul are tendința de a se concentra doar asupra notelor comune din lucrările elevilor și
pierde din vedere aspectele originale sau menționate doar de un număr restrâns de elevi; de
asemenea, erorile care nu sunt suficient de frecvente în lucrările elevilor sunt, de regulă,
ignorate, iar acest fapt conduce supraaprecierea unor elevi.
Metoda analitică a fost anterior prezentată din perpectiva lui A. Stoica și a
colaboratorilor săi (2001) și presupune descrierea calităților fiecărui tip de răspuns asociat cu
o notă. G. de Landsheere (1975) descrie un model de notare al lucrărilor de tip compunere la
limba maternă, care include șaptesprezece factori grupați în patru categorii: forma exterioară
a lucrării (lizibilitatea, estetica, prezentarea); folosirea limbii (corectitudinea ortografică,
exactitatea morfologică, corectitudinea sintactică, caracterul propriu al limbajului, stilul);
conţinutul şi organizarea expunerii (structura expunerii, bogăţia de idei, pertinenţa ideilor,
precizia informării, gradul de completitudine); aspecte personale ale lucrării (originalitate,
maturitate, imaginaţie). Alte exemple de scheme de notare analitică pot fi identificate prin
consultarea subiectelor pentru evaluările și examenele naționale, în special pentru itemii de tip
eseu. Ele sunt cunoscute și sub denumirea de bareme de corectare și de notare.
Notarea analitică permite profesorului să controleze în mai mare măsură tendințele
subiective, chiar dacă nu toți indicatorii incluși în schemele de corectare și de notare pot fi
formulați foarte precis. În plus, notarea analitică asigură o bună fidelitate a evaluării realizată
de doi sau mai mulți evaluatori competenți, pentru că presupune raportarea la același set de
criterii, de exigențe, iar variabilitatea interpersonală a evaluatorilor este astfel diminuată.
Metoda determinării frecvenţelor este plasată de De Landsheere la limita dintre
notarea subiectivă și cea obiectivă și se poate realiza prin două procedee: fie acordarea notei
pe baza însumării aspectelor pozitive proiectate de către profesor în raport cu obiectivele
educaționale, fie scăderea unui număr de puncte pentru fiecare greșeală, după ce profesorul a
stabilit tipologia erorilor posibile în realizarea unei lucrări. În primul procedeu, se pornește de
la nota minimă și se acordă puncte pe măsură ce se descoperă în lucrarea elevului aspectele
pozitive anticipate de către profesor, iar în al doilea procedeu reperul este nota maximă din
care se scad puncte pentru fiecare eroare. Studiile au pus evidență faptul că profesorii au
tendința de a scădea cu multă ușurință puncte și de a acorda cu greutate puncte în plus. De
aceea, se recomandă utilizarea complementară a celor două procedee de notare prin
determinarea frecvențelor, pentru a anula cele două efecte.
Notarea obiectivă este considerată cea mai adecvă modalitate de apreciere a
rezultatelor elevului și poate ilustra cel mai realist prestația acestuia. Ea constă în atribuirea
unor valori numerice pentru comportamente riguros delimitate și, de aceea, permite o
fidelitate interevaluatori ridicată (De Landsheere, 1975). Obiectivitatea notării emerge, așadar
din modul de proiectare al probelor de evaluare, fiind cu certitudine mai ridicată în cazul
testelor docimologice alcătuite în special din itemi obiectivi, care pot fi notați cu mare
precizie. Un caz special este cel al testelor docimologice standardizate, care sunt diponibile în
unele sisteme educaționale (vezi cazul testelor docimologice americane, care au o îndelungată
tradiție).
În cazul evaluării criteriale, notarea obiectivă presupune derivarea riguroasă a
indicatorilor de notare din standardele de performanță, care, la rândul lor sunt proiectate în
raport cu obiectivele cadru. Astfel, notarea obiectivă în situațiile de evaluare criterială pare
mai plauzibilă în cazul examinărilor de la finalul unui ciclu școlar. Cu toate acestea,
standardele de perfomanță pot fi utilizate ca reper în formularea obiectivelor și a descriptorilor
de performanță vizați în evaluările sumative de mai mică amploare pe care le poate utiliza
profesorul la clasă. În contextul evaluării normative, notarea obiectivă impune determinarea
poziției relative a fiecărei note, prin comparație cu notele obținute la aceleași probe de toți
elevii examinați. Nu vom detalia aici aspectele statistice ale notării obiective, pentru că vom
reveni asupra acestor aspecte în prezentarea modelului de notare normativă.
5.1.3. Notarea criterială, notarea normativă și notarea în raport cu progresul individual
O clasificare complementară a modelelor de apreciere face distincția între notarea
criterială, notarea normativă și notarea în raport cu progresul individual.
Notarea criterială (supranumită și notarea în standarde absolute – Linn și Gronlund,
2000; Nitko, 2001) presupune compararea rezultatelor elevului cu repere absolute riguros
elaborate, fie la nivel național, fie la nivelul școlii sau al clasei. În cazul evaluărilor naționale,
criteriile de comparație sunt standardele de performanță incluse în programele școlare, în timp ce
evaluările sumative la clasă au drept criteriu obiectivele educaționale și descriptorii de
performanță care sunt eleborați de către profesor. Evaluarea criterială nu are însă sens decât în
cazul în care probele de evaluare sunt proiectate în strânsă corelație fie cu standardele de
performanță, fie cu obiectivele și descriptorii de performanță, fapt evidențiat în acea matrice de
specificații pe care am prezentat-o ca etapă de elaborare a testului docimologic. La această
exigență, se adaugă necesitatea utilizării consecvente a obiectivelor educaționale în proiectarea
didactică, dar și ca reper în feedbackul formativ pentru elevi.
Deși standardele de perfomanță pentru elevi și descriptorii de performanță au pătruns în
învățământul primar începând cu anul școlar 1998/1999, puține lucrări de teoria evaluării
abordează această problematică, iar relația dintre ele este aproape complet ignorată. De aceea,
alocăm câteva paragrafe pentru a explica aceste detalii care, în opinia noastră, sunt cruciale în
înțelegerea notării criteriale care este promovată în evaluarea românească prin toate măsurile de
reformă din ultimul deceniu.
Standardele educaţionale, în general, au fost elaborate și revizuite în contextul mai
larg al unui sistem integrat de asigurarea a calităţii în educaţie. Termenul de standard este
incontestabil legat de ideea construirii sistemelor de control şi asigurare a calităţii. În sistemul
educaţional românesc, drumul standardelor educaţionale este mai mult decât sinuos, ele
apărând izolat unele de altele şi nefiind nici în prezent prea bine interconectate în procesul de
control şi asigurare a calităţii, aşa cum este acesta conceput şi realizat (în conformitate cu
prevederile legale în vigoare).
Fără a avea pretenţia unei cronologii exacte, menţionăm că standardele profesionale
pentru cadrele didactice din învăţământul primar şi cele pentru profesorii de matematică au
fost printre primele elaborate şi lansate, ca rezultat al unor procese decizionale relativ
îndelungate (Gliga, 2002). Aproximativ în aceiași perioadă, au fost elaborate şi ataşate
programelor şcolare (iniţial, doar pentru învăţământul primar) standardele de performanţă
pentru elevi. În ultimii ani, Agenţia de Asigurare a Calităţii în Învăţământul Preuniversitar
(ARACIP) a lansat standardele, indicatorii şi descriptorii de evaluare a calităţii în instituţiile
educaţionale. Deşi aceste categorii de standarde nu sunt încă corelate suficient şi dau impresia
de puzzle incomplet, apariţia fiecăreia dintre categorii a marcat un pas nou în conturarea unui
demers evaluativ multidimensional în învățământul românesc.
Deşi standardele de performanţă pentru elevi în învăţământul primar sunt lansate de
câţiva ani, utilizarea lor în evaluare este încă deficitară, nefiind întotdeauna asociată cu
elaborarea indicatorilor de evaluare şi a descriptorilor de performanţă. Este şi situaţia
standardelor de performanţă pentru învăţământul secundar, care ar trebui asociaţi unor
indicatori şi apoi cu criterii de notare elaborate de profesori. Credem că situaţia poate fi
explicată prin relaţionarea standardelor de performanţă cu finalul unui ciclu de învăţământ
şi cu evaluarea externă: cadrele didactice consideră că aceste standarde nu orientează
activitatea didactică curentă și nu există obligativitatea raportării la acestea în evaluarea
formativă sau în cea sumativă de mai mică amploare. Este adevărat că standardele de
performanţă sunt susceptibile de utilizare directă mai ales în situaţiile de evaluări şi examene
naţionale, în circumstanțe de evaluare externă. Nu e mai puţin adevărat că obiectivele pentru o
secvență de evaluare sumativă după parcurgerea unei unităţi de învăţare sau a unei discipline
într-un an școlar, de exemplu, trebuie proiectate în perspectiva standardelor de performanţă.
Ele nu sunt vizate direct în evaluarea la clasă, dar, ca și obiectivele cadru și cele de referință,
trebuie avute permanent în vedere.
O analiză a documentelor în care sunt precizate standardele de performanţă
(programele şcolare în vigore şi documentele SNEE cu privire la standardele de evaluare)
ilustrează faptul că persistă încă o serie de incongruenţe. Exemplificăm această afirmaţie cu o
analiză comparativă a standardelor de performanţă aşa cum sunt prezentate în Programa
şcolară pentru matematică, clasa a IV-a (2005) şi în documentul SNEE privind Standardele
de evaluare la clasa a IV-a, a VIII-a şi a XII-a (2003).
Extras din Programa şcolară pentru Matematică, 2005
Obiectiv cadru Standard
1. Cunoaşterea şi utilizarea conceptelor specifice S1. Scrierea, citirea, compararea şi ordonarea
matematicii numerelor naturale mai mici decât 1 000 000;
S2. Folosirea corectă a terminologiei matematice
învăţate în contexte variate;
S3. Utilizarea fracţiilor pentru a exprima subdiviziuni
ale întregului în contexte variate;
S4. Efectuarea de opera ţii de adunare şi scădere cu
numere naturale mai mici sau egale cu 1 000 000;
S5. Efectuarea de opera ţii de înmulţire şi împărţire cu
numere naturale mai mici sau egale cu 1 000 folosind
operaţiile aritmetice învăţate;
2. Dezvoltarea capacităţilor de explorare/investigare şi S6. Recunoaşterea, reprezentarea şi clasificarea după
rezolvare de probleme proprietăţi simple a unor forme plane şi spaţiale;
S7. Utilizarea de reguli şi corespondenţe pentru
formarea de şiruri;
S8. Realizarea de estimări în situaţii practice;
S9. Utilizarea unor raţionamente aritmetice în
rezolvarea unor situaţii problemă
S10. Compunerea şi rezolvarea de probleme care
presupun efectuarea a cel mult trei operaţii
S11. Utilizarea unităţilor de măsură neconvenţionale şi
convenţionale în contexte variate
S12. Utilizarea instrumentelor de măsură pentru
măsurarea şi compararea timpului, a masei, lungimii şi
capacităţii unor obiecte
S13. Utilizarea unor modalităţi simple de organizare şi
clasificare a datelor
3. Formarea şi dezvoltarea capacităţii de a comunica S14. Exprimarea orală şi scrisă, într-o manieră concisă
utilizând limbajul matematic şi clară, a modului de lucru în rezolvarea de exerciţii şi
probleme

Deşi în general menţionează aceleaşi standarde de performanţă, cu acelaşi conţinut,


documentul SNEE (2003) prezintă mai puţine standarde de performanţă pentru elevi
(12), formulate în manieră diferită și însoțite de indicatori de evaluare pentru nivelul minim şi
maxim.

Exemplu de indicatorii de evaluare pentru standadrul S1: Să scrie, să citească şi să poziţioneze pe axă numere
mai mici decât 1 000 000.

Minim
- Să scrie, după dictare, numere naturale mai mari decât 100 000.
- Să scrie cu cifre, cu numere scrise cu litere, când acestea are la toate ordinele cifre diferite de zero.
- Să poziţioneze pe axă numere naturale mai mici decât 100 000.
Maxim
- Să scrie după dictare, cu cifre şi litere, numere naturale până la 1 000 000, la care trebuie poziţionate
mai multe zerouri în interior, pentru a marca absenţa a 2-3 ordine consecutive sau clase, respectând
corectitudinea elementelor grafice
- Să poziţioneze pe axă numere naturale până la 1 000 000.

Analizând doar aceste exemple, putem constata o serie inadvertenţe: în programă


standardele de performanţă sunt exprimate în termeni apropriaţi celor utilizaţi în elaborarea
obiectivelor cadru, în timp ce documentul SNEE propune o formulare mai aproape de cea
specifică obiectivelor de referinţă. De asemenea, conţinutul standardului S1 prezentat în
ambele variante nu este acelaşi, cel inclus în documentul SNEE excluzând citirea şi
compararea numerelor naturale până la 1 000 000. Aceste diferenţe adăugate lipsei de
informare cu privire la standardele de performanţă, pot genera confuzii şi erori, cu impact
asupra evaluării curente.
Unul dintre obiectivele cadru nu se regăseşte în lista celor asociate cu standarde de
performanţă, în nici unul dintre cele două documente. Este vorba despre obiectivul cadru
corespunzător domeniului afectiv - dezvoltarea interesului şi a motivaţiei pentru studiul şi
aplicarea matematicii în contexte variate. Această observaţie ilustrează o afirmaţie bine
documentată în literatura pedagogică cu privire la limitele standardelor de performanţă, care
nu pot surprinde aspectele non-cognitive ale evoluţiei elevilor.
Această analiză nu este orientată de intenţii maliţioase (precizăm că nu este un caz
izolat de nepotrivire a variantelor de prezentare a standardelor de performanţă), ci de nevoia
de dezbatere deschisă asupra standardelor de performanţă şi de ilustrare a procesului de
elaborare a acestora, care să faciliteze înţelegerea şi aplicarea lor de către cadrele didactice.
Standardele de performanţă trebuie să se regăsească în toate documentele care orientează
activitatea de evaluare. În ceea ce priveşte forma de exprimare a standardelor de performanţă,
considerăm că trebuie să devină unitară, iar cea mai potrivită în opinia noastră este elaborarea
lor mai aproape de obiectivele de referinţă/competenţele specifice, deşi prin conţinut ele se
raportează la obiectivele cadru/competenţele generale. Astfel, ele ar sugera mai evident
comportamentele care ar trebuie să constituie obiectul evaluării.
Pentru a exemplifica modul de utilizare a standardelor de performanță în evaluarea
sumativă de la finalul cilcului primar, prezentăm un fragment din raportul tehnic cu privire la
evaluarea națională din anul 2007, secvență care ilustrează gradul de performare al
obiectivelor și, respectiv, al standardelor la disciplina matematică (cu alte cuvinte, proporția
de elevi care a atins obiectivele, care au fost ilustrate prin itemi corespunzători în testul de
matematică), în rândul elevilor incluși în eșantion (MECT și CNCEIP, Evaluarea națională la
finalul clasei a IV-a. Raport Tehnic, 2007, p. 76):

Standarde de performanță Obiective de evaluare Grad de performare


S1. Scrierea, citirea, compararea şi O01. Citirea numerelor naturale 69,2%
ordonarea numerelor naturale mai mai mici decât un milion
mici decât 1 000 000 exprimate în litere și cifre
O02. Compararea numerelor 79,3%
naturale mai mici decât un milion
O03. Ordonarea numerelor 62,5%
naturale mai mică decât un milion
Această modalitate de a raporta rezultatele elevilor la standardele de performanță și la
obiectivele corespunzătoare ilustrează foarte bine ideea centrală a modelului de notare
criterială.
Deși cunoașterea standardelor de performață este importantă în perspectiva evaluărilor
sumative care acoperă obiective cu caracter general și conținuturi vaste, evaluarea curentă și
cea sumativă care vizează secvențe didactice mai mici impune profesorului pentru
învățământul primar cunoașterea procedeelor de elaborare și utilizare a descriptorilor de
performanță.
Descriptorii de performanță constau în formulări, descrieri, explicații organizate în
manieră ierarhică, cu privire la performanțele așteptate din partea elevilor aflați în situații
de evaluare (Stoica et al, 2001). Performanța anticipată a elevului este concepută și exprimată
în termeni realizabili în clasă, având în vedere antecedentele didactice relevante. Descriptorul
de performanță se concretizează într-o scală de apreciere care argumentează o judecată de
valoare a profesorului. Fiecărui obiectiv (nu fiecărui item dintr-un test, așa cum eronat se
procedează în unele cazuri) îi corespunde un descriptor de performanță, care ilustrează
nivelele de performanță corespunzătoare calificativelor foarte bine, bine, suficient (de regulă,
nu se formulează descrieri ale răspunsului pentru calificativul insuficient/nesatisfăcător).

Exemplu. Să presupunem că proiectăm o probă de evaluare orală, sumativă pentru finalul


unității de învățare Adunarea și scăderea numerelor naturale în concentrul 0-1000. Unul
dintre obiectivele de evaluare (care nu este un obiectiv operațional, pentru că se referă la o
întreagă unitate de învățare) pe care dorim să le verificăm prin proba de evaluare este formulat
astfel: Să efectueze corect operații de adunare și de scădere cu și fără trecere peste ordin, cu
numere naturale în concentrul 0-1000.
Pentru a verifica îndeplinirea acestui obiectiv de către un elev considerăm că sunt necesare
cinci sarcini de lucru distincte, pe care le vom include în proba de evaluare:
1. Rezolvarea prin calcul mintal a unei adunări cu numere naturale de la 0 la 1000, fără
trecere peste ordin
2. Rezolvarea prin calcul mintal a unei scăderi cu numere naturale de la 0 la 1000, fără
trecere peste ordin
3. Rezolvarea prin calcul scris a unei adunări cu trecere peste ordin
4. Rezolvarea prin calcul scris a unei scăderi cu trecere peste ordin
5. Rezolvarea în scris unui exercițiu care include o serie de adunări și scăderi cu/fără
trecere peste ordin.
Descriptorul de performanță pentru acest obiectiv ar putea fi în manieră foarte simplă, printr-o
exprimare cantitativă a performanței așteptate în raport cu fiecare calificativ:
Foarte bine Elevul trebuie să rezolve corect toate cele cinci sarcini de lucru
Bine Elevul trebuie să rezolve corect patru dintre cele cinci sarcini de lucru
Suficient Elevul trebuie să rezolve corect trei dintre cele cinci sarcini de lucru
Această manieră de formulare a unui descriptor de performanță nu este complet eronată, dar
nu oferă indicii calitative despre nivelul de performanță asociat cu fiecare calificativ. Este
recomandabil ca descriptorii de performanță să combine sau să alterneze explicațiile
cantitative cu cele calitative, pentru a nu genera erori în aprecierea elevilor. Dacă se utilizează
doar exprimări cantitative ale descriptorilor de performanță, se poate ajunge la situații absurde
în care un elev care a rezolvat corect o sarcină dificilă, dar a greșit la o sarcină ușoară obține
același calificativ ca un elev care a rezolvat sarcina ușoară, dar nu și pe cea dificilă.
Iată cum s-ar putea reformula în manieră calitativă descriptorul de performanță pentru
obiectivul din exemplul nostru:
Foarte bine Elevul trebuie să rezolve corect toate sarcinile de lucru, verbalizând
procedura de rezolvare a exercițiilor care sunt rezolvate în scris, fără
ajutor din partea profesorului
Bine Elevul trebuie să rezolve corect sarcinile de lucru, cu erori pe care este
capabil să le corecteze cu ajutorul profesorului
Suficient Elevul trebuie să rezolve corect exercițiile de calcul mintal și un
exercițiu în scris, chiar în condițiile în care are nevoie de ajutor
substanțial din partea profesorului.

Argumentele introducerii descriptorilor de performanță în asociere cu calificativele în


învățământul primar gravitează în jurul următoarelor idei: utilizarea acestora are un potențial
formativ mai ridicat decât scara de notare în zece trepte; informarea elevilor cu privire la obiective
și descriptori de performanță stimulează dezvoltarea capacităților metacognitive și de
autoevaluare; contribuie la creșterea transparenței și, implicit, a credibilității evaluării școlare;
stimulează centrarea pe obiective și competențe și nu pe conținuturi; sunt mai adecvate vârstei
școlare mici, deoarece nuanțele normative sunt reduse la minimum; în timp, pot contribui la
stabilirea unui consens între evaluatori și la dezvoltarea unei culturi evaluative (Stoica et al, 2001).

Aplicație
Elaborați cel puțin cinci descriptori de performanță, pentru tot atâtea obiective ale unor probe de
evaluare pentru discipline diferite. Reflectați la dimensiunile cantitative și calitative incluse în
formularea descriptorilor.

Notarea normativă este utilă și recomandată mai ales în situațiile în care numărul elevilor
evaluați este foarte mare, iar poziția relativă a rezultatului obținut de fiecare elev în comparație cu
performanțele celorlalți consituie scopul administrării unei probe (ceea sugerează și importanța
ierarhizării, uneori în scopuri de selecție pentru un program de studii). Aceste condiții nu sunt
îndeplinite decât în evaluările și examinările cu caracter național, în cazul concursurilor școlare
sau în cazul administrării de teste standardizate. Acestea din urmă nu sunt instrumente de evaluare
cu tradiție în școala românescă, așadar nu ne putem aștepta la elaborarea unor asemenea teste în
viitorul apropiat. De asemenea, notarea normativă este realizată mai riguros în cazul probelor
scrise.
În cazul evaluării la clasă, se pot utiliza procedee simple de notare normativă (Linn și
Gronlund, 2000; Nitko, 2001) prin raportare la rangul percentil al scorurilor obținute de către
fiecare elev, la cvartile sau prin calcularea scorurilor standardizate z (toate aceste procedee
statistice vă sunt cunoscute de la cursul de Metodologia cercetării pedagogice).

Exemplu. Pentru a exemplifica utilizarea rangului percentil și a cvartilelor în notarea normativă la


clasă, vom utiliza rezultatele ipotetice obținute de 20 de elevi la un test pentru diciplina Științe
(scorul maxim posibil pentru întreg testul este 100).

Rezultat la testul de Științe


Frecvenţa Frecvenţa Frecvenţa relativă Frecvenţa relativă Frecvenţa relativă
Frecvenţa absolută relativă (fr) cumulată (frc) procentuală (fr %) cumulată
Scoruri absolută (fa) cumulată (fc) procentuală (frc %)
43.00 1 1 0,05 0,05 5.0 5
57.00 1 2 0.05 0,10 5.0 10
65.00 1 3 0,05 0,15 5.0 15
68.00 2 5 0,10 0,25 10.0 25
69.00 1 6 0,05 0,30 5.0 30
72.00 1 7 0,05 0,35 5.0 35
76.00 2 9 0,10 0,45 10.0 45
79.00 1 10 0,05 0,50 5.0 50
82.00 1 11 0,05 0,55 5.0 55
85.00 1 12 0,05 0,60 5.0 60
86.00 1 13 0,05 0,65 5.0 65
88.00 2 15 0,10 0,75 10.0 75
92.00 2 17 0,10 0,85 10.0 85
97.00 1 18 0,05 0,90 5.0 90
99.00 1 19 0,05 0,95 5.0 95
100.00 1 20 0,05 1,00 5.0 100
Total 20 1,00 100.0

Iată cum putem folosi rangul percentil în interpretarea rezultatului obținut de un elev, care a
obținut 72 de puncte la acest test: elevul a obținut un scor care îl plasează între ultimii 35% dintre
elevi și în jumătatea inferioară a clasamentului sau 30% dintre elevii evaluați au obținut un scor
mai mic decât elevul în cauză.
Putem asocia rangurile percentile cu sistemul de calificative, după o schemă pe care o considerăm
oportună având în vedere scopul administrării probei și vârsta elevilor. Utilizarea curbei normale
pentru a forța o anumită distribuție a calificativelor nu este indicată, deoarece niciodată rezultatele
unei clase de elevi nu se vor apropia suficient de mult de aceasta. Putem folosi însă scheme de
corespondență între rangul percentil și calificative, care să ilustreze mai degrabă experiența
noastră didactică decât reguli clare. Deși procedeul este prezentatat în literatura pedagogică
internațională, se admite că aceste scheme sunt arbitrare și depind în mare măsură de competența
cadrului didactic. Iată un exemplu de asemenea schemă care să ne ajute în notare:
Ranguri percentile Calificativ
100-81 Foarte bine
80-31 Bine
30-11 Suficient
Până la 10 Insuficient

Așadar, ultimii 10% dintre elevi vor obține calificativul insuficient, cei care au obținut scoruri care
îi plasează între rangul percentil 11 și 30 vor obține calificativul suficient, cei între rangul
percentil 31 și 80 vor obține calificativul bine, iar cei care au scoruri cuprinse între rangul
percentil 81 și 100 vor obține foarte bine. Observați că deși pare o modalitate de notare riguroasă,
utilizarea rangului percentil în acestă manieră este arbitrară și este influențată de întreaga filozofie
a profesorului în legătură cu evaluarea.
Un alt procedeu de evaluare normativă constă în utilizarea cvartilelor; pe baza acestora se
poate acorda calificativul foarte bine elevilor care au obținut primele 25% dintre scoruri și
calificativul insuficient celor care au obținut ultimele 25% dintre scoruri. Cvartila doi, care este
chiar mediana, constituie pragul între calificativele bine și suficient. Dacă încercăm să acordăm
calificative elevului care a obținut 72 de puncte la test folosind rangul percentil și schema de
transformare propusă, acesta ar fi apreciat cu bine, același calificativ fiind valabil și în cazul
utilizării cvartilelor. Dacă luăm însă în considerare un elev care a obținut scorul 65, folosind
rangul percentil și schema de corespondență i-am acorda calificativul suficient, dar dacă am folosi
procedeul cvartilelor ar obține calificativul insuficient. Pe baza acestei scurte exemplificări, putem
concluziona că utilizarea cvartilelor poate conduce la creșterea numărului de elevi care obține
calificativele insuficient și suficient (practic, jumătate dintre ei s-ar afla în această situație, ceea ce
ar fi greu de acceptat și pentru profesor, dar și pentru elevi, părinți etc.).
Indiferent ce procedeu de notare normativă am utiliza dezavantajul său major în raportare
cu notarea criterială nu se diluează: în cazul notării normative întotdeauna vor exista elevi care vor
înregistra eșec șcloar, în sensul că nu vor obține calificativul de trecere; în cazul în care se
utilizează notarea criterială, există posibilitatea ca nici un elev să nu fie în situația de a obține
calificativul insuficient.

Notarea în raport cu progresul individual presupune compararea nivelului de achiziții al


elevului de la un moment dat cu performanțele sale anterioare, în special cele obținute la
evaluările inițiale (Nitko, 2001). Avantajele acestui model de notare includ descurajarea
competiției între elevi pentru obținerea anumitor calificative, motivarea elevului pentru a continua
să progreseze, încurajarea celor mai slabi elevi dintr-o clasă. Limitele notării în raport cu
progresul individual țin de factorii subiectivi care influențează aprecierea profesorului, de nevoia
de a cunoaște și de a comunica celor interesați progresul elevilor în raport cu obiectivele și
standardele de performanță, de lipsa de precizie în ierarhizarea elevilor, de aprecierea constantă a
efortului și ignorarea comportamentului observat sau a calității produselor activității. În plus,
abordând acest model de notare strict statistic, progresul elevilor cu un nivel ridicat de achiziții
inițiale va fi întodeauna mai mic decât progresul celor cu un nivel foarte scăzut al performanțelor
inițiale. În consecință, notarea constantă în raport cu progresul individual va conduce la situația
paradoxală în care elevii cu cele mai bune performanțe pot obține calificative mai slabe decât cei
cu cele mai slabe performanțe. Aceast nu înseamnă că acest model de notare nu poate fi utilizat
ocazional în notarea elevilor, în scopul de motiva, de a încuraja progresele viitoare, ci doar că
asemenea decizii trebuie luate cu precauție și cu temei.

Aprecierea prin notă presupune cunoașterea de către profesor a unui număr rezonabil de
modele, metode și procedee. Indiferent care sunt opțiunile noastre în evaluarea la clasă, ar trebui
să comunicăm transparent elevilor, părinților, altor factori interesați care sunt argumentele noastre
în acordarea unui calificativ. În absența notării, evaluarea n-ar constitui o miză atât de importantă
în raporturile profesorului cu elevii și părinții, iar cadrele didactice trebuie să conștientizeze
nevoia de rigoare în aprecierea rezultatelor elevilor.

Temă de reflecție
Încercați să comparați modelele de notare prezentate în curs și să le identificați pe cele care sunt
compatibile și pe cele care se exclud reciproc.

5.2. Aprecierea verbală constă într-un feedback pe care profesorul îl formulează în legătură cu
performanțele unui copil care poate avea fie nuanțe pozitive, fie nuanțe negative. Orice aprecierea
verbală trebuie să surprindă în egală măsură efortul copilului de a rezolva o sarcină și procesul
rezolutiv, dar și calitatea produsului final al activității, a performanței demonstrate. Este o metodă
de apreciere importantă mai ales în învățământul preșcolar, deoarece profesorul nu dispune de
calificative pentru a sancționa rezultatele copiilor, iar stimulentele nu au semnificație în absența
aprecierilor verbale care să le clarifice. Aprecierea verbală se utilizează și în învățământul primar,
fie în combinație cu un calificativ, fie ca feedback formativ cu rol motivațional pentru elev.

6. Erori (factori perturbatori) în evaluarea elevilor


Toate lucrările dedicate problematicii evaluării școlare includ un capitol sau un
paragraf destinat prezentării erorilor frecvente, care afectează aprecierea rezultatelor obținute
de către un elev (e.g. De Landsheere, 1975; Radu, 1981; Moise, 2007; Cucoș, 2008).
Deoarece v-ați familiarizat anterior cu erorile posibile în evaluare în cadrul cursului de
Psihologia educației, le vom trece în revistă sintetic pe cele mai frecvente și vom încerca să
sugerăm măsuri care ar putea reduce efectele acestora.
Efectul halo constă în tendința de a raporta rezultatele elevului la percepția globală
asupra abilităților sale și se traduce atât în favorizarea elevilor cu rezultate în general bune, cât
și în defavorizarea elevilor despre care profesorul consideră că sunt slabi. Cu alte cuvinte,
profesorul fie supraapreciază, fie subapreciază rezultatele unui elev, generalizând elemente
ale percepției sale globale (un elev bun care obține o performanță slabă în rezolvarea unei
sarcini va fi suprapreciat, în timp ce un elev slab care obține o performanță ridicată va fi
subapreciat).
Un efect asociat este cel oedipian sau efectul Pygmalion, care poate fi ilustrat printr-o
atitudine inflexibilă a evaluatorului față cel evaluat, datorată unei preconcepții despre
posibilitățile, abilitățile sau peformanțele acestuia.
Efectul de ordine se concretizează în modificări ale notelor obținute de către cei
evaluați, datorate plasării cronologice diferite a răspunsurilor sau lucrărilor. Acest fapt se
datorează atât unor variabile care țin de subiectivitatea evaluatorului (pe măsură ce înaintează
în procesul de evaluare intervine oboseala și un anumit sentiment de saturație), cât și lipsei
unor repere riguroase în apreciere. Este binecunoscut faptul că la începutul unei probe orale
sau la debutul activității de corectare a lucrărilor scrise notarea este mai precisă, chiar mai
exigentă, iar la finalul evaluării examinarea răspunsurilor este mai sumară, iar notarea mai
generoasă. Un efect similar este cel de contrast, în sensul că un răspuns evaluat după un altul
considerabil mai bun va fi subapreciat, iar o performanță slabă va fi suprapreciată dacă
urmează după o prestație și mai slabă.
Infidelitatea examinatorului faţă de sine este un alt efect documentat în literatura
pedagogică și generează diferențe mari în aprecierea unor lucrări care sunt recorectate după
un interval de timp de către același profesor, în condițiile în care acesta nu este prevenit
asupra acestei situații.
Tendinţa spre valoarea centrală constă în preferința evaluatorului pentru aprecierile
moderate și evitarea notelor extreme. Aceasta ar putea fi complementară tendinței de a nota în
concordanță cu o curbă normală, care presupune utilizarea întregii game de note în
conformitate cu procentajele specifice distribuției gaussiene (Moise, 2007).
Ecuaţia personală a fiecărui evaluator constituie un factor perturbator major, unii
având tendința de a fi exagerat de exigenți, în timp ce alții sunt exagerați de indulgenți în
notare. Efectul ecuației personale este mai vizibil în cazul probelor scrise și a testelor cu itemi
de tip eseu la discipline care presupun și prezentarea argumentată a unor puncte de vedere
diferite.
Prudenţa examinatorilor constă în subaprecierea rezultatelor școlare la începutul unui
semestru sau an școlar din teama de a nu îi îndemna pe elevi la o atitudine negativă față de
pregătirea continuă în cazul în care ar obține note mari. Acest efect funcționează însă și în
sens pozitiv, în situația în care un profesor suprapreciază rezultatele elevilor la începutul
colaborării, pentru a fi sigur că nu va îi va dezavantaja în condițiile în care nu îi cunoaște
foarte bine.
Pentru a reduce impactul factorilor perturbatori asupra aprecierii rezultatelor școlare se
pot imagina demersuri variate, dar efectul acestora este dificil de estimat. Pentru a crește
obiectivitatea notării, ar trebuie să se opteze pentru alte modele, metode și tehnici decât
tehnica impresiei globale care lasă loc de manifestare tuturor factorilor perturbatori. Această
metodă de notare nu poate fi însă întotdeuna evitată și, pentru a reduce distorsiunile în
apreciere, se poate apela la doi sau mai mulți evaluatori competenți pentru a anula efectul
subiectivității personale.
În situațiile în care nu se poate apela la doi evaluatori, se recomandă utilizarea testelor
docimologice cu itemi obiectivi și semiobiectivi, cu scheme de corectare și de notare clare,
care nu permit abateri mari. Baremele de corectare și de notare ar trebui să fie comunicate
elevilor înainte de rezolvarea unei probe, astfel încât aceștia să se poată autoevalua. În plus,
dacă există posibilitatea de a solicita corectarea unei lucrări de către doi evaluatori, aceștia ar
trebui să ajungă la un acord în privința baremului de corectare și de notare.
O altă sugestie de creștere a obiectivității în notare constă în utilizarea frecventă a
notării analitice, mai ales pentru probele scrise de tip compunere sau eseu, astfel încât să se
evite aprcierea globală a lucrărilor în absența unor repere clare.
Pentru a reduce impactului efectului halo și a celui oedipian se poate opta pentru
asigurarea anonimității lucrărilor, dar acest lucru nu este posibil decât în cazul evaluărilor
externe.
Cea mai simplă și cea mai eficientă cale de a reduce efectele perturbatoare în
aprecierea rezultatelor elevului rămâne pregătirea temeinică a profesorilor în domeniul
evaluării. Pe măsură ce profesorii sunt mai familiarizați cu întreaga gamă de metode de
verificare și de apreciere pe care le au la dispoziție și conștientizează mai clar avantajele și
limitele fiecărei strategii evaluative, șansele de apropiere de dezideratul obiectivității cresc.

Temă de reflecție
Încercați să identificați și alte modalități de control a factorilor perturbatori în evaluare. Explicați
care dintre efectele perturbatoare ar fi atenuate.
BIBLIOGRAFIE

Anastasi, A. (1976). Psychological testing, Ediţia a IV-a, McMillan Publishing Co., New
York
Ausubel, D., Robinson, F. (1981). Învăţarea în şcoală. O introducere în psihologia
pedagogică, Editura Didactică și Pedagogică, Bucureşti
Best, J. W. (1977) Research in education, Prentice-Hall Inc., New Jersey
Cerghit, I., (2002). Sisteme de instruire alternative şi complementare, Editura Aramis,
Bucureşti
Creţu, C., (1999). Teoria curriculumului şi conţinuturile educaţiei, Editura Universităţii
„Alexandru Ioan Cuza", Iași
Crocker, L., Algina, J. (1986). Introduction to classical and modern test theory, Holt,
Rinehart and Winston Inc., Orlando
Cucoş C. (2000). Pedagogie, Editura Polirom, Iaşi
Cucoş, C. ( 2008). Teoria şi metodologia evaluării, Editura Polirom, Iaşi
Cucoş, C. (2002). Pedagogie, Ediţia a II-a, revăzută şi adăugită, Editura Polirom, Iaşi
De Landsheere, G. (1975). Evaluarea continuă a elevilor şi examenele, Editura Didactică și
Pedagogică, București
De Landsheere, V., De Landsheere, G. (1979). Definirea obiectivelor educaţiei, Editura
Didactică și Pedagogică, București
Downing, S. M., Haladyna, T. M. (eds.) (2006). Handbook of Test Development, Routledge,
London
Evans, J.D. (1985). Invitation to psychological research, CBS College Publishing, New York
Gall, M.D., Gall, J.P., Borg.W.R. (2007). Educational research: an introduction, 8th Edition,
Pearson Education, Inc., Boston
Gallagher, J.D. (1998). Classroom Assessment for Teachers, Prentice-Hall Inc., New Jersey
Gliner, J.A., Morgan, G. A. (2000). Research Methods in Applied Settings: An Integrated
Approach to Design and Analysis, Lawrence Erlbaum Associates, New Jersey
Jinga, I. (1996).
Jinga, I., Istrate, E. (1998).
Karmel, L.J., Karmel, M.O. (1978). Measurement and evaluation in the schools, Ediţia a II-a,
McMillan Poblishing Co., New York
Linn, R.L., Gronlund, N.E. (2000). Measurement and Assessment in Teaching, Prentice-Hall
Inc., New Jersey
Liţoiu, N., (2001). Metode şi instrumente de evaluare, în Stoica, A. (coord.), Evaluarea
curentă şi examenele, Editura ProGnosis, Bucureşti, pp. 30-46
Manolescu, M. (2002). Evaluarea şcolară-un contract pedagogic, Editura Fundaţiei
Culturale, „D. Bolintineanu”, Bucureşti
Mason, E. J., Bramble, W. J. (1997) Research in Education and the Behavioral Sciences,
Brown & Benchmark Publishers, Duburque
Mândruţ, M. (2001), Tipologia itemilor, în Stoica, A. (coord.), Evaluarea curentă şi
examenele, Editura ProGnosis, Bucureşti, pp. 65-85
McMillan, J.H. (1992). Educational Research. Fundamentals for the Consumer,
HarperCollins Publishers Inc., New York
MECT, CNCEIP (2007). Evaluarea națională la finalul clasei a IV-a. Raport Tehnic,
disponibil on-line: www.edu.ro
Meyer, G. (2000). De ce şi cum evaluăm, Editura Polirom, Iași
Mihail, R. (2001). Evaluarea educațională și evaluarea performanțelor/rezultatelor școlare, în
Stoica, A. (coord.), Evaluarea curentă şi examenele, Editura ProGnosis, Bucureşti, pp.
4-21
Moise, C. (2007). Teoria şi practica evaluării, în Psihologie. Curs pentru Învăţământ la
Distanţă, Editura Universităţii „Alexandru Ioan Cuza", Iași
Muster. D. (1970). Verificarea progresului şcolar prin teste docimologice, 1970, Editura
Didactică și Pedagogică, București
Neacşu, I., Stoica, A. (coord.) (1996). Ghid general de evaluare şi examinare, Editura
Aramis, Bucureşti
Negreţ-Dobridor, Ioan, 2001, Teoria curriculumului, în I. Cerghit, I. Neacşu, I. Negreţ-
Dobridor, I.O. Pânişoară, Prelegeri pedagogice, Editura Polirom, Iaşi, pp. 11-60
Nitko, A.J. (2001). Educational Assessment of Students, 3rd Edition, Prentice-Hall Inc., New
Jersey
Osterlind, S. J. (1998). Evaluation in Education and Human Services. Constructing test items:
multiple-choice, constructed response, performance and other formats, 2nd edition,
Kluwer Academic Publishers
Popescu, P. (1978). Examinarea şi notarea curentă, Editura Didactică și Pedagogică,
București
Popham, W. J. (2003). Test better, teach better. The instructional role of assessment,
Association for Supervision and Curriculum Development
Potolea, D. (2002). Conceptualizarea curriculum-ului. O abordare multidimensională, în E.
Păun, D. Potolea (coord.), Pedagogie.Fundamentări teoretice şi demersuri aplicative,
Editura Polirom, Iaşi, pp. 69-84
Radu, I. (1995). Elemente de docimologie didactică, în M. Ionescu şi I. Radu (coord.),
Didactica modernă, Editura Dacia, Cluj-Napoca
Radu, I. T. (1981). Teorie şi practică în evaluarea eficienţei învăţământului, Editura
Didactică și Pedagogică, București
Radu, I. T. (2000). Evaluarea în procesul didactic, Editura Didactică și Pedagogică, București
Radu, I. T., Popescu, P. (1982). Evaluarea randamentului şcolar, în I. Salade (coord.),
Didactica, Editura Didactică și Pedagogică, București
Roman, I., Popescu, P. (1980). Lecţii în spiritul metodelor active, 1980, Editura Didactică și
Pedagogică, București
Schreerens, J., Glas, C., Thomas, S. M. (2003). Educational evaluation, assessment and
monitoring. A systemic approach, Swets & Zeitlinger Publishers, Lisse
SNEE (2003). Standarde de evaluare pentru clasa a IV-a, a VIII-a şi a XII-a, disponibil on-
line: www.edu.ro
SNEE (2005). Evaluarea națională la finalul clasei a IV-a. Raportul tehnic, disponibil on-
line: www.edu.ro
Stan, A. (2002). Testul psihologic. Evoluţie, construcţie, aplicaţii, Editura Polirom, Iași
Stan, C. (2001). Evaluarea şi autoevaluarea şcolară, Presa Universitară Clujeană, Cluj-
Napoca
Stoica, A. (2003). Evaluarea curentă şi examenele. De la teorie la practică, Editura
Humanitas Educational, București
Stoica, A. (coord.) (2001). Evaluarea curentă şi examenele, Editura ProGnosis, București
Strungă, C. (1999). Evaluarea şcolară, Editura de Vest, Timişoara
Thomas, R.M. (1998). Conducting Educational Research. A comparative view, Bergin &
Garvey Westport, Connecticut
Vogler, J. (2000). Evaluarea în învăţământul preuniversitar, Editura Polirom, Iași

S-ar putea să vă placă și