Documente Academic
Documente Profesional
Documente Cultură
Curs Mai Vechi TEORIA-SI-METODOLOGIA-EVALUARII-CURS-PIPP-II-5 PDF
Curs Mai Vechi TEORIA-SI-METODOLOGIA-EVALUARII-CURS-PIPP-II-5 PDF
Obiective
• Să identifice elementele de specificitate în evaluarea elevilor, a profesorilor și a
instituțiilor școlare;
• Să explice funcțiile evaluării în context educațional și legătura dintre evaluare și
curriculum, predare, învățare;
• Să compare diferite forme și tipuri de evaluare (formativă/sumativă,
inițială/continuă/finală, criterială/normativă etc.);
• Să descrie metode tradiționale și alternative de verificare (inclusiv testul docimologic);
• Să elaboreze secvențe și instrumente de evaluare specifice învățământului preșcolar și
primar;
• Să descrie metode de apreciere a performanțelor elevilor și elementele de specificitate
în învățământul preșcolar și primar (notarea și aprecierea verbală; standarde și
descriptori de performanță);
• Să explice erorile posibile în evaluare și modalitățile de evitare a acestora.
Tematică generală
Temă de reflecție
Încercați să realizați un tabel cu argumente pro și contra evaluării naționale a elevilor la
sfârșitul clasei a IV-a și să sintetizați concluziile într-o frază.
Teoria evaluării operează constant cu o serie de termeni care necesită clarificări:
• Docimologia este știința sau domeniul care are ca obiect studierea sistematică a
examenelor, în special a sistemelor de notare şi a comportării examinatorilor şi a celor
examinaţi (De Landsheere, 1975).
• Termenul doxologie se referă la studierea sistematică a rolului aprecierii în învăţământul
şcolar, efectele stimulante sau inhibitoare ale diverselor forme de examinare, reacțiile
examinatorilor și a celor examinați (De Landsheere, 1975).
• Sintagma randament şcolar defineşte nivelul de pregătire şi dezvoltare a personalităţii
elevului prin raportare la finalitățile educaționale.
• Termenii performanţă şcolară şi progres școlar sunt utilizați cu acepțiuni diferite în
teoria evaluării. Performanța școlară poate fi considerată orice rezultat al elevului (indiferent
de calitatea acestui rezultat), însă poate fi concepută și restrictiv, ca rezultat notabil sau de
valoare al unui elev. Termenul de progres școlar surprinde orice salt calitativ al unui elev,
care se poate observa prin compararea performanțelor actuale cu cele anterioare (Radu şi
Popescu, 1982).
O altă problemă care trebuie clarificată atunci când discutăm despre evaluarea elevilor
se referă la obiectul evaluării, cu ale cuvinte trebuie să răspundem la întrebarea „Ce rezultate
ale elevilor evaluăm?”. Nici răspunsul la această întrebare nu este simplu, pentru că profesorul
nu evaluează doar cunoștințe, deși, cel mai adesea, acestea constituie obiectul principal al
eforturilor evaluative. Atât literatura românească de specialitate, cât și cea străină accentuează
faptul că rezultatele elevului pot consta în cunoştinţe, capacităţi intelectuale, capacităţi de
aplicare a cunoştinţelor, capacitatea de a crea produse personale, trăsături de personalitate
şi de conduită (Radu, 1981; Moise, 2007; Linn și Gronlund, 2000; Nitko, 2001). Dacă
rememorați cunoștințele dobândite la cursul de Teoria și metodologia instruirii, vă veți
reaminti că obiectivele sunt elaborate și pentru a orienta activitatea de evaluare, ori acestea se
referă nu doar la domeniul cognitiv, ci și la cel afectiv și psihomotor. Nu este mai puțin
adevărat că domeniul cognitiv ocupă cel mai mare spațiu atât în pregătirea viitorilor profesori,
cât și în evaluarea rezultatelor elevilor. Există însă o preocupare evidentă pentru evaluarea
achizițiilor complexe ale elevilor, atât în domeniul cognitiv, cât și în cel afectiv și psihomotor,
mai ales în contextul reformelor educaționale comprehensive care au loc în aproape toate
țările lumiii (vezi deziderate precum dezvoltarea gândirii critice, dezvoltarea cetățeniei
democratice etc.)
Temă de reflecție
Comentați principiile generale ale evaluării enunțate mai sus. Ați mai putea formula și alte
principii ale evaluării?
Temă de reflecție
Recitiți fragmentele din cursul de Teoria și metodologia instruirii cu privire la obiectivele
educaționale. Încercați apoi să răspundeți la întrebarea „În ce mod influențează obiectivele
educaționale activitățile de predare, învățare și evaluare?”.
Temă de reflecție
Citiți cu atenție funcțiile evaluării enumerate în tabel și încercați să descoperiți similarități și
diferențe între propunerile diverșilor autori.
Temă de reflecție
Comentați eventualele suprapuneri conceptuale și clasificări derivate, pe baza tipurilor de
evaluare prezentate în curs.
4.2.1. Metodele de verificare orală sunt utilizate în mod frecvent în evaluarea la clasă
și pot îmbrăca cel puțin două forme: ascultarea sau chestionarea în fiecare lecție mixtă și
verificarea orală în lecții special organizare (lecțiile de evaluare).
Verificarea orală curentă (ascultarea) constituie substanța secvenței de „verificare a
cunoștințelor anterioare” din fiecare lecție mixtă, alături de verificarea temei pentru acasă. Ea
constă în chestionarea elevilor din conținutul lecției de zi, nefiind recomandată verificarea
cunoștințelor anterioare dintr-un set de lecții anterioare. Proiectarea și desfășurarea corectă a
probelor de evaluare curentă constituie premise pentru a obține informații suficient de precise
despre achizițiile elevului. Prin intermediul verificărilor orale curente se pot evalua
comportamente corespunzătoare unor niveluri taxonomice diferite, de la cunoștințe și
capacități până la judecăți de valoare asupra unor conținuturi, iar caracterul formativ al acestei
metode este evident. Practic, verificarea orală curentă îndeplinește în principal funcția de
orientare și ameriorare, dar poate acoperi și funcția decizională, în cazul în care se finalizează
prin notare.
O secvență de chestionare dintr-o lecție mixtă trebuie să se încadreze în limitele
temporale specifice (15-25 de minute), ceea ce permite evaluarea unui număr mic de elevi, de
la 3-5 elevi în cazul disciplinelor socio-umane, până la 6-8 elevi în cadrul disciplinelor reale.
Ascultarea începe, de regulă, printr-o conversație frontală de scurtă durată care se încheie cu
precizarea conținuturilor și a comportamentelor ce vor fi evaluate (Radu, 1979) și desemnarea
elevilor care vor fi ascultați. Restul elevilor din clasă participă la evaluare, fie prin implicare
directă (li se poate cere să formuleze și ei întrebări de verificare pentru colegii lor, să
completeze sau să corecteze răspunsurile), fie prin autoevaluarea propriilor achiziții în
comparație cu cele ale colegilor evaluați.
Întrebările care se adresează au fost grupate în mod tradițional în întrebări de bază și
întrebări ajutătoare, iar dialogul evaluator-evaluat trebuie să respecte toate regulile
conversației ca metodă didactică, deoarece verificarea orală curentă se constituie într-o formă
de factură conversațională. Se recomandă ca profesorul să asculte până la capăt răspunsul
formulat de elev, indiferent de gradul de corectitudine al acestuia și abia la final să intervină.
Dacă răspunsul este corect se poate continua secvența de evaluare, dar dacă răspunsul este
greșit se stimulează autocorectarea. În cazul în care elevul nu își poate corecta răspunsul, se
cere celorlalți elevi din clasă să intervină. În cazul în care nici această formulă de rezolvare a
sarcinii nu se soldează cu un succes, poate interveni profesorul. Nu se recomandă ca
profesorul să fragmenteze răspunsul elevului cu observații, deoarece acest comportament ar
genera și mai multă nesiguranță și neîncredere la elev. De asemenea, nu se recomandă
aprecierea prin notă a răspunsurilor izolate, a intervențiilor foarte scurte care produc
dezechilibre în apreciere. Profesorul poate utiliza un catalog personal, în care să noteze mai
multe intervenții ale elevului, pe baza cărora să se aprecieze apoi achizițiile acestuia.
Literatura de specialitate sintetizează și alte erori pe care profesorii le pot face în
verificarea orală curentă cum ar fi:
• Reducerea verificării la ascultarea lecției de zi, reprodusă mecanic de către elev fără o
selecție a conținuturilor semnificative, foarte importante indicate de către profesor prin
întrebări;
• Examinarea exclusiv frontală, fără a se nominaliza elevii ce vor fi ascultați și, eventual,
notați sau neglijarea completă a clasei, prin concetrarea atenției doar pe interacțiunea cu
elevii chestionați;
• Elaborarea defectuoasă a întrebărilor ajutătoare, care devin inutile ca mijloc de sprijinire a
elevului în formularea răspunsului.
Temă de reflecție
Analizați secvența de verificare a cunoștințelor anterioare dintr-un proiect didactic pentru o
lecție mixtă (elaborat de dvs., de către un coleg, de către un cadru didactic), concentrându-vă
atenția asupra calității întrebărilor. Încercați să corectați eventualele erori în proiectarea
întrebărilor.
Verificarea orală în lecţii special organizate (periodică) poate fi utilizată în
învățământul preșcolar și primar, cu precauția impusă de caracteristicile specifice vârstei și
având în vedere complexitatea conținuturilor vizate. Spre deosebire de verificarea orală
curentă care se realizează în fiecare lecție mixtă, verificarea orală periodică poate fi o
secvență consistentă a lecției de evaluare și poate viza conținuturi mai ample (un set de lecții,
o unitate de învățare etc.). Această metodă de evaluare presupune formularea unor sarcini de
rezolvat care sunt prezentate elevului în etape succesive. Verificarea orală periodică are
câteva avantaje în comparație cu cea curentă: în principal, permite evaluarea unui număr mai
mare de elevi și a unor conținuturi mai extinse. În cadrul lecțiilor de evaluare, verificarea
orală se poate combina cel mai adesea cu verificarea scrisă. Dacă demersul verbal este
dominant, metoda de evaluare utilizată este verificarea orală periodică, iar în cazul unei
dominante scrise avem de-a face cu o verificare scrisă periodică (cu alte cuvinte, schimbul
verbal de întrebări și răspunsuri poate fi însoțit de sarcini scrise, dar ponderea acestora din
urmă trebuie să fie mai redusă).
Datorită complexității conținuturilor și comportamentelor vizate, verificarea orală
periodică presupune eforturi mai mari de proiectare și de realizare. Spre deosebire de forma
curentă a verificării orale, acoperă mai degrabă necesitatea aprecierii elevului prin notă decât
orientarea acestuia în activitatea de învățare. Validitatea evaluării prin verificare orală
periodică este mai mare decât în cazul evaluării orale curente, deoarece volumul
conținuturilor surprinse este mai mare, iar profesorul are posibilitatea de a selecta teme,
subiecte reprezentative. Evident, notarea este mai concludentă din același motiv.
Temă de reflecție
Recitiți descrierea conversației ca metodă didactică din cursul de teoria instruirii și încercați să
adaptați exigențele pe care trebuie să le respecte întrebările și răspunsurile la situația de verificare
orală curentă, respectiv periodică.
Dincolo de aceste avantaje, trebuie avute în vedere şi o serie de limite ale probelor scrise:
• Profesorul nu îi poate sprijini pe elevi în formularea răspunsurilor, iar unele erori nu pot fi
corectate imediat, ceea ce înseamnă că feedback-ul este mai întârziat decât în cazul
probelor orale.
• Evaluarea prin probe scrise nu este la fel de intens conectată cu activitățile de predare și
învățare și nu permite reglaje didactice fine.
• În cazul în care subiectele sunt formulate neglijent, evaluarea se reduce la surprinderea
volumului de cunoștințe asimilate de către elev.
Temă de reflecție
Imaginați o probă scrisă care poate fi aplicată în învățământul preșcolar. Reflectați la faptul că
instrucțiunile de rezolvare trebuie prezentate oral de către profesor, iar sarcinile nu trebuie să
depășească nivelul indicat de programa școlară pentru învățământul preșcolar. Care sunt
dificultățile în proiectarea unei astfel de probe?
Temă de reflecţie
Proiectaţi o probă scrisă curentă (lucrare de control) sau periodică (lucrare la sfârşit de
capitol/unitate de învățare) pentru o disciplină la alegere din planul de învăţământ pentru clasa
a II-a.
Temă de reflecţie
Proiectaţi o probă practică curentă (într-o lecţie mixtă) sau periodică (într-o lecţie de evaluare,
la sfârşitul unui capitol sau al unei unităţi de învăţare) pentru disciplina matematică.
1
Această secțiune introductivă privind testul docimologic constituie o reluarea a cunoștințelor despre testul
docimologic asimilate anterior de cursanți în cadrul disciplinei Metodologia cercetării pedagogice (anul II,
semestrul I).
2
Din rațiuni didactice, nu vom prezenta toate tipurile de teste descrise în literatura de specialitate, ci ne vom
centra doar pe tipologiile relevante în contextul activității de evaluare a profesorului.
aplicabilitate, de unde decurge însă şi cea mai evidentă limită: ele nu pot fi utilizate în
evaluarea curentă, deoarece se referă la cunoştinţe sau achiziţii generale. Testele
nestandardizate, cunoscute şi ca teste elaborate de profesor (din engl. teacher-made tests) sunt
aplicabile doar unei situaţii particulare sau unui anumit grup de elevi şi nu permit comparaţii
cu alte grupuri.
• În funcţie de modalitatea de interpretare a rezultatelor distingem testele normative de
testele criteriale. Testele normative presupun compararea rezultatelor unui subiect cu
rezultatele grupului de referinţă. Ele permit realizarea unui „clasament” al subiecţilor, fiind
valorizată posibilitatea de comparare inter-individuală. Testele criteriale presupun raportarea
rezultatelor unui subiect la un nivel prestabilit al performanţei în domeniul de interes.
Scorurile obţinute de un elev sunt interpretate în raport cu un criteriu, nu în contextul
rezultatelor grupului de referinţă. Distribuţia scorurilor la testele criteriale este asimetrică,
rezultatele concentrându-se la polul negativ.
• În funcţie de scopul aplicării lor şi a volumului conţinuturilor vizate, testele pot fi
formative şi sumative: primele contribuie la determinarea nivelului şi deficitului elevului şi la
orientarea sa în procesul învăţării, în timp ce ultimele sunt aplicate pe secvenţe mari (unităţi
de învăţare, semestre, ani şcolari, cicluri de învăţământ) şi au ca scop clasificarea elevilor și
chiar certificarea acestora (Stoica et al., 2001; Moise, 2007).
• După modul de prezentare a răspunsului, se disting teste obiective şi teste subiective.
Testele obiective solicită răspunsuri stricte, iar testele subiective implică răspunsuri formulate
diferit de fiecare subiect (Stoica et al., 2001; Moise, 2007).
• În funcţie de modalitatea de adminstrare, testele pot fi orale (aceasta este o variantă
preferabilă pentru preşcolari, de exemplu) şi scrise.
• În funcţie de limitele temporale impuse pentru rezolvarea testului, putem distinge testele
de randament (engl. speed-test) şi testele de nivel (engl. power-test). Spre deosebire de testele
de nivel sau de performanţă, testele de randament presupun rezolvarea itemilor între limite de
timp clar precizate.
• În funcţie de momentul în care sunt aplicate (Radu, 2000), testele pot fi iniţiale
(administrate înainte ca orice intervenţie educaţională să fi avut loc), de progres (administrate
în timpul desfăşurării intervenţiei educaţionale) şi finale (administrate după încheierea
intervenţiei educaţionale).
4.3.3.1. Itemii cu răspuns dual se elaborează sub forma unor enunţuri complete, pe
care examinatul trebuie să le accepte sau să le respingă. Răspunsurile sunt marcate cu ajutorul
unor inţiale (A – F, dacă răspunsul este considerat adevărat, respectiv fals; menţionăm că se
poate introduce şi varianta O reprezentând faptul că enunţul este o opinie, nefiind nici
adevărat, nici fals) sau al cuvintelor DA - NU, plasate în faţa fiecărui enunţ sau după acesta.
Acest tip de item este alcătuit dintr-o instrucţiune pentru cel examinat și unul sau mai
multe enunţuri conţinând sarcina de rezolvat, însoţite de variantele de răspuns (DA - NU;
Adevărat - Fals etc.). Există şi alternativa ca examinatul să plaseze (nu să bifeze) aprecierile
de tip A - F, Da – Nu, în relaţie cu itemii corespunzători. În general, itemii cu răspuns dual
conduc la evaluarea unor comportamente corespunzătoare nivelelor taxonomice inferioare
(cunoaşterea şi înţelegerea), însă pot fi utilizaţi în elaborarea testelor pentru majoritatea
disciplinelor de învăţământ.
Încercuieşte cuvântul “DA” dacă enunţul este scris corect şi cuvântul “NU” dacă enunţul este scris
incorect.
Ei hrănesc păsările. DA NU
Ei hrăneşte păsările. DA NU
Ele se joc în ogradă. DA NU
3
Toate exemplele de itemi sunt preluate din testele administrate în contextul Evaluării naționale pentru clasa a
IV-a din anul 2005. Vezi Raportul SNEE pe site-ul www.edu.ro
Ele se joacă în ogradă. DA NU
Copiii harnici îngrijeşte puişorii. DA NU
Copiii harnici îngrijesc puişorii. DA NU
1. Scrie “X” în caseta din dreptul ilustraţiei care prezintă evaporarea apei.
Uneşte, printr-o linie, cuvintele din coloana A cu acelea care au înţeles opus din coloana B.
A B
rea tristeţe
mult încet
repede bună
s-a bucurat puţin
piticii urâţenie
frumuseţe uriaşii
s-a întristat
Trasează săgeţi, indicând hrana fiecărei fiinţe din ilustraţiile de mai jos:
Completează spaţiile punctate, alegând forma corectă dintre cuvintele scrise între paranteze.
Pisica ……………………. aşezat lângă sobă.
(s-a / sa)
Pisica ………………… doarme lângă sobă.
(s-a / sa)
Păsările călătoare ………………… întors.
(sau / s-au)
Tu cumperi cărţi ………………… caiete?
(s-au / sau)
Tata ……………… recomandat lui Ion să ………………… patinele.
(ia / i-a) (ia / i-a)
Vasile ……………… văzut pe Marin ……………… muzeu.
(la / l-a) (l-a / la)
Copiii …………………spus mamei că ………………... calificative bune.
(iau / i-au) (iau / i-au)
El …………………….. promis că ……………. merge în excursie.
(va / v-a) (v-a / va)
Avantaje ale itemilor cu răspuns scurt şi de completare (Mândruţ, 2001; Moise, 2007;
Cucoş, 2008)
• Atât itemii cu răspuns scurt, cât și cei de completare sunt relativ uşor de proiectat, de
aplicat şi de corectat/ notat.
• Au un grad ridicat de obiectivitate, în condiţiile elaborării unei scheme de notare adecvate.
• Permit evaluarea unei game largi de conţinuturi.
• Evită dezavantaje specifice itemilor obiectivi, de tipul ghicitului răspunsurilor, deoarece
nu i se oferă elevului variante de răspuns.
• Permit chiar mai multe variante corecte de răspuns, dacă acestea sunt incluse în schema de
notare.
Păsările migratoare
Se re-ntorc din tropice.
Gâzele depun la soare
Ouă microscopice.
Imaginează-ţi că eşti automobilist şi pleci în excursie. Câţi kilometri parcurgi pe fiecare din următoarele trasee:
Clădirea unei şcoli are 8 săli de clasă a câte 30 de locuri fiecare. La şcoală sunt 105 băieţi şi 125 fete. Câte
locuri vor rămâne libere dacă toţi elevii sunt prezenţi la şcoală?
Completează datele problemei în schema de mai jos şi scrie semnul potrivit pe spaţiul punctat, apoi
rezolvă.
Avantaje ale itemilor de tip rezolvare de probleme (Mândruţ, 2001; Moise, 2007; Cucoş,
2008)
• Modalitatea de elaborare a acestor itemi stimulează gândirea creativă a elevilor şi
încurajează transferul de proceduri şi metode de rezolvare a problemelor în interiorul aceluiaşi
domeniu sau între domenii diferite.
• Favorizează activităţile de rezolvare în echipă (dacă sunt proiectaţi în acest sens) şi
dezvoltarea abilităţilor autoevaluative.
• Încurajează elevul să analizeze comparativ mai multe metode, căi de rezolvare a unei
probleme şi să ia decizii cu privire la cea mai adecvată dintre ele.
• Permit utilizarea unor materiale diverse, unele dintre ele favorizând contactul cu elemente
ale vieţii cotidiene.
Limite ale itemilor de tip rezolvare de probleme
• Proiectarea acestor itemi este cronofagă.
• Elaborarea schemei de corectare şi de notare este dificilă, lăsând uneori loc interpretărilor
subiective ale evaluatorului.
• Timpul de administrare şi de corectare este mai îndelungat decât în cazul itemilor
obiectivi şi semiobiectivi.
Exemplul 1 (item de tip eseu structurat / scurt) – Limba română, Varianta 2, Itemul 8
Temă obligatorie 1
Elaboraţi un set de exemple de itemi obiectivi, semiobiectivi și subiectivi (câte două exemple
pentru fiecare tip de item, adaptate la specificul învățământului preșcolar și primar).
4.3.6. Calităţile testului
Pentru a putea aplica un test este necesară verificarea calităţilor sale globale (Karmel
şi Karmel, 1978; Radu, 2000; Moise, 2007) - obiectivitate, aplicabilitate, fidelitate şi
validitate, precum şi a calităţilor fiecărui item – dificultate şi putere de discriminare.
Obiectivitatea unui test docimologic se referă la caracterul explicit şi la claritatea
itemilor, care să permită obţinerea de scoruri comparabile în cazul unor evaluatori competenţi.
Dacă scopul administrării unui test nu este clarificat înainte de începerea proiectării sau dacă
sunt omise etape de proiectare a acestuia, există riscul de a genera erori în calcularea și
interpretarea scorurilor, care nu se datorează evaluatorului, ci neglijenței celui care a elaborat
testul.
Aplicabilitatea se referă la adecvarea itemilor la conţinuturile vizate, la volumul de
timp şi resurse materiale necesar administrării care trebuie să fie rezonabil, la claritatea
modalităţii de calculare a scorurilor. Numărul de itemi și timpul alocat rezolvării testului
trebuie să fie rezonabil, iar instrucțiunile de aplicare trebuie să fie clare și precise. Scorurile la
testele docimologice sunt importante pentru a lua decizii educaționale potrivite și, de aceea,
treuie să fie deopotrivă ușor de calculat și de interpretat. De asemenea, ele trebuie să permită
explicații și pentru alți actori educaționali decât profesorul (în special elevii și părinții).
Fidelitatea şi validitatea sunt adesea folosite în mod eronat ca sinonime, însă cele
două concepte au accepţiuni diferite – în timp ce fidelitatea se referă la consistenţa sau
stabilitatea unui test, validitatea indică proporția în care un test surprinde ceea ce şi-a propus
să măsoare. Un instrument de evaluare poate avea o fidelitate ridicată, fără a fi valid, însă un
test valid are cu siguranţă o fidelitate ridicată.
C) Validitatea de construct sau conceptuală se referă la cât de bine este transpus într-
un instrument un concept (o competenţă, un comportament etc.). Evaluarea validităţii de
construct presupune atât un demers teoretic, cât şi un demers empiric: parcurgerea
bibliografiei de specialitate ce cuprinde date anterioare cu privire la acelaşi construct/concept
şi claritatea raţionamentelor ipotetico-deductive sunt la fel de importante ca procedurile
bazate pe date empirice.
Cu alte cuvinte, dacă un profesor ar dori să proiecteze un test pentru o unitate de
învățare despre „viețuitoare acvatice” ar trebui să studieze cu atenție programa școlară pentru
a identifica obiectivele de referință aplicabile, elementele de conținut care trebuie avute în
vedere, dar și schițele de proiecte pentru a-și reaminti gama de comportamente vizate la elevi
în fiecare lecție. De asemenea, ar trebui să analizeze teste proiectate de alți colegi, eventual
publicate în culegeri, pentru a se asigura că va selecta un eșantion reprezentativ de
comportamente și de conținuturi care vor fi vizate. În cazul testelor docimologice, tabelul sau
matricea de specificații (pe care o com prezenta detaliat în secțiunea destinată proiectării
testului) constituie un instrument de asigurare a validității de construct.
Fidelitatea se poate estima prin intermediul a patru modalităţi diferite (Thomas, 1998;
Gliner şi Morgan, 2000):
A) Fidelitatea test-retest (exprimată statistic prin coeficientul de stabilitate) presupune
ca aplicarea instrumentului de evaluare aceloraşi subiecţi, în momente diferite, să conducă la
obţinerea unor rezultate comparabile. Evaluarea acestui tip de fidelitate poate conduce la erori
provenite din familiarizarea subiecţilor cu întrebările, fiind posibil ca stabilitatea rezultatelor
să fie dată de memorarea întrebărilor şi a răspunsurilor, nu de calităţile instrumentului. De
aceea, evaluatorul trebuie să se asigure că intervalul de timp între cele două aplicări este
suficient de lung pentru a evita acest tip de eroare.
C) Fidelitatea estimată prin consistenţa internă sau omogenitatea unui test se referă
pe de o parte, la măsura în care toţi itemii relaţionează între ei şi, pe de altă parte, la măsura în
care fiecare item relaţionează cu rezultatul total obţinut de subiecţi. Au fost elaborate şi sunt
utilizate mai multe metode de calcul a coeficientului de consistenţă internă, dintre care cele
mai cunoscute sunt (Gliner şi Morgan, 2000): metoda înjumătăţirii (engl. split-half), metoda
Kuder-Richardson și metoda de calcul a coeficientului alpha Cronbach.
Având în vedere aceste date, calculăm coeficientul de corelaţie Pearson (r), utilizând
formula:
Σxy
r=
Σx 2 ⋅ Σy 2
În exemplul nostru, dacă înlocuim rezultatele noastre în formulă, vom obține:
7,50
r12 = = 0,73
16,10 ⋅ 6,50
Pe baza acestei corelaţii între cele două jumătăţi ale testului, se calculează fidelitatea
întregul test rt, utilizând corecţia Spearman-Brown:
2 ⋅ r12 2 ⋅ 0,73
rt = = = 0,84
1 + r12 1 + 0,73
Această cifră reprezintă o corelaţie puternică, dacă avem în vedere faptul că unii autori
sugerează că valorile acceptabile sunt cuprinse între 0,70 - 0,90, iar cele ideale, peste 0,90
(Anastasi, 1975; Evans 1985).
Metoda înjumătăţirii pentru estimarea fidelităţii este adecvată doar în cazul testelor
alcătuite din itemi cu punctaje identice (de exemplu, itemi cu răspuns dual pentru care
răspunsurile pot fi notate cu 1 şi 0; itemi cu alegere multiplă, varianta răspuns corect etc.).
k Σpq
Formula KR 20 rKR20 = (1 − 2 )
k −1 s
k M (k − M )
Formula KR 21 rKR21 = (1 − )
k −1 k * s2
ITEMI X x
Elevi 1 2 3 4 5 6 7 8 9 10 Scor total test (X-M) x2
A 1 1 1 1 1 0 1 1 1 1 9,00 2,80 7,84
B 1 1 1 0 0 1 1 0 1 1 7,00 0,80 0,64
C 1 1 1 1 1 0 0 1 1 0 7,00 0,80 0,64
D 1 1 1 0 1 1 1 0 0 0 6,00 -0,20 0,04
E 1 1 1 1 0 0 0 0 0 0 4,00 -2,20 4,84
F 0 1 1 1 1 0 0 0 0 0 4,00 -2,20 4,84
G 1 1 1 1 1 1 1 1 1 0 9,00 2,80 7,84
H 1 1 0 0 0 0 1 0 0 0 3,00 -3,20 10,24
I 1 1 0 0 1 1 1 1 0 0 6,00 -0,20 0,04
J 1 1 1 0 0 0 1 1 1 1 7,00 0,80 0,64
∑ 9 10 8 5 6 4 7 5 5 3
M= 6,20 0,00 ∑x2= 37,60
Pe lângă rezultatele elevilor, în tabel sunt prezentate scorurile totale obținute de fiecare elev
pentru întregul test (X), media scorurilor obținute de elevi (M), abaterea de la medie a fiecărui
scor (x= X-M) și abaterea pătratică de la medie (x2)4.
Înlocuind aceste valori în formula dispersiei pe care o cunoaștem [s2= Σ(X – M)2 / N-1],
obținem valoarea acesteia s2= 4,17.
4
Toate detaliile de calcul pentru aceste valori vă sunt cunoscute de la cursul de Metodologia cercetării
pedagogice.
Valorile p 0,90 1,00 0,80 0,50 0,60 0,40 0,70 0,50 0,50 0,30
Valorile q 0,10 0,00 0,20 0,50 0,40 0,60 0,30 0,50 0,50 0,70
p*q 0,09 0,00 0,16 0,25 0,24 0,24 0,21 0,25 0,25 0,21
∑ pq 2,04
k Σpq 10 2,04 10
rKR20 = (1 − 2 ) = (1 − ) = (1 − 0,49) = 1,11 * 0,51 = 0,56
k −1 s 10 − 1 4,17 9
k M (k − M ) 10 6,20(10 − 6,20)
rKR21 = (1 − 2
) = (1 − ) = 1,11 * 0,44 = 0,48
k −1 k *s 9 10 * 4,17
Dacă vom compara cele două valori ale coeficienților de corelație, vom observa că cea
obținută prin aplicarea formulei KR 21 este mai mică, deoarece aceasta este, în fapt, o
estimare simplă a formulei KR 20, care are la bază asumpția că toți itemii dintr-un test au un
nivelul de dificultate apropiat. În ciuda acestui dezavantaj, formula KR 21 este mai simplu de
utilizat, deoarece presupune doar calcularea mediei și a dispersiei.
Coeficientul Alpha Cronbach (α) este utilizat frecvent pentru a estima consistenţa
internă a testelor care includ itemi care au și răspunsuri parțial corecte, acestea fiind notate cu
mai mult de două scoruri diferite (de exemplu, 0, 1, 2 și 3). Un bun exemplu în acest sens sunt
itemii de tip eseu, pentru care se notează și răspunsurile parțiale (Linn și Gronlund, 2000;
Gallagher, 1998; Nitko, 2001). De asemenea, se recomandă şi în cazul testelor care includ mai
multe tipuri de itemi. Coeficientul de fidelitate Alpha Cronbach este o variantă a formulelor
Kuder-Richardson și, ca și acestea, estimează media coeficienților de fidelitate care ar fi
obținuți prin metoda înjumătățirii, dacă aceștia ar fi calculați pentru toate variantele posibile
de împărțire a unui test în două jumătăți.
2
k Σs
(1 − k2 ) ,
r=
k −1 sx
unde k este numărul de itemi dintr-un test, sk reprezintă dispersia fiecărui item, iar sx2 este
2
În tabelul de mai jos sunt notate valorile dispersiei pentru fiecare item din testul utilizat ca
exemplu, precum şi valoarea dispersiei pentru scorurile totale.
ITEMI X
1 2 3 4 5 6 7 8 9 10 Scor total test
sk2 0,10 0 0,17 0,27 0,26 0,26 0,23 0,27 0,27 0,23 sx2=4,17
∑ sk2=2,06
Înlocuind aceste valori în formulă obţinem:
2
k Σs 10 2,06
r = (1 − k2 ) = (1 − ) = 1,11 * (1 − 0,49) = 1,11 * 0,51 = 0,56
k −1 sx 9 4,17
Dacă vom compara valoarea coeficientului de fidelitate obţinut prin formula KR 20 şi cel
obţinut prin formula Alpha Cronbach vom observa apropierea lor (doar primele două
zecimale sunt prezentate, ceea ce ar putea conduce la concluzia că cele două valori sunt chiar
identice). Dată fiind această similitudine, nu se recomandă utilizarea amândurora pentru
acelaşi test, deoarece nu furnizează informaţii suplimentarea privind fidelitatea acestuia.
Cea mai frecventă eroare în interpretarea coeficienților de fidelitate derivați din
formulele Kuder-Richardson este aceea că se confundă consistenţa internă cu validitatea de
construct: deşi este un bun estimator al fidelităţii unui instrument, acest coeficient nu
garantează validitatea de construct a unui instrument, ci faptul că rezultatul pentru fiecare
item considerat separat corelează cu rezultatele pentru ceilalți itemi și cu rezultatul pentru
întregul test (Gliner şi Morgan, 2000).
Să presupunem că doi evaluatori au corectat și notat același test, rezolvat de aceiași elevi.
Scorurile pe care le-au acordat pentru 5 elevi sunt sintetizate în tabelul de mai jos.
Procentajul de acord între cele două seturi de scoruri poate fi cuprins între 100% și 0% și se
calculează după formula:
N
Pa = a ⋅ 100 ,
Ns
unde Ns este numărul total de scoruri calulate de către fiecare evaluator, iar Na este numărul
situațiilor în care cei doi evaluatori au fost acordat același scor.
Cei doi evaluatori din exemplul nostru au acordat același scor în 3 (Na) cazuri din 5
(Ns). Dacă înlocuim aceste date în formulă obținem:
N 3
Pa = a ⋅ 100 = ⋅ 100 = 60%
Ns 5
Așadar, precentajul de acord între cei doi evaluatori este de 60%. Am putea considera
că acesta este suficient de mare, dar după unii autori valoarea sa ar trebuie să fie de peste 80%
(Nitko, 2001).
Ca şi în cazul validităţii, există o serie de factorii care pot influenţa fidelitatea unui
test (Linn şi Gronlund, 2000; Nitko, 2001):
• Numărul itemilor poate influenţa fidelitatea unui test, în sensul că fidelitatea testului
creşte odată cu numărul acestora. Un test cu un număr mai mare de itemi scade şi posibilitatea
ca elevii să ghicească răspunsul corect. Această regulă a fost oarecum sugerată de calculul
fidelităţii prin înjumătăţire, dacă avem în vedere că aplicarea formulei Spearman-Brown a
generat un coeficient de fidelitate mai mare.
• Variabilitatea sau împrăştierea scorurilor are un efect asupra fidelităţii, în sensul că cu
cât aceasta este mai mare cu atât creşte şi valoarea coeficienţilor de fidelitate. Această relaţie
se explică prin faptul că fidelitatea unui test creşte odată cu scăderea posibilităţii ca un elev să
îşi schimbe poziţia în ierarhia grupului. Dacă variabilitatea scorurilor este mică, probabilitatea
ca un elev să obţină un scor care să-l plaseze în altă zonă a clasamentului la o eventuală re-
aplicare a testului creşte.
• Obiectivitatea testului influenţează şi fidelitatea sa. În cazul testelor obiective, pentru
care schemele de corectare şi notare sunt foarte precise, acest factor nu reprezintă o problemă
majoră. Un plus de atenţie trebuie, aşadar, acordat elaborării baremelor de corectare şi de
notare pentru testele obiective, astfel încât doi evaluatori să ajungă la rezultate finale
comparabile. Excluderea itemilor subiectivi din evaluare nu constituie o soluţie, întrucât o
asemenea decizie ar afecta validitatea testului, cea mai importantă calitate a acestuia.
Comportamentele complexe, corespunzătoare nivelelor taxonomice înalte nu pot fi măsurate
întodeauna cu itemi obiectivi sau semiobiectivi. Aşadar, soluţia constă în precizia baremelor
de corectare şi notare, care va conduce şi la o creştere a fidelităţii inter-evaluatori.
• Fidelitatea depinde şi de metoda utilizată pentru calcularea sa. Aşa cum aţi observat
şi din exemplele utilizate pentru calculul coeficienţilor de fidelitate, metoda pentru care optăm
are impact direct asupra valorii acestora. Astfel, coeficientul de stabilitate poate fi mai mare
decât cel obţinut prin metoda înjumătăţirii, dacă intervalul de timp dintre măsurări este scurt.
În cazul fidelităţii estimate prin teste alternative, coeficienţii sunt mai mici decât în situaţia în
care aplicăm metoda înjumătăţirii sau calculăm coeficientul de stabilitate. În plus, cu cât
intervalul de timp dintre aplicări creşte, coeficientul de fidelitate scade. Coeficientul de
fidelitate calculat prin metoda înjumătăţirii este mai ridicat în cazul testelor de randament
(acele teste care au limită de timp). Toţi coeficienţii de fidelitate derivaţi din metoda Kuder-
Richardson au valori mai mici decât cei obţinuţi prin metoda înjumătăţirii şi sunt afectaţi în
sens pozitiv în cazul în care testul are limită de timp.
Analiza validității și a fidelității unui test sunt completate prin analiza calităților
fiecărui item sau analiza de item care presupune estimarea dificultății și a puterii de
discriminare pentru fiecare item, precum și analiza distractorilor. De regulă, indicele de
dificultate şi cel de discriminare se calculează pentru testele normative. Valoarea lor poate fi
calculată şi pentru testele criteriale, dar este lipsită de relevanţă, deoarece acestea nu vizează
ierarhizarea elevilor prin comparaţii intra-grup, ci raportarea achiziţiilor elevului la
obiectivele educaţionale care constituie criteriile. Analiza distractorilor este, evident, posibilă
doar în cazul itemilor care includ asemenea variante de răspuns.
Indicele de dificultate al unui item (Anastasi, 1976; Karmel şi Karmel, 1978; Radu,
2000; Moise, 2007) este, în fapt, o estimare a procentului de subiecţi care rezolvă corect un
item și se poate calcula folosind formula:
C + Ci
I dif = s ,
2⋅n
unde Cs reprezintă numărul de răspunsuri corecte din segmentul superior al clasamentului
elevului, realizat în funcție de scorurile totale la test; Ci reprezintă numărul de răspunsuri
corecte din segmentul inferior al clasementului; iar n este numărul de subiecţi dintr-un
segment sau subgup.
Practic, grupul de subiecți cărora li s-a administrat testul se împarte în trei, patru sau
cinci grupuri egale, în funcție de scorul total obținut la test, iar în calculul indicelui de
dificultate de iau în considerare doar cazurile extreme (cei mai buni 20-30% și cei mai slabi
20-30%). Valoarea indicelui de dificultate variază între 0 şi 1 (în formă procentuală). Cu cât
este mai aproape de 0, cu atât itemul este mai dificil, iar apropierea de valoarea 1 sugerează
un nivel mai scăzut de dificultate. Itemii prea uşor sau prea dificil de rezolvat nu oferă
informaţii relevante despre subiecţi şi sunt eliminaţi în etapa de revizuire a testului. Din punct
de vedere strict statistic, itemul „ideal” ar fi cel care este rezolvat corect de 50% dintre
subiecţi. În cazul unui test normativ, dificultatea optimă este între cuprinsă între 0,40 - 0,50,
dar, în general, se acceptă un coeficient de dificultate cuprins între 25% şi 75%.
Iată cum ar trebui să procedăm dacă am dori să calculăm indicele de dificultate al itemului 7
dintr-un test aplicat unui număr de 10 elevi, ale căror scoruri sunt prezentate în tabelul de mai
jos.
ITEMI
Elevi 1 2 3 4 5 6 7 8 9 10 Scor total test
A 1 1 1 1 1 0 1 1 1 1 9,00
B 1 1 1 0 0 1 1 0 1 1 7,00
C 1 1 1 1 1 0 0 1 1 0 7,00
D 1 1 1 0 1 1 1 0 0 0 6,00
E 1 1 1 1 0 0 0 0 0 0 4,00
F 0 1 1 1 1 0 0 1 0 0 5,00
G 1 1 1 1 1 1 1 1 1 0 9,00
H 1 1 0 0 0 0 1 0 0 0 3,00
I 1 1 0 0 1 1 1 1 0 0 6,00
J 1 1 1 0 0 0 1 1 1 1 7,00
După ce am calculat scorurile total la test, vom împărți grupul de 10 elevi în 5 grupuri (fiecare
grup va fi alcătui din câte 2 elevi). Dacă îi vom ierarhiza în funcție de scorurile totale, vom
obține următorul tabel:
ITEMI
Elevi 1 2 3 4 5 6 7 8 9 10 Scor total test
H 1 1 0 0 0 0 1 0 0 0 3
E 1 1 1 1 0 0 0 0 0 0 4
F 0 1 1 1 1 0 0 1 0 0 5
D 1 1 1 0 1 1 1 0 0 0 6
I 1 1 0 0 1 1 1 1 0 0 6
B 1 1 1 0 0 1 1 0 1 1 7
C 1 1 1 1 1 0 0 1 1 0 7
J 1 1 1 0 0 0 1 1 1 1 7
A 1 1 1 1 1 0 1 1 1 1 9
G 1 1 1 1 1 1 1 1 1 0 9
Pentru a calcula indicele de dificultate al itemului 7, avem nevoie de scorurile pentru acest
item al primilor doi și al ultimilor doi elevi. Ambii elevi din segmentul superior (A și G),
precum și un elev in segmentul inferior (H) au rezolvat itemul. Dacă înlocuim aceste date în
formulă, obținem:
C + Ci 2 + 1
I dif = s = = 0,75
2⋅n 4
Așadar, itemul 7 din exemplu nostru este relativ ușor, deoarece valoarea sa este mai aproape
de 1 decât de 0.
Deşi analiza itemilor constituie un demers obligatoriu cel puţin în vederea proiectării
mai corecte testelor pentru o secvenţă de evaluare viitoare, ar trebui avute în vedere o serie de
nuanţe privind interpretarea sa (Lin şi Gronlund, 2000; Nitko, 2001):
• Puterea de discriminare a unui item nu oferă informaţii şi despre validitatea acestuia. În
calcularea coeficientului de discriminare se folosesc scorurile de la întregul test pentru a
împărţi grupul se elevi în subgrupuri, adică un criteriu intern şi nu unul extern. O valoarea
adecvată a indicelui de discriminare ilustrează validitatea unui item, doar în cazul în care
validitatea întregului test a fost deja demonstrată. În evaluarea pe care o realizăm la clasă,
rareori ne putem permite să realizăm o analiză de validitate completă şi, de aceea, indicele
de discriminare trebuie interpretat cu precauţie.
• Un indice scăzut al discriminării nu indică întotdeauna un item formulat în completă
eroare. Itemii care nu discriminează între elevii buni şi cei slabi trebuie analizaţi în special
sub aspectul formulării, care poate fi ambiguă, inexactă sau poate induce unor elevi
răspunsul corect. Testele elaborate de profesor pentru utilizarea la clasă sunt proiectate
pentru a măsura comportamente pe mai multe nivele taxonomice (cunoaştere, înţelegere,
aplicare etc). Dacă un test cu 20 de itemi care vizează cunoaşterea şi înţelegerea include
15 itemi pentru nivelul cunoaştere şi 5 itemi pentru nivelul înţelegere, puterea de
discriminare a itemilor care măsoară înţelegerea va fi cu siguranţă mai mică. Un prim
motiv este acela că itemii care vizează înţelegerea sunt mai puţin reprezentaţi în întregul
test, iar un al doilea ar fi slaba corelaţia între itemii care măsoară cunoaşterea şi cei care
măsoară înţelegerea pe care cercetătorii au demonstrat-o anterior (Linn şi Gronlund,
2000). Dacă am exclude aceşti itemi din test, am obţine un test mai omogen, dar
validitatea sa ar scădea pentru că nu am mai surprinde întreaga gamă de comportamente
pe care le-am vizat în activitatea de predare-învăţare.
• Între indicele de dificultate şi indicele de discriminare se stabilesc relaţii complexe care
trebuie avute în vedere în interpretarea lor. Astfel, în principiu, un item cu dificultatea
0,50 (itemul „ideal”) poate avea un indice de discriminare maxim (1), dar această relaţie
între cele două valori ale indicilor nu este garantată. Dacă jumătate dintre elevii din
segmentul superior şi, respectiv, din segmentul inferior ar rezolva corect un item, indicele
de dificultate ar rămâne 0,50, dar valoarea indicelui de discriminare ar fi 0. Cu cât ne
îndepărtăm de valoarea 0,50 a indicelui de dificultate, iar itemii devin fie mai uşori, fie
mai dificili, valoarea indicelui de discriminare scade. Aşadar, itemii cu nivel foarte scăzut
sau foarte ridicat de dificultate au o putere de discriminare redusă. În luarea deciziilor
privind excluderea unor itemi trebuie avute în vedere cel puțin două considerații
importante: pe de o parte, o slabă putere de discriminare poate indica probleme în
formularea clară a cerințelor și nu deficiențe de conținut, iar pe de altă parte, testele
elaborate de către profesor pentru a fi aplicate la clasă nu vizează întotdeauna
discriminarea de finețe între rezultatele elevilor. Astfel, eliminarea itemilor cu putere de
discriminare mică poate influența negativ validitatea testului.
• Analiza de itemi trebuie întotdeauna interpretată cu precauție atunci când se realizează pe
grupuri mici de elevi, cum sunt clasele. În mod evident, rezultatele analizei de itemi sunt
influențate de volumul lotului de elevi cărora li se administrează testul și, de aceea,
rezultatele sale pentru o clasă de elevi trebuie interpretate prudent. Vor fi excluși din test
doar acei itemi care sunt în mod evident prea dificili ori prea facili și care discriminează
negativ, dar fără a interpreta rigid limitele numerice sugerate de specialiști.
Conţinuturi/
Achiziţia informaţiei Înţelegere Aplicare Analiză Total
Obiective
Element de conţinut 1 10 (2) - - - 10 (2)
Element de conţinut 2 10 (2) 10 (2) 5 (1) - 25 (5)
Element de conţinut 3 - 10 (2) 25 (5) - 35 (7)
Element de conţinut 4 10(2) 10 (2) - 10 (2) 30 (6)
Total 30 (6) 30 (6) 30 (6) 10 (2) 100 (20)
Pentru a uşura activitatea de elaborare a matricei de specificaţii se poate opta pentru trecerea
în fiecare celulă a numărului de itemi care vor fi proiectaţi (în exemplul de mai sus, numărul
de itemi este notat în paranteză). Atât procentele, cât şi numerele de însumează pe verticală şi
pe orizontală.
În funcţie de scopul şi tipul testului care trebuie proiectat, se poate elabora o matrice
de specificaţii generală sau detaliată (Stoica, 2001).
Matricea de specificaţii generală este utilă în proiectarea testelor sumative care
vizează conţinuturi largi şi obiective cu nivele de complexitate ridicate. Ele specifică unităţi
mari de conţinut şi nivele taxonomice generale (ca în exemplul general sugerat inițial).
Matricea de specificaţii detaliată este recomandată în cazul testelor sumative care
vizează conţinuturi mai restrânse (evaluare la finalul unei unităţi de învăţare, la finalul unui
semestru etc.) şi chiar în cazul testelor formative (care pot viza conţinutul unei singure lecţii
şi, în mod evident, nu pot ţinti decât anumite nivele taxonomice). Ea poate detalia
conţinuturile care vor fi acoperite prin test sau nivelele taxonomice, dar poate include
informaţii amănunţite şi despre ambele dimensiuni.
C) Formularea itemilor constituie cea mai laborioasă etapă a elaborării unui test pedagogic.
D) Stabilirea unei grile de corectare care să includă răspunsurile corecte pentru fiecare item
uşurează considerabil activitatea evaluatorului.
Dacă este vorba de teste nestandardizate sau elaborate de profesor, etapa următoare
include aplicarea testului, în timp ce în cazul testelor standardizate această etapă este
pregătită de etapele de pretestare şi de revizuire, reformulare şi definitivare a acestuia. A.
Anastasi (1976, p. 413) indică însă că şi în cazul testelor nestandardizate trebuie realizată o
pretestare care să includă o analiză a itemilor (calcularea coeficientului de dificultate şi a celui
de discriminare, analiza distractorilor).
F) Pretestarea are în vedere verificarea calităţilor globale ale testului (Karmel şi Karmel,
1978; Radu, 2000; Moise, 2007) - obiectivitate, aplicabilitate, fidelitate şi validitate, precum şi
a calităţilor fiecărui item – dificultate şi putere de discriminare, calitatea distractorilor.
G) În ultima etapă de construire a unui test – revizuirea acestuia, o parte dintre itemi sunt fie
reformulaţi, fie eliminaţi în funcţie de rezultatele analizei privind caracteristicile prezentate
anterior. Pentru a fi corect aplicat un test docimologic standardizat, ca şi un test psihologic
trebuie însoţit de un manual de utilizare care să includă toate detaliile tehnice, precum şi
informaţii complete privind administrarea şi maniera de calculare a scorurilor.
Temă obligatorie 2
Proiectaţi un test docimologic pentru învățământul primar (proiectat după regulile prezentate
în curs, însoțit de schema de corectare și de notare și de descriptori de perfomanță5).
5
Descriptorii de performanță vor fi descriși în secțiunea destinată notării ca metodă de apreciere a rezultatelor
elevului.
Având în vedere spectrul redus de metode de verificare tradiționale la care se poate
face apel în învățământul preșcolar, metodele complementare pot constitui un suport real în
activitatea evaluativă. Din păcate, acestea nu beneficiază de „tratament egal” în competiția cu
metodele tradiționale de verificare, fiind prezentate în literatură destul de sumar. Acest fapt
conduce la erori în înțelegerea și aplicarea acestor metode, ceea ce se răsfrânge apoi în
activitatea de evaluare din școli și din clase: elevii pregătesc portofolii imprimând diverse
materiale care se pot găsi on-line și nu înțeleg motivele pentru care iau note mai mici decât
alți colegi care, poate, au procedat la fel; părinții fie se implică prea mult în realizarea unui
portofoliu împreună cu copilul lor, fie sunt nemulțumiți de utilizarea acestuia ca metodă de
evaluare; în sfârșit, profesorii nu obțin informații suplimentare privind achizițiile elevului, pe
care nu le pot verifica prin apelul la metode tradiționale, mai puțin costisitoare și cronofage
decât cele complementare.
Așadar, o introducere în utilizarea mai riguroasă a metodelor complementare de
verificare se impune cu necesitate. În acest curs nu vom aborda unele dintre metodele
complementare de verificare (de exemplu, referatul, harta conceptuală, jurnalul reflexiv)
pentru că le considerăm mai puțin aplicabile în învățământul preșcolar și primar, ci ne vom
concentra atenția asupra celor care pot fi utilizate în evaluarea copiilor de vârste mici:
portofoliul, proiectul, investigația, observaţia sistematică a activităţii şi comportamentului
elevului, autoevaluarea şi interevaluarea.
4.4.1. Portofoliul poate fi definit ca o colecție de produse ale activității elevului, care
sunt reunite pentru a documenta fie achiziții ale elevului, fie progresul sau dezvoltarea
acestuia (Gallagher, 1998; Linn și Gronlund, 2000). Realizarea unui portofoliu presupune
stabilirea unui scop clar pentru care sunt colectate lucrări și produse ale elevului.
Scopul pentru care se elaborează portofoliile se poate constitui într-un criteriu general
de clasificare a tipurilor de portofolii care pot fi folosite în școală (Arter, Spandel și Culham,
1995 citați de Linn și Gronlund, 2000). Astfel, portofoliile pot fi instrucționale sau evaluative.
Cu alte cuvinte, putem utiliza portofoliul nu doar ca metodă de evaluare, ci și ca metodă
didactică, pentru a încuraja elevii să se pregătească permanent, dar și pentru a le forma
deprinderile de a selecta cele mai bune lucrări pe care le realizează de-a lungul unei perioade
de timp. Evident, portofoliul instrucțional are o dimensiune evaluativă, dacă avem în vedere
faptul că elevii sunt încurajați să-și autoevalueze activitatea și produsele. Portofoliul de
evaluare poate fi folosit ca produs global al elevului pentru stabilirea unei note și constrânge
la stabilirea unui set bine precizat de produse, lucrări etc. care vor fi realizate de către toți
elevii unei clase, pentru a asigura justețea actului de evaluare și posibilitatea de a compara
achizițiile demonstrate de fiecare elev. Această metodă complementară poate fi folosită atât în
evaluarea continuă, formativă, cât și în evaluarea sumativă, cu precizarea că utilizarea sa în
evaluarea formativă nu trebuie să se finalizeze în mod obligatoriu prin notă. Portofoliile
pregătite în contextul evaluării formative pot fi considerate oportunități pentru feedbackul
continuu atât de necesar profesorului și elevului, dar și pentru încurajarea autoevaluării la
elev.
Literatura pedagogică internațională descrie și alte modalități de clasificare a
portofoliilor (Gallagher, 1998; Linn și Gronlund, 2000):
• Portofoliile pot include produse ale activității elevului care să ilustreze achizițiile elevului
la un moment dat, dar poate fi utilizat și cu scopul de a analiza progresul sau devoltarea
elevului. Portofoliul de achiziții al elevului se poate realiza într-o perioadă de timp relativ
scurtă și include doar lucrări sau produse finalizate, care pot fi apreciate global printr-o
notă. Prin contrast, portofoliul de progres sau de dezvoltare poate include și lucrări sau
produse neterminate de către elev și chiar mai multe versiuni ale acelaiași lucrări care să
pună în lumină evoluția într-o perioadă mai lungă de timp. Portoliul de progres poate fi
proiectat pentru un întreg ciclu de învățământ și poate însoți copilul pe parcursul mai
multor ani, astfel încât profesorii să poată avea informații despre achizițiile anterioare ale
acestuia. În plus, portofoliul de progres poate constitui o modalitate eficientă de a
comunica părinților puntele tari și punctele slabe ale copilului și de a stimula implicarea
familiei în viața educațională a copilului.
• Portofoliul poate reuni cele mai bune lucrări ale elevului (așa-numitul portofoliu de
prezentare), dar poate avea și rolul de a documenta achizițiile elevului (portofoliul de
documentare). Portofoliul de prezentare îl are ca actor principal pe elev, care alege singur
sau sprijinit de colegi și profesor, cele mai bune lucrări ale sale pentru a ilustra nivelul
achizițiilor sale. Portofoliul de documentare are ca actor principal profesorul, care
selectează lucrări și produse ale activității elevului pe care le consideră importante pentru
a contura volumul și profunzimea achizițiilor.
• Portofoliul finalizat include doar lucrări și produse terminate, gata pentru a fi prezentate
unui public-țintă (gândiți-vă la portofoliul de angajare sau la portofoliul de lucrări necesar
pentru admiterea în învățământul superior artistic), în timp de portofoliul de lucru
documentează activitatea zilnică fiind util mai ales pentru evaluarea formativă. Portofoliul
de lucru este deschis și permite reveniri, corecturi, îmbunătățiri sau chiar înlocuirea
completă a unor piese.
• Portfoliul individual include lucrări ale unei singure persoane, în timp ce portofoliul
colectiv reunește lucrări realizate în grup, prin cooperare între două sau mai multe
persoane.
În învățământul preșcolar și primar românesc portofoliile nu sunt o noutate absolută:
cadrele didactice au alcătuit dintotdeauna mai ales portofolii de dezvoltare sau de progres
pentru elevi sau pentru întreaga clasă, fără a le asocia însă cu termenologia vehiculată în
prezent în teoria evaluării. Confuziile, nemulțumirile și erorile în utilizarea portofoliilor survin
mai ales ca urmare a lipsei de preoucupare pentru stabilirea unui scop clar pentru care acestea
sunt elaborate. Scopul și tipul portofoliului determină structura acestuia și posibilitățile de
utilizare pentru aprecierea prin notă.
Temă de reflecție
Încercați să rememorați 2-3 situații educaționale în care au fost utilizate portofolii. În ce
categorie din tipologia de mai sus ați putea încadra acele portofolii?
Pentru fiecare dintre aceste patru piese, profesorul trebuie să stabilească o schemă de
corectare și de notare, iar portofoliul în ansamblu trebuie prevăzut cu o schemă generală de
notare. Schema generală de notare a pieselor din portfoliu presupune o analiză a sarcinilor din
punct de vedere al complexității și al volumului de conținuturi acoperite, dar și o estimare a
efortului pe care elevul trebuie să-l depună. Punctajele acordate pentru fiecare piesă pot fi
diferențiate, printr-o asemenea analiză minimală, astfel încât elevul să se poată orienta în
activitatea de realizare a portofoliului.
Dacă avem în vedere același exemplu, schema generală de notare pentru portfoliul
nostru ar putea fi:
Deoarece punctajele nu sunt note care pot fi consemnate în catalog, profesorul trebuie
să stabilească și corespondanța între punctajele ce vor fi obținute de elevi și sistemul de notare
utilizat. În cazul învățământului primar românesc, sistemul de notare constă în calificative –
foarte bine, bine, suficient și insuficient. Iată cum am putea ilustra corespondența punctaj –
calificative pentru exemplul nostru:
Calificativ Punctaj
Foarte bine 86-100 puncte
Bine 61-85 puncte
Suficient 41-60 puncte
Insuficient 10-40 puncte
Așadar, dacă un elev va obține 82 de puncte pentru portofoliu, va primi calificativul bine.
Observați că stabilirea limitelor superioare și inferioare ale punctajelor se face ca în cazul
intervalelor din analiza de frecvențe grupate, fără a repeta limita superioară a unui interval de
puncte ca limită inferioară a intervalului următor.
De asemenea, pentru fiecare piesă prevăzută a fi inclusă în portofoliu, trebuie
construită o schemă de corectare și de notare, dar modalitățile de elaborare ale acesteia vor fi
detaliate în secțiunea din curs destinată notării, ca metodă de apreciere.
Aplicații
a. Descrieți piesele care ar putea fi incluse într-un portofoliu de dezvoltare sau de progres al
unui preșcolar, elaborat pentru a-i informa pe părinți și, ulterior pe profesorul pentru
învățământ primar/învățător cu privire la evoluția copilului.
c. Exemplificați structura și schema generală de notare a unui portofoliu pentru disciplina
Științe (învățământ primar).
d. Reflectați la structura unui portofoliu de evaluare sumativă pentru absolvenții de
învățământ superior care doresc să obțină certificarea de formare inițială pentru cariera
didactică. Ce piese ar putea include un asemenea portofoliu?
4.4.3. Investigaţia poate consta în experimente sau aplicații de mică amploare pe care
elevii trebuie să le planifice, să le realizeze, să le interpreteze și să le comunice adecvat. În
ciuda percepției comune care plasează investigația în sfera științelor, se pot imagina asemenea
situații evaluative și în cadrul științelor socio-umane. De exemplu, elevii dintr-o clasă a IV-a
ar putea fi solicitați să răspundă la întrebarea “Ce cred școlarii mici despre programele after-
school?” printr-un mic sondaj de opinie în rândul colegilor din școală. Ca și proiectul,
investigația se poate realiza fie individual, fie în grup, dar spre deosebire de acesta și de
portofoliu nu este recomandat pentru evaluări sumative care să se finalizeze prin notare.
Investigația este o metodă de verificare potrivită pentru evaluarea formativă, pentru că are
avantajul de a putea fi concepută în condiții naturale sau în condiții de laborator, pentru mai
toate disciplinele de învățământ și permite profesorului să surprindă atât volumul de
cunoștințe asimilat, cât și nivelul altor achiziții de tipul deprinderilor, atitudinilor etc.
Pentru a fi o sursă credibilă de informații pentru profesor, investigația trebuie
proiectată astfel încât să se respecte următoarele recomandări (Nitko, 2001): a) investigația
trebuie precedată de o conversație în care elevii, asistați de profesor, să formuleze ipoteze,
predicții privind fenomenul studiat și să stabilească modalitățile concrete prin care vor aduna
informații; b) elevii trebuie monitorizați pe tot parcursul procesului de colectare a
informațiilor relevante, dar și atunci când analizează și pregătesc un mic raport asupra
investigației; c) investigația se încheie prin prezentarea rezultatelor de către elevi, dar și prin
formularea unor concluzii pe baza datelor colectate; d) profesorul oferă elevilor feedback
privind modalitățile de colectare a datelor și concluziile formulate, sugerând care au fost
eventualele surse de erori.
Temă de reflecție
Exemplificați utilizarea investigației ca metodă de evaluare în învățământul preșcolar și
primar.
Folosirea numerelor sau a variantelor de răspuns le conferă un aer de acuratețe, dar acest
lucru nu este întotdeauna adevărat. De exemplu, deși nu există recomandări explicite privind un
număr maxim de trepte ce pot fi incluse într-o scară de clasificare, dacă acestea sunt mai multe de
șapte orice evaluator va avea dificultăți. Scara de clasificare are aceleași limite ca cele identificate
pentru lista de control, dar între avantaje câștigă unul suplimentar: permite documentarea
progresului unui elev, în cazul în care se aplică în mod repetat.
Aplicație
Proiectați o listă de control și o scară de clasificare pe care să le puteți utiliza în evaluarea
comportamentelor creative ale preșcolarilor.
Aplicație
Propuneți cinci exemple de întrebări utilizabile în procesul de interevaluare prin tehnica
nominalizării la vârsta preșcolară și școlară mică.
Temă obligatorie 3
Redactaţi un eseu de 3-4 pagini în care să comparaţi metodele tradiţionale şi complementare
(alternative) de evaluare.
5. Metode de apreciere
5.1. Notarea
Aplicație
Dați exemple de cel puțin două scări informale de notare care pot fi utilizate în învățămîntul
preșcolar. Argumentați oportunitatea și utilitatea lor în aprecierea rezultatelor preșcolarilor.
Exemplu de indicatorii de evaluare pentru standadrul S1: Să scrie, să citească şi să poziţioneze pe axă numere
mai mici decât 1 000 000.
Minim
- Să scrie, după dictare, numere naturale mai mari decât 100 000.
- Să scrie cu cifre, cu numere scrise cu litere, când acestea are la toate ordinele cifre diferite de zero.
- Să poziţioneze pe axă numere naturale mai mici decât 100 000.
Maxim
- Să scrie după dictare, cu cifre şi litere, numere naturale până la 1 000 000, la care trebuie poziţionate
mai multe zerouri în interior, pentru a marca absenţa a 2-3 ordine consecutive sau clase, respectând
corectitudinea elementelor grafice
- Să poziţioneze pe axă numere naturale până la 1 000 000.
Aplicație
Elaborați cel puțin cinci descriptori de performanță, pentru tot atâtea obiective ale unor probe de
evaluare pentru discipline diferite. Reflectați la dimensiunile cantitative și calitative incluse în
formularea descriptorilor.
Notarea normativă este utilă și recomandată mai ales în situațiile în care numărul elevilor
evaluați este foarte mare, iar poziția relativă a rezultatului obținut de fiecare elev în comparație cu
performanțele celorlalți consituie scopul administrării unei probe (ceea sugerează și importanța
ierarhizării, uneori în scopuri de selecție pentru un program de studii). Aceste condiții nu sunt
îndeplinite decât în evaluările și examinările cu caracter național, în cazul concursurilor școlare
sau în cazul administrării de teste standardizate. Acestea din urmă nu sunt instrumente de evaluare
cu tradiție în școala românescă, așadar nu ne putem aștepta la elaborarea unor asemenea teste în
viitorul apropiat. De asemenea, notarea normativă este realizată mai riguros în cazul probelor
scrise.
În cazul evaluării la clasă, se pot utiliza procedee simple de notare normativă (Linn și
Gronlund, 2000; Nitko, 2001) prin raportare la rangul percentil al scorurilor obținute de către
fiecare elev, la cvartile sau prin calcularea scorurilor standardizate z (toate aceste procedee
statistice vă sunt cunoscute de la cursul de Metodologia cercetării pedagogice).
Iată cum putem folosi rangul percentil în interpretarea rezultatului obținut de un elev, care a
obținut 72 de puncte la acest test: elevul a obținut un scor care îl plasează între ultimii 35% dintre
elevi și în jumătatea inferioară a clasamentului sau 30% dintre elevii evaluați au obținut un scor
mai mic decât elevul în cauză.
Putem asocia rangurile percentile cu sistemul de calificative, după o schemă pe care o considerăm
oportună având în vedere scopul administrării probei și vârsta elevilor. Utilizarea curbei normale
pentru a forța o anumită distribuție a calificativelor nu este indicată, deoarece niciodată rezultatele
unei clase de elevi nu se vor apropia suficient de mult de aceasta. Putem folosi însă scheme de
corespondență între rangul percentil și calificative, care să ilustreze mai degrabă experiența
noastră didactică decât reguli clare. Deși procedeul este prezentatat în literatura pedagogică
internațională, se admite că aceste scheme sunt arbitrare și depind în mare măsură de competența
cadrului didactic. Iată un exemplu de asemenea schemă care să ne ajute în notare:
Ranguri percentile Calificativ
100-81 Foarte bine
80-31 Bine
30-11 Suficient
Până la 10 Insuficient
Așadar, ultimii 10% dintre elevi vor obține calificativul insuficient, cei care au obținut scoruri care
îi plasează între rangul percentil 11 și 30 vor obține calificativul suficient, cei între rangul
percentil 31 și 80 vor obține calificativul bine, iar cei care au scoruri cuprinse între rangul
percentil 81 și 100 vor obține foarte bine. Observați că deși pare o modalitate de notare riguroasă,
utilizarea rangului percentil în acestă manieră este arbitrară și este influențată de întreaga filozofie
a profesorului în legătură cu evaluarea.
Un alt procedeu de evaluare normativă constă în utilizarea cvartilelor; pe baza acestora se
poate acorda calificativul foarte bine elevilor care au obținut primele 25% dintre scoruri și
calificativul insuficient celor care au obținut ultimele 25% dintre scoruri. Cvartila doi, care este
chiar mediana, constituie pragul între calificativele bine și suficient. Dacă încercăm să acordăm
calificative elevului care a obținut 72 de puncte la test folosind rangul percentil și schema de
transformare propusă, acesta ar fi apreciat cu bine, același calificativ fiind valabil și în cazul
utilizării cvartilelor. Dacă luăm însă în considerare un elev care a obținut scorul 65, folosind
rangul percentil și schema de corespondență i-am acorda calificativul suficient, dar dacă am folosi
procedeul cvartilelor ar obține calificativul insuficient. Pe baza acestei scurte exemplificări, putem
concluziona că utilizarea cvartilelor poate conduce la creșterea numărului de elevi care obține
calificativele insuficient și suficient (practic, jumătate dintre ei s-ar afla în această situație, ceea ce
ar fi greu de acceptat și pentru profesor, dar și pentru elevi, părinți etc.).
Indiferent ce procedeu de notare normativă am utiliza dezavantajul său major în raportare
cu notarea criterială nu se diluează: în cazul notării normative întotdeauna vor exista elevi care vor
înregistra eșec șcloar, în sensul că nu vor obține calificativul de trecere; în cazul în care se
utilizează notarea criterială, există posibilitatea ca nici un elev să nu fie în situația de a obține
calificativul insuficient.
Aprecierea prin notă presupune cunoașterea de către profesor a unui număr rezonabil de
modele, metode și procedee. Indiferent care sunt opțiunile noastre în evaluarea la clasă, ar trebui
să comunicăm transparent elevilor, părinților, altor factori interesați care sunt argumentele noastre
în acordarea unui calificativ. În absența notării, evaluarea n-ar constitui o miză atât de importantă
în raporturile profesorului cu elevii și părinții, iar cadrele didactice trebuie să conștientizeze
nevoia de rigoare în aprecierea rezultatelor elevilor.
Temă de reflecție
Încercați să comparați modelele de notare prezentate în curs și să le identificați pe cele care sunt
compatibile și pe cele care se exclud reciproc.
5.2. Aprecierea verbală constă într-un feedback pe care profesorul îl formulează în legătură cu
performanțele unui copil care poate avea fie nuanțe pozitive, fie nuanțe negative. Orice aprecierea
verbală trebuie să surprindă în egală măsură efortul copilului de a rezolva o sarcină și procesul
rezolutiv, dar și calitatea produsului final al activității, a performanței demonstrate. Este o metodă
de apreciere importantă mai ales în învățământul preșcolar, deoarece profesorul nu dispune de
calificative pentru a sancționa rezultatele copiilor, iar stimulentele nu au semnificație în absența
aprecierilor verbale care să le clarifice. Aprecierea verbală se utilizează și în învățământul primar,
fie în combinație cu un calificativ, fie ca feedback formativ cu rol motivațional pentru elev.
Temă de reflecție
Încercați să identificați și alte modalități de control a factorilor perturbatori în evaluare. Explicați
care dintre efectele perturbatoare ar fi atenuate.
BIBLIOGRAFIE
Anastasi, A. (1976). Psychological testing, Ediţia a IV-a, McMillan Publishing Co., New
York
Ausubel, D., Robinson, F. (1981). Învăţarea în şcoală. O introducere în psihologia
pedagogică, Editura Didactică și Pedagogică, Bucureşti
Best, J. W. (1977) Research in education, Prentice-Hall Inc., New Jersey
Cerghit, I., (2002). Sisteme de instruire alternative şi complementare, Editura Aramis,
Bucureşti
Creţu, C., (1999). Teoria curriculumului şi conţinuturile educaţiei, Editura Universităţii
„Alexandru Ioan Cuza", Iași
Crocker, L., Algina, J. (1986). Introduction to classical and modern test theory, Holt,
Rinehart and Winston Inc., Orlando
Cucoş C. (2000). Pedagogie, Editura Polirom, Iaşi
Cucoş, C. ( 2008). Teoria şi metodologia evaluării, Editura Polirom, Iaşi
Cucoş, C. (2002). Pedagogie, Ediţia a II-a, revăzută şi adăugită, Editura Polirom, Iaşi
De Landsheere, G. (1975). Evaluarea continuă a elevilor şi examenele, Editura Didactică și
Pedagogică, București
De Landsheere, V., De Landsheere, G. (1979). Definirea obiectivelor educaţiei, Editura
Didactică și Pedagogică, București
Downing, S. M., Haladyna, T. M. (eds.) (2006). Handbook of Test Development, Routledge,
London
Evans, J.D. (1985). Invitation to psychological research, CBS College Publishing, New York
Gall, M.D., Gall, J.P., Borg.W.R. (2007). Educational research: an introduction, 8th Edition,
Pearson Education, Inc., Boston
Gallagher, J.D. (1998). Classroom Assessment for Teachers, Prentice-Hall Inc., New Jersey
Gliner, J.A., Morgan, G. A. (2000). Research Methods in Applied Settings: An Integrated
Approach to Design and Analysis, Lawrence Erlbaum Associates, New Jersey
Jinga, I. (1996).
Jinga, I., Istrate, E. (1998).
Karmel, L.J., Karmel, M.O. (1978). Measurement and evaluation in the schools, Ediţia a II-a,
McMillan Poblishing Co., New York
Linn, R.L., Gronlund, N.E. (2000). Measurement and Assessment in Teaching, Prentice-Hall
Inc., New Jersey
Liţoiu, N., (2001). Metode şi instrumente de evaluare, în Stoica, A. (coord.), Evaluarea
curentă şi examenele, Editura ProGnosis, Bucureşti, pp. 30-46
Manolescu, M. (2002). Evaluarea şcolară-un contract pedagogic, Editura Fundaţiei
Culturale, „D. Bolintineanu”, Bucureşti
Mason, E. J., Bramble, W. J. (1997) Research in Education and the Behavioral Sciences,
Brown & Benchmark Publishers, Duburque
Mândruţ, M. (2001), Tipologia itemilor, în Stoica, A. (coord.), Evaluarea curentă şi
examenele, Editura ProGnosis, Bucureşti, pp. 65-85
McMillan, J.H. (1992). Educational Research. Fundamentals for the Consumer,
HarperCollins Publishers Inc., New York
MECT, CNCEIP (2007). Evaluarea națională la finalul clasei a IV-a. Raport Tehnic,
disponibil on-line: www.edu.ro
Meyer, G. (2000). De ce şi cum evaluăm, Editura Polirom, Iași
Mihail, R. (2001). Evaluarea educațională și evaluarea performanțelor/rezultatelor școlare, în
Stoica, A. (coord.), Evaluarea curentă şi examenele, Editura ProGnosis, Bucureşti, pp.
4-21
Moise, C. (2007). Teoria şi practica evaluării, în Psihologie. Curs pentru Învăţământ la
Distanţă, Editura Universităţii „Alexandru Ioan Cuza", Iași
Muster. D. (1970). Verificarea progresului şcolar prin teste docimologice, 1970, Editura
Didactică și Pedagogică, București
Neacşu, I., Stoica, A. (coord.) (1996). Ghid general de evaluare şi examinare, Editura
Aramis, Bucureşti
Negreţ-Dobridor, Ioan, 2001, Teoria curriculumului, în I. Cerghit, I. Neacşu, I. Negreţ-
Dobridor, I.O. Pânişoară, Prelegeri pedagogice, Editura Polirom, Iaşi, pp. 11-60
Nitko, A.J. (2001). Educational Assessment of Students, 3rd Edition, Prentice-Hall Inc., New
Jersey
Osterlind, S. J. (1998). Evaluation in Education and Human Services. Constructing test items:
multiple-choice, constructed response, performance and other formats, 2nd edition,
Kluwer Academic Publishers
Popescu, P. (1978). Examinarea şi notarea curentă, Editura Didactică și Pedagogică,
București
Popham, W. J. (2003). Test better, teach better. The instructional role of assessment,
Association for Supervision and Curriculum Development
Potolea, D. (2002). Conceptualizarea curriculum-ului. O abordare multidimensională, în E.
Păun, D. Potolea (coord.), Pedagogie.Fundamentări teoretice şi demersuri aplicative,
Editura Polirom, Iaşi, pp. 69-84
Radu, I. (1995). Elemente de docimologie didactică, în M. Ionescu şi I. Radu (coord.),
Didactica modernă, Editura Dacia, Cluj-Napoca
Radu, I. T. (1981). Teorie şi practică în evaluarea eficienţei învăţământului, Editura
Didactică și Pedagogică, București
Radu, I. T. (2000). Evaluarea în procesul didactic, Editura Didactică și Pedagogică, București
Radu, I. T., Popescu, P. (1982). Evaluarea randamentului şcolar, în I. Salade (coord.),
Didactica, Editura Didactică și Pedagogică, București
Roman, I., Popescu, P. (1980). Lecţii în spiritul metodelor active, 1980, Editura Didactică și
Pedagogică, București
Schreerens, J., Glas, C., Thomas, S. M. (2003). Educational evaluation, assessment and
monitoring. A systemic approach, Swets & Zeitlinger Publishers, Lisse
SNEE (2003). Standarde de evaluare pentru clasa a IV-a, a VIII-a şi a XII-a, disponibil on-
line: www.edu.ro
SNEE (2005). Evaluarea națională la finalul clasei a IV-a. Raportul tehnic, disponibil on-
line: www.edu.ro
Stan, A. (2002). Testul psihologic. Evoluţie, construcţie, aplicaţii, Editura Polirom, Iași
Stan, C. (2001). Evaluarea şi autoevaluarea şcolară, Presa Universitară Clujeană, Cluj-
Napoca
Stoica, A. (2003). Evaluarea curentă şi examenele. De la teorie la practică, Editura
Humanitas Educational, București
Stoica, A. (coord.) (2001). Evaluarea curentă şi examenele, Editura ProGnosis, București
Strungă, C. (1999). Evaluarea şcolară, Editura de Vest, Timişoara
Thomas, R.M. (1998). Conducting Educational Research. A comparative view, Bergin &
Garvey Westport, Connecticut
Vogler, J. (2000). Evaluarea în învăţământul preuniversitar, Editura Polirom, Iași