Sunteți pe pagina 1din 72

TEORIA I METODOLOGIA EVALURII Scopul unitii de curs: Formarea competenelor de evaluare a rezultatelor precolarilor i colarilor mici Obiective S identifice

ce elementele de specificitate n evaluarea elevilor, a profesorilor i a instituiilor colare; S explice funciile evalurii n context educaional i legtura dintre evaluare i curriculum, predare, nvare; S compare diferite forme i tipuri de evaluare (formativ/sumativ, iniial/continu/final, criterial/normativ etc.); S descrie metode tradiionale i alternative de verificare (inclusiv testul docimologic); S elaboreze secvene i instrumente de evaluare specifice nvmntului precolar i primar; S descrie metode de apreciere a performanelor elevilor i elementele de specificitate n nvmntul precolar i primar (notarea i aprecierea verbal; standarde i descriptori de performan); S explice erorile posibile n evaluare i modalitile de evitare a acestora. Tematic general 1. Delimitri conceptuale generale 1.1. Terminologia specific teoriei evalurii 1.2. Elemente de specificitate n evaluarea rezultatelor elevului 1.3. Relaia dintre evaluare, curriculum, predare i nvare 2. Funcii ale evalurii rezultatelor elevilor 3. Tipuri de evaluare a rezultatelor elevilor 4. Metode de evaluare a rezultatelor elevilor 4.1. Clasificri ale metodelor de evaluare 4.2. Metode tradiionale de verificare 4.2.1. Metode de verificare oral 4.2.2. Metode de verificare n scris 4.2.3. Metode de verificare practic 4.3. Testul docimologic 4.3.1. Definiii i tipologie 4.3.2. Definiia itemului din perspectiva evalurii. Tipuri de itemi 4.3.3. Itemii obiectivi 4.3.4. Itemii semiobiectivi 4.3.5. Itemii subiectivi 4.3.6. Calitile testului docimologic 4.3.7. Proiectarea testului docimologic 4.4. Metode alternative (complementare) de verificare 4.4.1. Portofoliul 4.4.2. Proiectul 4.4.3. Investigaia 4.4.4. Observarea sistematic a activitii i a comportamentului elevului 4.4.5. Autoevaluarea i interevaluarea 5. Metode de apreciere 5.1. Notarea

5.1.1. Notarea analitic i notarea holistic 5.1.2. Notarea subiectiv i notarea obiectiv 5.1.3. Notarea criterial, notarea normativ i notarea n raport cu progresul individual 5.2. Aprecierea verbal 6. Erori (factori perturbatori) n evaluarea rezultatelor colare

1. Delimitri conceptuale generale Teoria i metodologia evalurii completeaz imaginea despre elementele fundamentale ale activitii didactice, deja creionat prin intermediul teoriei curriculumului i a instruirii. Nu vom ncerca s argumentm evidena, ci s atragem atenia asupra importanei actului evaluativ. Prin impactul su, evaluarea constituie o punte de legtur ntre coal, familie i comunitate, iar orice reglaj slab n activitatea de evaluare determin incongruene nu doar n clas sau n coal, ci i dincolo de zidurile acestora. Importana evalurii este poate mai evident n ultimii ani, n contextul politicilor naionale privind certificarea studiilor (vezi exemplul examenului de bacalaureat) i al celor privind evaluarea elevilor la finalul ciclurilor colare (evaluarea naional la sfritul claselor a IV-a, includerea n sistemele de evaluare internaional a elevilor din clasele a VII i a VIII-a, sistemul tezelor unice care va fi reconsiderat etc.). Pornind de la aceste premise, v propunem o sintez a reperelor majore privind evaluarea, n vederea pregtirii dumneavoastr pentru cariera didactic. 1.1. Terminologia specific teoriei evalurii n mod evident, primul termen pe care ar trebui s-l definim este chiar cel de evaluare, prin raportare la contextul educaional. O definiie sintetic este ns dificil de formulat, avnd n vedere abundena de termeni concureni care sunt invocai n literatura de specialitate: a aprecia, a constata, a estima, a examina, a cntri, a judeca, a msura, a nota, a valida (sau a invalida), a valoriza (sau a devaloriza), a expertiza (Vogler, 2000). Nici unul dintre termenii amintii nu explic ns complet conceptul de evaluare i, de aceea, facem apel la o definiie propus de A. J. Nitko (2001, pp. 4-5), pe care ncercm s o adaptm nevoilor noastre de nelegere: n context educaional, evaluarea, n sensul su cel mai larg, se refer la procesul de colectare, prelucrare i interpretare a informaiilor necesare pentru a lua decizii despre elevi, curriculum, programe educaionale i chiar politici n domeniul educaiei. Deciziile privind elevii se pot referi la selecia acestora pentru anumite programe educaionale, verificarea continu a achiziiilor colare, certificarea final a studiilor, consilierea remedial, orientarea n carier etc. Deciziile cu privire la curriculum i programe educaionale pot include revizuirea finalitilor, a coninuturilor i a chiar a modalitilor de evaluare. n plus, la acest nivel al evalurii se poate discuta i despre evaluarea cadrelor didactice i chiar a instituiilor colare. Politicile educaionale pot fi, de asemenea, afectate de procesele evaluative, iar un exemplu n acest sens poate fi decizia de a reforma segmente ale vieii colare, dup realizarea unei evaluri a ntregului sistem de nvmnt. O definiie romneasc a evalurii pedagogice atrage atenia asupra acelorai elemente: potrivit lui I.T. Radu (1981, pp. 17-18), evaluarea este "procesul menit s msoare i s aprecieze valoarea rezultatelor sistemului de educaie sau a unei pri a acestuia, eficacitatea resurselor, a condiiilor i a operaiilor folosite n desfurarea activitii, prin compararea rezultatelor cu obiectivele propuse, n vederea lurii deciziilor privind ameliorarea activitii n etapele urmtoare". Evaluarea educaional este, aadar, o activitate cu adevrat complex care poate viza orice actor din spaiul educaional, orice instituie, orice segment al vieii colare. n contextul pregtirii pentru cariera didactic accentul va cdea ntotdeauna pe evaluarea elevilor, dei profesorii ar trebui s fie informai i cu privire la alte paliere ale evalurii (mai ales evaluarea cadrelor didactice i a instituiilor de nvmnt). Tem de reflecie ncercai s realizai un tabel cu argumente pro i contra evalurii naionale a elevilor la sfritul clasei a IV-a i s sintetizai concluziile ntr-o fraz.

Teoria evalurii opereaz constant cu o serie de termeni care necesit clarificri: Docimologia este tiina sau domeniul care are ca obiect studierea sistematic a examenelor, n special a sistemelor de notare i a comportrii examinatorilor i a celor examinai (De Landsheere, 1975). Termenul doxologie se refer la studierea sistematic a rolului aprecierii n nvmntul colar, efectele stimulante sau inhibitoare ale diverselor forme de examinare, reaciile examinatorilor i a celor examinai (De Landsheere, 1975). Sintagma randament colar definete nivelul de pregtire i dezvoltare a personalitii elevului prin raportare la finalitile educaionale. Termenii performan colar i progres colar sunt utilizai cu acepiuni diferite n teoria evalurii. Performana colar poate fi considerat orice rezultat al elevului (indiferent de calitatea acestui rezultat), ns poate fi conceput i restrictiv, ca rezultat notabil sau de valoare al unui elev. Termenul de progres colar surprinde orice salt calitativ al unui elev, care se poate observa prin compararea performanelor actuale cu cele anterioare (Radu i Popescu, 1982). 1.2. Elemente de specificitate n evaluarea rezultatelor elevului Orice iniiere n evaluarea rezultatelor elevilor impune delimitarea unor termeni importani, care sunt utilizai frecvent n literatura de specialitate. O prim triad este alctuit din evaluare, msurare i apreciere. Evaluarea rezultatelor elevului se refer la dou seturi de activiti: 1) aplicarea unor metode i proceduri diverse se colectare a informaiilor despre performanele elevului i 2) elaborarea unor judeci de valoare privind performanele observate (Linn i Gronlund, 2000). Aadar, evaluarea nu se confund nici cu msurarea, nici cu aprecierea. De asemenea, metodele de colectare a informaiilor despre rezultatele elevului nu conduc ntotdeauna la descrieri cantitative (msurare). Mai mult, este chiar recomandat ca descrierile cantitative (numerice) ale rezultatelor elevilor s fie completate cu descrieri calitative (nonmsurare). Astfel, distincia ntre msurare i evaluare devine mai evident: nu toate aciunile evaluative se finalizeaz cu atribuirea unei valori numerice n relaie cu rezultatele elevului. n plus, msurarea rezultatelor elevului nu presupune cu necesitatea testarea, existnd i forme alternative de colectare a informaiilor. Aprecierea nsoete ntodeauna activitatea de msurare i se traduce n acele judeci de valoare privind dezirabilitatea rezultatelor elevului. R. L. Linn i N. E. Gronlund (2000) descriu relaia dintre evaluare, msurare i apreciere ca proces: descrierea calitativ (non-msurare) i cantitativ (msurare) a rezultatelor elevului determin judecile de valoare (aprecierea), iar acestea determin regndirea secvenelor evaluative ulterioare. O alt problem care trebuie clarificat atunci cnd discutm despre evaluarea elevilor se refer la obiectul evalurii, cu ale cuvinte trebuie s rspundem la ntrebarea Ce rezultate ale elevilor evalum?. Nici rspunsul la aceast ntrebare nu este simplu, pentru c profesorul nu evalueaz doar cunotine, dei, cel mai adesea, acestea constituie obiectul principal al eforturilor evaluative. Att literatura romneasc de specialitate, ct i cea strin accentueaz faptul c rezultatele elevului pot consta n cunotine, capaciti intelectuale, capaciti de aplicare a cunotinelor, capacitatea de a crea produse personale, trsturi de personalitate i de conduit (Radu, 1981; Moise, 2007; Linn i Gronlund, 2000; Nitko, 2001). Dac rememorai cunotinele dobndite la cursul de Teoria i metodologia instruirii, v vei reaminti c obiectivele sunt elaborate i pentru a orienta activitatea de evaluare, ori acestea se refer nu doar la domeniul cognitiv, ci i la cel afectiv i psihomotor. Nu este mai puin adevrat c domeniul cognitiv ocup cel mai mare spaiu att n pregtirea viitorilor profesori,

ct i n evaluarea rezultatelor elevilor. Exist ns o preocupare evident pentru evaluarea achiziiilor complexe ale elevilor, att n domeniul cognitiv, ct i n cel afectiv i psihomotor, mai ales n contextul reformelor educaionale comprehensive care au loc n aproape toate rile lumiii (vezi deziderate precum dezvoltarea gndirii critice, dezvoltarea ceteniei democratice etc.) R. L. Linn i N. E. Gronlund (2000) prezint un set de principii generale n evaluarea rezultatelor elevului: a. Primul pas n proiectarea unei secvene de evaluare const ntotdeauna n stabilirea caracteristicilor care vor fi evaluate. Acurateea i eficiena evalurii depind n mare msur de claritatea cu care sunt circumscrise caracteristicile care vor fi evaluate. n acest sens, reperele profesorului sunt obiectivele cadru i de referin din programele colare, standardele de performan pentru elevi i obiectivele operaionale. b. Metodele de evaluare a rezultatelor elevilor trebuie alese n aa fel nct s conduc cu adevrat la evaluarea caracteristicilor pe care le avem n vedere. Dei metodele de evaluare trebuie s ndeplineasc o serie de condiii generale (acuratee, obiectivitate etc.) acestea nu sunt suficiente pentru a decide n situaii de evaluare specifice. De exemplu, dac intenionm s evalum conduite, nu este recomandat s folosim testul docimologic, ci observarea sistematic a comportamentului elevului. c. Evaluarea comprehensiv presupune utilizarea unor metode i instrumente de evaluare variate. Cu alte cuvinte, se recomand utilizarea n complementaritate a unui set de metode i instrumente care s conduc la judeci realiste i fundamentate despre o caracteristic a elevilor. d. Utilizarea adecvat a metodelor i a instrumentelor de evaluare presupune i contientizarea limitelor acestora. Nici o metod sau instrument de evaluare nu este infailibil/infailibil. Ele pot conduce la judeci de valoare corecte n anumite situaii particulare de evaluare, dar pot genera erori grave n altele. Toate metodele de evaluare au limite i, de aceea, se recomand utilizarea lor n combinaii care s optimizeze deciziile profesorului. e. Evaluarea se constituie ntr-o cale de a determina nivelul performanelor elevilor n vederea optimizrii proceselor de predare-nvare i nu este un scop n sine. Evaluarea are ca finalitate major luarea unor decizii educaionale i nu are sens n condiiile n care rezultatele nu sunt utilizate n interesul elevului. Tem de reflecie Comentai principiile generale ale evalurii enunate mai sus. Ai mai putea formula i alte principii ale evalurii? 1.3. Relaia dintre evaluare, curriculum, predare i nvare Literatura pedagogic romneasc i asum i dezvolt perspectiva structural asupra curriculumului, accentund nevoia de centrare pe interaciunile dintre componentele acestuia. Astfel, se apreciaz c dac n urm cu mai mult de trei secole termenul de curriculum desemna un plan de nvmnt, n prezent poate fi definit ca un ntreg program sau parcurs de nvare. n sens restrns, termenul desemneaz strict coninuturile nvmntului (sau doar obiectivarea acestora n documente de tipul planului de nvmnt, programei colare, manualelor colare, auxiliarelor etc.), n timp ce accepiunea larg trimite la un ntreg program de aciuni educaionale, cu toate componentele i conexiunile dintre acestea (Creu, 1999; Cuco, 2002).

De asemenea, se sugereaz faptul c utilizarea termenului n teoria i practica pedagogic se justific i se impune n contextual abordrii sistemice a proceselor educaionale, acordndu-se atenie sporit componentelor procesului de nvmnt i a relaiilor dintre acestea, abordate n mod tradiional de didactic (Negre-Dobridor, 2001). O ncercare de conceptualizare comprehensiv a termenului de curriculum (Potolea, 2002) propune ca premise admiterea caracterului multidimensional al acestuia, a faptului c el poate fi definit doar n asociere sau conjuncie cu ali termeni i a caracterului extrem de dinamic (este permanent redefinit i mbogit). Discursul se centreaz asupra caracterului multidimensional al curriculumului, o perspectiv care faciliteaz i expunerea ideilor noastre cu privire la evaluare. Potolea analizeaz dou modele structurale ale curriculum-ului: modelul triunghiular care include finalitile educaionale, coninuturile instruirii i timpul de instruire/nvare, i modelul pentagonal care conserv componentele modelului triunghiular la care se adaug strategiile de predare-nvare i strategiile de evaluare. Acest ultim model justific ntreg demersul de cercetare, dar i de reform curricular n sistemul educaional romnesc. Termenul se legitimeaz tocmai prin acest tip de abordare, care subliniaz deopotriv extensiunea i nuanele sale. De ce sunt importante aceste precizri asupra curriculumului, n contextul unui discurs pedagogic despre evaluare? Rspunsul ine de eviden, dac analizm tipologia definiiilor termenului de curriculum, dezbaterile despre structura, componentele acestuia i tipurile de curriculum delimitate. Mai mult dect att, unul dintre tipurile de curriculum, curriculum evaluat sau testat (care se refer la acele secvene de coninuturi actualizate n procesul de evaluare Creu, 1999; Cuco, 2002) conecteaz cele dou concepte i n plan verbal. Relaia dintre curriculum i evaluare poate fi abordat i din perspectiva efectelor educaionale, care se manifest bidirecional n sensul c orice construcie curricular influeneaz evaluarea, iar evaluarea, la rndul su are impact asupra curriculumului (Mihail, 2001). Literatura de specialitate descrie dou seturi de efecte care ar putea lmuri natura relaiei dintre curricum i evaluare: a) Efectul de feedback se refer la posibilitatea ca profesorul s utilizeze informaiile rezultate din activitatea de evaluare n optimizarea procesului de predare-nvare, prin luarea unor decizii adecvate, fundamentate pe rezultatele elevului. Feedback-ul formativ, obinut ca urmare a evalurii continue, permite diagnosticarea punctelor tari i punctelor slabe ale elevului, precum i revizuirea deciziilor educaionale n concordan cu acestea. Feedback-ul sumativ permite profesorului s comunice elevilor, prinilor, factorilor de decizie etc. care este nivelul de achiziii n raport cu prescripiile din curriculum. b) Efectul retroactiv sau de siaj (engl. backwash sau washback) surprinde influena evalurii asupra metodelor de predare-nvare utilizate la clas, asupra calitii interaciunilor dintre profesor i elevi, asupra nivelului motivaional al elevului i chiar asupra strategiilor evaluative ce vor fi utilizate ulterior la clas. Specialitii vorbesc i despre un efect de tip washbefore care explic modul n care evaluarea (n special cea sumativ, la nivel naional, organizat pentru elevii care ncheie un ciclu colar) poate conduce la modificarea ntregului curriculum (finaliti, coninuturi, metode de predare-nvare i evaluare recomandate etc.). Un viitor profesor trebuie s contientizeze faptul c evaluarea rezultatelor elevului presupune utilizarea corect a unui set de metode i instrumente specifice, dar procesul evaluativ depete graniele nguste ale colectrii i interpretrii de informaii despre achiziiile educabililor. Evaluarea debuteaz cu formularea obiectivelor educaionale i se finalizeaz cu judeci privind nivelul de atingere a acestor obiective (Linn i Gronlund, 2000). Evaluarea trebuie abordat n strns legtur cu finalitile educaionale, coninuturile i strategiile de predare-nvare, la care s-ar putea aduga potrivit unor

pedagogi mijloacele de nvmnt i timpul colar. Orice modificare la nivelul uneia dintre componentele curriculumului, va genera n mod logic, transformri, ajustri la nivelul celorlalte. Tem de reflecie Recitii fragmentele din cursul de Teoria i metodologia instruirii cu privire la obiectivele educaionale. ncercai apoi s rspundei la ntrebarea n ce mod influeneaz obiectivele educaionale activitile de predare, nvare i evaluare?. 2. Funciile ale evalurii Funciile evalurii constituie rspunsuri la ntrebarea n ce scop evalum?. Dac evaluarea nu este un scop n sine, trebuie s determinm raiunile pentru a consuma timp, efort i energie pentru proiectarea i realizarea sa. Trebuie s facem de la bun nceput precizarea c nu exist consens terminologic asupra funciilor evalurii, literatura de specialitate fiind presrat cu clasificri i descrieri ale acestora. Vom prezenta selectiv cteva seturi de funcii i vom sintetiza ntr-un tabel alte opiuni privind utilitatea i finalitatea procesului evaluativ. O sintez a abordrilor din literatura de specialitate ar conduce la determinarea a dou categorii fundamentale de funcii ale evalurii (I.T. Radu, 1981; Moise, 2007): funcii sociale i funcii pedagogice. Dintre funciile sociale cea mai important este aceea de asigurare a feedback-ului ctre societate, n raport cu finalitile educaionale mprtite la un moment dat i care trebuie s orienteze n permanen viaa colii. Mai precis, coala are datoria de a informa factorii sociali (familii, comunitate, decideni n materie de educaie) cu privire la nivelul pregtirii elevilor (pe tot parcursul procesului educaional) i la numrul de absolveni pe cicluri de nvmnt i profilul lor (la finalul procesului). Dintre funciile pedagogice cele mai importante pot fi considerate: orientarea i ameliorarea activitii educaionale i luarea deciziilor cu privire la rezultatele elevului prin notare. Toate celelalte funcii descrise n lucrrile dedicate evalurii colare pot fi asociate celor enumerate mai sus. Astfel, funcia de prognoz (anticiparea rezultatelor viitoare ale elevului pe baza celor obinute n prezent), funcia de diagnoz (stabilirea nivelului elevului la un moment dat, n scopul adecvrii activitilor educaionale la nevoile sale de nvare), funcia de orientarea colar (stabilirea profilului aptitudinal al elevului n vederea orientrii sale n etapele urmtoare de colarizare sau n viaa profesional), funcia de feedback pentru profesor (utilizarea rezultatelor evalurii pentru ameliorarea activitii de predare) sunt parte a setului de funcii pedagogice de orientare i ameliorare. Funcia de certificare (a competenelor la finalul unui ciclu de nvmnt), funcia de ierarhizare (clasificarea elevilor dup nivelul rezultatelor colare) pot fi considerata aspecte ale funciei decizionale. Cele mai multe dintre funciile descrise anterior se regsesc i n clasificarea propus de fostul Serviciu Naional de Evaluare i Examinare (SNEE, n prezent departament al Centrului Naional pentru Curriculum i Evaluare n nvmntul Preuniversitar) care a coordonat evalurile i examenele naionale romneti n ultimii ani (Stoica et al, 2001). Funciile evalurii sunt grupate n funcii generale i specifice. Funciile generale sunt cea diagnostic, cea prognostic, cea de certificare i cea de selecie, iar funciile specifice sunt cea motivaional (stimularea elevului n activitatea de nvare prin feedback pozitiv), cea de consiliere (orientare colar i profesional).
Tabelul nr. 1. Funcii ale evalurii descrise n literatura de specialitate Autor Funcii ale evalurii I. Radu (1995, pp. 257 - 1) Conexiunea invers n procesul de instruire

2) 3) 4) 5) I. Jinga i E. Istrate (1998, 1) pp. 322 323) 2) 3) 4) 5) 6) J. Vogler (2000, p. 31) 1) 2) 3) C. Cuco (2002, p. 373) 1) 2) 3) 4) 5) 6) I. Cerghit (2002, pp. 301 - 1) 303) 2) 3) 4) 5) 6) 7)

260)

Msurarea progresului realizat de elevi Valoare motivaional Stimularea autoevalurii i a formrii contiinei de sine Reglare Funcia de control Funcia de reglare a sistemului Funcia de predicie Funcia de clasificare i selecie Funcia educativ Funcia social Recompensarea sau pedepsirea elevilor n funcie de natura performanelor obinute de acetia n activitatea de nvare; Clasarea i compararea rezultatelor n funcie de probele comune, cu scopul de a provoca emulaia; Informarea autoritilor colare i a prinilor n legtur cu meritele sau deficienele fiecrui elev Funcia de constatare Funcia de informare Funcia de diagnosticare Funcia de pronosticare Funcia de selecie Funcia pedagogic Funcia constatativ-explicativ sau de diagnoz Funcia de supraveghere (de control sau monitorizare) Funcia de feed-back Funcia de ameliorare Funcia de motivaie, de stimulare Funcia de prognoz Funcia de stimulare a dezvoltrii capacitii de autoevaluare la elevi

Tem de reflecie Citii cu atenie funciile evalurii enumerate n tabel i ncercai s descoperii similariti i diferene ntre propunerile diverilor autori. 3. Tipuri de evaluare a rezultatelor elevilor Ca i n cazul funciilor pe care le poate ndeplini evaluarea, tratarea tipurilor de evaluare a rezultatelor elevilor a beneficiat de mult atenie n rndul pedagogilor, fiind enunate n acest sens mai multe criterii de clasificare nsoite de tipologiile aferente. Din dorina de a simplifica tabloul tipurilor de evaluare, vom prezenta sintetic clasificrile pe care le considerm relevante pentru formarea dumneavoastr, fr a intra n detalii privind eventualele suprapuneri ori incongruene conceptuale. a. Cea mai cunoscut clasificare a tipurilor de evaluare se realizeaz prin raportare la relaia ntre procesele de predare-nvare i cele de evaluare. Pe baza acestui criteriu se face distincia ntre evaluarea formativ i cea sumativ (De Landsheere, 1975). Evaluarea formativ se realizeaz n paralel cu activitile de predare-nvare i vizeaz mai degrab reglarea procesului educaional pe parcursul su (prin feedback-ul pentru elevi i pentru profesor), dect aprecierea rezultatelor elevului prin not. n lucrrile recente, se utilizeaz din ce n ce mai des sintagma evaluare dinamic (Radu, 2000), care se substituie evalurii formative, dar pstreaz definiiile i caracteristicile acesteia. Evaluarea sumativ se realizeaz dup finalizarea unei secvene de predare-nvare (fie c aceasta conduce la un volum relativ mic de achiziii ale

elevului, fie c este vorba chiar despre un ntreg ciclu de nvmnt) i se soldeaz ntotdeauna cu aprecierea rezultatelor elevului prin not. b. Dac ne referim la elementul de referin n aprecierea rezultatelor elevului, putem distinge evaluarea normativ i evaluare criterial (De Landsheere, 1975). Evaluarea normativ presupune compararea rezultatelor fiecrui elev cu media (sau norma) grupului, prin raportarea la rezultatele obinute de ctre ceilali elevi. Prin contrast, evaluarea criterial presupune raportarea la un set de criterii constituite din obiectivele educaionale. Aceast tipologie a fost dezvoltat n contextul discuiilor despre testele docimologice i modul n care trebuie interpretate scorurile obinute (n seciunea dedicat testului docimologic, vei descoperi c i testele docimologice pot fi normative, respectiv criteriale). Din combinarea celor dou criterii de clasificare deja prezentate, rezult faptul c evaluarea sumativ poate fi normativ i criterial (deoarece nu se finalizeaz prin notare, evaluarea formativ nu poate mbrca aceste forme). c. Dac avem n vedere momentul n care se realizeaz evaluarea n raport cu un program educaional, putem identifica evaluarea iniial, evaluarea continu i evaluarea final (Bloom, 1971, citat de Moise, 2007). Evaluarea iniial se realizeaz nainte de debutul unui program educaional, cu scopul de a stabili nivelul de pregtire al elevului i se poate realiza prin teste de aptitudini, teste de plasament, teste docimologice etc. Evaluarea continu este echivalentul evalurii formative, n timp ce evaluarea final este, evident, sumativ. d. Volumul de achiziii ale elevului care se are n vedere constituie criteriul de difereniere ntre evaluarea secvenial i evaluarea global (Cuco, 2002). n timp ce evaluarea secvenial surprinde un volum redus de achiziii ale elevului, evaluarea global presupune investigaii de amploare de tipul celor care se organizeaz la finalul unui ciclu colar. e. Dac ne raportm la funcia dominant, putem distinge ntre evaluarea diagnostic i cea prognostic (Radu, 2000). Evaluarea diagnostic vizeaz sesizarea progreselor sau a regreselor elevului, cu scopul de a ameliora procesul de predare-nvare, n timp ce evaluarea prognostic are un scop predictiv, de anticipare a evoluiilor viitoare ale elevului. f. n funcie de apartenena instituional a evaluatorului, putem diferenia evaluarea intern de cea extern. Evaluarea intern se realizeaz de ctre profesorul care pred la clas, n timp ce evaluarea extern se realizeaz de ctre alte persoane. De regul, evaluarea extern se realizeaz la finalul unui ciclu colar i are ca scop limitarea subiectivitii n aprecierea rezultatelor elevilor, dar i aplicarea unor criterii i exigene unitare la nivelul ntregului sistem educaional. Tem de reflecie Comentai eventualele suprapuneri conceptuale i clasificri derivate, pe baza tipurilor de evaluare prezentate n curs. 4. Metode de evaluare a rezultatelor elevilor 4.1. Clasificri ale metodelor de evaluare Literatura pedagogic romneasc a consacrat o clasificare a metodelor de evaluare pe care o vom utiliza i noi n prezentarea analitic a acestora (Radu, 2000; Moise, 2007; Cuco, 2008). Potrivit acestei clasificri, metodele de evaluare pot fi plasate fie n categoria metodelor de

verificare, care sunt utilizate pentru a constata care este nivelul achiziiilor elevului, fie n rndul metodelor de apreciere care sunt utile n interpretarea rezultatelor obinute de elevi. La rndul lor, metodele de verificare sunt fundamentale sau tradiionale i complementare sau alternative. Metodele de verificare tradiionale sunt probele orale, scrise i practice (n toate variantele lor: curente, periodice, finale sau globale), precum i testele docimologice. Dac metodele de verificare tradiionale pot fi enumerate n manier exhaustiv, nu se poate face aceeai afirmaie cu privire la metodele complementare de evaluare. Acestea au un nc un statut problematic, datorit faptului c n anumite ipostaze pot fi considerate mai degrab metode de predare-nvare, dect metode de evaluare (vezi pentru exemplificare situaia hrilor conceptuale, care pot fi utilizate i ca metode de predare-nvare). n acest curs vom prezenta o parte dintre metodele complementare de evaluare, i anume: portofoliul, proiectul, investigaia, observaia sistematic a comportamentului elevului, autoevaluarea i interevaluarea. Considerm c se impun cteva observaii privind utilizarea metodelor de evaluare, mai ales n condiiile n care exist o tendin a practicienilor de a supraaprecia o categorie de metode sau alta. Nici o metod nu este lipsit de limite sau dezavantaje, de unde rezult i nevoia de mbinare a metodelor i instrumentelor, pentru a crete acurateea i credibilitatea evalurii. Metodele de evaluare nu se utilizeaz aleatoriu n relaie cu nite coninuturi care au fost predate i despre care presupunem c au fost nvate, ci trebuie alese prin raportare la obiectivele educaionale care indic ce tip de achiziii trebuie s surprindem (cunotine, capaciti, deprinderi, atitudini etc.). Pentru a exemplifica diversitatea punctelor de vedere din literatura pedagogic dedicat evalurii, prezentm i idei alternative de clasificare, care nu sunt specifice spaiului educaional romnesc. Pedagogii americani au rafinat n ultimii ani clasificrile metodelor de evaluare, meionnd testul i metodele de evaluare autentic sau metodele alternative, precum i metodele de notare (e.g. Gallagher, 1998; Linn i Gronlund, 2000; Nitko, 2001). Manualele strine de teoria evalurii discut nu doar despre testul docimologic (care surprinde cunotine i capaciti intelectuale ale elevului), ci i despre alte tipuri de teste care se utilizeaz n coal (teste de aptitudini, de creativitate etc.). Metodele de evaluare autentic constituie o alternativ la test, n viziunea pedagogilor strini. Domeniul evalurii are ns cu totul alte tradiii n alte sisteme de nvmnt, iar acest fapt poate fi exemplificat prin utilizarea ndelungat a standardelor de perfoman pentru elevi i a testului n evaluarea iniial, continu i final. Procesul elaborrii standardelor de performan, precum i utilizarea intensiv a testelor, mai ales n evaluarea naional (examene de bacalaureat, teze unice, evaluarea naional la finalul clasei a IV-a etc.) sunt elemente relativ noi n evaluarea romneasc. n acest fel se explic i opiunile diferite pentru clasificarea, dar i pentru utilizarea metodelor de evaluare. 4.2. Metode tradiionale de verificare Tipologia metodelor tradiionale de evaluare este tratat detaliat n majoritatea lucrrilor predagogice. Metodele tradiionale de verificare sunt probele de evaluare orale, scrise i practice (Radu, 2000; Lioiu, 2001; Moise, 2007; Cuco, 2008). Unii autori prefer utilizarea conceptelor de verificare oral, scris i practic, pentru a diferenia aceste metode de examen, care este considerat o form special a probelor de verificare tradiionale. Fiecare dintre aceste probe se poate aplica la clas fie n mod curent, fie periodic, fie la finalul unor secvene consistente de predare-nvare (verificare global). 4.2.1. Metodele de verificare oral sunt utilizate n mod frecvent n evaluarea la clas i pot mbrca cel puin dou forme: ascultarea sau chestionarea n fiecare lecie mixt i verificarea oral n lecii special organizare (leciile de evaluare).

Verificarea oral curent (ascultarea) constituie substana secvenei de verificare a cunotinelor anterioare din fiecare lecie mixt, alturi de verificarea temei pentru acas. Ea const n chestionarea elevilor din coninutul leciei de zi, nefiind recomandat verificarea cunotinelor anterioare dintr-un set de lecii anterioare. Proiectarea i desfurarea corect a probelor de evaluare curent constituie premise pentru a obine informaii suficient de precise despre achiziiile elevului. Prin intermediul verificrilor orale curente se pot evalua comportamente corespunztoare unor niveluri taxonomice diferite, de la cunotine i capaciti pn la judeci de valoare asupra unor coninuturi, iar caracterul formativ al acestei metode este evident. Practic, verificarea oral curent ndeplinete n principal funcia de orientare i ameriorare, dar poate acoperi i funcia decizional, n cazul n care se finalizeaz prin notare. O secven de chestionare dintr-o lecie mixt trebuie s se ncadreze n limitele temporale specifice (15-25 de minute), ceea ce permite evaluarea unui numr mic de elevi, de la 3-5 elevi n cazul disciplinelor socio-umane, pn la 6-8 elevi n cadrul disciplinelor reale. Ascultarea ncepe, de regul, printr-o conversaie frontal de scurt durat care se ncheie cu precizarea coninuturilor i a comportamentelor ce vor fi evaluate (Radu, 1979) i desemnarea elevilor care vor fi ascultai. Restul elevilor din clas particip la evaluare, fie prin implicare direct (li se poate cere s formuleze i ei ntrebri de verificare pentru colegii lor, s completeze sau s corecteze rspunsurile), fie prin autoevaluarea propriilor achiziii n comparaie cu cele ale colegilor evaluai. ntrebrile care se adreseaz au fost grupate n mod tradiional n ntrebri de baz i ntrebri ajuttoare, iar dialogul evaluator-evaluat trebuie s respecte toate regulile conversaiei ca metod didactic, deoarece verificarea oral curent se constituie ntr-o form de factur conversaional. Se recomand ca profesorul s asculte pn la capt rspunsul formulat de elev, indiferent de gradul de corectitudine al acestuia i abia la final s intervin. Dac rspunsul este corect se poate continua secvena de evaluare, dar dac rspunsul este greit se stimuleaz autocorectarea. n cazul n care elevul nu i poate corecta rspunsul, se cere celorlali elevi din clas s intervin. n cazul n care nici aceast formul de rezolvare a sarcinii nu se soldeaz cu un succes, poate interveni profesorul. Nu se recomand ca profesorul s fragmenteze rspunsul elevului cu observaii, deoarece acest comportament ar genera i mai mult nesiguran i nencredere la elev. De asemenea, nu se recomand aprecierea prin not a rspunsurilor izolate, a interveniilor foarte scurte care produc dezechilibre n apreciere. Profesorul poate utiliza un catalog personal, n care s noteze mai multe intervenii ale elevului, pe baza crora s se aprecieze apoi achiziiile acestuia. Literatura de specialitate sintetizeaz i alte erori pe care profesorii le pot face n verificarea oral curent cum ar fi: Reducerea verificrii la ascultarea leciei de zi, reprodus mecanic de ctre elev fr o selecie a coninuturilor semnificative, foarte importante indicate de ctre profesor prin ntrebri; Examinarea exclusiv frontal, fr a se nominaliza elevii ce vor fi ascultai i, eventual, notai sau neglijarea complet a clasei, prin concetrarea ateniei doar pe interaciunea cu elevii chestionai; Elaborarea defectuoas a ntrebrilor ajuttoare, care devin inutile ca mijloc de sprijinire a elevului n formularea rspunsului. Tem de reflecie Analizai secvena de verificare a cunotinelor anterioare dintr-un proiect didactic pentru o lecie mixt (elaborat de dvs., de ctre un coleg, de ctre un cadru didactic), concentrndu-v atenia asupra calitii ntrebrilor. ncercai s corectai eventualele erori n proiectarea ntrebrilor.

Verificarea oral n lecii special organizate (periodic) poate fi utilizat n nvmntul precolar i primar, cu precauia impus de caracteristicile specifice vrstei i avnd n vedere complexitatea coninuturilor vizate. Spre deosebire de verificarea oral curent care se realizeaz n fiecare lecie mixt, verificarea oral periodic poate fi o secven consistent a leciei de evaluare i poate viza coninuturi mai ample (un set de lecii, o unitate de nvare etc.). Aceast metod de evaluare presupune formularea unor sarcini de rezolvat care sunt prezentate elevului n etape succesive. Verificarea oral periodic are cteva avantaje n comparaie cu cea curent: n principal, permite evaluarea unui numr mai mare de elevi i a unor coninuturi mai extinse. n cadrul leciilor de evaluare, verificarea oral se poate combina cel mai adesea cu verificarea scris. Dac demersul verbal este dominant, metoda de evaluare utilizat este verificarea oral periodic, iar n cazul unei dominante scrise avem de-a face cu o verificare scris periodic (cu alte cuvinte, schimbul verbal de ntrebri i rspunsuri poate fi nsoit de sarcini scrise, dar ponderea acestora din urm trebuie s fie mai redus). Datorit complexitii coninuturilor i comportamentelor vizate, verificarea oral periodic presupune eforturi mai mari de proiectare i de realizare. Spre deosebire de forma curent a verificrii orale, acoper mai degrab necesitatea aprecierii elevului prin not dect orientarea acestuia n activitatea de nvare. Validitatea evalurii prin verificare oral periodic este mai mare dect n cazul evalurii orale curente, deoarece volumul coninuturilor surprinse este mai mare, iar profesorul are posibilitatea de a selecta teme, subiecte reprezentative. Evident, notarea este mai concludent din acelai motiv. n ciuda subiectivitii metodelor de verificare oral, se poate afirma c ele prezint o serie de avantaje, care decurg tocmai din caracterul viu al schimbului de ntrebri i rspunsuri dintre evaluator i evaluat. Profesorul are posibilitatea de a surprinde imediat nivelul de achiziii al elevului i eventuale lacune care pot fi acoperite prin msuri educaionale remediale. Dei verificrile orale permit mai ales colectarea de informaii despre volumul de cunotine asimilate de ctre elev, ele permit i evaluarea unor capaciti mai complexe, cum ar fi capacitatea de argumentare a elevului, capacitatea de a construi o serie de raionamente i de a le susine n manier convingtoare. Probele orale, n general, au marele avantaj de a-i permite profesorului s ofere suport elevului n elaborarea rspunsului, prin reformularea ntrebrilor sau prin adresarea unor ntrebri ajuttoare. n acest mod, elevii aflai n dificultate pot fi ajutai s surmonteze momentele dificile. Printre alte avantaje ale verificrii orale curente am putea meniona: flexibilitatea n formulare i reformularea sarcinilor de rezolvat de ctre elev, posibilitatea de a alterna tipul ntrebrilor i gradul lor de dificultate, n funcie de calitatea rspunsurilor oferite de ctre elev, oportunitatea de a clarifica i de a corecta imediat eventualele erori sau nenelegeri ale elevului, formularea ntrebrilor i a rspunsurilor potrivit logicii i dinamicii unui discurs oral, interaciunea direct ntre profesor i elev. Toate probele de verificare oral au o serie de limite, generate tocmai de caracterul direct i, uneori, greu controlabil i predictibil al intraciunilor dintre profesor i elev. Numrul de elevi care poate fi evaluat prin probe orale ntr-o anumit unitate de timp este relativ mic, indiferent dac verificrile sunt curente, periodice sau globale. Acest dezavantaj este resimit de profesor mai ales n cazul disciplinelor pentru care este alocat un numr mic de ore prin planul de nvmnt. De asemenea, volumul de coninuturi care poate fi antrenat n evaluarea oral este relativ redus, verificarea realizndu-se practic prin sondaj. n acest fel, cunotine foarte importante pentru etapele urmtoare de predare i nvare pot fi omise, ceea ce poate genera dificulti.

Verificarea oral este dificil din perspectiva elevului, mai ales dac acesta este introvertit sau emotiv, ceea ce presupune ca profesorul s anticipeze asemenea situaii i creeze o atmosfer de evaluare lipsit de ncordare, astfel nct elevul s poat depi eventualele momente critice. Unii dintre factorii perturbatori ai evalurii rezultatelor elevului au un efect mult mai puternic n contextul probelor orale i, de aceea, profesorul este obligat s reflecteze la posibilitile de reducere a erorilor, mai ales dac verificrile orale se soldeaz cu apreciere prin not. Din perspectiva evaluatorului, conservarea aceluiai nivel de exigen este un deziderat, ns realitatea educaional demonstreaz c, n cele mai multe cazuri, evaluatorul este mai exigent la nceputul verificrii i tinde s devin mai indulgent spre sfrit. n plus, nivelul de dificultate al ntrebrilor este greu de echilibrat, iar acest fapt conduce la diferenieri eronate ntre nivelurile de achiziii ale elevilor ascultai. n timp ce unii vor avea de rezolvat sarcini uoare, alii vor trebui s rspund la ntrebri complexe i, astfel, pot aprea dezechilibre n evaluare. Pentru a reduce subiectivitatea n verificrile orale, se pot utiliza fie de apreciere a rspunsurilor formulate de elev, care s includ repere generale precum (Jinga et al, 1996, pp. 46-47): a) coninutul rspunsului (profesorul trebuie s aprecieze corectitudinea i completitudinea acestuia, prin raportare la obiectivele i la coninuturile vizate); b) organizarea coninutului (profesorul va analiza i modul de structurare a coninutului, precum i coerena n formularea rspunsului); c) prezentarea coninutului (profesorul va lua n calcul claritatea, sigurana i acurateea n redarea coninuturilor vizate). La aceste elemente, s-ar putea aduga elementele de originalitate din rspunsurile elevului. Tem de reflecie Recitii descrierea conversaiei ca metod didactic din cursul de teoria instruirii i ncercai s adaptai exigenele pe care trebuie s le respecte ntrebrile i rspunsurile la situaia de verificare oral curent, respectiv periodic. 4.2.2. Metode de verificare n scris Varietatea de obiective i de coninuturi implicate n activitatea didactic impune cu necesitate i utilizarea metodelor de verificare n scris. n funcie de nivelul de generalitate al obiectivelor i de volumul de cuntine vizat, probele scrise pot fi (Manolescu, 2002; Moise, 2007): Probe scrise curente (lucrarea de control n nvmntul primar i extemporalul n nvmntul gimnazial i liceal); Lucrri de control la sfritul unui capitol sau al unei uniti de nvare; Lucrri scrise semestriale (care pot mbrca i forma tezelor n gimnaziu i liceu) care sunt precedate de lecii de recapitulare i sistematizare. Probele scrise sunt preferate n multe dintre situaiile de evaluare, deoarece prezint o serie de avantaje n comparaie cu metodele de verificare oral: Cea mai important caracteristic a probelor scrise este aceea c presupun elaborarea unor sarcini sau subiecte strict identice pentru toi elevii. n acest fel, profesorul poate evita eventualele inconsecvene n formularea sarcinilor de rezolvat, fapt greu de controlat n cadrul probelor orale care au ca potenial risc elaborarea de ntrebri cu nivele de dificultate diferite, ceea ce poate conduce la erori n aprecierea rezultatelor elevilor. Spre deosebire de probele orale, care sunt cronofage, lucrrile scrise permit evaluarea unui numr mare de elevi (ntreaga clas, n cazul lucrrilor scrise curente i a celor proiectate la sfritul unui capitol) ntr-un interval de timp relativ scurt.

Probele scrise permit evaluarea unui volum mare de achiziii ale elevului i pot surprinde comportamente specifice tuturor nivelelor taxonomice pentru domeniul cognitiv, de la cunoaterea conceptelor i a terminologiei la analiz, sintez i chiar evaluare. Subiectivitatea evaluatorului poate fi controlat, acesta avnd posibilitatea de a reveni asupra unor lucrri, a le recorecta, a regndi deciziile privind aprecierea prin not, ceea ce este imposibil n cazul probelor orale. Metodele de verificare n scris respect ritmul individual de lucru al elevilor, n sensul c fiecare dintre acetia rezolv fiecare subiect potrivit posibilitilor, fr limit de timp (doar pentru ntreaga lucrare exist, de regul, o limit de timp, dar elevul are libertatea de a gestiona timpul pe care l aloc fiecrui subiect). n plus, probele scrise constituie o oportunitate de exprimare pentru elevii mai timizi, care sunt dezavantajai n situaiile de evaluare oral. Pe baza analizei detaliate a lucrrilor dintr-o clas, profesorul poate identifica lacune i erori repetitive, ceea ce i permite s proiecteze activiti didactice cu caracter remedial, de recuperare, i chiar s regndeasc demersurile didactice cu scopul de a sprijini procesul de nvare al elevilor.

Dincolo de aceste avantaje, trebuie avute n vedere i o serie de limite ale probelor scrise: Profesorul nu i poate sprijini pe elevi n formularea rspunsurilor, iar unele erori nu pot fi corectate imediat, ceea ce nseamn c feedback-ul este mai ntrziat dect n cazul probelor orale. Evaluarea prin probe scrise nu este la fel de intens conectat cu activitile de predare i nvare i nu permite reglaje didactice fine. n cazul n care subiectele sunt formulate neglijent, evaluarea se reduce la surprinderea volumului de cunotine asimilate de ctre elev. n mod evident, probele scrise nu se pot utiliza n nvmntul precolar dect n forme mult simplificate, adaptate cu grij la specificul obiectivelor i al coninuturilor. Vom prezenta detaliat probele scrise curente i cele aplicate la sfritul unui capitol sau al unei uniti de nvare. Nu vom trata teza ca prob scris periodic, avnd n vedere faptul c nu se utilizeaz n nvmntul precolar i primar. Tem de reflecie Imaginai o prob scris care poate fi aplicat n nvmntul precolar. Reflectai la faptul c instruciunile de rezolvare trebuie prezentate oral de ctre profesor, iar sarcinile nu trebuie s depeasc nivelul indicat de programa colar pentru nvmntul precolar. Care sunt dificultile n proiectarea unei astfel de probe? Proba scris curent (lucrare de control, la clasele mici) constituie o alternativ la proba oral curent (ascultarea sau chestionarea) i nu se confund cu testul docimologic aplicat n form scris, deoarece subiectele sunt elaborate n manier tradiional (probele scrise curente includ subiecte de tip compunere). Probele scrise nlocuiesc chestionarea din fiecare lecie mixt de cteva ori ntr-un an colar i se finalizeaz, de regul, cu aprecierea prin not a performanelor elevului. n acest fel, probele scrise curente contribuie la motivarea continu a elevului pentru activitatea de nvare i la orientarea acestuia asupra propriului progres. Att profesorul, ct i elevii pot identifica eventualele lacune sau erori n nelegerea materiei i pot interveni pentru ndeprtarea acestora, nainte ca procesul de nvare s fie iremediabil afectat. Pentru a putea contribui n mod veritabil la reglarea i mbuntirea activitilor de predare-nvare, proba scris curent trebuie s respecte o serie de repere, precum:

Subiectele trebuie s surprind achiziii reprezentative ale elevului, fr a se centra pe detalii nesemnificative care nu ofer informaii relevante pentru etapele viitoare ale activitilor de predare i nvare. n plus, se recomand ca subiectele s se refere strict la lecia de zi, ntruct probele scrise curente nu sunt anunate anterior. Toate detaliile privind modul de administrare, subiectele i instruciunile de rezolvare trebuie proiectate nainte de nceperea leciei, pentru a nu genera confuzii i a nu irosi din timpul alocat rezolvrii probei. Proba scris este ntodeauna nsoit de un punctaj care se comunic elevilor nainte ca acetia s nceap rezolvarea subiectelor, pentru a-i putea gestiona singuri timpul i efortul. De asemenea, proiectarea probelor scrise presupune elaborarea unor scheme de corectare sau adoptarea unei metode de notare. Avnd n vedere natura subiectelor incluse n probele scrise tradiionale, acestea se noteaz prin metode subiective precum impresia global, scara de specimene, determinarea frecvenelor i metoda analitic (De Landsheere, 1975), pe care le vom prezenta detaliat n seciunea dedicat metodelor de apreciere. Intervalul de timp n care se corecteaz lucrrile trebuie s fie ct mai scurt, astfel nct rezultatele s fie comunicate elevilor ct mai repede, pentru a se pstra impactul formativ i motivaional al probei scrise curente.

Verificarea la sfrit de capitol s-a impus ca prob periodic de evaluare n scris n ultimele decenii (Roman i Popescu, 1980; Moise, 2007) i acoper obiective i coninuturi parcurse ntr-o serie de lecii, conectate prin legturi logice. Aceast form de verificare scris impune organizarea riguroas a activitii de predare i nvare, n sensul c profesorul i elevii urmresc mpreun firul logic al unui capitol care se reflect i n tipologia leciilor (parcurgerea unui capitol debuteaz cu lecii de predare, continu cu lecii mixte i de consolidare i se ncheie cu lecii de recapitulare i sistematizare, urmate de o lecie de evaluare). Verificarea la sfrit de capitol are o serie de avantaje n comparaie cu alte tipuri de probe scrise i orale: Ritmicitatea evalurii i constrnge pe elevi s acorde atenie egal fiecrui capitol, evitndu-se astfel ruperile de ritm n procesul de nvare i asigurndu-se caracterul sistematic i temeinic al pregtirii elevului. Caracterul formativ al verificrilor de sfrit de capitol este mai vizibil dect n cazul evalurilor scrise curente, prin pregtirea elevului pentru viitoarele examene (n cazul elevilor din nvmntul primar, examenul naional de la sfritul clasei a IV-a). Acoper cu destul rigoare funcia diagnostic a evalurii, oferind informaii despre nivelul de achiziii al elevului i facilitnd orientarea activitilor didactice viitoare. Poate contribui la optimizarea relaiilor didactice: verificarea la sfrit de capitol este ntotdeauna anunat i pregtit anterior prin lecii de recapitulare i sistematizare, spre deosebire de lucrrile de control care nu sunt, de regul, anticipate de ctre elev. Acoper ntr-o oarecare msur chiar funcia social a evalurii, n sensul c permite comunicarea unor informaii mai valide despre achiziiile elevului ctre factorii interesai, n special prinii i decidenii n domeniul educaional. n contextul apariiei unei noi structuri curriculare unitatea de nvare verificarea la sfrit de capitol ar trebui s fie regndit, n sensul adaptrii sale la noua modalitate de organizare a coninuturilor i al elaborrii de exigene specifice. n condiiile introducerii examenului naional la finalul clasei a IV-a cu caracter obligatoriu (pn n acest an colar, evaluarea naional la finalul clasei a IV-a s-a realizeaz cu caracter experimental pe un

eantion reprezentativ de elevi), verificarea la sfrit de capitol sau de unitate de nvare ar putea avea un rol important n pregtirea elevilor (inclusiv emoional). Tem de reflecie Proiectai o prob scris curent (lucrare de control) sau periodic (lucrare la sfrit de capitol/unitate de nvare) pentru o disciplin la alegere din planul de nvmnt pentru clasa a II-a. 4.2.3. Metodele de verificare practic sunt utilizate pentru a evalua achiziii n contextul unor discipline precum educaia fizic, educaia plastic i muzical etc., dar i n situaiile n care sunt vizate deprinderi i capaciti complexe n domenii diverse precum matematica, tiinele, studiul limbilor strine etc. Profesorii cad adesea n eroarea de a privi probele practice n asociere restrns doar cu anumite discipline, ignornd posibilitile de utilizare a acestora n domenii pentru care sunt rezervate probele scrise i cele orale (de exemplu, limba i literatura romn sau matematica). Mai mult dect att, datorit dificultilor n a distinge i a aprecia contribuiile individuale, se pierde adesea din vedere faptul c probele practice pot fi realizate i n grup. n cazul probelor practice, profesorul poate evalua fie produsul activitii elevului, fie procesul parcurs n realizarea acestuia (Gallagher, 1998). Proiectarea probelor practice presupune parcurgerea unor etape, care faciliteaz i orienteaz finalizarea acestora prin notare (Gallagher, 1998, pp. 244-271): 1) Stabilirea scopului probei practice; 2) Determinarea obiectivelor ce vor fi vizate i specificarea domeniului (cognitiv, afectiv, psihomotor) i a nivelului taxonomic la care se situeaz; 3) Proiectarea detaliat a sarcinilor de lucru i a instruciunilor de rezolvare; 4) Stabilirea criteriilor de apreciere a produselor sau a procesului; 5) Elaborarea unei scheme de notare pe baza criteriilor stabilite anterior; 6) Aplicarea experimental a probei practice i 7) Revizuirea probei practice (inclusiv a criteriilor de apreciere i a schemelor de notare). Dei acest demers de proiectare pare logic, fr dificulti majore, natura comportamentelor i a coninuturilor vizate poate genera numeroase probleme. De aceea, pentru domeniul afectiv i psihomotor se recomand folosirea complementar a observrii activitii i comportamentului elevilor (prin fie de evaluare, scri de clasificare i liste de control), o metod alternativ de evaluare pe care o vom prezenta ntr-o seciune ulterioar a cursului. Observarea activitii i comportamentului elevului este util mai ales n etapele de stabilire a criteriilor de apreciere i de elaborare a schemei de notare. Se apreciaz c probele practice pot ndeplini toate funciile actului evaluativ i permit evidenierea unor achiziii de tipul trsturilor de personalitate, care nu pot fi vizate prin alte metode de verificare (Moise, 2007). Probele practice sunt ns mai cronofage dect cele orale i scrise, presupun accesul la resurse materiale substaniale i antreneaz dificulti n aprecierea rezultatelor elevului. Tem de reflecie Proiectai o prob practic curent (ntr-o lecie mixt) sau periodic (ntr-o lecie de evaluare, la sfritul unui capitol sau al unei uniti de nvare) pentru disciplina matematic. La nceputul prezentrii analitice a probelor orale, scrise i practice fceam observaia c acestea pot fi curente, periodice sau globale n funcie de complexitatea obiectivelor i volumul cunotinelor vizate. Descrierea noastr s-a limitat doar la la forma curent i periodic a probelor de evaluare, forma global fiind examenul (oral, scris i chiar practic). Deoarece examenul nu este specific nvmntului precolar i primar, am considerat c nu este necesar tratarea sa n acest curs. Atragem ns atenia asupra faptului c examenul scris ar putea deveni (n viitor, n condiiile unui nou val de reforme educaionale) o prob de

evaluare sumativ, care s fie adminstrat elevilor la finalul clasei a IV-a. n ultimii ani, n Romnia au fost organizate evaluri naionale pentru elevii claselor a IV-a, pe eantioane reprezentative la nivel naional, care au acoperit ns mai degrab funcia social a evalurii. Subiectele nu au fost formulate ns n spiritul examenului scris ca form de verificare global, ci au constat n itemi specifici testelor docimologice. 4.3. Testul docimologic 4.3.1. Definiii i tipologie1 O prim observaie care se impune n prezentarea testului docimologic este aceea c nu toate probele scrise sunt sau trebuie s fie teste docimologice. Dei o parte din literatura romneasc recent destinat problematicii evalurii sugereaz exact acest fapt, ne exprimm convingerea c proba scris tradiional (lucrarea de control sau extemporalul) nu mbrac ntotdeauna forma unui test. Nu e mai puin adevrat c se recomand utilizarea mai frecvent a testelor docimologice n evaluarea la clas, cel puin n perspectiva pregtirii elevilor pentru evalurile i examenele naionale. n ultimii ani, acestea din urm sunt cu certitudine elaborate n acord cu exigenele testelor docimologice. Literatura pedagogic abund n definiii ale testului (n englez prob, examinare, ncercare), de la definiii de dicionar pn la definiii asociate unor nume mari ale psihologiei i pedagogiei (L. Cronbach sau A. Anastasi). Testul poate fi definit ca o prob de evaluare a unei persoane n raport cu o serie de criterii, cu scopul de a obine informaii despre raportul dintre acea persoan i aria de referin (Karmel i Karmel, 1978, p. 5) sau ca instrument care presupune rezolvarea unui set de ntrebri/ sarcini standard, aceleai pentru fiecare subiect. Rspunsurile la ntrebri se traduc n expresii sau valori numerice, suma lor reprezentnd o form de caracterizare a subiectului n ceea ce privete anumite procese i abiliti (McMillan, 1992, p. 114). Dac aceste definiii ne pot lmuri cu privire la accepiunea testului n spaiul educaional, nu putem afirma c maniera de clasificare a acestora este la fel de clar. n mod evident, testul docimologic utilizat n evaluarea colar s-a dezvoltat n strns legtur cu testul psihologic, iar toate criteriile de clasificare, precum i exigenele de elaborare sunt aceleai ca n cazul acestuia. Practic, n spaiul educaional se utilizeaz att teste psihologice, ct i teste docimologice, iar acestea din urm trebuie s rspund acelorai exigene de construcie i de elaborare ca i cele dinti. Cele dou categorii de teste difer doar n ceea ce privete obiectul evalurii: n timp ce testele psihologice vizeaz procese cognitive, trsturi de personalitate etc., testele docimologice vizeaz cunotine sau alte tipuri de achiziii colare. Testele docimologice, ca i cele psihologice pot fi clasificate n funcie de mai multe criterii (McMillan, 1992; Radu, 2000; Moise, 2007; Gall, Gall, i Borg, 2007)2: n funcie de rigurozitatea procedurilor de administrare i de calculare a scorurilor, testele pot fi standardizate i nestandardizate. Testele standardizate au o procedur de administrare riguroas: sunt stabilite cu precizie limitele de timp pentru rezolvarea fiecrui item, materialele care trebuie utilizate (inclusiv ordinea i forma de prezentare). Ele sunt elaborate de specialiti i sunt nsoite de manuale de utilizare care specific condiiile de administrare, modalitile de calculare a scorurilor, precum i detalii privind fidelitatea i validitatea instrumentului. Avantajul testelor standardizate const n aria larg de
Aceast seciune introductiv privind testul docimologic constituie o reluarea a cunotinelor despre testul docimologic asimilate anterior de cursani n cadrul disciplinei Metodologia cercetrii pedagogice (anul II, semestrul I). 2 Din raiuni didactice, nu vom prezenta toate tipurile de teste descrise n literatura de specialitate, ci ne vom centra doar pe tipologiile relevante n contextul activitii de evaluare a profesorului.
1

aplicabilitate, de unde decurge ns i cea mai evident limit: ele nu pot fi utilizate n evaluarea curent, deoarece se refer la cunotine sau achiziii generale. Testele nestandardizate, cunoscute i ca teste elaborate de profesor (din engl. teacher-made tests) sunt aplicabile doar unei situaii particulare sau unui anumit grup de elevi i nu permit comparaii cu alte grupuri. n funcie de modalitatea de interpretare a rezultatelor distingem testele normative de testele criteriale. Testele normative presupun compararea rezultatelor unui subiect cu rezultatele grupului de referin. Ele permit realizarea unui clasament al subiecilor, fiind valorizat posibilitatea de comparare inter-individual. Testele criteriale presupun raportarea rezultatelor unui subiect la un nivel prestabilit al performanei n domeniul de interes. Scorurile obinute de un elev sunt interpretate n raport cu un criteriu, nu n contextul rezultatelor grupului de referin. Distribuia scorurilor la testele criteriale este asimetric, rezultatele concentrndu-se la polul negativ. n funcie de scopul aplicrii lor i a volumului coninuturilor vizate, testele pot fi formative i sumative: primele contribuie la determinarea nivelului i deficitului elevului i la orientarea sa n procesul nvrii, n timp ce ultimele sunt aplicate pe secvene mari (uniti de nvare, semestre, ani colari, cicluri de nvmnt) i au ca scop clasificarea elevilor i chiar certificarea acestora (Stoica et al., 2001; Moise, 2007). Dup modul de prezentare a rspunsului, se disting teste obiective i teste subiective. Testele obiective solicit rspunsuri stricte, iar testele subiective implic rspunsuri formulate diferit de fiecare subiect (Stoica et al., 2001; Moise, 2007). n funcie de modalitatea de adminstrare, testele pot fi orale (aceasta este o variant preferabil pentru precolari, de exemplu) i scrise. n funcie de limitele temporale impuse pentru rezolvarea testului, putem distinge testele de randament (engl. speed-test) i testele de nivel (engl. power-test). Spre deosebire de testele de nivel sau de performan, testele de randament presupun rezolvarea itemilor ntre limite de timp clar precizate. n funcie de momentul n care sunt aplicate (Radu, 2000), testele pot fi iniiale (administrate nainte ca orice intervenie educaional s fi avut loc), de progres (administrate n timpul desfurrii interveniei educaionale) i finale (administrate dup ncheierea interveniei educaionale). 4.3.2. Definiia itemului din perspectiva evalurii. Tipuri de itemi Din perspectiva evalurii colare prin teste docimologice, itemul poate fi definit ca unitate de msurare care include un stimul i o form prescriptiv de rspuns, fiind formulat cu intenia de a suscita un rspuns de la cel examinat, pe baza cruia se pot face inferene cu privire la nivelul achiziiilor acestuia (Osterlind, 1998; Downing i Haladyna, 2006). Itemul poate fi prezentat izolat sau n strns relaie cu ali itemi de acelai tip sau din tipologii diferite, poate presupune alegerea sau elaborarea rspunsului, ntr-un timp strict determinat sau fr limit de timp. Itemii trebuie s respecte aceleai exigene de proiectare, administrare i scorare, indiferent de natura testului n care sunt inclui (teste elaborate de profesor sau teste standardizate; teste formative sau teste sumative etc.). Tipologia itemilor include itemi obiectivi, semiobiectivi i subiectivi (Radu, 2000; Mndru, 2001; Moise, 2007; Cuco, 2008). Itemii obiectivi permit msurarea exact a rezultatelor i sunt utilizai mai ales n testele standardizate i pot fi (Evans, 1985; Crocker i Algina, 1986; Radu, 2000; Moise, 2007): itemi cu alegere dual care solicit subiectului s aleag unul din cele dou posibiliti de rspuns de tipul: adevrat-fals, corect-greit, potrivit/nepotrivit; itemi cu alegere multipl care solicit alegerea unui rspuns dintr-o list de alternative;

itemi de asociere care presupun stabilirea unei corespondene ntre dou liste de afirmaii sau concepte. Itemii semiobiectivi pot fi itemi cu rspunsuri scurte, fiind formulai concis i specificnd clar natura rspunsului corect; itemi de completare care presupun completarea unui cuvnt sau a unei sintagme ntr-un text lacunar; itemi structurai care se constituie dintrun set de ntrebri care au n comun un element sau se refer la acelai fenomen, concept (Mndru, 2001; Radu, 2000). Itemii subiectivi solicit formularea unui set de enunuri ample sau restrnse din punct de vedere al volumului (Radu, 2000; Moise, 2007). Itemii de tip rezolvare de probleme i cei de tip eseu (structurat sau nestructurat) constituie variantele de itemi subiectivi utilizai n evaluarea colar (Mndru, 2001; Cuco, 2007). Natura acestor itemi imprim o not subiectiv i calculrii scorurilor, a punctajelor chiar dac se elaboreaz un barem de corectare foarte riguros. Fiecare dintre tipurile de itemi are avantaje i limite specifice i trebuie s respecte criterii de formulare, de care depinde calitatea global a testului (Radu, 2000; Moise, 2003). n elaborarea unui test docimologic, trebuie avut n vedere complementaritatea i dificultatea gradat a tipurilor de itemi. Vom prezenta sistematic toate cele trei categorii de itemi, prezentnd exemple, dar i avantaje i limite. 4.3.3. Itemii obiectivi Itemii obiectivi presupun ntotdeauna alegerea rspunsului/rspunsurilor corect/e dintr-o list anterior elaborat de ctre evaluator i pus la dispoziie celui examinat (de aceea, sunt cunoscui i ca itemi cu rspuns dat). Rspunsul corect este identic pentru toi cei examinai, iar evaluatorii corecteaz aceti itemi strict identic. Putem delimita trei categorii de itemi obiectivi, difereniai att n funcie de natura stimulului, ct i n funcie de natura rspunsurilor solicitate: itemi cu rspuns dual (alternativ), itemi cu rspuns de tip alegere multipl i itemi de asociere. 4.3.3.1. Itemii cu rspuns dual se elaboreaz sub forma unor enunuri complete, pe care examinatul trebuie s le accepte sau s le resping. Rspunsurile sunt marcate cu ajutorul unor iniale (A F, dac rspunsul este considerat adevrat, respectiv fals; menionm c se poate introduce i varianta O reprezentnd faptul c enunul este o opinie, nefiind nici adevrat, nici fals) sau al cuvintelor DA - NU, plasate n faa fiecrui enun sau dup acesta. Acest tip de item este alctuit dintr-o instruciune pentru cel examinat i unul sau mai multe enunuri coninnd sarcina de rezolvat, nsoite de variantele de rspuns (DA - NU; Adevrat - Fals etc.). Exist i alternativa ca examinatul s plaseze (nu s bifeze) aprecierile de tip A - F, Da Nu, n relaie cu itemii corespunztori. n general, itemii cu rspuns dual conduc la evaluarea unor comportamente corespunztoare nivelelor taxonomice inferioare (cunoaterea i nelegerea), ns pot fi utilizai n elaborarea testelor pentru majoritatea disciplinelor de nvmnt.
Exemplul 13 Limba romn, Varianta 2, Itemul 4 ncercuiete cuvntul DA dac enunul este scris corect i cuvntul NU dac enunul este scris incorect. Ei hrnesc psrile. Ei hrnete psrile. Ele se joc n ograd.
3

DA DA DA

NU NU NU

Toate exemplele de itemi sunt preluate din testele administrate n contextul Evalurii naionale pentru clasa a IV-a din anul 2005. Vezi Raportul SNEE pe site-ul www.edu.ro

Ele se joac n ograd. Copiii harnici ngrijete puiorii. Copiii harnici ngrijesc puiorii.

DA DA DA

NU NU NU

Exemplul 2 tiine, Varianta 1, Itemul 2 Scrie X n caseta din dreptul fiecrui enun adevrat. Corpurile gazoase au form i volum proprii. Corpurile solide au form i volum proprii. Corpurile solide iau forma vasului n care sunt puse. Corpurile lichide au form i volum proprii.

Avantaje ale itemilor cu rspuns dual Precizia i simplitatea sarcinilor de rezolvat crete fidelitatea i obiectivitatea acestui tip de itemi. Permit evaluarea unui numr relativ mare de comportamente (se pot acoperi coninuturi extinse) ntr-un timp scurt, dat fiind faptul c rspunsurile sunt anterior formulate, iar elevul indic doar valoarea de adevr a acestora. Favorizeaz evaluarea unor comportamente asociate unor nivele taxonomice diferite (cunoatere, nelegere i, n condiii speciale, aplicare). Proiectarea lor este relativ simpl, rezultatele fiind uor de cuantificat. Limite ale itemilor cu rspuns dual Validitatea itemilor cu rspuns dual este relativ mic, datorit simplitii, ceea ce conduce la orientarea spre nivelele taxonomice inferioare. Aceti itemi nu permit nuanri n evaluarea elevului, dat fiind caracterul fix i scurt al rspunsului, avnd valoare diagnostic redus (nu ofer evaluatorului informaii cu privire la raiunile pentru care elevul a ales una sau alta dintre cele dou variante). Dac este comparat cu toate celelalte tipuri de itemi, se poate aprecia c permite cea mai mare probabilitatea de a ghici din partea elevului. Teoretic, exist 50% anse ca elevul s ghiceasc rspunsul corect. Exigene de proiectare a itemilor cu rspuns dual Se recomand evitarea adevrurilor banale i inutile. Trebuie evitate enunurile negative (mai ales a celor care includ o dubl negaie). Trebuie evitate i formulrile lungi ori inexacte, care nu permit orientarea elevului ctre rspunsul corect. n acelai enun nu se pot include dou idei care nu se afl n relaie direct, pentru c o asemenea formulare ar putea dezorienta elevul. Lungimea enunurilor adevrate i false trebuie s fie aproximativ aceeai, pentru a nu ntinde elevului capcana de a ghici rspunsul corect, speculnd c enunul mai elaborat este adevrat. Numrul enunurilor adevrate i false trebuie s fie echilibrat pentru a nu determina elevul s greeasc prin generalizarea unei reguli pe care poate considera c a desprins-o din rezolvarea itemilor anteriori (dac toate rspunsurile au fost false i acesta e tot fals).

4.3.3.2. Itemii cu rspuns de tip alegere multipl Itemii cu rspuns de tip alegere multipl pot servi att la evaluarea unor comportamente specifice nivelelor taxonomice inferioare, ct i a comportamentelor asociate cu analiza i evaluarea (Berk, 1999 citat de Schreerens, Glas i Thomas, 2003). Acest tip de item este alctuit din dou elemente: Tulpina (engl. stem), problema sau premisa (Mndru, 2001; Popham, 2003), formulat printr-o ntrebare direct sau printr-un enun incomplet; O serie de alternative de rspunsuri propuse elevului, dintre care una este corect sau cea mai bun, iar celelalte au rolul de distractori, constituind obstacole ce trebuie depite de ctre elevi n alegerea rspunsului corect (distractorii au caracter mai degrab stimulativ, dect derutant). Avnd n vedere natura rspunsului care se poate solicita elevului, itemii cu rspuns de tip alegere multipl pot fi proiectai n dou variante (Moise, 2007): Itemii cu rspuns corect presupun alegerea rspunsului corect care completeaz un enun, dintr-o list de alternativ pus la dispoziie elevului. Se aseamn cu itemii semiobiectivi tip rspuns scurt (de completare), singura diferen constnd n faptul c elevul alege rspunsul, nu l elaboreaz el nsui. Itemii de acest tip se cantoneaz la nivelul cunoaterii din taxonomia domeniului cognitiv. Itemii cu rspunsul cel mai bun sunt preferai pentru evaluarea pe nivele taxonomice mai nalte (analiz i evaluare). Mai multe dintre rspunsurile pe care elevul trebuie s le analizeze sunt acceptabile, dar n msur diferit, elevul trebuind s indice cea mai potrivit variant.
Exemplul 1 tiine, Varianta 1, Itemul 1 1. Scrie X n caseta din dreptul ilustraiei care prezint evaporarea apei.

Exemplul 2 Matematic, Varianta 1, Itemul 5 ncercuiete litera potrivit rspunsului corect. Dac diferena a dou numere este 150, iar scztorul este 112, atunci desczutul este: a. 38; b. 162; c. 226; d. 262.

Avantaje ale itemilor de tip alegere multipl Pot fi utilizai att n evaluarea unor comportamente simple, de natur reproductiv, ct i n evaluarea unor comportamente complexe, specifice nivelelor taxonomice nalte. Pot acoperi coninuturi diverse, la un nivel de profunzime satisfctor. Proiectarea, administrarea i scorarea itemilor cu alegere multipl este relativ simpl. Dificulti n proiectare pot fi invocate doar n cazul itemilor cu alegere multipl de tip cel mai bun rspuns, care trebuie s fie atent conectate cu elementele de coninut corespunztoare. Indiferent de forma n care sunt utilizai, au eficien crescut, avnd n vedere volumul mare de coninuturi care poate fi evaluat.

Limite ale itemilor de tip alegere multipl Faptul c rspunsurile sunt gata elaborate nu permite evaluarea capacitilor creative ale elevului, a capacitilor de organizare a informaiilor (sintez). Itemii care solicit precizarea celui mai bun rspuns sunt dificil de proiectat distractorii trebuie s fie suficient de contrastani prin raport cu rspunsul corect, ns alternativele trebuie s fie totodat omogene. Scorarea itemilor cu alegere multipl, n varianta rspunsul cel mai bun poate genera dezacorduri ntre evaluatori, n cazul n care exist mai mult de o variant de rspuns corect (Mndru, 2001). Exigene de proiectare a itemilor de tip alegere multipl Tulpina itemului trebuie s fie formulat clar, complet i logic, evitndu-se impreciziile i ambiguitile. Distractorii trebuie s fie relativ omogeni, fr a se introduce alternative de rspuns fr nici o legtur cu problema ilustrat n enun. Trebuie evitate redundanele verbale n prezentarea variantelor de rspuns, pentru a uura lectura i rezolvarea itemulului de ctre elev. Tulpina sau premisa trebuie s evite formulrile negative, care genereaz dificulti n interpretarea itemului de ctre elev. Dei recomandarea de mai sus se aplic i distractorilor, exist voci care susin necesitatea unei alternative de rspuns de tipul nici o variant din cele de mai sus (dar nu de tipul toate rspunsurile de mai sus), deoarece acesta ar reprezenta o real provocare pentru elev (Popham, 2003). Dac un test include mai muli itemi cu alegere multipl, poziia rspunsului corect trebuie s varieze, pentru a descuraja elevul s speculeze asupra locului alternativei de rspuns care trebuie bifat. Distratorii trebuie s constituie rspunsuri plauzibile, nu evident nepotrivite cu enunul problemei, astfel nct s stimuleze elevul n analiza fiecrui posibil rspuns. 4.3.3.3. Itemii de asociere Itemii de asociere (engl. matching items) sau tip pereche solicit elevului s stabileasc corespondena ntre dou seturi de concepte, date, informaii etc., plasate de regul n dou coloane diferite: o prim coloan este destinat premiselor sau stimulilor, iar n a doua coloan sunt incluse rspunsurile. Premisele i rspunsurile pot fi perechi de evenimente i date, termeni i definiii, reguli i exemple, simboluri i concepte, autori i titluri de cri, plante, animale i clasificri, principii i aplicaii, cauze i efecte, afirmaii teoretice i experimente etc. (Moise, 2007). n funcie de natura coninuturilor, exist i moduri alternative de prezentare a premiselor i a rspunsurilor, cu ajutorul hrilor, diagramelor, imaginilor etc., care s-l ajute pe elev n rezolvarea sarcinii. n cazul precolarilor i a colarilor mici se poate sugera marcarea relaiilor dintre premise i rspunsuri prin sgei sau linii simple.
Exemplul 1 Limba romn, Varianta 1, Itemul 3 Unete, printr-o linie, cuvintele din coloana A cu acelea care au neles opus din coloana B. A B rea tristee mult ncet repede bun s-a bucurat puin

piticii frumusee

urenie uriaii s-a ntristat

Exemplul 2 tiine, Varianta 2, Itemul 10 Traseaz sgei, indicnd hrana fiecrei fiine din ilustraiile de mai jos:

Avantaje ale itemilor de asociere Itemii de asociere pot fi considerai cei mai compleci dintre itemii obiectivi, fiind practic constituii dintr-o serie de itemi de alegere multipl. Posibilitatea ca elevul s ghiceasc rspunsul corect este redus prin elaborarea listei de rspunsuri, n aa fel nct s includ i distractori (rspunsuri care nu trebuie asociate cu nici o premis). Sunt relativ uor de proiectat i de administrat, fcnd posibil abordarea unui numr mare de comportamente n timp scurt. Pot viza deopotriv nivele taxonomice inferioare i superioare. Limite ale itemilor de asociere n majoritatea situaiilor evaluative, sunt utilizai pentru a aprecia acurateea asimilrii informaiilor de tip factual, dei se preteaz i n evaluarea comportamentelor asociate nelegerii, aplicrii i chiar analizei. Proiectarea itemilor de asociere poate fi dificil n cazul n care se vizeaz respectarea omogenitii premiselor i a alternativelor de rspuns. Exigene de proiectare a itemilor de asociere Premisele i alternativele de rspuns trebuie s acopere un spectru omogen (concepte similare), astfel nct elevul s nu poat asocia elementele din cele dou liste prin excluderea rspunsurile atipice, fr legtur logic cu celelalte (Popham, 2003). Se recomand ca numrul premiselor s fie inegal fa de rspunsurile propuse, cei mai muli autori recomandnd un numr mai mare al rspunsurilor, astfel nct s se evite relaionarea elementelor prin excludere. Rspunsurile trebuie prezentate n acord cu o regul clar: fie n ordine cronologic, fie n ordine alfabetic, astfel nct s se evite dezorientarea elevului, dar i ncercarea de a generaliza greit o anumit manier de prezentare a itemilor. Descrierea sarcinii de rezolvat trebuie s fie clar, precizndu-se logica asocierilor pe care trebuie s le realizeze elevul. Trebuie precizat de cte ori poate fi utilizat un rspuns n realizarea asocierilor (sau, dup caz, de cte ori premisele pot fi utilizate n stabilirea relaiilor cu rspunsurile). Numrul premiselor i a rspunsurilor trebuie s fie rezonabil (4-5 premise, respectiv 5-6 rspunsuri). Se recomand ca ntreg corpul itemului s fie plasat pe o singur pagin, pentru a nu genera confuzii sau omisiuni.

4.3.4. Itemii semiobiectivi Itemii semiobiectivi sunt inclui n unele clasificri alturi ce cei subiectivi ntr-o categorie mai larg de itemi cu rspunsuri elaborate de ctre cel examinat (Schreerens, Glas i Thomas, 2003). Dat fiind faptul c rspunsurile sunt construite de ctre elev, scorarea/notarea acestora respect alte exigene dect itemii obiectivi, antrennd calitile de evaluator ale corectorilor. Se pot delimita trei categorii de itemi semiobiectivi: itemi cu rspuns scurt, itemi de completare i ntrebrile structurate. 4.3.4.1. Itemii cu rspuns scurt i de completare Itemii cu rspuns scurt i cei de completare sunt similari, n sensul c proiectarea, administrarea i notarea rspunsurilor se supun acelorai exigene. n cazul itemilor cu rspuns scurt, acesta se solicit printr-o ntrebare direct sau printr-un enun direct, n timp ce itemii de completare constau n enunuri lacunare, incomplete, rspunsul costnd din completarea spaiilor libere. Cele dou tipuri de itemi permit evaluarea de rezultate diverse ale activitii de nvare, dar la nivele taxonomice inferioare: cunoaterea terminologiei, a regulilor, a metodelor i a procedeelor de aciune, interpretarea simpl a unor date, abilitatea de a reda coninuturi prezentate prin desene, hri, diagrame etc., capacitatea de a utiliza simboluri matematice sau utilizate n tiinele naturii, capacitatea de rezolvare a unor probleme simple din tiinele exacte (Moise, 2007).
Exemplu de item cu rspuns scurt tiine, Varianta 1, Itemul 4 Scrie, pe spaiul punctat, o caracteristic specific animalelor care triesc n: mediul terestru mediul acvatic .. Exemplu de item de completare Limba romn, Varianta 1, Itemul 7 Completeaz spaiile punctate, alegnd forma corect dintre cuvintele scrise ntre paranteze. Pisica . aezat lng sob. (s-a / sa) Pisica doarme lng sob. (s-a / sa) Psrile cltoare ntors. (sau / s-au) Tu cumperi cri caiete? (s-au / sau) Tata recomandat lui Ion s patinele. (ia / i-a) (ia / i-a) Vasile vzut pe Marin muzeu. (la / l-a) (l-a / la) Copiii spus mamei c ... calificative bune. (iau / i-au) (iau / i-au) El .. promis c . merge n excursie. (va / v-a) (v-a / va)

Avantaje ale itemilor cu rspuns scurt i de completare (Mndru, 2001; Moise, 2007; Cuco, 2008) Att itemii cu rspuns scurt, ct i cei de completare sunt relativ uor de proiectat, de aplicat i de corectat/ notat.

Au un grad ridicat de obiectivitate, n condiiile elaborrii unei scheme de notare adecvate. Permit evaluarea unei game largi de coninuturi. Evit dezavantaje specifice itemilor obiectivi, de tipul ghicitului rspunsurilor, deoarece nu i se ofer elevului variante de rspuns. Permit chiar mai multe variante corecte de rspuns, dac acestea sunt incluse n schema de notare.

Limite ale itemilor cu rspuns scurt i de completare Nivelul taxonomic vizat este aproape exclusiv cel al achiziiei de informaii, dei sunt posibile i sarcini care s pun n lumin comportamente specifice nelegerii sau chiar aplicrii. Corectarea i notarea pot fi contaminate de probleme de exprimare, erori de scriere, aspecte estetice ale rspunsului. Exigene de proiectare ale itemilor cu rspuns scurt ntrebrile sau enunurile trebuie s fie formulate clar, pentru a nu genera confuzii. n cazul solicitrii unui rspuns numeric trebuie precizat tipul de rspuns ateptat i nivelul de precizie al acestui rspuns. Dac rspunsurile numerice sunt nsoite de uniti de msur corespunztoare, acestea trebuie s fie clar precizate att n ntrebare, ct i dup spaiul liber. Exigene de proiectare a itemilor de completare Sarcina de rezolvat trebuie formulat concis, dar suficient de explicit pentru a nu lsa loc de interpretare. Itemii nu trebuie s includ prea multe spaii albe (de completat de ctre elevi), pentru c se ngreuneaz procesul de nelegere a sarcinii. Nu se recomand decontextualizarea definiiilor, deoarece s-ar putea ajunge la confuzii n formularea rspunsului. Se recomand ca spaiile albe n care elevul trebuie s completeze rspunsurile s fie egale ca lungime, chiar dac dimensiunea rspunsurilor este diferit, pentru a nu determina fie rspunsuri prea scurte, fie rspunsuri de tip eseu. Este preferabil ca spaiile albe s fie plasate la finalul enunului. 4.3.4.2. ntrebrile structurate ntrebrile structurate sunt definite ca sarcini formate din mai multe subntrebri, de tip obiectiv i semiobiectiv, legate ntre ele printr-un element comun", menite s acopere spaiul liber aflat ntre itemii obiectivi i cei subiectivi (Mndru, 2001, p. 111). Un asemenea item este alctuit dintr-un material-stimul (care poate fi reprezentat dintr-un desen, un text, un tabel etc.) i o suit de subntrebri care sunt conectate prin coninut cu materialul-stimul. Practic, subntrebrile ghideaz rspunsurile elevului i i ofer un cadru n care i realizeaz demersul de rezolvare a sarcinii.
Exemplul 1 Limba romn, Varianta 2, Itemii 1-2 Citete cu atenie urmtorul text, pentru a rspunde cerinelor de mai jos! Dup atta frig i cea Iar s-arat soarele. De-acum nu ne mai nghea Nasul i picioarele! Psrile migratoare

Se re-ntorc din tropice. Gzele depun la soare Ou microscopice. Toat lumea din ograd Cnt fr pauz. Doi cocoi se iau la sfad Nu tiu din ce cauz. (George Toprceanu - Primvara - fragmente) 1. Scrie X n caseta corespunztoare rspunsului corect. a. Autorul unei poezii se numete: compozitor povestitor poet prozator

b. n aceast poezie este prezentat anotimpul: vara toamna iarna primvara

c. Strofele de mai sus sunt alctuite fiecare din: dou versuri patru versuri 2. a. b. c. trei versuri cinci versuri

Scrie, pe spaiul punctat, cte o expresie cu neles asemntor pentru: cnt fr pauz .. se iau la sfad .. se re-ntorc din tropice .

Exemplul 2 Matematic, Varianta 1, Itemul 7 Imagineaz-i c eti automobilist i pleci n excursie. Ci kilometri parcurgi pe fiecare din urmtoarele trasee: a) Bucureti Ploieti Braov .. b) Giurgiu Bucureti Piteti .. c) Piteti Bucureti Braov ......

Avantaje ale ntrebrilor structurate (Mndru, 2001; Moise, 2007) Se presupune c plasarea unui numr suficient de itemi obiectivi i semiobiectivi n relaie cu acelai material-stimul, poate favoriza evaluarea unor comportamente corespunztoare unor nivele taxonomice mai nalte (aplicare i chiar analiz). Fiind vorba de mai muli itemi, de regul organizai n funcie de nivelul de dificultate, faciliteaz abordarea ntrebrilor de ctre un numr mare de elevi, inclusiv cei mai slabi (cel puin n prima parte). Permit utilizarea unor materiale-stimul de tipul graficelor, hrilor, diagramelor etc., ceea ce la face mai atractive pentru elevi i mai pertinente n evaluarea unor capaciti dificil de abordat prin intermediul altor categorii de itemi. Permit transformarea unor itemi de tip eseu ntr-o serie de itemi obiectivi i semiobiectivi, acest fapt avnd ca efect creterea fidelitii actului de evaluare. Limite ale ntrebrilor structurate

Precizm c majoritatea exemplelor de ntrebri structurate ce pot fi identificate n subiectele testelor i examenelor naionale romneti conin itemi semiobiectivi de tip rspuns scurt sau de completare. Cu toate acestea, surse din literatura pedagogic strin amintesc ntrebrile structurate n conexiune cu o serie de itemi cu alegere multipl. Astfel, Schreerens, Glas i Thomas (2003) introduc n tipologia itemilor cu rspuns elaborat de ctre elev itemii contextuali (engl. context-dependent item), similari ntrebrilor structurate, despre care se spune c ar conine un numr rezonabil (4-5) de itemi de alegere multipl, care sunt pui n relaie cu acelai material-stimul. Exemplul furnizat de autori este un item contextual de evaluare a capacitii de comprehensiune verbal, n care se d un material-stimul, n legtur cu care se formuleaz mai muli itemi cu alegere multipl. Materialele-stimul pot ridica probleme tehnice n proiectare, legate de acurateea i claritatea imaginilor, a graficelor etc. Costurile de proiectare i de administrare sunt mai ridicate n cazul ntrebrilor structurate, dect n cazul altor tipuri de itemi. n unele situaii, rspunsurile la subntrebri sunt conectate ntre ele, ceea ce trebuie s se evidenieze clar n schema de notare. Elaborarea schemelor de corectare i de notare este mai dificil. Exigene de proiectare a ntrebrilor structurate (Mndru, 2001; Moise, 2007) Subntrebrile trebuie proiectate gradat, n ceea ce privete nivelul de dificultate, din cel puin dou motive: pentru a asigura evaluarea unor capaciti cu nivele crescnde de complexitate, dar i pentru a ncuraja abordarea subiectului de ctre toi elevii. Itemii ataai materialului-stimul trebuie s solicite rspunsuri simple i scurte. n acest sens se recomand nu doar formularea ct mai clar a itemilor, astfel nct s ghideze elaborarea rspunsului de ctre elev, ci i alocarea unui spaiu de rspuns care s orienteze elevul cu privire la volumul de informaii care trebuie utilizat. Se recomand ca subntrebrile s fie independente, astfel nct s nu condiioneze rspunsurile la un item de rspunsurile la itemi anteriori. Itemii trebuie s fie strict conectai la coninutul materialului-stimul, pentru a nu-l orienta eronat pe elev ctre speculaii inutile. Calitatea tehnic a materialului-stimul trebuie s fie adecvat, fr a crea dificulti suplimentare n calea rezolvrii corecte a cerinelor de ctre elev. Spaiul alocat rspunsului trebuie s sugereze lungimea ateptat a rspunsului, fr a limita posibilitatea de exprimare a elevului, dar i fr a ncuraja exagerrile n dezvoltarea ideilor. Schema de notare trebuie elaborat cu atenie. n cazul subntrebrilor conectate ntre ele (situaie nerecomandat), acest fapt trebuie ilustrat prin schema de notare propus. 4.3.5. Itemii subiectivi Itemii subiectivi sunt prezentai n maniere diverse n literatura pedagogic, diferenele putnd fi identificate chiar i la nivelul denumirii lor (itemi cu rspuns elaborat de ctre elev, itemi nonobiectivi, itemi cu rspuns deschis). n literatura pedagogic romneasc i n documentele SNEE este prezentat o clasificare comprehensiv a itemilor subiectivi, care combin criteriul dimensiunii rspunsului ateptat cu cel al tipului de rspuns solicitat (sau gradul de detaliere al cerinelor) pe care o prezentm mai jos (Neacu i Stoica, coord., 1996; Mndru, 2001; Cuco, 2008): Itemi de tip rezolvare de probleme;

Itemi de tip eseu, cu patru variante rezultnd din combinarea criteriului de clasificare dimensiune (restrns i extins) i cu cel de nivel de structurare a sarcinii (eseu structurat i eseu liber). Itemii subiectivi permit evaluarea unor comportamente, capaciti complexe din etajele taxonomice superioare, valorificnd i dimensiunea creativ a elaborrii rspunsurilor, capacitatea elevului de formula explicaii, de a argumenta, de a descrie modaliti de lucru n situaii particulare. Dei elaborarea schemelor de notare este evident mai dificil dect n cazul itemilor obiectivi i semiobiectivi, antrennd toate resursele de obiectivitate ale evaluatorului, itemii subiectivi nu pot fi evitai mai ales n evalurile sumative de tipul examenelor naionale, date fiind avantajele lor n evaluarea competenelor complexe. 4.3.5.1. Itemi de tip rezolvare de probleme Itemii de tip rezolvare de probleme presupun prezentarea unor situaii-problem nefamiliare, inedite pentru elev, care nu dispun de o soluie predeterminat, precum i antrenarea acestuia pentru identificarea unor soluii prin parcurgerea unor etape: identificarea problemei, culegerea i selectarea datelor de baz (relevante), formularea i validarea unor ipoteze, identificarea metodei de rezolvare, propunerea unei soluii, evaluarea soluiei, formularea concluziei asupra rezolvrii realizate (Mndru, 2001). Aceste etape de soluionare a situaiilor-problem nu pot fi strict parcurse n toate ipostazele de prezentare a acestei categorii de itemi, constituind doar un reper orientativ pentru explicarea procesului rezolutiv. Situaiile problem pot fi simple sau nchise, atunci cnd elevului i sunt puse la dispoziie toate datele necesare rezolvrii, scopul este precizat clar, iar succesiunea cerinelor sugereaz i etapele de rezolvare i situaii problem deschise, atunci cnd elevul dispune doar de datele cele mai importante, procesul de rezolvare este doar sugerat, iar demersul propriu-zis trebuie ales de ctre cel examinat.
Exemplu Matematic, Varianta 1, Itemul 12 Cldirea unei coli are 8 sli de clas a cte 30 de locuri fiecare. La coal sunt 105 biei i 125 fete. Cte locuri vor rmne libere dac toi elevii sunt prezeni la coal? Completeaz datele problemei n schema de mai jos i scrie semnul potrivit pe spaiul punctat, apoi rezolv.

Avantaje ale itemilor de tip rezolvare de probleme (Mndru, 2001; Moise, 2007; Cuco, 2008) Modalitatea de elaborare a acestor itemi stimuleaz gndirea creativ a elevilor i ncurajeaz transferul de proceduri i metode de rezolvare a problemelor n interiorul aceluiai domeniu sau ntre domenii diferite. Favorizeaz activitile de rezolvare n echip (dac sunt proiectai n acest sens) i dezvoltarea abilitilor autoevaluative. ncurajeaz elevul s analizeze comparativ mai multe metode, ci de rezolvare a unei probleme i s ia decizii cu privire la cea mai adecvat dintre ele. Permit utilizarea unor materiale diverse, unele dintre ele favoriznd contactul cu elemente ale vieii cotidiene.

Limite ale itemilor de tip rezolvare de probleme Proiectarea acestor itemi este cronofag. Elaborarea schemei de corectare i de notare este dificil, lsnd uneori loc interpretrilor subiective ale evaluatorului. Timpul de administrare i de corectare este mai ndelungat dect n cazul itemilor obiectivi i semiobiectivi. Exigene de proiectare a itemilor de tip rezolvare de probleme (Mndru, 2001) Pentru a asigura caracterul formativ al evalurii prin probe care includ itemi de tip rezolvare de probleme, sarcinile de lucru trebuie s fie diversificate pentru a evita rutina. Sarcinile de rezolvat trebuie conectate la obiectivul de evaluare vizat. Schema de corectare i de notare trebuie elaborat cu deosebit atenie, pentru a minimiza efectele subiectivitii evaluatorului. 4.3.5.2. Itemii de tip eseu Itemii de tip eseu presupun elaborarea de ctre elev a unor rspunsuri complexe, acesta avnd suficient libertate n jalonarea liniilor de explicare, argumentare etc., avnd avantajul de a surprinde comportamente plasate la nivele taxonomice nalte (Radu, 2000; Mndru, 2001; Cuco, 2008). Dei se vehiculeaz patru categorii de itemi de tip eseu, clasificate dup dou criterii distincte cu rspuns restrns i cu rspuns extins, dup dimensiunea ateptat a rspunsului; eseu structurat i eseu liber, dup natura cerinelor specificate n cadrul itemului, ele sunt coextensive n sensul c eseul cu rspuns restrns se apropie de eseul structurat, iar cel cu rspuns extins se apropie de eseul liber. Itemii tip eseu cu rspuns restrns (eseu scurt, minieseu) implic respectarea de ctre elev a unor cerine n elaborarea rspunsului, care pot viza forma i/ sau coninutul acestuia. Exigenele de form se pot referi la numrul de pagini, linii sau pragrafe, n timp ce reperele privind coninutul pot face trimitere la anumite elemente de coninut care trebuie s se regseasc n rspuns. Itemii eseu cu rspuns extins solicit elevului s elaboreze un rspuns amplu, valoricnd toate achiziiile anterioare, dar introducnd i elemente de originalitate. Itemii de tip eseu structurat includ n enunul lor cerine, repere explicite care s orienteze elevul ntr-o anumit manier n organizarea, argumentarea ideilor expuse. Acest tip de itemi trebuie ntotdeauna completat cu o schem de corectare i de notare care s indice punctajele aferente elementelor de reper, care s fie aduse la cunotin elevului ntr-o form sau alta. Itemii de tip eseu liber sunt elaborai ca sarcini de lucru deschise pentru orice rspuns, fr a include precizri cu privire la maniera de organizare i la procedura de evaluarea analitic a acestuia.
Exemplul 1 (item de tip eseu structurat / scurt) Limba romn, Varianta 2, Itemul 8 Compune un text despre primvar. Textul trebuie s fie alctuit din cel puin 6 i cel mult 10 enunuri. Scrie un titlu potrivit textului. Aaz corect textul n pagin. Respect regulile de ortografie i punctuaie. Exemplul 2 (item de tip eseu liber) tiine, Varianta 2, Itemul 14

Dintre experimentele efectuate n clas, la tiine ale naturii, descrie n cteva enunuri pe cel care i-a plcut cel mai mult. Ce ai aflat n urma realizrii lui?

Avantaje ale itemilor de tip eseu structurat i cu rspuns restrns Sunt mai uor de proiectat dect alte categorii de itemi. Dac sunt nsoii de scheme de corectare i de notare clare, sunt relativ uor de corectat. Ghideaz elevul, n manier explicit, n elaborarea rspunsului, ajutndu-l s-i organizeze ideile. Notarea este mai riguroas dect n cazul itemilor de tip eseu liber i cu rspuns extins, de unde decurge i o fidelitate mai ridicat a evalurii. Limite ale itemilor de tip eseu structurat i cu rspuns restrns Restricionarea rspunsului prin introducerea cerinelor nu permite evaluarea la nivelul taxonomic cel mai nalt. Proiectarea itemilor, a schemelor de corectare i de notare este dificil i consumatoare de timp. n ciuda preciziei cu care se pot formula cerinele, subiectivitatea evaluatorului poate interveni n aprecierea rspunsului. Avantaje ale itemilor de tip eseu liber i cu rspuns extins Sunt itemii care permit msurarea capacitilor asociate nivelului taxonomic cel mai nalt, permind i evidenierea calitilor de tipul creativitii, coerenei argumentative etc. Dac sunt utilizai de ctre profesor n evaluarea curent, pot constitui reale ocazii de dezvoltare a capacitii de exprimare i organizare a ideilor la elevi. Sunt relativ uor de proiectat. Limite ale itemilor de tip eseu liber i cu rspuns extins Ridic mari probleme n corectare i notare, n sensul c aceste aciuni trebuie strict orientate de scheme de corectare i de notare suficient de detaliate i de precise. Datorit timpului mai ndelungat de administrare, nu permit evaluarea unui set larg de capaciti ale elevului. Fidelitatea este, n general, redus. Exigene de proiectare a itemilor de tip eseu Se recomand ca itemii de tip eseu s fie utilizai numai n situaiile n care capacitile vizate nu pot fi msurate prin intermediul itemilor obiectivi i semiobiectivi, datorit nivelului ridicat de subiectivitate n aprecierea rspunsurilor. n cazul eseului structurat, cerinele trebuie formulate clar i precis, astfel nct s constituie un sprijin veritabil pentru elev n formularea rspunsului (inclusiv cerine clare privind dimensiunea rspunsului i/ sau limita de timp impus pentru redactarea acestuia). n cazul tuturor tipurilor de eseu, schema de corectare i de notare necesit atenie ridicat, pentru evitarea aprecierii rspunsurilor n contextul impresiei globale. n toate situaiile n care este posibil, elementele acesteia trebuie aduse la cunotina elevului, odat cu prezentarea itemului. Tem obligatorie 1 Elaborai un set de exemple de itemi obiectivi, semiobiectivi i subiectivi (cte dou exemple pentru fiecare tip de item, adaptate la specificul nvmntului precolar i primar).

4.3.6. Calitile testului Pentru a putea aplica un test este necesar verificarea calitilor sale globale (Karmel i Karmel, 1978; Radu, 2000; Moise, 2007) - obiectivitate, aplicabilitate, fidelitate i validitate, precum i a calitilor fiecrui item dificultate i putere de discriminare. Obiectivitatea unui test docimologic se refer la caracterul explicit i la claritatea itemilor, care s permit obinerea de scoruri comparabile n cazul unor evaluatori competeni. Dac scopul administrrii unui test nu este clarificat nainte de nceperea proiectrii sau dac sunt omise etape de proiectare a acestuia, exist riscul de a genera erori n calcularea i interpretarea scorurilor, care nu se datoreaz evaluatorului, ci neglijenei celui care a elaborat testul. Aplicabilitatea se refer la adecvarea itemilor la coninuturile vizate, la volumul de timp i resurse materiale necesar administrrii care trebuie s fie rezonabil, la claritatea modalitii de calculare a scorurilor. Numrul de itemi i timpul alocat rezolvrii testului trebuie s fie rezonabil, iar instruciunile de aplicare trebuie s fie clare i precise. Scorurile la testele docimologice sunt importante pentru a lua decizii educaionale potrivite i, de aceea, treuie s fie deopotriv uor de calculat i de interpretat. De asemenea, ele trebuie s permit explicaii i pentru ali actori educaionali dect profesorul (n special elevii i prinii). Fidelitatea i validitatea sunt adesea folosite n mod eronat ca sinonime, ns cele dou concepte au accepiuni diferite n timp ce fidelitatea se refer la consistena sau stabilitatea unui test, validitatea indic proporia n care un test surprinde ceea ce i-a propus s msoare. Un instrument de evaluare poate avea o fidelitate ridicat, fr a fi valid, ns un test valid are cu siguran o fidelitate ridicat. Validitatea unui test se refer la proporia n care acesta surprinde ceea ce se presupune c trebuie s msoare. n cazul unui test, se pot estima mai multe tipuri de validitate (Anastasi, 1976; Evans, 1985; Linn i Gronlund, 2000; Moise, 2007): A) Validitatea de coninut reflect msura n care itemii unui test acoper problema de studiat, n cazul nostru msura n care surprinde comportamentele pe care dorim s le msurm la elevi. Este considerat adesea o valoare subiectiv (Stan, 2002) deoarece presupune ca unul sau mai muli experi s evalueze msura n care itemii contribuie la cunoaterea caracteristicii studiate. Exist cel puin dou modaliti de utilizare a metodei experilor n evaluarea validitii de coninut: experilor li se poate cere s judece msura n care itemii instrumentului ilustreaz comportamentul sau trstura investigat (Evans, 1985) i/sau li se poate solicita s formuleze un set de itemi care s surprind comportamentul sau trstura investigat (Stan, 2002). n cazul testului docimologic, atunci cnd facem aprecieri privind validitatea de coninut ar trebui s avem n vedere o serie de ntrebri la care s gsim rspunsuri prin analiza itemilor din test: Domeniul comportamental vizat (cognitiv, afectiv, psihomotor) este ilustrat de itemii inclui n test? Itemii din test sunt elaborai n concordan cu standardele de perfoman pentru elevi, cu obiectivele cadru i de referin, respectiv cu cele operaionale? Care este corespondena ntre coninuturile sugerate n programa colar i cele acoperite prin itemii testului? Testul este echilibrat pe nivele taxonomice sau vizeaz doar nivele taxonomice inferioare, respectiv superioare? B) Validitatea criterial (de criteriu) presupune o concordan ridicat ntre rezultatele subiecilor n urma aplicrii unui test i un criteriu. Cele dou forme ale validitii criteriale sunt validitatea concurenial i validitatea predictiv (Gliner i Morgan, 2000; Stan, 2002, Gall, Gall i Borg, 2007). Validitatea concurenial presupune compararea rezultatelor ntre instrumentul de evaluare i criteriu sau un alt instrument (al crui validitate a fost anterior determinat i este

ridicat). n acest caz, coeficientul de validitate exprim corelaia ntre instrument i criteriu. Un exemplu de analiz a validitii concureniale ar putea fi calcularea coeficientului de corelaie ntre un rezultatele la testul docimologic analizat i rezultatele la un test de aptitudini academice (dac acesta ar fi disponibil i am avea date privind validitatea sa). Validitatea predictiv surprinde relaia ntre valorile obinute prin aplicarea instrumentului i un criteriu, n condiiile n care msurarea criteriului este realizat ulterior, deci puterea instrumentului de a anticipa comportamente, performane viitoare. n acest caz, coeficientul de validitate exprim corelaia ntre un predictor (valorile unui test) i valorile criteriului. Pentru evaluarea coeficientului de validitate se pot utiliza coeficientul de regresie i punctajele critice multiple (engl. cut-offs) (Crocker i Algina, 1986; Stan, 2002, pp. 182183). n cazul n care un profesor ar dori s analizeze validitatea criterial a unui test sumativ pe care l-a aplicat la sfritul semestrului I unei clase a IV-a, ar putea corela rezultatele elevilor si cu rezultatele pe care acetia le-ar obine ulterior la evaluarea naional sau cu notele de la primele evaluri sumative din clasa a V-a. Validitatea criterial, n ambele sale forme, este influenat de natura criteriului ales i de caracteristicile eantionului. De aceea, raportarea coeficienilor de validitate pentru un test trebuie nsoit de specificarea i descrierea clar a criteriului i a eantionului pe care s-a realizat evaluarea. C) Validitatea de construct sau conceptual se refer la ct de bine este transpus ntrun instrument un concept (o competen, un comportament etc.). Evaluarea validitii de construct presupune att un demers teoretic, ct i un demers empiric: parcurgerea bibliografiei de specialitate ce cuprinde date anterioare cu privire la acelai construct/concept i claritatea raionamentelor ipotetico-deductive sunt la fel de importante ca procedurile bazate pe date empirice. Cu alte cuvinte, dac un profesor ar dori s proiecteze un test pentru o unitate de nvare despre vieuitoare acvatice ar trebui s studieze cu atenie programa colar pentru a identifica obiectivele de referin aplicabile, elementele de coninut care trebuie avute n vedere, dar i schiele de proiecte pentru a-i reaminti gama de comportamente vizate la elevi n fiecare lecie. De asemenea, ar trebui s analizeze teste proiectate de ali colegi, eventual publicate n culegeri, pentru a se asigura c va selecta un eantion reprezentativ de comportamente i de coninuturi care vor fi vizate. n cazul testelor docimologice, tabelul sau matricea de specificaii (pe care o com prezenta detaliat n seciunea destinat proiectrii testului) constituie un instrument de asigurare a validitii de construct. D) Validitatea convergent estimeaz msura n care dou teste msoar acelai construct, iar validitatea discriminatorie se refer la relaia non-corelaional cu teste care msoar alte constructe dect cel studiat. Matricea centralizatoare include corelaii ntre teste care msoar aceeai trstur, corelaii ntre teste care msoar trsturi diferite i corelaii ntre acestea din urm n cazul utilizrii unor metode diferite de msurare (vezi pentru exemple Anastasi, 1976, p. 157 i Stan, 2002, p. 192). Pentru a aprecia validitatea global a unui test este necesar att specificarea mai multor coeficieni de fidelitate, ct i prezentarea unor consideraii legate de toate tipurile de validitate. Unii dintre factorii care influeneaz validitatea in de eviden i pot fi relativ uor de controlat, n timp ce alii au efecte subtile, greu sesizabile i ridic dificulti conceptorilor de teste. Este evident c un profesor nu poate elabora un test pentru elevii unei clase a III-a fcnd apel la coninuturi din programa clasei a V-a, dup cum nu putem evalua printr-un test la matematic comportamente pe care le vizm la elevi prin activitile educaionale din domeniul tiine. n ambele situaii, dac am proceda contrar evidenei am obine teste cu

validitate sczut. Dac un profesor ar elabora testul de matematic avnd ca reper standardele de performan, obiectivele, coninuturile etc., dar ar folosi n explicarea sarcinilor (n instruciuni) termeni pe care nu toi elevii i neleg, rezultatul ar fi ti un test cu validitate sczut, dar factorul care a determinat acest fapt este mai subtil dect n primul exemplu. Aceti factori subtili care pot influena validitatea unui test docimologic pot fi grupai n funcie de sursa potenialei erori (Linn i Gronlund, 2000; Nitko, 2001): Erori de proiectare a testului. O examinare atent a fiecrui item ar trebui s fie suficient pentru a stabili concordana cu finalitile i coninuturile disciplinei. n plus, sunt i ali factori care in de proiectarea testului i pot afecta validitatea acestuia: instruciunile formulate neclar care i pot dezorienta pe elevi; ambiguitatea n formularea itemilor; timpul prea scurt alocat rezolvrii testului (atunci cnd variabila timp nu este legat de nivelul achiziiilor elevului); supradimensionarea prilor din test care surprind achiziii uor de msurat, n detrimentul itemilor care msoar achiziii dificil de msurat (de exemplu, capaciti intelectuale complexe); erori n proiectarea itemilor, n sensul c acetia includ indicii prea clare ctre rspunsurile corecte sau alternative de rspuns ordonate dup tipare evidente pentru elevi (de exemplu, ntotdeauna primul rspuns din lista alternativelor este cel corect); numrul prea mic de itemi poate afecta validitatea prin slaba reprezentare a obiectivelor i a coninuturilor. Erori n activitatea de predare anterioar administrrii testului sau lipsa de concordan ntre itemii testului i modul n care s-a realizat predarea. Dac un tip de sarcin a fost rezolvat n clas dup un anumit algoritm, iar testul l pune pe elev n situaia de a rezolva n alt mod o sarcin similar, validitatea ar avea de suferit. Nu e mai puin adevrat c, dac includem ntr-un test o sarcin rezolvat deja n clas, vom msura comportamentul elevului doar la nivelul de cunoatere, indiferent de nivelul taxonomic pe care l-am vizat. Erori n administrare i n calcularea scorurilor. Dac profesorul acord ajutor, explicaii suplimentare etc. n timpul adminstrrii testului, validitatea acestuia scade. De asemenea, copiatul sau ajutorul ntre elevi, precum i greelile din timpul corectrii testelor afecteaz validitatea. Factori personali care in de pregtirea elevilor pentru situaia de testare. Dac elevii nu sunt familiarizai cu atmosfera de administrare a unui test i triesc momentul testrii ca pe o ameninare, scorurile nu vor reflecta achiziiile lor reale. Compoziia grupului i natura criteriului. Validitatea unui test se discut ntotdeauna n legtur cu un anumit grup de subieci. Dac aplicm acelai test de matematic unui grup de elevi de clasa a II-a i unui alt grup de elevi de clasa a IV-a, n condiiile n care instrumentul a fost proiectat pentru acetia din urm, validitatea nu va fi comparabil. Validitatea unui test este afectat de factori precum vrsta, genul, nivelul aptitudinal, biografia educaional a elevilor, apartenena cultural. n ceea ce privete natura criteriului, corelaia ntre scorurile la un test i un criteriu va fi mai redus n situaiile n care caracteristicile msurate sunt diferite, mprtierea sau variabilitatea scorurilor este mic, stabilitatea scorurilor este i ea redus sau timpul dintre aplicarea testului i msurarea criteriului folosit pentru estimarea validitii predictive este foarte ndelungat. Fidelitatea se poate estima prin intermediul a patru modaliti diferite (Thomas, 1998; Gliner i Morgan, 2000): A) Fidelitatea test-retest (exprimat statistic prin coeficientul de stabilitate) presupune ca aplicarea instrumentului de evaluare acelorai subieci, n momente diferite, s conduc la obinerea unor rezultate comparabile. Evaluarea acestui tip de fidelitate poate conduce la erori provenite din familiarizarea subiecilor cu ntrebrile, fiind posibil ca stabilitatea rezultatelor s fie dat de memorarea ntrebrilor i a rspunsurilor, nu de calitile instrumentului. De

aceea, evaluatorul trebuie s se asigure c intervalul de timp ntre cele dou aplicri este suficient de lung pentru a evita acest tip de eroare. B) Fidelitatea prin forme alternative (exprimat statistic prin coeficientul de stabilitate) presupune ca rezultatele subiecilor n urma aplicrii unui test s fie comparabile cu cele obinute de aceiai subieci n urma aplicrii unui test cu itemi similari. Estimarea acestui tip de fidelitate implic fie ca cercettorul s formuleze aceiai itemi n form diferit, fie s schimbe ordinea itemilor n cadrul aceluiai instrument. Indicatorul statistic al coeficientului de stabilitate i al coeficientului de echivalen este coeficientul de corelaie Pearson. Cele mai multe lucrri consider c un coeficient de corelaie egal sau mai mare de 0,70 este suficient pentru a asigura cele dou tipuri de fidelitate. Anastasi (1976, p. 109) i Evans (1985, p. 79) menioneaz ns valori ale coeficientului de corelaie cuprinse ntre 0,80-0,90, pentru a putea avea certitudinea unei fideliti ridicate. C) Fidelitatea estimat prin consistena intern sau omogenitatea unui test se refer pe de o parte, la msura n care toi itemii relaioneaz ntre ei i, pe de alt parte, la msura n care fiecare item relaioneaz cu rezultatul total obinut de subieci. Au fost elaborate i sunt utilizate mai multe metode de calcul a coeficientului de consisten intern, dintre care cele mai cunoscute sunt (Gliner i Morgan, 2000): metoda njumtirii (engl. split-half), metoda Kuder-Richardson i metoda de calcul a coeficientului alpha Cronbach. Metoda njumtirii se recomand atunci cnd nu exist o form alternativ a instrumentului de evaluare sau nu s-a parcurs etapa de retest. Metoda presupune mprirea rezultatelor unui test n dou jumti comparabile i obinerea unui coeficient de corelaie a acestora. mprirea se poate realiza fie strict numeric (dac avem un instrument cu 30 de ntrebri, 15 sunt incluse n prima jumtate, 15 n a doua) ceea ce nu conduce la erori dac itemii au fost ordonai n funcie de dificultate; fie prin reunirea itemilor similari ntr-o jumtate i a celor singulari n cealalt jumtate. Coeficientul de corelaie al celor dou jumti de test este utilizat n calcularea coeficientului de consisten intern, corectat prin formula Spearman-Brown (Anastasi, 1976, pp. 115-116; Gliner i Morgan, 2000, pp. 314315). Exemplu de calcul a fidelitii unui test prin metoda njumtirii n tabelul de mai jos sunt prezentate rezultatele rezultatele a 10 elevi la un test care conine 10 itemi (pentru fiecare item rezolvat corect un elev primete 1 punct, iar rspunsurile greite se noteaz cu 0). Dup cum se poate observa, tabelul are dou intrri: pe coloane sunt prezentate etapele intermediare de calcul a coeficientului de fidelitate, iar pe rnduri sunt prezentate rezultate elevilor (respectiv, prelucrri corespunztoare scorurilor fiecrui elev). Coloana X include rezultatele elevilor la itemii impari (scorurile totale pentru o jumtate a testului), iar coloana Y include rezultatele la itemii pari (scorurile totale pentru cealalt jumtate a testului). Coloana x include abaterea de la medie pentru itemii impari (diferena ntre fiecare scor din coloana X i media scorurilor X). Coloana y include abaterea de la medie pentru itemii pari. Coloana x2 include abaterea ptratic de la medie pentru itemii pari, iar coloana y2 abaterea ptratic de la medie pentru itemii pari. Coloana xy reprezint produsul dintre valorile abaterilor de la medie ale itemilor impari i valorile abaterilor de la medie pentru itemii pari. Sub coloanele x2, y2 i xy sunt notate totalurile corespunztoare.
Itemi/ subieci Itemi impari X Itemi pari Y X Y X2 y2 xy

1 2 3 4 5 6 7 8 9 10

4 3 2 5 4 3 2 1 2 1 M= 2,70

4 2 3 3 3 3 2 2 2 1 M= 2,50

1,30 0,30 -0,70 2,30 1,30 0,30 -0,70 -1,70 -0,70 -1,70

1,50 -0,50 0,50 0,50 0,50 0,50 -0,50 -0,50 -0,50 -1,50

1,69 0,09 0,49 5,29 1,69 0,09 0,49 2,89 0,49 2,89 = 16,10

2,25 0,25 0,25 0,25 0,25 0,25 0,25 0,25 0,25 2,25 = 6,50

1,95 -0,15 -0,35 1,15 0,65 0,15 0,35 0,85 0,35 2,55 = 7,50

Avnd n vedere aceste date, calculm coeficientul de corelaie Pearson (r), utiliznd formula: xy r= x 2 y 2 n exemplul nostru, dac nlocuim rezultatele noastre n formul, vom obine:
r12 = 7,50 = 0,73 16,10 6,50

Pe baza acestei corelaii ntre cele dou jumti ale testului, se calculeaz fidelitatea ntregul test rt, utiliznd corecia Spearman-Brown: rt = 2 r12 2 0,73 = = 0,84 1 + r12 1 + 0,73

Aceast cifr reprezint o corelaie puternic, dac avem n vedere faptul c unii autori sugereaz c valorile acceptabile sunt cuprinse ntre 0,70 - 0,90, iar cele ideale, peste 0,90 (Anastasi, 1975; Evans 1985). Metoda njumtirii pentru estimarea fidelitii este adecvat doar n cazul testelor alctuite din itemi cu punctaje identice (de exemplu, itemi cu rspuns dual pentru care rspunsurile pot fi notate cu 1 i 0; itemi cu alegere multipl, varianta rspuns corect etc.). Metoda Kuder-Richardson de calculare a consistenei interne estimeaz omogenitatea itemilor unui test. Omogenitatea inter-itemi poate fi afectat de dou tipuri de erori de varian: eantionarea coninutului (adic alegerea iniial a itemilor) i eterogenitatea domeniului comportamental la care se refer itemii. Cu ct domeniul comportamental surprins prin intermediul itemilor este mai omogen, cu att crete consistena inter-itemi. Coeficientul Kuder-Richardson este potrivit pentru estimarea consistenei interne pentru acele instrumente care au un sistem de cotare al rspunsurilor de tipul corect-greit sau totul sau nimic (rspunsurile corecte sunt notate cu 1, iar cele greite cu 0).

Exemplu de calcul a fidelitii unui test prin metoda Kuder-Richardson

Exist dou formule Kuder-Richardson care pot fi utilizate pentru calcularea fidelitii: KR 20 i KR 21. Formula KR 20
rKR20 = rKR21 = k pq (1 2 ) k 1 s k M (k M ) (1 ) k 1 k * s2

Formula KR 21

Iat i semnificaia simbolurilor din cele dou formule: k numrul de itemi inclui n test p frecvena relativ pentru numrul de rspunsuri corecte la fiecare item (numrul de rspunsuri corecte / numrul total de itemi) q frecvena relativ pentru numrul de rspunsuri greite la fiecare item (numrul de rspunsuri greite / numrul total de itemi) s2 dispersia sau variana M media scorurilor totale obinute la test S presupunem c am aplicat un test docimologic cu 10 itemi unui numr de 10 elevi. Pentru fiecare item rezolvat corect elevul primete un punct, iar rspunsurile eronate sunt notate cu 0. Rezultatele celor 10 elevi pentru fiecare dintre cei 10 itemi sunt prezentate n tabelul de mai jos.
Elevi A B C D E F G H I J 1 1 1 1 1 1 0 1 1 1 1 9 2 1 1 1 1 1 1 1 1 1 1 10 3 1 1 1 1 1 1 1 0 0 1 8 4 1 0 1 0 1 1 1 0 0 0 5 ITEMI 5 6 1 0 0 1 1 0 1 1 0 0 1 0 1 1 0 0 1 1 0 0 6 4 7 1 1 0 1 0 0 1 1 1 1 7 8 1 0 1 0 0 0 1 0 1 1 5 9 1 1 1 0 0 0 1 0 0 1 5 10 1 1 0 0 0 0 0 0 0 1 3 X Scor total test 9,00 7,00 7,00 6,00 4,00 4,00 9,00 3,00 6,00 7,00 M= 6,20 x (X-M) 2,80 0,80 0,80 -0,20 -2,20 -2,20 2,80 -3,20 -0,20 0,80 0,00 x2 7,84 0,64 0,64 0,04 4,84 4,84 7,84 10,24 0,04 0,64 x2= 37,60

Pe lng rezultatele elevilor, n tabel sunt prezentate scorurile totale obinute de fiecare elev pentru ntregul test (X), media scorurilor obinute de elevi (M), abaterea de la medie a fiecrui scor (x= X-M) i abaterea ptratic de la medie (x2)4. nlocuind aceste valori n formula dispersiei pe care o cunoatem [s2= (X M)2 / N-1], obinem valoarea acesteia s2= 4,17.

n tabelul urmtor sunt prezentate valorile lui p i q, reprezentnd frecvena relativ a rspunsurilor corecte, respectiv greite pentru fiecare item, precum i produsele pq pentru fiecare item i suma produselor pq.
4

Toate detaliile de calcul pentru aceste valori v sunt cunoscute de la cursul de Metodologia cercetrii pedagogice.

Valorile p Valorile q p*q pq

0,90 0,10 0,09 2,04

1,00 0,00 0,00

0,80 0,20 0,16

0,50 0,50 0,25

0,60 0,40 0,24

0,40 0,60 0,24

0,70 0,30 0,21

0,50 0,50 0,25

0,50 0,50 0,25

0,30 0,70 0,21

Dac nlocuim aceste date n formula KR 20 obinem: rKR20 = k 10 2,04 10 pq (1 2 ) = (1 ) = (1 0,49) = 1,11 * 0,51 = 0,56 k 1 s 10 1 4,17 9

Dac nlocuim aceste date n formula KR 21 obinem: rKR21 = k M (k M ) 10 6,20(10 6,20) (1 ) = (1 ) = 1,11 * 0,44 = 0,48 2 k 1 k *s 9 10 * 4,17

Dac vom compara cele dou valori ale coeficienilor de corelaie, vom observa c cea obinut prin aplicarea formulei KR 21 este mai mic, deoarece aceasta este, n fapt, o estimare simpl a formulei KR 20, care are la baz asumpia c toi itemii dintr-un test au un nivelul de dificultate apropiat. n ciuda acestui dezavantaj, formula KR 21 este mai simplu de utilizat, deoarece presupune doar calcularea mediei i a dispersiei. Coeficientul Alpha Cronbach () este utilizat frecvent pentru a estima consistena intern a testelor care includ itemi care au i rspunsuri parial corecte, acestea fiind notate cu mai mult de dou scoruri diferite (de exemplu, 0, 1, 2 i 3). Un bun exemplu n acest sens sunt itemii de tip eseu, pentru care se noteaz i rspunsurile pariale (Linn i Gronlund, 2000; Gallagher, 1998; Nitko, 2001). De asemenea, se recomand i n cazul testelor care includ mai multe tipuri de itemi. Coeficientul de fidelitate Alpha Cronbach este o variant a formulelor Kuder-Richardson i, ca i acestea, estimeaz media coeficienilor de fidelitate care ar fi obinui prin metoda njumtirii, dac acetia ar fi calculai pentru toate variantele posibile de mprire a unui test n dou jumti. Exemplu de calcul a coeficientului de fidelitate Alpha Cronbach Coeficientul Alpha Cronbach se calculeaz folosind formula:
k s (1 k2 ) , k 1 sx 2 unde k este numrul de itemi dintr-un test, sk reprezint dispersia fiecrui item, iar sx2 este dispersia scorurilor totale la test. r= n tabelul de mai jos sunt notate valorile dispersiei pentru fiecare item din testul utilizat ca exemplu, precum i valoarea dispersiei pentru scorurile totale.
1 0,10 2 0 3 0,17 ITEMI 4 5 6 0,27 0,26 0,26 sk2=2,06 7 0,23 8 0,27 9 0,27 10 0,23 X Scor total test sx2=4,17
2

sk2

nlocuind aceste valori n formul obinem: s 10 2,06 k r = (1 k2 ) = (1 ) = 1,11 * (1 0,49) = 1,11 * 0,51 = 0,56 k 1 9 4,17 sx Dac vom compara valoarea coeficientului de fidelitate obinut prin formula KR 20 i cel obinut prin formula Alpha Cronbach vom observa apropierea lor (doar primele dou zecimale sunt prezentate, ceea ce ar putea conduce la concluzia c cele dou valori sunt chiar identice). Dat fiind aceast similitudine, nu se recomand utilizarea amndurora pentru acelai test, deoarece nu furnizeaz informaii suplimentarea privind fidelitatea acestuia. Cea mai frecvent eroare n interpretarea coeficienilor de fidelitate derivai din formulele Kuder-Richardson este aceea c se confund consistena intern cu validitatea de construct: dei este un bun estimator al fidelitii unui instrument, acest coeficient nu garanteaz validitatea de construct a unui instrument, ci faptul c rezultatul pentru fiecare item considerat separat coreleaz cu rezultatele pentru ceilali itemi i cu rezultatul pentru ntregul test (Gliner i Morgan, 2000).
2

Fidelitatea inter-evaluatori se refer la concordana ntre evalurile realizate de doi sau mai muli evaluatori care corecteaz i calculeaz scoruri la un test pentru aceiai subieci. Cea mai direct modalitate de a estima fidelitatea inter-evalauatori este calculul coeficientului de corelaie ntre scorurile acordate de doi sau mai muli evaluatori. Exist ns i o modalitate mai simpl, dar mai inexact de estimare a fidelitii ntre doi sau mai muli evaluatori prin calcularea procentajului de acord ntre scorurile acordate de acetia. Exemplu de estimare a fidelitii inter-evaluatori prin procentajul de acord
S presupunem c doi evaluatori au corectat i notat acelai test, rezolvat de aceiai elevi. Scorurile pe care le-au acordat pentru 5 elevi sunt sintetizate n tabelul de mai jos.
Evaluator/ Elevi A B C D E Evaluator 1 8 5 3 4 9 7 5 4 5 9 Evaluator 2 X X X Acord ntre cei doi evaluatori

Procentajul de acord ntre cele dou seturi de scoruri poate fi cuprins ntre 100% i 0% i se calculeaz dup formula: N Pa = a 100 , Ns unde Ns este numrul total de scoruri calulate de ctre fiecare evaluator, iar Na este numrul situaiilor n care cei doi evaluatori au fost acordat acelai scor. Cei doi evaluatori din exemplul nostru au acordat acelai scor n 3 (Na) cazuri din 5 (Ns). Dac nlocuim aceste date n formul obinem: N 3 Pa = a 100 = 100 = 60% Ns 5 Aadar, precentajul de acord ntre cei doi evaluatori este de 60%. Am putea considera c acesta este suficient de mare, dar dup unii autori valoarea sa ar trebuie s fie de peste 80% (Nitko, 2001).

Ca i n cazul validitii, exist o serie de factorii care pot influena fidelitatea unui test (Linn i Gronlund, 2000; Nitko, 2001): Numrul itemilor poate influena fidelitatea unui test, n sensul c fidelitatea testului crete odat cu numrul acestora. Un test cu un numr mai mare de itemi scade i posibilitatea ca elevii s ghiceasc rspunsul corect. Aceast regul a fost oarecum sugerat de calculul fidelitii prin njumtire, dac avem n vedere c aplicarea formulei Spearman-Brown a generat un coeficient de fidelitate mai mare. Variabilitatea sau mprtierea scorurilor are un efect asupra fidelitii, n sensul c cu ct aceasta este mai mare cu att crete i valoarea coeficienilor de fidelitate. Aceast relaie se explic prin faptul c fidelitatea unui test crete odat cu scderea posibilitii ca un elev s i schimbe poziia n ierarhia grupului. Dac variabilitatea scorurilor este mic, probabilitatea ca un elev s obin un scor care s-l plaseze n alt zon a clasamentului la o eventual reaplicare a testului crete. Obiectivitatea testului influeneaz i fidelitatea sa. n cazul testelor obiective, pentru care schemele de corectare i notare sunt foarte precise, acest factor nu reprezint o problem major. Un plus de atenie trebuie, aadar, acordat elaborrii baremelor de corectare i de notare pentru testele obiective, astfel nct doi evaluatori s ajung la rezultate finale comparabile. Excluderea itemilor subiectivi din evaluare nu constituie o soluie, ntruct o asemenea decizie ar afecta validitatea testului, cea mai important calitate a acestuia. Comportamentele complexe, corespunztoare nivelelor taxonomice nalte nu pot fi msurate ntodeauna cu itemi obiectivi sau semiobiectivi. Aadar, soluia const n precizia baremelor de corectare i notare, care va conduce i la o cretere a fidelitii inter-evaluatori. Fidelitatea depinde i de metoda utilizat pentru calcularea sa. Aa cum ai observat i din exemplele utilizate pentru calculul coeficienilor de fidelitate, metoda pentru care optm are impact direct asupra valorii acestora. Astfel, coeficientul de stabilitate poate fi mai mare dect cel obinut prin metoda njumtirii, dac intervalul de timp dintre msurri este scurt. n cazul fidelitii estimate prin teste alternative, coeficienii sunt mai mici dect n situaia n care aplicm metoda njumtirii sau calculm coeficientul de stabilitate. n plus, cu ct intervalul de timp dintre aplicri crete, coeficientul de fidelitate scade. Coeficientul de fidelitate calculat prin metoda njumtirii este mai ridicat n cazul testelor de randament (acele teste care au limit de timp). Toi coeficienii de fidelitate derivai din metoda KuderRichardson au valori mai mici dect cei obinui prin metoda njumtirii i sunt afectai n sens pozitiv n cazul n care testul are limit de timp.

Analiza validitii i a fidelitii unui test sunt completate prin analiza calitilor fiecrui item sau analiza de item care presupune estimarea dificultii i a puterii de discriminare pentru fiecare item, precum i analiza distractorilor. De regul, indicele de dificultate i cel de discriminare se calculeaz pentru testele normative. Valoarea lor poate fi calculat i pentru testele criteriale, dar este lipsit de relevan, deoarece acestea nu vizeaz ierarhizarea elevilor prin comparaii intra-grup, ci raportarea achiziiilor elevului la obiectivele educaionale care constituie criteriile. Analiza distractorilor este, evident, posibil doar n cazul itemilor care includ asemenea variante de rspuns. Indicele de dificultate al unui item (Anastasi, 1976; Karmel i Karmel, 1978; Radu, 2000; Moise, 2007) este, n fapt, o estimare a procentului de subieci care rezolv corect un item i se poate calcula folosind formula: C + Ci I dif = s , 2n

unde Cs reprezint numrul de rspunsuri corecte din segmentul superior al clasamentului elevului, realizat n funcie de scorurile totale la test; Ci reprezint numrul de rspunsuri corecte din segmentul inferior al clasementului; iar n este numrul de subieci dintr-un segment sau subgup. Practic, grupul de subieci crora li s-a administrat testul se mparte n trei, patru sau cinci grupuri egale, n funcie de scorul total obinut la test, iar n calculul indicelui de dificultate de iau n considerare doar cazurile extreme (cei mai buni 20-30% i cei mai slabi 20-30%). Valoarea indicelui de dificultate variaz ntre 0 i 1 (n form procentual). Cu ct este mai aproape de 0, cu att itemul este mai dificil, iar apropierea de valoarea 1 sugereaz un nivel mai sczut de dificultate. Itemii prea uor sau prea dificil de rezolvat nu ofer informaii relevante despre subieci i sunt eliminai n etapa de revizuire a testului. Din punct de vedere strict statistic, itemul ideal ar fi cel care este rezolvat corect de 50% dintre subieci. n cazul unui test normativ, dificultatea optim este ntre cuprins ntre 0,40 - 0,50, dar, n general, se accept un coeficient de dificultate cuprins ntre 25% i 75%.

Exemplu de calcul a indicelui de dificultate


Iat cum ar trebui s procedm dac am dori s calculm indicele de dificultate al itemului 7 dintr-un test aplicat unui numr de 10 elevi, ale cror scoruri sunt prezentate n tabelul de mai jos.
Elevi A B C D E F G H I J 1 1 1 1 1 1 0 1 1 1 1 2 1 1 1 1 1 1 1 1 1 1 3 1 1 1 1 1 1 1 0 0 1 4 1 0 1 0 1 1 1 0 0 0 ITEMI 5 6 1 0 0 1 1 0 1 1 0 0 1 0 1 1 0 0 1 1 0 0 7 1 1 0 1 0 0 1 1 1 1 8 1 0 1 0 0 1 1 0 1 1 9 1 1 1 0 0 0 1 0 0 1 10 1 1 0 0 0 0 0 0 0 1 Scor total test 9,00 7,00 7,00 6,00 4,00 5,00 9,00 3,00 6,00 7,00

Dup ce am calculat scorurile total la test, vom mpri grupul de 10 elevi n 5 grupuri (fiecare grup va fi alctui din cte 2 elevi). Dac i vom ierarhiza n funcie de scorurile totale, vom obine urmtorul tabel:
Elevi H E F D I B C J A G 1 1 1 0 1 1 1 1 1 1 1 2 1 1 1 1 1 1 1 1 1 1 3 0 1 1 1 0 1 1 1 1 1 4 0 1 1 0 0 0 1 0 1 1 ITEMI 5 6 0 0 0 0 1 0 1 1 1 1 0 1 1 0 0 0 1 0 1 1 7 1 0 0 1 1 1 0 1 1 1 8 0 0 1 0 1 0 1 1 1 1 9 0 0 0 0 0 1 1 1 1 1 10 0 0 0 0 0 1 0 1 1 0 Scor total test 3 4 5 6 6 7 7 7 9 9

Pentru a calcula indicele de dificultate al itemului 7, avem nevoie de scorurile pentru acest item al primilor doi i al ultimilor doi elevi. Ambii elevi din segmentul superior (A i G), precum i un elev in segmentul inferior (H) au rezolvat itemul. Dac nlocuim aceste date n formul, obinem: C + Ci 2 + 1 I dif = s = = 0,75 2n 4 Aadar, itemul 7 din exemplu nostru este relativ uor, deoarece valoarea sa este mai aproape de 1 dect de 0.

Indicele de discriminare (Anastasi, 1976; Karmel i Karmel, 1978; Radu, 2000; Moise, 2007) indic msura n care un item face diferena ntre subiecii cu performane nalte i cei cu performane sczute la un test. Se poate calcula ca diferen ntre procentul de subieci care au rezolvat corect itemul analizat din cincimea superioar a clasamentului, realizat pe baza scorurilor totale la test (primii 20% dintre subieci) i procentul de subieci care a rezolvat corect itemul analizat din cincimea inferioar a clasamentului (ultimii 20% dintre subieci). Ca i n cazul indicelui de dificultate, grupul de subieci poate fi mprit i n trei sau patru segmente. Formula dup care se calculeaz indicele de discriminare este: G Gs I dis = i , n n care Gi reprezint numrul de rspunsuri greite n segmentul inferior, Gs numrul de rspunsuri greite n segmentul superior, iar n este este numrul de subieci dintr-un segment. Valoarea indicelui de discriminare poate varia ntre -1 i +1. Cnd are valoarea +1, itemul discrimineaz la nivel maxim n favoarea subiecilor buni, iar valoarea -1 indic o discriminare negativ (toi elevii din segmentul superior au greit itemul, iar cei din segmentul inferior l-au rezolvat corect). n situaia absurd a unei discriminri negative, se recomand excluderea itemului. n cazul unui test normativ, valoarea optim a indicelui de discriminare ar trebui s se situeze peste 0,70. Exemplu de calcul a indicelui de dificultate
Revenim la exemplul pe baza cruia am calculat indicele de dificultate i analizm puterea de discriminare a itemului 7. Un elev din segmentul inferior (E) a greit itemul, n timp ce n segmentul superior nu avem nici un rspuns greit. Dac nlocuim aceste date n formul, obinem: G Gs 1 0 I dis = i = 0,50 = n 2 Aadar, indicele de discriminare al itemului 7 este de 0,50, o valoare mai mic dect 0,70, ceea ce nseamn c acest item nu discrimineaz foarte bine ntre elevii buni i elevii slabi.

Analiza distractorilor (rspunsurile incorecte) se recomand n special pentru itemii cu alegere multipl sau pentru cei de asociere pentru a determina eficiena acestora. Rspunsurile incorecte ar trebui s-l stimuleze pe elev, fr a permite ghicirea rspunsului corect fr nici un fel de efort. Analiza distratorilor se poate realiza prin calcularea indicelului de discriminare pentru fiecare distractor, cu precizarea c acesta ar trebui s aib valori mai degrab negative pentru ca varianta de rspuns incorect s poat fi considerat un distractor eficient (Linn i Gronlund, 2000; Nitko, 2001). Cu alte cuvinte, distractorul ar trebui s atrag mai multe alegeri din rndul elevilor slabi i mai puine din rndul celor buni. Dac aceast soluie pare complicat i minuioas, se poate proceda la o analiz detaliat a distractorilor, care s respecte principiile enunate anterior, evitnd totodat calculele matematice. Vom

exemplifica un asemenea demers, pentru a facilita nelegerea acestei proceduri de analiz a distractorilor. S presupunem c am aplicat un test care include itemi cu alegere multipl care au cte patru variante de rspuns unui grup de 40 de elevi. Ca i n cazul calculrii indicelui de discriminare, trebuie s stabilim segmentul superior i segmentul superior n funcie de rezultatele totale la test. n acest caz, presupunem c vom mpri grupul nostru n patru segmente a cte 10 elevi. Rezultatele detaliate pentru unul dintre itemi, pentru care rspunsul corect este A, iar B, C i D sunt distratori sunt prezentate n tabelul de mai jos.
Alternative de rspuns Segmentul superior Segmentul inferior Varianta de rspuns A 6 3 Varianta de rspuns B 4 2 Varianta de rspuns C 1 5 Varianta de rspuns D 0 0 Non-rspunsuri 0 0

Puterea de discriminare a itemului este relativ redus, valoarea indicelelui de discriminare fiind 0,33. Alternativa de rspuns B este un distractor nepotrivit, deoarece a atras mai multe alegeri din segmentul superior al grupului de elevi. Varianta de rspuns C este un distractor adecvat deoarece a atras mai multe alegeri din segmentul inferior al grupului, n timp ce alternativa D este un distractor lipsit de eficien, nefiind ales de nici un elev. Ca urmare a aceste analize, profesorul ar trebui s nlocuiasc variantele de rspuns B i D sau s revizuiasc itemul n ntregime, n cazul n care sarcina a fost formulat ntr-o manier ambigu, genernd astfel problemele de discriminare ntre elevii buni i cei slabi. Dei analiza itemilor constituie un demers obligatoriu cel puin n vederea proiectrii mai corecte testelor pentru o secven de evaluare viitoare, ar trebui avute n vedere o serie de nuane privind interpretarea sa (Lin i Gronlund, 2000; Nitko, 2001): Puterea de discriminare a unui item nu ofer informaii i despre validitatea acestuia. n calcularea coeficientului de discriminare se folosesc scorurile de la ntregul test pentru a mpri grupul se elevi n subgrupuri, adic un criteriu intern i nu unul extern. O valoarea adecvat a indicelui de discriminare ilustreaz validitatea unui item, doar n cazul n care validitatea ntregului test a fost deja demonstrat. n evaluarea pe care o realizm la clas, rareori ne putem permite s realizm o analiz de validitate complet i, de aceea, indicele de discriminare trebuie interpretat cu precauie. Un indice sczut al discriminrii nu indic ntotdeauna un item formulat n complet eroare. Itemii care nu discrimineaz ntre elevii buni i cei slabi trebuie analizai n special sub aspectul formulrii, care poate fi ambigu, inexact sau poate induce unor elevi rspunsul corect. Testele elaborate de profesor pentru utilizarea la clas sunt proiectate pentru a msura comportamente pe mai multe nivele taxonomice (cunoatere, nelegere, aplicare etc). Dac un test cu 20 de itemi care vizeaz cunoaterea i nelegerea include 15 itemi pentru nivelul cunoatere i 5 itemi pentru nivelul nelegere, puterea de discriminare a itemilor care msoar nelegerea va fi cu siguran mai mic. Un prim motiv este acela c itemii care vizeaz nelegerea sunt mai puin reprezentai n ntregul test, iar un al doilea ar fi slaba corelaia ntre itemii care msoar cunoaterea i cei care msoar nelegerea pe care cercettorii au demonstrat-o anterior (Linn i Gronlund, 2000). Dac am exclude aceti itemi din test, am obine un test mai omogen, dar validitatea sa ar scdea pentru c nu am mai surprinde ntreaga gam de comportamente pe care le-am vizat n activitatea de predare-nvare. ntre indicele de dificultate i indicele de discriminare se stabilesc relaii complexe care trebuie avute n vedere n interpretarea lor. Astfel, n principiu, un item cu dificultatea 0,50 (itemul ideal) poate avea un indice de discriminare maxim (1), dar aceast relaie ntre cele dou valori ale indicilor nu este garantat. Dac jumtate dintre elevii din

segmentul superior i, respectiv, din segmentul inferior ar rezolva corect un item, indicele de dificultate ar rmne 0,50, dar valoarea indicelui de discriminare ar fi 0. Cu ct ne ndeprtm de valoarea 0,50 a indicelui de dificultate, iar itemii devin fie mai uori, fie mai dificili, valoarea indicelui de discriminare scade. Aadar, itemii cu nivel foarte sczut sau foarte ridicat de dificultate au o putere de discriminare redus. n luarea deciziilor privind excluderea unor itemi trebuie avute n vedere cel puin dou consideraii importante: pe de o parte, o slab putere de discriminare poate indica probleme n formularea clar a cerinelor i nu deficiene de coninut, iar pe de alt parte, testele elaborate de ctre profesor pentru a fi aplicate la clas nu vizeaz ntotdeauna discriminarea de finee ntre rezultatele elevilor. Astfel, eliminarea itemilor cu putere de discriminare mic poate influena negativ validitatea testului. Analiza de itemi trebuie ntotdeauna interpretat cu precauie atunci cnd se realizeaz pe grupuri mici de elevi, cum sunt clasele. n mod evident, rezultatele analizei de itemi sunt influenate de volumul lotului de elevi crora li se administreaz testul i, de aceea, rezultatele sale pentru o clas de elevi trebuie interpretate prudent. Vor fi exclui din test doar acei itemi care sunt n mod evident prea dificili ori prea facili i care discrimineaz negativ, dar fr a interpreta rigid limitele numerice sugerate de specialiti.

4.3.7. Proiectarea testului Elaborarea unui test docimologic presupune parcurgerea mai multor etape (Evans, 1985; Crocker i Algina, 1986; Radu, 2000) pe care le vom prezenta detaliat n cele ce urmeaz. A) Stabilirea scopului (diagnostic, pronostic; formativ, sumativ etc.) i tipului probei (normativ/criterial; iniial, de progres, final) determin structura i coninutul acesteia. B) Selectarea obiectivelor i a coninuturilor corespunztoare care vor fi vizate prin intermediul testului este sintetizat ntr-un tabel sau matrice de specificaii (Crocker i Algina, 1986; Mason i Bramble, 1997; Radu, 2000; Stoica, 2001; Gall, Galli Borg, 2007). Acest tabel de specificaii include pe vertical coninuturile care vor fi evaluate, iar pe orizontal obiectivele corespunztoare, ierarhizate n acord treptele unei taxonomii a domeniului cognnitiv (n cazul taxonomiei lui Bloom: cunoatere, comprehensiune, aplicare, analiz, sintez i evaluare). Matricea (tabelul) de specificaii este prezentat n literatura pedagogic n strns conexiune cu filosofia evalurii prin raportare la obiective (engl. objective-based evaluation), consituind o veritabil punte de legtur ntre obiective, coninuturi i evaluare, n calitate de componente ale curriculumului (Mason i Bramble, 1997; Gall, Gall i Borg, 2007). Demersul de elaborare a matricei de specificaii constituie una dintre etapele proiectrii testului docimologic, care urmeaz celei n care se stabilete tipul de test vizat. Fr a intra n detalii inutile, prezentm succint linia de reflecie care a condus la ideea necesitii elaborrii matricei de specificaie, nainte de proiectarea itemilor. Demersul i are orginea n aa numita abordare Tyler-Bloom a curriculumului (Mason i Bramble, 1997; Gall, Gall i Borg, 2007) care presupune selecia i organizarea coninuturilor n acord cu un set de obiective de nivel general, care s orienteze activitatea conceptorilor de planuri de nvmnt, programe colare, manuale alternative etc. i care s fie reflectate n metodele i instrumentele de evaluare. Obiectivele de nivel general care orienteaz activitatea de selecie i organizare a coninuturilor nu pot constitui repere directe de msurare a performanelor elevilor, de unde i necesitatea exprimrii acestora n termeni de comportamente observabile i msurabile (vezi contribuia lui B. Bloom n acest sens). Dincolo de argumentele solide care pot fundamenta utilizarea matricei de specificaii n proiectarea testelor docimologice, ca element derivat din contribuiile lui R. Tyler i B. Bloom la clarificarea relaiilor dintre

componentele curriculumului, nu putem ignora inconsistena prezentrii sale n lucrrile romneti de teoria evalurii. Matricea de specificaii const ntr-un tabel cu dou intrri care servete la proiectarea i organizarea itemilor dintr-un test docimologic, n care sunt precizate, pe de o parte, coninuturile care vor fi vizate, i, pe de alt parte, nivelele taxonomice la care se plaseaz obiectivele de evaluare (Mason i Bramble, 1997; Linn i Gronlund, 2000; Schreerens, Glas i Thomas, 2003; Gall, Gall i Borg, 2007; Stoica, 2001). Cteva precizri se impun n legtur cu obiectivele de evaluare, insuficient discutate n literatura pedagogic romneasc. Ele nu se suprapun perfect peste obiectivele cadru i de referin. n fond curriculum recomandat, curriculum predat i curriculum evaluat nu se suprapun perfect! Dei practicienii pot considera menionarea acestora un artificiu inutil, ea este crucial n proiectarea unor teste docimologice (mai ales a celor sumative) de calitate, n condiiile n care se opereaz decupaje n obiectivele i coninuturile avute n vedere. Liniile matricei de specificaii includ elementele de coninut vizate, iar coloanele se refer la nivelele taxonomice le care vor fi msurate performanele elevilor n raport cu aceste coninuturi. Cea mai utilizat taxonomie pentru domeniul cognitiv este cea a lui B. S. Bloom, ns exist suficiente alternative prezentate detaliat, inclusiv cu exemple n lucrri traduse n limba romn (vezi lucrrile lui V. i G. De Landsheere, 1979, Definirea obiectivelor educaiei, Bucureti, EDP i Ausubel, D., Robinson, Fl., 1981, nvarea n coal. O introducere n psihologia pedagogic, Bucureti, E.D.P.). Unii pedagogi recomand utilizarea combinat a taxonomiilor, pentru a pune n eviden o gam larg de capaciti, abiliti ale elevului prin aceeai prob de evaluare (Stoica, 2001; Schreerens, Glas i Thomas, 2003). Celulele tabelului, aflate la intersecia dintre elementele de coninut i nivelele taxonomice pentru nivelul cognitiv cuprind procentele de itemi (din totalul itemilor consacrai ntregului test) ce vor fi folosii n proiectatea testului. Dac testul va include 20 itemi, nseamn c 5% din total, adic 2 itemi, vor fi alocai celulei care vizeaz terminologia de recunoscut sau de redat din memorie (celul rezultat din intersectarea coninuturilor constnd din terminologie, cu nivelul taxonomic achiziia informaiei); 30%, adic 12 itemi, pentru celula viznd rezolvarea de probleme, la nivelul taxonomic analiz (rezultat din ntretierea rndului coninuturilor constnd din probleme cu coloana reprezentnd analiza) etc.
Coninuturi/ Obiective Element de coninut 1 Element de coninut 2 Element de coninut 3 Element de coninut 4 Total Achiziia informaiei 10 (2) 10 (2) 10(2) 30 (6) nelegere 10 (2) 10 (2) 10 (2) 30 (6) Aplicare 5 (1) 25 (5) 30 (6) Analiz 10 (2) 10 (2) Total 10 (2) 25 (5) 35 (7) 30 (6) 100 (20)

Pentru a uura activitatea de elaborare a matricei de specificaii se poate opta pentru trecerea n fiecare celul a numrului de itemi care vor fi proiectai (n exemplul de mai sus, numrul de itemi este notat n parantez). Att procentele, ct i numerele de nsumeaz pe vertical i pe orizontal. n funcie de scopul i tipul testului care trebuie proiectat, se poate elabora o matrice de specificaii general sau detaliat (Stoica, 2001). Matricea de specificaii general este util n proiectarea testelor sumative care vizeaz coninuturi largi i obiective cu nivele de complexitate ridicate. Ele specific uniti mari de coninut i nivele taxonomice generale (ca n exemplul general sugerat iniial).

Matricea de specificaii detaliat este recomandat n cazul testelor sumative care vizeaz coninuturi mai restrnse (evaluare la finalul unei uniti de nvare, la finalul unui semestru etc.) i chiar n cazul testelor formative (care pot viza coninutul unei singure lecii i, n mod evident, nu pot inti dect anumite nivele taxonomice). Ea poate detalia coninuturile care vor fi acoperite prin test sau nivelele taxonomice, dar poate include informaii amnunite i despre ambele dimensiuni. Exemplu - Matrice de specificaii pentru un test de evaluare la unitatea de nvare Adunarea i scderea numerelor naturale, n care sunt detaliate nivelele taxonomice
Cunoaterea Coninuturi/ Obiective 1. Termeni specifici 2. Relaii, transformri 3. Utilizri, aplicaii 4. Probleme Total 10% (2) 5% (1) Cunoaterea terminologiei 10% (2) 5% (1) 5% (1) Cunoterea conveniilor Cunoaterea metodelor nelegere Traspunere 10% (2) 5% (1) 10% (2) 15% (3) 15% (3) Extrapolare 5% (1) 10% (2) 15% (3) Aplicare Analiz Cutarea elementelor 5% (1) 5%(1) Cutarea relaiilor 5% (1) 5% (1) Total

5% (1) 25% (5) 30% (6)

10% (2) 25% (5) 35% (7) 30% (6) 100% (20)

C) Formularea itemilor constituie cea mai laborioas etap a elaborrii unui test pedagogic. D) Stabilirea unei grile de corectare care s includ rspunsurile corecte pentru fiecare item uureaz considerabil activitatea evaluatorului. E) Elaborarea baremului de notare sau a modalitii de calculare a scorurilor va permite evaluarea precis i identic a rspunsurilor formulate de fiecare elev. n cazul itemilor subiectivi, baremul de corectare include elemente ale rspunsului care vor fi punctate. Dac este vorba de teste nestandardizate sau elaborate de profesor, etapa urmtoare include aplicarea testului, n timp ce n cazul testelor standardizate aceast etap este pregtit de etapele de pretestare i de revizuire, reformulare i definitivare a acestuia. A. Anastasi (1976, p. 413) indic ns c i n cazul testelor nestandardizate trebuie realizat o pretestare care s includ o analiz a itemilor (calcularea coeficientului de dificultate i a celui de discriminare, analiza distractorilor). F) Pretestarea are n vedere verificarea calitilor globale ale testului (Karmel i Karmel, 1978; Radu, 2000; Moise, 2007) - obiectivitate, aplicabilitate, fidelitate i validitate, precum i a calitilor fiecrui item dificultate i putere de discriminare, calitatea distractorilor. G) n ultima etap de construire a unui test revizuirea acestuia, o parte dintre itemi sunt fie reformulai, fie eliminai n funcie de rezultatele analizei privind caracteristicile prezentate anterior. Pentru a fi corect aplicat un test docimologic standardizat, ca i un test psihologic trebuie nsoit de un manual de utilizare care s includ toate detaliile tehnice, precum i informaii complete privind administrarea i maniera de calculare a scorurilor. Avantajele i limitele testului n general, i a celui docimologic, n special, au fost ndelung dezbtute: n timp ce unii au subliniat faptul c ele constituie mijloace eficiente de cunoatere a performanelor subiecilor, de selecie a acestora (atunci cnd acesta este scopul

aplicrii lor) i poate contribui la luarea deciziei de tratare difereniat, alii au invocat lipsa de rigoare n elaborarea i administrarea unora dintre teste. Testele normative au fost adesea criticate pentru raportarea la rezultatele unui grup de referin, care nu ntotdeauna este potrivit (vezi situaia persoanelor din minoriti etnice, care vorbesc alt limb dect cea n care este administrat testul sau a persoanelor cu dizabiliti). Testele care includ prea muli itemi obiectivi au fost criticate pentru faptul c evalueaz mai degrab capacitatea de memorare a subiecilor, n timp ce testele cu itemi de tip eseu sunt considerate prea subiective. Valoarea testelor depinde n mare msur de competena celor care le elaboreaz i de pregtirea celor care le aplic i calculeaz scorurile, de unde i nevoia de pregtire riguroas a acestora. Este incontestabil contribuia testelor nu doar n reglarea activitii educaionale (elaborarea programelor de recuperare sau accelerare), ci i n realizarea unor cercetri educaionale credibile. n ciuda acestui fapt, testul trebuie utilizat cu precauie, n condiiile respectrii tuturor etapelor i condiiilor de elaborare, de administrare i de calculare a scorurilor. Tem obligatorie 2 Proiectai un test docimologic pentru nvmntul primar (proiectat dup regulile prezentate n curs, nsoit de schema de corectare i de notare i de descriptori de perfoman5). 4.4. Metode alternative (complementare) de verificare Clasificrile metodelor de evaluare pe care le-am invocat ntr-o seciune anterioar a acestui curs, includ ntre metodele de verificare nu doar pe cele tradiionale (probele orale, scrise i practice, testul docimologic), ci i metode alternative sau complementare de verificare. O observaie interesant se impune n legtur cu sintagma evaluare autentic, pus adesea n relaie cu metodele complementare de verificare: ea este utilizat foarte rar n literatura de specialitate romneasc (vezi Stoica, 2003), iar literatura pedagogic internaional include ntre metodele de evaluare autentic i probele practice (Gallagher, 1998; Linn i Gronlund, 2000). Evaluarea autentic presupune, de fapt, colectarea de informaii despre achiziii ale elevului demonstrate n situaii ct mai aproape de cele din viaa real i formularea unor aprecieri pe baza acestor date. Mai mult dect att, de cele mai multe ori, procesul i nu produsul constituie obiectul evalurii autentice. Conceptul de evaluare autentic s-a cristalizat pe fondul nemulumirii actorilor educaionali, n contextul generalizrii standardelor de performan pentru elevi i a testelor docimologice, care nu ofer informaii suficient de credibile despre achiziiile elevului deoarece surprind comportamente artificial antrenate n coal. n contextul pregtirii dvs. pentru cariera didactic n nvmntul precolar i primar, cunoaterea metodelor complementare de verificare i formarea competenelor de utilizare corect a acestora este deosebit de important, avnd n vedere faptul c evaluarea n nvmntul precolar se poate proiecta i realiza mai ales prin aceste metode. Dei nu am acordat un spaiu extins discuiilor despre posibilitile de aplicare a metodelor de verificare descrise n paginile anterioare n nvmntul precolar, este de la sine neles faptul c probele scrise sunt rar utilizabile n verificarea achiziiilor precolarilor. n forme adaptate la specificul vrstei, probele orale, probele practice i testul docimologic pot fi utilizate. Testul docimologic poate fi aplicat fie oral, fie n scris (dac itemii includ imagini i nu text, iar instruciunile de rezolvare se pot comunica oral).

Descriptorii de performan vor fi descrii n seciunea destinat notrii ca metod de apreciere a rezultatelor elevului.

Avnd n vedere spectrul redus de metode de verificare tradiionale la care se poate face apel n nvmntul precolar, metodele complementare pot constitui un suport real n activitatea evaluativ. Din pcate, acestea nu beneficiaz de tratament egal n competiia cu metodele tradiionale de verificare, fiind prezentate n literatur destul de sumar. Acest fapt conduce la erori n nelegerea i aplicarea acestor metode, ceea ce se rsfrnge apoi n activitatea de evaluare din coli i din clase: elevii pregtesc portofolii imprimnd diverse materiale care se pot gsi on-line i nu neleg motivele pentru care iau note mai mici dect ali colegi care, poate, au procedat la fel; prinii fie se implic prea mult n realizarea unui portofoliu mpreun cu copilul lor, fie sunt nemulumii de utilizarea acestuia ca metod de evaluare; n sfrit, profesorii nu obin informaii suplimentare privind achiziiile elevului, pe care nu le pot verifica prin apelul la metode tradiionale, mai puin costisitoare i cronofage dect cele complementare. Aadar, o introducere n utilizarea mai riguroas a metodelor complementare de verificare se impune cu necesitate. n acest curs nu vom aborda unele dintre metodele complementare de verificare (de exemplu, referatul, harta conceptual, jurnalul reflexiv) pentru c le considerm mai puin aplicabile n nvmntul precolar i primar, ci ne vom concentra atenia asupra celor care pot fi utilizate n evaluarea copiilor de vrste mici: portofoliul, proiectul, investigaia, observaia sistematic a activitii i comportamentului elevului, autoevaluarea i interevaluarea. 4.4.1. Portofoliul poate fi definit ca o colecie de produse ale activitii elevului, care sunt reunite pentru a documenta fie achiziii ale elevului, fie progresul sau dezvoltarea acestuia (Gallagher, 1998; Linn i Gronlund, 2000). Realizarea unui portofoliu presupune stabilirea unui scop clar pentru care sunt colectate lucrri i produse ale elevului. Scopul pentru care se elaboreaz portofoliile se poate constitui ntr-un criteriu general de clasificare a tipurilor de portofolii care pot fi folosite n coal (Arter, Spandel i Culham, 1995 citai de Linn i Gronlund, 2000). Astfel, portofoliile pot fi instrucionale sau evaluative. Cu alte cuvinte, putem utiliza portofoliul nu doar ca metod de evaluare, ci i ca metod didactic, pentru a ncuraja elevii s se pregteasc permanent, dar i pentru a le forma deprinderile de a selecta cele mai bune lucrri pe care le realizeaz de-a lungul unei perioade de timp. Evident, portofoliul instrucional are o dimensiune evaluativ, dac avem n vedere faptul c elevii sunt ncurajai s-i autoevalueze activitatea i produsele. Portofoliul de evaluare poate fi folosit ca produs global al elevului pentru stabilirea unei note i constrnge la stabilirea unui set bine precizat de produse, lucrri etc. care vor fi realizate de ctre toi elevii unei clase, pentru a asigura justeea actului de evaluare i posibilitatea de a compara achiziiile demonstrate de fiecare elev. Aceast metod complementar poate fi folosit att n evaluarea continu, formativ, ct i n evaluarea sumativ, cu precizarea c utilizarea sa n evaluarea formativ nu trebuie s se finalizeze n mod obligatoriu prin not. Portofoliile pregtite n contextul evalurii formative pot fi considerate oportuniti pentru feedbackul continuu att de necesar profesorului i elevului, dar i pentru ncurajarea autoevalurii la elev. Literatura pedagogic internaional descrie i alte modaliti de clasificare a portofoliilor (Gallagher, 1998; Linn i Gronlund, 2000): Portofoliile pot include produse ale activitii elevului care s ilustreze achiziiile elevului la un moment dat, dar poate fi utilizat i cu scopul de a analiza progresul sau devoltarea elevului. Portofoliul de achiziii al elevului se poate realiza ntr-o perioad de timp relativ scurt i include doar lucrri sau produse finalizate, care pot fi apreciate global printr-o not. Prin contrast, portofoliul de progres sau de dezvoltare poate include i lucrri sau produse neterminate de ctre elev i chiar mai multe versiuni ale acelaiai lucrri care s pun n lumin evoluia ntr-o perioad mai lung de timp. Portoliul de progres poate fi

proiectat pentru un ntreg ciclu de nvmnt i poate nsoi copilul pe parcursul mai multor ani, astfel nct profesorii s poat avea informaii despre achiziiile anterioare ale acestuia. n plus, portofoliul de progres poate constitui o modalitate eficient de a comunica prinilor puntele tari i punctele slabe ale copilului i de a stimula implicarea familiei n viaa educaional a copilului. Portofoliul poate reuni cele mai bune lucrri ale elevului (aa-numitul portofoliu de prezentare), dar poate avea i rolul de a documenta achiziiile elevului (portofoliul de documentare). Portofoliul de prezentare l are ca actor principal pe elev, care alege singur sau sprijinit de colegi i profesor, cele mai bune lucrri ale sale pentru a ilustra nivelul achiziiilor sale. Portofoliul de documentare are ca actor principal profesorul, care selecteaz lucrri i produse ale activitii elevului pe care le consider importante pentru a contura volumul i profunzimea achiziiilor. Portofoliul finalizat include doar lucrri i produse terminate, gata pentru a fi prezentate unui public-int (gndii-v la portofoliul de angajare sau la portofoliul de lucrri necesar pentru admiterea n nvmntul superior artistic), n timp de portofoliul de lucru documenteaz activitatea zilnic fiind util mai ales pentru evaluarea formativ. Portofoliul de lucru este deschis i permite reveniri, corecturi, mbuntiri sau chiar nlocuirea complet a unor piese. Portfoliul individual include lucrri ale unei singure persoane, n timp ce portofoliul colectiv reunete lucrri realizate n grup, prin cooperare ntre dou sau mai multe persoane. n nvmntul precolar i primar romnesc portofoliile nu sunt o noutate absolut: cadrele didactice au alctuit dintotdeauna mai ales portofolii de dezvoltare sau de progres pentru elevi sau pentru ntreaga clas, fr a le asocia ns cu termenologia vehiculat n prezent n teoria evalurii. Confuziile, nemulumirile i erorile n utilizarea portofoliilor survin mai ales ca urmare a lipsei de preoucupare pentru stabilirea unui scop clar pentru care acestea sunt elaborate. Scopul i tipul portofoliului determin structura acestuia i posibilitile de utilizare pentru aprecierea prin not. Tem de reflecie ncercai s rememorai 2-3 situaii educaionale n care au fost utilizate portofolii. n ce categorie din tipologia de mai sus ai putea ncadra acele portofolii? Repere n utilizarea portofoliului de evaluare. Pentru a folosi portofoliul n scop evaluativ, trebuie s conferim acestuia o not de rigoare pentru a nu se putea pune la ndoial deciziile exprimate de profesor prin not. Pentru a acoperi acest deziderat trebuie s parcurgem o serie de pai sau etape n proiectarea i realizarea evalurii pe baz de portofoliu (Gallagher, 1998; Linn i Gronlund, 2000): a) Scopul pentru care se solicit elevilor s realizeze un portofoliu trebuie articulat cu maxim claritate, astfel nct s indice cu suficient precizie ce lucrri sau produse ale activitii elevului vor fi selectate, cine le va selecta, cine va contribui la realizarea lor. Sunt necesare precizri cu privire la eventuala implicare a prinilor, dac o parte dintre piesele prevzute pentru portofoliu se realizeaz sau se finalizeaz acas, dup cum exist i posibilitatea ca una sau mai multe piese ale portofoliului s se realizeze n grup i nu individual. n cazul n care portofoliul va fi analizat i apreciat prin not, este preferabil s se utilizeze portofolii individuale, iar elevii s fie informai cu privire la toate regulile de elaborare. n acest etap a proiectrii evalurii prin portofoliu trebuie stabilite i piesele care sunt solicitate i intervalul de timp pe care elevul l are la dispoziie pentru a le realiza. De asemenea, toi factorii educaionali (n special prinii i familiile) trebuie informai n

legtur cu aceste detalii, pentru ca intervenia lor s nu interfereze cu scopul evaluativ al portofoliului. b) Obiectivele educaionale care vor fi avute n vedere n contextul evalurii prin portfoliu, precum i coninuturile care vor fi acoperite trebuie clar precizate pentru a fundamenta stabilirea lucrrilor, a pieselor care vor fi realizate de ctre elevi. Ca n orice alt situaie de evaluare, utilizarea portfoliului nu se reduce la un artificiu didactic, ci trebuie s se raporteze la criterii clare, care, n cazul activitii educaionale sunt reprezentate de obiective. Obiectivele sunt ntodeauna corelate cu un set de coninuturi, care vor fi vizate n evaluare. c) Profesorul trebuie s precizeze care sunt piesele obligatorii (compuneri, desene, imagini, fotografii, rezumate etc.) care vor fi incluse n portofoliu. Un cadru didactic nu poate folosi corect portofoliul de evaluare dac nu precizeaz ce ateapt de la elevi i dac nu clarific i pentru sine ce criterii de corectare va folosi pentru fiecare pies inclus n portofoliu. Chiar i portfoliile de progres sau de devoltare trebuie nsoite de aceste precizri, pentru a crete rigoarea i obiectivitatea evalurii. Exemplu. S presupunem c dorim s utilizm portofoliul pentru evaluarea sumativ (semestrial) la Limba i Literatura romn n nvmntul primar, pentru elevii unei clase a III-a. n acest sens, propunem elevilor realizarea unui portofoliu individual (fr contribuii directe sau indirecte ale prinilor, familiei, colegilor) n care trebuie s includ: O compunere de maxim 2 pagini pe tema Duminica n parc. Trei fie de lectur pentru trei povestiri scrise de autorii cu care elevii fac cunotin prin intermediul textelor din manual (fiecare fi de lectur trebuie s aib minumum o pagin). O scurt biografie a unui autor despre care elevii vor nva n acel semestru (o fotografie nsoit de o jumtate de pagin cu informaii biografice). O analiz gramatical a unui text dat, n care elevul s utilizeze toate elementele de gramatic parcurse anterior (textul poate fi diferit pentru fiecare elev, dar sarcinile trebuie alese n aa fel nct s fie comparabile). Pentru fiecare dintre aceste patru piese, profesorul trebuie s stabileasc o schem de corectare i de notare, iar portofoliul n ansamblu trebuie prevzut cu o schem general de notare. Schema general de notare a pieselor din portfoliu presupune o analiz a sarcinilor din punct de vedere al complexitii i al volumului de coninuturi acoperite, dar i o estimare a efortului pe care elevul trebuie s-l depun. Punctajele acordate pentru fiecare pies pot fi difereniate, printr-o asemenea analiz minimal, astfel nct elevul s se poat orienta n activitatea de realizare a portofoliului. Dac avem n vedere acelai exemplu, schema general de notare pentru portfoliul nostru ar putea fi: Piesa din portofoliu Compunerea Trei fie de lectur pentru trei povestiri O scurt biografie a unui scriitor O analiz gramatical a unui text dat Puncte din oficiu Total Punctaj 30 puncte 30 puncte 10 puncte 30 puncte 10 puncte 100 puncte

Deoarece punctajele nu sunt note care pot fi consemnate n catalog, profesorul trebuie s stabileasc i corespondana ntre punctajele ce vor fi obinute de elevi i sistemul de notare utilizat. n cazul nvmntului primar romnesc, sistemul de notare const n calificative

foarte bine, bine, suficient i insuficient. Iat cum am putea ilustra corespondena punctaj calificative pentru exemplul nostru: Calificativ Foarte bine Bine Suficient Insuficient Punctaj 86-100 puncte 61-85 puncte 41-60 puncte 10-40 puncte

Aadar, dac un elev va obine 82 de puncte pentru portofoliu, va primi calificativul bine. Observai c stabilirea limitelor superioare i inferioare ale punctajelor se face ca n cazul intervalelor din analiza de frecvene grupate, fr a repeta limita superioar a unui interval de puncte ca limit inferioar a intervalului urmtor. De asemenea, pentru fiecare pies prevzut a fi inclus n portofoliu, trebuie construit o schem de corectare i de notare, dar modalitile de elaborare ale acesteia vor fi detaliate n seciunea din curs destinat notrii, ca metod de apreciere. d) Profesorul trebuie s monitorizeze procesul de realizare a portfoliului i s ofere feedback elevului pe parcursul pregtirii. Dac prin regulile stabilite iniial, la anunarea portofoliului, se stabilete i faptul c elevul poate reface una sau mai multe piese dup ce primete feedback de la profesor, acest lucru trebuie urmrit i nregistrat. e) Portofoliul poate fi utilizat n complementaritate cu alte metode alternative de evaluare, cum ar fi observaia sistematic a activitii i comportamentului elevului, proiectul, investigaia etc. Acest lucru trebuie precizat i anunat de la nceputul activitii de pregtire a portofoliilor. Dac s-a optat pentru observarea sistematic a elevului, profesorul trebuie s se asigure c are suficient timp pentru a prelucra i pentru a nregistra informaiile de care are nevoie. f) Evaluarea propriu-zis a portofoliului se realizeaz prin aplicarea schemei de corectare i de notare elaborat de profesor ntr-o etap anterioar i presupune asamblarea rezultatelor pentru fiecare pies din portofoliu ntr-un punctaj, respectiv calificativ global. Dac nu se respect aceste repere, crete riscul ca factorii perturbatori s afecteze aprecierea performanelor elevului, iar portfoliul ca metod de evaluare s-i piard credibilitatea. Dac elevii au libertatea de a include ce doresc ntr-un portofoliu crete i riscul de a aprecia accesul la resurse al elevilor i nu achiziiile sau rezultatele acestuia. Elevii care provin din familii cu statut socio-economic sczut, cu acces restrns la resurse de documentare, pot prezenta portofolii nesatisfctoare tocmai datorit situaiei dezavantajante. De aceea, se recomand stabilirea unei structuri clare a portofoliului, aplicabil pentru toi elevii, precum i o schem de corectare i de notare riguroas. Portofoliul are o serie de avantaje care l delimiteaz de alte metode de verificare, fie tradiionale, fie complementare (Gallagher, 1998; Linn i Gronlund, 2000): n primul rnd, portofoliul ca metod de evaluare poate fi asociat cu tendinele de a-l plasa pe elev n centrul activitii educaionale i cu nevoia de ntreptrundere a activitilor de predare, nvare i evaluare. De asemenea, poate contribui la dezvoltarea competenelor de autoevaluare ale elevului. Portfoliile de dezvoltare sunt extrem de importante n a documenta progresul copilului i n a-i informa pe prini i pe profesori cu privire la evoluia acestuia. El ofer i posibilitatea de a regndi activitile educaionale prin prisma nivelului de achiziii al copilului, creionnd o imagine realist a punctelor tari i slabe.

Prin varietatea pieselor ce pot fi incluse n portofolii, profesorul se poate asigura c fiecare elev poate demonstra c deine achiziiile minime necesare pentru a trece n urmtoarea etap de pregtire. Cu alte cuvinte, chiar i pentru cei mai slabi dintre elevi se poate crea oportunitatea exprimrii acelor achiziii pentru care poate fi valorizat. Dac este folosit n forma sa colectiv, portofoliul poate contribui la formarea deprinderilor de lucru n echip, a abilitilor de dialog i de negociere. Portfoliul se poate combina cu alte metode de verificare, inclusiv cele tradiionale, oferind astfel informaii complexe despre achiziiile elevului. Ca toate celelalte metode de verificare, portofoliul are o serie de limite pe care profesorul trebuie s le contientizeze atunci cnd opteaz pentru o strategie de evaluare: Portofoliile se numr printre cele mai cronofage i energofage metode de verificare. De aceea, volumul portofoliului i efortul de elaborare din partea elevului i de evaluare din partea profesorului trebuie atent cntrite. Fidelitatea evalurii prin portofoliu este n mare suferin, mai ales atunci cnd sarcinile sunt neclar stucturate, iar criteriile de corectare i de notare sunt vagi. Pe de alt parte, structurarea rigid a portofoliului i a criteriilor de evaluare poate submina validitatea acestuia, mai ales dac scopul utilizrii sale este formarea abilitilor de autoevaluare la elev, prin alegerea pieselor celor mai potrivite. Exist i un risc major de erori grave n utilizarea portfoliului determinat de naivitatea profesorilor i a elevilor, care pleac de la premisa c acesta poate fi realizat, asamblat cu mare uurin. Coleciile dezordonate de lucrri i produse ale elevului nu pot fi numite portofolii, de unde i nevoia de rigoare n proiectarea i realizarea evalurii prin portofoliu. Utilizarea portofoliului n evaluarea colar nu reprezint o noutate, ns cercetarea educaional pe teme corelate este relativ sumar. Profesorii trebuie s contientizeze avantajele i limitele portofoliului, dar i s se informeze asupra noutilor cu privire la alternativele n evaluare.

Aplicaii a. Descriei piesele care ar putea fi incluse ntr-un portofoliu de dezvoltare sau de progres al unui precolar, elaborat pentru a-i informa pe prini i, ulterior pe profesorul pentru nvmnt primar/nvtor cu privire la evoluia copilului. c. Exemplificai structura i schema general de notare a unui portofoliu pentru disciplina tiine (nvmnt primar). d. Reflectai la structura unui portofoliu de evaluare sumativ pentru absolvenii de nvmnt superior care doresc s obin certificarea de formare iniial pentru cariera didactic. Ce piese ar putea include un asemenea portofoliu? 4.4.1. Proiectul este o metod de verificare complex, care presupune realizarea de ctre elev a unui model, a unui obiect funcional, a unui raport, a unei colecii de materiale diverse etc., prin apelul de cunotine, deprinderi, abiliti variate. De regul, proiectul presupune stabilirea unei perioade timp pentru elaborare, de la cteva zile la cteva sptmni. n funcie de obiectivele i de coninuturile vizate proiectele pot fi individuale, colective i combinate (Nitko, 2001). Proiectele individuale sunt cele mai indicate pentru evaluri sumative ncheiate prin notare i presupun activarea unui set de cunotine, deprinderi etc. complexe pentru realizarea unui produs final care trebuie s fie prezentat n faa clasei. Dac proiectul const, de exemplu, n realizarea unei machete a colii ideale (cldire, arhitectur, organizarea spaiilor etc.), elevul trebuie s activeze cunotine i deprinderi complexe, de factura transdiciplinar. De regul, proiectele antreneaz i creativitatea, spiritul critic sau simul estetic al elevului.

Pentru a fi credibile ca metode de verificare, proiectele individuale trebuie s respecte o serie de condiii: a) obiectivele educaionale vizate trebuie s fie clare att pentru profesor, ct i pentru elevi; b) fiecare elev trebuie s lucreze constant pentru finalizarea proiectului; c) elevii trebuie s aib acces egal la resurse de documentare i resurse materiale necesare n realizarea proiectului; d) profesorul trebuie s fie contient de posibilele erori pe care le poate face n aprecierea proiectelor realizate de elevi. De asemenea, proiectele care presupun doar activitate de documentare i redactare a unui text trebuie alternate cu acelea care stimuleaz realizarea de produse originale de ctre elev. Ca i n cazul portfoliului, se recomand proiectarea unei scheme detaliate de notare, care s aib n vedere toi paii pe care elevii trebuie s-i parcurg n realizarea proiectului, precum i ponderea acestora n nota final. Proiectele de grup sau colective (doi sau mai muli elevi pregtesc acelai proiect) se folosesc n evaluare doar atunci cnd vizm deprinderile de lucru n echip i, de regul, nu se ncheie prin notare dect dac se poate documenta cu suficient precizie contribuia fiecrui membru al grupului la realizarea produsului final. Proiectele combinate presupun alternarea sarcinilor individuale i a celor de grup n realizarea unui produs final. Pentru a asigura un minim de rigoare n realizarea proiectelor, profesorul trebuie s aib n vedere i urmtoarele aspecte: a) elevii trebuie monitorizai n permanen, pentru a se asigura progresul continuu; b) profesorul trebuie s acorde sprijin individual sau fiecrui grup n surmontarea eventualelor dificulti de parcurs n realizarea proiectelor; c) elevii trebuie s prezinte periodic un raport asupra stadiului proiectului; d) obiectivele, termenele de finalizare i schema de notare a proiectelor trebuie s fie foarte clare att pentru profesor, ct i pentru elevi. Printre avantajele proiectului ca metod de evaluare se numr posibilitatea de a evalua cunotine, capaciti, depinderi etc. complexe n situaii ct mai apropriate de cele reale, stimularea elevului pentru studiu i activitate independent sau pentru colaborarea cu ali colegi, creterea motivaiei pentru nvare prin stabilirea unor sarcini atractive, dezvoltarea creativitii i a spiritului critic. Ca i n cazul portofoliului, dezavantajele proiectului sunt generate de lipsa de atenie pentru proiectarea activitilor asociate, de la stabilirea vag a obiectivelor, pn la neclariti asupra schemei de notare. Dei pot furniza informaii importante despre achiziiile elevului, proiectele pot fi un eec dac profesorul nu acord suficient atenie proiectrii sale. n lipsa unei planificri riguroase, notarea proiectelor individuale este mai vulnerabil n fa factorilor perturbatori dect alte metode de verificare. 4.4.3. Investigaia poate consta n experimente sau aplicaii de mic amploare pe care elevii trebuie s le planifice, s le realizeze, s le interpreteze i s le comunice adecvat. n ciuda percepiei comune care plaseaz investigaia n sfera tiinelor, se pot imagina asemenea situaii evaluative i n cadrul tiinelor socio-umane. De exemplu, elevii dintr-o clas a IV-a ar putea fi solicitai s rspund la ntrebarea Ce cred colarii mici despre programele afterschool? printr-un mic sondaj de opinie n rndul colegilor din coal. Ca i proiectul, investigaia se poate realiza fie individual, fie n grup, dar spre deosebire de acesta i de portofoliu nu este recomandat pentru evaluri sumative care s se finalizeze prin notare. Investigaia este o metod de verificare potrivit pentru evaluarea formativ, pentru c are avantajul de a putea fi conceput n condiii naturale sau n condiii de laborator, pentru mai toate disciplinele de nvmnt i permite profesorului s surprind att volumul de cunotine asimilat, ct i nivelul altor achiziii de tipul deprinderilor, atitudinilor etc. Pentru a fi o surs credibil de informaii pentru profesor, investigaia trebuie proiectat astfel nct s se respecte urmtoarele recomandri (Nitko, 2001): a) investigaia trebuie precedat de o conversaie n care elevii, asistai de profesor, s formuleze ipoteze, predicii privind fenomenul studiat i s stabileasc modalitile concrete prin care vor aduna

informaii; b) elevii trebuie monitorizai pe tot parcursul procesului de colectare a informaiilor relevante, dar i atunci cnd analizeaz i pregtesc un mic raport asupra investigaiei; c) investigaia se ncheie prin prezentarea rezultatelor de ctre elevi, dar i prin formularea unor concluzii pe baza datelor colectate; d) profesorul ofer elevilor feedback privind modalitile de colectare a datelor i concluziile formulate, sugernd care au fost eventualele surse de erori. Tem de reflecie Exemplificai utilizarea investigaiei ca metod de evaluare n nvmntul precolar i primar. 4.4.4. Observarea sistematic a activitii i a comportamentului elevului const n nregistrarea unor date relevante sau considerate importante de ctre profesori cu privire la achiziii sau reacii ale elevului care nu se pot msura, investiga cu uurin prin alte metode de evaluare. Aceast metod complementar de evaluare se poate realiza prin apelul la trei tipuri de instrumente, care se difereniaz ntre ele prin natura observaiilor i prin gradul de structurare al acestora: fia de evaluare (engl. anectodal record), lista de control (engl. checklist) i scala de clasificare (engl. rating scale) (Gallagher, 1998; Linn i Gronlund, 2000; Nitko, 2001). Fia de evaluare este un instrument observaional simplu, care presupune nregistrarea de ctre profesor a unor incidente, evenimente sau comportamente considerante relevante, sub forma unor descrieri factuale care trebuie realizate la scurt timp dup consumarea situaiei prezentate. Pentru a putea fi utilizate ulterior, fiele de evaluare trebuie s includ observaii despre locul i data la care s-a nregistrat evenimentul observat, clasa i numele elevului (ca n exemplul de mai jos).
Clasa______________ Numele elevului_______________________ Data ______________ Locul (n clas, n curtea colii)___________ Incidentul / evenimentul observat Interpretare

Literatura pedagogic subliniaz faptul c utilizarea fielor de evaluare se recomand mai ales n situaiile n care vizm relaiile sociale din clasa de elevi, caracteristicile personale ale elevilor sau dificulti de nvare care nu pot fi detactate prin intermediul altor metode. Fia de evaluare const, practic, n consemnarea unor observaii spontane, realizate n mediul natural al subiecilor (dac coala poate fi considerat un mediu natural pentru elevi i profesori). Observaiile trebuie s respecte regulile metodei de cercetare cu care v-ai familiarizat n semestrul trecut, n sensul c profesorul trebuie s vizeze un numr rezonabil de comportamente i de elevi. Fia de evaluare este ntotdeauna individual, iar relatarea ct mai fidel a evenimentului sau a comportamentului trebuie s se disting de interpretarea pe care o genereaz profesorul. Fia de evaluare este util n special n nvmntul precolar, dar poate fi folosit i n cazul colarilor mici. Pe baza observaiilor colectate de-a lungul unui interval mai lung de timp, profesorul poate genera un raport mai vast, care poate constitui fundamentul proiectrii unor msuri educaionale adecvate (activiti de recuperare sau accelerare, remediale etc.), dar i o modalitate mai structurat de a prezenta prinilor i familiei nivelul de achiziii al copilului. Mai mult dect att, fiele de evaluare sunt recomandate n nvmntul preprimar nu doar datorit posibilitilor limitate de comunicare n scris specifice vrstei copiilor, ci i pentru c precolarii sunt mai spontani iar comportamentele lor sunt mai uor de interpretat ntr-un context dat.

Cel mai important avantaj al fielor de evaluare este acela c includ informaii cu privire la comportamente reale ale copilului, care au loc n situaii naturale oferind astfel i posibilitatea de a verifica rezultatele elevilor aa cum au fost anterior evaluate prin alte metode. De exemplu, un precolar poate defini n termeni proprii ce este prietenia, poate spune ct de importani sunt prietenii etc. ntr-o evaluare oral, dar comportamentul su egocentric i ndeprteaz pe colegii de grup i conduce la izolarea sa social. n plus, fiele de evaluare pot fi mrturii ale unor comportamente excepionale (n sensul c sunt singulare, izolate), care pot constituie puncte de plecare n luarea unor decizii educaionale ulterioare. Exemplele clasice n acest sens sunt copiii apatici care manifest brusc interes pentru un anumit tip de sarcin, copiii conformiti care rezolv n manier original o sarcin, copiii cu un comportament n general ostil care fac gesturi de prietenie fa de un coleg etc. Nici unul dintre aceste exemple de comportamente nu poate fi surprins prin alte metode sau instrumente de evaluare. Cea mai important limit a fielor de evaluare deriv din consumul mare de timp pentru completarea formularelor de nregistrare a datelor semnificative. Profesorul trebuie s stabileasc o limit maxim realist de fie de evaluare care pot fi completate ntr-o zi, ntr-o sptmn etc. i trebuie s aloce timp suplimentar pentru analiza i interpretarea comportamentelor observate ntr-un interval mai lung de timp, pe care care l consider semnificativ. Un alt dezavantaj rezid n subiectivitatea informaiilor nregistrate. n mod ideal, ar trebui ca profesorul s noteze ntocmai un comportament observat la un elev i apoi s ncerce interpretarea acestuia. n realitatea, observaiile noastre sunt ntotdeauna marcate de convingeri, percepii, stereotipuri pe care nu ntodeauna le putem controla. Un comportament atip al unui copil poate trece cu uurin neobservat, pentru c nu se potrivete cu imaginea noastr despre acel copil. O dificultate corelat cu subiectivitatea profesorului n nregistrarea evenimentelor semnificative este obinerea unui set de observaii relevant pentru a descrie comportamentul unui copil. Un copil timorat i anxios n timpul activitilor didactice se poate manifesta zgomotos n pauze sau n timpul jocurilor n aer liber. Plecnd de la asemenea exemple, profesorul trebuie s identifice un interval de timp i o palet variat de situaii care s i permit o interpretare ct mai aproape de adevr a comportamentului unui copil. Pentru a optimiza utilizarea fielor de evaluare, profesorul poate avea n vedere urmtoarele recomandri: a) circumscrierea comportamentelor care vor fi observate, dar pstrarea unei anumite deschideri n privina comportamentelor neateptate i atipice; b) analiza fielor de evaluare prin prisma eventualelor prejudeci, stereotipuri care le-ar putea afecta coninutul (eventual, cu ajutorul unui coleg); c) nregistrarea unei cantiti suficiente de informaii pentru a putea genera concluzii pertinente privind comportamentul unui copil; d) completarea fielor de evaluare la cel mai scurt timp posibil dup observarea comportamentului, a evenimentului; e) nregistrarea n rubrici distincte a descrierilor factuale i a posibilelor interpretri; f) fiele de evaluare trebuie s includ att comportamentele, evenimentele pozitive, ct i exemplele negative; g) profesorul trebuie s stabileasc care este volumul rezonabil de informaii colectate pe baza fielor de evaluare care i va permite s genereze concluzii i recomandri; h) completarea cu acuratee a fielor de evaluare necesit antrenament ndelungat i, de aceea, se recomand exerciii care s l formeze pe profesor n calitate de observator. Lista de control este un instrument observaional pe baza cruia comportamentul unui copil poate fi evaluat ca adecvat sau inadecvat, pozitiv sau negativ, prezent sau asent. O list de control include dou seciuni: o seciune n care sunt prezentate comportamentele ce urmeaz a fi observate i o seciune n care se noteaz dac acel comportament este adecvat sau inadecvat, absent sau prezent etc. n general, comportamentele ce trebuie observate sunt precizate succint, n cuvinte cheie pentru a minimaliza timpul necesar citirii acestora i a maximiza timpul destinat observaiei propriu-zise (vezi exemplul de mai jos, n care sunt prezentate comportamente ce ar putea fi observate n timpul activitillor n grup). Exist i posibilitatea de a introduce alte

coloane n structura listei de control cum ar fi cea destinat notrii faptului c un comportament nu a putut fi observat sau cea destinat eventualelor comentarii ale profesorului.
Nr. 1 2 3 4 Comportamentul vizat Comunic cu ceilali membri ai grupului Manifest tendina de a monopoliza discuiile din grup i contrazice n permanen pe ceilali membri ai grupului Nu colaboreaz cu ceilali membri ai grupului Prezent Absent Exemplu de list de control Comentarii/observaii

Lista de control poate fi nsoit i de un spaiu n care s se totalizeze punctajul obinut de ctre fiecare copil, dei acesta nu este ntodeauna relevant. Trebuie s menionm ns faptul c lista de control poate fi utilizat i pentru a evalua produse ale activitii elevului de tipul desenelor, machetelor, modelajelor etc. n acest caz, se recomand folosirea unui sistem de calculare a scorurilor (de regul, se noteaz cu 1 calitile i cu 0 erorile sau omisiunile n realizarea produsului). Mai mult dect att, lista de control poate fi un instrument util n cazul n care dorim s evalum nu doar produsul activitii unui copil, ci i procesul de realizare a acestuia. Reflectai la o activitate de modelaj, care nu se ncheie doar cu produse reuite. Cu toate acestea procesul de realizare a produsului final i poate plasa pe unii dintre copiii care nu au reuit s finalizeze produsul sau care au obinut produse incomplete ori inestetice n categoria celor motivai prin evaluare s ncerce mai mult la urmtoarea sarcin de lucru similar. Avantajul listei de control const tocmai n posibilitatea de a nregistra i elemente ale procesului de nvare sau de realizare a unei lucrri. Cel mai adesea, este preferat scalei de clasificare pentru c este mai uor de urmrit i permite colectarea unui volum mare de informaii n acelai interval de timp. Limitele acestei metode de verificare sunt similare cu cele descrise n cazul fielor de evaluare: este cronofag, necesit atenie i pregtire prealabil din partea profesorului, iar rezultatele sunt sensibile la variabilitatea factorilor subiectivi ai evaluatorului. n plus, n ciuda aparenelor de mai mare acuratee, nici listele de control nu permit discriminri fine ntre copii, pe baza eventualelor punctaje totale calculate. Scara de clasificare nu este nimic altceva dect o list de control n care comportamentele sau produsele activitii sunt evaluate utiliznd o scal cu un numr variabil de trepte (de obicei, se utilizeaz o scal Likert n cinci trepte, dar se poate opta i pentru alte variante). Ea se aplic atunci cnd evaluatorul vizeaz obinerea unor informaii mai complexe despre comportamente sau produse ale copiilor (vezi exemplul de mai jos, care este o adaptare a listei de control din exemplul anterior).
Nr. 1 2 3 4 Comportamentul vizat Comunic cu ceilali membri ai grupului Manifest tendina de a monopoliza discuiile din grup i contrazice n permanen pe ceilali membri ai grupului Nu colaboreaz cu ceilali membri ai grupului ntodeauna Foarte des Rar Exemplu de scar de clasificare Foarte rar Niciodat

Folosirea numerelor sau a variantelor de rspuns le confer un aer de acuratee, dar acest lucru nu este ntotdeauna adevrat. De exemplu, dei nu exist recomandri explicite privind un numr maxim de trepte ce pot fi incluse ntr-o scar de clasificare, dac acestea sunt mai multe de apte orice evaluator va avea dificulti. Scara de clasificare are aceleai limite ca cele identificate

pentru lista de control, dar ntre avantaje ctig unul suplimentar: permite documentarea progresului unui elev, n cazul n care se aplic n mod repetat. Aplicaie Proiectai o list de control i o scar de clasificare pe care s le putei utiliza n evaluarea comportamentelor creative ale precolarilor. 4.4.5. Autoevaluarea i interevaluarea Dei n mod tradiional profesorul era privit ca unic evaluator al elevului, indiferent dac era vorba despre evaluarea rezultatelor colare, a comportamentelor sociale, a atitudinilor, a intereselor, a motivaiei pentru nvare etc., literatura pedagogic romneasc i internaional a accentuat n ultimele decenii pregtirea elevului pentru viaa independent de adult, nc de la cele mai mic vrste, prin trasformarea sa n evaluator (Radu, 1981; Gallagher, 1998; Linn i Gronlund, 2000; Nitko, 2001). Opiunea pentru ncurajarea autoevalurii i interevalurii se nscrie n tendinele de modificare a atmosferei educaionale din clase dinspre individualism i competiie ctre cooperare, situaie n care i rolul profesorului cunoate transformri. Autoreglarea activitilor de nvare i dezvoltarea deprinderilor metacognitive consitutie deziderate ale educaiei contemporane, fr nici o urm de ndoial. n acest context, autoevaluarea i interevaluarea capt valene noi, fiind determinante n formarea pentru viaa de adult, capabil s-i analizeze i s-i gestioneze propriile resurse de nvare. Dac profesorul nu are n registrul su didactic suficient tact pentru a controla situaiile de auto i interevaluare sau dac relaiile sociale din clas (profesor-elevi, elevielevi) nu sunt bazate pe ncredere reciproc, aceste metode nu sunt recomandate pentru c pot genera experiene academice i emoionale negative. Pedagogii au formulat o serie de recomandri pentru profesorii care decid s utilizeze aceste metode de evaluare (Gallagher, 1998, pp. 272-274): a) Interevaluarea nu ar trebuie folosit niciodat ca unic element n luarea deciziilor privind notarea, deoarece o asemenea decizie poate conduce la dezechilibre n clas. Ea se poate folosi pentru a-i antrena pe levi ca evaluatori i pentru a ncuraja onestitatea i tactul n exprimarea opiniilor. Notarea este o responsabilitate a profesorului i nu ar trebui s apese pe umerii elevilor. Feedbackul ntre elevi este benefic, dar acesta nu trebuie s constituie unicul reper n notare. b) Interevaluarea are succes mai ales n clasele n care se stimuleaz spiritul de cooperare, n detrimentul competiiei bazate pe performane individuale. c) Orice opinie evaluativ, indiferent de evaluator trebuie s fie privit ca un ndemn ctre mbuntirea performanelor, nu ca o critic lipsit de sens. Elevii trebuie s fie asistai n procesul de stabilire a unor obiective personale realiste, care s i ajute s progreseze. d) Evaluarea trebuie s se concentreze asupra peformanelor sau produselor elevului, nu asupra persoanei. e) Interevaluarea trebuie s aib o structur clar: n prim instan trebuie s fie menionate punctele tari din prestaia unui coleg de clas, apoi punctele slabe nsoite de recomandri. Dac se ncepe cu aspectele pozitive ale unei performane sau ale unui produs, feedbackul va fi ntotdeauna receptat ca fiind binevoitor. f) Ori de cte ori este posibil, autoevaluarea i interevaluarea trebuie s se realizeze pe baza unor criterii clare, precizate de ctre profesor. n acest sens, se recomand familiarizarea elevilor cu listele de control i scrile de clasificare, care pot constitui instrumente utile n autoevaluare i interevaluare. g) Dac intenionai s utilizai aceste metode la clas, ncepei ntodeauna cu deprinderea strategiilor de autoevaluare i abia apoi introducei interevaluarea. Elevii care sunt capabili s

i aprecieze realist propriile performane i produse ale activitii sunt mai credibili ca evaluatori ai colegilor i sunt capabili de mai mult acuratee n aprecieri. Literatura romneasc menioneaz printre tehnicile ce pot fi utilizate n autoevaluare scrile de clasificare i chestionarele (Stoica et al., 2001). Scrile de clasificare au fost deja prezentate i evident, se pot utiliza i listele de control care au o structur i mai simpl. n ceea ce privete chestionarele, autorii recomand utilizarea de ntrebri deschise pentru a stimula reflecia asupra aspectelor pozitive i negative n contextul rezolvrii unei sarcini, dar i pentru a ncuraja elevul s identifice autonom modaliti de mbuntire a propriei prestaii (Ce etape am parcurs n realizarea acestei sarcini?; Ce am greit n rezolvarea acestei sarcini?; Ce a putea face pentru a-mi mbunti performana). Dac sunt folosite pentru a obine informaii despre trsturi de personalitate sau de caracter, atitudini etc., chestionarele de autoevaluare includ, de regul, itemi nchii cu rspunsuri msurate pe scale ordinale sau de interval (practic, sunt chestionare care se utilizeaz n context colar n scop formativ i mai puin n scop de cercetare). Printre tehnicile de interevaluare, R. L. Linn i N. E. Gronlund (2000) menioneaz nominalizarea (numit i tehnica Cine e?) i tehnicile sociometrice. Acestea din urm v sunt deja cunocute i nu necesit lmuriri suplimentare. Nominalizarea este o tehnic de interevaluare foarte simpl i se poate folosi pentru copii de orice vrst. Fiecare elev dintr-o clas trebuie s rspund la un set de dou ntrebri, una pozitiv i una negativ, care se refer la descrierea succint a unui comportament; elevul trebuie s indice ce coleg corespunde cel mai bine cu descrierea respectiv. Unii profesori prefer s foloseasc doar descrieri de comportamente pozitive, n timp ce alii opteaz pentru ambele variante. n cazul copiilor de vrst mic, aceast tehnic poate fi introdus sub forma unui joc (Ghici ce copil din grup/clas am descris?) i permite colectarea de informaii cu privire la comportamentele sociale din grupul de elevi sau la caracteristicile personale ale elevilor, dar poate fi folosit i pentru interevaluare n cazul unor caracteristici precum creativitate, gndire critic, abiliti de rezolvare a problemelor. Exemple de ntrebri ce pot fi folosite pentru interevaluare prin tehnica nominalizrii: 1. Cine este cel mai prietenos copil din grup/clas? 2. Cine are ntodeauna curajul de a adresa ntrebri atunci cnd nu nelege ceva? 3. Cine poate s formuleze cu uurin o problem dup o imagine dat? 4. Cine gsete ntodeauna i alt soluie la o problem rezolvat n clas? 5. Cine i mparte ntotdeauna materialele cu colegii? Pentru a obine un tablou general al interevalurilor, profesorul trebuie doar s numere de cte ori a fost nominalizat un copil n asociere cu descrierea pozitiv. Dac acelai copil a fost nominalizat i pentru descrierea negativ, scorul total se calculeaz ca diferen ntre preferine i respingeri. Tehnica nominalizrii are avantajul simplitii i al aplicabilitii la orice vrst. De asemenea, se poate utiliza n condiii de maxim economie de timp. Limita acestei tehnici de interevaluare rezid n excluderea din interevaluare a elevilor timizi sau introvertii, care nu vor fi niciodat nominalizai de colegi pentru c sunt probabil exclui. Att autoevaluarea ct i interevaluarea pot fi utilizate i n combinaie cu alte metode de evaluare, att tradiionale, ct i complementare. De asemenea, ele contribuie la optimizarea relaiilor pedagogice, stimuleaz comunicarea i cooperarea i, n condiiile utilizrii consecvente, conduce la formarea competenelor evaluative la elev, care sunt relevante n procesul de autonomizare al acestuia. Aplicaie

Propunei cinci exemple de ntrebri utilizabile n procesul de interevaluare prin tehnica nominalizrii la vrsta precolar i colar mic. Tem obligatorie 3 Redactai un eseu de 3-4 pagini n care s comparai metodele tradiionale i complementare (alternative) de evaluare. 5. Metode de apreciere 5.1. Notarea Notarea constituie cea mai concret modalitate de apreciere a rezultatelor colare, se realizeaz prin consemnarea n documente colare (catalogul) a unor simboluri (numere sau litere) i comunic celor interesai (profesori, elevi, prini) care este nivelul achiziiilor elevului la un moment dat. Scrile de notare difer de la un sistem educaional la altul i au fost instituite prin tradiie. De exemplu, scara de notare francez are 20 de trepte (20 este nota maxim), scara de notare german are 6 trepte (1 este nota maxim), scara de notare britanic are tot ase trepte, dar simbolurile asociate sunt litere (A, B, C, D, E, F, unde A este nota maxim, iar E i F nu reprezint note de trecere) etc. n sistemul educaional romnesc se aplic dou scri de notare diferite: o scal n patru trepte n nvmntul primar n care notele, numite calificative sunt simbolizate prin litere (FB-foarte bine; B-bine; S-suficient; Iinsuficient) i o scal n 10 trepte n nvmntul secundar i teriar (note de la 1 la 10). Fiecare dintre scrile de notare are avantaje i dezavantaje: scrile cu un numr redus de trepte nu permit diferenieri de nuan ntre rezultatele elevilor, plasnd performane foarte diferite n aceeai categorie, n timp ce scrile de notare care includ o plaj foarte larg de valori sunt dificil de aplicat i necesit eforturi analitice foarte mari din partea evaluatorilor. n general, se accept faptul c scrile cu un numr mai mic de trepte au impact emoional mai puin negativ asupra elevilor. Scrile de notare care utilizeaz alte simboluri dect numerele (cum este i cazul calificativelor din nvmntul primar romnesc) au dezavantajul c nu permit prelucrri ulterioare exacte (de exemplu, calcularea mediei). Pentru a stabili un calificativ semestrial la o disciplin n nvmntul primar, profesorul are dou opiuni: fie indic prin acest calificativ dominanta de-a lungul semestrului, prin simpla calculare a frecvenelor calificativelor obinute de ctre elev, fie nregistreaz prin acest calificativ progresul sau regresul elevului pe parcursul unui semestru. Nici una dintre soluii nu este foarte precis i antreneaz dificulti nu doar n stabilirea calificativelor semestriale, ci i n comunicarea semnificaiei acestora ntr-o form inteligibil pentru elevi i prini. n nvmntul precolar, sunt folosite scri de notare informale care folosesc simboluri precum feele zmbitoare sau triste ( ), imagini ale unor gesturi semnificative pentru rezultate foarte bune, bune i slabe ( ), imagini de diverse culori asociate cu nivele diferite ale performanelor copiilor etc. Acestea sunt cunoscute practicienilor sub numele de stimulente, deoarece ele acoper mai ales funcia de feedback i funcia motivaional a evalurii. Dei opiniile privind utilizarea stimulentelor n nvmntul precolar sunt mprite, considerm c ele trebuie folosite nu doar pentru a acoperi cele dou funcii deja menionate, ci i pentru a-i obinui pe copii cu procesul de apreciere a rezultatelor, pentru a monitoriza progresul acestora i pentru a rspunde funciei sociale a evalurii (mai ales prin comunicare rezultatelor ctre prini, familie etc.). Varietatea stimulentelor utilizate n aprecierea performanelor la precolari depinde de creativitatea profesorului, care are i libertatea de decide numrul de trepte pe care le are n vedere n aplicarea unei scri informale de notare (reinei ns faptul c, pentru vrstele mici se recomand scri de notare cu un numr mic de trepte).

n aprecierea rezultatelor precolarilor se pot folosi listele de control i scrile de clasificare n variante mai precise, eventual nsoite de valori numerice care apoi s fie transformate n calificative informale. Profesorul are i opiunea evalurii calitative prin rapoarte narative n care s prezinte detaliat nivelul achiziiilor precolarului n contrast cu obiectivele educaionale. Acestea pot constitui instrumente de apreciere care s suplineasc notele/calificativele, care nu sunt considerate adecvate cu particularitile vrstei i cu finalitile majore ale nvmntului precolar. Aplicaie Dai exemple de cel puin dou scri informale de notare care pot fi utilizate n nvmntul precolar. Argumentai oportunitatea i utilitatea lor n aprecierea rezultatelor precolarilor. n luarea deciziilor privind notarea elevilor, profesorul trebuie s contientizeze faptul c acestea sunt influenate de caracteristicile i funciile procesului de evaluare (factorii perturbatori propriu-zii vor fi descrii ntr-o seciune distinct a cursului): Evaluarea nu este un proces facil, nici nici din perspectiva evaluatorului, nici din perspectiva evaluatului. Ea necesit eforturi susinute de reflecie, planificare i interpretare. Fiecare profesor i construiete propria filosofie cu privire la evaluare, care este influenat nu doar de experiena sa didactic, ci i de experiena sa de elev, student etc. evaluat. Notarea implic elaborarea unor judeci de valoare cu privire la rezultatele elevului, iar acestea nu au ntodeauna un caracter pozitiv, ceea ce poate genera un anumit disconfort emoional al evaluatorului. Notarea trebuie s fie nsoit ntodeauna de argumente, care s poat fi comunicate ntr-o form accesibil pentru elevi i pentru prini. n multe situaii, simpla consemnare i comunicare a unui calificativ nu este suficient, pentru c nu ofer date relevante pentru nivelul de achiziii al elevului sau despre elementele de referin. Notele pot avea o funcie motivaional foarte puternic, dar profesorul nu trebuie s abuzeze de acest fapt prin supra-aprecierea sau sub-aprecierea rezultatele unor elevi, pentru c poate declana dezechilibre chiar la nivelul relaiilor sociale din clas. Notele sunt importante i n stabilirea calitii activitii profesorului i, de regul, sunt comunicate n forme sintetice factorilor decizionali din domeniul educaional (direciunii colii, inspectoratelor judeene etc.), dar acest fapt nu trebuie s distorsioneze procesul de apreciere a rezultatelor elevilor. n materie de notare, puterea decizional a profesorului este foarte mare, iar opiunea pentru un model sau altul de apreciere depinde n mare msur de percepiile sale subiective asupra actului evaluativ. De aceea, pentru a-i cristaliza opiunile privind aprecierea prin not a rezultatelor elevului, profesorul trebuie s se familiarizeze cu mai multe modele de notare. n acest curs vom prezenta doar o parte dintre aceste opiuni i vom ncerca s sugerm eventualele avantaje sau dezavantaje ale fiecrui model de notare, fr a fi prtinitori i fr a avea pretenia c putem decide obiectiv care este cea mai potrivit pentru nvmntul precolar sau primar. 5.1.1. Notarea analitic i notarea holistic Modelul care evideniaz variantele analitice i holistice (sau globale) de notare a fost difuzat n nvmntul romnesc odat cu reforma sistemului de evaluare i a introducerii evalurilor/examenelor naionale (Stoica et al, 2001), dei lucrarea lui G. de Landsheere tradus n limba romn i publicat n 1975 privind evaluarea curent i examenele descrie modele de notare similare.

Notarea analitic este aplicat mai ales n contextul evalurii formative, atunci cnd accentul cade pe identificarea i analiza erorilor frecvente ale elevilor, n scopul ameliorrii secvenelor educaionale ulterioare. Aceasta presupune descrierea rspunsurilor adecvate pe care elevii ar trebui s le formuleze pentru o sarcin i asocierea fiecrui rspuns corect cu un punctaj. nsumarea simpl a punctajelor conduce la stabilirea unui scor, care i gsete corespondena ntro not. Cel mai important dezavantaj al notrii analitice este acela c profesorul nu poate anticipa toat gama de rspunsuri corecte pe care le poate formula elevul, iar acest fapt poate afecta nota final. n cazul probelor i a testelor docimologice scrise, acest dezavantaj poate fi restrnd prin regndirea schemei de notare dup corectarea a aproximativ 20% dintre lucrri, prin includerea altor variante de rspunsuri corecte ntre cele punctate. Chiar i n aceste condiii, efortul de evaluare este considerabil i trebuie asigurat fidelitatea notrii prin participarea a cel puin doi evaluatori. Notarea holistic sau global se recomand atunci cnd scopul aprecierii este acela de a oferi un feedback asupra naturii erorilor frecvente ale elevului i presupune formarea unei impresii generale asupra unui rspuns i ncadrarea sa ntr-o categorie prestabilit. A. Stoica et al (2001) citeaz un model de notare global elaborat de L. Carey (1998), care presupune parcurgerea a apte etape: a) stabilirea categoriilor de rspunsuri care vor fi utilizate (n cazul nvmntului primar romnesc, logica ar indica stabilirea a patru categorii: foarte bine, bine, suficient, insuficient); b) descrierea comportamentelor pe care elevul trebuie s le demonstreze pentru ca rspunsul su s fie ncadrat n fiecare categorie; c) analiza rapid a tuturor rspunsurilor i formarea unei impresii generale cu privire la calitatea acestora; d) plasarea rspunsurilor ntr-o categorie corespunztoare; e) reanalizarea rspunsurilor incluse n aceeai categorie; f) reluarea procesului de stabilire a categoriilor pentru acele rspunsuri care trebuie plasate ntr-o categorie superioar sau inferioar; g) acordarea aceleiai note pentru toate rspunsurile incluse ntr-o anumit categorie. n aceeai lucrare citat anterior (Stoica et al, 2001) se detaliaz paii c i d prin apelul la opinia lui I.M. Thyne care propune urmtorul algoritm de analiz a rspunsurilor, aplicabil ns numai n cazul probelor i a testelor docimologice scrise: dac profesorul are n vedere cinci categorii n care vor fi plasate rezultatele finale ale elevilor, dup o analiz global a tuturor lucrrilor, va alege iniial cte un model de lucrare pentru fiecare dintre categoriile extreme; n etapa urmtoare, profesorul va izola un model de lucrare pentru categoria de mijloc i, apoi, cte un model pentru categoriile intermediare. Cele cinci modele de lucrri sau teste vor fi apoi folosite care reper n notarea tuturor celorlalte lucrri. Notarea prin calificative este prezentat ca alternativ la notarea analitic i holistic, deoarece presupune formularea coerent a descriptorilor de performan. n fapt, notarea prin calificative poate mbrca fie forma analitic, fie forma holistic, n funcie de opiunea profesorului. Notarea analitic are o dominant criterial, pentru c se centreaz pe o tipologie prestabilit a rspunsurilor corecte, fr a presupune comparaii ntre elevi, n timp ce notarea holistic are conotaii mai degrab normative, datorit faptului c implic o serie de comparaii ntre rspunsurile elevilor. 5.1.2. Notarea subiectiv i notarea obiectiv Lucrarea lui G. De Landsheere Evaluarea continu i examenele (1975) introducea n spaiul educaional romnesc dou modele de notare notarea subiectiv i notarea obiectiv. Notarea subiectiv include "orice apreciere fcut de profesori n mod global, fie imediat dup examinarea performanei elevilor, fie dup ce au cptat o vedere de ansamblu a scorurilor individuale"; "orice not la care s-a ajuns printr-un procedeu ce nu poate fi automatizat" (De Landsheere, p. 122). Aceast modalitate de notare se utilizeaz mai ales n cazul n care s-a apelat la metode de verificare tradiionale sau n cazul testelor care includ doar itemi de tip eseu. Profesorul C. Moise (2007) reunete contribuiile lui De Landsheere i

ale unor autori romni (e.g. Muster, 1970; Popescu, 1978), pentru a descrie patru metode de notare subiectiv: metoda impresiei generale, metoda scrilor de specimene, metoda analitic i metoda determinrii frecvenelor. Metoda impresiei generale are o ndelungat tradiie n spaiul educaional romnesc i const ntr-o apreciere de ansamblu a unui rspuns pentru o sarcin de evaluare i aproximarea imediat a notei. Tradiia didactic a impus o serie de criterii de notare prin impresia general precum volumul i profunzimea cunotinelor pe care le demonstreaz elevul, capacitile de aplicare, analiz, sintez i evaluare a informaiilor asimilate, eventualele elemente de orginalitate din rspunsurile elevilor etc. Acest metod de notare are avantajul economiei de timp i al aplicabilitii pentru toate tipurile de metode de verificare, fie tradiionale, fie complementare. Evident, dezavantajul major al notrii prin impresia global este acela c deschide larg poarta subiectivitii evaluatorului i tuturor factorilor perturbatori. Metoda scrilor de specimene const n identificarea unor modele sau specimene de lucrri care sunt utilizate ca reper de ordin cantitativ i calitativ n evaluarea tuturor celorlalte lucrri. Acest metod de notare a fost anterior prezentat n asociere cu notarea holistic, aa cum este descris de A. Stoica et al (2001). n practica evaluativ se prefer opiunea pentru cinci categorii de lucrri, care vor constitui repere n notarea prin comparaie a tuturor celorlalte. Avantajul acestei metode ar consta n faptul c permite o ierarhizare acceptabil a elevilor pe baza calitii rspunsurilor, ns limitele sunt de asemenea demne de luat n considerare: scrile de specimene pot fi utilizate doar pentru notarea probelor scrise; lucrrile elevilor sunt uneori imposibil de comparat deoarece sunt structurate n manier diferit; evaluatorul are tendina de a se concentra doar asupra notelor comune din lucrrile elevilor i pierde din vedere aspectele originale sau menionate doar de un numr restrns de elevi; de asemenea, erorile care nu sunt suficient de frecvente n lucrrile elevilor sunt, de regul, ignorate, iar acest fapt conduce supraaprecierea unor elevi. Metoda analitic a fost anterior prezentat din perpectiva lui A. Stoica i a colaboratorilor si (2001) i presupune descrierea calitilor fiecrui tip de rspuns asociat cu o not. G. de Landsheere (1975) descrie un model de notare al lucrrilor de tip compunere la limba matern, care include aptesprezece factori grupai n patru categorii: forma exterioar a lucrrii (lizibilitatea, estetica, prezentarea); folosirea limbii (corectitudinea ortografic, exactitatea morfologic, corectitudinea sintactic, caracterul propriu al limbajului, stilul); coninutul i organizarea expunerii (structura expunerii, bogia de idei, pertinena ideilor, precizia informrii, gradul de completitudine); aspecte personale ale lucrrii (originalitate, maturitate, imaginaie). Alte exemple de scheme de notare analitic pot fi identificate prin consultarea subiectelor pentru evalurile i examenele naionale, n special pentru itemii de tip eseu. Ele sunt cunoscute i sub denumirea de bareme de corectare i de notare. Notarea analitic permite profesorului s controleze n mai mare msur tendinele subiective, chiar dac nu toi indicatorii inclui n schemele de corectare i de notare pot fi formulai foarte precis. n plus, notarea analitic asigur o bun fidelitate a evalurii realizat de doi sau mai muli evaluatori competeni, pentru c presupune raportarea la acelai set de criterii, de exigene, iar variabilitatea interpersonal a evaluatorilor este astfel diminuat. Metoda determinrii frecvenelor este plasat de De Landsheere la limita dintre notarea subiectiv i cea obiectiv i se poate realiza prin dou procedee: fie acordarea notei pe baza nsumrii aspectelor pozitive proiectate de ctre profesor n raport cu obiectivele educaionale, fie scderea unui numr de puncte pentru fiecare greeal, dup ce profesorul a stabilit tipologia erorilor posibile n realizarea unei lucrri. n primul procedeu, se pornete de la nota minim i se acord puncte pe msur ce se descoper n lucrarea elevului aspectele pozitive anticipate de ctre profesor, iar n al doilea procedeu reperul este nota maxim din care se scad puncte pentru fiecare eroare. Studiile au pus eviden faptul c profesorii au

tendina de a scdea cu mult uurin puncte i de a acorda cu greutate puncte n plus. De aceea, se recomand utilizarea complementar a celor dou procedee de notare prin determinarea frecvenelor, pentru a anula cele dou efecte. Notarea obiectiv este considerat cea mai adecv modalitate de apreciere a rezultatelor elevului i poate ilustra cel mai realist prestaia acestuia. Ea const n atribuirea unor valori numerice pentru comportamente riguros delimitate i, de aceea, permite o fidelitate interevaluatori ridicat (De Landsheere, 1975). Obiectivitatea notrii emerge, aadar din modul de proiectare al probelor de evaluare, fiind cu certitudine mai ridicat n cazul testelor docimologice alctuite n special din itemi obiectivi, care pot fi notai cu mare precizie. Un caz special este cel al testelor docimologice standardizate, care sunt diponibile n unele sisteme educaionale (vezi cazul testelor docimologice americane, care au o ndelungat tradiie). n cazul evalurii criteriale, notarea obiectiv presupune derivarea riguroas a indicatorilor de notare din standardele de performan, care, la rndul lor sunt proiectate n raport cu obiectivele cadru. Astfel, notarea obiectiv n situaiile de evaluare criterial pare mai plauzibil n cazul examinrilor de la finalul unui ciclu colar. Cu toate acestea, standardele de perfoman pot fi utilizate ca reper n formularea obiectivelor i a descriptorilor de performan vizai n evalurile sumative de mai mic amploare pe care le poate utiliza profesorul la clas. n contextul evalurii normative, notarea obiectiv impune determinarea poziiei relative a fiecrei note, prin comparaie cu notele obinute la aceleai probe de toi elevii examinai. Nu vom detalia aici aspectele statistice ale notrii obiective, pentru c vom reveni asupra acestor aspecte n prezentarea modelului de notare normativ. 5.1.3. Notarea criterial, notarea normativ i notarea n raport cu progresul individual O clasificare complementar a modelelor de apreciere face distincia ntre notarea criterial, notarea normativ i notarea n raport cu progresul individual. Notarea criterial (supranumit i notarea n standarde absolute Linn i Gronlund, 2000; Nitko, 2001) presupune compararea rezultatelor elevului cu repere absolute riguros elaborate, fie la nivel naional, fie la nivelul colii sau al clasei. n cazul evalurilor naionale, criteriile de comparaie sunt standardele de performan incluse n programele colare, n timp ce evalurile sumative la clas au drept criteriu obiectivele educaionale i descriptorii de performan care sunt eleborai de ctre profesor. Evaluarea criterial nu are ns sens dect n cazul n care probele de evaluare sunt proiectate n strns corelaie fie cu standardele de performan, fie cu obiectivele i descriptorii de performan, fapt evideniat n acea matrice de specificaii pe care am prezentat-o ca etap de elaborare a testului docimologic. La aceast exigen, se adaug necesitatea utilizrii consecvente a obiectivelor educaionale n proiectarea didactic, dar i ca reper n feedbackul formativ pentru elevi. Dei standardele de perfoman pentru elevi i descriptorii de performan au ptruns n nvmntul primar ncepnd cu anul colar 1998/1999, puine lucrri de teoria evalurii abordeaz aceast problematic, iar relaia dintre ele este aproape complet ignorat. De aceea, alocm cteva paragrafe pentru a explica aceste detalii care, n opinia noastr, sunt cruciale n nelegerea notrii criteriale care este promovat n evaluarea romneasc prin toate msurile de reform din ultimul deceniu. Standardele educaionale, n general, au fost elaborate i revizuite n contextul mai larg al unui sistem integrat de asigurarea a calitii n educaie. Termenul de standard este incontestabil legat de ideea construirii sistemelor de control i asigurare a calitii. n sistemul educaional romnesc, drumul standardelor educaionale este mai mult dect sinuos, ele aprnd izolat unele de altele i nefiind nici n prezent prea bine interconectate n procesul de control i asigurare a calitii, aa cum este acesta conceput i realizat (n conformitate cu prevederile legale n vigoare).

Fr a avea pretenia unei cronologii exacte, menionm c standardele profesionale pentru cadrele didactice din nvmntul primar i cele pentru profesorii de matematic au fost printre primele elaborate i lansate, ca rezultat al unor procese decizionale relativ ndelungate (Gliga, 2002). Aproximativ n aceiai perioad, au fost elaborate i ataate programelor colare (iniial, doar pentru nvmntul primar) standardele de performan pentru elevi. n ultimii ani, Agenia de Asigurare a Calitii n nvmntul Preuniversitar (ARACIP) a lansat standardele, indicatorii i descriptorii de evaluare a calitii n instituiile educaionale. Dei aceste categorii de standarde nu sunt nc corelate suficient i dau impresia de puzzle incomplet, apariia fiecreia dintre categorii a marcat un pas nou n conturarea unui demers evaluativ multidimensional n nvmntul romnesc. Dei standardele de performan pentru elevi n nvmntul primar sunt lansate de civa ani, utilizarea lor n evaluare este nc deficitar, nefiind ntotdeauna asociat cu elaborarea indicatorilor de evaluare i a descriptorilor de performan. Este i situaia standardelor de performan pentru nvmntul secundar, care ar trebui asociai unor indicatori i apoi cu criterii de notare elaborate de profesori. Credem c situaia poate fi explicat prin relaionarea standardelor de performan cu finalul unui ciclu de nvmnt i cu evaluarea extern: cadrele didactice consider c aceste standarde nu orienteaz activitatea didactic curent i nu exist obligativitatea raportrii la acestea n evaluarea formativ sau n cea sumativ de mai mic amploare. Este adevrat c standardele de performan sunt susceptibile de utilizare direct mai ales n situaiile de evaluri i examene naionale, n circumstane de evaluare extern. Nu e mai puin adevrat c obiectivele pentru o secven de evaluare sumativ dup parcurgerea unei uniti de nvare sau a unei discipline ntr-un an colar, de exemplu, trebuie proiectate n perspectiva standardelor de performan. Ele nu sunt vizate direct n evaluarea la clas, dar, ca i obiectivele cadru i cele de referin, trebuie avute permanent n vedere. O analiz a documentelor n care sunt precizate standardele de performan (programele colare n vigore i documentele SNEE cu privire la standardele de evaluare) ilustreaz faptul c persist nc o serie de incongruene. Exemplificm aceast afirmaie cu o analiz comparativ a standardelor de performan aa cum sunt prezentate n Programa colar pentru matematic, clasa a IV-a (2005) i n documentul SNEE privind Standardele de evaluare la clasa a IV-a, a VIII-a i a XII-a (2003).
Extras din Programa colar pentru Matematic, 2005 Obiectiv cadru 1. Cunoaterea i utilizarea conceptelor specifice matematicii Standard S1. Scrierea, citirea, compararea i ordonarea numerelor naturale mai mici dect 1 000 000; S2. Folosirea corect a terminologiei matematice nvate n contexte variate; S3. Utilizarea fraciilor pentru a exprima subdiviziuni ale ntregului n contexte variate; S4. Efectuarea de opera ii de adunare i scdere cu numere naturale mai mici sau egale cu 1 000 000; S5. Efectuarea de opera ii de nmulire i mprire cu numere naturale mai mici sau egale cu 1 000 folosind operaiile aritmetice nvate; S6. Recunoaterea, reprezentarea i clasificarea dup proprieti simple a unor forme plane i spaiale; S7. Utilizarea de reguli i corespondene pentru formarea de iruri; S8. Realizarea de estimri n situaii practice; S9. Utilizarea unor raionamente aritmetice n rezolvarea unor situaii problem

2. Dezvoltarea capacitilor de explorare/investigare i rezolvare de probleme

3. Formarea i dezvoltarea capacitii de a comunica utiliznd limbajul matematic

S10. Compunerea i rezolvarea de probleme care presupun efectuarea a cel mult trei operaii S11. Utilizarea unitilor de msur neconvenionale i convenionale n contexte variate S12. Utilizarea instrumentelor de msur pentru msurarea i compararea timpului, a masei, lungimii i capacitii unor obiecte S13. Utilizarea unor modaliti simple de organizare i clasificare a datelor S14. Exprimarea oral i scris, ntr-o manier concis i clar, a modului de lucru n rezolvarea de exerciii i probleme

Dei n general menioneaz aceleai standarde de performan, cu acelai coninut, documentul SNEE (2003) prezint mai puine standarde de performan pentru elevi (12), formulate n manier diferit i nsoite de indicatori de evaluare pentru nivelul minim i maxim.
Exemplu de indicatorii de evaluare pentru standadrul S1: S scrie, s citeasc i s poziioneze pe ax numere mai mici dect 1 000 000. Minim Maxim S scrie, dup dictare, numere naturale mai mari dect 100 000. S scrie cu cifre, cu numere scrise cu litere, cnd acestea are la toate ordinele cifre diferite de zero. S poziioneze pe ax numere naturale mai mici dect 100 000. S scrie dup dictare, cu cifre i litere, numere naturale pn la 1 000 000, la care trebuie poziionate mai multe zerouri n interior, pentru a marca absena a 2-3 ordine consecutive sau clase, respectnd corectitudinea elementelor grafice S poziioneze pe ax numere naturale pn la 1 000 000.

Analiznd doar aceste exemple, putem constata o serie inadvertene: n program standardele de performan sunt exprimate n termeni apropriai celor utilizai n elaborarea obiectivelor cadru, n timp ce documentul SNEE propune o formulare mai aproape de cea specific obiectivelor de referin. De asemenea, coninutul standardului S1 prezentat n ambele variante nu este acelai, cel inclus n documentul SNEE excluznd citirea i compararea numerelor naturale pn la 1 000 000. Aceste diferene adugate lipsei de informare cu privire la standardele de performan, pot genera confuzii i erori, cu impact asupra evalurii curente. Unul dintre obiectivele cadru nu se regsete n lista celor asociate cu standarde de performan, n nici unul dintre cele dou documente. Este vorba despre obiectivul cadru corespunztor domeniului afectiv - dezvoltarea interesului i a motivaiei pentru studiul i aplicarea matematicii n contexte variate. Aceast observaie ilustreaz o afirmaie bine documentat n literatura pedagogic cu privire la limitele standardelor de performan, care nu pot surprinde aspectele non-cognitive ale evoluiei elevilor. Aceast analiz nu este orientat de intenii maliioase (precizm c nu este un caz izolat de nepotrivire a variantelor de prezentare a standardelor de performan), ci de nevoia de dezbatere deschis asupra standardelor de performan i de ilustrare a procesului de elaborare a acestora, care s faciliteze nelegerea i aplicarea lor de ctre cadrele didactice. Standardele de performan trebuie s se regseasc n toate documentele care orienteaz activitatea de evaluare. n ceea ce privete forma de exprimare a standardelor de performan, considerm c trebuie s devin unitar, iar cea mai potrivit n opinia noastr este elaborarea lor mai aproape de obiectivele de referin/competenele specifice, dei prin coninut ele se

raporteaz la obiectivele cadru/competenele generale. Astfel, ele ar sugera mai evident comportamentele care ar trebuie s constituie obiectul evalurii. Pentru a exemplifica modul de utilizare a standardelor de performan n evaluarea sumativ de la finalul cilcului primar, prezentm un fragment din raportul tehnic cu privire la evaluarea naional din anul 2007, secven care ilustreaz gradul de performare al obiectivelor i, respectiv, al standardelor la disciplina matematic (cu alte cuvinte, proporia de elevi care a atins obiectivele, care au fost ilustrate prin itemi corespunztori n testul de matematic), n rndul elevilor inclui n eantion (MECT i CNCEIP, Evaluarea naional la finalul clasei a IV-a. Raport Tehnic, 2007, p. 76):
Standarde de performan S1. Scrierea, citirea, compararea i ordonarea numerelor naturale mai mici dect 1 000 000 Obiective de evaluare O01. Citirea numerelor naturale mai mici dect un milion exprimate n litere i cifre O02. Compararea numerelor naturale mai mici dect un milion O03. Ordonarea numerelor naturale mai mic dect un milion Grad de performare 69,2% 79,3% 62,5%

Aceast modalitate de a raporta rezultatele elevilor la standardele de performan i la obiectivele corespunztoare ilustreaz foarte bine ideea central a modelului de notare criterial. Dei cunoaterea standardelor de performa este important n perspectiva evalurilor sumative care acoper obiective cu caracter general i coninuturi vaste, evaluarea curent i cea sumativ care vizeaz secvene didactice mai mici impune profesorului pentru nvmntul primar cunoaterea procedeelor de elaborare i utilizare a descriptorilor de performan. Descriptorii de performan constau n formulri, descrieri, explicaii organizate n manier ierarhic, cu privire la performanele ateptate din partea elevilor aflai n situaii de evaluare (Stoica et al, 2001). Performana anticipat a elevului este conceput i exprimat n termeni realizabili n clas, avnd n vedere antecedentele didactice relevante. Descriptorul de performan se concretizeaz ntr-o scal de apreciere care argumenteaz o judecat de valoare a profesorului. Fiecrui obiectiv (nu fiecrui item dintr-un test, aa cum eronat se procedeaz n unele cazuri) i corespunde un descriptor de performan, care ilustreaz nivelele de performan corespunztoare calificativelor foarte bine, bine, suficient (de regul, nu se formuleaz descrieri ale rspunsului pentru calificativul insuficient/nesatisfctor). Exemplu. S presupunem c proiectm o prob de evaluare oral, sumativ pentru finalul unitii de nvare Adunarea i scderea numerelor naturale n concentrul 0-1000. Unul dintre obiectivele de evaluare (care nu este un obiectiv operaional, pentru c se refer la o ntreag unitate de nvare) pe care dorim s le verificm prin proba de evaluare este formulat astfel: S efectueze corect operaii de adunare i de scdere cu i fr trecere peste ordin, cu numere naturale n concentrul 0-1000. Pentru a verifica ndeplinirea acestui obiectiv de ctre un elev considerm c sunt necesare cinci sarcini de lucru distincte, pe care le vom include n proba de evaluare: 1. Rezolvarea prin calcul mintal a unei adunri cu numere naturale de la 0 la 1000, fr trecere peste ordin 2. Rezolvarea prin calcul mintal a unei scderi cu numere naturale de la 0 la 1000, fr trecere peste ordin 3. Rezolvarea prin calcul scris a unei adunri cu trecere peste ordin 4. Rezolvarea prin calcul scris a unei scderi cu trecere peste ordin

5. Rezolvarea n scris unui exerciiu care include o serie de adunri i scderi cu/fr trecere peste ordin. Descriptorul de performan pentru acest obiectiv ar putea fi n manier foarte simpl, printr-o exprimare cantitativ a performanei ateptate n raport cu fiecare calificativ: Foarte bine Elevul trebuie s rezolve corect toate cele cinci sarcini de lucru Bine Elevul trebuie s rezolve corect patru dintre cele cinci sarcini de lucru Suficient Elevul trebuie s rezolve corect trei dintre cele cinci sarcini de lucru Aceast manier de formulare a unui descriptor de performan nu este complet eronat, dar nu ofer indicii calitative despre nivelul de performan asociat cu fiecare calificativ. Este recomandabil ca descriptorii de performan s combine sau s alterneze explicaiile cantitative cu cele calitative, pentru a nu genera erori n aprecierea elevilor. Dac se utilizeaz doar exprimri cantitative ale descriptorilor de performan, se poate ajunge la situaii absurde n care un elev care a rezolvat corect o sarcin dificil, dar a greit la o sarcin uoar obine acelai calificativ ca un elev care a rezolvat sarcina uoar, dar nu i pe cea dificil. Iat cum s-ar putea reformula n manier calitativ descriptorul de performan pentru obiectivul din exemplul nostru: Foarte bine Elevul trebuie s rezolve corect toate sarcinile de lucru, verbaliznd procedura de rezolvare a exerciiilor care sunt rezolvate n scris, fr ajutor din partea profesorului Bine Elevul trebuie s rezolve corect sarcinile de lucru, cu erori pe care este capabil s le corecteze cu ajutorul profesorului Suficient Elevul trebuie s rezolve corect exerciiile de calcul mintal i un exerciiu n scris, chiar n condiiile n care are nevoie de ajutor substanial din partea profesorului. Argumentele introducerii descriptorilor de performan n asociere cu calificativele n nvmntul primar graviteaz n jurul urmtoarelor idei: utilizarea acestora are un potenial formativ mai ridicat dect scara de notare n zece trepte; informarea elevilor cu privire la obiective i descriptori de performan stimuleaz dezvoltarea capacitilor metacognitive i de autoevaluare; contribuie la creterea transparenei i, implicit, a credibilitii evalurii colare; stimuleaz centrarea pe obiective i competene i nu pe coninuturi; sunt mai adecvate vrstei colare mici, deoarece nuanele normative sunt reduse la minimum; n timp, pot contribui la stabilirea unui consens ntre evaluatori i la dezvoltarea unei culturi evaluative (Stoica et al, 2001). Aplicaie Elaborai cel puin cinci descriptori de performan, pentru tot attea obiective ale unor probe de evaluare pentru discipline diferite. Reflectai la dimensiunile cantitative i calitative incluse n formularea descriptorilor. Notarea normativ este util i recomandat mai ales n situaiile n care numrul elevilor evaluai este foarte mare, iar poziia relativ a rezultatului obinut de fiecare elev n comparaie cu performanele celorlali consituie scopul administrrii unei probe (ceea sugereaz i importana ierarhizrii, uneori n scopuri de selecie pentru un program de studii). Aceste condiii nu sunt ndeplinite dect n evalurile i examinrile cu caracter naional, n cazul concursurilor colare sau n cazul administrrii de teste standardizate. Acestea din urm nu sunt instrumente de evaluare cu tradiie n coala romnesc, aadar nu ne putem atepta la elaborarea unor asemenea teste n viitorul apropiat. De asemenea, notarea normativ este realizat mai riguros n cazul probelor scrise. n cazul evalurii la clas, se pot utiliza procedee simple de notare normativ (Linn i Gronlund, 2000; Nitko, 2001) prin raportare la rangul percentil al scorurilor obinute de ctre

fiecare elev, la cvartile sau prin calcularea scorurilor standardizate z (toate aceste procedee statistice v sunt cunoscute de la cursul de Metodologia cercetrii pedagogice). Exemplu. Pentru a exemplifica utilizarea rangului percentil i a cvartilelor n notarea normativ la clas, vom utiliza rezultatele ipotetice obinute de 20 de elevi la un test pentru diciplina tiine (scorul maxim posibil pentru ntreg testul este 100).
Frecvena absolut cumulat (fc) 1 2 3 5 6 7 9 10 11 12 13 15 17 18 19 20 Rezultat la testul de tiine Frecvena Frecvena relativ relativ (fr) cumulat (frc) 0,05 0.05 0,05 0,10 0,05 0,05 0,10 0,05 0,05 0,05 0,05 0,10 0,10 0,05 0,05 0,05 1,00 0,05 0,10 0,15 0,25 0,30 0,35 0,45 0,50 0,55 0,60 0,65 0,75 0,85 0,90 0,95 1,00 Frecvena relativ procentual (fr %) 5.0 5.0 5.0 10.0 5.0 5.0 10.0 5.0 5.0 5.0 5.0 10.0 10.0 5.0 5.0 5.0 100.0 Frecvena relativ cumulat procentual (frc %) 5 10 15 25 30 35 45 50 55 60 65 75 85 90 95 100

Scoruri 43.00 57.00 65.00 68.00 69.00 72.00 76.00 79.00 82.00 85.00 86.00 88.00 92.00 97.00 99.00 100.00 Total

Frecvena absolut (fa) 1 1 1 2 1 1 2 1 1 1 1 2 2 1 1 1 20

Iat cum putem folosi rangul percentil n interpretarea rezultatului obinut de un elev, care a obinut 72 de puncte la acest test: elevul a obinut un scor care l plaseaz ntre ultimii 35% dintre elevi i n jumtatea inferioar a clasamentului sau 30% dintre elevii evaluai au obinut un scor mai mic dect elevul n cauz. Putem asocia rangurile percentile cu sistemul de calificative, dup o schem pe care o considerm oportun avnd n vedere scopul administrrii probei i vrsta elevilor. Utilizarea curbei normale pentru a fora o anumit distribuie a calificativelor nu este indicat, deoarece niciodat rezultatele unei clase de elevi nu se vor apropia suficient de mult de aceasta. Putem folosi ns scheme de coresponden ntre rangul percentil i calificative, care s ilustreze mai degrab experiena noastr didactic dect reguli clare. Dei procedeul este prezentatat n literatura pedagogic internaional, se admite c aceste scheme sunt arbitrare i depind n mare msur de competena cadrului didactic. Iat un exemplu de asemenea schem care s ne ajute n notare: Ranguri percentile Calificativ 100-81 Foarte bine 80-31 Bine 30-11 Suficient Pn la 10 Insuficient Aadar, ultimii 10% dintre elevi vor obine calificativul insuficient, cei care au obinut scoruri care i plaseaz ntre rangul percentil 11 i 30 vor obine calificativul suficient, cei ntre rangul percentil 31 i 80 vor obine calificativul bine, iar cei care au scoruri cuprinse ntre rangul percentil 81 i 100 vor obine foarte bine. Observai c dei pare o modalitate de notare riguroas,

utilizarea rangului percentil n acest manier este arbitrar i este influenat de ntreaga filozofie a profesorului n legtur cu evaluarea. Un alt procedeu de evaluare normativ const n utilizarea cvartilelor; pe baza acestora se poate acorda calificativul foarte bine elevilor care au obinut primele 25% dintre scoruri i calificativul insuficient celor care au obinut ultimele 25% dintre scoruri. Cvartila doi, care este chiar mediana, constituie pragul ntre calificativele bine i suficient. Dac ncercm s acordm calificative elevului care a obinut 72 de puncte la test folosind rangul percentil i schema de transformare propus, acesta ar fi apreciat cu bine, acelai calificativ fiind valabil i n cazul utilizrii cvartilelor. Dac lum ns n considerare un elev care a obinut scorul 65, folosind rangul percentil i schema de coresponden i-am acorda calificativul suficient, dar dac am folosi procedeul cvartilelor ar obine calificativul insuficient. Pe baza acestei scurte exemplificri, putem concluziona c utilizarea cvartilelor poate conduce la creterea numrului de elevi care obine calificativele insuficient i suficient (practic, jumtate dintre ei s-ar afla n aceast situaie, ceea ce ar fi greu de acceptat i pentru profesor, dar i pentru elevi, prini etc.). Indiferent ce procedeu de notare normativ am utiliza dezavantajul su major n raportare cu notarea criterial nu se dilueaz: n cazul notrii normative ntotdeauna vor exista elevi care vor nregistra eec cloar, n sensul c nu vor obine calificativul de trecere; n cazul n care se utilizeaz notarea criterial, exist posibilitatea ca nici un elev s nu fie n situaia de a obine calificativul insuficient. Notarea n raport cu progresul individual presupune compararea nivelului de achiziii al elevului de la un moment dat cu performanele sale anterioare, n special cele obinute la evalurile iniiale (Nitko, 2001). Avantajele acestui model de notare includ descurajarea competiiei ntre elevi pentru obinerea anumitor calificative, motivarea elevului pentru a continua s progreseze, ncurajarea celor mai slabi elevi dintr-o clas. Limitele notrii n raport cu progresul individual in de factorii subiectivi care influeneaz aprecierea profesorului, de nevoia de a cunoate i de a comunica celor interesai progresul elevilor n raport cu obiectivele i standardele de performan, de lipsa de precizie n ierarhizarea elevilor, de aprecierea constant a efortului i ignorarea comportamentului observat sau a calitii produselor activitii. n plus, abordnd acest model de notare strict statistic, progresul elevilor cu un nivel ridicat de achiziii iniiale va fi ntodeauna mai mic dect progresul celor cu un nivel foarte sczut al performanelor iniiale. n consecin, notarea constant n raport cu progresul individual va conduce la situaia paradoxal n care elevii cu cele mai bune performane pot obine calificative mai slabe dect cei cu cele mai slabe performane. Aceast nu nseamn c acest model de notare nu poate fi utilizat ocazional n notarea elevilor, n scopul de motiva, de a ncuraja progresele viitoare, ci doar c asemenea decizii trebuie luate cu precauie i cu temei. Aprecierea prin not presupune cunoaterea de ctre profesor a unui numr rezonabil de modele, metode i procedee. Indiferent care sunt opiunile noastre n evaluarea la clas, ar trebui s comunicm transparent elevilor, prinilor, altor factori interesai care sunt argumentele noastre n acordarea unui calificativ. n absena notrii, evaluarea n-ar constitui o miz att de important n raporturile profesorului cu elevii i prinii, iar cadrele didactice trebuie s contientizeze nevoia de rigoare n aprecierea rezultatelor elevilor. Tem de reflecie ncercai s comparai modelele de notare prezentate n curs i s le identificai pe cele care sunt compatibile i pe cele care se exclud reciproc. 5.2. Aprecierea verbal const ntr-un feedback pe care profesorul l formuleaz n legtur cu performanele unui copil care poate avea fie nuane pozitive, fie nuane negative. Orice aprecierea

verbal trebuie s surprind n egal msur efortul copilului de a rezolva o sarcin i procesul rezolutiv, dar i calitatea produsului final al activitii, a performanei demonstrate. Este o metod de apreciere important mai ales n nvmntul precolar, deoarece profesorul nu dispune de calificative pentru a sanciona rezultatele copiilor, iar stimulentele nu au semnificaie n absena aprecierilor verbale care s le clarifice. Aprecierea verbal se utilizeaz i n nvmntul primar, fie n combinaie cu un calificativ, fie ca feedback formativ cu rol motivaional pentru elev. 6. Erori (factori perturbatori) n evaluarea elevilor Toate lucrrile dedicate problematicii evalurii colare includ un capitol sau un paragraf destinat prezentrii erorilor frecvente, care afecteaz aprecierea rezultatelor obinute de ctre un elev (e.g. De Landsheere, 1975; Radu, 1981; Moise, 2007; Cuco, 2008). Deoarece v-ai familiarizat anterior cu erorile posibile n evaluare n cadrul cursului de Psihologia educaiei, le vom trece n revist sintetic pe cele mai frecvente i vom ncerca s sugerm msuri care ar putea reduce efectele acestora. Efectul halo const n tendina de a raporta rezultatele elevului la percepia global asupra abilitilor sale i se traduce att n favorizarea elevilor cu rezultate n general bune, ct i n defavorizarea elevilor despre care profesorul consider c sunt slabi. Cu alte cuvinte, profesorul fie supraapreciaz, fie subapreciaz rezultatele unui elev, generaliznd elemente ale percepiei sale globale (un elev bun care obine o performan slab n rezolvarea unei sarcini va fi suprapreciat, n timp ce un elev slab care obine o performan ridicat va fi subapreciat). Un efect asociat este cel oedipian sau efectul Pygmalion, care poate fi ilustrat printr-o atitudine inflexibil a evaluatorului fa cel evaluat, datorat unei preconcepii despre posibilitile, abilitile sau peformanele acestuia. Efectul de ordine se concretizeaz n modificri ale notelor obinute de ctre cei evaluai, datorate plasrii cronologice diferite a rspunsurilor sau lucrrilor. Acest fapt se datoreaz att unor variabile care in de subiectivitatea evaluatorului (pe msur ce nainteaz n procesul de evaluare intervine oboseala i un anumit sentiment de saturaie), ct i lipsei unor repere riguroase n apreciere. Este binecunoscut faptul c la nceputul unei probe orale sau la debutul activitii de corectare a lucrrilor scrise notarea este mai precis, chiar mai exigent, iar la finalul evalurii examinarea rspunsurilor este mai sumar, iar notarea mai generoas. Un efect similar este cel de contrast, n sensul c un rspuns evaluat dup un altul considerabil mai bun va fi subapreciat, iar o performan slab va fi suprapreciat dac urmeaz dup o prestaie i mai slab. Infidelitatea examinatorului fa de sine este un alt efect documentat n literatura pedagogic i genereaz diferene mari n aprecierea unor lucrri care sunt recorectate dup un interval de timp de ctre acelai profesor, n condiiile n care acesta nu este prevenit asupra acestei situaii. Tendina spre valoarea central const n preferina evaluatorului pentru aprecierile moderate i evitarea notelor extreme. Aceasta ar putea fi complementar tendinei de a nota n concordan cu o curb normal, care presupune utilizarea ntregii game de note n conformitate cu procentajele specifice distribuiei gaussiene (Moise, 2007). Ecuaia personal a fiecrui evaluator constituie un factor perturbator major, unii avnd tendina de a fi exagerat de exigeni, n timp ce alii sunt exagerai de indulgeni n notare. Efectul ecuaiei personale este mai vizibil n cazul probelor scrise i a testelor cu itemi de tip eseu la discipline care presupun i prezentarea argumentat a unor puncte de vedere diferite. Prudena examinatorilor const n subaprecierea rezultatelor colare la nceputul unui semestru sau an colar din teama de a nu i ndemna pe elevi la o atitudine negativ fa de pregtirea continu n cazul n care ar obine note mari. Acest efect funcioneaz ns i n

sens pozitiv, n situaia n care un profesor suprapreciaz rezultatele elevilor la nceputul colaborrii, pentru a fi sigur c nu va i va dezavantaja n condiiile n care nu i cunoate foarte bine. Pentru a reduce impactul factorilor perturbatori asupra aprecierii rezultatelor colare se pot imagina demersuri variate, dar efectul acestora este dificil de estimat. Pentru a crete obiectivitatea notrii, ar trebuie s se opteze pentru alte modele, metode i tehnici dect tehnica impresiei globale care las loc de manifestare tuturor factorilor perturbatori. Aceast metod de notare nu poate fi ns ntotdeuna evitat i, pentru a reduce distorsiunile n apreciere, se poate apela la doi sau mai muli evaluatori competeni pentru a anula efectul subiectivitii personale. n situaiile n care nu se poate apela la doi evaluatori, se recomand utilizarea testelor docimologice cu itemi obiectivi i semiobiectivi, cu scheme de corectare i de notare clare, care nu permit abateri mari. Baremele de corectare i de notare ar trebui s fie comunicate elevilor nainte de rezolvarea unei probe, astfel nct acetia s se poat autoevalua. n plus, dac exist posibilitatea de a solicita corectarea unei lucrri de ctre doi evaluatori, acetia ar trebui s ajung la un acord n privina baremului de corectare i de notare. O alt sugestie de cretere a obiectivitii n notare const n utilizarea frecvent a notrii analitice, mai ales pentru probele scrise de tip compunere sau eseu, astfel nct s se evite aprcierea global a lucrrilor n absena unor repere clare. Pentru a reduce impactului efectului halo i a celui oedipian se poate opta pentru asigurarea anonimitii lucrrilor, dar acest lucru nu este posibil dect n cazul evalurilor externe. Cea mai simpl i cea mai eficient cale de a reduce efectele perturbatoare n aprecierea rezultatelor elevului rmne pregtirea temeinic a profesorilor n domeniul evalurii. Pe msur ce profesorii sunt mai familiarizai cu ntreaga gam de metode de verificare i de apreciere pe care le au la dispoziie i contientizeaz mai clar avantajele i limitele fiecrei strategii evaluative, ansele de apropiere de dezideratul obiectivitii cresc. Tem de reflecie ncercai s identificai i alte modaliti de control a factorilor perturbatori n evaluare. Explicai care dintre efectele perturbatoare ar fi atenuate.

BIBLIOGRAFIE Anastasi, A. (1976). Psychological testing, Ediia a IV-a, McMillan Publishing Co., New York Ausubel, D., Robinson, F. (1981). nvarea n coal. O introducere n psihologia pedagogic, Editura Didactic i Pedagogic, Bucureti Best, J. W. (1977) Research in education, Prentice-Hall Inc., New Jersey Cerghit, I., (2002). Sisteme de instruire alternative i complementare, Editura Aramis, Bucureti Creu, C., (1999). Teoria curriculumului i coninuturile educaiei, Editura Universitii Alexandru Ioan Cuza", Iai Crocker, L., Algina, J. (1986). Introduction to classical and modern test theory, Holt, Rinehart and Winston Inc., Orlando Cuco C. (2000). Pedagogie, Editura Polirom, Iai Cuco, C. ( 2008). Teoria i metodologia evalurii, Editura Polirom, Iai Cuco, C. (2002). Pedagogie, Ediia a II-a, revzut i adugit, Editura Polirom, Iai De Landsheere, G. (1975). Evaluarea continu a elevilor i examenele, Editura Didactic i Pedagogic, Bucureti De Landsheere, V., De Landsheere, G. (1979). Definirea obiectivelor educaiei, Editura Didactic i Pedagogic, Bucureti Downing, S. M., Haladyna, T. M. (eds.) (2006). Handbook of Test Development, Routledge, London Evans, J.D. (1985). Invitation to psychological research, CBS College Publishing, New York Gall, M.D., Gall, J.P., Borg.W.R. (2007). Educational research: an introduction, 8th Edition, Pearson Education, Inc., Boston Gallagher, J.D. (1998). Classroom Assessment for Teachers, Prentice-Hall Inc., New Jersey Gliner, J.A., Morgan, G. A. (2000). Research Methods in Applied Settings: An Integrated Approach to Design and Analysis, Lawrence Erlbaum Associates, New Jersey Jinga, I. (1996). Jinga, I., Istrate, E. (1998). Karmel, L.J., Karmel, M.O. (1978). Measurement and evaluation in the schools, Ediia a II-a, McMillan Poblishing Co., New York Linn, R.L., Gronlund, N.E. (2000). Measurement and Assessment in Teaching, Prentice-Hall Inc., New Jersey Lioiu, N., (2001). Metode i instrumente de evaluare, n Stoica, A. (coord.), Evaluarea curent i examenele, Editura ProGnosis, Bucureti, pp. 30-46 Manolescu, M. (2002). Evaluarea colar-un contract pedagogic, Editura Fundaiei Culturale, D. Bolintineanu, Bucureti Mason, E. J., Bramble, W. J. (1997) Research in Education and the Behavioral Sciences, Brown & Benchmark Publishers, Duburque Mndru, M. (2001), Tipologia itemilor, n Stoica, A. (coord.), Evaluarea curent i examenele, Editura ProGnosis, Bucureti, pp. 65-85 McMillan, J.H. (1992). Educational Research. Fundamentals for the Consumer, HarperCollins Publishers Inc., New York MECT, CNCEIP (2007). Evaluarea naional la finalul clasei a IV-a. Raport Tehnic, disponibil on-line: www.edu.ro Meyer, G. (2000). De ce i cum evalum, Editura Polirom, Iai Mihail, R. (2001). Evaluarea educaional i evaluarea performanelor/rezultatelor colare, n Stoica, A. (coord.), Evaluarea curent i examenele, Editura ProGnosis, Bucureti, pp. 4-21

Moise, C. (2007). Teoria i practica evalurii, n Psihologie. Curs pentru nvmnt la Distan, Editura Universitii Alexandru Ioan Cuza", Iai Muster. D. (1970). Verificarea progresului colar prin teste docimologice, 1970, Editura Didactic i Pedagogic, Bucureti Neacu, I., Stoica, A. (coord.) (1996). Ghid general de evaluare i examinare, Editura Aramis, Bucureti Negre-Dobridor, Ioan, 2001, Teoria curriculumului, n I. Cerghit, I. Neacu, I. NegreDobridor, I.O. Pnioar, Prelegeri pedagogice, Editura Polirom, Iai, pp. 11-60 Nitko, A.J. (2001). Educational Assessment of Students, 3rd Edition, Prentice-Hall Inc., New Jersey Osterlind, S. J. (1998). Evaluation in Education and Human Services. Constructing test items: multiple-choice, constructed response, performance and other formats, 2nd edition, Kluwer Academic Publishers Popescu, P. (1978). Examinarea i notarea curent, Editura Didactic i Pedagogic, Bucureti Popham, W. J. (2003). Test better, teach better. The instructional role of assessment, Association for Supervision and Curriculum Development Potolea, D. (2002). Conceptualizarea curriculum-ului. O abordare multidimensional, n E. Pun, D. Potolea (coord.), Pedagogie.Fundamentri teoretice i demersuri aplicative, Editura Polirom, Iai, pp. 69-84 Radu, I. (1995). Elemente de docimologie didactic, n M. Ionescu i I. Radu (coord.), Didactica modern, Editura Dacia, Cluj-Napoca Radu, I. T. (1981). Teorie i practic n evaluarea eficienei nvmntului, Editura Didactic i Pedagogic, Bucureti Radu, I. T. (2000). Evaluarea n procesul didactic, Editura Didactic i Pedagogic, Bucureti Radu, I. T., Popescu, P. (1982). Evaluarea randamentului colar, n I. Salade (coord.), Didactica, Editura Didactic i Pedagogic, Bucureti Roman, I., Popescu, P. (1980). Lecii n spiritul metodelor active, 1980, Editura Didactic i Pedagogic, Bucureti Schreerens, J., Glas, C., Thomas, S. M. (2003). Educational evaluation, assessment and monitoring. A systemic approach, Swets & Zeitlinger Publishers, Lisse SNEE (2003). Standarde de evaluare pentru clasa a IV-a, a VIII-a i a XII-a, disponibil online: www.edu.ro SNEE (2005). Evaluarea naional la finalul clasei a IV-a. Raportul tehnic, disponibil online: www.edu.ro Stan, A. (2002). Testul psihologic. Evoluie, construcie, aplicaii, Editura Polirom, Iai Stan, C. (2001). Evaluarea i autoevaluarea colar, Presa Universitar Clujean, ClujNapoca Stoica, A. (2003). Evaluarea curent i examenele. De la teorie la practic, Editura Humanitas Educational, Bucureti Stoica, A. (coord.) (2001). Evaluarea curent i examenele, Editura ProGnosis, Bucureti Strung, C. (1999). Evaluarea colar, Editura de Vest, Timioara Thomas, R.M. (1998). Conducting Educational Research. A comparative view, Bergin & Garvey Westport, Connecticut Vogler, J. (2000). Evaluarea n nvmntul preuniversitar, Editura Polirom, Iai