Sunteți pe pagina 1din 36

EVALUAREA

Scurt istoric
 La originile sale, evaluarea şcolară îşi propunea numai notarea, ierarhizarea şi
selecţia elitelor, prin raportarea performanţelor la cele ale unui grup de referinţă.
 În anii 1950 psihologii şi pedagogii americani au propus ca evaluarea să raporteze
performanţele la criterii prestabilite prin obiectivele operaţionale şi să decidă dacă
sunt necesare conduite de remediere. Astfel evaluarea a căpătat şi un rol formativ, de
sprijin acordat atât elevului cât şi profesorului în analiza evoluţiei cognitive a elevilor.
Evaluarea este deci integrată în procesul de predare-învăţare ca o verigă de legătură
între cele două aspecte.
 În anii 1960-70 ca urmare a cercetărilor şi rezultatelor lui Piaget, evaluarea este
chemată şi să descopere obstacolele cognitive şi modul de funcţionare cognitivă a
elevilor. În acel stadiu, evaluarea putea fi considerată ca fiind integrată în procesul de
predare-învăţare, acesta schimbându-şi denumirea în predare-învăţare-evaluare, iar
elevul devine din obiect al educaţiei, subiect al ei.
 Începutul anilor 1980 aduce o nouă schimbare de optică asupra persoanei elevului în
sensul că elevul învaţă chiar şi în cursul examinării şi că răspunsurile sale depind de
contextul concret în care se găseşte elevul examinat. Astfel evaluarea îşi propune să
ghideze procesul învăţării pentru progresul cognitiv al elevului. Scopul este implicarea
elevului în propria învăţare, deci transformarea acestuia din subiect al educaţiei în
evaluator al propriei prestaţii sau a prestaţiilor celorlalţi.
Concluzie
 Ca urmare, în analiza evaluării şcolare, pornim de la
următoarea premisă: rostul evaluării nu este atât
notarea elevilor, în sensul catalogării lui pe un
anumit nivel al performanţei, ci măsurarea
progresului în învăţare şi determinarea (generarea)
acestui progres. În aceste condiţii, notarea ar trebui
să măsoare nu atât cantitatea de informaţii de care
dispune elevul la un moment dat, ci mai ales, ceea
ce poate să facă el utilizându-şi competenţele
dobândite prin învăţare.
Definiţia evaluării:

procesul multidimensional de obţinere a


informaţiilor, cu ajutorul unor instrumente
de evaluare, în scopul elaborării unor
judecăţi de valoare, raportate la nişte
criterii propuse şi care se finalizează cu
aprecieri ce permit luarea de decizii.
Etapele evaluării sunt:
 Măsurarea rezultatelor şcolare reprezintă operaţia de constatare a
existenţei, volumului, corectitudinii şi gradului de stăpânire a unor
cunoştinţe prin aplicarea unor instrumente de evaluare adecvate
scopului urmărit (probe orale/scrise/practice, proiecte, portofolii,etc.).

 Aprecierea rezultatelor şcolare reprezintă procesul de acordare a notei


pe baza unor criterii unitare ( bareme de corectare şi notare, descriptori
de performanţă, etc.);

 Formularea concluziilor este un demers de factură explicativ-


justificativă având rolul de a facilita înţelegerea, la nivelul elevului, a
motivelor care au stat la baza acordării notei. Argumentarea realizată
de profesor se poate manifesta sub două forme:
 Normativă: centrată pe justificarea corectitudinii notei acordate
 Formativă: profesorul urmăreşte nu numai conştientizarea elevului cu privire
la nivelul performanţelor sale dar şi mobilizarea lui în direcţia depăşirii
performanţei obţinute la un moment dat.
Cui se adresează procesul
evaluării în sistemul educaţional?

Elevul

părintele Evaluarea profesorul

Şcoala
Tipuri de evaluare
În funcţie de sistemul de referinţă faţă de care facem evaluarea putem
avea:
 Elevul considerat în raport cu propriul său standard, ca expresie a
capacităţilor şi motivaţiei pentru învăţare. În acest caz interesează în ce
măsură elevul îşi reeditează sau depăşeşte statutul anterior. Acest tip
de evaluare se numeşte evaluare de progres.

 Elevul situat în standardele sau norma grupului (clasă sau a unui grup
reprezentativ). Acest tip de evaluare se numeşte evaluare normativă /
clasificatorie.

 Nu se clasifică propriu-zis elevii, ci se stabileşte distanţa care-i separă


de obiectivele prevăzute în programă, respectiv în documentele de
lucru, proiectele de lecţie, etc. Această formă de evaluare se numeşte
evaluare formativă.
Tipuri de evaluare
În funcţie de momentul în care se realizează evaluarea putem avea:

 Evaluare iniţială care se realizează la începutul unei etape de instruire.


Ea îşi dovedeşte utilitatea din două puncte de vedere: stabilirea cu
suficientă exactitate încă de la început lacunele existente în pregătirea
elevilor şi a măsurilor ce permit eliminarea acestora şi în al doilea rând
se constituie ca punct de reper esenţial pentru asigurarea obiectivităţii şi
pertinenţei acţiunilor evaluative ulterioare;

 Evaluarea continuă se realizează pe parcursul secvenţelor de instruire


şi are drept obiectiv pe de o parte monitorizarea sistematică a
progresului elevilor iar pe de altă parte repararea în timp util a
eventualelor disfuncţionalităţi survenite în procesul de predare-învăţare;

 Evaluarea finală/sumativă se realizează la sfârşitul unui stadiu de


instruire şi urmăreşte constatarea eficienţei acţiunii instructiv-educative
întreprinse în acest interval de timp.
Evaluarea formativă continuă
Se ocupă de proces (invizibil)
Se desfăşoară în timpul actului pedagogic
Are ca scop remedierea lipsurilor
Oferă informaţii asupra gradului de atingere a
obiectivelor, comparând rezultatele elevului
cu standardul prestabilit, fără a-l clasifica
Vizează sesizarea la timp a unor defecţiuni şi
aplicarea măsurilor de corectare
Evaluarea sumativă / finală
Se ocupă de produs (vizibil)
Preia ceea ce rămâne în afara evaluării formative,
clasând progresul observat, prin compararea rezultatelor
mai multor elevi = funcţie normativă
Interferează cu evaluarea formativă când are în vedere
compararea performanţelor fiecărui elev cu standardele
prescrise = funcţie criterială
Modifică procesul evaluat după perioade relativ lungi de
desfăşurare
Constă în verificarea şi aprecierea periodică, încheiate
prin control final asupra întregului produs al actului
pedagogic
Instrumente tradiţionale de
evaluare

 Probe scrise

 Probe orale

 Probe practice
Instrumente alternative de
evaluare
 observarea sistematică a elevilor;
 investigaţia;
 chestionarul;
 proiectul (miniproiectul);
 portofoliul;
 tema pentru acasă;
 tema de lucru în clasă;
 grile de evaluare;
 scale de evaluare;
 autoevaluarea.
METODELE TRADIŢIONALE
O întrebare care ne frământă:
De ce probele tradiţionale au pondere
superioară în procesul evaluării – la clasă,
dar şi prin examenele naţionale?
Răspunsuri posibile :
- Ofera elevilor aceeasi sarcina de lucru deci notele obtinute de
acestia sunt comparabile;
- Se castiga timp;
- Permit o verificare completa a atingerii obiectivelor prestabilite
Probele practice
 Oferă posibilitatea evaluării capacităţii elevilor de a
aplica cunoştinţele în practică, precum şi a gradului
de stăpânire a priceperilor şi a deprinderilor formate
 Forme: experienţe de laborator, lucrări
experimentale, desene, schiţe, grafice etc.
 Oferă posibilitatea elevului de a-şi dezvolta
atât competenţele generale (comunicare, analiză,
sinteză, evaluare), cât şi pe cele specifice,
aplicative (utilizarea datelor, a instrumentelor de
lucru, interpretarea rezultatelor ).
Probele orale
 Reprezintă metoda cel mai des utilizată la clasă
Avantaje Dezavantaje
 flexibilitatea şi adecvarea individuală  diversele circumstanţe (factori externi)
(alternarea tipurilor de întrebări şi a care pot influenţa obiectivitatea evaluării
gradului lor de dificultate în funcţie de atât din perspectiva evaluatorului, cât şi a
calitatea răspunsurilor oferite de către celui evaluat;
elev);  nivelul scăzut de fidelitate şi validitate;
 clarificarea şi corectarea imediată a
 consumul mare de timp, având în vedere
eventualelor erori sau neînţelegeri ale
elevului în raport cu un conţinut specific; că elevii sunt evaluaţi individual.
 libertate de manifestare a originalităţii
elevului, a capacităţii sale de argumentare
etc.;
posibilitatea de a se realiza evaluări de
ordin atitudinal sau comportamental;
stabilirea unei interacţiuni optime între
evaluator şi cel evaluat.
Probele scrise

Au o valoare de obiectivitate şi imparţialitate mai


mare decât cele orale.

Definiţie
Item = element constitutiv al unui test,
chestionar etc. cu o notă specifică în cadrul
unei probleme, referindu-se la un fragment
strict determinat şi unic al acesteia .
TIPURI DE ITEMI
 ITEMI OBIECTIVI
 capacitatea de a testa un număr mare de elemente
de conţinut în timp relativ scurt
 sunt utilizaţi în testele standardizate
 au timp scurt de răspuns şi de corectare
 asigurarea obiectivităţii în evaluare şi notare
DEZAVANTAJ: Posibilitatea ghicirii răspunsului
CATEGORII
1. cu alegere duală;
2. de tip pereche;
3. cu alegere multiplă.
ITEMII CU ALEGERE DUALĂ
 măsoară rezultate ale învăţării situate la niveluri cognitive
inferioare: cunoştinţe, priceperi, capacităţi de bază (capacitatea de
a identifica );

 implică alegerea corectă a unor alternative ce presupun relaţii de


tipul adevărat-fals, da-nu, corect-incorect, fapt-opinie, acord-
dezacord...;

 principalul inconvenient: sunt vulnerabili la răspunsurile date la


întâmplare, ,,ghicite”;

 înlăturarea inconvenientului: principiul ,,modificării variantei false”


(Carey, L.);

 grad sporit de dificultate: identificarea relaţiei cauză-efect şi


discriminarea dintre enunţurile factuale şi enunţurile de opinie.
ITEMII DE TIP PERECHE
 Determinarea corespondenţei corecte între cuvinte, propoziţii, fraze,
semnificaţii, simboluri, informaţii etc.
 Distribuţie pe două coloane (premise şi răspunsuri)
Cerinţe:
 includerea unui număr inegal de premise şi răspunsuri;
 instruirea elevilor pentru ca fiecare răspuns să fie folosit o dată,
de mai multe ori sau niciodată:
 utilizarea unui material omogen, respectând regula de a selecta
din acelaşi domeniu obiectivele ce vor fi corelate;
 premisele şi răspunsurile să fie plasate pe aceeaşi pagină;
 pentru a evita furnizarea oricăror indicii ce ar conduce elevul
spre „ghicirea” răspunsului corect, coloana răspunsurilor să fie
aranjată într-o ordine logică(alfabetică, crescătoare,
descrescătoare).
ITEMI CU ALEGERE MULTIPLĂ
 solicită elevului să aleagă un răspuns dintr-o listă de răspunsuri oferite pentru o
singură premisă
 printre alternativele oferite se găseşte una care este corectă în raport cu premisa.
Celelalte răspunsuri, în afara celui corect se numesc distractori (alternative incorecte,
plauzibile şi paralele)

Cerinţe:
 premisa va conţine o singură problemă bine definită;
 premisa formulată într-un limbaj corespunzător nivelului de vârstă al elevilor;
 distractorii să fie plauzibili şi paraleli;
 răspunsurile pe cât posibil să aibă aceeaşi lungime;
 răspunsurile să nu fie opuse sau sinonime ca înţeles;
 alternativele trebuie să fie omogene şi să urmeze logic şi gramatical enunţul.
ITEMI SEMIOBIECTIVI
Elevului i se cere să dea un răspuns în totalitatea lui sau o parte
componentă a unei afirmaţii, a unei reprezentări grafice, astfel încât
aceasta să capete sens şi valoare de adevăr
Caracteristici
 trebuie să aibă precizate: obiectivul, enunţul şi schema de notare;
 răspunsul cerut elevului poate fi limitat ca spaţiu, formă şi conţinut prin structura întrebării;
 libertatea elevului de a reorganiza informaţia primită şi de a formula răspunsul în forma dorită
este redusă;
 pentru a oferi răspunsul corect, elevul trebuie să demonstreze nu numai cunoaşterea dar şi
abilitatea de a structura, de a elabora cel mai potrivit şi scurt răspuns.

CATEGORII
1. Itemi cu răspuns scurt/de completare;
2. Întrebări structurate.
Itemi cu răspuns scurt/de completare
 răspuns scurt = răspunsul sub forma unui cuvânt, simbol, număr sau sub forma
unei propoziţii, fraze;

completare = solicită în general drept răspuns doar unul sau două cuvinte, care să
se încadreze în contextul – suport oferit;
Cerinţe
 răspunsul solicitat să fie scurt şi bine definit;
 spaţiul liber furnizat trebuie să sugereze dacă răspunsul va conţine un cuvânt sau
mai multe(propoziţii, fraze);
 dacă mai multe cuvinte trebuie scrise atunci spaţiile libere vor avea aceeaşi
lungime pentru a nu oferi elevilor indicii privind răspunsul;
 unităţile de măsură vor fi precizate atât în întrebare, cât şi după spaţiul liber,
astfel încât un răspuns greşit al elevului să nu fie urmarea unei erori de citire sau
de înţelegere a întrebării;
 nu se indică folosirea unui text din manual, deoarece s-ar încuraja memorarea şi
s-ar putea testa altă capacitate decât cea dorită;
 se va evita excesul de spaţii albe şi formulările incomplet definite, care cresc
imprecizia.
Întrebări structurate
 itemi care conţin mai multe sarcini de lucru, lăsând celor examinaţi
posibilitatea alegerii modalităţilor de formulare a răspunsurilor;
 întrebarea structurată este formată din mai multe subîntrebări de tip
obiectiv, semiobiectiv sau eseu scurt, legate între ele printr-un element
comun.
Cerinţe
 întrebările structurate trebuie să solicite răspunsuri simple la început şi
să crească dificultatea spre sfârşit;
 fiecare subîntrebare va fi autoconţinută şi nu va depinde de răspunsul
corect la subîntrebarea precedentă;
 subîntrebările trebuie să fie în concordanţă cu materialele/ stimulii
utilizaţi;
 pe foaia de răspuns se va lăsa un spaţiu liber corespunzător lungimii
fiecărui răspuns aşteptat.
Itemi subiectivi (cu răspuns deschis)
Solicită construirea răspunsului de către elevi, testându-le
obiective ce vizează creativitatea, originalitatea, caracterul
original al răspunsului

Categorii
 eseu cu răspuns restrâns, structurat sau nestructurat
 rezolvări de probleme
Comparaţie între testele standardizate şi
testele nestandardizate
Testul standardizat: este elaborat în instituţii specializate.
Caracteristici: 
 itemii (întrebare & răspuns) au calităţi tehnice superioare;
 indicaţiile privind administrarea şi corectarea sunt atât de precise, încât
procedurile sunt standard pentru diferiţi utilizatori;
 este furnizat pe norme de vârstă, la nivel naţional / regional;
 există forme echivalente şi compatibile de teste, precum şi un manual al
testului, ce serveşte drept ghid în administrarea şi corectarea testului,
precum şi în interpretarea şi utilizarea rezultatelor;
 informaţiile sunt clar definite şi au parametrii cunoscuţi: consistenţă
internă, coeficient de stabilitate, echivalenţă etc.
 informaţiile sunt obţinute în condiţii "ideale" din punct de vedere al
aranjamentelor iniţiale, al administrării, al timpului acordat etc.
 rezultatele fundamentează decizii de ordin administrativ, de consiliere,
de cercetare.
Calităţile unui test bun
1. Validitatea = calitatea în virtutea căreia testul "măsoară ceea ce este destinat să măsoare"(Ausubel &
Robinson, 1981)

 De conţinut: relevă măsura în care testul acoperă în mod uniform elementele de conţinut majore pe
care le testează. Aprecierea validităţii de conţinut se face prin estimarea concordanţei dintre itemii
testului şi obiectivele operaţionale definite pe baza conţinuturilor esenţiale ale programului de
instruire.
 
 De construct: exprimă acurateţea cu care testul măsoară un anumit construct intelectual:
inteligenţa, creativitatea. Acest tip de validitate vizează raportul natura itemilor - nivelul învăţării.

 Concurentă: se referă la concordanţa dintre rezultatele obţinute de un elev la un test şi alte criterii
similare, de comportament (ex.: un elev a obţinut rezultate bune la un test ce măsoară capacitatea
de a utiliza cele patru operaţii matematice. Dacă el nu face greşeli de calcul la testul următor, în care
sunt folosite aceste operaţii, primul test are validitate concurentă).
 
 Predictivă: vizează măsura în care testul poate favoriza progresul performanţelor viitoare ale
elevului. Estimarea acestui tip de validitate este posibilă prin relaţia dintre "predictor" (ex.: rezultatele
obţinute de elevi la examenul de admitere în licee, la o anumită disciplină/şi "criteriu"/ex.: rezultatele
aceloraşi elevi la aceeaşi disciplină, după un an de studiu).
 
 De faţadă: exprimă măsura în care testul este relevant şi important pentru cei ce sunt testaţi (ex.: un
test care estimează conţinuturi de dimensiuni şi importanţă diferite, exprimă acest fapt printr-o
pondere diferită a itemilor pe unităţi de conţinut).
Calităţile unui test bun
2. Fidelitatea = calitatea unui test de a produce rezultate constante în
urma aplicării sale repetate.

Metode de estimare a fidelităţii testului


 
 Testul - retestul: testul este aplicat de două ori aceluiaşi grup, la un
interval de timp aleatoriu(câteva minute - câţiva ani).
 Formele echivalente: se administrează aceluiaşi grup de elevi, la un
interval de timp scurt, două forme ale aceluiaşi test.
 Test - retest cu forme echivalente: se administrează aceluiaşi grup
două forme ale aceluiaşi test, la un interval de timp aleatoriu.
 Înjumătăţirea: testul se aplică o singură dată, după ce a fost, în prealabil,
împărţit în două jumătăţi echivalente (itemi pari - itemi impari). Se
calculează apoi coeficientul de fidelitate pentru întregul test, conform
formulei 2 x fidelitatea unei jumătăţi.
 
Calităţile unui test bun
3. Obiectivitatea = gradul de concordanţă între aprecierile făcute de evaluatori
independenţi privitor la răspunsul bun pentru fiecare din itemi.
4. Aplicabilitatea (validitatea de aplicare) = calitatea unui test de a fi administrat şi
aplicat cu uşurinţă.

Factori ce influenţează calitatea testului


 Indicaţiile (clare /neclare)
 Conţinutul tehnic al itemilor (ştiinţific / banal)
 Lungimea testului (lung /scurt)
 Administrarea /corectarea (corectă / incorectă)
 Caracteristicile grupului (omogen / eterogen)
 Schema de notare (structurată /neclară)
 Relaţia: formă & conţinut - nivelul de vârstă al elevilor (adecvat / neadecvat)
 Importanţa conţinutului testat (mare / mică)
Interpretarea rezultatelor obţinute
de elevi la probele de evaluare

Ce presupune interpretarea rezultatelor?

culegerea şi organizarea datelor, extragerea


informaţiilor posibile din datele culese şi
evaluarea lor
Culegerea şi organizarea
datelor
Se face prin corectarea lucrărilor şi trecerea rezultatelor în borderoul
de corectare. Acesta se realizează printr-un tabel de forma:
 

Nr.crt./ Numele Itemul 1 Itemul 2 ... Itemul n Total

A.I.          
B.I.          
...          
Extragerea informaţiilor
Se poate face prin adăugarea de linii în care să se treacă diferite informaţii referitoare la itemi
( de exemplu : media pe fiecare item, procentul celor care au rezolvat integral itemul). De
asemenea extragerea informaţiilor se poate face în urma reprezentării grafice a datelor, utilizând
de exemplu editorul de calcul tabelar Excel, prin : histogramă, poligon al frecvenţelor, diagramă
circulară, grafic al notelor, etc.
Pentru o interpretare mai detaliată a rezultatelor se
n
calculează:
x i
 Media aritmetică (M) a celor n note: M  i 1
,
n
unde xi, i=1,n reprezintă cele n note ale elevilor

 Mediana (Me): este mărimea (nota) din mijlocul şirului de note aşezate în ordine crescătoare şi
care împarte şirul note în două părţi egale ca număr de note.

 Modul (Mo): este nota care are cea mai mare frecvenţă (se repetă de cele mai multe ori).

 Deviaţia standard (σ) arată împrăştierea notelor faţă de medie şi se calculează astfel:
n

 (x i  M )2
 i 1

n
Interpretarea rezultatelor
pentru evaluarea normativă
Presupune compararea rezultatelor elevului cu cele ale
grupului din care face parte.
În situaţia ideală notele se aşează pe curba (clopotul)
lui Gauss (fig.). Ecuaţia curbei lui Gauss este
exprimată matematic printr-o formulă în care intervin
media aritmetică (M), deviaţia standard (σ) şi numărul
total de cazuri (n):
( xM )2
n 
y e 2 2

 2
unde e şi π sunt valori constante cunoscute:
e = 2,7182; π= 3,1415.
Curba lui Gauss

Frecvenţe M

M- σ
 
M+σ
 
 
 
 
M-2σ M+2σ
M- 3 σ M+ 3 σ
 
Proprietăţi ale curbei lui
Gauss:
 Dreapta verticalǎ de ecuaţie x = M este axǎ de simetrie pentru curba lui Gauss;
 Cele trei mărimi M, Me şi Mo coincid;
 Funcţia este strict crescǎtoare pe intervalul (-, M] şi strict decrescǎtoare pe
 intervalul [M, +);
 Funcţia este concavă pe intervalul [M-σ , M+σ] şi convexă pe intervalele
 (-, M-σ] şi [M+σ , +);
 În intervalul [M-0,5 σ ; M+0,5 σ ] se găsesc aproximativ 38,3% dintre note;
 În intervalul [M-(2/3)σ ; M+(2/3)σ ] se găsesc aproximativ 50% dintre note;
 În intervalul [M-σ ; M+σ] se găsesc 68,26% dintre note;
 În intervalul [M-1,5σ ; M+1,5σ] se găsesc aproximativ 86,64% dintre note;
 În intervalul [M-2σ ; M+2σ] se găsesc 99,74% dintre acestea, în afara studiului
rămânând mai puţin de 1% dintre cazurile posibile, cele cu totul excepţionale ca
mărime.
Cum se procedează?
 Se observă asemănarea care există între curba statistică (construită
cu datele examinării) şi curba lui Gauss construită pentru n, M şi σ
determinate din rezultatele examinării.

 Compararea se face din punctul de vedere al simetriei (faţă de


media aritmetică) şi al înălţimii curbei.

 O curbă nesimetrică sau prea înaltă ori prea joasă (care strânge
prea mulţi subiecţi în partea centrală, sau risipindu-i pe o bază mai
largă) rezultă din colective deficitare ca număr (prea mici), ca
eterogenitate (vârste prea diferite, pregătire anterioară), ca selecţie
(prea mulţi elevi buni sau slabi), sau ca aplicare a unor probe
necorespunzătoare (prea simple sau prea grele).
Evaluarea rezultatelor pentru o
evaluare formativă
Notele arată nivelul clasei în faţa unor teste
standardizate.
Notele pot fi aşezate pe curba lui Gauss cu un
maxim:
- mai mic decât nota 7: caz în care avem o clasă în care
numai puţini copii fac faţă testelor standardizate
- mai mare decât nota 7: caz în care avem o clasă în care
numai puţini copii nu fac faţă testelor standardizate
Această situaţie se întâlneşte mai ales la clasele de liceu
care au fost selectate anterior.