Sunteți pe pagina 1din 4

Unitatea de învăţare 6.

Metode de măsurare: testele pedagogice

Literatura care tratează probleme de metodologie a cercetării în ştiinţele socio-umane


abundă în definiţii ale testului (în engleză probă, examinare, încercare), de la definiţii de
dicţionar până la definiţii asociate unor nume mari ale psihologiei (L. Cronbach sau A.
Anastasi). În lucrările de metodologie a cercetării educaţionale testul este definit ca „o probă
de evaluare a unei persoane în raport cu o serie de criterii, cu scopul de a obţine informaţii
despre raportul dintre acea persoană şi aria de referinţă” (Karmel şi Karmel, 1978, p.5) sau ca
„instrument care presupune rezolvarea unui set de întrebări/sarcini standard, aceleaşi pentru
fiecare subiect. Răspunsurile la întrebări se traduc în expresii/valori numerice, suma lor
reprezentând o formă de caracterizarea a subiectului în ceea ce priveşte anumite procese şi
abilităţi” (McMillan, 1992, p. 114).
Dacă aceste definiţii ne pot lămuri cu privire la accepţiunea testului în spaţiul
educaţional, nu putem afirma că maniera de clasificare a acestora este la fel de clară.

Important

În mod evident, testul pedagogic s-a dezvoltat în strânsă legătură cu testul


psihologic, iar toate criteriile de clasificare, precum şi exigenţele de elaborare sunt aceleaşi ca
în cazul acestuia. Practic, în cercetarea educaţională se utilizează atât teste psihologice, cât şi
teste pedagogice, iar acestea din urmă trebuie să răspundă aceloraşi exigenţe de construcţie şi
de elaborare ca şi cele dintâi. Cele două categorii de teste diferă doar în ceea ce priveşte
obiectul evaluării: în timp ce testele psihologice vizează procese cognitive, trăsături de
personalitate etc., testele pedagogice (de randament şi de cunoştinţe) vizează cunoştinţe sau
achiziţii şcolare.

Testele pedagogice, ca şi cele psihologice pot fi clasificate în funcţie de mai multe


criterii (McMillan, 1992; Radu, 2000; Moise, 2003; Gall, Gall, şi Borg, 2007):
 În funcţie de modalitatea de interpretare a rezultatelor distingem testele normative de
testele criteriale. Testele normative implică compararea rezultatelor unui subiect cu
rezultatele grupului de referinţă. Ele permit realizarea unui „clasament” al subiecţilor, fiind
valorizată posibilitatea de comparare inter-individuală. Testele criteriale presupun raportarea
rezultatelor unui subiect la un nivel prestabilit al performanţei în domeniul de interes.
Scorurile obţinute de un subiect sunt interpretate în raport cu un criteriu, nu în contextul
rezultatelor grupului de referinţă. Distribuţia scorurilor la testele criteriale este asimetrică,
rezultatele concentrându-se la polul negativ.
 În funcţie de rigurozitatea procedurilor de administrare şi de calculare a scorurilor,
testele pot fi standardizate şi nestandardizate. Testele standardizate au o procedură de
administrare riguroasă: sunt stabilite cu precizie limitele de timp pentru rezolvarea fiecărui
item, materialele care trebuie utilizate (inclusiv ordinea itemilor şi forma de prezentare). Ele
sunt elaborate de specialişti şi sunt însoţite de manuale de utilizare care specifică condiţiile de
administrare, modalităţile de calculare a scorurilor, precum şi detalii privind fidelitatea şi
validitatea instrumentului. Avantajul testelor standardizate constă în aria largă de
aplicabilitate, de unde decurge însă şi cea mai evidentă limită: ele nu pot fi utilizate în
cercetări foarte focalizate, deoarece se referă la cunoştinţe sau achiziţii generale. Testele
nestandardizate, cunoscute şi ca teste elaborate de profesor (teacher-made tests), sunt
aplicabile doar unei situaţii particulare sau unui anumit grup de subiecţi şi nu permit
comparaţii cu alte grupuri.
 În funcţie de natura caracteristicilor măsurate, testele pot fi de aptitudini sau abilităţi
şi de achiziţii. Testele de aptitudini sau abilităţi pot servi în predicţia unor performanţe
şcolare/academice viitoare, în timp ce testele de achiziţii surprind nivelul cunoştinţelor în
momentul măsurării;
 În funcţie de scopul aplicării lor şi a volumului conţinuturilor vizate, testele pot fi
formative şi sumative: primele contribuie la determinarea nivelului şi deficitului elevului şi la
orientarea sa în procesul învăţării, în timp ce ultimele sunt aplicate pe secvenţe mari (capitole,
semestre, ani şcolari, cicluri de învăţământ) şi au ca scop notarea şi clasificarea elevilor
(Stoica ş.a., 2001);
 După modul de prezentare a răspunsului se disting teste obiective şi teste subiective
(eseu). Testele obiective solicită răspunsuri stricte, iar testele subiective implică răspunsuri
formulate diferit de către fiecare subiect (Stoica ş.a., 2001);
 În funcţie de momentul în care sunt aplicate (Radu, 2000) testele pot fi iniţiale
(administrate înainte ca orice intervenţie educaţională să fi avut loc), de progres (administrate
în timpul desfăşurării intervenţiei educaţionale) şi finale (administrate după încheierea
intervenţiei educaţionale).

Temă de reflecţie

Ce tipuri de teste credeţi că se aplică în mod frecvent la clasă?

Important

Elaborarea unui test pedagogic presupune parcurgerea mai multor etape (Evans,
1985; Crocker şi Algina, 1986; Radu, 2000):
 Stabilirea scopului probei (diagnostic sau prognostic) determină structura şi conţinutul
acesteia.
 Selectarea conţinuturilor şi a obiectivelor corespunzătoare care vor fi vizate prin
intermediul testului este sintetizată într-un tabel/matrice de specificaţii (Crocker şi Algina,
1986; Radu, 2000). Acest tabel de specificaţii include pe verticală conţinuturile care vor fi
evaluate, iar pe orizontală obiectivele corespunzătoare, ierarhizate în acord treptele
taxonomiei lui Bloom (cunoaştere, comprehensiune, aplicare, analiză, sinteză şi evaluare).
 Formularea itemilor constituie cea mai laborioasă etapă a elaborării unui test
pedagogic.

Important

Tipologia itemilor include itemi obiectivi, semiobiectivi şi subiectivi (Radu, 2000).


Itemii obiectivi permit măsurarea exactă a rezultatelor şi sunt utilizaţi mai ales în
testele standardizate şi pot fi (Evans, 1985; Crocker şi Algina, 1986; Radu, 2000):
- itemi cu alegere duală care solicită subiectului să aleagă unul din cele două posibilităţi
de răspuns de tipul: adevărat-fals, corect-greşit, potrivit/nepotrivit;
- itemi cu alegere multiplă care solicită alegerea unui răspuns dintr-o listă de alternative;
- itemi de tip pereche sau de asociere care presupun stabilirea unei corespondenţe între
două liste de afirmaţii sau concepte.
Itemii semiobiectivi nu sunt incluşi în lucrările mai vechi de metodologie a cercetării,
însă sunt menţionaţi de autori români care au abordat testul docimologic ca instrument de
evaluare şcolară (Radu, 2000, p. 217-218). Itemii semiobiectivi pot fi itemi cu răspunsuri
scurte care sunt formulate concis şi specifică clar natura răspunsului corect; itemi de
completare care presupun completarea unui cuvânt sau a unei sintagme într-un text lacunar;
itemi structuraţi care se constituie dintr-un set de întrebări care au în comun un element sau
se referă la acelaşi fenomen, concept.
Itemii subiectivi sau itemii de tip eseu solicită răspunsuri deschise, care în funcţie de
volumul şi amploarea răspunsului aşteptat pot avea caracter restrictiv şi extins (Radu, 2000).
Natura acestor itemi imprimă o notă subiectivă şi calculării scorurilor, a punctajelor chiar
dacă se elaborează un barem de corectare foarte riguros.
Fiecare dintre tipurile de itemi amintiţi are avantaje şi limite specifice şi trebuie să
respecte criterii de formulare, de care depinde calitatea globală a testului (vezi pentru detalii
Radu, 2000). În elaborarea unui test docimologic, trebuie avută în vedere complementaritatea
şi dificultatea gradată a tipurilor de itemi.
 Stabilirea unei grile de corectare care să includă răspunsurile corecte pentru fiecare
item uşurează considerabil activitatea evaluatorului.
 Elaborarea baremului de corectare sau a modalităţii de calculare a scorurilor va
permite evaluarea precisă şi identică a răspunsurilor formulate de fiecare subiect. În cazul
itemilor subiectivi, baremul de corectare include elemente ale răspunsului care vor fi punctate.
Dacă este vorba de teste nestandardizate sau elaborate de profesor, etapa următoare
include aplicarea testului, în timp ce în cazul testelor standardizate această etapă este
pregătită de etapele de pretestare şi de revizuire, reformulare şi definitivare a acestuia. A.
Anastasi (1976, p. 413) indică însă că şi în cazul testelor nestandardizate trebuie realizată o
pretestare care să includă o analiză a itemilor (calcularea coeficientului de dificultate şi a celui
de discriminare).
 Pretestarea are în vedere verificarea calităţilor globale ale testului (Karmel şi Karmel,
1978; Radu, 2000) - obiectivitate, aplicabilitate, fidelitate şi validitate, precum şi a calităţilor
fiecărui item – dificultate şi putere de discriminare.
Obiectivitatea unui test pedagogic se referă la caracterul explicit şi la claritatea
itemilor, care trebuie să permită obţinerea de scoruri comparabile în cazul unor evaluatori
competenţi. Aplicabilitatea se referă la adecvarea itemilor la conţinuturile vizate, la volumul
de timp şi resurse materiale necesare aplicării, la claritatea modalităţii de calculare a
scorurilor.
Fidelitatea şi validitatea1 sunt adesea folosite în mod eronat ca sinonime, însă cele
două concepte au accepţiuni diferite – în timp ce fidelitatea se referă la consistenţa sau
stabilitatea unui test, validitatea indică măsura în care un test surprinde ceea ce şi-a propus să
investigheze. Un instrument de cercetare poate avea o fidelitate ridicată, fără a fi valid, însă
un test valid are cu siguranţă o fidelitate ridicată.
Coeficientul de dificultate al unui item (Anastasi, 1976; Karmel şi Karmel, 1978;
Radu, 2000) se calculează ca procent de subiecţi care rezolvă corect un item. Itemii prea uşor
sau prea dificil de rezolvat nu oferă informaţii relevante despre subiecţi şi sunt eliminaţi în
etapa de revizuire a testului. Din punct de vedere strict statistic, itemul „ideal” ar fi cel care
este rezolvat corect de 50% dintre subiecţi. În general, se acceptă un coeficient de dificultate
cuprins între 25% şi 75%, deşi interpretarea acestuia depinde de scopul aplicării testului.
Coeficientul de discriminare (Anastasi, 1976; Karmel şi Karmel, 1978; Radu, 2000)
indică măsura în care un item face diferenţa între subiecţii cu performanţe înalte şi cei cu
1
Fidelitatea şi validitatea, precum şi modalităţile de estimare a acestora sunt prezentate în manieră generală –
fiind calităţi tehnice care trebuie estimate nu doar pentru testele pedagogice ci şi pentru alte tehnici şi
instrumente de cercetare (de exemplu, pentru chestionare).
performanţe scăzute. Se poate calcula ca diferenţă între procentul de subiecţi care au rezolvat
corect itemul analizat din partea superioarã a clasamentului, realizat pe baza scorurilor totale
la test (primii 27-33%) şi procentul de subiecţi care au rezolvat corect itemul analizat din
partea inferioarã a clasamentului (ultimii 27-33%). Valoarea minimă acceptată a
coeficientului de discriminare este de 25%.

 În ultima etapă de construire a unui test – revizuirea acestuia, o parte dintre itemi sunt
fie reformulaţi, fie eliminaţi în funcţie de rezultatele analizei privind caracteristicile prezentate
anterior.
Pentru a fi corect aplicat un test docimologic standardizat, ca şi un test psihologic
trebuie însoţit de un manual de utilizare care să includă toate detaliile tehnice, precum şi
informaţii complete privind administrarea şi maniera de calculare a scorurilor.

Avantajele şi limitele testului în general, şi a celui pedagogic, în special, au fost


îndelung dezbătute: în timp ce unii au subliniat faptul că ele constituie mijloace eficiente de
cunoaştere a performanţelor subiecţilor, de selecţie a acestora (atunci când acesta este scopul
aplicării lor) şi poate contribui la luarea deciziei de tratare diferenţiată, alţii au invocat lipsa de
rigoare în elaborarea şi administrarea unora dintre teste. Testele normative au fost adesea
criticate pentru raportarea la rezultatele unui grup de referinţă, care nu întotdeauna este
potrivită (vezi situaţia persoanelor din minorităţi etnice, care vorbesc altă limbă decât cea în
care este administrat testul). Testele standardizate care includ prea multe răspunsuri închise au
fost criticate pentru faptul că evaluează mai degrabă capacitatea de memorare a subiecţilor, în
timp ce testele cu itemi de tip eseu sunt considerate prea subiective. Valoarea testelor depinde
în mare măsură de competenţa celor care le elaborează şi de pregătirea celor care le aplică şi
calculează scorurile, de unde şi nevoia de pregătire riguroasă a acestora.
Este incontestabilă contribuţia testelor nu doar în reglarea activităţii educaţionale
(elaborarea programelor de recuperare sau accelerare), ci şi în realizarea unor cercetări
educaţionale credibile. În ciuda acestui fapt, testul trebuie utilizat cu precauţie, în condiţiile
respectării tuturor etapelor şi condiţiilor de elaborare, de administrare şi de calculare a
scorurilor.

Test de autoevaluare

1. Itemii obiectivi pot fi:


a) cu răspuns sau alegere duală;
b) de completare;
c) cu alegere multiplă;
d) de tip rezolvare de probleme.

2. Printre calitățile testului docimologic se numără:


a) validitatea;
b) dificultatea;
c) discriminarea;
d) obiectivitatea.

S-ar putea să vă placă și