Sunteți pe pagina 1din 195

CAS++

Coordonatori:
Mircea MICLEA
Mihaela PORUMB
Paul COTÂRLEA
Monica ALBU
 
Descrierea CIP a Bibliotecii Naţionale a României

CAS++ - Cognitrom Assessment System /


coord.: Mircea Miclea, Mihaela Porumb, Paul Cotârlea, Monica Albu. -
Ed. a 2-a, rev. - Cluj-Napoca: Editura ASCR, 2009
4 vol.
ISBN 978-973-7973-70-2

Vol. 4: Evaluarea cunoştinţelor. - 2009. - ISBN 978-973-7973-74-0

I. Miclea, Mircea (coord.)


II. Porumb, Mihaela (coord.)
III. Cotârlea, Paul (coord.)
IV. Albu, Monica (coord.)

159.922

Editor: Diana Breaz


Coperta: Carolina Banc
Tehnoredactare: Diana Breaz şi Monica Albu

Comenzi:
SC COGNITROM SRL
Piaţa 14 Iulie nr. 18
400325, Cluj-Napoca
Tel./Fax: 0264 581499
www.cognitrom.ro
office@cognitrom.ro

Copyright © 2009 COGNITROM

Toate drepturile rezervate.


Reproducerea integrală sau parţială a textului, stocarea într-o bază de date şi transmiterea lui în orice formă
sau prin orice mijloace, elecronic, mecanic, fotocopiere, înregistrare sau de altă natură, fără acordul prealabil
al COGNITROM, sunt interzise şi se pedepsesc conform legii.
CUPRINS

Introducere 5
1. MĂSURAREA ŞI EVALUAREA ÎN PSIHOLOGIE 7
1.1. Măsurarea 7
1.2. Evaluarea 8
1.3. Psihodiagnoza 11
2. INSTRUMENTE DE EVALUARE ÎN PSIHOLOGIE 13
2.1. Ce este un instrument de evaluare? 13
2.2. Principalele tipuri de instrumente de evaluare utilizate în psihologie 14
2.2.1. Scalele de evaluare 14
2.2.2. Chestionarul 16
2.2.3. Testul psihologic 20
2.2.3.1. Caracteristici definitorii ale testului psihologic 20
2.2.3.2. Clasificări ale testelor psihologice 24
2.2.3.2.1. Clasificări în funcţie de modul de rezolvare a testului 24
2.2.3.2.2. Clasificări în funcţie de modul de administrare a testului 25
2.2.3.2.3. Clasificări în funcţie de conţinutul testului 26
2.2.3.2.4. Clasificări în funcţie de modul de cotare a testului 30
şi de interpretare a scorurilor
3. EVALUAREA CUNOŞTINŢELOR ÎN ŞCOALĂ 33
3.1. Evaluarea performanţelor şcolare 33
3.2. Tipuri de evaluări în şcoală 35
3.3. Rolul obiectivelor operaţionale în realizarea evaluării didactice 40
3.4. Precizarea termenilor: Test de cunoştinţe sau test docimologic? 49
3.5. Avantaje şi dezavantaje ale utilizării testelor de cunoştinţe în şcoală 55
4. EVALUAREA CUNOŞTINŢELOR ÎN CONTEXT NON-ŞCOLAR 57
4.1. Organizarea programelor de pregătire profesională 57
4.1.1. Rolul programelor de formare/dezvoltare profesională 57
4.1.2. Paşii programelor de formare/dezvoltare profesională 57
4.1.3. Utilizarea testelor de cunoştinţe în programele de formare/ 62
dezvoltare profesională
4.2. Selecţia profesională 63
4.2.1. Rolul selecţiei profesionale 63
4.2.2. Strategii de selecţie 65
4.2.3. Utilizarea testelor de cunoştinţe în selecţie 68
5. ITEMI ÎN TESTELE DE CUNOŞTINŢE 69
5.1. Noţiunea de item 69
5.2. Tipuri de întrebări în testele de cunoştinţe 70
5.3. Sugestii pentru formularea întrebărilor şi pentru alcătuirea testului 75
5.3.1. Sugestii generale 75
5.3.2. Sugestii pentru scrierea întrebărilor dihotomice 79
5.3.3. Sugestii pentru scrierea întrebărilor cu răspunsuri la alegere 79

1 |
5.3.4. Sugestii pentru scrierea întrebărilor de tip asociere 84
5.3.5. Sugestii pentru scrierea întrebărilor de tip ordonare 85
5.3.6. Sugestii pentru scrierea întrebărilor cu formulări lacunare 86
6. CALCULUL SCORULUI UNUI TEST DE CUNOŞTINŢE 89
7. VALIDITATEA TESTELOR 97
7.1. Noţiunea de validitate 97
7.2. Validarea testelor 98
7.2.1. Semnificaţia validării testelor 98
7.2.2. Analiza validităţii de construct 99
7.2.3. Analiza validităţii de conţinut 102
7.2.4. Analiza validităţii relative la criteriu 104
7.2.5. Factori care afectează valoarea coeficienţilor de validitate 107
7.2.6. Observaţii asupra validării testelor 108
7.3. Validitatea de aspect a testelor 108
8. FIDELITATEA TESTELOR 111
8.1. Noţiunea de fidelitate 111
8.2. Estimarea coeficienţilor de fidelitate 113
8.3. Utilizarea coeficientului de fidelitate la interpretarea scorurilor observate 119
8.4. Valori recomandate pentru coeficienţii de fidelitate 120
9. CONSTRUIREA UNUI TEST DE CUNOŞTINŢE STANDARDIZAT 123
9.1. Algoritmul de construire a unui test de cunoştinţe 123
9.2. Definirea testului 123
9.3. Crearea băncii de itemi 126
9.4. Construirea unei variante a testului 126
9.5. Analiza de itemi 128
9.5.1. Algoritmul analizei de itemi 128
9.5.2. Metode cantitative utilizate pentru testele relative la normă 129
9.5.2.1. Indicele de dificultate al unui item 129
9.5.2.2. Analiza răspunsurilor incorecte la itemi 131
9.5.2.3. Validitatea itemilor 135
9.5.2.4. Indicele de discriminare al unui item 136
9.5.3 Metode cantitative utilizate pentru testele relative la criteriu 138
9.6. Elaborarea documentaţiei de utilizare a testului 140
10. CONSTRUIREA UNUI TEST DE CUNOŞTINŢE NESTANDARDIZAT 143
10.1. Algoritmul de construire a unui test de cunoştinţe 143
10.2. Definirea testului 144
10.3. Construirea itemilor 144
10.4. Analiza itemilor 145
10.5. Construirea testului 145
10.6. Administrarea testului 146

2 |
10.7. Analiza răspunsurilor la itemi 146
10.8. Analiza fidelităţii şi a validităţii testului 146
10.9. Determinarea elementelor necesare pentru interpretarea scorurilor testului 147
11. CALITĂŢI ŞI DEFECTE ALE UNUI TEST DE CUNOŞTINŢE 149
11.1. Calităţi ale unui test de cunoştinţe 149
11.2. Defecte ale unui test de cunoştinţe 150
12. ETALONAREA UNUI TEST 151
12.1. Tipuri de etaloane 151
12.2. Transformări liniare 154
12.3. Transformări neliniare 156
13. INTERPRETAREA SCORURILOR UNUI TEST DE CUNOŞTINŢE 161
13.1. Interpretarea scorului unei persoane 161
13.1.1. Posibilităţi de interpretare a scorului unei persoane 161
13.1.2. Praguri de secţionare şi scoruri critice 161
13.1.3. Interpretarea scorurilor la testele de cunoştinţe informative 166
13.1.4. Interpretarea scorurilor la testele de cunoştinţe utilizate 167
în evaluarea criterială
13.1.5. Interpretarea scorurilor la testele de cunoştinţe utilizate 168
în evaluarea normativă
13.2. Interpretarea scorurilor unei colectivităţi 169
14. TEHNOREDACTAREA UNUI TEST DE CUNOŞTINŢE 173
15. GHID PRACTIC. CONSTRUIREA ŞI UTILIZAREA TESTELOR DE 175
CUNOŞTINŢE ÎN CAS++
15.1. Funcţiile modulului de evaluare a cunoştinţelor din CAS++ 175
15.2. Teste de cunoştinţe în CAS++ 175
15.3. Crearea unui test de cunoştinţe 178
15.4. Operaţii asupra itemilor unui test de cunoştinţe 179
15.5. Actualizarea unui test de cunoştinţe 181
15.6. Copierea unui test de cunoştinţe 182
15.7. Crearea unui test de cunoştinţe pornind de la un test de cunoştinţe existent 182
15.8. Ştergerea unui test de cunoştinţe 182
15.9. Listarea unui test de cunoştinţe 182
15.10. Verificarea unui test de cunoştinţe 184
15.11. Mutarea unui test de cunoştinţe pe o altă staţie de lucru 184
15.12. Administrarea unui test de cunoştinţe cu ajutorul calculatorului, 185
în cadrul platformei CAS++
15.13. Vizualizarea răspunsurilor la un test de cunoştinţe 186
15.14. Recomandări pentru construirea unui test de cunoştinţe 186
folosind modulul de evaluare a cunoştinţelor din CAS++
BIBLIOGRAFIE 189

3 |
4 |
INTRODUCERE

Pentru a construi un test de cunoştinţe care să furnizeze rezultate utile nu este suficient
să se formuleze câteva întrebări şi să se stabilească punctajul fiecărui răspuns corect.
Construirea unui test este o activitate de mare responsabilitate, mai ales atunci când scorurile
acestuia stau la baza unor decizii cu implicaţii majore asupra destinului unor oameni, cum este
cazul celor care se iau la concursurilor pentru admiterea într-o formă de învăţământ sau pentru
ocuparea unui post într-o organizaţie.
Principalul scop pe care l-am avut în vedere la elaborarea volumului CAS++. Evaluarea
cunoştinţelor a fost acela de a furniza celor interesaţi să utilizeze teste de cunoştinţe câteva
metode pentru verificarea calităţilor acestora, cu ajutorul cărora să poată construi teste de
calitate şi să poată alege testele pe care le vor folosi într-o anumită situaţie.
Sunt definite în volum noţiunile de item, scală şi test. Sunt descrise metodele de analiză
a itemilor, de validare, de cercetare a fidelităţii şi de etalonare, aplicabile nu doar testelor de
cunoştinţe, ci şi altor instrumente de evaluare (chestionare, teste psihologice). Înţelegerea
acestora necesită cunoştinţe elementare de statistică şi cunoştinţe fundamentale de psihologie.
De fapt, de astfel de cunoştinţe au absolută nevoie toţi utilizatorii platformei CAS++.
Sunt prezentate posibilităţile de folosire a testelor de cunoştinţe atât în şcoli, cât şi în
context non-şcolar, în selecţia profesională şi la evaluarea personalului din organizaţii.
Ideile expuse sunt ilustrate prin numeroase exemple.
Ultimul capitol descrie modul în care se construiesc şi se utilizează testele de cunoştinţe
în cadrul platformei CAS++.
Informaţiile cuprinse în acest volum servesc şi la înţelegerea procedeelor folosite la
construirea sau adaptarea testelor psihologice prezentate în volumele CAS++. Aptitudini
cognitive şi CAS++. Personalitate şi interese.

5 |
6 |
1. MĂSURAREA ŞI EVALUAREA ÎN PSIHOLOGIE

În cele ce urmează, prin obiecte vom înţelege lucruri (de exemplu, cărţi, desene), fiinţe
(persoane sau animale) şi evenimente (de exemplu, examene, spectacole).

1.1. Măsurarea

Măsurarea este o operaţie prin care, unei caracteristici care poate fi urmărită la o
mulţime de obiecte, i se atribuie valori numerice, respectând anumite reguli stabilite înainte de
efectuarea măsurării. Aceste reguli asigură ca una sau mai multe relaţii existente între obiecte
în ceea ce priveşte caracteristica măsurată să fie valabile şi între numerele atribuite acelor
obiecte prin măsurare.
Nu se impune nicio condiţie asupra numerelor care se atribuie prin măsurare. Ele pot fi
întregi sau zecimale, pozitive sau negative, în funcţie de preferinţa celui care face măsurarea.
Regulile utilizate cel mai frecvent cer respectarea, prin operaţia de măsurare, a
„echivalenţei” obiectelor (se atribuie acelaşi număr tuturor obiectelor care, în privinţa
caracteristicii măsurate, pot fi considerate echivalente şi se atribuie numere diferite obiectelor
care nu pot fi considerate echivalente între ele) şi a „ordinii” obiectelor (adică, obiectului care,
în privinţa caracteristicii măsurate, este superior altuia i se atribuie un număr mai mare decât
celuilalt).
De exemplu, dacă se măsoară caracteristica „lungime” la o mulţime de tije metalice, se
poate stabili regula ca numerele atribuite la două tije de aceeaşi lungime (care, puse una peste
cealaltă, au extremităţile pe aceeaşi verticală) să fie identice, iar numerele atribuite la oricare
două tije de lungimi diferite să fie diferite, fără a avea importanţă dacă tijei mai lungi i se
atribuie un număr mai mic sau mai mare decât tijei mai scurte. Această regulă asigură
respectarea „echivalenţei” tijelor.
O altă posibilitate de a efectua măsurarea caracteristicii „lungime” la mulţimea de tije
metalice ar fi să se impună, pe lângă regula anterioară, regula ca ori de câte ori două tije nu au
aceeaşi lungime, numărul atribuit tijei mai lungi să fie mai mare decât numărul atribuit tijei
mai scurte. Această regulă asigură respectarea „ordinii” tijelor.
Atunci când sunt respectate cele două reguli, ierarhia obiectelor în privinţa caracteristicii
măsurate coincide cu ierarhia lor stabilită pe baza măsurilor lor (adică a numerelor care le-au
fost atribuite prin măsurare).
În domeniul psihologiei, se măsoară, de obicei, caracteristici psihice (de exemplu,
atenţia, fluiditatea verbală, anxietatea) şi performanţe ale persoanelor în diverse activităţi (de
exemplu, performanţa şcolară sau cea profesională). Adesea, măsurarea se realizează cu
ajutorul unor instrumente de măsură (chestionare, teste etc.), fiecărei persoane fiindu-i
atribuită ca măsură valoarea indicată de instrument (de exemplu, scorul obţinut la un test).

7 |
Măsurarea stabileşte un izomorfism între mulţimea obiectelor şi mulţimea măsurilor
obiectelor. Devine posibil, astfel, să se efectueze diverse operaţii asupra măsurilor obiectelor,
iar concluziile desprinse să se extindă asupra obiectelor.
Exemplu. Pentru a forma, într-o mulţime de elevi, grupe „contrastante” sub aspectul
performanţei şcolare – o grupă care să conţină elevii cei mai buni, iar cealaltă, elevii cei mai
slabi – se va realiza o măsurare a performanţei şcolare, cu respectarea celor două reguli
formulate anterior, în aşa fel încât să se păstreze ierarhia persoanelor. De exemplu, fiecărui
elev i se va atribui, ca măsură a performanţei şcolare, media generală de la sfârşitul anului
şcolar precedent. Apoi, se va constitui o grupă din elevii care au mediile cele mai mari şi o
grupă din elevii care au mediile cele mai mici.
O altă posibilitate de măsurare a performanţei şcolare ar fi să i se ceară fiecărui elev să
acorde fiecărui coleg o notă cuprinsă între 1 şi 10, prin care să indice cât de bun îl consideră
ca elev, cu semnificaţia 1 = foarte slab şi 10 = foarte bun. Apoi, să se calculeze pentru fiecare
elev media aritmetică a notelor primite şi aceasta să fie considerată măsură a performanţei
şcolare.
Spre deosebire de caracteristicile fizice (lungime, masă, durată etc.), care pot fi măsurate
obiectiv şi destul de precis cu ajutorul unor instrumente, caracteristicile psihice se măsoară fie
prin atribuire de valori numerice de către diverse persoane (de exemplu, prin acordarea de
note şcolare de către profesori), fie prin administrarea unor instrumente la care răspund chiar
persoanele la care se face măsurarea (de pildă, prin administrarea unui test de atenţie), în
ambele situaţii măsurile fiind afectate de subiectivitate şi destul de imprecise.

1.2. Evaluarea

Evaluarea este o succesiune de acţiuni efectuate pentru a putea emite judecăţi asupra
unui obiect. Aceste acţiuni constau în culegerea de informaţii despre una sau mai multe
caracteristici ale obiectului respectiv şi prelucrarea lor, adesea prin compararea obiectului cu
alte obiecte, reale sau ideale. Rezultatul evaluării unui obiect este o descriere a acestuia, în
termeni cantitativi şi/sau calitativi.
Uneori, pentru realizarea evaluării unui obiect se fac măsurări ale unor caracteristici ale
acestuia. Alteori, evaluarea se bazează pe aprecieri subiective.
Exemplu. Pentru evaluarea unui elev sub aspectul performanţei sale şcolare, se culeg
informaţii despre notele acestuia şi despre rezultatele obţinute la diverse concursuri şcolare, se
cere părerea colegilor elevului şi se solicită aprecieri din partea cadrelor didactice care au avut
ore la clasa din care face parte elevul. Notele elevului se compară cu cele ale colegilor săi,
dar, în acelaşi timp, se au în vedere şi semnificaţiile obişnuite ale notelor (9-10 = note „foarte
bune”, 7-8 = note „bune”, 5-6 = note „mediocre”, 3-4 = note „slabe”).
În urma evaluării se poate afirma că elevul este „foarte bun” (dacă majoritatea notelor
sale sunt 9 şi 10, a obţinut rezultate bune la concursuri şcolare, este apreciat favorabil de
colegi şi de profesori) sau/şi că este „printre cei mai buni” din clasă (dacă notele sale sunt mai

8 |
bune decât cele ale majorităţii elevilor din clasă, iar profesorii şi colegii săi consideră că este
mai bine pregătit decât cei mai mulţi din clasă).

Spre deosebire de măsurare, care se referă la o singură caracteristică şi atribuie fiecărui


obiect o valoare numerică, evaluarea poate să se refere la mai multe caracteristici, iar
rezultatul său constă într-o descriere a obiectului făcută prin numere şi/sau prin cuvinte.
Se pot evalua obiecte diverse: fiinţe (în ceea ce priveşte caracteristici fizice sau psihice,
performanţele obţinute într-o activitate, interesele faţă de un domeniu sau faţă de o activitate,
atitudinile faţă de un eveniment etc.), posturi de muncă (de exemplu, ţinând seama de
calificarea cerută sau de complexitatea activităţii care trebuie să fie desfăşurată de ocupantul
postului), evenimente (de exemplu, erorile comise de angajaţi în procesul de producţie, în
funcţie de gravitatea lor ori de cauzele lor) etc.
Evaluarea se desfăşoară de obicei în doi paşi. Mai întâi se culeg date despre obiectul care
trebuie să fie evaluat, uneori cu ajutorul unor instrumente de evaluare. Apoi, pe baza acestor
date, se formulează aprecierile, comparând valorile variabilelor înregistrate pentru obiect cu
cele ale altor obiecte sau cu standarde fixate.
Orice evaluare necesită existenţa următoarelor elemente:
• un evaluat: un obiect asupra căruia se vor emite judecăţi în urma evaluării;
• unul sau mai multe criterii în funcţie de care se face evaluarea (acestea sunt, de fapt,
caracteristicile despre care se culeg informaţii şi în funcţie de care se raportează
obiectul evaluat la alte obiecte reale sau ideale);
• unul sau mai mulţi evaluatori: o persoană sau mai multe care participă la realizarea
descrierii obiectului evaluat, oferind informaţii despre obiect, emiţând aprecieri
despre obiect, realizând măsurări ale unor caracteristici ale obiectului, analizând
informaţiile culese şi formulând o judecată de sinteză asupra obiectului.
Atunci când obiectul evaluat este o persoană şi aceasta furnizează informaţii despre sine
răspunzând la un chestionar sau utilizând o scală de evaluare, evaluatul are şi rol de evaluator.
Instrumentele (chestionare, scale) utilizate într-un asemenea scop sunt denumite „de
autoevaluare”.
Rezultatul evaluării unui obiect după un singur criteriu poate fi:
• un rang sau un loc, care indică poziţia obiectului evaluat în cadrul unei mulţimi de
obiecte cu care este comparat;
• un calificativ (de exemplu, „foarte bun”, „de nivel mediu”), care reprezintă poziţia
obiectului evaluat faţă de standardele cu care este comparat;
• un număr (de exemplu, în cazul evaluării unei persoane, scorul acesteia la un test sau
gradaţia unei scale de evaluare care i-a fost atribuită);
• o etichetă, adică o denumire a unei clase din care face parte obiectul sau în care ar fi
potrivit să fie repartizat acesta (de exemplu, tipul de temperament);
• un set de adjective prin care se caracterizează obiectul evaluat (de exemplu, pentru o
persoană: „sociabilă”, „anxioasă”, „conştiincioasă”).
În urma evaluării unui obiect după mai multe criterii, se poate obţine:

9 |
• un profil al obiectului, adică o reprezentare grafică a rezultatelor evaluărilor în care
fiecărui criteriu îi corespunde un punct, poziţionat astfel încât să indice mărimea
criteriului la obiectul evaluat, iar punctele corespunzătoare criteriilor consecutive
sunt unite prin segmente de dreaptă (figura 1.1) sau o reprezentare grafică în care
criteriilor le corespund dreptunghiuri având aceleaşi dimensiuni pentru bază şi pentru
înălţime, iar în dreptunghiul corespunzător fiecărui criteriu este colorată o porţiune
având aria proporţională cu mărimea criteriului la obiectul evaluat (figura 1.2);
• o ierarhie a criteriilor (de exemplu, dacă este evaluată o persoană sub aspectul
interesului pe care îl manifestă faţă de mai multe domenii profesionale, se consideră
că fiecărui domeniu îi corespunde un criteriu, se măsoară interesul pentru fiecare
domeniu printr-un număr cuprins între 1 – cu semnificaţia „interes foarte scăzut” – şi
5 – cu semnificaţia „interes foarte ridicat” –, iar rezultatul evaluării va fi un
clasament al domeniilor profesionale stabilit pe baza măsurilor interesului faţă de
acestea) (figura 1.3);
• la fel ca în cazul evaluării după un singur criteriu, un rang, un calificativ, un număr
sau o etichetă, dar care sintetizează rezultatele evaluărilor făcute la fiecare criteriu în
parte (de exemplu, în cazul evaluării performanţei şcolare a unui elev, rezultatul
poate fi media generală, calculată ca medie aritmetică a mediilor obţinute de elev la
sfârşitul unui an şcolar, la toate materiile din anul şcolar respectiv, performanţa
şcolară la fiecare dintre aceste materii fiind considerată un criteriu măsurat prin
media de la sfârşitul anului şcolar; de asemenea, rezultatul evaluării performanţei
şcolare poate fi şi locul ocupat de elev în cadrul clasei din care face parte, stabilit pe
baza mediei generale).

70
Cota T

60

50

40

30
E A C S D

Scala

Fig.1.1. Profilul psihologic al unei persoane la chestionarul FFPI


(E=Extraversiune; A=Amabilitate; C=Conştiinciozitate; S=Stabilitate emoţională; D=Autonomie)

10 |
Abilitatea de învăţare foarte slab slab mediu bun foarte bun

Aptitudinea verbală foarte slab slab mediu bun foarte bun

Aptitudinea numerică foarte slab slab mediu bun foarte bun

Abilităţi funcţionăreşti foarte slab slab mediu bun foarte bun

Capacitatea organizatorică foarte slab slab mediu bun foarte bun

Fig.1.2. Un exemplu de profil psihologic realizat de platforma CAS++

1.Interese investigative
2.Interese realistice
3.Interese sociale
4. Interese antreprenoriale
5.Interese convenţionale
6.Interese artistice

Fig. 1.3. Un exemplu de clasament al intereselor pentru domenii profesionale


realizat de platforma CAS++ pe baza răspunsurilor la Chestionarul de evaluare a intereselor

1.3. Psihodiagnoza

Termenii psihodiagnoză, diagnoză psihică şi diagnoză psihologică sunt utilizaţi, în


general, ca sinonimi. Ei desemnează acţiunea de evaluare a unei persoane în privinţa unor
caracteristici psihice, a conduitelor şi/sau a performanţelor sale, fie pentru a le identifica pe
acelea care îi sunt specifice (sunt mai pronunţate sau, din contră, mai puţin pronunţate decât
restul ori au alte valori decât cele obişnuite în populaţia din care face parte persoana), fie
pentru a descoperi cauzele care au făcut ca prin unele aspecte individul respectiv să se
deosebească de ceilalţi membri ai populaţiei din care face parte sau pentru a prezice
performanţele pe care persoana le-ar putea obţine într-un anumit domeniu.
În primul caz, în cadrul psihodiagnozei se investighează un ansamblu larg de însuşiri
referitoare la procese psihice, aptitudini, trăsături de personalitate, temperament, caracter,
limbaj, trebuinţe, interese, atitudini etc., pentru a le depista pe acelea care prezintă niveluri
mult mai mari sau mult mai mici decât majoritatea celorlalte ori decât cele obişnuite în
populaţia din care face parte persoana. Pentru a putea compara între ele mai multe însuşiri,
este necesar ca acestea să fie exprimate în aceleaşi unităţi de măsură, de exemplu, în cote T.
Însuşirile evidenţiate astfel stau la baza aprecierilor formulate despre persoana evaluată.
Această utilizare a psihodiagnozei este frecvent întâlnită în consilierea şi în orientarea şcolară
şi profesională.

11 |
În cel de-al doilea caz, psihodiagnoza constă în examinarea şi interpretarea acelor
caracteristici psihice despre care se cunoaşte sau se presupune că ar putea fi cauze ale
deosebirilor existente între individul evaluat şi majoritatea membrilor populaţiei din care face
parte (de exemplu, în context clinic sunt urmărite caracteristicile care ar putea constitui cauza
unor deteriorări psihice) ori care ar putea asigura obţinerea unor performanţe bune într-un
anumit domeniu (de exemplu, în cadrul selecţiei profesionale sunt investigate caracteristicile
care au legătură cu obţinerea performanţei în profesia pentru care se efectuează selecţia).
Psihodiagnoza urmăreşte, pentru fiecare dintre caracteristicile psihice examinate, atât
gradul de dezvoltare, cât şi variabilitatea manifestărilor ei în momente sau situaţii diferite.
Concluziile formulate la sfârşitul psihodiagnozei constituie psihodiagnosticul. El
reprezintă doar imaginea unui moment, a unei etape în evoluţia psihică a persoanei evaluate,
şi nu este o caracterizare a individului valabilă pentru întreaga sa viaţă. Semnificaţia
psihodiagnosticului poate fi înţeleasă corect numai prin raportare la antecedentele persoanei
şi, dacă sunt prezente valori mai puţin obişnuite ale unor însuşiri psihice, prin identificarea
cauzelor acestora.
Rezultatele evaluărilor efectuate în cadrul psihodiagnozei împreună cu recomandările
formulate pe baza acestora fac obiectul raportului psihologic. El constituie mijlocul de
comunicare între psiholog şi cel care a solicitat psihodiagnoza.
De obicei, într-un raport psihologic se includ următoarele informaţii:
• date pentru identificarea persoanei evaluate (numele, data naşterii, data stabilirii
psihodiagnosticului);
• numele psihologului care a întocmit raportul psihologic;
• informaţii despre mediul în care persoana evaluată trăieşte şi îşi desfăşoară
activitatea (familie, loc de muncă);
• observaţii efectuate de psiholog asupra comportamentului persoanei evaluate;
• informaţii culese de psiholog despre persoana evaluată prin interviuri (cu persoana
evaluată, cu membrii familiei acesteia sau cu alte persoane);
• rezultatele obţinute de persoana evaluată la diverse teste;
• interpretarea rezultatelor evaluărilor;
• recomandări.
Pentru a fi util, raportul psihologic trebuie să fie redactat pe înţelesul celui căruia i se
adresează (profesor, angajator, medic etc.). Prin urmare, termenii psihologici folosiţi trebuie
să fie explicaţi, iar rezultatele observaţiilor şi scorurile obţinute de persoana evaluată la
diverse probe trebuie să fie interpretare, nu doar comunicate sub formă brută.
Platforma CAS++ elaborează un Raport de evaluare psihologică pentru fiecare persoană
evaluată cu ajutorul testelor psihologice şi al testelor de cunoştinţe conţinute în platformă.
Raportul prezintă rezultatele persoanei la teste, împreună cu scurte explicaţii privind
semnificaţia acestora. El este redactat sub forma unui fişier de tip .doc, aşa încât psihologul
care realizează examinarea poate adăuga informaţii, interpretări şi recomandări. Un exemplu
de asemenea raport se găseşte în volumul CAS++. Cognitrom Assessment System.

12 |
2. INSTRUMENTE DE EVALUARE ÎN PSIHOLOGIE

2.1. Ce este un instrument de evaluare?

Un instrument este un mijloc utilizat de o persoană pentru a culege informaţii din


realitatea pe care o studiază.
Instrumentele de evaluare servesc la obţinerea de informaţii despre un obiect, care se
vor utiliza pentru evaluarea obiectului respectiv.
În psihologie, instrumentele de evaluare folosite cel mai frecvent sunt: testul psihologic,
chestionarul, interviul, scalele de evaluare şi aparatele de măsură pentru diverse variabile
fiziologice. Unele instrumente de evaluare au o formă materială (de exemplu, chestionarul, în
care întrebările adresate subiectului sunt înregistrate pe un suport material − hârtie sau suport
magnetic, în cazul chestionarelor administrate cu ajutorul calculatorului), altele nu (de
exemplu, interviul în care întrebările sunt formulate chiar în timpul discuţiei cu persoana de la
care se culeg informaţii).
Un instrument de evaluare conţine un set de variabile stimuli, care provoacă un set de
răspunsuri. Astfel de variabile stimuli sunt:
• denumirea caracteristicii urmărite în evaluare;
• denumirea şi definiţia caracteristicii urmărite în evaluare;
• una sau mai multe descrieri ale unor comportamente specifice caracteristicii urmărite
în evaluare.
Răspunsurile la variabilele stimuli cuprinse într-un instrument de evaluare pot fi verbale
(exprimate prin cuvinte) sau non-verbale (de exemplu, completarea unui desen).
Adesea, instrumentele de evaluare conţin şi răspunsurile posibile admise la fiecare
variabilă stimul (de exemplu, gradaţiile scalei de evaluare, cotele itemilor unui test). În
asemenea situaţii, cel care răspunde variabilelor stimuli este obligat să aleagă, dintre
răspunsurile posibile admise, pe acelea care se potrivesc cel mai mult obiectului evaluat cu
ajutorul instrumentului respectiv.
Exemplu. Într-un chestionar destinat autoevaluării persoanelor în privinţa sociabilităţii,
două variabile stimuli sunt reprezentate de următoarele afirmaţii:
Îmi place să-mi petrec timpul liber împreună cu prietenii mei.
Mă simt bine la petrecerile cu multă lume.
În chestionar sunt incluse şi răspunsurile posibile admise. Acestea sunt „da” şi „nu”.
Persoana evaluată cu ajutorul chestionarului apreciază dacă afirmaţiile i se potrivesc şi
răspunde la fiecare dintre ele cu „da” sau cu „nu”. Ea nu are posibilitatea să indice dacă o
afirmaţie i se potriveşte „foarte mult”, „cam pe jumătate” sau „puţin”, fiind obligată să aleagă
o variantă dintre răspunsurile propuse de chestionar.

13 |
2.2. Principalele tipuri de instrumente de evaluare utilizate în psihologie

2.2.1. Scalele de evaluare

O scală de evaluare este un instrument pentru aprecierea unei caracteristici a unui


obiect (persoană, lucru, eveniment etc.) de către un evaluator.
În general, o scală de evaluare conţine trei tipuri de informaţii:
• indicaţii pentru evaluator cu privire la modul în care trebuie să utilizeze scala;
• denumirea caracteristicii evaluate, uneori însoţită de o definiţie şi/sau de o descriere
a ei;
• un standard, prin care se evaluează caracteristica vizată.
Standardul constă din cote (valori numerice dintr-o mulţime dată, de exemplu din
mulţimea {1, 2, 3, 4, 5}), calificative (de exemplu, „bun”, „mediocru”, „slab”), adjective sau
descrieri scurte (de exemplu, „optimist”, „cu capacitate de organizare”).
Pentru a evalua un obiect, evaluatorul analizează standardul şi alege acea valoare care i
se pare că se potriveşte cel mai bine obiectului respectiv. Rezultatul evaluării este, deci, o
valoare din standard.
Caracteristica evaluată cu ajutorul scalelor poate fi o trăsătură de personalitate, o
aptitudine, o însuşire specifică unui post (de exemplu, toleranţa la condiţii de izolare, pentru
postul de meteorolog la un centru de măsurători meteorologice situat pe un munte) sau un
aspect al performanţei în muncă (de pildă, originalitatea lucrărilor realizate, pentru cercetători
ştiinţifici).
Multe chestionare de personalitate se prezintă sub forma unui set de scale de evaluare.
Prezentăm două tipuri de scale de evaluare:
• scala de evaluare numerică;
• scala de evaluare grafică.

O scală de evaluare numerică serveşte la evaluarea unei însuşiri sau a unui


comportament sub aspectul intensităţii ori al frecvenţei cu care se manifestă. Ea are ca
standard o mulţime de cote, care sunt numere întregi consecutive dintr-un interval dat, de
obicei [1, 5] sau [1, 7]. Acestea reflectă intensitatea sau frecvenţa. Întotdeauna este specificată
semnificaţia valorilor extreme (de exemplu, pentru o scală având cotele posibile 1, 2, 3, 4 şi 5:
1=foarte rar, 5=foarte des).
Exemplu. Apreciaţi printr-un număr întreg cuprins între 1 şi 5 (1=foarte puţin, 5=foarte
mult) în ce măsură reuşeşte persoana pe care o evaluaţi să termine la timp lucrările.

O scală de evaluare grafică este constituită dintr-un segment de dreaptă sau dintr-o
înşiruire de căsuţe alături de care sunt notate mai multe repere (ancore), care marchează sau
descriu niveluri diferite de performanţă ori de prezenţă a unei calităţi. Ancorele pot fi:

14 |
adjective, numere, descrieri comportamentale sau expresii care descriu niveluri (de exemplu,
„sub medie”, „peste medie”).
Evaluatorul trebuie să compare obiectul pe care îl evaluează cu fiecare ancoră şi, pe
această bază, să aprecieze în ce punct al segmentului sau în care căsuţă ar fi cel mai potrivit să
o plaseze.
Exemplu. Apreciaţi cât mult i se potriveşte persoanei pe care o evaluaţi descrierea „Este
amabilă chiar şi cu cei care sunt nepoliticoşi cu ea.” şi notaţi un X în căsuţa potrivită.

Foarte Puţin Mult Foarte


puţin mult

Atunci când scala este formată din căsuţe succesive, o ancoră poate să corespundă unei
căsuţe sau unui grup de căsuţe ori poate fi plasată între căsuţe.
Exemplu Apreciaţi cât mult i se potriveşte persoanei pe care o evaluaţi descrierea „Este
amabilă chiar şi cu cei care sunt nepoliticoşi cu ea.” şi încercuiţi cifra din căsuţa potrivită.

Foarte puţin Puţin Mult Foarte mult


1 2 3 4 5 6 7 8 9 10 11 12

Ancorele sunt aici „foarte puţin”, „puţin”, „mult” şi „foarte mult”.

Nu este atât de important numărul de ancore, cât relevanţa acestora pentru caracteristica
evaluată, claritatea formulării lor şi localizarea lor precisă pe scală.
Scalele de evaluare care servesc la evaluarea unei caracteristici a unei persoane şi care
constau dintr-un segment alături de care sunt notate descrieri de comportament ce ilustrează
niveluri diferite de prezenţă a respectivei caracteristici (ancorele) sunt cunoscute sub
denumirea de scale de evaluare cu ancore comportamentale.
În cazul lor, segmentul este, de obicei, gradat prin puncte de diviziune echidistante.
Ancorele se pot găsi atât în dreptul gradaţiilor, cât şi printre punctele de diviziune, nu neapărat
la distanţe egale unele de altele.
Este posibil ca persoanei evaluate să nu i se potrivească niciuna dintre descrieri sau, din
contră, să i se potrivească mai multe descrieri. Evaluatorul trebuie să citească toate ancorele şi
apoi să aprecieze unde ar fi potrivit să localizeze, pe segment, persoana pe care o evaluează.
Uneori i se cere evaluatorului să facă marcarea peste un punct de diviziune, alteori i se
permite să o localizeze oriunde pe segment. În primul caz, rezultatul evaluării este reprezentat
de numărul de ordine al punctului de diviziune, iar în cel de-al doilea caz, de lungimea
segmentului cuprinsă între extremitatea corespunzătoare celui mai scăzut nivel al
caracteristicii evaluate şi marcajul făcut de evaluator.
Exemplu. O scală de evaluare a autonomiei cognitive, care conţine, alături de denumirea
caracteristicii, definiţia acesteia, se prezintă astfel:

15 |
Autonomia cognitivă:
Capacitatea de a raţiona independent, de a-ţi forma propriile opinii şi de a lua decizii;
un sentiment de încredere în propria persoană, dar şi credinţa că poţi alege ceea ce faci;
capacitatea de a gândi critic, dorinţa de a-ţi îmbunătăţi propria cunoaştere şi de a căuta
informaţii; capacitatea de autoevaluare.

Note Exemple
┬5
│ Are propriile opinii, indiferent de părerea celorlalţi.


│ Într-o situaţie conflictuală exprimă direct propria opinie.

┼4
│ Dacă are de făcut o alegere, îşi întreabă prietenii, dar preferă să fie, în final,
│ el cel care decide.


│ Îşi cunoaşte bine atât abilităţile, cât şi punctele slabe.
┼3


│ În unele situaţii are dificultăţi în exprimarea unor opinii contrare majorităţii.
│ Are nevoie de suport şi sfaturi când trebuie să ia decizii mai importante.

┼2 Reuşeşte să se autoevalueze cu dificultate, atunci când i se cere.

│ De fiecare dată când trebuie să-şi cumpere ceva, nu merge fără un prieten
│ de încredere care să-l ajute să aleagă cea mai bună variantă.
│ Majoritatea deciziilor sale sunt influenţate de opiniile celor din jurul său.
│ Adoptă părerile celorlalţi fără a le analiza critic.
┴1 Are mereu nevoie de asigurări din partea celorlalţi, nu are încredere în propriile
abilităţi.

Aici ancorele sunt exemplele.


Rezultatul evaluării unei persoane cu ajutorul acestei scale este un număr întreg, cuprins
între 1 şi 5. Valorile mici corespund unei autonomii cognitive scăzute, iar cele mari, unei
autonomii cognitive ridicate.

2.2.2. Chestionarul

Un chestionar este un ansamblu de întrebări scrise sau/şi imagini (desene, fotografii),


alese şi aranjate astfel încât să servească obţinerii de informaţii despre o temă fixată, care au
rolul de a determina din partea celui care răspunde un comportament verbal sau non-verbal ce
se înregistrează în scris.

16 |
Chestionarul poate fi administrat de către persoane calificate, numite operatori, sau
autoadministrat. În primul caz, operatorul citeşte întrebările şi notează atât comportamentul
verbal (răspunsurile la întrebări şi alte exprimări verbale), cât şi comportamentul non-verbal al
subiecţilor. În cel de-al doilea caz, aceeaşi persoană citeşte întrebările, formulează
răspunsurile şi le înregistrează în scris.
Comportamentul declanşat de administrarea unui chestionar este diferit de la un individ
la altul, fiind influenţat de o multitudine de factori: personalitatea celui chestionat,
personalitatea celui care administrează chestionarul, situaţia (inclusiv locul şi momentul) în
care se răspunde la întrebări, structura chestionarului (forma şi conţinutul întrebărilor şi
ordinea acestora).
Unele chestionare sunt utilizate ca teste psihologice, pentru evaluarea după unul sau mai
multe criterii a persoanei care răspunde, iar altele servesc în cadrul anchetelor, pentru
culegerea de informaţii de la un eşantion cu privire la unul sau mai multe obiecte (persoane,
lucruri, fapte etc.), în cadrul unor cercetări.
Orice chestionar se compune din:
• consemne;
• întrebări şi/sau imagini.

Consemnele
Consemnele sunt informaţiile şi instrucţiunile date persoanelor care răspund la
chestionar. Ele sunt pregătite înaintea administrării chestionarului şi sunt prezentate într-o
manieră identică tuturor subiecţilor.
Există mai multe categorii de consemne (după Delhomme, Meyer, 1998):
Consemnul pentru motivarea persoanelor care vor răspunde la chestionar prezintă ce se
urmăreşte prin chestionar şi numărul de întrebări conţinute în chestionar. Totodată, el îi
asigură pe participanţi că răspunsurile lor vor rămâne confidenţiale: chiar dacă se
înregistrează şi date personale, nu va fi dezvăluită nicio informaţie nominală. Se insistă asupra
faptului că ceea ce interesează sunt opiniile, ideile şi experienţa celui care răspunde.
Consemnul care creează un context al cercetării descrie o anumită situaţie în care
persoana care răspunde trebuie să acţioneze. De exemplu, înaintea administrării unui
chestionar pentru verificarea însuşirii cunoştinţelor predate la un curs, se poate formula
consemnul: „Întrebările sunt uşoare, cunoaşterea răspunsurilor corecte la cel puţin 75% dintre
întrebări este o condiţie absolut necesară pentru promovarea examenului.” sau „Întrebările
sunt dificile, să nu vă speriaţi dacă nu ştiţi să răspundeţi decât la jumătate dintre ele.” Astfel
de consemne se folosesc mai ales atunci când chestionarul serveşte culegerii de date pentru o
cercetare ştiinţifică.
Consemnul pentru introducerea unei sarcini explică ce trebuie făcut pentru a răspunde la
chestionar (cum se răspunde la întrebări). Un consemn bun este simplu, precis şi redundant.
Se spune acelaşi lucru în forme uşor diferite, pentru a se asigura o înţelegere corectă din
partea tuturor subiecţilor. Se pot oferi şi exemple de întrebări.

17 |
Consemnul care asigură legătura dintre diferite sarcini sau seturi de întrebări
realizează înlănţuirea logică a unor sarcini diferite şi, prin aceasta, accentuează impresia că
instrumentul este elaborat de specialişti şi, astfel, face să crească încrederea în chestionar. Se
utilizează atunci când chestionarul conţine grupe de întrebări de tipuri diferite sau care
vizează aspecte diferite ale unei teme.

Imaginile
Uneori, stimulii prezentaţi de un chestionar au forma unor desene sau a unor fotografii,
pe marginea cărora subiectul trebuie să dea un răspuns verbal. Asemenea desene, în care sunt
înfăţişate două persoane care discută, dar lipseşte replica uneia şi i se cere subiectului să o
completeze, apar în testele proiective, cum este testul Rosenzweig. Aceste teste pot fi privite
ca o formă particulară de chestionar, întrucât solicită din partea subiectului un răspuns verbal.
Alteori, desenele apar în cadrul unor întrebări din chestionar pentru a explica unii
termeni sau pentru a spori atractivitatea chestionarului.

Întrebările
Sub denumirea de întrebare, într-un chestionar pot figura atât întrebări propriu-zise, cât
şi afirmaţii faţă de care cel care răspunde trebuie să-şi manifeste acordul sau dezacordul,
propoziţii în care trebuie să se completeze unul sau mai multe cuvinte ori liste de elemente
care trebuie ordonate. Prin urmare, o întrebare într-un chestionar este un stimul sub formă de
text.
După forma lor, întrebările incluse în chestionare pot fi clasificate în:
• întrebări închise;
• întrebări deschise;
• întrebări semiînchise (sau semideschise);
• întrebări mixte.
Întrebările închise propun câteva răspunsuri şi le solicită subiecţilor să aleagă unul sau
mai multe dintre ele.
O întrebare închisă poate propune:
• răspunsurile „da”/„nu” (întrebare dihotomică);
• răspunsurile „da”/„nu”/„nu ştiu” (întrebare trihotomică);
• o listă de răspunsuri care indică diverse grade de intensitate (precum „foarte
puţin”/„puţin”/„potrivit”/„mult”/„foarte mult”) sau de frecvenţă (de exemplu,
„rar”/„câteodată”/„des”);
• mai multe răspunsuri diverse (întrebare cu alegere multiplă, întrebare
precodificată multiplu sau întrebare evantai).
Majoritatea cercetătorilor susţin că este necesar să se introducă în lista de răspunsuri
propuse varianta „nu ştiu” sau „fără opinie”, pentru a se reduce anxietatea celui chestionat şi a
se elimina răspunsurile alese la întâmplare, care s-ar putea să nu fie conforme cu realitatea.
În ceea ce priveşte întrebările ale căror răspunsuri exprimă grade de intensitate, părerile
specialiştilor sunt împărţite: unii sunt pentru includerea în listă a răspunsului care exprimă

18 |
poziţia de mijloc (de exemplu, „potrivit”), în timp ce alţii sunt împotrivă, argumentând că
acesta este ales cel mai frecvent, întrucât oamenii preferă să adopte poziţii moderate în locul
celor extreme.
În cazul întrebărilor cu alegere multiplă, răspunsurile propuse trebuie să îndeplinească
două condiţii:
• mulţimea lor să acopere mulţimea răspunsurilor posibile, aşa încât cel care răspunde
la chestionar să poată întotdeauna să aleagă un răspuns (în acest scop se adaugă,
uneori, la sfârşitul listei de răspunsuri propuse, varianta „niciunul dintre răspunsurile
de mai sus”);
• oricare două răspunsuri propuse să corespundă la două situaţii care diferă între ele,
adică aceleiaşi situaţii să nu îi corespundă mai multe răspunsuri.
Faptul că o întrebare cu alegere multiplă trebuie să conţină o listă exhaustivă de
răspunsuri le-ar putea impune, uneori, subiecţilor să memoreze un număr mare de cuvinte sau
de propoziţii. Or, nu toate persoanele sunt dispuse să facă aşa ceva. Există riscul ca unele
dintre ele să indice drept răspuns prima variantă reţinută, adică să nu dea răspunsul care li s-ar
potrivi cel mai mult. Pentru a evita astfel de situaţii se introduc în lista de răspunsuri propuse
doar acele răspunsuri despre care se presupune că sunt mai frecvente sau, în cazul unei
cercetări ştiinţifice, sunt foarte importante pentru ipotezele cercetării şi se adaugă, la sfârşit,
varianta de răspuns „alte situaţii (alt caz), şi anume ...”, seria de puncte semnificând faptul că
subiectul trebuie să expliciteze situaţia. O asemenea întrebare se numeşte semiînchisă sau
semideschisă.
Răspunsurile obţinute la varianta „alte situaţii” prezintă interes pentru cel care culege
informaţii folosind chestionarul, dar ele nu pot fi prelucrate statistic, întrucât faptul că un
răspuns dat de o persoană nu apare şi la alte persoane nu înseamnă că nu este valabil şi pentru
acestea. Este posibil ca ele să fi avut ezitări să completeze rubrica „alte situaţii” ori să nu se fi
gândit la răspunsul respectiv.
Uneori, subiectului i se cere să indice din lista propusă doar elementul care îi place (sau i
se potriveşte) cel mai mult şi/sau elementul care îi place (i se potriveşte) cel mai puţin.
Întrebările de acest tip sunt denumite întrebări cu alegere forţată.
Exemplu. Care dintre următoarele activităţi vă atrage cel mai mult?
a. să cultiv flori;
b. să citesc o revistă de ştiinţă;
c. să meşteresc ceva;
d. să ajut un copil să-şi facă temele.
Încercuiţi litera din faţa răspunsului ales.

Întrebările deschise sunt acelea la care persoanele chestionate au libertatea de a


răspunde cum doresc.
Exemplu. Care este activitatea pe care vă place cel mai mult să o practicaţi în timpul
liber?

19 |
Comparând întrebările închise cu cele deschise, se evidenţiază următoarele avantaje ale
întrebărilor închise:
• răspunsul potrivit este uşor de găsit;
• răspunsul este uşor de marcat (de obicei se încercuieşte litera sau cifra dinaintea
acestui răspuns);
• răspunsurile pot fi prelucrate statistic uşor şi rapid.
În schimb, întrebările deschise au următoarele avantaje:
• nu sugerează răspunsul;
• răspunsul primit la o întrebare de cunoştinţe deschisă indică nivelul cunoştinţelor
subiectului mai exact decât răspunsul la o întrebare închisă, care ar fi putut fi ales la
întâmplare.
Pentru a îmbina avantajele întrebărilor închise cu posibilitatea oferită de întrebările
deschise de a afla mai multe amănunte, se poate proceda în două moduri:
• După o întrebare închisă se pune o întrebare deschisă, de tipul „Puteţi detalia
răspunsul anterior?”.
• Se utilizează întrebări mixte, care au prima parte închisă şi a doua deschisă.
Aceasta din urmă lămureşte sensul răspunsului închis.
Exemplu. Obişnuiţi să vă petreceţi timpul liber în societate?
a. Da; b. Nu.
Dacă aţi răspuns cu „Da”, indicaţi cum vă petreceţi cel mai des timpul liber.

2.2.3. Testul psihologic

2.2.3.1. Caracteristici definitorii ale testului psihologic

La sfârşitul secolului al XIX-lea, când a fost folosit pentru prima dată în psihologie,
termenul „test" desemna „o serie de probe psihologice utilizate pentru a studia diferenţele
individuale”. De atunci, au fost formulate numeroa0se definiţii ale testului psihologic. Fiecare
autor a pus accentul pe alte aspecte, aşa încât s-a ajuns la situaţia ca unele definiţii să nu aibă
niciun element comun între ele. Întrucât nici până azi nu s-a ajuns la un consens, în locul unei
definiţii a testului psihologic, vom prezenta şi comenta câteva caracteristici ale acestuia, pe
care le considerăm deosebit de importante.
♦ Testele psihologice servesc fie la măsurarea unor atribute psihice (ca, de exemplu,
atenţia concentrată, reprezentarea spaţială, dexteritatea manuală), fie la predicţia unor
comportamente (ca, de pildă, succesul şcolar).
♦ Testul constă din una sau mai multe probe.
♦ Fiecare probă solicită îndeplinirea unei sarcini, aceeaşi pentru toţi subiecţii.
Uneori, proba serveşte drept stimul pentru un anumit comportament. Se urmăreşte, prin
administrarea testului, dacă apare sau nu respectivul comportament şi, eventual, în cazul
apariţiei, lungimea timpului de reacţie, frecvenţa ori intensitatea comportamentului.

20 |
Exemplu. O probă constă din afişarea pe ecranul unui monitor de calculator, timp de
cinci secunde, a unui şir format din şapte litere. Subiectului i se cere să apese pe tasta A dacă
observă litera S şi pe tasta L dacă şirul conţine litera Z. Dacă nu sunt prezente literele S şi Z
nu trebuie să acţioneze asupra tastaturii. Testul conţine 30 de asemenea probe. Se
înregistrează numărul de cazuri în care subiectul a procedat corect.
Alteori, proba are forma unei întrebări dintr-un chestionar. Ea îi cere subiectului să facă
aprecieri asupra unui comportament al său.
Exemplu. Într-un chestionar apare următoarea întrebare:
Răspundeţi cu „adevărat” sau „fals” la fiecare dintre următoarele afirmaţii, după cum vi
se potriveşte sau nu:
1. Merg la expoziţii de pictură de mai multe ori pe săptămână.
2. Mi-ar plăcea să escaladez un munte greu accesibil.
3. Cred că aş putea fi un bun conducător politic.

Un element al testului psihologic care solicită un răspuns (format din unul sau mai multe
elemente) ce se interpretează separat de celelalte răspunsuri ale testului se numeşte item.
Itemul este o întrebare sau, atunci când o întrebare cere mai multe răspunsuri, o parte a
ei.
Valoarea numerică atribuită unei persoane care răspunde la un item, dependentă de
răspunsul dat de aceasta, se numeşte cota itemului (sau scorul itemului) pentru persoana
respectivă.
Încă din etapa de construire a unui test, se identifică răspunsurile posibile la toţi itemii şi
se decide ce scor să i se asocieze fiecăruia. Odată stabilite, aceste scoruri rămân fixe pentru
toate persoanele şi în toate ocaziile de administrare a testului.
Exemple. Pentru itemii următori sunt notate, în paranteză, cotele care se atribuie
răspunsurilor.

a. Alegeţi răspunsul care vi se potriveşte la întrebarea „Vă faceţi o planificare a


activităţilor curente?” şi puneţi un x în faţa lui:
niciodată; (0)
rareori; (1)
câteodată; (2)
deseori; (3)
întotdeauna. (4)

În acest caz, itemul coincide cu întrebarea, iar scorul itemului pentru o persoană este
egal cu numărul asociat răspunsului ales de aceasta.

b. Notaţi numărul care urmează în şirul 1 2 3 5 8 13.


(Răspunsul 21 primeşte cota 1, iar orice alt răspuns, cota 0.)
Şi de această dată, itemul coincide cu întrebarea.

21 |
c. Indicaţi ordinea în care vă plac următoarele activităţi:
lectura;
excursiile;
vizionarea unui film;
ascultarea unor piese muzicale;
practicarea unui sport.
Pe locul întâi plasaţi activitatea care vă place cel mai mult, iar pe locul 5, cea care vă
place cel mai puţin. Notaţi locul în faţa fiecărei activităţi. (Pentru fiecare activitate, cota este
egală cu 6 − locul indicat de subiect.)

În acest exemplu, fiecare activitate reprezintă un item.

♦ Întrucât fiecare item vizează un comportament şi furnizează o valoare numerică, se


poate afirma că testul psihologic măsoară comportamente.
Un set de itemi care se referă la acelaşi aspect (un atribut psihic pe care testul îl măsoară
sau un comportament pe care testul îl prezice) formează o scală.
Denumirea scalei conţine numele elementului măsurat sau prezis de ea (de exemplu,
„scală de agresivitate”). Pentru fiecare scală se calculează un scor, conform unei reguli
stabilite de autorul testului. De obicei, scorul unei scale se obţine prin însumarea cotelor
itemilor componenţi, ponderate sau nu.
Un test psihologic constă din una sau din mai multe scale.
♦ Testul psihologic trebuie să realizeze o măsurare obiectivă a comportamentelor
subiecţilor.
Pentru aceasta, este necesar ca testul să îndeplinească următoarele condiţii:
¾ Persoana testată să nu poată ghici cum se interpretează răspunsurile posibile la
itemi, pentru a se evita ca ea să dea acele răspunsuri care corespund impresiei
pe care doreşte să o creeze despre sine.
¾ La orice item, fiecare răspuns posibil să fie interpretat în acelaşi mod de mai
mulţi experţi care analizează testul.
Exemplu. În cazul itemului „Anagramaţi succesiunea de litere ANIGÃ. Indicaţi ce aţi
obţinut, punând un x în faţa răspunsului potrivit dintre următoarele:
a. un nume de persoană;
b. un nume de pasăre;
c. un nume de munte;
d. un nume de râu.”
unele persoane vor considera corect răspunsul b (pasărea „găina”), iar altele răspunsul c
(muntele „Găina”).

Scorul unui subiect trebuie să depindă doar de răspunsurile date de acesta la itemi, nu şi
de subiectivismul, neatenţia sau starea de oboseală ale celui care calculează scorurile. Dacă
această condiţie este îndeplinită, se spune că testul este cu cotare obiectivă.

22 |
♦ Toate comportamentele măsurate de itemii unei scale sunt semnificative pentru
un atribut psihic pe care scala îl măsoară sau pentru un comportament pe care scala îl
prezice.
De exemplu, toţi itemii unei scale care măsoară anxietatea se referă la forme de
manifestare a anxietăţii (simptome somatice, trăiri subiective etc.) în diverse situaţii
generatoare de anxietate (întuneric, înălţime, examen etc.).
Nu este necesar ca itemii unui test construit în scopul predicţiei unui comportament să
descrie exact comportamentul respectiv. De altfel, ar fi imposibil ca un test utilizat la selecţia
profesională, deci înainte de ocuparea unui loc de muncă sau a unui loc la un curs de instruire
pentru o anumită profesie, să se refere la comportamentele care sunt specifice profesiei
respective. De pildă, nu li se poate cere persoanelor care se prezintă la selecţia pentru şcoala
de şoferi să conducă o maşină pe şosea.
Pentru a prezice un anumit comportament care nu va putea fi observat la subiecţi decât
peste un interval de timp, mai lung sau mai scurt, se includ în scală itemi ce măsoară
comportamente pentru care s-a constatat, prin procedee statistice, că au legătură cu
comportamentul care trebuie prezis. Adică, testul psihologic măsoară comportamente prin
care se pot face inferenţe asupra altor comportamente.
De exemplu, pentru a prezice dacă o persoană va deveni un bun conducător auto se pot
utiliza itemi care să măsoare gradul de cunoaştere a regulilor de circulaţie, precum şi itemi
care să măsoare atenţia distributivă.
♦ În general, ceea ce un test măsoară sau prezice are legătură cu un număr foarte mare
de comportamente. Să ne imaginăm, de pildă, prin câte comportamente se poate evidenţia
extraversiunea. Ar trebui cunoscută comportarea persoanei la locul de muncă, la întruniri, la
petreceri, în tren, între prieteni, între persoane necunoscute ei etc. Nefiind posibil ca testul să
conţină câte un item pentru fiecare comportament care poate fi conectat cu ceea ce testul
măsoară sau prezice, se extrage un eşantion din mulţimea tuturor acestor comportamente.
Comportamentele eşantionului respectiv vor fi măsurate de itemii testului. Se poate afirma,
astfel, că un test psihologic măsoară un eşantion de comportamente.
Exemplu. Un test pentru măsurarea capacităţii de reprezentare spaţială constă din 12
figuri. Fiecare dintre ele conţine cuburi aşezate în diverse moduri (sub formă de paralelipiped,
de piramidă etc.), astfel încât să nu fie toate vizibile. Subiectul trebuie să identifice câte cuburi
sunt în fiecare desen.
Evident, ar fi putut fi imaginate mult mai multe figuri (formate din cuburi şi/sau din alte
corpuri geometrice) decât cele cuprinse în test.

♦ Majoritatea testelor au o structură fixă: tuturor subiecţilor li se administrează


aceiaşi itemi, în aceeaşi ordine. Dacă testul conţine atât itemi uşori, cât şi dificili, iar ordinea
itemilor nu ar fi fixă, atunci comportarea la test a subiecţilor ar putea fi influenţată de poziţia
itemilor dificili: prezenţa acestora la început poate fi obositoare şi chiar descurajatoare,
repercutându-se negativ asupra modului de răspuns la ceilalţi itemi.

23 |
Există şi teste al căror conţinut se stabileşte în timpul administrării lor, în funcţie de
răspunsurile date de subiect.
♦ Pentru a interpreta scorul obţinut de o persoană la o scală, acesta se compară
fie cu rezultatele altor persoane care fac parte din aceeaşi populaţie ca şi subiectul, fie cu
unul sau mai multe praguri, fixate de autorul testului.
♦ Orice test psihologic trebuie să fie însoţit de reguli de utilizare, adică să fie
standardizat. Aceste reguli, care asigură similaritatea condiţiilor de testare pentru toţi
subiecţii, se referă la:
¾ conţinutul testului: comportamentele măsurate de test să fie aceleaşi pentru toţi
subiecţii sau, în cazul când itemii sunt generaţi aleator de calculator, cât mai
asemănătoare între ele;
¾ condiţiile de administrare: instrucţiunile date în legătură cu sarcinile pe care le
au de îndeplinit să fie aceleaşi pentru toţi subiecţii;
¾ modul de evaluare a răspunsurilor: procedurile aplicate pentru calculul
scorurilor să nu permită decât o intervenţie redusă a subiectivităţii
examinatorului, astfel încât, dacă aceleaşi răspunsuri sunt evaluate de mai mulţi
examinatori, scorurile rezultate să fie egale sau foarte apropiate între ele;
¾ modul de interpretare a rezultatelor obţinute de subiecţi: pentru doi subiecţi
care fac parte din aceeaşi populaţie şi au scoruri egale la test interpretarea
rezultatelor să fie aceeaşi.
Concret, regulile de utilizare indică:
¾ structura fiecărei scale a testului (din ce itemi este compusă şi care este ordinea
de administrare a acestora);
¾ ce li se spune subiecţilor în legătură cu testul;
¾ ce cotă se acordă fiecărui răspuns al fiecărui item şi ce formule se aplică pentru
a calcula scorurile scalelor pe baza scorurilor itemilor;
¾ cum se procedează pentru a interpreta scorurile scalelor.
Regulile de utilizare a unui test sunt prezentate în manualul testului.

2.2.3.2. Clasificări ale testelor psihologice

2.2.3.2.1. Clasificări în funcţie de modul de rezolvare a testului

A. După modul de executare a sarcinii de către subiect, testele se clasifică în:


• teste orale;
• teste scrise („creion-hârtie”);
• teste de performanţă:
¾ teste cu manipulare de aparate şi piese;
¾ teste administrate de calculator.
Testele orale îi cer subiectului să răspundă oral la întrebări adresate oral şi/sau în scris.

24 |
În cazul testelor „creion-hârtie”, itemii sunt scrişi pe hârtie, iar subiecţii răspund în
scris, fie pe foaia care conţine testul, fie pe o foaie de răspuns. Există tendinţa de înlocuire a
acestor teste cu testele administrate de calculator. Itemii nu mai apar pe hârtie, ci sunt afişaţi
pe ecranul monitorului, iar subiectul nu mai răspunde pe hârtie, ci apasă o tastă sau
manevrează mouse-ul ori creionul optic.
Testele de performanţă le impun subiecţilor să opereze cu obiecte, desene, aparate sau
să efectueze activităţi complexe, asemănătoare situaţiilor din viaţa reală. În această categorie
sunt incluse şi testele în care stimulii sunt constituiţi din desene animate, prezentate pe un
ecran, la televizor sau pe monitorul unui calculator.
B. După gradul de utilizare a limbajului în rezolvarea sarcinii impuse de test, se poate
vorbi despre:
• teste verbale (de exemplu, teste de raţionament verbal, teste de vocabular, teste care
cer completarea unor propoziţii);
• teste non-verbale (de exemplu, teste care cer urmărirea mintală a unui labirint,
rotirea pe plan mintal a unei figuri, completarea unor figuri lacunare).
În cazul testelor non-verbale, nu se utilizează limbajul nici oral, nici în scris, nici în
conţinutul testului şi nici în instrucţiunile acestuia. Asemenea teste sunt destinate persoanelor
analfabete, cu deficienţe de auz sau care nu cunosc limba folosită la examinare.
Unii autori acceptă sub denumirea de teste non-verbale şi probe în care utilizarea
limbajului este redusă. Pentru asemenea teste au fost stabilite următoarele trei niveluri
(English, English, 1970):
• teste complet non-verbale (extrem de rare);
• teste non-verbale în instrucţiuni, în forma de prezentare a sarcinii şi în modul de
răspuns din partea subiectului, dar care acceptă utilizarea limbajului pe parcursul
efectuării sarcinii (de exemplu, subiectul poate comenta ceea ce face, vorbind
singur);
• teste în care numai răspunsul subiectului este non-verbal.

2.2.3.2.2. Clasificări în funcţie de modul de administrare a testului

A. După numărul persoanelor care pot fi examinate simultan, testele sunt:


• individuale;
• colective sau de grup.
Examenul psihologic individual testează câte un singur subiect la un moment dat.
Testarea colectivă presupune examinarea simultană a mai multor subiecţi.
Această clasificare a testelor nu este precisă, întrucât unele teste create pentru a fi
administrate colectiv pot fi aplicate şi în mod individual (de exemplu, Testul Raven). Situaţia
inversă este imposibilă, mai ales în cazul testelor de performanţă (Roşca, 1972).
Ambele moduri de examinare prezintă o serie de avantaje, dar şi neajunsuri. Examenul
psihologic individual îi permite psihologului să stabilească un contact mai bun cu subiectul, să
ajungă mai repede la cooperare cu acesta. Totuşi, examenul psihologic individual este mai

25 |
puţin standardizat decât cel colectiv, iar decizia psihologului este mai încărcată de
subiectivitate. În schimb, unele stări particulare ale subiecţilor, care pot denatura rezultatele
testării, cum sunt oboseala, anxietatea, boala etc., sunt mai greu de detectat în condiţiile
examenului colectiv.

B. După timpul de execuţie a sarcinii impuse, testele de aptitudini şi cele de cunoştinţe


pot fi:
• teste de viteză:
• teste de randament:
¾ cu limită de timp;
¾ cu timp de lucru nelimitat.
Testele de viteză conţin itemi la care orice persoană din categoria celor cărora le este
destinată proba poate să răspundă cu uşurinţă corect, dar care trebuie rezolvaţi rapid. De
exemplu, trebuie barate numere sau figuri sau trebuie identificate figurile identice. Ele sunt
administrate cu limită de timp, fixată astfel încât nicio persoană să nu poată rezolva integral
testul. Performanţa unui subiect este dată de numărul de itemi la care a răspuns. Aceste teste
au la bază presupunerea că între viteza de lucru şi gradul de dezvoltare a caracteristicii
măsurate de test există o asociere pozitivă.
Testele de randament conţin itemi de dificultăţi diferite, adesea aşezaţi în ordinea
crescătoare a dificultăţii. Timpul de rezolvare a unui asemenea test nu este limitat sau este
suficient de lung pentru a permite parcurgerea integrală a testului de către toate persoanele, iar
performanţa unui subiect este indicată de numărul itemilor rezolvaţi corect.
Probele utilizate cel mai des sunt combinaţii ale celor două tipuri de teste. Ele conţin
itemi de dificultăţi diferite şi sunt administrate cu limită de timp. Dacă timpul de lucru este
atât de lung încât toate persoanele examinate au posibilitatea să rezolve toţi itemii la care
cunosc răspunsul, proba se comportă ca un test de randament. Dacă timpul de lucru este prea
scurt şi subiecţii nu au posibilitatea să rezolve toţi itemii la care ştiu răspunde, proba se
comportă ca un test de viteză (Corsini, 1994).
Guilford (1965) apreciază că un test care a fost parcurs integral de cel puţin 75% dintre
cei examinaţi poate fi considerat drept test de randament.

2.2.3.2.3. Clasificări în funcţie de conţinutul testului

A. În funcţie de comportamentele evaluate de itemii lor, testele sunt clasificate în:


• teste cognitive (teste intelective):
¾ teste de aptitudini;
¾ teste de cunoştinţe (de succes educaţional);
• teste non-cognitive (teste nonintelective):
¾ chestionare de personalitate;
¾ tehnici (teste) proiective;
¾ teste obiective de personalitate.

26 |
Testele cognitive măsoară procesele şi produsele activităţii mintale. Ele au în vedere cât
de bine execută subiectul o sarcină atunci când este motivat să depună cel mai mare efort
posibil. Prin urmare, testele cognitive măsoară performanţa maximă a individului, arată ce
poate să facă persoana. Din acest motiv ele sunt denumite şi teste de eficienţă.
Testele non-cognitive evaluează interese, atitudini, valori, motive, trăsături de
temperament şi alte caracteristici non-cognitive ale personalităţii. Ele sunt cunoscute şi sub
numele de teste de personalitate, deşi unii psihologi cuprind sub această denumire teste care
se referă atât la trăsături nonintelectuale, cât şi la trăsături intelectuale (Anastasi, 1976).
Testele non-cognitive reflectă comportamentul tipic al subiectului, arată ce face el în
situaţii obişnuite. Aceste teste ajută la înţelegerea performanţelor trecute ale subiectului şi
completează rezultatele testelor cognitive.
Spre deosebire de testele cognitive, care sunt compuse din itemi la care se răspunde
corect sau greşit, pentru itemii testelor non-cognitive nu există răspunsuri bune sau rele.
Testele cognitive sunt clasificate, de obicei, în:
• teste de aptitudini;
• teste de cunoştinţe (de succes educaţional).
Deosebirea esenţială între cele două categorii este dată de scopul pentru care sunt
folosite.
Testele de aptitudini servesc la predicţia nivelului de performanţă aşteptat pentru o
persoană care va urma un program de instruire într-un anumit domeniu sau va ocupa un
anumit post. Ele măsoară potenţialul persoanei şi prezic succesul pe care îl va avea într-o
situaţie viitoare.
Testele de cunoştinţe evaluează performanţa obţinută de subiect, succesul său într-o
situaţie de învăţare trecută.
Se administrează un test de aptitudini, dacă se doreşte să se afle ce poate învăţa o
persoană şi se utilizează un test de cunoştinţe, dacă se vrea să se afle ce ştie, ce a învăţat
individul până în momentul examinării (Thorndike, Hagen, 1961).

Testele de aptitudini
Aptitudinile reprezintă „însuşiri ale persoanei care, în ansamblul lor, explică diferenţele
constatate între oameni în privinţa posibilităţilor de a-şi însuşi anumite cunoştinţe, priceperi şi
deprinderi (A. Cosmovici, 1974, apud Balan, 1999). Ele constituie cauza randamentului
diferit într-o anumită activitate al unor indivizi care au beneficiat de educaţie egală (E.
Claparède, apud Sillamy, 2000).
Testele de aptitudini sunt probe care oferă informaţii despre gradul de dezvoltare a
variabilelor intelectuale, psihomotorii şi psihofiziologice care sunt considerate „aptitudini”
(creativitate, coordonare manuală, percepţie cromatică etc.). Ele permit construirea unui profil
individual diferenţiat şi stabilirea unei ierarhii între persoane.
Testele de aptitudini sunt clasificate în trei categorii (Reber, 1985):
• teste de aptitudini generale: ele determină potenţialul în domenii nespecifice (testele
de inteligenţă fac parte din această categorie);

27 |
• teste de aptitudini speciale: sunt cele care măsoară potenţialul pentru o singură
aptitudine (de grup, specifică sau complexă);
• teste de aptitudini multiple: sunt baterii de teste care evaluează mai multe aptitudini.

Testele de cunoştinţe
Prin scorurile lor, testele de cunoştinţe reflectă gradul în care subiecţii au învăţat ceva,
au îndeplinit o sarcină ori au obţinut succes într-o activitate. Ele măsoară nivelul cunoştinţelor
sau al deprinderilor persoanelor într-un domeniu în care au depus efort (Aiken, 1994). Este
vorba despre cunoştinţe şi deprinderi însuşite în şcoală sau în cadrul unor programe de
instruire profesională.
Scorurile testelor de cunoştinţe se pot folosi atât pentru formularea unui psihodiagnostic,
cât şi pentru a evalua eficienţa unui program de instruire. Concret, ele servesc la:
• identificarea persoanelor cu deficienţe în privinţa cunoştinţelor sau a deprinderilor,
pentru a le supune unei examinări mai amănunţite, în vederea determinării cauzelor;
• verificarea cunoştinţelor sau a deprinderilor existente la elevii unei clase sau ai unei
şcoli, în scopul stabilirii direcţiilor de instruire;
• identificarea celui mai potrivit program de instruire pentru fiecare persoană;
• gruparea persoanelor cu nivel apropiat de cunoştinţe sau deprinderi, pentru a urma
acelaşi program de instruire;
• evaluarea eficienţei programelor educative;
• determinarea nivelului cunoştinţelor necesare practicării unei ocupaţii.

Chestionarele de personalitate
Chestionarele de personalitate sunt compuse din una sau mai multe scale. Fiecare scală
este alcătuită dintr-o mulţime de declaraţii descriptive (itemii), care sunt relevante pentru
starea sau trăsătura psihică al cărei nume figurează în denumirea scalei. Există, de pildă, scale
de agresivitate, scale pentru măsurarea anxietăţii ca trăsătură şi pentru măsurarea anxietăţii ca
stare, scale de introversiune/extraversiune etc.
După conţinutul aspectelor cercetate, chestionarele de personalitate pot fi clasificate
astfel (Roşca, 1972):
• chestionare de adaptare (inventare de personalitate, chestionare de personalitate)
numite uneori şi chestionare de autoevaluare, deoarece subiectul dă informaţii asupra
propriei conduite, a propriilor trăiri, care ar fi indicatoare pentru adaptarea sau pentru
sănătatea sa psihică;
• chestionare de interese;
• chestionare de atitudini.
Chestionarele de personalitate constau, în general, din afirmaţii sau întrebări, iar
persoanei examinate i se cere să îşi manifeste acordul sau dezacordul faţă de ele. Acestea sunt
formulate astfel încât, prin răspunsurile date, subiectul dă informaţii asupra stării sale de
sănătate fizică sau psihică şi a comportamentelor sale specifice în situaţii diverse.

28 |
Testele proiective
Testele proiective sunt cunoscute şi sub denumirile de teste de apercepţie, teste de
dinamism şi teste nestructurate. Ele constau dintr-o serie de stimuli ambigui, vagi sau
incompleţi care îi sunt prezentaţi subiectului. Acestuia i se cere să reacţioneze într-un anumit
fel (asociind cuvinte, completând fraze, construind povestiri etc.). Dar, sarcina trasată prin
instrucţia prealabilă are un caracter foarte general, dând libertate în formularea răspunsului.
Nu există un răspuns bun prestabilit. Pentru a determina cauzele răspunsurilor subiectului, se
efectuează o anchetă în jurul acestuia, se analizează cantitativ şi calitativ forma şi conţinutul
răspunsurilor. Interpretările se bazează pe o teorie.
Presupunerea care stă la baza construirii şi a utilizării testelor proiective, numită ipoteza
proiectivă, este că interpretarea dată de subiect stimulilor prezentaţi reflectă nevoi, motive şi
conflicte inconştiente ale acestuia. Testele proiective servesc la cunoaşterea a ceea ce
subiectul nu poate sau nu vrea să spună despre sine, uneori pentru că nici el nu ştie.

Testele obiective de personalitate


Aceste teste se aseamănă cu probele proiective, dar folosesc stimuli mai structuraţi. Sunt
utile în selecţia profesională, putând să discrimineze între persoanele normale şi cele cu unele
tulburări psihice (puţin rezistente la stres, neurotice sau cu modificări patologice) (Pichot,
1967).
Fiind teste obiective, ele urmăresc obţinerea unei concordanţe mari între cotările făcute
de mai mulţi evaluatori. Stimulul şi reacţia provocată de el trebuie să fie de aşa natură încât
subiectul să nu fie tentat să falsifice răspunsul sau să îl distorsioneze, din dorinţa de a se
prezenta într-o lumină favorabilă sau, din contră, nefavorabilă. Pentru a realiza o asemenea
cerinţă, testele sunt „deghizate”; cu alte cuvinte, subiectul nu-şi poate da seama ce trăsătură de
personalitate se deduce din răspunsurile sale. Din acest motiv, testele obiective de
personalitate sunt uneori denumite teste indirecte (Roşca, 1972).
La baza testelor obiective de personalitate stă ipoteza că „stilul personalităţii”, „stilul
comportamentului” se manifestă în activităţi diverse. Asemenea activităţi simple, care pot
avea o valoare predictivă prin modul în care sunt îndeplinite, sunt introduse în testele
obiective de personalitate. În general, subiectului i se pretinde să execute o sarcină, nu să se
autoevalueze. Se urmăreşte felul în care acesta acţionează.
De exemplu (Roşca, 1972), proba Adjective Check List a lui H.G. Gough îi cere
subiectului ca, dintr-o listă cu 300 de adjective aranjate în ordine alfabetică, să le marcheze pe
cele care îl caracterizează. Psihologul are în vedere faptul că răspunsurile persoanei sunt
conforme imaginii pe care aceasta o are despre sine şi nu realităţii, deci nu le interpretează
direct. Dar anumite aspecte ale personalităţii subiectului rezultă din modul de execuţie a
sarcinii. S-a constatat, de pildă, că extravertiţii realizează aprecieri superioare celor date de
introvertiţi la trăsături care în realitate nu îi diferenţiază. Asemenea observaţii stau la baza
interpretării testelor obiective de personalitate.

B. După modul în care variază proba de la o administrare la alta, testele folosite într-o
examinare psihologică se împart în:

29 |
• teste cu conţinut fix;
• teste cu conţinut variabil.
În cazul testelor cu conţinut fix, toate persoanele examinate cu ajutorul testului parcurg
aceiaşi itemi. În general, şi ordinea în care sunt prezentaţi itemii testului este aceeaşi. Atunci
când testele sunt administrate colectiv, de calculator, pentru a se evita ca subiecţii să copieze
răspunsurile unul de la altul, se poate recurge la schimbarea ordinii itemilor în cadrul testului,
aleator sau după un algoritm stabilit a priori.
Majoritatea testelor utilizate în examinările psihologice au conţinut fix.
Din categoria testelor cu conţinut variabil fac parte testele idiografice şi testele
adaptative.
În primul caz, testul este construit sau ales special pentru subiect.
Testele adaptative sunt generate în momentul examinării psihologice, în funcţie de
comportarea subiectului.

2.2.3.2.4. Clasificări în funcţie de modul de cotare a testului şi de interpretare a


scorurilor

A. După modul de stabilire a cotei la test, se poate vorbi despre:


• teste obiective;
• teste subiective.
Un test obiectiv este cel al cărui scor se calculează urmând o regulă prestabilită, simplă,
care cere o judecată redusă (English, English, 1970). De exemplu, se compară setul de
răspunsuri date de subiect cu un set de răspunsuri fixat şi scorul subiectului la test este dat de
numărul de răspunsuri care coincid. Termenul „obiectiv” se referă numai la modul în care se
face cotarea răspunsurilor la test.
Pentru testele obiective, scorul poate fi calculat de un operator (nu neapărat de psiholog)
sau prin scanare şi cotare automată, folosind calculatorul electronic.
Spre deosebire de testele obiective, testele subiective permit ca mai mulţi evaluatori să
coteze foarte diferit răspunsurile aceleiaşi persoane. Din acest motiv, astfel de teste sunt
utilizate cu precădere de către psihologii clinicieni şi în unele cabinete de consiliere, mai puţin
în mediul industrial.
Din categoria testelor subiective fac parte testele proiective.

B. După modul în care se interpretează scorurile testelor, se poate vorbi despre:


• teste normative;
• teste centrate pe criteriu (teste criteriale);
• teste idiografice;
• teste ipsative.
Testele normative interpretează un scor individual prin comparaţie cu scorurile obţinute
la acelaşi test de un eşantion de persoane reprezentativ pentru o populaţie. Se folosesc clasele
etalonului (cuartile, decile, centile ori clase normalizate) sau valorile statistice (media şi

30 |
abaterea standard) ale scorurilor în eşantion. Cu ajutorul lor, pentru fiecare subiect se
determină clasa din care face parte scorul obţinut sau se calculează cota transformată (cota z,
cota T etc.).
Adesea, pentru un test se formează eşantioane reprezentative de persoane după mai
multe criterii, de exemplu după vârstă, după profesie, după nivelul de şcolarizare etc. În acest
caz, scorurile unui subiect pot fi comparate cu cele ale mai multor eşantioane de persoane,
fiind posibilă, astfel, o interpretare mai nuanţată.
Testele centrate pe criteriu (testele criteriale) sunt probe pentru care, de la început, a
fost fixat un standard de pricepere, numit criteriu sau nivel acceptabil de performanţă
(Guilbert, 1987). Scorul fiecărei persoane este comparat cu acest standard, iar rezultatul este
exprimat dihotomic: subiectul „a reuşit” (a îndeplinit condiţiile standardului) sau „nu a reuşit”
(nu a îndeplinit condiţiile standardului).
De exemplu, în cazul unui test de aritmetică format din 20 exerciţii de adunare,
administrat la sfârşitul clasei I, se poate stabili drept standard pentru promovarea clasei
rezolvarea corectă a 16 exerciţii.
În scopul evitării confuziilor, termenul „criteriu” fiind folosit în evaluarea psihologică
pentru a desemna variabila prezisă (şi corespunzător acestei accepţiuni se vorbeşte despre
validitatea relativă la criteriu), American Psychological Association, American Educational
Research Association şi National Council on Measurement au propus înlocuirea denumirii de
test centrat pe criteriu (criterion-referenced test) cu cea de test centrat pe conţinut (content-
referenced test) sau test centrat pe domeniu (domain-referenced test) (Silva, 1993). În
literatura de specialitate, pentru acest tip de teste se mai foloseşte denumirea de test centrat
pe obiective (de Landsheere, 1975).
Întrucât testele interpretate prin referire la criterii furnizează de obicei un scor numeric,
ele pot fi utilizate şi ca teste normative.
Testele idiografice se utilizează în situaţiile în care nu interesează compararea scorului
unei persoane cu un criteriu sau cu rezultatele unui grup de persoane, ci evoluţia în timp a
scorului său (de exemplu, se urmăresc schimbările intervenite pe parcursul unui program
psihoterapeutic). În asemenea cazuri, persoana completează una şi aceeaşi formă a testului în
mai multe ocazii şi se identifică modificările apărute.
Testele ipsative sunt cele la care interpretarea răspunsurilor date de un individ se face
prin compararea între ele a scorurilor obţinute de acesta la scalele sau la itemii testului
(Corsini, 1994). În general, testele ipsative îi pretind subiectului să aloce o resursă proprie
limitată (timp, bani etc.) mai multor domenii. Prin acest procedeu, atribuirea unei valori mari
pentru un aspect scade automat valorile altor aspecte. De exemplu, pentru studierea motivaţiei
sunt enumerate o serie de activităţi, iar persoana examinată trebuie să indice cât timp îi dedică
fiecăreia, în mod obişnuit, într-o lună.

31 |
32 |
3. EVALUAREA CUNOŞTINŢELOR ÎN ŞCOALĂ

3.1. Evaluarea performanţelor şcolare

Analiza mai multor definiţii ale evaluării în învăţământ (Radu, 2009; I.T. Radu, 1981,
apud Sălăvăstru, 1999; T. Tenfrink, S. Toma şi I. Jinga, apud Jinga, Petrescu, 2008) a permis
formularea următoarelor caracteristici ale acesteia:
• Este un proces, deci o activitate etapizată, desfăşurată în timp.
• Vizează domenii şi probleme complexe (precum sistemul de învăţământ în
ansamblu, curriculum etc.), nu doar performanţele şcolare ale elevilor.
• Începe cu colectarea de informaţii (asupra elevului, a profesorului însuşi sau asupra
programului educativ), care se folosesc la efectuarea a diverse comparaţii, în
principal la compararea rezultatelor sistemului de educaţie sau ale unei părţi a
acestuia cu obiectivele propuse. Unele informaţii sunt obţinute prin măsurări.
• Se finalizează cu emiterea unor aprecieri (deci judecăţi de valoare) cu privire la
rezultatele educaţiei, la eficienţa resurselor, a condiţiilor şi/sau a strategiilor folosite.
Aceste aprecieri sunt estimări ale situaţiei actuale sau prognoze asupra unor situaţii
viitoare.
• Aprecierile servesc drept bază pentru adoptarea unor decizii menite să
îmbunătăţească activitatea în domeniul evaluat.
Evaluarea performanţelor şcolare ale elevilor este una dintre formele de evaluare
practicate în învăţământ.
Performanţele şcolare ale elevilor sunt rezultatul acţiunii unor factori diverşi, care ţin de
elevi, de profesori, de cadrul material-organizatoric, de management. Ele sunt determinate, în
principal, de: calitatea instruirii (îndeosebi a predării), calitatea învăţării, calitatea evaluării şi
de natura relaţiilor dintre predare, învăţare şi evaluare (Jinga, Petrescu, 2008).
Evaluarea performanţelor şcolare are mai multe funcţii:
• funcţia de control (diagnostică) – Evaluarea constată şi apreciază activitatea
desfăşurată de elev şi de profesor în procesul de învăţământ, pe baza comparării
rezultatelor elevilor cu obiectivele proiectate. Ea oferă informaţii cu privire la
nivelul performanţelor elevilor, la un moment dat, şi permite identificarea factorilor
şi a cauzelor succesului/insuccesului şcolar. Diagnoza realizată prin evaluare îl ajută
pe profesor să identifice lacunele şi erorile din cunoştinţele elevilor şi, astfel, să îşi
adapteze predarea la situaţia particulară a fiecărei clase şi, chiar, a fiecărui elev. Ea îi
permite elevului să verifice corectitudinea noţiunilor şi a raţionamentelor pe care şi
le-a însuşit, îi oferă un indiciu pentru reglarea efortului său de învăţare şi îl poate
motiva să înveţe mai mult, pentru a obţine succes.
• funcţia predictivă (prognostică) – În urma evaluării, se pot face predicţii asupra
rezultatelor viitoare ale elevilor, asupra evoluţiei lor, li se poate oferi sprijin acestora
pentru a se orientarea în carieră, anticipând performanţele pe care le-ar obţine.

33 |
Evaluarea le ajută şi părinţilor, prin predicţia făcută asupra succeselor sau, din
contră, a insucceselor copilului, indicându-le dacă este necesar să ia măsuri pentru
a-l ajuta în învăţare.
• funcţia de clasificare şi de selecţie – Pe baza rezultatelor evaluării, elevii pot fi
ierarhizaţi. Această funcţie este utilă mai ales în vederea admiterii într-o formă de
învăţământ, identificându-i pe cei cu rezultatele cele mai bune.
• funcţia de certificare – Evaluarea efectuată la sfârşitul unei forme de învăţământ
permite atestarea însuşirii de către elev a unor cunoştinţe sau deprinderi pe parcursul
studiilor respective.
Scopul major al evaluării performanţelor şcolare îl constituie sprijinirea activităţii de
învăţare a elevilor. Pentru a le fi cu adevărat utilă, evaluarea performanţelor şcolare trebuie să
fie realiză astfel încât să fie respectate următoarele cerinţe psihopedagogice (Jinga, Petrescu,
2008):
• Pregătirea elevului să fie apreciată având în vedere competenţele specifice
disciplinei de studiu şi obiectivele operaţionale ale lecţiilor la care este evaluat.
Cerinţele probelor de evaluare trebuie să fie în concordanţă cu cerinţele formulate
faţă de elevi cu prilejul predării.
• Probele utilizate să se refere la întregul domeniu evaluat, nu doar la o parte a
acestuia, aşa încât să nu îi permită unui elev care nu a învăţat decât fragmente din
materia la care se face evaluarea să obţină un rezultat bun.
• Evaluarea să aibă un caracter stimulator, să îi încurajeze pe elevi să înveţe mai bine,
nu să îi inhibe sau să îi demotiveze. Pentru îndeplinirea acestei cerinţe, evaluarea
trebuie concepută şi prezentată elevilor ca o sarcină comună, firească, şi nu ca o
sancţiune.
Realizarea evaluării în şcoală necesită parcurgerea mai multor paşi (Meyer, 2000):
• definirea a ceea ce se doreşte să se evalueze sau a ceea ce trebuie evaluat;
• construirea sau alegerea instrumentelor ori a metodelor potrivite pentru evaluarea a
ceea ce s-a stabilit la pasul precedent;
• compararea rezultatelor constatate în urma evaluării (a performanţei fiecărui
elev/cursant) cu ceea ce se dorea (performanţa aşteptată);
• comunicarea, prin intermediul unor valori cantitative (note, puncte) sau calitative
(aprecieri, calificative) a rezultatelor evaluării, a diferenţei dintre performanţa
aşteptată şi cea realizată.
Organizarea unei evaluări didactice trebuie să înceapă prin a răspunde întrebării De ce
evaluăm?, adică, Ce scop are evaluarea?. În funcţie de acest răspuns, se va răspunde apoi la
întrebările ce/când/cum/prin ce mijloace/pe ce bază evaluăm?

34 |
3.2. Tipuri de evaluări în şcoală

Având în vedere două dintre scopurile evaluării, în lucrările de didactică se face


distincţie între evaluarea normativă şi cea formativă (Meyer, 2000). Dacă evaluarea verifică
însuşirea unor cunoştinţe, este normativă, iar dacă îl ajută pe elev să înveţe, este formativă.
Evaluarea normativă urmăreşte verificarea achiziţiilor elevilor, comparând
performanţele constatate cu o normă exterioară. Ea măsoară produsele învăţării, alese arbitrar
de un profesor sau de o echipă de profesori, apreciate ca fiind semnificative pentru programa
de învăţământ.
Instrumentele utilizate pentru realizarea evaluării normative sunt de două feluri (Meyer,
2000):
• instrumente relative, care raportează produsul elevului la alte produse realizate de
ansamblul elevilor unei clase sau al elevilor de acelaşi nivel din clasă şi furnizează o
notă care permite plasarea elevului printre cei buni, printre cei mediocri sau printre
cei slabi;
• instrumente binare, care compară produsul elevului cu ceea ce se aşteaptă,
identifică în ce procent componentele aşteptate sunt prezente la acest produs şi câte
dintre ele sunt realizate corect, iar în final dă un rezultat de forma „da”/„nu”,
„reuşit”/„nereuşit”, „admis”/„respins”.
Evaluarea normativă îl ajută pe profesor să îşi evalueze itinerarul pedagogic şi să
verifice dacă acesta se potriveşte fiecărui elev. Evaluarea normativă serveşte, de asemenea,
pentru a decide orientarea spre sau admiterea la o formă de învăţământ, înainte de începerea
unei formări ori a învăţării, şi pentru atestare, după şi, uneori, în timpul învăţării.
Evaluarea normativă efectuată înainte de momentul învăţării are scop de predicţie sau
de prognosticare. Ea se foloseşte în cazul concursurilor de admitere la o şcoală sau într-o
profesie, pentru a-i detecta, dintr-o mulţime de candidaţi, pe cei care sunt cei mai potriviţi să
urmeze anumite discipline de studiu sau să exercite o anumită profesie. Se mai recurge la
evaluare normativă înaintea unei serii de lecţii care vizează stăpânirea unei competenţe,
atunci când respectiva competenţă poate fi însuşită prin itinerare pedagogice care diferă între
ele atât prin obiectivele intermediare urmărite, cât şi prin instrumentele de educaţie şi
situaţiile utilizate. Itinerarul pedagogic al fiecărui elev va fi trasat în funcţie de necesităţile
sale şi de felul său de a învăţa.
Atunci când evaluarea normativă are loc după ce a fost parcurs un itinerar pedagogic
stabilit de către profesor, la sfârşitul unei serii de lecţii consacrate aceleiaşi competenţe, ea
urmăreşte dacă elevii stăpânesc respectiva competenţă. Se recomandă ca pentru o competenţă
să se facă cel puţin o evaluare normativă (Meyer, 2000).
Evaluarea formativă are rolul de a-l ajuta pe elev să înveţe, oferindu-i ocazia să îşi dea
seama ce învaţă, cum învaţă şi de ce reuşeşte să înveţe. Ea măsoară procesele care au condus
la produsele învăţării. Termenul de proces are aici o dimensiune temporală (se referă la
etapele de realizare a produsului, ordonate cronologic) şi o dimensiune cauzală (care priveşte

35 |
mijloacele, instrumentele utilizate pentru realizarea fiecărei etape). Evaluarea formativă
serveşte la luarea unor decizii de reechilibrare a proceselor pe care le utilizează elevul, adică
a mijloacelor cognitive de care dispune, pentru a dobândi o competenţă vizată.
Principalele deosebiri dintre evaluarea normativă şi evaluarea formativă pot fi
schematizate astfel:
• Evaluarea formativă atestă evoluţia cunoştinţelor, în timp ce evaluarea normativă
atestă conformitatea acestor cunoştinţe cu o normă.
• Obiectele evaluării normative sunt produsele vizibile realizate de elevi, care reflectă
prezenţa unei anumite competenţe ce figurează în programa de învăţământ. Fiecare
asemenea produs este măsurat, pentru a şti dacă este conform cu produsul-etalon
aşteptat sau cu media performanţelor realizate de elevii clasei. Obiectele evaluării
formative sunt mijloacele cognitive – sau procesele – care permit să fie îndeplinite
criteriile folosite la evaluarea obiectelor evaluării normative (a produselor). În
evaluarea normativă, actori sunt profesorul şi/sau elevul, în timp ce, în evaluarea
formativă, actor este doar elevul.
• Evaluarea normativă se efectuează la începutul, în timpul sau la sfârşitul învăţării.
Evaluarea formativă se face atât la începutul, cât şi la sfârşitul învăţării.
Scopul evaluării formative fiind diferit de cel al evaluării normative, instrumentele
utilizate în cele două tipuri de evaluări sunt diferite.
Exemplu. În urma prezentării unui text, pentru a realiza o evaluare normativă cu privire
la înţelegerea textului, se va administra un chestionar compus din întrebări care încep, în
general, cu ce, cine, cum, unde, despre ce/cine şi care verifică dacă s-au memorat informaţii
(de exemplu: De unde este extras textul? Cine a scris textul?). Dacă se doreşte o evaluare
formativă, care să-l ajute pe elev să înveţe să lectureze un text, se va administra un chestionar
în care majoritatea întrebărilor încep cu de ce (de exemplu, de ce este utilizată o anumită
expresie, de ce un anumit cuvânt este scris între ghilimele, de ce un cuvânt are articol hotărât
şi nu articol nehotărât) şi care urmăresc dacă elevul ştie cum şi de unde să extragă
informaţiile (de exemplu, Care sunt cuvintele care indică de unde a fost extras textul? Unde
este indicată data publicării textului?).

Trebuie menţionat că termenii evaluare normativă şi evaluare formativă sunt folosiţi şi


cu alte accepţiuni.
De exemplu, I. Radu (2009), vorbind despre comparaţiile pe care este obligat să le facă
un evaluator pentru a putea interpreta rezultatul obţinut de un elev, menţionează următoarele
trei situaţii:
• compararea elevului cu el însuşi, într-un moment anterior, pentru a identifica
progresul sau regresul realizat de acesta;
• compararea elevului cu standardele sau norma grupului-clasă (grupul-clasă fiind un
grup virtual, mai larg decât clasa din care face parte elevul, constituit din clase
paralele sau clase întâlnite în experienţa profesorului), ceea ce se realizează printr-o

36 |
evaluare normativă, care conduce la plasarea elevului deasupra sau dedesubtul
mediei grupului-clasă;
• compararea rezultatului elevului cu obiectivele prevăzute în programă (în
documentele de lucru, în proiectele de lecţie etc.), ceea ce se realizează printr-o
evaluare formativă, care are scopul de a stabili distanţa care-l separă pe elev de
aceste obiective pentru a iniţia – dacă este cazul – activităţi sau programe de lucru
de recuperare şi nu îl include pe elev într-o categorie de forma „peste media
clasei”/„sub media clasei”.
Unii autori (Goia, 2002; Jinga, Petrescu, 2008) iau în considerare momentul în care se
face evaluarea şi utilizează următoarele denumiri:
• evaluarea iniţială (sau diagnostică sau predictivă) – se efectuează la începutul
fiecărui ciclu de instruire (la început de capitol, de semestru, de an şcolar etc.),
pentru a verifica dacă elevii au cunoştinţele necesare pentru a învăţa ceea ce
urmează, pentru a identifica lacunele existente în informaţia şi competenţa elevilor
şi a putea, astfel, stabili măsuri de corectare, pentru fiecare elev în parte;
• evaluarea pe parcurs (sau de progres sau formativă) – se realizează pe tot
parcursul instruirii, prin teste care conţin sarcini prevăzute în obiectivele
operaţionale curente, cu scopul de a regla ritmul instruirii şi de a preveni apariţia
unor lacune, vizează atât nivelul general al clasei, cât şi pe fiecare elev în parte,
ajutându-l să conştientizeze reuşitele şi erorile;
• evaluarea finală (sau sumativă) – este practicată la încheierea semestrului sau a
unui an de studiu, cu scopul de a verifica nivelul instruirii şi posibilităţile de
vehiculare a noţiunilor, a cunoştinţelor şi a competenţelor însuşite.
Pentru evaluarea iniţială, cea mai simplă modalitate de realizare este testul. Întrebările
sunt stabilite de profesor pe baza consultării programei clasei (claselor) anterioare şi a
comparării ei cu programa clasei curente. Ele vizează problemele esenţiale din materia
parcursă, care este absolut necesar să fie cunoscute pentru a se putea realiza în bune condiţii
sarcinile de predare. Spre deosebire de testele folosite la examene, testul de evaluare iniţială
trebuie să conţină astfel de itemi încât răspunsurile elevilor să-l edifice pe profesor dacă
aceştia stăpânesc cunoştinţele şi deprinderile strict necesare continuării instruirii. Sunt
recomandabile răspunsurile de tip eseu şi rezolvările de probleme. Întrebările cu răspunsuri
de tip „da”/„nu” sau „corect”/„greşit” şi cele cu alegere multiplă nu oferă întotdeauna
rezultante relevante, întrucât elevii pot ghici răspunsurile corecte sau pot copia răspunsurile
colegilor (Jinga, Petrescu, 2008).
Pentru evaluarea pe parcurs, profesorul alege metodele de evaluare în funcţie de
specificul obiectului de studiu, de efectivul de elevi, de timpul disponibil, de situaţia
particulară a clasei şi a fiecărui elev.
Evaluarea finală trebuie să verifice dacă elevul cunoaşte lucrurile esenţiale din materia
parcursă şi, în plus, dacă ştie să se folosească de ele în diverse situaţii, adică dacă ştie să
utilizeze cunoştinţele învăţate în practică. În învăţământul preuniversitar, cele mai răspândite

37 |
forme de evaluare finală sunt lucrările scrise semestriale (tezele) şi examenele (de absolvire a
şcolilor profesionale, de bacalaureat).

Alte clasificări ale formelor de evaluare şi câteva definiţii ale tipurilor de evaluare,
formulate pe parcursul celei de-a doua jumătăţi a secolului trecut, sunt prezentate în tabelul
3.1 (după Meyer, 2000).

Tabelul 3.1. Câteva definiţii ale tipurilor de evaluare,


în ordinea cronologică a formulării lor (după Meyer, 2000)

Evaluarea sumativă

Autorul Definiţia

M. Scriven Este o evaluare finală şi externă; ea constă într-o apreciere de ansamblu a schimbărilor
(1967) survenite într-o activitate de formare, care permite echipei decizionale exterioare
operaţiunii să se pronunţe asupra acesteia.

G. De Urmăreşte dacă au fost îndeplinite anumite obiective, cum ar fi cunoştinţele dintr-un


Landsheere curs, însuşirea unei atitudini sau dobândirea unei capacităţi. Evaluarea sumativă se
(1976) traduce printr-un scor. Scorul este rezultatul obiectiv obţinut în urma unui test sau a
oricărei alte forme de evaluare prin adunare sau scădere de puncte, după reguli fixe.

B.-S. Bloom Este legată de clasarea, certificarea sau atestarea progreselor fiecărui elev; ea stabileşte
(1979) gradul în care au fost atinse obiectivele, fie comparându-i pe elevi între ei (interpretare
normativă), fie comparând performanţele manifestate de fiecare cu performanţele
aşteptate (interpretare criterială).

L. Allal Se realizează după încheierea unui itinerar pedagogic, în vederea atestării însuşirii
(1988) cunoştinţelor, prin control continuu sau prin examen final, utilizând instrumente cu
referinţă normativă.

Evaluarea prognostică

Autorul Definiţia

L. Allal Se realizează înaintea unui itinerar pedagogic, în vederea orientării sau al admiterii, fie
(1988) pentru a pune un diagnostic achiziţiilor deja făcute, fie pentru a-i orienta pe anumiţi
elevi spre o filieră specială, în funcţie de dificultăţile reperate. Ea utilizează
instrumente cu referinţă criterială şi/sau instrumente cu referinţă normativă.

Evaluarea diagnostică

Autorul Definiţia

B.-S. Bloom Permite descoperirea punctelor tari şi a punctelor slabe ale elevilor, fie înaintea unei
(1979) unităţi de studiu, fie în timpul desfăşurării acesteia, pentru a putea hotărî sprijinirea
elevilor cu dificultăţi sau adaptarea predării la caracteristicile elevilor.

38 |
Tabelul 3.1. Câteva definiţii ale tipurilor de evaluare,
în ordinea cronologică a formulării lor (după Meyer, 2000) (continuare)

Evaluarea formativă

Autorul Definiţia

M. Scriven Este o evaluare internă, axată pe proces; ea constă într-o apreciere globală sau
(1967) sectorială a schimbărilor ce se produc în timpul unei activităţi de formare, care permite
persoanelor responsabile de conducerea activităţii de formare să îmbunătăţească şi să
ducă la bun sfârşit această activitate.

G. De Are scopul de a identifica situaţiile în care elevul întâmpină o dificultate, în ce constă


Landsheere aceasta şi de a-l informa. Acest tip de evaluare nu se exprimă în note sau în scoruri.
(1976) Are un caracter diagnostic. Ea oferă un feed-back pentru elev şi pentru profesor.

B.-S. Bloom Este acea evaluare care se desfăşoară pe tot parcursul unui itinerar pedagogic, este
(1979) frecventă şi îi permite elevului să-şi remedieze erorile şi lacunele imediat după
apariţia lor şi înainte de declanşarea unui proces cumulativ. Ea compară performanţa
elevului cu un prag de reuşită fixat dinainte, fără a-l judeca sau a-l clasa pe elev.

R. Reprezintă o succesiune de intervenţii periodice care verifică eficacitatea metodelor de


Tousignant predare, îi informează pe elevi în legătură cu progresele realizate şi îi susţin în
(1982) eforturile lor de a atinge obiectivele propuse. Se face fie la începutul învăţării, pentru
a-l ajuta pe profesor să aleagă activităţile cele mai potrivite nevoilor fiecărui elev, fie
pe parcursul învăţării, pentru a sugera activităţi care să remedieze dificultăţile
întâmpinate (caz în care se numeşte evaluare diagnostică sau continuă), fie la
sfârşitul învăţării, pentru a face bilanţul obiectivelor atinse şi pentru a planifica mai
bine cursurile viitoare (caz în care se numeşte evaluare sumativă).

G. Scallon Este un proces de evaluare continuă (şi nu o succesiune de controale făcute la


(1988) întâmplare) care urmăreşte să asigure progresul fiecărui individ angajat într-un proces
de învăţare, cu intenţia de a modifica situaţia de învăţare sau ritmul acestui progres,
pentru a aduce (dacă este cazul) îmbunătăţirile sau corecţiile potrivite.

L. Allal Se realizează pe parcursul itinerarului pedagogic, în vederea reglării interne, utilizând


(1988) instrumente cu referinţă criterială.

Evaluarea normativă

Autorul Definiţia

G. De Serveşte la interpretarea scorului obţinut la un test clasic de inventariere a


Landsheere cunoştinţelor sau de inteligenţă, prin compararea scorului cu o distribuţie statistică de
(1976) scoruri, care constituie norma. În acest fel, performanţa unei persoane este judecată
prin raportare la performanţele altora.

R. Constă în compararea comportamentelor unui individ cu acelea ale indivizilor din


Tousignant acelaşi grup.
(1982)

39 |
Tabelul 3.1. Câteva definiţii ale tipurilor de evaluare,
în ordinea cronologică a formulării lor (după Meyer, 2000) (continuare)

Evaluarea criterială

Autorul Definiţia

R. Constă în compararea comportamentelor unui individ cu cele pe care ar trebui să le


Tousignant manifeste, urmărind diferenţa dintre performanţele aşteptate şi cele realizate, pentru
(1982) fiecare elev în parte.

3.3. Rolul obiectivelor operaţionale în realizarea evaluării didactice

În vorbirea comună, termenii obiectiv, scop şi finalitate sunt utilizaţi adesea ca sinonime.
În literatura pedagogică se face distincţie între ei, dar nu s-a ajuns la un consens cu privire la
locul ocupat de obiectivele didactice (pedagogice, educaţionale) în raport cu finalităţile şi cu
scopurile. Ele sunt văzute fie ca „intenţionalităţi” ale procesului educaţional, alături de
finalităţi şi scopuri, fie ca finalităţi ale educaţiei, cu un grad de generalitate mai scăzut decât
idealul şi scopurile. După cum se poate constata din cele ce urmează, semnificaţia atribuită
obiectivelor didactice este asemănătoare în cele două clasificări.
În cadrul unor simpozioane şi conferinţe UNESCO (1979, 1981) s-a stabilit ca termenii
finalitate, scop şi obiectiv să desemneze în limbajul pedagogic trei grade de generalitate a
„intenţionalităţilor” educaţionale (Preda, 2009):
• Finalităţile sunt „aspiraţii sau intenţionalităţi înalte”, pe termen lung. Ele reprezintă
un sistem de referinţă atât pentru elaborarea programelor şcolare, cât şi pentru
orientarea demersului didactic în clasă.
• Scopurile sunt „aspiraţii, intenţionalităţi pe termen mediu” şi cu un grad de
generalitate mediu.
• Obiectivele (pedagogice) sunt sarcini particulare, mai analitice şi mai concrete ale
procesului educaţional. Ele pot fi atinse în intervale de timp relativ mici, în cadrul
activităţilor didactice, respectiv al sistemelor de lecţii, al unei lecţii etc.
I. Jinga (2008) defineşte educaţia ca „un sistem de acţiuni exercitate în mod conştient,
organizat şi sistematic asupra unor persoane sau grupuri de persoane, în vederea transformării
personalităţii lor, potrivit unor finalităţi la care acestea au aderat”, prin finalităţi ale educaţiei
(pedagogice) înţelegându-se „orientările asumate la nivel de politică a educaţiei în vederea
realizării activităţii de formare-dezvoltare a personalităţii umane conform anumitor valori
angajate în proiectarea sistemului şi a procesului de învăţământ (S. Cristea, 1998, apud Jinga,
2008). În ordinea descrescătoare a generalităţii lor, finalităţile pedagogice sunt (Jinga, 2008):
• idealul educativ, care exprimă orientările strategice ale unui sistem educativ într-o
anumită etapă istorică a dezvoltării economico-sociale, ştiinţifice şi culturale a unei
ţări, stabilite prin politica educaţiei;

40 |
• scopul, care vizează finalitatea unei acţiuni educative determinate, prefigurând
rezultatele aşteptate de la fiecare tip de instituţie şi treaptă de şcolarizare sau de la
diferite elemente componente ale educaţiei (intelectuală, morală, fizică etc.);
• obiectivul pedagogic, care este „un enunţ cu caracter anticipativ care descrie, în
termeni de schimbare comportamentală observabilă şi (eventual) măsurabilă,
rezultatele aşteptate de la o activitate concretă, menită să asigure realizarea unui
scop”.
Rezultă că la nivelul unui subsistem al învăţământului se poate vorbi despre ideal, ca
finalitatea cea mai generală a proceselor de formare şi perfecţionare (descrie modelul de profil
uman şi de specialist într-un anumit domeniu), despre scop, pentru a indica finalităţile unui
anumit tip de şcoală sau ale unui program de perfecţionare, şi despre obiective, atunci când se
precizează scopurile sau se descriu finalităţile la nivelul unei discipline de învăţământ, al unei
teme, al unui capitol, sistem de lecţii, lecţii sau secvenţe de instruire.
Alţi autori pun semnul egalităţii între finalităţi şi scopuri, dar împart obiectivele în două
categorii.
Astfel, de exemplu, Viviane şi Gilbert de Landsheere (apud Jinga, 2008) consideră că
există trei niveluri de definire a obiectivelor educaţiei:
• finalităţile sau scopurile educaţiei, care reprezintă „ceea ce apare ca încheiere şi
totodată ca scop, motivul pentru care ceva se face sau există”;
• obiectivele definite după marile categorii comportamentale (taxonomiile), care
leagă finalităţile sau scopurile educaţiei de acţiunea cotidiană, indicând tipul de
comportament (cognitiv, afectiv sau psihomotor) vizat prin educaţie;
• obiectivele operaţionale, care informează educatorul asupra comportamentelor
observabile care vor fi realizate în urma unor activităţi concrete de instruire şi
educare.
Krathwol (apud Jinga, 2008) include scopurile în categoria obiectivelor, iar pe acestea le
ierarhizează, în funcţie de întrebuinţarea care li se dă, pe trei niveluri de generalitate:
• scopurile cele mai generale, urmărite de orice şcoală pe perioada mai multor ani de
instruire;
• obiective comportamentale, care permit să se descompună scopurile generale în
scopuri specifice;
• obiective operaţionale, care asigură analiza cea mai detaliată, la nivel de lecţie.
În cele ce urmează, vom utiliza pentru obiectivele pedagogice accepţiunea dată de I.
Jinga (2008): un obiectiv didactic exprimă o intenţie pedagogică, descrie un comportament
dorit, un rezultat aşteptat de la elevi, ca efect al parcurgerii unei secvenţe de instruire.
Obiectivele pedagogice au fost clasificate în diverse feluri.
Luând drept criteriu tipul de activitate (predominant intelectuală sau predominant
acţională) la care se referă, obiectivele au fost împărţite în două categorii (Jinga, 2008):
• obiective informative, care vizează cunoaşterea (achiziţionarea cunoştinţelor într-un
anumit domeniu);

41 |
• obiective formative, care vizează formarea unor deprinderi şi capacităţi,
posibilitatea de a opera cu sistemul de informaţii, de cunoştinţe şi valori asimilate în
procesul de instruire.
După importanţa acordată unui obiectiv în cadrul unui subsistem de instruire, unei
discipline de învăţământ sau unei activităţi didactice concrete, se vorbeşte despre (Jinga,
2008):
• obiective principale (fundamentale, dominante);
• obiective secundare (auxiliare)
Corespunzător domeniilor comportamentale la care se referă, obiectivele pedagogice au
fost clasificate în trei categorii (Sălăvăstru, 1999):
• obiective cognitive, care vizează asimilarea de cunoştinţe, formarea de deprinderi şi
capacităţi intelectuale;
• obiective afective, care au în vedere formarea sentimentelor, atitudinilor,
convingerilor;
• obiective psihomotorii, care se referă la formarea unor deprinderi motorii, a unor
abilităţi manuale.
Unii autori au adăugat şi o a patra categorie, aceea a obiectivelor morale sau
psihosociale (Jinga, 2008).
Pentru fiecare dintre aceste categorii au fost elaborate diverse taxonomii ale obiectivelor.
O taxonomie este o clasificare în care categoriile (clasele) formate sunt ordonate,
alcătuind o structură de arbore. Cele aflate la un nivel inferior (care sunt subordonate altora)
satisfac toate condiţiile pe care le îndeplinesc cele situate pe un nivel superior şi, în plus, alte
condiţii. De exemplu, clasa „mese” se găseşte la un nivel inferior, în timp ce clasa „mobile” se
află la un nivel superior.
B.S. Bloom a realizat, la jumătatea secolului trecut, o taxonomie a obiectivelor din
domeniul cognitiv, ordonând obiectivele de la simplu la complex şi grupându-le în şase
categorii, reunite în două categorii mari, dintre care prima conţine o categorie, iar a doua,
celelalte cinci (Sălăvăstru, 1999):
• obiective care vizează cunoaşterea şi implică doar evocarea din memorie a datelor
înmagazinate (date particulare, convenţii, clasificări, metode, principii, legi şi
teorii);
• obiective care vizează formarea deprinderilor şi a capacităţilor intelectuale, adică
modurile în care se utilizează sau se operează cu informaţiile dobândite, grupate în
următoarele cinci categorii:
¾ comprehensiunea (capacitatea de înţelegere);
¾ aplicarea (utilizarea noţiunilor şi a regulilor asimilate anterior pentru a rezolva
situaţii noi);
¾ analiza (capacitatea de gândire analitică, logică, deductivă);
¾ sinteza (activităţi creative realizate printr-o restructurare proprie a datelor
cunoscute);
¾ evaluarea (formularea judecăţilor de valoare, a opiniilor).

42 |
În prima mare categorie sunt incluse obiective de ordin informativ, iar în cea de-a doua,
obiective de ordin formativ.
La sfârşitul seculului al XX-lea, L. Anderson şi D. Krathwohl au revizuit taxonomia lui
Bloom. Ei au inversat locurile categoriilor sinteză (pe care au denumit-o creare) şi evaluare şi
au realizat o clasificare a obiectivelor cognitive, în care fac deosebire între tipurile de
cunoştinţe (fapte, concepte, principii, proceduri, strategii metacognitive) şi tipurile de procese
cognitive implicate în învăţare. Noua clasificare se reprezintă sub forma unui tabel, care
conţine pe coloane procesele cognitive, iar pe linii, dimensiunile (sau nivelurile) cunoştinţelor
(tabelul 3.2).

Tabelul 3.2. Taxonomia lui Bloom revizuită (după Dalton, 2003)

Dimensiu- Categoria proceselor cognitive


nea Memo- Înţelegere Aplicare Analiză Evaluare Creare
cunoştin- rare
ţelor
Fapte Memo- Înţelegerea Aplicarea Analiză Evaluare Creare
rarea faptelor faptelor utilizând utilizând utilizând
faptelor fapte, fapte, fapte,
Concepte/ Memo- Înţelegerea Aplicarea concepte, concepte, concepte,
principii rarea conceptelor conceptelor principii şi principii şi principii şi
concep- proceduri proceduri proceduri
telor
Proceduri Memo- Înţelegerea Aplicarea
rarea procedu- procedu-
procedu- rilor rilor
rilor
Metacog- Memo- Înţelegerea Aplicarea Analiza Evaluarea Crearea
niţii rarea strategiilor strategiilor strategiilor strategiilor strategiilor
strate- metaco- metacog- metacog- metacog- metacog-
giilor nitive nitive nitive nitive nitive
metacog-
nitive
Cunoştinţe Deprinderi Abilităţi

În noua taxonomie, categoriile de procese cognitive sunt definite astfel (Wilson, 2006):
• Memorarea: recunoaşterea sau reproducerea informaţiilor stocate în memorie. Se
realizează prin reproducerea de definiţii, fapte sau liste, recitarea sau evocarea unui
material memorat.
• Înţelegerea: construirea de materiale inteligibile prin diverse funcţii, precum
interpretare, exemplificare, clasificare, rezumare, inferenţă, comparare şi explicare.
• Aplicare: executarea unei proceduri. Se referă la situaţii în care materialul învăţat
este folosit pentru a realiza produse cum sunt: modele, prezentări, interviuri sau
simulări.

43 |
• Analiză: descompunerea materialului în părţi, determinarea relaţiilor dintre părţi sau
a relaţiilor părţilor cu o structură ori cu un scop. Analiza se bazează pe diferenţiere,
organizare, atribuire şi pe realizarea de distincţii între componente sau părţi.
• Evaluarea: realizarea de judecăţi bazate pe criterii şi standarde, care se finalizează
prin critici, recomandări şi rapoarte. Adesea, evaluarea este o parte necesară a
comportamentului care precede crearea a ceva.
• Crearea: punerea împreună a elementelor pentru a forma un întreg coerent şi
funcţional, reorganizarea elementelor pentru a forma o structură nouă, prin generare,
planificare sau producere. Crearea se finalizează cu o formă nouă sau cu un produs
nou.
Pentru dimensiunile cunoştinţelor sunt folosite următoarele descrieri (Wilson, 2006):
• Cunoştinţele factuale (faptele) sunt cunoştinţele despre ceea ce este fundamental
într-o disciplină specifică: fapte esenţiale, terminologie, detalii sau elemente pe care
este obligatoriu să le cunoască cineva pentru a înţelege o disciplină sau a rezolva
probleme din cadrul disciplinei.
• Cunoştinţele conceptuale (conceptele) sunt cunoştinţele despre clasificări, principii,
generalizări, teorii, modele sau structuri dintr-o disciplină particulară.
• Cunoştinţele procedurale (procedurile) sunt cunoştinţele sau informaţiile care ajută
la realizarea a ceva specific unei discipline, adică: metode de cercetare, deprinderi
foarte specifice, algoritmi, tehnici, metodologii particulare.
• Cunoştinţele metacognitive (metacogniţiile) sunt cunoştinţele despre propriile
procese cognitive, despre propriile cunoştinţe stocate în memorie, despre procedeele
utilizate în operarea cu aceste cunoştinţe şi despre propriul mod de a raţiona.
Există o puternică asociere între primele trei categorii de procese cognitive (cele care
ocupă coloanele din stânga ale tabelului 3.2 şi primele trei tipuri de cunoştinţe (cele care
figurează pe primele trei linii din tabelul 3.2), în sensul că, cel mai des li se cere elevilor să-şi
amintească fapte, să înţeleagă concepte şi să aplice proceduri. Ultimele trei tipuri de procese
cognitive folosesc, în general, mai multe tipuri de cunoştinţe.
În ultima linie a tabelului 3.2 sunt notaţi termenii folosiţi mai frecvent pentru a denumi
categoriile de procese cognitive din taxonomia lui Bloom revizuită: cunoştinţe, deprinderi şi
abilităţi.
Taxonomiei propuse de Bloom i s-au adus o serie de critici (Preda, 2009), dintre care
unele – cum ar fi faptul că analiza nu condiţionează neapărat sinteza şi evaluarea (respectiv,
evaluarea şi crearea) – sunt valabile şi pentru versiunea revizuită a acesteia.
O altă clasificare, care le poate fi utilă profesorilor la formularea obiectivelor procesului
de predare-învăţare, este clasificarea „morfologică” elaborată de E. De Corte şi colaboratorii
săi (1979, apud Preda, 2009). La baza clasificării lui De Corte, se află modelul structurii
intelectului elaborat de J.P. Guilford. Schema de clasificare propusă de De Corte şi
colaboratorii săi cuprinde şapte categorii de obiective cognitive, fiecare reprezentând o formă
de comportament cognitiv (o operaţie): recepţionarea (perceperea) informaţiilor,
recunoaşterea informaţiilor, reproducerea informaţiilor, producţie interpretativă de

44 |
informaţii, producţii convergente de informaţii, producţie divergentă de informaţii şi
producţie evaluativă de informaţii. Ea nu este o taxonomie, întrucât nu plasează obiectivele
cognitive într-o structură ierarhică.
V. Preda (2009) propune o schemă a derivării/integrării obiectivelor pedagogice în
raport cu scopurile şi finalităţile educaţiei şcolare. În această schemă, scopurile generale ale
educaţiei realizate prin sistemul de învăţământ se transpun în obiective educaţionale
intermediare profilate, de nivel mediu de generalitate şi de nivel prospectiv mediu, care se
împart în obiective pe niveluri de şcolarizare (pe cicluri de învăţământ) şi obiective pe tipuri
de profiluri de pregătire şcolară şi profesională. Din aceste obiective sunt derivate obiectivele
generale şi specifice diferitelor discipline şcolare. Pentru formularea lor, se au în vedere
epistemologia şi structura logică a ştiinţelor, epistemologia şi logica didactică, principiile şi
legităţile psihologiei învăţării şi psihologia genetică (îndeosebi dezvoltarea stadială a
inteligenţei).
Pe baza obiectivelor generale şi specifice fiecărei discipline şcolare se stabilesc, pe
capitole, pe sisteme de lecţii şi pe lecţii, două tipuri de obiective educaţionale:
• obiective care se pot operaţionaliza, fiind exprimabile în termeni comportamentali
direct observabili şi „măsurabili” (obiectivele psihomotorii şi obiectivele din
domeniul cognitiv, cu excepţia celor care vizează rezolvarea de probleme pe căi
euristice şi a obiectivelor cu nuanţă creativă);
• obiective care nu se pot operaţionaliza (cele care vizează capacităţi şi trăsături
deosebit de complexe – afective, motivaţionale, atitudinale –, a căror formare,
dezvoltare şi integrare se realizează în intervale lungi de timp, după interiorizarea
semnificaţiilor valorice ale mai multor activităţi şi situaţii educaţionale).
Prin operaţionalizarea obiectivelor educaţionale se înţelege precizarea unor
comportamente cognitive şi/sau psihomotorii direct observabile şi „măsurabile”, astfel încât
să se creeze o imagine clară şi concretă a performanţei pe care va trebui să o obţină elevul în
urma instruirii, adică a ceea ce se va evalua şi a criteriilor pe baza cărora se va face evaluarea
(Preda, 2009).
Un obiectiv operaţional este un obiectiv educaţional transpus la nivelul concret al
actului pedagogic al activităţii de învăţare a elevilor, exprimat în termeni de comportamente şi
performanţe observabile (F. Voiculescu, 1995, apud Sălăvăstru, 1999). Obiectivul operaţional
descrie ce va şti şi ce va fi capabil să facă elevul la sfârşitul unei activităţi de instruire. Este
vorba despre ceva ce elevul nu ştia sau nu putea să facă înainte de instruire. Obiectivele
operaţionale anticipează, deci, o schimbare comportamentală observabilă şi măsurabilă şi se
realizează de către un singur educator, pe parcursul unei activităţi didactice determinate (de
regulă, o lecţie) (Jinga, 2008).
G. De Landsheere (1979, apud Sălăvăstru, 1999) şi I. Jinga (2008) apreciază că
formularea completă a unui obiectiv operaţional implică precizarea următoarelor aspecte:
• cine va produce comportamentul dorit;

45 |

care este capacitatea care trebuie să se formeze prin activitatea de instruire
(asimilarea de noi cunoştinţe, formarea unor deprinderi intelectuale sau motorii,
formarea unei atitudini);
• ce comportament observabil (ce acţiune concretă) va dovedi că obiectivul este atins;
• care va fi produsul acestui comportament (performanţa);
• în ce condiţii trebuie să aibă loc comportamentul;
• pe temeiul căror criterii se poate trage concluzia că produsul este satisfăcător (care
este nivelul de performanţă acceptabil).
Vom detalia, în continuare, aceste aspecte, enumerând un ansamblu de condiţii care se
cer a fi respectate atunci când se formulează un obiectiv operaţional (după Jinga, 2008;
Kubiszyn, Borich, 1996; Preda, 2009; Sălăvăstru, 1999):
• Orice obiectiv operaţional trebuie să se refere la activitatea de învăţare a elevului şi
nu la activitatea profesorului. Formularea unui obiectiv se face în termeni de
prescripţie: „elevul va fi capabil să …”.
• Obiectivul trebuie să corespundă nivelului de dezvoltare a elevilor şi să vizeze o
dificultate surmontabilă.
• Orice obiectiv precizează o modificare calitativă (nu doar cantitativă) a capacităţilor
elevilor, apărută ca urmare a unei activităţi instructiv-educative dirijate. O asemenea
schimbare poate avea loc la nivelul unei acţiuni mintale, al unei operaţii logice, al
algoritmului de învăţare etc.
• Un obiectiv operaţional se centrează pe procese, acţiuni, acte, operaţii observabile,
uşor de constatat, şi nu pe procese psihice „interne”, care nu pot fi observate şi
evaluate precis. Pentru descrierea acestora se folosesc „verbe de acţiune”, concrete
şi atât de precise încât toţi cei care iau cunoştinţă de obiectiv (profesori şi elevi) să-şi
reprezinte produsul aşteptat sub aceeaşi formă. Asemenea verbe de acţiune sunt: a
identifica, a preciza, a enumera, a defini, a compara, a descrie, a clasifica, a desena,
a rezolva, a demonstra, a reprezenta grafic, a aplica etc. Sunt interzise enunţurile
ambigue, care permit interpretări variate, şi verbele abstracte, cum sunt: a cunoaşte,
a înţelege, a asimila, a şti, a aprecia, a sesiza semnificaţia, a se familiariza.
• Obiectivul trebuie să vizeze o singură operaţie (acţiune), pentru a permite evaluarea
gradului său de realizare.
• Fiecare obiectiv trebuie să specifice condiţiile didactice, psihopedagogice
(materialele didactice şi instrumentele utilizate, timpul de realizare a sarcinii,
instrucţiunile primite de elev, precum şi limitele şi restricţiile impuse activităţii
elevului), în contextul cărora elevii vor exersa şi vor dovedi că au ajuns la
schimbarea calitativă şi/sau cantitativă preconizată. Aceste condiţii vizează atât
procesul învăţării pentru atingerea obiectului operaţional, adică situaţiile de învăţare
care determină modificările educative preconizate, cât şi condiţiile în care vor fi
evaluate performanţele. Pentru precizarea condiţiilor, se utilizează formule verbale
precum: „după citirea textului/tabelului/graficului/hărţii”, „având acces la…”, „fiind

46 |
date …”, „pus în situaţia de …”, „utilizând …”, „fără a folosi …”, „cu ajutorul …”
etc.
• Obiectivul operaţional descrie nivelul la care trebuie să se situeze elevul în privinţa
unor cunoştinţe, deprinderi, abilităţi sau atitudini, sub aspect calitativ şi cantitativ.
Este vorba despre prezenţa sau absenţa unei capacităţi, a unei calităţi sau trăsături,
despre timpul de realizare a unei sarcini, caracteristicile erorilor acceptabile,
concordanţa sau non-concordanţa cu un standard, numărul de încercări admise,
caracteristicile unui produs material obţinut prin activitatea practică etc. Adesea, se
include în obiectivul educaţional numărul ori procentul de itemi pe care elevul
trebuie să îi rezolve corect sau numărul de itemi la care elevul trebuie să răspundă
într-un interval de timp dat. Nivelul minim de acceptare a rezultatului se stabileşte în
funcţie de importanţa, complexitatea, dificultatea şi gradul de noutate al
obiectivului, dar nu poate fi mai mic de 40% din performanţa maximă. Unii autori
(de exemplu, R. Mager) susţin că obiectivul operaţional trebuie să precizeze nivelul
minim de realizare la care se poate considera că obiectivul a fost atins, în timp ce
alţii (de exemplu, L. Vlăsceanu) afirmă că trebuie stabilite mai multe niveluri de
performanţă (minimale, medii şi maximale). Dacă obiectivul operaţional va servi ca
bază pentru a cunoaşte situaţia fiecărui elev în parte, atunci el va preciza doar ceea
ce trebuie să facă o persoană pentru a se putea afirma că a realizat obiectivul sau că
se află la un anumit nivel de performanţă. În cazul în care, însă, obiectivul
operaţional trebuie să-i ofere profesorului un mijloc de a verifica dacă activitatea sa
didactică s-a finalizat cu succes, atunci el va indica şi procentul minim de elevi
pentru care va fi atins obiectivul sau procentul elevilor care se vor afla pe fiecare
nivel de performanţă.
• Datorită faptului că, atunci când obiectivul operaţional vizează un comportament
complex (precum rezolvarea de probleme, realizarea unui produs nou, formarea unei
atitudini), este posibil ca rezultatul acţiunii elevului să nu fie prevăzut de educator,
se recomandă ca în astfel de situaţii să se descrie doar condiţiile în care trebuie să se
producă respectivul comportament, nu şi actul comportamental particular.
Exemple de obiective operaţionale
1. La sfârşitul cursului, studenţii vor fi capabili să identifice metodele care pot fi utilizate
pentru aproximarea coeficientului de fidelitate al unui test psihologic, pe baza manualului
testului. Obiectivul va fi considerat atins dacă sunt identificate metodele potrivite pentru 4 din
5 teste.
2. La sfârşitul primului semestru, fiind date 20 de exerciţii care conţin câte două operaţii
aritmetice, elevul va fi capabil să rezolve corect, în timp de 15 minute, cel puţin 10 exerciţii.
3. La sfârşitul cursului, studenţii vor fi capabili să efectueze analiza de itemi pentru un
test psihologic. Obiectivul se consideră atins dacă cel puţin 75% dintre studenţi calculează
corect cel puţin doi dintre următorii indici: indicele de dificultate, indicele de discriminare şi
indicele de validitate.

47 |
Operaţionalizarea obiectivelor este un demers pedagogic complicat, dificil mai ales la
disciplinele care conţin informaţii a căror stăpânire se evaluează prin criterii combinate,
cantitative şi calitative, cum sunt disciplinele umaniste şi cele sociale.
Se pot proiecta obiectivele educaţionale luând în considerare taxonomia obiectivelor din
domeniul cognitiv realizată de B.S. Bloom şi specificând comportamente pentru fiecare
categorie de obiective. În acest scop, se recomandă utilizarea următoarelor verbe de acţiune
(Kubiszyn, Borich, 1996):
• pentru cunoaştere: a defini, a descrie, a identifica, a numi, a enumera, a alege, a
recita, a evoca din memorie;
• pentru comprehensiune: a explica, a deosebi, a distinge, a estima, a prognoza, a
generaliza, a infera, a rezuma, a parafraza;
• pentru aplicare: a schimba, a calcula, a demonstra, a rezolva, a transfera, a organiza,
a dezvolta, a prepara, a produce, a utiliza;
• pentru analiză: a ilustra, a sublinia, a deduce, a diferenţia, a separa, a subdivide;
• pentru sinteză: a crea, a compune, a formula, a rescrie, a planifica;
• pentru evaluare: a interpreta, a justifica, a critica, a trage concluzii, a verifica, a
compara.

Pentru a se verifica dacă obiectivele educaţionale fixate au fost atinse, se compară aceste
obiective cu rezultatele şcolare ale elevilor, în cadrul procesului de evaluare.
Prin rezultate şcolare se înţelege „ansamblul achiziţiilor şi modificărilor înregistrate în
planul personal al elevilor/evaluaţilor, în urma parcurgerii unui program educaţional” (Bocoş,
Jucan, 2007). În funcţie de complexitatea lor şi de intervalul de timp în care au fost obţinute,
rezultatele şcolare se prezintă sub următoarele ipostaze (Bocoş, Jucan, 2007):
• prestaţia elevului, care constituie o manifestare de moment, un act elementar
efectuat de elev;
• performanţa elevului, care este un rezultat mai complex şi mai semnificativ, se
referă la realizarea unei sarcini de învăţare;
• competenţele elevului, care reprezintă ansambluri integrate de cunoştinţe, capacităţi
şi abilităţi de aplicare, operare şi transfer al achiziţiilor, care permit desfăşurarea cu
succes a unei activităţi, rezolvarea eficientă a unei clase de probleme, situaţii;
• conduita elevului, care se referă la ansamblul reacţiilor, al relaţiilor cu colegii, al
acţiunilor şi atitudinilor sale, în contextul rezolvării sarcinii de învăţare, la felul său
de a se comporta şi de a-şi îndeplini obligaţiile şcolare.
Fiecare dintre aceste ipostaze permite să se verifice îndeplinirea unor anumite tipuri de
obiective educaţionale (tabelul 3.3).

48 |
Tabelul 3.3. Tipurile de obiective educaţionale a căror îndeplinire
poate fi verificată prin fiecare ipostază a rezultatelor şcolare
(după Bocoş, Jucan, 2007)

Ipostaza rezultatelor şcolare Obiective educaţionale


prestaţia elevului obiective operaţionale
performanţa elevului obiective operaţionale şi neoperaţionale
competenţele elevului obiective educaţionale de generalitate medie
sau generale
conduita elevului obiective operaţionale şi neoperaţionale,
obiective educaţionale de generalitate medie
sau generale

Probele utilizate pentru evaluare sunt elaborate sau selectate în strânsă legătură cu
obiectivele operaţionale fixate, în funcţie de gradul de complexitate al obiectivului (asimilare
de cunoştinţe, aplicaţie, sinteză, evaluare).
Verbele de acţiune utilizate în formularea obiectivelor operaţionale au o importanţă
deosebită pentru proiectarea sau alegerea instrumentelor de evaluare, întrucât ele indică ce
trebuie să facă elevul în timpul probei de evaluare.
Rezultatele obţinute de fiecare elev, la sfârşitul unui program educaţional, sunt apreciate
prin raportare la unul sau mai multe dintre următoarele criterii:
• obiectivele de evaluare;
• nivelul atins de ceilalţi elevi;
• rezultatele obţinute de acelaşi elev la începutul programului, pentru a se decide dacă
a înregistrat un progres sau un regres.
Obiectivele de evaluare reprezintă finalităţi instructiv-educative operaţionalizate, care
precizează ce, cum şi cât trebuie să fie capabili să realizeze elevii, mai precis, care sunt
comportamentele vizate la aceştia, în ce condiţii se produc aceste comportamente şi care este
nivelul performanţei acceptabil (Bocoş, Jucan, 2007; Goia, 2002). Foarte frecvent, obiectivele
de evaluare se suprapun peste obiectivele operaţionale (Bocoş, Jucan, 2007).

3.4. Precizarea termenilor: Test de cunoştinţe sau test docimologic?

Principalele metode de verificare a cunoştinţelor în şcoală sunt (Jinga, Petrescu, 2008l


Radu, 2009):
• observaţia curentă;
• chestionarea sau examinarea orală;
• probele scrise (extemporale, teze, teste, chestionare, referate, eseuri, proiecte etc.);
• probe practice (probe la educaţie fizică, lucrări practice în laborator sau atelier etc.);
• evaluarea cu ajutorul calculatorului;
• portofoliul.

49 |
Testele pedagogice de cunoştinţe, denumite, de unii autori, teste docimologice, iar de
alţii, teste de cunoştinţe sau, simplu, teste, fac parte dintre probele scrise de evaluare a
cunoştinţelor.
Un test de cunoştinţe este un grupaj de întrebări sau teme − numite itemi − care
răspund unui set de sarcini intelectuale şi practice, arată ce ştie persoana evaluată ca
informaţie şi ce ştie să facă (adică, priceperi, deprinderi şi operaţii) şi prevede un barem de
notare care dă o notă obiectivă, reducând divergenţele de notare (Radu, 1995).
Baremul este o grilă de evaluare şi notare unitară, care descompune tema evaluată în
subteme şi prevede, pentru fiecare subtemă, un punctaj stabilit prin consensul profesorilor.
Punctajele se însumează, iar rezultatul se transformă într-o notă şcolară (Radu, 1995).
Conform definiţiei enunţate, testul de cunoştinţe este o probă – nu neapărat standardizată
sub alte aspecte decât cel al cotării – care conduce la o notă şcolară.
Exemplu. Pentru verificarea cunoştinţelor despre fidelitatea testelor psihologice se
construieşte următoarea probă, compusă din opt teme:
1. Definiţi fidelitatea unui test psihologic şi comentaţi cât mai detaliat definiţia,
referindu-vă la coeficientul de fidelitate şi la erorile de măsură.
2. Enumeraţi principalele metode pentru evaluarea fidelităţii unui test psihologic.
3. Definiţi paralelismul a două probe psihologice.
4. Indicaţi cum se poate construi o probă psihologică paralelă cu o probă dată şi cum se
poate verifica dacă noua probă este paralelă cu cea dată.
5. Indicaţi condiţiile în care se poate aproxima coeficientul de fidelitate al unui test
psihologic folosind metoda test-retest.
6. Descrieţi un test psihologic pentru care nu se poate calcula coeficientul de consistenţă
internă α (Cronbach).
7. Precizaţi condiţiile în care coeficientul de consistenţă α coincide cu coeficientul KR20.
8. Daţi un exemplu de probă psihologică pentru care, pentru cercetarea fidelităţii este
necesar să se calculeze coeficientul de fidelitate inter-evaluatori.

Baremul acestei probe descompune fiecare temă în subteme şi indică numărul de puncte
care se acordă fiecărei subteme dacă s-a răspuns corect (tabelul 3.4).

50 |
Tabelul 3.4. Exemplu de barem

Numărul Punctajul Punctajele subtemelor


temei temei
1 10 1 punct pentru definiţia fidelităţii din Standards for Educational and
Psychological Test,
1 punct pentru definiţia scorului observat,
1 punct pentru definiţia scorului real,
1 punct pentru definiţia erorii de măsură,
1 punct pentru prezentarea deosebirii dintre erorile de măsură sistematice
şi cele aleatoare,
1 punct pentru precizarea tipului de erori de măsură care influenţează
fidelitatea,
1 punct pentru definiţia coeficientului de fidelitate,
3 puncte pentru comentarea valorilor coeficientului de fidelitate;
2 5 câte un punct pentru fiecare dintre metodele: metoda test-retest, metoda
formelor paralele, metoda analizei consistenţei interne, metoda
coeficienţilor de fidelitate inter-evaluatori; metoda coeficienţilor de
fidelitate intra-evaluator;
3 1 1 punct pentru redarea corectă a definiţiei;
4 4 1 punct dacă se menţionează că cele două probe au acelaşi număr de
itemi,
1 punct dacă se precizează că fiecare item din proba construită are un
corespondent în proba dată, itemii corespondenţi fiind de acelaşi tip,
având aceeaşi dificultate şi fiind cotaţi în acelaşi mod;
2 puncte dacă se indică faptul că se administrează cele două probe mai
multor eşantioane de subiecţi şi se verifică dacă în fiecare eşantion pentru
cele două probe scorurile observate au aceeaşi medie şi aceeaşi abatere
standard;
5 2 1 punct dacă se menţionează că scorurile reale ale subiecţilor nu se
modifică între test şi retest,
1 punct dacă se precizează că răspunsurile subiecţilor la retest nu sunt
influenţate de răspunsurile lor la test;
6 2 2 puncte dacă este descrisă o probă care este compusă dintr-un singur item
sau o probă al cărei scor nu se calculează prin însumarea cotelor itemilor
componenţi;
7 1 1 punct dacă se precizează că itemii testului sunt dihotomici;
8 2 2 puncte pentru descrierea unei probe care nu este cu cotare obiectivă.
Punctaj 27
maxim
pentru
probă
Se precizează modul de transformare al punctajului obţinut în urma rezolvării probei în
notă şcolară: se împarte punctajul la 3, rezultatul se rotunjeşte la cel mai apropiat întreg şi se
adună 1.

Temele care pot compune un test de cunoştinţe sunt foarte diverse. Cele utilizate mai
frecvent pot fi clasificate astfel (Radu, 1995):
• teme de simplă atestare a stăpânirii unei informaţii (din memorie), cum ar fi enunţul
unei definiţii, reguli, teoreme sau redarea unei descrieri ori a unei clasificări;

51 |
•teme de aplicare a informaţiei în sarcini de recunoaştere şi clasificare pe un
material inedit – judecăţi asupra apartenenţei la o clasă/grupare;
• teme de angajare a efortului de gândire, de rezolvare de probleme – pot lua forma
interpretării unui text, a comentării acestuia, identificarea şi analiza unei relaţii
cauză-efect, reunirea unui grupaj de evenimente/fapte sub aceeaşi teză, regularitate
sau principiu etc. Pot fi rezolvări de probleme (care sunt mai frecvente la
matematică, fizică şi chimie), teme de analiză literară, gramaticală, de recunoaştere a
unei plante nestudiate încă etc.
• teme de integrare sau stabilire de corelaţii în cadrul unui capitol ori între capitole
diferite, apropiate sau distanţate în timp.
În sfera testelor de cunoştinţe sunt incluse şi teste care nu au rolul de a verifica, sub
aspectul cantităţii şi al calităţii, informaţiile achiziţionate de elev şi, eventual, modul de
folosire a cunoştinţelor dobândite. Aşa sunt testele simulatoare, folosite mai ales în formarea
unor deprinderi şi abilităţi (I. Holban, 1995, apud Jinga, Petrescu, 2008).

Deşi cuvântul test indică faptul că proba este standardizată (adică sunt prevăzute
instrucţiuni clare privind condiţiile în care se administrează, modul în care se calculează
scorul şi modul în care se interpretează acesta), în cazul testelor de cunoştinţe se obişnuieşte
să se vorbească despre (Gronlund, 1967):
• teste standardizate, care sunt elaborate de specialişti, administrate, cotate şi
interpretate în condiţii standardizate, adică în conformitate cu reguli specifice
(valabile doar pentru un test) şi uniforme (valabile pentru toţi cei care le utilizează),
şi care sunt destinate să fie folosite pe scară largă;
• teste informative, care sunt construite de profesorul care predă la o clasă şi sunt
interpretate prin raportarea fiecărui scor individual la scorurile clasei respective sau
la o grilă stabilită de cel care le-a elaborat.
Deosebirea principală dintre testele standardizate şi cele informative este dată de scopul
pentru care sunt folosite.
Testele elaborate de către profesor se folosesc în primul rând pentru măsurarea
îndeplinirii obiectivelor pedagogice propuse şi se administrează clasei pentru care au fost
construite.
Testele standardizate se utilizează pentru a compara rezultatele unei clase sau ale unei
persoane cu datele externe oferite de normele testului. Astfel de teste se administrează în şcoli
pentru a compara scorurile între clase, şcoli sau localităţi sau pentru a urmări evoluţia
scorurilor de la un an la altul. Ele se utilizează şi în scop diagnostic, pentru a identifica elevii
cu dificultăţi la învăţare şi pentru a evalua diverse programe de studiu.
Aceste deosebiri de scop determină diferenţe de structură, de administrare şi de
interpretare între cele două tipuri de teste.
Testele standardizate se deosebesc de cele informative din trei puncte de vedere
(Lindeman, 1978):

52 |
• Testele standardizate sunt administrate întotdeauna în aceleaşi condiţii. Fiecare test
standardizat este însoţit de un manual, care include instrucţiuni pentru administrare şi
cotare. Timpul alocat diverselor subsecţiuni ale testului este menţionat în aceste
instrucţiuni şi trebuie respectat cu stricteţe, pentru a putea interpreta rezultatele prin
comparare cu cele obţinute de un alt grup sau de o altă persoană.
• Testele standardizate cuprind întotdeauna norme (etaloane), determinate pe baza
unui eşantion numeros, reprezentativ pentru populaţia din care a fost extras.
• Testele standardizate ocupă o mai mare varietate de conţinut decât cele informative.
Ele pot fi inadecvate pentru măsurarea unor obiective pedagogice formulate de
profesori pentru o anumită activitate de instruire.
În funcţie de scopul în care se utilizează, testele informative se împart în două categorii
(Kubiszyn, Borich, 1996):
• teste relative la normă – sunt cele care furnizează informaţii despre locul pe care îl
ocupă fiecare elev în cadrul clasei, având în vedere performanţele sale la test;
• teste relative la criteriu – sunt cele care permit să se afle dacă nivelul unui elev în
privinţa cunoştinţelor sau a deprinderilor verificate de test este cel aşteptat.
Exemplu. Atunci când interesează nivelul deprinderii unui elev de a efectua cele patru
operaţii aritmetice se administrează un test relativ la criteriu şi se urmăreşte dacă elevul a
rezolvat cel puţin N% dintre exerciţiile testului, numărul N fiind fixat de profesorul care a
construit testul. Dacă, însă, se doreşte să se compare un elev cu ceilalţi din clasă sub aspectul
deprinderii de a efectua cele patru operaţii aritmetice, se administrează un test relativ la normă
şi se ierarhizează elevii din clasă pe baza scorurilor obţinute la test.

Principala deosebire dintre testele relative la normă şi cele relative la criteriu este gradul
lor de generalitate. Testele relative la criteriu măsoară, destul de precis, o singură deprindere.
Testele relative la normă măsoară mai multe deprinderi, însă nu foarte precis, astfel încât nu
permit să se deducă dacă un elev are nivel satisfăcător la fiecare deprindere în parte.
În testele relative la normă itemii au dificultăţi diferite, unii fiind foarte uşori, alţii foarte
greu de rezolvat corect, iar cei mai mulţi având dificultate medie. Testele relative la criteriu
sunt compuse din itemi de dificultăţi apropiate între ele şi nu foarte dificili, aşa încât fiecare
item să poată fi rezolvat corect de aproximativ 80% dintre elevi (Kubiszyn, Borich, 1996).

De obicei, testele de cunoştinţe sunt considerate sinonime cu testele docimologice. Unii


autori, însă, fac distincţie între testele de cunoştinţe, testele pedagogice şi testele
docimologice.
De exemplu, Bocoş şi Jucan (2007) includ testele (în rândul cărora intră testele de
cunoştinţe) şi testele docimologice, ca probe de tip diferit, alături de lucrările de control şi
lucrările scrise semestriale (tezele), între cele mai răspândite forme de evaluare scrisă.
Autoarele consideră că testul este „un instrument de evaluare scrisă cu structură, calităţi şi
însuşiri/atribute specifice”, dintre care le amintesc pe următoarele (Bocoş, Jucan, 2007):
• poate verifica atingerea unui număr mare de obiective ale actului didactic;

53 |
• permite o măsurare mai obiectivă a performanţelor elevilor în comparaţie cu alte
probe de evaluare;
• poate poseda însuşiri ale investigaţiei experimentale, ceea ce îi conferă o mai mare
precizie;
• asigură condiţii identice de evaluare pentru cei evaluaţi, ceea ce permite evidenţierea
diferenţelor individuale dintre aceştia;
• operează cu bareme de prelucrare şi interpretare a răspunsurilor, clare şi
operaţionale;
• permite să se compare rezultatele obţinute de cei evaluaţi.
În accepţiunea autoarelor menţionate, baremul (sau etalonul) este un sistem de referinţă
la care se raportează performanţele şi conduita subiecţilor evaluaţi (Bocoş, Jucan, 2007). De
data aceasta, nu se mai face referire la transformarea punctajului obţinut la test în notă şcolară.
Din definiţia prezentată rezultă că testele de cunoştinţe sunt probe standardizate în
privinţa modului de administrare, al modului de cotare şi al modului de interpretare a
rezultatelor.
Ion Holban (1995, apud Bocoş, Jucan, 2007) foloseşte denumirea de teste pedagogice
pentru testele de cunoştinţe care evaluează cunoştinţele dobândite în şcoală, în contexte
educaţionale formale, în secvenţe specifice de predare-învăţare. Unele teste pedagogice
realizează evaluarea elevilor acordând o notă, altele oferă doar o certificare, în raport cu un
standard prestabilit, a suficienţei/insuficienţei performanţelor elevilor într-o situaţie
educaţională dată.
Dintre testele pedagogice sunt denumite teste docimologice doar acelea care „se
folosesc la concursuri, promovări sau examinări curente” (Holban, 1995, apud Bocoş, Jucan,
2007) şi care sunt standardizate (Bocoş, Jucan, 2007). În această accepţiune, sunt considerate
teste docimologice: testele naţionale, administrate elevilor din ciclul gimnazial; testele
utilizate la bacalaureat; testele administrate candidaţilor la concursurile pentru ocuparea
posturilor vacante în învăţământul preuniversitar.
I. Radu (1995) foloseşte denumirea de teste docimologice pentru testele de cunoştinţe
care sunt standardizate sub aspectul conţinutului şi al modului de administrare şi notare, dar
care nu sunt etalonate. Dacă există şi etaloane, ele sunt denumite probe normalizate (Radu,
1995). Acestea din urmă sunt mai puţin răspândite în practica şcolară.
I. Jinga şi A. Petrescu (2008) utilizează denumirea de test docimologic pentru testele
care îndeplinesc o funcţie docimologică, adică de examinare şi notare, fără a impune restricţia
de standardizare. Ei consideră că testul de cunoştinţe şi testul docimologic sunt cazuri
particulare ale testului de evaluare didactică (T.E.D.). Prin test de evaluare didactică autorii
amintiţi înţeleg „o probă complexă formată dintr-un ansamblu de itemi care, în urma aplicării
în condiţii cvasiidentice, oferă, pe baza unor măsurători şi aprecieri judicioase, informaţii
pertinente referitoare la modul de realizare a obiectivelor didactice, la progresul şcolar, la
direcţiile de intervenţie de perspectivă a cadrelor didactice pentru ameliorarea eficienţei
demersurilor instructiv-educative” (Jinga, Petrescu, 2008, pag. 398). „Testul de evaluare
didactică cuprinde judecăţi de valoare nu numai referitoare la rezultatele şcolare, ci şi la

54 |
modul de organizare a procesului de învăţământ, la eficacitatea metodelor didactice şi a
modului de concepere a obiectivelor didactice.” (Jinga, Petrescu, 2008, pag. 398).
Un test de evaluare didactică are următoarele componente (Jinga, Petrescu, 2008):
• obiectivele didactice stabilite în corelaţie cu conţinuturile de învăţământ;
• conţinuturile itemilor;
• rezolvările itemilor;
• performanţa maximă specifică (PMS), care reprezintă nivelul comportamental
maxim ce poate fi atins de elev folosind în exclusivitate elementele specifice
procesului de evaluat;
• performanţa minimă admisă (pma), prin care se înţelege nivelul comportamental
minim ce atestă dobândirea de către elev a capacităţii necesare pentru trecerea într-o
etapă următoare de instruire.
Pe baza PMS şi pma se calculează nota şcolară corespunzătoare unui scor x obţinut la
test, astfel:
pma − x
dacă x<pma, atunci: nota = 5 − 4 × ;
pma
dacă x=pma, atunci nota=5;
x − pma
dacă x>pma, atunci nota= 5 + 5 × .
PMS − pma
Scorul posibil la test fiind cuprins între 0 şi PMS, nota corespunzătoare este cuprinsă
între 1 (pentru x=0) şi 10 (pentru x=PMS).

3.5. Avantaje şi dezavantaje ale utilizării testelor de cunoştinţe în şcoală

Comparativ cu alte forme de evaluare didactică, testul de cunoştinţe prezintă avantajul


de a oferi rezultate mult mai obiective, întrucât scorul fiecărei persoane se calculează prin
raportare la un barem.
Este cunoscut faptul că, atunci când evaluează o prestaţie a elevului, profesorul este
influenţat de informaţiile anterioare pe care le are despre acesta. S-a constatat, în urma unui
experiment (G. Noizet, J. Caverni, 1978, apud Radu, 1995), că, atunci când evaluatorilor li se
oferă informaţii cu privire la nivelul elevilor pe care îi evaluează – chiar dacă aceste
informaţii sunt false –, ei acordă note diferite unor prestaţii şcolare (răspunsuri, lucrări) de
aceeaşi calitate, elevii „buni” obţinând o medie mai mare decât elevii „slabi”.
S-a constatat, de asemenea, că atunci când corectează lucrări scrise, profesorilor le
rămân neobservate mai multe greşeli la elevii pe care îi consideră „buni” decât la cei „slabi”,
întrucât ei se aşteaptă ca elevii buni să nu comită greşeli (G. De Landsheere, 1975, apud
Radu, 1995). Este un fenomen de inerţie a percepţiei, subsumabil teoriei consonanţei/
disonanţei cognitive.
În notarea răspunsurilor (orale sau scrise), evaluatorii sunt puternic influenţaţi de primele
impresii pe care şi le-au format despre elevi. Acelaşi număr de greşeli conduce către o notă

55 |
mai mică atunci când greşelile apar la începutul prestaţiei elevului, decât dacă ele sunt
poziţionate spre sfârşit (G. Noizet, J. Caverni, 1978, apud Radu, 1995).
Frecvenţa erorilor de tipul celor menţionate este mult diminuată în cazul testelor de
cunoştinţe, care sunt cotate cu ajutorul unei grile, fiind aproape nulă atunci când cotarea se
realizează cu ajutorul calculatorului.
Testele de cunoştinţe prezintă, însă, şi unele dezavantaje, printre care faptul că verifică
doar fragmente din totalul informaţiilor şi al deprinderilor ce alcătuiesc un domeniu şi permit
numai într-o măsură redusă verificarea capacităţilor de elaborare, de raţionament şi de
exprimare (Radu, 1995).

56 |
4. EVALUAREA CUNOŞTINŢELOR ÎN CONTEXT NON-ŞCOLAR

4.1. Organizarea programelor de pregătire profesională

4.1.1. Rolul programelor de formare/dezvoltare profesională

Un program de formare sau de dezvoltare profesională este un proces prin care


angajaţii unei organizaţii îşi însuşesc cunoştinţele şi deprinderile care sunt fundamentale
pentru a-şi putea îndeplini cu succes sarcinile aferente posturilor pe care le ocupă şi/sau
abilităţile de a reuşi (abilităţi de a gândi autonom, de a lua decizii şi de a-şi asuma
responsabilitatea consecinţelor acestora etc.) (Dessler, 1997; Paloş, 2004).
Programele de formare profesională (training-urile) se adresează noilor angajaţi ai unei
organizaţii şi celor care lucrează în organizaţie de mai mult timp dar urmează să ocupe alte
posturi.
Programele de dezvoltare profesională sunt destinate angajaţilor care au vechime pe
postul pe care îl ocupă în organizaţie şi înregistrează rezultate nesatisfăcătoare în muncă.

4.1.2. Paşii programelor de formare/dezvoltare profesională

Organizarea şi desfăşurarea unui program tipic de formare/dezvoltare profesională


constau din următorii cinci paşi (Dessler, 1997):
• analiza nevoilor de instruire;
• realizarea designului instruirii;
• validarea programului;
• implementarea programului;
• evaluarea programului.

Analiza nevoilor de instruire


Înainte de proiectarea unui program de formare sau de dezvoltare profesională într-o
organizaţie trebuie să se afle dacă este, cu adevărat, necesar acest program şi ce ar fi de dorit
să se realizeze prin intermediul lui. Cu alte cuvinte, trebuie să se identifice nevoile de instruire
ale angajaţilor organizaţiei.
O nevoie de instruire este o discrepanţă – în ceea ce priveşte cunoştinţele, deprinderile
şi/sau abilităţile de a reuşi – între o stare actuală şi o stare dorită, care ar putea fi eliminată
prin instruire (Paloş, 2004).
Identificarea nevoilor de instruire a angajaţilor trebuie să înceapă cu analiza organizaţiei
pentru a cunoaşte scopurile şi obiectivele acesteia, resursele fizice şi umane de care dispune şi
pe care le poate mobiliza, precum şi cadrul în care angajaţii îşi desfăşoară activitatea (politici,
reguli, norme, climat, relaţii între angajaţi etc.) (Paloş, 2004).

57 |
În cazul angajaţilor noi şi al celor care urmează să îndeplinească sarcini noi, identificarea
nevoilor de instruire înseamnă să se afle ce sarcini vor avea de efectuat persoanele respective
şi care sunt cunoştinţele şi deprinderile de care au nevoie pentru a le realiza cu succes.
Pentru persoanele care lucrează în organizaţie şi nu obţin performanţele aşteptate în
muncă, identificarea nevoilor de instruire urmăreşte să depisteze domeniile în care s-ar putea
interveni prin instruire pentru a ridica nivelul acelor cunoştinţe sau deprinderi care, fiind
deficitare, împiedică realizarea sarcinilor de muncă în condiţii bune. Acest lucru este destul de
dificil în cazul posturilor care nu sunt bine definite şi al celor care nu necesită aptitudini
specifice. În plus, există posibilitatea ca performanţele scăzute să nu fie cauzate de pregătirea
profesională insuficientă a angajaţilor, ci de factori de altă natură, precum lipsa motivaţiei
pentru performanţă în muncă sau utilizarea unor criterii de evaluare a performanţelor neclare
ori nepotrivite posturilor.
Metodele prin care se pot identifica nevoile de instruire sunt diverse: autoevaluarea
realizată de angajaţi, focus-grup, evaluările făcute de supervizori, ancheta pe bază de
chestionar sau de interviu, metoda Delphi, observarea, testarea cunoştinţelor specifice postului
etc. (Paloş, 2004). Două metode sunt folosite mai frecvent:
• analiza postului – utilă mai ales pentru organizarea programelor de formare
profesională –, care constă în analiza cerinţelor postului şi determinarea
cunoştinţelor şi a deprinderilor specifice postului care sunt absolut necesare pentru a
obţine succes în muncă;
• analiza performanţelor – utilă îndeosebi pentru organizarea programelor de
dezvoltare profesională –, care încearcă să identifice diferenţele între ceea ce fac
persoanele şi ceea ce ar trebui să facă.
Analiza postului se poate servi de descrierea postului şi de specificarea postului.
Descrierea postului se obţine în urma analizei muncii cerute de post din perspectiva
sarcinilor. Ea indică activităţile esenţiale ale ocupantului postului şi oferă descrieri detaliate,
concrete, ale modului de realizare a acestor activităţi (J. Sandberg, 2000, apud Vîrgă, 2004).
Se prezintă sub forma fişei postului şi oferă informaţii despre poziţia postului în structura
formală a organizaţiei şi despre scopul, obiectivele, îndatoririle, activităţile şi
responsabilităţile postului respectiv.
Specificarea postului este rezultatul analizei muncii cerute de post din perspectiva
ocupantului postului. Ea indică un set de caracteristici psihologice care îi sunt solicitate
ocupantului postului. Aceste cerinţe se referă la (Vîrgă, 2004):
• cunoştinţe – ceea ce trebuie să ştie ocupantul postului pentru a realiza sarcinile
impuse de post;
• deprinderi – ceea ce o persoană trebuie să facă în postul respectiv;
• aptitudini – capacităţile persoanei de a obţine performanţe bune în realizarea
sarcinilor de muncă, potenţialul ei de a învăţa, de a-şi dezvolta unele calităţi şi de
a-şi consolida unele deprinderi pentru a-şi îmbunătăţi performanţa în muncă;

58 |
• alte particularităţi individuale, care nu sunt incluse printre cele enumerate deja şi au
rol în realizarea cu succes a sarcinilor postului (de exemplu, unele aspecte legate de
personalitate, precum conştiinciozitatea etc.).
Uneori, pe lângă descrierea postului şi specificarea postului se realizează un formular de
înregistrare a analizei sarcinilor. Acesta se prezintă sub forma unui tabel cu şase coloane.
Prima coloană conţine sarcinile postului, descompuse în sub-sarcini, fiecare pe câte o
linie. Celelalte cinci coloane se referă la aceste sarcini şi sub-sarcini şi cuprind următoarele
informaţii:
• frecvenţa efectuării sarcinii sau a sub-sarcinii;
• standardele de cantitate şi de calitate pe baza cărora se apreciază dacă sarcina sau
sub-sarcina a fost efectuată acceptabil;
• condiţiile în care se efectuează sarcina sau sub-sarcina (de exemplu, zgomot,
umiditate, temperatură ridicată/scăzută etc.);
• cunoştinţe şi deprinderi necesare pentru efectuarea sarcinii sau a sub-sarcinii (acesta
este elementul esenţial pentru a putea stabili ce vor învăţa participanţii la programul
de formare profesională);
• condiţiile în care se poate învăţa cel mai bine cum să se efectueze sarcina sau sub-
sarcina (de exemplu, la locul de muncă, prin practică înainte de a lucra pe post,
într-un simulator etc.)
Nu este obligatoriu ca pentru fiecare sarcină sau sub-sarcină să se completeze toate cele
cinci coloane.
Analiza postului serveşte la întocmirea unui profil ideal al ocupantului postului.
Evaluarea cunoştinţelor, a deprinderilor şi a atitudinilor unui angajat care ocupă postul
respectiv permite realizarea profilului acestuia. Prin compararea profilului angajatului cu
profilul ideal se evidenţiază diferenţele care apar şi care ar putea fi reduse sau eliminate prin
programe de instruire.
Analiza performanţelor urmăreşte să identifice unde apar deficienţe semnificative în
realizarea sarcinilor de muncă şi să determine dacă acestea pot fi corectate printr-un program
de dezvoltare profesională sau sunt necesare alte mijloace (de exemplu, înlocuirea
angajaţilor).
Primul pas al analizei performanţelor constă în evaluarea performanţelor angajaţilor. Se
compară, apoi, acestea cu performanţele aşteptate.
Este esenţial să se depisteze dacă angajaţii nu pot sau nu vor să obţină performanţele
care li se cer. Atunci când persoanele nu pot atinge standardele de performanţă, se impune
identificarea cauzelor: selecţia ocupanţilor posturilor nu a fost bine efectuată, formarea
ocupanţilor posturilor nu a fost bine realizată, angajaţii nu ştiu cum să îşi îndeplinească
sarcinile sa nu ştiu ce li se cere etc. Dacă, însă, angajaţii pot dar nu vor să obţină
performanţele aşteptate de la ei, s-ar putea să fie necesar să se modifice sistemul de
recompensare a angajaţilor.

59 |
Realizarea designului instruirii
În această etapă se formulează obiectivele de instruire, se decide ce metode şi
instrumente se vor folosi, se descriu secvenţe de conţinut, se construiesc exemple, exerciţii şi
activităţi. La organizarea programului de formare/dezvoltare profesională trebuie să se ţină
seama de teoriile învăţării la vârsta adultă.
Se pregătesc toate materialele care le vor servi participanţilor şi formatorilor pe
parcursul programului: textele conţinând prezentarea teoriei, înregistrările video sau audio,
planşele, caietele de notiţe pentru participanţi etc. Se verifică dacă acestea sunt realizate în
conformitate cu caracteristicile participanţilor (vârstă, nivel de studii etc.), dacă servesc
atingerii obiectivelor de instruire fixate şi dacă au o bună calitate grafică sau sonoră.
Un obiectiv de instruire (numit şi obiectiv de formare/dezvoltare) este o descriere a
unei performanţe pe care participanţii la program vor fi capabili să o realizeze după o secvenţă
de instruire sau la sfârşitul programului. La fel ca obiectivele pedagogice formulate de
profesorii care lucrează în învăţământ, obiectivele de instruire pentru programele de
formare/dezvoltare precizează:
• ce vor fi capabili participanţii să realizeze (performanţa);
• în ce condiţii vor obţine aceste performanţe;
• care sunt criteriile sau standardele în funcţie de care se apreciază rezultatele.
Dacă programul urmăreşte completarea unor cunoştinţe, atunci obiectivele vor evidenţia
informaţiile care vor fi stăpânite de participanţi. De exemplu: La sfârşitul acestui program
(training), participanţii vor putea să construiască un test de cunoştinţe folosind modulul
Gestiune teste de cunoştinţe din platforma CAS++.

Validarea programului
Se desfăşoară programul de formare/dezvoltare cu un număr redus de participanţi, din
aceeaşi categorie (în ceea ce priveşte postul ocupat, nivelul de studii, vârsta etc.) cu
persoanele cărora le este destinat programul. Pe baza observaţiilor făcute în această etapă se
vor modifica unele componente sau/şi materiale ale programului.

Implementarea programului
Se desfăşoară programul cu participarea persoanelor pentru care a fost organizat.
Pentru a creşte şansele ca programul să aibă succes este bine ca înainte de începerea
derulării sale să aibă loc un antrenament al formatorilor care îl vor conduce.

Evaluarea programului
Modelul tradiţional al evaluării unui program de formare/dezvoltare profesională
cuprinde patru niveluri de culegere şi prelucrare a datelor (F. Bee, R. Bee, apud Paloş, 2004):
1. Nivelul reacţional: se încearcă să se surprindă ce simt şi ce gândesc participanţii
despre program, gradul de mulţumire al acestora faţă de activităţile de instruire la care au luat
parte.

60 |
2. Nivelul efectelor imediate, directe: se urmăreşte dacă pe parcursul derulării
programului s-au obţinut rezultatele aşteptate de organizatorii săi. Se procedează în două
moduri:
• pentru a verifica dacă participanţii au achiziţionat cunoştinţe sau/şi deprinderi, se
realizează două evaluări, una la începutul şi una la sfârşitul programului, şi se
compară rezultatele;
• se fac evaluări, pe parcursul programului, după fiecare secvenţă de învăţare, pentru a
se verifica dacă au fost îndeplinite obiectivele de instruire fixate.
Dacă programul are ca scop dobândirea de cunoştinţe, pentru evaluarea efectelor
imediate ale programului se utilizează teste de cunoştinţe. Se recomandă folosirea întrebărilor
dihotomice şi a celor cu răspunsuri la alegere pentru verificarea însuşirii de noţiuni, proceduri,
reguli şi reglementări, şi a întrebărilor cu răspunsuri deschise, atunci când se testează
înţelegerea unor situaţii complexe, capacitatea de aplicare a cunoştinţelor în practică (Paloş,
2004).
În cazul unui program de formare de deprinderi, evaluarea va urmări dacă participanţii
ştiu să aplice cele învăţate. Deprinderile se vor fragmenta (în funcţie de gradul lor de
complexitate) în unităţi mai mici şi se va încerca să se identifice gradul de dezvoltare a
acestora, folosind jocul de rol, simularea unor situaţii din viaţă etc.
Atunci când programul are ca scop formarea sau schimbarea unor atitudini, se vor utiliza
chestionare de evaluare a atitudinilor. Însă nu există siguranţa că răspunsurile participanţilor
vor fi sincere, întrucât aceştia ştiu ce se aşteaptă de la ei.
Evaluarea abilităţii de a reuşi include măsurarea cunoştinţelor şi a deprinderilor, precum
şi o evaluare a judecăţilor, atitudinilor şi comportamentelor care reflectă modul în care
participanţii pun în practică deprinderile şi cunoştinţele.
3. Nivelul efectelor indirecte, practice: se urmăreşte dacă după terminarea programului
de formare/dezvoltare s-a schimbat comportamentul participanţilor la locul lor de muncă şi
s-a îmbunătăţit performanţa, în cazul programelor de dezvoltare profesională, respectiv dacă
performanţa în muncă a participanţilor este cea aşteptată, în cazul programelor de formare
profesională. Se apelează la evaluări făcute de supervizori şi se măsoară performanţa în
muncă a persoanelor la un timp după terminarea programului de formare/dezvoltare.
4. Nivelul efectelor organizaţionale: se verifică dacă programul de formare/dezvoltare a
condus la o creştere a performanţelor organizaţiei.
Pentru a putea aprecia dacă programul de formare/dezvoltare a fost eficient, dacă
îmbunătăţirea performanţei în muncă este datorată celor învăţate de participanţi în cadrul
programului şi nu are alte cauze, se recomandă să se efectueze un experiment controlat
(Dessler, 1997). Acesta constă în formarea a două grupuri de persoane (un grup experimental
şi unul de control), similare în ceea ce priveşte postul ocupat, nivelul de studii, vârsta şi alte
variabile care ar putea influenţa modul de îndeplinire a sarcinilor de muncă. Doar grupul
experimental participă la programul de formare/dezvoltare. Se măsoară performanţa în muncă
a ambelor grupuri, după terminarea programului, iar în cazul programelor de dezvoltare, şi
înainte de începerea programului (când performanţele celor două grupuri trebuie să fie

61 |
asemănătoare). Se apreciază că programul a fost util, dacă după terminarea lui performanţele
grupului experimental sunt mai mari decât cele ale grupului de control. Dacă nu se constată
diferenţe între cele două grupuri, atunci cauza o reprezintă un factor extern programului (de
exemplu, sistemul de salarizare a personalului, care nu motivează angajaţii să obţină rezultate
bune în muncă).
În cele mai multe organizaţii nu se practică acest experiment, ci se consideră că un
program de formare/dezvoltare a avut succes dacă după terminarea sa participanţii la program
obţin performanţe în muncă mai bune decât înainte, în cazul programelor de dezvoltare,
respectiv la nivelul aşteptat, în cazul programelor de formare.
Evaluarea unui program de formare/dezvoltare va arăta dacă acesta a fost eficient, care
au fost punctele sale tari şi cele slabe. Ea le serveşte:
• formatorilor, pentru a putea organiza cât mai bine activităţile următoare, luând în
considerare rezultatele acestui program;
• participanţilor, care află astfel cât de mult au învăţat ca urmare a participării la
program;
• organizaţiei care a plătit programul respectiv, pentru a şti dacă rezultatele promise
înainte de desfăşurarea programului au fost obţinute.

4.1.3. Utilizarea testelor de cunoştinţe în programele de formare/dezvoltare


profesională

Administrarea unui test de cunoştinţe poate fi utilă în două etape ale programului de
formare/dezvoltare:
a. pentru identificarea nevoilor de instruire;
b. pentru evaluarea programului.
a. Dacă în urma analizei postului se constată că acesta necesită cunoştinţe dintr-un
anumit domeniu, se va administra un test de cunoştinţe viitorilor participanţi la program.
În cazul unui program de formare profesională, când viitorii ocupanţi ai postului
urmează să dobândească prin program cunoştinţele necesare postului, testul de cunoştinţe va
conţine întrebări referitoare la elemente (noţiuni, reguli, legi etc.), din acelaşi domeniu sau din
domenii înrudite, care trebuie să fie cunoscute pentru a se putea preda noile cunoştinţe.
Când se intenţionează să se organizeze un program de dezvoltare profesională, este
necesar să se ştie dacă performanţele scăzute în muncă ale viitorilor participanţi ar putea fi
cauzate de absenţa cunoştinţelor de specialitate şi, în consecinţă, ar trebui să se aloce timp
pentru predarea acestora. Testul de cunoştinţe va conţine întrebări care vizează noţiuni şi
reguli esenţiale din domeniul de cunoştinţe identificat de analiza postului ca fiind foarte
important pentru a se putea îndeplini cu succes sarcinile de muncă.
În ambele situaţii, răspunsurile obţinute la testul de cunoştinţe vor servi la stabilirea
conţinutului programului de formare/dezvoltare. Vor prezenta interes, în acest sens, întrebările
la care o mare parte dintre viitorii participanţi nu au ştiut să răspundă corect.

62 |
b. Testele de cunoştinţe folosite pentru evaluarea programelor de formare/dezvoltare au
acelaşi rol ca testele de cunoştinţe informale utilizate în şcoală pentru verificarea îndeplinirii
obiectivelor pedagogice stabilite. Prin urmare, ele vor fi construite la fel ca acestea, iar
răspunsurile date de cei examinaţi vor fi folosite în acelaşi mod.

4.2. Selecţia profesională

4.2.1. Rolul selecţiei profesionale

Selecţia este procesul prin care se culeg şi se evaluează informaţii despre o persoană, cu
scopul de a i se oferi un post într-o organizaţie. Acesta poate fi primul post pe care îl ocupă în
organizaţie, dacă persoana nu a mai lucrat acolo, sau o poziţie nouă, dacă ea este deja angajată
în organizaţie (Gatewood, Feild, 2001). Uneori se face distincţie între cele două situaţii, în
sensul că pentru ocuparea unui post de o persoană provenită din exteriorul organizaţiei se
utilizează o gamă largă de instrumente de evaluare (interviu, teste etc.), în timp ce pentru
promovare în cadrul organizaţiei se recurge doar la discuţii cu superiorii candidatului şi la
analizarea performanţelor în muncă ale acestuia
Selecţia profesională are scopul de a-i identifica, dintr-o mulţime de candidaţi pentru un
post, pe aceia care au cunoştinţele, deprinderile şi abilităţile potrivite pentru a realiza bine
sarcinile de muncă ale postului respectiv.
Orice selecţie pentru un post începe cu analiza postului. Se culeg informaţii despre
sarcinile sau activităţile cerute de post, rezultatele muncii (produsele sau serviciile),
echipamentul şi materialele folosite, persoanele cu care se interacţionează şi mediul
(condiţiile de muncă, programul de lucru, eventualele riscuri etc.) care caracterizează postul.
Aceste informaţii sunt necesare, pe de o parte, pentru a le oferi posibililor candidaţi o imagine
despre natura şi cerinţele postului şi, astfel, a-i ajuta să nu-şi formeze aşteptări mult diferite de
realitate, iar pe de altă parte, pentru a pregăti paşii următori ai procesului de selecţie.
Se identifică apoi dimensiunile importante ale performanţei în muncă, adică acele
aspecte ale muncii desfăşurate de ocupantul postului care permit să se aprecieze dacă acesta
obţine sau nu succes. Se definesc, astfel, criteriile procesului de selecţie.
Un criteriu este o variabilă prin care se măsoară performanţa în muncă sau un aspect al
(o dimensiune a) acesteia. Este variabila dependentă, care trebuie prezisă cu ajutorul
metodelor sau al instrumentelor folosite în selecţie.
Criteriile se deduc în urma analizei postului pentru care se face selecţia sau se preiau din
unele modele ale performanţei în muncă. De exemplu, Bernadin şi Beatty (1984, apud Vîrgă,
2004) consideră că dimensiunile performanţei în muncă (în general) sunt:
• calitatea;
• cantitatea;
• respectarea termenelor;
• eficienţa costurilor;
• nevoia de supervizare;

63 |
• impactul interpersonal.
Unii autori (de exemplu, W.C. Borman şi S.J. Motowidlo, 1993, apud Vîrgă, 2004) fac
distincţie între performanţa în sarcinile de muncă aferente postului şi performanţa
contextuală. Performanţa în sarcinile de muncă reprezintă eficienţa cu care angajatul
realizează activităţi care ţin de slujba sa. Performanţa contextuală (numită şi
comportament organizaţional civic) constă în manifestarea unor comportamente prosociale,
care promovează bunătatea individuală sau a grupurilor din organizaţii, precum altruismul,
cinstea, bunătatea şi dezvoltarea personală.
Ţinând cont de criteriile alese pentru aprecierea performanţei pe postul de muncă,
specialiştii în resurse umane determină care sunt cunoştinţele, deprinderile, abilităţile şi alte
caracteristici ale persoanei (de exemplu, trăsăturile de personalitate) pe care trebuie să le aibă
o persoană care, dacă ar fi angajată pe post, ar obţine succes în muncă. Pentru fiecare criteriu
se încearcă să se identifice una sau mai multe asemenea variabile care, prin valorile lor, ar
putea prezice valoarea criteriului la fiecare persoană. Aceste variabile se numesc predictori.
Se aleg predictorii pentru care sunt disponibile metode sau instrumente de evaluare. De
exemplu, chiar dacă se presupune că un bun predictor al performanţei în munca de manager ar
fi capacitatea de organizare, se renunţă la el dacă nu există posibilitatea de a-l măsura la
fiecare candidat pentru post.
Instrumentele folosite cel mai frecvent pentru evaluarea predictorilor fac parte din
următoarele trei categorii (Gatewood, Feild, 2001):
• instrumente de culegere a informaţiilor generale despre candidaţi: CV-ul (în care
candidatul se descrie şi îşi prezintă activitatea desfăşurată la locurile de muncă
precedente), referinţele despre candidat (obţinute de la persoane care cunosc bine
candidatul) şi chestionarul de date biografice (care conţine întrebări despre
experienţele de viaţă ale candidatului);
• interviul de selecţie;
• teste de aptitudini, teste de cunoştinţe şi chestionare de personalitate.
Ultimul pas al selecţiei este cel de validare a întregului proces de selecţie. Se culeg şi se
evaluează informaţii pentru a determina dacă:
• acele caracteristici ale persoanelor care au fost considerate importante pentru
obţinerea succesului în muncă (predictorii) şi care au fost evaluate la candidaţi au,
într-adevăr, legătură semnificativă cu performanţa în muncă;
• strategia folosită (adică, algoritmul utilizat pentru a alege, pe baza informaţiilor
oferite de predictori, din mulţimea candidaţilor, persoanele care au fost angajate pe
post) a condus la selectarea unor persoane cu performanţe bune în muncă.
Se validează, deci, fiecare instrument de măsurare a predictorilor şi strategia de selecţie.
Există mai multe metode de validare a predictorilor. Cel mai des se utilizează validarea
relativă la criteriu, calculând coeficientul de corelaţie liniară între scorurile instrumentului cu
care este măsurat predictorul şi valorile criteriului pe care se presupune că acesta îl prezice.

64 |
Pentru ca rezultatele obţinute în urma cercetării validităţii relative la criteriu a unui
instrument folosit la evaluarea unui predictor să fie utile, trebuie să fie îndeplinite următoarele
condiţii (Gatewood, Feild, 2001):
• Sarcinile de muncă aferente postului pentru care se face selecţia să fie stabile, să nu
se afle într-o perioadă de schimbări.
• Criteriul să fie măsurat cu un instrument care are o fidelitate bună.
• Măsurarea predictorului şi a criteriului să se facă într-un eşantion de persoane care să
fie reprezentativ pentru populaţia pentru care se va folosi predictorul şi care să aibă
un volum mare (câteva sute de persoane).
Atunci când se efectuează un studiu de validare pentru un predictor, dacă s-a constatat că
acesta corelează cu criteriul – ceea ce ar însemna că predictorul este valid – este necesară
repetarea validării predictorului folosind un alt eşantion de persoane cu aceleaşi caracteristici
ca primul eşantion în privinţa variabilelor care ar putea influenţa relaţia dintre predictor şi
criteriu (de exemplu, sex, vârstă, pregătire profesională). Numai dacă şi în acest eşantion
predictorul se dovedeşte a fi valid se va putea utiliza predictorul în selecţie.
Se recomandă ca validarea predictorilor să se realizeze chiar în organizaţia în care
aceştia vor fi utilizaţi pentru selecţie. Dar, atunci când un instrument de evaluare s-a dovedit a
fi valid pentru selecţia pe un post într-o organizaţie, el poate fi folosit şi în alte organizaţii
pentru selecţia pe posturi care au aceleaşi cerinţe legate de cunoştinţe, deprinderi, aptitudini şi
alte caracteristici ca postul pentru care s-a realizat validarea.

4.2.2. Strategii de selecţie

În cele mai multe cazuri, pentru fiecare candidat pentru un post se obţin valori ale mai
multor predictori. Strategia de selecţie se referă la modul în care sunt utilizate aceste valori
pentru a se lua decizia finală de a accepta (a angaja) un candidat sau a-l respinge. În
continuare vor fi descrise câteva strategii de selecţie.

Strategia bazată pe regresia multiplă


Se foloseşte atunci când se presupune că valorile unui anumit criteriu pot fi prezise
folosind valorile mai multor predictori, dacă atât criteriul, cât şi predictorii sunt măsuraţi pe
scală de interval sau de raport (pentru a fi permisă determinarea ecuaţiei de regresie).
O ecuaţie de regresie liniară multiplă are următoarea formă:
y=a1x1+ a2x2+…+ akxk+b
unde:
k este numărul de predictori (k≥2);
y este valoarea criteriului Y;
x1, x2,…, xk sunt valorile predictorilor (xi este valoarea predictorului Xi, pentru
i=1,2,…,k);
a1, a2,…, ak şi b sunt numere reale.

65 |
Mărimea valorii absolute a unui coeficient ai (i=1,2,…,k) arată cât de important este
predictorul Xi în variaţia valorii criteriului: o variaţie mică a valorii predictorului Xi va
produce o variaţie cu atât mai mare a valorii criteriului Y, cu cât este mai mare ⎜ai⎜.
Pentru fiecare candidat se calculează, cu ajutorul ecuaţiei de regresie multiplă, valoarea
criteriului. Apoi se ierarhizează candidaţii pe baza valorilor criteriului.
Utilizarea ecuaţiei de regresie multiplă conduce la rezultate eronate dacă, în realitate,
între criteriu şi predictori nu există o legătură liniară sau dacă predictorii nu se pot compensa
între ei, ceea ce înseamnă că o valoare mică la un predictor împiedică realizarea unor
performanţe bune în muncă, chiar dacă valorile altor predictori sunt mari.
Această strategie este costisitoare atunci când numărul candidaţilor este mare şi/sau se
folosesc mulţi predictori, întrucât necesită cunoaşterea valorilor tuturor predictorilor la toţi
candidaţii.

Strategia cu praguri de secţionare multiple


Pentru fiecare predictor se stabileşte un prag de secţionare. Acesta este un număr care
împarte mulţimea valorilor posibile ale predictorului în două submulţimi: valorile mai mici
decât pragul de secţionare sunt considerate „slabe”, iar cele mai mari decât el sau egale cu el,
„bune”.
Pentru fiecare candidat se obţin valorile tuturor predictorilor. Sunt eliminaţi candidaţii
care au cel puţin o valoare „slabă” (au pentru cel puţin un predictor o valoare mai mică decât
pragul fixat).
Această strategie se utilizează atunci când pentru a se obţine succes în muncă trebuie
să-şi aducă o contribuţie fiecare predictor, întrucât predictorii nu se pot compensa între ei,
altfel spus, atunci când nu se poate obţine o valoare mare a criteriului dacă cel puţin un
predictor are valoare mică.
Foarte frecvent se recurge la această strategie în cazul când predictorii sunt abilităţi
fizice.
La fel ca în strategia bazată pe regresia multiplă şi aici este necesară obţinerea tuturor
valorilor predictorilor pentru toţi candidaţii, ceea ce poate necesita costuri mari. Un alt
dezavantaj al strategiei este că nu furnizează o metodă de ierarhizare a candidaţilor care,
având doar valori „bune” la predictori, nu au fost eliminaţi.

Strategia cu metode combinate


Această strategie combină strategia cu praguri de secţionare multiple şi strategia bazată
pe regresia multiplă.
Se obţin valorile tuturor predictorilor, de la toţi candidaţii. Se aplică, în prima fază,
strategia pragurilor de secţionare multiplă şi se elimină candidaţii care au cel puţin o valoare
„slabă”. Pentru candidaţii rămaşi se calculează scorul criteriului, utilizând ecuaţia de regresie
liniară multiplă a criteriului faţă de predictori. Pe baza scorurilor criteriului se ierarhizează
candidaţii.

66 |
Strategia cu metode combinate este utilă atunci când, pentru a avea succes în muncă (a
obţine valori mari ale criteriului) este necesar ca valorile fiecărui predictor să depăşească un
anumit prag, iar pentru persoanele care au la predictori valori mai mari decât pragurile de
secţionare, predictorii se pot compensa între ei.
Avantajul oferit de această strategie, comparativ cu strategia cu praguri de secţionare
multiple, este posibilitatea de a avea o ierarhie a candidaţilor care nu au fost eliminaţi.
Întrucât necesită obţinerea valorilor tuturor predictorilor de la toţi candidaţi, strategia cu
metode combinate poate fi costisitoare.

Strategia cu obstacole multiple


Şi această strategie necesită stabilirea unui punct de secţionare pentru fiecare predictor.
Predictorii sunt ordonaţi în funcţie de importanţa lor pentru obţinerea succesului în
muncă, începând cu cel mai important (cel care, dacă are valori mici, face imposibilă
obţinerea performanţei în muncă). Fiecare predictor constituie un obstacol, care elimină o
parte dintre candidaţi.
Pentru toţi candidaţii se măsoară primul predictor, cel mai important. Cei care au valori
„slabe” (sub pragul de secţionare fixat) sunt eliminaţi. Pentru ceilalţi se obţin valorile
următorului predictor în ordinea importanţei. Sunt eliminaţi cei care au valori „slabe” la
acesta. Procedeul continuă în acelaşi mod până la depăşirea ultimului obstacol.
La fel ca strategia cu praguri de secţionare multiple, această strategie este utilă atunci
când predictorii nu se pot compensa între ei şi este necesară o valoare peste un anumit prag la
fiecare predictor pentru a se putea obţine o valoare mare a criteriului.
Strategia cu obstacole multiple este mai puţin costisitoare decât cele trei descrise
anterior, pentru că, exceptând primul predictor, valorile fiecărui predictor se obţin doar pentru
o parte dintre candidaţi. Ea prezintă, însă, dezavantajul că durează mai mult, întrucât după
evaluarea fiecărui predictor este necesar un timp pentru a interpreta valorile, a hotărî, pentru
fiecare candidat, dacă este păstrat sau eliminat şi a comunica decizia. Din acest motiv este mai
puţin convenabilă pentru organizaţiile care au nevoie să obţină rapid rezultatul selecţiei şi
pentru candidaţii cu valori „bune” ale predictorilor, care sunt menţinuţi mai mult timp în stare
de anxietate.

Strategia potrivirii profilurilor


Înainte de a efectua selecţia pentru un post se obţin valorile predictorilor de la persoane
care ocupă postul respectiv şi au performanţe bune în muncă. Pentru fiecare predictor se
calculează media valorilor.
Dacă se utilizează k (k≥2) predictori (X1, X2,…, Xk) şi se notează cu mi media valorilor
pentru predictorul Xi (i=1,2,…,k), atunci vectorul1 (m1, m2,…, mk) reprezintă profiul postului.

1
Un vector este un set de numere înscrise între paranteze, aranjate într-o ordine fixată, în sensul că se stabileşte
de la început ce reprezintă numărul de pe fiecare poziţie.

67 |
Pentru fiecare candidat se măsoară toţi predictorii. Cu ajutorul lor se construieşte
profilul candidatului. Astfel, dacă o persoană a obţinut la predictorii X1, X2,…,Xk valorile x1,
x2,…, xk, atunci profilul său este vectorul (x1, x2,…, xk).
Se compară apoi profilul fiecărui candidat cu profilul postului şi se reţin pentru a fi
angajate persoanele al căror profil se aseamănă cel mai mult cu profilul postului.
O posibilitate de a evalua asemănarea dintre două profiluri este aceea de a calcula
distanţa dintre ele. Distanţa dintre profilul unui candidat, (x1, x2,…, xk), şi profilul postului,
(m1, m2,…, mk), este pătratul distanţei euclidiene dintre cei doi vectori:
k
D 2 = ∑ ( xi − mi )2
i =1
2
Cu cât distanţa D este mai mică, cu atât profilul candidatului se aseamănă mai mult cu
profilul postului.
Această strategie prezintă avantajul că nu pretinde fixarea – adesea în mod arbitrar – a
pragurilor de secţionare pentru predictori. În plus, permite o ierarhizare a candidaţilor, în
funcţie de asemănarea profilului lor cu profilul postului.
Există, însă, şi un dezavantaj major al acestei strategii: faptul că profilul postului este
dependent de eşantionul de persoane folosit la construirea lui. Atunci când toţi predictorii
utilizaţi la construirea profilului corelează direct cu criteriul – cum se întâmplă de obicei –,
persoanele care au valori mari la toţi predictorii au cele mai mari şanse să aibă performanţe
mari în muncă. Însă, dacă în eşantionul folosit la construirea profilului postului, există unul
sau mai mulţi predictori pentru care media nu este mare, candidaţii care au valori mari la
predictorii respectivi vor avea distanţe mari între profilul lor şi profilul postului. Din acest
motiv, ei nu vor ocupa locuri fruntaşe în ierarhia candidaţilor.

4.2.3. Utilizarea testelor de cunoştinţe în selecţie

Sunt numeroase posturile în care nu se poate obţine o performanţă bună în muncă fără a
avea cunoştinţe temeinice în unul sau mai multe domenii. De exemplu, un programator nu va
putea realiza programe care să funcţioneze corect dacă nu cunoaşte foarte bine limbajul de
programare folosit în colectivul în care doreşte să se angajeze.
În asemenea situaţii, printre probele utilizate ca predictori în selecţie se va include şi un
test de cunoştinţe. Întrebările sale vor viza acele cunoştinţe care sunt absolut necesare pentru
realizarea în bune condiţii a sarcinilor de lucru specifice postului pentru care se organizează
selecţia.
Testul va trebui validat. Pe lângă validitatea de conţinut se va cerceta validarea relativă
la criteriu.
Dacă la selecţie se va utiliza strategia cu praguri de secţionare multiple, stategia cu
metode combinate sau strategia cu obstacole multiple se va stabili un prag de secţionare.

68 |
5. ITEMI ÎN TESTELE DE CUNOŞTINŢE

5.1. Noţiunea de item

În cazul testelor de cunoştinţe, prin item se înţelege o probă (o întrebare, o problemă


etc.) sau o parte a acesteia, care îndeplineşte următoarele condiţii:
• este analizată şi interpretată separat de celelalte probe ale testului şi de celelalte părţi
ale probei din care face parte;
• este cotată independent de felul în care sunt rezolvate de către subiect alte sarcini
impuse de test.
Adesea, în testele de cunoştinţe, un item se prezintă ca o întrebare care solicită un
răspuns. Din acest motiv, termenii de item şi întrebare se folosesc de multe ori ca sinonimi.
Dar, în momentul în care se calculează cotele itemilor, în vederea analizei de itemi sau a
determinării consistenţei interne a testului, este obligatoriu să se facă distincţie între item şi
întrebare.
Exemplu. Într-un test de cunoştinţe de statistică este cuprinsă următoarea probă:
Indicaţi relaţia dintre medie şi mediană pentru fiecare dintre următoarele distribuţii de
frecvenţe:
a. distribuţia de frecvenţe este simetrică;
b. distribuţia de frecvenţe este în formă de i;
c. distribuţia de frecvenţe este în formă de j.
Puteţi să vă verificaţi răspunsurile luând câte un exemplu de distribuţie de frecvenţe
pentru fiecare caz şi calculând media şi mediana.
Atunci când examinatorul este interesat dacă studenţii ştiu semnificaţia mediei şi a
medianei, presupunând că aceştia cunosc noţiunea de formă a unei distribuţii de frecvenţe,
întreaga întrebare va reprezenta un item. Ea va primi un singur punctaj, care poate fi de forma
0 sau 1 (1 în cazul când s-a răspuns corect la toate cele trei situaţii şi 0 în caz contrar) ori se
poate calcula prin însumarea cotelor acordate celor trei situaţii, răspunsul la fiecare dintre ele
putând fi cotat, de exemplu, cu 1 dacă este corect şi cu 0 dacă este greşit sau a fost omis.
Punctajul întregii întrebări va fi luat în considerare atunci când se va face analiza de itemi şi
când se va cerceta consistenţa internă a testului.
În schimb, dacă examinatorul doreşte să verifice cunoştinţele studenţilor despre forma
distribuţiei de frecvenţe, ştiind că aceştia sunt obişnuiţi să calculeze media şi mediana, va
considera că întrebarea este compusă din trei itemi, câte unul pentru fiecare dintre punctele a-
c. Va fi cotat separat răspunsul la fiecare item (de exemplu, cu 1 dacă este corect şi cu 0 dacă
este greşit sau omis). Când se va efectua analiza de itemi se vor prelucra separat punctajele
celor trei itemi. De asemenea, cele trei cote vor fi introduse separat (fără a fi cumulate) în
formula de calcul a coeficientului de consistenţă internă a testului.

69 |
5.2. Tipuri de întrebări în testele de cunoştinţe

La fel ca în chestionare, în testele de cunoştinţe, sub denumirea de întrebare pot figura


atât întrebări propriu-zise, la care subiectul formulează răspunsul ori îl alege dintr-o listă de
răspunsuri propuse, cât şi afirmaţii faţă de care cel care răspunde trebuie să-şi manifeste
acordul sau dezacordul, propoziţii în care trebuie să se completeze unul sau mai multe cuvinte
ori liste de elemente care trebuie să fie ordonate.
Literatura de specialitate grupează tipurile de întrebări care se utilizează frecvent pentru
verificarea cunoştinţelor prin teste, în două categorii:
• întrebări cu răspunsuri închise;
• întrebări cu răspunsuri deschise (libere).
Întrebările cu răspunsuri închise solicită selectarea unuia sau a mai multor răspunsuri
dintr-o listă de răspunsuri propuse. Din această categorie fac parte:
• întrebările dihotomice;
• întrebările cu răspunsuri la alegere (cu alegere multiplă);
• întrebările de tip asociere;
• întrebările de tip ordonare.
Întrebările cu răspunsuri deschise (libere) pretind formularea unui răspuns folosind
vocabularul propriu al subiectului. Această categorie cuprinde:
• întrebările cu formulări lacunare (adresează o întrebare la care se cere să se
formuleze un răspuns foarte scurt sau prezintă un text conţinând spaţii libere care
trebuie completate cu un număr redus de cuvinte);
• întrebările cu răspunsuri scurte (cer să se formuleze un răspuns clar pe cel mult o
pagină);
• întrebările de tip eseu (pretind un răspuns cu format deschis, cu lungime mai mare
decât o pagină).
Întrebările cu răspunsuri închise verifică mai ales informaţia dobândită de subiect şi mai
puţin capacitatea acestuia de a opera cu informaţiile acumulate. Ele pot fi cotate obiectiv şi
pot fi introduse în testele de cunoştinţe standardizate.
Întrebările cu răspunsuri deschise permit evaluarea unor capacităţi superioare ale
subiectului, cum sunt: creativitatea, capacitatea de organizare, judecata, spiritul critic,
capacitatea de sinteză. Aceste întrebări sunt greu de cotat obiectiv, mai ales dacă solicită
răspunsuri lungi şi complexe. Întrebările cu răspunsuri lacunare pot fi cotate obiectiv, dar ele
verifică, de obicei, numai dacă au fost memorate anumite cunoştinţe.
În continuare vor fi prezentate tipurile de întrebări utilizate mai frecvent în testele de
cunoştinţe standardizate.

Întrebările dihotomice conţin o propoziţie-afirmaţie despre care subiectul trebuie să


spună dacă este adevărată sau falsă ori o întrebare directă, la care se răspunde cu „da” sau
„nu”.

70 |
Exemplu. Apreciaţi dacă următoarea afirmaţie este adevărată sau falsă: „Coeficientul lui
Cohen (K) se utilizează pentru a măsura consistenţa internă a unui test.”
a. Este adevărată.
b. Este falsă.

Din punctul de vedere al taxonomiei lui Bloom, aceste întrebări sunt potrivite pentru
obiectivele pedagogice care vizează cunoaşterea, comprehensiunea şi aplicarea.
Sunt uşor de construit, dar prezintă dezavantajul că şansa de a ghici răspunsul corect este
de 50%.
Întrebările dihotomice pot cere să se identifice dacă:
• un eveniment este cauză sau efect al altuia;
Exemplu. În urma administrării cu limită de timp a unui test de atenţie compus din itemi
dihotomici, s-a obţinut KR20=0,92. Valoarea mare a coeficientului KR20 ar putea fi cauzată
de timpul de lucru prea scurt pentru eşantionul de subiecţi?
a. Da.
b. Nu.

• un obiect sau un eveniment face parte dintr-o anumită categorie;


Exemplu. Coeficientul KR20 este un coeficient de consistenţă internă?
a. Da.
b. Nu.

• două evenimente pot avea loc simultan.


Exemplu. Este posibil ca un test psihologic să aibă, pentru o populaţie, o consistenţă
internă foarte slabă şi o validitate relativă la un criteriu foarte bună?
a. Da.
b. Nu.

Întrebările cu răspunsuri la alegere conţin o întrebare şi o listă de răspunsuri propuse


sau o frază incompletă şi o listă de completări posibile. Subiectul trebuie să selecteze din listă
răspunsurile sau completările pe care le consideră corecte.
Răspunsurile propuse sunt cunoscute sub denumirea de alternative, iar cele greşite, sub
cea de distractori.
Este posibil ca lista de răspunsuri propuse să conţină un singur răspuns corect sau mai
multe. Este posibil să figureze printre răspunsurile propuse „toate răspunsurile de mai sus”
sau/şi „niciunul din răspunsurile de mai sus”.
Cu excepţia nivelurilor superioare ale taxonomiei lui Bloom, care conţin obiective ce
vizează sinteza şi evaluarea şi pretind formularea unor răspunsuri originale din partea
subiectului, toate celelalte niveluri pot fi verificate prin intermediul întrebărilor cu răspunsuri
la alegere.

71 |
Dacă numărul răspunsurilor corecte este mai mic de jumătate din numărul de răspunsuri
propuse, atunci şansa ca o persoană să nimerească un răspuns corect alegând răspunsul la
întâmplare este mai mică de 50%, adică este mai mică decât în cazul întrebărilor dihotomice.
La fel ca întrebările dihotomice, întrebările cu răspunsuri la alegere sunt uşor de cotat şi
permit prelucrarea statistică a răspunsurilor, în vederea îmbunătăţirii testului. Se utilizează
frecvent în testele de cunoştinţe administrate cu ajutorul calculatorului.
Un dezavantaj al acestor întrebări este consumul mare de timp necesar pentru construirea
lor, întrucât este destul de dificil de formulat răspunsuri greşite care să li se pară corecte
persoanelor lipsite de cunoştinţele verificate de întrebare.
Prin întrebări cu răspunsuri la alegere li se poate cere subiecţilor să efectueze
următoarele sarcini:
• să identifice categoria din care face parte un obiect, o persoană sau un eveniment;
Exemplu. Indicaţi din care categorie face parte coeficientul K (Cohen):
a. coeficienţi de stabilitate;
b. coeficienţi de echivalenţă;
c. coeficienţi de consistenţă internă;
d. coeficienţi de fidelitate inter-evaluatori.

• să decidă care este consecinţa corectă a unuia sau a mai multor evenimente;
Exemplu. Unui test compus din itemi paraleli i se adaugă 5 itemi paraleli cu cei care îl
alcătuiesc. Ce se va întâmpla cu valoarea coeficientului de consistenţă a testului?
a. va creşte;
b. va scădea;
c. va rămâne aceeaşi;
d. este posibil să se modifice, dar nu se poate preciza cum.

• să utilizeze două sau mai multe condiţii pentru a trage o concluzie;


Exemplu. Două teste de cunoştinţe sunt compuse din câte cinci întrebări. La fiecare
întrebare se acordă un punct pentru răspunsul corect şi zero puncte dacă s-a răspuns greşit sau
nu s-a răspuns.
Testul 1 conţine patru întrebări dihotomice şi o întrebare cu răspunsuri la alegere, care
propune patru răspunsuri, dintre care unul singur este corect.
Testul 2 conţine două întrebări dihotomice şi două întrebări cu răspunsuri la alegere care
propun câte trei răspunsuri, dintre care este corect doar unul.
O persoană răspunde la toate întrebările din ambele teste, alegând la întâmplare câte un
răspuns. La care dintre cele două teste are şanse mai mari să obţină scorul maxim (5)?
a. Şansele sunt mai mari la testul 1.
b. Şansele sunt egale la cele două teste.
c. Şansele sunt mai mari la testul 2.

72 |
• să decidă dacă dintre două afirmaţii referitoare la acelaşi obiect sau fenomen este
adevărată numai una, sunt adevărate ambele sau ambele sunt false.
Exemplu. Se dau următoarele afirmaţii:
1. Coeficientul α (Cronbach) este echivalent cu coeficientul KR20 atunci când itemii
testului sunt dihotomici.
2. Coeficientul α (Cronbach) ia valori în intervalul [0,1].
Care este valoarea de adevăr a celor două afirmaţii?
a. ambele sunt adevărate;
b. ambele sunt false;
c. prima este adevărată, iar a doua este falsă;
d. prima este falsă, iar a doua este adevărată.

• să identifice o opţiune care nu îşi are locul printre celelalte;


Exemplu. Care dintre următorii coeficienţi de fidelitate nu face parte din aceeaşi
categorie cu ceilalţi:
a. KR20;
b. α (Cronbach);
c. K (Cohen).

• să determine relaţia dintre două noţiuni (A şi B) şi să identifice, din lista de


răspunsuri propuse, noţiunea care este legată de o noţiune C, aşa cum sunt legate
între ele noţiunile A şi B.
Exemplu. Coeficientul KR20 este pentru coeficientul α aşa cum este indicele de
dificultate al unui item pentru:
a. media cotelor itemului;
b. dispersia cotelor itemului;
c. abaterea standard a cotelor itemului;
d. puterea de discriminare a itemului.

Uneori, întrebarea cu răspunsuri la alegere are forma unui scenariu complex, care poate
conţine câteva probleme la care trebuie să se dea mai multe răspunsuri prin selectarea celor
corecte dintr-o mulţime de răspunsuri propuse.
Exemplu. Un test de cunoştinţe constă din itemi cu răspunsuri la alegere. Fiecare item
conţine cinci răspunsuri, dintre care sunt corecte două. Sunt propuse trei variante de cotare a
itemilor:
a. Se acordă 1 punct fiecărui răspuns corect ales.
b. Se acordă 1 punct fiecărui răspuns corect ales şi se scade 1 punct pentru
fiecare răspuns greşit ales.
c. Se acordă 1 punct dacă au fost alese ambele răspunsuri corecte (chiar
dacă au fost alese şi alte răspunsuri) şi 0 puncte în caz contrar.
La unul dintre itemi, un subiect alege la întâmplare 3 răspunsuri.

73 |
Pentru care dintre cele trei variante de cotare are şanse mai mari să obţină exact un
punct?
a. b. c.
Dar dacă subiectul identifică un răspuns propus ca fiind greşit şi nu-l alege?
a. b. c.

Întrebările de tip asociere conţin două liste de elemente şi o regulă de asociere a câte
două elemente, unul dintr-o listă şi celălalt din a doua listă. Subiectului i se cere să alcătuiască
o listă-răspuns, prin formarea de perechi.
Întrebările de acest tip sunt potrivite pentru obiective pedagogice care vizează
cunoaşterea şi comprehensiunea.
Dacă numărul perechilor corecte este mai mic decât jumătate din numărul total al
perechilor care pot fi formate (care este egal cu produsul dintre numărul elementelor primei
liste şi numărul de elemente din lista a doua), atunci şansa unei persoane care alege
răspunsurile la întâmplare de a ghici un răspuns corect este mai mică de 50%.
Aceste întrebări sunt mai uşor de redactat decât întrebările cu răspunsuri la alegere. Pot
fi cotate rapid, iar răspunsurile pot fi supuse prelucrărilor statistice.
Adesea, în întrebările de tip asociere, o listă conţine denumiri de termeni, iar cealaltă,
definiţii de termeni.
Exemplu. Pentru fiecare dintre metodele de evaluare a fidelităţii testelor (a-c), indicaţi
procedeul de lucru (1-4). Răspundeţi cu perechi formate dintr-o literă şi o cifră.
a. metoda consistenţei interne;
b. metoda test-retest;
c. metoda formelor echivalente;
1. Se calculează coeficientul de corelaţie între scorurile testului şi scorurile
unui test paralel cu el, cele două instrumente fiind administrate aproape în
acelaşi timp.
2. Se calculează coeficientul de corelaţie între scorurile testului obţinute în
două momente diferite.
3. Se calculează coeficientul α (Cronbach).
4. Se calculează coeficientul K (Cohen).

Alteori, o listă conţine autori, iar cealaltă creaţii. Sau o listă conţine reguli, iar cealaltă,
exemple.

Întrebările de tip ordonare constau dintr-o listă de elemente, etape, evenimente,


operaţii etc., dispuse într-o ordine aleatoare. Se răspunde prin indicarea ordinii corecte.
Aceste întrebări sunt potrivite pentru obiectivele pedagogice care vizează cunoaşterea şi
comprehensiunea.

74 |
Ele prezintă dezavantajul că, dacă numărul de elemente este mare, şansa de a se
răspunde corect este foarte mică. (Dacă întrebarea conţine n elemente, numărul de răspunsuri
100
posibile este n!=1x2x3x…xn, iar şansa de a ghici răspunsul este de %. )
n!
Exemplu. Într-un test de cunoştinţe sunt incluse următoarele trei întrebări:
a. o întrebare dihotomică;
b. o întrebare cu răspunsuri la alegere, care propune patru răspunsuri, dintre
care sunt corecte două;
c. o întrebare de tip asociere, în care una dintre liste conţine două elemente,
cealaltă listă conţine trei elemente şi sunt corecte trei perechi.
La fiecare întrebare se acordă un punct dacă s-a răspuns corect şi complet şi zero puncte
în cazul răspunsului absent, al răspunsului parţial corect sau al celui greşit.
Aranjaţi întrebările în ordinea crescătoare a şansei de a se obţine cota 1 prin alegerea
răspunsurilor la întâmplare.

Întrebările cu formulări lacunare conţin fie o întrebare la care se răspunde cu un


număr redus de cuvinte ori de numere, fie un text în care sunt prezente spaţii libere în care
trebuie să se completeze cuvinte sau numere.
Aceste întrebări sunt potrivite pentru obiectivele pedagogice care vizează cunoaşterea,
comprehensiunea şi aplicarea.
Exemplu. Într-o întrebare cu răspunsuri la alegere care propune doar răspunsurile „da” şi
„nu”, şansa ca o persoană care alege răspunsul la întâmplare să nimerească răspunsul corect
este de __%. Întrebările de acest tip se mai numesc ________________.

5.3. Sugestii pentru formularea întrebărilor şi pentru alcătuirea testului

5.3.1. Sugestii generale

1. Formularea întrebării trebuie să fie adecvată nivelului de maturitate şi de pregătire al


persoanelor care vor răspunde la test.

2. Ideile să fie exprimate clar, prin cuvintele cele mai potrivite, cu un sens precis. Se vor
evita frazele lungi şi asocierile de cuvinte care fac dificilă înţelegerea întrebării.
Exemplu. Extrageţi din lista de mai jos enunţurile care nu sunt adevărate în ceea ce
priveşte oportunitatea utilizării testelor de inteligenţă:
a. Coeficientul de inteligenţă trebuie corelat cu alte date pentru a fi folosit drept
criteriu.
b. Coeficientul de inteligenţă este stabil.
c. Coeficientul de inteligenţă are valoare absolută.
d. Un anumit test de inteligenţă poate fi inadecvat într-o situaţie dată.
e. Testele de inteligenţă trebuie să fie etalonate.

75 |
f. Testele de inteligenţă pot fi aplicate de oricine.

Această întrebare conţine mai multe erori. Astfel:


• Instrucţiunile de selectare a răspunsurilor corecte sunt greu de înţeles şi incorecte.
Ele afirmă că întrebarea se referă la testele de inteligenţă, dar primele trei răspunsuri
propuse au în vedere coeficientul de inteligenţă. S-ar fi putut înlocui „oportunitatea
utilizării testelor de inteligenţă” cu „testele de inteligenţă şi coeficientul de
inteligenţă”.
• Primul răspuns propus este neclar. Nu se specifică scopul utilizării coeficientului de
inteligenţă drept criteriu.
• De asemenea, este neclar răspunsul propus c.

3. Se va acorda atenţie folosirii semnelor de punctuaţie.


Exemplu. Coeficientul de fidelitate intra-evaluator se obţine calculând coeficientul de
corelaţie liniară între scorurile acordate de acelaşi evaluator unui eşantion de persoane testate
în momente diferite?
a. Da.
b. Nu.

Absenţa unei virgule, înainte sau după cuvântul „testate”, face imposibilă stabilirea
răspunsului corect. Dacă virgula este plasată înainte de cuvântul „testate”, atunci răspunsul
corect este b. Dacă virgula este plasată după cuvântul „testate”, atunci răspunsul corect este a.

4. Nu se vor introduce în întrebare informaţii neesenţiale (care nu contribuie la


fundamentarea alegerii răspunsului).
Exemplu. A fost construit un test de cunoştinţe de geografie, care să li se administreze
elevilor la sfârşitul primului semestru de şcoală, după ce au fost predate lecţiile despre
geografia Europei, a Asiei şi a Africii. Acesta este format din 20 de întrebări cu răspunsuri la
alegere, dintre care câte şapte se referă la Europa şi Asia şi şase se referă la Africa.
Fiecare întrebare propune cinci răspunsuri. Fiecare răspuns conţine un nume de munte.
În textul întrebării este specificată o ţară. Se cere să se selecteze din lista de răspunsuri
propuse cele două răspunsuri care conţin numele unor munţi aflaţi pe teritoriul ţării.
Se acordă un punct pentru fiecare răspuns corect şi zero puncte pentru răspunsurile
greşite sau omise. Scorul la test se obţine însumând cotele întrebărilor.
Care formulă este potrivită pentru calculul coeficientului de consistenţă internă a
testului?
a. α (Cronbach);
b. KR20.

76 |
În această întrebare, prima frază se putea reduce, aşa încât să conţină singura informaţie
importantă pentru a putea răspunde corect: „Un test de geografie este format din 20 de
întrebări cu răspunsuri la alegere.”
5. Se vor introduce în întrebare toate datele necesare pentru a permite raţionamentul pe
baza căruia se alege răspunsul. Nu se vor considera implicite anumite informaţii, pentru că
este posibil ca nu toţi subiecţii să le cunoască.
Exemplu. Într-un test de cunoştinţe, o întrebare cu răspunsuri la alegere propune cinci
răspunsuri, dintre care două sunt corecte. Care este şansa ca o persoană care alege la
întâmplare două răspunsuri să obţină un punct?
a. 20%;
b. 40%;
c. 60%
d. 80%.

În această întrebare, pentru a se putea identifica răspunsul corect, ar fi fost absolut


necesar să se menţioneze modul în care se cotează răspunsul subiectului: dacă se acordă câte
un punct pentru fiecare răspuns corect indicat sau dacă se acordă un punct dacă au fost
indicate ambele răspunsuri corecte.

6. Se vor evita formulările care oferă ajutor pentru alegerea răspunsului corect (de
exemplu, sugerează numărul de răspunsuri aşteptate sau dacă trebuie ales ca răspuns un
substantiv la singular).
Exemplu. Selectaţi indicatorul care se poate calcula pentru o variabilă măsurată pe scală
nominală:
a. modul;
b. mediana;
c. media;
d. dispersia.

Întrebarea îl ajută pe subiect sugerându-i că numai unul dintre răspunsurile propuse este
corect. Ea putea folosi formularea „Selectaţi toţi indicatorii care se pot calcula” sau
formularea „Selectaţi indicatorul (indicatorii) care se poate (se pot) calcula”.

7. Structura întrebării trebuie să fie cât mai simplă. În general, întrebarea este formulată
la început, iar răspunsurile propuse şi eventualele explicaţii sunt aşezate la urmă.

8. Se va evita utilizarea, în textul întrebării, a negaţiilor („nu”, „nici”, „niciodată”) şi în


special a negaţiilor duble. Dacă, totuşi, negaţiile sunt necesare, ele vor fi scrise cu alte
caractere (de exemplu, cu majuscule sau cu caractere îngroşate) ori vor fi subliniate, pentru a
atrage atenţia asupra lor.
Exemplu. Care dintre următoarele elemente nu are (nu au) legătură cu exprimarea
calităţii senzaţiilor?

77 |
a. selectivitatea receptorilor;
b. energia corticală;
c. stările afective;
d. energia specifică receptorilor.

În această întrebare, pentru a nu i se sugera subiectului numărul de răspunsuri corecte, au


fost incluse în text ambele variante: „nu are” şi „nu au”.
S-a folosit negaţia pentru ca numărul de răspunsuri corecte să fie mai mic decât jumătate
din numărul de răspunsuri propuse şi, astfel, şansele de ghicire a răspunsului corect să fie mai
mici. Dar, pentru ca subiectul să observe negaţia, cuvântul „nu” a fost scris cu caractere
îngroşate.

8. Atunci când i se cere subiectului să aprecieze dacă un obiect se află la o extremitate a


unei ierarhii (este „cel mai important” sau este „cel mai bun”), trebuie să se menţioneze
criteriul care se află la baza întocmirii ierarhiei.
Exemplu. Din 15 itemi paraleli s-au construit trei teste. Care dintre ele este cel mai bun?
a. testul format din 7 itemi;
b. testul format din 11 itemi;
c. testul format din 15 itemi.

Pentru că nu s-a precizat sub ce aspect trebuie să se compare testele pentru a aprecia care
este cel mai bun, o persoană care va lua în considerare fidelitatea va alege răspunsul c, iar o
alta, care va avea în vedere timpul necesar administrării testului, va selecta răspunsul a.

9. Se recomandă să nu se formuleze întrebări pe marginea unor probleme controversate


sau care, în cărţi diferite, sunt prezentate ori soluţionate diferit.
Exemplu. Indicaţi tipul de coping pentru care optează persoanele care au scoruri mari la
anxietate:
a. focalizat pe problemă;
b. focalizat pe emoţie;
c. este dependent de tipul de stresor.

În cartea Stres şi personalitate, a Adrianei Băban, scrie: „Cercetările lui Lazarus


sugerează că oamenii utilizează atât copingul focalizat pe problemă, cât şi cel focalizat spre
emoţie pentru a face faţă situaţiei de stres. Conform autorilor citaţi, opţiunea depinde de tipul
de ameninţare. Totuşi, unii autori constată diferenţe în predominarea utilizării unei forme sau
alta de coping (Vitalino şi colab., 1990)... Persoanele cu scoruri mari la anxietate optează mai
mult pentru coping emoţional.”
Întrebarea nu este clară (nu rezultă în ce condiţii persoanele optează pentru un tip de
coping, pentru că lipseşte menţiunea „mai mult” sau „mai frecvent” după cuvântul „optează”)
şi, în plus, se referă la un fapt controversat în literatură, fără a se specifica autorul după care
trebuie ales răspunsul (Lazarus sau Vitalino).

78 |
5.3.2. Sugestii pentru scrierea întrebărilor dihotomice

1. Afirmaţia a cărei valoare de adevăr este apreciată de subiect trebuie să fie astfel
formulată încât să fie absolut şi fără ambiguitate adevărată sau falsă.
Exemplu. Adăugând itemi la un test, consistenţa internă a acestuia va creşte?
a. Da.
b. Nu.

Dacă testul este alcătuit din itemi care constituie forme paralele şi se adaugă itemi
paraleli cu aceştia, atunci consistenţa internă a testului va creşte. Întrucât nu se specifică dacă
itemii sunt paraleli, prin adăugarea de itemi consistenţa internă a testului poate să crească sau
să scadă, aşa încât niciunul dintre răspunsurile propuse nu este corect.

2. În cadrul unui test, întrebările pentru care răspunsul corect este „adevărat” trebuie să
fie aproximativ de aceeaşi lungime cu cele al căror răspuns corect este „fals”.

3. Într-un test, numărul întrebărilor al căror răspuns corect este „adevărat” trebuie să fie
aproximativ egal cu cel al întrebărilor pentru care răspunsul corect este „fals”.

5.3.3. Sugestii pentru scrierea întrebărilor cu răspunsuri la alegere

1. Este bine ca numărul răspunsurilor propuse să fie cuprins între 3 şi 5.

2. Numărul de răspunsuri corecte trebuie să fie cel mult egal cu jumătate din numărul de
răspunsuri propuse. Cu cât diferenţa dintre numărul de distractori şi numărul de răspunsuri
corecte este mai mare, cu atât este mai mică şansa unei persoane să ghicească răspunsul
corect.
Exemplu. Dezvoltarea aptitudinilor se supune:
a. legilor vârstei;
b. împrejurărilor externe, de mediu;
c. nici legilor vârstei şi nici împrejurărilor externe, de mediu.

La acest item, răspunsurile corecte sunt a şi b. Acestea sunt cotate cu câte un punct.
Dacă cineva nu este sigur de răspuns şi alege la întâmplare un răspuns, are o şansă de 66,67%
să obţină un punct.
Întrebarea poate fi reformulată astfel încât răspunsurile propuse să fie:
a. numai legilor vârstei;
b. numai împrejurărilor externe, de mediu;
c. atât legilor vârstei, cât şi împrejurărilor externe, de mediu;
d. nici legilor vârstei şi nici împrejurărilor externe, de mediu.
În acest caz, şansa de a nimeri un răspuns corect prin ghicire este doar de 25%.

79 |
3. Distractorii să fie construiţi astfel încât să pară corecţi unor persoane care nu au
cunoştinţele verificate de item. Este recomandabil ca înainte de construirea întrebărilor cu
răspunsuri la alegere să se administreze testul sub forma unor întrebări cu răspunsuri deschise,
iar distractorii să fie aleşi dintre răspunsurile greşite oferite de subiecţi.
Exemplu. Care dintre următoarele strategii de validare necesită administrarea testului
înainte de măsurarea criteriului?
a. validarea predictivă;
b. validarea concurentă;
c. validarea consistenţei interne.

Ultimul răspuns propus este un distractor care a fost introdus în întrebare doar pentru a
micşora şansa de ghicire a răspunsului corect. Dar este puţin probabil să fie ales de cineva
care are noţiuni – chiar sumare – despre fidelitatea şi validitatea testelor.

4. Răspunsurile propuse trebuie să aibă lungimi aproximativ egale şi să fie construite în


acelaşi mod, pentru a nu sugera, prin lungimea lor, care sunt cele corecte (adesea, răspunsurile
corecte conţin mai multe detalii, fiind, astfel, mai lungi decât răspunsurile greşite).
Exemplu. H. Selye a evidenţiat câteva faze pentru sindromul general de adaptare.
Identificaţi-le în lista de mai jos.
a. anticipare;
b. de alarmă;
c. cunoaştere;
d. comutare;
e. de rezistenţă;
f. de epuizare.

În această întrebare toate răspunsurile corecte încep cu cuvântul „de”, deosebindu-se


astfel de răspunsurile greşite.

5. Răspunsul propus „niciunul dintre răspunsurile de mai sus” să se utilizeze numai


atunci când pentru fiecare răspuns propus se poate afirma, fără nici un dubiu, dacă este corect
sau greşit. El nu va fi folosit în întrebările care solicită să se aleagă, din lista de răspunsuri
propuse, „răspunsul cel mai potrivit”.

6. Răspunsul propus „toate răspunsurile de mai sus” să se utilizeze rar ca răspuns corect,
întrucât s-a constatat că el este ales frecvent de persoanele care au doar cunoştinţe parţiale din
tema verificată de întrebare şi, prin urmare, le aduce acestora puncte nemeritate.

7. Să se includă negaţii în textul itemului numai atunci când este important ca persoanele
testate să ştie când nu se produce un eveniment sau care element nu are o anumită proprietate.
În cele mai multe cazuri este important să se cunoască în ce condiţii au loc evenimentele şi ce
proprietăţi au elementele.

80 |
Exemplu. Indicaţi intervalul (intervalele) în care sunt incluse valori care nu pot fi luate
de coeficienţii de corelaţie liniară:
a. [-1,5, 0];
b. [-1, 0];
c. [-0,5, 0,5];
d. [0, 1];
e. [0, 1,5].

Întrucât întrebarea verifică dacă persoanele testate ştiu că intervalul valorilor


coeficienţilor de corelaţie liniară este [-1, 1], nu era necesară formularea ei aşa încât să
includă negaţia. Li s-ar fi putut cere subiecţilor să indice intervalele care cuprind valori
posibile ale coeficienţilor de corelaţie liniară, iar pentru ca numărul răspunsurilor corecte să
nu depăşească jumătate din numărul răspunsurulor propuse se putea elimina unul dintre
răspunsurile corecte sau se putea adăuga un răspuns eronat.

8. Nu este obligatoriu ca răspunsurile propuse să fie de dificultăţi apropiate, dar este


necesar ca ele să fie astfel construite încât să nu fie extrem de uşor de apreciat pentru fiecare
răspuns dacă este adevărat sau fals.
Exemplu. Indicaţi situaţia (situaţiile) care favorizează apariţia stresului psihic:
a. prelucrarea adecvată a informaţiei;
b. supraîncărcarea informaţională;
c. libertatea de acţiune limitată;
d. atitudinea de aprobare din partea grupului.

În această întrebare răspunsurile corecte (b şi c) sunt evidente, deoarece conţin cuvintele


„supraîncărcare” şi, respectiv, „limitată”, care sugerează efecte neplăcute, spre deosebire de
răspunsurile a şi d, care conţin cuvintele „adecvată” şi, respectiv, „aprobare”.

9. Răspunsurile propuse trebuie să fie aşezate în ordine logică. De exemplu, dacă ele
sunt numere, să fie aranjate în ordine crescătoare sau descrescătoare.
Exemplu. Precizaţi care sunt distorsiunile cognitive:
a. atitudini negative faţă de sine;
b. atitudini pozitive faţă de lume;
c. atitudini negative faţă de lume şi faţă de viitorul apropiat;
d. atitudini pozitive faţă de sine.

Această întrebare conţine trei erori:


• Răspunsul corect c conţine două idei.
• Răspunsul corect c este mai lung decât celelalte răspunsuri propuse.

81 |
•Răspunsurile propuse nu sunt ordonate nici după sensul atitudinilor
(pozitive/negative), nici după obiectul faţă de care se manifestă atitudinile
(sine/lume).
10. Fiecare răspuns propus trebuie să conţină afirmaţii care pot fi apreciate ca adevărate
sau false de orice persoană care are aptitudinea sau cunoştinţele necesare pentru a formula un
răspuns corect.
Exemplu. După Miller (1956), adultul obişnuit poate memora:
a. 11 cifre;
b. 9 cifre;
c. 7 cifre.

Această întrebare este dificilă şi pentru persoanele care ştiu că G. Miller a arătat
existenţa unei limite a memorării, egală cu 7+/-2 elemente (litere, numere sau figuri simple).
Alegerea răspunsului corect este dependentă de felul în care subiectul interpretează termenul
„poate”: ca o limită superioară (adultul poate memora cel mult 7+2 elemente), caz în care
răspunsul corect este b, sau ca posibilitate „de mijloc” (adultul poate memora între 5 şi 9
numere, deci valoarea „de mijloc” este 7), situaţie în care răspunsul corect este c.

11. Răspunsurile propuse trebuie să fie disjuncte între ele, să nu se suprapună şi să nu fie
incluse unul în altul.
Exemplu. Psihologia şcolară:
a. este importantă pentru că a contribuit la introducerea metodei
experimentale în pedagogie;
b. nu este importantă pentru teoria pedagogică;
c. este importantă pentru că furnizează informaţii profesorilor;
d. este importantă pentru că furnizează informaţii cadrelor didactice şi
părinţilor.

Această întrebare conţine patru erori:


• Răspunsul c este inclus în răspunsul d, întrucât profesorii sunt cadre didactice.
• Nu se specifică pentru cine „este importantă” psihologia şcolară (pentru teoria
pedagogică).
• Răspunsurile a, c şi d trebuiau formulate corect astfel „este importantă pentru teoria
pedagogică şi pentru că ...”, deoarece există posibilitatea ca unii subiecţi să le
interpreteze de forma „este importantă numai pentru că...” şi să le considere false pe
toate.
• Răspunsul b trebuia plasat pe prima sau pe ultima poziţie, pentru a avea o ordonare
logică a răspunsurilor propuse.

12. Fiecare răspuns propus trebuie să conţină o singură idee.

82 |
Exemplu. Care dintre enunţurile de mai jos sunt corecte?
a. Psihologia şcolară stabileşte care să fie structura unei şcoli, ce anume
să se predea elevilor, ce metode şi materiale pot fi folosite şi are
caracter normativ.
b. Pedagogia studiază acţiunile educative şi rezultatele lor din punct de
vedere psihologic, igienic, moral şi economic.
c. Psihologul face constatări şi recomandări necesare pedagogului.
d. Pedagogia nu dă niciun fel de indicaţii pentru activitatea educativă
desfăşurată în şcoală.

În această întrebare răspunsul a conţine mai multe idei, dintre care unele sunt adevărate,
altele false. Faptul că răspunsul a este fals este evident şi pentru cineva care nu are cunoştinţe
de psihologie şcolară, pentru că se ştie că structura unei şcoli nu este stabilită de psihologia
şcolară.

13. Trunchiul întrebării trebuie să conţină toate informaţiile necesare pentru alegerea
răspunsurilor corecte.
Exemplu. Completaţi definiţia dezvoltării psihice utilizând poziţii selectate din lista de
mai jos, ordonate conform introducerii în text:
Dezvoltarea psihică este procesul de ... a capacităţilor, operaţiilor şi funcţiilor psihice,
precum şi de apariţie a unor structuri noi psihocomportamentale sub acţiunea corelată a
factorilor de ...
a. ereditate;
b. combinare;
c. autoreglare;
d. înnoire;
e. mediu;
f. educaţie;
g. personalitate.

La această întrebare răspunsurile corecte sunt d (pentru prima completare), a, e şi f


(pentru a doua completare).
Indicaţiile din trunchiul întrebării nu sunt suficient de clare, pentru că nu reiese dacă pe o
poziţie pot fi trecute mai multe cuvinte sau numai unul. Trunchiul întrebării poate fi formulat
astfel:
Completaţi definiţia dezvoltării psihice înlocuind fiecare cifră cu unul sau mai multe
cuvinte selectate din lista de mai jos. Răspundeţi cu perechi formate din câte o cifră şi o literă.
Dezvoltarea psihică este procesul de 1 a capacităţilor, operaţiilor şi funcţiilor psihice,
precum şi de apariţie a unor structuri noi psihocomportamentale sub acţiunea corelată a
factorilor de 2 .

83 |
14. Se va respecta acordul gramatical între textul inclus în trunchiul întrebării şi
răspunsurile propuse.
Exemplu. În ceea ce priveşte diferenţele interculturale, societatea vestică:
a. valorizează controlul intern;
b. reprimă controlul intern;
c. nu există diferenţe interculturale în ceea ce priveşte locus of control.

Întrebarea conţine două erori:


• Nu se specifică în primele două răspunsuri propuse că este vorba despre locul
controlului.
• Răspunsul propus c nu continuă logic propoziţia începută în trunchiul întrebării.

15. Pentru simplificarea exprimării, vor fi incluse în trunchiul întrebării toate cuvintele
care ar trebui repetate în fiecare răspuns, dacă acest lucru nu îngreunează înţelegerea.
Exemplu. Validitatea convergentă a unui test se cercetează în cadrul:
a. validării de conţinut;
b. validării de construct;
c. validării relative la criteriu.

Pentru a nu repeta cuvântul „validării” în fiecare răspuns propus, itemul se poate rescrie
astfel:
Validitatea convergentă a unui test se cercetează în cadrul validării:
a. de conţinut;
b. de construct;
c. relative la criteriu.

16. Într-un test întrebările trebuie să fie ordonate astfel încât răspunsul corect să nu
figureze pe aceeaşi poziţie în mai multe întrebări consecutive.

17. Într-un test pot fi incluse întrebări care au un număr diferit de răspunsuri propuse şi,
de asemenea, întrebări care au acelaşi număr de răspunsuri propuse şi numere diferite de
răspunsuri corecte.

5.3.4. Sugestii pentru scrierea întrebărilor de tip asociere

1. Elementele fiecărei liste trebuie să aparţină aceleiaşi categorii.

2. Elementele listelor să fie relativ scurte, întrucât ele sunt citite de mai multe ori, ceea
ce consumă timp pentru formularea răspunsurilor.

84 |
3. Atunci când este posibil, elementele fiecărei liste să fie aranjate într-o ordine logică
(de exemplu, în ordine crescătoare sau descrescătoare, dacă elementele sunt numere).

4. În trunchiul întrebării se va prezenta regula de formare a perechilor (criteriul) şi


modul de formulare a răspunsului.

5. Se recomandă ca listele să conţină numere diferite de elemente şi să se permită ca


unele elemente dintr-o listă să formeze pereche cu mai multe elemente din cealaltă listă sau/şi
ca unele elemente să nu intre în componenţa niciunei perechi. (Dacă listele ar conţine acelaşi
număr de elemente şi fiecare element ar fi inclus într-o pereche, atunci formarea greşită a unei
perechi ar cauza alcătuirea greşită a unei alte perechi.)

6. Listele să nu conţină prea multe elemente, pentru a nu creşte nejustificat nivelul de


complexitate al întrebării. De obicei se folosesc liste cu 4-5 elemente.

7. Dacă cele două liste nu conţin acelaşi număr de elemente, se va plasa în partea stângă
lista cea mai lungă, pentru a scurta timpul de răspuns, întrucât de cele mai multe ori subiecţii
citesc, pe rând, elementele listei din partea stângă şi, pentru fiecare dintre ele, parcurg întreaga
listă din partea dreaptă.

5.3.5. Sugestii pentru scrierea întrebărilor de tip ordonare

1. Textul întrebării trebuie să specifice clar criteriul folosit pentru ordonare.


Exemplu. Într-un test de cunoştinţe figurează trei întrebări dihotomice (A, B şi C). Testul
a fost administrat la 20 de elevi. Au răspuns corect:
la întrebarea A, 10 elevi;
la întrebarea B, 7 elevi;
la întrebarea C, 12 elevi.
Ordonaţi întrebările după dificultatea lor şi răspundeţi cu literele care identifică
întrebările, ordonate corespunzător.

Nu se precizează aici dacă trebuie să se aranjeze întrebările în ordinea crescătoare sau în


ordinea descrescătoare a dificultăţii lor.

2. Numărul elementelor care vor fi ordonate nu trebuie să fie mare, pentru că, pe măsură
ce creşte numărul lor, scade şansa de a se răspunde corect. Inversarea a două elemente, de
exemplu, face ca răspunsul să fie considerat greşit, la fel ca unul în care niciun element nu a
fost plasat pe poziţia corectă. Sunt suficiente 3-6 elemente.

85 |
5.3.6. Sugestii pentru scrierea întrebărilor cu formulări lacunare

1. Textul întrebării să fie formulat astfel încât să fie înţeles la fel de toate persoanele care
îl citesc.
Exemplu. Poetul George Coşbuc s-a născut în ___.

La această întrebare se poate răspunde corect fie cu anul naşterii (1866), fie cu numele
localităţii natale (Hordou).
2. Nu se va cere completarea unor elemente care determină modul de completare a altor
elemente.
Exemplu. Indicele de … al unui item ia valori în intervalul …

La această întrebare se poate răspunde corect în următoarele trei moduri:


„dificultate” şi „[0, 1]”;
„validitate” şi „[-1, 1]”;
„discriminare” şi „[-1, 1]”.
Ar fi fost necesar să se completeze primul termen absent:

3. Atunci când răspunsul aşteptat este un număr zecimal, este necesar ca întrebarea să
specifice numărul zecimalelor acestuia şi, atunci când este cazul, dacă se obţine prin
trunchiere sau prin rotunjire.
Exemplu. Indicaţi valoarea numărului π: ____

Întrucât nu s-a specificat în întrebare cu câte zecimale să fie notat răspunsul, vor fi
considerate corecte toate răspunsurile următoare:
3,14 (valoarea cu două zecimale);
3,141 (valoarea obţinută prin trunchierea numărului 3,1416 la trei zecimale);
3,142 (valoarea obţinută prin rotunjirea numărului 3,1416 la trei zecimale);
3,1416 (valoarea cu patru zecimale).

4. Dacă răspunsul aşteptat poate fi formulat în diverse unităţi de măsură (de exemplu, în
ore, minute sau secunde) este necesar să se precizeze în întrebare unitatea de măsură în care
trebuie exprimat acesta.

5. Atunci când se poate răspunde la întrebare prin sinonime, vor fi considerate corecte
toate sinonimele.
Exemplu. Numărul de puncte obţinut de o persoană la un test de cunoştinţe se numeşte
______

86 |
Oricare dintre răspunsurile „scor”, „cotă”, „scor brut” şi „cotă brută” trebuie să fie
considerat corect.

5. Spaţiile lăsate la fiecare întrebare pentru notarea răspunsurilor să fie aproximativ de


aceeaşi lungime, pentru a nu sugera lungimea fiecărui răspuns.

87 |
88 |
6. CALCULUL SCORULUI UNUI TEST DE CUNOŞTINŢE

Performanţele unui subiect la un test de cunoştinţe sunt exprimate printr-un scor sau o
cotă.
Scorul unui test este un număr, a cărui valoare se obţine luând în considerare
răspunsurile subiectului la itemii testului şi, uneori, gradul de dificultate al acestor itemi.
Concret, pentru calculul său se parcurge următorul algoritm cu trei paşi:
a. Se calculează cota fiecărui item al testului, în funcţie de răspunsul subiectului.
b. Pentru fiecare item se înmulţeşte cota itemului cu ponderea itemului. Această
pondere este o caracteristică a itemului; ea reflectă dificultatea sau importanţa
itemului şi se stabileşte în faza de construcţie a testului.
c. Se însumează valorile obţinute la pasul b, pentru toţi itemii.
Atunci când nu se doreşte să se diferenţieze itemii în funcţie de dificultatea sau de
importanţa lor, se acordă tuturor itemilor ponderea 1. În acest caz pasul b nu mai are rost.
Adesea, cotele itemilor sunt stabilite astfel încât valoarea maximă posibilă a cotei să fie
cu atât mai mare, cu cât ceea ce verifică itemul este mai important, mai dificil sau mai
complex. Toţi itemii au ponderea egală cu 1, dar intervalele valorilor posibile pentru cote
variază de la un item la altul.
Exemplu. Un test de verificare a cunoştinţelor de statistică constă din următorii trei
itemi:
1. Indicaţi formula de calcul a medianei, în cazul datelor grupate.
2. S-a administrat o probă de evaluare a dexterităţii manuale, unei grupe formate din 10
persoane, în trei momente diferite. Indicaţi, pentru fiecare situaţie, valoarea modului.
a. 1, 2, 2, 3, 4, 4, 5, 5, 5, 6.
b. 1, 2, 3, 4, 5, 5, 6, 7, 8, 9.
c. 1, 2, 3, 3, 4, 5, 6, 6, 7, 8.
3. Precizaţi deosebirea (deosebirile) dintre formulele de calcul utilizate pentru
determinarea dispersiei într-o populaţie şi într-un eşantion.

Cotele şi ponderile itemilor pot fi stabilite în diverse moduri. O posibilitate de cotare ar


fi să se acorde, pentru fiecare item, un punct în cazul în care răspunsul subiectului este corect
şi complet şi 0 puncte dacă este greşit, incomplet sau omis.
Dacă se consideră că itemii testează cunoştinţe de importanţă, complexitate şi dificultate
relativ egale, se stabileşte ca ponderea fiecărui item să fie egală cu 1, iar scorul testului va
putea varia între 0 (atunci când nu se răspunde corect şi complet la niciun item) şi 3 (dacă se
răspunde corect şi complet la toţi itemii).
Dacă, însă, se apreciază că itemul 2 necesită mai multe cunoştinţe decât primul item, iar
itemul 3 este mai dificil decât primul, se pot stabili ponderile: 1 pentru primul item, 3 pentru
itemul al doilea şi 2 pentru itemul al treilea. Scorul testului va varia de această dată între 0 şi
6.

89 |
O altă posibilitate este de a acorda primului item un punct dacă răspunsul este corect şi
zero puncte dacă este greşit sau omis, itemului 3, considerat mai dificil, să i se acorde 2
puncte în cazul răspunsului corect şi 0 puncte dacă se răspunde greşit sau nu se răspunde, iar
la al doilea item să se acorde câte un punct fiecărui caz în care modul a fost indicat corect,
cota acestui item putând lua, astfel, valorile 0, 1, 2 sau 3. Valoarea maximă posibilă a cotei
fiecărui item reflectă dificultatea şi complexitatea acestuia, aşa încât nu mai are rost să se
stabilească ponderi diferite pentru itemi. Toate ponderile vor fi egale cu 1. Scorul testului va
avea valori cuprinse între 0 şi 6.

Metoda cea mai frecvent folosită pentru a cota itemii unui test de cunoştinţe, indiferent
de tipul acestora, este de a acorda un punct pentru fiecare răspuns corect şi zero puncte
răspunsurilor greşite şi celor omise (răspunsurilor corecte care nu au fost alese de cel care a
răspuns la test). În felul acesta, la un item pentru care sunt corecte s răspunsuri (de exemplu,
itemul cere efectuarea a s calcule, fiecare putând fi realizat „corect” sau „greşit”; itemul este
cu răspunsuri la alegere şi lista de răspunsuri propuse conţine s răspunsuri corecte; itemul este
de tip asociere şi sunt corecte s perechi; itemul este cu răspunsuri deschise şi cere enumerarea
a s termeni) valoarea cotei pentru un subiect va fi egală cu numărul de răspunsuri corecte. Prin
urmare, cota va putea avea valorile 0, 1, 2, …, s.
Această metodă nu diferenţiază între itemii care au acelaşi număr de răspunsuri corecte,
dar au dificultăţi diferite. Uneori, dificultatea unui item provine din modul în care acesta a fost
formulat (cu răspunsuri închise ori cu răspunsuri deschise) sau, în cazul itemilor cu răspunsuri
la alegere, din numărul de răspunsuri propuse.
Exemplu. Următorii itemi verifică aceleaşi cunoştinţe şi solicită câte un singur răspuns:
1. Indicaţi intervalul în care ia valori coeficientul de corelaţie liniară:
a. [0, 1];
b. [-1, 1].

2. Indicaţi intervalul în care ia valori coeficientul de corelaţie liniară:


a. [0, 2];
b. [0, 1];
c. [-1, 0];
d. [-2, 0];
e. [-1, 1];
f. [–2, 2].

3. Indicaţi intervalul în care ia valori coeficientul de corelaţie liniară.

Cotele posibile, la toţi cei trei itemi, sunt 1 (dacă s-a indicat răspunsul [-1, 1]) şi 0 (dacă
nu s-a răspuns ori a fost ales un alt răspuns).
Dar şansele de a ghici răspunsul corect, dacă acesta nu îi este cunoscut subiectului,
diferă mult între itemi. Astfel, la primul item, şansele sunt de 50% (întrucât subiectul are de

90 |
ales un răspuns din două), la al doilea, de 16,7% (pentru că trebuie ales un răspuns din şase),
în timp ce la al treilea item, şansele sunt foarte mici.

O soluţie pentru a evita obţinerea aceluiaşi punctaj la itemi asemănători în ceea ce


priveşte cantitatea şi complexitatea cunoştinţelor verificate, dar care, datorită formei de
prezentare sunt de dificultăţi diferite, este de a acorda ponderi diferite itemilor.
Un dezavantaj pe care îl prezintă acest mod de cotare a itemilor constă în faptul că
permite să se obţină cota maximă la un item cu răspunsuri la alegere dacă se selectează toate
răspunsurile propuse. Sunt avantajaţi cei care, nefiind siguri pe cunoştinţele lor, aleg cât mai
multe răspunsuri propuse.
Exemplu. La un item cu răspunsuri la alegere care propune patru răspunsuri, dintre care
unul singur este corect, şansele de a „nimeri” răspunsul corect şi de a obţine, astfel, un punct
sunt de:
25% dacă se alege un singur răspuns;
50% dacă se aleg două răspunsuri,
75% dacă se aleg trei răspunsuri;
100% dacă se aleg toate cele patru răspunsuri.

Chiar dacă la un item cu alegere multiplă se specifică numărul de răspunsuri corecte şi


se menţionează că persoanelor care aleg mai multe răspunsuri decât numărul de răspunsuri
corecte vor primi zero puncte, metoda de a cota itemul acordând câte un punct pentru fiecare
răspuns corect îi avantajează pe cei care, necunoscând răspunsurile corecte, aleg la
întâmplare. Astfel, la un item care propune n răspunsuri (n≥2) dintre care sunt corecte s (s≥1),
dacă s este mai mare decât jumătate din numărul itemilor propuşi (s> n ), atunci orice
2
persoană care alege la întâmplare s răspunsuri va obţine cel puţin 2s-n puncte.
Exemplu. La un item cu alegere multiplă care propune 5 răspunsuri, dintre care sunt
corecte 3, orice persoană care va alege la întâmplare 3 răspunsuri va obţine cel puţin un punct.
Ea are şanse de 10% să obţină trei puncte, de 60% să obţină două puncte şi de 30% să obţină
un punct.

Iar dacă numărul de răspunsuri corecte este cel mult egal cu jumătate din numărul de
răspunsuri propuse (s≤ n ), atunci şansele ca o persoană care alege la întâmplare s răspunsuri
2
⎛ Cs ⎞
⎜ n − s ⎟ ⎡ (n − s )!(n − s )!⎤
să obţină cel puţin un punct sunt de 100 × ⎜1 − % = 100 × ⎢1 − %.
⎜ C s ⎟ ⎟ ⎣ n! (n − 2 s )! ⎥⎦
⎝ n ⎠
Observaţie. Cab reprezintă „combinări de a obiecte luate câte b” şi se calculează cu

formula Cab = a! = 1× 2×...× a


b!( a − b)! (1× 2×...×b)×[1× 2×...×( a − b)]

91 |
Exemplu. La un item cu alegere multiplă care propune cinci răspunsuri, dintre care sunt
corecte două, o persoană care va alege la întâmplare două răspunsuri are şanse de 10% să
obţină două puncte şi de 60% să obţină un punct, adică, şansele sale de a obţine cel puţin un
punct sunt de 70%.

Pentru a micşora şansele subiecţilor care răspund la întâmplare să obţină puncte,


întrebările cu răspunsuri la alegere în care se specifică numărul de răspunsuri corecte ar trebui
formulate astfel încât numărul de răspunsuri corecte să nu fie mai mare decât jumătate din
numărul răspunsurilor propuse. Dacă nu se pot adăuga răspunsuri propuse greşite care să fie
credibile, se poate recurge la reformularea itemului, astfel încât să ceară selectarea
răspunsurilor care, în formularea iniţială, erau greşite.
Exemplu. Următorul item propune patru răspunsuri, dintre care doar unul (răspunsul d)
este greşit:
Care dintre următorii indicatori poate fi calculat (pot fi calculaţi) pentru o variabilă
măsurată pe scală ordinală?
a. frecvenţa relativă a fiecărei valori;
b. modul;
c. mediana;
d. media.

O posibilitate de a micşoara numărul de răspunsuri corecte ar fi să se reformuleze


itemul, astfel încât să ceară selectarea răspunsului d:
Care dintre următorii indicatori nu poate fi calculat (nu pot fi calculaţi) pentru o
variabilă măsurată pe scală ordinală?
a. frecvenţa relativă a fiecărei valori;
b. modul;
c. mediana;
d. media.

O altă formulă de calcul al scorului unui item dintr-un test de cunoştinţe ia în


considerare probabilitatea de a ghici răspunsul corect. Ea poate fi utilizată numai în cazul
întrebărilor cu răspunsuri închise, când această probabilitate este cunoscută şi este aceeaşi
pentru toţi itemii testului. Pentru folosirea ei trebuie să fie îndeplinite următoarele condiţii:
• răspunsurile parţial corecte sunt considerate greşite;
• pentru fiecare item se acordă un punct în cazul răspunsului corect şi zero puncte în
cazul răspunsului omis;
• pentru fiecare item se acordă acelaşi punctaj în cazul răspunsului greşit sau parţial
p
corect, egal cu − , unde p este probabilitatea de a răspunde corect.
1− p

92 |
p
Cu cât probabilitatea de a răspunde corect este mai mare, cu atât raportul este mai
1− p
mare, adică fiecare răspuns greşit este penalizat mai mult.
Faptul că probabilitatea răspunsului corect este aceeaşi pentru toţi itemii nu înseamnă că
itemii testului trebuie să fie, toţi, de acelaşi tip.
Exemplu. Probabilitatea de a răspunde corect este egală cu 1 pentru:
6
• un item cu răspunsuri la alegere care propune şase răspunsuri, dintre care unul este
corect, şi cere să se aleagă un singur răspuns;
• un item cu răspunsuri la alegere care propune patru răspunsuri, dintre care două sunt
corecte şi cere să se aleagă două răspunsuri;
• un item care solicită formarea de perechi cu elemente din două liste, una cu două
elemente şi cealaltă cu trei elemente, dacă dintre cele şase perechi care pot fi formate
este corectă doar una şi itemul specifică să se formeze o singură pereche.
Pentru primul şi al treilea item se acordă un punct dacă a fost indicat răspunsul corect şi
1
se scad = 6 puncte dacă a fost ales un răspuns greşit. La al doilea item se acordă un
1
5 1− 1
6
punct dacă au fost alese ambele răspunsuri corecte şi se scad 1 puncte dacă a fost ales cel
5
puţin un răspuns greşit. Pentru itemii la care nu s-a răspuns se acordă zero puncte.

Scorul pe care îl obţine la test un subiect care a răspuns corect la C itemi şi greşit sau
parţial corect la G itemi, dacă se utilizează această metodă de cotare a itemilor, este egal cu
p
C− G . Dacă a răspuns corect la toţi itemii, atunci scorul său este egal cu numărul de
1− p
itemi din test. Dacă nu a răspuns la nici un item, obţine zero puncte, iar dacă a răspuns cel
puţin la un item, dar nu a răspuns corect la niciun item, scorul său este negativ.
În cazul particular când toţi itemii testului sunt cu răspunsuri la alegere, propun acelaşi
număr de răspunsuri (n) dintre care unul este corect şi se cere selectarea unui singur răspuns,
probabilitatea de a ghici răspunsul corect este p = 1 . Fiecărui item la care s-a răspuns corect
n
i se acordă un punct, iar pentru fiecare item la care s-a răspuns greşit se scad 1 puncte.
n −1
Scorul obţinut la test de un subiect care a răspuns corect la C itemi şi greşit la G itemi este
egal cu C − 1 G .
n −1
Această formulă de obţinere a scorului la un test format din itemi cu răspunsuri la
alegere care propun n itemi, dintre care unul este corect, şi care solicită alegerea unui singur
răspuns la fiecare item este cunoscută sub denumirea de formula corectată pentru şansa
succesului.

93 |
Conform acestei formule, dacă un subiect a răspuns la toţi itemii, atunci, notând cu T
numărul de itemi din test (T=C+G), scorul său va fi egal cu n C − 1 T . Termenul
n −1 n −1
1 T este o caracteristică a testului. Prin urmare, dacă celor examinaţi li se cere să răspundă
n −1
la toţi itemii, se va obţine aceeaşi ordine a examinaţilor dacă scorul fiecărei persoane se
calculează acordând câte un punct pentru fiecare item la care a răspuns corect şi zero puncte
pentru itemii la care a greşit sau dacă se utilizează formula corectată pentru şansa succesului,
întrucât scorurile obţinute prin cele două formule sunt legate între ele printr-o transformare
liniară de forma:
S1=aS2+b
unde:
S1 este scorul calculat prin formula corectată pentru şansa succesului;
S2 este scorul calculat acordând câte un punct pentru fiecare item la care s-a răspuns
corect şi zero puncte pentru fiecare item la care s-a răspuns greşit;
a= n ;
n −1
b= − n T .
n −1
Metoda prezentată mai sus, de a acorda un punct fiecărui răspuns corect şi de a penaliza
p
răspunsurile greşite cu puncte, se bazează pe ipoteza că orice persoană care nu cunoaşte
1− p
răspunsul corect la un item nu răspunde sau răspunde la întâmplare. Dar, această presupunere
este rareori corectă. Examinaţii care au informaţii parţiale despre tema la care se referă un
item nu vor răspunde la întâmplare, ci vor încerca să-şi utilizeze cunoştinţele pentru a da
răspunsul corect şi, astfel, au şanse mai mari să aleagă toate răspunsurile corecte decât dacă ar
încerca să ghicească. De asemenea, persoanele care au informaţii eronate nu vor recurge la
ghicirea răspunsurilor corecte, ci vor alege răspunsuri greşite, convinşi că acestea sunt
corecte. În ambele situaţii prezentate, răspunsurile greşite propuse de item nu sunt, toate, la fel
de atractive pentru cel examinat, ceea ce înseamnă că probabilitatea de a fi alese de acesta nu
este aceeaşi.
Metoda prezentată pentru cotarea itemilor îi avantajează, dintre examinaţii care nu
cunosc răspunsurile corecte, pe cei care au cunoştinţe parţiale şi sunt capabili să identifice
unul sau mai multe răspunsuri greşite dintre cele propuse pentru a le evita, precum şi pe cei
care răspund „inteligent”, analizând cu atenţie fiecare răspuns şi putând, astfel, să identifice
răspunsurile greşite care nu sunt atât de bine formulate încât să pară corecte. Din acest motiv,
o practică larg acceptată în utilizarea testelor de cunoştinţe este aceea de a le spune
examinaţilor că este în dezavantajul lor să ghicească răspunsul atunci când nu îl cunosc,
deoarece greşelile sunt penalizate atunci când se calculează scorul la test, dar de a-i încuraja
să răspundă de fiecare dată când nu sunt siguri, însă pot face un raţionament bazat pe
informaţii, care să îi conducă spre un răspuns corect.

94 |
O metodă de cotare a itemilor, în cazul testelor compuse din itemi cu răspunsuri la
alegere care propun acelaşi număr de răspunsuri, n, dintre care sunt corecte s (1≤s<n) este
aceea de a acorda câte un punct răspunsurilor corecte, a cota cu zero puncte răspunsurile care
sunt corecte dar nu au fost indicate de examinat şi a scădea s puncte pentru fiecare
n−s
răspuns greşit. În felul acesta, cota fiecărui item poate lua valori între –s (atunci când
examinatul a ales toate răspunsurile greşite şi nici un răspuns corect) şi s (dacă examinatul a
ales toate răspunsurile corecte şi nici un răspuns greşit). O persoană care alege toate
răspunsurile propuse la un item primeşte zero puncte.
Cantitatea scăzută pentru un răspuns greşit, s , este cu atât mai mare cu cât raportul
n−s
s , adică probabilitatea de a alege un răspuns corect, este mai mare.
n
Avantajul acestei metode este că permite să se acorde puncte şi itemilor la care s-a dat
un răspuns parţial corect.
Scorul la test al unei persoane care a dat C răspunsuri corecte şi G răspunsuri greşite este
egal cu C − s G . Această formulă de calcul al scorului total generalizează formula
n−s
corectată pentru şansa succesului, reducându-se la aceasta dacă s=1, adică la fiecare item doar
un răspuns dintre cele propuse este corect, şi li s-a spus examinaţilor să aleagă un singur
răspuns la fiecare item.

În literatura de specialitate apare cvasiunanimă părerea că la întrebările cu răspunsuri la


alegere trebuie să se acorde un punctaj diferit de zero numai dacă au fost indicate toate
răspunsurile corecte şi nici un răspuns greşit. Altfel spus, răspunsurile greşite şi cele parţial
corecte se cotează cu zero puncte (Jinga, Petrescu, 2008).
Observaţii.
1. O întrebare de tip ordonare poate fi considerată, pentru calculul cotei, ca un item cu
răspunsuri la alegere, în care numărul de răspunsuri propuse este egal cu numărul de
răspunsuri posibile (dacă întrebarea cere să se ordoneze n elemente, atunci numărul de
răspunsuri posibile este n!=1x2x…xn).
2. O întrebare de tip asociere poate fi considerată, pentru calculul cotei, drept un item cu
răspunsuri la alegere, în care numărul de răspunsuri propuse este egal cu numărul de perechi
ce pot fi formate, adică este egal cu produsul numerelor elementelor din cele două liste, iar
numărul de răspunsuri corecte este egal cu numărul de perechi corecte. Sau este posibil ca ea
să fie interpretată ca fiind formată din atâţia itemi cu răspunsuri la alegere câte elemente sunt
în prima listă, pentru fiecare item numărul de răspunsuri propuse fiind egal cu numărul de
elemente din cea de a doua listă, iar numărul de răspunsuri corecte coincizând cu numărul de
perechi corecte formate cu elementul din prima listă.
Exemplu. Într-un test de cunoştinţe de statistică figurează următoarea întrebare:
Indicaţi, pentru fiecare dintre scalele de măsură 1-2, care dintre indicatorii statistici a-d
poate fi calculat (pot fi calculaţi). Răspundeţi cu perechi formate din câte o cifră şi o literă.

95 |
1. scală nominală; a. modul;
2. scală ordinală. b. mediana;
c. media;
d. dispersia.

Întrebarea poate fi considerată ca un item cu răspunsuri la alegere în care răspunsurile


propuse sunt 1a, 1b, 1c, 1d, 2a, 2b, 2c şi 2d, iar răspunsurile corecte 1a, 2a şi 2b. Itemul ar
corespunde următoarei întrebări:
Indicaţi care dintre următoarele calcule este corect (sunt corecte):
1a. calculul modului pentru o variabilă măsurată pe scală nominală;
1b. calculul medianei pentru o variabilă măsurată pe scală nominală;

2d. calculul dispersiei pentru o variabilă măsurată pe scală ordinală.
Sau întrebarea poate fi rescrisă sub forma a doi itemi cu răspunsuri la alegere, fiecare
propunând câte patru răspunsuri:
1. Indicaţi care dintre următorii indicatori statistici poate fi calculat (pot fi calculaţi)
pentru o variabilă măsurată pe scală nominală:
a. modul;
b. mediana;
c. media;
d. dispersia.

2. Indicaţi care dintre următorii indicatori statistici poate fi calculat (pot fi calculaţi)
pentru o variabilă măsurată pe scală ordinală:
a. modul;
b. mediana;
c. media;
d. dispersia.

La primul item există un singur răspuns corect (a), iar la al doilea, două răspunsuri
corecte (a şi b).

96 |
7. VALIDITATEA TESTELOR

7.1. Noţiunea de validitate

Multă vreme, în teoria testelor s-a considerat că validitatea se referă la cât de bine
realizează instrumentul ceea ce se presupune că face (Graziano, Raulin, 1993). Iniţial, ea a
fost definită şi cercetată în legătură cu funcţia îndeplinită de test. Astfel, de exemplu,
Lindeman (1978) scria că „validitatea unui test este dată de măsura în care acesta îşi
îndeplineşte funcţia”.
Întrucât testele psihologice şi cele de cunoştinţe sunt construite pentru măsurare, pentru
predicţie sau pentru decizie, verificarea validităţii se făcea determinând:
• dacă testul măsoară ceea ce se doreşte să măsoare (în cazul testelor de cunoştinţe,
dacă măsoară cunoştinţele persoanei examinate, gradul său de înţelegere, capacitatea
sa de a aplica principii care au fost predate într-o anumită secvenţă de instruire etc.)
sau
• dacă testul poate fi utilizat pentru a lua decizii ori a face predicţii asupra persoanelor
examinate (de exemplu, în cazul testelor de cunoştinţe administrate la un concurs de
admitere, dacă persoanele declarate reuşite vor obţine rezultate bune în timpul sau
după încheierea perioadei de instruire), în sensul că scorurile furnizate de test
corelează sau se asociază cu măsuri ale rezultatelor deciziei ori cu măsuri ale
succesului.
Dar observaţia că psihologii care utilizează un test nu sunt interesaţi, de fapt, de
proprietăţile acestuia, ci de atributele persoanelor testate, a condus spre o nouă accepţiune a
termenului validitate, în care accentul nu mai cade pe felul în care testul îşi realizează funcţia,
ci pe încrederea pe care o prezintă deducţiile făcute pe baza scorurilor sale, luând în
considerare întregul proces prin care s-au obţinut aceste scoruri (Guion, 1986). În consecinţă,
validitatea nu mai este privită ca o calitate a testului, ci ca o calitate a utilizării date
rezultatelor testului.
Sunt relevante, în acest sens, următoarele definiţii:
• Validitatea este gradul în care o anumită inferenţă făcută plecând de la test are
înţeles, este potrivită şi utilă (Standards for Educational and Psychological Tests,
1985).
• Validitatea unui test se referă la cât de potrivite sunt interpretările descriptive,
explicative sau predictive care se dau scorurilor sale (Silva, 1993).
• Validitatea este o judecată evaluativă globală asupra gradului în care dovezi empirice
şi raţionamente teoretice oferă sprijin ca, pe baza scorurilor testului, să se realizeze
interpretări sau acţiuni potrivite (Messick, 1995).
Sintetizând aceste definiţii, se poate afirma că un test este valid dacă pe baza scorurilor
sale pot fi formulate descrieri, explicaţii sau predicţii care să fie utile, servind scopului în care
este folosit testul.

97 |
De fapt, noile definiţii ale validităţii le extind pe cele vechi, impunând condiţii legate de
utilitate, aspect care era trecut cu vederea atunci când se analizau calităţile testelor. Or, nu este
suficient să se ştie că un test construit pentru a măsura capacitatea de decizie îşi îndeplineşte
funcţia (în sensul că realizează o măsurare corectă), dacă nu se poate şti ce semnificaţie are
faptul că o persoană a obţinut la acest test scorul 20, cum se va comporta într-o funcţie de
conducere o persoană care a realizat scorul 24 sau ce recomandări ar trebui să facă un
psiholog unei persoane al cărei scor la test este egal cu 5.
Validitatea unui test este dependentă atât de instrument, cât şi de contextul în care este
utilizat acesta şi de persoanele care răspund la test. Este absolut necesar ca atunci când se
vorbeşte despre validitatea unui test să se precizeze:
• scopul utilizării testului (formularea unui psihodiagnostic, selecţie profesională etc.);
• funcţia testului (măsurare, predicţie sau decizie);
• atributul măsurat sau variabila ale cărei valori sunt prezise de test;
• populaţia pentru care va fi folosit testul;
• condiţiile în care va fi utilizat testul.
Nu este corect să se folosească expresia validitatea testului fără alte specificaţii. Nici un
test nu este valid pentru toate scopurile sau în toate situaţiile ori pentru toate populaţiile de
indivizi (Standards for Educational and Psychological Tests, 1974). Un test poate realiza o
măsurare foarte bună, fără a putea fi folosit pentru predicţie. De asemenea, un test poate fi
utilizat pentru a lua decizii importante, chiar dacă nu se ştie ce măsoară.

7.2. Validarea testelor

7.2.1. Semnificaţia validării testelor

Validarea unui test este procesul prin care se investighează gradul de validitate a
interpretării propuse de test (Standards for Educational and Psychological Tests, 1985).
Orice validare trebuie să înceapă prin a răspunde la întrebările:
• Ce funcţie îndeplineşte testul?
• În ce scop se utilizează testul?
• În ce condiţii se foloseşte testul?
• Ce caracteristici au persoanele cărora li se administrează testul?
Exemplu. În cazul unui test de cunoştinţe de statistică, pentru a putea verifica dacă
scorurile sale vor fi interpretate corect (adică, dacă testul este valid), se vor lua în considerare
următoarele aspecte:
• Testul trebuie să verifice cât de bine cunosc cei examinaţi noţiunile statistice (testul
are funcţie de măsurare).
• Testul va fi administrat studenţilor din anul I de la o facultate de psihologie.
• Testul va fi utilizat în cadrul examenului la disciplina „Psihologie experimentală şi
statistică”.

98 |
• Testul trebuie să-i identifice pe studenţii care nu ştiu să utilizeze noţiunile statistice
la rezolvarea unor probleme simple din domeniul psihologiei experimentale. Aceştia
nu vor promova examenul.

Întrucât validitatea unui test a fost, multă vreme, legată de felul în care acesta îşi
îndeplineşte funcţia, şi procedeele folosite pentru validarea testelor au avut în vedere funcţiile
testelor. Pentru fiecare funcţie a testelor psihologice (măsurare, decizie şi predicţie) au fost
formulate condiţiile pe care trebuie să le îndeplinească un test valid şi au fost propuse strategii
de verificare a acestora. Fiecare set de condiţii, cu strategiile corespunzătoare, a fost etichetat
şi a fost privit ca un tip de validitate sau ca o faţă a validităţii. În Standards for Educational
and Psychological Tests din anul 1974 sunt prezentate trei tipuri de validitate:
• validitatea conceptuală, denumită şi validitate de construct;
• validitatea de conţinut;
• validitatea relativă la criteriu.
Validitatea de construct şi validitatea de conţinut sunt legate de funcţia de măsurare a
testelor, iar validitatea relativă la criteriu investighează funcţiile de decizie şi de predicţie.
Se creează, însă, o posibilitate de confuzie, pentru că se utilizează acelaşi termen –
validitate – atât pentru o calitate a testului, cât şi pentru modul în care se face verificarea
acesteia. Apare, astfel, justificată propunerea făcută de C.L. Lawshe (Landy, 1986) de a
înlocui denumirea tip de validitate cu cea de tip de analiză a validităţii. Prin analiză a
validităţii Lawshe înţelege o procedură, un proces sau o strategie prin care se colectează sau
se generează date în vederea determinării extinderii ori a forţei inferenţelor care pot fi făcute
pe baza unei mulţimi de scoruri la test.
Principala deosebire dintre cele trei categorii de strategii de validare constă în ponderea
acordată procedurilor statistice. Astfel:
• analiza validităţii de conţinut se bazează pe judecăţi, nu face apel decât în măsură
redusă la metode statistice;
• analiza validităţii relative la criteriu cercetează legăturile dintre rezultatele testului şi
rezultatele altor măsurători (denumite criterii), folosind procedee statistice;
• analiza validităţii de construct utilizează atât judecăţi, cât şi verificări prin procedee
statistice ale relaţiilor testului cu diverse criterii.

7.2.2. Analiza validităţii de construct

Analiza validităţii de construct se realizează, mai ales, în cazul testelor care măsoară
constructe psihologice, cum sunt chestionarele de personalitate. (Conform definiţiei din
Standards for Educational and Psychological Tests, din 1985, un construct psihologic este
„o noţiune teoretică derivată din cercetare şi din alte experienţe, care a fost construită pentru a
explica patternuri de comportament observabile”. Astfel de constructe sunt: sociabilitatea,
anxietatea, creativitatea.)

99 |
Analiza validităţii de construct face apel la diverse teorii psihologice pentru a verifica, în
primul rând, dacă testul se referă cu adevărat la constructul pe care trebuie să îl măsoare şi
apoi dacă scorurile obţinute de subiecţi la test reflectă corect mărimea acestui construct la
persoanele respective, adică dacă între scorurile testului şi valorile constructului (estimate cu
ajutorul altor instrumente sau al unor metode) există o relaţie crescătoare, de obicei o relaţie
liniară. (O teorie este o explicaţie logică despre relaţiile dintre mai multe variabile sau un
raţionament bazat pe asemenea relaţii.)
Exemplu. Pentru a analiza validitatea de construct a unui test care măsoară anxietatea
faţă de calculator, dacă o teorie asupra anxietăţii faţă de calculator susţine că persoanele care
au lucrat puţin la calculator au o anxietate faţă de calculator mai accentuată decât cele care au
o experienţă mai mare în lucrul la calculator, se vor compara scorurile testului între două
grupe contrastante de subiecţi, formate în funcţie de numărul de ore de lucru la calculator
(apreciat de subiect). Dacă diferenţa dintre mediile scorurilor în cele două grupe nu este
semnificativă statistic sau dacă media este mai mare în grupa celor care au lucrat mai mult la
calculator, testul nu are validitate de construct.
Se va verifica apoi dacă scorurile obţinute de subiecţi la test reflectă corect mărimea
constructului „anxietatea faţă de calculator” la persoanele respective. Pentru aceasta, se va
administra un alt test care măsoară anxietatea faţă de calculator şi se va verifica dacă scorurile
celor două instrumente corelează liniar direct între ele.

Cercetarea validităţii de construct impune analizarea testului din mai multe puncte de
vedere şi prin metode diferite. Un algoritm posibil al analizei validităţii de construct constă
din următorii paşi (după Messick, 1995):
A. Mai întâi se cercetează cât de relevant şi reprezentativ este conţinutul testului pentru
constructul care trebuie măsurat. O asemenea analiză impune descrierea amănunţită a
domeniului constructului respectiv, adică prezentarea deprinderilor, a cunoştinţelor, a
atitudinilor, a motivelor, a altor atribute care au legătură cu constructul şi specificarea
relaţiilor dintre ele. Un grup de experţi apreciază apoi dacă cele mai importante porţiuni ale
domeniului constructului sunt acoperite de conţinutul testului.
B. Se analizează consecvenţa răspunsurilor la itemii testului. În acest scop, se identifică
procesele implicate în obţinerea scorurilor la itemi şi se urmăreşte dacă acestea acţionează
similar la toţi itemii din întregul test sau dintr-o parte fixată a acestuia.
Mijloacele de verificare a consecvenţei răspunsurilor sunt variate: se cercetează dacă
timpii de răspuns la itemi sunt aproximativ constanţi sau dacă scorurile itemilor corelează
semnificativ între ele ori dacă mişcările ochilor subiecţilor în timpul conceperii răspunsurilor
nu variază prea mult de la un item la altul.
C. Se urmăreşte dacă structura scorului la test reflectă structura domeniului constructului
măsurat.
Pentru aceasta, se descompune scorul total al testului în scoruri parţiale (scoruri ale unor
grupe de itemi care corelează între ei sau scoruri factoriale) şi se presupune că fiecare
asemenea scor reprezintă măsura unei variabile.

100 |
Adesea, în scopul identificării unor asemenea variabile, se utilizează analiza factorială.
Ea permite să se determine una sau mai multe variabile (numite factori) ale căror valori
(numite scoruri factoriale) se combină liniar pentru a forma scorul total al testului. Această
metodă, numită validare factorială, se aplică mai ales în cazul testelor care măsoară
constructe multidimensionale, când se verifică şi dacă variabilele puse în evidenţă de analiza
factorială corespund componentelor constructului.
Se caută semnificaţia variabilelor măsurate prin scorurile parţiale ale testului, se reţin
cele care au legătură cu constructul şi se verifică dacă importanţa acestora în domeniul
constructului este reflectată corect prin ponderile pe care le au măsurile lor în scorul total al
testului.
D. Se estimează în ce măsură concluziile desprinse până la acest pas al algoritmului de
validare pot fi generalizate, adică pot fi extinse asupra altor populaţii sau a altor ocazii de
examinare cu ajutorul testului. Se încearcă să se stabilească dacă interpretările propuse pentru
scorurile testului se menţin atunci când se schimbă situaţia în care se face examinarea,
momentul examinării ori evaluatorii.
E. Se cercetează relaţiile dintre scorurile testului şi diverse alte măsurători psihologice
sau observaţii non-evaluative asupra comportamentului. Această verificare este denumită
uneori validare convergentă şi discriminantă.
Un test are validitate convergentă dacă măsoară ceea ce măsoară şi alte teste sau
variabile care se referă la acelaşi construct, adică între scorurile sale şi rezultatele
respectivelor măsurători există o relaţie funcţională monotonă (liniară sau nu). Un test are
validitate discriminantă dacă evaluează altceva decât diverse teste sau variabile despre care se
ştie că se referă la constructe ce nu au legătură cu constructul măsurat de test. Aceasta
înseamnă că scorurile testului nu sunt în relaţie funcţională monotonă cu rezultatele acelor
măsurători.
Verificarea validităţii convergente şi discriminante se realizează conform următorului
algoritm:
a. Se identifică acele comportamente care sunt legate de constructul măsurat de test.
b. Se determină constructele care au legături cu constructul măsurat de test şi se pun în
evidenţă acele comportamente legate de ele care pot fi conectate cu constructul
măsurat de test.
c. Pentru toate comportamentele reţinute se apreciază ce fel de corelaţii ar putea exista
între măsurile lor şi o măsură bună a constructului care ne interesează (corelaţii
pozitive, negative, mari, mici sau nule).
d. Se determină coeficienţii de corelaţie între scorurile la testul studiat şi rezultatele
unor măsurători efectuate asupra comportamentelor reţinute (de exemplu, scoruri ale
unor scale).
e. Se compară coeficienţii de corelaţie obţinuţi cu valorile aşteptate.
Validarea convergentă a unui test este necesară, dar nu şi suficientă pentru a dovedi că
testul măsoară ceea ce se doreşte. Aceasta, deoarece etichetele atribuite testelor reprezintă
trăsăturile sau predispoziţiile pe care testele ar trebui să le măsoare. Corelaţia mare între două
teste care poartă aceeaşi etichetă poate fi cauzată de existenţa, în cele două teste, a unor itemi

101 |
asemănători, care nu întotdeauna sunt reprezentativi pentru constructul pe care testele
intenţionează să îl măsoare. Analiza factorială sau analiza de clusteri efectuată asupra itemilor
din testele cu aceeaşi denumire poate ajuta la explicarea corelaţiilor dintre scorurile testelor.
F. Se analizează interpretările propuse pentru scorurile testului şi sursele de invaliditate
a testului, pentru a deduce posibilele consecinţe negative ale utilizării testului, atât pe termen
scurt, cât şi pe perioade mai îndelungate.

Validarea de construct a testelor de cunoştinţe se realizează prin verificarea relaţiilor


dintre scorurile testului şi diverse alte informaţii, presupuse de o anumită teorie. Aceste
informaţii nu reprezintă măsurări ale cunoştinţelor verificate de test realizate cu un alt
instrument sau cu o altă metodă şi, prin urmare, nu pot fi folosite drept criteriu pentru
validarea testului relativă la un criteriu.
Exemplu. Pentru un test de cunoştinţe de aritmetică este de aşteptat ca, dacă este
administrat de două ori aceloraşi elevi, înainte şi după o perioadă de pregătire intensă la
aritmetică, să se constate o creştere a scorurilor sale. De asemenea, este de aşteptat ca între
scorurile testului de aritmetică şi scorurile unui test de cunoştinţe de istorie să existe o
corelaţie scăzută.

7.2.3. Analiza validităţii de conţinut

Analiza validităţii de conţinut se impune în cazul testelor utilizate la măsurarea unui


atribut care nu poate fi exprimat printr-un construct (Murphy, Davidshofer, 1991). Aşa sunt
cunoştinţele din diverse domenii.
Analiza validităţii de conţinut implică „examinarea sistematică a conţinutului testului
pentru a determina dacă el acoperă un eşantion reprezentativ din domeniul de comportamente
pe care testul în cauză trebuie să îl măsoare” (Anastasi, 1976). Mulţimea tuturor
comportamentelor care pot fi utilizate pentru a măsura atributul specific sau caracteristica la
care se referă testul poartă denumirea de domeniu de conţinut al testului (Murphy,
Davidshofer, 1991).
Itemii testului sunt priviţi ca reprezentând un eşantion extras dintr-o populaţie largă de
itemi posibili care definesc ceea ce testul trebuie să măsoare. Dacă eşantionul este
reprezentativ pentru populaţie, atunci se admite că testul are validitate de conţinut (Gregory,
1992).
Exemplu. Pentru ca un test de cunoştinţe de statistică pentru studenţii din anul I de la
facultatea de psihologie să posede validitate de conţinut, nu este suficient ca itemii săi să
verifice cunoaşterea noţiunilor de statistică descriptivă. Testul trebuie să conţină şi itemi
referitori la statistica inferenţială.

Analiza validităţii de conţinut a unui test se realizează în doi paşi:


a. se defineşte şi se descrie domeniul de conţinut al testului;

102 |
b. se analizează itemii testului şi se elimină acei itemi care nu se referă la comportamente
cuprinse în domeniul de conţinut.
a. Este foarte important ca descrierea domeniului de conţinut să fie cât mai detaliată şi să
se precizeze clar limitele acestui domeniu.
Domeniul de conţinut al unui test de cunoştinţe trebuie să conţină problemele cele mai
importante care se consideră că este necesar să fie cunoscute de cei examinaţi, din secvenţa de
instruire care este verificată prin test. Pentru descrierea sa, se recurge la tabelul de specificaţii
alcătuit în faza de construire a testului de cunoştinţe.
b. Pentru a analiza itemii testului, se formează un grup de experţi, cărora li se dau
instrucţiuni de forma următoare (Gregory, 1992):
Citiţi cu atenţie descrierea domeniului de conţinut pentru următorul test. Apoi apreciaţi,
pentru fiecare item, cât de bine reflectă domeniul de conţinut şi acordaţi-i o notă între 1 şi 4,
cu următoarea semnificaţie:
1 = nerelevant;
2 = puţin relevant;
3 = destul de relevant;
4 = foarte relevant.
Judecaţi fiecare item numai din punctul de vedere al concordanţei dintre conţinutul său
şi conţinutul domeniului pe care trebuie să îl măsoare.
Sunt reţinuţi în test doar itemii pe care majoritatea experţilor i-au apreciat cu notele 3 şi
4.
La această operaţie este bine să participe cât mai mulţi experţi, mai ales dacă în test sunt
incluşi itemi complecşi, care pot să disperseze atenţia celor examinaţi şi, din acest motiv, cota
lor să fie influenţată de alte caracteristici decât cea care ar trebui să fie măsurată.
Exemplu. Pentru a verifica dacă elevii ştiu să rezolve ecuaţii, au fost formulate
următoarele două probleme:
1. Se dau trei numere întregi, a, b şi c. Între ele există următoarele relaţii:
b=2c
a+2= (b+2)(c+2)
a+7=b+c+14
Ce valoare are a?
2. Într-o familie sunt trei fraţi, Andrei, Barbu şi Călin. Acum vârsta lui Barbu este egală
cu dublul vârstei lui Călin. Peste doi ani, vârsta lui Andrei va fi egală cu produsul vârstelor
fraţilor săi. Peste şapte ani, vârsta lui Andrei va fi egală cu suma vârstelor fraţilor săi. Toate
vârstele sunt exprimate în ani împliniţi. Câţi ani are Andrei?

Cea de-a doua problemă conduce tot la ecuaţiile din prima problemă, dar le propune
celor examinaţi o sarcină mult mai complexă decât prima, întrucât le cere să citească un text
mai lung şi să dea dovadă de atenţie, să observe că peste n ani (n=2 sau 7) vârsta fiecăruia
dintre fraţi va fi mai mare cu n ani decât vârsta actuală. Este posibil ca la problema b cota să
fie alterată de variabila irelevantă pentru ceea ce măsoară testul, „deprinderea de a citi”.

103 |
Este important să se verifice pentru fiecare item dacă nu cumva necesită un
comportament care nu aparţine domeniului de conţinut al testului.
Pentru itemii reţinuţi se identifică zona domeniului de conţinut la care se referă. Apoi se
verifică dacă structura testului se suprapune peste structura domeniului de conţinut, adică dacă
sunt acoperite toate zonele domeniului de conţinut şi dacă itemii reţinuţi în test sunt repartizaţi
proporţional cu mărimea şi importanţa zonelor.
Aprecierea generală privind validitatea de conţinut a unui test este subiectivă. Ea nu
apelează la metode statistice, ci se bazează doar pe raţionamente. Din acest motiv, analiza
validităţii de conţinut este denumită în literatură şi validare logică sau validare raţională
(Anastasi, 1976).
În cazul testelor care verifică deprinderi sau cunoştinţe însuşite în cadrul unui program
de instruire există recomandarea de a lua în considerare, la aprecierea validităţii de conţinut a
testului, şi rezultatul comparării statistice a scorurilor obţinute de aceleaşi persoane înainte şi
după acest program (Anastasi, 1954). Dacă există o suprapunere între conţinutul itemilor
testului şi conţinutul programului de instruire şi dacă itemii sunt bine construiţi, atunci este de
aşteptat ca scorurile finale să fie mult mai mari decât cele iniţiale, deci media diferenţelor de
scor să fie pozitivă şi să difere semnificativ de zero.
Trebuie menţionat că analiza validităţii de conţinut nu permite să se tragă nicio
concluzie despre calitatea măsurării realizate de test (Murphy, Davidshofer, 1991). De
asemenea, ea nu furnizează suficiente informaţii pentru a putea interpreta corect scorurile
testului. Nu se poate afirma că, dacă testul are validitate de conţinut, atunci în privinţa
atributului măsurat de test, un subiect care a realizat un scor mai mare la test îi este superior
unuia care a obţinut un scor mai mic. Acest lucru se poate verifica apelând la analiza
validităţii relative la criteriu.
Analiza validităţii de conţinut oferă informaţii numai despre cât de valid pare testul, nu
indică dacă itemii sunt bine construiţi sau dacă nu pretind cunoaşterea unui limbaj de
specialitate de nivel prea înalt pentru subiecţi. Un test poate părea valid, dar să măsoare
altceva decât se dorea (de exemplu, testul poate măsura abilitatea de a ghici, cunoaşterea
neologismelor, diverse deprinderi care nu au legătură cu ceea ce trebuie să măsoare testul).
Validitatea de conţinut este o cerinţa minimă pentru ca un test să fie util, dar nu este suficientă
pentru a avea un test bun.
Deci operaţiile cuprinse sub denumirea de analiza validităţii de conţinut a testului nu
reprezintă o validare, în sensul definiţiei date de Standards for Educational and Psychological
Tests din 1985. Ele realizează doar analiza testului în privinţa clarităţii, a reprezentativităţii şi
a relevanţei conţinutului său.

7.2.4. Analiza validităţii relative la criteriu

Analiza validităţii relative la criteriu cercetează gradul în care deducţiile făcute pornind
de la scorurile testului concordă cu cele bazate pe valorile unei variabile, independentă de test,
numită criteriu. Criteriul poate fi o variabilă pe care testul încearcă să o prevadă (de exemplu,

104 |
performanţa în muncă pe un anumit post) sau o altă măsurare a ceea ce testul trebuie să
măsoare, considerată corectă (de exemplu, un alt test care evaluează constructul pe care îşi
propune să-l măsoare testul a cărui validitate se analizează).
Variabila criteriu poate fi unidimensională sau multidimensională, cu valori cantitative
şi/sau calitative. De exemplu, în selecţia profesională a managerilor, variabila criteriu
capacitatea managerială poate fi privită ca fiind constituită din abilitatea de comunicare şi
din capacitatea de organizare (apreciate prin câte un calificativ), din sociabilitate, persuasiune
şi ambiţie (măsurate cu ajutorul unor scale de evaluare numerice).
Adesea, analiza validităţii relative la criteriu se realizează atunci când testul trebuie să
înlocuiască variabila criteriu, din cauză că valorile variabilei criteriu nu sunt cunoscute în
momentul testării (de exemplu, performanţa profesională viitoare nu este cunoscută în
momentul selecţiei profesionale, atunci când se administrează testul), pentru că variabila
criteriu nu furnizează rezultate corecte dacă se fac măsurări repetate la aceleaşi persoane (de
exemplu, după ce un test de cunoştinţe de statistică a fost administrat într-un examen şi au fost
comunicate răspunsurile corecte celor examinaţi, este puţin probabil ca rezultatele studenţilor
la o nouă administrare a testului, în următoarea sesiune de examene, să reflecte corect
cunoştinţele de statistică ale acestora) sau deoarece măsurarea variabilei criteriu este mult mai
costisitoare ori necesită mai mult timp decât administrarea testului.
Aprecierea validităţii relative la criteriu se bazează, de obicei, pe valorile unui coeficient
de validitate a testului. Acesta este egal cu coeficientul de corelaţie liniară între scorurile
testului şi valorile variabilei criteriu. Validitatea testului este cu atât mai bună, cu cât
coeficientul de validitate este mai mare, mai apropiat de valoarea 1.
O altă posibilitate de cercetare a validităţii relative la criteriu a unui test utilizează două
grupe contrastante de subiecţi, formate pe baza valorilor variabilei criteriu: una este compusă
din persoane cu valori foarte mari, iar cealaltă, din persoane cu valori foarte mici. Se compară
mediile scorurilor testului între cele două grupe şi se apreciază că testul este valid relativ la
criteriu dacă mediile diferă semnificativ, la un prag de probabilitate fixat (Anastasi, 1976).
Această metodă se foloseşte mai ales atunci când variabila criteriu este calitativă – iar, din
această cauză, nu se poate calcula coeficientul de corelaţie liniară – şi atunci când criteriul
este multidimensional, având mai multe componente cantitative şi/sau calitative, dar este
posibilă formarea grupelor contrastante.
Unii autori (Hammond, 1995) recomandă ca analiza validităţii relative la criteriu a unui
test să utilizeze mai multe variabile criteriu, dintre care unele nu au legătură cu ceea ce testul
trebuie să măsoare sau să prezică. Acestea servesc la verificarea specificităţii testului. Este de
dorit ca testul să nu coreleze cu ele.
Exemplu. Pentru a analiza validitatea relativă la criteriu a unui test de cunoştinţe de
matematică, pentru elevii unei clase a VII-a, în al doilea semestru de şcoală, se pot utiliza
drept criterii:
• mediile şcolare ale elevilor la matematică, la sfârşitul primului semestru de şcoală;

105 |

aprecierile profesorului de matematică de la clasa respectivă, pe baza cărora se
formează două grupe contrastante (elevi buni la matematică şi elevi slabi la
matematică);
• mediile şcolare ale elevilor, la sfârşitul primului semestru, la istorie.
Scorurile la testul de matematică ar trebui să coreleze liniar cu mediile la matematică de
la sfârşitul primului semestru. În grupa formată din elevi buni la matematică ar trebui să se
obţină o medie a scorurilor testului mai mare decât în grupa elevilor slabi la matematică.
Dacă scorurile testului corelează liniar cu mediile şcolare la istorie, este posibil ca testul
de matematică să verifice doar dacă elevii au memorat formule sau algoritmi (având în vedere
că notele la istorie reflectă în mare măsură cantitatea de informaţie memorată de elevi), nu şi
capacităţile lor de a aplica noţiunile învăţate la rezolvarea unor probleme noi.

Există două strategii utilizate în mod obişnuit pentru aprecierea validităţii relative la
criteriu a testelor:
• validarea concurentă;
• validarea predictivă.
Validarea concurentă se realizează îndeosebi pentru testele utilizate la obţinerea unor
diplome sau licenţe, care măsoară cunoştinţele sau deprinderile persoanelor, şi pentru testele
care servesc la stabilirea unui diagnostic clinic. Prin această strategie, se verifică dacă poziţiile
pe care le ocupă subiecţii la un criteriu (de exemplu, ordinea lor în privinţa scorurilor obţinute
la un test care serveşte drept criteriu) pot fi identificate destul de bine pe baza scorurilor la test
ale acestora.
Pentru cercetarea validităţii concurente, este necesar să se obţină scorurile la test
aproximativ în acelaşi timp cu valorile variabilei criteriu.
Validarea predictivă se realizează atunci când scorurile testului trebuie să servească la
predicţia valorilor pe care le va avea variabila criteriu într-un viitor mai mult sau mai puţin
apropiat (câteva luni sau, chiar, câţiva ani). Asemenea teste se utilizează de obicei la
admiterea în diverse forme de învăţământ ori la selecţia profesională, pentru a-i identifica pe
acei candidaţi care au şanse mari ca la sfârşitul cursurilor sau după ocuparea postului să obţină
performanţe bune. Variabila criteriu este reprezentată de performanţele şcolare sau
profesionale ale persoanelor testate.
Pentru cercetarea validităţii predictive, valorile variabilei criteriu se obţin la un interval
de timp după ce s-a administrat testul (de exemplu, un test de cunoştinţe se administrează la
concursul de admitere într-o facultate, iar valorile variabilei criteriu sunt mediile obţinute de
persoanele testate la sfârşitul primului an de facultate).
Întrucât în cazul testelor folosite la selecţia şcolară sau profesională validarea predictivă
foloseşte valorile predictorilor obţinute înainte ca persoanele să fie angajate pe un post, iar
validarea concurentă utilizează valorile predictorului obţinute după angajare, ar fi de aşteptat
ca cele două strategii de validare să furnizeze rezultate diferite. Dar, unele cercetări în care s-a
efectuat atât validare predictivă, cât şi validare concurentă pentru aceiaşi predictori au condus
la valori aproximativ egale ale coeficienţilor de validitate în cele două situaţii (N. Schmitt,

106 |
R.Z. Gooding, R.A. Noe, M. Kirsch, 1984, apud Vîrgă, 2004). Acest rezultat permite
utilizarea validării concurente în locul validării predictive, care necesită mult timp pentru a
putea evalua criteriul. Validarea predictivă poate fi realizată într-un timp scurt dacă sunt
disponibile valorile criteriului şi dacă valorile predictorului pot fi obţinute rapid.
S-a constatat că doar în puţine cazuri coeficientul de validitate faţă de un criteriu
important este mai mare decât 0,60 (Murphy, Davidshofer, 1987).
În experienţa obişnuită, valoarea coeficientului de validitate al testelor utilizate pentru a
face predicţii este cuprinsă în intervalul [0, 0,60], mai frecvent în partea inferioară a acestuia
(Guilford, 1965), pentru testele de personalitate fiind mai mică decât 0,40 (Funder, 1983).
F.L. Schmidt şi J.E. Hunter (1998, apud Vîrgă, 2004) au realizat un studiu meta-analitic
asupra validităţii diverşilor predictori utilizaţi în selecţia profesională. Având drept criteriu
performanţa generală, coeficienţii de validitate ai câtorva instrumente de evaluare sunt
următorii:
0,54 probe de lucru;
0,51 teste cognitive;
0,48 teste de cunoaştere a meseriei;
0,40 chestionare de personalitate;
0,31 conştiinciozitatea;
0,10 interese.

7.2.5. Factori care afectează valoarea coeficienţilor de validitate

Validitatea relativă la criteriu a unui test este influenţată nu numai de test, ci şi de


criteriul utilizat la validare şi de populaţia căreia i se administrează testul. Enumerăm, în
continuare, câţiva dintre factorii care afectează validitatea testelor (adaptare după Aiken, 1994
şi Warr, 1997).

A. În general, coeficienţii de validitate sunt mai mici în grupele în care valorile


criteriului sau scorurile testului variază puţin.
Întrucât validitatea unui test este dependentă şi de grupul de subiecţi, ori de câte ori se
constată că un test nou este valid faţă de un anumit criteriu, este necesar să se efectueze o
validare suplimentară a testului (cross-validation), folosind acelaşi criteriu, dar un alt eşantion
de subiecţi, provenit din aceeaşi populaţie ca primul. Numai dacă şi în acest caz testul se
dovedeşte a fi valid se poate recomanda utilizarea sa în practică.

B. Coeficientul de validitate poate avea o valoare scăzută atunci când criteriul folosit la
validarea testului are o fidelitate scăzută şi atunci când repartiţia de frecvenţe a valorilor
criteriului nu urmează legea normală.

C. În cazul unui test format din itemi paraleli, coeficientul de validitate este dependent
de numărul itemilor testului. Faţă de acelaşi criteriu, prin adăugare de itemi paraleli cu cei

107 |
existenţi în test, coeficientul de validitate creşte, iar prin eliminare de itemi din test,
coeficientul de validitate scade.

D. Coeficientul de validitate al unui test relativ la orice criteriu nu poate depăşi indicele
de fidelitate al testului. Prin urmare, dacă un test nu este fidel, el nu poate avea o bună
validitate relativă la criteriu faţă de niciun criteriu. Dar o valoare mare a indicelui de fidelitate
nu garantează o valoare mare a coeficientului de validitate.

7.2.6. Observaţii asupra validării testelor

Validitatea unui test nu poate fi estimată printr-un singur coeficient, ci se deduce din
acumularea dovezilor empirice şi conceptuale.
Standards for Educational and Psychological Tests din 1974 atrag atenţia că „validitatea
nu se măsoară, ci se deduce”. Manualul testului trebuie să conţină valorile mai multor
coeficienţi de validitate, calculaţi pentru utilizări diferite ale testului sau pentru populaţii
diferite.
Validarea unui test este un proces care trebuie repetat mereu pe parcursul perioadei în
care acesta este utilizat, întrucât datele care se acumulează, provenite din observaţii clinice şi
din diverse proiecte de cercetare, permit ca interpretarea propusă iniţial pentru scorurile
testului să fie îmbunătăţită şi rafinată.
Ori de câte ori se face o modificare importantă într-un test în ceea ce priveşte formatul,
limbajul, conţinutul sau instrucţiunile de administrare, testul trebuie validat din nou.

7.3. Validitatea de aspect a testelor

Orice test psihologic sau educaţional care este destinat utilizării în practică (nu doar
cercetării ştiinţifice) trebuie să fie perceput de cei examinaţi cu el ca fiind adecvat domeniului
în care este aplicat. Această calitate a testelor este denumită validitate de aspect (C.I. Mosier,
apud Nevo, 1993).
Exemplu. Un test de cunoştinţe de statistică destinat studenţilor facultăţii de psihologie li
se va părea acestora potrivit domeniului dacă le va cere să calculeze indicatori statistici ai
scorurilor la un chestionar de personalitate şi nu indicatori statistici ai greutăţii găinilor de la o
fermă avicolă.

O definiţie operaţională a validităţii de aspect a fost formulată de L. Guttman şi S. Shye


(Nevo, 1993) astfel: „Se face o măsurare a validităţii de aspect atunci când o persoană testată/
un utilizator neprofesionist /un individ interesat, utilizând o tehnică absolută /relativă
apreciază un item / un test / o baterie de teste drept foarte potrivit /.../ nepotrivit pentru
utilizarea care îl interesează”.
Trebuie observat că aprecierea validităţii de aspect nu este realizată de experţi şi pentru
măsurarea sa nu se folosesc metode statistice. Dacă aprecierea validităţii de aspect este făcută

108 |
de persoanele testate, ele trebuie să îşi spună părerea imediat după ce au răspuns la test, când
impresiile sunt încă proaspete.
Validitatea de aspect nu este inclusă printre celelalte tipuri de validitate (Standards for
Educational and Psychological Tests, 1974) şi nici nu le poate înlocui. Ea este importantă,
însă, pentru că influenţează asupra motivaţiei subiecţilor de a rezolva testul.
S-a constatat că atunci când testele folosite pentru selecţie profesională au validitate de
aspect, candidaţii au convingerea că munca aferentă postului pentru care se face selecţia este
interesantă.

109 |
110 |
8. FIDELITATEA TESTELOR

8.1. Noţiunea de fidelitate

În urma măsurării unei caracteristici, la o persoană, cu ajutorul unui instrument de


evaluare (scală, chestionar, test etc.) se obţine un număr, numit scor observat. Mărimea
acestui scor este influenţată nu numai de nivelul caracteristicii la persoana respectivă, ci şi de
condiţiile particulare în care se face măsurarea (de exemplu, de starea de oboseală sau de
anxietate a celui evaluat, de comportamentul celui care administrează instrumentul, de
temperatura, lumina şi zgomotul din sala în care se administrează instrumentul). Dacă
măsurarea s-ar face în alte condiţii, scorul observat ar putea avea o altă valoare.
Presupunând că s-ar administra un instrument de măsură aceleiaşi persoane în toate
condiţiile posibile şi că aceasta s-ar comporta de fiecare dată ca şi când nu ar cunoaşte testul,
s-ar obţine o distribuţie de frecvenţe2 a scorurilor la test, în care unele valori ar avea o
probabilitate mai mare, iar altele ar avea probabilităţi foarte mici, chiar nule.
Exemplu. La un test de evaluare a capacităţii de decizie, ale cărui scoruri posibile sunt
numerele întregi cuprinse între 0 şi 20, o persoană care are dificultăţi atunci când trebuie să ia
o hotărâre are şanse extrem de mici să obţină un scor apropiat de 20. Dacă testul ar fi
administrat în toate condiţiile posibile (referitoare la starea persoanei şi la mediul extern
acesteia), s-ar obţine o distribuţie de frecvenţe a scorurilor la test în care scorurile mici,
apropiate de 0, ar avea probabilităţi mari, iar cele mari ar avea probabilităţi foarte mici.

Distribuţia de frecvenţe a scorurilor pe care le-ar putea obţine la un anumit instrument de


evaluare o persoană poate să difere de distribuţia de frecvenţe a scorurilor pe care le-ar putea
obţine o altă persoană la acelaşi instrument, întrucât cele două persoane pot să se deosebească
între ele atât în privinţa nivelului caracteristicii măsurate de test, cât şi sub aspectul altor
caracteristici care pot influenţa rezultatele evaluării (de exemplu, anxietatea în situaţii de
evaluare, dorinţa de a face o impresie bună sau de a obţine succes etc.).
Valoarea medie a tuturor scorurilor pe care le-ar putea obţine o persoană la un
instrument de evaluare se numeşte scor real al persoanei. Acesta este interpretat ca scor pe
care l-ar obţine respectiva persoană dacă instrumentul ar fi administrat în condiţii ideale,
astfel încât să nu intervină factori perturbatori.
Mărimea scorului real este determinată de factorii care contribuie la consistenţa
rezultatelor, adică de caracteristicile stabile ale persoanei evaluate şi ale situaţiilor în care se
face administrarea instrumentului.
Mărimea unui scor observat este influenţată de mărimea scorului real, dar şi de diverşi
factori care contribuie la inconsistenţa rezultatelor, precum unele caracteristici ale persoanei
evaluate care nu au legătură cu ceea ce măsoară instrumentul (de exemplu, starea de sănătate,

2
Distribuţia (repartiţia) de frecvenţe a unei variabile este un tablou cu două linii, care conţine în prima linie
toate valorile posibile ale variabilei, iar în a doua linie, sub fiecare valoare, probabilitatea acesteia.

111 |
motivaţia) şi ale situaţiei de evaluare (de exemplu, ora la care s-a făcut evaluarea, starea de
nervozitate a celui care a administrat instrumentul).
Diferenţa dintre un scor observat şi scorul real poartă denumirea de eroare de măsură.
În studiul fidelităţii instrumentelor de evaluare se face distincţie între erorile de măsură
aleatoare (cele care sunt datorate unor factori ce acţionează aleator în timpul administrării
instrumentului, crescând scorurile unor subiecţi şi scăzând scorurile altora) şi erorile de
măsură sistematice (care afectează în acelaşi mod scorul observat al fiecărui subiect, la fiecare
administrare).
Dacă un instrument de evaluare este folosit o singură dată pentru măsurarea unei
caracteristici la toţi membrii unei populaţii, atunci pentru fiecare persoană se obţine câte un
scor observat. Dar, pentru fiecare persoană există un scor real şi o distribuţie de frecvenţe ale
rezultatelor pe care respectiva persoană le-ar putea obţine dacă instrumentul ar fi administrat
în condiţii diverse.
Există, prin urmare, două variabile, fiecare având câte o distribuţie de frecvenţe: prima
are ca valori scorurile reale ale persoanelor care formează populaţia, iar cea de-a doua, toate
scorurile pe care le-ar putea obţine la instrumentul de evaluare utilizat toţi membrii populaţiei
dacă administrarea s-ar face în condiţii foarte diverse, adică toate scorurile care ar putea fi
scoruri observate dacă s-ar face administrarea instrumentului în condiţii variate. Distribuţia de
frecvenţe a celei de-a doua variabile este determinată de distribuţiile de frecvenţe ale
scorurilor observate ale tuturor persoanelor din populaţie.
Pătratul coeficientului de corelaţie liniară între cele două variabile (care au ca valori
scorurile reale şi scorurile care ar putea fi observate în populaţie) se numeşte coeficient de
fidelitate al instrumentului de evaluare în populaţia considerată. El se notează, de obicei, cu
ρ 2XT . Rădăcina pătrată dintr-un coeficientul de fidelitate se numeşte indice de fidelitate.
Fiind pătratul unui coeficient de corelaţie liniară, coeficientul de fidelitate ia valori în
intervalul [0, 1].
Un instrument realizează o măsurare precisă pentru fiecare persoană dacă, indiferent de
condiţiile în care este administrat, scorul observat este acelaşi. Evident, atunci scorul real
coincide cu valoarea scorului observat.
Dacă instrumentul de evaluare are o precizie foarte bună pentru toate persoanele dintr-o
populaţie, atunci pentru fiecare persoană distribuţia de frecvenţe a scorurilor care ar putea fi
obţinute conţine o singură valoare care are probabilitate diferită de 0. Aceasta coincide cu
scorul real al persoanei şi are probabilitatea egală cu 1. Prin urmare, variabila care are ca
valori scorurile reale şi variabila care are ca valori scorurile care ar putea fi obţinute dacă
administrarea s-ar face în condiţii diverse au aceeaşi distribuţie de frecvenţe în populaţie.
Coeficientul de corelaţie liniară între cele două variabile fiind egal cu 1, şi coeficientul de
fidelitate al instrumentului de evaluare are cea mai mare valoare posibilă, fiind egal cu 1.
În schimb, dacă rezultatele măsurărilor făcute cu ajutorul unui instrument sunt puternic
influenţate de diverşi factori care acţionează în timpul administrării instrumentului, pentru
fiecare persoană dintr-o populaţie distribuţia de frecvenţe a scorurilor care ar putea fi obţinute
în condiţii de administrare variate conţine mai multe valori care au probabilitate diferită de

112 |
zero (care au şanse să apară). Din acest motiv, distribuţia de frecvenţe a scorurilor care ar
putea fi scoruri observate în populaţie, dacă s-ar administra de multe ori instrumentul în
diverse condiţii, poate să difere mult de distribuţia de frecvenţe a scorurilor reale, iar
coeficientul de fidelitate al instrumentului de evaluare în populaţie poate să aibă o valoare
scăzută, chiar apropiată de 0.
Dacă un instrument de evaluare este fidel, putem avea încredere că, administrându-l de
mai multe ori, scorurile sale la orice persoană vor rămâne constante sau, eventual, se vor
schimba foarte puţin. Un instrument care nu este fidel nu este util, deoarece scorurile obţinute
de o persoană oarecare sunt dependente de momentul administrării sale.
Faptul că un instrument de evaluare este fidel înseamnă că este puţin afectat de erorile de
măsură aleatoare.
În acest sens trebuie înţeleasă definiţia din Standards for Educational and Psychological
Test (1985): fidelitatea este „gradul în care scorurile testului sunt consistente sau repetabile,
adică gradul în care nu sunt afectate de erorile de măsură”.
Trebuie reţinut că în studiul fidelităţii intervin doar erorile de măsură aleatoare, nu şi
cele sistematice. Erorile sistematice au efect asupra validităţii instrumentului de evaluare,
întrucât rezultatele măsurării nu sunt corecte, dar este posibil să nu aibă nicio influenţă asupra
fidelităţii.
Exemplu. Să considerăm un test alcătuit din 10 itemi dihotomici, la care se răspunde cu
„da” sau „nu”, răspunsurile se cotează cu 0 şi 1, iar scorul testului se obţine prin însumarea
cotelor itemilor. Dacă testul este bine construit, aşa încât răspunsurile subiecţilor nu sunt
influenţate de condiţiile de administrare a testului, scorurile la test ale subiecţilor nu vor varia
(decât, eventual, puţin) de la o administrare la alta şi coeficientul de fidelitate al testului va
avea o valoare mare. Acest lucru este valabil indiferent dacă pentru cotarea itemilor se
foloseşte o grilă corectă sau una greşită. Faptul că se utilizează o grilă de cotare eronată are
efect asupra corectitudinii măsurării efectuate cu ajutorul testului la toţi subiecţii, nu doar la
unii. Se produce, astfel, o eroare sistematică. Ea scade validitatea testului, dar nu influenţează
fidelitatea acestuia.

Erorile de măsură sunt dependente atât de caracteristicile instrumentului, cât şi de cele


ale subiecţilor şi de scopul administrării instrumentului. Din acest motiv, nu se vorbeşte
despre fidelitatea unui instrument de evaluare, ci despre fidelitatea unui instrument de
evaluare pentru o anumită populaţie şi pentru un anumit scop de utilizare a instrumentului.

8.2. Estimarea coeficienţilor de fidelitate

Întrucât pentru un instrument de evaluare nu se pot cunoaşte nici scorurile reale ale
persoanelor cărora li se administrează şi nici distribuţiile de frecvenţă ale scorurilor pe care
acestea le-ar putea obţine în diverse condiţii de administrare a instrumentului, coeficientul de
fidelitate nu poate fi cunoscut. Se poate doar aproxima valoarea sa prin valorile altor
coeficienţi care se calculează pe baza scorurilor observate ale persoanelor şi care, în anumite

113 |
condiţii bine precizate, iau valori apropiate de cea a coeficientului de fidelitate. După modul
în care se obţin valorile lor, aceşti coeficienţi sunt împărţiţi în cinci categorii:
• coeficienţi de stabilitate;
• coeficienţi de echivalenţă;
• coeficienţi de consistenţă internă;
• coeficienţi de fidelitate inter-evaluatori;
• coeficienţi de fidelitate intra-evaluatori.
Coeficienţii de stabilitate se calculează prin metoda test-retest. Aceasta constă în doi
paşi:
• Se administrează de două ori instrumentul, aceloraşi persoane, în aceleaşi condiţii.
• Se calculează coeficientul de corelaţie liniară între scorurile observate ale subiecţilor
la prima administrare (la test) şi la a doua administrare (la retest). Acest coeficient
este denumit coeficient de stabilitate.
Un coeficient de stabilitate aproximează bine valoarea coeficientului de fidelitate al
instrumentului de evaluare (pentru o anumită populaţie şi un anumit scop al evaluării), numai
dacă sunt îndeplinite următoarele două condiţii:
• Scorurile reale ale persoanelor cărora li s-a administrat de două ori instrumentul de
evaluare nu s-au modificat între test şi retest. De exemplu, nu se poate aproxima
coeficientul de fidelitate al unui test care măsoară anxietatea ca stare cu ajutorul unui
coeficient de stabilitate, dacă în intervalul dintre test şi retest persoanele cărora li se
administrează testul urmează un tratament pentru reducerea anxietăţii. De asemenea,
la un test de cunoştinţe este posibil ca după testare unii subiecţi să afle răspunsurile
corecte la itemi şi la retest să obţină scoruri mai mari decât la test pentru că a crescut
nivelul lor de cunoştinţe din domeniul verificat de test, adică au crescut scorurile lor
reale la test. La alţi subiecţi, care au învăţat doar pentru testare, au ştiut răspunsurile
corecte la test, dar le-au uitat la scurt timp după aceea, scorurile la retest vor fi mai
mici decât cele de la test, pentru că nivelul cunoştinţelor acestor persoane a scăzut.
Prin urmare, nici în cazul testelor de cunoştinţe coeficienţii de stabilitate nu
aproximează bine valoarea coeficientului de fidelitate.
• Răspunsurile date de subiecţi la retest nu sunt influenţate de răspunsurile acestora la
test. De exemplu, dacă intervalul de timp dintre test şi retest este scurt, mulţi subiecţi
sunt tentaţi ca la acei itemi la care nu sunt siguri de răspunsul corect sau potrivit, să
repete la a doua administrare a instrumentului de evaluare răspunsurile pe care le-au
dat la prima administrare. În acest fel, vor exista mai multe răspunsuri identice la test
şi la retest decât cele cauzate doar de precizia instrumentului de evaluare. Iar acestea
vor contribui la creşterea valorii coeficientului de corelaţie liniară dintre scorurile
observate la cele două administrări ale instrumentului şi, deci, vor crea impresia că
instrumentul de evaluare are o fidelitate mai bună decât are în realitate.
Coeficienţii de echivalenţă se pot calcula numai dacă există un instrument de evaluare
care să constituie o formă paralelă a instrumentului analizat sub aspectul fidelităţii.

114 |
Două instrumente de evaluare sunt paralele într-o populaţie, dacă pentru orice persoană
din populaţie scorul real la cele două instrumente este acelaşi şi erorile de măsură au aceeaşi
abatere standard.
Întrucât scorurile reale nu pot fi cunoscute şi abaterile standard ale erorilor de măsură nu
pot fi calculate, nu se poate stabili dacă două instrumente de evaluare sunt sau nu paralele.
Din acest motiv, în practică, se consideră că două instrumente de evaluare sunt paralele dacă
sunt alcătuite din acelaşi număr de itemi şi fiecare item dintr-un instrument are un
corespondent în celălalt instrument, cei doi itemi fiind de acelaşi tip, cu aceeaşi dificultate şi
cotaţi în acelaşi mod. Dacă două instrumente de evaluare sunt paralele într-o populaţie, atunci
oricărui eşantion de subiecţi din acea populaţie ar fi administrate, pentru cele două
instrumente s-ar obţine medii egale şi dispersii egale ale scorurilor observate.
Dacă pentru un instrument de evaluare există o formă paralelă, se poate aproxima
valoarea coeficientului său de fidelitate prin metoda formelor paralele. Aceasta constă în
administrarea ambelor instrumente aceloraşi persoane, la momente apropiate între ele, şi
calculul coeficientului de corelaţie liniară între scorurile observate la cele două instrumente.
Coeficientul calculat astfel se numeşte coeficient de echivalenţă. El aproximează bine
coeficienţii de fidelitate ai ambelor instrumente numai dacă răspunsurile fiecărei persoane la
instrumentul administrat primul nu influenţează răspunsurile sale la celălalt instrument.
Valoarea coeficientului de echivalenţă este dependentă de condiţiile în care sunt
administrate cele două instrumente. Pentru a diminua efectul schimbării condiţiilor de
administrare se obişnuieşte să se procedeze astfel:
• Se împarte eşantionul de subiecţi extras din populaţia în care se face studiul
fidelităţii, în mod aleatoriu, în două părţi egale.
• Fiecare jumătate a eşantionului de subiecţi este evaluată cu un alt instrument.
• Apoi se administrează fiecărui subiect instrumentul cu care nu a fost evaluat, aşa
încât fiecare persoană să răspundă la ambele instrumente.
• Se calculează coeficientul de corelaţie liniară între scorurile observate la cele două
instrumente, fără a se ţine seama de ordinea în care au fost acestea administrate la
fiecare subiect.
Coeficienţii de consistenţă internă se pot calcula numai pentru instrumentele de
evaluare compuse din cel puţin doi itemi şi pentru care scorul furnizat de instrument se obţine
prin însumarea cotelor itemilor. Ei indică măsura în care itemii care compun instrumentul
evaluează acelaşi lucru.
În cazul testelor de cunoştinţe, coeficienţii de consistenţă internă sunt potriviţi pentru
estimarea coeficientului de fidelitate numai dacă toţi itemii se referă la o singură deprindere
sau la cunoştinţele dintr-o singură temă. De exemplu, ei sunt utili pentru un test de ortografie,
dar nu şi pentru un test care verifică atât cunoaşterea regulilor de ortografie, cât şi înţelegerea
textelor şi bogăţia vocabularului.
Un coeficient de consistenţă internă utilizat frecvent este coeficientul α al lui
Cronbach. El se calculează cu ajutorul formulei:

115 |
⎛ n 2⎞
⎜ ∑σi ⎟
⎜ ⎟
α = n ⎜1 − i = 1 ⎟
n −1⎜ σ 2X ⎟
⎜ ⎟
⎝ ⎠

unde:
n este numărul de itemi ai instrumentului de evaluare;
σ i2 este dispersia scorurilor observate la cel de-al i-lea item, pentru =1,2,...,n;
σ X2 este dispersia scorurilor observate ale instrumentului de evaluare.
Dacă itemii instrumentului de evaluare sunt dihotomici, având cotele posibile doar 0 şi
1, atunci coeficientul α este cunoscut sub denumirea de coeficientul KR20 al lui Kuder şi
Richardson. El se calculează cu formula:
⎛ n ⎞
⎜ ∑ pi qi ⎟
⎜ ⎟
KR 20 = n ⎜1 − i = 1 ⎟
n −1⎜ σ 2X ⎟
⎜ ⎟
⎝ ⎠
unde:
n este numărul de itemi ai instrumentului de evaluare;
pi este frecvenţa relativă a valorii 1 pentru scorul observat la cel de-al al i-lea item,
pentru i=1,2,...,n;
qi=1-pi, pentru i=1,2,...,n.
Dacă itemii care compun instrumentul sunt paraleli între ei, coeficientul α coincide cu
coeficientul de fidelitate al instrumentului de evaluare: α= ρ 2XT .
Coeficientul α nu depăşeşte valoarea 1, dar poate lua şi valori negative, caz în care nu
este util pentru aproximarea coeficientului de fidelitate, care are valori în intervalul [0, 1].
Atunci când pentru orice persoană căreia i se administrează instrumentul de evaluare,
scorurile observate la oricare doi itemi ai instrumentului sunt variabile aleatoare independente
– ceea ce înseamnă că modul în care persoana răspunde la un item, mai precis, cota pe care o
obţine, nu are nicio legătură cu modul în care răspunde la oricare alt item –, coeficientul α nu
2
depăşeşte coeficientul de fidelitate al instrumentului: α≤ ρ XT .
Coeficientul α are valoare mare atunci când intercorelaţiile itemilor sunt mari. Dacă,
însă, toţi coeficienţii de corelaţie liniară dintre itemi au valoarea 0, coeficientul α este egal cu
0.
În cazul când administrarea instrumentului se face cu limită de timp, este posibil ca
ultimii itemi să nu fie rezolvaţi de multe persoane. De obicei, itemii nerezolvaţi sunt cotaţi cu
0. Coeficientul de corelaţie între doi itemi care au cote identice la multe persoane are o
valoare mare. Dacă sunt mai mulţi itemi nerezolvaţi de mulţi subiecţi, intercorelaţiile lor fiind

116 |
mari, coeficientul α va avea o valoare mare, deşi este posibil ca aceşti itemi să se refere la
caracteristici diferite şi, prin urmare, instrumentul să nu fie fidel. Din acest motiv, pentru ca
valoarea coeficientului α să reflecte fidelitatea instrumentului de evaluare, este necesar ca
administrarea instrumentului să se facă fără limită de timp.
Dacă un instrument de evaluare este compus din n părţi (itemi sau grupuri de itemi) care
sunt paralele între ele (pe care le notăm cu Y1, Y2,…,Yn), atunci toate cele n părţi au acelaşi
coeficient de fidelitate, egal cu coeficientul de corelaţie liniară între oricare două părţi, Yi şi Yj
(i,j∈{1,2,…,n}, i≠j), iar coeficientul de fidelitate al întregului instrument poate fi calculat
folosind formula generală Spearman-Brown:
nρ (Y1, Y2 )
ρ 2XT =
1 + (n − 1) ρ (Y1, Y2 )
unde ρ(Y1,Y2) este coeficientul de corelaţie liniară între primele două părţi ale instrumentului
de evaluare, Y1 şi Y2.
Din această formulă se deduce că fidelitatea unui instrument de evaluare compus din
părţi paralele depinde crescător de numărul acestor părţi.
De obicei, formula generală Spearman-Brown se utilizează pentru a aproxima
coeficientul de consistenţă internă al unui instrument de evaluare prin metoda split-half. Se
procedează astfel:
• Se administrează instrumentul de evaluare unui eşantion de persoane.
• Se împarte instrumentul de evaluare în jumătăţi, Y1 şi Y2.
• Se calculează coeficientul de corelaţie între scorurile observate la cele două jumătăţi,
ρ(Y1,Y2).
• Se utilizează formula generală a lui Spearman-Brown pentru n=2, numită, în acest
caz, formula lui Spearman-Brown.
Dacă cele două jumătăţi ale instrumentului de evaluare sunt forme paralele, atunci
ρ (Y1, Y2 )
valoarea calculată astfel, , reprezintă coeficientul de fidelitate al instrumentului.
1 + (Y1, Y2 )
Se consideră că cele două jumătăţi sunt forme paralele, dacă fiecare item dintr-o parte
formează pereche cu un item din cealaltă parte, itemii fiecărei perechi fiind similari în ceea ce
priveşte tipul de întrebare (cu răspunsuri la alegere, cu răspuns liber etc.), forma (modul de
prezentare a textului, a ilustraţiilor), conţinutul, dificultatea, media şi abaterea standard a
scorurilor (Pitariu, 1978). Se recomandă ca, în cadrul instrumentului de evaluare, fiecare item
să fie aşezat alături de itemul cu care formează pereche şi itemii să fie plasaţi în ordinea
crescătoare a dificultăţii lor (Lord, Novick, 1968).
Coeficienţii de fidelitate inter-evaluatori şi coeficienţii de fidelitate intra-evaluator se
calculează în cazul instrumentelor pentru care scorul subiecţilor nu se obţine pe baza unui
algoritm clar, obiectiv, ci este rezultatul aprecierii subiective a celui care evaluează
răspunsurile. Astfel de instrumente sunt testele de creativitate, testele proiective, scalele de
evaluare, testele de cunoştinţe compuse din itemi cu răspunsuri deschise.
Coeficientul de fidelitate inter-evaluatori al unui instrument se obţine astfel:

117 |

Se administrează instrumentul o singură dată unui eşantion de subiecţi.

Răspunsurile fiecărui subiect sunt apreciate de doi evaluatori, care lucrează
independent unul de altul şi acordă câte un scor. În felul acesta, fiecare subiect
primeşte câte un scor de la fiecare evaluator.
• Se calculează coeficientul de corelaţie liniară între scorurile acordate de cei doi
evaluatori.
Unii autori (Hammond, 1995) recomandă utilizarea, pentru aprecierea acordului dintre
doi evaluatori, în locul coeficientului de corelaţie liniară între scoruri, a coeficientului K al lui
Cohen. Acesta poate fi calculat şi în cazul când rezultatul evaluării nu este un scor, ci un
calificativ (de exemplu, „slab”, „mediocru” sau „bun”). Se utilizează formula:
K = RS − S
1− S
unde:
n
∑ f ii
RS = i = 1
N
n
∑ f i. f.i
S = i =1
N2
N = numărul de subiecţi;
n = numărul de valori de scoruri sau de calificative folosite pentru evaluare (de
exemplu, n=3 dacă evaluarea se face prin calificativele „slab”, „mediocru” şi „bun”);
pentru fiecare valoare de scor sau de calificativ (i=1,2,…,n):
fii = numărul de subiecţi care au primit cea de-a i-a valoare de scor sau cel
de-al i-lea calificativ de la ambii evaluatori;
fi. = numărul de subiecţi care au primit cea de-a i-a valoare de scor sau cel de-al
i-lea calificativ de la primul evaluatori;
f.i = numărul de subiecţi care au primit cea de-a i-a valoare de scor sau cel de-al
i-lea calificativ de la al doilea evaluator.
Coeficientul K ia valori cuprinse între -1 şi 1, fiind cu atât mai mare, cu cât concordanţa
evaluărilor făcute de cele două persoane este mai mare. Concordanţa este perfectă dacă
fiecare subiect este apreciat în acelaşi mod (primeşte acelaşi scor sau acelaşi calificativ) de
ambii evaluatori, caz în care coeficientul lui Cohen are valoarea 1.
Pentru a obţine coeficientul de fidelitate intra-evaluator se procedează astfel:
• Se administrează instrumentul o singură dată unui eşantion de subiecţi.
• Răspunsurile fiecărui subiect sunt apreciate de acelaşi evaluator, de două ori. Între
cele două momente în care se face evaluarea trebuie să existe un interval de timp
suficient de lung pentru ca evaluatorul să nu fie influenţat, la cea de-a doua cotare a
răspunsurilor subiecţilor, de scorurile acordate prima dată.
• Se calculează coeficientul de corelaţie liniară între scorurile acordate de evaluator în
cele două momente.

118 |
Utilizarea coeficienţilor de fidelitate inter-evaluatori şi intra-evaluator pentru
aproximarea coeficientului de fidelitate al unui instrument se bazează pe ideea că instrumentul
este paralel cu el însuşi. Or, dacă două instrumente sunt paralele, atunci ele au aceeaşi valoare
a coeficientului de fidelitate, iar aceasta este egală cu coeficientul de corelaţie liniară între
scorurile observate la cele două instrumente.

Alegerea metodei de estimare a coeficientului de fidelitate a unui instrument de evaluare


trebuie să se facă ţinând cont de caracteristicile instrumentului (dacă este cu cotare obiectivă,
dacă este format dintr-un singur item sau din mai mulţi itemi), de stabilitatea în timp a ceea ce
măsoară instrumentul, de existenţa unei forme paralele a instrumentului, precum şi de
posibilitatea de a administra instrumentul de două ori.
În cazul testelor de cunoştinţe care vizează cunoştinţe dintr-un domeniu restrâns (o
lecţie, un capitol), se calculează, de obicei, coeficienţii de consistenţă internă. Dacă testul este
format din itemi cu răspunsuri deschise, se calculează coeficienţii de fidelitate inter-evaluatori
sau intra-evaluator. Dacă există o formă paralelă a testului de cunoştinţe (ceea ce se întâmplă
rar), se calculează coeficientul de echivalenţă.

8.3. Utilizarea coeficientului de fidelitate


la interpretarea scorurilor observate

Coeficientul de fidelitate serveşte la aprecierea preciziei unui test, dar nu este suficient
pentru descrierea acestuia ca instrument de măsură. O aceeaşi valoare a coeficientului de
fidelitate poate fi obţinută pentru dispersii diferite ale scorurilor observate. Din această cauză,
Standards for Educational and Psychological Tests din 1985 recomandă ca în manualul
testului să figureze, alături de coeficientul de fidelitate al testului, eroarea standard de măsură,
σE. Ea se calculează cu ajutorul coeficientului de fidelitate ( ρ 2XT ) şi al abaterii standard a
scorurilor observate (σ):
σ E = σ 1 − ρ XT
2

Coeficienţii de fidelitate se utilizează la compararea testelor. Eroarea standard de măsură


serveşte la interpretarea scorurilor testului, mai precis, la determinarea intervalelor de
încredere pentru scorurile reale ale subiecţilor.
Intervalul de încredere al scorului real al unei persoane, corespunzător unei
probabilităţi fixate, P, este intervalul în care, cu o probabilitate egală cu P, se găseşte scorul
real la test al acesteia. De obicei, P=0,68 sau P=0,95.
Dacă o persoană a obţinut la test scorul x, atunci intervalul de încredere al scorului real
este:
(x-σE, x+σE), pentru P=0,68;
(x-1,96σE, x+1,96σE), pentru P=0,95.

119 |
8.4. Valori recomandate pentru coeficienţii de fidelitate

Dintr-o mulţime de teste având toate celelalte caracteristici egale, este de preferat testul
care are cea mai mare fidelitate. Dar, pe de o parte, testul cel mai fidel poate fi cel mai scump
sau cel mai dificil de administrat. Pe de altă parte, caracteristicile testelor sunt rareori egale.
Este imposibil să se specifice un nivel minim care să fie impus coeficienţilor de fidelitate
ai tuturor testelor. În practica obişnuită sunt utile următoarele recomandări:
• Se cer niveluri înalte de fidelitate testelor folosite pentru a se lua decizii importante
asupra persoanelor şi celor care împart indivizii în mai multe categorii pe baza unor
diferenţe relativ mici între ei. În selecţia profesională, de pildă, se recomandă să se
folosească teste care au coeficienţi de fidelitate mai mari decât 0,9 (J.C. Nunnally,
apud Hammond, 1995).
• Se acceptă niveluri scăzute de fidelitate atunci când testele se utilizează pentru a lua
decizii preliminare, nu finale, şi în cazul testelor care împart persoanele într-un
număr mic de categorii, pe baza unor diferenţe individuale mari.
• Dacă un test serveşte la compararea grupelor de persoane, coeficientul său de
fidelitate poate fi mai mic, chiar cuprins între 0,6 şi 0,7. Dacă, însă, testul se
foloseşte pentru compararea persoanelor una cu alta, coeficientul său de fidelitate
trebuie să fie mai mare decât 0,85 (Aiken, 1994).
Testele cotate obiectiv care măsoară aptitudini cognitive pot furniza, în loturi eterogene
de persoane, coeficienţi de fidelitate mai mari decât 0,8. Testele cotate subiectiv care măsoară
aptitudini, testele de cunoştinţe şi cele care evaluează performanţe tipice (de exemplu
chestionarele de personalitate) au, adesea, coeficienţi de fidelitate mai mici decât 0,8 (Traub,
1994).
Fidelitatea testelor de cunoştinţe standardizate este, de obicei, mai mare decât 0,80. Se
consideră că testul are o fidelitate acceptabilă dacă (Kubiszyn, Borich, 1996):
• are coeficientul de consistenţă internă mai mare decât 0,95;
• are coeficientul de stabilitate mai mare decât 0,90;
• are coeficientul de echivalenţă mai mare decât 0,85.
Nu este obligatoriu să fie îndeplinite toate aceste condiţii. Un test de cunoştinţe
standardizat pentru care coeficientul de consistenţă internă este egal cu 0,93, coeficientul de
stabilitate este 0,92 şi coeficientul de echivalenţă, 0,82 este considerat ca având o fidelitate
bună.
Testele de cunoştinţe folosite în şcoli pentru măsurarea performanţelor grupelor de elevi
au, în general, o fidelitate mai scăzută, coeficienţii de fidelitate fiind cuprinşi între 0,60 şi 0,65
(Jacob, Hartshorne, 1992).
În general, fidelitatea chestionarelor de personalitate şi a celor de interese este mai mică
decât cea a testelor cognitive (de cunoştinţe, de inteligenţă, de aptitudini speciale) (Aiken,
1994).

120 |
Întrucât validitatea este mai importantă decât fidelitatea, în practică se folosesc adesea
teste care sunt valide pentru populaţia şi pentru situaţia în care sunt administrate, dar care nu
au coeficienţi de fidelitate foarte mari.
În orice caz, la interpretarea valorii unui coeficient de fidelitate, trebuie să se aibă în
vedere următoarele constatări (Kubiszyn, Borich, 1996):
• În eşantioanele de subiecţi neomogene (cu o variabilitate mare a scorurilor la test)
coeficientul de fidelitate este mai mare decât în grupele omogene.
• Erorile de cotare afectează fidelitatea.
• Creşterea numărului de itemi care constituie măsurători paralele are ca efect
creşterea coeficientului de fidelitate.
• Atunci când toţi itemii testului sunt uşori sau toţi sunt dificili, coeficientul de
fidelitate are valoare scăzută.

121 |
122 |
9. CONSTRUIREA UNUI TEST DE CUNOŞTINŢE STANDARDIZAT

9.1. Algoritmul de construire a unui test de cunoştinţe

Construirea unui test de cunoştinţe se desfăşoară conform următorului algoritm:


a. Se defineşte testul, stabilind funcţia sa, populaţia căreia îi este destinat, structura
testului şi condiţiile în care va fi utilizat.
b. Se formulează itemii testului şi se creează o bancă de itemi.
c. Se construieşte o variantă a testului extrăgând itemi din bancă, astfel încât să fie
acoperite obiectivele educaţionale stabilite pentru secvenţa de învăţare care se
verifică prin acest test.
d. Se formulează instrucţiunile de administrare a testului.
e. Se administrează testul pentru a realiza analiza de itemi.
f. Se studiază validitatea şi fidelitatea testului obţinut în urma analizei de itemi. Dacă
acestea sunt acceptabile, se stabileşte ordinea itemilor în cadrul testului (având în
vedere tipul itemilor şi dificultatea acestora), se verifică şi, dacă este cazul, se
corectează instrucţiunile de administrare a testului, după care se trece la pasul
următor. Dacă validitatea sau fidelitatea nu este acceptabilă, se construieşte o nouă
variantă a testului, păstrând, eventual, unii itemi care s-a constatat că sunt potriviţi
pentru test şi se reia algoritmul de la pasul d.
g. Se administrează testul unui nou eşantion de persoane, extras din populaţia căreia îi
este destinat testul. Se analizează validitatea şi fidelitatea. Dacă acestea sunt
acceptabile, se trece la pasul următor. În caz contrar, se construieşte o nouă variantă
a testului şi se reia algoritmul de la pasul d.
h. Dacă interpretarea scorurilor testului se face prin raportare la norme, se determină
normele testului. Se stabilesc regulile de interpretare a scorurilor.
i. Se redactează documentaţia de utilizare a testului.

9.2. Definirea testului

A defini un test înseamnă a stabili:


• ce funcţie va îndeplini acesta (de măsurare, de predicţie sau de decizie);
• din cine este formată populaţia căreia îi este destinat testul;
• în ce condiţii va fi administrat testul (când, unde, cum, în cât timp);
• cum vor fi interpretate scorurile testului (prin raportare la obiective sau prin raportare
la norme).
Se stabileşte mai întâi funcţia pe care trebuie să o îndeplinească testul, întrucât de
aceasta depinde cărei caracteristici psihometrice trebuie să i se acorde o importanţă mai mare
pe parcursul construirii testului. Se ştie că un test nu poate avea în acelaşi timp şi o validitate

123 |
relativă la criteriu foarte bună, şi o consistenţă internă ridicată. De asemenea, un test poate fi
un instrument de măsură foarte bun, dar să nu aibă vreo valoare predictivă.
Dacă un test de cunoştinţe se va folosi pentru a prezice succesul şcolar la sfârşitul unei
forme de învăţământ sau performanţele profesionale pe un anumit post, se va urmări ca atât
itemii săi, cât şi testul în întregime să aibă validitate relativă la criteriu, criteriul fiind ales
corespunzător scopului pe care îl va îndeplini testul.
Dacă pe baza scorurilor testului se vor lua decizii importante pentru persoanele
examinate, cum ar fi promovarea unei forme de învăţământ, se va acorda atenţie fidelităţii
testului.
Modul de interpretare a rezultatelor la test ale unei persoane este dependent de scopul
căruia îi va servi testul. Atunci când testul trebuie să verifice dacă anumite deprinderi sau
cunoştinţe ale unei persoane depăşesc un prag minim necesar, scorul individual va fi raportat
la bareme fixate aprioric. Dacă, însă, testul trebuie să prezică performanţele unei persoane
într-un anumit domeniu, comparativ cu alte persoane din aceeaşi populaţie, atunci
interpretarea scorului individual se va face prin raportare la norme.
Definirea populaţiei din care provin persoanele care vor fi examinate cu acest test
înseamnă stabilirea unor caracteristici comune tuturor acestor persoane, care sunt importante
pentru construirea testului, precum vârsta (care influenţează capacitatea de concentrare, viteza
de citire şi de scriere, deci lungimea testului) şi nivelul de instruire (care are legătură cu
bogăţia vocabularului şi cu capacitatea de înţelegere a testelor, prin urmare influenţează
modul în care sunt formulaţi itemii).
Tot la acest pas al algoritmului de construire a testului se decide:
• ce tipuri de itemi se vor include în test;
• cum vor fi ordonaţi itemii (după dificultatea lor sau aleatoriu);
• ce lungime va avea testul (în funcţie de caracteristicile populaţiei căreia îi este
destinat testul şi de timpul de administrare);
• dacă testul va fi sau nu administrat cu limită de timp.
Apoi se descrie domeniul de conţinut al testului, prin specificarea obiectivelor
educaţionale a căror îndeplinire se va verifica prin intermediul testului. Adesea se construieşte
o tabelă de specificaţii, în care se indică temele a căror cunoaştere se testează şi obiectivele
cognitive verificate de test. În fiecare celulă este notat numărul de itemi care vor fi incluşi în
test. O asemenea tabelă este prezentată în tabelul 9.1.
Tabela de specificaţii serveşte ca bază pentru a decide tipurile itemilor testului, întrucât
pentru fiecare obiectiv cognitiv verificat de test sunt mai potrivite anumite tipuri de itemi (de
exemplu, capacitatea de explicare a unor fapte poate fi verificată mai bine prin itemi de tip
eseu decât prin itemi cu răspunsuri închise).
Numărul de itemi incluşi în test pentru fiecare temă care se doreşte a fi verificată se
stabileşte în funcţie de importanţa temei, de timpul care a fost alocat studierii sale şi de
lungimea totală a testului.

124 |
Tabelul 9.1. Tabele de specificaţii pentru verificarea cunoştinţelor
la capitolul „Analiza de itemi”

Obiectivul cognitiv Tema


Dificultatea Puterea de Validitatea itemilor
itemilor discriminare a
itemilor
Cunoaşterea Cunoaşterea Cunoaşterea Cunoaşterea
terminologiei definiţiei definiţiei definiţiei
(1 item) (1 item) (1 item)
Cunoaşterea faptelor Cunoaşterea Cunoaşterea Cunoaşterea
specifice procedurii de calcul procedurii de calcul procedurii de calcul
a indicelui de a indicelui de a indicelui de
dificultate discriminare validitate
(1 item) (1 item) (1 item)
Înţelegere Înţelegerea legăturii Înţelegerea
dintre dificultatea deosebirii dintre
itemilor şi puterea puterea de
lor de discriminare discriminare şi
(1 item) validitatea itemilor
(1 item)
Aplicare Calculul indicelui de Calculul indicelui de
dificultate discriminare
(1 item) (1 item)
Total 4 itemi 3 itemi 3 itemi

Lungimea unui test este dependentă de timpul disponibil pentru administrarea acestuia,
care este fixat, în general, ţinând cont de condiţiile în care va fi utilizat testul (într-o oră de
clasă, la un concurs de admitere într-o instituţie de învăţământ etc.), dar şi de caracteristicile
persoanelor cărora li se va administra testul (de vârsta acestora, de deprinderea lor de a citi, de
capacitatea lor de a-şi concentra atenţia pentru a răspunde la întrebări).
Timpul necesar pentru rezolvarea unui test este dependent nu numai de numărul de itemi
din test, ci şi de tipul acestora, de numărul răspunsurilor pe care le propun itemii, de lungimea
textului itemilor şi de dificultatea sarcinii pe care trebuie să o îndeplinească cei cărora li se
administrează testul pentru a putea răspunde la itemi.
Este bine ca o testare să nu depăşească o oră pentru elevii din şcoala primară, o oră şi
jumătate pentru cei din gimnaziu şi din liceu şi două ore pentru adulţi, timp care include şi
completarea datelor personale, citirea instrucţiunilor de administrare a testului şi rezolvarea
exemplelor (dacă este cazul). Întrucât elevii din clasele primare nu pot să rămână atenţi la
sarcinile unui test mai mult de 30 de minute, dacă rezolvarea testului necesită un timp mai
lung, se va recurge la administrarea testului în mai multe sesiuni de lucru (Aiken, 1994).

125 |
9.3. Crearea băncii de itemi

Itemii care se introduc în banca de itemi pot să provină din mai multe surse:
• sunt formulaţi de persoana sau persoanele care elaborează testul (de exemplu, de
profesorul care va utiliza testul);
• sunt creaţi de specialişti din domeniul din care fac parte cunoştinţele care se verifică
prin acest test (de exemplu, pentru un test utilizat la selecţia profesională pentru un
post de electrician, itemii pot fi formulaţi de şeful echipei din care va face parte
persoana care va fi angajată, împreună cu un inginer);
• sunt extraşi din culegeri de exerciţii şi/sau probleme ori din manuale (unde pot figura
ca exemple).
Înainte de a fi introduşi în banca de date, itemii trebuie să fie verificaţi de o persoană
care are cunoştinţe din domeniul vizat de test, care nu a participat la elaborarea lor, şi de una
care cunoaşte regulile de formulare şi de redactare a itemilor. Se va urmări, pentru fiecare
item, dacă este formulat corect din punct de vedere gramatical, dacă nu conţine termeni greu
de înţeles şi dacă, în general, respectă sugestiile prezentate anterior cu privire la scrierea
întrebărilor din testele de cunoştinţe. De asemenea, se va verifica dacă răspunsurile
considerate corecte de autorul itemului sunt, într-adevăr, cele corecte.
Banca de itemi va cuprinde mai mulţi itemi decât s-a stabilit să se introducă în testul de
cunoştinţe, pentru că, adesea, în urma analizei de itemi se constată că unii itemi prezintă
deficienţe şi este necesară înlocuirea lor.
Pentru a facilita construirea unei variante a testului, este bine ca, pentru fiecare item
introdus în banca de itemi, să se completeze următoarele informaţii:
• tema la care se referă (de exemplu, titlul lecţiei sau al capitolului din manual);
• obiectivul cognitiv pe care îl verifică (de exemplu, adoptând taxonomia lui Bloom);
• gradul de dificultate, apreciat de persoanele care au construit sau au verificat itemul,
ori determinat în urma unei analize de itemi;
• timpul necesar pentru rezolvarea itemului, apreciat de persoanele care au construit
sau au verificat itemul, ori măsurat în timpul administrării itemului;
• punctajul acordat fiecărui răspuns.

9.4. Construirea unei variante a testului

Primul pas pentru construirea unei variante a testului constă în extragerea itemilor din
banca de itemi. Se poate proceda în mai multe moduri:
• dacă s-a construit o tabelă de specificaţii, se aleg itemii astfel încât să fie respectate
frecvenţele înscrise în celulele tabelei de specificaţii;
• dacă pentru itemii introduşi în banca de itemi se cunoaşte gradul de dificultate, se pot
alege itemii astfel încât să fie de dificultăţi diferite ori, dacă se doreşte alcătuirea

126 |
unui test dificil sau a unuia uşor, se vor selecta numai itemi dificili sau numai itemi
uşori;
• se extrag aleator itemii.
Înainte de a asambla testul, se va verifica dacă itemii extraşi acoperă obiectivele
educaţionale sau de instruire formulate pentru secvenţa de instruire care se verifică prin test şi
dacă timpul necesar pentru a răspunde la itemii extraşi este aproximativ egal cu cel prevăzut
pentru testare.
La stabilirea ordinii întrebărilor în cadrul testului, se pot avea în vedere următoarele
recomandări, formulate de Kubiszyn şi Borich (1996):
• Dacă întrebările testului au dificultăţi asemănătoare, atunci întrebările de acelaşi tip
(dihotomice, cu răspunsuri la alegere, de tip asociere) să fie grupate, pentru ca
persoana examinată să nu fie obligată la fiecare întrebare să facă efortul de a
identifica modul în care trebuie să răspundă.
• În cadrul testului, itemii să fie aranjaţi în ordinea crescătoare a dificultăţii, pentru a
spori încrederea celor examinaţi în propriile capacităţi şi a le reduce anxietatea.
Văzând că pot rezolva primii itemi, ei vor anticipa obţinerea succesului în continuare
şi vor avea curajul de a aborda şi itemii mai dificili. La testele administrate cu limită
de timp şi la cele foarte dificile, acest mod de aranjare are ca efect creşterea
scorurilor testului. Dar se pare că efectul său este scăzut sau nul în cazul itemilor cu
răspunsuri la alegere.
• Aranjarea întrebărilor să se facă astfel încât să nu apară patternuri de răspunsuri
corecte (precum b a c b a c, în cazul întrebărilor cu răspunsuri la alegere, sau da da
da nu da da da nu, în cazul itemilor dihotomici).
Se stabileşte modul în care se va calcula scorul testului. De obicei, acesta este egal cu
suma cotelor itemilor.
Se vor redacta, apoi, instrucţiunile de administrare a testului. Acestea trebuie să fie clare
şi să furnizeze suficiente detalii, pentru a nu fi necesare comentarii pe această temă în timpul
testării. Ele vor conţine următoarele informaţii:
• scopul testării;
• numărul de itemi care compun testul;
• cum se procedează pentru a stabili răspunsul corect (se alege răspunsul corect dintre
răspunsurile propuse, se formează perechi etc.);
• modul de notare a răspunsului corect (prin încercuirea literei sau a cifrei din faţa
răspunsului corect, prin încercuirea răspunsului corect, prin sublinierea răspunsului
corect etc.);
• modul în care se procedează pentru a schimba un răspuns (atunci când persoana
căreia i se administrează testul doreşte să schimbe răspunsul pe care l-a notat deja);
• dacă se poate reveni asupra unei întrebări pentru a completa răspunsul sau pentru a-l
schimba;
• formulele folosite pentru calculul cotelor itemilor şi al scorului testului;
• timpul alocat pentru a răspunde la itemii testului;

127 |

în cazul testelor care conţin întrebări cu răspunsuri închise, dacă este sau nu
recomandabil să se ghicească răspunsul, atunci când nu se cunoaşte răspunsul corect;
• în cazul testelor care conţin întrebări cu răspunsuri deschise, dacă la cotarea
răspunsurilor se ţine seama de respectarea normelor ortografice şi a celor
gramaticale;
• dacă este permis să nu se răspundă la unul sau la mai mulţi itemi.
Se recomandă ca în instrucţiunile de administrare să fie incluse şi exemple de întrebări,
din fiecare tip prezent în test (dihotomice, cu răspunsuri la alegere, de tip asociere), de
dificultate redusă, pentru ca persoanele examinate să înţeleagă modul în care trebuie să
procedeze pentru a alege răspunsurile corecte şi a le nota pe foile testului sau pe foaia de
răspuns.

9.5. Analiza de itemi

9.5.1. Algoritmul analizei de itemi

Analiza de itemi este o etapă a construirii unui test, care constă în analiza, prin metode
cantitative, a răspunsurilor date la itemi de persoane din categoria celor cărora le este destinat
testul. Metodele cantitative utilizate pentru testele relative la criteriu diferă de cele folosite
pentru testele relative la normă.
Analiza de itemi se realizează conform următorului algoritm:
a. Se formează un eşantion reprezentativ pentru populaţia persoanelor pentru care este
construit testul, dar din care să nu facă parte persoane care au mai răspuns la itemii
testului sau care urmează să fie examinate cu varianta finală a testului.
b. Se administrează testul în aceleaşi condiţii în care va fi utilizat (de exemplu, un test
de cunoştinţe de istorie, care urmează să fie folosit la sfârşitul clasei a VII-a, va fi
administrat unor elevi din clasa a VII-a, înainte de terminarea anului şcolar), folosind
instrucţiunile care vor însoţi − eventual, cu modificări minore, care ţin de numărul de
itemi şi de timpul de lucru − varianta finală a testului.
c. Se prelucrează statistic răspunsurile la itemi.
d. Se elimină itemii eronaţi.
e. Dacă se constată că itemii rămaşi sunt prea puţini sau nu acoperă toate obiectivele
educaţionale stabilite pentru secvenţa de învăţare care se verifică prin acest test, se
adaugă itemi (extrăgând din banca de itemi sau corectând itemii eronaţi) şi se reia
algoritmul de la pasul b, cu noua variantă a testului, folosind un alt eşantion de
persoane.
f. Dacă itemii rămaşi sunt prea numeroşi, se elimină o parte dintre ei, urmărind ca
itemii păstraţi în test să acopere toate obiectivele educaţionale formulate pentru
secvenţa de învăţare care se verifică prin acest test.
Alegerea metodelor cantitative aplicate în cadrul analizei de itemi şi interpretarea
rezultatelor obţinute sunt determinate de tipul testului (test relativ la criteriu sau test relativ la

128 |
normă), de tipul itemilor, de funcţia pe care o va îndeplini testul şi de calităţile psihometrice
pe care trebuie să le aibă acesta.
În cazul testelor relative la normă, pentru fiecare item se efectuează una sau mai multe
dintre următoarele prelucrări:
• Se calculează frecvenţele cu care au fost alese răspunsurile corecte şi se încearcă să
se identifice cauzele care au determinat frecvenţe foarte mari sau foarte mici.
• În cazul itemilor cu răspunsuri la alegere sau de tip asociere, se analizează
răspunsurile propuse greşite care au fost alese de foarte multe persoane, dovedindu-se
mai atractive decât cele corecte, şi cele care, din contră, nu au fost alese decât de
foarte puţine persoane, ceea ce înseamnă că ele conţin soluţii foarte deosebite de cea
corectă (de cele corecte).
• Se verifică relaţiile itemului cu diverse criterii (corelaţiile cu alte instrumente de
evaluare sau variaţia răspunsurilor între două grupe contrastante de persoane
examinate).
Pentru testele relative la criteriu se compară frecvenţele răspunsurilor corecte la itemi
între două administrări ale testului, una înainte şi una după secvenţa de învăţare care ar trebui
să le transmită participanţilor cunoştinţele verificate de test.

9.5.2. Metode cantitative utilizate pentru testele relative la normă

9.5.2.1. Indicele de dificultate al unui item

Indicele de dificultate al unui item este egal cu frecvenţa relativă a persoanelor care au
răspuns corect la item (adică au indicat toate răspunsurile corecte şi niciun răspuns greşit), din
totalul celor cărora li s-a administrat testul. În cazul testelor administrate cu limită de timp
care nu au fost parcurse integral de toate persoanele cărora li s-a administrat testul, calculul
indicelui de dificultate al unui item se face împărţind numărul celor care l-au rezolvat corect
la numărul de persoane care l-au citit. Pentru fiecare persoană se consideră necitiţi toţi itemii
aflaţi după ultimul item la care a răspuns.
Indicele de dificultate se notează, de obicei, cu p.
El este cuprins între 0 (când nimeni nu a rezolvat itemul corect) şi 1 (atunci când toţi cei
care au răspuns la item au indicat răspunsul corect). Cu cât un item este mai dificil, cu atât
indicele său de dificultate este mai mic, pentru că numărul celor care au ştiut să răspundă
corect este mai mic.
Itemii al căror indice de dificultate este foarte mic sau foarte mare nu permit o bună
diferenţiere între subiecţi, întrucât majoritatea persoanelor răspund la fel şi, deci, obţin
punctaj identic. Din acest motiv, într-un test care trebuie să ierarhizeze subiecţii şi să sesizeze
deosebirile dintre ei nu vor fi incluşi decât foarte puţini itemi al căror indice de dificultate este
cuprins în afara intervalului [0,3, 0,7]. Itemii care au indicele de dificultate apropiat de
valoarea 0 le vor permite persoanelor care cunosc foarte bine materia verificată de test să
obţină un scor mai mare decât celelalte, în timp ce itemii al căror indice de dificultate este

129 |
apropiat de valoarea 1 vor ajuta la identificarea persoanelor care nu cunosc aproape deloc
materia verificată de test şi care vor avea la test un scor foarte mic.
Dacă, însă, se doreşte construirea unui test foarte dificil (de exemplu, pentru a depista
persoanele foarte bine pregătite într-un domeniu) sau a unuia foarte uşor (de pildă, pentru a
identifica persoanele care au nevoie de ajutor pentru a-şi însuşi cunoştinţe dintr-un anumit
domeniu), atunci se formează testul doar din itemi cu indicele de dificultate foarte mic,
respectiv foarte mare.
Exemplu. Un test de cunoştinţe format din 10 itemi dihotomici a fost administrat, cu
limită de timp, la cinci persoane. Modul în care au răspuns acestea la itemi este prezentat în
tabelul 9.2.

Tabelul 9.2. Răspunsurile date de cinci persoane la 10 itemi dihotomici

Persoana Item
I1 I2 I3 I4 I5 I6 I7 I8 I9 I10
P1 c g g c c c g g c c
P2 c g g g g c g o o o
P3 c c c c c g c c o o
P4 c g g g o o c o o o
P5 c c o g o g o g g o
Legendă: c = răspuns corect; g=răspuns greşit; o=răspuns omis (item nerezolvat)

Vom calcula indicele de dificultate al itemilor.


Mai întâi, vom reconstrui tabelul 9.2 eliminând, pentru fiecare persoană, itemii pe care
nu i-a citit (cei aflaţi după ultimul răspuns dat, indiferent dacă acesta a fost corect sau greşit
(tabelul 9.3).

Tabelul 9.3. Răspunsurile date de cinci persoane la itemii pe care i-au citit,
dintr-un test format din 10 itemi dihotomici

Persoana Item
I1 I2 I3 I4 I5 I6 I7 I8 I9 I10
P1 c g g c c c g g c c
P2 c g g g g c g
P3 c c c c c g c c
P4 c g g g o o c
P5 c c o g o g o g g
Legendă: c = răspuns corect; g=răspuns greşit; o=răspuns omis (item nerezolvat).

Apoi, pentru fiecare item, vom determina:


• numărul de persoane care l-a rezolvat corect C;
• numărul de persoane care l-a citit (N);
• indicele de dificultate, egal cu raportul dintre C şi N (tabelul 9.4).

130 |
Tabelul 9.4. Calculul indicilor de dificultate pentru itemii testului
ale cărui răspunsuri au fost prezentate în tabelele 9.2 şi 9.3

Item
I1 I2 I3 I4 I5 I6 I7 I8 I9 I10
C 5 2 1 2 2 2 2 1 1 1
N 5 5 5 5 5 5 5 3 2 1
p 1,0 0,4 0,2 0,4 0,4 0,4 0,4 0,3 0,5 1,0
Legendă: N=numărul de persoane care au răspuns la item; C=numărul de
persoane care au răspuns corect la item; p=indicele de dificultate al itemului.

9.5.2.2. Analiza răspunsurilor incorecte la itemi

În cazul itemilor cu răspunsuri la alegere, este important de aflat dacă răspunsurile


propuse care sunt incorecte (distractorii) sunt bine formulate, adică sunt îndeplinite
următoarele condiţii:
• frecvenţa persoanelor care au ales un asemenea răspuns considerându-l corect nu
este apropiată de zero, ceea ce ar înseamna că răspunsul este foarte deosebit de
răspunsul corect (răspunsurile corecte) şi poate fi recunoscut ca eronat chiar şi de
persoanele care nu au cunoştinţele verificate de item;
• frecvenţa persoanelor care au ales un asemenea răspuns considerându-l corect este
mai mică decât frecvenţa celor care au ales răspunsul corect al itemului (răspunsurile
corecte ale itemului) (în caz contrar, există posibilitatea ca respectivul distractor să
semene foarte mult cu răspunsul corect sau ca răspunsul corect să fie greşit
formulat);
• răspunsul a fost ales de mai puţine persoane care au cunoştinţele verificate de item şi
de mai multe persoane dintre cele care nu cunosc materia la care se referă itemul.
Pentru a analiza răspunsurile propuse la un item cu răspunsuri la alegere se procedează
astfel:
• Dacă testul a fost administrat cu limită de timp, atunci din mulţimea persoanelor
cărora li s-a administrat testul se elimină cele care nu au citit itemul (cele pentru care
ultimul item la care au răspuns se află înaintea acestui item).
• Se aranjează persoanele care au citit itemul în ordinea crescătoare a valorilor unui
criteriu care se referă la materia verificată de item (media notelor şcolare, scorurile la
un alt test de cunoştinţe sau scorurile la testul din care face parte itemul, dacă
specialiştii apreciază că acesta măsoară cunoştinţele pentru verificarea cărora a fost
construit).
• Pentru fiecare valoare a criteriului se calculează frecvenţa relativă a celor care au
ales fiecare răspuns propus la item, ca raport între numărul celor care au ales
răspunsul şi numărul celor care au respectiva valoare a criteriului.
• Se urmăreşte evoluţia frecvenţelor relative, pentru fiecare răspuns propus la item, în
funcţie de valorile criteriului.

131 |
Dacă itemul este bine construit, atunci, pe măsură ce cresc valorile criteriului,
frecvenţele relative ale răspunsurilor corecte cresc, iar frecvenţele relative ale răspunsurilor
greşite scad.
Exemplu. Un item cu răspunsuri la alegere propune cinci răspunsuri, dintre care primele
două sunt corecte, iar celelalte, eronate. Testul din care face parte itemul a fost administrat
unei clase formate din 23 de elevi, cu limită de timp. Profesorul care predă la clasa respectivă
materia verificată de test a ierarhizat elevii clasei pe cinci trepte: „foarte slabi”, „slabi”,
„mediocri”, „buni” şi „foarte buni”.
Dintre elevii clasei, trei nu au reuşit să citească itemul. Ei au fost eliminaţi din
prelucrare. Ceilalţi au fost ordonaţi în funcţie de calificativul primit. Răspunsurile date de
aceştia la item sunt notate în tabelul 9.5.

Tabelul 9.5. Răspunsurile date de 20 de elevi la un item cu răspunsuri la alegere

Elev Calificativul Răspunsul propus


elevului a b c d e
E9 foarte slab X X
E10 foarte slab X X
E1 slab X X
E2 slab X X
E8 slab X X
E3 mediocru X
E11 mediocru X X
E12 mediocru X X X
E13 mediocru X X X
E14 mediocru X X X
E18 mediocru X X X
E19 mediocru X X
E20 mediocru X X X
E4 bun X
E5 bun X X X
E6 bun X X X X
E15 bun X X X
E17 bun X X X X
E7 foarte bun X X X
E16 foarte bun X X X
Legendă: S-a notat X în dreptul răspunsurilor alese de fiecare elev.

Pentru fiecare răspuns propus la item se determină frecvenţa relativă a celor care l-au
ales, pentru fiecare valoare a criteriului (tabelul 9.6).

132 |
Tabelul 9.6. Frecvenţele relative ale alegerii răspunsurilor la item,
în funcţie de calificativele elevilor

Calificativ N Răspunsul la item


a b c d e
F.a. F.r. F.a. F.r. F.a. F.r. F.a. F.r. F.a. F.r.
foarte slab 2 0 0,0 0 0,0 2 1,0 0 0,0 2 1,0
slab 3 0 0,0 0 0,0 3 1,0 1 0,3 2 0,7
mediocru 8 3 0,4 1 0,1 7 0,9 5 0,6 4 0,5
bun 5 4 0,8 0 0,0 5 1,0 4 0,8 2 0,4
foarte bun 2 2 1,0 0 0,0 2 1,0 2 1,0 0 0,0
Legendă: N=numărul de persoane care au acelaşi calificativ; F.a.=frecvenţa absolută a celor care au ales
răspunsul, dintre cei care au acelaşi calificativ; F.r.= frecvenţa relativă a celor care au ales răspunsul, dintre
cei care au acelaşi calificativ, egală cu raportul dintre F.a. şi N.

Răspunsul corect a nu a fost ales de niciun elev foarte slab sau slab, a fost ales de
aproape toţi elevii buni şi de toţi elevii foarte buni. El este bine construit.
Răspunsul corect b nu a fost ales decât de un singur elev, care face parte din categoria
elevilor „mediocri”. Este posibil ca el să fi făcut alegerea la întâmplare. Este necesar să se
verifice dacă acest răspuns nu conţine o formulare greşită şi dacă nu se referă la ceva ce nu a
fost predat.
Răspunsul greşit c a fost ales de aproape toţi elevii. Trebuie să se verifice dacă este
formulat aşa încât seamănă foarte mult cu un răspuns corect sau dacă vizează cunoştinţe care
le-au fost transmise greşit elevilor.
Răspunsul greşit d a fost ales mai frecvent de elevii „buni” şi „foarte buni” decât de
elevii „foarte slabi” şi „slabi”. La fel ca în cazul răspunsului c, trebuie să se verifice dacă este
formulat aşa încât seamănă foarte mult cu un răspuns corect sau dacă vizează cunoştinţe care
le-au fost transmise greşit elevilor.
Răspunsul greşit e este bine formulat: este ales frecvent de elevii „foarte slabi” şi de cei
„slabi” şi mai puţin frecvent de elevii „buni” şi „foarte buni”.

Pentru itemii cu răspunsuri la alegere care cer selectarea unui singur răspuns din n
răspunsuri propuse, se poate verifica dacă răspunsurile greşite sunt bine formulate, parcurgând
următorul algoritm, pentru fiecare răspuns greşit (de Landsheere, 1975; Murphy, Davidshofer,
1987):
• Se calculează frecvenţa observată, fo, egală cu frecvenţa relativă a cazurilor în care a
fost ales:
Ng
fo =
N
unde:
Ng = numărul persoanelor care au ales acest răspuns greşit;
N = numărul persoanelor care au răspuns la item.

133 |
• Se calculează frecvenţa teoretică, egală cu frecvenţa relativă a cazurilor în care acest
răspuns ar fi fost ales dacă toţi cei care au dat un răspuns greşit ar fi ales răspunsul
greşit la întâmplare:
N − Nc
ft =
N (n − 1)
unde:
Nc = numărul persoanelor care au ales răspunsul corect;
N = numărul persoanelor care au răspuns la item.
• Se compară frecvenţa observată cu cea teoretică.
Se apreciază că itemul este bine construit dacă pentru fiecare răspuns greşit frecvenţa
observată este aproximativ egală cu cea teoretică.
Exemplu. Un item cu răspunsuri la alegere propune cinci răspunsuri (a-e), dintre care
doar unul este corect (răspunsul e). În textul itemului se specifică faptul că trebuie ales un
singur răspuns. La item au răspuns 50 de elevi, dintre care 15 au ales răspunsul corect. În
tabelul 9.7 sunt notate frecvenţele alegerii răspunsurilor greşite şi frecvenţele lor observate.
Pentru fiecare răspuns greşit frecvenţa teoretică este aceeaşi:
f t = 50 − 15 = 0,175
50(5 − 1)
Tabelul 9.7. Frecvenţele alegerii răspunsurilor greşite la un item cu răspunsuri la alegere

Răspunsul Frecvenţa Frecvenţa


greşit alegerii observată
a 25 0,50
b 8 0,16
c 2 0,04
d 0 0,00
Total 35 0,70

Răspunsul greşit b are frecvenţa observată (0,16) apropiată de cea teoretică (0,175).
Răspunsurile greşite c şi d au fost alese de foarte puţine persoane, de mult mai puţine decât
dacă ar fi fost alese la întâmplare. Ele le apar „evident greşite” chiar şi celor care nu au
cunoştinţele verificate de item. Răspunsul a a fost ales de mai mult de jumătate dintre cei care
au răspuns greşit (25 din 35), iar dacă cei care nu cunoşteau răspunsul corect ar fi ales la
întâmplare, ar fi ales răspunsul a doar un sfert dintre ei.
Prin urmare, se impune verificarea formulărilor conţinute de răspunsurile a, c şi d.

Se consideră că un răspuns greşit pe care nu îl aleg decât foarte puţine persoane nu îşi
îndeplineşte rolul de factor de distragere întrucât este identificat cu uşurinţă drept greşit şi, în
acest fel, scade dificultatea sarcinii subiectului, care nu mai are de ales răspunsul corect dintre
cele n răspunsuri propuse, ci dintre n-1. Un asemenea răspuns trebuie înlocuit.
Un răspuns greşit ales de un număr mare de persoane poate conţine o formulare
incorectă sau incompletă, care îl face să semene cu răspunsul corect, dar, în acelaşi timp,

134 |
poate semnala existenţa unei erori la răspunsul corect, care îi determină pe subiecţi să îl
respingă şi să aleagă unul dintre celelalte răspunsuri.
Există şi situaţii în care unele răspunsuri greşite sunt formulate intenţionat astfel încât să
se deosebească de răspunsul corect doar prin câte un element subtil. Ele vor fi alese frecvent
de persoanele care nu stăpânesc bine cunoştinţele verificate de item. Întrebările de acest tip
sunt utile pentru a-i identifica pe subiecţii cu o foarte bună pregătire în domeniul verificat de
test (de exemplu, la selecţia elevilor pentru lotul olimpic).
La baza algoritmului descris mai sus a stat presupunerea că subiecţii care nu cunosc
răspunsul corect la o întrebare cu răspunsuri la alegere selectează la întâmplare din lista de
răspunsuri propuse. În realitate, însă, modul de selecţie a răspunsului diferă de la un subiect la
altul. Unele persoane aleg un răspuns eronat cu convingerea că acesta este cel corect. Altele
sunt capabile să identifice unul sau mai multe răspunsuri greşite şi să le elimine, alegând la
întâmplare dintre celelalte. În sfârşit, mai sunt şi persoane care aleg răspunsul bazându-se pe
alte considerente, cum ar fi lungimea răspunsurilor propuse, precizia limbajului folosit în
formularea acestora, poziţia răspunsului corect în întrebările pe care le-a parcurs deja etc. Din
aceste motive, în multe cazuri, răspunsurile greşite ale unui item sunt alese cu frecvenţe
diferite unele de altele.

9.5.2.3. Validitatea itemilor

În general, pentru aprecierea validităţii unui item se apelează la un criteriu extern, de


exemplu la scorurile unui alt test care măsoară cunoştinţele din acelaşi domeniu ca testul din
care face parte itemul, la media notelor şcolare de la materia verificată cu acest test sau la
aprecieri ale elevilor făcute de profesorul care predă materia verificată de test la clasa în care
a fost administrat testul.
Atunci când criteriul este măsurat pe scală de interval sau de raport (cum este cazul
mediilor şcolare), pentru estimarea validităţii unui item se calculează coeficientul de corelaţie
liniară între cotele itemului şi valorile criteriului. Acesta este denumit indice de validitate al
itemului. Dacă itemul are doar două cote posibile (este dihotomic sau este cotat astfel încât
răspunsurile greşite, cele parţial corecte şi cele omise primesc zero puncte, iar răspunsul
corect primeşte un punct), validitatea itemului se estimează cu ajutorul coeficientului de
corelaţie punct-biserială. Acesta este un caz particular al corelaţiei liniare, corespunzător
situaţiei când una dintre variabile are numai două valori.
Uneori criteriul este măsurat pe scală ordinală. Aşa se întâmplă atunci când criteriul este
reprezentat de aprecierea elevilor de către profesor, prin calificative, cărora li s-au pus în
corespondenţă numere, cum ar fi: 1=foarte slab, 2=slab, 3=mediocru, 4=bun, 5=foarte bun. În
astfel de situaţii, validitatea itemului nu poate fi studiată cu ajutorul coeficientului de corelaţie
liniară, ci se foloseşte un coeficient de corelaţie a rangurilor (de exemplu, coeficientul lui
Spearman).
Se consideră că un item este valid atunci când coeficientul de corelaţie calculat este
pozitiv şi semnificativ statistic la un prag ales (de obicei, p=0,05).

135 |
Foarte frecvent, în cazul testelor de cunoştinţe este greu de găsit o variabilă care să
servească drept criteriu pentru cercetarea validităţii itemilor testului. Dar, dacă specialiştii
apreciază că testul de cunoştinţe, în ansamblu, este valid – adică măsoară cunoştinţele din
domeniul pentru care a fost construit –, atunci scorurile testului pot fi utilizate, în locul
valorilor unei variabile criteriu, la cercetarea validităţii itemilor care compun testul. Este
adevărat că rezultatele vor fi distorsionate de faptul că în calculul scorului total al testului se
ia în considerare şi scorul itemului, dar, dacă numărul itemilor din test este mare, influenţa
fiecărui item este redusă. Vor fi consideraţi valizi itemii care măsoară acelaşi lucru ca întregul
test, adică au corelaţii liniare pozitive şi semnificative statistic cu scorul testului. În acest caz,
denumirea de indice de validitate este înlocuită cu aceea de indice de discriminare şi
consistenţă internă (Davis, 1955). Standards for Educational and Psychological Tests
(1974) consideră, însă, că asemenea coeficienţi nu măsoară validitatea itemilor.

9.5.2.4. Indicele de discriminare al unui item

Noţiunea de putere de discriminare a unui item vine sa o completeze pe cea de validitate


a itemului. Pentru cercetarea ambelor este necesară existenţa unei variabile criteriu. Destul de
des, în cazul testelor de cunoştinţe, drept criteriu serveşte chiar testul din care face parte
itemul.
În general, se apreciază că un item are putere de discriminare dacă persoanele care au
valori mari la variabila criteriu au şanse mai mari să răspundă corect la item decât cele care au
valori scăzute. O asemenea comportare o au, de obicei, itemii valizi, ale căror cote corelează
pozitiv (liniar sau nu, în funcţie de scala pe care este măsurată variabila criteriu şi de tipul
itemului) cu valorile variabilei criteriu. Din acest motiv, în literatura de specialitate, problema
validităţii itemilor şi cea a puterii lor de discriminare se confundă uneori, deşi metoda
recomandată pentru aprecierea puterii de discriminare – care va fi prezentată în continuare –
nu garantează totdeauna validitatea itemului. Această metodă, denumită metoda grupelor
contrastante, poate fi utilizată pentru itemii care au numai două cote posibile (itemi
dihotomici sau itemi cotaţi cu un punct în cazul răspunsului corect şi cu zero puncte în cazul
răspunsurilor greşite, parţial corecte sau omise), dacă testul a fost administrat unui număr
mare de persoane. Se procedează astfel:
• Din mulţimea persoanelor cărora li s-a administrat testul se formează două grupe, în
funcţie de valorile variabilei criteriu: grupa „bună”, compusă din cei care au cele mai
mari valori ale variabilei criteriu, şi grupa „slabă”, alcătuită din cei care la variabila
criteriu au cele mai mici valori. Dacă valorile variabilei criteriu sunt repartizate
conform legii normale, grupele vor conţine aproximativ 27% din totalul persoanelor.
Dacă repartiţia de frecvenţe a valorilor variabilei criteriu se abate mult de la legea
normală, se vor forma grupele din câte 33% dintre persoane. În ambele situaţii,
procentele persoanelor incluse în grupa „bună” şi în grupa „slabă” trebuie să fie
aproximativ egale şi să fie cuprinse în intervalul [25, 33] (M.J. Allen, W.M. Yen,
apud Gregory, 1992).

136 |
• Se calculează indicele de discriminare al itemului, folosind formula:
C C
D= B − S
NB NS
unde:
NB şi NS reprezintă numărul de persoane din grupa „bună”, respectiv din grupa „slabă”
(dacă testul a fost administrat cu limită de timp, atunci NB şi NS reprezintă numărul de
persoane care au citit itemul, în fiecare din cele două grupe);
CB şi CS reprezintă numărul de persoane care au răspuns corect la item, în grupa
„bună”, respectiv în grupa „slabă”.
Indicele de discriminare variază între -1 (atunci când toţi cei din grupa „slabă” au
răspuns corect la item şi toţi cei din grupa „bună” au răspuns greşit) şi +1 (atunci când toţi cei
din grupa „slabă” au răspuns greşit la item şi toţi cei din grupa „bună” au răspuns corect). Cu
cât indicele de discriminare este mai mare, cu atât itemul diferenţiază mai bine între cei
„slabi” şi cei „buni”.
Dacă indicele de discriminare este negativ sau apropiat de zero – ceea ce înseamnă că
frecvenţa relativă a persoanelor din grupa „slabă” care au răspuns corect la item este mai mare
decât frecvenţa relativă a persoanelor din grupa „bună” care au răspuns corect la item sau cele
două frecvenţe sunt aproximativ egale –, itemul trebuie eliminat din test.
Valoarea indicelui de discriminare D este dependentă de cea a indicelui de dificultate p.
Atunci când itemul este foarte dificil (p este apropiat de 0) şi atunci când este foarte uşor (p
este apropiat de 1), majoritatea subiecţilor răspund la fel la item (greşit sau corect), indiferent
din care grupă fac parte. Cel mai mare potenţial pentru a realiza o discriminare bună îl au
itemii al căror indice de dificultate este apropiat de 0,5.
Unii autori consideră că un item trebuie să fie eliminat din test dacă indicele său de
discriminare este mai mic decât 0,30. Dar, din cauza faptului că indicele de discriminare nu
poate lua valori mai mari decât 0,30 decât în cazul itemilor de dificultate medie, alţi autori
recomandă să se menţină în test itemii al căror indice de discriminare este mai mare decât 0
(Kubiszyn, Borich, 1996).
Un item poate avea un indice de discriminare convenabil, fără a avea o validitate bună.
Aşa se întâmplă, de pildă, dacă frecvenţa relativă a celor care răspund corect la item este mult
mai mare în rândul persoanelor care nu au fost incluse în grupa „slabă” şi în grupa „bună”
decât în cele două grupe. Un asemenea caz corespunde situaţiei când într-un item cu
răspunsuri la alegere răspunsul considerat corect conţine o eroare sesizabilă doar de
persoanele cu o bună pregătire în domeniu. O parte dintre persoanele din grupa „bună”
observă greşeala şi nu aleg acest răspuns, în timp ce persoanele care au doar cunoştinţe
parţiale în domeniu – şi care nu au fost incluse în cele două grupe – îl aleg.
O deficienţă a metodei grupelor contrastante constă în faptul că elimină din prelucrare
mai mult de o treime dintre persoanele care au răspuns la test. În plus, indicele de
discriminare astfel calculat nu arată cum diferenţiază itemul între persoanele din fiecare
grupă, ci doar dacă face deosebire între cei „buni” şi cei „slabi”. Din aceste motive, studiul
puterii de discriminare a itemului trebuie completat cu analiza validităţii sale.

137 |
9.5.3 Metode cantitative utilizate pentru testele relative la criteriu

Un test de cunoştinţe relativ la criteriu conţine itemi referitori la obiectivele pedagogice


sau de instruire formulate pentru o anumită secvenţă de instruire. Dacă aceasta se desfăşoară
în condiţii bune şi testul este bine construit, atunci scorurile testului variază puţin între
persoanele testate, cei mai mulţi dintre examinaţi reuşind să răspundă corect la majoritatea
întrebărilor. Prin urmare, indicii de dificultate ai itemilor au valori mari, apropiate între ele, şi,
din acest motiv, indicii de discriminare au valori mici.
Dar, simplul fapt că itemii au fost uşori pentru cei cărora li s-a administrat testul nu
înseamnă că acesta este un instrument de măsură bun.
Pentru verificarea itemilor se recomandă să se administreze testul de două ori aceloraşi
persoane: o dată înainte de secvenţa de instruire (testare) şi o dată la sfârşitul ei (retestare).
Itemii buni sunt cei rezolvaţi corect doar de puţine persoane în faza de testare (de exemplu, de
mai puţin de 30% dintre cei testaţi) şi de multe persoane în faza de retestare (de exemplu, de
cel puţin 70% dintre examinaţi) (Kubiszyn, Borich, 1996).
La întrebările cu răspunsuri la alegere, pentru fiecare răspuns propus se calculează
diferenţa dintre frecvenţele relative cu care a fost ales răspunsul respectiv în faza de testare şi
în faza de retestare. Această diferenţă trebuie să fie pozitivă pentru distractori şi negativă
pentru răspunsurile corecte.
Exemplu. La o întrebare cu răspunsuri la alegere, dintr-un total de 23 de elevi, în faza de
testare au răspuns 21 de elevi, iar în faza de retestare, 23. Întrebarea propune patru răspunsuri
(a-d), dintre care este corect doar primul (a). Subiecţilor li s-a cerut să marcheze un răspuns şi
numai unul. Răspunsurile date de elevi sunt notate în tabelul 9.8.
Eevul E21 nu a răspuns decât la testare, iar elevii E22 şi E23 nu au răspuns decât la
retestare. Aceşti trei elevi vor fi eliminaţi din prelucrări.
Pentru fiecare răspuns se calculează frecvenţa relativă a persoanelor care l-au ales la
testare, frecvenţa relativă a elevilor care l-au ales la retestare şi diferenţa celor două frecvenţe
relative (tabelul 9.9).

138 |
Tabelul 9.8. Răspunsurile date de 23 de elevi la o întrebare cu răspunsuri la alegere

Elevul Testare Retestare


a b c d a b c d
E1 x x
E2 x x
E3 x x
E4 x x
E5 x x
E6 x x
E7 x x
E8 x x
E9 x x
E10 x x
E11 x x
E12 x x
E13 x x
E14 x x
E15 x x
E16 x x
E17 x x
E18 x x
E19 x x
E20 x x
E21 x
E22 x
E23 x
Notă: Pentru fiecare elev s-a marcat un X în coloana corespunzătoare
răspunsului ales, atât la testare, cât şi la retestare.

Tabelul 9.9. Frecvenţele relative ale alegerilor răspunsurilor propuse


la un item cu răspunsuri la alegere

Item Testare Retestare Diferenţa


a 0,20 0,55 -0,35
b 0,50 0,10 0,40
c 0,25 0,10 0,15
d 0,05 0,25 -0,20

Pentru răspunsul corect a frecvenţa relativă a celor care l-au ales a crescut de la testare la
retestare. Aceasta înseamnă, pe de o parte, că elevii şi-au însuşit, pe parcursul secvenţei de

139 |
instruire, cunoştinţele verificate de întrebare, iar pe de altă parte, că răspunsul a este bine
formulat.
Răspunsurile propuse b şi c sunt, de asemenea, bine formulate. Ele au fost alese mai
frecvent în faza de testare decât în faza de retestare.
Distractorul d a fost ales mai frecvent la sfârşitul secvenţei de instruire decât la începutul
ei, ceea ce înseamnă că el seamănă cu răspunsul corect. Este posibil să fie bine formulat,
pentru că a fost ales mai rar decât răspunsul corect. Dar se impune verificarea sa.

Această metodă de analiză cantitativă a itemilor din testele relative la criteriu prezintă
următoarele inconveniente (Kubiszyn, Borich, 1996):
• Este greu de scris itemi pe care majoritatea persoanelor testate să îi rezolve incorect
în faza de testare şi corect în faza de retestare.
• Dacă secvenţa de instruire are durată scurtă, este posibil ca la retestare o parte dintre
subiecţii care nu stăpânesc cunoştinţele verificate de item să-şi amintească
răspunsurile pe care le-au dat la testare şi să le repete.
• Administrarea testului şi la începutul secvenţei de instruire, nu doar la sfârşitul ei,
scurtează timpul destinat instruirii.

9.6. Elaborarea documentaţiei de utilizare a testului

Fiecare test de cunoştinţe trebuie să fie însoţit de un manual, elaborat de întreaga echipă
care a contribuit la realizarea sa. Acesta va conţine informaţii despre (Nelissen, Eisendrath,
1987):
• autorii testului şi, în cazul administrării testului cu ajutorul calculatorului, autorii
programului computerizat (ai soft-ului);
• condiţiile în care se poate obţine testul (dacă se poate cumpăra, de unde şi preţul);
• în cazul administrării testului cu ajutorul calculatorului, condiţiile hard şi soft
necesitate de program (tipul de calculator, capacitatea memoriei, perifericele de
intrare/ieşire, sistemul de operare);
• durata medie a testării (dacă administrarea testului se face fără limită de timp) sau
timpul limită pentru răspuns;
• destinatarii testului (facultatea, profilul, anul de studii, pentru studenţi; profilul
liceului, clasa, pentru elevi);
• condiţiile în care se face verificarea cunoştinţelor cu ajutorul acestui test (examen,
seminar, autoverificare etc.);
• bibliografia utilizată pentru formularea întrebărilor testului;
• obiectivele educaţionale sau de instruire a căror îndeplinire este verificată cu ajutorul
testului;

140 |
• nivelul minim de pregătire necesar persoanelor care vor fi testate, nu numai în
domeniul care face obiectul examinării (de exemplu, este posibil ca un test de fizică
să pretindă anumite cunoştinţe de matematică);
• comenzile necesare pentru rularea programului, modul de alegere a opţiunilor din
meniu şi modul de utilizare a perifericelor, dacă administrarea testului se face cu
ajutorul calculatorului (fiecare operaţie posibilă trebuie să fie ilustrată cu o imagine a
tastaturii sau a ecranului la care se referă);
• modul de apreciere a rezultatelor testului.
Pentru testele de dimensiuni mai mari care se administrează cu ajutorul calculatorului,
este util să se elaboreze două manuale: unul destinat cadrelor didactice, în care să se insiste
asupra testului de cunoştinţe, iar celălalt pentru persoanele care vor fi examinate cu ajutorul
testului, în care accentul să cadă pe modul de utilizare a programului.

141 |
142 |
10. CONSTRUIREA UNUI TEST DE CUNOŞTINŢE
NESTANDARDIZAT

10.1. Algoritmul de construire a unui test de cunoştinţe

Adesea este nevoie de câte un test de cunoştinţe care să fie utilizat o singură dată sau de
un număr redus de ori. Aşa se întâmplă, de exemplu:
• în cazul testelor informative, construite de profesorul care predă la o clasă, şi al celor
folosite în timpul derulării programelor de formare/dezvoltare, pentru a verifica
îndeplinirea obiectivelor pedagogice, respectiv de instruire propuse;
• în organizaţii, înainte de desfăşurarea unui program de formare/dezvoltare
profesională, pentru a surprinde „golurile” din cunoştinţele participanţilor;
• atunci când se organizează o selecţie profesională şi este important ca persoanele care
vor ocupa posturile scoase la concurs să aibă cunoştinţe de specialitate.
În toate aceste situaţii nici nu se dispune de timpul necesar şi nici nu se justifică efortul
pentru a construi un test de cunoştinţe urmând întocmai algoritmul descris pentru construirea
testelor de cunoştinţe standardizate. Nu înseamnă că se poate reduce construirea testului la
formularea câtorva întrebări, la stabilirea arbitrară a punctajelor corespunzătoare răspunsurilor
corecte şi, eventual, a unor praguri care să îi departajeze pe cei „buni” de cei „mediocri” şi pe
aceştia de cei „slabi”. Şi pentru asemenea teste trebuie analizate cu atenţie atât întrebările
componente, cât şi răspunsurile persoanelor examinate, pentru a depista eventualii itemi
eronaţi.
Algoritmul de construire a unui test de cunoştinţe nestandardizat poate fi descris astfel:
a. Se defineşte testul, stabilind funcţia sa, populaţia căreia îi este destinat, structura
testului şi condiţiile în care va fi utilizat.
b. Se formulează itemii testului.
c. Se analizează întrebările testului sub aspectul corectitudinii ştiinţifice şi al modului
în care sunt formulate.
d. Se construieşte testul.
e. Se administrează testul.
f. Se analizează răspunsurile persoanelor examinate pentru a identifica eventualele
întrebări eronate şi a le elimina din test.
g. Se studiază fidelitatea şi validitatea testului obţinut în urma analizei de itemi.
h. Se determină elementele necesare pentru interpretarea scorurilor testului (scorul sau
pragul de secţionare, scorul critic, criteriul de performanţă sau norme).
Majoritatea paşilor sunt foarte asemănători cu cei ai algoritmului de construire a testelor
de cunoştinţe standardizate. Acţiunile corespunzătoare lor au fost prezentate în detaliu şi nu
vor fi reluate. În cele ce urmează se va insista pe deosebirile dintre cei doi algoritmi.

143 |
10.2. Definirea testului

Acest pas este foarte asemănător primului pas din algoritmul de construire a testelor de
cunoştinţe standardizate.
Se stabileşte funcţia pe care o va îndeplini testul şi, în legătură cu aceasta, se decide în ce
mod va fi validat, Dacă este cazul, se identifică variabilele care vor servi drept criteriu la
validarea sa.
În conformitate cu scopul pentru care va fi folosit testul, se stabileşte modul în care vor
fi interpretate scorurile sale.
Se defineşte populaţia căreia îi este destinat testul. În general, întrucât testul este folosit
de un număr redus de ori, populaţia coincide cu mulţimea tuturor persoanelor care vor fi
examinate cu acest test. Astfel de populaţii sunt: clasa de elevi căreia i se va administra testul
pentru a se verifica dacă au fost îndeplinite obiectivele pedagogice; grupul de participanţi la
un program de dezvoltare profesională, căruia i se va administra testul la începutul şi la
sfârşitul programului, pentru a se verifica dacă aceştia au achiziţionat cunoştinţe; grupul de
candidaţi la selecţia pentru un anumit post într-o organizaţie. Se încearcă să se identifice
caracteristicile persoanelor din populaţie care pot avea legătură cu modul de rezolvare a
testului: vârsta (de care depind capacitatea de concentrare, viteza de citire, bogăţia
vocabularului etc.), nivelul de şcolarizare, manualele utilizate pentru însuşirea cunoştinţelor
etc.
Se stabileşte în ce condiţii va fi administrat testul (locul, momentul şi durata testării),
pentru a se putea şti care este lungimea maximă pe care o poate avea testul, mai precis, cât
timp poate dura administrarea sa.
Se descrie domeniul de conţinut al testului, prin specificarea obiectivelor educaţionale
(pentru testele folosite în şcoală) sau a celor de instruire (în cazul testelor utilizate în cadrul
programelor de formare/dezvoltare profesională) a căror îndeplinire se urmăreşte, ori a
temelor a căror cunoaştere se verifică (atunci când testul se va folosi la selecţie profesională
sau pentru pregătirea unui program de formare/dezvoltare profesională).
Adesea se construieşte o tabelă de specificaţii. Ea ajută să se aleagă ce tipuri de itemi se
vor include în test.
Tot acum se decide dacă testul va fi sau nu administrat cu limită de timp şi cum vor fi
ordonaţi itemii (în ordinea dificultăţii sau aleatoriu).

10.3. Construirea itemilor

În general, itemii testelor de cunoştinţe nestandardizate utilizate în şcoală sunt formulaţi


de profesorul care va utiliza testul. Pentru testele de cunoştinţe nestandardizate folosite în alte
organizaţii, itemii sunt construiţi de specialişti din domeniul din care fac parte cunoştinţele
verificate de test.

144 |
În ambele situaţii, unii itemi pot fi extraşi din manuale, culegeri de exerciţii şi probleme
sau din alte teste de cunoştinţe.
Pentru fiecare item se decide cum vor fi cotate răspunsurile.
Se va urmări ca itemii introduşi în test să corespundă domeniului de conţinut al testului.
Este bine să fie elaboraţi mai mulţi itemi decât s-a prevăzut să intre în componenţa testului,
pentru că unii dintre ei ar putea fi eliminaţi în urma analizei itemilor.

10.4. Analiza itemilor

Înainte de a fi introduşi în test, itemii ar trebui să fie verificaţi de o persoană care are
cunoştinţe din domeniul vizat de test, care nu a participat la elaborarea lor, şi de una care
cunoaşte regulile de formulare şi de redactare a itemilor. Acest lucru este obligatoriu în cazul
testelor utilizate la selecţie şcolară sau profesională, când deciziile luate pe baza scorurilor lor
pot avea efecte importante asupra persoanelor testate.
Se va urmări, pentru fiecare item, atât corectitudinea ştiinţifică (dacă termenii de
specialitate sunt utilizaţi corect, dacă au fost bine stabilite răspunsurile corecte), cât şi modul
în care este formulat (dacă este clar, este formulat la nivelul de înţelegere al persoanelor
cărora li se va administra testul şi dacă, în general, respectă sugestiile prezentate anterior cu
privire la scrierea întrebărilor din testele de cunoştinţe).
Itemii eronaţi vor fi eliminaţi din test sau vor fi reformulaţi.

10.5. Construirea testului

Dintre itemii consideraţi corecţi în urma analizei itemilor se aleg cei vor intra în
componenţa testului, urmărindu-se ca aceştia să acope domeniul de conţinut al testului şi să se
poată răspunde la ei în timpul prevăzut pentru testare. Înainte de a definitiva conţinutul
testului se va verifica dacă nu există suprapuneri între itemi (în sensul că mai mulţi itemi se
referă la aceleaşi cunoştinţe) şi dacă nu există itemi care, prin informaţiile pe care le prezintă
în întrebare, să ajute la formularea răspunsului pentru alţi itemi. În ambele situaţii se vor
elimina din test itemii care sunt mai puţin reprezentativi pentru domeniul cunoştinţelor
verificat de test. Ei vor fi înlocuiţi cu itemi consideraţi corecţi în urma analizei itemilor şi care
nu au fost incluşi în test.
Itemii vor fi aranjaţi în ordinea crescătoare a dificultăţii lor (apreciată de cel care
construieşte testul) sau în ordine aleatoare, după cum s-a decis la pasul Definirea testului.
Sunt valabile şi aici recomandările prezentate la descrierea pasului Construirea unei variante
a testului din algoritmul de construire a testelor de cunoştinţe standardizate.
Se vor redacta, apoi, instrucţiunile de administrare a testului. Acestea trebuie să conţină
aceleaşi informaţii ca în cazul testelor de cunoştinţe standardizate.
Dacă se consideră util ca răspunsurile la test să nu fie notate pe foile testului, se va
redacta o Foaie de răspuns. Aceasta poate facilita corectarea răspunsurilor, în cazul în care

145 |
întrebările testului ocupă mai multe foi, şi permite să se economisească hârtie, dacă testul este
lung şi se prevede administrarea lui în mai multe ocazii.

10.6. Administrarea testului

Se multiplică testul şi, dacă este cazul, foile de răspuns.


Se administrează testul respectând timpul de răspuns prevăzut.

10.7. Analiza răspunsurilor la itemi

În cazul testelor de cunoştinţe nestandardizate, acest pas are scopul principal de a depista
itemii eronaţi care nu au fost observaţi la pasul Analiza itemilor. Procedeul urmat este cel
descris la pasul Analiza răspunsurilor incorecte la itemi din algoritmul de construire a testelor
de cunoştinţe standardizate.
Pentru fiecare item se analizează validitatea, utilizând un criteriu extern, sau se
calculează indicele de discriminare şi consistenţă internă.
Itemii eronaţi şi cei care se constată că nu sunt valizi se elimină din test.

10.8. Analiza fidelităţii şi a validităţii testului

Atunci când testul conţine itemi cu răspunsuri deschise, se calculează coeficientul de


fidelitate inter-evaluatori sau cel de fidelitate intra-evaluator. Dacă se constată că acesta este
foarte scăzut, nu se vor utiliza rezultatele testului.
Se calculează coeficientul de consistenţă al testului. El are doar o valoare informativă
pentru testele folosite la verificarea îndeplinirii unor obiective pedagogice sau de instruire,
însă este foarte important în cazul testelor utilizate la selecţie şcolară sau profesională,
întrucât este riscant să se ia decizii importante asupra persoanelor pe baza scorurilor unor teste
cu o fidelitate redusă şi, deci, imprecise.
Dacă în urma analizei răspunsurilor la itemi au fost eliminaţi itemi, atunci este necesar
să se analizeze validitatea de conţinut a testului. În cazul testelor utilizate în şcoli sau în alte
organizaţii pentru verificarea îndeplinirii unor obiective pedagogice ori de instruire s-ar putea
să se constate că nu mai există în test itemi referitori la anumite obiective şi să devină, astfel,
necesară construirea unui alt test de cunoştinţe, pentru verificarea îndeplinirii acestora.
Pentru testele utilizate la selecţie şcolară sau profesională se analizează validitatea
relativă la criteriu. Dacă se constată că testul nu este valid, se va renunţa la utilizarea
scorurilor sale.

146 |
10.9. Determinarea elementelor necesare
pentru interpretarea scorurilor testului

Atunci când scorurile testului se folosesc pentru a împărţi persoanele care au răspuns la
test în două grupe, „acceptaţi” şi „respinşi” – ceea ce se întâmplă frecvent în cazul testelor
utilizate la selecţie şcolară sau profesională – se determină un prag (scor) de secţionare.
Pentru a împărţi persoanele examinate cu ajutorul testului în două categorii, „cu succes”
şi „cu insucces”, se calculează scorul critic al testului.
Dacă testul de cunoştinţe este folosit într-o evaluare criterială, se stabileşte un criteriu de
performanţă, nivelurile de stăpânire a cunoştinţelor şi cotele la test corespunzătoare fiecărui
nivel.
Atunci când se doreşte să se compare între ele persoanele care au răspuns la test se
calculează normele testului şi se transformă scorurile testului în cote z, în cote T, în decile sau
în clase ale scalei normalizate. Se recurge mai rar la transformarea în centile deoarece
grupurile de persoane examinate cu teste de cunoştinţe nestandardizate au, în general, volum
redus.

147 |
148 |
11. CALITĂŢI ŞI DEFECTE ALE UNUI TEST DE CUNOŞTINŢE

11.1. Calităţi ale unui test de cunoştinţe

Pertinenţa
Un test este pertinent dacă respectă specificările formulate în momentul elaborării sale,
referitoare atât la conţinut, cât şi la obiectivele pedagogice urmărite.

Caracterul reprezentativ al testului


Itemii care compun testul reprezintă un eşantion din mulţimea tuturor itemilor (populaţia
itemilor) care ar fi putut fi formulaţi pentru a verifica dacă sunt cunoscute faptele, conceptele,
principiile unei teme de studiu. Acest eşantion trebuie să fie reprezentativ pentru populaţia din
care provine, adică să acopere întregul domeniu verificat de test.

Specificitatea
Un test este specific dacă un subiect care nu dispune de cunoştinţele pe care le verifică
testul obţine un scor egal cu cel pe care l-ar fi obţinut dacă ar fi răspuns la întâmplare
(Guilbert, 1987).
Aceasta înseamnă, pe de o parte, că itemii testului se referă la cunoştinţe legate puternic
de tema verificată de test, aşa încât să nu poată fi rezolvaţi corect pe baza cunoştinţelor din
alte domenii, iar pe de altă parte, că întrebările sunt bine formulate, nu sugerează răspunsul
corect, iar distractorii nu conţin afirmaţii neplauzibile.

Sensibilitatea
Sensibilitatea sau puterea de discriminare a unui test este dată de capacitatea acestuia de
a face distincţie între persoanele examinate, aşa încât să nu obţină, toate, scoruri egale sau
apropiate ca valoare.
Sensibilitatea este influenţată atât de numărul scorurilor posibile ale testului, cât şi de
legătura dintre itemii componenţi.
Este clar că un test care permite doar un număr redus de scoruri nu discriminează bine
între subiecţi. Dar, chiar şi atunci când numărul de scoruri posibile este mare, dacă itemii
corelează puternic între ei, persoanele examinate cu ajutorul testului se împart în două
categorii: unele răspund corect la aproape toţi itemii şi obţin scoruri apropiate de scorul
maxim posibil, iar altele nu răspund corect decât la foarte puţini itemi şi obţin scoruri
apropiate de scorul minim posibil. Prin urmare, apar cu frecvenţe mari scorurile extreme, în
timp ce scorurile medii au frecvenţă apropiată de zero.
Modul în care discriminează un test între persoanele examinate cu el este indicat de
forma distribuţiei de frecvenţe a scorurilor sale. O distribuţie normală asigură o discriminare
bună între persoanele care obţin scoruri mici şi între cele cu scoruri mari, dar nu diferenţiază
bine între subiecţii care realizează scoruri apropiate de media scorurilor, întrucât aceste valori

149 |
au o frecvenţă mare. O distribuţie asimetrică discriminează foarte bine între persoanele care
obţin scoruri ce apar cu frecvenţe reduse şi nu discriminează bine între subiecţii care au
scoruri ce apar cu frecvenţe mari.

Aplicabilitatea
Pentru a decide dacă un test este aplicabil, trebuie să se ia în considerare următoarele
aspecte practice (Ausubel, Robinson, 1981):
• Informaţiile la care se referă întrebările din test să fie importante pentru domeniul
verificat, iar cunoaşterea lor să fie utilă.
• Testul să corespundă, ca formă şi conţinut, vârstei persoanelor cărora le este destinat
şi preocupărilor acestora.
• Modul de administrare a testului să fie convenabil, atât în privinţa costului, cât şi a
timpului necesar.
• Manualul testului să prevadă modul de cotare a testului şi modul de interpretare a
scorurilor.

11.2. Defecte ale unui test de cunoştinţe (după Guilbert, 1987)

Inexactitatea este generată de redactarea cu erori a întrebărilor sau, în cazul întrebărilor


cu răspunsuri la alegere şi al celor de tip asociere, a răspunsurilor propuse.

Ambiguitatea provine din utilizarea, în formularea întrebărilor, a unor termeni cu sens


confuz, care îl fac pe cel examinat să piardă mai mult timp cu înţelegerea întrebării decât cu
găsirea răspunsului.

Sugestivitatea reprezintă formularea defectuoasă a întrebărilor, aşa încât cel examinat


este condus spre răspunsul corect, chiar dacă acesta nu are cunoştinţele verificate de test.

Futilitatea apare atunci când întrebările testului sunt lipsite de importanţă sau de
utilitate.

Complexitatea este produsă de includerea în test a unor itemi mult mai dificili decât se
prevăzuse la începutul construirii testului.

150 |
12. ETALONAREA UNUI TEST

12.1. Tipuri de etaloane

Prin etalonare a unui test se înţelege stabilirea unei scale (scări) care permite să se
determine locul pe care îl ocupă scorul la test al unei persoane faţă de scorurile unui eşantion
extras din populaţia căreia îi aparţine persoana respectivă.
Etalonarea este una dintre etapele acţiunii de standardizare a testului. Ea se desfăşoară în
următorii paşi:
a. Se defineşte populaţia pentru care se etalonează testul.
b. Se extrage un eşantion din această populaţie.
c. Se administrează testul acestui eşantion.
d. Se stabileşte metoda de obţinere a cotelor transformate din scorurile testului.
e. Se determină cotele transformate corespunzătoare scorurilor testului.
În continuare, vor fi detaliaţi aceşti paşi.

a. Când se construieşte un test se decide cărei populaţii îi este destinat, adică cine sunt
persoanele care vor fi examinate cu el, ce caracteristici au aceste persoane.
Etalonarea testului se poate face pentru întreaga populaţie pentru care a fost construit
testul sau pentru subpopulaţii provenite din această populaţie.
Definiţia populaţiei pentru care se etalonează un test este foarte arbitrară: toate
persoanele cu un anumit nivel şcolar sau numai o parte dintre ele (de exemplu, cele care
domiciliază sau învaţă într-o anumită localitate).
Definirea populaţiei se poate face fie concret, prin enumerarea tuturor membrilor ei, fie
operaţional, prin indicarea unui set de condiţii pe care le îndeplinesc toate persoanele care
aparţin populaţiei.
Exemple. O populaţie este formată din „toţi elevii din clasa a VIII-a din România”. O
altă populaţie este constituită din „elevii din clasa a VIII-a de la Liceul „Ion Creangă” din
Timişoara, care îl au ca profesor de istorie pe Ion Popescu.

b. Din populaţia pentru care se etalonează testul se extrage un eşantion de persoane,


numit grup de normare (grup de etalonare sau eşantion de etalonare). Eşantionul format
trebuie să îndeplinească două cerinţe:
• să fie reprezentativ pentru populaţia din care a fost extras, adică structura sa să fie cât
mai asemănătoare structurii populaţiei pentru care se face etalonarea testului, în ceea
ce priveşte caracteristicile care ar putea avea influenţă asupra scorurilor la test (de
exemplu, profilul liceelor, nivelul liceelor apreciat pe baza mediilor de admitere în
liceu etc.);
• să fie destul de mare, aşa încât rezultatele obţinute la test să reflecte repartiţia acestor
valori în populaţia din care provine eşantionul (de exemplu, pentru un test ale cărui

151 |
scoruri posibile sunt numere întregi cuprinse între 0 şi 50, într-un eşantion format din
20 de persoane se vor putea obţine cel mult 20 de valori distincte de scor, în timp ce
în populaţia din care provine acest eşantion, compusă din 1000 de persoane, este
posibil să fie prezente toate cele 51 de scoruri).
Există şanse destul de mari să se obţină un eşantion reprezentativ pentru populaţie, dacă
eşantionul nu are volum foarte redus şi formarea eşantionului se face prin selecţie aleatoare
simplă. Aceasta înseamnă că fiecare persoană din populaţie are o probabilitate calculabilă şi
diferită de zero de a intra în componenţa eşantionului. De exemplu, se alcătuieşte o listă cu
toţi membrii populaţiei, se generează numere aleatoare (sau se aleg la întâmplare numere
dintr-un tabel cu numere aleatoare) şi se includ în eşantion persoanele ale căror numere de
ordine în listă coincid cu aceste numere aleatoare. Sau, dacă populaţia nu este numeroasă, se
scrie numele fiecărei persoane din componenţa ei pe câte un bilet şi apoi se extrag, la
întâmplare, atâtea bilete câte persoane trebuie să fie incluse în eşantion.
Atunci când volumul eşantionului este mic în raport cu populaţia, pentru obţinerea unui
eşantion reprezentativ este necesar să se facă o selecţie aleatoare stratificată. În acest scop, se
determină variabilele care se ştie sau se presupune că au influenţă asupra rezultatelor la test.
Se face apoi o clasificare a populaţiei după valorile acestei variabile şi se stabileşte care
trebuie să fie compoziţia eşantionului astfel încât fiecare clasă să fie reprezentată în eşantion
proporţional cu frecvenţa ei relativă în populaţie. Din fiecare clasă se extrag, prin selecţie
aleatoare simplă, persoanele care vor intra în componenţa eşantionului.
Exemplu. Se doreşte etalonarea unui test de cunoştinţe de istorie pentru clasa a VIII-a.
Populaţia este formată din toţi elevii claselor a VIII-a dintr-un judeţ. Volumul populaţiei
este de 10000 de persoane. Se doreşte formarea unui eşantion compus din 70 de elevi.
Se presupune că asupra rezultatelor la test ar avea influenţă mediul (urban sau rural) în
care este situată şcoala şi manualul folosit de profesorul care predă la clasă (există trei
manuale alternative, pe care le denumim A, B şi C).
Structura populaţiei este prezentată în tabelul 12.1.

Tabelul 12.1. Structura populaţiei pentru care se etalonează


un test de cunoştinţe de istorie

Mediul în care Manualul Frecvenţa Frecvenţa


este situată folosit absolută relativă în
şcoala populaţie
urban A 2000 0,20
B 1000 0,10
C 3000 0,30
rural A 1000 0,10
B 2500 0,25
C 500 0,05
Total 10000 1,00

Se determină numărul de elevi care trebuie să intre în componenţa eşantionului astfel


încât frecvenţa relativă în eşantion a fiecărei dintre cele şase clase formate în funcţie de

152 |
mediul în care este situată şcoala şi de manualul folosit să fie aproximativ aceeaşi cu cea din
populaţie. În acest scop, se înmulţeşte fiecare frecvenţă relativă din populaţie cu volumul
eşantionului (70) şi rezultatul se rotunjeşte la cel mai apropiat întreg. Este posibil ca în acest
fel volumul rezultat al eşantionului să nu mai fie egal cu cel preconizat.
Structura eşantionului care urmează să fie format este prezentată în tabelul 12.2.

Tabelul 12.2. Structura eşantionului care va fi folosit


pentru etalonarea unui test de cunoştinţe de istorie

Mediul în care Manualul Frecvenţa Frecvenţa Frecvenţa


este situată folosit absolută relativă în relativă
şcoala eşantion dorită în
eşantion
urban A 14 0,197 0,20
B 7 0,099 0,10
C 21 0,296 0,30
rural A 7 0,099 0,10
B 18 0,253 0,25
C 4 0,056 0,05
Total 71 1,000 1,00

Principala dificultate în cazul selecţiei aleatoare stratificate constă în determinarea


variabilelor utilizate pentru a împărţi populaţia în clase. Nu se vor alege prea multe variabile,
pentru a nu fi necesară constituirea unui eşantion de volum mare. În general, nu se folosesc
mai mult de patru variabile.
În cazul populaţiilor numeroase (cum ar fi, de exemplu, toţi elevii din clasa a XII-a din
ţară), care sunt eterogene şi, din acest motiv, necesită utilizarea mai multor variabile pentru
formarea claselor, eşantionul trebuie să fie de volum mare pentru a putea conţine, din fiecare
clasă, cel puţin 100 de persoane.
Pentru a se face economie de timp şi de bani, adesea se renunţă la etalonarea testelor
pentru o populaţie generală şi se determină etaloane în populaţii mai puţine numeroase şi mai
omogene, pentru care se pot forma eşantioane de volum mai redus. În acest fel, se obţin
norme (etaloane) locale ale testului.

c. Persoanelor din eşantionul format li se administrează testul, în condiţii foarte


asemănătoare celor în care acesta va fi utilizat.

d. Se stabileşte modul în care se transformă scorurile testului în cote transformate. Mai


frecvent se folosesc două tipuri de transformări:
• transformări liniare, care schimbă doar media şi abaterea standard a scorurilor
testului, aşa încât repartiţia de frecvenţe a cotelor transformate este aceeaşi cu
repartiţia de frecvenţe a scorurilor testului. Prin astfel de transformări se obţin cotele
standard z şi cotele standardizate.

153 |
• transformări neliniare, care schimbă forma repartiţiei de frecvenţe a scorurilor
testului astfel încât repartiţia de frecvenţe a cotelor transformate să fie asemănătoare
repartiţiei uniforme (în cazul centilelor, decilelor sau cuartilelor) ori repartiţiei
normale (în cazul în care se urmăreşte obţinerea unei scale normalizate).

12.2. Transformări liniare

Se recurge la efectuarea de transformări liniare asupra scorurilor testelor, fie pentru a


putea compara între ele performanţele unei persoane la mai multe teste, fie pentru a interpreta
scorul unei persoane prin compararea sa cu media scorurilor testului în eşantionul utilizat la
etalonare.
Pentru a transforma scorul unei persoane la un test, x, în cotă standard z (sau, pe scurt,
cotă z) se foloseşte formula:
z = x−m
σ
unde:
m şi σ sunt media şi abaterea standard pentru scorurile acestui test, calculate în eşantionul
utilizat la etalonarea testului;
z este cota standard z corespunzătoare scorului x.
Cota z arată cu câte unităţi de abatere standard (σ) este depărtat scorul x de media m.
Atunci când cota z este pozitivă, scorul x este mai mare decât media m, iar atunci când cota
z este negativă, scorul x este mai mic decât media m. Cota z este egală cu zero dacă şi numai dacă
x=m.
Cotele standard z sunt uşor de interpretat dacă scorurile testului sunt repartizate aproximativ
normal în populaţia din care a fost extras eşantionul care a servit la etalonare. În acest caz, în
intervalul [-1, 1] se află cotele z pentru 68% dintre persoane. Acestea corespund scorurilor
„obişnuite” sau „medii”.
Cotele z mai mari decât 1 corespund scorurilor „mari”, iar cele mai mici decât -1, scorurilor
„mici”.
Despre un subiect care a obţinut o cotă z egală cu 0,72 se poate afirma că a obţinut un
rezultat „obişnuit” (sau „mediu”), în timp ce o persoană cu o cotă z egală cu 3,6 are un scor
„neobişnuit de mare” (mai puţin de 0,13% dintre persoanele populaţiei din care a fost extras
eşantionul utilizat la etalonare au mai realizat un asemenea scor).
Pentru a putea compara între ele rezultatele unei persoane la mai multe teste, este necesar
ca toate testele ale căror scoruri vor fi comparate să fi fost etalonate în acelaşi eşantion de
persoane (adică, să fi fost administrate aceluiaşi eşantion de persoane şi să se fi calculat
mediile şi abaterile standard ale scorurilor fiecărui test în acest eşantion).
Exemplu. Un elev a obţinut la un test de gramatică 12 puncte, iar la un test de matematică
14 puncte. Ambele teste au scorurile posibile între 0 şi 20. Se poate afirma că elevul este mai bun
la matematică decât la gramatică?

154 |
Pentru a răspunde la această întrebare, se transformă scorurile testului în cote z, utilizând
mediile şi abaterile standard ale scorurilor celor două teste, calculate în acelaşi eşantion de
persoane, extras din populaţia din care face parte elevul.
Pentru testul de gramatică, media este 11, iar abaterea standard, 2. Cota z a elevului este
egală cu 12 − 11 = 0,5. La acest test, elevul a obţinut un rezultat „obişnuit” sau „mediu”.
2
Pentru testul de matematică, media este 16, iar abaterea standard, 1,6. Cota z a elevului este
egală cu 14 − 16 = −1,25. Prin urmare, la testul de matematică, elevul a obţinut un rezultat
1,6
„slab”.
Comparând cotele z se deduce că elevul este mai bun la gramatică decât la matematică.

Inconvenientul utilizării cotelor z îl constituie faptul că acestea se exprimă prin numere cu


semn şi cu zecimale, fiind cuprinse, în general, în intervalul [-3, 3]. Din acest motiv, se
efectuează transformări liniare asupra cotelor z, obţinându-se cote standardizate. Aceste
transformări sunt de forma:
z’=M+Sz
unde:
z’ este cota standardizată corespunzătoare cotei standard z;
M şi S sunt media şi abaterea standard pentru cotele standardizate obţinute prin
transformare.
În tabelul 12.3 sunt prezentate câteva dintre transformările utilizate mai des.

Tabelul 12.3. Valorile M şi S pentru diverse transformări


ale cotelor standard z în cote standardizate

Scala
N C WP L T Z IQ H
M 3 5 10 10 50 100 100 50
S 1 2 3 5 10 10 15 14

Exemplu. Pentru a transforma o cotă z într-o cotă standardizată T (numită, pe scurt, cotă
T) se foloseşte formula: T=50+10z.
Astfel, o persoană care are cota z egală cu 0,5 va avea cota T egală cu 50+10x0,5=55.

Cotele T cuprinse în intervalul [40, 60] (corespunzător intervalului [-1, 1] al cotelor z)


sunt considerate „medii” sau „obişnuite”, cele mai mari decât 60 sunt considerate „mari”, iar
cele mai mici decât 40, „mici”.

155 |
12.3. Transformări neliniare

Prin transformări neliniare se schimbă forma repartiţiei de frecvenţe a scorurilor testului,


astfel încât repartiţia de frecvenţe a scorurilor transformate să cuprindă un număr fixat de
valori şi, pentru fiecare valoare, un procent din volumul eşantionului de persoane care a servit
la etalonare cât mai apropiat de un procent fixat. Transformările utilizate cel mai des conduc
fie spre o repartiţie de frecvenţe asemănătoare legii uniforme (transformarea scorurilor în
cuartile, decile sau centile), fie spre o repartiţie de frecvenţe asemănătoare legii normale
(transformarea scorurilor în scala normalizată cu 5, 7 sau 9 clase).
Pentru fiecare dintre aceste transformări este fixat numărul de valori ale scorurilor
transformate şi procentul corespunzător fiecărei valori (tabelul 12.4). Acest procent trebuie să
fie aproximat cât mai bine de procentul persoanelor din eşantionul folosit la etalonare care au
respectiva valoare de scor transformat.
Astfel, de exemplu, prima cuartilă corespunde celor mai mici scoruri de test realizate în
eşantionul utilizat la etalonare, iar numărul persoanelor care au asemenea scoruri de test este de
aproximativ 25% din volumul eşantionului. Cea de a doua cuartilă corespunde scorurilor de test
care urmează, ca mărime, scorurilor de test corespunzătoare primei cuartile. Aceste scoruri sunt
obţinute de aproximativ 25% dintre persoanele eşantionului utilizat la etalonare. Cea de a treia
cuartilă corespunde scorurilor de test care urmează, ca mărime, scorurilor de test corespunzătoare
celei de a doua cuartile. Aceste scoruri sunt obţinute de aproximativ 25% dintre persoanele
eşantionului folosit la etalonare. Ultima cuartilă corespunde celor mai mari scoruri de test.
Acestea sunt obţinute de aproximativ 25% dintre persoanele eşantionului utilizat la etalonare.
Se deduce că transformarea în decile şi cea în centile au sens numai atunci când volumul
eşantionului folosit la etalonare este mare, întrucât fiecărei valori de scor transformat trebuie să îi
corespundă scoruri de test obţinute de 10%, respectiv de 1%, dintre persoanele eşantionului.

Tabelul 12.4. Numărul de valori ale scorurilor transformate şi procentele fiecărei valori
pentru diverse transformări ale scorurilor testelor

Denumirea Numărul de Procentele valorilor scorurilor transformate


scorurilor valori
transformate pentru
scorurile
transformate
cuartile 4 25% pentru fiecare valoare
decile 10 10% pentru fiecare valoare
centile 100 1% pentru fiecare valoare
clase ale scalei 5 7%, 24%, 38%, 24%, 7%
normalizate 7 5%, 11%, 21%, 26%, 21%, 11%, 5%
9 4%, 7%, 12%, 17%, 20%, 17%, 12%, 7%, 4%
Notă: Pentru transformările în clase ale scalei normalizate, procentele au fost notate în ordinea
crescătoare a scorurilor transformate cărora le corespund (primul procent corespunde celui mai mic
scor, al doilea procent corespunde celui de-al doilea scor ca mărime,…, ultimul procent corespunde
celui mai mare scor transformat).

156 |
De obicei, atunci când se efectuează o transformare a scorurilor de test nu se pot obţine
exact procentele notate în tabelul 12.4, din două motive:
• Rezultatul calculului unui anumit procent poate să fie un număr zecimal (de
exemplu, 25% din 130 este 32,5). Or, fiind vorba de persoane, trebuie să se lucreze
cu numere întregi.
• O valoare de scor de test trebuie să corespundă unui singur scor transformat, iar dacă
procentul persoanelor din eşantionul folosit la etalonare care au obţinut o anumită
valoare de scor este mare, scorul transformat care va corespunde acelui scor de test
va avea un procent mai mare de persoane decât cel fixat.
Determinarea scorurilor transformate corespunzătoare fiecărei valori de scor de test se
realizează urmând algoritmul descris în statistică pentru calculul cuantilelor.
Pentru un număr real p din intervalul (0,1), se numeşte cuantilă de ordinul p a unei
variabile într-o colectivitate un număr care are proprietatea că 100p% dintre unităţile statistice ale
colectivităţii au valori mai mici decât el, iar celelalte 100(1-p)% au valori mai mari decât el sau
egale cu el.
În cazul transformărilor de scoruri de test, variabila este „scorul la test”, colectivitatea este
„eşantionul de persoane folosit la etalonarea testului”, unităţile statistice ale colectivităţii sunt
„persoanele din eşantion”, iar valorile p utilizate la calculul cuantilelor sunt precizate, pentru
fiecare transformare din tabelul 12.4, în tabelul 12.5. Valorile p corespund procentelor cumulate
crescător, împărţite la 100. De exemplu, pentru transformarea în scala normalizată cu 5 clase:
0,07 = 7
100
0,31= 7 + 24
100
0,69= 7 + 24 + 38
100
0,93= 7 + 24 + 38 + 24
100

Tabelul 12.5. Valorile p utilizate la calculul cuantilelor,


pentru diverse transformări ale scorurilor testelor

Denumirea Numărul de Valorile p


scorurilor valori
transformate pentru
scorurile
transformate
cuartile 4 0,25; 0,50; 0,75
decile 10 0,10; 0,20; 0,30; …, 0,90
centile 100 0,01; 0,02; 0,03; …; 0,99
clase ale scalei 5 0,07; 0,31; 0,69; 0,93
normalizate 7 0,05; 0,16; 0,37; 0,63; 0,73; 0,84; 0,95
9 0,04; 0,11; 0,23; 0,40; 0,60; 0,77; 0,89; 0,96

157 |
Calculul cuantilei de ordinul p, pentru p∈(0,1), se realizează conform următorului algoritm:
a. Se determină numărul k=[np]+1, unde n este volumul eşantionului pentru care se face
calculul, iar [np] reprezintă partea întreagă a numărului np.
b. Se înregistrează scorurile testului la toate persoanele din eşantion şi se ordonează
crescător. Dacă există mai multe persoane care au acelaşi scor, valoarea respectivă va fi
scrisă în şir de atâtea ori de câte ori apare în eşantion. Se formează astfel un şir de n
numere: x1≤x2≤...≤xn
c. Cuantila de ordinul p primeşte ca valoare cea de a k-a valoare din şir: xk.
Atunci când eşantionul are volum mare, pentru a nu scrie un şir lung la pasul b, se
întocmeşte un tabel de frecvenţe de următoarea formă:

Scor Frecvenţa Frecvenţa


cumulată
crescător
y1 f1 F1
y2 f2 F2

yk fk Fk
Total n

În acest tabel, n reprezintă volumul eşantionului utilizat la etalonare, k este numărul


valorilor de scor de test distincte înregistrate în acest eşantion, iar numerele y1, y2,…yk sunt
valorile de scor de test distincte, ordonate crescător: y1<y2<…<yk. Evident, y1=x1 şi yk=xn.
Pentru fiecare valoare de scor yi (i=1,2,…,k), fi reprezintă numărul de persoane din
eşantion care au valoarea de scor de test yi, iar Fi reprezintă numărul de persoane din eşantion
care au scorul de test egal cu yi sau mai mic decât yi: Fi=f1+f2+…+fi.
Din tabel se poate afla că valoarea de scor de test y1 a fost obţinută de persoanele care în
şirul ordonat x1≤x2≤...≤xn ocupau primele F1 poziţii, valoarea de scor de test y2 a fost obţinută de
persoanele care în şirul ordonat x1≤x2≤...≤xn ocupau poziţiile cuprinse între F1+1 şi F2 ş.a.m.d. În
general, valoarea de scor de test yi (i=2,3,…,k) a fost obţinută de persoanele care în şirul ordonat
x1≤x2≤...≤xn ocupau poziţiile cuprinse între Fi-1+1 şi Fi.
După ce se determină toate cuantilele necesare transformării alese a scorurilor de test, se
alcătuieşte un tabel în care se notează, pentru fiecare scor transformat, fie intervalul de scoruri de
test care îi corespunde, fie limita superioară a acestui interval (fiind subînţeles faptul că limita
inferioară este numărul care urmează limitei superioare a intervalului corespunzător scorului
transformat precedent).
Adesea, în eşantionul utilizat la etalonarea unui test nu apar cele mai mici şi cele mai mari
scoruri de test posibile. În tabelul de corespondenţă între scorurile transformate şi scorurile de
test, intervalul de scoruri de test corespunzător celei mai mici valori de scor transformat va avea
limita inferioară egală cu cel mai mic scor de test posibil şi nu cu cel mai mic scor de test
înregistrat în eşantionul folosit la etalonare. De asemenea, intervalul de scoruri de test
corespunzător celei mai mari valori de scor transformat va avea limita superioară egală cu cea
mai mare valoare posibilă de scor de test şi nu cu cel mai mare scor de test înregistrat în eşantion.

158 |
Exemplu. Se transformă scorurile de test obţinute într-un eşantion format din 50 de elevi în
scala normalizată cu 5 clase. Scorurile posibile la test sunt numere întregi, cuprinse între 0 şi 18.
În tabelul 12.6 sunt notate frecvenţele scorurilor de test în eşantionul folosit la etalonare.

Tabelul 12.6. Frecvenţele scorurilor la un test în eşantionul utilizat la etalonarea testului

Scor Frecvenţa Frecvenţa


cumulată
crescător
0 1 1
1 1 2
2 2 4
3 3 7
4 2 9
5 4 13
6 6 19
7 5 24
8 7 31
9 4 35
10 4 39
11 3 42
12 4 46
13 2 48
14 1 49
15 1 50
Total 50

Pentru a afla care sunt limitele superioare ale claselor scalei normalizate, se vor determina
cuantilele de ordinele 0,07, 0,31, 0,69 şi 0,93.
Utilizăm algoritmul descris mai sus.
Dacă p=0,07 şi n=50, atunci k=[3,5]+1=3+1=4. Limita superioară a primului interval va fi
valoarea de scor de test aflată pe poziţia 4. Din coloana „Frecvenţa cumulată crescător” a
tabelului 11.6 se constată că poziţiile 3 şi 4 sunt ocupate de valoarea 2. Prima clasă va fi [0, 2].
Ea conţine 4 persoane, adică 8% din eşantion şi nu 7% cum ar fi necesar.
Dacă p=0,31 şi n=50 atunci k=[15,5]+1=15+1=16. Limita superioară a celui de-al doilea
interval va fi valoarea de scor de test situată pe poziţia 16. De la poziţia 14 şi până la poziţia 19
se află valoarea 6. Limita inferioară a celui de-al doilea interval este numărul consecutiv limitei
superioare a primului interval, adică 3. A doua clasă este [3, 6]. Ea conţine 15 persoane, adică
30% din eşantion.
Procedând în acelaşi mod găsim următoarele clase: [7, 9] şi [10, 13].
Ultima clasă va avea limita inferioară egală cu numărul consecutiv limitei superioare a
intervalului precedent, adică 14, iar limita superioară egală cu cel mai mare scor posibil la test,
18.
În tabelul 12.7 sunt notate scorurile transformate (clasele scalei normalizate), frecvenţele
acestora, procentele dorite şi procentele obţinute.

159 |
Tabelul 12.7. Clasele normalizate şi frecvenţele acestora

Clasa Scorurile Frecvenţa % %


normalizată de test clasei dorit
(scorul corespun-
transformat) zătoare
1 [0, 2] 4 8 7
2 [3, 6] 15 30 24
3 [7, 9] 16 32 38
4 [10, 13] 13 26 24
5 [14, 18] 2 4 7
Total 50 100 100

Se observă că procentele elevilor din cele 5 clase nu sunt identice cu procentele care s-a
dorit să fie obţinute.
Tabelul de transformare a scorurilor testului în clasele scalei normalizate se prezintă sub
următoarea formă:

Clasa Scorurile de test


normalizată corespunzătoare
(scorul
transformat)
1 [0, 2]
2 [3, 6]
3 [7, 9]
4 [10, 13]
5 [14, 18]

160 |
13. INTERPRETAREA SCORURILOR
UNUI TEST DE CUNOŞTINŢE

13.1. Interpretarea scorului unei persoane

13.1.1. Posibilităţi de interpretare a scorului unei persoane

Scorul obţinut de o persoană la un test de cunoştinţe nu aduce nicio informaţie despre


cunoştinţele acesteia. Faptul că la un test de cunoştinţe ale cărui cote brute posibile sunt
numere întregi, cuprinse între 0 şi 20, un elev a obţinut scorul 10 nu înseamnă că el este
mediocru, după cum nici un scor egal cu 5 nu ar permite să se tragă concluzia că elevul este
slab.
O cotă brută dobândeşte semnificaţie numai dacă este raportată:
• la un barem fixat
sau
• la cotele brute realizate la acelaşi test de alte persoane, din aceeaşi populaţie din care
face parte elevul
sau
• la cota brută obţinută la acelaşi test, de acelaşi elev, la o testare anterioară.
Prima situaţie este întâlnită mai ales la testele utilizate în evaluarea criterială şi la cele
folosite în selecţia şcolară sau în cea profesională. Uneori, baremul la care se face raportarea
rezultatelor unui test este reprezentat de o singură valoare de scor. Aceasta poate fi un prag
(scor) de secţionare sau un scor critic (Truxillo, Donahue, Sulzer, 1996).

13.1.2. Praguri de secţionare şi scoruri critice

Un prag (scor) de secţionare este un număr care serveşte la împărţirea persoanelor


cărora li s-a administrat testul în două categorii: acceptaţi sau admişi (cei care au obţinut un
scor mai mare decât pragul de secţionare sau egal cu acesta) şi respinşi (celelalte persoane).
Uneori, pragul de secţionare este stabilit de specialişti, care apreciază nivelul minim de
cunoştinţe, deprinderi sau priceperi necesare pentru a avea succes într-o anumită profesie, la
un curs de calificare sau de specializare etc. De exemplu, ei decid numărul minim de întrebări
dintr-un test de cunoştinţe la care o persoană trebuie să răspundă corect pentru a fi declarată
„admisă”.
Pentru testele folosite ca predictori în selecţia profesională sunt descrise, în literatura de
specialitate, mai multe metode de stabilire a pragului de secţionare. Vom prezenta, în
continuare, câteva dintre acestea, după Gatewood şi Feild (2001).

161 |
Metoda lui Thorndike necesită să se facă presupuneri asupra următoarelor aspecte,
necunoscute în momentul în care se determină pragul de secţionare:
• numărul de posturi care vor fi disponibile într-un interval de timp fixat şi pentru care
se va efectua selecţia folosind acest test, P;
• numărul de persoane care vor candida pe aceste posturi, C (C>P);
• distribuţia de frecvenţe a scorurilor la test pentru cei C candidaţi.
Se calculează frecvenţa relativă a persoanelor care vor fi acceptate pentru a fi angajate
pe posturile disponibile: f = P . Pe baza ei se determină procentul candidaţilor care vor fi
C
respinşi, din totalul celor care se vor prezenta la selecţie: R = 100 × (1 − f ) .
Pragul de secţionare va fi stabilit la valoarea scorului de test care corespunde centilei R,
din care se scade eroarea standard de măsură.
Este posibil ca atunci când va avea loc selecţia, distribuţia scorurilor la test ale
candidaţilor să difere mult de cea presupusă şi, din acest motiv, numărul candidaţilor care vor
avea scorul la test cel puţin egal cu pragul de secţionare stabilit prin metoda lui Thorndike să
fie mult mai mare sau mult mai mic decât P.
Exemplu. O firmă de programare a anunţat că în următoarele trei luni intenţionează să
organizeze selecţie pentru ocuparea a 40 de posturi de programator. Se presupune că se vor
prezenta 200 de candidaţi, majoritatea fiind absolvenţi ai facultăţilor de Informatică şi de
Calculatoare.
Se doreşte să se fixeze pragul de secţionare pentru un test de cunoştinţe de informatică.
Acesta a fost administrat recent unui eşantion format din studenţi în ultimul an ai mai multor
facultăţi de Informatică. Pe baza scorurilor obţinute de aceştia s-au determinat centilele
corespunzătoare scorurilor testului şi s-a calculat eroarea standard de măsură: σE=2.
Se face presupunerea că distribuţia de frecvenţe a scorurilor testului în eşantionul
candidaţilor la cele 40 de posturi este identică distribuţiei scorurilor în eşantionul folosit la
calculul centilelor.
Se calculează frecvenţa relativă a persoanelor care vor fi acceptate pentru a fi angajate:
f = 40 = 0,20 şi procentul candidaţilor care vor fi respinşi: R=100x(1-0,20)=80. Din tabelul
200
care indică centilele corespunzătoare scorurilor testului se află că centilei 80 îi corespunde
scorul 26.
Pragul de secţionare va fi fixat la valoarea 26-2=24.
Toţi candidaţii care vor obţine un scor mai mic decât 24 vor fi respinşi.

Metoda lui Angoff se poate folosi numai în cazul testelor compuse din itemi la care se
răspunde „corect” sau „greşit”, nu şi „parţial corect”.
Un grup de experţi apreciază, pentru fiecare item al testului, frecvenţa relativă a celor
care l-ar rezolva corect, în mulţimea persoanelor care ar putea fi acceptate pentru a fi angajate
pe post. Se însumează aceste frecvenţe relative pentru toţi itemii testului, iar rezultatul obţinut
reprezintă pragul de secţionare.

162 |
Atunci când testul a fost administrat deja unui eşantion de persoane asemănătoare, sub
aspectul variabilelor care ar putea avea influenţă asupra modului de a răspunde la test (de
exemplu, vârstă, nivel de pregătire şcolară), celor care vor candida pentru post şi s-a calculat
eroarea standard de măsură a scorurilor testului, se poate utiliza metoda lui Angoff
modificată: pragul de secţionare va fi egal cu diferenţa dintre pragul de secţionare obţinut prin
metoda lui Angoff, din care se scade eroarea standard de măsură.
Exemplu. Un test de ortografie este alcătuit din 10 itemi cotaţi cu 1 pentru răspuns corect
şi cu 0 pentru răspuns greşit sau omis. Testul urmează să fie folosit în selecţia pe postul de
tehnoredactor la o editură. Sunt acceptate să se înscrie la concurs persoane care au absolvit
liceul şi au diplomă de bacalaureat.
S-a format un grup de experţi din trei profesori de limba română. Lor li s-a cerut să îşi
imagineze cum ar răspunde la test persoanele care ar putea ocupa postul scos la concurs şi,
pentru fiecare item, să aprecieze procentul persoanelor care l-ar rezolva corect. S-a calculat
media celor trei procente şi s-a împărţit la 100, pentru a obţine frecvenţa relativă. Rezultatele
sunt prezentate în tabelul 13.1.

Tabelul 13.1. Frecvenţele relative ale persoanelor care ar răspunde corect


la itemii unui test de ortografie

Item
1 2 3 4 5 6 7 8 9 10
0,75 0,80 0,85 0,80 0,65 0,75 0,92 0,68 0,77 0,73

Se adună frecvenţele relative. Suma este egală cu 7,70. Acesta este pragul de secţionare
stabilit prin metoda lui Angoff.
Dacă testul a fost administrat unui eşantion de persoane format din absolvenţi de liceu cu
diplomă de bacalaureat şi s-a obţinut eroarea standard de măsură σE=1,5 atunci se poate fixa
pragul de secţionare, prin metoda lui Angoff modificată, la 7,7-1,5=6,2.

Metoda grupelor contrastante se poate utiliza atunci când testul a fost administrat unui
eşantion de persoane asemănătoare celor care este de aşteptat să se prezinte la selecţia în
cadrul căreia va fi folosit testul şi acestea au fost împărţite în două grupe („calificaţi”/
„necalificaţi” sau „buni”/„slabi”), pe baza aprecierilor făcute de un grup de evaluatori, având
drept criteriu cunoştinţele sau deprinderile măsurate de test.
Dacă testul este valid şi aprecierile au fost făcute corect, atunci în grupa celor
„necalificaţi” sunt mai frecvente scorurile mici, iar în grupa celor „calificaţi” sunt mai
frecvente scorurile mari.
În fiecare dintre grupe se determină, pentru fiecare scor al testului, frecvenţa relativă a
celor care au obţinut scorul respectiv din totalul persoanelor grupei.
Se alege ca prag de secţionare o valoare de scor pentru care frecvenţele relative în cele
două grupe sunt aproximativ egale.

163 |
Exemplu. Un test de informatică, format din 10 itemi, a fost administrat unui eşantion
compus din 45 de operatori care lucrează într-o organizaţie şi au aceleaşi sarcini de muncă.
Operatorii au fost împărţiţi, de superiorii lor, în două grupe, în funcţie de cunoştinţele lor de
informatică: „necalificaţi” (25 de persoane) şi „calificaţi” (20 de persoane).
Scorurile obţinute la testul de informatică în cele două grupe sunt prezentate în tabelul
13.2.

Tabelul 13.2. Frecvenţele scorurilor obţinute de 45 de operatori la un test de informatică

Grupa Scorul Total


0 1 2 3 4 5 6 7 8 9 10
necalificaţi 2 4 8 4 3 2 1 1 25
calificaţi 1 2 2 3 7 5 20

Se calculează, pentru fiecare scor, frecvenţa relativă a persoanelor care l-au obţinut, în
fiecare grupă (tabelul 13.3).

Tabelul 13.3. Frecvenţele relative ale scorurilor obţinute la un test de informatică


de operatori „calificaţi” şî de operatori „necalificaţi”

Grupa Scorul
0 1 2 3 4 5 6 7 8 9 10
necalificaţi 0,08 0,16 0,32 0,16 0,12 0,08 0,04 0,04 0,00 0,00 0,00
calificaţi 0,00 0,00 0,00 0,00 0,00 0,05 0,10 0,10 0,15 0,35 0,25

Pentru scorul 5 frecvenţa relativă în grupa celor „necalificaţi” (0,08) este aproximativ
egală cu frecvenţa relativă în grupa celor „calificaţi” (0,05). Se va alege scorul 5 ca prag de
secţionare.

Adesea se obţin frecvenţe relative aproximativ egale pentru mai multe scoruri. În
asemenea situaţii, pragul de secţionare se stabileşte astfel încât majoritatea scorurilor obţinute
de subiecţii din grupa „calificaţi” să se situeze deasupra pragului de secţionare sau să fie egale
cu acesta, iar majoritatea scorurilor celor din grupa „necalificaţi” să se afle sub pragul de
secţionare.
Exemplu. Un test de cunoştinţe de geometrie pentru clasa a VII-a, ale cărui scoruri
posibile sunt numere întregi cuprinse între 0 şi 14 a fost administrat la două grupe
contrastante de elevi, proveniţi din patru clase a VII-a la care predă acelaşi profesor de
matematică. Prima grupă, a fost formată din 20 de elevi pe care profesorul i-a considerat cei
mai buni la geometrie, iar a doua, din 25 de elevi, pe care acelaşi profesor i-a apreciat ca fiind
cei mai slabi la geometrie. Frecvenţele scorurilor obţinute la test de cei 45 de elevi sunt notate
în tabelul 13.4.

164 |
Tabelul 13.4. Frecvenţele scorurilor la testul de geometrie
în două grupe contrastante de elevi

Grupa Scorul la test


0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
„slabă” 1 1 2 4 9 3 2 1 1 1 0 0 0 0 0
„bună” 0 0 0 0 0 1 1 1 1 2 3 4 4 2 1

Elevii din grupa „slabă” au obţinut scoruri cuprinse între 0 şi 9, iar cei din grupa „bună”,
între 5 şi 14. Pragul de secţionare ar trebui fixat între 5 şi 10. Pentru fiecare valoare din
intervalul [5, 10] se determină frecvenţa celor din grupa „slabă” care au obţinut un scor mai
mic şi frecvenţa celor din grupa „bună” care au realizat un scor cel puţin egal cu valoarea
respectivă (tabelul13.5).

Tabelul 13.5. Frecvenţele scorurilor în grupa „slabă” şi în grupa „bună”


pentru diverse valori ale pragului de secţionare

Valori ale Frecvenţa persoanelor Frecvenţa persoanelor


pragului din grupa „slabă” care din grupa „bună” care
de au obţinut un scor mai au obţinut un scor cel
secţionare mic decât scorul de puţin egal cu scorul de
secţionare secţionare
(N=25) (N=20)
Frecvenţa Frecvenţa Frecvenţa Frecvenţa
absolută relativă absolută relativă
5 17 0,68 20 1,00
6 20 0,80 19 0,95
7 22 0,88 18 0,90
8 23 0,92 17 0,85
9 24 0,96 16 0,80
10 25 1,00 14 0,70

Se caută o valoare de prag de secţionare pentru care frecvenţa relativă a persoanelor din
grupa „slabă” care au obţinut un scor mai mic decât pragul de secţionare şi frecvenţa relativă
a persoanelor din grupa „bună” care au obţinut un scor cel puţin egal cu pragul de secţionare
să fie, ambele, mari (de exemplu, cel puţin egale cu 0,85). Această condiţie este îndeplinită de
valorile 7 şi 8. Suma celor două frecvenţe relative este egală cu 1,78 pentru valoarea 7 şi cu
1,77 pentru valoarea 8. Suma fiind mai mare pentru valoarea 7, se va alege această valoare ca
prag de secţionare.

Se recurge la fixarea unui prag (sor) de secţionare nu numai în cazul selecţiei şcolare sau
al selecţiei profesionale, pentru a elimina o parte dintre candidaţi, ci şi la alte examinări,
pentru a le oferi un feedback subiecţilor, care, de multe ori, sunt mai puţin interesaţi de locul
pe care îl ocupă în clasamentul întocmit pe baza rezultatelor testării, decât de faptul că „au
trecut” sau au „căzut” la test (Truxillo, Donahue, Sulzer, 1996).
Scorul critic serveşte la diferenţierea persoanelor care au succes de cele care au
insucces într-un anumit domeniu. De obicei, pentru stabilirea acestui scor se determină

165 |
ecuaţia de regresie a valorilor unui criteriu care măsoară succesul faţă de scorurile testului. Se
fixează o valoare a criteriului, aşa încât valorile cel puţin egale cu aceasta să caracterizeze
persoanele care au succes. Folosind ecuaţia de regresie se determină scorul de test care
corespunde valorii fixate a criteriului. Acesta este scorul critic.
Exemplu. Se foloseşte drept criteriu al succesului şcolar la geografie media obţinută de
elevi la sfârşitul primului semestru al clasei a VIII-a. Pentru a fixa scorul critic la un test de
cunoştinţe de geografie administrat elevilor de clasa a VIII-a, în prima lună a celui de-al
doilea semestru, ale cărui scoruri posibile sunt numere întregi cuprinse între 0 şi 39, se
determină ecuaţia de regresie a mediei la geografie faţă de scorurile testului. Să presupunem
că aceasta este:
y = x −3
3
unde:
y=media la geografie la sfârşitul primului semestru;
x=scorul la testul de cunoştinţe de geografie.
Dacă se consideră că „au succes” la geografie elevii care au media cel puţin egală cu 7,
atunci se calculează valoarea x care corespunde valorii y=7. Aceasta este x=30. Scorul critic
va fi 30. Pentru elevii care obţin la test o cotă cel puţin egală cu 30 se face predicţia că vor
avea „succes la geografie”.

13.1.3. Interpretarea scorurilor la testele de cunoştinţe informative

Atunci când un profesor construieşte un test de cunoştinţe pe care îl foloseşte la o


anumită clasă, el poate proceda în două moduri pentru a interpreta scorul unui elev:
• calculează procentul de itemi rezolvaţi corect de elev din totalul de itemi ai testului;
• compară cota brută a elevului cu scorurile celorlalţi elevi din clasă.
Prima metodă este utilă doar în cazul testelor de cunoştinţe cu criterii absolute, când
procentul itemilor rezolvaţi corect arată cât de aproape se află fiecare elev de performanţa
minimă necesară.
Exemplu. Dacă se consideră că pentru promovarea clasei I elevii trebuie să fie capabili
să rezolve corect cel puţin 40 de exerciţii dintr-un test de aritmetică format din 50 de exerciţii
asemănătoare între ele ca dificultate, atunci performanţa minimă necesară este de
40 × 100% = 80% , iar un elev care a rezolvat corect doar 20 de exerciţii, adică
50
20 × 100% = 40% se află cu mult sub nivelul necesar promovării.
50

Dar utilizarea de criterii absolute pentru a se lua decizii importante asupra persoanelor
examinate cu un test (de exemplu, promovarea clasei) impune o verificare foarte atentă a
testului sub aspectul validităţii şi al fidelităţii, ceea ce nu se prea întâmplă în cazul testelor de
cunoştinţe informative.

166 |
Cota brută a unui elev la un test de cunoştinţe elaborat de profesorul clasei din care face
parte aduce informaţii importante asupra elevului respectiv dacă este comparată cu rezultatele
altor persoane din aceeaşi clasă. Interpretând scorul unui elev prin raportare la poziţia sa în
cadrul clasei, se elimină erorile cauzate de neadecvarea testului la nivelul cunoştinţelor
elevilor examinaţi. Astfel, de exemplu, în cazul unui test foarte dificil, este posibil ca scorul
cel mai mare obţinut la test într-o clasă să se afle sub ceea ce profesorul consideră că ar fi
„nivelul minim necesar de performanţă”.

13.1.4. Interpretarea scorurilor la testele de cunoştinţe utilizate în evaluarea


criterială

Pentru interpretarea scorurilor la aceste teste se foloseşte un criteriu de performanţă


fixat înainte de administrarea lor şi care este independent de rezultatele pe care le obţin la test
diverse grupe de persoane.
Stabilirea criteriului se face de către specialiştii care au elaborat testul, ţinând cont de
comportamentele aşteptate din partea persoanelor examinate şi de nivelul la care este necesar
să se situeze rezultatele, pentru un individ sau pentru un grup de persoane. Criteriile pot fi de
următoarea formă: „Elevul trebuie să identifice subiectul în cel puţin 75% dintre propoziţiile
cuprinse în test.” sau „Cel puţin 85% dintre elevii clasei trebuie să identifice corect subiectul
în cel puţin 75% dintre propoziţiile care compun testul.”
Utilizarea testelor în evaluarea criterială are ca principal scop ierarhizarea elevilor pe
niveluri de stăpânire a cunoştinţelor, pentru obiectivul educaţional verificat de test
(Swaminathan, Hambledon, Algina, 1974). Pe baza rezultatelor obţinute la test se decide dacă
elevul poate trece la programul de instruire următor ori rămâne la programul actual.
Specialiştii stabilesc nivelurile de stăpânire a cunoştinţelor şi cotele la test
corespunzătoare fiecărui nivel.
Exemplu. Pentru un test de cunoştinţe de aritmetică alcătuit din 50 de exerciţii de
dificultate asemănătoare, cotate cu 0 (pentru răspuns greşit sau omis) şi 1 (pentru răspuns
corect), al cărui scor total se obţine însumând cotele itemilor, pot fi stabilite următoarele trei
niveluri:
„slab”, căruia îi corespund scorurile cuprinse între 0 şi 10;
„mediocru”, căruia îi corespund scorurile cuprinse între 11 şi 35;
„bun”, căruia îi corespund scorurile cuprinse între 36 şi 50.

Atunci când sunt fixate numai două niveluri (de exemplu „slab” şi „bun” sau
„insuficient” şi „suficient”), cea mai mică valoare de scor corespunzătoare nivelului superior
se numeşte nivel acceptabil de performanţă (Guilbert, 1987).

167 |
13.1.5. Interpretarea scorurilor la testele de cunoştinţe utilizate în evaluarea
normativă

Aceste teste utilizează drept criteriu de apreciere a scorurilor normele (etaloanele)


testului, furnizate de rezultatele obţinute la test de un grup de indivizi.
Normele unui test reprezintă valori ale unei anumite caracteristici a repartiţiei scorurilor
testului într-un eşantion extras din populaţia căreia îi este destinat testul.
Normele facilitează interpretarea scorurilor individuale, făcând posibilă compararea lor
cu rezultatele obţinute de alte persoane.
Pentru a fi cu adevărat utile, normele trebuie să fie descrise detaliat în manualul testului
şi să indice:
• populaţia pentru care sunt potrivite normele;
• modul în care a fost extras din această populaţie eşantionul pe baza căruia au fost
determinate normele;
• volumul şi caracteristicile acestui eşantion: sex, vârstă, rasă, statut socio-economic,
localizare geografică, nivel de şcolarizare, durata instruirii (de cât timp studiază
persoanele din eşantion domeniul testat şi câte ore pe săptămână), calitatea instruirii
(nivelul de pregătire al profesorilor care predau disciplina verificată prin test),
conţinutul instruirii (manualele folosite), caracteristicile studiilor precedente ale
persoanelor din eşantion (dacă au studiat materii înrudite cu domeniul testat),
aptitudinile persoanelor din eşantion;
• gradul în care eşantionul folosit pentru determinarea normelor este reprezentativ pentru
populaţia pentru care vor fi folosite normele;
• natura şi uniformitatea condiţiilor în care a fost administrat testul;
• data testării.
Normele testului se determină în cadrul operaţiei de etalonare a testului.
Cu ajutorul normelor se determină modul în care se transformă cotele brute ale testului
în cote uşor de interpretat, numite cote transformate. Acestea fac posibilă compararea
scorurilor între persoane diferite sau, pentru aceeaşi persoană, între teste diferite ori între
momente diferite de administrare a aceluiaşi test.
Tabelele de norme incluse în manualul unui test cuprind în paralel cotele brute şi cotele
transformate corespunzătoare, pentru una sau mai multe populaţii. Ele oferă informaţii numai
despre rezultatele „obişnuite” sau „tipice” pentru populaţiile respective şi nu despre
rezultatele „ideale”, care ar trebui egalate.
Când se interpretează rezultatul la un test al unei persoane, este necesar să se aibă în
vedere faptul că acesta nu reprezintă scorul real al persoanei, ci este doar una dintre valorile
de scor pe care ea le-ar fi putut obţine şi că mărimea sa este influenţată de condiţiile în care a
fost administrat testul.
Din acest motiv, atunci când se doreşte să se compare scorurile la test obţinute de două
persoane sau de aceeaşi persoană în momente diferite, se vor determina intervalele de
încredere ale scorurilor reale, corespunzătoare aceleiaşi probabilităţi. Dacă cele două intervale

168 |
sunt disjuncte (nu se intersectează), se poate afirma că cele două persoane au niveluri de
cunoştinţe diferite sau că nivelul de cunoştinţe al persoanei s-a modificat între cele două
administrări ale testului. Dacă, însă, intervalele au o porţiune comună, este posibil ca scorurile
reale să se găsească în acea porţiune, iar între ele să existe oricare dintre relaţiile <, = şi >, aşa
încât nu se poate trage nicio concluzie.
În manualul testului, conform recomandărilor făcute de Standards for Educational &
Psychological Tests (1985), trebuie să figureze, pentru fiecare eşantion de persoane utilizat la
etalonarea testului, eroarea standard de măsură, σE, pentru a se putea calcula intervalele de
încredere ale scorurilor reale.
Exemplu. La un test de cunoştinţe, o persoană, A, a obţinut 16 puncte, iar o altă persoană,
B, a obţinut 19 puncte. Aparent, B este mai bună decât A în domeniul verificat de test. Înainte
de a trage vreo concluzie cu privire la nivelul cunoştinţelor celor două persoane, se calculează
intervalele de încredere ale scorurilor reale, corespunzătoare probabilităţii P=0,95. Se
utilizează formula:
(x-1,96σE, x+1,96σE)
unde x este scorul obţinut la test, iar σE este eroarea standard de măsură.
În manualul testului figurează valoarea σE=1,5.
Intervalul de încredere pentru persoana A este (13,06, 18,94).
Intervalul de încredere pentru persoana B este (16,06, 21,94).
Cele două intervale de încredere au o porţiune comună: (16,06, 18,94). Este posibil ca
scorurile reale ale celor două persoane să se găsească în acest interval, între ele fiind oricare
dintre relaţiile <, = sau >. Prin urmare, nu se poate afirma că persoana B are mai multe
cunoştinţe (dintre cele verificate de test) decât persoana A.

Uneori, manualele testelor conţin chiar intervalele de încredere ale scorurilor reale
pentru fiecare valoare posibilă a scorului testului.

13.2. Interpretarea scorurilor unei colectivităţi

Pentru aprecierea rezultatelor la test ale unei colectivităţi (grup de elevi, clasă etc.) se
calculează indicatorii statistici (de obicei, media şi abaterea standard) şi se reprezintă grafic
frecvenţele scorurilor, sub forma unei diagrame.
Media scorurilor testului, prin comparaţie cu media eşantionului extras din populaţia
căreia îi aparţine colectivitatea, înregistrată în manualul testului, aduce informaţii despre
nivelul general al cunoştinţelor colectivităţii testate
Abaterea standard serveşte la aprecierea omogenităţii colectivităţii testate. O valoare
mică a abaterii standard este caracteristică unui lot de subiecţi foarte asemănători între ei ca
pregătire în privinţa cunoştinţelor verificate de test. Într-o asemenea situaţie, media scorurilor
caracterizează foarte bine nivelul de cunoştinţe al colectivităţii. Valorile mari ale abaterii
standard indică faptul că persoanele din colectivitatea testată diferă mult între ele. În acest

169 |
caz, media scorurilor testului este mai puţin ilustrativă, întrucât scorurile obţinute sunt
împrăştiate într-un interval destul de mare în jurul valorii medii.
Prin diagrama scorurilor se pune în evidenţă modul în care sunt repartizate scorurile
obţinute în cadrul intervalului scorurilor posibile. Forma diagramei este influenţată atât de
caracteristicile colectivităţii testate (de repartiţia persoanelor din cadrul colectivităţii testate pe
niveluri de cunoştinţe), cât şi de caracteristicile testului (de exemplu, de dificultatea itemilor
componenţi).
Dacă se constată din diagramă că repartiţia de frecvenţe a scorurilor este plurimodală
(frecvenţa maximă sau frecvenţe foarte apropiate de cea maximă se înregistrează pentru cel
puţin două valori de scor neconsecutive) (v. figura 13.1), se poate presupune că în cadrul
colectivităţii testate există două sau mai multe subloturi, destul de omogene ca pregătire, dar
care diferă între ele în ceea ce priveşte nivelul de pregătire. O altă explicaţie ar putea-o
constitui existenţa unor deosebiri în condiţiile de administrare a testului (de exemplu, unii
dintre subiecţi au răspuns la test după programul de şcoală, fiind obosiţi, iar alţii, la începutul
programului de şcoală).

12
Frecventa

10

0
0 2 4 6 8 10 12 14 16 18 20

Scor

Fig. 13.1. O repartiţie de frecvenţe plurimodală (bimodală)

O repartiţie de frecvenţe unimodală asimetrică poate însemna faptul că testul a fost prea
greu pentru colectivitatea testată (dacă majoritatea subiecţilor au scoruri mici) (figura 13.2)
sau prea uşor (dacă majoritatea subiecţilor au realizat scoruri mari) (figura 13.3).

170 |
12

Frecventa
10

0
0 2 4 6 8 10 12 14 16 18 20

Scor

Fig. 13.2. O repartiţie de frecvenţe asimetrică în care sunt mai frecvente scorurile mici

20
Frecventa

10

0
0 2 4 6 8 10 12 14 16 18 20

Scor

Fig. 13.3. O repartiţie de frecvenţe asimetrică în care sunt mai frecvente scorurile mari

Pentru interpretarea scorurilor colectivităţii, în cazul repartiţiilor asimetrice, trebuie luate


în considerare atât scorurile obţinute în colectivitate, cât şi scorurile posibile ale testului şi
media scorurilor în eşantionul utilizat la etalonare, deoarece se poate întâmplă ca persoanele
dintr-o colectivitate să obţină cele mai mari scoruri posibile la test, dar în cadrul intervalului
scorurilor obţinute să predomine scorurile mai mici. O astfel de situaţie este, de exemplu, cea
în care un test de aritmetică pentru clasa a III-a este administrat la o clasă a IV-a, în care elevii
nu sunt foarte buni la aritmetică. Majoritatea rezolvă exerciţiile simple şi cele de nivel mediu,
dar numai câteva persoane reuşesc să răspundă corect şi la exerciţiile dificile.
O distribuţie de frecvenţe aproximativ simetrică în jurul mediei obţinute de eşantionul
utilizat la etalonare (figura 13.4) arată că testul a fost potrivit ca dificultate colectivităţii
testate. Pentru a aprecia omogenitatea colectivităţii se va urmări mărimea abaterii standard a
scorurilor în colectivitate.

171 |
16

Frecventa
14

12

10

0
0 2 4 6 8 10 12 14 16 18 20

Scor

Fig. 13.4. O repartiţie de frecvenţe aproximativ simetrică

Atunci când colectivitatea testată este formată din persoane care au învăţat aceeaşi
materie, după acelaşi manual, dacă testul nu este nici prea greu, nici prea uşor şi a fost
administrat în condiţii identice tuturor subiecţilor, este de aşteptat ca scorurile obţinute în
colectivitate să se repartizeze aproximativ după curba normală (figura 12.5). În asemenea
situaţii, notând cu m şi σ media şi, respectiv, abaterea standard a scorurilor în colectivitate,
scorurile colectivităţii au următoarele proprietăţi:
• sunt repartizate simetric în jurul mediei;
• aproximativ 68% dintre ele se găsesc în intervalul [m-σ, m+σ];
• aproximativ 95% dintre ele se găsesc în intervalul [m-2σ, m+2σ];
• aproximativ 99% dintre ele se găsesc în intervalul [m-3σ, m+3σ].

30
Frecventa

20

10

0
0 2 4 6 8 10 12 14 16 18 20

Scor

Fig. 13.5. O repartiţie de frecvenţe aproximativ normală

172 |
14. TEHNOREDACTAREA UNUI TEST DE CUNOŞTINŢE

Autorul testului are sarcina de a utiliza cele mai potrivite elemente grafice (sublinieri,
caractere mai mari, culori contrastante) pentru a atrage atenţia asupra anumitor părţi din
instrucţiunile de administrare, aşa încât cei care le vor citi celor examinaţi să ştie cum să îşi
modifice intonaţia.
Pentru elevii din clasele primare, notarea răspunsurilor se va face chiar pe foile testului.
Pentru elevii mai mari, se vor folosi foi de răspuns.
Utilizarea foilor de răspuns prezintă două avantaje: economiseşte hârtia, permiţând
folosirea foilor care conţin întrebările testului la examinarea mai multor subiecţi, şi reduce
timpul de cotare a itemilor şi a testului, întrucât nu mai este necesară răsfoirea mai multor foi
(de obicei, întrebările unui test de cunoştinţe ocupă mai multe foi).
Există câteva condiţii care trebuie să fie respectate la tehnoredactarea unui test de
cunoştinţe (după Kubiszyn, Borich, 1996):
• Să se utilizeze hârtie de bună calitate.
• Să se asigure un contrast bun între caractere şi hârtie.
• Este preferabil să se scrie cu negru pe alb, întrucât hârtia colorată îl poate obosi pe
cel examinat, mai ales dacă testul este lung.
• Să se scrie cu caractere suficient de mari.
• Să se evite scrierea cu caractere italice, care sunt greu de citit.
• La începutul testului sau al foii de răspuns să se prevadă spaţiu pentru completarea
datelor de identificare a subiectului (nume şi prenume, data naşterii, eventual şcoala
şi clasa sau profesia şi locul de muncă) şi a datei examinării.
• Întrebările să fie poziţionate în pagină astfel încât să poată fi uşor de citit dar, în
acelaşi timp, hârtia să fie utilizată cât mai economic.
• În funcţie de locul unde vor fi marcate răspunsurile (pe foile testului sau pe foaia de
răspuns), se vor fixa poziţiile în care se vor nota răspunsurile, urmărindu-se să se
poată face uşor corectarea, eventual cu ajutorul unui şablon sau al calculatorului.
• La întrebările cu răspunsuri închise, răspunsurile propuse pot fi plasate unul după
celălalt, pe aceeaşi linie (dacă sunt scurte) sau unul sub celălalt, pe aceeaşi parte a
paginii.
• Fiecare răspuns propus va fi precedat de codul său ori de o căsuţă în care se va nota
un X atunci când se alege răspunsul respectiv. Codul este format fie dintr-o literă
(dacă întrebările sunt numerotate), fie dintr-o cifră (dacă întrebările sunt marcate prin
litere ori alte semne grafice diferite de cifre).
• Să se lase cel puţin două rânduri de spaţii între textul întrebării şi răspunsurile
propuse, precum şi între întrebări. Răspunsurile propuse să fie spaţiate la 1,5 rânduri.
• Textul unei întrebări (inclusiv răspunsurile propuse) să fie scris pe aceeaşi pagină şi,
în plus, dacă întrebarea se află în partea de jos a paginii, după ea să rămână un spaţiu

173 |
de cel puţin 2,5 cm (pentru ca la copierea testului să nu existe riscul de a se pierde
linii de text).
• Desenele şi tabelele să fie plasate imediat după textul întrebării la care se referă.
Dacă acelaşi material ilustrativ serveşte mai multor întrebări consecutive, el va fi
plasat deasupra acestora.
• Pentru a atrage atenţia asupra unor aspecte, să se folosească sublinieri, scrierea cu
majuscule sau îngroşări, dar să se ţină seama de faptul că o încărcare excesivă cu
semne grafice (săgeţi, chenare etc.) sau culori poate să distragă atenţia celui
examinat şi să genereze erori la răspuns.
Înainte de multiplicarea testului se va verifica dacă nu există erori de editare sau de
ortografie.

174 |
15. GHID PRACTIC. CONSTRUIREA ŞI UTILIZAREA
TESTELOR DE CUNOŞTINŢE ÎN CAS++

15.1. Funcţiile modulului de evaluare a cunoştinţelor din CAS++

Modulul de evaluare a cunoştinţelor Gestiune teste de cunoştinţe permite construirea şi


actualizarea (modificarea) testelor de cunoştinţe, fie pentru a fi administrate sub forma creion-
hârtie, fie pentru a fi administrate cu ajutorul calculatorului, în cadrul platformei CAS++, la fel
ca testele psihologice puse la dispoziţia utilizatorilor de platforma CAS++.
În primul caz, testul de cunoştinţe construit este transformat într-un fişier de tip .doc.
Acesta va fi tehnoredactat de persoana care doreşte să-l utilizeze, conform regulilor de
tehnoredactare a testelor de cunoştinţe, după care va fi listat, multiplicat şi administrat,
individual sau colectiv. Există două posibilităţi de corectare a răspunsurilor:
• Se corectează manual, utilizându-se grila de cotare a testului, care se poate obţine, la
cerere, sub forma unui fişier de tip .doc. Scorul realizat de subiect se introduce apoi în
calculator, pentru a fi luat în considerare la redactarea Raportului de evaluare
psihologică şi la ierarhizarea persoanelor care au fost examinate cu testul respectiv.
• Se corectează automat, caz în care se introduc în calculator răspunsurile la itemi ale
fiecărui subiect ca şi când acestuia i s-ar administra testul cu ajutorul calculatorului.
În cazul administrării automate a testului, pe ecran se afişează, pe rând: informaţii despre
test, instrucţiunile de administrare a testului, exemple de itemi şi itemii testului. Subiectul
răspunde la fiecare item în parte. Se calculează automat scorul testului şi procentul punctelor
realizate de subiect din totalul punctelor posibile.
Raportul de evaluare psihologică al unei persoane căreia i s-a administrat un test de
cunoştinţe sub forma computerizată conţine toate răspunsurile date de aceasta, împreună cu
punctajele corespunzătoare, scorul total obţinut la test şi procentul reprezentat de scorul
realizat din cel mai mare scor posibil.
Dacă un test de cunoştinţe este administrat mai multor persoane – sub forma creion-
hârtie sau computerizat - şi sunt înregistrate scorurile acestora în baza de date, se poate obţine
un clasament al celor examinaţi, realizat pe baza scorurilor lor.

15.2. Teste de cunoştinţe în CAS++

Un test de cunoştinţe este un fişier care poate fi creat, actualizat (modificat) şi utilizat
numai prin intermediul modulului Gestiune teste de cunoştinţe al platformei CAS++. El este
identificat prin numele său, stabilit în momentul creării sale, dar care poate fi modificat
ulterior.
Un test de cunoştinţe conţine următoarele informaţii:
• o descriere a testului

175 |
• timpul de răspuns la test;
• modul de cotare a răspunsurilor la itemii testului;
• instrucţiunile de administrare a testului;
• exemple de itemi;

itemii testului.
Descrierea testului este o prezentare scurtă a testului, care va afişată pe primul ecran în
cazul administrării testului cu ajutorul calculatorului şi va fi plasată la început, dacă se cere
listarea testului în vederea administrării sale sub forma creion-hârtie. Se recomandă ca aceasta
să se refere la scopul şi contextul în care se va utiliza testul, la autorii testului şi, eventual, la
bibliografia folosită la construirea itemilor.
Exemplu. Test de geografie pentru clasa a VIII-a, pentru verificarea cunoştinţelor despre
relieful României, la sfârşitul semestrului I al anului şcolar 2009-2010,
Autorul testului: Maria Bojan.
Bibliografie: Gherasim, I. (2007). Manual de geografie pentru clasa a VIII, Cluj-Napoca:
Editura Napoca.

Timpul de răspuns la test este exprimat în minute. În cazul în care testul este administrat
sub forma creion-hârtie, are doar o valoare informativă pentru cel care îl foloseşte. Dacă testul
este administrat de calculator, atunci el reprezintă lungimea intervalului de timp din momentul
apariţiei pe ecran a primului item din test şi până la oprirea automată a testării.
Modul de cotare a răspunsurilor este valabil pentru toţi itemii testului şi are două
variante:
• punctaje parţiale, atunci când se acordă puncte pentru fiecare răspuns corect ales de
subiect şi nu se penalizează răspunsurile greşite indicate de acesta, iar itemii la care
nu s-a răspuns sunt cotaţi cu zero puncte;
• totul sau nimic, atunci când se acordă puncte unui item numai dacă au fost alese de
către subiect toate răspunsurile corecte şi numai acestea. Itemii la care s-a răspuns
parţial corect (nu au fost indicate toate răspunsurile corecte şi/sau a fost ales cel puţin
un răspuns greşit) primesc zero puncte, la fel ca itemii la care nu s-a răspuns.
Indiferent de modul în care se cotează itemii, scorul testului se obţine adunând cotele
itemilor.
Instrucţiunile de administrare a testului sunt informaţiile care se furnizează subiectului
înainte de a începe să răspundă la itemi.
În cazul administrării testului sub forma creion-hârtie, ele vor fi listate şi vor preceda
exemplele. Atunci când testul este administrat cu ajutorul calculatorului ele vor fi afişate pe
ecran înaintea itemilor-exemplu.
Aceste instrucţiuni trebuie să descrie clar şi detaliat acţiunile care se efectuează pentru a
răspunde la itemi şi modul în care trebuie procedat pentru a corecta un răspuns. De asemenea,
vor menţiona că se poate reveni la un item pentru a completa sau a modifica răspunsul. Pentru

176 |
testele administrate de calculator se va preciza, în plus, cum se poate opri testarea şi faptul că
această operaţie este posibilă nu doar la sfârşit, ci şi pe parcursul administrării testului.
Exemplu. Testul conţine două tipuri de întrebări. La unele se răspunde cu Adevărat sau
Fals. La altele sunt propuse mai multe răspunsuri şi trebuie să alegeţi dintre acestea răspunsul
corect (sau răspunsurile corecte).
Răspunsurile posibile la fiecare întrebare sunt afişate în partea de jos a ecranului.
Pentru a răspunde la o întrebare poziţionaţi cursorul deasupra fiecărui răspuns ales şi
faceţi click cu butonul din stânga al mouse-ului.
Dacă doriţi să anulaţi un răspuns pe care l-aţi ales, poziţionaţi cursorul deasupra lui şi
faceţi click cu butonul din stânga al mouse-ului.
Pentru a trece de la o întrebare la alta folosiţi butoanele Continuaţi (trecere la întrebarea
următoare) şi Precedent (revenire la întrebarea anterioară) din partea de jos a ecranului.
Puteţi să nu răspundeţi la una sau la mai multe întrebări.
Puteţi reveni la orice întrebare pentru a completa sau a schimba răspunsul.
Când aţi terminat sau dacă doriţi să renunţaţi la continuarea testării folosiţi butonul
Renunţare.
Oricând doriţi puteţi să revedeţi instrucţiunile de lucru. Pentru aceasta utilizaţi butonul
Instrucţiuni.

Exemplele de itemi sunt itemi asemănători celor incluşi în test, dar uşori. Ei au rolul de
a-l învăţa pe cel căruia i se administrează testul să completeze răspunsurile.
Este obligatoriu ca pentru fiecare tip de itemi conţinuţi în test să existe cel puţin un item-
exemplu.
Atunci când testul este administrat sub forma creion-hârtie aceşti itemi sunt listaţi având
semnul X completat în dreptul răspunsurilor corecte.
Itemii testului pot fi de trei tipuri:
• itemi de tip adevărat/fals (itemi dihotomici), care admit doar răspunsurile „adevărat”
şi „fals”;
• itemi cu răspunsuri multiple (itemi cu răspunsuri la alegere), care admit cel puţin două
şi cel mult şase răspunsuri propuse, dintre care cel puţin unul trebuie să fie greşit;
• itemi de tip asociere, care conţin două liste, prima având cel puţin două şi cel mult
şase elemente, iar a doua având cel puţin două şi cel mult opt elemente.
Testele de cunoştinţe din modulul de evaluare a cunoştinţelor din CAS++ au două
variante: draft şi final.
Numai testele finale pot fi administrate cu ajutorul calculatorului şi pot fi listate pentru a
fi administrate sub forma creion-hârtie.
Din momentul în care începe construirea sa şi până când persoana care îl creează
consideră că a ajuns la versiunea finală, testul este are varianta draft. Transformarea unui test
de cunoştinţe din varianta draft în variabta final se face folosind meniul de tip drop-down
Variantă test din fereastra corespunzătoare tab-ului Configurare.

177 |
Nu este admisă transformarea din draft în final dacă este îndeplinită cel puţin una dintre
următoarele condiţii:
• nu s-a completat numele testului;
• nu s-a completat descrierea testului;
• nu s-au completat instrucţiunile de administrare a testului;
• nu există cel puţin un item-exemplu pentru fiecare dintre tipurile itemilor conţinuţi în
test;
• nu au fost introduşi cel puţin doi itemi de test.
Atunci când într-un test de cunoştinţe final se face o modificare, testul îşi schimbă
automat varianta, devenind draft.

15.3. Crearea unui test de cunoştinţe

Această operaţie se poate face în una sau mai multe sesiuni, nefiind obligatoriu ca itemii
testului de cunoştinţe să fie completaţi de la început.
Pentru crearea testului se foloseşte butonul Creare test aflat în partea dreaptă a ferestrei
în care sunt afişate testele de cunoştinţe existente. Imediat se va deschide o fereastră
corespunzătoare tab-ului Configurare. Aici se va completa numele testului, în câmpul
Denumire test, şi descrierea acestuia, în câmpul Descriere test.
Se poate schimba timpul de răspuns la itemii testului, în câmpul Durata test, dacă acesta
este diferit de 30 de minute, şi, dacă este cazul, se va schimba modul de cotare a răspunsurilor
la itemi, din punctaje parţiale în totul sau nimic, folosind meniul de tip drop-down Tip cotare
răspunsuri.
Testul are varianta draft până când se va cere explicit transformarea acesteia în varianta
finală, utilizându-se meniul de tip drop-down Variantă test.
Obligatoriu, pentru a putea crea testul de cunoştinţe, se vor completa instrucţiunile de
administrare a testului. În acest scop, se va acţiona asupra tab-ului Instrucţiuni şi se va scrie
un text în fereastra care se va deschide.
Itemii-exemplu şi itemii testului se pot introduce în test în această sesiune sau într-o
sesiune ulterioară, când fişierul care conţine testul de cunoştinţe va fi deschis folosind butonul
Editare test. Introducerea itemilor, atât a celor care servesc ca exemplu, cât şi a celor din test,
se poate face în orice ordine, pentru că ordinea lor în cadrul testului poate fi schimbată.
Dacă se consideră că testul este pregătit pentru a fi administrat se transformă din varianta
draft în varianta finală, folosind meniul de tip drop-down Variantă test din fereastra
corespunzătoare tab-ului Configurare.
Pentru a încheia crearea testului se foloseşte butonul Ieşire cu salvare.
În cazul în care se doreşte să se renunţe la toate informaţiile introduse şi să nu se creeze
testul de cunoştinţe, se utilizează butonul Ieşire fără salvare.

178 |
15.4. Operaţii asupra itemilor unui test de cunoştinţe

Orice acţiune asupra unui item, indiferent dacă acesta este de tip exemplu sau item de
test, se poate realiza numai după acţionarea tab-ului Itemi. Acesta este accesibil după ce s-a
apăsat butonul Creare test sau butonul Editare test.
Se va deschide o fereastră care va conţine toţi itemii existenţi în test, mai întâi cei de tip
exemplu, apoi cei de tip test. Ordinea de afişare este cea în care aceştia au fost introduşi în test
sau, dacă ei au fost ordonaţi, cea obţinută în urma ultimei ordonări. Pentru fiecare item
existent în test sunt prezentate următoarele informaţii:
• codul itemului, format dintr-o literă (E pentru itemii-exemplu şi T pentru itemii de
testare) şi un număr care reprezintă numărul de ordine al itemului în test;
• primele cuvinte din textul trunchiului itemului;
• tipul itemului (R1=item cu răspunsuri multiple, R2=item cu răspunsuri adevărat/fals,
R3=item cu răspunsuri tip asociere).
Pentru a acţiona asupra unui item existent, se marchează acesta (poziţionând cursorul
oriunde pe linia itemului şi făcând un click cu butonul din stânga al mouse-ului) şi apoi se
foloseşte butonul corespunzător operaţiei dorite, din dreapta ferestrei în care sunt afişaţi
itemii: Editare item (pentru a face modificări în item), Ştergere item (pentru a elimina itemul
din test), Copiere item (pentru a adăuga în test un item identic cu cel marcat), Mutare sus sau
Mutare jos (pentru a schimba ordinea itemilor, deplasând itemul marcat în sus sau în jos cu
câte o poziţie).
Dacă se consideră că rezultatul acţiunii efectuate asupra itemului este cel dorit, se
foloseşte butonul Ieşire cu salvare. În caz contrar, se utilizează butonul Ieşire fără salvare.

Construirea unui item


Pentru a introduce în test un item se acţionează butonul Creare item. În fereastra care se
deschide se va completa tipul itemului (exemplu sau testare) şi tipul răspunsurilor sale
(răspunsuri multiple, tip adevărat/fals sau răspunsuri tip asociere). Dacă se apasă butonul
Continuare, se va deschide o fereastră în care se va introduce textul itemului. Conţinutul
acestei ferestre şi acţiunile care vor fi efectuate sunt dependente de ceea ce s-a selectat la
rubrica tip răspunsuri.
Pentru itemii de tip adevărat/fals:
• Se va introduce textul itemului în câmpul Întrebare.
• În dreptul răspunsului corect se va marca Răspuns corect şi se va completa punctajul
corespunzător răspunsului.
Pentru itemii cu răspunsuri multiple:
• Se va introduce textul din trunchiul itemului, în câmpul Întrebare.
• Se vor completa cele k răspunsuri propuse, în câmpurile Răspuns 1, Răspuns 2,…,
Răspuns k (numărul de răspunsuri propuse, k, este cuprins între 2 şi 6), fără a lăsa
câmpuri necompletate între două răspunsuri consecutive.

179 |

În dreptul fiecărui răspuns corect se va marca Răspuns corect şi se va completa
punctajul corespunzător răspunsului.
Pentru itemii de tip asociere:
• Se va introduce textul din trunchiul itemului, în câmpul Întrebare.
• Se vor introduce elementele celor două liste (prima listă în fereastra Coloana A, iar a
doua listă în fereastra Coloana B), acţionând pentru fiecare element butonul + din
dreapta ferestrei în care se face introducerea textului şi apoi scriind textul.
• Dacă este necesar, se elimină unul sau mai multe elemente din oricare listă.
Ştergerea unui element se efectuează marcând elementul şi apoi apăsând butonul –
aflat în dreapta listei.
• Dacă se doreşte, se ordonează elementele listelor. Schimbarea locului unui element
în cadrul unei liste se realizează marcând elementul şi apoi apăsând butonul ↑ sau ↓
pentru a-l deplasa în cadrul listei în sus sau în jos.
• Pentru fiecare element din prima listă, aflat pe o poziţie k (k=1,2,…,n; n fiind
numărul de elemente din prima listă), se deschide meniul de tip drop-down de pe
linia Asociere k (aflat în dreptul elementului respectiv) şi se bifează elementele celei
de a doua liste care se asociază cu el formând perechi corecte.
• Pentru fiecare element din prima listă, aflat pe o poziţie k (k=1,2,…,n; n fiind
număarul de elemente din prima listă), pe linia Asociere k se notează punctajul care
se acordă atunci când sunt indicate toate perechile corecte formate cu respectivul
element.
Operaţia de construire a unui item se încheie prin apăsarea butonului Salvare, dacă se
doreşte includerea itemului în test, sau a butonului Renunţare, dacă nu se va include itemul în
test.

Modificarea unui item


Pentru a face orice schimbare într-un item din test se marchează itemul respectiv şi apoi
se acţionează butonul Editare item. Se va deschide o fereastră specifică tipului itemului, mai
precis, tipului de răspunsuri ale itemului.
Pentru toate tipurile de itemi se poate schimba textul din trunchiul itemului, poziţionând
cursorul în locul potrivit şi adăugând sau ştergând caractere, şi se pot schimba punctajele
acordate răspunsurilor corecte.
Pentru itemii cu răspunsuri multiple se pot face modificări în textul răspunsurilor
propuse, procedând la fel ca pentru schimbarea textului din trunchiul itemului. Este posibilă şi
schimbarea răspunsurilor corecte. Dacă un răspuns care era considerat greşit va fi marcat
acum ca răspuns corect, va fi obligatoriu să se indice punctajul care se va acorda atunci când
va fi ales.
În cazul itemilor de tip asociere elementele celor două liste nu pot fi modificate decât
prin ştergere şi reintroducere. Pentru ştergerea unui element, acesta se marchează şi apoi se
apasă butonul -. Orice schimbare făcută în vreuna din liste impune ca pentru fiecare element

180 |
din prima listă să se bifeze din nou toate elementele din cea de a doua listă cu care formează
perechi corecte şi să se indice punctajul corespunzător răspunsurilor corecte.
Modificările efectuate asupra unui item vor fi memorate numai după ce se va apăsa
butonul Salvare.

Ştergerea unui item


Orice item poate fi şters dintr-un test. Pentru aceasta, se marchează itemul şi apoi se
apasă butonul Ştergere item. Înainte ca itemul să fie eliminat din test, se va cere confirmarea
intenţiei de ştergere a itemului.

Crearea unui item nou, pornind de la un item existent în test


Această operaţie este utilă atunci când se doreşte introducerea în test a unui item care are
multe părţi comune cu un item de acelaşi tip (item-exemplu sau item de testare) existent în
test. Ea se efectuează în doi paşi.
Mai întâi se realizează o copie a itemului din test. Se marchează itemul din test şi se
apasă butonul Copiere item. Ca rezultat, va apărea un item nou în lista de itemi, pe ultima
poziţie a itemilor care sunt de acelaşi tip cu cel marcat.
Apoi se va apăsa butonul Editare item şi se vor efectua modificări în noul item.

15.5. Actualizarea unui test de cunoştinţe

Se pot face modificări în orice test de cunoştinţe, indiferent dacă acesta este o variantă
draft sau una finală. În momentul în care într-un test de cunoştinţe s-a efectuat o schimbare,
varianta sa devine automat draft.
Pentru a modifica un test de cunoştinţe se marchează acesta în lista de teste şi se apasă
butonul Editare test. Imediat se va deschide fereastra corespunzătoare tab-ului Configurare.
Într-un test de cunoştinţe sunt permise următoarele modificări:
• schimbarea numelui testului, în câmpul Denumire test;
• schimbarea variantei testului (din draft în finală sau invers);
• schimbarea textului din câmpul Descriere test;
• schimbarea instrucţiunilor de administrare a testului, după acţionarea tab-ului
Instrucţiuni;
• schimbarea timpului de lucru;
• schimbarea modului de cotare a răspunsurilor la itemi;
• ştergerea de itemi de test sau de itemi-exemplu;
• adăugarea de itemi de test sau de itemi-exemplu;
• modificarea unor itemi de test sau a unor itemi-exemplu;
• schimbarea ordinii itemilor.
Pentru ca modificările efectuate să fie memorate este necesar ca, la sfârşit, să se apese
butonul Ieşire cu salvare. Dacă se apasă butonul Ieşire fară salvare atunci sunt anulate toate
operaţiile realizate asupra testului de când s-a acţionat butonul Editare test.

181 |
Schimbarea variantei unui test, din draft în finală sau din finală în draft este, de
asemenea, o operaţie de actualizare unui test şi este posibilă după acţionarea butonului
Editare test.

15.6. Copierea unui test de cunoştinţe

Un test de cunoştinţe poate fi administrat unei persoane, în cadrul platformei CAS++, o


singură dată. Dacă este necesară administrarea sa repetată, se va face câte o copie a testului,
de fiecare dată.
Pentru copierea unui test se marchează acesta în lista de teste şi se apasă butonul
Copiere test. În lista de teste va apărea, la sfârşit, un test al cărui nume este format din numele
celui din care provine, urmat de cuvântul (Copie). Deşi acest test este identic cu cel din care
provine, pentru că are un alt nume este considerat de platforma CAS++ ca fiind un alt test.

15.7. Crearea unui test de cunoştinţe


pornind de la un test de cunoştinţe existent

Uneori se doreşte crearea unui test de cunoştinţe care să difere doar puţin de un test
existent în cadrul platformei CAS++, construit cu ajutorul modulului Gestiune teste de
cunoştinţe.
Dacă se ştie că testul existent nu va mai fi folosit, atunci se vor face modificările
necesare chiar în testul respectiv, procedând la fel ca pentru actualizarea unui test de
cunoştinţe.
Dacă, însă, este important să se păstreze şi testul original, atunci se va face mai întâi o
copie a acestuia, după care se vor opera modificările în noul test.

15.8. Ştergerea unui test de cunoştinţe

Dacă un test de cunoştinţe nu mai prezintă interes, se poate şterge fişierul care îl conţine.
Pentru aceasta se marchează testul în lista de teste şi apoi se apasă butonul Ştergere test.
Un test de cunoştinţe şters nu mai poate fi recuperat.

15.9. Listarea unui test de cunoştinţe

Există trei posibilităţi de a lista un test de cunoştinţe sau părţi ale sale:
• pentru a-l administra sub forma creion-hârtie;
• pentru a obţine grila de cotare a sa;
• pentru a-l verifica.

182 |
Listarea se realizează după marcarea testului în lista testelor existente şi apăsarea
butonului Tipărire test, din meniul aflat în dreapta ferestrei care conţine lista de teste. Se va
alege apoi tipul de listă:
• pentru efectuare (de către subiecţi);\
• pentru cotare (de către examinatori);
• pentru verificare (de către administrator).
Primele două tipuri de liste se pot obţine numai dacă testul este varintă finală.
Toate aceste liste se prezintă sub forma unor fişiere de tip .doc. Numele lor este format
din numele testului de cunoştinţe listat, precedat de test_ şi urmat de (subiect), (examinator)
sau (administrator), în funcţie de tipul listei. Pentru a putea fi utilizate este necesară salvarea
lor într-un director ales de cel care le-a solicitat.
Listarea testului în vederea administrării lui sub forma creion-hârtie are ca rezultat un
fişier de tip .doc, în care sunt notate următoarele informaţii preluate din fişierul care conţine
testul de cunoştinţe:
• numele testului de cunoştinţe;
• descrierea testului;
• instrucţiunile de administrare a testului;
• itemii exemplu, având completat câte un X în dreptul răspunsurilor corecte;
• un text care informează câţi itemi de testare vor urma şi ce durată are testarea;
• itemii testului, fiecare răspuns posibil fiind precedat de o căsuţă în care persoana care
răspunde poate nota semnul X.
Itemii-exemplu şi itemii testului sunt listaţi în ordinea în care figurează în testul de
cunoştinţe.
Înainte de a fi administrat, testul trebuie să fie tehnoredactat, astfel încât primul item al
testului să înceapă pe o pagină nouă şi fiecare item, indiferent dacă este exemplu sau item de
test, să fie inclus integral pe o pagină.
Grila de cotare a testului este un fişier de tip .doc, care conţine, pentru fiecare item de
testare, răspunsurile corecte şi punctajele corespunzătoare lor.
Lista obţinută pentru verificarea unui test de cunoştinţe conţine, în ordine:
• numele testului de cunoştinţe;
• numărul de itemi-exemplu;
• numărul de itemi de testare;
• durata testării (timpul de răspuns la itemi);
• modul de cotare a răspunsurilor la itemii testului;
• data la care s-a făcut ultima actualizare a fişierului care conţine testul de
cunoştinţe;
• descrierea testului;
• instrucţiunile de administrare a testului;

183 |
• itemii-exemplu şi itemii de testare, pentru fiecare item fiind precizat tipul
răspunsurilor sale, răspunsurile corecte şi punctajul acordat pentru fiecare răspuns
corect.

15.10. Verificarea unui test de cunoştinţe

Dacă un test de cunoştinţe este variantă finală este posibilă verificarea sa în forma în
care va fi administrat subiecţilor, cu singura deosebire că acum se vor afişa, la sfârşit:
• timpul în care a fost rezolvat testul;
• scorul maxim posibil la test;
• scorul realizat de cel care a răspuns;
• procentul reprezentat de punctajul realizat din punctajul maxim posibil.
Pentru aceasta se marchează testul şi se apasă butonul Verificare test.
Ecranele afişate vor avea acelaşi conţinut ca în timpul administrării testului în cadrul
platformei CAS++. De asemenea, modul de lucru pentru a efectua testul va fi acelaşi.

15.11. Mutarea unui test de cunoştinţe pe o altă staţie de lucru

Un test de cunoştinţe creat cu ajutorul modulului Gestiune teste de cunoştinţe, aflat în


variantă finală, este inclus automat în listat testelor care pot fi administrate computerizat în
cadrul platformei CAS++. Dar, administrarea sa este posibilă numai pe staţia de lucru pe care
testul a fost construit. Pentru a-l administra pe o altă staţie de lucru, este necesar ca el să fie
inclus în lista testelor platformei CAS++ aflate pe staţia de lucru respectivă. Acest lucru se
realizează în doi paşi:
• Mai întâi se copiază testul de cunoştinţe de pe staţia de lucru unde se găseşte (se
salvează) pe un suport de stocare (CD, DVD, stick de memorie), folosind butonul
Export test.
• Apoi se copiază testul de cunoştinţe de pe suportul de stocare pe staţia de lucru care
va fi utilizată la administrarea testului, cu ajutorul butonului Import test.
• Ambele butoane (Export test şi Import test) se găsesc în meniul din dreapta ferestrei
care conţine lista testelor de cunoştinţe, în cadrul modulului Gestiune teste de
cunoştinţe.
• Pentru salvarea unui test de cunoştinţe se fac următoarele operaţii:
• Se selectează testul în lista testelor de cunoştinţe din modulul Gestiune teste de
cunoştinţe.
• Se apasă butonul Export test.
• În fereastra care se deschide se indică locul unde se va salva fişierul care conţine
testul (în câmpul Save as) şi numele testului, dacă se doreşte schimbarea numelui (în
câmpul File name), după care se apasă butonul Save.

184 |
Pentru copierea testului de pe suportul pe care a fost salvat pe staţia de lucru unde va fi
administrat se procedează astfel:
• Pe staţia de lucru se deschide modulul Gestiune teste de cunoştinţe.
• Se apasă butonul Import test.
• În fereastra care se deschide se indică locul unde se găseşte fişierul care conţine
testul de cunoştinţe, pe suportul magnetic (în câmpul Look in), se selectează testul şi
se apasă butonul Open. Se va observa că testul va fi inclus în lista testelor de
cunoştinţe.

15.12. Administrarea unui test de cunoştinţe cu ajutorul calculatorului, în


cadrul platformei CAS++

Pentru ca un test de cunoştinţe să poată fi administrat cu ajutorul calculatorului, el


trebuie să fie varintă finală.
La sfârşitul unei sesiuni de lucru cu modulul Gestiune teste de cunoştinţe, testele care
sunt în varianta finală sunt incluse, automat, în lista testelor care pot fi folosite pentru
evaluare psihologică, în categoria Evaluarea cunoştinţelor. Testele de cunoştinţe care făceau
parte din această listă dar au devenit draft dispar din listă.
Administrarea unui test de cunoştinţe, la fel ca administrarea oricărui test inclus în lista
de teste disponibile, este posibilă numai pentru persoanele înregistrate în baza de date a
platformei CAS++.
Administrarea testelor de cunoştinţe se realizează prin intermediul modulului Efectuare
teste din componentele Evaluare psihologică individuală şi Evaluare şi selecţie de personal.
Atunci când se aleg testele care vor fi administrate unei persoane, dacă se selectează un test de
cunoştinţe din lista testelor disponibile şi se apasă butonul Informaţii test se va afişa
descrierea testului, timpul de răspuns şi numărul itemilor de testare.
Atunci când se administrează testul de cunoştinţe cu ajutorul calculatorului, pe ecran
apar, în ordine:
• numele şi descrierea testului;
• instrucţiunile de administrare a testului;
• itemii-exemplu;
• un text care informează asupra numărului de itemi de test şi asupra timpului de lucru;
• itemii testului.
Itemii-exemplu şi itemii de testare sunt afişaţi în ordinea în care figurează în testul de
cunoştinţe.
La itemii-exemplu persoana testată trebuie să răspundă în acelaşi mod ca la itemii de
acelaşi tip din test. I se comunică dacă a răspuns corect sau greşit, iar în cazul răspunsului
greşit, care este răspunsul corect.
În timpul parcurgerii testului, în partea de jos a ecranului se afişează permanent timpul
de lucru rămas

185 |
Persoana examinată are următoarele posibilităţi, la fiecare item din test:
• să răspundă;
• să treacă la itemul următor (apăsând butonul Continuare) sau la un item anterior
(apăsând butonul Revenire), fără să răspundă;
• să schimbe răspunsurile date;
• să renunţe la continuarea testării.
Se poate reveni la oricare item din test pentru a completa sau a schimba răspunsul
(răspunsurile).
Rezultatele obţinute de o persoană la un test de cunoştinţe sunt integrate automat în
Raportul de evaluare psihologică produs de componenta Evaluarea psihologică individuală,
respectiv în Profilul candidatului, creat de componenta Evaluare şi selecţie de personal.

15.13. Vizualizarea răspunsurilor la un test de cunoştinţe

Componentele Evaluare psihologică individuală şi Evaluare şi selecţie de personal ale


platformei CAS++ conţin butonul Afişare rezultate. Dacă se apasă acest buton, se va afişa,
pentru o persoană aleasă din baza de date, Raportul de evaluare psihologică (în componenta
Evaluare psihologică individuală) sau Profilul candidatului (în componenta Evaluare şi
selecţie de personal). Fiecare dintre ele este un fişier de tip .doc, care conţine rezulatele
persoanei respective la testele care i-au fost administrate.
Pentru un test de cunoştinţe sunt incluse informaţii cu privire la acest test (numele
testului, descrierea testului şi tipul cotării itemilor), data examinării, modul în care a fost
administrat testul (creion-hârtie sau computerizat), durata testării, scorul obţinut de subiect,
intervalul scorurilor posibile la test şi procentul reprezentat de scorul obţinut din scorul
maxim posibil al testului.
Dacă testul a fost administrat cu ajutorul calculatorului, atunci pentru fiecare item se
precizează tipul răspunsurilor sale, răspunsurile alese de cel examinat, răspunsurile corecte şi
punctajul obţinut de subiect.
În cazul în care un test de cunoştinţe a fost inclus în setul de probe care au fost
administrate candidaţilor pentru ocuparea unui anumit post, în cadrul componentei Evaluare
şi selecţie de personal, apăsând butonul Ierarhizare şi selectând, din lista afişată, postul
respectiv, se va obţine un raport care va conţine lista acestor candidaţi, în ordinea
descrescătoare a scorului pe care l-au realizat la test. Lista este un fişier de tip .doc.

15.14. Recomandări pentru construirea unui test de cunoştinţe


folosind modulul de evaluare a cunoştinţelor din CAS++

• Construirea testului de cunoştinţe se realizează urmând paşii descrişi în capitolul 9


(Construirea unui test de cunoştinţe standardizat) sau 10 (Construirea unui test de cunoştinţe
nestandardizat).

186 |
• Toţi itemii vor fi introduşi într-un test construit folosind modulul Gestiune teste de
cunoştinţe. Acesta va constitui banca de itemi. Ea va conţine atât itemi-exemplu, cât şi itemi
de testare. Descrierea testului format din toţi itemii (a băncii de itemi) şi instrucţiunile de
administrare vor conţine informaţii generale, valabile pentru orice test construit pornind de la
această bancă de itemi.
• Pentru a obţine o variantă a testului de cunoştinţe se va face o copie a băncii de itemi,
se vor elimina itemii care nu se includ în test, se vor ordona itemii rămaşi şi se vor face
modificările necesare în descrierea testului şi în instrucţiunile de administrare a testului.
• Pentru verificarea itemilor sub aspectul corectitudinii ştiinţifice şi al modului în care
sunt formulaţi, se va lista testul.
• Corectarea itemilor se va face atât în test, cât şi în banca de itemi, pentru a avea o
colecţie de itemi corecţi, din care să se poată construi teste de cunoştinţe ori de câte ori este
necesar.
• Atunci când se consideră că testul este corect, se administrează unui eşantion de
subiecţi pentru a face analiza de itemi (în cazul testelor de cunoştinţe standardizate) sau
persoanelor care trebuie să fie examinate cu el (în cazul testelor de cunoştinţe
nestandardizate). Administrarea se poate face sub forma creion-hârtie (caz în care se listează
testul construit) sau computerizat.
• Dacă testul a fost administrat sub forma creion-hârtie, pentru a putea realiza analiza de
itemi se vor introduce răspunsurile fiecărui subiect în calculator ca şi când acesta ar răspunde
la testul administrat de calculator (se administrează testul computerizat, în numele
subiectului).
• Prelucrarea statistică a răspunsurilor la itemi se poate realiza cu ajutorul pachetului de
programe SPSS. Acesta poate importa baze de date Excel.
• Dacă în urma analizei de itemi se constată că unii itemi sunt eronaţi, se va face
corectarea lor atât în banca de itemi, cât şi în testul administrat. Testul corectat va fi păstrat
pentru a putea fi utilizat şi cu alte ocazii sau pentru a servi ca punct de pornire în construirea
unui alt test.

187 |
188 |
BIBLIOGRAFIE

Aiken, L.R. (1994). Psychological Testing and Assessment. Allyn and Bacon.
American Psychological Association (1974 şi 1985). Standards for Educational & Psychological Tests.
Anastasi, A. (1954 şi 1976). Psychological Testing. New York: MacMillan Publishing Co., Inc.
Ausubel, D.P., Robinson, F.G. (1981). Învăţarea în şcoală. Introducere în psihologia pedagogică.
Bucureşti: Editura Didactică şi Pedagogică.
Balan, B. (1999). Aptitudinile şi importanţa lor în activitatea şcolară. În: A. Cosmovici, L. Iacob (coord.),
Psihologie şcolară. Iaşi: Editura Polirom.
Bocoş, M., Jucan, D. (2007). Teoria şi metodologia instruirii. Teoria şi metodologia evaluării. Repere şi
instrumente didactice pentru formarea profesorilor. Piteşti: Editura Paralela 45.
Corsini, R.J. (ed.) (1994). Encyclopedia of Psychology. vol. 2. New York, Chichester: John Wilney & Sons.
Cucoş, C. (1998). Probleme de docimologie didactică. În C. Cucoş (coord.). Psihopedagogie pentru
examenele de definitivare şi grade didactice. Iaşi: Editura Polirom.
Dalton, E. (2003). The ”New Bloom’s Taxonomy”, Objectives and Assessments, la adresa
http://gaeacoop.org/dalton/publications/new_bloom.pdf (vizitată în 29 iunie 2009).
Davis, F.B. (1955). Item Selection Techniques. În: E.F. Lindquist (ed.). Educational Measurement.
Washington, D.C.: American Council on Education.
Delhomme, P., Meyer, T. (1998). Culegerea datelor ca interacţiune socială: prescriere, conversaţie şi
interogare. Psihologia socială, 1, 143-150.
Dessler, G. (1997). Human Resource Management. New Jersey: Prentice-Hall, Inc.
English, H.B., English, A.C. (1970). A Comprehensive Dictionary of Psychological and Psychoanalytical
Terms. David McKay Company, Inc.
Funder, D.C. (1983). Three Issues in Predicting More of the People: A Reply to Mischel and Peake.
Psychological Review, 90 (3), 283-289.
Gatewood, R.D., Feild, H.S. (2001). Human Resource Selection. Harcourt College Publishers.
Goia, V. (2002). Didactica limbii şi literaturii române pentru gimnaziu şi liceu. Cluj-Napoca: Editura Dacia.
Graziano, A.M., Raulin, M.L. (1993). Research Methods. A Process of Inquiry. Harper Collins College
Publishers.
Gregory, R.J. (1992). Psychological Testing. History, Principles, and Applications. Allyn and Bacon.
Gronlund, N.E. (1967). Measurement and Evaluation in Teaching. New York: The MacMillan Company.
Guilbert, J.J. (1987). Ghid pedagogic pentru personalul sanitar. Bucureşti: Editura Medicală.
Guilford, J.P. (1965). Fundamental Statistics in Psychology and Education. McGraw-Hill Book Company.
Guion, R.M. (1986). Changing Views for Personnel Selection Research. Lucrare prezentată la al 21-lea
Congres Internaţional de Psihologie, Ierusalim, 15 iulie 1986.
Hammond, S. (1995). Using Psychometric Tests. În: G.M. Breakwell, S. Hammond, C. Fife-Schaw (ed.).
Research Methods in Psychology. Sage Publications.
Jacob, S., Hartshorne, T. (1992). Ethics & Law for School Psychologists. Brandon, Vermont: Clinical
Psychology Publishing Co., Inc.
Jinga, I. (2008). Finalităţile educaţiei. (131-143). În: I. Jinga, E. Istrate. (coord.). Manual de pedagogie.
Bucureşti: Editura ALL.
Jinga, I., Petrescu, A. (2008). Evaluarea în învăţămănt (385-416). În: I. Jinga, E. Istrate (coord.). Manual de
pedagogie. Bucureşti: Editura ALL.

189 |
Kubiszyn, T., Borich, G. (1996). Educational Testing and Measurement. Classroom Application and
Practice. New York: Harper Collins College Publishers.
de Landsheere, G. (1975). Evaluarea continuă a elevilor şi examenele. Manual de docimologie. Bucureşti:
Editura Didactică şi Pedagogică.
Landy, F.L. (1986). Stamp Collecting Versus Science. Validation as Hypothesis Testing, American
Psychologist. vol. 41 (11), 1183-1192.
Lindeman, R.H. (1978). Evaluarea în procesul de instruire. În: J.R. Davitz, S. Ball (ed.). Psihologia
procesului educaţional. Bucureşti: Editura Didactică şi Pedagogică.
Lord, F.M., Novick, M.R. (1968). Statistical Theories of Mental Test Scores. Addison-Wesley Publishing
Company.
Messick, S. (1995). Validity of Psychological Assessment. American Psychologist. vol. 50 (9), 741-749.
Meyer, G. (2000). De ce şi cum evaluăm. Iaşi: Polirom.
Murphy, K.R., Davidshofer, C.O. (1987 şi 1991). Psychological Testing. Principles and Applications.
Prentice Hall International, Inc.
Nelissen, C., Eisendrath, G. (1987). Criteria for Educational Software. În: J. Moonen, A. Tjeerd (ed.).
EURIT 86, Developments in Educational Software and Courseware. Pergamon Press.
Nevo, B. (1993). Face Validity Revised 1. În: B. Nevo, R.S. Jäger (ed.). Educational and Psychological
Testing: The Test Taker's Outlook. Hogrefe & Huber Publishers.
Paloş, R. (2004). Pregătirea profesională: formare şi dezvoltare. În: Bogáthy, Z. (coord.), Manual de
psihologia muncii şi organizaţională (pag. 113-134). Iaşi: Polirom.
Pichot, P. (1967). Les tests mentaux. Paris : Presses Universitaire de France.
Pitariu, H. (1978). Psihologie industrială – Lecţii. Curs multiplicat la Universitatea „Babeş-Bolyai”, Cluj-
Napoca.
Preda, V. (2009). Obiectivele procesului de predare-învăţare. În: M. Ionescu, M. Bocoş (coord.). Tratat de
didactică modernă (pag. 145-170). Piteşti: Editura Paralela 45.
Radu, I. (1995). Elemente de docimologie didactică. În: M. Ionescu, I. Radu (coord.). Didactica modernă.
Cluj-Napoca: Editura Dacia.
Radu, I. (2009). Evaluarea activităţii diadei profesor-elev (elemente de docimologie didactică). În: M.
Ionescu, M. Bocoş (coord.). Tratat de didactică modernă (pag. 383-414). Piteşti: Editura Paralela 45.
Reber, A.S. (1985). The Penguin Dictionary of Psychology. Penguin Books.
Roşca, M. (1972). Metode de psihodiagnostic. Bucureşti: Editura Didactică şi Pedagogică.
Sălăvăstru, D. (1999). Didactica psihologiei. Perspective teoretice şi metodice. Iaşi: Editura Polirom.
Sillamy, N. (2000). Dicţionar de psihologie. Bucureşti: Editura Univers Enciclopedic.
Silva, F. (1993). Psychometric Foundations and Behavioral Assessment. Sage Publications, Inc.
Swaminathan, H., Hambledon, R.K., Algina, J. (1974). Reability of Criterion-Referenced Tests: A Decision-
Theoretic Formulation. Journal of Educational Measurement. 11 (4), 263-267.
Thorndike, R.L., Hagen, E. (1961). Measurement and Evaluation in Psychology and Education. John Wiley
& Sons, Inc.
Traub, R.E. (1994). Reliability for the Social Sciences. Theory and Applications. vol. 3. Sage Publications.
Truxillo, D.M., Donahue, L.M., Sulzer, J.L. (1996). Setting Cutoff Scores for Personnel Selection Tests:
Issues, Illustrations, and Recommendations. Human Performance, 9 (3), 275-295.
Turcu, F., Turcu, A. (1999). Fundamente ale psihologiei şcolare. Bucureşti: Editura ALL Educational.
Vîrgă, D. (2004). Recrutare şi selecţie. În: Bogáthy, Z. (coord.), Manual de psihologia muncii şi
organizaţională (pag. 73-94). Iaşi: Polirom.
Warr, P. (1997). The Varying Validity of Personality Scales. Selection&Development Review, 13 (4), 3-7.

190 |
Wilson, L.O. (2006). Leslie Owen Wilson’s Curriculum Pages Beyond Bloom − A New Version of the
Cognitive Taxonomy, la adresa http://www.uwsp.edu/education/lwilson/curric/newtaxonomy.htm
(vizitată în 29 iunie 2009).

191 |

S-ar putea să vă placă și