STANDARD DE MĂSURĂ
cele individuale.
STANDARD DE MĂSURĂ
fidelitate.
atât limitele erorii sunt mai mici. Cu cât valoarea rtt este mai mică, cu atât
5 × 3DS =15
real.
92
93
timp şi conţinut;
acestuia;
evaluatorilor.
coeficientului de fidelitate:
94
teste al căror scor este rezultatul aprecierii subiective făcute de evaluator.
ele.
Se procedează astfel:
între cele două administrări ale sale, scorurile reale ale persoanelor nu
s-au schimbat.
coeficient de stabilitate. Metoda test – retest este utilă atunci când scorurile
emoţiile, temperatura şi lumina din sala de testare etc.) pot ajuta unei
erorile de măsură.
Condiţii: Aplicarea metodei test – retest impune să se asigure asemenea
încât subiecţii să nu îşi poată aminti cum au răspuns la test, întrucât multe
intervalul de timp dintre test şi retest subiecţii îşi modifică scorul real,
95
persoane pot căuta în cărţi răspunsurile corecte la itemi, mai ales acolo
Hotz, 1989).
atunci când testul este utilizat pentru a se lua decizii, prin plasarea
subiecţilor în una din categoriile „admis” (cei cu scor mai mare decât un
prag fixat) sau „respins” (cei cu scor mai mic decât acest prag). Testul
96
Dezavantajul metodei test – retest constă în faptul că pretinde
apărea de mai multe ori cu scorul zero. Intercorelaţiile lor vor avea, din
celălalt.
total al testului.
()
()(12)
12
1n1ry,y
rny,y
+−
lungit (sau scurtat), prin itemi paraleli, un test dat, astfel încât fidelitatea
lungi consumă mult timp şi sunt mai scumpe decât cele scurte. Deci, nu
întotdeauna este posibilă şi rentabilă creşterea fidelităţii prin adăugarea de
itemi paraleli.
teste.
test – retest: cele două forme fiind diferite, rezultatele la cel de-al doilea
amintim următoarele:
97
98
costisitoare.
echivalenţa măsurătorilor.
un alt test.
99
răspunsul la celălalt. Astfel că, din fiecare pereche, un item va intra într-o
plasarea celor două părţi una după cealaltă, întrucât intervine oboseala
jumătate, iar dacă testul este administrat cu limită de timp, este foarte
probabil ca mulţi itemi din cea de-a doua parte să nu fie rezolvaţi
la aceştia şi, deci, scorurile la itemii pari şi la cei impari vor apărea mai
100
puternic corelate decât sunt în realitate. Din acest motiv, metoda
101
erorile ele măsură este mai mare în metoda test – retest şi în metoda
COEFICIENŢILOR DE FIDELITATE
102
eşantionului.
două forme paralele ale testului să fie identică şi, în acelaşi timp, să fie
caracteristici egale, este de preferat testul care are cea mai mare fidelitate.
Dar, pe de o parte, testul cel mai fidel poate fi cel mai scump sau mai
egale.
103
Hammond, 1995).
coeficientul său de fidelitate poate fi mai mic, chiar cuprins între 0.6
tinde să fie mai mică decât cea a testelor cognitive (de cunoştinţe, de
decât 0.8.
spre moderată.
104
test care este administrat de două ori unui lot de persoane (de exemplu,
105
7. CARACTERISTICI METROLOGICE:
VALIDITATEA
106
1) validitatea conceptuală;
2) validitatea de conţinut;
3) validitatea predictivă;
4) validitatea concurentă.
107
testul.
scorurilor sale”.
le are) cu constructul măsurat de test. În cel de-al doilea caz, criteriul este
inferenţelor care pot fi făcute pe baza unei mulţimi de scoruri de test (l986).
108
şi sau condiţiilor.
poate evalua măsura în care orice consecinţe contrare ale testării derivă
irelevanţa constructului.
Hammond, 1995:
109
trebuie revalidat.
(Anastasi, 1976):
În ce scop
Întrebarea pe care
şi-o pune
utilizatorul
să interpreteze
scorul subiectului
Ce tip de validitate
este verificată
Verificarea cunoştinţelor
de aritmetică în şcoala
primară
Cât de mult a
învăţat elevul în
trecut?
Validitatea de
conţinut
Testarea aptitudinii
matematice pentru
predicţia performanţelor
în gimnaziu
Cât de bine va
învăţa elevul în
viitor?
Validitatea de
conţinut
Diagnosticarea lipsei
deprinderii de a face
calcule
Performanţa
elevului indică
lipsa deprinderii
de a face calcule?
Validitatea relativă
criteriu (validitatea
concurentă)
Măsurarea
raţionamentului logic
Cum poate fi
descris modul de
a raţiona al
elevului?
Validitatea
conceptuală
110
Concluzii:
numai pentru bărbaţi, nu şi pentru femei. Sau numai pentru persoane care
RELATIVĂ LA CRITERIU
măsurării lor.
111
se validează atât testul, cât şi ipotezele aflate la baza sa, scrie: „Validitatea
validitatea să fie nesatisfăcătoare este mai mare pentru test decât pentru
la criteriu.
măsurat de test.
aceste constructe. Pentru fiecare din ele, pe baza relaţiilor dintre constructe,
112
Construct Comportament
1. Identificarea comportamentelor referitoare la agresivitate
domină în jocuri
acest comportament
domină în jocuri
onestitate
domină în jocuri