Documente Academic
Documente Profesional
Documente Cultură
j
j
G X
Aflarea valorii brute cu o corectur ocazional(accidental)
Deoarece la sarcinile corect-fals i la sarcinile cu alegere multipl un
rspuns corect poate s apar prin ntmplare, sunt avantajai necritic
examinaii i dezavantajai critic examinaii. Cnd se accept c rspunsurile
greite sunt introduse prin ntmplare , rezult o corectur:
1
1
m
F
R X
i i
n care
m este numrul posibilitilor de rspuns.
Exemplu: Un subiect obime, la un test cu alegere multipl cu 4 alegeri, 62
de rspunsuri corecte i 12 rspunsuri greite. Corectura de corijare a ntmplrii
este :
58
1 4
12
62
X
La dispozitivul de rspuns la test de tipul corect - fals
exist doar o alternativ pentru rspunsurile corecte, adic X
i
= C
i
- F
i
Indicaii:
a. Cnd un test cuprinde un mare numr de sarcini, abia se poate face
deosebirea, dac se lucreaz cu sau fr corectur de ntmplare.
b. La sarcinile cu alegere multipl se recomand o corectur de
ntmplare atunci cnd avem 4 sau mai puin de 4 posibiliti de
alegere., ns numai condiia ca testul s conin relativ puine sarcini.
n afara sarcinilor cu alegere multipl i sarcinilor corect-fals, la testele
standardizate, este aplicat rar o corectur de ntmplare.
Stabilirea rezultatului brut prin corectur de eroare ntmpltoare.
Pentru fiecare test, cum se petrec lucrurile la testele de calcul cu timp
determinat, n care rezult att evaluare pentru cantitate ct i pentru calitate,
este de dorit de a exprima randamentul la test ntr-un singur scor, cantitatea
i calitatea fiind considerate mpreun ntr-o msur corespunztoare.
Cuprinderea celor dou criterii laolalt este permis doar atunci cnd aceste se
influeneaz reciproc, atunci cnd o ridicare a cantitii de randament duce la
scdere a calitii randamentului. Aceasta ar fi nemotivat, cnd o corectur
stabilit prin definiie sau o corectur de eroare prin ntmplare ne st la
ndemn, deoarece nu este acceptat ipoteza c toate erorile ar exista prin
ntmplare.
O corectur semnificativ a randamentului cantitativ pe baza diferitelor
caliti abia poate fi realizat n fapt, dac analiza sarcinilor testului a fost
realizat deja printr-un criteriu exterior, procedura cantitativ trebuie s fie ns
anticipat. Se precizeaz, ca de obicei, rspunsurile corecte i greite de la
fiecare subiect coreleaz fiecare din aceste scoruri cu valoarea criteriului i la
fel valorile corecte i cele false. Cu aceti trei coeficieni poate s se procedeze
la acceptarea unei distribuii normale trivariate dup ecuaia de corelaie
multipl. Thurstone a elaborat o formul, i anume formula pentru determinarea
ponderii erorii G
F
. n aceast formul, semnificaia simbolurilor utilizate este
urmtoarea:
S
R
= abaterea standard a scorurilor R;
S
F
= abaterea standard a scorurilor F;
r
RF
= corelaia ntre scorurile F i R;
r
RC
= corelaia ntre scorul R i scorul criteriului;
r
FC
= corelaia ntre scorurile F i scorurile criteriului.
RC RF FC F
FC RF RC r
F
r r r S
r r r S
G
( *
) ( *
Cu aceast pondere a erorii G
F
trebuie s fie multiplicat scorul erorilor F
nainte de a permite s fie adugat algebric la scorurile R.
X
i
= C
i
+ G
F
*F
i
Deoarece ponderea G
F
are practic de cele mai multe ori un semn negativ, se
rezum operaia de calcul pentru aflarea valorilor empirice corijate la o
scdere..
Exemplu
Un test de calcul are o mprtiere a scorurilor C de s
C
= 20 i o mprtiere
a valorilor de eroare de s
F
= 4. Corelaia ntre rspunsurile F i C cuprinde r
CF
=
0,1. n calitate de criteriu al randamentului la birou servete numrul de acte
ordonate i ndeplinite corect pe or. Ia natere o puternic corelaie ntre
succesul la birou i randamentul la calcul de r
CK
= 0,7 i, pe de alt parte-ceea
ce era de ateptat-o corelaie relativ mic ntre insuccesul la birou i calitatea
randamentului de calcul de r
FK
= - 0,2
De aici rezult, dup formula anterioar, o pondere a erorii de:
[ ]
87 , 1
7 , 0 1 , 0 * 1 , 0 * ) 2 , 0 ( * 4
) 2 , 0 ( 1 , 0 * 7 , 0 ( * 20
F
G
Atunci cnd dorim ca succesul muncii la birou s fie calculat, pe ct posibil,
printr-un singur scor , trebuie s aplicm formula dat anterior la un subiect RU
care a obinut 102 calcule corecte i 12 false. Valoarea corijat se prin nlocuirea
valorilor n formul:
X
RU
= 102 +(-1,87*12) = 80.
ntr-un mod simplificat, pentru a obine valoarea brut ajustat se scade
dublul erorilor din numrul de rezolvri corecte.
La testele pure de rapiditate, care trebuie evaluate separat dup
cantitate i calitate pot s fie anexate numrul sarcinilor n general prelucrate ca
valoare brut pentru cantitatea randamentului la test i calitatea s fie definit
ca procent de erori.
Harald Gulliksen consider c n construcia testelor, analizarea i interpretarea
rezultatelor, exist cinci tipuri majore de probleme:
1. Conceperea i selecia itemilor testului;
2. Alocarea unui scor fiecrei persoane;
3. Determinarea acurateii (fidelitatea sau erorile de msurare) scorurilor
testului;
4. determinarea valorii predictive a scorurilor testului(validitatea sau
eroarea de estimare)
5. Compararea rezultatelor cu acelea obinute utiliznd alte teste au alte
grupe de subieci. n realizarea acestor comparaii este necesar de a
considera efectul lungimii testului i eterogenitii grupului asupra
variatelor msurii ale acurateii i valorii predictive a scorurilor testului.
Clasificarea testelor psihologice din punct de vedere al formei
Din punct de vedere formal sau al aspectelor metodice, testele psihologice cunosc
mai multe criterii clasificare:
a. Dup gradul de standardizare i cuantificare s-a realizat diviziunea n teste
psihometrice(evaluarea se produce sub form numeric, exist norme sau
etaloane) i nepsihometrice);
b. Diviziunea testelor n teste formale i teste informale are la baz nivelul
eforturilor de dezvoltare psihometric pentru procedeul de construcie. Se
prefer denumirile de procedee de analiz i ajutoare(anexe) ale analizei
c. n funcie de indicaiile referitoare la regimul temporal prestabilit se realizeaz
diviziunea ntre teste de nivel (power Tests) i teste de rapiditate( speed
Tests). Testele de nivel sunt fr limit de timp, cu sarcini dificile, n timp ce
testele de rapiditate au o limit temporal strict prestabilit i sarcini uoare,
monotone. Se vorbete i de teste mixte, care au limite generoase de timp i
sarcini de nivel mediu.
d. Din punctul de vedere al suportului material al prezentrii stimulrii (sau
medium-ul testului) distingem ntre teste creion-hrtie i teste de aciune
sau manipulare(teste de prelucrare a materialelor), teste aparative, teste-
imagini La testul creion-hrtie, solicitarea are drept suport material ca o
simpl foaie imprimat sau un caiet cu mai multe foi, rspunsul subiectului
fiind nregistrat pe o foaie de rspuns. Aceast separare a foii de rspuns este
justificat de exigena de economicitate prezentat anterior de noi. n forma
clasic de corectare, pe foaia de rspuns se aplic un ablon care are
deschideri n dreptul variantelor corecte. n variantele moderne, rspunsurile
date de ctre subiect sunt nregistrate i prelucrate electronic, activitate care
se desfoar foarte rapid. n zilele noastre asistm la computerizarea
variantelor creion - hrtie. Menionm c nu exista identitate ntre forma
creion hrtie i cea computerizat. La testele aparative, solicitarea se prezint
cu ajutorul unui dispozitiv mecanic sau electronic, prezentnd stimulii,
nregistrnd rspunsurile corecte, greite sau omise, realiznd normarea
scorului obinut(la formele computerizate). n marea lor majoritate, testele
aparative sunt individuale i necesit costuri financiare mai mari
e. Dac lum drept criteriu de separaie numrul subiecilor examinai
concomitent, distingem ntre teste individuale i teste colective. Testul
individual se aplic unei singure persoane, n timp ce testul colectiv la mai
multe persoane odat. Avantajul aplicrii individuale const n faptul c se
poate realiza o bun observare a comportamentului subiectului n timpul
probei, dezavantajul constnd n consumul de timp raportat la persoana
examinat. Avantajul aplicrii testelor colective const n eficacitate mare de
examinare, ns nu tim dac aceasta este un avantaj aa de mare cunoscnd
faptul slabei posibiliti de observare a comportamentului examinailor. n
marea lor majoritate, testele creion-hrtie sunt teste colective. Modernizarea
intervenit prin computerizare a dus uneori la transformarea unor teste
individuale n teste colective.
f. Dup numrul dimensiunilor cuprinse n test realizm clasificarea n teste
unidimensionale i multidimensionale, varianta de exprimare fiind teste
singulare i baterii de teste. mprirea n teste singulare, i baterii de
probe nu trebuie confundat cu cea anterioar(individuale i colective),
deoarece se refer la un alt aspect. Testul singular este acel test care este
folosit n mod exclusiv sau izolat de alte teste ntr-o examinare, de exemplu
testul Rorschach. n alte cazuri se folosesc baterii de teste, adic un ansamblu
de teste. Din exploatarea informaional a unui test singular sau elementar
rezult un singurscor, pe cnd sistemele de teste obin mai mult de unul.
Scorurile pot s aib autonomie sau s fie cumulate ntr-un punctaj global.
Sistemele de teste sunt divizate n profiluri de teste i baterii de teste.
Profilurile de test sunt prezentri grafice ale rezultatelor mai multor teste.
Denumirea a fost creat n anul 1926 de ctre Grigory Ivanovich Rossolimo
. n sensul extins al cuvntului, profilul de test semnific o combinaie de mai
multe teste individuale n care fiecare test singular conserv(pstreaz)
autonomia. Alegerea testelor elementare pentru un profil este dictat de
nevoile practice. Pentru rezultatele unui singur subiect, profilul aptitudinal
poate arta n felul urmtor:
Scoruri standardizate(interquintile)
Nr.crt. Denumite test Scor brut I II III IV V
1 Bordon Amfimov 433 *
2 Kraepelin 179 *
3 AD P 84 *
4 MPR 55 *
5 Discuri Wather 142 *
Figura 3.1 Profil aptitudinal
Figura 3.2. Profil de personalitate la CPI
Exemplu: pentru descrierea ngust a unei structuri de personalitate
individuale putem ntocmi un aa-numit profil de personalitate, pentru
descrierea structurii inteligenei, un profil de inteligen, pentru descrierea
unei aptitudini profesionale un profil aptitudinal. Se vorbete n acest sens de
o combinaie ad-hoc de teste singulare despre care se crede c sunt create
pentru un scop special, i nu create arbitrar. Pentru un profil de test nu sunt
fixate exigene prea mari de natur metodologic. n consecin, se ateapt
ca fiecare test s fie ntr-o oarecare msur fidel i s coreleze relativ sczut
cu celelalte, s dovedeasc, independent unul de altul, o suficient validitate
logic sau empiric. Informaiile dobndite din profilul total duc la o
accentuat lrgire a domeniului validitii. Interpretarea unui profil nu trebuie
s plece doar de la testele individuale, ci trebuie s fac posibil o viziune
cuprinztoare. Bateriile de teste sunt combinaii de mai multe teste
individuale n care testele individuale i pierd autonomia lor, i apar n
serviciul unui scop general, i anume acela de a cuprinde, pe ct posibil de
exact, o caracteristic a personalitii definit printr-un criteriu de validitate.
Numele de baterie de teste i gsete analogia, pe de o parte, n
electrotehnic, unde mai multe elemente galvanice sunt cuplate unul lng
altul n interiorul bateriei, pe de alt parte, n tehnica rzboiului, unde mai
multe piese de artilerie contribuie laolalt pentru atingerea unui el de lupt.
n ambele cazuri, se ridic n esen problema efectivitii, numrul de voli,
respectiv puterea de foc. Alegerea testului individual pentru o baterie trebuie
s fie ghidat dup domeniul su de validitate, adic toate testele reunite ntr-
o baterie trebuie s cuprind o aceiai caracteristic a personalitii, chiar
dac, dup mprejurri, din puncte de vedere diferite Rmne deschis
problema dac domeniul caracteristicii este strict circumscris(de exemplu,
capacitatea de concentrare la diferite activiti) sau dac este mai
vast(capacitatea de randament intelectual general). Exigenele statistice fa
de testele individuale care compun o baterie de teste fac raportare la fidelitate
i nu, cu s-ar putea crede), la validitate, care este o chestiune primar a unui
test.
g. Dac lum drept criteriu de clasificare gradul subiectivitii la evaluarea i
interpretarea testelor, distingem ntre teste obiective i subiective. Dac
lum n consideraie deformarea sistematic a rezultatului testului prin
simulare, disimulare, tendina de conformism social, realizm tot o asemenea
distincie
h. Dup gradul de dependen de nivelul de nelegere a limbii i aptitudinea de
exprimare verbal distingem ntre teste verbale i neverbale.
i. Dup gradul structurrii n evaluare, deosebim ntre teste nalt
structurate(fiecare are numai o rezolvare corect posibil, rezultat obiectiv
evaluabil, sunt stabilite norme ) i slab structurate(necesit categorizarea
rspunsurilor, diferene uoare ntre evaluatori);
j. n funcie de libertatea posibilitii de rspuns, testele se divid n teste cu
dispozitiv de rspuns deschis (liber, creativ) i teste cu dispozitiv de
rspuns fixat(selectiv,impus). La testele din prima categorie, subiectul are
libertatea de a exprima rspunsul, pe cnd la cele din a doua are posibilitatea
de a alege un fel de rspuns prestabilit.
k. Lee Joseph Cronbach propune o clasificare a testelor n funcie de felul
comportamentului provocat n teste de comportament maximal i teste
de comportament specific. Din prima categorie fac parte testele de
aptitudini, din a doua teste de personalitate.
Analiza de itemi
Am prezentat anterior noiunea de item pe care am deosebit-o de cea de
sarcin, n cadrul unui test. Itemul este deci o component informaional
elementar, bazal a unui test. Teste se construiesc prin asamblarea unui numr de
itemi i scorul global al unui test reprezint suma simpl sau ponderat a
rezultatelor itemilor. Pentru a putea fi nit item, o component a unui test trebuie s
aib un dispozitiv de rspuns cu alegere multipl i independen informaional,
adic din analiza rezultatelor s poat rezulta indicatori statistici similari
rezultatului global(indicatori de dificultate, indicatori de nivel, indicatori de
mprtiere, coeficieni de corelaie, coeficieni de validitate). Teoria testului dispune
de reguli dup care un item servete pentru un anumit scop diagnostic i despre
modul de construcie al itemilor i despre asamblarea lor ntr-un ntreg Cunoscutul
teoretician american al testului psihologic Paul Horst face urmtoarea
afirmaie:Procedurile de alegere a itemilor la construcia de teste psihologice sunt
numite analize de itemi(Horst,1971). Autorul american mai adaug precizarea c
aceast noiune este de cele mai multe ori utilizat imprecis, deoarece felul
analizelor realizate nu este suficient de clar specificat. Exist diferite feluri de
analize de itemi care depind de scopurile speciale cu care construim un anumit test.
Din ansamblurile de itemi(populaiile de itemi) care sunt constituite anterior
construciei testelor sunt selecionai itemi care vor forma unul sau mai multe
grupuri de itemi. Distribuiile rezultatelor, corelaiile i indicatorii care rezult din
analiza acestor grupuri de itemi trebuie s satisfac anumite condiii. Cele mai
frecvente analize de itemi sunt urmtoarele:
Analiza dificultii;
Analiza omogenitii;
Analiza specificitii;
Analiza validitii, analiza asimetriei i excesului
Analiza dificultii. Este analiza cea mai simpl, cea mai rspndit i cea
mai logic. Se practic la testele de randament cognitiv, n special. Din aceast
analiz rezult cota parte procentual sau sub form de proporie a acelor examinai
ai unui eantion care au rezolvat corect acest item. Am indicat n spaiul anterior
modul de calcul pentu itemii exprimai dihotomic i polihotomic. Avnd la dispoziie
rezultatele despre indicii de dificultate ai unui test dihotomic sau polihotomic, putem
stabili variana itemului care este un indicator grosier al capacitii de discriminare a
unui item. Din tabelul anterior al matricii itemi- subieci(forma dihotomic), prelum
ultimele trei linii, la care adaugm o linie ce conine valorile varianei:
f
i
6 4 9 1 6 5 7
p
i
0,6 0,4 0,9 0,1 0,6 0,5 0,7
q
i
0,4 0,6 0,1 0,9 0,4 0,5 0,3
s
2
i
0,24 0,24 0,09 0,09 0,24 0,25 0,21
Formula de calcul pentru varian este urmtoarea: i i i
q p s
2
. Dac unul din
termenii acestei nmuliri este egal cu 0, atunci i produsul este egal cu 0. Deci, un
item la care rspund corect toi subiecii sau la care rspund incorect toi subiecii
este nul din punctul de vedere al discriminrii, valoarea produsului fiind 0.
Capacitatea maxim de discriminare a unui item o avem n situaia n care un
item este rezolvat corect de jumtate din subiect i rezolvat incorect de cealalt
jumtate. Oscilaia valoric a varianei unui item este n intervalul 0 - 0,25. Diferite
ipostaze ale varianei unui item le prezentm n figura urmtoare.
Evolutia variantei itemului dihotomic
Analiza distractorilor. Prin analiza distractorilor se intenioneaz de a determina
la fiecare item plauzibilitatea distractorilor. n urma acestei analize se poate ti care
distractori sunt puini plauzibili i care sunt foarte aproape de rspunsul corect.
Evidenierea pluazibilitii distractorilor se poate face prin analiza frecvenei alegerii
lor. Prezentm forma cea mai comun prin care sunt nregistrate rezultatele unui
subiect. Sunt nregistrate rspunsurile corecte(notate cu 1) i rspunsurile
incorecte(notate cu 0)
Itemi
Sub
1 2 3 4 5 6 7 8 X
1
1 1 0 1 0 1 1 1
6
2
1 0 0 1 0 1 1 0
4
3
0 0 1 0 1 0 0 0
2
4
0 1 0 0 1 1 0 1
4
5
1 0 0 1 0 0 1 1
4
6
1 0 0 1 1 1 1 1
6
7
0 0 0 1 0 1 1 0
3
8
0 1 1 1 0 1 1 1
6
9
1 0 0 0 0 1 0 0
2
10
0 1 0 0 0 1 1 1
4
f
i
5 4 2 6 3 8 7 6 41
p
i
0,5 0,4 0,2 0,6 0,3 0,2 0,7 0.6
q
i
0,5 0,6 0,8 0,4 0,7 0,8 0,3 0,6
Matrice itemi-subieci, pentru un tip de sarcin cu 6 alegeri multiple .
Forma original se prezentare
Aceast matrice se poate exprima i sub forma evidenierii fiecrui distractor ales
ntr-un dispozitiv de rspuns de tip multiple choice cu 6 alegeri.
Itemi
Sub
1 2 3 4 5 6 7 8 X
1 4 2
4
6
2
5 4 2 6
2 4
1 5
6
3
5 4
1
4
3
1 5
3
1
1
1 5 3
2
4
5
2
6 4
1 5
2
2 4
5 4
4 1
6
5 4
4 2 4
6 4
3 4
6 1 5 4 2 6
7
5 6 2
6
4
5 4
4
3
8
3
2 3 6
1
5 4 2 6
9 4
1 5 5 6
5
1 6
2
10
6
2
2 2 5
5
4
2 4
f
i
5 4 2 6 3 8 7 6 41
p
i
0,5 0,4 0,2 0,6 0,3 0,2 0,7 0.6
q
i
0,5 0,6 0,8 0,4 0,7 0,8 0,3 0,6
Form de prezentare cu evidenierea distractorului ales
(rspunsul corect este ntrit)
Aceast form de prezentare prezint avantajul c ofer informaii pentru
reconfigurarea itemului, n cazul n care acesta se dovedete a fi deficitar n privina
satisfacerii criteriilor de apreciere pentru a fi introdus ntr-un test. Un distractor care
nu este ales de nici un subiect, sau este ales de foarte puini subieci, poate fi
considerat inutil i, n consecin, trebuie s fie eliminat din test sau revizuit.
Spunem despre un asemenea item c este neverosimil, atunci cnd nu intr n
atenia subiectului cruia i este administrat proba. Invers, dac un distractor este
ales de o proporie apreciabil de subieci, atunci spunem despre item c este
verosimil sau atractiv. n cazul destul de rar al preferrii de o proporie de subieci
mai mare chiar dect varianta de rspuns corect, atunci spunem despre item c
este supra-atractiv
S presupunem c am examinat cu un test de randament cognitiv cu dispozitiv
de rspuns de tip multiple choice un numr de 354 de subieci i distribuia
rspunsurilor pentru fiecare din cele 6 variante de rspuns ale itemului 25, de
exemplu, dintre care una corect(numerotat cu 4) i 5(variantele de rspuns
1,2,3,5,6) distractori ar fi urmtoarea:
Varianta de rspuns 1 2 3 4 5 6
Frecvena 0 0 0 354 0 0
Inspectnd vizual o astfel de distribuie a variantelor de rspuns, putem s
oferim dou ipoteze: or subiecii sunt geniali (dei tim c nu se nasc genii pe
strad, nici la ua cafenelei), or distractorii sun foarte puini verosimili. Situaia
existente la ceilali itemi ne poate ajuta s identificm cauza. n cazul n care
distractorii sunt foarte puini verosimili, subiectul va descoperi foarte uor rspunsul
corect. Dac situaia s-ar prezenta n felul urmtor, alta ar fi aprecierea noastr
privind adecvarea itemului:
Varianta de rspuns 1 2 3 4 5 6
Frecvena 19 14 35 214 40 32
Exist procedee de a detecta itemii neverosimili sau valabilitatea dispozitivului
de rspuns. Unul din procedee este de a examina frecvena alegerilor variantelor de
rspuns. Redm situaia din tabelul anterior, exprimat n procente:
Varianta de rspuns 1 2 3 4 5 6
Frecvena 5,34% 3,96% 9,89% 60% 11,29% 9,03%
In ultimul tabel, rspunsul corect a fost ales de 60% dintre respondeni, pe cnd
distractorii n ansamblu au fost alei n procent de 40%
Kevin Murphy i Charles Davidshofer consider c un item perfect dintr-un
test are dou caracteristici:
1. Subiecii care cunosc rspunsul corect la solicitarea cognitiv vor alege
mereu rspunsul corect;
2. Subiecii care nu cunosc rspunsul corect vor alege ntmpltor ntre
rspunsurile posibile. Astfel de oameni pot ghici rspunsul corect i
fiecare rspuns incorect este egal n preferine.
(Murphy&Davidshofer,2001.p.194))
La itemul exemplificat anterior, 60% dintre subieci au rspuns corect i 40 %
incorect. Dac considerm itemul perfect conform aprecierii autorilor americani, ar
trebui ca procentul de 40% s fie divizat egal l
a toi cei 5 distractori, Deci, situaia ideal ar trebui s arata n felul urmtor:
Varianta de rspuns 1 2 3 4 5 6
Frecvena 8% 8% 8% 60% 8% 8%
Exprimat n valori absolute. Distribuia s-ar prezenta astfel:
Varianta de rspuns 1 2 3 4 5 6
Frecvena 28 28 28 214 28 28
Rezultatele acestea sunt obinute prin mprirea sumei rspunsurilor incorecte, sub
form de frecvene absolute sau relative, la numrul de distractori. Dac am realiza
un test
2
, am obine urmtorul tabel.
Distractor f
o
ft f
o
-f
t
(f
0
-f
t
)
2
(f
0
-f
t
)
2
/ft
1 19 28 -9 81 2,89
2 14 28 -14 196 7
3 35 28 7 49 1,75
5 40 28 12 144 5.14
6 32 28 4 16 0,57
2
= 17,35
Interpretnd valoarea lui
2
pentru 4 grade de libertate, rezult o respingere a
ipotezei de nul(p<0,01).
n situaia n care numrul de persoane care aleg un distractor excede semnificativ
numrul ateptat, exist dou explicaii:
1. Este posibil ca alegerea s reflecte cunoaterea parial
2. O posibilitate mai ngrijortoare este c itemul este construit pe baza unui
simplu iretlic.
Dac mai mult de unul din distractori este extrem de popular printre subiecii care
au o bun cunoatere a domeniului cuprins de item i dac identificarea rspunsului
corect depinde de cteva puncte obscure sau subtile, itemul nu este probabil s fie
o msur valid a domeniului de coninut. n asemenea situaii, itemii extrem de
dificili sau subtili sunt dezirabili, ca i cum elul este de a msura diferenele
individuale printre subieci la captul superior al distribuiei scorurilor (exemplu
competitorii pentru bursele unei universiti). n cele mai multe situaii, aceste tipuri
de item cu distractori extrem de populari este probabil s influeneze calitatea
global a unui test. Pentru cele mai multe teste, prezena itemilor cu distractori
extrem de populari este probabil de a reduce fidelitatea i validitatea unui test.
Anumii distractori sunt extrem de nepopulari. Numrul subiecilor care aleg
actual acest rspuns este considerabil mai mic dect numrul care se ateapt prin
ans. Prezena unui distractor extrem de nepopular sau neplauzibil afecteaz un
numr important de caracteristici ale itemului. Cel mai clar efect al unui distractor
nepopular este c el scade dificultatea itemului. Dac o persoan nu cunoate
absolut nimic despre domeniul care este testat, probabilitatea de a alege rspunsul
corect la un item cu patru alegeri posibile este una din patru.
Criterii de apreciere a itemilor
Dany Laveault i Jacques Grgoire compar analiza de itemi cu repetiia
unei orchestre, unde fiecare instrument component trebuie s funcioneze n
armonie cu toate celelalte. De asemenea, fiecare item intervine ntr-un anumit
moment impus de compozitor i stabilit de dirijor(Laveault, Grgoire, 1997, p.223).
n analiza de itemi trebuie s identificm itemii care nu acioneaz n armonie
cu toi ceilali sau care nu respect un anumit ritm. Scopul constructorului de test
este de a verifica faptul c mesajul furnizat este clar, armonios i precis. Analiza de
itemi ajut constructorul testelor de a alege cei mai buni itemi plecnd de la un
ansamblu incipient mai mare dect necesar.
Analiza de itemi poate lua mai multe forme, funcie de obiectivele
constructorului testului i, de asemenea, de metoda de pregtire a testului. Analiza
de itemi corespunde, mai nti, la un proces de selecie, n forma final fiind reinui
cei mai buni. n edumetrie, funcia de evaluare decide modul de desfurare a
analizei de itemi. n cadrul unui examen final, administrat n vederea unei evaluri
sumative, analiza de itemi va fi puternic diferit de aceea a unui instrument de
msur criterial, administrat n vederea unei evaluri diagnostice sau a unei evaluri
formative. Itemul care este considerat perfect n cadrul unei evaluri formative,
poate s nu posede caracteristicile dorite pentru o bun evaluare sumativ.
Am amintit anterior tipurile de analize care se pot face care pot susine
valabilitatea unui item. Aceste tipuri de analize se concretizeaz ntr-o serie de
indicatori cantitativi. Dintre indicatorii care pot ajute s selecionm itemii n funcie
de obiectivele de evaluare a unui test, sunt de menionat urmtorii:
Indicele de dificultate;
Indicele d discriminare;
Indicele de fidelitate;
Indicele de validitate
Aceti indici trebuie s fie interpretai n funcie de contextul n care
instrumentul din care trebuie s fac parte este folosit. Dificultatea itemului depinde
de grup(puternic sau slab) i de ateptrile fa de grup. Interpretarea dificultii
depinde de rspunsurile pe care le dm la urmtoarele ntrebri:
Itemul msoar un obiectiv esenial, intermediar sau o aptitudine
complex?
Este vorba de un grup puternic sau de un grup slab?
Indicele de dificultatea itemului.
n cazul testelor de randament, n care problema este pus n form
dihotomic , este important sistemul de scorare (adic s decidem dac la itemi
putem obine un punct sau nici un punct(dup sistemul totul sau nimic), sau
polihotomic(subiectul poate primi puncte pe o scal gradat de la 1 la k).
Procedura de calculare este de a mpri suma rezultatelor obinute de subieci la un
item la numrul total de subieci. Mediile nu permit de a calcula dificultatea relativ
a fiecrui item. Dac dorim s comparm dificultatea relativ a mai multor itemi,
trebuie s reducem mediile lor la o scal comparabil. Poate fi complicat de a
analiza rezultatele la un test ai crui itemi sunt notai pe scale diferite.
Interpretarea indicelui de dificultate poate fi influenat de doi factori:
1. numrul de rspunsuri omise;
2. probabilitatea de reuit a itemului prin pura ntmplare.
n situaia n care un mare numr de persoane nu a putut s rspund la un item,
din cauza limitrii timpului de administrare, indicele de dificultate nu reflect
veritabila dificultate a itemului. n astfel de situaii, indicele de dificultate msoar
dou aspecte: dificultatea itemului i rapiditatea respondentului
Este posibil de a corija indicele de dificultate prin efectul hazardului, de fiecare
dat cnd se poate admite o asemenea ipotez. Formula de corecie a indicelui de
dificultate prin hazard este urmtoarea:
Corecia nu este necesar pentru a compara indicii de dificultate. Dac formatul
ntrebrilor variaz(m=2,3,4,5) va fi necesar de a efectua corecia pentru a putea
compara dificultatea itemilor plecnd de la o baz comun.
Subiec
t
Item cu 2
alegeri
Item cu 4
alegeri
Item cu 6
alegeri
Item cu 8
alegeri
1 0 0 0 0
2 1 1 1 1
3 0 0 0 0
4 1 1 1 1
5 1 1 1 1
6 1 1 1 1
7 0 0 0 0
8 1 1 1 1
1
]
1
1
1
'
M
p
p p
Legend n aceast formul, semnificaia simbolurilor este urmtoarea:
p
sau
q
p
s
X X
r
x
p
pbis
p
X
media acelor rezultate globale la care subiectul a rezolvat corect
sarcina;
q
X
media acelor rezultate globale la care subiectul nu a rezolvat
corect sarcina;
X media rezultatelor globale la pentru ntregul lot de subieci;
s
x
= abaterea standard a tuturor rezultatelor globale;
p = indicele de eficacitate a itemului;
q = indicele de ineficacitate a itemului
Coeficientul de discriminare a unui item i este egal corelaiei ntre
punctajul la item, de cele mai multe ori exprimat prin 0 i 1, i valorile brute
ale ale rezultatului global la test al celor N examinai din eantion.
Un coeficient nalt de discriminare indic faptul c itemul corespunztor
difereniaz clar subiecii n buni i slabi , prin aceea c examinaii buni
rezolv corect itemul i examinaii slabii dau un rspuns fals, de cele mai
multe ori, la item.
Un coeficient de discriminare egal cu 0 exprima faptul c rspunsurile corecte
la itemi sunt distribuite n mod egal ntre subiecii cu performan crescut i
cei cu performan sczut.
Un coeficient de discriminare negativ indic faptul c itemii cu rspuns
incorect aparin subiecilor buni i cei cu rspuns corect subiecilor slabi( o
cauz ar fi c subiectul nu a neles sarcina respectiv.pentru calcularea
coeficientului de duscriminare exist mai multe metode )
Exemplu: S presupunem c aven la dispoziie datele rezultatelor a 12 subieci la un
item i i rezultatul global X (la un test de randament cognitiv).
Subiect Item i X(rezultat global la test)
1 1 63
2 0 47
3 1 76
4 0 55
5 1 79
6 1 68
7 0 51
8 1 62
9 0 48
10 1 59
11 0 44
12 0 43
P 0,5 X 57,91
Q 0,5 s
x
=12,1
83 , 67
6
59 62 68 79 76 63
+ + + + +
p
X
48
6
43 44 48 51 55 47
+ + + + +
q
X
82 , 0 5 , 0 5 , 0
1 , 12
48 83 , 67
pbis
r
Observm cu uurin, n tabelul cuprinznd rezultatele de la item i rezultatul
global, c rezultatul 1 la item corespunde la cele mai mari valori ale rezultatului global. n
condiiile n care indicele de eficien a itemului nu se schimb, dar rezultatele 1 la item
corespund celor mai slabe rezultate globale, situaia coeficientului de corelaie se
schimb radical. Ilustrm o asemenea situaie:
Subiect Item i X(rezultat global la test)
1 1 47
2 0 63
3 1 55
4 0 76
5 1 43
6 1 51
7 0 68
8 1 48
9 0 62
10 1 44
11 0 59
12 0 79
p 0,5 X 57,91
q 0,5 s
x
=12,1
82 , 0 5 , 0 5 , 0
1 , 12
83 , 67 48
pbis
r
Valoarea + 0,82 indic o valoare nalt a coeficientului de corelaie i
,n consecin, itemul este unul omogen, adic un item care trage n aceeai
direcie cu testul. Valoarea 0,82 indic un item eterogen, adic un item care nu
contribuie la capacitatea de discriminare a rezultatului global al testului.
Cealalt formul d un rezultate echivalent(varianta primului tabel):
82 , 0 1
1 , 12
92 , 9
5 , 0
5 , 0
1 , 12
91 , 57 83 , 67
q
p
s
X X
r
x
p
pbis
Corelaia punct biserial se aplic n situaia n care itemulul nu este dihotomic, ci
dihotomizat. Formula n acest caz devine:
y p
s
X X
r
x
q p
pbis
sau
y
p
s
X X
r
x
p
pbis
y
p
s
X X
r
x
p
pbis
Valoarea coeficientului de corelaie este slab.
Frederic M. Lord i Melvin R. Novick au demonstrat superioritatea cu 20%
a coeficientului de corelaie biserial fa de coeficientul de corelaie punct-biserial.
Urmtoarea ecuaie permite de a transforma un coeficient de corelaie punct-
biserial n unul biserial.
pbis bis
r
Y
q p
r
d b
b
P
M
43 , 0
14
6
8 6
6
+
c a
a
P
NM
B = P
M
-
P
NM
B = P
M
- P
NM
= 0,77 - 0,43 = 0,34
S-a obinut un grad de stpnire pozitiv, ceea ce presupune c itemul are
capacitatea de a diferenia.
Procedura de stabilire a fidelitii prin evidenierea consistenei
interne se bazeaz pe formulele Kuder-Richardson 20 i lui Cronbach. n
anul 1937, G.F Kuder i M.V. Richrsdson au dezvoltat un sistem de ecuaii
pentru determinarea coeficientului d fidelitate(K-R 2, K-R 8, K-R 14, K-R 20 i
K-R 21). Pentru a specifica utilizarea acestora, menionm c teoria clasic a
testulelor psihologice strict paralele indic urmtoarele postulate:
Itemii testului msoar un factor sau o trstur i numai una;
Coeficienii de corelaiile inter-itemi sunt egali;
Itemii au varian egale;
Itemii sunt de dificultate identic
Utilizarea lor este indicat n urmtoarele situaii:
Nici un postulat nu este verificat(K-R 2);
Doar postulatul 1 este verificat(K-R 8);
Primele dou postulate sunt verificate(K-R 14);
Primele trei postulate sunt verificate( K-R 20);
Toate cele patru postulate sunt verificate(K-R 21)
Utilizat frecvent este K-R 20. Aceasta se aplic pentru itemi al cror
rezultat este exprimat dihotom;
,
_
X
i i
s
q p
k
k
R K 1
1
20
Legend:
p
i
este propria celor care au rspuns corect a item;
q
i
este proporia celor care au rspuns incorect la item;
k este numrul de itemi;
s
X
este abatarea standard a rezultatului global la test.
Oferim un exemplu pentru aplicarea acestei formule:
:
Rezultatul este urmtorul:
Formula pentru stabilirea coeficientului de fidelitate este echivalentul
ecuaiei K-R 20, fiind folosit pentru cazul n cazul n care rezultatul itemilor
este exprimat sub form polihotomic.
,
_
X
i
s
s
k
k
2
1
1
,
_
X
s
q p
N
N
KR
coeficientul alfa ridicat nu este o dovad c un test msoar numai o
abilitate, trstur sau o dimensiune.
Formula coeficientului alfa necesit un numr mare de respondeni
pentru a putea estima consistena intern. n caz c numrul respondenilor
este mic, se nesocotesc prezumiile care stau la baza formulei, astfel nct
coeficientul alfa supraestimeaz sau subestimeaz fidelitatea populaiei.
Pentru procedura de stabilire a fidelitii prin folosirea unui test paralel
are ca dificultate faptul gsirii unui test paralel. n mediul constructorilor de
teste exist tendina de a creea forme paralele ale aceluiai test.
Chestionarul de personalitate 16 PF(care are drept autor pe R.B.Cattell) are
mai multe forme, dintre care amintim A,B,C i D . Fiecare chestionar este
compus din itemi diferii, care au aceiai destinaie psihodiagnostic. Dac
prima dat s-a aplicat forma A, retestarea se face cu forma B, Coeficientul de
corelaia obinut se mai numete i coeficient de echivalen i are o valoare
mai mic dect cel de stabilitate. Formele paralele ale testelor psihologice se
mai numesc i forme alternative. Cel mai mare risc n folosirea formelor
alternative este ca acestea s nu fie echivalente. Formele alternative sunt
mult mai uor de creat pentru caracteristicile bine definite, precum abilitatea
matematic, dect pentru trsturile de personalitate, aa cum este stima
de sine.
Strategia aleas pentru a determina fideltatea depinde de testul n sine
i e condiiile n care utilizatorul de teste intenioneaz s administreze
proba.
Fidelitatea bateriilor de teste
Profiluri de teste. Dup unul din criteriile formale de clasificare a
testelor, acestea se pot grupa n teste singulare, simple, elementare i
baterii de teste. Din exploatarea informaional a unui test elementar rezult
un singur punctaj, pe cnd sistemele de teste obin mai mult de unul.
Punctajele pot s aib autonomie sau s fie adunate ntr-un punctaj global.
Sistemele de teste sunt divizate n profilurile de teste i baterii de teste.
Profilurile de test sunt prezentri grafice ale rezultatelor mai multor
teste. Denumirea a fost creat n anul 1926 de ctre Rossolimo. n sensul
extins al cuvntului, profilul de test semnific o combinaie de mai multe
teste individuale care fiecare test singular conserv(pstreaz) autonomia.
Alegerea testelor elementare pentru un profil este dictat de nevoile
practice. Exemplu, pentru descrierea ngust a unei structuri de
personalitate individuale presupune un aa-numi profil de personalitate,
pentru descrierea structurii inteligenei, un profil de inteligen, pentru
descrierea unei aptitudini profesionale un profil profesional Se vorbete n
acest sens de o combinaie ad-hoc de teste singulare despre care se crede
c sunt create pentru un scop special i nu create arbitrar. Pentru un profil
de test nu sunt fixate exigene prea mari de natur metodologic.
Exemplu: Profil aptitudinal
n continuare prezentm un profil de personalitate(CPI)
n consecin, se ateapt ca fiecare test s fie ntr-o oarecare msur
fidel i s coreleze relativ sczut cu celelalte, s dovedeasc, independent
unul de altul, o suficient validitate logic sau empiric. Informaiile
dobndite din profilul total duc la o accentuat lrgire a domeniului
validitii. Interpretarea unui profil nu trebuie s plece doar de la testele
individuale, ci trebuie s fac posibil o viziune cuprinztoare.
Bateriile de teste sunt combinaii de mai multe teste individuale, n care
testele individuale i pierd autonomia lor i apar n serviciul unui scop
general, i anume acela de a cuprinde, pe ct posibil de exact, o
caracteristic a personalitii definit printr-un criteriu de validitate. Numele
de baterie de teste i gsete analogia, pe de o parte, n electrotehnic,
unde mai multe elemente galvanice sunt cuplate unul lng altul n
interiorul bateriei, pe de alt parte, n tehnica rzboiului, unde mai multe
tunuri contribuie pentru atingerea unui el de lupt. n ambele cazuri, se
ridic n esen problema efectivitii, numrul de voli, puterea de foc.
Criterii de valabilitate.
Alegerea testului individual pentru o baterie trebuie s fie ghidat dup
domeniul su de validitate, adic toate testele reunite ntr-o baterie trebuie
s cuprind o aceiai caracteristic a personalitii, chiar dac, dup
mprejurri, din puncte de vedere diferite Rmne deschis problema dac
domeniul caracteristicii este strict circumscris(de exemplu, capacitatea de
concentrare la diferite activiti) sau dac este mai vast(capacitatea de
randament intelectual general). Exigenele statistice fa de testele
individuale care compun o baterie de teste fac raportare la fidelitate i nu, cu
s-ar putea crede), la validitate, care este o chestiune primar a unui test. Au
fost dezvoltate procedee statistice n serviciul testului psihologic, cu ajutorul
crora , dintr-o serie de teste individuale, trebuie s alegem pe acela care
contribuie cel mai bine pentru cuprinderea unor caracteristici cercetate de
personalitate(care posed validitate logic)
Fidelitatea bateriilor de teste. Este vorba de baterii omogene de
teste. Estimarea se realizeaz prin intermediul formulei Spearman-
Brown(aceeai ponderare a sub-testelor). Formula este urmtoarea:
k= numrul de teste componente.
Exemplu pentru fidelitatea bateriilor omogene. Baterie de teste
care const din 4 subteste cu fidelitatea de 0,90, 0,86, 0,92, i 0,82. Dup ce
valorile se convertesc n valori standard z, se obine:
Formula pentru fidelitatea bateriilor eterogene. Se folosete cu luarea
n consideraie a intercorelaiilor dintre teste Formula este urmtoarea:
Se ia n consideraie exemplul anterior la care se dau
intercorelaiile ntre teste:
tt
tt
tt
r k
r k
bat r
) 1 ( 1
) *
+
38 , 1
4
51 , 5
4
16 , 1 59 , 1 29 , 1 47 , 1
'
+ + +
z
97 , 0
88 , 0 ) 1 4 ( 1
88 , 0 4
) (
+
bat r
tt
t s
st
t
tt
tt
r k
r k
bat r
2
1 ) (
Matricea corelaiilor interteste este urmtoarea
Testul 1 2 3 4
1 0,90 0,6 0,8 0,5
2 0,86 0,7 0,4
3 0,92 0,7
4 0,82
Cursul nr. 8 CII(constructia instrumentelor de investigatie)
Calculul fidelitii prin luarea n considerare a ponderii
testelor n baterie.
Formula de calcul este:
7 , 3 7 , 0 4 , 0 7 , 0 5 , 0 8 , 0 6 , 0
1
+ + + + +
s
st
r
96 , 0
7 , 3 2 4
5 , 3 4
1 ) (
+
bat r
tt
+
t t s
st t s t
t t
tt t t
tt
r G G G
r G G
batG r
2
1
2
2 2
Simbolurile Gs i Gt semnific n acest caz factorii de
ponderare ai subtestelor s si t
Date din exemplul anterior:Se presupun urmtorii factori de ponderare pentru
sub-testele individuale: G
1
= 3, G
2
= 7, G
3
= 4 i G
4
= 6. Se calculeaz valorile
necesare pentru formula:
Din cauza faptului c testele fidele 1 i 3 au fast valorizate sczut i testele
mai puin fidele 2 i 4 mult, a sczut fidelitatea global a bateriei de la 0,96 la
0,94.
Consideraii suplimentare despre testele paralele
S.S. Willks a dezvoltat pentru testele paralele i seriile de teste o metod de
verificare a echivalenei care se sprijin pe cele mai importante statistici de test.
n general, ca simbol de echivalen este utilizat litera L
Willks pretinde pentru k teste paralele, egalitatea mediilor, a varianelor i a
covarianelor. Mrimea de verificare derivat din Lmvc pentru eantioane mari
este (-N*lnL
mvc
) i este este distribuit dup
2
,
cu k(k+3)/2 grade de libertate,
variind de la 0 la 1. Dac M(media), v (variana) i c(covariana) pentru toate
formele paralele sunt egale, rezult L
mvc
=1 i (-N*lnL
mvc
) = 0. Statistica de
echivalen L pentru k teste paralele arat n felul urmtor:
110 6 4 7 3
2 2 2 2 2
+ + +
t
t
G
+ + +
t
tt t
r G 5 , 94 ) 82 , 0 6 ( ) 92 , 0 4 ( ) 86 , 0 7 ( ) 90 , 0 3 (
2 2 2 2 2
4 , 84 ) 7 , 0 6 4 ( ) 4 , 0 6 7 (
) 7 , 0 4 7 ( ) 5 , 0 6 3 ( ) 8 , 0 4 3 ( ) 6 . 0 7 3 (
+ +
+ + +
st
t s
t s
r G G
94 , 0
4 , 84 2 110
5 , 94 110
1
+
batG r
tt
[ ] [ ]
1
2 2
) 1 ( ) 1 ( 1 (
+ +
k mvc
v r s r k s
D
L
Pentru cazul cel mai simplu i mai practic cu dou teste paralele, formula
este urmtoarea:
Pentru trei teste paralele, formula este urmtoarea:
Semnificaii ale simbolurilor utilizate
D= determinantul n matricea varian covarian:
s
1
2
c
12
c
13
c
1k
c
21
s
2
2
c
23
c
2k
c
31
c
32
s
3
2
.. c
3k
.. .. . ..
c
k1
c
k1
c
k3
. s
k
2
s
j
2
= variana testului j;
c
je =
covariana
testelor j i e;
c
jc
= r
je*
s
j*
s
e
Pentru dou teste paralele determinantul se calculeaz prin formula:
Semnificaiile simbolurilor i modul de calcul sunt urmtoarele:
2
2 1 12
2
2
2
1
12
2
2
2
1
2
12
2
2
2
1
) (
2
1
) 1 (
2
) 1 (
2
) 1 (
X X r
s s
r
s s
r s s
L
mvc
+
1
]
1
+
+
+
2 2 2 2
2
23
2
13
2
12 23 13 12
2
3
2
2
2
1
) ( ) 2 1 (
) 2 1 (
v r s s r s
r r r r r r s s s
L
mvc
+ +
+
) 1 (
2
12
2
2
2
1 1 2 21 2 1 12
2
2
2
1 21 12
2
2
2
1
r s s s s r s s r s s c c s s D
paralele teste de numarul k
Concluzia
Valorii de echivalen obinut L
mvc
i este aplicat un logaritm natural i acesta
este nmulit cu valoarea negativ a lui N. Valoarea obinut este cutat n
tabelele
2
(chi ptrat). Valoare semnificativ a lui chi ptrat respinge ipoteza
echivalenei testelor paralele
Exemplu:
Acceptm faptul c dou forme paralele ale unui test au mediile de 70 i 72.
Variana primului test este de 200 i a celui de+al doilea de 210. Corelaia ntre
ambele forme este de 0,9 i N = 90 Stabilirea echivalenei se face n felul urmtor:
paralele testelor a medie var
2
2
ianta
k
s
s
j
j
paralele stelor atiilor te intercorel
) 1 (
2
1
2
media
s k k
c
r
j
estelor mediilor t var
1
) (
2
ianta
k
X X
v
j
testelor mediilor media
k
X
X
j
3 ) 3 (
2
k
df ln
2
+ k L N
mvc
9106 , 0
) 72 70 (
2
1
) 9 , 0 1 (
2
210 200
) 9 , 0 1 (
2
210 200
) 9 , 0 1 ( 210 200
2
2
1
]
1
+
+
+
+
mvc
L
0937 , 0 9106 , 0 ln
2 3 ) 3 2 (
2
2
df 4 , 8 ) 0937 , 0 ( 90 (
2
+
% 5 p
Ipoteza dup care cele dou forme de test sunt echivalente are mai puin de
5% verosimilitate. De aceea, o vom respinge i putem s considerm cele dou
forme neechivalente
Exemplu cu trei teste
Dac dorim s tim dac dificultatea diferit a testelor sau diferena ntre
variane a cauzat ne-echivalena, atunci putem aplica testul t sau testul F sau s
inserm datele n formulele anterioare. Se accept faptul c pentru un test sunt trei
forme paralele, care ar fi fost realizate pe un eantion de 130 de subieci
Media
Abaterea
standard
Intercorelaii
Rezultatul:
Recomandri APA
(American Psychological Association)
Principii generale
n materie de fidelitate, manualul probei va furniza informaii permind
lectorului de a aprecia dac rezultatele(la test) merit ncrederea pe care
o cer utilizrile indicate. Manualul va semnala n mod egal absena
oricrei informaii necesare care nu fost culeas. (Esenial).
Comentariu: manualul ofer informaii despre patru tipuri de fidelitate:
test - retest, par-impar, forme parale i intercorelaii ntre pri. El indic
n mod egal eroarea standard de msur i limitele de ncredere pentru
abaterea Q.I.- ului. Alte manuale menioneaz c fidelitile enumerate
rezult din analizele interne bazat pe o singur aplicare a testului.
Corelaiile ntre formele paralele i test - retest nu au fost calculate.
Manualul probei va furniza, n msura posibilului, o analiz cantitativ a
ansamblului variaiilor n urmtoarele componente principale: fluctuaiile
sau contradiciile n rspunsurile subiectului; inconsistena sau
eterogenitatea coninutului probei(de exemplu n itemi, ntrebri i
situaii); variaiile n administrarea testului; variaii ntre corectori sau
ntre unitile dispozitivului(aparat); n fine, erorile mecanice de
notare(foarte de dorit). (Comentariu: n general, analiza dorit va fi
8 , 27
1
X 3 , 28
2
X 9 , 27
3
X
9 , 9
1
s 1 , 10
2
s
4 , 10
3
s
93 , 0
12
r 92 , 0
13
r 90 , 0
23
r
21 , 1
2
) 046 , 0 91 , 0 7 , 102 7 , 102 ( ) 83 , 1 1 ( 7 , 102
)
2
90 , 0
2
92 , 0
2
93 , 0 90 , 0 92 , 0 93 , 0 2 1 (
2
4 , 10
2
1 , 10
2
9 , 9
+ +
+
x mvc
L
realizabil numai dac rezultatele sunt exprimate n termeni cantitativi,
diferii de categorii sau termeni non-parametrici, i dac planul de
culegere de informaii a datelor include controalele necesare. n cazul
probelor colective de cunotine, principalele surse de eroare pe care el
convine obinuit de a le evalua nglobeaz:
inconsistena sau eterogenitatea coninutului(admind faptul c n
materie de coninut o prob psihologic trebuie s prezinte acelai grad
de eterogenitate pe care materia considerat sau pe care funciile
necesare bunei utilizri a cunotinelor le impun);
variaiile n nsi aplicarea probei;
fluctuaiile rspunsului subiectului n funcie de timp, adic de
instabilitate. Datele vor fi culese dup un plan permind de a evalua cei
trei factori. La subiecii testelor proiective, fluctuaiile sau incoerena n
rspunsurile subiecilor constituie n mod obinuit principala surs de
eroare aleatorie de evaluat);
Manualul va furniza cel puin o evaluare de fidelitate sau de erori de
msur, chiar dac obiectivul probei vizeaz unic predicia
empiric(foarte de dorit). Comentariu: O astfel de informaie ajut
practicianul de a nelege proba, permindu-se astfel de a aplica i de a
interpreta mai inteligent, cum el nu o va face fr aceast informaie. n
anumite cazuri, de exemplu, cnd este vorba de a evalua efectul posibil
al lungirii probelor(testelor), informaiile relative la fidelitate sunt
indispensabile; de asemenea, manualul trebuie s le furnizeze
utilizatorului).
Normele relative la fidelitate cuprind fiecare rezultat de ansamblu,
fiecare rezultat parial sau fiecare combinaie de rezultate(precum suma
,diferena sau coeficientul) recomandate de ctre manualul de
prob(explicit sau implict) ntr-un alt scop dect o simpl ncercare pilot.
Esenial
n cazul instrumentelor utiliznd un profil n interiorul cruia diferenele
ntre rezultate(puncte) prezint o fidelitate puin ridicat, manualul va
pune explicit practicianul n gard contra unei interpretri fortuite a
diferenelor ntre rezultate. n caz contrar, cu titlu de eventualitate, se
cere o verificare prin alte mijloace. Esenial.
Manualul va meniona valoarea minimal de obicei necesar pentru ca o
diferen ntre dou rezultate s fie statistic semnificativ(foarte de
dorit).
n capitolul consacrat fidelitii i erorilor de msur,
manualul va descrie de o manier suficient de precis
procedurile i eantioanele utilizate, permind astfel
practicianului de a determina pn la ce punct faptele culese
se aplic persoanelor i problemelor de care el se ocup.
ESENIAL Comentariu: ntr-un grup, gradul de maturitate, variaiile
interindividuale i atitudinile fa de prob reprezint condiii normale de
utilizare a probei. Fidelitatea unui test destinat seleciei angajailor, de
exemplu, va fi calculat plecnd de la rezultatele unei populaii de
candidai de diverse posturi, mai degrab dect plecnd de la rezultatele
obinute de ctre studeni i muncitori deja angajai.)