Explorați Cărți electronice
Categorii
Explorați Cărți audio
Categorii
Explorați Reviste
Categorii
Explorați Documente
Categorii
Pentru a decide alegerea unui anumit test pentru o situaţie concretă este necesar să se
evalueze adecvarea lui la obiectivele examenului psihologic, adică în ce măsură testul este relevant
pentru diagnoza sau predicţia comportamentului care constituie scopul specific al examenului
respectiv.
Există o evaluare practică a testului și o evaluare tehnică.
Privind aspectele ce determină valoarea practică a testului putem enumera:
• Utilitatea
• Acceptabilitatea
• Caracterul direct
• Nonreactivitatea
• Caracterul compatibil
Utilitatea se referă la avantajul practic pe care îl putem obţine din utilizarea unui anume
instrument (Gottman, Leiblum, 1974, apud Minulescu, M., 2003), măsura în care instrumentul
ajută la rezolvarea unei probleme practice (realizarea intervenţiei), feedback privind eficienţa
intervenţiei, selecţie, promovare etc. Alte aspecte ale utilităţii sunt: scopul testului, lungimea,
ușurinţa în scorare, ușurinţa în intrepretare.
Acceptabilitatea se referă la necesitatea ca instrumentul să fie potrivit pentru persoana testată
din punct de vedere cognitiv și afectiv (să nu fie prea intruziv sau ofensiv).
Caracterul direct se referă la capacitatea testului de a reflecta comportamenztul real,
gândurile sau sentimentele reale ale persoanei. Măsurile indirecte necesită inferenţe, adică
posibilităţi de eroare. Testele de performanţă sunt considerate directe, în timp ce tehnicile
proiective sunt considerate indirecte. Toate instrumentele se situează pe o dimensiune ce unește
aceste două extreme. Atunci când se pune accent pe fidelitatea datelor, caracterul direct al testului
este decisiv.
Nonreactivitatea se referă la calitatea testului de a nu provoca o anumită reacţie subiectului,
influenţând astfel răspunsul. Această calitate are legătură și cu caracterul nonintruziv al
conţinutului, și cu dezirabilitatea acestora.
Adecvarea generală a instrumentului este criteriul final, adică măsura în care acesta este
compatibil pentru o evaluare fără complicaţii; instrumentele prea lungi sau prea complicate ca
scorare pot fi utile ca informaţie dar nepractice datorită consumului de timp. Adecvarea se referă
și la aspectele tehnice: fidelitate, validitate, obiectivitate, standardizare și etalonare.
1. Standardizarea
Standardizarea este o condiţie fundamentală a testului psihologic, unde orice variaţie a
condiţiilor produce o variaţie a rezultatelor.
Standardizarea se referă la două aspecte:
1. interpretarea rezultatelor unui subiect prin raportare la un standard sau etalon, adică la
media performanţelor obţinute la acelaşi test şi în aceleaşi condiţii de administrare de un
eşantion reprezentativ de subiecţi;
2. uniformizarea condiţiilor în care are loc examenul psihologic, adică standardizarea tehnicii
de administrare, cotare şi interpretare a rezultatelor;
Obiectivitatea se referă la măsurarea fără ambiguitate a capacităţilor persoanelor, deci
evaluatori diferiţi trebuie să obţină aceleaşi rezultate la evaluarea unui subiect.
Obiectivitatea mai este numită şi concordanţă interpersonală (Stan, 2002) şi este un aspect
ce ţine de standardizarea testelor psihologice.
2. Obiectivitatea
Se spune despre un test că este obiectiv dacă permite să se măsoare fără ambiguitate
capacităţile unei persoane (Klausnitzer, 1992). În literatura de specialitate se menţionează trei
condiţii ale obiectivităţii:
· Rezultatele să nu depindă de nivelul pregătirii subiectului în domeniul testării psihologice
· Fiecare răspuns la item să fie interpretat la fel de către mai mulţi experţi
· Scorul să nu fie influenţat de personalitatea examinatorului, adică să aibă cotare obiectivă
3. Fidelitatea
3.1. Definiţie şi noţiuni de bază
Acest principiu psihometric se referă la precizia cu care un test măsoară o caracteristică. Se
spune că un test este fidel dacă atunci când se aplică de mai multe ori în aceleaşi condiţii, rezultatele
sunt identice de fiecare dată. Fidelitatea absolută înseamnă absenţa totală a erorii de măsură, deci
scorul obţinut este egal cu scorul real. Dar acest lucru nu se întâmplă niciodată în practică şi atunci
vorbim doar despre fidelitatea relativă a unui test.
Orice scor la un test psihologic este rezultatul dintre scorul real şi eroarea de măsură.
X=V+E
unde
X = scorul măsurat (observat)
V = scorul real
E = eroarea de măsură
Dacă scorul măsurat este egal cu scorul real (deci eroarea este 0), coeficientul de fidelitate
va avea valoarea 1.
Dar cum în practică acest lucru nu este posibil, pentru ca un test să fie considerat fidel trebuie
să aibă un coeficient de fidelitate mai mare decât 0.70.
Când facem o apreciere ştiinţifică, ne interesează care este intervalul în care se găseşte scorul
real. Deoarece în activitatea practică nu putem obține scoruri multiple la același test pentru un
subiect și nici nu putem face o medie al lor pentru a obține o estimare a scorului real, scorul
disponibil poate fi plasat într-un interval creat pe baza valorii SEM. Acest interval se numeşte
interval de încredere şi este definit de probabilitatea ca scorul real al persoanei la un test să se
găsească între anumite limite.
IC = X ± Z * Se
Scorul Z va fi ales în funcţie de precizia cu care dorim să lucrăm. Dacă alegem să lucrăm cu
o probabilitate de a răspunde corect de 95%, Z = 1.96; pentru o precizie de 99%, Z = 2.58.
Este de reţinut că:
• intervalul de încredere depinde de coeficientul de fidelitate al testului; dacă avem
coeficienţi de fidelitate mici, intervalul se măreşte, deci eroarea și eroarea standard a
măsurării este mai mare;
• intervalul de încredere depinde de abaterea standard a scorurilor la test.Cu cât împrăștierea
datelor este mai mare, cu atât și intervalul de încredere se lărgește.
Ca exemplu:
S-a aplicat un test la un număr de subiecţi. Conform rezultatelor obţinute, media scorurilor
la test (x) a avut valoarea egală cu 18, abaterea standard egală cu 5 iar coeficientul de fidelitate
egal cu 0.90. Ne interesează să aflăm în ce limite s-ar afla adevăratul parametru al populaţiei,
tinând cont de faptul că se decide la un nivel de încredere de 95%.
Deci:
Z = 1.96
X = 18
Sx = 5
rxx = 0.90
Aplicând formula:
Se = 5√1 − 0.9
Se = 1.58
�±E
IC = X
IC = 18 ± 3.10 deci [21.10; 14.90]
Deci putem afirma cu un risc de a greşi egal cu 5% că media scorurilor la testul aplicat în
populaţie se va găsi în intervalul [21.10; 14.90].
Fidelitatea unui test psihologic se referă la două aspecte: consistenţa internă şi stabilitatea în
timp a rezultatelor testării.
Consistenţa internă
O bună consistenţă internă a unui test presupune o corelaţie ridicată între itemii testului
respectiv şi exprimă faptul că toate întrebările testului evaluează aceeaşi trăsătură. Metoda care
evaluează acest aspect poartă denumirea de metodă consistenţei interne.
Stabilitatea în timp a rezultatelor testării
Ne indică în ce măsură, la aplicări diferite în timp, un subiect obţine rezultate similare la un
test psihologic. Metoda care evaluează acest aspect al fidelităţii unui test se numeşte metoda
formelor paralele.
În afara acestor metode care sunt obligatorii pentru evaluarea fidelităţii unui test, se mai pot
utiliza încă două metode: metoda formelor (testelor) paralele şi metoda fidelităţii interevaluatori.
Aceste formule țin cont de corelașia dintre performanțele la toți itemii din cadrul unui test.
Mărimea acestor coeficienți depinde de numărul itemilor din test și de raportul dintre variabilitatea
performanțelor persoanelor testate la itemii testului și dispersia totală a scorurilor testului. Valorile
acestor coeficienți vor fi înalte pe măsură ce numărul de itemi crește și pe măsură ce raportul dintre
dispersia scorului unui item și dispersia totală a scorurilor testului descrește.
Atunci când se urmărește omogenitatea tuturor itemilor testului, mărimile coeficienților K-
R și α reprezintă indicatori ai măsurii în care acest obiectiv a fost atins.
• calcularea corelaţiei între două jumătăţi ale testului cu ajutorul formulei lui Pearson, după
care se aplică coeficienții de corecție Guttman sau Spearman – Brown. Ei se folosesc
deoarece rezultatele se referă la un test cu o lungime de două ori mai mică decât cea a
testului original. Înjumătățirea testului poate fi obținută pri mai multe modalități. Pot fi
selectați itemii pari și itemii impari, itemii care formează prima jumătete și pe cei care o
formează a doua jumătate a testului, itemii de la extreme către mijloc, etc, condiția este ca
cele două jumătăți să fie alcătuite din itemi care sunt proporționali ca și dificultate. Având
în vedere că numărul de jumătăţi posibile ale unui test este foarte mare şi este foarte greu
ca două jumătăţi să fie exact egale, este indicat să se calculeze unul din indicii de
consistenţă internă prezentaţi anterior.
Kaplan şi Saccuzzo (1993) sesizează foarte întemeiat că toate măsurile care evaluează
consistenţa internă determină de fapt gradul în care fiecare item diferit măsoară aceeaşi trăsătură
sau abilitate. Acest lucru presupune implicit că testul este omogen, în caz contrar acesta neavând
consistenţă internă. Pentru testele neomogene, procedeul cel mai indicat este analiza factorială,
prin care se vor putea subîmpărţi itemii pe grupe omogene, subtestele ce rezultă având fiecare o
consistenţă internă ridicată, dar fiind relativ independente unul în raport cu celelalte, ca în cazul
subscalelor testului de prsonalitate 16PF Cattell.
Aiken (1997) sesizează de asemenea că cele trei procedee de determinare a fidelităţii amintite
anterior supraestimează valoarea acesteia pentru testele în care este implicată viteza. În acest caz,
procedurile de apreciere a fidelităţii trebuie modificate, recomandarea făcută fiind aceea de a
administra cele două jumătăţi ale testului în momente diferite, dar cu limită de timp egală, după
care se calculează fidelitatea făcându-i-se corecţia cu formula Spearman – Brown.
Coeficienţii de stabilitate obţinuţi prin aceeaşi metodă se calculează când testul măsoară o
caracteristică durabilă şi exprimă gradul în care scorurile aceluiaşi subiect la acelaşi test sunt
constante de la o aplicare la alta.
Metoda presupune două aplicări identice ale aceluiaşi test cu un interval de timp recomandat
a fi cuprins între 3 şi 6 luni.
Factori care influenţează calculul fidelităţii test-retest
• Intervalul de timp între test şi retest. Dacă timpul este prea scurt există o mare probabilitate
ca subiecţii să îşi reamintească răspunsurile date anterior, respectiv un timp prea lung între
test şi retest poate determina maturizarea eşantionului de subiecţi. Astfel dacă aplicăm un
test de percepţie la 4 ani şi îl reaplicăm la un interval de 6 luni există o mare probabilitate
să obţinem rezultate diferite la cele două administrări ale testului deoarece în intervalul de
6 luni subiectii s-au maturizat. În acest caz, retestul va include în evaluare nivelul de
maturizare al subiecţilor. Datorită acestor argumente este de multe ori dificil de stabilit cu
exactitate un timp optim între test şi retest.
Întotdeauna când se calculează acest coeficient trebuie precizat intervalul scurs între test şi
retest, vârstă subiecţilor precum şi condiţiile în care s-au administrat testele pentru a putea
identifica eventualele surse de eroare de măsură.
• Gradul de dificultate al itemilor. Dacă itemii sunt fie prea uşori, fie prea dificili, se vor
obţine coeficienţi de stabilitate ridicaţi deoarece itemii testului fie vor fi rezolvaţi de
majoritatea subiecţilor (în primul caz) fie nu vor fi rezolvaţi nici la test, nici la retest (al
doilea caz).
• Schimbări ale subiectului determinate de prima aplicare. Pot exista o serie de situaţii în
care se obţin performanţe diferite la retest deoarece subiectul fie a învăţat să răspundă la
itemi după prima administrare, fie această primă administrare a determinat schimbări de
atitudini faţă de o anumită problemă.
3. 2. 4. Fidelitatea interevaluatori
Este necesar a fi ca1culată în cazul testelor care nu au o cotare obiectivă aşa cum sunt testele
proiective de personalitate la care scorul este influenţat şi de interpretarea pe care o dă persoana
care face cotarea. Pentru a verifica în ce măsură scorul la test este influenţat de modalitatea în care
se face cotarea de către diferite persoane se va cere la diferiţi evaluatori să ca1culeze scorurile la
test, iar apoi se va realiza un coeficient de corelaţie interevaluatori. Acest coeficient va exprima
măsura în care testul este independent de erori datorate modalităţii de cotare a răspunsurilor
subiectului.
Coeficienţii de fidelitate transformaţi în coeficienţi de determinare (pătratul coeficientului de
fidelitate) relevă proporţia în care varianţa totală a rezultatelor psihometrice se datorează varianţei
"reale" - diferenţelor individuale reale - sau din contră, varianţei "eroare", definită diferit, în funcţie
de metoda particulară urmată în stabilirea tipului de fidelitate (Kulcsar, 1980). În consecinţă, deşi
semnificaţia diferiţilor coeficienţi de fidelitate nu este aceeaşi, totuşi orice coeficient de fidelitate,
ridicat la pătrat, poate fi interpretat în termeni de procentaj al varianţei randamentului la test. Astfel
de exemplu, un coeficient de fidelitate de .80 înseamnă că .802=64% din varianţa totală a
rezultatelor psihometrice considerate se datorează varianţei reale a domeniului explorat, iar 36%
varianţei eroare, generată de unele din sursele multiple ale deosebirilor în rezultatele psihometrice.
Când avem de ales dintr-o mulţime de teste având toate celelalte caracteristici egale, este de
preferat testul care are cea mai mare fidelitate. Nu este posibil să se specifice un nivel minim care
să fie impus coeficienţilor de fidelitate ai tuturor testelor.
Fidelitatea chestionarelor de personalitate si a celor de interese tinde să fie mai mică decât
cea a testelor cognitive (de cunoștinţe, de inteligenţă, de aptitudini speciale) (Aiken, 1994). Testele
cotate obiectiv care măsoară aptitudini cognitive pot furniza, în loturi eterogene de persoane,
coeficienţi de fidelitate mai mari decât 0.8. Testele cotate subiectiv care măsoară aptitudini, testele
demcunoștinţe și cele care evaluează performanţe tipice (de exemplu, chestionare de personalitate)
au, adesea, coeficienţi de fidelitate mai mici decât 0.80 (Traub, 1994).
Testele cu alegere multiplă pot avea o fidelitate mai scăzută.
B. Eșantionul de subiecţi să fie reprezentativ pentru populaţia căreia îi este destinat testul. El
trebuie să fie la fel de eterogen ca si această populaţie, întrucât gradul de omogenitate al
eșantionului are influenţă asupra mărimii coeficientului de fidelitate.
D. Procedura de administrare a testului si a retestului sau a celor două forme paralele ale
testului să fie identică și, în același timp, să fie aceeași cu cea care se va utiliza în practică. Astfel,
de exemplu, dacă se prevede ca testul să fie administrat cu limită de timp, în 40 de minute, atunci
acest interval de timp va fi respectat si la administrarea testului pentru estimarea fidelităţii.
2. Este posibil ca un test să aibă un coeficient de consistență internă ridicat, dar un coeficient de
stabilitate scăzut? Explicați de ce.
3. Dacă la un test de memorie o persoana a obţinut un scor egal cu 26, care este intervalul in care
se găseşte scorul real al persoanei dacă coeficientul de fidelitate al testului este 0,74, iar abaterea
standard a scorurilor la test este 2,6? Ce înseamnă acest interval de încredere?
4. Un studiu a urmărit crearea unei grile se observaţie a 10 alcoolici în scopul determinării metodei
de psihoterapie optimă. Grila conţine 3 categorii distincte: hipnoză, joc de rol, tehnici cognitiv-
comportamentale. Rezultatele obţinute de 2 evaluatori independenţi pe evaluări simultane sunt
redate în tabelul următor. Ce puteţi spune despre grila de observaţie?
subiecţi
Hipnoză Joc de Tehnici cog- Hipnoză Joc de rol Tehnici cog-comp
rol comp
1 * *
2 * *
3 * *
4 * *
5 * *
6 * *
7 * *
8 * *
9 * *
10 * *
1 2 3 4 5 6 7 8
Subiecţi
Evaluatori
E1 20 23 27 21 19 16 22 17
E2 21 23 26 22 17 19 20 18
E3 19 22 28 20 15 14 23 11
E4 8 18 13 11 9 7 17 5