Sunteți pe pagina 1din 5

VI. Fidelitatea testelor psihologice.

Metode practice de determinare

Scopul determinării fidelităţii unui test este de a şti ce grad de încredere putem avea în scorul
obţinut la acesta de un subiect. Cu alte cuvinte, gradul de precizie cu care testul măsoară ceea ce prin
destinaţie ar trebui să măsoare.
O măsurare nu este niciodată perfect exactă. Ea comportă o anumită marjă de eroare. Cu cât
această marjă de eroare este mai redusă sau mai scăzută, cu atât mai mult se poate avea încredere în
metoda utilizată (şi invers). Testele psihometrice fondate pe tehnici statistice sunt ca nişte „iceberguri”
– partea cea mai importantă şi mai semnificativă nu este la suprafaţă. Dincolo de metodele de evaluare
a conţinutului aparent al testului, avem ansamblul metodelor subadiacente testând fidelitatea şi
validitatea, bazat pe tratamentul statistic al răspunsurilor furnizate de diferite la itemii testului.
Teoria clasică a testelor (teoria scorului adevărat/real) arată că scorurile obţinute la un test
reflectă o trăsătură subadiacentă (ipotetică), adesea numită şi trăsătură latentă. Nivelul „adevarat”
(real) al trăsăturii evaluată la un individ poate fi aflat desprinzând în scorul obţinut partea de eroare a
măsurătorilor efectuate. Principiile esenţiale ale T.C.T. (teoria clasică a testelor) sunt:
1. indivizii umani posedă însuşiri, caracteristici personale (aptitudini, trăsături) relativ stabile.
2. Scorurile obţinute (observate) la teste sunt rezultantele unui scor „adevărat” şi ale unei părţi
de eroare a măsurătorii, adică:
X=T+e, unde

X – scor observat,
T – scor adevărat (de la englezescul true) şi
e – scor eroare.
3. Erorile se distribuie (după legea normală) de o parte şi de alta a scorului adevărat/real. Cu
alte cuvinte, repetarea la infinit a măsurătorilor conduce la minimizarea erorilor şi la
aproximarea cât mai bună a scorului adevărat (real). De exemplu, cu cât cântărim/măsurăm
greutatea unui individ de mai multe ori, cu atât media acestor măsurători furnizează o
aproximaţie mai corectă (satisfacătoare) a greutăţii sale reale.
4) Dacă măsurăm aceeaşi caracteristică cu acelaşi instrument la un mare număr de persoane, vom
constata că se verifică următoarele legi: a) media scorurilor „adevărate” se apropie de media scorurilor

24
observate (deoarece erorile de măsurare se distribuie după o lege/curbă normală). Erorile a căror
distribuţie are media zero vor avea tendinţa să se anuleze unele pe altele; b) atunci când media
măsurătorilor va fi egala cu zero, nu vom putea vorbi de varianţa lor. Cu cât cântărim de mai multe ori
un individ, cu atât media acestor măsurători va furniza o aproximaţie mai corectă a greutăţii sale reale.
c) dacă măsurăm aceeaşi caracteristică cu acelaşi instrument la un număr mare de persoane, vom avea
că varianţa scorurilor obţinute (observate) este egală cu varianţa scorurilor „adevărate” + varianţa
scorurilor eroare, adică: Sx² = Sт² + Se², unde Sx² - varianţa scorurilor observate, Sт² - varianţa
scorurilor adevărate, iar Se² - varianţa scorurilor eroare.
Fidelitatea este definită ca gradul de exactitate a măsurării formale a scorurilor adevărate.
Dar definiţia de mai sus nu ne furnizează şi o metodă de calcul, deci nu poate fi măsurată direct
varianţa scorurilor adevărate. Trebuie o metodă care să permită estimarea acestei varianţe.

Metode practice de determinare a fidelităţii unui test

1) METODA TEST – RETEST - constă în a aplica de două ori în aceleaşi condiţii acelaşi test, pe
acelaşi grup de subiecţi. Coeficientul de corelaţie pe care îl obţinem (între rezultatele celor două
aplicări) este numit de obicei coeficient de stabilitate.

Probleme:
 Corelaţia test-retest depinde în parte de stabilitatea temporală a caracteristicilor/trăsăturilor
măsurate. Astfel, se constată în general că fidelitatea test-retest scade cu timpul. De aceea, este necesar
să se ia în consideraţie intervalul de timp dintre cele 2 aplicări când se interpretează/apreciază
coeficientul de fidelitate al testului.
Ex.: Când se evaluează însuşiri de „stare” (de exemplu, anxietatea stare) şi nu „trăsături” (care
sunt pattern-uri relativ durabile şi consistente în timp), se pot obţine valori test-retest ridicate
(0.80 – 0.90) la interval de 2 – 3 săptămâni. Aceste valori pot scădea până la 0.60 sau mai puţin când
intervalul de timp este de ordinul anilor.
R. B. Cattell consideră că măsurarea fidelităţii test-retest cu intervale de timp scurte/lungi
furnizează informaţii diferite.

25
 Când retestarea se face la un interval scurt (cel puţin 2 săptămâni) se obţine un
coeficient de încredere privind instrumentul de măsură (timpul este prea scurt pentru a se
produce schimbări semnificative ale trăsăturii).
 Când retestarea se face la intervale mai lungi (cel puţin 2 luni) se obţine un coeficient
de stabilitate.
Dacă se scade coeficientul de stabilitate din coeficientul de încredere se poate obţine partea de
variantă care se datorează fluctuaţiei reale a trăsăturii.
 În cazul în care perioada de timp scursă între cele două aplicări succesive este prea scurtă, există
riscul – mai ales la testele de randament (eficienţă, la care răspunsrurile pot fi corecte/greşite) – ca
prima aplicare să influenţeze mărimea scorului la cea de-a doua (de pildă, subiecţii îşi aduc aminte
soluţiile alese prima dată sau itemii care le-au pus probleme sau se obişnuiesc cu sarcinile testului).
 O altă problemă constă în tendinţa de supraestimare a valorii coeficientului de fidelitate prin
corelarea (în ansamblu) a itemilor între ei. Se introduce astfel o varianţă sistematică, specifică itemilor
utilizaţi. Aceasta are la bază tendinţa subiecţilor de a răspunde la fel la itemi identici.

2) METODA FORMELOR ECHIVALENTE SAU PARALELE

Se încearcă evitarea problemelor care ţin de utilizarea primei metode (familiarizarea cu


probele, tendinţa de a răspunde la fel la itemii identicietc.). La „retest” se utilizează o „altă versiune” a
testului construită din itemi diferiţi ca formulare, dar avându-se în vedere ca atât conţinutul cât şi
forma şi/sau dificultatea itemilor să fie comparabile (de aceea, se numesc forme echivalente).
Coeficientul de corelaţie pe care îl obţinem prin corelarea celor două forme este numit coeficient de
echivalenţă. Pentru testele de personalitate mai lungi, construirea de forme paralele este mai dificilă.
În practică este dificil de conceput un număr mare de itemi paraleli (atât sub aspectul
conţinutului verbal care trebuie să fie diferit dar fără ca aspectele la care fac referire itemii să difere,
cât şi sub aspectul echivalenţei). Costurile pentru construcţie sunt şi ele mai mari. Este posibil ca cele
două forme ale testului să nu acopere exact acelaşi domeniu de măsurare (ci subdomenii diferite şi
inadecvat eşalonate). Motiv pentru care, valoarea coeficientului de fidelitate (corelaţia) calculat prin
corelarea celor două forme echivalente este, de obicei, mai scăzută decât în cazul test-retest.

26
3) METODA ÎNJUMĂTĂŢIRII (Split half)

Constă în divizarea în 2 părţi a testului, astfel încât să se obţină două serii de scoruri distincte
asupra cărora să se poată aplica calculul de corelaţie. Divizarea se poate face prin separarea primei
părţi a testului (jumătate din numărul total de itemi) de cea de-a doua sau prin separarea itemilor
impari de cei pari. Coeficientul de corelaţie obţinut se apropie de coeficientul de echivalenţă (descris
anterior), deosebirea fiind că administrarea itemilor se face într-o singură şedinţă (ceea ce constituie un
avantaj). Dacă corelaţia este suficient de ridicată şi itemii suficient de numeroşi, ne putem decide să
împărţim testul în 2 jumătăţi, fiecare dintre acestea putând fi considerată o formă paralelă. Însă, şi în
acest caz apar o serie de probleme:
 Corelaţia obţinută subestimează fidelitatea reală, pentru că cele 2 jumătăţi comparate sunt
mai scurte decât proba în întregime (iar probele scurte sunt mai vulnerabile la erori întâmplătoare de
eşantionare). De aceea, există o formulă de corecţie a fidelităţii prin înjumătăţire (Spearman-Brown)
care (teoretic) are valoarea unui coeficient pentru un test de două ori mai lung.
 O altă problemă constă în faptul că erorile de eşantionare a conţinutului testului (de pildă,
erorile întâmplătoare provenite din intervenţia hazardului statistic în distribuţia itemilor în fiecare din
cele două părţi) pot influenţa valoarea coeficientului de fidelitate prin înjumătăţire.

4) METODA DETERMINĂRII CONSISTENŢEI INTERNE (sau omogenităţii itemilor)

Constă în a calcula corelaţiile între fiecare item şi scorul total. Coeficientul obţinut se numeşte
coeficientul de consistenţă. (omogenitate). Calcularea consistenţei interne nu are sens decât pentru
testele unidimensionale (care măsoară o singură trăsătură – de pildă testele de aptitudini specifice) sau
pentru scalele care se referă la un singur factor/faţetă a personalităţii în chestionarele de personalitate.
Pentru itemii dihotomici la care răspunsurile se cotează cu 1 – adevărat (corect) sau 0 – fals (incorect),
corelaţia cu scorul total (variabilă continuă pe un anumit interval provenind de obicei din însumarea
scorurilor la itemi) se calculează utilizându-se coeficientul de corelaţie punct-biserială ( rpbis ).

27
Există o legătură cu metoda înjumătăţirii, întrucât media ansamblului corelaţiilor tuturor
înjumătăţirilor posibile pornind de la un anumit număr de itemi este foarte apropiată de media tuturor
corelaţiilor între itemi.
Pentru calculul (mai simplu) al consistenţei interne se utilizează formule bazate pe raportul
între suma varianţei itemilor (sau ansamblului de itemi) şi varianţa scorul global (total) la test. Cel mai
cunoscut coeficient în acest sens este coeficientul alfa (α) al lui Cronbach (pentru variabile continue).

28

S-ar putea să vă placă și