Sunteți pe pagina 1din 24

Fidelitatea și teoria clasică a

testării (CTT)

Asist. univ. dr. Claudiu Papasteri


Caracteristici psihometrice – rațiuni și
delimitări
 Ori de câte ori utilizăm un instrument trebuie
să ne asigurăm că acesta măsoară bine
constructul dorit.
 Rezultatele pe care le obținem în urma
măsurării trebuie să fie credibile.
 Ne așteptăm ca testele psihologice să măsoare
foarte bine constructul și să reflecte realitatea.
 Testul trebuie să ofere rezultate constante în
timp (să măsoare bine) și să măsoare ceea ce
și-a propus.
 Din combinarea celor două posibiliăți rezultă 4
situații:
a. Testul măsoară ce și-a propus să măsoare și o face bine
(soundness) – situația ideală.
b. Testul măsoară ce și-a propus și o face cu erori.
c. Testul nu măsoară ce și-a propus și o face bine bine.
d. Testul nu măsoară ce și-a propus și o face cu erori.
 Un test este utilizabil atunci când răspundem
pozitiv la următoatele întrebări: este fidel?” și
„Testul este valid?”.
 Cu alte cuvinte, testul trebuie să dispună de
proprietăți psihometrice.
 Caracteristicile psihometrice sunt acele însușiri ale testelor
care asigură un înalt grad de credibilitate rezultatelor.

 Cele mai importante caracteristici psihometrice sunt


fidelitatea și validitatea.

 Fidelitatea ne arată gradul în care un test manifestă


constanță în măsurare. În ce măsură testul oferă rezultate
asemănătoare dacă evaluăm subiectul în mod repetat
folosind același instrument.

 Validitatea ne indică capacitatea testului de a măsura ceea


ce și-a propus.
Teoria Clasică a Testării (CTT)
 Teoria clasică - asumpții simple propuse de
teoreticienii testării
 Idea fundamentală a CTT este că scorurile la
teste sunt infleunțate de două tipuri de factori:
◦ Factori care contribuie la consistență. Aceștia constau
în întregime din atributele stabile ale individului pe
care examinatorul dorește să le măsoare.
◦ Factori care contribuie la inconstință. Aceștia includ
caracteristici ale individului, testului sau situației care
nu au nicio legătură cu atributul măsurat, dar care
afectează scorurile.
Surse de eroare
 Selecția itemilor
◦ Selectarea unui eșantion cât mai reprezentativ al unei populații infinite
de itemi nu e ușor
◦ Ex. studenții bine pregătiți pot pica ușor dacă întrebările sunt din notele
de subsol al cărții: studentul conștiincios va avea scor mai mic decât
scorul lui real (al abilității), în timp ce alții mai norocoși vor avea scorul
mai mare decât cel real datorită erorii de măsurare pozitive.

 Administrația testului
◦ Influențe de mediu (temperatură, luminozitate, orice crează inconfort)
◦ Stari psihologice (fluctuații momentane/situaționale ale: anxietății,
atenției, motivației, oboselii)
◦ Influențe ale examinatorului
◦ (cel mai frecvent și dureros) Ex. la test grilă vrei sa lași un item
necompletat și să rezolvi în continuare dar din greseală începi prin a
răspunde la itemul pe care nu voiai să îl abordezi încă și astfel toate
răspunsurile de la acel punct înainte sunt defazate și nu reflectă
răspunsurile pe care voiai sa le dai.
Surse de eroare
 Scorarea testului
◦ Subiectivitatea în scorare (ex. teste proiective) -> din fericire majoritatea
testelor au criterii bine definite pentru scorarea răspunsurilor

 Eroarea sistematică de măsurare


◦ Ex. Scală pentru introversie socială inevitabil evaluează în mod consistent
și anxietatea; astfel ecuația pentru scorurile observate incorporează atât
eroarea nesistematică, cât și pe cea sistematică:

◦ Utilizarea unor metode adecvate de construcție a testelor poate minimiza


impactul erorilor sistematice.
◦ Totuși, este foarte greu, dacă nu imposibil, să evaluezi o trăsătură în
izolare pură de altele.
Eroarea de măsurare și fidelitatea
 Asumpții CTT:
1. Erorile de măsurare sunt aleatoare.
2. Media erorilor de măsurare este 0.
3. Scorurile reale și erorile de măsurare sunt necorelate.
4. Erorile la teste diferite sunt necorelate.

Coeficient de fidelitate: , echivalent

rxx indică proporția din varianța în scorurile observare explicată de varianța


în scorurile totale.
Problema este că acestă formulă este doar conceptuală. Ce indici folosim
dacă știm că aceștia vor fi între 0 și 1 (ca acesta), că fidelitatea se referă la
consistență în măsurare și că fidelitatea este micșorată atunci când erorile
de măsurare domină scorurile obținute
Fidelitatea
 Cele mai întâlnite forme de fidelitate sunt:
◦ Fidelitatea test-retest
◦ Fidelitatea formă alternativă
◦ Fidelitatea half-split
◦ Fidelitatea Kuder-Richardson
◦ Fidelitatea Cronbach alpha
◦ Fidelitatea inter-examinator

 Coeficientul de fidelitate poate lua valori


cuprinse în intervalul 0 – 1.
Fidelitatea test-retest
 Presupune aplicarea unui test, în momentul t1, pe un grup de
subiecți și apoi aplicarea lui, pe același eșantion, în momentul t2.
 În continuare se calculează valoarea coeficientului de fidelitate
(rtt) care ne arată la ce nivel corelează cele două serii de
rezultate. Distanța dintre cele două evaluări poate fi mai mică
(zile, săptămâni) sau mai mare (luni, ani).
 Cercetările au arătat că o distanță mică între testări asigură o
valoare mai mare a fidelității. Totuși, cu cât intevalul este mai
mic, cu atât mai mult se poate întâmpla ca subiecții să fie
influențați de recunoașterea principiului de construcție a testului.
 Se recomandă ca timpul dintre cele două testări să nu
depășească șase luni.
 În cazul copiilor, datorită schimbărilor accentuate ca urmare a
dezoltării progresive se recomandă ca timpul să fie mult mai
scurt.
Fidelitatea formă alternantă
 Se aplică un test pe un grup de subiecți și, după un anumit
interval de timp, se aplică pe același eșantion un test care
este echivalent cu primul.
 În cazul în care forma alternantă se aplică imediat după
prima variantă, vorbim de fidelitate formă alternantă
imediată.
 În cazul în care forma echivalentă se aplică după mai mult
timp, vorm de fidelitate formă alternantă întârziată.
 Sursa erorii în cazul fidelității formă alternantă imediată
este eșantionarea conținutului.
 În cazul fidelități formă alternantă întârziată sursa erorii
este reprezentată de eșantionarea conținutului, dar și de
eșantionarea timpului.
• Două instrumente sunt echivalente atunci
când:
a. Obiectivul urmărit prin măsurare este
același.
b. Număr aproximativ egal de itemi.
c. Itemi cu coeficient de dificultate
asemănător.
d. Modalitatea asemănătoare de răspuns.
Fidelitatea half-split
 Testul este împărțit în două jumătăți, acestea devenind într-un sens
teste independente ce sunt aplicate pe același grup de subiecți.
 Cea mai adecvată metodă pleacă de la numărul de ordine al itemilor.

În prima jumătate vor fi itemii cu soț (2, 4, 6 etc.), iar în a doua


jumtătate vor fi itemii fără soț (1, 3, 5 etc.).
 Valoare indicelui de corelație dintre cele două jumătăți ne oferă o

valoare subestimată a fidelității.


 Pentru a calcula fidelitatea întregului test vom aplica formula

Spearman-Brown:

 rtt = fidelitatea testului; rhh = corelația privind jumătatea de test


 Exerciții
1. Dacă coeficientul de fidelitate (rtt) calcultat cu
formula Spearman-Barown a fost de 0,75. Cât a
fost corelația dintre cele două jumătăți ale
testului?
 0,75+0,75*rhh = 2*rhh => rhh = 0,75/(2-0,75) = 0,6

2. Același test a fost împărțit în alte două


jumătăți considerate echivalente, iar coeficientul
de corelație dintre jumătăți (rhh) a fost de 0,63.
Cât este coeficientul de fidelitate
 2*0,63/(1+0.,63) = 0,77
 Creșterea sau scăderea numărului de itemi ai testului are
efect direct asupra coeficientului de fidelitate. Acest efect
poate fi calculat cu ajutorul formulei Spearman-Brown:

 rnn = coeficientul de fidelitate estimat; coeficientul de


fidelitate obținut; n = numărul care exprimă de câte ori
crește sau descrește dimensiunea testului.

 Creșterea numărului de itemi are, în general, ca efect


creșterea coeficientului de fidelitate (mai ales dacă au
conținut echivalent și dificultate similară a itemilor).
 Problema poate fi privită și astfel: cunoaștem valoare actuală
a coeficientului de fidelitate și dorim ca fidelitatea să fie
îmbunătățită și să atingă o anumită valoare a coeficientului.
 În acestă situație vom afla câți itemi trebuie adăugați față de
numărul inițial. În acest caz aplicăm formula profeției
Spearman-Brown:

N = de câte ori va crește numărul itemilor;


rtto = coeficientul de fidelitate obținut;
rttd = coeficientul de fidelitate dorit.
 Exerciții
1. Un test compus din 12 itemi are fidelitate (rtt)
de 0,68. Numărul de itemi este dublat la 24, se va
îmbunătăți fidelitatea?
 = 2*(0,68) / [1 + (2 – 1) * 0,68] = 0,81

2. Coeficientul de fidelitate obținut (rtto) pentru un


test cu 20 itemi este 0,75. De câți itemi adiționali
ar fi nevoie pentru a avea un coeficient de 0,9?
 = (0,9 * (1-0,75)) / (0,75 * (1-0,9)) = 3
 => 3*20 = 60 => de 40 itemi adiționali
Valorile rtt
 Kaplan și Saccuzzo (2009) recomandă următoarele valori
ale rtt:
a. Pentru cele mai multe dintre situațiile de cercetare rtt trebuie să
fie minim 0.70.
b. Când testul este utilizat pentru a lua decizii importante în
legătură cu o persoană rtt minim acceptat este 0.95.
c. În alte scopuri de testare rtt minim acceptat este 0,90.

 Noile recomandări susțin faptul că, pe lângă valoarea


calculată a coeficientului de fidelitate, o importanță
deosebită o are intervalul de încredere pentru rtt obținut.
 Astfel, este recomandabil ca valoarea inferioară a
intervalului de încredere să fie 0.70; 0.90, respectiv 0.95
și nu coeficientul de fidelitate în sine.
Fidelitatea Kuder-Richardson
 Această formă de fidelitate este aplicabilă
pentru teste cu itemi care au răspunsuri de
tipul totul sau nimic (dihotomic): Da/Nu;
Adevărat/Fals (1 / 0).
 Exemple: testele de aptitudini; testele de

inteligență.
Fidelitatea Cronbach alpha
 Această formă de fidelitate este aplicabilă pentru teste cu itemi
care au răspunsuri pe scală likert (foarte rar/rar/des/foarte des;
dezacord neutru/acord/acord total).
 Poate fi văzut ca media tuturor coeficienților half-split posibili,

corectați cu formula Spearman-Brown.

 rα = coeficientul apha;
 N = numărul de itemi;

 σ 2 = varianța unui item;


j
 ∑σ 2 = suma varianțelor tuturor itemilor;
j
 σ2 = varianța scorurilor totale ale testului.
Fidelitatea Cronbach alpha
 Exemple: inventarele de personalitate.
 A se vedea aplicarea în SPSS.
Fidelitatea interexaminator
 Această formă de fidelitate este aplicabilă
pentru testele cu nivel ridicat de subiectivism.
 Mai mulți examinatori sunt puși să coteze

rezultatele subiecților evaluați.


Eroarea standard a măsurării
 Formă a fidelității utilizată pentru interpretarea scorurilor
individuale.
 Va preciza între ce limite se va înscrie scorul subiectului dacă va fi

supus evaluării cu același test.

SDt = abaterea standard a scorurilor testului;


rtt = coeficientul de fidelitate al testului.

 68% dintre scoruri se află în intervalul definit de scor ± 1 SEM


 95% dintre scoruri se află în intervalul definit de scor ± 2 SEM
 99% dintre scoruri se află în intervalul definit de scor ± 3 SEM

◦ (de fapt e 1*SEM, 1,96*SEM, 2,58*SEM )


 Exerciții
1. O persoană obține un scor de 100 la un test cu SEM
egal cu 2. Care este intervalul de încredere de 68%
pentru împrăștierea scorurilor?
 (98,102)

2. Știind că abaterea standard a scorurilor unui test este


de 20, iar coeficientul de fidelitate (rtt) este de 0,84, în
ce interval ne așteptăm să găsim 95% dintre scorurile
unei persoane care a obținut un scor de 60?
 SEM=20*sqrt(1-0,84) = 20*0,4 = 8
 (44,76)

S-ar putea să vă placă și