Sunteți pe pagina 1din 4

ETALONAREA ȘI NORMAREA TESTELOR

Atunci când aplicăm chestionare obținem niște scoruri. Cele mai multe dintre teste au
manuale. Rezultatele unui test de evaluare psihologice sunt scoruri sau cote brute.
Testul de depresie Beck de exemplu are 21 de itemi. După ce se răspunde la test noi
însumăm cei 21 de itemi și obținem un scor brut. Acest scor nu are nici o valoare dacă noi nu
îl putem raporta la normele care există pentru populația respectivă. Sunt o serie de teste la
care nu ne așteptăm ca respondenții să rezolve absolut tot și atunci noi interpretăm în funcție
de grupul de referință.
Datele de la chestionare le putem introduce în programul SPSS care ne permite să
calculăm media, abaterea standard, distribuții, să facem comparație între grupe, și altele.
Acest program ne oferă partea statistică.
Grupul de referință în cazul nostru este populația României pe care acest test s-a
validat.
Scorurile obținute nu sunt direct interpretabile ci întotdeauna trebuie să ne raportăm la
populația de referință. Apoi, comparația cu grupul de referință poate fi, ca în această situație,
fie ne raportăm la acest grup fie la populația mai generală respectiv cea pe care s-a adaptat
acest chestionar. BDI2 care evaluează depresia.
Pe noi ne interesează să vedem cum interpretăm scorurile pe care fiecare dintre voi le-
ați obținut raportat la grupul din care faceți parte. De aceea trebuie să aflăm media grupului.
Ce înseamnă că am obținut un scor de 0 și ce înseamnă că am obținut un scor de 13 care este
maxim. Apoi mă interesează abaterea standard care reprezintă variația din jurul mediei.
În SPSS acum mă interesează media, abaterea standard, scorul minim și scorul maxim.
Media este 3,37 iar abaterea standard 3,94. Scorurile sunt cuprinse între 0 și 16. Dacă o
persoană are un scor de 0 înseamnă că este sub medie. Este admisă plus sau minus o abatere
standard. Astfel că scorurile cuprinse între 0 și 7 sunt admise adică nu înseamnă nimic
problematic raportat la acest grup. Dacă scorul este de 16 are un scor de depresie mai ridicat
decât media grupului dar acest scor va trebui să fie raportat și la populația la care a fost
adaptat testul. Când subiecții sunt puțini pot apărea anumite erori. În aplicarea testului la acest
grup scorul nu este reprezentativ pentru populație. O eroare poate fi că un singur subiect poate
schimba scorul. Dacă există subiecți care au scoruri foarte mari nu mai avem o distribuție
normală. Dat fiind că nu avem o distribuție normală nu mai putem spune că media ne reflectă
cel mai bine. Nu este corect să zicem că media acestui grup este un indicator al tendinței
centrale. Atunci ce facem cu acele persoane care au scoruri ridicate? Dacă ar fi o distribuție
normală ar însemna că avem persoane care au scoruri foarte mici, foarte mari și majoritatea
care are scoruri în jurul tendinței centrale. Ceea ce putem face cu subiecții respectivi este să
ne uităm la cadrul de referință. Știm din manualul testului că scorul prag (catof - care indică
că începând cu acest scor sunt probleme de intensitate clinică) este de 30 și atunci scorul de
16 sau 18 nu este problematic.
Datele legate de vârstă, gen sau educație ne-ar interesa în măsura în care ne raportăm
la cadrul de referință. Nu este suficient să avem acest chestionar aplicat pe o populație de
adulți și să îl aplicăm unui grup de adolescenți. în cazul anumitor instrumente psihologice
există norme diferite. Pentru scorurile variază în funcție de vârstă sau de gen.
Etalonarea se referă la stabilirea unei astfel de scale la care să ne arate unde se situează
persoana care a completat. Populația care formează cadrul de referință trebuie să fie
reprezentativă.
Atunci când evaluăm, avem instrumente care măsoară tabloul clinic (simptomele) dar
în același timp ne interesează instrumente care măsoară și gândurile.
ATQ – este un test care măsoară gândurile automate.
Scala aceasta se cotează de la 1-5.
…..
Eșantionarea se constituie mai greu în psihologie decât în alte domenii pentru că avem
foarte multe variabile de care trebuie să ținem cont.
Există două modalități majore de eșantionare:
1. Eșantionare aleatoare (tot la a doua persoană)
2. Eșantionare stratificată. Fac o împărțire pe clase (vârstă, gen)

Administrarea testului
Aplicăm chestionarul folosind aceleași instrucțiuni pentru toți subiecții.
….
Când vorbim despre scoruri, un alt aspect foarte important este natura scorurilor.
Astfel că avem:
 Transformări liniare – implică utilizarea mediei și a abaterii standard și a
scorurilor brute.
 Transformări nonliniare – sunt acelea care alterează forma distribuției și
corelațiile cu alte dimensiuni sau criterii.
Exemplu de criteriu este depresia.
Cu excepția scorurilor standardizate toate celelalte tipuri de scoruri sunt nonliniare.
Pentru testele care au o distribuție normală putem calcula cote standard - T, Z și IQ și clase
normalizate (staline).
Folosim cotele standard care îmi permit să compar concepte diferite între teste diferite
care au intervale diferite.
Testul CBCL – unul dintre cele mai utilizate chestionare care măsoară problemele
copiilor. Este validat pe populație românească și ne oferă foarte multe informații valoroase.
Putem calcula scorul pe anxietate, pe depresie, pe tulburări de externalizare. Este nul din cele
mai bune.
Această scală (vedem că este precizat că este o scală derivată DSM) mai ne permite să
calculăm și scoruri diferite sau scoruri pe subscale. Scorurile pe care noi le obținem la
problemele afective corespund foarte bine cu criteriile din DSM. Mai conține o fișă care ne
permite să aflăm sindroamele. Ne permite deci să facem un scor total pentru problemele de
internalizare și cele de externalizare.
Scorurile Z ne arată cât de mult se îndepărtează o anumită variabilă de la media
populației iar formula este scorul pe care îl are copilul – media populației/abatere standard.
Scorurile T se calculează 50+Z x 10 iar IQ avem formula 100+Z x 15.
Ca eu să pot interpreta rezultatele la teste ar trebui să gasesc o modalitate prin care să
le compar. Ca să le compar trebuie să standardizez. Le transform fie în scoruri Z fie în scoruri
T. Pentru depresie scorul Z de exemplu îl calculăm 30-M/AS. Dacă le transform în scoruri T
aplicăm formula.
Clasele normalizate reprezintă procentele care se află în clasele respective. Dacă
avem de exemplu 5 clase și avem 7%în cls1 28%în cls2, etc…
Se mai utilizează staninele. Numărul claselor ne arată cât la sută este cuprins în
intervalul respectiv.
Avem Z-uri și nu date brute pentru a putea compara. Astfel că dacă măsor depresia
unui copil cu două tipuri de teste aplicând scorul Z le pot compara.

La transformări nonliniare care alterează forma distribuției și corelațiile cu alte


dimensiuni. Aici avem distribuția normală, o sumarizare la ceea ce am exemplificat. Avem
împărțirea în cele 8 porțiuni, avem percentile, avem scorul Z, scorul T și procentele în stanine.
Centilele sau percentilele sunt date obținute prin raportare la un etalon dar nu prin
transformare liniară ci împărțim la o ierarhie ipotetică de 100 de clase egale. Deci avem
distribuția pe care o împărțim la 100. Sunt scoruri procentuale și avem percentilele în o sută
de clase egale, decilele în zece clase egale și quartilele în 4 clase egale.
Rangurile percentile arată poziția pe care o are un subiect la un moment dat în ierarhie.
Adică ce procentaj din populație a obținut un scor egal sau mi mic de referință și câte scoruri
sunt mai mici sau egale. Acestea variază între 1-99.
De exemplu avem un scor care este percentilul 3. Asta înseamnă că 3% din scoruri
sunt mai mici decât cadrul nostru de referință iar 97% sunt mai mari.
De exemplu un copil are percentilul 93 la ADHD. Asta înseamnă că intervalul în care
se află copilul este cu probleme de intensitate subclinică. Comparativ cu ceilalți copii de
vârsta sa nu este în intervalul normal.
…..
Mai sunt și alte modalități de a standardiza teste. De exemplu SAT.

Interpretăm testul în raport cu grupul de referință și criteriul de performanță (scorul


criterial).
Am instrumentul acesta iar criteriul este tulburarea depresivă majoră din DSM5. Nu
mă interesează în mod specific să raportez scorul pe care clientul îl obține la test ci mai mult
mă interesează dacă întrunește criteriile respective din DSM5. Și avem la scoruri criteriale,
scoruri bazate pe convenții diagnostice adică anumiți itemi critici, și coruri bazate pe teorie.
Iată un exemplu din ADHD. Ne uităm în DSM la criteriile de diagnostic și urmăresc să
întrunească aceste criterii. Și ofer un scor criterial diagnostic în care aplic o scală de ADHD și
mă interesează dacă în urma aplicării scalei, persoana evaluată întrunește criteriile ADHD din
DSM5. Mai avem scale bazate pe teorie care măsoară anumite constructe la nivel teoretic dar
nu au întrunit consensul unei anumite comunități și avem câteva exemple pe baza teoriei lui
Jung. Deci avem aceste criterii cu care nu întreaga comunitate a fost de acord și atunci avem
instrumente care măsoară și tipologiile despre care Jung vorbește. Și putem să spunem doar că
sunt scoruri criteriale pe bază de teorie care sunt raportate la teoria acceptată de anumiți
reprezentanți nu de toată comunitatea științifică.
Când punem diagnostic pe baza scorurilor obținute la testele validate atunci ne referim
la normă, adică la criterii cu care toată comunitatea științifică a fost de acord.
Mai avem secvențe comportamentale atunci când ne interesează anumite
comportamente care apar la copii și vrem să vedem în ce măsură aceste comportamente sunt
în conformitate cu vârsta copilului. În aceeași categorie sunt stadiile lui Piaget la care pot
raporta dezvoltarea copilului.
Atunci când aplicăm un instrument, putem să îl raportăm la medie și abatere standard,
la un etalon (norme, staline ranguri percentile), sau la un criteriu (simptomele sau tulburarea
respectivă din DSM5), sau mai sunt scoruri criteriale bazate pe teorie dar care nu au fost
validate de toată comunitatea științifică.
Valorile prag sunt fixate pentru a identifica performanța unui subiect la un test și sunt
îndeplinite criteriile minimale pentru psihopatologie.
Atunci când achiziționăm un test ar trebui să fim atenți la ce ne spune despre etalon.
Orice test ar trebui să includă:
- Date demografice – pe cine a fost efectuat acest test, cât de mare a fost eșantionul,
ce vârste au avut participanții, mediul din care fac parte subiecții, gradul de
școlarizare. În funcție de aceste date demografice noi putem ști dacă putem să le
administrăm persoanei care vine în evaluare.
- Data construirii normelor – este importantă data pentru că și testele se schimbă și
pot avea alte norme. Multe scale mai multe versiuni.
- Tipul de normă – trebuie să știm cum sunt transformările – liniare sau neliniare.
Dacă avem transformări la scoruri liniare avem cote Z, T, IQ. La non-liniare avem
ranguri percentile, stanine, decile. La nonliniare practic împărțim distribuția în mai
multe categorii egale. La cele liniare avem formule care să ne permită să calculăm
și să stabilim preformanța obținută la un test a unui subiect în funcție de un
numitor comun (medie și abatere standard). Astfel o să putem să formulăm astfel
de comparații doar folosind etalonarea și partea aceasta de normare.

Testul RAVEN permite măsurarea abilității cognitive generale. Măsoară componenta


eductivă și reproductivă.
Atunci când vorbim despre interpretarea testelor de inteligență cum este RAVEN-ul,
ne referim la rang percentil.
Ne uităm la intervalul de vârstă care ni se potrivește și în funcție de scor și vârstă mă
uit în ce percentil mă încadrez.
Există o diferență între testele astea. În timp ce RAVEN-ul nu îți permite foarte clar să
discriminezi între aceste valori, scalele de inteligență WESCHLER îți oferă foarte clar această
discriminare.
Deci pentru început este foarte important să știu în ce percentilă mă aflu. Odată ce am
identificat percentilul, manualul testului ne mai oferă un tabel din care putem afla IQ-ul.
Căutăm astfel valoarea pentru percentil și căutăm intervalul în care ne aflăm.

S-ar putea să vă placă și