Sunteți pe pagina 1din 24

Bazele Teoretice ale Testării Psihologice

C1. Principii Etice


Atât instrumentele de evaluare cât și procesul în sine (de evaluare) implică o serie de reglementări etice,
pentru a ne asigura că deciziile sunt luate spre binele tuturor celor implicați, iar evaluarea este realizată într-o
manieră profesionistă.
Principii generale APA:
A. Principiul binefacerii și al nefacerii răului
Psihologii se vor asigura că cei cu care lucrează vor avea toate beneficiile de pe urma colaborării și se asigură că
nu fac rău. Psihologii se asigură de protejarea celor cu care interacționează din punct de vedere profesional. Sunt
atenți și au grijă ca actul lor să nu fie folosit cu repercursiuni negative la nivel personal, financiar, social,
organizațional sau politic.
B. Principiul fidelității și al responsabilității
Psihologii stabilesc relații de încredere cu cei cu care lucrează. Își asumă responsabilitatea asupra propriului
comportament. Se consultă cu colegi sau instituții (funcție de nevoie) pentru a oferi cele mai bune soluții cu care
lucrează.
C. Principiul integrității
Psihologii promovează acuratețea, onestitatea și adevărul în cercetarea, predarea și practicarea psihologiei.
D. Principiul justiției
Oferă tratament egal și se asigură că toți clienții vor avea parte în mod egal de beneficiile serviciilor psihologice
E. Principiul respectului față de drepturile și demnitatea persoanelor
Intimitate, confidențialitate, autodeterminare.
Principii generale:
1. Relația profesională
2. Respectarea intimității
3. Respectarea integrității
4. Etichetarea și îngrădirea libertății
5. Utilizarea competentă și informată a instrumentelor de evaluare
6. Interpretarea și utilizarea rezultatelor evaluării
7. Comunicarea rezultatelor testării
8. Asigurarea securității testelor și a informațiilor din evaluare

1. Relația profesională
Evaluarea trebuie să aibă loc doar în contextul unei relații profesionale clar stabilite (natura, scopul și
condițiile relației sunt anterior discutate). Anterior efectuării evaluării, psihologul oferă informații relevante și
solicită consimțământul informat persoanei pentru a fi evaluată.
Informațiile furnizate se referă la:
- Tipul și durata evaluării
- Proceduri alternative
- Confidențialitate
- Costuri financiare
- Informații adiționale relevante
 În situații clar reglementate de lege, atunci când persoana nu este capabilă să ofere consimțământul sau
când serviciul psihologic este solicitat de către o instanță legală, nu este necesar consimțământul
Psihologul trebui esă fie conștient de efectul pe care calitatea relației îl poate avea asupra rezultatelor evaluării.
Așteptările examinatorului pot influența performanța persoanei evaluate. Aceste influențe sunt subtile și pot
apărea doar în unele contexte – considerându-se că sunt transmise non-verbal. În calitate de evaluatori, trebuie să
fim conștienți dacă avem așteptări față de persoanele evaluate și să încercăm să nu le comunicăm sub nici o formă.
Rezultatele evaluării poate fi influențat și de gradul de simpatie pe care psihologul îl manifestă pentru client. Cu
cât examinatorul simpatizează mai mult clientul, cu atât cresc șansele ca el să interpreteze un răspuns ambiguu
într-o manieră favorabilă. Uneori, astfel de distorsiuni pot apărea și pe răspunsuri mai puțin ambigue.
Un alt factor este reprezentat de starea emoțională a persoanei evaluate. Este important de evaluat și starea
afectivă generală a clientului în momentul evaluării psihologice.
- Uneori, în situații de anxietate ridicată poate fi recomandată înreruperea sesiunii de testare
- Sau, putem încorpora factorii emoționali în interpretarea rezultatelor evaluării.
Important!
a. Trebuie să solicităm consimțământul informat al clientului (în afara situațiilor excepționale).
b. Evaluatorul (psihologul) trebuie să fie mereu conștient de relația pe care o are cu persoana evaluată și de
starea ecesteia din momentul respectiv pentru a putea crește gradul de obiectivitate al evaluării sale.

2. Respectarea intimității
Uneori persoanelor evaluate le este frică de faptul că psihologul poate afla aspecte pe care acestea ar dori să le
țină ascunse și/sau că aceste informații pot fi folosite în detrimentul lor. Respectarea intimității devine sensibilă
mai ales în cazul testelor de personalitate (mai ales cele ce măsoară aspecte accentuate – tulburări), dar și în cazul
probelor de inteligență.
Frica de evaluare este generată de doi factori:
- Publicul larg nu este conștient de limitele probelor psihologice (exagerând rolul acestora)
- Nu este neapărat greșit să obții informații pe care o persoană nu ar dori să le facă cunoscute, important
este ce faci cu ele
Persoana evaluată are controlul asupra informațiilor furnizate
 Excepții: minorii, clienții ce riscă să își pună viața în pericol
Aspectele ce țin de intimitate sunt mai sensibile în selecția personalului și mai puțin sensibile în domeniul clinic.
În plus, psihologul trebuie să selecteze doar probe relevante pentru contextul evaluării (scade riscul de a solicita
informații intime). Relevanța testelor utilizate va fi explicată într-un limbaj accesibil persoanei evaluate.
(diminuăm frica auto-dezvăluirii).
Trebuie să explicăm clienților ce tipuri de date vom obține și cum pot fi acestea folosite.
Important!
Prezentarea într-o manieră clară și simplă a scopului general al testelor utilizate poate duce la diminuarea
sentimentului de invadare a intimității.

3. Respectarea integrității
Protejarea integrității implică evitarea producerii de emoții negative persoanei confruntate cu situația de testare.
Abordarea de subiecte considerate taboo (ex: practicile sexuale, credințele personale, evenimente traumatizante)
pot genera anxietate.
Important!
La fel ca în situația respectării intimității, explicarea clară a probelor utilizate, a relevanței lor și a protejării datelor
poate diminua intensitatea emoțiilor negative activate.

4. Etichetarea și îngrădirea libertății


Atunci când etichetăm o persoană (atribuim un diagnostic), există riscul interiorizării etichetei respective și a
apariției fenomenului de auto-îndeplinire a profețiilor (pe baza rolului asociat etichetei respective).
Un alt risc este reprezentat de stigmatul social asociat anumitor afecțiuni mentale (ex: persoanele diagnosticate
cu schizofrenie pot fi discriminate)
Acceptarea rolului acelei categorii poate fi în detrimentul unei persoane (ex: va depune mai puține eforturi în
ameliorarea situației)
Important!
Trebuie să fim atenți atunci când etichetăm o persoană și să ținem cont de posibilul impact asupra acesteia.

5. Utilizarea competentă/informată a instrumentelor de evaluare


Ce trebuie să dețină un specialist:
Formare corespunzătoare pentru utilizarea instrumentelor de evaluare (studii de specialitate + training
pentru utilizarea anumitor instrumente)
Cunoștințe tehnice pentru a evalua calitățile și limitele unui instrument de evaluare (evidence-based
assessment)
Important!
Trebuie să ținem cont și de particularitățile culturale/grupurile sociale de apartenență ale persoanei evaluate

6. Interpretarea și utilizarea rezultatelor evaluării


Este important să selectăm testele și etaloanele la care raportăm rezultatele pe baza relevanței lor în raport cu
persoana evaluată și scopul evaluării. Nu este o procedură mecanică de raportare a unui rezultat la un etalon.
Trebuie să ținem cont de particularitățile persoanei + ale contextului evaluării.
Sunt necesare cunoștințe tehnice (etalonare), pentru a putea utiliza corect și evalua calitatea normelor pe baza
cărora facem evaluarea (ne putem crea singuri etaloane)
Important!
Noi suntem responsabili de modul în care interpretăm rezultatul și de recomandările pe care le facem, nu
dezvoltatorul instrumentului respectiv.

7. Comunicara rezultatelor evaluării


Trebuie să oferim feedback clientului într-un limbaj clar și accesibil (evitați jargonul de specialitate). Explicațiile
trebuie să înceapă cu clarificarea rolului evaluării, astfel încât clientului să-i fie clară relevanța acestora. Dacă
este necesar, pot fi furnizate clarificări și în legătură cu preconcepții asupra testului respectiv sau a limitelor sale.
Dacă evaluăm copii, rezultatul trebuie explicat mai ales părinților acestora.
Important!
Utilizați un limbaj accesibil.

8. Asigurarea securității testelor și a informațiilor din evaluare.

C2. Observația
Ce este observația?
Înregistrarea, mai mult sau mai puțin, sistematică a caracteristicilor și modificărilor obiectului studiat.
Observarea unui comportament, altul decât cel indus în mod explicit de un set predeterminat și stanardizat
de stimuli.
Comportamentul = ansamblul actelor produse de om (sau animal) accesibile observației directe.
a. Observația nesistematizată – naturală
Observatorul selectează situații specifice și înregistrează tot ce surprinde în situația respectivă fără a ținti anumite
comportamente.
b. Observația sistematică – controlată și/sau naturală
Scopul este de a măsura comportamente specifice. Comportamentul observat a fost definit operațional. Sunt
folosite proceduri standardizate. Momentele și locurile sunt atent observate. Datele înregistrate au un format
standardizat.
Observația naturală
Cea mai „pură” formă a observației sistematice – comportamentul este înregistrat în mediul natural și se produce
fără ca observatorul să intervină. Elementul esențial = lipsa devierii comportamentului, de către observator sau/și
procesul observat, de la traiectoria lui obișnuită.
Tehnici pentru observația naturală:
- Tehnica observatorului vizibil dar ignorat
Observatorii sunt, sau încearcă să pară, elemente normale din mediul natural. Obsevatorul nu trebuie să trezească
suspiciuni prin comportamentul său, consemnarea informațiilor trebuie făcută într-o manieră discretă.
- Observația participantă
Observatorul are un rol activ în situația observată; poate fi realizată pe mai multe niveluri de transparență
(cunoașterea rolului vs. Ascunderea rolului); limite – în cazul cunoașterii rolului obs., persoanele observate își
pot modifica comportamentul. Comportamentului obs. poate influența mediu iar subiectivitatea sa poate afecta
calitatea observației.
- Tehnica observatorului ascuns
Folosirea unui punct de observație greu detectabil; utilizarea unor medii cu ferestre (oglinzi) cu vedere
unidirecțională
- Utilizarea unor dispozitive de supraveghere și înregistrare
Amplasarea de camere video sau microfoane nedetectabile
- Crearea unor medii „facsimil”
Replicarea mediului natural, poate fi manipulat.
Limitele observației naturale:
 Implicații etice (lipsa consimțământului)
 Lipsa controlului asupra mediului obsevat, în unele cazuri
 Poate genera un volum ridicat de informații înregistrate
Observația controlată
- Cel mai des sunt derulate în contexte de laborator, dar și în selecția de personal; este utilizată o
procedură standardizată și permite manipularea unor elemente din mediu – variabile.
- Tipuri de comportamente în funcție de obiectivul situației controlate:
o Evocate – produse pe baza manipulării experimentale
o Ampllificate – varierea intensității condițiilor manifestării unui comportament
o Epurate – izolarea unui comportament cu scopul măsurării lui
Observația controlată în evaluarea psihologică
 Observația în timpul rezolvării unor probleme
 Observația comportamentului în timpul convorbirii psihologice
 Interacțiuni structurate
 Observația comportamentului în timpul jocului de rol
 Observația comportamentului în situații de laborator similare celor deale (ex: fobii)
Să ne reamintim
Definiție conceptuală = înțelegere teoretică/abstractă a unui concept sau fenomen,
Definiția operațională = definirea unei variabile/construct (psihologic) în termenii procedurilor propriu-
zise ce sunt folosite pentru a o/în măsura sau manipula. Rețetă/instrucțiuni exacte ce permit replicarea procedurii.
Criterii pentru dezvoltarea grilei de observație (operaționalizării).
a. Selectarea și definirea comportamentelor
- Operaționalizarea comportamentelor – seturi de operații necesare identificării unui comportament.
Criterii pentru identificarea comportamentelor – pentru a identifica corect un comportament, cercetătorul trebuie
mai întâi să definească proprietățile ce indică recunoașterea comportamentului respectiv.
 Criterii concrete sau descriptive (referitoare la formă vs efecte)
Formă – fragmentarea comportamentului în unități mici cu scopul obținerii unei descrieri detaliate.
Dimensiuni formale pentru caracterizarea unui comportament:
- Localizarea în spațiu – locul situării sau traiectoria persoanei
- Orientarea – poziția în raport cu alte elemente din mediu
- Topografia tridimensională
- Proprietăți intrinseci ale corpului sau epidermei
Efecte – identificarea comportamentului pe baza efectului pe care îl are asupra mediului (nu include
comportamentul social).
Accentul este pus pe efectele fizice asupra mediului (ex: deschide, deformează, schimbă). Descrierea este mai
globală.
 Criterii teoretice sau interpretative (clasificări cauzale vs funcționale)
Nu sunt direct observabile – sunt interpretări ale indicatorilor din mediu; sunt mai generale
- Cauzale – comportamentele care se presupune că au aceeași cauză sunt grupate în aceeași categorie
(ex: comportamentele controlate/automate)
- Funcționale – gruparea comportamentelor pe baza funcției pe care o îndeplinesc (ex: de apărare, de
alimentare)
Deseori cele două se intersectează (ex: comportament dominant)
b. Eșantionarea comportamentelor
Eșantionare = asigurarea reprezentativității informațiilor respective și a generalizării lor la nivelul tuturor
comportamentelor categoriei respective.
 Eșanționarea timpului
Obținerea unor eșantioane de timp reprezentative pe baza efectuării observației la diferite intervale de
timp (pe baza unei scheme temporale). Scheme temporale sistematice vs aleatorii (cea mai ridicată generalizare).
Criterii pentru eșantionarea timpului
- Frecvența comportamentului
- Variabilitatea
- Specificarea situațională
- Posibile schimbări în timp
- Complexitatea sistemului de înregistrare
Eșantionarea evenimentelor – atunci când comportamentul are loc cu o frecvență erdusă (sau imprevizibil)
 Eșantionarea situațiilor
Obținerea unui eșantion de locații și condiții (creșterea posibilității de generalizare la cât mai multe
circumstanțe)
 Eșantionarea subiecților
Când nu putem observa toți subiecții disponibili (sunt prea mulți), dar vrem să putem generaliza rezultatele
obținute.
c. Procedee de înregistrare
Diferă în funcție de tipul de observație: directă vs auto-observația.
Procedee pentru observația directă:
- Înregistrări calitative (mai ales în cazul observației naturale)
- Contabilizarea răspunsurilor comportamentale (frecvența lor)
- Înregistrarea unor caracteristici temporale
o Frecvența într-o anumită unitate de timp
o Secvența – suită de comportamente consemnate în ordinea apariției
o Durata – perioada dintre debutul și finalizarea unui comportament
o Latența – perioada de până la apariția comportamentului
o Intervalul – perioada dintre două comportamente
- Intensitatea comportamentului (evaluare subiectivă)
- Evaluarea unor atribute (caracteristici) pe baza unor scale de evaluare
Procedee pentru auto-observație
- Jurnalele – preponderent consemnări calitative (există și variantă cantitativă)
- Monitorizarea comportamentelor (ex: numărul de țigări fumate, alimente nesănătoase consumate, etc.)

C3 - Interviul
„Interviul este o situație socială de schimb conversațional între două persoane cu scopul culegerii de
informații într-un cadru specificat” – Weil-Barais, 1997,
Interviul psihologic este realizat cu scopul atingerii unui obiectiv explicit. (ex: selecția celui mai bun candidat
pentru un job, atribuirea unui diagnostic în context clinic, etc.)
Ce nu este un interviu psihologic:
- Monologul
- Interogatoriul
- Interviul jurnalistic
- Dezbatere de idei
- Confesiunea
Interviu vs conversație (Groth-Marnat, 2003)
Interviul prezintă o secvențialitate clară și este de cele mai multe ori organizat tematic deoarece este realizat cu
scopuri clare. Interviul psihologic poate aduce în discuție informații sau emoții neplăcute. Interviul psihologic
este conceput pentru a obține informații ce nu pot fi obținute prin alte mijloace (aspecte ideosincratice), interviul
psihologic are printre obiectivele generale, cel de a stabili o relație cu persoana intervievată (ce să faciliteze
obținerea de informații). Intervievatorul trebuie să controleze și direcționeze interacțiunea (pentru atingerea
obiectivelor).
Interviul poate fi clasificat în funcție de gradul de structurare:
- Nestructurat/Non-directiv
- Semi-structurat
- Structurat/Directiv
Cu cât este mai nestructurat, cu atât oferă mai multă:
o Flexibilitate intervievatorul
o Posibilitatea de a analiza modul în care persoana intervievată își organizează răspunsurile
o Posibilitatea de a explora detalii unice din experiența persoanei
o Neîncredere în rezultatele obținute (slabă fidelitate și validitate)
Pentru a depăși limitele interviurilor slab structurate, au fost dezvoltate forme semi-structurate sau
puternic structurate (cu proprietăți psihometrice ridicate.)
Interviul structurat se bazează pe un set standardizat de întrebări și un sistem standardizat de cotare. Există un
protocol standardizat de administrare ce trebuie urmat de către orice intervievator cu fiecare persoană evaluată în
parte.
Avantaje majore ale interviului slab-structurat
- Oferă informații complementare pentru interpretarea rezultatelor evaluării psihologice.
- Flexibilitatea oferită de interviu (mai ales de cele nestructurate) este unul din cele mai puternice
avantaje față de testele psihologice
- Focalizează atenția pe individ, pe aspectele sale unice (idiosincrasii) și nu pe modul în care individul
este în comparație cu un anumit grup
- Situația de interviu duce la stabilirea relației cu persoana evaluată și facilitarea auto-dezvăluirii
(rezultatele testării pot fi influențate de încrederea conferită, deschidere și empatia percepută)
Dezavantaje majore ale interviului slab-structurat
- Cu cât un interviu este mai puțin structurat, cu atât riscul e mai mare ca informațiile să fie afectate de
bias-uri perceptuale și de interacțiune.
- Slaba comparabilitate a informațiilor cauzzată de variații ale acestora (cu cât interviul este mai
structurat, cu atât întrebările folosite pentru a evalua un anumit aspect pot fi mai diferite; cu cât
întrebările sunt mai diferite, cu atât rezultatele obținute vor fi mai variate)
Avantaje ale interviurilor structurate
- Au precizie psihometrică mult mai ridicată (permit comparații între cazuri)
- Sunt exhaustive în raport cu criteriile/simptomatologia evaluată (există mici șanse de a se pierde din
vedere aspecte relevante), acest avantaj a condus la proliferarea interviurilor structurate în evaluarea
clinică.
- Înaltul grad de standardizare permite administrarea lor și de către persoane mai puțin specializate
Dezavantaje ale interviurilor structurate
- Timp mai lung de realizare a interviului
- Deși au proprietăți psihometrice mai ridicate, tind să piardă din vedere aspectele idiosincratice ale
persoanei evaluate
- Interviurile puternic structurate diminuează facilitarea stabilirii relației dintre intervievator și persoana
evaluată
- Există anumite categorii de validitate mai slab explorate pentru interviurile structurate.
Derularea interviului
Nu există o rețetă unică pentru derularea corectă a unui interviu de evaluare.
Stilul intervievatorului este puternic determinat de orientarea sa teoretică sau de scopul interviului (de
diagnostic sau explorator)
Intervievatorii mai variază și în funcție de modul în care își notează informațiile obținute
-- luarea de notițe pe tot parcursul interviului poate crește anxietatea clientului și
alterarea amosferei
+ luarea de notițe este importantă pentru că facilitează reținerea mai multor detalii
decât în cazul consemnării răspunsurilor interviului
Este recomandat un volum mediu al notării pe parcursul interviului.
În cazul în care interviul este înregistrat, trebuie să explicăm clientului motivul pentru care inregistrarea
este necesară și să-i solicităm consimțământul.
Tactici de intervievare
Groth-Marnat sintetizează din multitudinea de tactici vehiculate în literatură, un set considerat esențial
pentru a concepe o strategie generală de intervievare.
A. Preliminarii
În faza inițială a interviului trebuie să ne asigurăm că tratăm următoarele aspecte:
a. Organizăm spațiul fizic în care se va desfășura situația de interviu (să pară uzată dar nu dezordonată,
lumina să fie optimă, distanța dintre intervievator și intervievat să fie optimă, contactul vizual – la
același nivel)
b. Ne facem introducerea și specificăm modul în care preferăm să ni se adreseze și clarificăm modul în
care ne putem adresa clientului
c. Clarificăm scopul interviului (ne asigurăm că a înțeles și că nu există discrepanțe între așteptările sale
și ce urmează să se întâmple)
d. Explicăm modul în care informația din interviu va fi folosită
e. Explicăm aspectele specifice confidențialității informațiilor (dacă informațiile vor fi oferite unor terți,
obținem consimțirea semnată)
f. Explicăm rolul clientului și activitățile în care va fi implicat (instrumentele pe care la vom folosi), și
durata aproximativă a evaluării
g. Clarificăm aspecte legate de costurile evaluării.
B. Gradul de directivitate – este influențat, pe lângă perspectiva teoretică a intervievatorului, și de:
- Aspecte practice (ex: dacă timpul este limitat – folosim mai multe întrebări directive)
- Scopul interviului (ex: diagnostic vs evaluare pre-terapie)
- Tipul de client (ex: pasiv, retras vs implicat)
Interviurile directive vs non-directive nu sunt mutual exclusive – pot fi folosite complementar.
C. Secvențialitatea tipurilor de întrebări.
Cea mai simplă schematizare sugerează că:
 Începem cu întrebări deschise
 Continuăm cu întrebări cu nivel intermediar de directivitate
 Finalizăm prin întrebări închise
Întrebările deschise permit discursul cât mai liber al clientului, ocazie ce facilitează exprimarea unor aspecte unice
prin indicatori precum: fluența verbală, nivelul de asertivitate, tonul vocii, ezitarea. În contrast cu aceste avantaje,
întrebările deschise pot furniza și un volum ridicat de informații vagi sau detalii inutile.
Se recomandă inițierea cu întrebări deschise iar ulterior introducerea de întrebări cu un grad intermediar de
directivitate pentru a acoperi lacunele/inconsistențele sesizate. Tipuri de întrebări intermediare:
o De facilitare (comentarii/observații) – facilitarea discursului menține fluența interviului. Poate
fi efectuată atât verbal „Spune-mi mai multe...”, „Te rog să continui...” cât și nonverbal, de
exemplu prin menținerea contactului vizual.
o De clarificare – solicitările de clarificare pot fi utilizate atunci când ne dăm seama că persoana
intervievată are mai multe de spus și nu îndrăznește să o facă. Putem să îi solicităm să fie mai
specific, sau să îl rugăm să ne ofere exemple – „Descrie o zi obișnuită în care apar astfel de
probleme”
o De empatizare – Intervențiile empatice pot facilita auto-dezvăluirea clientului – „Trebuie să fi
fost dificil pentru tine”
o De confruntare (a inadvertențelor) – inadvertențele apărute în declarațiile sau comportamentul
clientului este indicat să fie confruntate. Confruntarea poate fi folosită și atunci când declarația
cleintului nu pare să fie veridică
 Confruntarea poate crea anxietate – trebuie utilizată cu precauție
 Nu trebuie să le formulăm ca provocări directe (ci în termeni ipotetici)
 Pot fi utilizate doar atunci când avem o relație clar stabilită cu clientul
În final, vom utiliza întrebări închise pentru a acoperi posibilele informații lipsă.
Secvențialitatea deschis, directiv, închis nu reprezintă parcursul întregului interviu, ci poate varia pe parcursul
interviului.
D. EXH
Scopul unui interviu este de a identifica comportamentul problematic (natura sa, gradul de severitate, etc.) și
cauza acestuia (condiții agtravante sau atenuante, originea, antecedente, etc.). Pentru a ne asigura că acoperim
toate aspectele relevante obiectivului nostru, este indicat să folosim liste cu categorii de informații pe care trebuie
să le vizăm – checklist
E. Evitarea întrebărilor „De ce?”
- Intensifică defenizivitatea clientului deoarece sună acuzator sau critic și conduc la obținerea unor
declarații justificative.
- O abordare alternativă constă în prefațarea întrebării cu formulări precum „Ce înțelegi tu prin...” sau
„Cum s-a întâmplat să...”
F. Comportamentul non-verbal
- Trebuie să fim atenți atât la comportamentul nostru non-verbal cât și la cel al clientului.
- Putem să ne exprimăm interesul prin menținerea contactului vizual, a fi expresivi facial, sau
acompanierea răspunsului prin gesturi afirmative
G. Concluzionarea
- Când ne apropiem de ultimele 5 minute este indicat să anunțăm clientul.
- Trebuie să îi oferim oportunitatea de a adresa întrebări de clarificare
- La finalul sesiunii, intervievatorul trebuie să facă un rezumat al principalelor aspecte vizate prin
interviu și, dacă este cazul, să sugereze recomandări.
Curs 4 – Testele
Ce este un test?
= Un instrument obiectiv și standardizat ce cuprinde un eșantion de comportamente.
Are 3 elemente cheie:
- Obiectivitatea = scorarea și interpretarea sunt afectate într-o mică măsură de subiectivitatea
evaluatorului
- Standardizarea = procedura de administrare, scorare și interpretare este uniformizată
- Un eșantion (reprezentativ) de comportamente (pe baza căruia putem face inferențe asupra totalității
comportamentelor). Situația test = decupaj reprezentativ al situației reale.
= Poate fi descris și prin metafora experimentului.
Manipulăm doar animiți stimuli (itemii testului) și controlăm ceilalți factori din mediu
(administrare standardizată), astfel încât să obținem un rezultat ce va reflecta – pe cât posibil – doar reacția față
de acei stimuli (răspunsurile persoanei).
= Un instrument
- Una din principalele „unelte” ale psihologului
- Un insturment ce poate avea repercursiuni politice și sociale.
Construirea unui test: pași generali
Conform cu Domino și Domino (2006), în general, construirea unui test implică o serie de 8 pași:
1. Identificarea nevoii.
Nevoia poate fi de natură:
 Pragmatică
o Identificarea unei cereri din partea unui anumit public (ex: practicienii necesită un test de
inteligență cu timp de administrare mai redus; există o cerere ridicată de instrumente de evaluare
a intereselor vocaționale.)
o Necesitatea dezvoltării unei cariante scurte a unui anumit test (ex: spre a fi mai ușor utilizat în scop
de cercetare)
 Teoretică:
o Nevoia de a operaținaliza o nouă teorie/construct (ex: asocieri implicite) sau o teorie mai veche
dar care încă nu a fost operaționalizată printr-un text (ex: libidoul din perspectivă freudiană)
o Nevoia de a modifica un instrument/dezvoltarea unui nou instrument pentru a reflecta modificările
aduse unei anumite teorii
2. Rolul teoriei
Orice test este dezvoltat pornind de la o anumită teorie sau perspectivă teoretică.
Fundamentarea sa teoretică poate fi:
 Explicită și formală
 Testul este construit pentru a măsura un construct în conceptualizarea lui Freud (ex:
măsurarea funcționării ego0ului)
 De astfel de instrumente este interesant mai ales un practician al abordării respective.
 Implicită și slab formalizată
 În dezvoltarea testului se pleacă de la conceptualizări generale (ex: „depresia este o stare
problematică compusă din segmente, negativă față de propria persoană, etc.”) sau
fundamentate empiric (observații sistematice asupra comportamentelor relevante; ex:
manifestări ale agresivității în trafic)
3. Alegerile practice
Aspectele practice pe care trebuie să le avem în minte atunci când dezvoltăm un instrument pot ține de:
- Tipul de itemi utilizați
- Limitarea temporală (impunerea sau nu a unui timp limită de completare)
- Formatul instrumentului (ex: utilizarea unei foi de răspuns separate față de caietul cu itemi,
administrarea online a testului)
- Automatizarea cotării
- Gradul de acoperire a constructului (ex: instrument scurt sau lung)
- Includerea unor scale/mecanisme de identificare a răspunsurilor distorsionate
- Administrarea individuală sau în grup
4. Setul de itemi
În această etapă este indicat să dezvoltăm un set de specificații pentru constuirea itemilor.
Specificațiile sunt cu referire la categoriile de informații cuprinse în test (ex: factori și sub-factori de personalitate,
tipuri de abilități cognitive vizate într-un test de inteligență, etc.)
Specificațiile sunt identificat epornind de la fundamentarea teoretică abordată, aspectele practice identificate,
părerile experților (ex: analiză de nevoi) sau idei proprii (ex: modalități de inovare)
Pornind de la stul de specificații, inițiem dezvoltarea itemilor
5. Încercări și ajustări
În urma etapei anterioare va rezulta un set mare de itemi în formă brută (itemi duplicat, itemi ce necesită
reformulare, etc).
Pentru rafinarea setului de itemi spre a-l reduce cantitativ și a-l îmbunătăți calitativ putem:
o Apela la experți sau/și
o Realiza un studiu pilot. Studiul pilot, de cele mai multe ori, implică (pe lângă completarea
itemilor) și solicitarea participanților să ofere feedback (asupra clarității instrucțiunilor, modul
de formulare a itemilor, etc.)
o Realiza un pretest, implică realizarea unui set preliminar de analize asupra itemilor
(perspectivă clasică sau a teoriei răspunsului la itemi)
În urma analizelor preliminare este posibil, nu doar să eliminăm o serie de itemi, dar și să îi
reformulăm/modificăm pe unii sau chiar să dezvoltăm itemi noi.
6. Fidelitate și validitate
În momentul în care am stabilit setul final de itemi pe care să-l includem în test, urmează testarea stabilității și
preciziei sale (fidelitate) și verificarea dacă măsoară ceea ce ne dorim noi să măsoare (validitatea)
7. Standardizare și normare
După ce am acumulat suficiente dovezi în favoarea fidelității și validității instrumentului nostru, trebuie să îl
standardizăm și să îl etalonăm (normăm).
Standardizarea se aplică asupra:
- Instrucțiunilor
- Limitelor de timp
- Procedurii de cotare
... cu scopul de a asigura aceleași condiții și modalitate de administrare indiferent de evaluatorul care
utilizează testul.
După ce am acumulat suficiente dovezi în favoarea fidelității și validității instrumentului nostru, trebuie să îl
standardizăm și să îl etalonăm.
Să considerăm că am obținut un scor de 22 la un test de inteligență. Ce înseamnă asta? Cum îl interpretăm?
Dacă vă zic că scorul maxim ce poate fi obținut este 25, am putea crede că 22 este un rezultat destul de
bun. Dar dacă aflați că 22 este scorul mediu al unui preșcolar?
22 este o cotă/scor brut. Rezultatele brute sunt lipsite de însemnătate în evaluare. Trebuie să îi atribuim
sens. Pentru asta, trebuie să putem compara rezultatul unui individ cu cel al unui grup de indivizi. Acest proces
se numește normare/etalonare.
8. Alte ajustări
- După un test a fost elaborat, el este în mod constant și periodic ajustat.
- Pentru tipurile de ajustări/modificări frecvent întâlnite putem identifica:
o Dezvoltarea de versiuni scurte ale acelui instrument (se bazează în primul rând pe criterii
statistice)
o Reconsiderarea factorilor în care au fost grupați itemii (se bazează în primul rând pe criterii
statistice – analiză factorială, analiza de modele bi-factoriale, etc)
o Dezvoltarea de noi dimensiuni (includerea de noi factori/noi tipuri de abilități cognitive, etc)
Tipuri de itemi – dezvoltarea lor
Recomandări generale asupra modului de formulare a itemilor unui test:
- Trebuie să fie clar formulați și lipsiți de ambiguitate (astfel ca răspunsul să nu reprezinte propria
interpretare a persoanei – „Îmi plac provocările”/„Lucrez cum vreau”)
- Nu trebie să prezinte conținut multiplu (ex: În timpul liber prefer să citesc și să vizionez filme. – Un
răspuns afirmativ nu știm la care din cele două activități face referire)
- Trebuie evitate formulări precum „uneori” (are însemnătate diferită de la o persoană la alta); alternativ,
putem încerca să specificăm frecvența comportamentului respectiv (ex: „cel puțin de două ori pe
săptămână”)
Tipuri de itemi:
- Două categorii:
1. Cu răspuns construit. Subiectului îi este prezentat un stimul și el furnizează un răspuns (ex:
redactarea de eseuri, sau completarea de fraze)
2. Cu răspuns selectat. Subiectul selectează răspunsul corect sau cel mai potrivit dintr-o listă de
opțiuni.
Itemi cu răspuns multiplu
Compuși din corpul itemului (întrebarea în sine) și opțiunile/variantele de răspuns.
În cazul abilităților cognitive/cunoștințelor, există un răspuns corect (răspuns cheie) și o serie de variante cu rol
distractor.
Variantele distractor trebuie să aibă dificultate similară și același grad de plauzabilitate.
În cazul testelor ce măsoară aspecte ale personalității sau funcționalitatea psihologică nu există variante de răspuns
greșite. Răspunsul cheie reflectă ceea ce testul inteționează să măsoare.
Itemi cu răspuns adevărat/fals
Constau într-o aserțiune pe care persoana o evaluează ca fiind adevărată sau falsă/corectă sau incorectă
Ex: (1) Timișoara este reședința județului Timiș, (2) Prefer să petrec timpul liber citind.
În ptimul caz există un răspuns corect (cheie), în cel de-al doilea caz există un răspuns cheie ce reflectă constructul
măsurat (extraversiunea)
Prima utilizare este mai puțin recomandată (șansa de a ghici ce este 50%), cea de-a doua utilizare este destul de
frecventă.
Itemi cu răspuns forțat (des folosit în instrumente de personalitate)
Conține două sau mai multe variante de răspuns construite ca fiind egal dezirabile sau echivalente pe baza unui
anumit criteriu, iar subiectul trebuie să aleagă doar una.
Față de necunoscuți am o atitudine mai degrabă:
o Prietenoasă și expansivă
o Calmă și rezervată
Consider că mă caracterizează mai degrabă
o O imaginație vie
o Realismul cu care privesc lucrurile
Itemi cu răspuns pe scală
Cel mai des în măsurarea atitudinilor. Scalele Likert pot evalua direcția atitudinii (pozitivă sau negativă față de
obiect) sau intensitatea atitudinii (dezacord puternic vs acord puternic)
Ex: Pentru mine, consumul de legume este:
Total neplăcut Neplăcut Neutru/Indiferent Plăcut Total plăcut
1 2 3 4 5
Diferențiatul semantic este format din perechi de adjective bipolare situate la cele două capete ale scalei.
Pozitiv Negativ
Sigur Periculor
Plăcut Neplăcut
Analogii
Cel mai des întâlnite în testele de inteligență.
Pot fi compuse din numere, cuvinte, reprezentări vizuale.
Este indicat să fie cu răspuns multiplu.
Exemple:
Sticla este pentru bec asa cum ... este pentru nucă.
a. Miezul
b. Farfuria
c. Copacul
d. Coaja
GCSTFXY este pentru YXFTSCG ceea ce ... este pentru YXTMRZK
a. KZMRTYX
b. ZKMRTXY
c. KZRMTXY
d. KZRMTYX
Similarități
Itemii sunt compuși dintr-un șir de stimuli (cuvinte, numere, etc) dintre care unul nu aparține categoriei în care
sunt grupați ceilalți. Există riscul ca acea categorie să nu fie singura/cea mai importantă/relevantă modalitate de
grupare a stimulilor.
Ex: Unul din cuvintele din seria următoare se deosebește de celelalte. Care este acel cuvânt.
Chitară Vioară Trompetă Harpă Contrabas
Nuc Maimuță Crizantemă Șoarece Argint
Serii (de numere)
Constau într-o serie de stimuli asociați unii cu alții, cu sarcina ca ultima componentă să fie identificată de subiect
(fie să o genereze, fie să o aleagă)
2 5 8 11 14 ...
6 6 12 18 30 ...
În prima dintre seriile de numere, răspunsul corect este 17 deoarece vedem că aceste cifre cresc din 3 în
3. În cea de-a doua serie de numere, observăm că fiecare număr este egal cu suma a două numere anterioare (30
= 18 + 12, 18 = 12 + 6, 12 = 6 + 6), acest tip de serie fiind cunoscută sub denumirea de secvența lui Fibonacci.
Vignette
Reprezintă scenarii succinte, iar sarcina subiectulu este de a reacționa într-o anumită manieră, fie prin oferirea
unui răspuns calitativ (completarea poveștii), fie prin alegerea unui răspuns dintr-o serie de variante.
Ce itemi alegem?
Criteriile generale ce dictează utilizarea unor anumite tipuri de itemi sunt:
- Conținutul tesutlui (ce măsoară?)
- Preferințele constructorului (cum alege să facă administrarea)
Un principiu general este dat de necesitatea dpdv statistic ca scorurile brute să varieze cât mai mult.
- Itemii la care majoritatea persoanelor ar alege doar o anumită variantă nu sunt indicați
- O stategie de creștere a variației constă în utilizarea răspunsului pe scală, comparativ cu cele de tip
A/F
Ordinea itemilor
- În cazul testelor de cunoștințe sau inteligență, regula generală este de a începe cu itemii ușori și a
termina cu cei dificili. O strategie alternativă constă în formatul de spirală omnibus – construirea de
secvențe de itemi de la ușor la dificil.
- În cazul testelor de personalitate multifactoriale, este recomandată amestecarea itemilor. Gruparea lor
poate face sa subiectul să identifice constructul măsurat.
Curs 5 – Testul psihologic. Fidelitatea
Considerații generale
Atunci când alegem un instrument de evaluare psihologică, suntem interesați ca aceste să posede o serie
de proprietăți psihometrice care să-i confere:
 Precizie – să ne putem pune încrederea în rezultatul obținut: un anumit individ să obțină același scos în
momente de timp diferite; scorul unui individ să poată fi comparat cu al altuia, etc.
 Calitate – să ne ofere o imagine cât mai reală asupra proprietății vizate.
Instrumentul psihologic poate fi afectat de diferite surse de eroare (ex: sistemarice și/sau aleatorii)
Investigarea fidelității și validității probelor psihologice ne permite diminuarea interferențelor cauzate de erorile
de măsurare.
Fidelitatea
Fidel = de încredere, ne putem baza pe..
Fiabil = de încredere, nu își pierde proprietățile în timp.
Aspect consistent caracteristicilor sale. / Funcțional fără eroare.
La baza conceptului de fidelitate stă cel de eroare de măsurare. Teoria clasică a măsurării postulează faptul că
observația unui anumit comportament (X – scor obsevat) este formată din două tipuri de informații: scor real (R)
și scor eroare (E)
X=R+E
Scorul real (R) – reprezintă gradul de însușire al constructului vizat în cazul unui anumit individ.
Nu îl putem observa direct pe R – ci doar estima pe baza scorului observat.
Scorul obsevat (X) deviază de la R în funcție de influența erorilor (E)
Scorul eroare este dat de surse aleatorii (ex: ideosincrasii) ca pot produce variații ale lui X față de R
(produc bruiaj ce ne împiedică să identificăm cu precizie scorul real)
Instrumentele de măsurare fidele sunt în mică măsură afectate de bruiaj (erori)
Fidelitatea = gradul în care scorurile testului sunt consistente sau repetabile, adică gradul în care ele nu sunt
afectate de erorile de măsurare.
- Un atribut al scorurilor și nu neapărat al instrumentului.
Teste de estimare a fidelității:
Pornind de la principiul consistenței (fidelitate ridicată = măsurarea repetată a unei caracteristici ce nu a suferit
modificări, trebuie să ofere acelați rezultat) există patru modalități de estimare a fidelității:
1. Administrarea unui test în momente de timp diferite: fidelitatea test-retest (Dacă aspectul măsurat este
stabil, atunci și rezultatele trebuie să fie similare)
Pe același lot de persoane se aplică de două ori același test la o anumită distanță de timp și se corelează cele două
seturi de scoruri. Reprezintă un indicator al stabilității temporale (constanța în timp a scorurilor). Cu cât
coeficientul de corelație este mai apropiat de 1, cu atât fidelitatea probelor este mai ridicată (erorile de măsurare
sunt mai mici.)
Dezavantaj:
- Nu este indicată aplicarea în cazul măsurării constructelor modificabile în timp sau situațional
- Trebuie să fim atenți la perioada fixată între măsurători (prea scurtă = distorsiuni ale răspunsurilor
cauzate de familiarizare, prea lungă = modificări asupra constructului vizat/maturizare)
2. Administrarea aceleiași persoane a două teste ce măsoară același construct (teste paralele/alternative) (cât
timp măsurăm același aspect, rezultatele celor două teste trebuie să fie similare)
Pe același lot de persoane se aplică două versiuni paralele ale aceluiași test. Prin estimarea corelației dintre cele
două forme putem stabilit gradul de fidelitate. Cu cât coeficientul de corelație este mai apropiat de 1, cu atât
fidelitatea probelor este mai ridicată (Erorile de măsurare sunt mici)
Dezavantaj:
- Probele paralele sunt dificil de proiectat
3. Împărțirea testului în două jumătăți egale și compararea scorurilor obținute (înjumătățire/„split-half”)
Estimăm corelația dintre două jumătăți „egale” ale aceleiași probe. Cu cât coeficientul de corelație este mai
apropiat de 1, cu atât fidelitatea probelor este mai ridicată (erorile de măsurare sunt mici).
Avantaj:
- Nu necesită o versiune paralelă și nici reevaluarea participanților (costuri reduse)
Dezavantaj:
- Dificil de utilizat în cazul testelor contra timp (recomandată împărțirea par/impar) sau acolo unde
operaționalizarea e făcută prin puțini itemi.
4. Itemii testului trebuie să fie convergenți în privința scorurilor adevărate (consistența internă)
Metoda consistenței interne – constă în estimarea unui indicator al consistenței interne (omogenitate) și indică
gradul de intercorelare între itemii instrumentului.
Interpretare: scorul obținut variază între 0 și 1. Cu cât este mai aproape de 0 înseamnă că întreaga variație a
scorurilor observare este aleatorie și nu reflectă constructul vizat. Un coeficient egal cu 1 înseamnă că variația
scorurilor observate reprezintă variația scorurilor reale.
Diferitele metode estimează surse de eroare diferite, astfel este indicată utilizarea complementară a lor.
Curs 6 – Testul psihologic. Validitatea.
Validitatea = măsura în care există dovezi empirice și argumente teoretice ca suport pentru corectitudinea
concluziilor formulate pe baza unei anumite forme de evaluare.
Validitatea = procesul de evaluare/stabilire a validității unui instrument.
Testarea validității reprezintă un proces de colectare de dovezi empirice. Acestea pot oferi sau nu suport
pentru validitatea unui instrument.
În decizia asupra validității concluziei oferite de un anumit instrument, trebuie să ținem cont de cât de
puternice sunt probele în acel sens.
Validitaea unui instrument face referire la cât de cuprinzător (validitate de conținut) și acurat (validitate de
construct) măsoară un anumit construct teoretic, și cât de bine prezice anumite rezultate (validitate de criteriu).
Categorii generale de validitate:
- Validitate de conținut
- Validitae de construct
- Validitate de criteriu
a. Validitatea de construct – reprezintă evaluarea gradului în care un anumit instrument (definiție
operațională) măsoară constructul pe care a fost conceput să-l măsoare.
Un prim pas pentru testarea validității de construct este să plecăm de la o definiție conceptuală clară și exhausivă,
ce să integreze atât toate aspectele caracteristice constructului respectiv cât și cele ce îl diferențiază de alte
constructe.
Există două forme principale de validitate de construct:
1. Validitatea convergentă = gradul în care măsurători diferite ale aceluiași construct converg (scorurile
obținute corelează între ele), sau măsurători ale unor constructe înrudite.
Ex: Dacă pulsul reprezintă un indicator valid al fricii, atunci frecvența bătăilor inimii în prezența unui stimul
înfricoșător (ex: șarpe) ar trebui să coreleze cu frica auto-raportată în prezența respectivului stimul.
Statistic, evaluarea validității convergente este realizată prin calcularea coeficientului de corelație dintre
rezultatele obținute prin instrumente diferite (cu cât ne așteptăm ca similaritatea să fie mai ridicată, cu atât
corelația ne așteptăm să fie mai apropiată de 1)
2. Validitatea discriminativă
Acest tip este opusul validității convergente și reprezintă măsura în care măsurători ale unor constructe
diferită oferă rezultate necorelate/slab corelate. Este evaluată tot prin intermediul coeficientului de corelație.
Asociat conceptului de validitate de construct este și cel de validitate de fațadă (aspect) = gradul în care
instrumentul pare să măsoare ceea ce susține că măsoară (impresie superficială).
Este posibil să existe în absența validității de construct (pare că măsoară un anumit aspect chiar dacă in
realitate nu o face.
b. Validitatea de conținut
Reprezintă evaluarea măsurii în care instrumentul măsoară toate aspectele relevante constructului vizat (cât de
bine eșantionează comportamentele specifice aspectului vizat.)
Ex: extraversiunea este descrisă prin următoarele fațete: afectivitate, sociabilitate, asertivitate, nivel de activism,
excitabiliate și veselie. Putem considera că un instrument are validitate de conținut ridicată dacă ține cont de toate
comportamentele extraversiunii.
Sunt utilizate două tipuri generale de strategii:
- Evaluarea subiectivă a itemilor (evaluări ale experților)
- Utilizarea de proceduri statistice (ex: analiză factorială exploratorie, analiza componentelor principale,
analiză factorială confirmatorie, etc). Acest tip de strategie mai este denumită și validitate factorială
sau structurală.
c. Validitatea de criteriu
= gradul de acuratețe cu care un anumit instrument prezice un indicator al unui anumit construct (măsura în care
rezultatele testului prezic comportamente specifice.)
Ex: un instrument ce măsoară inteligența ar trebui să prezică succesul academic.
Indicatorul utilizat pentru testarea acestui tip de validitate se numește măsură criteriu.
Validitatea de criteriu poate fi investigată în raport cu indicatori viitori (validitate predictivă), prezenți
(validitate concurentă) sau din trecut (validitate retrospectivă)
1. Validitatea predictivă – este în general investigată prin studii longitudinale prin intermediul cărora
măsurarea constructului vizat precede măsurarea criteriului.
Ex: Măsurăm conștiinciozitatea studenților la început de an universitar, ulterior monitorizăm prezența la cursuri
– criteriul – și verificăm dacă scorurile asupra conștiinciozității prezic – corelează cu – frecvența participării la
cursuri.
2. Validitatea concurentă – în acest caz obținem informații asupra criteriului concomitent cu realizarea
măsurării constructului (investigată prin studii transversale).
Ex: măsurăm atitudinile față de alimente sănătoase și în același timp întrebăm cât de multe fructe consumă
persoanele în general.
3. Validitatea retrospectivă – se bazează tot pe studii transversale și solicităm informații din trecut asupra
criteriului.
Ex: măsurăm agresivitatea la volan și în același timp întrebăm și care a fost numărul de sancțiuni pe care
persoanele le-au primit în ultimul an. (in literatura de specialitate, cel mai adesea este asimilată validității
concurente)
C7 – Tipuri de scopuri
Nomotetic = tendința de a generaliza; abordarea axată pe identificarea legilor generale ce cuvernează un fenoment
(în general)
Idiografic = tendința de a fi specific; abordare axată pe identificarea și înțelegerea aspectelor unice și subiective.
 În psihologie
Nomotetic = cuantificarea proceselor psihologice și exprimarea lor cantitativă – utilizarea instrumentelor
standardizate
Idiografic = surprinderea aspectelor unice ale indivizilor (idiosincarsii = aspecte singulare) – utilizarea
de metode slab structurate.
Test = instrument standardizat (administrare, cotare, interpretare)
- Test psihologic = instrument standardizat pentru măsurarea performanței indivizilor (ex: abilităților)
Chestionar = set de întrebări construite pentru a investiga unul sau mai multe aspecte (a culege răspunsuri din
partea unor indivizi)
- Chestionar psihologic = instrument standardizat pentru măsurarea personalității, atitudinilor, etc.

Inventar = instrument (test) multifactorial (ex: inventar de personalitate)

De ce se repetă itemii în testele de personalitate?


1. Creșterea consistenței interne a instrumentului.
2. Modelitate de verificare a seriozității clientului în completarea testului.
Ce alte măsuri putem folosi în testele de personalitate?
- Itemi absurzi sau exemple de comportament foarte puțin probabile.

Testare vs. Evaluare


Testarea constă în procesul de măsurare al/ale unui/unor aspecte psihologice (aplicarea unor probe psihologice și
cotarea rezultatului obținut)
Evaluarea este un proces integrativ, folosind multiple surse (anamneză, testare, observare, interviu, etc.) pentru a
colecta date relevante luării unei decizii (pentru scopul urmărit). Prin evaluare conferim sens rezultatelor testării.
Scopuri ale testării psihologice
1. Descriptiv (sau de clasificare), presupune:
- Descrierea stării curente a funcționării psihice (ex: oferirea unei imagini generale psiho-aptitudinale)
- Servește obiective mai generale: autocunoaștere, dezvoltare personala (coaching), decizii de carieră.
Tipuri de instrumente folosite
Bine standardizate – metode calitative (teste)
2. Screening, presupune;
- Evaluare cu caracter general în vederea depistării unor potențiale probleme (la indivizi aparent
normali).
- Utilizat pentru scopuri de prevenție (Ex: evaluarea de cabinet cu verdict apt/inapt)
Tiprui de instrumente folosite:
Preponderent standardizate (teste)
Mai ales! Teste cu durata redusă de administrare.
3. Diagnostic, presupune:
- Scop cu aplicativitate preponderent în psihologie clinică (Dar și educațională/developmentală)
- Confirmarea unei potențiale probleme (sugerate de screening). Stabilire a gradului/nivelului de
manifestare a unei probleme.
Tipuri de instrumente folosite
Preponderent calitative
Diagnostic diferențial? (comparăm simptomele reismțite de persoană cu cele specifice altor afecțiuni similare
pentru a putea stabili cu exactitate un diagnostic) – foarte important, mai ales în cazul comorbidităților.
4. Monitorizare, presupune
- Verificarea periodică a stadiului/evoluției (intensității) unei probleme.
- Precedată de diagnostic
- Ex: poate fi utilizată pentru a monitoriza modul în care pacientul răspunde la tratament (ex: terapie,
medicație, etc.) sau a evoluției unei afecțiuni cronice care implică degradare neuro-cognitivă.
Tipuri de instrumente folosite:
Cantitative (teste)
5. Prognostic sau predicție, presupune:
- Prezicerea comportamentului viitor sau/și a factorilor de risc asociați stării persoanei respective.
- Dpdv clinic, implică un prognostic asupra evoluției afecțiunii sau riscului apariției unei anumite
consecințe ale afecțiunii diagnosticate (ex: facă are depresie, există și riscul de suicid?)
- În context educațional: prezicerea performanței școlare, a riscului de abandon șcloar, etc.
Tipuri de insturmente folosite:
Preponderent cantitative (teste), combinat cu informații calitative.
C8 – Interpretarea testelor
Scorurile brute
Scor brut = număr (X) – însumează/surprinde un aspect la performanței unei persoane la un eșantion de
comportament atent selectat și observat care alcătuiește testul psihologic.
Scorul brut nu transmite nicio semnificație.
Cadrele de referință pentru interpretarea scorurilor obținute la test
1. Norme
Interpretarea testului în raport cu norma – standarde bazate pe performanța unor grupuri specifice de oameni care
oferă informații pentru interpretarea scorurilor.
Este utilizată atunci când comparăm indivizii unul cu altul sau cu un grup de referință pentru a evalua diferențele
dintre ei cu privire la o caracteristică măsurată de test.
Termenul normă = performanța la test/comportamentul tipic al unuia sau mai multor grupuri de referință – tabele
de statistici descriptive (medii, abateri standard, distribuții de frecvență) care însumează performanța
grupului/grupurilor.
Normele extrase din performanța la test a grupurilor = eșantioane normative/de standardizare
2. Criteriul de performanță
Relația dintre itemii/sarcinile testului și standardul performanței este demonstrabilă și bine definită – scorurile la
test pot fi evaluate via interpretare în raport cu un criteriu. – utilizează proceduri (eșantionarea domeniilor de
conținut sau a comportamentelor legate de activitatea în muncă) pentru a stabili dacă și în ce măsură nivelele
dorite ale criteriilor de măiestrie sau de performanță au fost îndeplinite.
Interpretarea unui test prin raportare la normă – cel mai larg utilizat cadru de referință.
Întrebarea la care răspunde este „Cum este performanța celui testat în comparație cu performanța celorlalți?”
Scorul este utilizat pentru a plasa informația subiectului în cadrul unei distribuții preexistente a scorurilor/datelor
obținute din performența unui grup de comparație potrivit.
Norme de dezvoltare
Scale la nivel ordinal bazate pe secvențe comportamentale
Dezvoltarea umană este caracterizată de procesul secvențial al unui număr de arii de comportament – ex:
secvența parcursă de dezvoltarea motorie în timpul perioadei de sugar.
Ori de câte ori o secvență universală de dezvoltare presupune o progresie ordonată de la un stadiu
comportamental la alt stadiu – mai avansat – secvența poate fi convertită într-o scală ordinală și utilizată normativ.
În astfel de cazuri, cadrul de referință pentru interpretarea scorurilor testului este derivad din observarea și notarea
anumitor regularități în ordinea și temporizarea achizițiilor la mai mulți indivizi.
Exemplu: The Provence Birth-to-Three Developmental Profile („Profilul Provence”) – parte din Infant-Toddler
Developmental Assessment (IDA)
IDA – identificarea copiilor care, dpdv al dezvoltării, prezintă un risc și, posibil, au nevoie de monitorizare sau
de intervenție.
Profilul Provence – informații despre momentul de timp în care un copil atinge anumite puncte de cotitură în
dezvoltare în opt domenii, în relație cu vârsta cronologică a copilului:
- Comportament motoriu grosier
- Comportament motoriu fin
- Relații cu obiecte neanimate
- Limbaj/comunicare
- Autoajutorare
- Relații cu persoanele
- Emoții și stări afective (afecte)
- Comportament de adaptare
Pentru fiecare domeniu – intervale de vârstă de la 0 – 42 de luni – 2 luni la vârstele mici, 18 la cele mari, cele mai
multe între 3-6.
Scorurile la itemi pt fiecare interval de vârstă/domeniu sunt adăugate pentru a ajunge la o vârstă a performanței,
care poate fi evaluată în comparație cu vârsta cronologică.
Scale ordinale cu bază teoretică – se pot baza pe alți factori decât vârsta cronologică.
Câteva teorii – stadiile dezvoltării cognitive din perioada de sugar până în adolescență propuse de Jean
Piaget/teoria dezvoltării simțului moral a lui Lawrence Goldberg – secvență/progresie ordonată și invariantă
derivată, cel puțin parțial, dn observații comportamentale. Unele dintre acestea au generat scale la nivel ordinal
construite pentru a evaluat nivelul pe care individul l-a atins în cadrul secvenței propuse – utilizate în primul rând
în scopuri legate de cercetare și nu pentru evaluare individuală.
Exemplu: Ordinal Scales of Psychological Development (Infant Psychological Development Scales) – ordinea
în care sunt achiziționate competențele cognitive în perioada copilăriei mici și mari realizate de Piaget.
Scoruri echivalente cu clasele școlare
Progresia secvențială și uniformitatea relativă a curriculei școlare, mai ales în clasele elementare, oferă
baze suplimentare pentru interpretarea scorurilor în termenii normelor de dezvoltare.
Aceste scoruri exprimate în clase sunt derivate din localizarea performanței la test în cadrul normelor
elevilor la nivelul fiecărei clase din eșantionul de standardizare. Dacă spunem, de exemplu, că un copil a obținut
scoruri de clasa a șaptea la citire și de clasa a cincea la aritmetică, înseamnă că performanța sa la testul de citire a
fost egală cu performanța medie a copiilor din clasa a șaptea din eșantionul de standardizare și că, la testul de
aritmetică, a fost egală cu performanța medie a copiilor din clasa a cincea.
Cu toate acestea, scorurile de echivalență cu notele pot să ne ghideze greșit:
- Conținutul curriculei și calitatea intruirii variază în diferite școli, sectoare școlare, state, etc
- Progresul așteptat în clasele primare ale școlii elementare în termenii achizițiilor academice este mult
mai mare decât în gimnaziu sau în liceu
- Un copil care se află în clasa a 4-a obține nivelul clasei a 7-a – nivelul de aritmenitcă este semnificativ
deasupra mediei celor de clasa a 4a.
IMPORTANT
Toate normele de dezvoltare sunt relative, cu excepția că ele reflectă o secvență comportamentală umană
sau o progresie universală.
 Scalele la nivel ordinal de bază teoretică – sunt mai mult sau mai puțin utile, în funcție de teoriile pe care
se bazează, dacă acestea sunt întemeiate și pot fi aplicate unui segment de populație sau populației ca
întreg.
 Normele de vârstă mentală sau scalele de scoruri exprimate în vârstă nu reflectă decât performanța medie
a anumitor grupuri de subiecți aflați la nivele de vârstă specifice la un moment și loc dat, la un anumit
test. Ele sunt supuse schimbării de-a lungul timpului și variază în diferite culturi și subculturi.
 Normele bazate pe clase sau scale de scoruri echivalente de vârstă reflectă de asemenea performanța medie
a anumitor grupuri de elevi din anumite clase, la un moment și într-un loc dat. De asemenea, ele sunt
supuse variației de-a lungul timpului și a curriculei din diferite școli, teritorii școlare și națiuni.
Normele interne ale grupului – oferă în mod esențial o cale de a evalua performanțele persoanei în
comparație cu unul sau mai multe grupuri de referință adecvate.
Scorurile brute sunt transformate în scoruri derivate, utilizate pentru a exprima normele interne ale grupului.
Componența eșantionului normativ sau de standardizare este de o importanță deosebită în acest tip de interpretate
a scorurilor, deoarece persoanele din acel eșantion stabilesc standardul în raport cu care sunt măsurați ceilalți
subiecți cărora li se apică testul.
Eșantionul normativ – reprezentative pentru tipul de indivizi cărora li se adresează testul și trebuie să fie suficient
de mare pentru a asigura stabilitatea valorilor obținute ale performanțelor.
Ex: dacă testul evaluează abilitățile de citire ale elevilor de școală elementară de la clasa a treia la clasa a cincea
din întreaga țară, eșantionul normativ va trebui să reprezinte populația națională de elevi de clasa a treia, a patra
și a cincea sub toate aspectele relevante.
Eșantionale normative variază foarte mult în funcție de ceea ce este măsurat.
Ex: testele de aptitudini aplicate în grup, din domeniul educațional, pot avea eșantioane normative – zeci sau sute
de mii de indivizi; iar testele individuale de inteligență – 1-3000 de indivizi.
Factorii relevanți care trebuie luați în considerare – variază – scopul testului și populația pentru care va fi
utilizat.
Grupurile de referință pot fi definite pe un continuum de lărgime sau specificitate în funcție de tipul de
comparații prin care utilizatorii testului trebuie să evalueze scorurile obținute la test. La o extremă – grupul de
refeință = populația generală a unei întregi națiuni sau chiar o populație multinațională – la celălalt capăt –
populații definite limitat în termeni de statut sau cadru.
Norme de subgrup – atunci când – eșantioane mari pentru a reprezenta populații definite larg – normele pot fi
raportate cumulat sau pot fi separate în norme de grup. Pot fi formate subgrupuri în termeni de vârstă sex, ocupație,
etnice, nivel educațional sau orice altă variabilă care ar putea avea un impact semnificativ asupra scorurilor
obținute la test sau ar putea duce la comparații ce prezintă interes. De asemenea, pot fi obținute după ce un test a
fost standardizat și publicat, pt a suplimenta și extinde aplicabilitatea testului.
Norme locale – pe baza grupurilor de referință extrase dintr-un cadru geografic sau instituțional specific –
utilizatorii contruiesc norme locale pt membrii unei populații mai strict definite – ex: studenții unei anumite
universități.
Norme convenabile – norme bazate pe un grup de oameni care se întâmplă pur și simplu să fie disponibili în
momentul în care este construit testul – utilitate limitată (nu sunt reprezentative pentru nicio populație definită)
Atenție!
 Eșantionul de standardizare = grup de indivizi pe care testul este standardizat inițial în termenii
procedurilor de administrare și scorare și de contruire a normelor testului. Datele obținute din acest grup
sunt prezentate de obicei în manualul testului.
 Eșantionul normativ = se poate referi la orice grup din care sunt extrase normele. Normele suplimentare
construite după publicarea testului, pentru ca acesta să fie utilizat cu un subgrup distinct, pot apărea în
revistele de specialitate sau în manualele tehnice publicate ulterior.
 Grupul de referință = termen cu sens mai larg, pentru a identifica un grup de persoane cu care sunt
comparate scorurile obținute la test. Poate fi aplicat grupului de standardizare, eșantionului normativ, unui
grup testat în scopul construirii unor norme locale sau oricărui grup specificat, cum ar fi elevii dintr-o
singură clasă sau participanții de cercetare.
Scoruri utilizate pentru a exprima norme interne de grup
a. Percentile – metodele cele mai directe și mai frecvent utilizate pentru a transmite rezultatele unui test
cu raportare la normă
Avantaje – pot fi înțelese cu ușurință de persoanele testate și pot fi eplicate celor mai multe tipuri de teste.
Un scor exprimat în percentile – poziția relativă a unui subiect individual căruia i s-a aplicat testul comparativ cu
un grup de referință – eșantionul de standardizare
= procentul de persoane din grupul de referință care au obținut scoruri egale sau mai mici decât un scor brut dat.
Cea mai mare percentilă = cele mai ari scoruri brute; a 50-a percentilă = mediana = punctul care separă jumătatea
superioară de jumătatea inferioară.
Atenție!
Datorită similarității dintre doi termeni, scorurile exprimate în percentile sunt deseori confundate cu
scorurile exprimate în procente.
 Percentilele = reflectă rangul sau poziția performanței unui individ la un test în comparație cu un grup de
referință; cadrul de referință este dat de ceilalți oameni
 Scorurile exprimate în procente = numărul de răspunsuri corecte pe care un individ le-a obținut din
numărul total din răspunsuri corecte la un test; cadrul de referință e conținutul întregului test.
Atunci când sunt disponibile norme suplimentare, un scor brut poate fi localizat în cadrul distribuțiilor a două sau
mai multe grupuri sau subgrupuri diferite și poate fi convertit cu ușurință în rang percentilic.
Palierul superior și inferior al testului
Problema pusă de indivizii aflați la extremitățile spectrului stabilesc limitele superioare și inferioare ale
performanței la acel test. Dacă o persoană testată atinge cel mai mare scor ce poate fi obținut la un test standardizat
= plafonul testului este insuficient: nu se poate ști cât de mare ar fi putut fi scorul obținut de acea persoană dacă
în test ar fi existat itemi suplimentari sau itemi cu o dificultate mai mare.
b. Scoruri standard
O modalitate de a depăși problema inegalității unităților percentile și de a transmite semnificația scorurilor
în raport cu un grup normativ = transformarea scorurilor brute pe scale care exprimă poziția scorurilor în raport
cu media, în unități de abatere standard – transformare liniară simplă.
O transformare liniară modifică unitățile în care sunt exprimate socrurile, lăsând nemodificate interrelațiile
dintre acestea = forma unei distribuții a scalei scorurilor derivată liniar pentru un grup este aceeași cu cea a
distrbuției scorurilor brute.
Prima transformare liniară = transformarea în abateri standard ale scorurilor/scoruri z
Un scor z –distanța dintre un scor brut și media grupului dereferință în termenii abaterii standard a grupului de
referință. Media scorurilor z = 0, iar abaterea standard = 1, iar distrbuția este simetrică bilateral.
Poziția scorurilor z în raport cu media – utilizarea unui semn pozitiv pt scorurile z care se afla deasupra mediei,
si negativ pentru cele de sub; iar valoarea numerică reflectă distanța față de medie în unități de abatere standard.
Deoarece transformarea scorurilor brute în scoruri z este prima în procesul de transformare, acestea sunt
considerate a fi exemplul principal de scoruri standard.
Sisteme suplimentare pentru obținerea scorurilor standard
Scorurile z – valori negative și zecimale = suferă uneori transformări liniare suplimentare – scopul de a
exprima rezultatele obținute într-o formă mai convenabilă. Numerele alese ca medii și abateri standard – asbitrare
– câteva au devenit însă mai familiare:
 Scoruri T (m = 50, ds = 10) – utilizate în multe inventare de personalitate, cum ar fi Inventarul Multifazic
de Personalitate Minnesota (MMPI) și Inventarul Psihologic California (CPI)
 Scoruri College Entrance Examination Board (CEEB) (m = 500, sd = 100) – utilizate de SAT și de
Educational Testing Service pentru mulți dintre absolvenții lor și pentru programele de testare la admiterea
în șocli profesionale, cum ar fi Graduate Record Exam (GRE)
 Scoruri ale subtestelor scalei Wechsler (m = 10, sd = 3) – utilizate pentru toate subtestele scalelor
Wechesler, ca și pentru subtestele câtorva alte intrumente
 IQ-ul pe scala Wechsler (m = 100, sd = 15) – utilizat pentru a sintetiza scorurile la toate scalele Wechser
și la alte teste, incluzând multe instrumente care nu-și etichetează scorurile ca IQ
 Otis-Lennon School Ability Indices (m = 100, sd = 16) – utilizat în Otis-Lennon School Ability Test
(OLSAT)
Majoritatea scorurilor standard utilizează o medie de 100 și sd = 15, însă există excepții – duce la diferențe
semnificative în interpretarea scorurilor
O notă cu privire la scorurile IQ pe scala Wechsler – au fost introduse în 1939 – prima scală de inteligență
Wechsler-Bellevue I. IQ Wechsler sunt obținute prin însumarea scorurilor obținute la diferite subteste și
localizarea acestei sume în tabloul normativ adecvat și nu prin formula (vârsta mentală/vârsta cronologică) x 100.
Transformări nonliniare = cele care convertesc o distrbuție de scoruri brute într-o distribuție cu o formă
diferită de cea inițială – utilizând în consturirea testului metode care permit o flexibilitate mai mare în manevrarea
distribuțiilor scorurilor brute decât conversiile liniare.
Transformarea scorurilor z în percentile = transformarea fiecărui scor brut în scor z și localizarea scorului z în
tabelul ariilor situate sub curba normală pentru a obține proporția/procentul ariei curbei normale care se află sub
acel punct.
Scorurile standard normalizate – când o distribuție de scoruri aproximează distribuția normală, dar nu se
suprapune exact cu aceasta.
Pentru a normaliza scorurile – trebuie să găsim mai întâi procentul de persoane din eșantionul de referință care se
află la nivelul fiecărui scor brut sau sub el – procentele sunt transformate în proporții – proporțiile sunt localizate
în Tabelul ariilor situate sub curba normală pentru a obține scoruri z corespunzătoare acestor ari.. Scorurile
obținute astfel nu pot fi distinse ca formă de cele obținute prin formula transformării liniare, dar trebuie
identificate ca scoruri standard normalizate pt a atenționa utilizatorul testelor că ele provin dintr-o distribuție
asimetrică.
Staninele (standrad nine) – transformă toate scorurile într-o distribuție în numere alcătuite dintr-o cifră de
la 1 la 9 – reduce timpul și efortul necesar pentru a introduce scorurile in computer și pt a fi stocate/procesate
ulterior. Media scaleli în stanine = 5, iar sd = aproximativ 2 – concizia și simplitatea sa duc și la o anumită pierdere
a preciziei.
Comparații între teste
- Compararea scorurilor obținute la un test nu are sens dacă:
o Testele sau versiunile testului sunt diferite
o Grupurile de referință sunt diferite
o Scalele scorurilor diferă, cu excepția situației în care testele, grupurile sau scalele au fost
echivalate în acest scop.
- Chiar și atunci când scorurile obținute pot fi comparate, trebuie luați în calcul factorii externi în
interpretarea scorurilor.
Tehnici de echivalare
- Există un număr de situații în care este necesar/dezirabil să comparăm scorurile indivizilorgrupurilor
în timp sau în diferite situații de funcționare psihică, în raport cu o normă uniformă
a. Formele alternative = două sau mai multe versiuni ale unui test menite a fi utilizate
interșanjabil, care urmăresc același scop și sunt administrate în manieră identică.
Crearea formelor alternative care sunt asemănătoare în conținutul pe care-l acoperă, dar variază în itemii specifici
pe care îi conțin = cea mai simplă modalitate de a produce teste comparabile.
O variantă mai strictă de a obține teste comparabile poate fi atinsă cu tipul de versiuni alternative ale testului –
forme paralele – sunt echivalente în privința acoperirii conținutului și a procedurilor și în ceea ce privește
caracteristicile statistice (m, sd, indicatori fidelitate & validitate).
Formele alternative sunt utile pt metoda test-retest.
Efectele practice – este dată o formă alternativă a unui test aplicat anterior, dar nu sunt la fel de mari ca atunci
când aceeași versiune a testului este aplicată încă o dată.
b. Testele ancoră = seturi comune de itemi administare unor grupuri diferite de examinați în
contextul a două sau mai multe teste, oferă o soluție diferită la problema comparării scorurilor
obținute la test.
Dacă avem răspunsurile mai multor grupuri normative la seturi comune de itemi, într-un cadru temporal dat,
putem să extrapolăm și să comparăm scorurile unui test cu cele ale altuia atât pentru indivizi, cât și pentru grupuri.
Tehnica – urmărește facilitarea comparării nivelelor de performanță la diferite arii de abilități, cum ar fi
înțelegerea unui text citit și exprimarea în scris = din două teste diferite, pe o scală uniformă.
c. Grupurile fixe de referință = cale de a dobândi o anumită comparabilitate și continuitate a
scorurilor testului în timp.
Această metodă utilizează teste-ancoră încorporrate în fiecare formă succesivă a testului pentru a oferi o legătură
cu una dintre formele anterioare ale aceluiași test: o serie de teste este legată printr-un lanț de itemi comuni de
scorurile grupului selectat ca referențial fix în scopul menținerii continuității scalei scorurilor în timp.
d. Normarea simultană a două sau mai multe teste pe același eșantion de standardizare, deseori
numită co-normare, este încă o metodă utilizată pentru a obține scoruri ce pot fi comparate.
Prin normarea testelor în același timp și pe același grup de persoane, se poate compara performanța indivizilor
sau subgrupurilor la mai multe teste, utilizând același standard – posibilitate utilă când se dorește constrastarea
nivelelor de performanță relative pentru două sau mai multe funcții psihice, cum ar fi nivelele vocabulrului
expresiv și receptiv sau memoria de scurtă durată și de lungă durată pentru același individ sau pentru un subgrup.
Teoria răspunsului la item (TRI)
Diferite procedee sofisticate bazate pe modele matematice înlocuiesc din ce în ce mai mult tehnicile
tradiționale de echivalare descrie – sunt cunoscute drept modele ale trăsăturii latente, și sunt grupate cel mai des
după eticheta teoria răspunsului la item.
Trasatura latentă = aceste modele caută să estimeze nivelele – neobservabile – ale diferitelor aptitudini, trăsături
sau constructe psihologice care sunt subiacente comportamentului observabil al indivizilor, demonstrat de
răspunsurile lor la itemii testului.
Metodele TRI aplică modele matematice datelor itemului testului din eșantioane mari și diverse, de aici și
denumirea teoria răspunsului la item. Aceste date sunt utilizate pt a calibra itemii testului împreună cu unul sau
mai mulți parametri și pentru a determina probabilitatea estimată a gradului aptitudinii, sau a nivelului trăsăturii,
necesară pt a răspunde la fiecare item într-un anumit fel = plasează atât persoanele, cât și itemii testului pe o scală
comună.
Dacă modelele TRI îndeplinesc anumite condiții = estimări de parametri ai itemului invariabile de-a lungul
populațiilor – nu sunt legate de performanța unui grup de referință specific.
TRI sunt aplicate unor arii de răspuns la item și datelor scorurilor la test din diferite eșantioane și sunt
îndeplinite premizele modelelor, pot fi utilizate:
- Pentru a estima probabilitatea ca persoanele cu anumite nivele specificate ale aptitudinii sau trăsăturii
în chestiune să răspundă corect la un item sau să răspundă la el într-un anumit mod
- Pentru a estima nivelele trăsăturii necesare pentru a avea o probabilitate specifică de a răspunde la un
item într-un anumit mod
Testarea computerizată adaptativă = avantaj al metodologiei TRI
Atunci când indivizilor li se aplică TCA – nivelele lor pot fi estimate pe baza răspunsurile la itemii testului în
timpul procesului de testare – sunt utilizate pt a selecta itemii testului adecvați nivelului de aptitudine al
persoanelor cărora li se aplică testul + ele pot reduce frustrarea pe care o pot simți multe persoane care răspund
la teste creion-hârtie atunci când sunt puse în fața broșurilor testului care conțin itemi ce se află considerabil peste
nivelul lor de abtitudine/sub aceasta.
Revizuirile unui test
- Denumirea testului poate reprezenta cu ușurință o posibilă sursă de confuzie pentru potențialii
utilizatori ai testului, insuficient informați – rareori se justifică să te orientezi după titlu. Unele sunt
evidente: inventarele de personalitate nu inventariază personalitate; altele nu sunt evidente.
- Un test revizuit nu poate fi comparabil cu versiunea anterioară, decât dacă similaritățile au fost stabilite
empiric.
- Revizuirile minore pot face testele comparabile = se aplică ambele versiuni acelorași persoane apoi se
corelează – corelație puternică = versiunile sunt interșanjabile.
- Revizuirile majore necesită restandarizarea testului cu un nou eșantion normativ – atunci când
schimbările sunt semnificativ suficiente pentru a justifica diferențele în scala/scorarea testului, avem
de-a face cu un test nou.
Schimbări longitudinale ale normelor testului
Atunci când un test este revizuit și standardizat pe un nou eșantion după o perioadă de câțiva ani, chiar dacă
revizuirile conținutului sunt minore, normele de scorare tind să se deplaseze într-o direcție sau alta datorită
schimbărilor apărute în populație după diferite perioade de timp.
Interpretarea testelor în raport cu un criteriu
În domeniul evaluării educaționale și ocupaționale, testele sunt utilizate deseori pentru a ne ajuta să
stabilim dacă o persoană a atins un anumit nivel de compentență într-un domeniu de cunoaștere sau a dobândit o
anumită abilitate în realizarea unei sarcini.
În astfel de cazuri, cadruld de referință a testelor trebuie schimbar – în loc să comparăm performanța
persoanei cu cea a celorlalte, performanța unui individ sau a unui grup este comparată cu un criteriu sau un
standard prestabilit.
Atunci când este utilizat în acest context, criteriul – fie cunoașterea unui domeniu de conținut specific, fie
competența într-un anumit tip de demers. Standardele – definite în mod tipic înt ermeni de nivele specificate de
cunoștințe sau expertiză necesare pentru a absolvi un curs, sau pt a obține un grad pt a dobândi o licență profesinală
– pot presupune demonstrarea unei competențe suficiente pt a efectua o activitate/realiza un produs.
Deseori, aplicarea testelor cu raportare la criteriu – scoruri limită/intervale de scoruri care separă
competență – incompetență/delimitează nivele diferite de performanță.
Tipuri de interpretare a testului în raport cu un criteriu = testarea în raport cu domeniul/conținutul/referință
obiectiă/testarea competenței. – interpretarea testului în raport cu un criteriu utilizează cel puțin două seturi de
standarde subiacente:
- Cele bazate pe gradul de cunoaștere a conținutului unui domeniu demonstrat de testele obiective
standardizate
- Cele bazate pe nivelul de competență într-o arie de abilități prezent în calitatea performanței sau a
produsului care a rezultat în urma exercitării acestei abilități.
Ocazional, „testare în raport cu criteriul” = interpretările bazate pe relații prestabilite între scorurile obținute la un
test și nivelele așteptate de performanță în raport cu un criteriu, cum ar fi o activitate viitoare/alt test.
Interpretarea testului în raport cu criteriul versus norma
 Testele cu raportare la normă urmăresc să localizeze performanța unuia sau mai multor indivizi în
constructul evaluat pe un continuum creat de performanța unui grup de referință
 Testele cu raportare la criteriu urmăresc se evalueze performanța indivizilor în relație cu standarde
referitoare la constructul în sine
În mod tipic, testele cu referire la criteriu:
o Stabilesc măsura în care persoanele testate sunt competente în anumite domenii de abilități sau
de cunoștințe
o Sunt scorate astfel încât performanța unei persoane nu influențează poziția celorlalte.
Variază maniera particulară în care sunt utilizate testele în raport cu un criteriu – uneori criteriile sunt cantitative
(atunci când este nevoie de anumite procente de răspunsuri corecte pt a stabili o măiestrie adecvată); alteori au o
natură mai mult calitativă și subiectivă. Mai mult, uneori performanța la aceste teste este evaluată pe o bazo de
tipul totul-sau-nimic.
Testarea cunoștințelor din diferite domenii de conținut
Pentru a utiliza cunoașterea domeniilor de conținut drept cadru de referință al interpretării scorurilor
obținute la test – câmp/subiect definit cu atenție și demarcat în mod clar din care să se extragă eșantioanele pt a
estima cunoștințele celui căruia îi este explicat testul.
Obiectivele trebuie evaluate atât în termenii cunoașterii unui domeniu de conținut, cât și în cei ai aplicării
acestor cunoștințe și ai standardelor care vor fi utilizate în evaluarea acestor obiective, care ar trebui să derive
dintr-un consens al experților.
Când domeniile de cunoaștere reprezintă cadrul de referință al interpretării testului, întrebarea este: „cât
de mult din domeniul specificat stăpânește cel căruia i-a fost aplicat testul?” și scorurile sunt prezentate cel mai
des sub forma procentului de răspunsuri corecte. = testare în raport cu conținutul/domeniul.
Planificarea acestor teste necesită dezvoltarea unui tabel de specificații cu celule care specifică numărul
de itemi sau sarcini ce vor fi incluse în test pt fiecare obiectiv de învățare și ariile de conținut pe care testul este
destinat să le evalueze.
Evaluarea performanțelor
- Pentru luarea deciziilor în domeniul ocupațional/educațional – nevoia de a stabili/certifica competențe
în realizarea unor sarcini care să fie mai realiste, mai complexe, care consumă mai mult timp sau sunt
mai dificil de evaluat decât cele tipice pentru testarea în raport cu conținutul sau domeniul.
- Când scopul e de a stabili nivele de competență în tipul de contexte în care abilitățile sunt aplicate în
viața reală, criteriul din interpretarea testului „în raport cu un criteriu” este fie calitatea performanței,
fie aprodusului care rezultă din punerea în practică a acelei abilități.
Evaluarea și scorarea în determinarea performanței – impune un set diferit de procedee decât atunci când se
realizează o testare a cunoașterii domeniilor de conținut – se bazează pe judecată subiectivă.
Excepție – atunci când criteriile pot fi cuantificate în termenii rapidității realizării, numărului de erori, de unități
produse sau alte standarde obiective. Ex: test de dactilografiere.
Multe tipuri de evaluare a performanței presupun:
- Identificarea și descrierea criteriilor calitative de evaluare a performanței sau produsului
- Construirea unei metode de aplicare a criteriilor
Metodele obișnuite de evaluare a criteriilor calitative presupun scale de ierarhizare sau rubrici de scorare
care descriu și ilustrează regulile și principiile ce urmează a fi aplicate în scorarea calității unei performanțe sau
a unui produs.
Testarea îndemânării – procedurile care evaluează performanța la test pe baza faptului că un subiect demonstrează
sau nu un nivel prestabilit de îndemânare sunt cunoscute drept teste de îndemânare – necesită scorări de tipul
totul-sau-numic, cum ar fi corect sau greșit, bazate pe un anumit nivel al criteriului care separă îndemânarea de
neîndemânare
Predicția performanței
a. Tabelele de expectanță prezintă distribuția scorurilor testului pentru unul sau mai multe grupuri de
indivizi, tabelată încrucișat cu performanța de criteriu.
b. Graficele de expectanță sunt utilizate atunci când performanța la criteriu într-o sarcină de muncă, un
program de formare sau de studiu poate fi clasificată drept reușită sau nereușită.

S-ar putea să vă placă și