Sunteți pe pagina 1din 12

Tema 3: note de curs

Aspecte generale privind constructia testelor de personalitate

Cerinţe generale şi etape generale în construirea unui chestionar de


personalitate
Asamblarea unui esantion de itemi

Există 2 probleme esenţiale în construirea şi experimentarea unui chestionar de evaluare a


personalităţii:
a. definirea constructului, deci a trăsăturii care va fi măsurată. Aceasta se va face în funcţie de
scopul testării şi de orientarea teoretică cu care operează autorul.
b. Construirea unui set de itemi prin care subiectul este chestionat în legătură cu acele
comportamente sau situaţii care sunt relevante pentru trăsătura respectivă. Răspunsurile subiectului
la itemi vor servi ca indicatori ai constructului.
Aceste două probleme sunt strâns legate şi presupun un demers unitar prin care pornind de la o
definiţie de lucru asupra constructului psihologul traduce dimensiunile acesteia îninr-un set de
itemi. Este vorba de un proces de operaţionalizare gradată a constructului, până la transpunerea
acestuia în itemi.
În definirea constructului psihologul poate opera cu o definiţie specifică asupra acestuia sau îşi
poate construi propria definiţie de lucru reunind elemente prin care constructul rerspectiv este
definit de către mai mulţi autori sau în mai multe lucrări. De exemplu, Porot semnalează trei
condiţii esenţiale ale anxietăţii: sentimentul unui pericol indeterminat, acompaniat de fantasme
tragice; starea de atenţie faţă de pericol, alerta psihică; convingerea de neputinţă şi sentimentul de
dezorganizare. Dacă utilizăm drept reper modul de definire cu care operează proiecte de tip DSM
sau ICD va fi necesar să adăugăm simptomatologia somatică în definiţia anxietăţii şi să facem unele
diferenţieri mai fine între tipurile concrete de manifestare a anxietăţii. În sfârşit, dacă operăm în
cadrul unei definiri din perspectiva terapiei cognitiv-comportamentale vom accentua asupra
perturbărilor cognitive ce apar în anxietate sau asupra modului detaşat de autoexperimentare şi
asupra calităţilor experienţei emoţionale dacă definiţia este una experienţială. Modul de definire
este strict dependent de scopul testării. Pentru a satisface o pretenţie de exhaustivitate, este necesară
o muncă prealabilă de documentare în problematica respectivă şi construirea unei definiţii de lucru
de tip integrativ sau sumativ.
În pasul următor vor fi identificate dimensiunile definiţiei, cu un grad de generalitate mai redus.
Acestea vor rezulta în funcţie de tipul de definiţie cu care autorul operează şi descopul evaluării.
Dacă scopul este evaluarea nivelului anxietăţii pacienţilor din clinică, centrarea va fi asupra
simptomelor iar dimensiunile pot viza de exemplu principalele tipuri de manifestări ale anxietăţii:
emoţionale, somatice, comportamentale şi cognitive. Într-o definiţie de tipul celei utilizate de Porot
aceste dimensiuni sunt sugerate chiar de autor. Unii autori precum Anastasi recomandă ca procesul
de operaţionalizare să continue prin identificarea de variabile şi indicatori, cu un nivel de
generalitate tot mai redus, aceştia din urmă urmând a fi traduşi în itemi. Organizarea este una de tip
arborescent, de la general la particular. Este posibil ca o dimensiune sau o variabilă a constructului
să fie reprezentată în instrumentul final printr-un număr inegal de itemi, în funcţie de măriea
acesteia şi relevanţa ei în definirea constuctului.

Cerinţe în construirea testului

a. Alegerea tipului de probă sau de chestionar depinde de scopul evaluării (ce testăm) şi de
domeniul de aplicare (de ce testăm şi pe cine). Ideea este de a răspunde unor probleme specifice ale
contextului şi ale subiecţilor vizaţi care pot deteriora comunicarea prin chestionar devenind surse de
eroare în evaluare.
b. Cerinţe ce ţin intrinsec de construirea chestionarului: adecvarea conţinutului itemilor, numărul de
itemi, omogenitatea sau neomogenitatea acestora, calităţile itemilor, relaţia existentă între item şi
trăsătură etc. Toate aceste aspecte vor afecta calităţile psihometrice ale testului, deci valoarea
acestuia ca instrument de măsurare.

Aplicarea experimentală a eşantionului de itemi

Un studiu pilot iniţial se poate face pe un număr minim de 20 subiecţi (după Meili, 1964). Scopul
acestui studiu pilot este acela de a aduce corecţii chestionarului, de a răspunde unor întrebări care
privesc intervenţia necontrolată a anumitor aspecte sau variabile ce pot influenţa rezultatele şi
fidelitatea testului.
Surse de eroare în evaluare care apar şi pot fi corectate în această etapă:
a. Standardizarea corectă (sau incorectă) a instructajului şi/sau condiţiilor specifice de răspuns,
b. Standardizarea tipului de răspuns,
c. Formularea unor itemi/scale de validare (control) a chestionarului în raport cu atitudinea
subiectului (estimarea incorectă a unor manifestări simptomatice sau situaţionale, atitudini de faţadă
sau bazate pe dezirabilitatea socială etc),
d. Construirea unor exemple introductive.

Validarea statistică preliminară

Această etapă are ca scop eliminarea itemilor neomogeni, nesemnificativi, care dublează un aspect
investigat etc. Se realizează în genere pe un număr de subiecţi suficient de larg ca să permită
clarificarea următoarelor aspecte:
a. Nivelul de dificultate al itemilor,
b. Precizarea grilei de răspuns (repartiţia itemilor în funcţie de posibilităţile de răspuns),
c. Capacitatea de discriminare.

Scopul acestei etape este acela de a elimina acei itemi care sunt neadecvaţi şi de a ordona itemii în
funcţie de gradul de dificultate (dacă este cazul să facem această ordonare, în special pentru probe
ce presupun performanţa rezolutivă) şi de tipul de grilă folosit (nu se vor pune, de exemplu prea
mulţi itemi într-o succesiune prelungită de reacţii relevante prin acelaşi fel de răspuns: Da sau Nu).
Tot în această etapă vor fi eliminaţi şi acei itemi care sunt reprezentativi pentru trăsătură dar care,
datorită unor motive precum dezirabilitatea, primesc acelaşi tip de răspuns de la majoritatea
subiecţilor.
În această etapă vom obţine o repartiţie echilibrată a itemilor în chestionar; adecvarea nivelului de
dificultate a limbajului la cel al populaţiei vizate; eliminarea acelor itemi ce nu contribuiela sau sunt
irelevanţi pentru posibilitatea de a dihotomiza subiecţii în funcţiede variabila testată. Această din
urmă calitate – capacitatea de discriminare – este considerată, alături de omogenitate, ca fiind
inseparabilă de validitatea testului (Meili). Capacitatea de discriminare se determină statistic prin
corelaţia cu un criteriu extern fie prin comparaţia corelaţiei fiecărui item cu rezultatele globale ale
scalei/chestionarului erxperimentat.

Cerinţe pentru validarea statistică preliminară

a. Lucrul cu un grup de subiecţi semnificativ pentru dimensiunea avută în vedere (criteriu extern).
b. Sarcina testului (conţinutul itemilor) să se refere la variabila avută în vedere.

Standardizarea interpretării prin etalonarea chestionarului

Cerinţe privind etalonarea


a. Construirea chestionarului în formă finală (definitivă). Problema aici este aceea de a respecta
cerinţale din etapele anterioare
b. Construirea unui lot (eşantion) de subiecţi adecvat, cât mai diversificat în funcţie de de criteriile
specifice categoriei populaţionale testate cu ajutorul instrumentului.
În această etapă aplicăm forma definitivă a chestionarului, exemplele de familiarizare cu proba
(dacă este cazul), experimentarea limitei de timp de răspuns (dacă este cazul, vom cere fiecărui
subiect să încercuiască ultimul item la care a răspuns, din minut în minut, până când ultimul subiect
termină de răspuns).
Tot în această etapă suntem interesaţi de valoarea testului ca măsură standardizată. Aici sunt
realizate cercetări privind validitatea diferitelor scale sau faţete, sunt continuate investigaţiile
privind fidelitatea, corelaţii cu alte teste, studii factoriale care să permită descoperirea de noi grupări
(faţete sau factori specifici), studii privind validitatea predictivă sau de criteriu etc.

Strategii de construire a chestionarelor de personalitate

Megargee (1972) inventariază 3 astfel de stategii sau metode: a. Metoda intuitivă sau abordarea
raţională, b. Metoda criteriului extern sau metoda empirică, c. Metoda criteriului intern sau
metoda factorială. Desigur, pot exista şi strategii de construcţie care combină elemente specifice
celor trei metode, numite strategii mixte.

Metoda intuitivă sau abordarea raţională

Autorul chestionarului este cel care decide ce itemi vor fi incluşi în chestionar şi care sunt
conţinuturile relevante pentru a traduce trăsătura într-un comportament. Acest fapt face ca o serie de
aspecte cum ar fi cunoştinţele acestuia de psihologie, experienţa în construirea şi utilizarea de teste
şi cunoaşterea problematicii specifice a trăsăturii ţintă să capete o importanţă specială.
Hase şi Goldberg (1967) realizează o tipologie a abordărilor raţionale folosind 2 criterii. Folosind
drept criteriu modul de selectare a conţinutului itemilor, disting între abordări în care selecţia se
bazează pe înţelegerea strict intuitivă a trăsăturii şi abordări în care selecţia este ghidată de o teorie
formalizată asupra personalităţii. Un al doilea criteriu priveşte instanţa care selecţionează itemii şi
diferenţiază între strategii în care autorul chestionarului este cel care optează şi strategii în care se
constituie un grup de persoane care face selecţia (judecători, experţi).
Megargee (1972) deferenţiază între selecţii pur intuitive şi cele mixte (parţial empirice), în care
selecţia este parţial ghidată de date experimentale. De exemplu, este cazul a 4 dintre scalele CPI
construite pe baza analizei consistenţei interne. În astfel de scale autorul selectează intuitiv un lot de
itemi care par să traducă (reflecte) trăsătura investigată, selecţia iniţială este analizată sub aspectul
consistenţei interne şi sunt păstraţi acei itemi care obţin un coeficient de corelaţie satisfăcător (un
nivel suficient de încredere).

Paşi

a. selecţia intuitivă a conţinuturilor itemilor şi a lotului iniţial de itemi


b. administrarea întregului lot de itemi unui grup de subiecţi
c. calcularea scorurilor totale la această scală preliminară
d. calcularea corelaţiilor dintre scorurile la itemi şi scorurile totale pentru toţi itemii din lotul
preliminar
e. utilizarea coeficienţilor de corelaţie drept criteriu pentru selecţia finală a itemilor (vor fi selectaţi
acei itemi cu cele mai mari corelaţii între scorurile proprii şi cele totale).

Într-un astfel de demers mixt, datele empirice pot fi utilizate pentru a creşte validitatea
discriminativă a testului prin eliminarea itemilor cu patternuri de răspuns ambigui sau care prezintă
corelaţii semnificative cu scale care măsoară alte trăsături.

Avantaje si dezavantaje
Dupa Megargee, principalele avantaje ale strategiei intuitive ar fi legate de:
a. validitatea de conţinut ridicată
b. coerenţă intrinsecă (consistenţă internă) a instrumentului.
Principalele dezavantaje ale metodei rationale tin de:
a. omogenitatea şi conţinutul itemilor depind de abilitatea autorului de a-şi imagina şi anticipa
răspunsurile la problemele itemilor ale subiecţilor caracterizaţi prin trăsătura respectivă
b. transparenţa instrumentului, facilitatea pentru subiect de a înţelege sensul itemilor şi modelul de
răspuns expectat de autor/chestionar, ceea ce deschide posibilitatea distorsionării voite a
răspunsurilor pentru a simula/disimula/da răspunsuri dezirabile. Acesta este motivul pentru care
unele chestionare precum CPI sau MMPI au construite scale de validare a profilului individual sau
scale de corecţie a scorurilor individuale.

Metoda empirică sau a criteriului extern

Selecţia itemilor în test este ghidată doar de relaţia empiric determinată între itemul testului şi o
măsură criteriu specifică.

Etape

a. asamblarea unui eşantion iniţial de itemi, pe baze raţionale sau folosind itemi din alte chestionare
b. administrarea setului de itemi la două grupuri de subiecţi care diferă între ei doar la nivelul
trăsăturii evaluate
c. determinarea pentru fiecare lot a frecvenţei răspunsurilor acord/dezcord
d. determinarea semnificaţiei statistice a difernţelor obţinute
e. itemii care difernţiază semnificativ cele două loturi sunt selectaţi pentru scala preliminară
f. scala rezultată este aplicată din nou loturilor criteriu iniţiale
g. dacă răspunsurile analizate sunt satisfăcătoare, scala va fi validată pe noi loturi pentru a identifica
şi elimina itemii cu o capacitate scăzută de discriminare
h. această scală prescurtată şi rafinată va fi din nou validată.

Avantaje

a. depăşeşte abilitatea intuitivă a unei singure persoane


b. reprezintă o consecinţă a comportamentului (răspunsului) unui număr mare de persoane faţă de
conţinutul itemilor şi poate detecta astfel itemi discriminativi pentru respectiva trăsătură, care sunt
departe de a fi evidenţi de la sine. Prin această metodă a fost construită, de exemplu, scala de
socializare din CPI.
Apare o cerinţă foarte importantă legată de această modalitate de selecţie, anume aceea a unei mari
acurateţi în selecţionarea loturilor criteriu de subiecţi, cazul contrar conducând spre selecţii greşite,
de itemi irelevanţi.
Concluzionând, în cadrul acestei metode relaţia empiric stabilită între itemi şi un criteriu extern şi
nu conţinutul manifest al itemilor determină selecţionarea acestora pentru chestionarul final. Un
item va fi inclus în test dacă este capabil în mod empiric să diferenţieze cele două loturi, indiferent
dacă răspunsurile subiecţilor par paradoxale (relaţia cu criteriul este obscură) sau direcţia lor pare
absurdă. Psihologul nu va fi preocupat de adevărul literal al răspunsului subiectului la item, ci
interesul său va fi orientat către relaţia dintre răspunsul subiectului la item şi alte dimensiuni
comportamentale implicite. Din aceste motive, scalele derivate empiric pot fi mai subtile şi mai
dificil de trucat decât cele raţionale. Scăderea validităţii aparente/de conţinut (implicită acestui tip
de scală) face ca testul să fie mai greu acceptat de către subiecţi („nu înţeleg de ce te interesează
acest lucru” sau „de ce acest aspect are relevanţă pentru angajarea mea”) şi mult mai dificil de
explicat nespecialiştilor care presupun existenţa unei relaţii directe între item şi constructul
investigat.
Această metodă de selectarea itemilor într-un chestionar devine decisivă atunci când se pune
problema utilităţii predictive a instrumentului în raport cu diferite criterii, deci pentru construirea
unor chestionare de tip vocaţional, clinic sau pentru măsurarea unor trăsături care sunt marcate de
prejudecata mentalităţii comune.

Metoda analizei factoriale sau a criteriului intern

Pune accent pe analiza criteriului intern, respectiv pe tehnici statistice care permit ca, odată cu
identificarea unui factor care apare ca dimensiune responsabilă de variaţia semnificativă a
comportamentului, să construim şi o scală pentru a defini psihologic şi a evalua respectivul factor.

Paşi

a. construirea pe baze apriori a unui lot relativ mic de itemi (celelalte metode presupuneau o selecţie
finală dintr-un număr iniţial mare de itemi posibili), itemi ce par să fie strâns legat de factorul vizat
b. aceşti itemi sunt administraţi unui număr mare de subiecţi, testaţi adesea în paralel şi cu alte
instrumente semnificative în raport cu factorul-dimensiunea vizată
c. se realizează o intercorelare a itemilor, matricea rezultată fiind analizată factorial, rotată conform
procedurii alese şi obţinându-se astfel o clusterizare care este responsabilă de un anumit cuantum al
variaţiei comportamentului subiecţilor testaţi
d. se determină încărcătura factorială a fiecărui item (corelaţia cu fiecare factor rezultat)
e. vor fi selectaţi pentru scala finală acei itemi care au cea mai înaltă încărcătură factorială.
Rezultatul va fi o soluţie structurală simplă, în care fiecare factor este responsabil pentru o anumită
trăsătură.
În această metodă pot interveni erori datorate metodei de analiză factorială sau datorită lipsei de
distinctivitate conceptuală între structură şi fenomen. Astfel, abilitatea cercetătorului constă în
analiza semnificaţiei psihologice a itemilor care structurează un anume factor, pentru a da
consistenţă psihologică, sens calitativ produsului analizei cantitative. Majoritatea chestionarelor
contemporane sunt construite cu ajutorul acestei metode, existând chiar tendinţa de fi pus sub
semnul întrebării orice chestionar care nu a fost supus analizei factoriale.

Avantaje si dezavantaje

Avantajul principal al unei astfel de scale este puritatea factorială şi omogenitatea sa, ceea ce
înseamnă că scoruri egale semnifică performanţe echivalente la testul respectiv (deziderat central
pentru orice instrument de psihodiagnostic).
Dezavantajul testelor factoriale vine din faptul că scalele factoriale nu relaţionează suficient de
flexibil şi relevant cu comportamentul viu, deci cu modele comportamentale complexe în care
factorul respectiv apare doar ca una dintre determinante (fapt acuzat adesea de psihodiagnosticienii
de orientare clinică).
In sfarsit, un caz special de strategie de construire a chestionarelor de personalitate este cel al
abordarii lingvistice, care este prezentat detaliat la capitolul privind abordarea Big Five.

Aspecte generale şi probleme privind construirea itemilor chestionarelor de


personalitate

În istoria psihodiagnozei s-a remarcat o anumită evoluţie a preocupărilor vis a vis de construirea
itemilor. Angleitner, John şi Lohr (1986) amintesc despre o anumită neglijare în faza de început a
construirii de teste de personalitate, a preocupărilor legate de proprietăţile itemilor, în favoarea
centrării aproape exclusive asupra principiilor de construire a scalelor. De aici rezultă inevitabil o
sursă importantă de eroare în evaluare.
În sfârşit, actualmente există câteva probleme legate de construcţia itemilor care intră în sfera
preocupărilor creatorului de teste: cum trebuie construit lotul iniţial de itremi; cum trebuiesc scrişi
itemii; cum influenţează caracteristicile formale şi de conţinut ale formulării modul în care vor
prelucra subiecţii acel item. Aceste categorii de probleme au preocupat pe creatorii clasici de teste
şe se află în dezbaterile actuale în domeniu.

Strategii generale de construire a itemilor - Problema limbajului

În 1957, Loevinger aducea în discuţia specialiştilor o anumită problematică. El incriminează faptul


că deficienţa majoră care apare în procesul de generare a itemilor pentru a reprezenta un anumit
construct ţine de imposibilitatea de a-l repeta ca pe orice experiment psihologic. Această deficienţă
ar ţine de gradul mare de subiectivitate care vine din partea cercetătorului care construieşte testul. El
a încearcat să structureze câteva reguli privind construirea lotului iniţial de itemi, pornind de la
postularea realităţii că itemii lotului iniţial sunt întotdeauna extraşi dintr-o arie de conţinuturi mai
largă decât trăsătura propriuzisă. De aici apare posibilitatea erorii legată de selecţia unor itemi care
traduc alte conţinuturi.
Regulile formulate de Loevinger:
a. Necesitatea de a fi construiţi şi itemi care să evalueze alte trăsături, înrudite dar cu valoare
discriminativă faţă de trăsătura avută în vedere,
b. Itemii trebuie aleşi astfel încât să reprezinte toate conţinuturile posibile care ar putea exprima
trăsătura respectivă, în funcţie de toate teoriile cunoscute,
c. Domeniile conţinuturilor ar trebui să fie reprezentative pentru importanţa lor existenţială.
În 1967, Jackson accentuează asupra necesităţii de a opera definiţii specifice şi reciproc exclusive
pentru fiecare construct (trăsătură), bazate pe trecerea în revistă a literaturii de specialitate privind
dimensiunea respectivă. Sistemul propus de Jackson („sistem secvenţial de dezvoltare a scalei de
personalitate”) consta în aceea că unui grup de judecători experţi li se dau descrieri ale unor
persoane ţintă care manifestă în înaltă măsură în comportamentul lor trăsătura investigată. În pasul
următor ei vor judeca şi ranga probabilitatea ca aceste persoane să aprobe fiecare dintre itemii
propuşi. O altă sarcină a grupului de judecători experţi era aceea de a stabili gradul, măsura în care
itemii pot fi consideraţi relevanţi pentru constructul respectiv.
În 1983, Buss şi Craik propun un al doilea model coerent privind generarea itemilor (primul fiind al
lui Jackson), pornind de la ceea ce autorii numesc „frecvenţa acţiunii” şi care se bazează pe
prototipicitatea unui comportament pentru o anumită trăsătură. Paşi:
1. selectarea în mod sistematic a unui set de trăsături dintr-un model structurat de comportament
interpersonal (realizat de Wiggins în 1979).
2. un eşantion larg de subiecţi are sarcina de a identifica comportamentele observabile care
corespund trăsăturii (generează acte comportamentale care pot fi considerate manifestări ale
trăsăturii),
3. alt lot de subiecţi apreciază prin rangare gradul de prototipicitate al acestor acte comportamentale
pentru trăsătura dată. Această evaluare se face pornind de la un set de reguli de evaluare a
prototipicităţii şi este bazată pe consensul unui mare număr de vorbitori ai unei limbi, fiind prima
tentativă de a capitaliza cunoştinţele semantice ale oamenilor în legătură cu acele comportamente
care sunt tipice pentru o anumită trăsătură.
Dezavantajul principal al metodei constă în faptul că nu mai este la fel de utilă atunci când se pune
problema construirii unor itemi pentru investigarea unei trăsături pentru care nu există denumiri
elaborate la nivelul limbajului comun (nu ne putem aştepta ca oamenii să aibă intuiţii semantice
relevante), cum ar fi de exemplu cazul unor dimensiuni ce se manifestă în afecţiunile psihice.
Problema fundamentală care apare ca sursă de eroare în evaluare şi este legată de generarea itemilor
este subiectivitatea iniţială din partea autorului testului. Această problemă nu poate fi corijată prin
metodele statistice de experimentare, întrucât ceea ce nu a fost cuprins în test şi este relevant pentru
trăsătură nu mai poate fi recuperat pentru a deveni parte a scalei rezultate. Un alt mod în care se
manifestă subiectivitatea autorului este legat de decizia acestuia privind denumirea scalei sau
factorului rezultat, decizie care va reflecta preconcepţiile acestuia. Această problemă se manifestă
chiar şi în chestionarele actuale, cum este de exemplu situaţia factorului V din chestionarele de tip
Big Five.
O altă problemă comună în modelele propuse de Buss şi Craik sau de Jackson se leagă de definirea
relevanţei pentru personalitate a anumitor cuvinte din limbajul curent. Allport şi Odbert (1936)
consideră de exemplu (într-o modalitate clasică) că relevanţi pentru personalitate sunt acei termeni
care pot fi folosiţi pentru a „distinge comportamentul unui om de comportamentul altuia”.
În 1990, Angleitner, Ostendorf şi John propun un model de definire şi operare selectivă prin trei
modalităţi. 1. Prima dintre ele identifică o taxonomie a tipurilor de caracteristici de personalitate
care pot fi regăsite direct la nivelul limbajului natural (substantive, verbe, adjective, adverbe etc).
Această clasificare cuprinde 6 categorii de conţinuturi: a. trăsături stabile; b. stări şi dispoziţii
psihice; c. activităţi; d. roluri sociale, relaţii şi efecte sociale; e. abilităţi şi talente; f. caracteristici
care ţin de prezenţa fizică. 2. A doua modalitate se referă la specificarea unor criterii de excludere:
a. un termen nu este relevant pentru personalitate dacă este nondistinctiv şi nu se aplică la toţi
indivizii; b. Termeni ce se referă la originea geografică, naţionalitate, identităţi profesionale sau
legate de o anumită muncă; c. Termeni care se referă doar la o parte din persoană şi d. Termeni a
căror implicaţie pentru personalitate este metaforică şi neprecisă. 3. cea de-a treia modalitate este o
grilă de identificare prin care se exclud acei termeni care nu se potrivesc în oricare dintre
următoarele propoziţii criteriu:
1. Pentru adjective – „Cât de ...... sunt?”, „Cât de ...... s-a comportat X?”
2. Pentru substantive – „Este X ......?”, „Poţi să spui că X este un ......?”
3. Pentru substantive atributive – „ ...... lui X este remarcabilă?”, „Prezintă (posedă) X ......?”
Hofstee (cercetând limba olandeză) în 1990, indică 5 tipuri de obstacole ce trebuie avute în vedere
atunci când se pune problema utilizării limbajului natural în construirea unui sistem ştiinţific de
categorii psihonosologice: 1. domeniul este greu de delimitat (atât categoriile ca atare cât şi alegerea
itemilor din interiorul acestor categorii), 2. măsura în care termenii sunt traductibili dintr-o limbă în
alta este limitată, 3. rolul copleşitorr al aspectelor evaluative în limbajul comun este stânjenitor
pentru un punct ştiinţific de vedere, 4. nu se pot aplica taxonomizări simple sau reguli precise, 5.
mulţi termeni (sau expresii) sunt paradoxali când sunt folosiţi la persoana întâia (autodescrieri). Pe
de altă parte, încercările de a construi un limbaj total artificial s-ar dovedi inutile într-un sens sau
altul (fie că nu ar fi înţeles, fie că termenii ar asimila repede impedimentele limbajului curent).
Principala strategie pentru a depăşi această situaţie (obstacole) constă în selectarea acelor termeni
care se subsumează principiului polarităţii trăsăturilor de personalitate. Acelaşi autor pledează
pentru formularea itemilor la persoana a treia singular (cerinţa abandonării chestionarelor care cer
subiectului să se autocaracterizeze în funcţie de itemi care generează paradoxuri când sunt aplicaţi
la persoana întâia). O altă recomandare a autorului vizează heteroevaluarea (aceleaşi chestionare
completate de alte persoane care cunosc pe cea testată), procedură care poate include sau nu şi
persoana testată ca judecător.
Mc Crae (1990) afirmă un scepticism legat de capacitatea omului obişnuit (nespecialist) de a
înţelege adevărtele baze ale personalităţii. După opinia sa, în studierea limbii trebuie să se continue
examinarea legăturilor empirice cu alte sisteme ale personalităţii, să se depăşească utilizarea
lexiconului pentru a analiza limbajul vorbit şi scris actual. Ei (Costa şi Mc Crae) dezvoltă variante
ale aceluiaşi chestionar destinate autoevaluării (persoana I-a singular) sau heteroevaluării (persoana
a III-a singular).
De Raad face unele studii (1992) privind diferenţierile între adjective, substantive şi verbe după
capacitatea acestora de a capta şi reda sensuri ale personalităţii. El dentifică faptul că utilizarea
ideosincratică în scalele de evaluare este mai probabilă pentu substantive decât pentru verbe şi
pentru verbe în raport cu adjectivele. Aceste diferenţieri conduc în practică la diferenţe în ordinea
factorilor derivaţi prin ele sau chiar în numărul factorilor rezultaţi. Factorii derivaţi prin substantive
prezintă o tendinţă spre o descriere mai coerentă şi bine definită. Ei tind să cuprindă cele mai
extreme semnificaţii ale dimensiunilor derivate din utilizarea adjectivelor. De asemenea, ei au o mai
largă variaţie în sensuri. Aceste aspecte confirmă caracteristica substantivelor de a fi reprezentative
prin ele însele. Verbele îşi extrag parţial sensurile din situaţii interpersonale, fiind astfel mai
condiţionate şi necesitând mai multă specificare. Un studiu realizat pe limba germană subliniază
capacitatea verbelor de a capta aspecte temperamentale.
În cercetările privind dimensiunile Big Five apare concluzia că o posibilă sursă de variaţie a acestor
dimensiuni în diferite limbi ţine de modurile diferenţiate de relaţionare între cele trei categorii de
termeni (adjective, substantive şi verbe), moduri specifice pentru fiecare limbă. Concluziile
cercetătorilor se îndreaptă către un acord în ceea ce priveşte o mai bună capacitate a adjectivelor de
a deveni descriptori de personalitate, dar este preferabil să se combine capacităţile de captare a
diferitelor clase lingvistice, conform specificului fiecărei limbi (De Raad şi Hofstee, 1993). O altă
recomandare cu referire la modalitatea de utilizare practică priveşte utilizarea de propoziţii şi fraze
în cea mai simplă formă acceptabilă gramatical şi nu a unor cuvinte singulare (Goldberg 1982,
Brigs, 1992).
O altă tendinţă, contrară, este promovată de alţi creatori de teste precum Gough şi constă în aceea că
strategiile sunt utilizate într-o manieră flexibilă iar instrumentele sunt dezvoltate din interiorul
aceluiaşi lot iniţial de itemi (unii preluaţi, alţii rescrişi sau nou creaţi). Un studiu comparativ relevă
faptul că scalele care evaluează constructe similare tind să cuprindă itemi relativ asemănători,
indiferent de diferenţele dintre chestionare privind construcţia sau chiar teoria de bază (de exemplu
itemi care descriu reacţii psihofiziologice pentru scalele de nevrotism sau itemi care descriu
comportamente pentru scalele de extraversie sau minciună). Angleitner concluzionează în 1986 că
între cercetători pare să existe o intuiţie împărtăşită privind ce tipuri de itemi sunt mai adecvate în
măsurarea / exprimarea unor trăsături de personalitate, chiar dacă aceste intuiţii nu au fost până în
prezent sistematizate.

Relaţia item - trăsătură

Ca primă etapă în construirea itemului, decizia privind trăsătura şi conţinuturile psihologice implică
o constantă raportare a itemului la validitatea sa discriminativă:
1. Definirea trăsăturii într-o modalitate optimă se face din perspectiva unei teorii structurale care
reflectă importanţa pentru viaţă a diferenţelor interindividuale generate de dimensiunea psihică
avută în vedere.
Această definire trebuie realizată explicit, fiind descrise atât relaţiile de tip convergent cât şi cele de
tip divergent cu alte trăsături (constructe) şi cu tipurile relevante şi specifice de manifestare a
trăsăturii respective.
2. Pentru evitarea formulării unor itemi nereproductibili sau de tip ideosincratic se vor utiliza loturi
de subiecţi pentru generarea exemplarelor fiecărui tip de itemi iar selecţia se va baza pe acordul
între un număr mai mare de persoane judecător privind gradul de relevanţă al conţinutului itemului
pentru trăsătură.
3. Pentru a capta influenţa contextului situaţional, se va avea în vedere faptul dacă în textul itemului
sunt incluse aspecte relevante ale acestuia (ale contextului) şi dacă conţinutul este cât mai explicit
posibil.

Angleitner realizează o descriere sistematică a relaţiei item - trăsătură pornind de la propriile


cercetări şi rezultatele obţinute de Janke (1973) şi Lennertz (1973). El prezintă un sistem format din
7 categorii, dintre care primele două sunt centrale (fiind prezente cu mare frecvenţă în aproximativ
toate genurile de chestionare. Celelalte 5 categorii se referă la conţinuturi indirect legate de trăsătura
de personalitate, fapt responsabil de altfel şi de diferenţele care apar în stabilitatea răspunsurilor la
itemii de aceste tipuri.

Denumire Definirea conţinuturilor psihologice

1. Descrieri de reacţii* Sunt trăiri evaluate prin itemi şi pot fi:


a. deschise, comportamente observabile
b. acoperite, interne, neobservabile de alţii: senzaţii, sentimente,
cogniţii interioare
c. simptome precum reacţii fiziologice

2. Atribute ale trăsăturii* Reprezintă dispoziţii, de obicei descrise prin adjective sau
substantive şi pot fi:
a. nemodificabile
b. modificabile, când sunt specificate frecvenţa, durata, contextul
situaţional
3. Dorinţe şi trebuinţe** Intenţia de a se angaja în comportamente specificate, dorinţa
pentru ceva anume (nu şi acelea pentru care se specifică
realizarea în prezent)

4. Fapte biografice** Itemi centraţi pe aspecte din trecut

5. Atitudini** Opinii puternic susţinute, atitudini şi opinii faţă de diferite categorii


de subiecte generale, personale, sociale

6. Reacţii ale altora** Itemi care descriu comportamente, reacţii şi atitudini ale altora faţă
de persoană

7. Itemi bizari** Majoritatea de acest fel descriu comportamente şi trăiri evident


neobişnuit, stranii, anormale

Note
* categorii centrale, prezente cu mare frecvenţă în aproximativ toate genurile de chestionare
** categorii care se referă la conţinuturi indirect legate de trăsătura de personalitate

Caracteristici de suprafaţă ale itemilor

Problema care apare în discuţie în etapa de scriere propriuzisă a itemilor (după selectarea
constructului şi a conţinuturilor relevante) este legată de posibilitatea de a da cea mai adecvată
formă pentru diferitele tipuri de conţinuturi. Apar două aspecte legate de această problematică: a.
Găsirea formei celei mai adecvate pentru a da itemului calitatea de indicator al constructului şi b.
Găsirea formei de răspuns cea mai adecvată pentru a da subiectului posibilitatea de a-şi exprima
propria situaţie.

Forma de răspuns

Răspunsurile la itemi pot fi subsumate unor comportamente verbale înalt standardizate,


comportamente provocate de stimuli verbali. Problemele care apar aici sunt legate de tipul de
răspuns solicitat de la subiect: dihotomic, trihotomic, pe o scală Likert sau cu alegere forţată
(exprimare seacă şi generală a itemului iar răspunsurile redau conţinutul propriuzis al diverselor
comportamente posibile).
În tipul clasic de răspuns de tip Da/Nu, Adevărat/Fals , eventual cu un răspuns mediu de tip Nu ştiu,
subiectul trăieşte dificultatea de a lege un răspuns prea extremizat. Dacă este utilizat acest format de
răspuns este important să se moduleze conţinutul itemului prin specificarea frecvenţei sau a
intensităţii manifestării descrise, pentru a evita ca şi itemul să exprime situaţii la fel de extreme ca şi
răspunsurile. Răspunsurile dihotomizate pot fi utilizate numai la itemii modulaţi.
În prezent nu se mai folosesc răspunsuri de tip Nu ştiu sau ?, considerându-se a fi nesatisfăcătoare
din punct de vedere al informaţiei (pot traduce fie neînţelegerea itemului, fie nesiguranţa
subiectului, fie un grad intermediar de răspuns de răspuns în situaţia unor itemi nemodulaţi)
(Anastasi, 1957). Goldberg (1981) indică cel puţin 4 modalităţi de apreciere de către subiecţi a
răspunsurilor de tip mediu: 1. o atribuire situaţională (conduita mea depinde de situaţie), 2. o
expresie a incertitudinii (nu pot decide, nu-mi cunosc suficient de bine acest aspect), 3.
ambiguitatea itemului (nu sunt sigur ce înseamnă), 4. neutralitatea (mă aflu undeva la medie în ceea
ce priveşte această caracteristică).
Cercetările au demonstrat că şi modularea prin intensitate, frecvenţă sau măsură reprezintă o sursă
de ambiguitate (deci de eroare), deoarece subiecţii nu înţeleg aceleaşi lucruri prin cuvinte ca rar,
uneori, adesea, frecvent.
În timp, a fost preferată ca formă de răspuns tehnica alegerilor forţate (dezvoltată în perioada anilor
40 de chestionarele destinate selecţiei profesionale). În esenţă această formă cere subiecţilor să
aleagă între două sau mai multe răspunsuri de tip descriere, fraze care par egale din perspectiva
acceptabilităţii dar care au validitate diferită faţă de criteriul extern. De obicei se construiesc perechi
sau tetrade (de fapt două perechi: 2 răspunsuri dezirabile şi 2 indezirabile). În forme şi mai
extinse /(de tip 5 variante de răspuns), subiectului i se cere de obicei să precizeze care este
răspunsul cel mai caracteristic şi cel mai puţin caracteristic pentru el. O formă specială a tehnicii
alegerilor forţate este cea a sortării Q, dezvoltată de Stephenson (1950), care cere subiectului să
rangheze un număr impar de răspunsuri-situaţii, în funcţie de un criteriu dat, începând de la o
extremă către cealaltă. Intenţia este de a da subiectului posibilitatea de a se exprima personal.
Răspunsurile pe scală Likert sunt folosite în special în studiul atitudinilor. Problema care apare este
legată de numărul de variante de răspuns. Se apreciază că scalele cu mai mult de 5 trepte nu reuşesc
diferenţieri acceptabile, diferenţa dintre treapta 2-3 de exemplu fiind grevată de subiectivitatea
respondentului. Preferabile sunt scalele cu 5 trepte. O altă problemă se leagă de transparenţa
itemilor şi de ideea de dezirabilitate, ceea ce poate conduce subiectul către falsificarea în acest sens
a răspunsurilor.
Un tip special de răspuns care combină variantele prezentate mai sus este folosit de autorii Neo Pi R
(Costa şi Mc Crae), prin care se cere subiectului să-şi exprime acordul sau dezacordul faţă de o
anumită afirmaţie pe o scală gradată în 5 trepte (Dezacord total, Dezacord parţial, Neutru, Acord
parţial, Acord total).

Forma itemului

Sub acest aspect, diversitatea care apare în practică este dezarmantă. Opinia curentă asupra
caracteristicilor de suprafaţă precum lungimea itemului sau complexitatea sintactică a propoziţiei /
frazei este că acestea trebuie corelate cu modul în care se face prelucrarea itemului de către subiecţii
respondenţi. Foss şi Hakes (1978) sau Wiggins (1965) sprijină ideea că gradul de
comprehensibilitate al propoziţiilor este invers proporţional cu numărul mai mare de transformări
implicate şi numărul nivelelor în procesările înţelegerii. Altfel spus, itemul va fi cu atât mai
inteligibil cu cât numărul de transformări este mai mic.
Există 3 aspecte fundamentale ale structurii de suprafaţă a itemilor:
1. Lungimea (numărul de cuvinte, litere, propoziţii - indicată o lungime medie de 12 cuvinte)
2. Complexitatea (corelată pozitiv cu numărul de negaţii, trecerea la diateza pasivă, timpul trecut,
alte moduri verbale decât indicativul, referinţa personală)
3. Formatul propriuzis al itemului (dat de tipul de propoziţie şi de tipul de răspuns)
Lievert (1969), Lohr şi Angleitner (1980), Angleitner (1986) recomandă itemi cât mai scurţi, cu
evitarea multor propoziţii şi negaţii. Lungimea medie a itemilor din principalele chestionare
analizate (altele decât Big Five) este de aproximativ 12 cuvinte. Conjugarea la timpul trcut şi la
modul subjonctiv sau condiţional apare doar în 10,5 % dintre cazuri. Doar 4,5% dintre itemii
curenţi nu au referinţă personală. Există şi o corelaţie posibilă cu categoria de relaţie item -
trăsătură. Astfel, chestionarele care conţin itemi biografici (MMPI de exemplu) conţin şi cel mai
mare număr de itemi la trecut; frecvenţa mare a itemilor legaţi de dorinţe, interese, atitudini, opinii
(specifică pentru 16 PF de exemplu) conduce la exprimarea prin acţiuni de natură ipotetică, deci
verbe la modurile subjonctiv sau condiţional.

Caracteristici semantice ale itemilor

Se referă la acele caracteristici responsabile de apariţia unor dificultăţi sau confuzii în prelucrarea
cognitivă a conţinuturilor itemilor de către subiecţi.
Angleitner (1986) descrie 5 caracteristici semantice care intervin semnificativ îngreunând sau
simplificând procesările răspunsului:
1. Comprehensibilitatea (cât de uşor poate fi înţeles)
Cauzele care conduc spre o comprehensibilitate scăzută ţin de utilizarea unor cuvinte neobişnuite, a
unor structuri propoziţionale complicate, forţate sau neclare sau de erorile gramaticale.
2. Ambiguitatea (posibilitatea atribuirii a mai mult decât un înţeles)
Este incertitudinea legată de înţelesul stimulului (spre deosebire de echivocitate înţeleasă ca difernţă
între persoane în ceea ce priveşte interpretarea itemului, după Goldberg 1963). Cauzele ambiguităţi
ţin de prezenţa unor cuvinte sau afirmaţii cu mai multe înţelesuri; de relaţii echivoce existente între
propoziţiile frazei; de incompatibilitatea dintre itemi şi formatul răspunsului (prin introducerea unei
negaţii, a unor conjuncţii de tip sau / sau, a unor fraze cu mai multe propoziţii principale).
Aceste erori pun subiectul în 2 posturi tipice: a. Nu recunoaşte natura ambiguă a itemului şi pur şi
simplu îl înţelege greşit (interpretându-l în alt sens decât cel vizat de psiholog) şi b. Recunoaşte
ambiguitatea itemului, însă nu este sigur de care dintre înţelesurile posibile este vorba.
3. Nivelul de abstractizare (cu cât informaţia este mai abstractă cu atât cere o procesare mai
desfăşurată)
Nivelul de abstractizare ridicat intervine în procesele de comparare item - experienţă personală. Un
item concret (care afirmă o informaţie specificată, care se referă la comportamente clar specificate,
numesc condiţii şi situaţii semnificative sau includ fapte a căror veridicitate poate fi afirmată) ajută
la o evocare rapidă din memorie. Itemul abstract cere procesarea în continuare a înţelesului său,
integrarea treptată şi/sau suplimentarea informaţiei prin exemple, referinţe la fapte concrete. Itemii
abstracţi sunt de regulă cei care prezintă atitudini, opinii, descrieri generale, cer interpretarea unor
evenimente generale sau integrarea lor de-a lungul unor situaţii diverse, comparaţii cu standarde
nespecificate, inferenţe personale. Cercetările indică o relaţie direct proporţională între gradul de
abstractizare şi diferenţierile în modul cum înţeleg subiecţii aceşti itemi (Angleitner, 1986).
4. Gradul de referinţă personală (informaţia care include direct şi semnificativ pe subiect)
Gradul în care conţinutul itemului este semnificativ pentru imaginea de sine a subiectului este în
relaţie directă cu capacitatea acestuia de a răspunde pe baza unei percepţii sau experienţe proprii
asupra lucrurilor, în măsura în care subiectul este direct menţionat prin item, fie la nivelul trăirii
unor evenimente, fie la nivelul acţiunii şi al implicării emoţionale. Referinţa personală intervine în
stadiul comparării item-eu.

5.Evaluarea (dezirabilitatea socială a conţinutului)


Măsura în care un item evocă valori, standarde aprobate social, determinări şi prjudecăţi comune,
este direct proporţională cu probabilitatea ca subiectul să selecteze răspunsul în sensul dezirabilităţii
sociale. Acest gen de judecată intervine mai ales în stadiul evaluărilor asupra utilităţii.

S-ar putea să vă placă și