Sunteți pe pagina 1din 122

PROF.DR.

CORNEL HAVÂRNEANU

PSIHODIAGNOSTIC (I)

CUPRINS
I. SCURT ISTORIC AL PSIHOLOGIEI DIFERENŢIALE
ŞI ORIGINILE CUNOAŞTERII PSIHOLOGICE A PERSOANEI
II. MĂSURAREA ÎN PSIHOLOGIE
III. METODA TESTELOR
IV. FIDELITATEA TESTELOR
V. VALIDITATEA TESTELOR
VI. STANDARDIZAREA TESTELOR
VII. TESTELE DE INTELIGENŢĂ
VIII. TESTELE PENTRU ABILITĂŢI DE GRUP ŞI SPECIFICE
1. Tipuri de teste pentru abilităţi de grup
2. Avantajele măsurării factorilor primari
3. Teste de abilitate specifică şi alte teste
IX. TESTE DE ABILITĂŢI ŞI CUNOŞTINŢE
1. Sensul aptitudinii
2. Formele itemilor în testarea abilităţilor şi cunoştinţelor
X. TESTE PROIECTIVE ŞI OBIECTIVE DE PERSONALITATE
1. Testele obiective
2. Avantajele testelor obiective
3. Tipuri de teste obiective
4. Distincţia dintre testele obiective de abilitate, temperament şi dinamică
5. Ghid practic pentru construcţia testelor obiective de personalitate şi motivaţie
XI. ALTE TIPURI DE TESTE PSIHOLOGICE
1. Metodele perceptiv-genetice
2. DMT
3. Testele speciale utilizate pentru pacienţii care au leziuni ale creierului
4. Teste speciale şi liste (checklist)
5. Descrierea modelului circumplex
6. Cercetările lui Plutchik
7. Repertoriul cu test grilă
SCOPUL UNITĂŢII DE CURS
(a) să ofere informaţii referitoare la metodele de evaluare psihologică a persoanei
(b) să formeze abilităţile necesare evaluării psihologie

OBIECTIVE OPERAŢIONALE
După parcurgerea acestei unităţi de curs, studenţii ar trebui să aibă următoarele abilităţi:
(a) Înţelegerea conceptelor de bază în măsurare şi evaluare, şi înţelegerea caracteristicilor care
diferenţiază aceste concepte;
(b) Înţelegerea conceptului de fidelitate şi altor concepte specifice teoriei clasice a testelor precum
şi a relaţiilor dintre acestea;
(c) Aplicarea diferitelor metode de estimare a fidelităţii şi cunoaşterea caracteristicilor şi limitelor
acestora;
(d) Posibilitatea de a judeca valoarea coeficientului de fidelitate şi de a evalua semnificaţia acestuia
în diferite contexte de decizie;
(e) Analiza valorii unui coeficient de fidelitate în aprecierea importanţei factorilor analizaţi şi
cunoaşterea limitelor fidelităţii;
(f) Înţelegerea conceptului de validitate, distingerea diferitelor sale faţete şi determinarea valorii
predictive;
(g) Evaluarea şi interpretarea validităţii de conţinut şi a validităţii teoretice sau de construct;
(h) Transformarea cotelor brute în cote derivate. Realizarea etaloanelor. Interpretarea rezultatelor
pornind de la scorurile individuale;
(i) Înţelegerea conceptului de inteligenţă şi a modalităţilor de evaluare a inteligenţei
(j) Înţelegerea modului de construcţie şi utilizare a testelor pentru abilităţi de grup şi specifice
(k) Înţelegerea modului de construcţie şi utilizare a testelor de abilităţi şi cunoştinţe
(l) Înţelegerea modului de construcţie şi utilizare a testelor obiective de personalitate
(m) Înţelegerea modului de construcţie şi utilizare a altor tipuri de teste psihologice
(n) Înţelegerea modului de utilizare a testelor în psihologia educaţională
(o) Înţelegerea modului de utilizare a testelor în psihologia clinică

MODALITĂŢILE DE EVALUARE VOR URMĂRI


(a) Aprecierea studenţilor în cadrul activităţilor tutoriale în care accentul va fi pus pe posibilitatea
acestora de a aplica cunoştinţele teoretice (pondere 50% din nota finală);
(b) Aprecierea rezultatelor obţinute la examenul scris din conţinutul cursului şi aplicaţiile aferente
(pondere 50% din nota finală);

NOTĂ
ƒ Prezenţa la activităţile tutoriale este obligatorie deoarece se vor realiza lucrări practice de
laborator
PSIHODIAGNOSTIC (I)

I. SCURT ISTORIC AL PSIHOLOGIEI DIFERENŢIALE ŞI


ORIGINILE CUNOAŞTERII PSIHOLOGICE A PERSOANEI

De-a lungul istoriei umanităţii au existat numeroase preocupări de a găsi metode de selecţie a
indivizilor mai productivi sau care să corespundă obiectivelor de formare stabilite Aceste preocupări au
dus la o utilizare pe sacră largă a testelor şi altor metode de cunoaştere a persoanei în diferite domenii
aplicative fapt care ne oferă posibilitatea stabilirii unei cronologii a evoluţiei lor.

I.1. SPIRITUL PSIHOLOGIEI DIFERENŢIALE ŞI ORIGINILE EVALUĂRII

DuBois (1970), care este citat în multe manuale de psihometrie, Gregory (1992) şi Sattler
(1992), susţin că evaluarea a apărut în China în urmă cu 3000 de ani. Această afirmaţie nu este
susţinută de surse istorice. Brawman (1998) consideră că începând cu anul 165 î.Hr. în China se
practica selecţia în domeniul serviciilor publice.

I.1.1. Originile psihologiei diferenţiale


Psihologia diferenţială, ca ramură a psihologiei ştiinţifice , a apărut în Anglia la sfârşitul sec. al
XIX-lea, odată cu dezvoltarea empirismului şi ca o prelungire a teoriei darwiniste a evoluţionismului.
Dar reflexiile asupra variabilităţii indivizilor sunt mult mai vechi. Încă din antichitate întâlnim
reflexii ale filozofilor şi medicilor referitoare la variabilitatea indivizilor. Platon (427-347 î.Hr.), de
exemplu în Republica, consideră că există trei tipuri de indivizi corespunzătoare celor trei faţete ale
sufletului uman: "dorinţele", "raţiunea" care le controlează, şi "pasiunea" care corespunde sensului
moral şi manifestărilor sale. Aceste proprietăţi înnăscute permit indivizilor să ocupe funcţii sociale
specifice (producători, războinici, magistraţi) şi societatea este interesată să facă plasamente în funcţie
de acestea. Consideraţii asupra variabilităţii interindividuale a făcut şi Aristotel (384-322 î.Hr.) care a
fost interesat de diferenţele psihologice dintre rase şi dintre sexe, şi de caracteristicile individuale
necesare în exercitarea diferitelor meserii. Hippocrate (460-477 î.HR.), părintele medicinii, descrie
patru tipuri temperamentele pe care le interpretează în termeni de "umori" şi de "elemente": colericul (la
care predomină bila albă şi focul), melancolicul (cu predominanţa bilei negre şi a pământului),
flegmaticul (la care predomina flegma şi apa) şi sanguinicul (la care predomină sângele). Vom
recunoaşte în tipologiile moderne ale personalităţii, mai ales în cea elaborată de Pavlov, o mare
analogie cu tipurile lui Hippocrate.
În evul mediu, evaluarea aptitudinilor s-a practicat târziu în mai multe universităţi europene.
Cristian Von Wolff trebuie menţionat deoarece a fost primul care a intuit posibilitatea creării unei
ramuri matematice a psihologiei, pe care a numit-o "psihometrie".

5
CORNEL HAVÂRNEANU

I.1.2. Teoria facultăţilor


În epoca modernă problema diferenţelor individuale a fost marcată de influenţa teoriei filosofice
a cunoaşterii care punea problema originii "ideilor" noaste, cum ar fi conceptele abstracte (Dumnezeu
de exemplu), categoriile gândirii (timpul, cauzalitatea) sau operaţiile mentale. Pentru filosofii idealişti
ideile sunt înnăscute, şi spiritul nostru are capacitatea de a le prelua direct. Pentru filosofii empirişti
ideile sunt elaborate pe baza informaţiilor furnizate de organele senzoriale.
În acest cadru al filosofiei idealiste s-a ajuns la definirea spiritului şi a facultăţilor mentale, care
permit accesul la cunoştinţe independent de senzaţii şi o descriere foarte generală a sufletului uman.
Thomas Reid (1710-1796), fondatorul şcolii ecoseze, prezintă o listă de "capacităţi ale sufletului":
douăzeci şi patru de "capacităţi active" ca faima, perseverarea eului, imitaţia, estimarea eului, nevoia de
putere, imaginaţia etc., şi şase "capacităţi intelectuale" ca percepţia, judecata, memoria, sensul moral
etc. Aceste facultăţi, sau capacităţi se pot manifesta slab sau foarte puternic la indivizi diferiţi, ceea ce
presupune existenţa unor diferenţe individuale între aceştia.
Dar interesul pentru aceste cadre descriptive este limitat. Ele sunt pure speculaţii iar cercetările
psihologiei diferenţiale trebuie să se bazeze pe observaţii sistematice, nu pe observaţii secvenţiale sau
pe simpla intuiţie, care nu face posibilă generalizarea. Ele sunt statice şi se bazează pe decupajul unei
scheme de funcţionare psihologică. În plus, postulatele ineiste nu oferă posibilitatea abordării dezvoltării
indivizilor şi rămân tributare accentuării rolului factorilor ereditari în explicarea diferenţelor
interindividuale.
Reminiscenţe ale teoriei facultăţilor şi o dezvoltare ulterioară a acesteia găsim şi la precursorii
lui Reid în psihologia modernă.
Alexander Bain (1818-1903), a reluat teoria facultăţilor mintale a lui Reid, pentru a descrie
diferenţele individuale într-o lucrare care abordează personalitatea, publicată în 1861 "Sur l'etude du
caractere".
Franz Joseph Gall (1758-1828), s-a inspirat mult din această lucrare, în tratatul său de
frenologie, care a avut un mare succes pe parcursul secolului al XIX-lea.
Pentru Gall există treizeci de facultăţi, fiecare facultate are un loc bine definit pe o regiune a
creierului, regiune care este foarte bine dezvoltată. Dezvoltarea creierului poate modifica forma
craniului, ceea ce oferă posibilitatea estimării dezvoltării unei anumite facultăţi. Fiecare facultate este
plasată într-o anumită regiune a creierului şi această regiune este mai dezvoltată. Dezvoltarea creierului
poate modifica forma craniului şi se poate estima dezvoltarea unei facultăţi prin palpare. Expresia "are
bosă de..." provine din frenologie (care a fost numită şi craniologie). Azi putem surâde de schematismul
frenologiei şi de naivitatea lui Gall, sau putem să ne indignăm de reducţionismul său. Dar această
teorie, ca toate teoriile; trebuie situată în contextul epocii în care a apărut. Cert este că teoria
frenologică este eronată: dimensiunile psihologice utilizate nu sunt fondate, creierul nu modifică forma
craniului. Frenologia are însă meritul de a accentua o idee forte nouă în epocă şi exactă în principiu:
localizarea în diferite zone ale creierului a funcţiilor psihice. Frenologia este un bun exemplu de teorie
generală (localizările cerebrale) care a fost confirmată prin cercetări diferenţiale.

6
PSIHODIAGNOSTIC (I)

I.1.3. Empirismul anglo-saxon


Empirismul a început să se dezvolte în Anglia începând cu Thomas Hobbes (1588-1679) şi
John Locke (1632-1704) care publică în 1690 "Essai sur l'entendement humain" (Eseu asupra
judecăţii umane), David Hume (1711-11776), contemporan cu empiristul francez Etienne de
Condillac (1711-1780), James Mill (1773-1836) şi John Stuard Mill (1806-1873).
Pentru empirişti spiritul este o tablă nescrisă (tabula rasa) pe care se înscriu senzaţiile.
Problema fundamentală care apare este: cum simplele senzaţii pot da naştere la cunoştinţe sau "idei".
Teoria asociaţionistă rezolvă această problemă. La fel ca şi în chimie corpurile simple se asociază
pentru a da naştere la corpuri complexe, senzaţiile se asociază pentru a deveni cunoştinţe. Hume
prezintă mai multe legi de asociere: elementele se pot asocia prin contiguitate spaţială sau temporală,
prin asemănare, prin relaţii de cauzalitate. Filosofia empiristă furnizează teorii extrem de generale şi
faptele prezentate nu vizau confirmarea sau infirmarea lor ci, doar simpla ilustrare. Dacă teoria nu este
ştiinţifică ea nu oferă o bază pentru dezvoltarea practicii. În sfârşit, gândirea nu poate fi considerată ca
un dat al cerului ci, ca un fenomen natural căruia îi putem observa manifestările. Cu toate acestea
psihologia diferenţială s-a dezvoltat pornind de la filosofia empiristă. Această origine empiristă a
determinat orientarea psihologiei de la sfârşitul secolului al XIX-lea spre introspecţie şi analiza
experimentală a fenomenelor senzoriale elementare. Programul ambiţios al acestei psihologii este
reconstituirea fenomenelor de conştiinţă pornind de la senzaţii.
Dacă empirismul a permis apariţia unei psihologii experimentale el este mai puţin favorabil
psihologiei diferenţiale. Pentru a deveni obiect de cercetare, diferenţele individuale au nevoie de o
oarecare stabilitate. Aceasta stabilitate relativă îşi poate avea originea într-o puternică determinare
ereditară sau în influenţele mediului. În secolul XIX stabilitatea diferenţelor era pusă pe seama
determinanţilor ereditari. Empirismul, prin postulatul său de bază tinde să minimalizeze ponderea
factorilor ereditari. Bineînţeles, constatăm recunoaşterea existenţei unor diferenţe individuale. "Ideile"
nu sunt aceleaşi, sau nu se manifestă în acelaşi fel la indivizi diferiţi. Provenind de la diversitatea
senzaţiilor care stau la baza formării lor, originea lor nu are nimic misterios: ele nu sunt decât
reflectarea circumstanţelor şi pot fi modificate uşor modificând circumstanţele. Apriorismul ideilor
explică interesul scăzut pentru diferenţele individuale, manifestat de Wundt şi o parte din primii
psihologi experimentalişti. În cercetarea legilor generale ale asociaţiei variabilitate interindividuală este
considerată ca o sursă de eroare de care trebuie să ne ferim. Behaviorismul, fiind curentul psihologic
cel mai apropiat de empirism a fost cel mai puţin interesat de studiul diferenţelor individuale.
Nu există totuşi incompatibilitate între principiile empirismului şi luarea în consideraţie a
diferenţelor individuale stabile. Circumstanţele nu sunt singure responsabile de variabilitatea
asociaţiilor. T. Brown (1778-1820) şi A. Bain consideră că aspectele stabile sunt datorate unor
caracteristici constituţionale ale indivizilor. Ei evocă şi stabilitatea obiceiurilor formate. Filosoful
evoluţionist Herbert Spencer (1820-1903), care va avea o influenţă directă asupra fondatorului
psihologiei franceze Theodule Ribot (1839-1916), introduce ineismul în empirism pe baza evoluţiei. El
consideră că asociaţiile frecvent repetate în ontogeneză sunt transmise descendenţilor. Diferenţele
individuale sunt deci caractere dobândite şi transmise ereditar. Credinţa în ereditatea caracterelor era
foarte răspândită în secolul al XIX-lea. S-a demonstrat ulterior că ea era fără fundament. Dorind să
găsească bazele stabile ale variabilităţii indivizilor fondatorii psihologiei diferenţiale, Francis Galton în
special, se situează în curentul empirist-asociaţionist.

7
CORNEL HAVÂRNEANU

I.1.4. Teoria evoluţiei


Prima teorie a evoluţiei a fost formulată de Jean-Baptiste de Lamarck. Finalist, Lamarck
credea că materia vie are o tendinţă naturală de perfecţionare. Aceste perfecţionări permit adaptarea la
mediu şi aceste caracteristici dobândite sunt transmise la descendenţi.
Charles Darwin (1809-1882) este un naturalist care a adunat numeroase observaţii. Lucrarea
sa de bază "Originea speciilor un mijloc de selecţie naturală sau lupta pentru existenţă în natură" a
apărut la Londra în 1859. Ca şi Lamarck, Darwin credea că speciile se nasc, se transformă şi dispar
fără ca Dumnezeu să intervină. Ca şi Lamarck el credea că această evoluţie este foarte lentă. Dar
mecanismele de evoluţie imaginate de Darwin sunt total diferite de cele ale lui Lamarck. Pentru Darwin
evoluţia este rezultatul unei selecţii care se manifestă pornind de la o variabilitate aleatoare a
caracterelor ereditare (prin hazard unele girafe se nasc cu un gât mai lung decât altele, aceasta le
permite să ajungă la crengile mai înalte, iar şansa lor de supravieţuire şi reproducere este astfel
maximizată). La baza mecanismului imaginat de Darwin se află variabilitatea între indivizii unei specii.
Ideea selecţiei naturale este preluată şi de economistul englez Thomas Malthus (1766-1835).
Pentru Mathus populaţie sporeşte mult mai rapid decât resursele. Există deci între indivizi o luptă
pentru existenţă care se manifestă prin războaie, epidemii, catastrofe, prin care se poate restabili
echilibrul între populaţie şi resurse. Şi în natură există o luptă pentru existenţă între indivizi. Lupta
pentru existenţă conduce la o selecţie naturală şi la supravieţuirea celor foarte apţi.
Impactul teoriei evoluţiei a fost considerabil: omul care era considerat o creaţie a divinităţii
devine un produs natural al evoluţiei. Darwinismul a determinat apariţia a două ramuri ale psihologiei:
psihologia comparată, care studiază diferenţele şi asemănările dintre speciile animale şi psihologia
diferenţială, care studiază diferenţele dintre indivizi.

I.1.5. Contribuţia lui Galton la apariţia psihologiei diferenţiale


Galton este unul dintre primii savanţi independenţi, toţi ceilalţi mari psihologi au fost universitari;
care a desfăşurat o activitate de cercetare în domenii diverse. El explorează sud-estul Africii realizând
numeroase observaţii geografice pe baza cărora redactează un manual practic pentru exploratori. Este
interesat de mecanică (construieşte un motor cu vapori, rotativ), meteorologie (foloseşte principiul
hărţilor meteorologice, descoperă anticiclonii), psihologie generală (realizează un dispozitiv pentru
studiul senzaţiilor, a imaginilor mentale şi asociaţiilor).
Activitatea sa în domeniul psihologiei are trei mari obiective: descrierea şi măsurarea
variabilităţii psihologice interindividuale, demonstrarea originii ereditare a acestei variabilităţi, folosirea
implicaţilor teoriei evoluţioniste pentru ameliorarea spaţiului uman (eugenismul).
În scopul observării variabilităţii interindividuale Galton inventează testele, probe care permit o
observaţie standardizată a conduitei. Acestea au fost realizate prin simplificarea unor situaţii
experimentale din laborator, facilitându-se aplicarea lor la un număr mare de subiecţi. În 1884 mai mult
de două mii de persoane au fost supuse măsurătorilor antropometrice. Pentru a condensa aceste
informaţii şi a putea evalua diferenţele dintre indivizi Galton a inventat etalonarea care permite
transformarea unei măsuri a performanţei în rang.
Matematicianul belgian Quetelet (1796-1874) consideră că distribuţia caracteristicilor fizice, de
exemplu talia, se realizează după legea Laplace-Gauss (distribuţia normală), la fel ca şi erorile de
măsurare. Galton consideră că acest aspect este valabil şi pentru caracteristicile psihologice. În acest

8
PSIHODIAGNOSTIC (I)

fel a putut fi stabilit un procedeu de măsură a diferenţelor interindividuale: diferenţele dintre indivizi sunt
diferenţele de abatere de la media populaţiei raportată la abaterea standard a distribuţiei populaţiei
respective. Distribuţia gaussiană a caracteristicilor psihologice este un postulat.
Galton consideră că variabilitatea indivizilor este de origine ereditară şi caută metode pentru a
demonstra acest aspect. Cercetarea legilor eredităţii presupune măsurarea asemănărilor între părinţi şi
copii în privinţa caracteristicilor fizice. Cu această ocazie, după 1880, el a inventat coeficientul de
corelaţie, tehnică care a fost perfecţionată mai târziu de Karl Pearsons (1857-1936) prin folosirea
teoremelor stabilite anterior de matematicianul francez Bravis. Coeficientul de corelaţie Bravis-
Pearsons, ca indice de corelaţie, a fost frecvent folosit în psihologia diferenţială. Galton a pus bazele
metodei de studiere a gemenilor, comparând gemenii de acelaşi sex cu gemenii de sexe diferite
(distincţia dintre gemenii monozigoţi şi cei dizigoţi a fost făcută mai târziu).
Galton a fost interesat şi de posibilitatea de intervenţie socială şi a pus bazele ştiinţifice ale
cercetărilor în domeniul eugeniei. În 1907 el a pus bazele unui laborator pentru studierea eugeniei în
care s-a elaborat toată statistica modernă. Eugenismul lui Galton constă în evitarea transmiterii
genetice anormale, ceea ce este o preocupare curentă şi azi. Galton caută înlocuirea selecţiei naturale
printr-o selecţie raţională bazată pe teoria evoluţiei, fiind în acest fel partizanul unui eugenism pozitiv.

I.2. APARIŢIA ŞI EVOLUŢIA PSIHOMETRIEI

Psihometria este o disciplină mai puţin cunoscută în ştiinţele umane datorită recunoaşterii sale
tardive în mediile ştiinţifice şi a dificultăţii pentru oamenii de ştiinţă şi lexicologi de a stabili definirea şi
particularităţile sale. Cristian Van Wolf, în 1732, a recunoscut că psihometria se leagă de psihologie şi
de măsurare, urmând să se stabilească dacă este vorba de o ramură a psihologiei, o ramificaţie a
măsurării, sau ambele.
După Legendre (1993), psihometria este "măsurarea şi prelucrarea statistică a faptelor psihice,
mai ales prin metoda testelor". Pentru De Landshere (1979), psihometria constă într-un "ansamblu de
operaţii care, prin probe speciale (teste) şi tehnici ştiinţifice, determină şi evaluează capacităţile psihice
ale indivizilor: stabilirea nivelului mental, detectarea tendinţelor caracteristice, estimarea aptitudinilor
profesionale etc.".
Paul Dickens, Jocelyne Tournois, André Fieller şi Jean-Luc Kop (1994) "psihometria constă
într-un ansamblul de teorii şi metode de măsurare în psihologie ..., care nu se confundă cu studiul
testelor ci numai cu analiza datelor... şi care poate exista fără nici o referire la teste".
De-a lungul istoriei umanităţii au existat preocupări de a găsi metode de selecţie a indivizilor
care să corespundă obiectivelor de formare sau să fie mai productivi. Utilizarea pe sacră largă a testelor
în diferite domenii aplicative ne oferă posibilitatea stabilirii unei cronologii a evoluţiei lor.
După Mercier (1897), Wundt a fost primul care s-a interesat de psihometrie. În 1879, a înfiinţat
la Leipzig primul laborator de psihologie experimentală. Cercetările realizate au fost orientate spre
procesele senzoriale, mecanismele perceptive, dar şi asupra unor funcţii complexe ca atenţia, memoria
şi emoţia. Metodele de observaţie erau precise şi au fost realizate numeroase aparate de investigaţie
psihologică. În timp, mulţi psihologi ca Hall, Cattell, Spearman, Titchner, au vizitat acest laborator
preluând modelul pentru propriile lor universităţi.

9
CORNEL HAVÂRNEANU

În 1888, Cattell deschide un laborator pentru testare, iar în 1890 propune două serii de probe
numite "teste mentale". Thorndike şi Lohman (1990) a publicat lista acestor teste:
1. presiune dinamometrică;
2. viteza de mişcare a braţelor;
3. ariile de sensibilitate şi de discriminare tactilă;
4. presiunea necesară pentru cauzare a unei dureri;
5. măsurarea sensibilităţii diferenţiale pentru o greutate de 100 de grame;
6. timp de reacţie simplu la sunet;
7. timpul necesar pentru denumirea culorilor;
8. divizarea unei lungimi de 50 de centimetri în două părţi egale;
9. evaluarea unei durate de 10 secunde;
10. numărul de litere reţinute după o singură prezentare auditivă.
Pe lângă acestea a mai folosit o probă pentru copii formată din 50 de teste distincte, 14 pentru
senzaţii vizuale, 8 pentru audiţie, 3 pentru gust şi miros, 7 pentru senzaţii presiune şi termice.
Utilizarea acestor teste nu a dus la un progres în diagnosticul aptitudinilor iar aceste
instrumente au continuat să fie utilizate pentru cercetarea psihologică. Binet şi Henri (1896) reproşează
faptul că se insistă pe investigarea proceselor psihice inferioare, senzaţii şi mişcări elementare, în
detrimentul funcţiilor superioare care caracterizează mai bine un individ. La om este mai important să
cunoaştem capacităţile de atenţie, imaginaţie şi inteligenţă decât aptitudinile tactile sau olfactive.
Jurnalele psihologice şi medicale din acea perioadă prezentau multe probe care nu erau organizate în
ordinea dificultăţii crescătoare. În încercarea de a sistematiza rezultatele obţinute, Spearman (1904)
recurge la analiza factorială şi constată că folosind coeficienţii de corelaţie putem obţine un factor
general şi mai mulţi factori specifici pentru fiecare test. Această descoperire a stat la baza teoriei celor
doi factori.
În 1905, Binet şi Simon realizează scara metrică a inteligenţei care le-a permis să evalueze
nivelul mental al copiilor. Materialul era compus din 30 de itemi aşezaţi într-o ordine de dificultate
crescătoare pentru 3, 5, 7, 9 şi 11 ani.
Acest instrument viza funcţiile mentale superioare, dar erau şi probe pentru estimarea
dezvoltării senzoriomotorii. Deficienţa mentală era clasificată în trei categorii: idiot, imbecil şi debil
mintal.
A doua şi a treia versiune a apărut în 1908 şi 1911. În 1909, Goddard traduce a doua versiune
publică în 1911, varianta americană revizuită care a fost apoi urmată de revizuire lui Kuhlman (1912) şi
Terman (1916).
Testul a fost tradus şi adaptat în multe ţări din Europa: în Germania de Maumann şi Bobertag,
în 1914, în Italia de Saffotti, în 1911, în Belgia de Decroly şi Degaud, în 1909, în Suedia de
Jaederholm, în 1914, în Marea Britanie de Burt, în 1921.
Varianta scării din 1908 este normalizată pe un eşantion de 300 de copii, cu vârste de la 3 la 13
ani şi s-a introdus noţiunea de vârstă mentală. Această metodă, foarte simplă, stabileşte nivelul
intelectual pentru fiecare vârstă cronologică. Seria de probe folosită constituie o scară metrică.
A treia variantă a scării apare în 1911, anul morţii lui Binet. Această variantă introduce noi
probe, unele pentru vârsta adultă, şi precizează tehnica de evaluare a vârstei mentale.

10
PSIHODIAGNOSTIC (I)

În 1912, Stern stabileşte formula coeficientului intelectual, prin raportarea vârstei mentale la
vârsta cronologică. QI = VM/VC
La sugestia lui Stern, Bobertag, utilizează primul acest procedeu de măsurare a intelectului, unde
1 reprezintă media. Dacă QI depăşeşte 1, subiectul este în avans faţă de vârsta cronologică, dacă este
inferior lui 1 el este sub medie pentru vârsta sa. La această formulă se aplică înmulţirea cu 100, în revizia
"Stenford", realizată de Terman (1916), luând forma QI = VM/VC × 100.
În 1911, Rossolimo raportează rezultatele a 8 probe sub forma unui grafic pe care l-a numit
profil.
Necesitatea examinării rapide a unui mare număr de recruţi, la sfârşitul primului război mondial,
a dus la realizarea a două baterii de teste colective, cunoscute sub numele de Army Alpha, în 1917 şi
Army Beta, în 1918 şi a scării Pintner Paterson (1915, 1917).
Problema testelor a ocupat un loc important la congresele internaţionale. Prima Conferinţă
internaţională de psihotehnico a avut loc la Geneva în 1920.
Tot în 1920, în Statele Unite, Woodworth introduce primul inventar de personalitate (Personal Data
Sheet), pentru o utilizare individuală şi în grup. Forma finală cuprinde 116 întrebări cu alegerea
răspunsurilor afirmative sau negative şi permite identificarea subiecţilor cu tulburări afective.
În 1921, în Elveţia, Rorschach prezintă o nouă tehnică de diagnosticare a personalităţii prin
interpretarea unor pete de cerneală.
În 1922, în Franţa, prin decret se stabileşte activitatea de consilier de orientare care precede
plasarea tinerilor în instituţii comerciale sau industriale prin determinarea aptitudinilor fizice, morale şi
intelectuale. În acest domeniu, Strong elaborează în 1927 primul chestionar de interese profesionale.
În 1927, evoluţia analizei metodologice a permis lui Thorndike să reducă în serii de patru
factori aspectele măsurate ale inteligenţei (CAVD): Completare de imagini, Aritmetică, Vocabular şi
Direcţionare. Mai multe activităţi mentale sunt în final grupate în trei categorii: activităţi sociale, activităţi
concrete şi activităţi abstracte.
Metoda centroidă, de analiză factorială a fost folosită de Thurstone (1936) şi a dus la
descoperirea unor factori de grup, care nu sunt comuni pentru toate testele, ci numai unei serii de teste.
În acelaşi an, Doll prezintă scala sa de maturitate socială, care contribuia la evaluarea
aptitudinilor adaptative la subiecţii cu deficienţe intelectuale.
La 4 iulie 1936, Comitetul Central al Partidului Comunist al fostei URSS condamnă practicarea
psihotehnicii, considerată o pseudo-ştiinţă antimarxistă, ordonând distrugerea tuturor cărţilor de
psihometrie.
Pentru anul 1938 patru evenimente merită a fi menţionate. Bender propune o serie de nouă
figuri geometrice pentru a fi copiate cu scopul realizării unor cercetări neuropsihologice şi a dezvoltării
mentale. Raven publică versiunea finală a matricilor progresive care cuprind cinci serii de figuri lacunare
cu ajutorul cărora poate fi măsurată inteligenţa generală, eliminând influenţa factorilor culturali. Tot
acum apare prima revistă sistematică de teste psihologice numită Mental Measurements Yarbook, iar
Gasell finalizează scala de teste de dezvoltare pentru copii.
În 1939, David Wechsler realizează scala de diagnostic intelectual pentru adulţi., Wechsler-
Bellevue Intelligence Scale. Apoi în 1949, Wechsler Intelligence Scale for Children, iar în 1967
Wechsler Preschool and Primary Scale of Intelligence. El a făcut o bună sinteză a probelor deja

11
CORNEL HAVÂRNEANU

existente şi a prezentat rezultatele sub forma unui profil psihologic renunţând la conceptul de vârstă
mentală.
În 1940, Cattell, folosind analiza factorială, introduce probe neverbale foarte saturate în factorul
general de inteligenţă "g", foarte puţin influenţate de factorii socio-culturali.
În 1959, Guilford prezintă structura factorială a inteligenţei ca un ansamblu de abilităţi. Modelul
structural al intelectului cuprinde trei dimensiuni care prin combinare formează 120 de factori. Fiecare
factor este localizat la intersecţia a trei dimensiuni care-l determină.
Cattell, în 1963, pe baza teoriei factoriale, elaborează teoria inteligenţei "cristalizate" şi "fluide".
Inteligenţa cristalizată se manifestă atunci când sunt prezentate situaţii acumulate din mediul social,
şcolar şi cultural. Testele care se referă la aceasta sunt teste de inteligenţă generală care au, mai ales,
un conţinut educaţional şi şcolar. Inteligenţa fluidă este activată în situaţii noi, când subiectul trebuie să
sesizeze noi relaţii dând dovadă de creativitate. Acest potenţial este măsurat prin teste prin teste care
nu sunt influenţate cultural
În 1968, Lord şi Novik au făcut o sinteză de interpretare a datelor obţinute pe baza testelor
psihologice. Ei au dat definiţii sintactice explicite (matematice) pentru conceptele care au o semnificaţie
matematică (reală). Conceptul de scor adevărat a fost definit sintactic şi interpretat semantic ca scorul
observat la o persoană cu ajutorul unui test de o lungime infinită. Acesta este un scor observat aşteptat.
Pe baza teoriei numerelor mari au demonstrat că definiţia teoriei testelor este o definiţie pragmatică
care furnizează o interpretare semantică a scorurilor observate.

I.3. CONCLUZII

Înaintea prezentării unor metode specifice de cunoaştere a persoanei, se impun câteva precizări în
legătură cu posibilitatea cunoaşterii psihologice.
1. În primul rând subliniem faptul că psihologia este o ştiinţă probabilistă, iar prin cunoaşterea psihologică
nu se ajunge la certitudine, ci este doar o cunoaştere probabilistică. Din această cauză în domeniul
psihologic nu vom putea stabili un diagnostic definitiv, ci doar un prognostic, care va trebui să fie elaborat
pe termen scurt, pentru a evita erorile predictive datorate evoluţiei în timp a subiecţilor, modificărilor,
uneori spectaculoase, determinate de multitudinea şi complexitatea factorilor implicaţi în schimbare.
2. Cunoaşterea în domeniul aptitudinilor este mai avansată, precizia în măsurare fiind mult mai mare faţă
de alte aspecte ale personalităţii în care nu putem fi siguri de autenticitatea reacţiilor persoanei. Când se
pune problema cunoaşterii trăsăturilor de caracter, de exemplu, subiecţii activează mecanisme de
apărare, etalează doar aparenţe în spatele cărora ascund trăsăturile autentice. Pentru evitarea acestor
neajunsuri s-au înregistrat reacţiile subiecţilor în situaţii imaginate, pentru a releva aspecte ale
personalităţii fără ca aceştia să conştientizeze scopul urmărit. În acest fel au apărut şi s-au dezvoltat
testele proiective, majoritatea bazându-se pe concepţii psihanalitice. Dar, şi aceste instrumente prezintă
dezavantaje, deoarece trebuie demonstrată corespondenţă dintre manifestările subiecţilor în situaţia
imaginară şi cea reală, iar interpretarea presupune o teorie elaborată asupra motivaţiei şi a modului în
care ea se exprimă (A. Cosmovici, 1972, 1985).
3. Există divergenţe în legătură cu metodele utilizate în psihologie, precum şi în legătură cu valoarea
acestora. Fără a intra în analiza acestor puncte de vedere subliniem faptul că tendinţa unanim acceptată
este de împărţire a metodelor de cunoaştere în două categorii: metode clinice (observaţia, convorbirea,

12
PSIHODIAGNOSTIC (I)

metoda biografică) şi metode psihometrice sau experimentale (experimentul, testul şi chestionarul).


Diferenţa fundamentală dintre cele două categorii de metode apare în funcţie de scopul urmărit, a
gradului de precizie şi obiectivitate în cunoaştere.
4. Din punct de vedere al scopului, metodele clinice îşi propun o cunoaştere cât mai amănunţită a
persoanei, şi explicaţia evoluţiei sale, în timp ce metodele psihometrice se orientează spre stabilirea
rangului persoanei, poziţia sa în raport cu o populaţie normală. Aceasta face ca orientarea predominantă
în cazul metodelor clinice să fie cea calitativă, iar în cazul metodelor psihometrice interpretarea
predominant cantitativă.
5. În legătură cu gradul de precizie şi obiectivitate, metodele psihometrice folosind verificări statistice
riguroase, sunt mult mai exacte, specificându-se de fiecare dată limitele de eroare. Metodele clinice
prezintă un grad de obiectivitate şi precizie mai mic, deoarece sunt lipsite de criterii precise de
interpretare, această depinzând de subiectivitatea celui care face analiza.
6. În psihologia aplicată se manifestă tot mai mult tendinţa de apropiere a celor două metode, îmbinarea
ambelor categorii şi evitarea unilateralităţii, care nu poate fi decât dăunătoare. Interpretarea cantitativă şi
calitativă a rezultatelor obţinute prin metode psihometrice oferă atât posibilitatea ierarhizării subiecţilor în
funcţie de performanţă, cât şi explicarea modului de obţinere a performanţei. Metodele clinice s-au
perfecţionat, găsindu-se mijloace de standardizare a interpretărilor şi comparaţii în condiţii mai exact
determinate.

13
CORNEL HAVÂRNEANU

II. MĂSURAREA ÎN PSIHOLOGIE

II.1. MĂSURAREA ŞI EVALUAREA

După numeroşi autori, măsurarea este o operaţie care constă în asocierea, după anumite
reguli, a unor simboluri (de cele mai multe ori numerice), obiectelor, evenimentelor, sau indivizilor,
pentru a evalua gradul în care acestea prezintă anumite atribute. După realizarea acestei operaţii,
putem califica aceste simboluri ca "rezultate ale măsurării." Pentru a fi semnificative, simbolurile
numerice trebuie să fie însoţite de o unitate de măsură.
De exemplu: În cazul unei mese cu lungimea de doi metri, vom asocia numărul 2 cu termenul
"metru", care este unitatea de măsură utilizată şi care este aplicată de două ori pe lungimea mesei.
Numărul 2 capătă o semnificaţie în virtutea unei relaţii cu o lungime standard care este metrul.
În cazul măsurării atributelor fizice, interpretarea rezultatelor nu ridică, în mod obişnuit nici o
problemă. Măsurarea atributelor psihologice, cum ar fi , raţionamentul sau motivaţia, este foarte
complexă, existând foarte multe variabile care trebuie definite şi controlate pentru a obţine un rezultat
valabil. De asemeni, în educaţie este dificil să găsim o unitate de măsură care să fie considerată etalon.
De exemplu: Un rezultat de 40 răspunsuri corecte din 50, la o probă de randament, este dificil
de interpretat, deoarece 40 de itemi corect rezolvaţi nu presupune, cu necesitate, un coeficient de
dificultate egal pentru fiecare item.
Deducem din definiţia precedentă că măsurarea presupune un proces de abstractizare. Dacă
asociem simboluri obiectelor sau indivizilor, vom măsura, de fapt, una sau mai multe dimensiuni dintre
toate cele pe care obiectele sau indivizii le posedă. De aceea este important să studiem natura acestor
atribute, înainte de a realiza măsurarea.
Observăm că nu toate atributele sunt în mod necesar măsurabile. Mai mult, o măsură se poate
aplică mai multor atribute, nu numai unuia singur. În acest caz, posibilitatea de a izola caracteristicile
atributului de măsurat este mai redusă, iar informaţiile obţinute vor fi deseori mai puţin utile.
Utilizarea simbolurilor numerice presupune deci cuantificarea atributelor. Această
cuantificare facilitează cunoaşterea rezultatelor relative, a gradului de prezenţă a acestora, sau
manifestarea unui atribut la un individ. În acest fel obţinem rezultate foarte detaliate şi foarte precise,
neinfluenţate de judecăţi personale, care ne permit să recurgem la modele de analiză matematică.
Procedeele de obţinere a unei măsurări trebuie să fie explicite. Pentru aceasta există reguli
precise care reglează procedeele de măsurare. Aceste reguli sunt fundamentale în construcţia şi
utilizarea unui instrument de măsură, deoarece validitatea lor determină validitatea instrumentului, şi în
consecinţă pe cea a rezultatelor. Nerespectarea acestor reguli duce la rezultate eronate, instabile şi
chiar aberante. Acest ansamblu de reguli permite cuantificarea, fără echivoc, a atributelor unui obiect
sau individ şi reprezintă o măsură legitimă.

14
PSIHODIAGNOSTIC (I)

Formularea riguroasă a regulilor care permit asocierea simbolurilor numerice unor atribute, fac
ca rezultatele obţinute cu ajutorul unui instrument de măsură să fie reproductibile. Acesta este un
aspect esenţial pentru standardizarea unui instrument de măsură. Un instrument de măsură este
standardizat dacă toţi utilizatorii obţin rezultate similare. Această similaritate depinde de invariabilitatea
conţinutului măsurat, uniformitatea procedeelor şi condiţiilor de administrare a instrumentului de măsură
şi de constanţa criteriilor de corectare. Altfel spus, probele aplicate trebuie să fie tot timpul aceleaşi
pentru toţi subiecţii, instrucţiunile clar enunţate, durata şi contextul administrării constant, iar criteriile de
corectare invariabile şi obiective.
În concluzie, măsurarea standardizată permite cuantificarea datelor, o descriere foarte obiectivă
care furnizează informaţii comparabile.
Cu toate că măsurarea se vrea cât mai obiectivă posibil, evaluarea presupune prezenţa unor
aspecte subiective. Putem defini evaluarea ca fiind o operaţie care constă în a face o judecată de
valoare, sau a acorda o valoare unui obiect sau unei persoane, comparând obiectul, l sau persoana cu
un criteriu dat. Această operaţiune poate fi aplicată rezultatelor măsurării. Astfel, expresii ca "excelent",
"mediocru", "superior mediei", "succes", "eşec" sunt termeni de evaluare utilizaţi în educaţie. Trebuie
precizat că evaluarea unui rezultat obţinut în urma măsurării, este un aspect important când rezultatul
este dificil de interpretat în absenţa unei unităţi de măsură, care poate da o semnificaţie rezultatului
respectiv.
Un exemplu care permite înţelegerea distincţiei dintre măsurare şi evaluare. Un prieten vă
informează că bunicul său are 90 de ani. Expresia "90 de ani" sau numărul 90 este rezultatul unei
măsurări. Pentru a asocia numărul 90 bunicului său, prietenul dumneavoastră a aplicat o regulă precisă
care constă în a determina de câte ori o unitate de măsură este cuprinsă între două momente precise:
data naşterii şi momentul în care se face relatarea. Din contra, dacă prietenul dumneavoastră vă spune
că bunicul său este foarte bătrân, el vă comunică rezultatul unei evaluări.
În baza acestui exemplu, putem constata că rezultatul măsurării este pur descriptiv, nici o
judecată de valoare nu apare, în timp ce rezultatul evaluării este subiectiv. Acesta este unul din
principiile de bază care diferenţiază măsurarea de evaluare.
Se poate obiecta că această distincţie nu este foarte clară, deoarece în toată lumea se spune
că un individ de 90 de ani este foarte bătrân. Avem aici o situaţie foarte frecventă din viaţa cotidiană, în
care rezultatul unei măsurări se înscrie cu uşurinţă în cadrul de referinţă care corespunde experienţei
anterioare. Noi cunoaştem unitatea de măsură, anii de existenţă, şi cunoaştem posibilităţile actuale ale
longevităţii umane. Dintre cele două informaţii, una se referă la unitatea de măsură, iar cealaltă la
posibilităţile sau limitele fenomenului studiat, care permite, foarte des, să se facă judecăţi de valoare
unice pe baza rezultatelor măsurării. În acest exemplu, criteriu care a servit ca bază de evaluare este
caracteristic unui ansamblu de indivizi. Este suficient ca această caracteristică să se modifice pentru ca
evaluarea să fie modificată. Dacă presupunem că durata de viaţă se prelungeşte la 200 de ani, atunci
judecata de valoare "foarte bătrân" nu mai este potrivită pentru o persoană de 90 de ani. Acest exemplu
ilustrează foarte bine caracterul subiectiv al evaluării.
În consecinţă, în educaţie şi psihologie se ignoră foarte frecvent unităţile de măsură şi limitele
fenomenului studiat. Această problemă poate fi rezolvată dacă evaluăm inteligenţa unui elev,
aptitudinile, interesele, calitatea randamentului său şcolar pe baza unui rezultat măsurabil. Mai mult,
deseori, acest rezultat este un număr care indică cantitatea răspunsurilor bune la un ansamblu de

15
CORNEL HAVÂRNEANU

probleme puse în cadrul unui test. Rezultatul de 60 obţinut de un elev la o probă de randament nu
relevă nimic din calitatea elevului şi nici din competenţa sa. Pentru a putea face o judecată de valoare,
trebuie să avem acces la ambele informaţii (conţinutului probei şi posibilităţile de rezolvare a probei).
Dacă cunoaştem natura problemelor pe care elevul le-a rezolvat în acea probă, vom putea
deduce capacităţile sau abilităţile necesare elevului pentru a rezolva proba. Cunoaşterea naturii
problemelor rezolvate sau a conţinutului probei este un compromis faţă de dificultatea de a stabili o
unitate de măsură sau un standard. Din contră, dacă vom cunoaşte posibilităţile de rezolvare a probei,
prin analiza rezultatelor obţinute de alţi elevi, vom putea elabora o judecată de valoare ca "excelent",
"mediocru", "superior mediei" sau "normal". În acest caz evaluarea se realizează folosind un criteriu de
bază şi caracteristicile unui ansamblu de elevi.

II.2. MĂSURAREA ŞI MATEMATICA

O distincţie importantă între măsurare şi matematică constă în faptul că măsurarea se face


pentru fapte concrete şi se aplică lumii reale. În consecinţă, deşi utilizează foarte des simboluri
numerice, măsurarea este orientată tot timpul asupra faptelor empirice. Ea se raportează la lumea
reală, cu scopul cuantificării atributelor unui obiect sau individ. Matematica, din contra, construieşte un
sistem abstract, pur deductiv, un ansamblu de reguli care permit manipularea de simboluri şi care nu
presupune în mod necesar raportarea la lumea reală.
Funcţia generală a matematicii este să creeze modele utile şi comode care să permită
descrierea fenomenelor naturii. Măsurarea apelează la elementele sistemului matematic pentru
examinarea relaţiilor interne dintre datele obţinute printr-un procedeu de măsură şi pentru a pune în
legătură relaţiile dintre rezultatele obţinute prin diferite procedee de măsurare. În acelaşi timp, nici un
model matematic nu poate descrie exact şi perfect un fenomen din natură. Toate descrierile sunt
aproximative, iar multe adevăruri au grade variabile.
Pentru a înţelege natura măsurării, trebuie să cunoaştem proprietăţile matematice, mai precis
cele ale numerelor. Din punct de vedere al măsurării, numărul este considerat ca o abstracţie simbolică
a uneia sau mai multor cifre, putând servi la clasificarea sau ordonarea obiectelor, evenimentelor,
indivizilor, într-o manieră sistematică, în funcţie de gradul în care acestea prezintă o caracteristică dată.
Mai mult, numerele pot fi manipulate şi combinate conform unor reguli matematice dându-li-se o
semnificaţie în maniere diferite şi foarte precise. Astfel, media furnizează o descriere cantitativă foarte
precisă a comportamentului unui individ într-un ansamblu de situaţii.

În postulatele principale ale sistemului de numere, găsim principalele postulate ale măsurării:
1. Elementele sunt fie identice, fie diferite: a = b sau a ≠ b
2. Relaţia de identitate este simetrică: dacă a = b atunci b = a
3. Relaţia de identitate este tranzitivă: dacă a = b şi b = c atunci a = c
4. Relaţia de ordine este simetrică: dacă a > b atunci b < a
5. Relaţia de ordine este tranzitivă: dacă a > b şi b > c atunci a > c
6. Elementele pot fi adunate dacă a = p şi b > 0 atunci a + b > p
(adunarea cu zero lasă elementul neschimbat)
7. Adunarea este comutativă: a+b=b+a

16
PSIHODIAGNOSTIC (I)

8. Elementele identice pot fi substituite a = p şi b = q atunci a + b = p + q


cu altele în adunare
9. Adunarea este asociativă: (a + b)+c = a+(b + c)
Numeroşi autori recunosc şi un alt postulat al măsurării care se referă la existenţa a patru
principale niveluri de măsurare corespunzătoare pentru patru tipuri fundamentale de scări de măsură
care se deosebesc unele de altele prin mai multe criterii.

III.3. CLASIFICAREA SCĂRILOR DE MĂSURĂ

Problema clasificării scalelor de măsurare este legată de diversitatea utilizării numerelor (de
exemplu numerele pot face referiri la cantităţi dar şi la calităţi). De asemeni, există tipuri distincte de
scale de măsură cu care putem clasifica toate atributele măsurate. În ştiinţele umaniste, problema
clasificării scalelor de măsură, este o preocupare amforă pentru numeroşi cercetători. Mulţi dintre ei
consideră că pentru a înţelege precizia unei măsurări psihologice trebuie să luăm în consideraţie natura
scalei utilizate în cazul unui procedeu de măsurare. Altfel spus, natura scalei de măsurare utilizată
determină tipul de interpretare şi cantitatea de informaţii pe care o putem extrage din rezultatele
obţinute cu ajutorul acelei scale Problema este legată de legitimitatea utilizării unor procedee
matematice pentru măsurarea atributelor umane care se referă la aspecte psihologice.
Primul criteriu de diferenţiere a unui tip de scară, se referă la regulile care determină modul în
care numerele sunt asociate atributelor măsurate. O scală nu are raţiunea de a exista dacă nu există un
izomorfism (corespondenţă) între unele proprietăţi ale atributelor măsurate şi unele proprietăţi ale seriei
numerice.
Proprietăţile sau natura atributelor, utilizarea procedeelor concrete care vizează măsurarea
acestor atribute, sunt factori care limitează operaţiile empirice de bază aplicabile atributelor măsurate.
De exemplu, unui atribut ca sexul indivizilor îi poate fi asociat un număr care are valoare de
etichetă (masculin 1 şi feminin 2) În consecinţă, chiar natura atributului măsurat nu ne oferă decât
posibilitatea unor operaţii empirice de clasificare şi de numărare.
Un al doilea exemplu ne permite să ilustră mai bine influenţa alegerii procedeelor concrete de
măsurare. Să presupunem că, fără să avem un instrument standardizat de măsurare, dorim să
comparăm înălţimea unor indivizi. Operaţiile empirice aplicabile rezultatelor acestor măsurări se vor
limita la a plasa, în ordine, indivizii, după talie. Însă dacă posedăm un instrument standard, care are la
bază unităţi etalon, şi repetăm măsurările, numărul operaţiilor empirice aplicabile acestor rezultate va fi
mult mai mare. În acest fel vom putea plasa indivizii în ordinea înălţimii, dar vom putea compara şi
diferenţele dintre înălţimile lor şi chiar stabili un raport între înălţimile indivizilor. Din aceste calcule
putem stabili că X este de două ori mai mare decât fiul său Y, constatare pe care nu o putem pune în
evidenţă în absenţa unei unităţi etalon.
Ceea ce caracterizează cel mai bine fiecare tip de scală, este studiul invarianţei. Aceasta
presupune ca transformările fiecărei scale să nu producă distorsiuni ale structurii acesteia.
De exemplu, dacă vrem să exprimăm datele în unităţi diferite de unităţile de măsură originale,
este necesar să putem efectua această transformare, fără a modifica semnificaţia datelor. Mărimea
invarianţei unei scale stabileşte limitele referitoare la transformările matematice şi statistice care pot fi
legitim aplicate datelor obţinute printr-un procedeu de măsurare. În cazul scalelor prin care se stabileşte

17
CORNEL HAVÂRNEANU

rangul indivizilor, în funcţie de un atribut dat, toate transformările matematice efectuate asupra acestor
date pentru modificarea rangului, falsifică rezultatele şi în consecinţă acest tip de transformare nu poate
fi legitim aplicat la acest tip de scară.
Fiecare tip de scară de măsurare are anumite implicaţii:
În primul rând, fiecare tip de scală are anumite postulate. Dacă datele obţinute printr-un anumit
procedeu de măsură sunt conforme postulatelor unui anumit tip de scală, măsurarea va fi considerată
ca posedând proprietăţile inerente scalei respective. Niciodată un tip de scală nu poate face abstracţie
de postulatele care îi sunt proprii.
În al doilea rând, cu cât un tip e scală este mai complex, cu atât regulile care determină
asocierea numerelor unor atribute măsurate sunt restrictive şi multe din informaţiile furnizate de scală
sunt precise, ceea ce are efecte asupra reducerii, întinderii invarianţei scalei respective. Mai mult,
postulatele matematice ale unei scale foarte complexe permit utilizare unui mare număr de operaţii
matematice şi statistice.
O altă proprietate majoră a unei scale este aceea de a reflecta atributele care trebuie măsurate.
De exemplu, dacă dorim să măsurăm înălţimea elevilor unei clase este necesar să avem o
scală care reflectă acest atribut. Se întâmplă ca multe dintre conceptele ştiinţifice, de interes pentru
cercetător, să poată fi măsurate prin modalităţi rudimentare. De exemplu, să presupunem că un
cercetător doreşte să obţină un singur număr care să reprezinte agresivitatea unui copil dintr-o
grădiniţă. O metodă ar putea fi utilizarea interviului psihologic clinic şi apoi evaluarea subiecţilor de la 1
la 10 în acord cu mărimea agresivităţii lor. Un aspect foarte important pentru problema pusă în discuţie
este ce atribute matematice generale trebuie să posede scala de agresivitate realizată pentru evaluarea
copiilor de la 1 la 10.
Atributele pe care trebuie să le posede o scală de măsurare sunt: magnitudinea sau mărimea,
intervale egale şi punctul zero.
Când o scală are magnitudine, atunci un anumit atribut poate fi judecat ca fiind mai mare
decât, mai mic decât sau egal cu o altă stare a aceluiaşi atribut. Dacă revenim la exemplul anterior şi
constatăm că un clinician atribuie un scor de 8 pentru subiectul X şi 5 pentru subiectul Y, această scală
de măsurare reflectă diferenţele în magnitudine ale agresivităţii la cei doi subiecţi (subiectul X este mai
agresiv decât subiectul Y).
Intervale egale, înseamnă că magnitudinea unui atribut reprezentat de o unitate de măsură pe
o scală este egală, indiferent de locul unde este plasată unitatea pe scală. De exemplu, în cazul
măsurării înălţimii în cm, diferenţa între o persoană care are 160 cm faţă de alta care are 161 cm, este
aceeaşi ca diferenţa care există între o persoană de 170 cm şi alta de 171 cm. Un centimetru reflectă
aceeaşi cantitate (de înălţime), indiferent de locul în care este plasat centimetrul pe scală.
Acest aspect nu este respectat tot timpul. Să luăm exemplul clasamentului realizat la sfârşitul
unui campionat de fotbal. Diferenţa dintre echipa plasată pe locul întâi şi cea de pe locul doi este de un
loc, aceeaşi diferenţă existând şi între echipa plasată pe locul doi şi cea de pe locul trei. Dar în acest
caz nu putem spune că 1–2 = 2–3, aşa cum am stabilit în cazul diferenţelor de înălţime.
Punctul zero absolut, este valoarea care indică faptul că atributul care trebuie măsurat nu are
nici o valoare (mai bine spus are valoarea zero). Zero pentru înălţime este o valoare a scalei care
presupune lipsa înălţimii. În cazul măsurării agresivităţii, cea mai mică notă pe care psihologul o poate
atribui este 1. Această valoare nu indică inexistenţa tendinţei agresive. Un copil care primeşte nota 1

18
PSIHODIAGNOSTIC (I)

poate să lovească uşor un alt copil sau să-l jignească verbal, ocazional. Copilul are un nivel mic al
agresivităţii, dar într-un sens relativ. Chiar dacă valoare zero ar fi o parte componentă a scalei această
nu presupune inexistenţa totală a agresivităţii. Această scală de evaluare a agresivităţii nu are zero
absolut.

II.4. SCALA NOMINALĂ

Acest tip de scală este cunoscută şi sub denumirea de scală calitativă, scală categorială sau
scală de clasificare.
Forma cea mai simplă de observaţie constă în a stabili dacă două obiecte au doi indivizi sunt
calitativ asemănători sau diferiţi prin răspunsurile lor la o situaţie dată, sau când prezintă una sau mai
multe proprietăţi date. Vom putea astfel grupa proprietăţile sau indivizii în funcţie de una sau mai multe
caracteristici comune. Este suficient să precizăm criteriile utilizate pentru includerea obiectelor sau
indivizilor într-o clasă sau categorie. Apoi, după ce acest criteriu a fost stabilit şi s-a realizat repartiţia în
clase, putem denumi clasa respectivă pentru a desemna obiectele sau indivizii incluşi în acea clasă.
Numele clasei poate fi un număr sau un cuvânt.
Ţinând seama de procedura de clasificare, rigoarea de discriminare depinde de capacitate de
observaţie a evaluatorului şi de marja de imprecizie care este tolerată. În ştiinţele umane, când vorbim
de egalitate dintre indivizii unei clase, vom spune că acesta este aproximativ egală în funcţie de
complexitatea comportamentului uman şi de imprecizia relativă a mijloacelor de observaţie.

Operaţiile de clasificare şi enumerare sunt folosite în producerea unei scale nominale.


Un caz particular de clasificare este cel în care o clasă sau categorie cuprinde un singur obiect sau
individ. Numele acestei clase devine o etichetă atribuită acelui obiect sau individ.
În cazul în care simbolurile numerice sunt atribuite indivizilor, aceste simboluri nu reprezintă
cantităţi de atribute şi nu putem vorbi de posibilităţi de utilizare a matematicii sau statisticii, ci doar de
obţinerea unor informaţii calitative. Putem avea doar o corelaţie accidentală între aceste numere şi
atribuitele respective, dar acesta nu poate fi obiectul unei interpretări referitoare de sensul legăturii.
Singurele operaţii statistice posibile cu aceste date nominale sunt calculul frecvenţelor (numărul de
cazuri din fiecare categorie), identificarea modulului (categoria cu cei mai mulţi indivizi), calcului
coeficientului de contingenţă (verificare ipotezei referitoare la distribuţia cazurilor în categorii, evaluarea
interdependenţei a două principii de clasare).
Aceste operaţii statistice sunt realizabile şi la scalele de măsurare mai complexe. Trebuie să
facem distincţia între utilizarea numerelor în scopul identificării unei clase şi utilizarea numerelor care
reprezintă frecvenţa obiectelor sau indivizilor dintr-o clasă sau categorie. În primul caz, (identificarea
unei clase), utilizarea numerelor nu este o măsurare ci un indiciu, la care se respectă postulatele 1, 2 şi
3. Mulţi autori consideră că scara nominală nu este decât o formă de clasare. În acelaşi timp,
majoritatea autorilor consideră că operaţiile de clasare corespund criteriilor de definire a unei măsurări.
Putem concluziona că scala nominală constituie un nivel de măsurare primar. Utilizarea scalelor
nominale este limitată în ştiinţele umane şi nu furnizează indicaţii asupra amplitudinii atributelor.

19
CORNEL HAVÂRNEANU

Un exemplu de scală nominală este scală utilizată pentru diferenţierea tipurilor temperamentale
(coleric, sanguinic, flegmatic şi melancolic). Dacă considerăm că fiecare individ poate fi plasat doar
într-unul din cele patru tipuri enumerate, atunci aceste tipuri reprezintă mulţimea categoriilor sacalei
nominale.
Uneori, pentru ca scala să îndeplinească condiţia de exhaustivitate, se introduce şi categoria
"alte situaţii", "şi alţii" etc. Pentru eficienţa cercetării această categorie specială trebuie să nu includă o
parte semnificativă a populaţiei studiate, fapt care ar diminua relevanţa rezultatelor.
În operaţiunea de culegere şi prelucrare a datelor, se recurge frecvent la codificarea acestora.
Prin codificare se înţelege transformarea unei mulţimi de obiecte, date, itemi, dintr-o formă sistematică
de prezentare într-o altă formă. De exemplu tipul coleric=1, tipul sanguinic=2, tipul flegmatic=3, iar tipul
melancolic=4.
Aceste coduri, utilizate în scala nominală trebuie considerate simple simboluri, proprietatea lor
de a fi diferite între ele permite discriminarea categoriilor.
Trebuie menţionat faptul că între categoriile unei scale nominale nu există relaţii de ierarhie,
ordinea prezentării fiind indiferentă.
Să presupunem că doi cercetători, în investigaţii independente, au obţinut următoarele
rezultate:
NR. SUBIECŢI NR. SUBIECŢI
TIP TEMPERAMENT
CERCETAREA 1 CERCETAREA 2
1 32 58
2 48 73
3 37 80
4 33 39
TOTAL 150 250
Menţionăm că în coloana din stânga avem coduri, etichete lipsite de semnificaţie cantitativă în
timp ce numerele din celelalte două coloane posedă această semnificaţie. Ansamblul numerelor din
coloana a doua şi a treia poartă numele de distribuţie a tipurilor temperamentale în grupurile studiate.
Fiecare număr reprezintă frecvenţa absolută a unei categorii din scală.
Compararea rezultatelor celor două cercetări ne conduce la constatarea că a doua cercetare
prezintă valori mai mari la fiecare categorie. Această constatare nu are valoare ştiinţifică deoarece al
doilea grup de cercetare este mai numeros decât primul, şi este normal ca frecvenţele să fie mai mari.
Pentru o comparaţie relevantă trebuie să utilizăm frecvenţele relative. Frecvenţa relativă pentru o
categorie se obţine prin împărţirea frecvenţei absolute la numărul total de subiecţi. Prin înmulţirea
frecvenţei relative cu 100, obţinem procente.
Comparaţiile efectuate după frecvenţele relative, sau procente capătă substanţă, deoarece
măsurătorile realizate pe eşantioane de mărimi diferite sunt aduse la un sistem de raportare comun,
ceea ce permite comparaţii.
Trebuie să se ţină seama de faptul că frecvenţele relative sunt sensibile la volumul eşantionului.
Astfel, 5 cazuri din 10 reprezintă 50%, în timp ce 6 cazuri din 10 reprezintă 60% din totalul cazurilor.
Diferenţa de unu între frecvenţele absolute se reflectă într-o diferenţă de 10 între procente. Dacă
volumul eşantionului ar fi fost 100, atunci 5 şi respectiv 6 cazuri ar fi reprezentat 5% şi respectiv 6%.
Observăm diferenţa mai mică între procentaje, datorată mărimii eşantionului. Din punct de vedere

20
PSIHODIAGNOSTIC (I)

practic, acest aspect impune raportarea numărului total de cazuri atunci când se folosesc frecvenţe
relative sau procente.

Operaţii asupra categoriilor unei scale nominale


Asupra categoriilor unei scale nominale se pot efectua două tipuri de operaţii: gruparea
(condensarea) şi rafinarea (diversificarea).
Gruparea este acea operaţie prin care din două sau mai multe categorii se obţine o singură
categorie care va purta o etichetă nouă, distinctă de celelalte. Prin grupare o scală nominală cu n
categorii se transformă într-o scală nominală cu m categorii, unde m< n.
Rafinarea este operaţia prin care dintr-o categorie se obţin două sau mai multe categorii noi,
etichetate distinct. În acest fel o scală cu n categorii se transformă într-o scală cu m categorii, unde m> n.
Asupra aceleaşi scale se pot efectua consecutiv ambele operaţii. Aceste operaţii corespund
necesităţilor practice de analiză şi sinteză, generalizare şi particularizare etc.
Aceste operaţii nu pot fi efectuate în mod arbitrar, în cazul unei scale nominale concrete,
responsabilitatea transformării revenind cercetătorului, care trebuie să respecte exigenţele de conţinut şi
cele formal logice.
De exemplu scala nominală care cuprinde categoriile de comunicare a lui Bales, permite
plasarea comunicărilor într-un grup în funcţie de rolul comunicării într-o discuţie. Clasificarea furnizează
informaţii despre dinamica comunicării, raportul dintre participanţii la discuţia în grup, mecanismele
discuţiei.
Categoriile propuse de Bales sunt:
I. 1. manifestă solidaritate
2. manifestă diminuarea tensiunii
3. manifestă acordul, acceptă pasiv
4. dă o sugestie
5. emite o opinie
6. dă o orientare, o informare
7. cere o orientare, o informare
8. cere o opinie
9. cere o sugestie
10. manifestă dezacordul
11. exteriorizează tensiune
12. manifestă antagonism
Utilizând operaţiile de grupare, această scală se poate transforma, prin condensarea
categoriilor, în felul următor:
II. A. Reacţii pozitive (1, 2 şi 3)
B. Răspunsuri aşteptate (4, 5 şi 6)
C. Întrebări (7, 8 şi 9)
D. Reacţii negative (10, 11 şi 12)
Noua scală cuprinde 4 categorii, fiecare provenind din câte trei ale scalei iniţiale.
Un alt gen de grupare ar putea fi:
III. a. comunicare (6, 7)
b. evaluare (5, 6)

21
CORNEL HAVÂRNEANU

c. influenţă (4, 9)
d. decizie (3, 10)
e. tensiune (2, 11)
f. integrarea membrilor (1, 12)
O altă viziune sintetică a fenomenului studiat poate produce condensări de ordinul doi, prin
gruparea categoriilor din scala II:
IV. i. reacţii emoţionale pozitive (A)
ii. reacţii emoţionale neutre (B, C)
iii. reacţii emoţionale negative (D )
Trecerea inversă, de la scale condensate la scale diversificate (cum ar fi de la scala II la scala I)
se realizează prin operaţii de rafinare, şi este impusă de necesităţi analitice accentuate.
Prin gruparea excesivă se produce o pierdere de informaţii primare, în timp ce rafinarea
excesivă duce la o acumulare de amănunte care creează dificultăţi în perceperea esenţei problemei
studiate. De aici rezultă nevoia păstrării unui echilibru între cele două situaţii.
Volumul eşantionului este un element important în alegerea numărului de gradaţii pentru o
scală nominală. Un eşantion mic nu se poate studia folosind o scală nominală cu un număr mare de
categorii, iar un eşantion mare printr-o scală cu puţine categorii.
Efectul transformării scalelor asupra distribuţiei datelor unei cercetări concrete este important.
Singurul lucru constant rămâne numărul de membri ai eşantionului. Distribuţia subiecţilor pe clase se
modifică la orice grupare sau rafinare a categoriilor.

II.5. SCALA ORDINALĂ

Scalele ordinale sunt cunoscute şi sub numele de scale de ordine, scale de rang, scale
ierarhice, şi permit ordonarea observaţiilor, indivizilor, situaţiilor de la mic la mare, de la simplu la
complex, de la mai puţin la mai mult.
Operaţia de enumerare şi clasare în diferite clase sau categorii este omogenă, adică toţi
indivizii sau obiectele unei clase sunt considerate ca fiind echivalente, când printr-un atribut ei aparţin
acelei clase. Dar, în interiorul unei clase date, indivizii pot fi comparaţi în funcţie de gradul prezenţei
unui atribut comun. Trebuie să fim preocupaţi de ordinea relativă a obiectelor sau indivizilor. Realizarea
acestei ierarhii se bazează pe evaluarea unui atribut observat, printr-o comparaţie directă sau indirectă.
O scală poate fi obţinută, constatând că un obiect sau individ posedă atributul într-un grad mai ridicat
faţă de obiectul sau individul precedent din serie, ceea ce poate fi simbolic exprimat astfel:
S1 < S2 < S3.............Sn (pentru n subiecţi)
Operaţiunea de ordonare presupune o discriminare foarte riguroasă faţă de simpla
categorizare, deoarece pentru fiecare obiect sau individ trebuie să stabilim gradul de prezenţă a unui
atribut, ceea ce nu înseamnă că scala indică cantitatea absolută a atributelor prezente, nici amploarea
diferenţelor sau raporturile dintre cantităţile atributelor prezente. În alţi termeni, atributul nu se exprimă
în mod necesar în unităţi egale, chiar dacă numerele care le reprezintă sunt la distanţe egale. De
exemplu, un individ care se situează la rangul patru nu prezintă de două ori mai multe atribute decât cel

22
PSIHODIAGNOSTIC (I)

care se situează la rangul doi. În fine, scala ordinală nu poate exista în absenţa totală a unui atribut, ea
nu admite deci zero absolut.
Simbolurile numerice atribuite obiectelor sau indivizilor, sunt ranguri care indică poziţia relativă
a acestora pe un continuum pentru atributul pe care dorim să-l măsurăm, ca în exemplul de mai jos.
S1 S2 S3 S4 S5 S6

Observăm că într-o scală ordinală direcţia continuumului este cunoscută. Singurele informaţii
cunoscute din acest continuum sunt de tipul "mai mic ca", "mai mare ca", "egal" sau "diferit" (<;>;=;≠),
între indivizi sau obiecte, în funcţie de atributul măsurat. Acest continuum reprezentat mai sus ne
permite să stabilim că:
S1 < S2; S4 > S3; S3 ≠ S5.
Datele scalelor ordinale pot fi analizate prin statistici neparametrice. Se poate recurge la toate
operaţiile statistice aplicabile scalelor nominale. Pentru aceste date putem calcula mediana, centile,
coeficienţi de corelaţie a rangurilor şi chi-pătrat. În acelaşi timp, operaţiile algebrice de adunare,
scădere, înmulţire şi împărţire nu au nici un sens dacă sunt aplicate acestor date. Nu putem calcula
media şi abaterea standard care ne oferă posibilitatea de a cunoaşte mai mult decât poziţia relativă a
obiectelor sau indivizilor. Aceasta este o limită importantă a informaţiilor care pot fi furnizate de o scală
ordinală, deoarece media sau abaterea standard reprezintă fundamentul metodelor statistice utilizate în
ştiinţele umane. Relaţiile funcţionale stabilite pe baza scalelor ordinale ne oferă un indice, mai mult sau
mai puţin satisfăcător, în comparaţie cu relaţiile exprimate de alte scale mult mai complexe.
Mulţi autori consideră că scalele de măsurare psihologice furnizează informaţii despre ordinea
indivizilor, în funcţie de atributul măsurat sau asupra gradului la care fiecare individ prezintă acel atribut.
Aceşti autori aduc critici severe legate de utilizarea metodelor statistice puternice în analiza datelor
psihologice şi recomandă o mare prudenţă în interpretarea datelor obţinute cu ajutorul scalelor ordinale.
Crearea unei scale ordinale presupune, stabilirea unei relaţii de ordine între valorile posibile ale
variabilei studiate.
J. Piaget, de exemplu oferă modelul unei scale după criteriul slab structurat - înalt structurat,
prin care evaluează stadiul dezvoltării inteligenţei la copil.
Stadiul 1 exersarea reflexelor
Stadiul 2 reacţia circulară primară
Stadiul 3 reacţiile circulară secundare
Stadiul 4 coordonarea schemelor secundare şi aplicarea la situaţii noi
Stadiul 5 reacţia circulară terţiară şi descoperirea de mijloace noi prin experimentare activă
Stadiul 6 inventarea unor mijloace noi de acţiune prin combinare mentală
Ordinea prezentată este de la simplu la complex. Utilizând această scală putem caracteriza
manifestările unui copil în funcţie de stadiul pe care l-a atins în dezvoltare. Dacă subiectul A este pasat
în stadiul 1, subiectul B în stadiul 2, iar subiectul C în stadiul 3, atunci putem face afirmaţia că subiectul
C are posibilităţi operatorii mai mari decât B sau C. Dar, caracteristicile scalei ordinale nu ne permit să
precizăm cu exactitate cu cât este mai complex C faţă de B sau faţă de A şi nici să comparăm diferenţa
dintre C şi B cu cea dintre B şi A.

23
CORNEL HAVÂRNEANU

II.6. SCALELE DE INTERVALE EGALE

Aranjarea ordinală poate da rezultate foarte complete dacă cunoaştem distanţa care separă
obiectele sau indivizii în funcţie de atributul măsurat. Dacă mai multe obiecte sau indivizi sunt la distanţe
egale, în funcţie de gradul pe care îl prezintă atributul, distanţa care le separă poate fi considerată ca o
unitate liniară de măsură şi scala constituită în acest fel se numeşte scală cu intervale egale sau scală
de intervale.
Egalitatea dintre intervale este necesară dacă dorim să cunoaştem diferenţele interindividuale
(diferenţele dintre indivizi referitoare la un atribut, pe un singur continuum) sau diferenţele intra-
individuale (diferenţele dintre poziţia unui individ în funcţie de mai multe atribute pe mai multe
continuumuri). O unitate reprezintă un aspect arbitrar, dar care poate avea o relaţie cu atributul pe care
dorim să-l măsurăm. Distanţele numerice egale reprezintă, în principiu distanţele empirice egale între
obiecte sau indivizi, în funcţie de atribut.
Se poate ajunge deseori la formularea unor enunţuri ştiinţifice în legătură cu diferenţele dintre
gradele la care obiectele sau indivizii prezintă un atribut. Sensul enunţurilor formulate presupun o
proprietate care se juxtapune obiectelor sau indivizilor, adică gradele de prezenţă a unui atribut pot fi
supuse operaţiilor de adunare şi scădere. Dacă această proprietate este satisfăcută atunci avem o
scală denumită "aditivă".
Unele scale aditive oferă posibilităţi limitate de măsurare dacă zero absolut nu poate fi stabilit.
De asemeni, scalele cu intervale egale permit măsurarea diferenţelor dintre gradele de prezenţă a
atributelor, dar nu indică amplitudinea absolută a acestor grade, deoarece ele nu admit zero absolut.
Ele presupun existenţa unui punct zero definit arbitrar. Zero nu este decât ceva arbitrar într-o scală de
interval, gradul de prezenţă a unui atribut care defineşte punctul zero are puţine şanse să corespundă
unei limite reale la care atributul dispare complet. Din această cauză este imposibil să stabilim proporţii
pe baza gradelor de prezenţă a unui atribut exprimat pe o scală de intervale egale. În acelaşi timp,
considerăm că distanţele pe o scală de intervale egale au proprietatea de adiţionare, ceea ce
presupune existenţa unui zero absolut.
Două enunţuri principale pot defini scalele cu intervale egale:
S1 < S2 < S3.............< Sn
S2 - S1 = S3 - S2 =S4 - S3.................Sn -Sn - 1
unde S1..........Sn sunt grade relative la care un atribut se prezintă pentru diferiţi subiecţi.
Scala de interval ne permite să cunoaştem direcţia unui continuum, dar şi stabilirea diferenţelor
între poziţiile obiectelor sau indivizilor, precum şi efectuarea unor operaţii de tipul celor prezentate mai
jos.
1 2 3 4

S1 S2 S3 S4 S5 S6 S7 S8 S9 S10 S11
Acest continuum de intervale egale ne permite să stabilim că diferenţa dintre rezultatele (R) a
indivizilor 1 şi 2 este mai mică decât diferenţa dintre rezultatele indivizilor 2 şi 3. Se observă că dacă
diferenţa dintre rezultatele indivizilor 2 şi 3 este de 1,5 în timp ce diferenţa dintre rezultatele indivizilor 1
şi 2 sau 3 şi 4 este de 1.

24
PSIHODIAGNOSTIC (I)

Scorurile unei scale de interval nu indică amplitudinea absolută a unui atribut din cauza
absenţei unui zero absolut, iar operaţiile de înmulţire şi împărţire nu au sens decât dacă ele se aplică
intervalelor nu şi scorurilor. Însă operaţiile de adunare şi scădere sunt aplicabile atât intervalelor cât şi
scorurilor.
Scorurile dintr-o scală de intervale pot fi supuse unei transformări liniare, fără ca structura scalei
să se modifice. Putem aduna sau scădea la fiecare scor o valoare constantă, sau putem împărţi sau
înmulţi fiecare scor printr-o constantă, fără a afecta nici poziţia relativă a obiectelor sau indivizilor pe un
continuum, nici egalitatea intervalelor, nici raporturile dintre intervale, nici forma generală a relaţiilor
dintre scorurile scalei faţă de o altă scală.
Scalele de intervale oferă, pe lângă posibilitatea operaţiilor statistice specifice scalelor mai puţin
complexe, calculul mediei abaterii standard, coeficientul de corelaţie Pearson recurgerea la teste de
semnificaţie (F; t) şi folosirea unor numeroase tehnici statistice puternice. Din acest motiv este de dorit
să utilizăm scala de intervale egale în ştiinţele umane:
Dar concepte ca inteligenţa, aptitudinile şi personalitatea nu pot fi măsurate decât cu scale
ordinale deoarece acestea nu răspund exigenţelor scalelor de măsurare mai complexe. În consecinţă,
singurele operaţii statistice acceptate legitim cu acest tip de date sunt cele specifice scalelor ordinale.
Cercetarea în ştiinţele umane recurge, cu mare frecvenţă la analize statistice puternice. Această situaţie
a determinat numeroase dezbateri printre cercetători purtate asupra legitimităţii de a considera
atributele umane ca putând fi exprimate în unităţi egale. De fapt, înainte de a analiza rezultatele unei
scale de măsurare, în conformitate cu posibilităţile pe care ni le oferă scalele de intervale, este
important să stabilim empiric egalitatea intervalelor scalei respective. În cazul în care utilizăm mai multe
metode de măsurare, este posibil să determinăm procedeul de operare potrivit, dacă unităţile sunt egale
sau nu. Alegerea acestor operaţii se efectuează în funcţie de variabila analizată şi de concepţiile
teoretice referitoare la natura variabilei respective.
Diferite tehnici permit controlul dificultăţilor legate de alegerea scalei şi se va proceda într-un
anumit fel dacă postulatele corespunzătoare utilizării unei scale de intervale egale sunt satisfăcute.
O primă tehnică constă în utilizarea unei singure definiţii operaţionale pentru atributul măsurat.
Acesta presupune să nu definim variabile decât în funcţie de rezultatele obţinute la un test. Ele
reprezintă deci, în mod cert, puritate matematică, dar ele pot conduce la erori de interpretare
conceptuală.
O a doua tehnică constă în a transforma rezultatele brute în scoruri derivate, care sunt ele
însele exprimate într-o scală de intervale egale.

II.7. SCALELE DE PROPORŢII SAU DE RAPORT

Această scală, care se aplică măsurătorilor fizice este o scală numerică. În măsurarea unui
atribut, zero absolut indică absenţa atributului la un obiect sau individ. O scală de proporţii poate fi
stabilită pentru un atribut, care la primă vedere, nu prezintă posibilitatea absenţei totale, când putem
respinge existenţa unei relaţii funcţionale între acel atribut şi un alt atribut sau fenomen care posedă
proprietatea de adunare (adică zero absolut). De exemplu, dacă putem vorbi de absenţa totală a
căldurii, vom putea tot timpul verifica existenţa unei relaţii funcţionale între căldură şi modificările

25
CORNEL HAVÂRNEANU

termice. Absenţa totală a variaţiilor termice corespunde unui zero absolut pentru temperatură (zero
grade Kelvin). Această procedură nu se poate aplica în toate situaţiile, mai ales în cazul atributelor
psihologice.
Prima caracteristică a unei scale de proporţii constă în posibilitatea de a cunoaşte distanţa între
zero absolut şi poziţia unui obiect sau individ pe un continuum definit pe baza unui atribut dat.
Amplitudinea absolută a unei cantităţi dintr-un atribut este o dată cunoscută şi este posibil să
cunoaştem poziţia unui scor individual fără a fi necesar să situam alţi indivizi sau obiecte pe acest
continuum. Numerele reprezintă deci, într-o formă reală gradul prezenţei unui atribut la un individ sau la
un obiect.
Mai mult, ca şi pentru scalele mai puţin complexe, direcţia continuumului este cunoscută, şi de
asemenea rangul indivizilor în funcţie de un anumit atribut, precum şi mărimea intervalelor dintre
scoruri, intervale care sunt evident egale. Scala de raport este deci o scală care dă informaţii foarte
complete.
1 2 3 4

0 1 2 3 4 5 6 7 8 9 10

Putem compara poziţiile indivizilor pe continuum dar, în acelaşi timp, putem stabili că individul 2
prezintă dublul gardului atributului prezent la individul 1, individul 3 prezintă de 3,5 ori gradul atributului
individului 1, iar individul 4 prezintă de 4,5 ori gradul atributului individului 1.
Dacă înmulţim sau împărţim scorurile unei scale de proporţii printr-o constantă, scala îşi
conservă proprietăţile, ordinea indivizilor sau obiectelor rămân aceeaşi, proporţiile dintre intervale şi
dintre scoruri rămân neschimbate, punctul zero este tot timpul prezent.
Dimpotrivă, dacă adunăm sau scădem o constantă din scorurile scalei, natura scalei se
modifică. Ordinea obiectelor sau indivizilor şi proporţiile dintre intervale rămân aceleaşi, dar proporţiile
dintre scoruri sunt modificate, iar zero absolut dispare.
Constatăm că informaţiile furnizate de o scală sunt cu atât mai precise, cu cât este mai mică
libertatea de a transforma scala fără a modifica informaţiile originale. O scală ordinală, de exemplu,
poate suporta toate transformările monotone fără ca informaţiile primare să fie modificate. La o scală de
intervale posibilităţile de transformare sunt mult mai restrânse. În sfârşit la scalele de proporţii
transformările permise sunt limitate la înmulţirea şi împărţirea printr-o constantă dacă dorim ca
informaţiile să rămână identice.
Postulatele unui model de scală de proporţii permit utilizarea tuturor operaţiilor aritmetice (+, –,
×, ÷), atât cu intervalele cât şi cu scorurile. Posibilitatea utilizării celor patru operaţii autorizează
folosirea metodelor de analiză matematică şi statistică foarte puternice, incluzând faţă de operaţiile
permise de scalele mai puţin complexe şi calculul coeficientului de variaţie.
Dacă corectăm un test şi adunăm numărul itemilor rezolvaţi corect, obţinem un număr situat pe
o scală de proporţii. Dar, dacă utilizăm acest număr pentru a indica poziţia subiectului pe o scală care
măsoară un atribut psihologic, atunci acest număr nu poate fi interpretat pe baza regulilor unei scale de
proporţii. Astfel, inexistenţa unor răspunsuri corecte (ceea ce însemnă zero răspunsuri corecte) nu

26
PSIHODIAGNOSTIC (I)

corespunde absenţei totale a atributului psihologic măsurat. De exemplu un scor zero la un test de
randament lexical nu implică că abilităţile de lectură sunt nule. Mai mult, 50 de itemi corect rezolvaţi,
dintr-un test, nu corespunde dublului gradului unui atribut pentru care s-au rezolvat 25 de itemi din
acelaşi test. Noi nu putem spune că un subiect care are un QI de 130 are o inteligenţă dublă faţă de un
subiect care are un QI de 65. De asemeni, nu putem vorbi de un QI nul, deoarece zaro absolut nu
există în măsurarea atributelor psihologice. Atributele psihologice nu permit aplicarea procedeului de
stabilire a unei relaţii funcţionale între două atribute deoarece acestea nu prezintă posibilitatea absenţei
totale. Scalele de proporţie nu sunt convenabile măsurării atributelor psihologice.

II.8. CLASIFICAREA DATELOR OBŢINUTE PRIN MĂSURARE

Observaţiile obţinute printr-un procedeu de măsură pot fi fie constante ale unui individ sau altul,
sau a unor situaţii diferite pentru acelaşi individ, fie variabile.
Variabilele sunt cantităţi de un anumit tip care pot lua mai mult decât o singură valoare. Acestea
pot fi neordonate (exemplu: sexul) sau ordonate (exemplu: aşezarea în ordine a scorurilor obţinute la un
test de randament). Variabilele ordonate pot fi negraduate (exemplu: bun, rău, slab) sau graduate
(exprimate cu ajutorul scorurilor numerice). Variabilele graduate pot fi continue (există posibilitatea de a
lua toate valorile numerice inclusiv fracţii, de exemplu: temperatura, greutatea) sau discrete (scorurile
nu pot avea decât valori întregi, de exemplu: numărul de indivizi dintr-o categorie sau numărul copiilor
dintr-o familie). Variabilele dihotomice sunt cele care nu pot lua decât două valori, de exemplu 0 sau 1.
Acestea sunt cazuri particulare ale variabililor discrete.
Constanta este o cantitate a cărei valoare rămâne neschimbată indiferent de context.

II.9. MĂSURAREA ŞI STATISTICILE

Termenul de statistică este frecvent utilizat dar este util să stabilim câteva distincţii în legătură
cu folosirea acestuia în teoria psihometrică. Distingem o diferenţiere între statistica inferenţială şi cea
descriptivă. Prima vizează producerea unor enunţuri probabiliste în legătură cu valorile obţinute de
subiecţii unor eşantioane din populaţie. A doua se limitează la descrierea diverselor aspecte ale unui
ansamblu de date empirice. Analizele matematice referitoare la măsurarea tendinţei centrale, a
dispersiei sau a corelaţiilor pot duce la descrierea unui ansamblu de date empirice ale unui eşantion mai
mare sau mai mic. Într-o etapă ulterioară putem aplica acestor date descriptive un ansamblu de tehnici
statistice inferenţiale (calcului intervalului de confidenţă, teste de semnificaţie) care permit extinderea
datelor obţinute prin investigarea eşantionului la ansamblul populaţiei studiate.
În psihologie, problema eşantionării se referă pe de o parte la eşantionarea subiecţilor dar pe
de altă parte la eşantionarea conţinutului (a itemilor unui test). Trebuie să facem distincţie între aceste
două forme de eşantionare. Putem concepe un ansamblu de itemi a unui test ca un eşantion a unei
populaţii ipotetic infinite de itemi (universul itemilor) care măsoară aceeaşi trăsătură. Teoria măsurării
este preocupată de relaţiilor statistice între scorurile obţinute la test şi scorurile ipotetice adică, scorurile
care ar putea fi obţinute dacă toţi itemii din universul de itemi ar fi utilizaţi pentru testare. După ce un
instrument de măsură a fost construit şi când el face obiectul unor cercetări empirice, este important să

27
CORNEL HAVÂRNEANU

realizăm analize statistice (inferenţiale) pentru generalizarea datelor obţinute pe eşantioane de subiecţi,
la populaţia corespunzătoare. În construcţia unui instrument preocuparea principală este examinarea
posibilităţilor de extindere la populaţia de itemi a rezultatelor obţinute cu ajutorul eşantionului de itemi. În
consecinţă, este imposibil să ţinem seama în acelaşi timp, în analize statistice, de cele două aspecte ale
eşantionului. O manieră tipică de rezolvare practică a acestei probleme este de a ţine seama, în mod
explicit, de unul din cele două dimensiuni şi considerând că cealaltă dimensiune poate eventual să
influenţeze rezultatele.
Există posibilitatea să se rezolve această problemă într-o manieră mult mai sigură. Putem folosi
un eşantion foarte mare, fără a fi preocupaţi de erorile de eşantionare decât în raport cu celălalt
eşantion. În psihometrie când construim un instrument de măsură utilizăm un eşantion de subiecţi
suficient de mare pentru ca eroare de eşantionare referitoare la indivizi să fie puţin importantă.
Problema reprezentativităţii eşantionului de subiecţi fiind rezolvată, reprezentativitatea eşantionului
conţinutului va deveni preocuparea centrală.
Un eşantion de subiecţi relativ restrâns nu este suficient pentru un studiu de validitate pentru
noul instrument. Mai mult, dacă eşantionul de subiecţi este suficient de mare, atunci precizia testului va
fi independentă de numărul de subiecţi din eşantion şi va fi legată direct de conţinutul testului adică de
numărul de itemi.

II.10. CUNOAŞTEREA PERSOANEI ŞI ASPECTELE MĂSURĂRII

În ştiinţele umane măsura nu se aplică direct indivizilor ci, diferitelor caracteristici ale acestora
la care se face referire printr-o terminologie variată. Când vorbim de atribut, de proprietăţi sau de
trăsătură, facem referire la o particularitate care este prezentă şi se manifestă în diferite grade la
indivizii unei clase date, acestea nefiind în mod necesar prezente la toţi indivizii. Problema este de a
cunoaşte dacă un individ posedă unele proprietăţi.
În cazul unei proprietăţi care se referă la abilitatea unui individ sau la personalitatea sa,
măsurarea se referă la comportamentele observabile şi măsurabile. Această proprietate este o
construcţie, un concept care se referă la un aspect precis al individului şi din care putem extrage un
ansamblu de comportamente, pe care îi vom considera indicatori ai proprietăţii respective. Acest
concept căruia îi atribuim un nume (perseverenţă, inteligenţă, autoritarism etc.) nu există în afara
indivizilor. Pentru a fi raţional este necesară o coerenţă cu acele comportamentele observate, cu
organizarea şi structurarea lor. Pe baza observaţiilor indicatorilor unei proprietăţi a trăsăturii vom putea
presupune prezenţa, într-o măsură mai mare sau mai mică a proprietăţii, la un individ iar această
presupunere implică formularea unuia sau mai multor postulate sau o demonstraţie pentru stabilirea
unei relaţii între proprietăţi şi manifestările sale (indicatori comportamentali).
Un concept poate fi definit în două feluri, fie cu ajutorul altor concepte (definiţie teoretică sau
constitutivă) fie cu ajutorul procedeelor experimentale (definiţie empirică sau operaţională). Dacă unele
trăsături se pretează la definiţii relativ clare şi precise (aptitudine numerică, aptitudine verbală etc.)
altele sunt foarte ambigue şi mai imprecise (onestitate, impulsivitate etc.). În cazul în care presupunem
că o proprietate poate fi măsurată cu ajutorul unor indicatori, atunci proprietatea respectivă face obiectul
unei definiţii operaţionale riguroase în care trebuie precizate activităţile şi operaţiile la care se recurge
pentru a putea fi supuse procedeului de măsurare.

28
PSIHODIAGNOSTIC (I)

Cercetătorii caută în mod obişnuit izolarea unei proprietăţi. În acest fel ei limitează observaţiile
directe şi indicatorii la categoria de comportamente pertinente studiului lor, pentru a stabili indicatorii
proprietăţii. Valoarea inferenţei prin utilizarea unui procedeu de măsurare este dependent de natura
observaţiilor, care sunt în funcţie de interacţiunea anumitor factori. Caracteristice naturale ale
proprietăţii, teoria care o susţine, natura instrumentelor de măsură, şi experienţa cercetătorului sunt
factori care determină tipul de observaţie (direct sau indirect) şi în acelaşi timp veridicitatea cazurilor
observate. Dar ştiinţa vizează stabilirea consensurilor propriilor enunţuri referitoare la conceptele pe
care le dezvoltă şi este important ca observaţiile să poată fi reproduse. Din acest motiv condiţiile
observaţiilor, timpul, locul şi circumstanţele trebuie precizate. De asemenea, procedeul de măsurare
trebuie să poată fi refolosit şi rezultatele să fie verificabile. Mai mult, valoarea observaţiilor în ştiinţele
umane, este limitată de diferite surse de eroare, rezultatele măsurării fiind doar estimări ale indicatorilor
proprietăţii studiate. Precizia rezultatelor permite evaluarea valorilor observate, a intervalelor “de
confidenţă” în interiorul cărora valorile studiate au o probabilitate dată.
Pentru a elimina lacunele observaţiilor trebuie să elaborăm un instrument de măsură care să
permită evaluări cât mai precise ale indicatorilor. Elaborarea acestor instrumente presupune o bună
înţelegere a conceptelor. Primele baze de identificare a unei proprietăţi pot fi imperfecte datorită limitelor
observatorului şi a conceptelor eronate despre proprietatea respectivă. În cursul elaborării unei măsurări
numeroase schimbări sunt făcute asupra conceptelor legate de proprietatea măsurată. Primele estimări
sunt grosiere şi posedă multe erori. Cercetătorul poate perfecţiona scala de măsurare prin determinarea
relaţiei existente între proprietatea măsurată cu ajutorul scalei şi alte proprietăţi. În acest fel, măsurarea
devine mai rafinată dacă în timp se achiziţionează noi cunoştinţe.
Realizarea unor instrumente la care erorile de măsurare să fie cât mai mici şi care să permită
înregistrarea cât mai obiectivă a manifestărilor unei proprietăţi este mai mică în domeniul psihologiei. De
fapt, constatăm că nici măsurătorile fizice nu sunt perfecte. Simplul fapt de a face o măsurare, în care
intervine un observator şi folosirea unui instrument de măsură afectează rezultatele. Dacă metodele
respective permit eliminarea, într-o măsură mai mare sau mai mică, a efectelor procedeului de
măsurare, rămâne tot timpul o interacţiune nedeterminată între subiect şi observator.
Faptul că măsurarea presupune o eroare afectează certitudinea în stabilirea unei relaţii
cauzale. Concepţiile moderne de măsurare substituie modelului convenţional “cauză - efect”, enunţuri
relative asupra probabilităţii de manifestare a unui eveniment sau interacţiunilor dintre observaţii. În
statistică, proprietatea este măsurată în funcţie de acumularea unor evenimente (media) şi variaţia
acestora (varianţă).

29
CORNEL HAVÂRNEANU

III. METODA TESTELOR

III.1. CONDUITA CA RELAŢIE

Faptul psihologic este o conduită, care implică o schemă de relaţii, pe care le studiază
psihologul. Conduita este manifestarea unei persoane într-o situaţie dată.
Dacă notăm conduita cu R (fideli tradiţiei anglo - saxone, unde R reprezintă iniţiala de la
răspuns sau reacţie), atunci aceasta depinde de personalitatea subiectului (P), care se confruntă cu o
situaţie dată (S).
În acest fel putem considera conduita în funcţie de personalitate şi situaţie: R=f(P,S).
În evoluţia psihologiei această relaţie a cunoscut diferite forme în funcţie de paradigmele
explicative la care au aderat cercetătorii.
Watson (1913), a pus bazele paradigmei behavioriste, în centrul atenţiei fiind plasat studiul
comportamentului exterior. Pentru acesta relaţia era de tipul R=f(S), aspectele legate de personalitatea
subiecţilor au fost neglijate deoarece psihologul nu poate pătrunde în interiorul "cutiei negre".
Woodworth (1929), complică schema de relaţii, sub forma S ⇒ O ⇒ R, scoţând în evidenţă
rolul organismului, dar se limitează doar la evocarea determinanţilor biologici ai comportamentului.
Pentru a evita orice confuzie trebuie menţionat faptul că variabilele S, R, P pot fi studiate la
diferite niveluri:
Conduita (R), reprezintă actul subiectului şi are componente endocrine, neurovegetative, motorii,
verbale. Psihologul se poate limita la studii fragmentare, luând în consideraţie doar o
componentă, dar poate cerceta şi relaţiile dintre mai multe componente. Astfel, o conduită
manifestată printr-un răspuns verbal, pate fi analizată din punct de vedere a structurii
gramaticale, a naturii fonemelor, a semnificaţiei sau a efectului produs pentru interlocutor.
Situaţia (S), pate fi de asemenea analizată la diferite niveluri. Stimulii fizici, care provin de la diferite
surse, acţionează de multe ori asupra subiecţilor, fără ca aceştia să conştientizeze. Lumina,
temperatura, umiditatea, presiunea atmosferică, compoziţia şi gradul de ionizare a aerului
influenţează dispoziţiile şi activităţile oamenilor. Percepţiile nu sunt simple fotografii ale obiectelor,
ele sunt construcţii ale experienţei, sunt influenţate de modul în care subiectul se raportează la
situaţie, de atitudinea acestuia. Situaţia este deci, relativă la subiect şi este important modul în
care subiectul vede situaţia, în funcţie de personalitatea sa.
Din aceste considerente relaţia nu este de tipul R=f(S,P) ci, R=f(S ⇔ P), săgeata dublă indicând
că există întotdeauna o interacţiune între S şi P, care nu sunt simple variabile aditive. Această
interacţiune poate fi cunoscută prin interpretarea răspunsurilor subiectului, care va dezvălui
semnificaţia pe care acesta o dă situaţiei.
Personalitatea (P), este o sinteză dinamică de aspecte morfologice şi fiziologice, dar şi conative,
afective, volitive. Cercetătorul trebuie să ţină seama de aceste aspecte şi chiar să ia în

30
PSIHODIAGNOSTIC (I)

consideraţie şi alte variabile ca: vârsta, sexul, integritatea senzorială, temperamentul, educaţia
primită, motivaţia etc. Personalitatea este în centrul relaţie, ea nu poate fi izolată din relaţie
deoarece se manifestă ca un nod de relaţii între situaţii şi răspunsuri.

III.2. TIPURI DE RELAŢII ÎNTRE S - P - R

Există trei modalităţi clasice de abordare a acestor relaţii:


a. Relaţii funcţionale, utilizate pentru studiul funcţiilor psihice, unde aceeaşi persoană
reacţionează diferit la variabile cantitative şi calitative ale situaţiei.

S1 R1

S2 R2

S3 P R3

Sn Rn
În această figură S1, S2, S3, .....Sn, reprezintă situaţii cărora le corespund diferite răspunsuri R1,
R2, R3, ...Rn. De exemplu, evoluţia adaptării la întuneric (R) este în funcţie de timp (S), sau volumul
materialului memorat (R) este în funcţie de numărul de repetiţii, sau reacţiile defensive (R) sunt în
funcţie de gradele diferite ale frustrării (S).
b. Relaţii structurale, folosite pentru studiul structurii psihice, unde se studiază relaţiile dintre
răspunsurile obţinute de subiecţi pornind de la situaţii diferite.
S1 R1

S2 R2

S3 P R3

Sn Rn
În acest caz, situaţiilor diferite S1, S2, S3, .....Sn, le corespund răspunsuri diferite R1, R2, R3,
...Rn. Aici se pune problema de a stabili relaţiile dintre răspunsurile R1, R2, R3, ...Rn, care sunt
dependente de structura personalităţii. Aceste studii utilizează calcule de corelaţie şi analiza factorială.
Astfel se pot studia relaţiile dintre reacţiile obţinute în diferite situaţii care produc emoţii sau relaţiile
dintre diferite niveluri de eficienţă în sarcini diferite. Logica acestor studii se bazează pe faptul că dacă
obţinem corelaţii ridicate între răspunsurile subiecţilor la diferite situaţii, înseamnă că există un factor, în
structura personalităţii care justifică aceste corelaţii. În acest fel Spearman a obţinut un factor "g" de

31
CORNEL HAVÂRNEANU

inteligenţă generală şi mai mulţi factori "s", consideraţi factori specifici, iar Thurstone mai mulţi factori de
grup, printre care factorul numeric "N", factorul de fluiditate verbală "W", factorul de comprehensiune
verbală "V", un factor perceptiv "P", unul de raţionament "R" (cu două forme raţionament inductiv I şi
deductiv D).
c. Relaţii diferenţiale, folosite pentru studierea diferenţelor dintre indivizi, unde luăm în
consideraţie reacţiile unor persoane diferite la o singură situaţie standardizată.
P1 R1

P2 R2

S
P3 R3

Pn Rn
Diferenţele dintre R1, R2, R3,...Rn, se obţin datorită diferenţelor existente între P1, P2, P3,...Pn. În
acest fel putem studia diferenţele dintre indivizi, dar putem compara şi reacţiile unor grupuri diferite, în
funcţie de anumite caracteristici ca: vârsta, sexul, etnia, nivelul cultural etc. În cel de al doilea caz putem
pune în evidenţă unele aspecte ale personalităţii, comune în diferite grade, tuturor subiecţilor care
aparţin unui grup selectat pe baza unor criterii dinainte stabilite. De exemplu, putem studia variaţiile
eficienţei subiecţilor în diferite domenii de activitate în funcţie de experienţa profesională a acestora,
evoluţia percepţiilor în funcţie de vârstă şi sex, asemănările şi deosebirile de mimică emotivă la populaţii
care aparţin unor culturi diferite.
Acest tip de relaţie este folosit atât în cazul experimentului cât şi în cel al testului psihologic, dar
cele două aspecte nu sunt identice. În situaţia experimentală, P1, P2, P3, ...Pn, este aceiaşi persoană
în stări diferite. Situaţiile interne, subiective pot fi diferite. De asemeni dacă sunt ingerate anumite
substanţe (stimulatoare, deprimante, droguri), reacţiile sunt determinate de acestea.
În cazul testului P1, P2, P3, ...Pn, sunt persoane diferite. Din aceasta cauză nu mai avem
aceeaşi certitudine în stabilirea relaţiilor dintre fapte şi nici atunci când interpretăm rezultatele, deoarece
situaţia este interpretată diferit de fiecare persoană. În cadrul relaţiilor S ⇔ P, necunoscând perfect
persoana nu putem şti care din factorii care acţionează asupra lui P1 determină R1 şi care din factorii
care acţionează asupra lui P2 determină R2. Dacă R1 şi R2 pot fi răspunsuri aproape identice P1 şi P2
sunt subiecţi foarte diferiţi.
În concluzie, între experiment şi test există o deosebire de precizie, testul fiind mai puţin
precis decât experimentul. Totuşi, testul rămâne o formă de experiment, pentru că provocăm o reacţie
în condiţii bine determinate ţi obţinem reacţii în aceste condiţii. Şi în cazul experimentului, chiar dacă
aceste se adresează aceloraşi subiecţi, starea acestora se poate modifica, subiecţii îşi pot schimba
atitudinea şi pot interveni factori care ne scapă de sub control. Pentru a evita erorile, în cazul
experimentului vom folosi grupe de subiecţi, şi în acest fel vom putea verifica dacă rezultatele sunt
datorate stimulului şi nu subiectivităţii subiecţilor. Condiţia care se impune pentru precizie, este ca
subiecţii să fie echivalenţi.

32
PSIHODIAGNOSTIC (I)

III.3. DEFINIREA TESTELOR

Termenul a fost introdus în psihologie de James McKeen Cattell, psiholog american, elev a lui
Wundtt, care în 1890 denumeşte probele destinate cunoaşterii deosebirilor dintre indivizi "teste",
denumire care s-a păstrat şi astăzi (în engleză "test" înseamnă probă, încercare, experimentare).
Lee Cronbach, defineşte testul ca un "procedeu sistematizat de măsură a comportamentului
unor persoane şi de descriere a acestuia cu ajutorul unor scări numerice sau a unui sistem de
categorii", (scări nominale sau ordinale). Pe baza acestei definiţii testul cuprinde chestionarele,
procedee pentru observarea comportamentului social, aparate pentru măsurarea şi înregistrarea
randamentului.
Pentru André Rey, "testul este un mijloc de a diferenţia indivizii în funcţie de un etalon", iar
Anne Anastasi (1976) consideră că "un test psihologic este măsurarea standardizată şi obiectivă a
unei modalităţi de comportament".
Asociaţia internaţională de psihotehnică şi Henri Piéron (1963) definesc testul "o probă
determinată, implicând o sarcină de executat, identică pentru toţi subiecţii examinaţi. Este o tehnică
precisă pentru aprecierea succesului sau pentru notarea numerică a reuşitei". Definiţia scoate în
evidenţă două aspecte importante: folosirea unei probe standardizate şi a unei tehnici exacte de
apreciere a rezultatelor.
P. Pichot observă că aceste definiţii elimină o categorie importantă de "teste" şi anume
"testele" proiective. După el, "testul psihologic este o situaţie standardizată servind drept stimul unui
comportament. Acest comportament este evaluat şi comparat statistic cu cel al altor indivizi plasaţi în
aceeaşi situaţie, ceea ce permite clasarea subiectului fie cantitativ, fie tipologic". În legătură cu "testele"
proiective", în literatura de specialitate se întâlneşte termenul de "tehnică proiectivă", deoarece aceste
"teste" nu sunt suficient de standardizate, mai ales în privinţa aprecierii şi interpretării rezultatelor.
Acesta este motivul care justifică eliminarea acestora din categoria testelor şi folosirea termenului de
tehnică, tocmai pentru a evidenţia specificul lor.
Ion Holban (1978), defineşte testul ca "instrument al metodei experimentale, organizat sub
forma unei probe standardizate din punct de vedere al conţinutului, al condiţiilor de aplicare şi al
modalităţilor de apreciere a rezultatelor, instrument ce este folosit în stabilirea unei anumite variabile".
Autorul face câteva observaţii importante referitoare la specificul acestor instrumente de cunoaştere.
Testul impune existenţa unei relaţii directe şi specializate între itemii testului şi variabilele de investigat.
Orice test are valoare numai în limitele diagnosticului variabilei pentru care a fost elaborat. Această
relaţie nu este şi inversă, adică pentru aceeaşi variabilă putem găsi un număr considerabil de teste, mai
mult sau mai puţin apropiate ca structură. De exemplu, multe teste de inteligenţă au fost construite după
principiile şi modelul testului elaborat de Binet, cărora li s-a schimbat, după caz, diferite categorii de
itemi.
Andrei Cosmovici, (1996), defineşte testul ca "o probă standardizată, vizând determinarea cât
mai exactă a gradului de dezvoltare a unei însuşiri psihice sau fizice." Observăm, şi în acest caz
accentul care se pune în legătură cu standardizarea, dar şi determinarea cu ajutorul testelor o
performanţelor de care sunt capabile unele persoane datorită calităţilor fizice pe care le posedă.
În psihologie, termenul "test" are două sensuri:

33
CORNEL HAVÂRNEANU

a. Este o probă standardizată din punct de vedere al consemnului (explicarea sarcinilor de


efectuat) şi a modului de corectare, cotare şi interpretare a rezultatelor, acestea fiind fixate dinainte
pentru a evita eventualele variaţii care se pot datora persoanei care aplică, corectează şi interpretează
testul.
b. Este o micro-situaţie, o simulare a unor caracteristici bine definite, în care vom plasa o
persoană cu scopul de a studia modul în care aceasta procedează în raport cu situaţia. Micro-situaţia
reprodusă trebuie să fie cât mai apropiată de situaţia reală din care a fost extrasă. Roger Mucchielli
(1969), consideră că un simulator este "un dispozitiv care reproduce, dup reguli şi garanţii bine
precizate un ansamblu de condiţii reale ale existenţei". Alţi autori, printre care Sorokin, Whyte (adversari
ai metodei testelor), susţin că singura probă valabilă este realitatea muncii, dacă vrem să judecăm
capacităţile unui subiect. Dar ei nu amintesc de faptul că această manieră de confruntare cu realitatea
muncii este o problemă foarte dificilă, care presupune consumuri considerabile de timp şi material, iar
evaluarea rezultatelor cere observaţii de lungă durată. Acestea sunt motivele care justifică utilitatea
folosirii unor micro - situaţii.
În acest fel, cu ajutorul testului se va extrage dintr-o situaţie concretă, reală un eşantion de
condiţii sau factori, consideraţi semnificativi pentru un anumit tip de comportament, ignorând aspectele
neesenţiale.

X1 X2 X3 X4 Y1 Y2
X5 X6 X7 X8 Y3

Xm-1 Xm Yn-1 Yn

SITUAŢIA CONCRETĂ SITUAŢIA TEST

De exemplu, dacă vrem să cunoaştem capacitatea de abstractizare a unui subiect, atunci în


vom cere să rezolve o serie reprezentativă de sarcini de abstractizare, urmărind să extragem cât mai
multe eşantioane de conduită reprezentative pentru operaţia de abstractizare. Răspunsurile subiectului
vor avea valoare diagnostică dacă există o legătură reală între răspunsurile acestuia în situaţia
experimentală (rezultatele la test) şi conduita subiectului în situaţii concrete de viaţă. Dacă constatăm o
strânsă legătură între performanţa obţinută în rezolvarea sarcinilor la test şi capacitatea reală de
abstractizare a subiectului, atunci putem trage concluzia că testul are utilitate practică.
Constatăm că testul este o situaţie experimentală controlată, variabilele lui esenţiale trebuie să
fie dinainte cunoscute de examinator. Prin natura sa, testul tinde să reproducă, în condiţii artificiale,
condiţiile unei situaţii reale. În acest fel el devine o micro-situaţie tipică, simulată. Valoarea "simulatoare"
a testului va depinde de analiza situaţiei reale, de definirea variabilelor situaţiei reale şi a modului de
interacţiune a acestor variabile. Aceasta implică, cunoaşterea structurii funcţionale a situaţiei şi
reproducerea, sub forma unui test a conţinutului psihologic a structurii funcţionale a situaţiei identificate.
Testul nu trebuie să piardă din vedere nici o variabilă esenţială a situaţiei concrete. În acest caz testul
nu este nici analitic, nici sintetic, ci analog cu situaţia reală, în sensul că modelează conţinutul psihologic
al activităţii reale, dar nu şi forma exterioară a acesteia.

34
PSIHODIAGNOSTIC (I)

În concluzie, deosebirile exterioare, de formă, între sarcina test şi sarcina reală, ascund mereu
o identitate internă, de conţinut sau de natură psihologică. Modalitatea de rezolvare a acestei probleme
este fundamentală pentru valoarea constructivă şi diagnostică a unui test (Roger Mucchielli, 1969).
Pentru a evita unele confuzii, este necesar să facem distincţia dintre teste şi chestionare.
Reprezentanţii şcolii germane definesc chestionarele ca fiind "teste subiective". Această atitudine este
justificată de faptul că precizia chestionarelor este mult mai mică, din cel puţin două motive. În primul
rând, răspunsurile obţinute cu ajutorul acestor instrumente sunt dezirabile, subiecţii au tendinţa de a
face o bună impresie, de a răspunde aşa cum cred ei că este bine şi nu aşa cum sunt în realitate. În al
doilea rând, bazându-se pe introspecţie (care este de fapt o retrospecţie), intervine uitarea, ceea ce
face ca multe aspecte esenţiale să fie neglijate.
Prin utilizarea testelor aceste limite sunt înlăturate, acesta fiind un instrument mult mai precis.
Distincţia esenţial - neesenţial este mai tranşantă în cazul testelor şi dispare posibilitatea de a măsura
aparenţele. Diferenţierile dintre persoane, evidenţiate cu ajutorul testelor, sunt esenţiale dacă
demonstrăm constanţa acestora. Testul este un instrument valoros dacă predicţia pe care o facem cu
ajutorul lui este pertinentă, adică dacă se referă la comportamente care persistă la un individ.

III.4. CLASIFICAREA TESTELOR

Testele ca mijloace de psihodiagnostic s-au dezvoltat într-un ritm accelerat, utilizându-se în prezent,
în practica psihologică peste 10.000 de teste, astfel încât este dificilă realizarea unei clasificări care să
surprindă cele mai sensibile diferenţe pe baza criteriilor care se iau în consideraţie pentru o clasificare
generală. Există în literatura psihologică numeroase clasificări ale testelor:
După paradigma teoretică la care aderă: reprezentanţii şcolii experimentaliste, care descompun
personalitatea în părţi componente, apelează la teste "sectoriale" folosind analiza factorială şi metode
metrice precise, în timp ce psihologii clinicieni, încearcă să cuprindă ansamblul personalităţii cu ajutorul
testelor holistice, folosind sau nu indicatori numerici.
După aspectul psihologic investigat: găsim teste intelectuale, care vizează cunoaşterea
proceselor cognitive (percepţie, memorie, capacitate de analiză şi sinteză etc.), teste de personalitate, care
vizează aspectul afectiv - atitudinal.
Această clasificare grupează pe de o parte testele intelectuale, care sunt metrice, iar pe de altă
parte testele de personalitate, care sunt analitice (chestionarele) sau holistice (testele proiective).
După modul de prezentare: testele pot fi orale, răspunsul subiectului se dă sub formă verbală,
teste scrise (numite creion - hârtie), teste instrumentale, la care se utilizează un suport concret (material sau
un aparat), teste informatizate, aplicate cu ajutorul computerului.
După modul de aplicare: teste individuale şi teste de grup.
După timpul alocat pentru răspuns: teste cu timp liber şi teste cu timp limitat.
După scopul urmărit (P. Pichot) distinge: teste de eficienţă, care măsoară o aptitudine sau o
capacitate, şi teste de personalitate prin care se urmăreşte explorarea fondului psihologic intim,
determinarea aspectelor motivaţionale, ale caracterului accentul fiind pus pe interpretarea calitativă a datelor
obţinute.

35
CORNEL HAVÂRNEANU

O clasificare în detaliu a testelor psihologice este utilă şi eficientă din punct de vedere practic. În
acest fel putem distinge următoarele categorii de teste:
• teste de inteligenţă şi dezvoltare mintală, care măsoară aptitudinea cognitivă generală şi nivelul
atins în dezvoltarea caracteristicilor intelectuale;
• teste de aptitudini şi capacităţi, care au fost elaborate pentru măsurarea aptitudinilor de grup şi
specifice;
• teste de personalitate, care măsoară însuşiri de temperament şi caracter, acestea fiind împărţite
în două categorii:
1. teste obiective de personalitate, care-şi propun obţinerea unor date cuantificabile, cât mai
puţin influenţate de interpretările subiective şi evitarea tendinţei de faţadă a subiecţilor în
momentul elaborării răspunsului, deoarece aceştia nu conştientizează aspectele
personalităţii vizate de test;
2. tehnici proiective, care valorizează mecanismul de proiecţie în cunoaşterea psihologică a
persoanei, trecând peste vigilenţa conştiinţei în încercarea de a studia inconştientul;
• teste de cunoştinţe sau docimologice, care măsoară nivelul cunoştinţelor acumulate de subiecţi
şi servesc ca modalitate de examinare şi notare.

36
PSIHODIAGNOSTIC (I)

IV. FIDELITATEA TESTELOR

Valoarea oricărui instrument de cunoaştere psihologică depinde de calităţile acestuia.


R. Zazzo în prefaţa la "Manuell pour l'examen psychologique de l'enfant" (1969) face câteva
reflecţii asupra metodei testelor din care cităm:
"Practicarea metodei testelor ridică o mulţime de probleme, unele create cu totul de
prejudecăţile şi ignoranţa unor oameni care vorbesc despre asta fără să ştie mare lucru, altele
într-adevăr reale, întâlnite şi rezolvate de bine de rău de către cei care construiesc testele şi le
utilizează...
Un test nu este, de fapt, aşa cum cred adesea profanii, un dispozitiv misterios care ne
informează în mod automat şi infailibil despre facultăţile misterioase al căror nume scapă psihologiei
comune.
Se confundă standardizarea probei cu un pretins automatism de aplicare. Se confundă, de
asemenea, natura insolită a anumitor factori la care încearcă să ajungă testele cu natura însăşi a
metodei: ca şi cum in test de ortografie nu ar indica natura acestei metode la fel de clar ca un test al
factorului G, de exemplu.
Se confundă, în sfârşit, precizia măsurărilor obţinute cu o afirmare a fixităţii pentru lucrul
măsurat: ca şi cum temperatura citită astăzi pe n termometru ar fixa febra la un nivel definitiv."
Vom sublinia faptul că orice instrument de cunoaştere psihologică trebuie utilizat ţinând seama
de limitele valorii sale diagnostice şi prognostice. Din această cauză psihologul trebuie să cunoască în
amănunt aceste calităţi înainte de a-l folosi pentru cunoaşterea psihologică a persoanei în diferite
scopuri.
În acest capitol vom prezenta cele mai importante calităţi ale testelor: fidelitatea, validitatea şi
standardizarea.

IV.1. DEFINIREA FIDELITĂŢII

Există frecvent credinţa eronată că testul ar măsura toate aspectele cuantificabile ale
conduitelor sau reacţiilor umane. În realitate testul extrage, din variaţiile teoretic infinite ale conduitelor
subiectului, un număr limitat de eşantioane de conduită, pe care le măsoară, oferind o imagine lacunară
asupra conduitei reale a persoanei testate.
Se observă că testarea repetată a unei persoane cu aceeaşi probă, sau cu probe paralele duce
la obţinerea unor rezultate fluctuante, la o variaţie mai mult sau mai puţin accentuată.
Scorurile obţinute la testele psihologice provin din răspunsurile date de diferiţi subiecţi. Una din
caracteristicile comportamentului uman este că acesta se modifică în timp, aspect care ne face să ne
preocupe constanţa scorurilor. Eşantionarea itemilor, circumstanţele particulare de administrare a
testului şi caracteristicile subiecţilor determină inconstanţa în măsurare. Măsurările fizice sunt în general

37
CORNEL HAVÂRNEANU

stabile, iar diferenţele dintre scoruri sunt uşor de explicat, ceea ce nu se întâmplă în cazul măsurătorilor
psihologice, la care scorurile sunt influenţate de condiţii exterioare.
Teoria preciziei testului (termen generic pentru desemnarea studiului consistenţei interne) este
importantă prin două probleme fundamentale:
Prima constă în gradul de consistenţă a rezultatelor, şi se referă la relaţia între scorurile
obţinute în diferite situaţii de aplicare a testelor; iar a doua la cauzele diferenţelor observate între
scoruri, deci a cunoaşte factorii care determină scorurilor inconstante şi importanţa efectului lor.
Caracterul inconsecvent al rezultatelor brute ridică problema fidelităţii instrumentului care în
esenţă ridică trei probleme:
a. Cât de variabile, de fluctuante sunt rezultatele subiectului de la o măsurare la alta?
În această situaţie fidelitatea constă în stabilitatea rezultatelor în timp şi în consecinţă în
predictibilitatea lor.
b. Valorile obţinute la o probă sunt adevăratele valori ale aspectului psihologic măsurat?
Diferenţele interindividuale, constatate în privinţa cotelor obţinute la test, pot fi explicate prin
diferenţe reale dintre subiecţi?
În această situaţie fidelitatea se referă la acurateţea, precizia cu care testul măsoară ceea ce şi-a
propus să măsoare.
c. Cât de mare este eroarea de măsurare (totalul erorilor întâmplătoare) a testului?
În această situaţie fidelitatea se referă la absenţa relativă a erorilor de măsurare.
Teoria clasică a testelor furnizează elementele de bază, necesare pentru rezolvarea acestei
probleme. Ea se bazează pe câteva postulate, definiţii şi relaţii.
După teoria clasică a testelor toate scorurile observate (X) sunt compuse din două părţi: un scor
adevărat (A) şi un scor eroare (E). Această relaţie poate fi reprezentată sub forma ecuaţiei: X = A + E
Se pune însă problema sensului pe care îl dăm scorului observat.
Acest concept poate fi definit în mai multe feluri.
1. Îl putem considera ca un scor obţinut cu un test perfect, deci un test care măsoară
fără eroare. De fapt, dacă putem efectua măsurări fără eroare, toate scorurile
observate pot fi considerate ca adevărate. Acest lucru este imposibil deoarece
întotdeauna există un gard de eroare.
2. Există şi o altă manieră de înţelegere a scorului adevărat. Lord şi Novick (1968)
dau o altă definiţie scorului adevărat elaborând postulatele de bază şi relaţiile dintre
scorurilor adevărate şi eroare.
Scorul adevărat al unui subiect (s) obţinut cu un instrument dat (i) este definit ca valoarea
aşteptată a scorului observat:
Asi = ε Xis
unde: Asi este o constantă, Xis este o variabilă oarecare, iar ε este valoarea aşteptată.
Deci, scorul aşteptat al unui subiect (s) obţinut cu instrumentul (i) este valoarea aşteptată (ε) a
răspunsului la instrumentul (i) dat de subiectul (s).
O altă manieră de exprimare a relaţiei dintre un scor adevărat şi un scor observat, constă în a descrie
scorul adevărat ca fiind scorul mediu a unui subiect pentru un număr infinit de utilizări a aceluiaşi
instrument de măsură.

38
PSIHODIAGNOSTIC (I)

Un alt concept important în teoria clasică a testelor este cel de eroare (E). Eroarea poate fi
definită ca fiind diferenţa dintre scorul adevărat şi scorul observat:
Esi = Xis - Asi
Acest tip de eroare este datorată hazardului ceea ce exclude toate sursele sistematice de
variaţie a erorii.
După aceste constatări putem apela la calcularea mediei şi a varianţei pornind de la relaţia
iniţială şi prin calcule vom obţine:
X m = Am
Media scorurilor observate este egală cu media scorurilor adevărate.
Termenul Em, dispare din ecuaţie când valorile aşteptate ale erorilor (variabile aleatoare) tind
spre zero. În consecinţă, efectele erorilor au tendinţa să se anuleze dacă numărul de observaţii tinde
spre infinit.
Aceeaşi procedură poate fi aplicată şi pentru varianţă şi vom obţine:
S2X = S2A + S2E
atunci când erorile tind spre zero
Acesta este o ecuaţie fundamentală care are o mare importanţă pentru că ne permite să
construim o definiţie simplă şi interesantă a fidelităţii unui test.
Un postulat important a acestei teorii este că scorurile adevărate şi scorurile eroare nu sunt în
corelaţie, adică rAE = 0.
Se postulează de asemenea că scorurile eroare la diverse măsurări nu sunt în corelaţie, adică
rE1E2 = 0.
Este suficient să utilizăm egalitatea fundamentală pentru definirea fidelităţii:
S2X=S2A + S2E
Dacă împărţim fiecare din aceste elemente prin aceeaşi cantitate S2X, adică varianţa rezultatelor
observate, vom obţine:
S2X S2A S2E S2 A S2E
= + adică 1= +
S2X S2X S2X S2X S2X
S2 A S2E
unde este proporţia varianţei observate care provine din varianţa adevărată, iar este
S2X S2X
proporţia varianţei observate care provine din varianţa eroare.
S2A
Precizia poate fi definită ca fiind un raport de varianţă: rXX = unde rXX 1 desemnează
1
2
SX
coeficientul de fidelitate, adică proporţia varianţei observate care provine din varianţa adevărată.
S 2E
Sau putem scrie formula sub forma rXX = 1 − , adică unu minus proporţia varianţei observate
1

S X2
care provine din varianţa eroare.
Relaţia care există între cele trei varianţe poate fi reprezentată sub forma:
(1) S2A S2E

(2) S2E S2A

39
CORNEL HAVÂRNEANU

Unde cazul (1) arată un raport de fidelitate mai mare decât cazul (2).
Coeficientul de fidelitate corespunde unui raport de varianţă şi poate lua valori între 0 şi 1, deci
numai valori pozitive. Ecuaţia următoare reflectă bine acest lucru:
S2E
rXX = 1 − 2
1

S X
Dacă varianţa eroare (S2E) este maximă, ea este egală cu varianţa observată a testului (S2X). În
acest caz, putem spune că varianţa observată este dată numai de erori şi coeficientul de fidelitate este
nul. Fidelitatea este certitudinea că un test măsoară scorurile adevărate, iar coeficientul de fidelitate dă
gradul de fidelitate.
Putem stabili un raport între scorurile adevărate şi scorurile observate. Dacă luăm în
consideraţie deviaţia scorurilor de la medie prin calcul vom obţine:
rXA = rXX 1
Corelaţia dintre scorurile adevărate şi scorurile observate este egală cu rădăcina pătrată a
coeficientului de fidelitate.

IV.2. DEFINIŢIA ERORII

Variabilitatea scorurilor observate SX, poate să fie cunoscută direct, existând procedee pentru a
estima coeficientul de fidelitate. Dacă notăm (SE, abaterea standard a erorilor şi cu S2E varianţa erorilor),
pe baza acestor parametri putem rezolva o problemă practică.
S2A
S2 E = S2 x - S2 A dar rXX 1
= 2 deci S 2 A = S 2 X rXX 1
S X
S2E = S2x -S2x rxx 1 = S2x (1 – rxx1) deci S E = S X 1 − rXX 1
SE este denumită eroarea standard de măsurare sau eroarea probabilă.
SE reprezintă eroarea aleatoare care nu poate fi eliminată din măsurare, dar trebuie luate
măsuri pentru a o reduce cât mai mult. Vom spune că măsurarea este fidelă sau precisă în măsura în
care există cât mai puţine erori posibile sau valoarea SE este cât mai mică posibil. Teoretic eroarea este
nulă.
Noţiunea de fidelitate presupune reproducerea scorurilor, adică posibilitatea de a obţine
aceleaşi rezultate de la aceiaşi subiecţi, în aceleaşi condiţii dar, în ocazii diferite, cu teste care măsoară
aceiaşi trăsătură.
Teoria clasică a testelor este o soluţie pe care o putem aplica la teoria erorilor de măsurare. Se
precizează că pentru un scor adevărat dat, mai multe măsurări echivalente ale aceleiaşi trăsături în
aceleaşi condiţii este un mijloc pentru o bună aproximare. Scorurile obţinute se distribuie simetric
deasupra şi dedesubtul scorului adevărat. Distribuţia erorilor aleatoare se repartizează normal şi se
aşteaptă o distribuţie a scorurilor observate în scorului adevărat. Să presupunem că dispersia erorilor
este aceiaşi pentru fiecare subiect iar abaterea standard a erorilor poate să fie cunoscută sau estimată.
Aceasta se numeşte eroarea standard de măsurare: S E = S X 1 − rXX 1

40
PSIHODIAGNOSTIC (I)

Problema măsurării constă în a determina această eroare, pe care trebuie să s-o eliminăm, cât
mai mult posibil, pentru a controla factorii care influenţează scorurile observate. De exemplu, dacă
SE=1,3, rxx1 =0,60 şi Sx = 2,00, atunci pe baza acestor date putem interpreta un rezultat observat în
funcţie de eroare şi putem determina limitele între care se poate situa rezultatul adevărat al subiecţilor
care au acelaşi rezultat observat.
Astfel:
X - 1SE < A < X + 1SE pentru o probabilitate de 0,68
X - 2SE < A < X + 2SE pentru o probabilitate de 0,95
X - 3SE < A < X + 3SE pentru o probabilitate de 0,99
Dacă X = 7 atunci avem:
7 - 1,3 < A < 7 + 1,3
7 - 2,6 < A < 7 + 2,6
7 - 3,9 < A < 7 + 3,9 adică 3,1 < A < 10,9
Aceasta înseamnă că pentru un rezultat observat 7, rezultatele adevărate pot fi situate între 3,1
şi 10,9, cu o probabilitate de 99,7%.

IV.3. SURSELE ERORILOR DE MĂSURARE

Pentru a putea diminua pe cât posibil erorile de măsurare este important să cunoaştem sursele
de eroare. O variabilă produce erori dacă nu este validă şi dacă se obţin rezultate inconstante atunci
când se fac mai multe măsurări. Există trei surse principale de eroare:
1. erori produse de testul însuşi;
2. erori legate de condiţiile de aplicare a testului;
3. erori legate de subiecţii care răspund la test
Prima categorie cuprinde factori controlabili ca: eşantionarea itemilor, dacă testul presupune
măsurarea unei trăsături foarte precise, ambiguitatea enunţurilor, imprecizia instrucţiunilor în legătură cu
maniera de răspuns, o limită de timp neadecvată. Toate acestea determină răspunsuri date la
întâmplare, ceea ce duce la o instabilitate a răspunsurilor şi o reducere a fidelităţii testului.
A doua categorie se referă la procedeele de prezentare a testului. Dacă aceste procedee sunt
standard riscurile de eroare sunt scăzute. Lipsa de experienţă a grupului testat, neobişnuinţa subiecţilor
de a răspunde la teste poate fi un factor de eroare. Lipsa de concentrare a subiecţilor, erorile de
redactare a instrucţiunilor şi deficienţele de cronometrare, sunt erori care fac parte din această
categorie.
Aceste două categorii conţin surse de eroare uşor de controlat, faţă de cele din a treia
categorie, unde sursele de eroare depind de subiecţi. Psihologii au evidenţiat multe surse de eroare de
acest tip. Aici le vom menţiona pe cele mai importante ca: motivaţia, obişnuinţa cu testarea, anxietatea,
diferenţele de învăţare şi variabile de natură fiziologică.
Există erori de măsurare dacă subiecţii examinaţi sunt motivaţi diferit. Dacă condiţiile de
aplicare a testului se modifică de la o aplicare la alta atunci trebuie să ne aşteptăm şi la o modificare a
rezultatelor. Testele de randament sunt afectate de aceste erori.
Se postulează că subiecţii au o experienţă echivalentă indiferent de procedeul utilizat şi
maniera de testare. Tot timpul, două situaţii indezirabile, care introduc erori de măsurare, pot să apară.
Pe de o parte, lipsa de experienţă a unor subiecţi, se materializează în incapacitatea acestora, mai

41
CORNEL HAVÂRNEANU

mare sau mai mică, de o obţine un randament ridicat, situaţie în care scorul nu reflectă gradul de
prezenţă a trăsăturii măsurate. Pe de altă parte, sunt persoane care au experienţă în rezolvarea testelor
şi obţin un randament ridicat, fapt care de asemenea nu este în concordanţă cu nivelul trăsăturii
măsurate. Aceste două situaţii determină erori de măsurare şi diminuează fidelitatea.
Multe persoane manifestă o oarecare nervozitate atunci când sunt testate. Există o marjă de
încredere, justificată sau nu, faţă de gradul prezenţei trăsăturii măsurate, care determină stări de
anxietate. Anxietatea afectează randamentul şi reduce punerea în valoare a posibilităţilor subiectului.
Un alt factor de eroare este legat de variabile fiziologice. Acest factor este inevitabil când
acestea sunt imprevizibile.
Problema erorilor de măsurare a fost prezentată anterior, dar este important să facem câteva
precizări suplimentare. Componentele "eroare" ale scorurilor observate la un subiect pot fi considerate
ca suma erorilor care provin din surse precise de eroare. Aceste surse de eroare sunt independente
unele de altele, între ele nu există nici o corelaţie. Acest aspect este un postulat.
Pentru fiecare sursă de eroare, se poate trasa curba erorilor mai multor subiecţi, în care
varianţa distribuţiei erorilor este formată din suma distribuţiilor provenite de la fiecare sursă de eroare.
Estimarea fidelităţii depinde de estimarea varianţei eroare, adică distribuţia erorilor (S2E). Metoda de
estimare a fidelităţii trebuie orientată spre estimarea diferitelor varianţe eroare (S2E), pentru că există
surse de eroare diferite care intervin de fiecare dată.
Pentru evaluarea unui coeficient de fidelitate este foarte important să cunoaştem metode pentru
a repera sursele de varianţă care pot interveni. Aceste surse pot fi următoarele:
‚ varianţa distribuţiei erorilor ca rezultat al unei schimbări care apare într-o situaţie sau alta, într-un
mediu sau altul (S2E);
‚ varianţa care decurge din subiectivitatea corectării (S2ES);
‚ varianţa datorată hazardului (S2EH), sau altor surse: memorie (S2EM), oboseală (S2EO)
Fidelitatea unui instrument de măsură se defineşte ca fiind corelaţia sau coeficientul de
concordanţă între două teste paralele sau două teste paralele la care eşantionul de itemi a fost extras
din aceeaşi populaţie de itemi. Indicele obţinut este un coeficient de corelaţie între măsurări care dau
acelaşi scor adevărat pentru fiecare subiect. Acest indice arată precizia cu care un item ne permită să
măsurăm o caracteristică. De asemenea, coeficientul de corelaţie la pătrat indică proporţia varianţei
între două măsurări.
S2A
rXX = r XA = 2
1 2
S X
Putem afirma, pe baza definiţiei fidelităţii, că acest coeficient indică proporţia din varianţa totală
care rezultă din diferenţele dintre scorurile adevărate. Din aceste diferenţe rezultă de fapt adevăratele
diferenţe dintre indivizi.
Acest coeficient este un indicator al inconstanţei erorilor, care are valoare minimă dacă testele
sunt într-adevăr paralele. El este denumit coeficient de precizie. Mulţi cercetători, printre care şi Lord şi
Novik (1968), au demonstrat că procedeele standard care servesc la estimarea coeficientului de
fidelitate şi la varianţa erorilor unui test presupun cel puţin două măsurări (scoruri) pentru fiecare subiect
şi că precizia estimării creşte o dată cu numărul acestor măsurări.
Varianţa erorii pentru un anumit subiect S2Esx presupune cel puţin două măsurări şi precizia
creşte o dată cu numărul observaţiilor asupra persoanei măsurate. Deci, deşi coeficientul de precizie nu
este nici foarte pertinent şi nici foarte practic, el constituie totuşi un indice al gradului de imprecizie care
poate fi atribuit viciilor de formă sau de procedură.

42
PSIHODIAGNOSTIC (I)

Dacă itemii testelor paralele sunt extraşi din aceeaşi populaţie de itemi, coeficientul de fidelitate
indică gradul de certitudine cu care poate fi măsurată o trăsătură, chiar dacă s-a folosit doar un eşantion
de itemi din populaţia respectivă. În acest fel, mai multe eşantioane aleatoare, cu acelaşi număr de
itemi, pot să constituie teste paralele şi permit să se obţină mai mulţi coeficienţi de corelaţie. Media lor
este cea mai bună estimare a coeficientului de corelaţie aşteptat pentru testele paralele cu aceeaşi
lungime, eşantionate aleator. Numărul de itemi şi gradul de omogenitate al populaţiei de itemi, adică
gradul în care măsoară aceeaşi variabilă, sunt doi factori care determină această medie.
Coeficientul care indică gradul legăturii între testele paralele, formate din eşantioane alese
aleator, este denumit coeficient de consistenţă internă. În practică testele nu satisfac exigenţele testelor
strict paralele, cu toate că în ansamblu ele măsoară acelaşi scor adevărat şi corelaţia între teste este
pozitivă. Coeficientul de fidelitate, cunoscut ca fiind corelaţia dintre teste paralele, este afectat de
varianţa proprie a fiecărui test. Cu toate că este vorba de varianţă adevărată, ea este considerată ca
eroare. Coeficientul de echivalenţă este coeficientul reprezentat de corelaţia între teste sau forme
paralele şi varianţa specifică are ca efect subestimarea adevăratului coeficient de fidelitate.

IV.4. METODE DE ESTIMARE A FIDELITĂŢII

IV.4.1. Metoda testelor paralele


Această metodă constă în calcularea corelaţiei între două forme ale aceluiaşi test format din
itemi diferiţi. Ea dă o aproximare a gradului de echivalenţă între teste atunci când le aplicăm aceluiaşi
grup de subiecţi la un interval scurt de timp.
Acest tip de coeficient este mai fiabil decât coeficientul de precizie deoarece el indică corelaţia
dintre două forme aproape paralele. Imprecizia de măsurare şi varianţa adevărată care decurge din
lipsa paralelismului dintre forme (varianţa adevărată specifică), sunt tratate ca erori şi tind să reducă
coeficientul de echivalenţă. Intervalul de timp dintre cele două aplicări ale testului fiind mic, putem
considera că se produce o scădere a fluctuaţiilor posibile între scorurile adevărate datorate celor două
aplicări, ceea ce permite să reducem S2AF (varianţa eroare datorată fluctuaţiilor scorurilor adevărate, în
diferite ocazii) şi în consecinţă S2E (varianţa eroare).

IV.4.2. Metoda test - retest


Metoda constă în a aplica acelaşi test de două ori aceluiaşi grup de subiecţi la un interval mai
mic sau mai mare de timp şi a calcula corelaţia dintre rezultatele obţinute.
Aplicarea acestei metode comportă mai multe dificultăţi. Efectul exerciţiului sau a memorării
poate influenţa subiecţii la a doua aplicare, astfel încât erorile înregistrate în cursul celor două prezentări
au tendinţa să fie în corelaţie. Mai mult, modificarea abilităţii subiecţilor contribuie de asemene la
eroare. Este deseori dificil de precizat dacă eroarea este efectul creşterii sau diminuării corelaţiei între
rezultate. După Gulliksen (1950), corelaţia va fi mai mare dacă intervalul de timp dintre cele două
prezentări este scurt şi oboseala intervine în mică măsură. În acest caz corelaţia obţinută este o
supraestimare a coeficientului de precizie. Dacă intervalul dintre prezentări este lung, memoria intervine
mai puţin, iar efectul este reducerea corelaţiei.
Dacă considerăm fluctuaţia scorurilor adevărate, eroare, fidelitatea este subestimată, iar dacă
efectul memoriei este considerat ca varianţă adevărată, fidelitatea este supraestimată. Varianţa atribuită
fluctuaţiei scorurilor adevărate creste o dată cu durata intervalului dintre cele două prezentări, iar efectul
memoriei scade. Intervalul ideal permite reducerea, pe cât posibil, a efectului combinat al celor doi
factori. A. Anastasi consideră că definirea exactă a varianţei eroare este dificilă. Un factor irelevant

43
CORNEL HAVÂRNEANU

pentru un scop diagnostic poate fi relevant pentru un altul şi invers. Deci, unul şi acelaşi factor poate fi
considerat, în funcţie de scopul testării, când varianţă adevărată când varianţă eroare. De exemplu,
dacă se urmăreşte starea afectivă actuală a unei persoane (dispoziţia emoţională, nivelul anxietăţii etc.),
atunci se preferă teste care relevă varianţa cotelor brute de la o testare la alta. Dacă se urmăreşte
prognoza şcolară sau profesională, atunci se preferă teste care surprind stabilitatea în timp a
conduitelor. În primul caz stabilitatea în timp a rezultatelor este contraindicată, în celălalt ea este de
dorit. Deci, sensul erorii depinde de scopul testării. Când condiţiile care determină cota subiectului sunt
mereu irelevante pentru scopul urmărit, ele intră în categoria varianţei eroare şi putem spune că
fidelitatea nu există sau este foarte mică.

IV.4.3. Metoda de analiză a varianţei interne


Metoda înjumătăţirii
Datorită limitelor pe care le posedă metodele prezentate anterior, şi a faptului că fidelitatea
este estimată printr-un coeficient de echivalenţă, metoda înjumătăţirii (split half) este utilă. În mod
obişnuit, procedeul constă în a ordona itemii în ordinea dificultăţii. Apoi vom împărţi testul în două,
echilibrând gradul de dificultate a fiecărei părţi pe baza indicelui pi (indicele de dificultate a itemului)
pentru fiecare item. În acest fel construim două teste de dificultate şi variabilitate echivalente în aşa fel
încât mediile şi abaterile standard să aibă valori cât mai apropiate posibil. Cele două teste vor măsura
aceleaşi scoruri adevărate deci, ele măsoară acelaşi conţinut şi există o corelaţie pozitivă perfectă între
scorurile adevărate.
Metoda presupune obţinerea unui scor de către fiecare subiect pentru fiecare jumătate şi
calcularea corelaţiei dintre aceste scoruri.
Metoda fidelităţii prin înjumătăţire nu poate fi utilizată pentru teste de viteză.

Coeficientul alfa şi coeficientul Kuder-Ricardson (KR20)


Este posibil să divizăm un test în atâtea părţi câţi itemi sunt. Putem postula că toţi itemii sunt
paraleli, deci au aceeaşi medie, aceeaşi varianţă şi intercorelaţii egale. Kuder şi Ricardson (1937) au
obţinut o ecuaţie care permite să obţinem coeficienţi de fidelitate. Cronbach a demonstrat că KR20 (caz
special al coeficientului α) este egal cu media tuturor coeficienţilor obţinuţi prin metoda înjumătăţirii,
calculaţi prin formula lui Rulon sau Guttman, pentru toate jumătăţile posibile ale unui test. KR20 este un
coeficient de omogenitate sau de consistenţă internă care dă o mai bună estimare a fidelităţii. El poate fi
considerat ca fiind corelaţia între teste paralele dacă eşantionarea itemilor s-a făcut prin hazard.
Varianţa adevărată este, deci dependentă de valoarea covarianţei dintre itemii unui test şi este
determinată de intercorelaţii şi varianţele itemilor. Aceasta ne permite să afirmăm că coeficientul KR20
(indicele de consistenţă internă) depinde de corelaţiile dintre itemi, deci de gradul în care măsoară
aceeaşi variabilă, cum s-ar spune de omogenitatea itemilor.

IV.5. UTILITATEA ŞI INTERPRETAREA COEFICIENTULUI DE FIDELITATE

Cum interpretăm un coeficient de fidelitate şi când poate fi considerat acceptabil? Răspunsul


la această întrebare nu este evident, dar există. Cum am văzut deja, pentru un test putem calcula mai
mulţi coeficienţi, diferiţi din punct de vedere a valorii calitative. Fiecare reprezintă estimarea valorii
inconstanţei rezultatelor şi nu o estimare a cauzei erorilor. Va trebui deci, să examinăm formele de
interpretare a unui coeficient de fidelitate.

44
PSIHODIAGNOSTIC (I)

Deşi există mai multe posibilităţi de calcul al coeficientului de fidelitate, în mod curent se
vorbeşte despre gradul de fidelitate pentru a desemna valoarea erorilor de măsurare cu testul respectiv.
Nunnally (1982) sugerează că cel puţin doi coeficienţi diferiţi trebuie utilizaţi pentru a cunoaşte
fidelitatea unui test: coeficientul α calculat pentru fiecare formă a testului şi corelaţia între forme
paralele. Alţi autori recomandă calcularea coeficientului de echivalenţă - stabilitate. Este important ca
cercetătorul să ţină seama de necesităţi şi de context. De exemplu, pentru o corectare subiectivă
efectuată de mai mulţi corectori, corelaţia mediei dintre scorurile celor două forme ale testului este un
bun indice de fidelitate. Metoda prin înjumătăţire poate fi folosită dacă nu există o formă paralelă a
testului.
În toate cazurile va fi folosită metoda care duce la o estimare cât mai prudentă şi verosimilă.
Există patru forme de interpretare a unui coeficient de fidelitate:
- ca o corelaţie dintre scorurile obţinute şi scorurile adevărate;
- ca un standard de comparaţie a preciziei unui test cu precizia altor teste de aceeaşi natură;
- ca procent al subiecţilor care-şi schimbă rangul sau poziţia;
- ca un indice al gradului de eroare între scorurile individuale.

Corelaţia dintre scorurile obţinute şi scorurile adevărate


Coeficientul de fidelitate este un raport de varianţă, prin care se poate stabili cât din proporţia
de varianţa totală aparţine varianţei adevărate. De exemplu, dacă rxx1 = 0.90, putem spune că 90% din
variabilitatea scorurilor observate decurge din varianţa adevărată şi 10% din varianţa eroare. Evident că
rxx1 = 0, presupune că variabilitatea este datorată în totalitate erorilor.
De asemenea, un coeficient de fidelitate poate fi interpretat ca fiind proporţia din varianţa
observată care provine din diferenţele dintre scorurile adevărate. Mai precis, el indică gradul erori de
măsurare obţinut prin administrarea unei forme a unui test la un eşantion particular de subiecţi în
condiţii bine precizate.

Un standard de comparaţie a preciziei unui test cu precizia altor teste de aceeaşi natură
O valoare foarte ridicată de 0,90 sau mai mare, observată la un test standard, care serveşte la
măsurarea randamentului, aptitudinilor sau abilităţilor, poate servi drept criteriu de comparaţie pentru aţi
coeficienţi. Pentru testele de personalitate, norma criteriu se situează la 0,80.

Schimbarea rangului subiecţilor


Dacă precizia este perfectă, fiecare subiect primeşte acelaşi rang la fiecare prezentare a
testului. Thorndike şi Hagen (1977) au prezentat tabelele de schimbare a rangurilor pentru diversele
valori ale coeficientului de fidelitate. Rangurile pe care le au doi subiecţi se schimbă în funcţie de
valoarea coeficientului de fidelitate. De exemplu, dacă scorurile a doi subiecţi sunt plasate în centilul 75
respectiv 50, aceste se inversează dacă precizia testului are valori diferite. Dacă rxx1 = 0.60 sunt 33%
şanse ca doi subiecţi plasaţi în centilele 75 şi 50 să-şi schimbe poziţia şi numai 2% şanse de schimbare
a poziţiei dacă rxx1 = 0.90.
Schimbarea rangului dintre subiecţi nu depinde numai de precizia testului ci si de numărul
claselor. Cu cât clasele sunt mai mici cu atât există mai multe şanse de schimbare.

Gradul de eroare între scorurile individuale


Gradul de eroare este invers proporţional cu gradul de fidelitate a unui test. Problema este de a
determina pentru fiecare subiect intervalul în care se află scorul adevărat.

45
CORNEL HAVÂRNEANU

De exemplu, presupunem o medie Xmed = 60, o abatere standard Sxx = 5 şi o fidelitate a testului
rxx 1 = 0.84. În acest caz eroarea de măsurare este:
S E = S X 1 − rXX 1 = 5 1 − 0,84 = 2
Pentru un scor X = 57 şi un grad de confidenţă de 0,95 vom obţine:
X - ZSE < A < X + ZSE
57 - (1,96 x 2) < A < 57 + (1,96 x 2)
53,08 < A< 60,92
unde Z este scorul standard luat de valorile care determină probabilităţi exacte pe o curbă normală, iar
A = scor adevărat.
Există deci, 95 % şanse ca un scor observat de 57 să corespundă unui scor adevărat situat
intre 53 şi 61. Eroarea de măsurare care este un indice al variabilităţii scorurilor observate faţă de
scorurile adevărate constituie o estimare a gradului atenuare a scorurilor aşteptate la o eventuală nouă
prezentare a testului. Cu cât eroarea de măsurate este mai mare cu atât intervalul în care se plasează
scorurile adevărate este mai mare.

ÎN CONCLUZIE:
1. Coeficientul de fidelitate teoretic se situează la 1,00, iar practic trebuie să fie cât mai
ridicat posibil.
2. Fidelitatea unui test este un concept pur teoretic pentru că un coeficient de precizie se
aplică exclusiv unui test, unui eşantion de teste menţinând constant testul şi metoda de calcul.
3. Dacă comparăm gradul de fidelitate a mai multor teste, nu putem spune că un test este mai precis
decât altul decât dacă unul dintre ele are un coeficient de precizie foarte ridicat decât alte teste care
au fost prezentate de mai multe ori.

46
PSIHODIAGNOSTIC (I)

V. VALIDITATEA TESTELOR

V.1. DEFINIŢIE ŞI GENERALITĂŢI

Validitatea, care este determinată în funcţie de gradul de varianţă adevărată al variabilei


măsurate, poate fi definită ca fiind:
• gradul în care un test măsoară o trăsătură, un construct sau un factor;
• relaţia dintre scorurile obţinute la test şi o măsurare a unui criteriu exterior.
După Legendre (1993), validitatea este "capacitatea unui instrument de a măsura realmente
ceea ce şi-a propus să măsoare după utilizarea acestuia". Conceptul de validitate este un termen
generic care se referă la următoarele probleme:
• Tipul de test folosit este potrivit utilizării care i-a fost destinată?
• Care sunt trăsăturile măsurate de test?
• În prezent testul măsoară ceea ce el trebuie să măsoare?
• Informaţiile furnizate de test sunt utile pentru a lua decizii?
• Ce interpretări putem face pe baza scorurilor obţinute la test?
• Ce predicţii putem face pe baza acestor scoruri?
• Care este gradul de varianţă care rezultă din variabila măsurată de test?
Validitatea este tot timpul legată de o situaţie particulară ceea ce înseamnă că în alte condiţii,
pe alte eşantioane sau metode de analiză vom obţine rezultate diferite. Validitatea nu poate fi extinsă la
ansamblul situaţiilor. A spune că un test este mai valid decât altul nu are sens decât dacă testul se
dovedeşte a fi valid într-o foarte mare varietate de situaţii sau pentru un foarte mare număr de scopuri
de testare.

V.2. DISTINCŢIA DINTRE FIDELITATE ŞI VALIDITATE

Fidelitatea se referă la precizia cu care un test măsoară anumite caracteristici în timp ce


validitatea vizează calitatea măsurării. Am definit fidelitatea ca fiind un raport de varianţă şi în aceeaşi
manieră vom defini validitatea ca fiind proporţia de varianţă adevărată care este pertinentă scopurilor de
utilizare a unui test. După cum s-a precizat deja validitatea vizează două aspecte: unul se referă la
calitatea cu care un test măsoară o trăsătură ipotetică sau un construct, iar al doilea se referă la relaţia
dintre scorurile obţinute la un test şi o măsură criteriu.
Definiţia validităţii poate fi exprimată prin ecuaţia: S2A = S2p + S2n
unde: S2p = varianţa pertinentă; S2n = varianţa non pertinentă dar valabilă
Deci: S2X = S2p + S2n + S2E

47
CORNEL HAVÂRNEANU

Varianţa totală a unui test este formată din varianţa validă, varianţa non pertinentă dar şi din
varianţa eroare. Dacă varianţa eroare scade, deci fidelitatea creşte (S2A / S2X), varianţa validă potenţială
creşte, dar această varianţă poate fi pertinentă sau nu pentru o situaţie dată. De asemenea, o mică
varianţă eroare nu garantează o validitate mare şi în acelaşi timp o fidelitate mare este o condiţie
necesară dar nu suficientă pentru o validitate mare pentru un test dat într-o situaţie dată.
Studiul validităţii vizează erorile sistematice, cel al fidelităţii erorile aleatoare.
Legătura dintre cele două concepte evidenţiază faptul că un coeficient de validitate rXY nu poate
depăşi valoarea rădăcinii pătrate a coeficientului de fidelitate rXX1, ceea ce înseamnă că validitatea este
tot timpul limitată de fidelitatea unui test. Următoarele situaţii demonstrează acest fapt:
1. O fidelitate mare şi o validitate mare
S2p S2n S2E

2. O fidelitate mare şi o validitate slabă


S2p S2n S2E

3. O fidelitate slabă şi o validitate relativ ridicată


S2p S2n S2E

4. O fidelitate slabă şi o validitate slabă:

S2p S2n S2E

unde: S2p = varianţa pertinentă


S2n = varianţa non pertinentă
S2E = varianţa eroare
S2A = S2p + S2n
Deci fidelitatea este o condiţie necesară dar nu suficientă, deoarece validitatea trebuie să fie
prezentă. Este important de subliniat că un test valid este în mod necesar şi fidel, dar un test fidel nu
este în mod necesar şi valid. O varianţă a erorii scăzută nu garantează o creştere a validităţii deoarece
varianţa adevărată poate fi în mare parte non pertinentă.

V.3. TIPURI DE VALIDITATE

Există mai multe tipuri de validitate în funcţie de scopul testării sau examinării: validitate
predictivă, validitate de conţinut, validitate teoretică. În literatura actuală se vorbeşte şi de validitate
aparentă (face validity), care se referă direct la conţinutul şi structura testului. Dacă un test are validitate
aparentă atunci există o corespondenţă logică evidentă între itemii testului şi ceea ce testul îşi propune
să măsoare.

48
PSIHODIAGNOSTIC (I)

Validitatea de conţinut
Dacă dorim să cunoaştem randamentul unui individ în universul situaţiilor în care testul este un
eşantion, conţinutul testului constituie aspectul primordial care trebui luat în seamă, şi atunci testul
devine universul în care itemii sunt eşantioane de situaţii. De asemenea, precizia răspunsurilor şi
procedeul de rezolvare a itemilor testului prezintă un mare interes. Evaluarea validităţii de conţinut se
face în funcţie de gradul de pertinenţă a eşantionului de itemi. Dar, neexistând un indice cantitativ de
pertinenţă a eşantionului, evaluarea se face prin judecăţi sau prin procese raţionale.

Validitatea de teoretică
Testele psihologice permit studierea caracteristicilor umane. În acest caz trebuie să cunoaştem
trăsătura pe care testul o măsoară. Dacă vom cunoaşte care este trăsătura măsurată, o vom putea
utiliza pentru studiul diferenţelor individuale şi pentru elaborarea teoriilor organizării trăsăturilor.
Pentru acest tip de validitate, trăsătura măsurată este aspectul esenţial şi estimarea validităţii
se face prin reliefarea prezenţei relative a trăsăturii. Reliefarea acestor prezenţe poate fi făcută în mai
multe feluri folosind diverse surse, apelându-se la studii de validitate predictivă şi de conţinut. Ca şi în
ca validităţii de conţinut evaluarea se face prin raţionament.

Validitatea predictivă
Putem folosi testele pentru a face predicţii relative la randamentul subiecţilor la un criteriu.
Putem folosi drept criteriu media şcolară sau randamentul în muncă. Criteriul este un indicele de
predicţie dat de validitatea predictivă a unui test.
Un aspect important a acestui tip de validitate este criteriul, deoarece scorul obţinut la test este
util în măsura în care poate prezice un criteriu, conţinutul fiind în acest caz un aspect secundar.

V.4. VALIDITATEA PREDICTIVĂ

Majoritatea testelor sunt folosite pentru predicţia randamentului. Testele de aptitudini şcolare
servesc pentru predicţia şanselor de reuşită şcolară, inventarele de interese permit cunoaşterea
câmpurilor de interese profesionale, inventarele de personalitate permit evidenţierea unor dezechilibre
psihice care pot determina anumite predispoziţii, testele de randament sunt utilizate pentru selecţie şi
plasare profesională, testele de aptitudini şi abilităţi profesionale permit predicţia productivităţii şi
stabilităţii în muncă.
În toate cazurile, variabila care face obiectul predicţiei este denumită criteriu. Criteriul este
măsurarea randamentului într-un mod diferit de cel desemnat de variabila predictivă. Modelul care
permite măsurarea acestui tip de validitate constă în stabilirea relaţiei între scorurile obţinute la test şi
cele obţinute la criteriu.
Expresia "validitate predictivă" se referă la faptul că folosind testul putem realiza predicţia
criteriului. Expresia "validitate empirică" se referă la faptul că determinarea validităţii predictive
presupune totdeauna colectarea unor date empirice din care decurge relaţia dintre scorurile obţinute la
test şi cele obţinute la criteriu.

49
CORNEL HAVÂRNEANU

Validitatea predictivă şi luarea deciziilor


Predicţia vizează luarea unei decizii şi pentru aceasta validitatea predictivă este foarte utilă.
Atunci când dorim să luăm o decizie pentru selecţie, clasament sau plasament vom folosi teste care ne
oferă scoruri individuale pe baza cărora decidem. În acelaşi timp putem folosi şi alte urse de informaţii.
Este însă dificil să stabilim importanţa relativă a scorurilor la teste comparativ cu informaţiile care provin
din alte surse. Mulţi autori, printre care şi Brown (1970), susţin că măsurarea validităţii predictive
măreşte şansele ca o decizie luată pe baza scorurilor unui test să fie exactă, faţă de exactitatea unei
decizii luată pe baza unor alte surse de informaţii.
Validitatea unui test este judecată în funcţie de corelaţia sa cu criteriul şi de gradul în care
scorurile criteriu nu reprezintă corect scopul propus (slăbiciunea criteriului). De exemplu, să considerăm
că pentru reuşita şcolară luăm media cumulată drept criteriu. Dacă testul ne permite predicţia, cu un
anumit grad de precizie, a mediilor cumulate, este posibil ca membrii consiliului profesoral să nu fie în
măsură să aleagă tipul de student care va fi admis. În consecinţă, folosirea testului a oferit posibilitatea
de a fi admişi, într-o proporţie crescută, numai studenţii care vor obţine medii ridicate. Studenţii aleşi în
acest fel posedă însă şi alte caracteristici care sunt legate de capacitatea de a obţine note ridicate. În
concluzie, problema constă în avantajul de a lua decizii legate de grupuri decât de indivizi. Validitatea
este tot timpul estimată pe baza datelor grupului, şi logic enunţurile referitoare la validitatea unui test ne
vor trimite înapoi la validitatea unui ansamblu de scoruri şi nu la scorul unui subiect.

Criteriile
În toate studiile de validitate predictivă criteriul este un element foarte important. Interesul
pentru un test predictor este tot timpul în funcţie de relaţia sa cu criteriul. Dacă un test are menirea să
măsoare un randament, va fi stabilit un standard de reuşită. Acest standard este un criteriu. În educaţie
se foloseşte frecvent media cumulată drept criteriu. Asta nu înseamnă că nu pot fi folosite şi alte criterii
ca: aptitudinea de integrare, de analiză de evaluare, cultura generală, capacitatea de adaptare,
manifestarea unei atitudini constructive în situaţii dificile. Este simplist să apelăm la un singur criteriu.
Recurgerea la mai multe criterii ridică o problemă interesantă. Dacă criteriile sunt puternic
interrelaţionate combinarea unora dintre ele nu aduce un aport prea mare decât dacă s-ar folosi unul
singur, deoarece fiecare măsoară acelaşi lucru. Din potrivă, dacă criteriile sunt slab interrelaţionate nu
este recomandat să le combinăm, deoarece ele măsoară aspecte diferite.
Combinarea criteriilor ridică şi o altă problemă cunoscută sub numele de "dimensionalitate
statistică". Ghiselli (1964), evidenţiază două probleme. Prima constă în faptul că un criteriu, considerat
că fiind fundamental poate deveni impropriu în timp. Ceea ce este azi considerat ca o măsură valabilă a
reuşitei poate să fie contestată în viitor. Aceasta este problema "dimensionalităţii dinamice". A doua
problemă este cea a "dimensionalităţii individului", şi este legată de diferenţele individuale. Doi indivizi
pot face aceeaşi muncă procedând în maniere total diferite dar amândoi fiind cotaţi la fel de bine.
Specialiştii sunt astfel confruntaţi cu dilema: acceptăm două metode de muncă la fel de valide sau una
este privilegiată în detrimentul alteia.

50
PSIHODIAGNOSTIC (I)

Caracteristicile unei măsuri - criteriu


Astin (1964), face distincţia între criteriu şi măsura-criteriu. El consideră criteriul un concept
general legat de randament Acest concept trebuie să fie exprimat în termeni operaţionali, conform unei
măsuri care apoi permite determinarea validităţi unui test. De exemplu reuşita la universitate este un
criteriu conceptual, iar media cumulată este o măsură - criteriu. Măsura - criteriu are mai multe
caracteristici:
‚ caracteristică foarte importantă a măsurii - criteriu este pertinenţa sa, adică validitatea sa. Ea
trebuie să reflecte şi să măsoare aspectele fundamentale ale criteriului conceptual. Media cumulată
este o măsură - criteriu validă dacă reflectă şi măsoară corect aspectele importante ale reuşitei la
universitate. Evaluarea pertinenţei unei măsuri - criteriu se face prin procedee raţionale şi calitative.
Nu există un indice cantitativ eficace pentru exprimarea gradului de pertinenţă a unei măsuri -
criteriu.
‚ a doua caracteristică a unei măsuri - criteriu este fidelitatea sau constanţa măsurărilor. O măsură
criteriu trebuie să fie constantă în timp indiferent de circumstanţe. O măsură - criteriu inconstantă
nu poate fi pusă în relaţie cu alta, iar indicele relaţiei cu predictorul nu va semnifica nimic, indiferent
de gradul acestuia. De exemplu, dacă folosim o măsură inconstantă pentru determinarea
productivităţii unui muncitor, atunci în cazul unei zile bune productivitatea va fi mare şi vom
supraestima valoarea sa, iar într-o zi proastă riscăm să subestimăm valoarea sa. Alegerea unei
măsuri - criteriu este supusă la cel puţin două constrângeri:
¤ factorii care induc o eroare de măsurare trebuie controlaţi pentru că ei influenţează măsurile -
criteriu în acelaşi fel ca şi predictorii;
¤ dacă controlul acestor factori nu ne permite să obţinem o măsură stabilă este posibil să creştem
stabilitatea alegând un număr mare de măsuri - criteriu sau alegând eşantioane în mai multe
ocazii.
‚ A treia caracteristică a unei măsuri criteriu este absenţa contaminării. Măsurarea criteriului se va
efectua în condiţiile în care factorii non pertinenţi nu pot influenţa scorurile. Contaminarea poate să
apară uşor dacă măsura criteriu se prezintă sub forma unor scale de evaluare care sunt vulnerabile
datorită efectului de halo sau a tendinţei de indulgenţă. Instrucţiuni foarte precise de forma unei
descrieri detaliate a caracteristicilor de evaluat permite diminuarea riscului de contaminare.
Thorndike (1971) atrage atenţia asupra unui factor major de contaminare. Este cazul în care
scorul criteriu al unui subiect este influenţat de cunoaşterea de către evaluator a scorului la predictor a
subiectului respectiv. Thorndike aminteşte şi de efectul acestui factor asupra randamentului la criteriu al
subiectului, efect denumit "predicţie pentru sine". Mai mult, el semnalează două tipuri de contaminare
între predictor şi criteriu.
De exemplu, dacă dorim să cunoaştem dacă un test de lectură permite predicţia scorurilor la
un test de atitudine faţă de matematică, măsura criteriu va fi scorul la destul de atitudine faţă de
matematică. Dacă evaluatorul care atribuie aceste cote cunoaşte scorurile subiecţilor la testul de lectură
(predictor), evaluările sale pot fi influenţate. Riscurile de contaminare sunt probabil mai ridicate dacă un
elev a obţinut un scor ridicat la testul de lectură şi când el pare să aibă o atitudine negativă faţă de
matematică. Subliniem că problema riscă să apară dacă un subiect obţine un scor mic la testul de
lectură dar manifestă o atitudine favorabilă faţă de matematică. Soluţia, pentru evitarea acestei situaţii
este de a evita ca evaluatorul să cunoască scorurile subiecţilor la variabila predictor.
Menţionăm că cele mai bune măsuri - criteriu sunt cele care prezintă cât mai multe avantaje
practice, care sunt simplu de folosit, care sunt disponibile şi mai puţin costisitoare.

51
CORNEL HAVÂRNEANU

Există mai multe categorii de măsuri - criteriu:


Prima categorie constă în măsurarea directă a producţiei sau a randamentului: volumul de
vânzări, numărul de clienţi pe oră sau pe zi, numărul de accidente pe lună sau pe an, numărul de erori
pe unitate, media cumulată etc.
A doua categorie este formată din randamentul la un test, cum ar fi rezultatul la un examen sau
la testele administrate de serviciile de personal din întreprinderi: scalele de evaluare fac parte din
această categorie. Subliniem că distincţia dintre cele două categorii nu este exclusivistă. De exemplu,
media cumulată poate aparţine uneia sau alteia din cele două categorii, în funcţie de felul în care ea a
fost obţinută.
În cea de-a treia categorie, măsura - criteriu aparţine unui grup. Testele de personalitate şi în
particular chestionarele de interese sunt considerate valide dacă permit o bună clasificare a indivizilor în
grupuri bine precizate. Testele de aptitudini sunt valide dacă permit să distingem indivizii care vor reuşi
faţă de cei care vor eşua într-o activitate sau într-un program de studii dat.
A patra categorie este formată din măsurile - criteriu de natură statistică, cum ar fi coeficienţii de
saturaţie, coeficienţii de discriminare sau cei de consistenţă internă.

ÎN CONCLUZIE
Un test nu poate fi mai bun decât criteriile folosite pentru stabilirea validităţii, pentru că
toate slăbiciunile criteriilor se răsfrâng asupra testului şi îi limitează utilitatea. Dificultatea nu
constă în alegerea unei măsuri - criteriu pertinente, ci în faptul de a nu alege doar una.
Pentru ca procesul de validare să fie valabil este necesar să recurgem la mai multe măsuri criteriu.

V.5. METODE PENTRU DETERMINAREA VALIDITĂŢII PREDICTIVE

Există patru metode principale pentru determinarea validităţii predictive, fiecare având avantaje
diferite. Toate permit calculul unui indice cantitativ a relaţiei dintre predictor şi criteriu. Aceste metode sunt:
1. indicele de eficacitate
2. scorurile de separare a categoriilor
3. indicele de separare a grupurilor
4. indicele de utilitate (coeficientul de validitate)

Coeficientul de validitate
Aceasta este folosit pentru a determina validitatea predictivă. Metoda constă în a calcula corelaţia dintre
scorurile la testul predictor şi scorurile la măsura - criteriu. Calculul presupune parcurgerea a cinci etape
distincte:
1. alegerea unui eşantion de subiecţi;
2. aplicarea testului predictor acestor subiecţi;
3. realizarea unor prelucrări specificate dacă este cazul;
4. Colectarea datelor la criteriu;
5. calcularea corelaţiei între scorurile obţinute la predictor şi la criteriu;
Coeficientul de corelaţie astfel obţinut este un coeficient de validitate. El este notat cu rxy, unde r
este coeficientul de corelaţie, X predictorul şi Y criteriul. Este evident că toţi factorii care influenţează
coeficientul de corelaţie pot influenţa coeficientul de validitate şi că datele trebuie să respecte
postulatele necesare calculării coeficientului de corelaţie. Doi factori, care sunt de fapt postulate
necesită o atenţie deosebită.

52
PSIHODIAGNOSTIC (I)

În primul rând ştiindu-se că coeficientul de corelaţie Pearson este cel mai des folosit,
postulatul de liniaritate dintre două variabile este primordial. Dacă mai multe variabile sunt considerate
ca fiind în relaţie liniară este necesar să verificăm această legătură înainte de a calcula coeficientul de
corelaţie. Pentru a realiza această verificare vom trasa graficul produs de cele două variabile, fiecare
axă reprezentând una din cele două variabile. Dacă relaţia nu este liniară atunci vom transforma
scorurile într-o scală sau vom folosi o altă metodă de corelaţie pentru a estima coeficientul de validitate.
În al doilea rând vom lua în consideraţie întinderea diferenţelor individuale. Se ştie că o mică
variabilitate a scorurilor limitează valoarea pe care o poate avea un coeficient de corelaţie. Această este
o problemă majoră pentru studiul validităţii, când folosim mai multe grupe de subiecţi. Este preferabil să
folosim grupe eterogene, care prezintă o întindere mai mare a diferenţelor individuale.

Interpretarea coeficientului de validitate


Există mai multe forme de interpretare a unui coeficient de validitate. O primă formă constă
în a compara diferiţi coeficienţi şi de a alege testul care prezintă coeficientul cel mai ridicat pentru o
situaţie dată. O altă formă de interpretare este transformarea coeficientului de validitate în procente de
varianţă. Prin ridicarea la pătrat a coeficientului de validitate obţinem proporţia din varianţă explicată prin
acesta. Astfel, dacă rXY = 0,60 atunci r2XY = 0,36 sau o proporţie de varianţă egală cu 0,36. Putem
spune că 36% din varianţă este împărţită între două variabile, sau că 36% din varianţa criteriului este
datorată variaţiei scorurilor testului predictor. Observăm că coeficientul de validitate trebuie să fie de
circa 0,7071 pentru ca jumătate din varianţa criteriului să fie explicată prin varianţa scorurilor la
predictor. În majoritatea studiilor găsim raportări inferioare valorii 0,7071.
Wiggins (1974) prezintă un exemplu în care studiază relaţia posibilă între scorurile la un test
care măsoară dominanţa şi percepţia subiectului ca un leader, şi raportează un coeficient de validitate
de 0,61. Aceasta înseamnă că indivizii care au obţinut un scor ridicat la testul de dominanţă sunt
percepuţi ca lideri faţă de cei care prezintă scoruri mici. Autorul estimează că circa 37% din varianţa
variabilei leader poate fi prezisă pe baza scorurilor la testul de dominanţă. Mai mult, el subliniază că de
fapt există trei interpretări posibile prin utilizarea unor diagrame după metoda lui Cattell (1957).
a b c

leader dominanţă

dominanţă leader dominanţă leader


Fig. 2
În fig.2a toate elementele dominanţei sunt conţinute în leader, în b toate elementele leader sunt
conţinute în dominanţă, în c, 61% din elementele leader sunt comune cu cele ale dominanţei şi
viceversa şi sunt dimensiunile unei trăsături-sursă numită extraversiune.
În realitate, este mai plauzibil să cauţi predicţia posibilităţii de a fi perceput ca un leader pe baza
scorurilor obţinute la un test de dominanţă. Aceasta ne face să presupunem ca în fig. a, că dominanţa
este o componentă majoră a leaderului acoperind 37% din varianţa explicată. Conform diagramei b

53
CORNEL HAVÂRNEANU

presupunerea este inversată. Diagrama sugerează mai degrabă că leaderul va fi o componentă majoră
a dominanţei. Diagrama c lasă să se presupună că chiar dacă 61% dintre elementele ambelor variabile
sunt comune, influenţa unei a treia variabile, comună celorlalte două intră în joc. Wiggins (1974),
sugerează o interpretare conform căreia dominanţa şi leaderul ar fi manifestări ale unei caracteristici
mult mai profunde, ca extraversiunea. Acest exemplu ilustrează complexitatea interpretării unei relaţii
între un predictor şi un criteriu.
O a treia formă de interpretare a unui coeficient de validitate ţine seama de caracteristicile
grupului care a fost ales, dacă testul este folosit pentru realizarea unei selecţii (Brogden, 1946). Autorul
demonstrează că pe baza postulatelor, coeficientul rxy poate fi interpretat direct ca fiind o măsură a
eficacităţii predictive, ca un raport între media scorurilor obţinute la măsura - criteriu a grupului
selecţionat şi cele ale tuturor grupelor de candidaţi neselecţionaţi. De exemplu, să presupunem că 200
de candidaţi se prezintă pentru admiterea la un program de studii la care nu pot fi admişi decât 75, care
să fie cei mai buni. Cel mai bun procedeu este de a accepta toţi candidaţii, pentru un timp şi apoi să
procedăm la colectarea datelor - criteriu, pentru a selecta în final acei candidaţi care scorurile - criteriu
cele mai ridicate. Media scorurilor - criteriu a grupului selectat va fi mai ridicată decât toate mediile pe
care le putem calcula pornind de la fiecare combinaţie de 75 de candidaţi din cei 200 care s-au
prezentat. Acest procedeu este bun din punct de vedere teoretic, dar în practică este imposibil de
aplicat.
Este rezonabil să aplicăm un test pentru selecţie şi să alegem 75 de candidaţi care au obţinut
scoruri ridicate la test. Coeficientul de validitate, după cum sugerează Brogden, este egal cu raportul
între randamentul mediu la criteriu, obţinut de grupul de 75 de candidaţi admişi pe baza testului
predictor şi randamentul mediu obţinut de 75 de candidaţi care ar fi fost aleşi dacă făceam selecţia pe
baza scorurilor - criteriu. Presupunem că obţinem un raport rxy = 0,80, ceea ce semnifică că grupul ales
pe baza testului predictor va avea un scor criteriu mediu egal cu patru cincimi din cel al grupului selectat
pe baza scorurilor criteriu. Metoda porneşte de la presupunerea că toţi candidaţii obţin un scor criteriu,
ceea ce în practică este imposibil.
O altă metodă de interpretare a coeficientului de validitate constă în predicţia erorilor. Aceasta
presupune utilizarea ecuaţiei de regresie.

Exemplu de calcul al coeficientului de validitate


Să presupunem că prezentăm unui grup de 250 subiecţi un test, sub forma unei scala de
măsurare a nivelului de cultură generală. Scorurile la test sunt prezentate sub formă de note standard
STEN (standard ten) de la 1 la 10. Apoi, după un timp li se prezintă o scală de evaluare a atitudinii
(gradul de satisfacţie) faţă de introducerea unei noi specialităţi în programul de studiu. Este a scală cu 7
trepte în care 1 înseamnă o atitudine foarte defavorabilă iar 7 o atitudine foarte favorabilă. Scorurile
obţinute la această scală constituie măsuri criteriu în acest exemplu.
Rezultatele celor două variabile sunt prezentate sub formă de frecvenţe în tabelul următor:

54
PSIHODIAGNOSTIC (I)

Măsura-criteriu Scorurile la testul predictor (X)


(Y) 1 2 3 4 5 6 7 8 9 10 Σ
7 4 4
6 2 4 2 3 1 12
5 2 2 4 8 19 5 5 45
4 6 4 12 21 13 9 5 7 1 74
3 9 12 10 4 2 3 1 1 42
2 7 18 11 6 6 2 1 51
1 4 3 5 4 2 18
Σ 26 37 40 37 27 24 30 15 9 5 250

Rezumatul statistic:
ΣX = 1108 ΣX2 = 6324 Xmed = 4,432 SX = 2,3776
ΣY = 883 ΣY2 = 3601 Ymed = 3,532 SY = 1,3888
ΣXY = 4460
Este suficient să calculăm coeficientul de corelaţie între X (scorurile obţinute la testul de cultură
generală) şi Y (scorurile obţinute la scala de atitudine) pentru obţinerea coeficientului de validitate.
N ∑ XY − ∑ X ∑ Y 1115000 − 978364 136636
rXY = = = = 0,662
N∑ X2 − (∑ x ) 2
N ∑Y2 − (∑ Y ) 2 (594,4207) × (347,2189) 206394,13
Putem interpreta acest coeficient în proporţii sau în procente de varianţă explicată
(0,6622 = 0,438). Putem spune că circa 44% din varianţa criteriului poate fi prezisă sau explicată prin
varianţa scorurilor obţinute la testul predictor. Acest procent de varianţă explicată este relativ ridicat
comparativ cu ceea ce întâlnim în general în studiile de validitate. Nu este simplu să stabilim cauzele
rezultatelor foarte ridicate în studiile de acest tip. Totdeauna, putem afirma că acest coeficient a fost
obţinut pe un grup la care nu s-a făcut o preselecţie, ceea ce presupune ca am folosit toţi subiecţii care
au fost disponibili. Particularitatea acestora este aceea că permit o întindere maximă a scorurilor la
testul predictor, ceea ce are ca efect creşterea valorii coeficientului de corelaţie.

V.6. VALIDITATE DE CONŢINUT

Dacă un profesor doreşte să evalueze cunoştinţele studenţilor la o materie el va construi un test


în care întrebările să cuprindă un eşantion reprezentativ a întregii materii. El se confruntă cu problema
validităţii de conţinut, care se referă la gradul de reprezentativitate a eşantionului de întrebări. Problema
constă într-o analiză raţională a conţinutului testului şi se realizează prin intermediul judecăţilor de
valoare. Decizia este subiectivă şi nu există un indicator numeric.
Specialiştii consideră că există două tipuri de validitate de conţinut: validitate aparentă şi
validitate logică.

Validitatea aparentă se realizează prin analiza testului, efectuată de un expert care


concluzionează dacă acesta măsoară adevărate trăsătură pe care şi-a propus s-o măsoare. Acest tip
de validitate nu este cea mai importantă deoarece putem folosi alt tip de validitate mai pertinent.

55
CORNEL HAVÂRNEANU

Validitatea logică în care eşantionul de itemi este stabilit într-o manieră mult mai concretă
decât în cazul validităţii aparente. În acest caz se prezintă un tabel cu specificaţiile care conţin o
definiţie clară a aspectelor măsurate, obiectivele precise şi alegerea cât mai logică a itemilor pentru o
divizare coerentă a domeniului vizat.
Tabelul care urmează prezintă un exemplu cu specificaţiile pentru măsurarea cunoştinţelor
acumulate în legătură cu proprietăţile fizice ale pădurii:
OBIECTIVE PARTICULARE
Cunoştinţe Cunoştinţe
Cunoştinţe
SUBIECT despre despre
specifice Aplicaţii Total
categorii metode
Structura arborilor 10% 0 0 0 10%
Transformarea arborilor 10% 0 20% 0 30%
Caracteristicile esenţelor 20% 15% 0 10% 45%
Calculul cantităţilor 0 10% 0 5% 15%
Total 40% 25% 20% 15% 100%

V.7. VALIDITATEA TEORETICĂ


Începând cu anul 1955, Cronbach şi Meehl s-au ocupat de studierea validităţii teoretice propusă
de Asociaţie Psihologilor din America (APA) în anul precedent. Validitatea teoretică este azi definită ca
fiind un indicator al gradului în care un test măsoară constructul pe care se presupune că-l măsoară.
Altfel spus, acest tip de validitate este utilă deoarece un test este construit pentru măsurarea unei
caracteristici pe care subiecţii o posedă în diferite grade. Constructul este descris printr-o definiţie
operaţională care precizează indicatorii observabili şi mijlocul prin care aceştia pot fi măsuraţi. Deseori
un test nu poate măsura toate aspectele constructului deoarece definiţia acestuia conţine elemente
foarte complexe şi vagi. Din această cauză validitatea teoretică este stabilită printr-o acumulare de
evidenţe decât printr-un singur indice. Specialiştii în măsurare se bazează pe teoria referitoare la
trăsătura măsurată şi fac predicţii asupra comportamentului la test într-o multitudine de situaţii. Aceste
predicţii sunt verificate experimental şi dacă se dovedesc a fi exacte duc la concluzia validităţii teoretice
a testului. Dacă ele sunt false sau insuficient de exacte sunt mai multe explicaţii: sau experimentarea nu
a fost bine realizată, sau teoria care stă la baza construcţiei testului este falsă sau testul nu măsoară
constructul respectiv.
Pentru stabilirea validităţii teoretice toate sursele de predicţie pot fi folosite şi verificate empiric.
Următoarele elemente pot constitui criterii de evidenţiere a validităţii teoretice: toate informaţiile
referitoare la natura itemilor testului, omogenitatea testului, stabilitatea tuturor condiţiilor de aplicare,
date referitoare la validitatea de conţinut şi validitatea predictivă, predicţiile referitoare la diferite grupuri,
modificarea rezultatelor în timp, corelaţiile dintre construct şi diferite variabile demografice şi procedeele
de măsurare folosite de test.
Validitatea teoretică a unui test poate fi cunoscută în diferite moduri în funcţie de problema care
se pune. De exemplu putem fi interesaţi de proporţia de varianţă observată care decurge din variabila
măsurară de test sau de măsura în care randamentul la test coincide cu gradul de prezenţă a
caracteristicii pe care presupunem că o măsurăm.

56
PSIHODIAGNOSTIC (I)

Pentru realizarea acestor constatări există posibilitatea folosirii mai multor metode: metode
intratest, metode intertest, metode criteriale, manipulări experimentale şi studii de generalizabilitate etc.
Metodele intratest vizează stabilirea validităţii de conţinut în funcţie de definiţiile operaţionale
ale constructului şi studii de omogenitate a testului cu ajutorul indicelui de consistenţă internă, prin
determinarea fie a coeficientului alpha fie a coeficientului Kuder-Richarson.
Metodele intertest studiază corelaţiile dintre mai multe teste pentru a verifica dacă ele
măsoară acelaşi construct. Este vorba de a stabili validitatea congruentă corelând scorurile obţinute la
noul test cu cele ale unui test bine cunoscut. Dacă corelaţia este ridicată, putem presupune că noul test
măsoară acelaşi construct ca şi testul deja recunoscut pentru calităţile sale de măsurare. Aceste
metode folosesc şi studiile de analiză factorială, tehnică statistică utilizată pentru a determina numărul
de factori, pe baza cărora putem explica intercorelaţiile unui ansamblu de teste. Tehnica permite
determinarea numărului de factori şi explică mai bine scorurile obţinute la fiecare din teste precizând
gradul de varianţă între scorurile explicate de fiecare factor (cât la sută din varianţa totală este acoperită
de varianţa fiecărui factor). Testele care au în comun o varianţă ridicată sunt cele care măsoară acelaşi
construct. Dacă această tehnică este folosită pentru a studia validitatea, putem vorbi de validitate
factorială ca un aspect al validităţii teoretice.
Pentru exemplificare prezentăm în tabelul de mai jos şase subteste, componente ale aceluiaşi test:
1 2 3 4 5 6
1.Reprezentare spaţială 1,00 0,37 0,27 0,47 0,59 0,35
2. Raţionament 1,00 0,37 0,46 0,42 0,43
3. Vocabular 1,00 0,31 0,27 0,63
4. Simţ mecanic 1,00 0,52 0,42
5.Percepţia dimensiunilor 1,00 0,37
6. Logică verbală 1,00

Constatăm că reprezentarea spaţială, măsurată cu ajutorul testului este relativ în legătură cu


percepţia dimensiunilor (r = 0,59), iar rezultatele la proba de vocabular sun în legătură cu cele de la
logică verbală (r = 0,63). Se observă prezenţa a doi factori principali iar testul format din şase subteste
măsoară în realitate doi factori. O analiză factorială prin metoda componentelor principale (Hotteling) şi
a rotaţiei factorilor prin metoda varimax permite următoarele constatări. Datele sunt prezentate în
tabelul de mai jos.
FACTOR 1 FACTOR 2
1. Reprezentare spaţială 0,78 0,12
2. Raţionament 0,54 0,46
3. Vocabular 0,11 0,89
4. Simţ mecanic 0,73 0,29
5.Percepţia dimensiunilor 0,84 0,15
6. Logică verbală 0,27 0,84
Numerele prezentate în tabel reprezintă coeficienţii de saturaţie, care sunt interpretaţi ca
coeficienţi de corelaţie între factori şi variabile. Testul original este considerat un test de aptitudini pentru
studii secundare. Dar rezultatele analizei factoriale arată evident că sunt două teste omogene fiecare
măsurând un construct. Primul este compus din itemi care măsoară reprezentare spaţială, simţul
mecanic şi percepţia dimensiunilor. Acest construct poate fi numit "aptitudini pentru ştiinţe tehnice". Al
doilea test este compus din itemi care măsoară vocabularul şi logica verbală, iar constructul măsurat
poate fi numit "aptitudine verbală".

57
CORNEL HAVÂRNEANU

Altă abordare, folosită în contextul metodelor interteste, constă în studierea validităţii


convergente şi divergente, propusă de Campbell şi Fiske. Validitatea convergentă permite să
demonstrăm că două teste măsoară acelaşi construct, în timp ce validitatea divergentă constă în a
demonstra independenţa sau lipsa de corelaţie a unui test cu alte teste care măsoară un construct
diferit.
Studiile de validitate predictivă, care vizează stabilirea legăturii dintre predictor şi criteriu, adică
predicţia criteriului pe baza scorurilor obţinute la test, sunt indicatori buni ai constructului măsurat de
test. Această tehnică este deseori folosită pentru construirea inventarelor de interese generale sau
profesionale şi a testelor de personalitate. În aceste teste trebuie introduşi itemi care diferenţiază cu
adevărat grupurile şi care vor permite descrierea psihologică a subiecţilor după randamentul la test.
Studiile de generalizabilitate sunt foarte complexe, dar în acelaşi timp foarte complete. Un
model este studiul de validitate "multitrăsături-multimetode" propus de Campbell şi Fiske. Această
tehnică se bazează pe principiul în baza căruia un test măsoară un construct folosind o metodă
particulară. Rezultatele la test pot fi dependente de constructul măsurat, de metoda utilizată sau de
combinaţia celor două. Deci, dacă vom compara trăsătura care ne interesează cu alte trăsături, folosind
diferite metod, rezultatele pot fi variabile. Este vorba de fapt de studierea validităţii convergente, a
validităţii divergente şi a omogenităţii testului. De exemplu, dacă cu ajutorul a trei teste măsurăm trei
trăsături, respectiv gradul de liberalism (A), cultura generală (B), şi alienarea (C), aplicând aceluiaşi
grup de subiecţi trei metode diferite: metoda (I), cu răspunsuri la alegere, metoda (II), prin care se cere
să se răspundă cu adevărat şi fals şi metoda (III), care presupune completare de fraze obţinem
următoarele rezultate:
METODA I METODA II METODA III
Trăsături A1 B1 C1 A2 B2 C2 A3 B3 C3
MET I A1 0,87
B1 0,64 0,80
C1 0,28 0,31 0,82
MET II A2 0,71 0,58 0,27 0,85
B2 0,25 0,66 0,32 0,61 0,78
C2 0,11 0,22 0,72 0,43 0,32 0,79
MET III A3 0,70 0,30 0,08 0,68 0,52 0,37 0,81
B3 0,27 0,66 0,09 0,57 0,70 0,28 0,65 0,79
C3 0,09 0,12 0,67 0,19 0,24 0,64 0,47 0,38 0,80

Acest tabel prezintă pe diagonala principală coeficienţii de fidelitate. Se observă că pentru metoda (I)
fidelitatea pentru cele trei teste este de 0,87, 0,80 şi respectiv 0,82.

Din tabel putem desprinde patru categorii de rezultate:


Prima categorie este evidenţiată de diagonala principală unde sunt prezentate estimările
fidelităţii pentru fiecare test şi pentru fiecare metodă (acelaşi test, aceeaşi metodă). Observăm că aceşti
coeficienţi au valori ridicate şi stabile.
A doua categorie este formată din corelaţiile dintre trăsături diferite măsurate prin metode
diferite. Aceste sunt corelaţiile:
rA1, B2 = 0,25, rA1, C2 = 0,11, rB1, C2 = 0,22, rA1, B3 = 0,27, rA1, C3 = 0,09, rB1, C3 = 0,12,

58
PSIHODIAGNOSTIC (I)

rA2, B3 = 0,57, rA2, C3 = 0,19, rB2, C3 = 0,24, rB1, A2 = 0,58, rC1, A2 = 0,27, rC1, B2 = 0,32,
rB2, A3 = 0,52, rC2, A3 = 0,37, rC2, B3 = 0,28, rB1, A3 = 0,30, rC1, A3 = 0,08, rC1, B3 = 0,09.
Toate aceste valori ajută la studierea validităţii divergente, care este foarte mică faţă de
corelaţiile aceeaşi trăsături măsurată prin metode diferite (rA1, A2 = 0,71).
A treia categorie este formată din corelaţiile dintre diferite trăsături măsurate prin aceeaşi
metodă:
rA1, C1 = 0,28, rB1, C1 = 0,31, rA2, B2 = 0,61, rA2, C2 = 0,43, rA1, B1 = 0,64, rA3, B3 = 0,65,
rA3, C3 = 0,47, rB3, C3 = 0,38, rB2, C2 = 0,32.
Aceste corelaţii sunt măsuri ale varianţei care decurge din metodele folosite.
A patra categorie este formată din corelaţiile dintre aceeaşi trăsătură şi diferite metode:
rA1, A2 = 0,71, rB1, B2 = 0,66, rC1, C2 = 0,72, rA2, A3 = 0,68, rB2, B3 = 0,70, rC2, C3 = 0,64.
Aceşti coeficienţi sunt folosiţi pentru studierea validităţii convergente.
Pe baza acestor rezultate putem face următoarele constatări:
1. Coeficienţii de fidelitate trebuie să aibă valori ridicate, la fel şi corelaţiile aceleiaşi trăsături măsurate
prin diferite metode(vezi diagonala principală şi corelaţiile rA1, A2 = 0,71, rB1, B2 = 0,66, rC1, C2 =
0,72, rA2, A3 = 0,68, rB2, B3 = 0,70, rC2, C3 = 0,64). Mai mult coeficienţii de corelaţie ale aceleiaşi
trăsături măsurate prin diferite metode trebuie să fie mult mai mari decât corelaţiile dintre trăsături
diferite măsurate prin aceeaşi metodă (rA1, A2 = 0,71 mai mare faţă de rB1, A2 = 0,58 şi de asemeni
mai mare decât rC1, A2 = 0,27 etc.). Altfel spus diferenţele dintre trăsături trebuie să fie mult mai
importante decât diferenţele dintre metode.
2. Coeficienţii de corelaţie ale aceleiaşi trăsături măsurate prin diferite metode trebuie să fie mai mari
decât corelaţiile dintre trăsături diferite măsurate prin metode diferite (rA1, A2 = 0,71 mai mare faţă
rA1, B2 = 0,25, şi de asemeni mai mare decât rA1, C2 = 0,11 etc).
3. Corelaţiile dintre trăsături diferite trebuie să fie mici (rA1, C1 = 0,28), şi corelaţiile dintre trăsături diferite
trebuie să fie foarte mici faţă de corelaţiile faţă de măsurile aceleiaşi trăsături (rA1, C1 = 0,28 mai
mic faţă de rA1, A2 = 0,71).
Vom spune că există validitate convergentă dacă obţinem corelaţii ridicate între măsurile
aceleiaşi trăsături obţinute prin diferite metode (rA1, A2 = 0,71, rA1, A3 = 0,70) şi există validitate divergentă
dacă obţinem corelaţii scăzute între trăsături diferite măsurate prin aceiaşi metodă (rA1, C1 = 0,28).
Efectul metodei este relevant dacă corelaţiile testele care măsoară trăsături diferite sunt mai
ridicate pentru aceiaşi metodă decât pentru metode diferite. De exemplu putem vorbi de un efect al
metodei dacă rA1, C1=0,28 sau rB1, C1=0,31 sunt mai mari decât rA1, C2=0,11 şi rb1, C2=0,22. În acest caz
putem vorbi de un "efect de halo" metodologic care se manifestă prin tendinţa de supraestimare a
corelaţiilor dintre variabilele măsurate prin aceleaşi metode.
Specificăm că în contextul validităţii de construct fidelitatea testului este definită ca fiind gradul
de concordanţă dintre două măsurări a aceleiaşi trăsături cu aceiaşi metodă, iar validitatea este definită
prin gradul de concordanţă între două măsurări ale aceleiaşi trăsături prin metode diferite.

59
CORNEL HAVÂRNEANU

VI. STANDARDIZAREA TESTELOR

VI.1. SEMNIFICAŢIA STANDARDIZĂRII

Standardizarea unui test presupune respectarea unor norme. Normele sunt seturi de scoruri
obţinute de subiecţii eşantioanelor studiate. Standardizarea este importantă pentru că permite
interpretarea psihologică a scorurilor şi pornind de la aceasta se pot face interpretări. Să presupunem
că un subiect obţine la un test de inteligenţă scorul 10. Dacă scorul de 10 a fost obţinut doar de 2% din
subiecţii populaţiei generale, se situează în topul celor mai bune scoruri, este evident că acea persoană
are un nivel ridicat de inteligenţă. Dacă însă scorul de 10 se plasează la extrema cealaltă, cu cele mai
mici scoruri (după scorurile obţinute de 98% dintre subiecţi) putem spune că subiectul are un nivel
scăzut de inteligenţă. Fără existenţa normelor este imposibil să cunoaştem semnificaţia scorului.
Standardizarea testelor este esenţială. Ea este folosită pentru utilizarea practică a testelor, cum ar fi în
luarea unor decizii în ceea ce priveşte orientarea profesională şi selecţia personalului. Normele sunt
necesare şi atunci când testele sunt utilizate pentru un scop precis, cum ar fi de exemplu selecţia
militarilor care vor participa la o anumită operaţiune armată.
Există o aplicaţia a testelor în care standardizarea nu este importantă, şi anume în analiza
psihometrică a diferenţelor individuale - studiul ştiinţific al atributelor umane, abilităţilor, personalităţii,
motivaţiei şi dispoziţiei. Pentru aceste aplicaţii psihometrice ale teoriei psihologice, scorurile brute,
directe sunt satisfăcătoare, iar transformarea lor în norme ar duce la pierderea de informaţii.

VI.2. PROBLEME ALE STANDARDIZĂRII

Normele folosite pentru interpretarea semnificaţiei scorurilor unui test trebuie să fie precise.
Dacă, conform normelor, un scor este obţinut de primii 20% dintre subiecţii populaţiei acesta poate sau
nu să fie reprezentativ pentru norma grupului. Dacă normele nu sunt clare, ele pot duce la o interpretare
greşită. Acest pericol apare în domeniul clinic şi psihiatric, unde există teste care sunt folosite pentru
stabilirea diagnosticului. Dacă un copil este orientat spre o anumită formă de educaţie pe baza
scorurilor obţinute la teste, este important ca normele să fie clare.
Înainte de a descrie tehnicile de standardizare şi varietatea normelor care pot fi utilizate
considerăm că este necesar să facem o precizare. Faptul că tetele psihologice pot fi uşor standardizate
ne dă posibilitatea să facem comparaţii precise cu normele grupurilor.
Normele sunt necesare pentru tetele psihologice pentru că nu există un zero absolut al scărilor
de măsurare. Multe forme de măsurare au un zero absolut, lungimea, greutatea pot fi măsurate cu o
astfel de scală. Lipsa lui zero absolut ar face ca măsurarea să fie imprecisă şi neştiinţifică.

60
PSIHODIAGNOSTIC (I)

VI.3. EŞANTIONAREA ÎN STANDARDIZARE

Eşantionarea este un factor crucial al standardizării unui test. Calitatea normelor depinde de
adecvarea la eşantionul pe care acestea se bazează. În eşantionare sunt două variabile importante:
mărimea şi reprezentativitatea. Eşantionul normativ trebuie să fie o bună reflectare a populaţiei pe
care o reprezintă şi trebuie să fie suficient de mare pentru ca erorile standard ale statisticii descriptive,
adică ale mediei, abaterii standard şi distribuţiei, să fie neglijabile.
Pentru reducerea erorilor standard o mărime a eşantionului de 500 de subiecţi este mai mult
decât adecvată. Reprezentativitatea eşantionului este independentă de mărimea acestuia. Totuşi un
eşantion mic nu poate fi cu adevărat reprezentativ pentru o populaţie mare. Normele pentru o populaţie
generală trebuie să fie realizate pe eşantioane foarte mari, pentru o reprezentare clară, dar pentru
populaţii cu variaţii mici sau pentru grupurile omogene, aceste norme pot fi realizate pe eşantioane mai
mici. De exemplu, pentru 5000 de profesori universitari, un eşantion de 500 de subiecţi este
reprezentativ.
Alegerea mărimii adecvate a eşantionului reprezentativ nu se face în manieră absolută.
Eşantionul depinde de populaţie, de mărimea şi omogenitatea acesteia. Astfel, profesorii de chimie sunt
mai omogeni decât populaţia de profesori în general şi ar putea fi reprezentată de un eşantion mic. Un
eşantion mic dar reprezentativ este superior unuia mare dar nereprezentativ. O valoare mică a erorii
standard nu are nici o valoare dacă valorile observate nu sunt clare.

VI.4. METODE DE EŞANTIONARE


O populaţie eterogenă este o populaţie generală, în care există mai multe subseturi de
persoane care diferă unele de altele. Obţinerea unui eşantion pentru o populaţie generală este cea mai
dificilă problemă de eşantionare, pentru că trebuie obţinut un eşantion reprezentativ pentru populaţia
respectivă.

a. Eşantionarea întâmplătoare / prin randomizate


Un eşantion este întâmplător dacă există şanse egale ca orice individ să fie ales ca membru al
eşantionului. Dacă eşantionul este suficient de mare acesta poate fi într-adevăr reprezentativ pentru
populaţia pentru care a fost desemnat. Dacă nu cunoaştem care sunt categoriile importante ale
populaţiei pentru care vrem să realizăm eşantionul, atunci eşantionul întâmplător este cea mai simplă
metodă pentru a asigura reprezentativitatea. De exemplu, să presupunem că dorim să realizăm un
eşantion al copiilor cu vârsta de 11 ani din Zair pentru a standardiza testele pentru această vârstă. Ca
noi veniţi în ţara respectivă nu aven informaţii despre variabile importante care pot afecta învăţarea în
şcoală, de acea un eşantion randomizat este cel mai indicat pentru a obţine un eşantion reprezentativ.
În această situaţie se obţine o listă a şcolilor primare din zonele reprezentative pentru această ţară.
Şcolile sunt numerotate şi se aleg la întâmplare numere pentru a selecta şcolile. Apoi toţi copii de 11 ani
din aceste şcoli selectate vor fi testaţi. În acest caz testarea se realizează pe un număr fix de copii şi
eşantionul va cuprinde aproximativ 1000 de copii.
Acest exemplu ilustrează un aspect important al eşantionării întâmplătoare, şi anume
asigurarea şanselor egale pentru toţi indivizii din populaţie pentru a fi selectaţi în eşantion. Este
imposibil să obţinem o listă a copiilor cu vârsta de 11 ani şi aceasta, de fapt, este principala dificultate a

61
CORNEL HAVÂRNEANU

eşantionării întâmplătoare: cum obţinem o listă preliminară din care să realizăm ulterior eşantionare
sau, în limbaj de eşantionare, cum definim populaţia.
Definirea populaţiei
Nu este suficient să definim teoretic o populaţie. Acest lucru pare uşor, de exemplu, populaţia
Marii Britanii conţine toate persoanele care locuiesc în ţara respectivă. Este necesar să avem câteva
definiţii operaţionale sau definiţii concrete. Ar fi nevoie de o listă, dar unde ar putea fi găsită? Dacă am
reduce discuţia, pentru moment, doar la persoanele adulte nu am avea la dispoziţie nici o listă. Listele
de vot sunt incomplete, cartea de telefon cuprinde numai o parte din populaţie. După cum se vede o
definiţie operaţională a populaţiei generale nu este uşor de dat.
Dacă dorim să stabilim norme speciale pentru teste, şi atunci este necesar să realizăm o
eşantionare specială a populaţiei. Din nou definirea teoretică şi operaţională poate fi dificilă. Dacă dorim
să facem un studiu al criminalităţii, este posibil să obţinem o listă a celor aflaţi în închisoare, să
eliminăm ceilalţi delicvenţi, rămânând numai cei din închisori. Apoi vom alege la întâmplare eşantionul
de criminali. În acest caz există posibilitatea de definire clară a populaţiei de criminali din închisoare.
Dacă dorim să stabilim şi norme legate de aspectul schizofrenic, această listă nu este suficientă,
deoarece va fi imposibil să desemnăm un eşantion reprezentativ din populaţia de criminali aflaţi în
închisoare.
Bazele pentru definirea populaţie pot fi variate. My Ghaian consideră că pentru a defini
populaţia de copii din şcoală putem folosi fie o listă a copiilor fie o listă a şcolilor. Un eşantion
randomizat plecând de la lista şcolilor este mai uşor de obţinut. Dacă aceste unităţi sunt prea mari se va
la o eşantionare aleatorie a membrilor fiecărei dintre unităţi. Şcolile sunt unităţi suficient de mici pentru a
putea fi folosite ca bază pentru realizarea unei eşantionări întâmplătoare a copiilor.
Desemnarea unui eşantion dintr-o populaţie
Procedura standard pentru a ne asigura că fiecare membru al listei va intra în eşantion este
aceea de a folosi o listă de numere întâmplătoare. Fiecare individ din populaţie primeşte un număr care
poate fi apoi extras din lista de numere. Această procedură poate fi realizată cu ajutorul computerului.
Este posibilă selecţia eşantionului pe intervale sau prin fixarea proporţiilor de populaţie din
eşantion, doar dacă poziţia subiecţilor din listă a fost randomizată.
În concluzie, eşantionarea aleatorie se poate realiza doar dacă există o listă adecvată a
populaţiei. Pentru a ne asigura că eşantionul este reprezentativ, acesta trebuie să fie suficient de mare.
Aceasta înseamnă că folosirea eşantionării aleatorii pentru stabilirea normelor de standardizare este
consumatoare de timp şi costă prea mult, fiind preferată eşantionarea stratificată.

b. Eşantioanele stratificate
Eşantionarea stratificată implică divizarea unei populaţii eterogene într-un număr de mai multe
populaţii omogene, aceste eşantioane de populaţii omogene putând fi combinate pentru a o forma un
eşantion reprezentativ al întregii populaţii. Deoarece populaţiile omogene implică eşantioane mici
reprezentative, eşantionul stratificat este mai reprezentativ ca mărime în comparaţie cu eşantionul
aleator.
Reprezentativitatea eşantionului stratificat depinde de variabilele utilizate pentru stratificare.
Dacă sunt folosite prea multe variabile eşantionul va fi foarte mare. Dacă sunt utilizate variabile greşite
atunci eşantionul nu va mai fi reprezentativ. Există o regulă simplă pentru selecţia variabilelor de

62
PSIHODIAGNOSTIC (I)

stratificare: ele trebuie să fie corelate cu variabilele care sunt studiate şi trebuie să micşorăm numărul
de stratificări. Câteva exemple vor clarifica aceste reguli:
Pentru a ilustra problema obţinerii unui bun eşantion stratificat pentru populaţie, vom analiza
normele testului de inteligenţă Lorge-Thorndike. Scorurile la test trebuie să fie corelate cu vârsta şi vom
analiza cum autorii au eşantionat fiecare grup de vârstă.
Definirea populaţiei: Comunităţile formează baza eşantionării. Pentru a obţine un eşantion
reprezentativ al acestor comunităţi se va folosi o eşantionare stratificată.
Variabilele de stratificare: Bazele stratificării sunt reprezentate de factorii care corelează cel
mai înalt cu scorul la testul de inteligenţă, în comunităţi:
a. nivelul de cultură generală;
b. proporţia diferitelor profesiuni;
c. procentajul de proprietari de locuinţe;
d. mediana valorii ratei la casă.
Fiecare comunitate a fost clasificată în funcţie de aceste 4 variabile în 5 categorii de la foarte
ridicat la foarte scăzut. Stratificarea eşantionului pe aceste baze s-a realizat pentru 44 de comunităţi şi
fiecare copil din fiecare grup din eşantioanele comunităţilor a fost testat pentru stabilirea normelor.
Rezultă un număr de 11.000 de subiecţi pentru fiecare grup, pentru vârste de la 6 la 17 ani,
deci în total 136.000.
Comentarii:
Metoda de eşantionare trebuie să plece de la un eşantion reprezentativ al comunităţilor şi apoi
de la un eşantion reprezentativ al copiilor pentru fiecare dintre comunităţile alese. Realizarea unui
eşantion reprezentativ pentru o populaţie necesită selectarea unui număr mare de subiecţi, ceea ce
implică costuri ridicate şi timp. O astfel de standardizare stă la baza construirii testelor.
În acest caz stratificarea s-a bazat pe variabile care corelau ridicat cu inteligenţa. Dacă ar
trebui să stabilim normele pentru un test de anxietate am folosi alte criterii de stratificare. Thorndike şi
Lorge au folosit ca normă clasa socială pentru împărţirea pe subgrupe şi pentru a face comparaţia între
ele. Aceste norme s-au dovedit a fi mai utile decât cele generale.
Acest test este un bun exemplu pentru eşantionarea stratificată. Criteriul de stratificare nu
este acelaşi pentru un test de anxietate. Vom examina în continuare eşantionul populaţiei generale
pentru un test de personalitate “16 PF” (Cattell, Eber & Tatsuoka, 1970).
Autorii a considerat că un eşantion mic, bine stratificat este superior unui eşantion randomizat.
De aceea suntem interesaţi să examinăm cum autorii au standardizat acest test. Vom prezenta în
continuare modul în care s-a realizat eşantionarea pentru subiecţii de sex feminin.

Baza stratificării:
SUA a fost divizată în opt arii geografice şi 8 densităţi ale populaţiei. Populaţia a fost împărţită
în 5 grupe de vârstă şi 7 nivele de venit. Procentajul populaţiei pentru fiecare dintre aceste categorii a
fost reflectat cât mai exact posibil în eşantionul de femei. Acest eşantion a fost de aproximativ 1000 de
persoane.
Comentarii:
Se pare că planificarea din acest eşantion nu a fost bună. Nu toate categoriile sunt la fel de
bine reprezentate. De exemplu, există doar 30 de femei din zonele muntoase şi 239 din două categorii

63
CORNEL HAVÂRNEANU

de oraşe cu populaţie peste 1 milion de locuitori. Acest eşantion nu este suficient de mare. După cum
am precizat în cazul testului Thorndike-Lorge, 10.000 de cazuri ar fi necesare pentru a avea un eşantion
stratificat reprezentativ. Eşantionul folosit pentru standardizarea inventarului “16PF” este prea mic
pentru a face comparaţii semnificative între subgrupe.
Un număr de 1.000 de subiecţi, oricât de bine stratificat ar fi eşantionul, nu este o bază de
satisfacere pentru normele generale. Din aceste motive normele pentru acest test trebuie să fie tratate
cu prudenţă.

Reguli pentru normele generale


1. un eşantion stratificat este mult mai eficient decât unul randomizat şi este mai bine să fie utilizat
pentru testele standardizate;
2. patru criterii de clasificare sunt normal suficiente. Dacă se folosesc prea multe criterii creşte
mărimea eşantionului;
3. variabilele care vor fi utilizate în stratificare trebuie să coreleze ridicat cu testul. Variabilele sex,
vârstă şi clasă socială sunt importante;
4. în fiecare grup ar trebui să fie suficienţi subiecţi pentru a forma un eşantion adecvat. Dacă luăm 300
ca minimum într-o categorie şi dacă avem, de exemplu, 5 clase sociale, 2 sexe şi 5 grupe de vârstă
există deja 50 categorii de subiecţi, ceea ce înseamnă în total 15000 subiecţi;
5. pentru a avea un eşantion adecvat pentru o populaţie generală este nevoie inevitabil de un număr
mare de subiecţi.

c. Norme de grup speciale


Deoarece în standardizarea testelor apar probleme logistice şi financiare mulţi “constructori” de
teste preferă să folosească norme pentru grupele specifice pentru care testele sunt realizate. Pentru
aceste grupuri specifice se aplică aceleaşi principii de eşantionare. Deoarece aceste grupe sunt mai
omogene, eşantioanele reprezentative vor fi mai mici. Pentru a clarifica problemele standardizării
testelor pentru grupuri specifice vom examina normele publicate de autorii anumitor teste.
Scala conservatorismului (Wilson & Patterson, 1970). Această scală vizează măsurarea
dogmatismului sau rigidităţii, descrise de Rokeach (1960) ca atitudine care are un efect profund în multe
sfere ale vieţii, şi care poate fi observată în conflictele din Beirut şi Belfast. S-a folosit un număr mare de
norme, dar în manualul testului nu sunt precizate şi motivele selecţiei acestora. În studiu au fost incluşi
studenţi universitari din 4 ţări, studenţi din colegii de educaţie, muncitori calificaţi, subiecţi de sex feminin
de vârstă şcolară şi de sex masculin de toate vârstele.
Comentarii
Examinând numărului de subiecţi pentru fiecare grup constatăm că aceste norme trebuie privite
cu rezerve. Cel mai mare număr de subiecţi se găsesc în eşantionul ocupaţiilor din Noua Zeelandă -
340 de subiecţi. Un eşantion cu o astfel de mărime nu este reprezentativ pentru varietatea profesiunilor.
Au fost examinaţi 50 de studenţi din mai mult de 4 universităţi din Marea Britanie, multe dintre ele având
mai mult de 5.000 de studenţi. Din aceste motive eşantionul de studenţi nu poate fi folosit ca bază
pentru norme. Cele mai multe dintre eşantioane sunt prea mici pentru a fi reprezentative: 22 de
tehnicieni de laborator, 22 de lucrători din biserică şi 30 de oameni de afaceri.

64
PSIHODIAGNOSTIC (I)

Concluzii
Normele utilizate au o valoare prea mică şi nu pot fi folosite pentru interpretarea scorurilor la
test. Alegerea grupelor este interesantă, dar era nevoie de un număr mai mare de subiecţi. Nu este
posibil ca rezultatele obţinute de subiecţii acestor eşantioane să fie utilizate ca norme pentru o populaţie
generală. Normele specifice grupului trebuie să aibă la bază un eşantion mai larg şi mai reprezentativ
decât cel folosit în acest test.
În 1970 Kline a dezvoltat Ai3Q, un test al personalităţii obsesive. S-au stabilit normele pentru
diriginţii claselor a VI-a din Anglia.

Obţinerea eşantionului
Pentru a avea un eşantion reprezentativ al diriginţilor claselor a VI-a, autorii s-au asigurat mai
întâi că au un eşantion adecvat al claselor a VI-a. Astfel, baza eşantionului a fost să se examineze toţi
diriginţii claselor a VI-a dintr-un eşantion stratificat al claselor a VI-a. Acest lucru a fost foarte important.
Un eşantion de diriginţi din şcoli cu clase numeroase de a VI-a şi standarde academice foarte ridicate,
cum ar fi Manchester Grammar School, St. Paulus and Cheltenham Ladies, ar fi complet greşit dacă s-
ar fi folosit ca bază pentru norme.

Stratificarea variabilelor pentru şcoli


Au fost utilizate 4 variabile de stratificare. Deşi unele din aceste variabile nu mai au
aplicabilitate, ele reprezintă un exemplu bun pentru modul cum trebuie realizat un eşantion stratificat.
1. surse de finanţare: şcoli publice, susţinere directă sau de la stat;
2. sex: băieţi, fete, mixte;
3. localizare geografică: orăşele, oraşe mari, mediu rural;
4. sistemul claselor: şcoli de gramatică, şcoli comprehensive şi colegii de 6 clase.
A fost destul de dificil să se realizeze un eşantion echilibrat ţinând seama de toate variabilele,
deoarece există puţine şcoli publice de stat în oraşele mici, cel puţin în afara Londrei. Cu toate acestea
un eşantion reflectând proporţiile acestor şcoli în populaţie, chiar dacă există doar două şcoli pentru
fiecare categorie, ar asigura norme suficient de precise. Au fost listate toate şcolile pentru fiecare
categorie şi au fost alese întâmplător două şcoli din fiecare categorie.
Eşantionul obţinut conţinea aproximativ 1.000 de subiecţi de sex feminin şi 1.000 de subiecţi de
sex masculin, acoperind doar nordul Angliei. Chiar dacă lucrăm cu categorii omogene de subiecţi din
anumite zone geografice ale ţării, este nevoie de un eşantion mare pentru a fi reprezentativ.
Myers-Briggs Type Indicator (Myers&Briggs, 1962). Acest test, care clasifică subiecţii în funcţie
de categoriile lui Jung (extravertiţi intuitivi, extravertiţi raţionali, etc.) îl vom folosi pentru a ilustra unele
dintre problemele eşantionării. Autorii acestui test au folosit un eşantion de 3.500 de băieţi şi 2.500 de
fete din 37 de şcoli din Pennsylvania. Acest eşantion este reprezentativ pentru acest stat, dar normele
pot să nu fie valabile pentru alte state. Autorii au folosit un eşantion de 4.500 de studenţi la arte şi
inginerie din 8 universităţi, care la admitere cereau un nivel ridicat de calificare al studenţilor. Subiecţii
din acest eşantion nu erau reprezentativi şi pentru studenţii altor colegii care nu aveau astfel de condiţie
la admitere şi care, de fapt, sunt cele mai numeroase în SUA.
Au fost folosite grupe normative neadecvate: copii adoptaţi (34 subiecţi de sex masculin şi 25
de sex feminin) şi 40 de arhitecţi nu nivel ridicat de creativitate.

65
CORNEL HAVÂRNEANU

Chiar atunci când investigatorii ştiu cum trebuie stabilite normele de grup, adesea aceştia nu
reuşesc să le respecte deoarece nu au resursele de timp şi materiale necesare pentru aceasta.
Reguli pentru eşantionarea grupurilor speciale
1. stratificarea grupului în funcţie de variabilele care corelează ridicat cu testul;
2. umărul minim pentru eşantioane este 300. Adesea este necesar să facem eşantionarea în timp;
3. un eşantion mic, cum este în cazul scalei conservatorismului, este mai bun decât deloc. Dacă a
fost utilizat un eşantion mic, utilizatorii testului trebuie să fie avertizaţi în legătură cu acest aspect.
Normele bazate pe un eşantion mic sunt doar sugestive sau experimentale, ele pot şi complet
greşite.

CONCLUZII
În principal dificultăţile eşantionării nu sunt de natură teoretică sau intelectuală, ci practice
ţinând de insuficienţa resurselor. Dacă un test este folosit pentru a lua decizii este esenţial
ca normele să respecte standardele pe care le-am prezentat anterior. Un eşantion mare şi
stratificat adecvat este esenţial pentru a avea norme bune.

VI.5. EXPRIMAREA REZULTATELOR

După ce grupurile normative au fost testate rezultatele trebuie să fie exprimate în formă
numerică. Există mai multe modalităţi de a face acest lucru. Cele mai multe dintre metode compară
scorul individului cu grupul normativ relevant.

Norme diferite
Vom descrie în continuare câteva dintre cele mai utilizate norme, precum şi avantajele şi
dezavantajele lor.

a. Centile
Un centil este un scor a cărui procentaj este dat de grupul normativ. Al 30-lea centil este un
scor sub care se găsesc 30% din subiecţii eşantionului. Acestea au avantajul că pot fi înţelese de
subiecţii testaţi.
Totuşi aceste norme au şi limite importante:
a) Centilele sunt scoruri ordinale pentru care nu se pot calcula parametri statistici;
b) Distribuţia centilelor este dreptunghiulară în timp ce distribuţia scorurilor testului se apropie de cea
normală. De aceea în jurul mediei diferenţele între subiecţi sunt mici, în timp ce la extreme apar
diferenţe mari între subiecţi.
Deoarece centilele nu pot fi analizate statistic şi pentru că afectează scorurile brute, aceste
norme nu sunt recomandate. Ele pot fi folosite doar pentru explicarea rezultatelor.
b. Scoruri standard
Cele mai utile norme sunt scorurile standard. Există o mare varietate de astfel de scoruri şi în
continuare vom discuta despre cele mai frecvent utilizate.

66
PSIHODIAGNOSTIC (I)

Scorurile Z
Scorurile standard se calculează prin împărţirea deviaţiei fiecărui scor de la medie la abaterea standard
a scorurilor. Formala de calcul este următoarea:
X−M
Z= , unde
σ
Z - scorul standard;
X - scorul obţinut la test;
M - media distribuţiei scorurilor;
σ - abaterea standard a scorurilor
Abaterea standard a testului este măsura variabilităţii testului, cât de mult scorurile variază în
jurul mediei.

Proprietăţile scorurilor Z
Cel mai mare avantaj al scorurilor Z în comparaţie cu notele brute, este că scorurile Z sunt
întotdeauna echivalente. Astfel, un scor Z de 2 înseamnă întotdeauna 2 abateri standard de la medie.
Ele permit compararea scorurilor obţinute la teste diferite.
Să presupunem că avem un set de scoruri la un test la care media este 50, iar abaterea
standard de 5. În tabelul următor prezentăm scorurile brute şi notele Z corespunzătoare, calculate după
formula prezentată anterior:

Scoruri brute Scoruri Z


50 0
55 1
60 2
45 -1
43 -1,4

Scorurile Z au o medie de 0, o abatere standard de 1 şi pot lua valori negative şi pozitive. Un


scor Z mai mare decât media este un scor pozitiv, iar scorul mai mic decât media este un scor Z
negativ. Transformarea scorurilor brute în scoruri Z este liniară, astfel că distribuţia scorurilor brute este
menţinută în scorurilor Z. Dacă distribuţia scorurilor brute este normal distribuită atunci scorurile Z vor
avea valori între +3 şi -3. Deoarece suprafaţa curbei normale este cunoscută, scorurile Z normal
distribuite au particularităţi informative. De exemplu, aproximativ 95% din distribuţia normală este
plasată între 2 bateri standard de o parte şi de alta a mediei distribuţiei. Un scor Z de 2 poate fi
interpretat în termeni de procentaj: 2% dintre subiecţi au rezolvat mai bine, celelalte 2 procente găsindu-
se la celălalt capăt al distribuţiei.
Cu toate avantajele pe care le au scorurile Z, există două probleme majore, deşi acestea sunt
cele mai simple forme ale scorurilor standard.
a) O scală care are ranguri mici (de la -3 la +3) şi o medie de 0, are mai puţină semnificaţie, de aceea
sunt mai puţin utilizate de către psihologi.
b) Rezultatele la multe teste se distribuie mai mult sau mai puţin normal. Când distribuţia nu este
normală distribuţia scorurilor Z nu poate şi transformată în centile.
Pentru a depăşi aceste dificultăţi psihologii transformă scorurile Z în alte scoruri standard.

67
CORNEL HAVÂRNEANU

Scorurile Z transformate în alte scoruri standard


Scorurile Z pot fi transformate în alte scoruri standard, atunci când se dă media şi abaterea
standard. Aceste scoruri, la fel ca şi scorurile Z, sunt compatibile cu alte scoruri standard transformate
cu aceeaşi medie şi abatere standard.
Z t = a + bZ , unde
Zt - scorul Z transformat
a - media distribuţiei transformate
b - abaterea standard a distribuţiei transformate
Z - scorul Z
După cum precizează şi Cronbach (1976), cel mai obişnuit scorurile Z sunt transformate în
scoruri standard cu media 50 şi abaterea de 10. În tabelul de mai jos sunt date scorurile Z transformate
după formula anterioară.
Scoruri brute Z scoruri Zt
55 1 60
60 2 70
45 -1 40
43 -1,4 36

Scorurile standard normalizate


Unii psihologi preferă scorurile standard normalizate. Inteligenţa, de exemplu, necesită să fie
normal distribuită (Vernon, 1961). De aceea se utilizează scoruri standard normal distribuite.
Pentru a normaliza un set de scoruri Z trebuie parcurşi mai mulţi paşi:
a. să se calculeze proporţia cumulată a eşantionului pentru fiecare scor brut;
b. calcularea frecvenţei cumulate pentru fiecare scor. Frecvenţa cumulată pentru scorul X este
reprezentată de numărul de subiecţi care au cote sub X;
c. poate fi calculată frecvenţa cumulată pentru valoarea din mijloc al fiecărui interval al scorului,
adăugând la scor jumătate din numărul de subiecţi care au acel scor. Dacă frecvenţa cumulată a
lui X este 10 şi 6 subiecţi au scorul X, atunci punctul din mijloc este 13;
d. fiecare punct de mijloc al frecvenţei cumulate poate fi convertit într-o proporţie prin împărţire la N
(numărul de subiecţi);
e. în tabele statistice care arată suprafaţa curbei de distribuţie normală, aceste puncte de mijloc pot fi
transformate în scoruri Z;
f. aceste scoruri Z sunt normal distribuite şi se poate face referire la ele ca scoruri Zn;
g. scorurile Z normalizate pot fi transformate în orice tip de scoruri standard, utilizând formula dată
anterior.
Scorurile T
Buros (1972) consideră că dacă trebuie folosite scoruri standard normalizate, atunci trebuie
folosită o scală care să aibă media 50 şi abaterea standard de 10.
Alte scoruri standardizate normalizate
a. Stanine. Acestea au media de 5 şi abaterea standard de 2. Aceste scoruri împart curba normală în
nouă scoruri;
b. Notele sten, au media de 5,5 şi abaterea standard de 1,5. Acestea au fost folosite în special pentru
testele de personalitate şi împart curba în 10 scoruri;
c. Testul de inteligenţă Wechsler utilizează o scală cu media de 100 şi abaterea standard de 15.

68
PSIHODIAGNOSTIC (I)

Utilizarea scorurilor standard normalizate


Scorurile standard normalizate pot fi folosite în condiţii speciale:
a. doar când distribuţia originală este aproximativ normală. Dacă această distribuţie nu este normală,
vor rezulta erori, în special la extremele distribuţiei;
b. trebuie utilizate atunci când există anumite aşteptări teoretice în legătură cu distribuţia normală;
c. este esenţial ca grupul de standardizare să fie reprezentativ pentru distribuţie, pentru a reflecta cât
mai exact populaţia, în special la extreme.
Concluzii
a. scorurile brute ale testelor psihologice au înţeles doar în relaţie cu scorurile normative ale grupului;
b. valoarea normelor depinde de eşantionul sau eşantioanele care au fost folosite. Doar când aceste
eşantioane sunt adecvate populaţiei, normele pot fi folosite fără rezerve;
c. Există eşantioane foarte largi, uneori de 10.000 de subiecţi;
d. Eşantioanele stratificate sunt mai eficiente decât cele randomizate, iar variabilele în funcţie de care
eşantionul ar trebui stratificat corelează ridicat cu variabilele testului;
e. Există multe metode de exprimare a scorurilor normative;
f. Centilele nu sunt recomandate pentru că nu pot fi prelucrate statistic;
g. Scorurile standard sunt recomandate, cele mai utile sunt scorurile standard cu media 50 şi abaterea
de 10;
h. Scorurile standard normalizate sunt recomandate numai în situaţii speciale. Dintre acestea scorurile
T sunt cele mai utile;
i. Orice test psihologic trebuie să respecte procedura de standardizare. Un set de scoruri standard
poate duce la concluzii eronate dacă eşantionarea este deficitară.

VI.6. METODE ALTERNATIVE DE INTERPRETARE A SCORURILOR LA TEST

Există metode de interpretare a scorurilor care diferă de norme şi au valoare doar în anumite
circumstanţe.

VI.6.1. Criteriu de conţinut


Dacă un test solicită anumite deprinderi sau comportamente pentru a fi completat, este nevoie
ca testul să reprezinte o măsură validă ipso facto a acestor deprinderi sau comportamente. De exemplu,
dacă un test de muzică cere subiecţilor să recunoască acordul dominant într-o serie, subiecţii au abilităţi
muzicale dacă aleg itemii corecţi. Validitatea conţinutului este relevantă când conţinutul este clar
specificat. Acest lucru este relativ uşor de realizat pentru nivele elementare ştiinţifice, muzicale sau
matematice, când conţinutul creşte progresiv în dificultate pentru a măsura nivele tot mai ridicate de
cunoştinţe. Validitatea conţinutului se aplică mai mult în cazul testelor de cunoştinţe şi de abilitate.
Am introdus termenul de conţinut valid deoarece criteriul de conţinut se aplică atunci când
testele au fost construite în aşa fel încât să aibă un conţinut valid. De exemplu, pentru testarea notaţiei
muzicale, un test ar trebuie să conţină toate notaţiile muzicale, cu toate că problema notaţiilor muzicale
poate fi evaluată rapid în timpul execuţiei unei piese muzicale. Un scor de 100 percentile ar indica
superioritate/deplină stăpânire, iar x % ar indica x % superioritate. În aceste teste este nevoie să se
stabilească punctele de critice în funcţie de care să se decidă dacă elevul poate să îşi mai continue

69
CORNEL HAVÂRNEANU

cursul. În multe şcoli astfel de evidenţe empirice lipsesc, fiind înlocuite cu punctele de vedere arbitrare
ale profesorilor.

Dificultăţi ale metodei criteriului


Problemele se pot datora restricţiilor metodei criteriului atunci când conţinutul nu este clar
stabilit. Itemii testului trebuie să reprezinte un eşantion din universul de itemi. Din această cauză este
dificil să argumentăm că un scor reprezintă cel mai bun procentaj pentru subiect. Aceasta înseamnă că
acest criteriu de conţinutul poate fi utilizat doar pentru interpretarea scorurilor testului când există un
conţinut specific slab sau ridicat al testului.

CONCLUZI
Criteriul de conţinut este potrivit doar pentru testele de cunoştinţe şi doar atunci când
conţinutul poate fi clar definit. Pentru cel mai scăzut nivel educaţional al claselor primare un
astfel de test poate fi valabil. Schonell (1951) a dezvoltat un set de teste diagnostice pentru
citire când rezultatele indicau aspecte exacte, cum ar fi inversarea anumitor litere, confuzie între
anumite litere.

VI.6.2. Criteriul de predicţie


O altă metodă de interpretare a scorurilor testului şi care nu ţine seama de norme este
probabilitatea ca subiecţii, prin fiecare scor să reflecte un criteriu particular. Trebuie construit un tabel al
aşteptărilor. Există câteva aspecte care trebuie notate.
a. Tabelele de aşteptare pot fi construite doar când sunt posibile criterii clare ale scorurilor. Acest
lucru este posibil doar pentru anumite teste din domeniul industrial şi educaţional. Examinarea
scorurilor şi gradelor reprezintă un bun criteriu pentru tabele de expectanţe, deşi în şcoli şi
universităţi examinările practice nu sunt eliberate de note.
b. Aceste aşteptări nu sunt teoretice ci empirice. Aceasta înseamnă că în studiile realizate pe scară
largă trebuie să avem o populaţie relevantă. Trebuie să avem în vedere problemele legate de
eşantionare pentru stabilirea normelor. În acest sens tabelul probabilităţilor expectanţelor
reprezintă date normative.
c. Tabelul expectanţelor ilustrează o importantă dilemă a psihologiei aplicate şi psihometriei: utilizarea
predicţiei reale în caz individual. Dacă un scor particular la un test indică 0,45 probabilitate pentru
reuşită, aceasta înseamnă că 45% dintre indivizi (în eşantionul normativ) cu un astfel de scor,
promovează examenul. În acest caz tabelele de expectanţă ne arată că 45% dintre subiecţii care
au obţinut acest scor au reuşit la test. Un evaluator ar putea respinge toţi candidaţii cu un astfel de
scor sau i-ar putea accepta pe toţi. Pentru cazurile individuale aceasta ar putea fi decizie
incorectă. Aceasta este dilema psihologiei aplicate. Tabelele expectanţelor pot fi utilizate cu
anumite rezerve.
În construirea tabelului expectanţelor eşantionul poate fi divizat în funcţie de criteriul grupurilor -
reuşita/nereuşita fiind un criteriu obişnuit şi util. Scorurile testului sunt divizate astfel încât să existe un
număr egal de indivizi pentru fiecare grup, cu excepţia extremelor, şi se calculează proporţia de subiecţi
din fiecare grup care a reuşit sau nu la examen. Această proporţie reprezintă, probabilitatea ca indivizii
cu aceste scoruri la test să reuşească la examen.

70
PSIHODIAGNOSTIC (I)

Dacă eşantionarea este săracă şi tabelul expectanţelor va fi cel mai probabil greşit. Este
necesar de un eşantion larg şi reprezentativ pentru realizarea tabelului de expectanţe, dar această
abordare prezintă câteva diferenţe faţă de standardizarea eşantionului. În locul stabilirii poziţiei relative
a scorului subiectului în grupul normativ, tabelul expectanţelor stabileşte poziţia relativă a performanţei
în funcţie de anumite criterii.

VI.6.3. Metoda regresiei


Scorurile ipsative
Aceste scoruri apar în orice test cu răspunsuri forţate, în care fiecare alegere este cotată. De
exemplu, în Testul Mecanismelor de Apărare (Gleser & Ihelevisch, 1969) subiecţii au de ales, pentru
fiecare item, dintre cinci răspunsuri care reprezintă cinci mecanisme de apărare diferite, cele care sunt
mai mult sau mai puţin probabile. Scorul testului reprezintă forţa relativă a capacităţii de apărare a
individului. Trebuie să existe unele corelaţii negative între scoruri ca un artefact al sistemului de cotare,
alegerea unui răspuns să însemne excluderea celorlalte patru. Acest sistem de cotare nu poate fi o
măsură absolută a capacităţii de apărare. Un băutor poate considera whisky-ul ca băutura favorită, apoi
ginul şi coniacul, combinaţia însă este selectată şi de un dipsoman. Aceste alegeri pot fi greu
comparate.
Utilizarea scorurilor ipsative pentru testele cu alegeri forţate are următoarele efecte. Mai întâi
matricea de corelaţie nu are semnificaţie deoarece scalele sunt artificial corelate negativ. Analiza
factorială a corelaţiilor nu poate fi interpretată. În al doilea rând realizarea normelor pentru aceste scale
nu are sens, deoarece scorurile indivizilor nu pot fi comparate.
Ar putea fi folosite normele bazate pe ranguri. Aceasta înseamnă că 60% dintre bărbaţi dau
primul rang intereselor externe, interesul pentru broderie având ultimul rang. Acestea au totuşi o valoare
îndoielnică pentru că distanţele dintre ranguri nu sunt cunoscute.
Scorurile ipsative ale unui test sunt folosite ca bază de discuţie cu subiectul care a rezolvat testul.
Aceasta înseamnă că rangurile scorurilor pot fi explicate. Utilizarea lor este restrânsă la contexte în care
scorurile sunt utilizate ca bază de discuţie şi când cuantificările sunt relativ neimportante. Deci, aceste
teste pot fi folosite în psihologia clinică, orientare profesională şi consiliere, când este important să
există un raport de încredere între subiect şi examinator.

CONCLUZIE
Testele normative sunt superioare testelor ipsative deoarece au o precizie mai mare în
măsurarea caracteristicilor psihologice. Scorurile ipsative sunt potrivite ca bază de discuţie.
Este la fel de posibil ca şi testele normative să fie baze de discuţie, dar prezintă şi avantajul
că fi analizate statistic, lucru care nu se poate realiza în cazul scorurilor ipsative, acesta fiind un motiv în
plus ca ele să nu fie folosite.

71
CORNEL HAVÂRNEANU

VII. TESTELE DE INTELIGENŢĂ

VII.1. CONTEXTUL ISTORIC AL TESTELOR DE INTELIGENŢĂ

Testele de inteligenţă reprezintă unele dintre cele mai vechi teste psihologice. Binet şi Simon
(1905) au dezvoltat aceste teste la Paris, descoperindu-se apoi avantajele lor pentru educaţie. Aceste
teste au fost ulterior dezvoltate, devenind cele mai utilizate teste de inteligenţă cunoscute şi sub numele
de Scala Standford Binet.
În acelaşi timp Spearman (1904) a raportat prima analiză factorială a abilităţilor umane. Autorul
consideră că abilităţile umane sunt explicate în termenii factorului g, un factor de abilitate generală, şi a
factorilor specifici. Spearman a dezvoltat noţiunea de inteligenţă ca factor general, care reprezintă încă
cea mai modernă încercare de măsurare a inteligenţei.

Definiţie inteligenţei şi a factorului g


Jensen (1980) menţionează că există un număr foarte mare de definiţii ale inteligenţei atât
psihologice cât şi nepsihologice. Ascuţit, perspicace şi rapid sunt adesea termeni folosiţi în definiţie,
opuşii lor fiind vag/neclar, lent/apatic şi încet. Astfel de definiţii sunt prea vagi pentru a avea utilitate
ştiinţifică.
Borring (1923) încearcă să depăşească această dificultate definind inteligenţa ca fiind ceea ce
măsoară testele de inteligenţă. Această definiţie este circulară şi inutilă, fără posibilitatea de a defini
precis şi clar ceea ce măsoară testele. Totuşi factorul măsurat de testele de inteligenţă poate fi definit.
Aceste teste măsoară un factor, în mod obişnuit denumit „gf”, aptitudinea fluidă. Un factor poate fi
definit prin variabilele care au pondere mare în acesta. Inteligenţa, dacă o considerăm ca fiind egală cu
aptitudinea fluidă, poate fi obiectiv definită prin factorii care au pondere în aceasta. Astfel, inteligenţa
poate fi văzută ca o abilitate raţională vastă şi de bază, utilă în soluţionarea unei mari varietăţi de
probleme.
Abilitatea de rezolvare a problemelor nu este specifică doar pentru testele de inteligenţă, aspect
demonstrat de faptul că scorurile la testele de inteligenţă corelează cu alte criterii externe, cum ar fi
succesul academic şi performanţa profesională (Jensen, 1980, Kline, 1990).
Putem defini inteligenţa, măsurată de testele de inteligenţă, ca o abilitate raţională de bază a
individului angajat în rezolvarea de probleme de diferite tipuri. Importanţa lui este atestată de faptul că
întotdeauna apare un factor mai larg în orice analiză factorială a abilităţilor. Totuşi inteligenţa se
manifestă prin deprinderi particulare care sunt valorizate prin cultură. Acest aspect al inteligenţei este
definit prin factorul „gc” sau aptitudinea cristalizată, care este aptitudinea fluidă exprimată cultural.
Pentru a înţelege mai bine ceea ce testele de inteligenţă dar şi alte teste de aptitudini sau
abilităţi încearcă să măsoare vom prezenta în continuare structura factorială a abilităţilor.

72
PSIHODIAGNOSTIC (I)

Structura factorială a abilităţilor umane


Structura abilităţilor umane a fost stabilită folosindu-se analiza factorială.
Cattell şi Haktian (1974) au găsit o serie de factori ai abilităţilor primare:
V - abilitatea verbală - înţelegerea cuvintelor şi ideilor. Cuprinde sarcini ca sinonime, înţelesul
proverbelor, analogii. Este probabil cel mai bun indicator al inteligenţei cristalizate – gc;
N - factor numeric - este uşurinţa în a manipula numerele. Acesta se distinge factorial de raţionamentul
aritmetic;
S - factorul spaţial - abilitatea de a vizualiza figuri bi şi tridimensionale atunci când orientarea lor este
alterată;
P - Viteza de percepţie şi factorul acurateţe - implică evaluarea figurilor atunci când perechile de stimuli
sunt similare sau diferite;
Cs - Viteza de închiderea - se referă la abilitatea de completare a gestaltului atunci când lipsesc părţi
din stimuli. Viteza de închidere verbală corelează 0,61 cu fluenţa verbală, ceea ce sugerează că
familiarizarea cu anumite cuvinte are un rol important pentru acest factor;
I - raţionament inductiv - implică inducţia, raţionamentul plecând de la particular la general.
Ma - memoria asociativă sau mecanică - se referă la memorarea perechilor de cuvinte între care nu
există legătură. Aceasta corelează cu testul perechilor cuvânt-număr şi cu testul perechilor figură-
număr;
Mk - abilitate şi cunoştinţe mecanice;
Cf - flexibilitatea de închidere - implică ignorarea stimulilor irelevanţi din câmpul perceptiv pentru a găsi
figurile stimul. Conform lui Cattell şi Haktian acest factor este o manifestare a independenţei şi este
legat de factorul de personalitate independenţă.
Ms - memoria span - este reamintirea de scurtă durată a literelor. A fost utilizată în testul WISC şi
WAIS. Corelaţia între Ma şi Ms este doar de 0,18;
Sp - citirea pe litere - recunoaşterea lipsei literelor/sunetelor din cuvinte. Cattell şi Haktian consideră că
acest factor nu apare ca factor în studiile anterioare, deoarece s-a folosit doar un singur test pentru
acest factor, fiind imposibilă obţinerea unui factor. Deoarece există o bună corelaţie cu V şi W atunci
când se scrie/pronunţă un cuvânt literă cu literă/sunet cu sunet, se consideră că acest factor fie este
primar, fie dependent de aceşti doi factori;
E - judecata estetică - abilitatea de a detecta principiile artistice de bază. La fel ca şi Mk acest factor
este dependent de experienţa anterioară;
Mm - memoria semnificaţiilor - implică învăţarea legăturilor dintre perechile între care există legături cu
sens. Corelaţia dintre Mm şi Ma este de 0,35 ceea ce demonstrează că acestea sunt
comportamental diferite;
O1 - originalitatea flexibilităţii ideatice - rezultă din testele lui Guildford şi Hoepfner (1971) care urmăresc
producerea divergentă a celulelor claselor semantice din modelul lui Guildford. Există o corelaţie
ridicată între acest factor şi Fl şi O2;
Fl - fluenţa ideatică - abilitatea de a reproduce rapid idei pe o temă dată. Se distinge de Wl, fluenţa
cuvintelor şi fluenţa asociativă şi expresivă care nu sunt cuprinse în acest studiu, dar care sunt
analizate de (Guildford şi Hoepfner);
W - fluenţa cuvintelor - rapida producere a unor cuvinte după o literă cerută dar fără a cere şi un anumit
înţeles. Acest factor a fost descoperit anterior de Cattell în 1933;

73
CORNEL HAVÂRNEANU

O2 – originalitate - la fel ca şi O1 este un factor relativ nou descoperit pe baza testelor lui Guildford, în
care subiecţii trebuiau să combine 2 obiecte într-unul nou, funcţional. Testului viza evaluarea
producţiei convergente a transformărilor semantice, în prezent acesta având pondere în factorul
producţie divergentă (Guildford şi Hoepfner, 1971);
A - ochirea - implică coordonarea rapidă ochi-mână;
Rd - abilitatea de reprezentare prin desen - în desenarea obiectelor stimul este cotată precizia liniilor şi
curbelor;
D - raţionament deductiv - implică deducţia, raţionamentul plecând de la general la particular;
Mc - coordonare motorie generală;
Amu - înclinaţie muzicală şi sensibilitate totală - factor descoperit în testul lui Seashore (aptitudine
muzicală);
Fe - fluenţa expresiei - descoperit de Guildford (1967), exprimarea verbală pentru evaluarea ideilor.
ams - viteză motorie - descoperit de Guildford;
asd - viteza de discriminare a simbolurilor - descoperit de Guildford;
J - judecată - abilitatea de a rezolva probleme atunci când judecata şi estimarea au un rol important.
Acest factor a fost descoperit de Guildford;
Factorii de ordinul doi rezultă din corelaţiile dintre factorii primari. Cattell şi Horn (1966) au
descris cinci factori secundari care se bazează pe factorii primari.
gf - inteligenţa fluidă - include inferenţe, inducţie, memoria span, flexibilitatea de închidere, precum şi
viteza intelectuală.
gc - inteligenţa cristalizată - este un factor al testelor tradiţionale. Se bazează pe factorii abilităţilor
verbale, mecanice, numerice şi sociale.
gv - vizualizare - are la bază deprinderile în care vizualizarea este importantă cum ar fi: orientarea
spaţială şi desprinderea marginilor formei. Cattell consideră că în cercetările anterioare vizualizarea
apare ca factor primar.
gr - capacitatea de restabilire sau fluenţa generală - include fluenţa ideatică, fluenţa asociativă, testele
de asociaţii irelevante.
gs - factorul vitezei cognitive - afectează viteza pentru o mare varietate de sarcini. Include viteza în
performanţa mecanică, scriere sau calcul numeric.
Inteligenţa fluidă şi cea cristalizată sunt cei mai largi factori de ordinul doi influenţând mult
varianţa testului de abilitate.

Aptitudinea fluidă şi cristalizată


Natura acestor două abilităţi a fost studiată de Cattell (1967 şi 1971). În concepţia sa inteligenţa
fluidă, care este o abilitate raţională de bază ereditară şi reflectă eficienţa fluxului de informaţii prin
creier care este transpusă în deprinderi valorizate cultural (deferit de la o cultură la alta). Astfel se
produce inteligenţa cristalizată.
Din punctul de vedere al construcţiei testului trebuie făcută o distincţie. Aptitudinea cristalizată
poate fi testată prin intermediul itemilor care solicită cunoştinţe şi deprinderi relevante pe care trebuie să
le aibă indivizii unei culturi. Aptitudinea fluidă poate fi măsurată fie prin sarcini care nu solicită cunoştinţe
sau solicită cunoştinţe care sunt supraînvăţate astfel încât au devenit automate, fie prin intermediul unor
sarcini care sunt atât de inedite încât subiecţii trebuie să le lucreze din nou.

74
PSIHODIAGNOSTIC (I)

Majoritatea testelor de inteligenţă măsoară amestecat atât inteligenţa cristalizată cât şi cea
fluidă.

Factorii g, gf, gc ai lui Spearman


Analiza factorială a abilităţilor a dus la o varietate de factori de structură care au la bază
numeroasele corelaţii dintre variabilele din sfera abilităţilor. Se observă că factorul g pe care multe teste
de inteligenţă încearcă să-l măsoare a fost împărţit în aptitudinea cristalizată şi fluidă. Acestea sunt înalt
corelate la vârstele tinere, însă indivizii învaţă sau nu (în funcţie de familie şi cultură) deprinderi culturale
la nivele diferite.
Nu numai Cattell s-a ocupat de aceste două noţiuni ale factorului g. Carroll (1983) şi colegii au
obţinut independent o structură şi factori primari asemănătoare cu cei ai lui Cattell.
Analiza factorială a postulat structura abilităţilor atât de diferită încât nici un test de inteligenţă
nu ar putea fi construit (Guildford, 1967). Analiza factorială pe bazează pe rotaţiile Procustes, în care nu
trebuie să aveam încredere, apărând probleme de calcul prin aceea că sunt utilizate rotaţiile ortogonale
care automat exclud factorii de ordinul 2 şi astfel factorul g.
Unii autori au încercat să egaleze aptitudinea fluidă cu factorul g a lui Spearman (Undeheim,
1981, Crombach, 1984). Gustaffson (1988) consideră că dificultăţile tehnice asociate identificării pot fi
rezolvate prin analiza probabilităţii maxime. Astfel, aptitudinea fluidă este de fapt factorul g a lui
Spearman, iar aptitudinea cristalizată este echivalentă cu factorul cunoştinţe educative care a fost
extras de Vernon şi cunoscut ca factorul v.ed. Atât gc cât şi v.ed, reprezintă expresii ale aptitudinii fluide
în cultură.
Este mai bine să privim factorul g ca un amestec de cei doi factori, aptitudine fluidă şi
cristalizată, bază a abilităţii raţionale, abilitate de a percepe relaţii şi a deduce corelaţii şi care pot fi
aplicate la orice tip de sarcină.

VII.2. ITEMII TESTELOR DE INTELIGENŢĂ

După ce am definit inteligenţa ca abilitate de bază prin care se deduc corelaţii şi se percep
relaţiile, trebuie să fim preocupaţi de itemi ca pot fi folosiţi pentru a măsura această abilitate. Fluiditatea
intelectuală poate fi măsurată prin intermediul unor sarcini nefamiliare sau cu materiale foarte bine
cunoscute de diferiţi indivizi în procesul de învăţare astfel încât să nu afecteze rezultatele. Inteligenţa
cristalizată poate fi testată cu ajutorul unor materiale care reflectă deprinderile achiziţionate şi valorizate
cultural. În acest caz vor apărea diferenţe în parte datorate educaţiei sau clasei sociale.
Nu vom descrie fiecare tip de item care poate să apară în testele de inteligenţă. Vom discuta
doar despre acei itemi care sunt cei mai frecvent folosiţi şi care au o pondere mare în factorii respectivi.
În testele de inteligenţă este important ca itemii să varieze uşor în dificultate. În scopuri
comparative este util ca acelaşi tip de itemi să fie folosiţi pentru grupe de vârstă diferite. Itemii trebuie să
fie flexibili. Este util ca forma itemului să fie aplicabilă la o mare varietate de situaţii. Există tipuri de itemi
care sunt utilizaţi atât pentru măsurarea inteligenţei fluide cât şi a celei cristalizate. Vom descrie în
continuare diferiţi itemi utilizaţi în testele de inteligenţă.

75
CORNEL HAVÂRNEANU

Analogii
Analogia este un tip de item care se găseşte în cele mai multe teste de inteligenţă. Nivelul de
dificultate este uşor de modificat dacă ţinem seama de relaţia dintre elemente. Datorită înaltului grad de
flexibilitate, pot fi construite analogii pentru o mare varietate de situaţii. Sternberg a analizat factorial
aceşti itemi în încercarea de a clarifica procesele cognitive implicate în rezolvarea de probleme care
solicită inteligenţa.
Exemple de analogii
Exemplele au fost alese pentru a evidenţia modalităţile de măsurare a factorului g.
Analogiile sunt folosite pentru testarea factorului g deoarece soluţiile lor implică deducerea relaţiei
relevante între prima parte a analogiei şi aplicarea acesteia la restul analogiei:
Item 1: Cotobatura este pentru pasăre ceea ce este vipera pentru ...
a. animal, b. furnică, c. peşte, d. pasăre, e. reptilă
Acesta este un item uşor şi este o măsură a gc (inteligenţei cristalizate) deoarece cunoştinţele
biologice elementare necesare pentru rezolvarea acestui item reprezintă o expectanţă culturală. Itemul
este uşor pentru că relaţia cu membrii unei clase este simplă şi pentru că soluţia, de a pune “viperă”
într-o clasă analogă, nu ar trebui să necesite efort la vârsta de 9 ani. Dacă itemul este folosit în studii
interculturale ar putea să apară eşec dacă speciile respective nu sunt prezente în arealul geografic cu
care sunt familiarizaţi subiecţii.

Distractori cu alegeri multiple


Este important ca distractorii să distragă evident. Pentru un item este important să observăm în
ce proporţie subiecţii dintr-un eşantion completează fiecare distractor. Astfel, dacă trei distractori sunt
evident greşiţi, pentru rezolvarea corectă, nimeni nu-i va alege, iar itemul devine uşor de ghicit. Se
întâmplă ca în urma analizei de itemi, un item să fie eliminat deoarece corelaţia acestuia cu scorul total
al testului să fie considerabil redusă.
Uneori este dificil să se conceapă buni distractori. O modalitate de a obţine distractori buni este
aceea de a prezenta itemii unui grup de subiecţi care dau răspunsuri libere. Cele mai frecvente
răspunsuri greşite date de subiecţi sunt considerate ca fiind buni distractori. Poziţia răspunsului corect
trebuie să fie întotdeauna întâmplătoare pentru ca astfel răspunsurile corecte să nu fie date în funcţie
de poziţia lor.
Item 2: Papagalul este pentru pasăre ceea ce este koala pentru ...
a. animal, b. furnică, c. mamifer, d. pasăre, e. reptilă
Acest item reprezintă un echivalent intercultural pentru itemul 1, evident folosit în Australia.
Analiza de item, prin compararea valorilor lui p, a corelaţiilor între item şi scorul total precum şi
ponderea în factor a itemului, permite să vedem dacă aceşti item sunt echivalenţi. De asemenea pot fi
comparate curbele de distribuţie ale itemilor.
Item 3: Samson Agonistes este pentru Comus ceea ce este The Bacchae pentru …
a. Oedipus Rex, b. Medaea, c. The Cyclos, d. Prometheus Bound, e. The Tempest
Am utilizat acest item pentru a ilustra anumite aspecte ale unui item. Este clar faptul că acest item
necesită cunoştinţe literare. Este un item dificil dacă nu ştim cine a scris aceste texte şi natura
cuvintelor. Dificultatea vine mai curând de la conţinutul implicat şi nu de la relaţii. Este posibil ca acesta
să fie un item sărac pentru că relaţia nu este dificil de dedus. Comus este opusul tragediei. The

76
PSIHODIAGNOSTIC (I)

Bacchae este o tragedie lui Eurupide şi trebuie să ne uităm după o lucrare non-tragică. Aceasta este
“Ciclopii” (The Cyclos).
Acest item ilustrează faptul că un item de analogie dificil poate să nu fie o bună măsură nici a
abilităţii cristalizate şi nici a celui fluide, atunci când conţinutul acestora este obscur. În testul de analogii
a lui Miller (Miller, 1970) rezolvarea itemilor presupune un nivel ridicat de informaţii. Itemii măsoară
inteligenţa cristalizată, nivelul ridicat de dificultate al acestora datorându-se dificultăţii relaţiilor dintre
conţinuturile analogiei. Itemul 4 este un exemplu pentru un astfel de item:
Item 4: Televizorul este pentru microscop la fel ca telefonul pentru ...
a. amplificator, b. microprocesor, c. microundă, d. microfon, e. difuzor.
Acest item cu siguranţă necesită anumite cunoştinţe şi el trebuie să măsoare inteligenţa
cristalizată. Totuşi chiar dacă subiectul cunoaşte dispozitivele electronice mici, relaţia care trebuie
dedusă nu este la fel de simplă ca în exemplul anterior. Este o relaţie a distanţei mărimii amplificării în
câmpul vizual. Răspunsul corect este a.
Distractorii acestui item au fost cu atenţie aleşi. Subiecţii care nu vor realiza relaţia precisă vor
alege microfon. Toţi distractorii care au fost aleşi se referă la sunete sau micro pentru a nu permite
ghicirea lor.
Exemplele pe care le-am prezentat reprezintă baze ale analogiilor, dar marele lor avantaj este
acela că pot fi construite foarte multe tipuri de relaţii pe baza lor. Poate fi manipulată mărimea în
analogii:
Item 5: Şoimul este pentru vultur la fel ca duba pentru ... răspunsul corect este camion.
Este un item simplu care măsoare inteligenţa cristalizată şi este folosit pentru copii din şcoala
primară.
Exemplul următor ne arată cât de abstracte pot fi analogiile.
Item 6: mare este pentru enormitate la fel ca obosit, pentru ... răspunsul corect este apatie.
Acest item măsoară gc pentru că depinde de bogăţia vocabularului. Relaţia dintre substantiv şi
adjectiv nu este dificil de dedus. După cum s-a demonstrat (Vernon, 1961) vocabularul este cel mai bun
predictor al abilităţii cristalizate şi raţionamentul verbal are pondere mare în acest factor de ordinul 2.
Toate aceste şase exemple de itemi măsoară inteligenţa cristalizată deoarece raţionamentele
sunt expresia culturii noastre. Acest tip de itemi pot fi folosiţi şi pentru a testa inteligenţa fluidă.
Cattell (1971) argumenta că inteligenţa fluidă poate fi testată folosind itemi care sunt
supraînvăţaţi de subiecţii unei culturi sau itemi care sunt la fel de nefamiliari subiecţilor din punct de
vedere educativ sau social. Relaţiile dintre literele din alfabet şi relaţiile numerice pot fi testate în
analogii. De asemenea pot fi folosiţi itemii vizuali, non-verbali, configuraţii spaţiale.
Exemplele de itemi vizuali, numerici sau alfabetici sunt simple şi pot fi banali pentru a fi adecvaţi
testelor de inteligenţă. Ei au fost incluşi pentru că ilustrează modul în care analogiile pot fi folosite
pentru a măsura inteligenţa fluidă. Pentru aceşti itemi calitatea lor ar trebui determinată prin intermediul
analizei de item sau analizei factoriale.

77
CORNEL HAVÂRNEANU

Item 7.

este pentru la fel ca pentru

a. b. c. d. e.

Aceasta este un exemplu tipic de item non-verbal gc care măsoară abilitatea spaţială. Se
observă că nu este nevoie de nici un fel de cunoştinţe pentru a rezolva acest item simplu. Pot fi
construiţi itemi de acest tip care au un nivel ridicat de dificultate. Similar sunt folosiţi itemi non-verbali
pentru testarea interculturală a inteligenţei.
Item 8: E este pentru H la fel ca G pentru .......
a. P, b. J, c. K, d. O, e. F
Este un item simplu bazat pe succesiunea alfabetică. Tipul de raţionament cerut pentru
rezolvarea itemului este similar celui implicat în rezolvarea itemilor verbali.
Item 9: D este pentru W la fel ca L pentru .............
a. O, b. N, c. T, d. R, e. H
Între D şi W este o relaţie de simetrie, au poziţie simetrică la începutul alfabetului şi la sfârşitul
acestuia. O simetrie asemănătoare trebuie găsită pentru L.
Item 10 25 este pentru 10 la fel ca 53 pentru ..........
a. 2, b. 8, c. 35, d. 15, e. 24
Relaţia nu este evidentă dar nu necesită multă matematică sau abilităţi de calcul pentru a o
descoperi: 10 este produsul dintre 2 şi 5.
Exemplele de analogii prezentate arată cum aceste forme de itemi pot testa abilitatea de a
deduce relaţii de diferite tipuri, de nivele diferite de dificultate şi folosind o varietate de materiale verbale
şi non-verbale. Nivelul de dificultate se referă mai curând la complexitatea relaţiei care trebuie dedusă,
decât la caracterul confuz al informaţiilor necesare.
Un bun test de inteligenţă poate fi construit folosind analogii de diferite tipuri. După cum am
discutat anterior varianţa unui test poate fi împărţită în varianţă adevărată şi varianţă eroare. Scorurile
obţinute la un test nou, construit dintre-un singur tip de itemi, vor fi compuse din varianţa specifică
itemilor. Nu se recomandă în practica psihometrică să se folosească teste alcătuite dintr-un singur tip de
itemi. Astfel Matricile Progresive Raven sunt administrate împreună cu un test de vocabular. MPR
măsoară inteligenţa fluidă în timp ce testele de vocabular măsoară aptitudinea cristalizată. Aplicarea
MPR împreună cu testele verbale au ca scop reducerea varianţei specifice a itemilor.

Alţi itemi folosiţi în testele de inteligenţă


1. Similitudini
Aceşti itemi constau dintr-un set de substantive, verbe, obiecte, numere, forme/figuri care toate,
în afară de unu fac parte din aceeaşi categorie. Subiectul trebuie să aleagă elementul care nu se
potriveşte cu celelalte. Subiectul trebuie să deducă relaţia dintre itemi pentru a stabili asemănările şi
diferenţele dintre membrii clasei. La fel ca şi în cazul analogiilor, această formă de itemi poate fi uşor
manipulată din punctul de vedere al nivelului de dificultate, atât al relaţiilor implicate cât şi al informaţiei
solicitate. Pentru testarea gf va fi nevoie de itemi care necesită un nivel scăzut de informaţii. Pentru

78
PSIHODIAGNOSTIC (I)

testarea gc sunt necesare informaţii despre nivelul educaţional şi clasă socială, deoarece acestea pot
afecta nivelul de inteligenţă fără ca raţionamentul cerut să fie dificil.

Exemple
1. Vrabie, graur, liliac, pescăruş, rândunică. Acesta este un item simplu care măsoară abilitatea
cristalizată şi are la bază abilitatea de a face distincţia între păsări şi non-păsări (mamifere - păsări).
2. Concret, abstract, îmblănit, iubitor, iute. Este un item foarte simplu pentru gc, în care alegerea
răspunsului corect se bazează pe existenţa unui adverb printre adjective. Se observă că răspunsul
corect poate să nu fie concret, la fel ca în cazul substantivelor Acest lucru distinge itemii testului de
inteligenţă de cei ai testelor de cunoştinţe, care de asemenea solicită deducerea relaţiilor
3. 24, 63, 10, 48, 35. Acesta este un exemplu de item numeric, despre care nu ştim sigur dacă
măsoară inteligenţa cristalizată şi care depinde de evidenţele empirice. Relaţia dintre patru numere
constă în faptul că dacă adunăm 1, ele sunt pătrate. Numai numărul 10 din şir nu are această
proprietate. Fiind necesare cunoştinţe de matematică pentru a rezolva acest item problema devine
una de abilitate cristalizată, pentru a descoperi relaţia aceasta.
4.

Acesta este un exemplu de item non-verbal. Este un item uşor. Doar unul dintre itemi nu are linii
drepte, şi nu sunt necesare cunoştinţe pentru rezolvarea lui. De aceea poate fi folosit pentru
măsurarea inteligenţei fluide la copii. Observăm că şi pentru aceşti itemi nu este o problemă
creşterea nivelului de dificultate. Atât inteligenţa fluidă cât şi cea cristalizată poate fi testată folosind
o mare varietate de astfel de itemi.

2. Secvenţe
Această formă de itemi poate fi folosită atât pentru itemii verbali, non-verbali sau numerici,
pentru testarea ambelor aspecte ale factorului g. Totuşi se potriveşte mai bine itemilor non-verbali şi
numerici. În cazul itemilor numerici soluţionarea lor nu implică prea multe cunoştinţe matematice sau de
raţionament. Secvenţele non-verbale sunt singurele forme de item care alcătuiesc Matricele Progresive
Raven. Acesta este unul dintre cele mai bune teste care măsoară abilitatea fluidă (Carroll, 1983).
Exemple de itemi
a) 9, 13, 15, 19, 21....
Acesta este un exemplu de item numeric, pentru a cărui rezolvare nu sunt necesare cunoştinţe de
matematică, deoarece itemul creşte cu 4 apoi cu 2.
b) 0,4, 2,4, 14,4, 86,4 .....
Acest item demonstrează că un item poate fi dificil. Relaţia este simplu de determinat dar necesită
cunoaşterea operaţiilor cu zecimale.
c)

Acesta este cel mai simplu item non-verbal posibil. Credem că este clar cum aceste materiale pot fi
folosite pentru construcţia itemilor.

79
CORNEL HAVÂRNEANU

d)

Această secvenţă este mai dificilă, subiecţii fiind rugaţi să completeze secvenţa selectând răspunsul
corect dintre cinci posibile.
Trebuie notat faptul că în unele situaţii secvenţele pot să nu fie complete. Se dă începutul şi sfârşitul
itemului, iar subiecţii trebuie să completeze mijlocul.
e) minuscul, foarte mic, mic, ............. larg, enorm. Subiecţii trebuie să aleagă între minuscul, mare,
enorm, greu.
Acest item ilustrează secvenţele verbale. Bineînţeles că aceşti itemi se potrivesc doar pentru
abilitatea cristalizată, oferind informaţii despre ponderea vocabularului în gc.
Aceste trei forme de itemi sunt mult utilizaţi în teste de inteligenţă. După cum am văzut aceşti
itemi sunt folosiţi pentru că pot utiliza o varietate de materiale şi pot avea nivele diferite de dificultate. Ei
sunt utili pentru măsurarea ambelor abilităţi.
Pentru a reduce monotonia testării (plictiseala reduce întotdeauna precizia şi validitatea
testului) s-au imaginat şi itemi de bază:
1. Variante ale analogiilor. Heim (1975) a utilizat o variantă interesantă a analogiilor standard. Erau
date două cuvinte subiecţilor. Aceştia trebuiau să selecteze dintr-o listă un cuvânt care se află în
relaţie similară cu ambele cuvinte date. Aceşti itemi pot avea un nivel de dificultate ridicat şi pentru
rezolvarea lor este nevoie de un vocabular bogat. Cu ajutorul lor se testează inteligenţa cristalizată
a subiecţilor cu un nivel educaţional ridicat.
2. Variante ale itemului 2 similitudini. Este prezentată o listă de cuvinte cu trăsături comune. Subiecţii
trebuiau să aleagă din listă un cuvânt sau cuvintele care nu au aceste trăsături comune.
3. Variante ale secvenţelor.
a. subiecţilor le se cerea să găsească itemul din mijlocul unei serii;
b. subiecţilor li se cerea să nu completeze următorul termen ci unul din final;
c. subiecţii trebuiau să rearanjeze termenii în secvenţe.
Rezolvarea acestor itemi depinde de abilitatea de a deduce relaţiile dintre termenii itemului. La
bază stă abilitatea de raţionament care este esenţa inteligenţei, inteligenţa care este definită prin
analiză factorială. Corelaţiile dintre testele de inteligenţă şi criteriile externe indică faptul că abilitatea de
raţionament este utilă într-un larg context de relaţii sociale.
Alte tipuri de itemi
Există şi alte tipuri de itemi care au fost utilizaţi pentru testarea în special a inteligenţei
cristalizate.
1. Vocabular După cum deja am menţionat vocabularul este testul care are ponderea cea mai mare în
factorul inteligenţă cristalizată şi sunt incluse în testele de inteligenţă individuală.
2. Informaţii generale Sunt de asemenea utilizate pentru măsurarea inteligenţei cristalizate. O
persoană mai inteligentă poate vedea mai multe legături între noile materiale şi ceea ce ştie deja în
comparaţie cu o persoană mai puţin inteligentă.
3. Itemi variaţi Jense a realizat un catalog cu itemi care sunt mai buni pentru testele actuale. Mulţi
dintre ei sunt foarte asemănători cu itemii de bază care au fost descrişi.
Această listă cuprinde: asemănări verbale - când două (cele mai asemănătoare cuvinte) trebuie
selectate; opuşi similari - când trebuie realizate perechi de cuvinte antonime; completarea
propoziţiilor - trebuie completate spaţiile albe ale unei propoziţii; proverbe – elucidarea conţinutului
unor proverbe; probleme de raţionament logic; clasificare verbală - când trebuie alese dintr-o listă
cuvintele din categorii asemănătoare; silogisme; sinonime; realizarea din inferenţe plecând de la

80
PSIHODIAGNOSTIC (I)

materialul prezentat; inferenţe sintactice - când înţelesul cuvântului trebuie să fie dedus; „pedigriu” -
descoperirea relaţiilor dintre indivizi; probleme de raţionament numeric.
4. Toţi aceşti itemi verbali sunt exemple ale abilităţii de raţionament pe care testele de inteligenţă
încearcă să o măsoare. Jensen a realizat şi o listă a diferitelor tipuri de itemi non-verbali care pot fi
găsite în aceste teste.
Itemi non-verbali. includ desene care conţin erori ce trebuie descoperite; clasificarea figurilor -
în care trebuie descoperite două figuri care pot fi puse împreună dintr-o serie; figuri încastrate, unde
trebuie descoperită o formă care este încastrată în alte figuri; completarea gestaltului, unde forme şi
figuri familiare trebui completate; figuri reversibile, unde subiecţii trebuie să manipuleze mental forme
geometrice; numărarea blocurilor, unde sunt prezentate blocuri de desene care trebuie numărate
(ultimele două teste măsoară abilitatea spaţială); compararea blocurilor, în care desenele blocurilor
trebuie să fie comparate pentru a judeca asemănarea şi deosebirea; vizualizarea spaţială, în care
subiecţii trebuie să imagineze cum o bucată de hârtie va fi împăturiră pentru a obţine un anumită formă.
Itemii testelor de performanţă includ realizarea unor structuri din mărgele, asamblarea
obiectelor; desenarea oamenilor; găsirea drumurilor prin labirint.
În afara ultimelor două teste toate celelalte tipuri de itemi solicită abilităţi de bază, raţionalizare
şi descoperirea relaţiilor.

VII.3. TESTE DE INTELIGENŢĂ INDIVIDUALE ŞI DE GRUP

Testele de inteligenţă se pot divide în două categorii - teste individuale şi de grup. După cum
sugerează şi numele testelor primele presupun ca subiecţii să fie testaţi cât unul odată, în timp ce
testele de grup presupun ca un mai mare număr de persoane să fie testaţi simultan.

Avantajele testelor individuale


Există câteva avantaje ale testelor de inteligenţă administrate individual, în comparaţie cu
administrarea în grup. În primul rând se elimină o serie surse de eroare cum ar fi: întoarcerea a două
pagini odată sau ruperea creionului sau stiloului. Aceste aspecte au o importanţă minoră dar atunci
când deciziile sunt luate pe baza scorurilor testului aceste surse de eroare trebuie eliminate.
Testele individuale permit cercetătorului să observe cum subiecţii rezolvă itemii. Acest lucru
poate da informaţii în legătură cu dificultăţile pe care le poate avea subiectul. De exemplu, un subiect
poate să găsească un itemi dificil şi să refuze să continue testul până când nu va reuşi să rezolve corect
acel item, chiar dacă nu este capabil de acest lucru. Acest mod de abordare a problemelor poate să
ajute la explicarea dificultăţilor care apar în rezolvarea problemelor din şcoală, universitate sau de la
locul de muncă. Alţi subiecţi lucrează cu mare viteză, iar când se confruntă cu un item dificil ei dau pur
şi simplu primul răspuns care le vine în minte fără să încerce să-l rezolve. Aceste informaţii dau mai
multe informaţii despre subiect decât scorul la testul de inteligenţă.
Un alt avantaj al acestor teste, în comparaţie cu cele de grup, este acela că putem să ne
asigurăm să subiectul a încercat cu adevărat să rezolve itemii, sau dacă acest lucru nu este posibil, cel
puţin să ştim dacă a fost angajat în rezolvarea itemilor testului. Scorul mic la un test se poate datora
faptului că subiectul nu a fost motivat.
Din aceste motive testele de inteligenţă individuală dau cea mai precisă măsură a inteligenţei.
Două astfel de teste au fost dezvoltate de Wechsler (1944, 1974) şi Standford-Binet (Termaan şi Merrill,
1960).

81
CORNEL HAVÂRNEANU

Avantajele testelor de grup


Cel mai evident avantaj al acestor teste, în special în psihologia aplicată, este că permite
testarea unui număr mare de subiecţi odată. Psihologul nu trebuie să aibă acelaşi nivel de pregătire şi
abilităţi ca în cazul celui care realizează administrarea individuală a testelor. Din aceste motive practice
şi financiare testele de grup sunt superioare testelor individuale. Teste de grup sunt cu adevărat
obiective, în timp ce testele individuale sunt subiective pentru că cercetătorul doreşte să realizeze un
profil cât mai bun al subiectului .
Vernon şi Jensen (1961) argumentează că există o corelaţie ridicată între testele de grup şi cele
individuale şi că un test de grup bun poate da o măsură validă a inteligenţei. Cea mai comună metodă de
validare a testelor de teste de inteligenţă de grup este aceea a corelaţiei cu testele individuale.
CONCLUZII
Din mai multe motive testele de inteligenţă de grup sunt satisfăcătoare. Există anumite
probleme specifice legate de persoană care fac ca un test individual să fie preferat, dar nu
trebuie să uităm corelaţia ridicată dintre cele două tipuri de teste.

QI - ul
Coeficientul de inteligenţă, QI, este pur şi simplu un scor standardizat sau normalizat cu o
medie de 100 şi o abatere standard de 15. O astfel de standardizare ne oferă posibilitatea de a face
comparaţii între scoruri şi în acelaşi timp acestea să fie mai pline de semnificaţie.
Iniţial QI era obţinut prin împărţirea vârstei mentale a copilului, care este rezultatul la test, la
vârsta cronologică, rezultatul fiind înmulţit cu 100. Astfel dacă un copil de 12 ani avea o vârstă mentală
de 12 ani, rezulta un QI de 100. Similar la vârsta mentală de 8 ani se obţinea un QI de 66. Ulterior s-a
renunţat la această metodă deoarece s-a constatat că în anumite cazuri atunci când diferenţa dintre
vârsta mintală şi cea cronologică este de un an sau de doi ani se obţine aceeaşi valoare a coeficientului
de inteligenţă.
De exemplu: 6ani/5ani × 100 = 120 şi 12 ani/10 ani × 100 = 120. În cele două cazuri coeficienţii
de inteligenţă sunt identici, deşi în primul caz diferenţa dintre vârsta mintală şi cea cronologică este de
un an iar cel de al doilea caz de doi ani.
De asemenea s-a constatat că după 15 ani vârsta mentală nu mai creşte în acelaşi ritm cu
vârsta cronologică.
Din aceste motive metoda de calcul a QI-ului a fost înlocuită cu scorurile standardizate calculate
prin raportarea performanţei individuale a subiectului la performanţa medie a grupului de vârstă.

TEME OBLIGATORII
TEMA NR. 1
La variabila capacitate generală de argumentare subiecţii testaţi au obţinut rezultatele prezentate mai
jos.
Realizaţi etalonul în decile, respectiv cvartile şi precizaţi în care decil, respectiv cvartil se găseşte un
subiect care a obţinut nota 23,08.
Valori Frecv. Procent Procent valid
2,78 1 2,9 3,4
3,92 1 2,9 3,4
5,41 2 5,9 6,9
9,38 1 2,9 3,4
10,00 1 2,9 3,4

82
PSIHODIAGNOSTIC (I)

10,81 1 2,9 3,4


10,87 1 2,9 3,4
12,12 1 2,9 3,4
13,51 1 2,9 3,4
14,71 1 2,9 3,4
15,56 1 2,9 3,4
16,67 1 2,9 3,4
17,65 1 2,9 3,4
17,95 1 2,9 3,4
19,15 1 2,9 3,4
20,45 1 2,9 3,4
20,59 1 2,9 3,4
21,05 2 5,9 6,9
21,57 1 2,9 3,4
22,86 1 2,9 3,4
23,08 1 2,9 3,4
23,26 1 2,9 3,4
23,53 1 2,9 3,4
24,44 1 2,9 3,4
25,53 1 2,9 3,4
28,57 1 2,9 3,4
30,23 1 2,9 3,4
, 5 14,7 Missing
------- ---- -------
Total 34 100,0

TEMA NR. 2
Un grup de subiecţi care au fost examinaţi folosindu-se un test care măsoară nivelul de umor, a
obţinut următoarele rezultate, M=7,5, SD=3,25
Transformaţi în note Z scorurile brute 2,25, 15,5 şi evaluaţi subiecţii care au obţinut aceste scoruri.

TEMA NR. 3
Un grup de subiecţi a obţinut următoarele rezultate:
Autocontrol: M1=19,8, SD1=3,8;
Nivel motivaţional: M2=5,9, SD2=3,3;
Sociabilitate: M3=14,8, SD3=2,5;
Rezistenţă la oboseală: M4=13,4, SD4=4,3;
Rezultatele obţinute de doi subiecţi la aceste probe sunt:
Autocontrol: S1=26, S2=18;
Nivel motivaţional: S1=24, S2=25;
Sociabilitate: S1=10, S2=3;
Rezistenţă la oboseală: S1=7, S2=25;
Cerinţe:
La care dintre probe a obţinut subiectul 1 cele mai bune rezultate?
La care dintre probe a obţinut subiectul 2 cele mai slabe rezultate?
Realizaţi ierarhia subiecţilor în funcţie de notele obţinute de subiecţi la cele 4 probe.

83
CORNEL HAVÂRNEANU

TEMA NR. 4
Demonstraţi cu ajutorul unui exemplu care este modalitatea de comparare a valorilor diferitelor
categorii sau a rezultatelor între aceleaşi categorii obţinute în două cercetări diferite într-o
scală nominală.

TEMA NR. 5
În urma aplicării unui test s-a obţinut un coeficient de fidelitate rxx1 = 0,63. Abaterea standard a
scorurilor observate este Sx=2,9.
Calculaţi între ce limite se poate situa un scor adevărat al subiecţilor care au acelaşi rezultat
observat de 7, cu o probabilitate de 68%.

TEMA NR. 6
Între variabilele atracţia pentru a anumită profesie şi realizare în plan social s-a obţinut un
coeficient de corelaţie de rxy=0,52. Interpretaţi coeficientul de validitate obţinut.

TEMA NR. 7
Unui grup de subiecţi li s-au aplicat 3 scale: deducţie, evaluare argumente şi evaluare ipoteze.
După realizarea inventarului statistic de bază sumar, s-au obţinut următoarele rezultate:
Deducţie: M1=8,6, SD=1,9
Evaluare argumente: M2=8,7, SD2=2,2
Evaluare ipoteze: M3=9,3, SD=2,1
Doi subiecţi au obţinut următoarele rezultate:
Deducţie: x1=2, x2=11
Evaluare argumente: x1=12, x2=7
Evaluare ipoteze: x1=9, SD=8
1. Transformaţi în note T, stanine şi note sten rezultatele obţinute de cei doi subiecţi
2. La care dintre scale a obţinut primul subiect cele mai slabe rezultate?
3. La care dintre scale a obţinut primul subiect cele mai bune rezultate?
4. Ierarhizaţi subiecţii în funcţie de rezultatele obţinute la cele trei scale.

84
PSIHODIAGNOSTIC (I)

VIII. TESTELE PENTRU ABILITĂŢI DE GRUP ŞI SPECIFICE

După cum s-a constat factorul „g” are două componente care asigură o bună proporţie de
varianţă în măsurarea abilităţii. Există şi factori importanţi pe care testele de inteligenţă nu le măsoară.
Unii dintre aceştia, cum ar fi „W” - fluenţa verbală (abilitatea de a elabora cuvinte pornind de la o literă
dată) par să fie înguşti şi specializaţi, în timp ce alţii, cum ar fi „V” - abilitatea verbală - par să fie mai
largi, de interes mai general. Factorii de vizualizare şi reamintire par să aibă o importanţă mai mare în
viaţa cotidiană.
Testele au fost construite pentru a măsura şi alte abilităţi în afara de inteligenţă. Au fost realizate
teste care să măsoare abilităţi utile în educaţie, pentru selecţie şi orientare, în psihologia industrială
unde se pune accentul pe selecţia persoanelor pentru meserii potrivite. Chiar dacă testele de abilitate,
cum ar fi abilitatea spaţială sau verbală, sunt valabile pentru predicţia succesului educaţional şi
profesional, nu înseamnă că factorul general „g” nu este implicat în rezolvarea de probleme. Factorul „g”
este important, la fel şi ceilalţi factori. De exemplu, un nivel ridicat al lui „g” este necesar atât pentru un
inginer cât şi pentru un bun jurnalist. Totuşi un nivel ridicat al abilităţii spaţiale este necesar pentru un
inginer, dar reprezintă un slab avantaj pentru un jurnalist. Pentru acesta din urmă este necesar un nivel
ridicat la abilităţii verbale.

VIII.1. TIPURI DE TESTE PENTRU ABILITĂŢII DE GRUP


Vom trece în revistă itemii pentru principalele teste de abilitate şi vom discuta despre valoarea şi
avantajele utilizării acestor teste.

VIII.1.1. Teste de abilitate verbală


Esenţa testelor de abilitate verbală este acea de a înţelege cuvintele sau ideile. Ele cuprind
sinonime, înţelegerea proverbelor, vocabular şi analogii verbale. Abilitatea verbală este probabil cel mai
bun indicator al inteligenţei cristalizate.
Itemi
Vom descrie itemii în termenii a ceea ce ei încearcă să măsoare.
Într-unul dintre cele mai bune teste de raţionament verbal „Scala de Raţionament Verbal din
testul de aptitudine diferenţiată” (Bennet, 1962) itemii au o singură formă de tipul analogiilor verbale.
Aspectul psihologic vizat este capacitatea de a stabili categorii pe baza unor caracteristici sau
însuşiri comune între noţiuni.
O colecţie de obiecte sau fenomene reunite în aceeaşi grupare sau categorie, pe baza unor
caracteristici determinate formează ceea ce numim o clasă. Noţiunea rezumă informaţia esenţială cu
privire la o clasă de obiecte sau fenomene.
De regulă conţinuturile semantice din domenii de cunoştinţe bine structurate sunt organizate în
reţele semantice. Reţeaua semantică este formată din noduri şi arcuri. Fiecare nod reprezintă un

85
CORNEL HAVÂRNEANU

concept şi fiecare arc o relaţie dintre concepte sau dintre acestea şi proprietăţile esenţiale adiacente.
Cunoştinţele care alcătuiesc reţeaua semantică sunt organizate ierarhic, în funcţie de gradul lor de
generalitate. Reţeaua semantică conţine două tipuri de relaţii: a) relaţii de subordonare; b) relaţii de
coordonare.
Se face apel la strategia inductivă, subiectul trebuind să găsească o noţiune supraordonată pe
baza desprinderii notelor comune ale unui grup de noţiuni şi să identifice elementele de contrast
(exemplele diferenţiatoare). Strategia inductivă se bazează pe activitatea de analiză şi comparaţie.
Strategia inductivă prezintă la copii (până la 10-11 ani) o formă particulară. Ei nu reuşesc să
extragă informaţia necesară din exemplul diferenţiator.
Sarcina de lucru: subiectul trebuie să identifice cuvintele care nu pot fi incluse într-o categorie cu
celelalte.
De exemplu: aici, azi, ieri, deunăzi mâine
mahomedan, catolic, ortodox, budist, protestant
După cum am menţionat anterior abilitatea verbală are o pondere ridicată în inteligenţa
cristalizată. Testele de abilitate verbală au o validitate ridicată. Ele măsoară abilitatea verbală şi
corelează ridicat cu inteligenţa cristalizată.
Alte teste de abilitate verbală, folosite în special pentru adulţi, conţin pasaje scrise, cu întrebări cu
alegeri multiple pentru a testa înţelegerea. Aceste teste au pondere mare în abilitatea cristalizată şi
adesea sunt folosite ca teste de inteligenţă mai curând decât ca test care măsoară abilitatea mentală.
Testele de abilitate verbală nu pot fi confundate cu cele de cunoştinţe. Cunoştinţele sunt
reprezentate de cunoştinţele de gramatică, vocabular, sintaxă. Aceste teste sunt dependente sau
corelează cu teste de abilitate verbală dar nu sunt identice. Un individ cu abilitate verbală ridicată care
se mută recent în altă ţară cu limbă diferită de a sa va prezenta un nivel scăzut de cunoştinţe în acea
limbă. Atunci când redactăm itemii de raţionament verbal este important să nu includem itemi prea
dificili care necesită cunoştinţe considerabile de gramatică.
Alţi itemi utilizaţi în scalele de raţionament verbal sunt testele de comprehensiune şi înţelegere, în
care se cere subiecţilor să explice înţelesul unor proverbe, în mod obişnuit în forma alegerilor multiple,
şi a testelor de vocabular.
De exemplu: Ce înţelegi prin cuvintele: apogeu, cronică, polemică, pertinent?
Citiţi cu atenţie proverbul „Spune-mi cu cine te însoţeşti ca să-ţi spun cine eşti”.
Cu care din proverbele de mai jos se aseamănă cel mai mult din punct de vedere al conţinutului:
1. Promisiunea dată e datorie curată
2. Buturuga mică răstoarnă carul mare
3. Omul din soţii lui se cunoaşte
4. Cine se scoală de dimineaţă, departe ajunge
5. Cine s-a fript în ciorbă, suflă şi în iaurt
6. Din pomul bun şi roadă bună se face
7. Năravul din fire nu are lecuire
8. Fiecare îşi trage spuza pe turta lui
Itemii acestor teste pot viza şi stabilirea unor relaţii dintre noţiuni. Aspectul psihologic vizat este
capacitatea de a înţelege sensul noţiunilor şi de stabilire a legăturilor dintre acestora, operare cu
raţionamente inductive analogice. Din punct de vedere structural - operatoriu gândirea constă din

86
PSIHODIAGNOSTIC (I)

structuri cognitive (=informaţii structurate) şi operaţii sau secvenţe de operaţii (= strategii) ce se poartă
asupra acestor structuri. Structura cognitivă tipică pentru gândire este noţiunea, care structurează
informaţiile generale, necesare şi esenţiale despre obiect sau stare de lucruri. Operaţiile sau prelucrările
(procesările) la care este supusă informaţia psihică sunt extrem de variate şi organizate ierarhic.
La nivel mediu de analiză a gândirii operaţia cea mai însemnată este raţionamentul (inferenţa).
Raţionamentul inductiv analogic, relevat de acest tip de sarcină, presupune inducerea unei structuri.
Adică, se bazează pe descoperirea unei reţele constante de conexiuni între elementele unei mulţimi şi
apoi aplicarea acestei structuri la o situaţie nouă.
Dacă descompunem raţionamentul reclamat în elemente componente (operaţii minimale),
obţinem şapte elemente componente: codarea, inferenţa, punerea în corespondenţă, aplicarea structurii
descoperite, compararea, justificarea, răspunsul.
Detectarea şi transferul structurii de la o problemă - sursă la o problemă - ţintă este dependentă
de schemele cognitive ale subiecţilor. Schemele cognitive sunt blocuri organizate de cunoştinţe
ireductibile la componentele sale, corespunzătoare unor mulţimi de elemente din realitate.
Cercetările au arătat că dintr-o baterie de teste de inteligenţă, subtestele verbale au valoarea
predictivă cea mai bună pentru reuşita şcolară ţinând cont de implicarea limbajului în procesul de
instruire.
Rezultatele la acest tip de teste sunt puternic influenţate de nivelul cultural.
Sarcina de lucru constă în identificarea legăturilor semantice dintre noţiunile unei perechi date
şi formarea unei noi perechi pe baza relaţiei stabilită anterior. Subiectul trebuie să aleagă al doilea
termen al perechii (primul fiind dat) din patru posibilităţi.
De exemplu:
Cer – albastru Iarbă - ………………/ verde, cardă, mare, deasă
Pasărea – zboară Peştele -…………… / fuge, înoată, sare, rapid
Toate aceste teste au pondere ridicată în abilitatea cristalizată.

VIII.1.2. Abilitatea numerică


Abilitatea numerică este uşurinţa de a manipula rapid şi corect numerele. Nu are o legătură foarte
apropiată cu abilitatea matematică, care corelează ridicat cu raţionamentul inductiv, abilitatea spaţială şi
cei doi factori de inteligenţă. Bineînţeles numerele nu pot fi manipulate făcând excepţie de regulile
matematice, astfel că itemii solicită un nivel minim de cunoştinţe aritmetice.
Itemi
Într-un test pentru adulţi itemii cu alegeri multiple ar trebui folosiţi nu pentru a creşte dificultatea
matematică, ci pentru a testa viteza şi precizia. În testul aptitudinilor diferenţiale, de exemplu, itemii
testează următoarele procese: adiţionarea, extragerea, divizarea, rădăcina pătrată, procentaje, fracţii.
Aspectul psihologic vizat este aptitudinea de a folosi cu uşurinţă simboluri matematice. Se
referă la factorul „N” a lui Thurstone.
Testele ce vizează factorul numeric sunt probe de calcul simplu ce trebuie executat într-un timp
limitat. Factorul numeric astfel măsurat este o aptitudine specifică, primară care nu dă informaţii despre
aptitudinea la matematică. Testul nu face apel la raţionament aritmetic, ci doar la folosirea rapidă de
simboluri numerice.

87
CORNEL HAVÂRNEANU

Factorul „N” este aptitudinea de manipularea rapidă a unui sistem simbolic urmând o serie de
reguli specifice, cu condiţia ca atât sistemul simbolic cât şi regulile să fie perfect asimilate. În cazul
acestui test sistemul simbolic corespunde simbolurilor numerice, iar regulile sunt de operaţie aritmetică
simplă.
Sarcina de lucru: Subiectul trebuie să rezolve itemul, pe baza celor patru operaţii aritmetice,
indicând răspunsul corect din mai multe variante posibile.
De exemplu: Cât este: 5/5/4 a. 1/5 c. 4 e. 25/4
b. 1/4 d. 5
Este clar că abilitatea numerică vizează viteza şi precizia manipulării numerelor. Aceşti itemi nu
solicită o abilitate ridicată de raţionament, de aceea există o corelaţie modestă cu cunoştinţele
matematice.

VIII.1.3. Abilitatea spaţială


Aceasta este abilitatea de a vizualiza figurile cu două sau trei dimensiuni atunci când orientarea
lor se schimbă. Este o abilitate importantă pentru anumite forme de matematică, cum ar fi geometria
sau topografia, anumite domenii din chimie unde structurile sunt importante.
Itemii
În mod obişnuit itemii constau într-o formă urmată de un set de alte forme. Subiecţilor li se cere
să precizeze care dintre formele din set este la fel ca exemplarul rotit. Alţi itemi cer subiectului să
identifice dintr-un set de forme pe cea care este la fel cu prima văzută în oglindă sau răsturnată.
Trebuie să precizăm că itemii spaţiali de acest tip în care formele geometrice sunt reorientate în
spaţiu şi trebuie recunoscute sunt ideale pentru prezentarea în formă computerizată, unde reorientarea
poate fi uşor controlată.
Un alt tip de itemi de abilitate spaţială cuprind o mulţime de blocuri în care înălţimea coloanelor
variază. Subiecţii sunt rugaţi să extragă numărul total de cărămizi din ansamblu, inclusiv pe cele care nu
se văd.
Un alt tip de itemi indică un aranjament de îndoituri ale hârtiei indicând numărul de îndoituri.
Dedesubtul acestora se găseşte o serie de construcţii din foi îndoite, subiectul trebuind să indice din
care dintre ansambluri a fost realizată construcţia.
Aspectele psihologice vizate sunt percepţia şi reprezentarea spaţială (factorii P şi S definiţi de
Thurstone în cadrul teoriei multifactoriale a inteligenţei) - care se referă la vizualizarea spaţială a
obiectelor cu posibilitatea de a imagina în plan mintal elementele “ascunse”.
Factorii prezintă legături puternice cu inteligenţa generală şi sunt cel mai puţin influenţaţi de
mediul socio-cultural al copilului.
Sarcina de lucru: constă în găsirea numărului de cuburi din fiecare construcţie incluzând atât
cuburile care se văd cât şi cele care nu se văd.
De exemplu: Din câte cuburi este compusă următoarea figură?

Sau modele desfăşurate în plan care prin pliere pot forma figuri geometrice:

88
PSIHODIAGNOSTIC (I)

De exemplu: Care din cele patru figuri A,B,C,D, poate fi confecţionată din modelul desfăşurat:
A B C D

VIII.1.4. Viteza de percepţie şi factorul precizie


Acest factor implică recunoaşterea rapidă a detaliilor observate şi abilitatea de a percepe
asemănările şi deosebirile în structura percepută. Se pare că este o abilitate importantă pentru anumite
profesiuni, cum ar cea de pilot sau operator radar în care factorul perceptiv joacă un rol important
(Carroll, 1971, Nunnally, 1978).
Itemii
Viteaza este importantă în măsurarea acestui factor. Itemii nu sunt dificili dacă se dă timp de
lucru nelimitat. Pentru măsurarea vitezei de percepere, de exemplu în Testul de Aptitudini Diferenţială,
itemii conţin forme care trebuie comparate cu alte forme, subiecţii trebuind să marcheze pe cei
asemănători sau diferiţi, sau conţin combinaţii de numere sau litere care trebuie comparate cu alte
combinaţii similare. Numărul mare de itemi trebuie completat într-un timp limită.
De exemplu: care din figurile notate A,B,C,D,E este identică cu figura din stânga imaginii?

A B C D E
VIII.1.5. Viteza perceptivă de închidere
Acesta este un alt factor perceptiv care apare în analiza factorială a testelor. Implică abilitatea de
a completa o formă atunci când lipsesc părţi ale sale. Acestor factor corelează 0,61 cu fluenţa verbală.
Itemii
Cuvintele degradate reprezintă un tip particular de itemi. Cuvintele sunt prezentate cu bucăţi de
litere lipsă, subiecţii trebuind să le identifice. Esenţial pentru această viteză de închidere este aceea că
recunoaşterea actuală poate fi dificilă dacă degradarea cuvintelor este considerabilă. Itemi similar pot
cere subiecţilor să identifice numere sau litere degradate (din care lipsesc bucăţi).
May a utilizat un astfel de test pentru a studia flexibilitatea gândirii. Itemii erau prezentaţi pe
computer, unde degradarea era întrerupând anumite numere sau pixeli relevanţi.
De exemplu: identificaţi cuvântul scris mai jos:

VIII.1.6. Raţionamentul inductiv


Acest factor implică inducţia, raţionamentul pornind de la specific la general. Este o variabilă cu
pondere mare în aptitudinea fluidă.
Itemi
Un test tipic pentru raţionamentul inductiv sunt literele grupate. Sunt prezentate 5 seturi de câte 4
litere. Subiecţii trebuie să găsească regula care leagă cele 4 litere din set şi să selecteze setul care nu
se potriveşte.
De exemplu: alegeţi unul din cele patru seturi de litere care nu se potriveşte să fie împreună cu
celelalte trei:

89
CORNEL HAVÂRNEANU

1. A.B.C.D. 3.M.N.P.S.
2. B.C.D.F. 4. A.E.I.O.
Un alt test este reprezentat de clasificarea figurilor. Fiecare item este reprezentat de 2 sau 3
grupuri, fiecare dintre ele fiind alcătuit din 3 figuri geometrice care sunt asemănătoare prin respectarea
aceleaşi reguli. Al doilea rând al fiecărui item este reprezentat de 8 figuri. Subiecţii trebuie să descopere
regula şi să clasifice aceste 8 figuri în grupuri asemănătoare.

VIII.1.7. Fluenţa ideatică


Este abilitatea de a produce un număr mare de idei pe o anumită temă dată. Se pune accent mai
mult pe viteză şi fluenţă decât pe calitate.
Itemi
Se dă un număr de obiecte cerându-li-se subiecţilor să precizeze cât mai multe moduri posibile
de folosire a acestora. În alt teste est folosită o listă de obiecte care se aseamănă din punctul de vedere
al utilizării.
De exemplu: găsiţi cât mai multe moduri de utilizare a unei cărămizi

VIII.1.8. Fluenţa cuvintelor


Acest factor pune are pune accentul pe creativitate sau gândirea divergentă, în concepţia lui
Guilford. Acest factor corelează cu fluenţa ideatică, dar este diferit de acesta. Implică abilitatea de a
produce cât mai multe cuvinte pornind de la o literă dată, cvinte care să nu fie legate semantic.
Itemii
Să se scrie cât mai multe cuvinte posibil dându-se litera de la început, sfârşit sau ambele litere de
la început şi sfârşit.

VIII.1.9. Originalitate flexibilităţii ideatice


Este o măsură a originalităţii ideilor aşa cum a fost studiată de Guilford.
Itemii
Sunt asemănători cu cei care măsoară fluenţa ideatică. Măsura acestui factor este o evaluare a
originalităţii ideilor produse ca răspuns la un item. Originalitatea poate fi reprezentată de o judecată
subiectivă sau poate fi original în sensul rarităţii, în comparaţie cu normele. Această ultimă formă este
mai precisă în comparaţie cu prima. Totuşi deşi ultima formă este mai precisă decât judecăţile
subiective, este posibil să fie mai puţin validă deoarece raritatea răspunsului nu înseamnă că este
originalitate se referă la sensul cuvântului. Schizofrenicii şi psihoticii pot da răspunsuri stupide care pot fi
cotate în factor. De exemplu, la modalităţile de utilizare a penei, un subiect poate scrie microscop, scalp
şi ţintă nucleară, acestea pot fi utilizări normativ originale, totuşi total ridicole.

VIII.1.10. Originalitate 2
Acest factor este relativ nou, fiind extras de Cattell (1974) din primul factor originalitate. Diferă ca
sens de originalitate, aici trebuind să fie utilizată în situaţii de constrângere şi există itemi tipici pentru
măsurarea lui.

90
PSIHODIAGNOSTIC (I)

Itemi
Subiecţii sunt rugaţi să combine două obiecte pentru a realiza un nou obiect funcţional. Poate fi
obţinută şi o măsură a fluenţei ideatice la fel de bine ca şi o măsură a factorului originalitate.
Acesta acoperă tipurile de itemi folosiţi pentru a măsura 10 dintre cei mai importanţi factori
primari. Unii dintre aceşti itemi au fost discutaţi în lista care cuprindea variate tipuri de itemi ale testelor
de inteligenţă. Factorul de compensaţia gr, care este aspectul educaţional cel mai important pentru
factorii de ordinul 2, apare din cei doi factori de inteligenţă, fiind că îmbrăţişează originalitatea şi fluenţa
care corelează cu creativitatea cel puţin pentru a limita extinderea/evaluarea.

VIII.2. AVANTAJELE MĂSURĂRII FACTORILOR PRIMARI

Deşi multe dintre testele care măsoară factorii primari au pondere în structura factorilor
secundari, se poate pune întrebarea de ce mai avem nevoie de aceste teste care măsoară factorii
primari. În aplicarea testelor psihometrice în domeniul educaţiei, clinic şi profesional este nevoie uneori
să măsurăm una dintre abilităţile mai specifice ale subiectului. De exemplu, dacă dorim să selectăm
subiecţii pentru zboruri de antrenament cu elicopterul, vom selecta subiecţii care au abilitate spaţială şi
ne-am concentra asupra acesteia. Acum factorul de vizualizare este important, dar am fi mult mai
precişi dacă am testa separat factorii primari care compun acest factor secundar. Am obţine două
scoruri identice la al doilea factor dar care sunt compuse din scoruri diferite ale factorilor de ordinul 1.
Nu înseamnă că factorii de ordinul 2 nu sunt importanţi. Pentru multe situaţii testele de inteligenţă
sunt cea mai utilă măsură. Una dintre problemele testării unui număr mare de factori primari este acea
că ele tind să coreleze, varianţa lor fiind explicată de factorul g. Aceasta este problema principală a
testelor de aptitudini. Ele nu diferenţiază destul între aspectele primare ale factorului g.

VIII.3. TESTE DE ABILITATE SPECIFICĂ ŞI ALTE TESTE

Din cauza naturii analizei factoriale nu putem spune că există un număr finit de abilităţi umane.
Factorii primari explică mult din varianţă atunci când se foloseşte un număr mare de teste de abilitate.
După cum argumentează Cattell multe dintre testele în varianta creion-hârtie (în forma modernă teste
computerizate) măsoară diferite abilităţi care sunt utile pentru educaţia academică. Totuşi sunt multe
abilităţi care pot fi observate în viaţa cotidiană şi pentru care nu există teste, cum ar fi de exemplu,
abilităţile practice ale meşteşugarilor. Dacă aceste abilităţi şi deprinderi ar fi supuse analizei factoriale
este posibil ca să deducem noi factori.
Apare problema diferenţei dintre un factor general şi un factor specific. Pentru toate testele
construite există pericolul obţinerii unui factor specific folosind un număr mare de itemi similari. Aceşti
factori nu corelează decât cu itemi similari. Acest lucru a apărut, parţial, în modelul abilităţilor umane a
lui Guilford (1967) care postulează existenţa a 120 de abilităţi.
În psihometrie există un acord asupra faptului că există un anumit număr de abilităţi speciale, şi
testele pot fi divizate pentru a le măsura. Vom discuta în continuare despre aceste teste care vizează
abilităţi speciale.

91
CORNEL HAVÂRNEANU

Abilitatea muzicală
Shuter (1968) consideră că aceste abilităţi pot fi măsurate folosind mai multe tipuri de teste.
Acest lucru este surprinzător ştiind că abilitatea mentală este diferită de inteligenţă precum şi de alte
abilităţi, nu sunt suficiente pentru expertiza aptitudinii muzicale. Se poate argumenta că îndemânarea
muzicală reprezintă pur şi simplu cunoştinţe pe care oricine le poate dobândi. Aceasta este concluzia
unui studiu realizat pe muzicieni. Este adevărat că cu efort o anumită măiestrie în muzică poate fi
obţinută de mulţi oameni. Totuşi viteza cu care muzicienii talentaţi învaţă, sugerează că trebuie să
existe abilităţi speciale. Există un număr de abilităţi speciale, dar cea mai renumită este cea dezvoltată
de Seashore (1919) în cercetările făcute asupra abilităţii mentale.
Itemii
Cele mai multe teste de abilitate mentală conţin itemi pe care orice muzician le-ar poseda. Sunt
măsurate înălţimea schimbării, analizele acordurilor, memorie, ritm, armonie, intensitate. Unele teste
folosesc pianul, altele tonurile pure. Seashore a încercat să măsoare abilităţile muzicale de bază, în
sensul tonalităţii, ritmului şi auzului muzical. Acestea corelează din punctul de vedere a lui Shuter
(1968) ca un factor muzical general.

Abilitate artistică
Abilitatea artistică are sens în explicarea diferenţelor individuale ale abilităţii de a desena, de a
picta şi a măiestriei artistice, deşi nu este nici o îndoială că exerciţiul şi metodele bune pot duce la
dezvoltarea abilităţilor artistice. Totuşi factorii care intră în alcătuirea abilităţilor artistice sunt
necunoscuţi.
La aceasta se adaugă faptul că selecţia în şcolile de artă se face, în mod obişnuit pe baza
performanţelor. Cel mai cunoscut test este Testul Evaluării Artei a lui Meier (1963), care cerea
subiecţilor să evalueze care dintre desene este mai bun, unul fiind o lucrare de artă iar celălalt o
versiune alterată. Nu există dovezi că acesta ar fi un test valid şi este îndoielnică încredere într-un
astfel de test.

Abilităţile copiilor mici


Psihologii care activează în domeniul psihologiei dezvoltării au realizat un număr de măsurători în
speranţa de a măsura inteligenţa sau dezvoltarea intelectului de la vârste foarte fragede, din momentul
în care copilul este capabil să răspundă. Scala de dezvoltarea a copiilor realizată de Bayley (1969), de
exemplu, este potrivită pentru copii de 2-30 de luni. Acest test reprezintă o măsurare tipică a abilităţilor
copiilor.
Testul de dezvoltare Gesell măsoară dezvoltarea mentală, dezvoltarea motorie, dar şi
comportamentul social la copilului, pe o scală de evaluare. Noţiunea de item este dificil de aplicat
deoarece copilului i se prezintă un sunet de clopoţel, examinatorul notând reacţia acestuia. Un alt item
este întoarcerea pentru a observa un obiect în mişcare. Aceşti itemi se aplică la vârste foarte fragede,
măsurând atenţia şi răspunsul. La vârsta de un an itemii se concentrează spre măsurarea abilităţii de
comunicare şi a dezvoltării conceptelor. Se consideră că şi imitaţia reprezintă un indicator important al
dezvoltării în scala Bayley, copiilor cerându-li-se să manipuleze păpuşi, căni, jucării, şi să mâzgâlească.
Aceste comportamente sunt urmărite atât spontan dar şi ca imitaţie.

92
PSIHODIAGNOSTIC (I)

Problema scalei Bayley, la fel ca şi a altor scări de măsurare a dezvoltării, este slaba corelaţie cu
inteligenţa măsurată mai târziu. Damarin (1978) afirmă că este greu să stabilim clinic sau în termeni
teoretici ce anume determină aceste rezultate. De fapt scorurile nu corelează ridicat cu QI-ul de mai
târziu pentru că conţinutul este total diferit.
Considerăm că aceste scale de măsurare a dezvoltării copiilor evaluează dezvoltarea dar nu sunt
legate de inteligenţă stabilită ulterior. Cattell (1971) sugerează că acest lucru nu trebuie să ne surprindă,
pentru că viteza de dezvoltare a diferitor specii, chiar şi a mamiferelor corelează negativ cu poziţia lor
pe scara filogenetică.
Aceste scări se pot dovedi utile pentru diagnosticarea unor cazuri severe de retard cu o bază
organică. Nu sunt recomandate ca indice al inteligenţei pentru cazurile normale, nemedicale.

Abilităţi fizice şi psihomotorii


Au un rol important în sport dar şi în cadrul anumitor sarcini, cum ar fi scrierea şi dactilografierea.
Aceste abilităţii motorii au fost obiect de studiu în mai multe cercetări realizate de Fleishman şi
colegii (Fleishman, 1964, 1975, Fleishman şi Quaintace, 1984). Au fost izolaţi 19 factori principali.
Aceşti factori au fost rezumaţi de Peterson şi Bownas (1982), considerându-se că ei sunt o bună
măsură a naturii acestor abilităţi psihometrice.
1. Forţa statică: gradul forţei musculare exercitat pentru a mişca continuu un obiect greu. Test –
dinamometru.
2. Forţa explozivă: abilitatea de a mobiliza energia pentru un efort exploziv, ca în aruncare.
3. Forţa dinamică: braţe şi trunchi puternice pentru a mişca continuu greutatea propriului corp.
4. Rezistenţă: abilitatea de a menţine activitatea fizică pe o perioadă îndelungată de timp.
5. Evaluarea flexibilităţii: abilitatea de a îndoi/flexa grupuri de muşchi.
6. Flexibilitatea dinamică: abilitatea de a repeta mişcările trunchiului sau ale membrelor atunci când
sunt cerinţe legate de viteză şi flexibilitate.
7. Echilibrul corpului: abilitatea de a menţine corpul în balans.
8. Timpul de alegere a reacţiei: viteza de reacţie la un stimul atunci când se prezintă mai mulţi stimuli.
9. Timpul de reacţie: viteza de reacţie la un singur stimul.
10. Viteza de mişcare a membrelor: viteza cu care pot fi executate mişcări ale membrelor.
11. Viteza încheietură-deget: viteza de execuţie a mişcărilor di articulaţia mâinii
12. Coordonarea corpului: abilitatea de a coordona trunchiul.
13. Coordonarea membrelor: vizează abilitatea de a coordona membrele
14. Dexteritatea degetelor: abilitatea de a coordona mişcarea degetelor. Nu se referă la abilitatea de a
manipula maşini sau de a controla mecanisme diferite.
15. Dexteritatea manuală: similar cu cea anterioară, dar se referă la mâini.
16. Siguranţa/precizia braţ-mână: abilitatea de a face mişcări braţ-mână precise şi sigure.
17. Nivelul controlului: abilitatea de a face ajustări motorii în timp pentru a schimba relativ viteza faţă de
o ţintă în mişcare.
18. Precizia controlului: abilitatea de a controla mişcările musculare necesare pentru a lucra la o
maşină sau de a controla mecanisme.

93
CORNEL HAVÂRNEANU

La fel ca în cazul listei factorilor cognitivi, care reprezintă cele mai importante variabile din
domeniul cognitiv care trebuie măsurate, lista prezentată mai sus prezintă cele mai importante variabile
în domeniul psihomotor.
Unii dintre factori nu au o componentă psihologică, cum ar şi rezistenţa sau viteza membrelor
(există o componentă psihologică determinativă atunci când persoana abandonează sarcina), în timp ce
alţi factori, cum ar fi viteza de reacţie şi alegerea reacţiei corelează ridicat cu inteligenţa (variabilitatea
reacţiei s-a sugerat că ar fi o posibilă măsură obiectivă a variabilităţii QI-ului) (Jensen, 1980, Kleine,
1990).

Testele psihomotorii
Multe dintre testele care măsoară aceşti factori sunt pur şi simplu teste fizice. Testul Purdue
Pegboard constă într-o placă de lemn cu goluri în care subiecţii trebuie să introducă forme. Testul
rotorului constă într-un plan cu un spot pe care subiectul trebuie să menţină un cursor. Se înregistrează
dacă contactul este menţinut sau nu. Măsurarea timpilor de reacţie pentru stimuli luminoşi
corespunzători unor taste care trebuie apăsate când apare lumina. Poate fi măsurat timpul de reacţie al
subiectului atunci când acesta stă cu mâna pe un buton, dar şi timpul de mişcare pentru a căuta butonul
necesar pentru a da răspunsul. Variabilitatea timpilor de reacţie corelează 0,40 cu factorul g.
O măsurare interesantă a realizat Fleishman pentru a prezice succesul în meserie în selecţia
ocupaţională. Corespunzător acestor factori psihomotori autorii au realizat scări de măsurare pentru
diferite posturi, astfel ca postul şi persoana să se potrivească. Aceşti factori sunt mai curând fizici decât
psihologici, corelează cu performanţa din viaţa reală şi variază în diferitele stadii de educaţie
(Fleishman, 1966). Aceste probe sunt utile pentru selecţia profesională în sarcini specifice.

94
PSIHODIAGNOSTIC (I)

IX. TESTE DE ABILITĂŢI ŞI CUNOŞTINŢE

II.1. SENSUL APTITUDINII


Termenul de aptitudine, în limba engleză, este frecvent folosit pentru a desemna o capacitate
naturală, potrivită şi chiar inteligenţa. Este utilizat în mod obişnuit pentru a descrie o persoană care are
aptitudine, de exemplu, pentru calculatoare sau pentru matematică. Aptitudinea este de asemenea şi
termen psihologic, existând o varietate de teste de aptitudini, unele larg utilizate, cum ar fi Testul
Aptitudinilor Diferenţiale - DAT (Bennet, 1962). Este clar că aptitudinea este un cuvânt care are mai
multe înţelesuri şi este important să se definească precis ceea ce se înţelege prin aptitudine sau cel
puţin să se clarifice ambiguitatea conceptului. Acest lucru este necesar pentru că testele sunt definiţii
operaţionale ale variabilelor.
În psihologie aptitudinea se referă la un ansamblu de abilităţi care pot avea o anumită valoare
într-o cultură dată. Astfel în DAT putem găsi atât teste verbale cât şi neverbale. Aceste două tipuri de
teste relevă confuzia din cadrul conceptului care include ambii factori (verbal şi nonverbal) cât şi unele
abilităţi şi deprinderi separate.
Astfel abilitatea verbală este un factor primar, „V”, dat de sinonime, înţelesul proverbelor şi
analogii. Aptitudinea de scriere nu emerge ca un factor. Este o colecţie de abilităţi care poate fi utilă în
societatea modernă, birocratică. Ea implică, de exemplu, viteză şi precizia copierii şi scrierii, calcule
simple, verificarea conştientă a listelor şi abilitatea de a rezista la sarcini monotone. Nu este doar
multifactorială, deoarece multe dintre acestea sunt mai mult caracteristici temperamentale decât
aspecte care ţin de sfera abilităţilor. Psihometric, aptitudinile amintite mai sus sunt distincte.

Teste de aptitudine
Testul de aptitudine verbală se referă la testarea factorului de abilitate verbală. Testul aptitudinii
de scriere este un amestec de itemi. Acest ultim tip de aptitudine ar trebui să fie construit empiric
selectând itemi care să discrimineze între subiecţii care nu posedă aptitudinea. Examinarea bateriilor de
teste de aptitudine confirmă această analiză, multe dintre ele conţin teste de acest tip: unifactoriale şi
multifactoriale.

Problemele testelor de aptitudini


Unul dintre cele mai folosite teste de aptitudini pentru selecţie şi orientare profesională este DAT
(Bennet, 1962). Vom discuta despre variabilele care sunt măsurate pentru a înţelege mai bine
dificultăţile generale implicate în folosirea testelor de aptitudini. Acestea sunt: testul de raţionament
verbal, abilitate numerică, raţionament abstract, viteza şi aptitudinea de scriere, raţionament mecanic,
relaţii spaţiale, gramatică şi silabisire (scriere literă cu literă).

95
CORNEL HAVÂRNEANU

IX.1.1. Testele trebuie să fie unifactoriale


Teoria clasică a erorii de testare stă la baza metodelor de construcţie a testelor folosite de
psihometricieni. Este clar că pentru a realiza o bună testare, testele să fie unifactoriale. Numai în cazul
în care avem două scoruri identice putem vorbi de semnificaţie psihologică identică. Testele
multifactoriale sunt cel mai bine înlocuite cu teste care măsoară separat fiecare factor. Dacă se face
acest lucru este posibil să se dovedească puterea de predicţie prin ponderea diferită a factorilor,
această pondere fiind determinată prin realizarea regresiei multiple pentru criteriu. Astfel, pentru
aptitudinile de scriere s-a realizat o corelaţie multiplă între testele separate pentru diferiţi factori putând fi
calculată astfel performanţa în acest domeniu, mărimea coeficienţilor β fiind folosiţi pentru a vedea
ponderea scorurilor testului.
Examinarea variabilelor DAT ilustrează problema testelor multifactoriale. Am menţionat deja
testul pentru aptitudinea de scriere, dar testele de gramatică şi citire/scriere pe litere vizează clar
aspecte ce ţin de cunoştinţe. Un scor de 12,1 la factorul de citire/scriere pe litere nu înseamnă exact
acelaşi lucru cu abilitatea de a citi/scrie pe litere (care se bazează pe percepţia cuvintelor incorecte) şi
corelează cu abilitatea verbală „V” şi fluenţa verbală „W”. Factorul de citi/scrie pe litere este probabil
limitat, iar testul de citire/scriere pe litere din DAT are pondere în acest factor împreună cu „V” şi „W”.
Testul de citire/scriere pe litere este un exemplu de variabilă multifactorială şi este fără îndoială util în
munca aplicată pentru a şti dacă o persoană poate sau nu citi/scrie pe litere.
Testul de a citi/scrie pe litere poate fi util în orientarea şi selecţia profesională şi reprezintă un
argument în favoarea ideii că testele unifactoriale trebuie alese de fiecare dată când este posibil.
Citirea/scrierea pe litere nu este o aptitudine ci o cunoştinţă. De aceea nu ar fi nici un motiv ca o
cunoştinţă, definită ca o informaţie să fie unifactorială. Citirea/scrierea pe litere poate fi dependentă de
achiziţionarea a 2 factori: abilitatea verbală şi fluenţa verbală. Aptitudinea de scriere este mai curând
este un set de abilităţi necesare pentru un set particular de deprinderi. Deoarece a citi/scrie pe litere
este o cunoştinţă, aptitudinea poate fi considerată ca având mai multe componente, factori puri, separaţi
de abilităţi şi cunoştinţe. În realitate lucrurile nu stau chiar aşa. Pur şi simplu cunoştinţele sunt utile în
multe meserii. Chiar dacă nu este o aptitudine este bine să se includă un test care să fie utilizat pentru
orientarea şi selecţia profesională. Acelaşi argument se aplică şi pentru testul de gramatică, deşi aici
cunoştinţele sunt mai mult decât o funcţie doar a factorului V.

IX.1.2. Factorul g şi testele de aptitudini


O altă problemă a testelor de aptitudini se referă la faptul că în ciuda multitudinii variabilelor, ele
sunt rar diferenţiale. Acest lucru se datorează intervenţiei factorului g (Quereshi, 1972). Manualul
testului DAT relevă o dificultate comună tuturor testelor de aptitudine. Astfel, inginerii au un scor mare la
toate grupele de teste nu doar la aptitudinea mecanică. Dacă încercăm să folosim DAT pentru orientare
sau selecţie, rezultatele nu ne vor ajuta. Suma scorurilor la DAT este probabil cel mai bun predictor al
succesului în meserie, fiind o bună măsură a factorului g.
Rezultatele indică faptul că ingineri, dintre toate grupele testate, au cel mai ridicat nivel la factorul
g şi că scalele din DAT au pondere mare în factorul g. Esenţial este că aceste scale măsoară factorul g.
Totuşi factorul g este măsurat folosindu-se un conţinut specific al unui test particular de aptitudini. Dacă
g trebuie măsurat atunci este mai bine să se folosească scale necontaminate de alţi factori. Informaţiile

96
PSIHODIAGNOSTIC (I)

obţinute în urma aplicării bateriei DAT ar putea fi obţinute mult mai eficient folosind un test de
inteligenţă.
Un posibil contra argument este acela că influenţa factorului g s-ar manifesta printr-un nivel mai
ridicat al scorurilor, dar evidenţiind profilul scorurilor la testele de aptitudine. Din nefericire acest lucru nu
se întâmplă. În parte acest lucru este cauzat de faptul că nu toate scalele sunt în mod egal saturate de
factorul g.
Puterea diferenţială a testelor de aptitudine este iluzorie deoarece scalele au pondere diferită în
factorul g. Quereschi (1972) prezintă rezultatele obţinute cu ajutorul analizei factoriale relevând 4 factori
care acoperă cel mai mult din varianţă. Ar fi fost interesant să vedem puterea predictivă a testelor de
aptitudine după ce factorul g ar fi extras. O analiză factorială oblică permite investigarea influenţei
factorului g deoarece aceşti factori sunt corelaţi.
Există corelaţii între testul DAT şi testul de inteligenţă Otis, 0,81 cu raţionamentul verbal, 0,69 cu
abilitatea numerică, 0,65 cu raţionamentul abstract, 0,58 cu relaţii spaţiale, 0,61 cu raţionamentul verbal,
0,31 cu precizia şi viteza de scriere, 0,48 cu citit/scris pe litere, 0,48 cu logica propoziţiilor. Aceste
corelaţii argumentează faptul că testul DAT este în principal un test de inteligenţă ineficient.
Pentru selecţia şi orientarea profesională avem nevoie de mai multă informaţie decât ne poate
oferi factorul g. Acestea pot fi date prin măsurarea altor grupe de factori, cum ar fi abilitatea spaţială şi
verbală. Un test de aptitudine constă în teste pentru diferite grupuri de factori şi o colecţie arbitrară de
deprinderi.

IX.1.3. Aptitudini şi capacităţi


Adesea se face confuzie între termenii de aptitudine sau potenţial şi cel de capacitate.
Aptitudinea se referă potenţialul individului în achiziţionarea unor deprinderi capacitatea sau abilitatea
se referă la posedarea unor deprinderi care au fost achiziţionate prin experienţă sau antrenament
deliberat.
Când selectăm indivizii pentru un curs de pregătire sau pentru anumite locuri de muncă (cum
este selecţia soldaţilor), măsurarea abilităţii este esenţială. Aici trebuie să măsurăm abilităţile principale
care sunt implicate în ocupaţie. În general selecţia de personal nu se realizează aşa. În multe cazuri
avem de a face cu indivizi care deja au deprinderile şi pregătirea necesară. Pentru aceste situaţii un test
de aptitudini oferă informaţii mai semnificative. Dacă dorim un chirurg vom alege pe cineva care are
diploma nu una care are capacitate.
Dacă indivizii au deprinderile şi pregătirea achiziţionate este mai bine să folosim aptitudinile ca
măsură a selecţiei decât abilităţile sau capacităţile. Pentru tinerii care doresc să participe la un curs de
pregătire testele de aptitudini sunt utile pentru diferenţiere. După cum am arătat ele tind să măsoare
doar aptitudinea generală, care este mai bine măsurată printr-un test de inteligenţă. Dacă un factor sau
un grup de factori specifici sunt mai importanţi pentru un post atunci se vor folosi teste pentru aceşti
factori.
În consecinţă testele de abilităţi nu sunt valabile aşa cum sugerează numele lor. Valoarea testul
DAT rezidă în măsurarea inteligenţei generală şi a grupului de factori specifici. Pentru multe posturi
aptitudinile sunt cel mai sensibil indice al performanţei. Dintre subiecţii care au acelaşi nivel al
deprinderilor se va selecta persoana cu cel mai ridicat scor a lui g, deoarece este mult mai probabil ca
aceasta să aplice mai bine cunoştinţele şi să achiziţioneze noi informaţii pentru a progresa.

97
CORNEL HAVÂRNEANU

Testele de abilităţi şi cunoştinţe


Toate testele care evaluează cum stăpânesc subiecţii un anumit câmp sunt teste de abilităţi sau
de cunoştinţe. Astfel, probele folosite pentru examinarea publică din şcoală, universitate sunt toate teste
de abilităţi şi de cunoştinţe. Aceste sunt teste cu calitate ridicată şi unele dintre ele, care se potrivesc
criteriilor psihometrice sunt teste bune.
Criteriile unui bun test de abilităţi şi cunoştinţe
1. Trebuie să acopere conţinutul cursului sau la domeniului de cunoştinţe. Una dintre problemele
acestor teste este că nu acoperă întreaga arie a cursului, candidaţii putând promova cunoscând
doar o mică parte din curs.
2. Trebuie să fie solid. Adică trebuie să aibă un număr mare de itemi şi să fie obiectiv cotat.
3. Trebuie să fie valid. Multe teste nu sunt valide, deşi curios multe dintre ele sunt utile pentru scopuri
de selecţie. Astfel dacă se cere subiecţilor să realizeze un eseu este evidenţiată abilitatea verbală.
Pentru o bună examinare a cunoaşterii limbii engleze se folosesc teste de cunoştinţe, teste pentru
măsurarea factorului g şi de abilitate verbală. Toate aceste caracteristici sunt valabile, dar este mai
bine să fie măsurate separat. Se poate pune şi problema de a selecta absolvenţi pentru un post.
Absolvirea liceului poate reprezenta un efort ridicat de învăţare dar nu şi un nivel ridicat al
inteligenţei sau abilităţii verbale. Pe de altă parte poate fi nevoie de un nivel ridicat al inteligenţei dar
de puţine cunoştinţe. Testul pe care îl vom alege va depinde de natura postului care trebuie ocupat.
Unii educatori pot fi mulţumiţi dacă testează abilitatea verbală şi inteligenţa, considerând că acestea
sunt caracteristici suficiente de promovare la un nivel superior de şcolarizare. Alţii îl privesc ca
asimilarea integrală a unui curs. De exemplu, examinarea medicală este privită ca un test de
cunoştinţe pe care subiecţii trebuie să-l rezolve în proporţie de 100% pentru a promova.
Psihometric, cea mai bună soluţie a fost găsită de universităţile americane. Selecţia doctoranzilor se
face după inteligenţă, abilităţi verbale şi numerice, pentru a vedea dacă studenţii sunt suficient de
capabili. Gradul/diploma/treapta de examinare sunt acordate prin măsurarea pur şi simplu a
abilităţilor.
Caracteristicile unui bun test de abilităţi şi cunoştinţe
1. Mulţi itemi aleşi pentru a acoperi întregul câmp. Pot fi consultaţi experţi pentru a verifica. Aceasta
implică consultaţii cu specialişti asupra diferitor subiecte pentru a specifica ce trebuie ştiut, în
diferite stadii, pentru acele specialităţi. Pentru testarea copiilor trebuie să fim capabili să specificăm
ce trebuie ca aceştia să cunoască la fiecare vârstă. Specialiştii trebuie să ierarhizeze diferitele
aspecte ale unui materii după importanţa lor.
2. Selecţia itemilor să ţină seama de criterii definite obiectiv. Pentru aceasta este necesar că
obiectivele să fie cât mai clare pentru a fi folosite la evaluarea itemilor. Schonell şi Schonell (1950)
au realizat un test pentru diagnosticarea dificultăţilor subiecţilor la aritmetică sau citire/scriere pe
litere. Acest test a fost în aşa fel divizat încât se pot descoperi exact dificultăţile cu care se
confruntă subiecţii, de exemplu confuzia între b şi d. Aceste teste sunt foarte utile pentru
diagnosticul dificultăţilor de învăţare şi reprezintă forme speciale ale acestor teste. Testele care au
conţinutul precis selectat pot duce la obţinerea unor scoruri care să fie folosite drept criterii de
referinţă. Dacă un subiect are scorul 85 la un test de matematică, criteriul de referinţă al scorului ar
indica faptul că subiectul a rezolvat corect 85% dintre problemele de algebră care implică
inversiunea matricei.

98
PSIHODIAGNOSTIC (I)

3. Itemii trebuie să acopere toate nivelele de dificultate pentru a asigura o distribuţie normală şi
simetrică.
4. Itemii să fie cotaţi obiectiv.
5. Norme bune. Este valabilă standardizarea.
6. Testele de aptitudini se potrivesc unei scale Rasch. sau altor modele derivate din teoria răspunsului
la itemi.

IX.2. FORMELE ITEMILOR ÎN TESTAREA ABILITĂŢILOR ŞI CUNOŞTINŢELOR


1. Itemi cu alegere multiplă
Sunt cei mai folosiţi itemi în cadrul acestor teste, deoarece se potrivesc unei mari varietăţi de
teme. Fiecare item are două părţi: a) tulpina care conţine întrebarea sau problema şi b) opţiunile care
constituie un set de răspunsuri posibile, dintre care subiectul trebuie să aleagă unul. Multe teste au
patru sau cinci variante de răspuns.
Vom prezenta câteva dintre cele mai acceptate reguli pentru scrierea unor itemi cu alegeri
multiple, reguli care ilustrează avantajele acestora în comparaţie cu testele tradiţionale de aptitudini.
a. Itemii trebuie să fie cât mai simpli posibil. Este nevoie de acest lucru pentru a reduce contaminarea
scorurilor testului la factorul V, abilitate verbală şi gc, inteligenţa cristalizată.
b. Toţi distractorii (variantele incorecte) trebuie să fie la fel de plauzibili. Dacă distractorii sunt evident
incorecţi itemul este fără valoare, deoarece acesta va fi rezolvat corect de toţi subiecţii. Distractorii
cei mai buni sunt aleşi selectând răspunsurile greşite la itemi într-o sarcină în care subiecţii primesc
răspunsurile la itemi în forma deschis-închis.
c. Trebuie să fie o singură variantă de răspuns corectă. Uneori dacă privim problema dintr-o
perspectivă diferită poate să ne apară corect un alt răspuns. Dacă se întâmplă acest lucru trebuie
să renunţăm la acel item sau să schimbăm distractorii.
d. Să ne asigurăm că distractorii nu reprezintă răspunsul corect pentru alţi itemi sau evidenţiază
răspunsul corect la alţi itemi.
e. Să evităm scrierea itemilor doar pentru că sunt uşor de scris.
f. Să se evite folosirea distractorului “nici una/unul dintre” cu excepţia itemilor în care sunt evident
corecţi.
g. Să se evite folosirea distractorului “toate dintre” care slăbeşte itemul.
Acestea sunt cele mai importante reguli care trebuie respectate atunci când scriem itemi cu
răspunsuri multiple, unele dintre ele având aplicabilitate şi pentru alte tipuri de itemi.

Avantajele folosirii acestor tipuri de itemi


a. Itemii pot fi uşor cotaţi. Acesta este un aspect important pentru testele care acoperă o mare
cantitate de material. Ele permit ca testele să fie lungi, ceea ce îmbunătăţeşte precizia şi validitatea
testelor. Uşurinţa cotării reduce erorile de scriere. Răspunsul cu alegere multiplă poate fi cotat
folosindu-se chei de marcare ideale pentru cotarea computerizată. Seturile de itemi cu alegeri
multiple sunt uşor de prezentat pe computer.
b. Ghicirea. Aceasta poate fi o problemă, dar testele cu alegere multiplă reduc posibilitatea de a ghici
răspunsul corect din cinci variante prezentate, în condiţiile în care distractorii sunt la fel de atractivi.

99
CORNEL HAVÂRNEANU

c. Conţinutul testului. Folosind un set de itemi cu răspunsuri multiple este posibilă o precisă abordare
a conţinutului testului, ceea ce permite psihologului să evalueze cât de potrivite este testul pentru
scopul propus.

2. Itemi adevărat - fals


Aceşti itemi constau în afirmaţii pe care subiectul trebuie să le marcheze ca fiind adevărate sau
false. Folosirea acestor itemi ridică o serie de probleme:
a. Ghicirea. Reprezintă o dificultatea reală deoarece există 50% şanse ca să se ghicească răspunsul
corect. Testul reprezintă un balans între răspunsul adevărat sau fals. Un subiect care alege fie
numai răspunsul fals, fie numai cel adevărat la toţi itemii va obţine 50% din scorul total.
b. Este dificil să scrii itemi care sunt irevocabil aderarăţi sau falşi.
c. Banalitatea. Nevoia de precizie ne determină să punem accentul pe itemii banali.
Ultimele două obiecţii sunt cele mai relevante pentru testele din ştiinţele sociale şi artă. În ştiinţe
adevărul absolut (în sensul dat de item) este posibil. În general, itemii adevărat-fals constau în afirmaţii
care pot fi înlocuite cu itemi cu alegeri multiple şi care reduc efectul de ghicire.
Totuşi există o clasă de itemi de acest tip care sunt utili. În cadrul acestora sunt prezentate
subiectului informaţiile, testul măsurând abilitatea acestuia de a înţelege. De exemplu, Kline (1986)
prezintă două distribuţii ale inteligenţei, una pentru subiecţii de sex feminin iar cealaltă pentru cei de sex
masculin. S-au folosit itemi de tipul adevărat-fals.
a. Există mai mulţi bărbaţi decât femei cu un QI foarte mic, mai mic de 45;
b. Există mai mulţi bărbaţi decât femei cu un QI foarte ridicat, mai mare de 140;
c. Distribuţia inteligenţei subiecţilor de sex feminin este aproximativ bimodală;
d. Distribuţia inteligenţei subiecţilor de sex masculin este aproximativ normală;
e. Media QI-ului la bărbaţi şi femei este aproximativ aceeaşi;
f. Există mai multe femei decât bărbaţi cu un QI între 120 şi 140;
g. Există mai multe bărbaţi decât femei cu un QI între 50 şi 60;
Această metodă de testare a înţelegerii materialului este utilă şi contrazice pe cei care susţin că
obiectivul itemilor testului este de a măsura dacă materialul este învăţat mecanic. Un subiect care nu
poate înţelege sau interpreta un item poate doar să-l ghicească.
Aceşti itemi pot fi folosiţi pentru o testare detaliată a cunoştinţelor. Astfel, pot fi calculaţi următorii
coeficienţi (coeficienţi teta): corelaţia tetraconică, corelaţie biserială, corelaţia punct biserială, tau, ro,
phi, indexul G.

Concluzii cu privire la itemii adevărat-fals


Aceşti itemi sunt utili pentru testarea înţelegerii unui material prezentat şi pentru examinarea
detaliată a cunoştinţelor, pentru care itemi cu alegeri multiple ar fi stângaci. Trebuie reţinut faptul că
precizia lor este diminuată de ghicire. Din aceste motive sunt de preferat itemii cu alegeri multiple.

3. Itemi perechi
Sarcina subiectului este de a potrivi itemii din două liste. Aceşti itemi se potrivesc materialelor
factuale sau celor intuitive. Autorii şi cărţile, clasele şi mamiferele sunt exemple de astfel de itemi
perechi. Putem avea 4 nume de autori A, B, C, D şi 8 titluri de cărţi. Subiecţii indică, folosind o literă

100
PSIHODIAGNOSTIC (I)

(cea corespunzătoare autorului) cine a scris o anumită carte. Aceşti itemi permit cea mai uşoară testare
în detaliu a cunoştinţelor. Deşi ar pute fi construiţi şi itemi cu alegeri multiple, numărul lor ar fi mai mare,
ar fi nevoie de 4 itemi cu alegeri multiple şi 32 de distractori. Itemi adevărat-fals ar pute fi folosiţi ‚în
acest scop, dar ar fi mai complicat decât folosirea itemilor perechi. Ar fi necesari 4 itemi, câte unul
pentru fiecare autor. Nu poate fi folosit acelaşi exemplu pentru fiecare din cei 4 itemi deoarece
răspunsul anterior poate influenţa răspunsurile la itemii următori. Astfel dacă autorul A scris cartea 1,
autorul B, C sau D nu mai pot scrie cartea 1.
Trebuie să precizăm că pentru itemii adevărat-fals, unde informaţiile sunt prezentate subiectului
iar itemii testează înţelegerea, este foarte dificil să folosim itemi pereche în locul lor. Itemii adevărat-fals
sunt mai buni atunci când se testează informaţia prezentată în test.
Pentru a reduce efectul de ghicire şi să ne asigurăm că subiecţii rezolvă itemii făcând alegeri
pentru fiecare item, răspunsurile nu trebuie să devină evidente iar listele trebuie să nu fie egale ca
lungime.

Concluzii: comparaţie între cele trei tipuri de itemi


a. Factori specifici. Trebuie minimalizat varianţa specifică datorată unui singur tip de item. Într-o
baterie de teste varianţa specifică a unui anumit tip de item poate avea pondere într-un factor, care
ar putea fi un factor de grup veritabil, deşi este vorba de o specificitate exagerată - abilitatea de a
răspunde la un tip particular de item. O varietate de itemi ar fi în acest caz mai avantajoasă.
b. Plictiseala. Folosirea unor itemi variaţi ar reduce plictiseala trăită de subiect în timpul completării
unor teste, după cum argumentează Crombach (1976) şi ar îmbunătăţi precizia procedurii de
testare.
c. Eficienţa itemilor. În construcţia testelor se doreşte un maxim de eficienţă a itemilor. Am văzut
anterior că eficienţa itemului depinde de cât de mult material se doreşte a fi testat. Pentru a obţine
cel mai bun tip de item trebuie respectate următoarele reguli:
1. Cele mai multe materiale să fie testate cu ajutorul itemilor cu alegeri multiple, aceştia
reprezentând itemii de bază în testele de cunoştinţe.
2. Pentru informaţii factuale detaliate sunt utili itemii adevărat-fals şi perechi.
3. Pentru testarea materialului prezentat într-un test sunt valabili itemii adevărat-fals.
4. Pentru motivele prezentate anterior este mai bine să se folosească un amestec format din
mai multe categorii de itemi, deşi mulţi itemi adevărat-fals cresc dificultăţile datorate ghicirii.

Scrierea itemilor
Criterii pentru alegerea itemilor:
1. Claritate. Alegeţi forma itemului care este cea mai clară pentru subiect.
2. Ghicire. Alegeţi forma care reduce efectele ghicirii la minim.
3. Precizie. Alegeţi forma care este cea mai clară şi mai simplă.
4. Relaţiile dintre itemi. Verificaţi dacă variantele itemilor sau chiar itemii nu dau răspunsul sau
sugestii pentru alţi itemi.
5. Echilibru. Acolo unde toate alegerile sunt posibile, alegeţi tipul de item care este cel mai rar.

101
CORNEL HAVÂRNEANU

Alte tipuri de itemi


Cele 3 categorii de itemi pe care le-am discutat anterior sunt cele mai comune şi utile în cadrul
testelor de cunoştinţe. Există şi alte categorii de itemi utile în condiţiile în care materialul rămâne
intransigent la testarea cu ajutorul celor 3 metode.
a. Itemi cu răspuns limitat. Aceşti itemi cer subiectului să dea propriul lor răspuns, care este totuşi
restrictiv, pentru a ne asigura obiectiv că itemii au rezolvaţi.
b. Itemi cu răspuns liber. Subiectul poate completa cu ceea ce crede . Se acceptă doar un singur
răspuns pe care subiectul poate să-l dea. Aceşti itemi trebuie analizaţi cu atenţie şi trebuie cotaţi
obiectiv. Să presupunem că vrem să testăm cunoştinţele subiecţilor despre liniile oblice. Întrebarea
“Ce sunt liniile oblice?” este prea generală necesitând un eseu mai curând decât un răspuns simplu.
Trebuie să fim mai specifici. Am putea folosi itemi adevărat-fals sau cu răspunsuri multiple. În forma
răspunsului liber am putea folosi întrebarea “Cum diferă liniile oblice de cele ortogonale?” Este prea
vagă, deoarece subiecţii pot preciza doar că liniile oblice formează un unghi mai mic de 90 de
grade. Astfel putem întreba “Ce informaţii cu putem obţine de la unghiurile dintre liniile oblice?”
Avantajul acestor tipuri de itemi este acela că reprezintă cel puţin o testare a memoriei mecanice,
nu apar distractori şi este mai interesant pentru subiect să completeze decât să compare între
variantele prezentate la itemii cu alegeri multiple.
c. Itemi cu alegeri limitate. Sunt mai atractivi şi precişi. Itemul cu răspuns liber dat anterior ca exemplu
pentru acest tip ar apărea astfel: “Despre unghiurile dintre liniile oblice putem şti că..........”

CONCLUZII
Aceste categorii de itemi sunt utile doar în situaţiile în care răspunsul trebuie să fie cât mai
precis. Itemii cu răspuns liber sunt dificil de redactat. De aceea itemi cu răspunsuri limitate
reprezintă o formă superioară.
Cotarea lor este dificilă, aceşti itemii nu pot fi prezentaţi şi cotaţi în formă computerizată.

Ghicirea
În cazul itemilor cu alegeri multiple şi a celor cu răspunsuri limitate poate apărea ghicirea care
introduce varianţa de eroare şi scade validitatea. Am menţionat anterior că subiectul poate rezolva prin
ghicire jumătate dintre itemii adevărat-fals.
Ghicirea este inevitabilă chiar în cadrul unor examene de admitere, promovare sau selecţie
pentru o anumită profesie.
1. Subiecţii sunt instruiţi să ghicească. În instrucţiunile testelor se cere subiecţilor să ghicească. “Nu
lăsaţi spaţii goale. Dacă nu ştiţi un răspuns sau nu sunteţi sigur, ghiciţi soluţia corectă. ”
2. Completaţi la întâmplare un test apoi cotaţi-l. Această completare este echivalentă ghicirii. Un
sistem computerizat de cotare poate fi programat să realizate acest lucru.

Formula de corecţie a ghicirii


Unii utilizatori de teste folosesc o formulă de corectare a ghicirii. Cea mai utilizată formulă este:
g
xcorect = c − , unde
n −1
x corect - scoruri corectate pentru ghicire;
c - numărul de răspunsuri corecte;

102
PSIHODIAGNOSTIC (I)

g - numărul de răspunsuri greşite;


n - numărul de variante ale itemului
Există cel puţin 4 probleme ale corectării ghicirii:
1. Se presupune că toate răspunsurile greşite se datorează ghicirii, ceea ce nu este în mod
necesar adevărat; Subiecţii pot să nu fie informaţi. Formula de ghicire nu ia în considerare
acest lucru.
2. Se presupune că atunci când apare ghicirea există un număr egal de şanse pentru fiecare
variantă. Pentru anumiţi itemi pot fi schimbaţi distractorii şi totuşi subiecţii să ghicească
răspunsul. Pentru aceşti subiecţi formula de corecţie subestimează performanţa.
3. Itemii pot avea un număr diferit de variante, necesitând corecţii ale ghiciri diferite.
4. Corecţia ghicirii se aplica mediei subiecţilor. Pentru cazurile individuale aceasta poate să fie
greşită.
Pentru toate aceste motive formula de corecţie a ghicirii este rudimentară. Suntem de acord cu
Vernon (1960) care afirmă ă ghicirea poate fi ignorată în testele cu variante multiple cu un număr mare
de itemi. Având în vedere problemele itemilor adevărat-fals trebuie folosit doar un număr redus de astfel
de itemi. Ghicirea este încurajată în testele de viteză. Nu se recomandă corecţia ghicirii.

103
CORNEL HAVÂRNEANU

X. TESTE OBIECTIVE DE PERSONALITATE

Vom discuta despre testele de obiective de personalitate, care încearcă să acopere unele dintre
defectele chestionarelor de personalitate, deşi după cum vom vedea aceste teste au alte probleme.
Chestionarele de personalitate sunt superficiale şi de obicei transparente fiind uşor de falsificat,
sunt prea necizelate pentru a încapsula bogăţia şi fineţea personalităţii. Testele obiective şi proiective
de personalitate, împreună, caută să elimine aceste neajunsuri. Cu toate obiecţiile aduse de Eysenck
(1957) şi alţi autori în ceea ce priveşte lipsa lor de validitate şi fidelitate, ar fi greşit să se renunţe la ele,
deoarece aceste teste pot fi utile atât în aplicaţii practice cât şi în cercetare.
Înainte de defini aceste categorii de teste trebuie să facem distincţia, în cadrul testelor de
personalitate, între măsurarea nomotetică şi cea idiografică.
Testele nomotetice sunt legate de dezvoltarea unor reguli pentru înţelegerea personalităţii.
Vizează măsurarea trăsăturilor sau dimensiunilor comune, în funcţie de care oamenii diferă.
Chestionarele de personalitate sunt măsurări nomotetice tipice, iar analiza factorială reprezintă cea mai
potrivită tehnică statistică pentru analiza testelor nomotetice. Psihometria, ca domeniu al psihologiei,
este în principal interesată de studiul diferenţelor individuale, măsurarea făcându-se prin urmare cu
ajutorul testelor nomotetice.
Testele idiografice, în contrast cu cele nomotetice, vizează măsurarea individuală a persoanei, a
tuturor aspectelor de personalitate pe care acesta nu le împarte cu nimeni. Aceste aspecte unice şi
individuale de personalitate sunt măsurate cu ajutorul testelelor obiective de personalitate.

X.1. TESTELE OBIECTIVE


Cattell (1973 şi 1957) consideră că în studiul personalităţii există trei surse de date: L, Q şi T.
Datele L, date de viaţă, se referă la observaţiile comportamentului actual, datele Q derivă din
chestionare, iar datele T se referă la măsurarea prin teste obiective, definite ca teste a căror scop este
ascuns subiecţilor. Cattell priveşte datele L ca un criteriu pe care se bazează toate testele, indiferent de
tipul lor. Pentru autor testele obiective reprezintă a treia sursă principală de date cantitative din
domeniul personalităţii. Aceste teste sunt mai puţin utilizate decât chestionarele sau testele proiective.
Cattell (1957) şi Cattell şi Warburton (1967) definesc testele obiective ca teste a căror scop este
ascuns subiecţilor, provocând distorsiuni deliberate, şi a căror cotare este obiectivă. Cronbach (1976) a
denumit aceste teste ca teste de performanţă.
Conform definiţiei testelor obiective, testele proiective cotate obiectiv pot fi incluse în categoria
testelor obiective. Testul Rorschach astfel cotat este inclus în categoria testelor obiective (Cattell şi
Warburton, 1967). Totuşi noi preferăm să includem teste proiective cotate obiectiv în categoria testelor
proiective, pentru că după cum consideră autorii lor şi categoria testelor proiective reprezintă un
instrument pentru măsurarea personalităţii.

104
PSIHODIAGNOSTIC (I)

X.2. AVANTAJELE TESTELOR OBIECTIVE

Motivul pentru care discutăm despre testele obiective este acela că dacă se demonstrează că ele
sunt valide, ele ar avea un avantaj clar faţă de chestionare şi faţă de unele teste proiective.
1. Faptul că este sunt inaccesibile ghicirii, deoarece scopul lor este neclar face să fie mai potrivite în
selecţie şi în psihologia aplicată în comparaţie cu alte teste de personalitate.
2. Este mai puţin probabil că în aceste teste să apară seturi de răspunsuri dezirabile, cum se întâmplă
în cazul chestionarelor.
3. Este posibil ca unele teste obiective, în special măsurările fiziologice, să poată fi utilizate în studiile
transculturale ale personalităţii, domeniu în care chestionarele au o valoare îndoielnică (Kline,
1977).
Din aceste motive dezvoltarea validităţii testelor obiective de personalitate reprezintă un aspect
important al psihometriei, cu toate că în prezent există puţine dovezi de progres în acest sens.

X.3. TIPURI DE TESTE OBIECTIVE


Cattell şi Warburton (1967) în compendiul testelor obiective listează 688 de teste, din care derivă
2300 de variabile şi acestea reprezintă doar o parte din testele obiective care pot fi construite. Este
evident din definiţie că teste conţin sarcini care pot fi obiectiv cotate, şi pe care subiecţii nu le pot ghici.
Ca exemplu vom da sarcina de curăţare a pantofilor, folosind perii şi cremă de pantofi. Vor fi
extrase din test următoarele variabile:
1. Numărul de întrebări puse înainte de a începe curăţarea.
2. Timpul scurs înainte de a începe.
3. Tipul necesar pentru realizarea sarcinii.
4. Numărul de periaje folosit în procesul de curăţare.
5. A înlocuit subiectul pantofii?
6. A potrivit subiectul peria şi crema?
7. A folosit material moale?
8. A înlocuit subiectul şireturile?
9. A curăţat subiectul limba de al pantofi?
Este clar că se pot folosi o infinitate de astfel de variabile, singura limită fiind ingeniozitatea
cercetătorului. Aceste variabile ne indică o dificultate serioasă a testelor obiective: validitatea lor. Cum
putem şti ceea ce măsoară fiecare dintre aceste teste? Aceasta este dificultatea testelor, pentru că
dacă noi ne dăm seama ce măsoară, atunci şi subiecţii vor fi capabili să ghicească acest lucru şi în
acest caz, prin definiţie aceste teste încetează să mai fie obiective.

Problema validităţii testelor obiective


Nici un teste obiectiv nu poate fi folosit fără să nu existe dovezi empirice ale validităţii şi fidelităţii
testului.

105
CORNEL HAVÂRNEANU

Raţiunea testelor obiective


După cum indică şi cele nouă variabile din exemplu dat anterior, trebuie să existe o raţiune în
construcţia acestor teste. O abordare posibilă în principiu, dar mare consumatoare de timp în practică ar
fi să se inventeze măsuri obiective, care să fie puse într-un test empiric. Acest lucru este imposibil.
Marea majoritate a testelor obiective nu au nici o dovadă a validităţii lor. Motivele construirii testelor
obiective trebuie menţionate, chiar dacă ele au doar o valoare orientativă.
Cattell şi Warburton (1967) au prezentat o taxonomie a testelor obiective şi un set de principii pentru
construirea unor astfel de teste obiective: ambele vor fi discutate pentru că ajută la înţelegerea lor.
O taxonomie a testelor obiective
Există trei surse de variaţie în testele psihologice:
1. Instrucţiunile testului. Acestea influenţează modul cum subiectul se raportează la test.
2. Materialele testului
3. Cotarea răspunsului
Observăm că primele două categorii nu sunt independente, deoarece instrucţiunile se referă la
materialele testului aceste două surse de variaţie grupează într-o singură categorie situaţia stimul-
instrucţiune.

Situaţia stimul-instrucţiune.
Aceasta variază de-a lungul următorilor parametri:
1. Reacţie vs. lipsa de reacţie. În mod obişnuit este cerută reacţia la stimul, dar nu întotdeauna se
întâmplă acest lucru, cum este cazul testului de sensibilitate la durere.
2. Răspunsuri inventive vs. răspunsuri selective. Testul TAT cere răspunsuri inventive, iar itemii
chestionarelor de personalitate cer răspunsuri selective.
3. Răspunsuri unice vs. răspunsuri repetitive
4. Secvenţe de răspunsuri ordonate vs. secvenţe de răspunsuri neordonate
5. Răspunsuri omogene vs. pattern-uri de răspuns. Unele teste cer răspunsuri de acelaşi fel, alte
răspunsuri variate.
6. Răspunsuri naturale vs. limitate. “Lucrează în ritmul tău propriu” comparativ cu “Lucrează cât mai
repede posibil” exemplifică aceşti parametri.
7. Reacţii de încheiere vs. reacţie la reacţie. Subiectul reacţionează fie la materialul testului, fie la
propriile reacţii, ca în evaluare.
Cattell şi Warburton (1967) adaugă la aceşti şapte parametri alte cinci dimensiuni importante,
dintre care primele trei sunt subiective şi au o importanţă particulară pentru testele obiective.
8. Semnificaţie imediată vs. semnificaţie atribuită. În testele timpilor de reacţie nu există o altă
semnificaţie în spatele testului însuşi. În alte teste, de exemplu cele care examinează opiniile, există
atribuiri externe şi simbolice, acestea fiind implicate în distorsiunile tipice ale testelor, ridicând
probleme legate de distorsiunea subiectivă a cuvintelor şi conceptelor.
9. Prezentare unui item vs. prezentare globală. Unele teste constau într-o singură sarcină, iar altele
într-un set de itemi.
10. Aspectul psihologic al testului. Unele răspunsuri la teste solicită cogniţia (o judecată corectă), alte o
judecare a sentimentelor iar altele judecarea familiarităţii sau recunoaşterea.
11. Variaţia motivelor pentru acceptarea situaţiei test.

106
PSIHODIAGNOSTIC (I)

12. Variaţia libertăţii pentru a finaliza situaţia test.


Această taxonomie indică o uriaşă varietate de teste obiective posibile - există 213 (8192) tipuri de
situaţii stimul-instrucţiuni.
Taxonomia nu este completă dacă ignorăm cea de a treia sursă de variaţie - cotarea
răspunsurilor. Deşi parametrii cotarea răspunsului nu sunt total independenţi de parametrii descrişi
anterior, ei trebuie luaţi în seamă pentru a vedea numărul total de teste care poate fi produs de
parametrii stimul-instrucţiune şi cotarea răspunsului.

Parametrii de cotare a răspunsului


1. Obiectivitate vs. auto-evaluare. Acesta este parametrul cel mai important care trebuie să fie bine
înţeles înainte de a cunoaşte natura testelor obiective, şi care adesea seamănă cu inventarele de
personalitate. Vom exemplifica acest parametru. Într-un test li se cere subiecţilor să evalueze dacă
o sarcină particulară (de exemplu, o chelneriţă care aduce în 10 minute şase fripturi pe o masă)
este forte bună, bună, slabă, sau foarte slabă. Se vor cota numărul de răspunsuri slab sau foarte
slab etc., adică numărul de evaluări critice. Această cotare este în întregime obiectivă şi imposibil
pentru subiect să o ghicească. Deşi acest mod de cotare poate fi comparat cu cel al inventarelor de
personalitate, de fapt el este diferit. Toate teste obiective sunt obiective în termenii acestui prim
parametru. În final precizăm că inventarele de personalitate standard pot fi considerate obiective în
privinţa acestui parametru. De exemplu, putem lua în seamă toate răspunsurile “da” sau “adevărat”
şi toate răspunsurile “fals”.
2. Comportament deschis vs. răspuns fiziologic. Comportamentele deschise implică întreg organismul,
în timp ce răspunsurile fiziologice implică părţi ale organismului, cum ar fi dilatarea pupilei, înroşire
etc.
3. Cotarea parametrică vs. neparametrică a răspunsurilor. Cotarea parametrică implică dimensiuni ale
răspunsului, cum ar fi timp, erori sau repetiţii. Cotarea neparametrică implică numărul şi varietatea
claselor de răspuns, ca în multe teste de creativitate.
4. Cantitatea sau numărul total de răspunsuri vs. fracţiuni ale răspunsului care întrunesc un anumit
criteriu.
5. Cotarea omogenă a scorurilor vs. cotare legată de patternuri. Prima cotare este posibilă doar când
testul este cotat ca întreg, la fel ca în cazul inventarelor de personalitate. Al doilea tip de cotare,
poate avea mai multe forme. Un exemplu ar fi diferenţa de timp în completarea primei şi celei de a
doua părţi a testului.
6. Scoruri normative vs. ipsative. Scorul normativ a fost descris în prima parte a cursului. Scorul ipsativ
a unui subiect la un item este deviaţia scorului subiectului la itemul respectiv de la media scorurilor.

Totuşi nu toate combinaţiile parametrilor sunt viabile, este clar că există un număr foarte mare de
tipuri de teste obiective: 213x26 ceea ce ar duce la 50.000 de tipuri de teste.
Deşi există principii pentru construcţia testelor obiective, toate aceste 50.000 de categorii nu pot fi
folosite. Cattell şi Warburton (1967) au scurtat lista la 64 de categorii desemnate, luând în considerare
cele mai importante tipuri de stimuli şi parametri de cotare, permiţând 8 varietăţi pentru fiecare.
Această taxonomie nu este suficientă pentru a înţelege testele obiective. Este important să
înţelegem forma dar trebuie să avem în vedere şi conţinutul lor.

107
CORNEL HAVÂRNEANU

O prima dificultate vizează categoriile de variabile care pot fi măsurate - abilităţi, temperament,
motivaţie. Nu există un motiv pentru care testele obiective nu pot măsura variabile din aceste sfere, şi
este necesar să facem distincţia dintre ele.

X.4. DISTINCŢIA DINTRE TESTELE OBIECTIVE DE ABILITATE, TEMPERAMENT ŞI DINAMICĂ

Este suficient ca prin analiză factorială să descoperim care sunt variabilele pe care le măsoară
testele obiective, dar bineînţeles după ce ele au fost construite. Ar fi util un ghid de construcţie a
testului, chiar dacă dovezile empirice sunt necesare pentru a asigura validitatea testului.
Cattell şi Warburton (1967) prezintă o serie de detalii în legătură cu această problemă:
1. Sunt definite două situaţii: iniţiale şi complexe.
2. Definirea situaţiei iniţiale: o situaţie iniţială provoacă atingerea scopului şi este un simbol al scopului
sau al realizării lui. Acest lucru poate fi descoperit prin procesul de analiză, adică prin analiza
statistică a paternului unei secvenţe de comportament care apare în timp. O situaţie iniţială poate fi
recunoscută din relaţia cu scopul. În studiul jurnalului unui subiect pe o perioadă de o lună, folosind
teste obiective (Cattell, Horn şi Sweney, 1970) Kline şi Grindley (1974) au arătat că o astfel de
relaţie apare din dinamica variabilelor măsurate cu ajutorul testelor cu evenimentele din viaţa reală.
3. Definirea situaţiilor complexe: Acestea sunt dependente de precizia evaluării situaţiilor iniţiale.
4. Dacă se schimbă situaţia iniţială, se modifică şi scorul testului obiectiv. Dacă se schimbă
complexitatea se modifică şi scorul la un test cognitiv. Toate celelalte teste sunt teste de
temperament.
5. Astfel pare uşor de măsurat dinamica şi abilităţile subiecţilor. Este relativ uşor obţinem o măsurare
pură asigurându-ne că una din aceste clase de variabile se menţine constantă. De exemplu, dacă
măsurăm abilitatea, care de altfel este uşor de măsurat, diferenţele dintre scoruri nu reflectă
diferenţe de abilitate ci diferenţele de dinamică, cum ar fi cât de mult efort depun subiecţii.
Asemănător, în procedura de selecţie reală a subiecţilor, în care toţi subiecţii depun efor, testele de
abilitate sunt pur şi simplu cognitive.
6. După construirea unui test acesta trebuie să fie supus unei analize factoriale, pentru a demonstra
că acesta măsoară ceea ce şi-a propus să măsoare.
Având acest ghid de realizare a testelor obiective psihologul trebuie să construiască un
raţionament pentru elaborarea testelor obiective. Totuşi, aceste taxonomii şi analize sunt foarte
abstracte şi din acest motiv autorii prezintă o serie de indicaţii practice bazate pe propria intuiţie şi
experienţa lor considerabilă în construirea testelor obiective.

X.5. GHID PRACTIC PENTRU CONSTRUCŢIA TESTELOR OBIECTIVE DE PERSONALITATE ŞI MOTIVAŢIE

Cattell şi Warburton (1967) listează cinci aspecte care trebuie evitate, la care de obicei recurg
amatorii în construirea de teste obiective:
1. Evitarea itemilor de tip chestionar, care prin definiţie nu pot intra în construcţia unui fi un test
obiectiv. După cum am menţionat anterior itemii chestionarelor pot fi utilizaţi ca bază pentru testele
obiective pentru a defini anumite comportamente tipice.
2. Evitarea problemelor şi a itemilor tip puzzle. Acestea sunt utilizate pentru măsurarea variabilelor
cognitive.

108
PSIHODIAGNOSTIC (I)

3. Să nu avem încredere prea multă în “situaţiile stres”. Acestea surprind cel mai bine frica şi
agresiunea, dar există şi alte emoţii pe care acestea nu le surprind.
4. Evitarea testelor cu preferinţe stilistice şi estetice. Este adevărat că acestea pot surprinde anumite
aspecte de personalitate. Dar este absurd să gândim că ele pot măsura toate aspectele de
personalitate, chiar dacă trebuie să ignorăm faptul evident că răspunsurile la aceste teste sunt
influenţate de educaţie şi cultură.
5. Evitarea simplei utilizări a testelor proiective - răspunsurile la acestea sunt complexe din punct de
vedere factorial (Wenig, 1952).
Pe lângă aceste cinci aspecte care trebuie evitate atunci când se realizează un test obiectiv,
există şi alte caracteristici.
Vom discuta despre cele mai importante dintre ele.
1. Motivaţia diferită a subiecţilor. Acesta reprezintă o dificultate a tuturor testelor, dar este acută
în testele obiective în care subiectul nu are nuci o idee legată de ceea ce testul poate să măsoare şi
pare o pierdere de timp. Totuşi există persoane care se consideră performante şi care întotdeauna
încearcă să rezolve cât mai bine itemii testului, de aceea factorii motivaţionali neintenţionaţi influenţează
rezultatele.
Cattell şi Warburton (1967) discută cinci posibilităţi de reducere a acestei distorsiuni:
a. Testul este divizat în două părţi, pentru care motivaţia se consideră ca fiind la fel. Scorul este
diferenţa dintre cele două părţi sau proporţia celor două, o parte fiind considerată deliberat ca fiind
afectată de motivaţie.
b. Să motivăm subiecţii astfel încât să putem presupune că nu mai apar diferenţe între motivaţiile
indivizilor. După cum menţionează Cattell şi Warburton, acest lucru se poate realiza prin utilizarea
unor impulsuri de bază, cum ar fi sexul, frica, furia, mai curând decât folosirea unor impulsuri care
au mai puţină semnificaţie, cum ar fi sentimentele modelate cultural, dintre care menţionăm
sentimentele faţă de familie sau cele religioase, care au o mai mare variaţie. În practică apar însă
probleme etice, unele stimulări fiind dificil de realizat (de exemplu înfometarea este imposibil de
realizat), în prezent se utilizează frecvent ca stimuli şocuri electrice sau poze cu figuri nude.
c. Cotarea poate fi restricţionată de aspectul stilistic sau formal al performanţei subiectului, deoarece
acestea sunt mai puţin influenţate de motivaţie, după cum menţionează Cattell şi Warburton, putând
fi recunoscute ca specifice într-o mare varietate de situaţii.
Toate aceste trei metode se aplică în testele temperamentale mai curând decât în testele obiective
dinamice. Ultimele două puncte se plică testelor dinamice.
d. Este posibil ca nivelul motivaţional al subiectului să acopere întreaga baterie de teste care este
analizată factorial. Dacă se întâmplă acest lucru toate variabilele care au pondere substanţială
într-un factor ar putea fi înlocuite.
e. Constructorul de teste trebuie să motiveze subiectul pentru a obţine o implicare completă a
acestuia. Practic acest lucru nu este uşor de realizat.

2. Testul ca situaţie. Testul poate fi privit va o situaţie care implică anumite comportamente
sociale, care reprezintă un aspect important al personalităţii. Mischel (1968) a contestat testele de
personalitate considerându-le invalide deoarece scorurile sunt determinate situaţional.

109
CORNEL HAVÂRNEANU

Cattell şi Warburton (1967) subliniază faptul că testul este o situaţie specifică şi că putem crea un
set de testele obiective care să implice interacţiuni sociale. Aceste situaţii în miniatură, sunt dificil de
creat şi complicat de aplicat în practică.

3. Influenţa abilităţilor şi a cunoştinţelor asupra testelor obiective. Dacă încercăm să măsurăm


personalitatea (sau motivaţia) folosind testele obiective influenţa abilităţii şi a cunoştinţelor asupra
scorului la teste distorsionează rezultatele.
Să presupunem că măsurăm interesele. Cantitatea de informaţii relevante pentru un domeniu
particular este o măsură a interesului subiectului pentru domeniul respectiv (Cattell şi Child, 1975).
Astfel, copii care sunt interesaţi de fotbal sau cricket au, în mod obişnuit, foarte multe informaţii la zi în
legătură cu viaţa şi cariera jucătorilor. Este clar că această măsurare este distorsionată de variabilele
abilitate. Este mai probabil ca un subiect foarte inteligent şi cu un nivel mediu al interesului, să obţină
acelaşi scor cu un subiect mai puţin inteligent dar cu un nivel foarte ridicat al interesului. Deci
măsurarea pur şi simplu a cantităţii de informaţii nu dă o măsură a interesului. O modalitate de a depăşi
această dificultate este folosirea scorurilor ipsative pentru fiecare subiect în parte. Acest lucru implică
folosirea ca scor la test devianţa subiectului de la medie.
Cattell şi Warburton (1967) sugerează că 5 metode pentru a lămuri efectele abilităţii asupra
testelor obiective de personalitate:
1. În crearea testului să se reducă cât mai mult posibil cerinţele care se bazează pe abilităţi sau
cunoştinţe.
2. La fel ca şi pentru depăşirea problemei motivaţiei, diferenţele de abilitate pot fi reduse folosind un
raport sau diferenţa dintre scorurile unui test împărţit în două părţi.
3. Toate testele ar trebui analizate factorial iar factorii în care abilităţile au pondere să fie înlocuiţi.
4. Utilizarea unui conţinut variat al testelor obiective, angajând întreaga varietate de interese umane.
Cu cât un test este mai variat cu atât este mai posibil ca acesta să măsoare întregul spectru al
personalităţii umane.
Până acum am discutat despre problemelor implicate în construirea testelor obiective de
personalitate şi motivaţie, şi despre ghidul formal care ajută la dezvoltarea acestui tip de teste. În
completarea acestor parametri şi taxonomii, Cattell şi Warburton admit că anumite idei şi intuiţii vagi
sunt importante în construirea testelor. Acestea includ:
1. intuiţie clinică;
2. observarea incidentelor critice din viaţa de zi cu zi şi care se reflectă în diferenţele de personalitate;
3. folclor, proverbe, aforisme;
4. situaţii emoţionale din jocuri sau sport;
5. conversaţii observate;
6. surse literare.
Testele obiective pot fi aplicate în grup sau individual.
CONCLUZII
La fel ca şi în cazul celorlalte teste este esenţial să se demonstreze validitatea şi acest lucru
poate fi realizat doar prin analiza factorială a variabilelor din câmpul personalităţii, abilităţii şi
motivaţiei.
Doar puţine din aceste teste au un nivel ridicat al validităţii. În cazul majorităţii testelor
obiective validitatea lor nu este cunoscută.

110
PSIHODIAGNOSTIC (I)

Exemple de teste obiective:


1. Agitaţia măsurată prin „agitometru” Acesta este un scaun cu contacte electrice, în diferite puncte,
care se închid prin mişcare. Scorul este reprezentat de numărul de mişcări înregistrate într-o
anumită perioadă de timp. Ipoteza care stă la baza construcţiei acestui test este acela că agitaţia
este un semn al anxietăţii. Era de aşteptat ca testul să aibă pondere în factorul anxietate. Totuşi
testul nu are pondere în factorul anxietate, ilustrând dificultatea de construire a testelor obiective.
Trebuie să notăm faptul că dacă subiecţii îşi dau seama că scaunul măsoară mişcarea ei vor fi
greu de păcălit. Se pune problema reacţiei pe care o vor avea subiecţii, vor fi rigizi, naturali, sau se
vor comporta altfel?
2. Desenarea lentă a unei linii. Se cere subiecţilor să deseneze o linie pe o foaie cât mai lent posibil.
Scorurile care vor deriva din test: lungimea liniilor, dacă subiectul va înşela, prin ridicarea creionului
astfel încât să nu lase nici o urmă sau prin opriri. Acest ultim scor se aştepta să aibă pondere în
factorul psihotism al lui Eysenck, şi pondere negativă în factorul G a lui Cattell. Nici una dintre
aceste ponderi nu este susţinută de dovezi.
3. Consimţirea de a face farse. Acest test este un chestionar în care subiectul îşi exprimă
disponibilitatea de a face practic glume. Raţiunea testului este că subiecţii timizi s-ar bucura de
aceste glume. Acest lucru este susţinut de analiza factorială. Surprinzător s-a constat că acest test
are pondere în factorul anxietate - subiecţii stabili fiind cei care se bucură mai mult de astfel de
glume.
4. Rata metabolismului bazal. Acesta este un exemplu de test obiectiv fiziologic. Cel mai mic consum de
oxigen al subiecţilor este convertit în calorii pe oră pe metri pătraţi din suprafaţă a corpului. S-a
considerat că acest test are pondere în factorul extraversiune şi exuberanţă. Totuşi testul are
pondere într-un număr de variabile de personalitate şi ilustrează probleme legate de încercarea de
a crea măsurători fiziologice ale personalităţii. Aceste teste trebuie să aibă dovezi clare ale
validităţii.
Aceste patru exemple indică motivele pentru care au fost construite testele obiective. Vom da în
continuare exemple de alte câteva teste obiective, care conform lui Hundleby (1973) au câteva dovezi
ale validităţii:
• Cel mai mare număr de recunoaşteri ale fragilităţii sau greşelilor de execuţie în oglindă
• Cea mai mare supunere în răspunsurile de la chestionare
• Cel mai mare scor într-o listă de neplăceri
• Toate aceste teste au pondere în factorul anxietate. Următoarele teste au pondere în factorul
asertivitate.
• Preferinţa pentru cărţi cu titluri acceptabile social în comparaţie cu cele care au titluri sub formă de
întrebări
• Cea mai rapidă viteză de bate/lovi uşor
• Cel mai rapid tempo al mânii sau a rotirii piciorului
• Cea mai rapidă viteză de citire atunci cât se cere subiectului să citească cu o viteză normală
• Cea mai mare viteză de citire a unei poezii şi de copiere a unor figuri
• Cea mai mare preferinţă pentru activităţile sofisticate şi rafinate

111
CORNEL HAVÂRNEANU

Considerăm că exemplele date sunt suficiente pentru a indica marea varietate a testelor
obiective. Tot ceea ce rămâne de făcut este să investigăm şi să stabilim dacă ele sunt valide şi dacă
măsoară aspecte importante ale personalităţii.

112
PSIHODIAGNOSTIC (I)

XI. ALTE TIPURI DE TESTE PSIHOLOGICE

Vom discuta despre testele psihologice care nu fac parte din grupurile de teste pe care le-am
analizat în cursurile anterioare. Ele sunt diferite ca natură şi au o coerenţă care nu se regăseşte în
categoriile prezentate anterior.

XI.1. METODELE PERCEPTIV-GENETICE


Aceste metode au fost dezvoltate de către Kragh şi Smith (1970). Aceşti autori şi-au adus o
contribuţie importantă atât pentru dezvoltarea metodei dar şi a bazei teoretice.
Aceste metode, după cum sugerează şi numele, au ca obiect de studiu dezvoltarea percepţiei. La
baza acestei metode stă presupunerea că percepţia este un proces constructiv, care reflectă totalitatea
experienţelor noastre. De exemplu, dacă percepem o fată care iese din universitate, percepţia noastră
conştientă este colorată de experienţa noastră anterioară cu fetele şi universităţile. Procesul de
percepţie este, bineînţeles, instantaneu şi scapă controlului conştient. Aceste metode caută să supună
aceste procese examinării conştiente şi să releve experienţe critice de viaţă şi conflictele inconştiente
care afectează percepţia. O astfel de descriere se potriveşte cu ceea ce este denumit în psihanaliză ca
fiind mecanism de apărare (Freud, 1946), de aceea nu trebuie să fim surprinşi că cele mai cunoscute
teste de acest tip sunt reprezentate de mecanismele defensive.
Metodele perceptiv-genetice fac apel la percepţia inconştientă prin prezentare serială a stimulilor,
mai întâi, în limitele pragului perceptiv pragul percepţiei şi apoi gradual descreşte viteza de prezentare
la tahitoscop. La fiecare prezentare subiectului i se cere să deseneze sau să descrie ceea ce a văzut.
Distorsiunile şi schimbările în descrierea stimulilor în timpul seriilor prezentate reflectă conflictele interne
şi experienţele individuale care afectează percepţia. Procesul instantaneu de percepţie este desfăcut în
fragmente şi expus inspecţiei prin această prezentare serială subliminală.
Există două teste, cel mai frecvent utilizate în cercetările perceptiv-genetice, testul mecanismului
defensiv, DMT (Kragh, 1985) şi tehnica meta-contrastului (Kragh şi Smith, 1970). Înainte de a descrie
pe scurt testul DMT vrem să discutăm despre raţiunea testelor perceptiv-genetice, şi dacă este posibil,
în principiu, ca un astfel de test să fie o măsură validă a proceselor inconştiente. Dacă acest lucru ar fi
posibil, aceste teste ar reprezenta cel bun instrument ştiinţific psihologic care a fost dezvoltat, deoarece,
ar evidenţia ceva care normal este în întregime inaccesibil, chiar prin definiţie, şi anume ar evidenţia
procesele inconştiente. Dacă s-ar demonstra testele perceptiv-genetice permit deschiderea pentru o
inspecţie publică a procesului privat de percepţie, o nouă ştiinţa ar fi posibil să apară. Astfel, blocajele
psihologiei ştiinţifice (se ştie că procesele noastre mentale sunt private şi inobservabile) ar putea fi
rezolvate.

113
CORNEL HAVÂRNEANU

XI.2. DMT
În acest test se prezintă cartoane cu doi stimuli care diferă doar în detaliu. Aceştia sunt stimuli
adaptaţi ai TAT - ului. Pe fiecare carton se găseşte figura unui erou, un atribut al eroului, iar în fundal, la
periferia planşei, se găseşte o figură ameninţătoare, hidoasă. Această figură hidoasă aflată la periferia
planşei implică testul în măsurarea mecanismelor defensive, deoarece distorsiunile de percepţie din
timpul prezentării seriilor pot fi surprinse prin modul în care subiecţii tratează ameninţarea. Sjoback
(1967), în descrierea pe care o face acestor teste, consideră că expunerile de la început, când subiecţii
văd puţin, prin răspunsurile lor reflectă procese primare, inconştiente, în timp ce expunerile din ultimele
stadii devin stimuli de graniţă. În schemele de cotare din testele perceptiv-genetice momentul din seria
de stimuli la care apare răspunsul este considerat ca fiind foarte important.
Există câteva aspecte care privesc cotarea şi interpretarea testelor perceptiv-genetice (pentru
aceste testul DMT este un exemplu tipic). Mai întâi, Kragh şi Smith (1970) argumentează că
transformările de înţeles, în dezvoltarea percepţiei, dezvăluită în seriile prezentate, fac posibilă
reprezentarea istoriei personalităţii în timpul prezent. Trecutul este disponibil direct investigaţiei
experimentale. Noua formă şi semnificaţiile ei pot fi înţelese doar prin referire la istoria vieţii subiectului.
Într-adevăr experienţele sunt actualizate prin utilizarea termenilor folosiţi în aceeaşi ordine în care au
apărut în viaţă. Acesta este un paralelism, şi semnifică faptul că anul precis al unui astfel de eveniment
traumatic poate fi evidenţiat printr-o serie perceptiv-genetică.
Acest lucru pare a fi fantastic şi există numeroase dovezi empirice pentru a respinge tehnica,
legăturile cu teoria psihanalitică neajutând în această privinţă. Kline (1987), consideră că se poate
renunţa la noţiunea de paralelism fără a abandona ideea că importante experienţe de viaţă ar putea fi
evidenţiate prin aceste tehnici. De fapt, s-a demonstrat că paralelismul nu are semnificaţie. În afară de
evaluarea faptului că fiecare răspuns la testul DMT apare într-o secvenţă strictă de timp şi de faptul că
există o demarcaţie clară a ceea ce constituie un răspuns paralel (care nu este un paralelism),
paralelismul, în aceste teste însemnând că în anumite situaţii răspunsul de la începutul seriei perceptiv-
genetice reflectă evenimente de la începutul vieţii, iar unele situaţii de la sfârşitul seriei reflectă
evenimente de la sfârşitul vieţii. Deci se poate renunţa la paralelism, fără însă a pierde puterea de
interpretare.

Validitatea metodelor perceptiv-genetice


Nu vom discuta în detaliu despre dovezile validităţii acestor metode, ci vom evidenţia principiile
care stau la baza acestor metode. Vom avea în vedere testul DMT, deoarece s-au făcut mai multe studii
legate de acest test în comparaţie cu alte teste perceptiv-genetice (Sjoback, 1988). Pentru mai multă
claritate vom descrie pe scurt modul cum este cotat DMT. Cotarea necesită deprinderi de cotare, şi deşi
cel mai nou manual (Kragh, 1985) îmbunătăţeşte metoda de cotare, care ar trebui supervizate practic.

Scorurile la DMT
- Represia: eroul sau figura ameninţătoare trăiesc sau nu sunt umane; sau ambele sunt obiecte;
- Izolarea: eroul sau figura ameninţătoare sunt separate sau izolate, sau una dintre ele nu poate fi
văzută;
- Negarea: ameninţarea este empatic negată;
- Reactanţa: ameninţarea este transformată în opusul ei;
- Identificarea cu agresorul: eroul devine agresor;

114
PSIHODIAGNOSTIC (I)

- Întoarcerea împotriva sinelui: eroul sau atributele sale sunt periculoase sau inutile; atributele devin o
ameninţare pentru erou;

Sjoback (1988), care a lucrat cu acest test, consideră că nu există dovezi definitive ale validităţi
acestui test. Acest lucru se datorează în mare parte faptului că cei care utilizează testul consideră că
acesta este valid şi fac afirmaţii clinice în legătură cu clienţii lor, afirmaţii pe care le consideră ca fiind
adevărate. Cooper şi Kline (1982) încearcă să remedieze acest deficit, realizând un studiu intens al
testului DMT. Autorii ajung la concluzia că DMT măsoară aspecte diferite de ceea ce măsoară 16 PF.
Într-un alt studiu DMT a fost obiectiv cotat folosind analiza G (Holley, 1973), rezultând că factorul DMT
corelează pozitiv cu succesul în selecţia piloţilor şi este legat de mecanismele defensive perceptive
(Dixon, 1981), care sunt o măsură a represiei. După cum notează şi Kragh (1989), testul DMT este util
în selecţia piloţilor, motivul fiind acela că cu cât se apără mai mult, cu atât aceştia vor răspunde mai
încet la ameninţare, este mult mai probabil să fie implicaţi în accidente.
Există anumite dovezi că testul DMT ar putea fi valid, dar mai este mult până când acest lucru va
fi demonstrat. Cea mai bună modalitate pentru demonstrarea validităţii testului ar fi să se combine
psihanaliza cu investigarea pacienţilor a căror inconştient este aparent cunoscut. Dacă ar apărea un
acord cu judecăţile clinice, acest lucru ar fi o dovadă a validităţii testului DMT. Acesta pare să fie un bun
argument din mai multe puncte de vedere:
a. Ar fi clar din punctul de vedere al raţiunii acestor metode perceptiv-genetice că, în principiu, ar
putea fi folosit orice stimul care reprezentă o ameninţare. Una din dificultăţile cu care ar pute să se
confrunte testul DMT ar fi că figura nu este suficient de ameninţătoare, cel puţin pentru unii subiecţi.
Westerlundl (1976) în studiul legat de agresiunea pacienţilor schizofrenici a utilizat stimuli diferiţi
(între care şi stimuli orali). S-a constat că au apărut mecanisme defensive la stimulii orali, dar nu şi
la imagini controlate.
b. Fraza “mecanismele defensive au fost constatate” sugerează un aspect important. Când testul DMT
este cotat pentru un mecanism defensiv (să spunem reactanţă) atunci când figura ameninţătoare
este descrisă ca zâmbind sau fiind plină de dragoste, aceste lucru este considerat ca fiind un suport
obiectiv al teoriei freudiene. Această interpretare a mecanismului defensiv nu este cu nimic diferită
de cea a unui analist care construieşte o remarcă complementară celei făcută de subiect cu privire
la formarea reactanţei faţă de mamă. Cu alte cuvinte, cotarea la DMT se face identic cu interpretare
a actului de către un analist, care etichetează răspunsul ca fiind un mecanism de apărare.
c. Aceste măsurări realizate cu ajutorul testelor perceptiv-genetice fac publice date rezultate din
relatările făcute de subiecţi, care sunt înregistrate în condiţii precise. Din acest motiv metodele
perceptiv-genetice sunt utile, pentru că ne permit accesul la un proces care în mod normal este
inaccesibil.
Aceste inferenţe sunt făcute analizând descrierea mecanismelor de apărare. Rămâne însă să se
demonstreze că aceste răspunsuri indică mecanisme de apărare sau alte conflicte inconştiente. Dacă
acest lucru nu se va realiza, nu vom putea spune că testele sunt valide, iar testele nu vor mai putea fi
recomandate.
CONCLUZII
Discuţiile despre testele perceptiv-genetice, exemplificate prin testul DMT, indică faptul că
acestea permit accesul la un material care este normal inconştient. Studiile clinice, realizate
de Kragh şi Smith (1970) şi Sjoback (1988) susţin această concluzie. În această situaţie ni se

115
CORNEL HAVÂRNEANU

pare util să se investigheze validitatea testelor perceptiv-genetice curente şi să se testeze eficienţa altor
stimuli. Congruenţa cu ipotezele clinice, psihanalitice constituie o dovadă a faptului că cel puţin
protocoalele testelor conţin un eşantion de material relevant.

XI.3. TESTELE SPECIALE UTILIZATE PENTRU PACIENŢII CARE AU LEZIUNI ALE CREIERULUI

Pacienţii cu leziuni ale creierului sau suspectaţi că ar avea leziuni ale creierului după accidente
sau lovituri, precum şi pacienţii care suferă de demenţă, sunt frecvent testaţi cognitiv pentru a evalua
gradul de deteriorare mentală. Aceste evaluări sunt utile nu doar pentru diagnostic, cum ar fi
discriminarea între efectele îmbătrânirii şi ale leziunilor (Goldstein şi Shelley, 1975) dar şi pentru
tratamentele de reabilitare şi tratament. Mulţi clinicieni utilizează teste de abilitate cognitivă pentru a
face discriminări între grupele psihiatrice care prezintă tulburări de gândire datorare unor leziuni ale
creierului, chiar dacă abilităţile lor cognitive nu sunt deteriorate. Schizofrenicii cu siguranţă fac parte din
această categorie.
Vom discuta despre raţiunea şi natura testelor deficitului cognitiv.

a. Utilizarea unui standard al testelor de abilitate


O abordare obişnuită pentru măsurarea deficitului cognitiv constă în utilizarea unui standard ale
testelor de abilitate. WAIS-ul (Wechsler, 1958) este potrivit pentru acest scop, deoarece scalele permit
evaluarea anumitor deficienţe cognitive. După cum menţionează Howard (1989) diferite configuraţii ale
sub-scorurilor sunt utilizate de clinicieni pentru a indica anumite deficienţe cognitive de natură organică,
precum şi altor probleme psihiatrice. Maloney şi Ward (1976) discută în detaliu utilizarea WAIS-ului.
Utilizarea WAIS-ului pentru investigarea deficitelor cognitive este împiedicată de faptul că, deşi
acesta apelează la cumularea sub-scalelor, acestea sunt totuşi prea scurte. Deficitele cognitive sunt mai
bine evaluate nu printr-o măsurare globală a abilităţilor cognitive, ci prin teste care să fie mult mai
specifice, care vizează abilităţi limitate.

b. Teste speciale
Kay (1989) argumentează că testele de inteligenţă (QI), cum ar fi WAIS-ului, nu au fost construite
pentru a discrimina pur şi simplu între grupele de subiecţi anormali, deşi după cum am văzut este sunt
folosite în acest scop, şi că ar trebui folosite teste special construite care oferă sensibilitatea şi
discriminarea necesară. Kay consideră că aceste teste ar trebui să vizeze măsurarea proceselor şi
funcţiilor cognitive. Pentru ca aceste teste să fie valabile este nevoie de o bază teoretică, ca cea
evocată de Sternberg (1981) şi Cattell (1971).
Goldenberg (1989) a fost preocupat de raţiunea dezvoltării acestor teste pentru folosirea lor în
diagnostic şi tratament în psihologia clinică. Ideal ar fi ca realizarea testelor neuro-psihologice să vizeze
cât mai mult posibil funcţii cognitive specifice. Totuşi cele mai multe teste neuro-psihologice nu au o
utilitate specifică pentru că ele sunt desemnate să descrie statusul cognitiv al pacienţilor fără a face
referinţă la creier. Goldenberg argumentează că încercările de a construi teste pure pentru un singur
factor ale funcţiei cognitive specifice sunt foarte rare, chiar dacă acestea au avut succes. Trăsăturile,
deprinderile sau comportamentele sunt complexe factorial.
După cum susţine Goldenberg (1989) există unele consecinţe importante ale faptului că de fapt
nici unul din teste nu este precis neuro-anatomic. Din acest motiv diagnosticul neuro-psihologic este

116
PSIHODIAGNOSTIC (I)

însoţit de necesitatea de a administrare a unei baterii de teste. Testele neuro-psihologice cu un singur


factor şi deficienţele performanţei la un singur factor nu sunt necesare pentru a evidenţia disfuncţia unei
singure localizări neuro-anatomice sau a unei simple dimensiuni cognitive. De aceea este nevoie de o
baterie de teste neuro-psihologice.
În acest context, măsurarea utilă pentru psihologia clinică a unui deficit cognitiv, implică utilizarea
unor teste care să măsoare o mare varietate de funcţii în special acele procesări de informaţii care au
fost identificate ca fiind importante în psihologia cognitivă. Aceste măsurări pot să permită inferenţe cu
privire la locul şi extinderea leziunilor creierului.
Warrington (192, 1975 a realizat studii pentru a elucida deficitele care apar în diferite tulburări
patologice El a realizat studii de psihologie experimentală cognitivă asupra leziunilor implicate în
memoria sistematică şi recunoaşterea obiectelor. A realizat un instrument util - Testul de Recunoaştere
din Memorie (Warrington, 1984). Acest test cere subiecţilor să recunoască cuvinte sau obiecte care au
fost anterior prezentate. Se poate obţine un scor la recunoaşterea verbală şi cea vizuală şi se consideră
că rezultatele ar indica locul leziunilor din creier, ambele scoruri putând fi folosite ca bază pentru
diagnostic şi tratament. Acest test este doar o măsură şi nu reprezintă o parte dintr-o baterie.
O baterie tipică pentru evaluarea neuro-psihologică este Bateria Luria Nebraska (Golden, 1980),
care evaluează un rang neuro-psihologic. Aplicarea testului durează 3½. Această baterie măsoară
motricitatea, ritmul, funcţiile tactile şi vizuale, viteza de receptivitate şi expresivitate, scriere, citire,
memorie şi procesele intelectuale. Toate aceste teste s-au dovedit utile pentru construcţia unui tablou
cognitiv al deficitelor cognitive ale subiectului şi a posibilei deteriorări neuro-psihologice.

CONCLUZII
În esenţă aceste teste încearcă să evalueze funcţiile cognitive de bază, şi au ca fundament
teoretic teoriile psihologice cognitive. Normele sunt esenţiale pentru că ne permit să vedem
care sunt afecţiunile tipice ale creierului.

XI.4. TESTE SPECIALE ŞI LISTE (CHECKLIST)

Vom discuta despre construcţia şi utilizarea testelor care sunt virtual liste (checklist). De exemplu,
lista simptomelor sau caracteristicilor unei sesiuni de terapie. Acestea sunt adesea folosite în evaluare
şi în studii de psihoterapie, unde se urmăreşte evaluarea progresului sau rezultatelor terapiei sau a
ceea ce simt clienţii în legătură cu tratamentul. În studiile lui Sheffield (Shapiro, 1990) sunt prezentate
câteva teste de acest tip. Vom prezenta şi noi câteva dintre aceste teste.
a. Teste de conţinut.
Deşi aceste teste sunt de natură clinică, teste similare au fost construite pentru a fi utilizate în
diferite contexte. În psihologia educaţională este posibil să se construiască liste (checklist) pentru
evaluarea performanţelor şcolare şi pentru evaluarea problemelor de comportament ale copiilor în
clasă. Stott (1957) a construit un set de teste care sunt utilizate în acest scop - Ghidul Bristol de
Ajustare Socială - care evaluează comportamentul copiilor la şcoală şi acasă. În psihologia ocupaţională
listele sunt folosite pentru evaluarea comportamentului angajaţilor şi sunt valabile pentru evaluarea
caracteristicilor dezirabile şi necesare pentru un anumit post. Chestionarul Analizei Poziţiei (McCormick,
1972) este un exemplu pentru acest tip de teste.

117
CORNEL HAVÂRNEANU

b. Fidelitatea şi analiza factorială a testelor


Scala de evaluare SCL-90 (Derogatis, 1973) este un exemplu pentru acest tip de teste. Aceasta
constă într-o listă de 90 de simptome pe care subiecţii le evaluau cât de mult le-au resimţit în ultimele
două săptămâni. Itemi tipici au fost: simt critica celorlalţi, simt că orice lucru pe care îl fac este un efort,
exagerez etc. Este evident că dacă simptomele sunt bine alese şi pot fi utile, pentru diagnostic, în
găsirea unor grupări de simptoame, în evaluarea şi monitorizarea psihoterapiei, în care se presupune
că dacă lucrurile vor merge bine pe parcursul terapiei simptomele vor scădea în intensitate şi vor fi mai
puţine ca număr.
În utilizarea acestui tip de teste, care sunt complet empirice şi ateoretice, singurul criteriu pentru
eşecul sau succesul terapeutic în reprezintă apariţia simptomelor.
Pentru astfel de scale trebuie să se demonstreze precizia şi să se arată că aceste scale conţin
unul sau mai mulţi factori. În prezent aceste demonstraţi sunt lipsite de semnificaţie. Se presupune că
pacienţii fac raportări corecte, fie că au fie că nu au aceste simptome. Astfel, scala are sau nu
consistenţă internă. Consistenţa internă şi fidelitatea reflectă pur şi simplu gradul în care aceste
simptome se întâmplă să fie asociate cu altele în viaţa de zi cu zi. Acest lucru este departe de situaţia în
care se încerca să se demonstreze că un set de itemi ai unui test de personalitate sunt extraşi dintr-un
domeniu comun de itemi, în care trebuia să se demonstreze că aceşti itemi sunt legaţi. Pentru a cota
precizia consistenţei interne a listelor (checklists) înseamnă pur şi simplu supunerea la ritualul
psihometric. Coeficienţii nu sunt importanţi.
Acelaşi lucru se întâmplă şi în cazul analizei factoriale. Informaţia că există x factori nu înseamnă
nimic mai mult decât că x grupe de simptoame tind să se grupeze împreună. Acestea pot confirma
categoriile de diagnostic, care pot prezenta interes clinic. Totuşi în multe situaţii astfel de factori pur şi
simplu reflectă asemănările semantice ale itemilor. Un exemplu de astfel de test este scala relaţiilor
client-terapeut, care a fost studiată de Shapiro (1990). Un cluster de itemi se referea la ceea ce simt
pacienţii despre terapeut iar altul se referea la descrierea terapeutului. Autorii nu fac referire la alte
variabile care s-ar afla în spatele testului. Universul de itemi din care a fost realizat testul a fost un set
de itemi care descriau terapeuţii. Aceasta este în contrast cu un set de itemi ai extraversiunii, care dacă
testul este valid reflectă un set larg de comportamente, care se află în spatele testului. Faptul că pot să
existe mai mulţi factori, nu numai unul, înseamnă doar că un scor nu poate fi utilizat bazându-ne doar
pe o simplă adiţionare a itemilor liste (checklist). Chiar dacă există câţiva factori într-o listă a
simptomelor, numărul absolut al simptomelor, înainte şi după tratament poate prezenta interes.
Din aceste argumente se poate vedea că în listele (checklist) nu revendică faptul că este
măsurată o variabilă prin intermediul itemilor, precizia şi construcţia factorială este mai puţin importantă
decât în cazul testelor psihometrice, unde variabilele sunt mai mult sau mai puţin o listă de itemi
asemănători.
c. Liste (checklists) şi simţul comun
Aceste liste sunt construite intuitiv plecând de la simţul comun, rezultatul fiind acela că este greu
de găsit ceva nou. Simţul comun poate fi refuzat dacă ipoteza nu este confirmată. Acest lucru se
întâmplă pentru că, prin natura construcţiei lor aceste test nu pot produce noi variabile. Această situaţie
contrastează cu testele de personalitate psihometrice unde, variabilele obţinute în urma analizei
factoriale, cum fi extraversiunea, anxietatea, obsesii, permit psihologilor să dezvolte noi modele de
personalitate.

118
PSIHODIAGNOSTIC (I)

d. Concluzii: liste (checklist) şi natura factorilor


Esenţa problemei este legată de natura factorilor. Am subliniat importanţa testelor analizate
factorial. Totuşi aceste teste, măsoară factori pentru care există un tip de validitate externă. Un astfel de
exemplu este inteligenţa. Factorul inteligenţă, măsurat prin intermediul testelor de inteligenţă, prezic
succesul academic, ocupaţional. Dar există şi indexul ridicat al eredităţii.
Din nefericire unele teste măsoară pur şi simplu specificităţi umflate (Cattell, 1978). Astfel de
teste au o precizie ridicată şi itemii au o saturaţie mare în factorul măsurat. Totuşi factorii cu specificităţi
umflate pot fi distinşi de factorii independenţi, importanţi prin faptul că aceşti factori nu corelează cu alte
variabile. În esenţă multe liste (checklist) şi teste similare sunt de acest tip. Itemii formează factori
pentru că evident similari. În acest caz informaţia psihologică este obţinută din itemii înşişi.
Un exemplu va clarifica acest aspect. În scala relaţiei client-terapeut există un item: “Deprinderile
profesionale ale terapeutului meu sunt impresionante”. Se presupune că acest item şi ceilalţi itemi
similari permit distincţia celor care se bucură de terapie, care se simt bine ca rezultat al terapiei. Totuşi
nu se poate face mai mult decât această inferenţă, şi anume că cei care se simt mai bine şi se bucură
de terapia găsesc că terapeutul lor este impresionant. Dacă rezultatele sunt slabe, pacienţii care nu se
simt mai bine nu găsesc deprinderile terapeutului lor ca fiind impresionante şi doar acest lucru putem
să-l afirmăm.
Uneori aceste informaţii pot fi valabile dar nimic nu se adaugă analizând factorial aceste teste.
Testele au răspunsurile cuantificate în aşa fel încât să fie posibil să se comparare grupele statistice. Se
pare că este puţin mai mult decât cunoaşterea anterioară, care punea pe primul loc construcţia testului.
4. Teste de emoţii bazate pe modele circumplex şi alte modele similare
Există un mic grup de teste construite după modelul Guttman, numit şi modelul circumplex.

XI.5. DESCRIEREA MODELULUI CIRCUMPLEX


Acesta este un model particular în care apare analiza în faţetei (facet). O faţetă (facet) este un
sistem de clasificare în care fiecare faţetă (facet) poate avea mai multe de nivele de clasificare. În
analiza faţetelor (facet), după cum menţionează Nunnally (1978) există un număr de stadii. Să
presupunem că avem o colecţia de teste. Mai întâi trebuie să sugerăm o structură a faţetei, în care
există o anumită combinaţie a tuturor categoriilor. Această structură propusă ar trebui să ne conducă la
o matrice ipotetică de intercorelaţiilor testelor. Atunci când matricea ipotetică este comparată cu
corelaţiile actuale, observate, sunt posibile testele statistice (ale potrivirii). Dacă suma faţetelor este
bună, atunci cotarea testului trebuie calculată ca o măsură a faţetelor de bază.
După cum argumentează Nunnally (1978) această analiză a faţetelor (facet) face referinţă la o
analiză corelaţională masivă deoarece se referă la structura ipotetică a întregii matrici mai curând decât
la factorii individuali. Faţetele (facet) pot fi explicate în termenii combinaţiilor lor, a factorilor ce stau la
baza matricei. Deşi este posibil să derive noi faţete (facet) din corelaţiile dintre teste, în mod obişnuit în
analiza faţetelor (facet) se începe cu ipotezele referitoare la faţete şi combinaţiile dintre acestea în
cadrul fiecărui test.
În cadrul acestui model structura faţetelor este circulară. Fiecare variabilă poate fi privită ca un
cluster deoarece este un amestec al componentelor faţetelor. Începem cu variabila 1 (sunt 8 variabile)
fiecare variabilă are mai multe în comun cu variabilele vecine decât cu cele care se află la distanţă (de
exemplu variabila 1 cu 2, variabila 7 cu 8). Totuşi ele sunt aranjate într-un cerc, în care variabilele din
mijloc 4, 5 şi 6 au mai puţin în comun cu extremele decât între ele, în timp ce variabilele de la extreme
ce suprapun în termenii compoziţiei faţetelor (1 şi 8). Într-un model circumplex se pleacă de la diagonala

119
CORNEL HAVÂRNEANU

părţilor matricei, numărul de faţete în comun începe de la zero şi apoi creşte indicând natura circulară a
naturii varianţei împărţite.
Nunnally (1978) ilustrează excelent modelul circumplex plecând de la faţetele comune, care clarifică
Cooperant natura ordonării
circulare. Trebuie
A: Încrezător
B: Stabil Docil menţionat că este
Responsabil C: Afectiv posibil să
B: Stabil
D: Supus
A: Încrezător C: Afectiv convertim o
B: Stabil D: Supus
C: Afectiv E: Neîncrezător matrice a faţetelor
H: Ascendent comune într-o
matrice ipotetică de
7 6 C: Afectiv corelaţii: numărul
8 D: Supus Modest
A: Încrezător de faţete comune
Managerial B: Stabil 1 5 E: Neîncrezător
G: Ostil F: Instabil poate avea
H: Ascendent 2 4 legătură cu
3
procentajul de
D: Supus varianţă comună, a
A: Încrezător E: Neîncrezător
F: Instabil F: Instabil cărui rădăcina
G: Ostil G: Ostil
E: Neîncrezător pătrată este
H: Ascendent
F: Instabil Sceptic
G: Ostil corelaţia.
Competitiv
H: Ascendent Reproducem
Agresiv aceasta în figura 1.

Figura 1
Trebuie să facem câteva precizări legate de acest model. Mai întâi, după cum argumentează
Nunnally (1978) acest model reprezintă un sumar elegant al datelor în matricei de corelaţie. Aceasta
este raţiunea analizei factoriale, dar din analiza factorială nu rezultă un număr evident de factori, dar ea
poate fi folosită pentru găsirea unui principiu de rezumare a datelor. Adepţii analizei corelaţionale
masive susţin că modelul circumplex permite acest lucru. McCrae şi Costa (1989) argumentează că
modelul permite o bună evaluare a personalităţii şi poate fi privit ca un model complementar la
descrierea analitică a factorilor.
Totuşi metoda analizei masive este complexă din punct de vedere logic şi statistic, iar dificultatea
se datorează lipsei de claritate în ceea ce priveşte diferenţele dintre noţiunile de faţetă şi variabilă.
O altă obiecţie a fost menţionată de Nunnally (1978). Analiza faţetelor, spre deosebire de analiza
factorială nu este o metodă de descoperire. Mai curând este o metodă de testare a ipotezei. Totuşi
modelul circumplex este o ipoteză extrem de complexă şi doar foarte rar este posibil ca ipoteza unei
structuri cu o astfel de complexitate să ducă la obţinerea de cunoştinţe curente în domenii psihometrice
principale ale personalităţii, motivaţiei şi abilităţii.
Din descrierea simplificată a modelului se poate observa că faţetele sunt fie prezente fie absente.
Totuşi în aplicaţiile realiste ale testelor psihologice o astfel de măsurare simplă este mai puţin probabilă.
Se poate avea în vedere şi greutatea diferită a diferitor faţete, iar acest lucru ar duce la complicarea
modelului circumplex.
Poate că cel mai important aspect se referă la faptul că analiza faţetelor nu este o metodă de
construcţie prin analiză a faţetelor de bază. Acest lucru deosebeşte modelul de analiza factorială.

120
PSIHODIAGNOSTIC (I)

Chiar dacă s-a arătat că este un model sumar al matricelor de corelaţie complexe, descrierea nu
pare să aibă o semnificaţie particulară. Este un punct de vedere subiectiv. Există autori care pot găsi o
descriere valabilă a modelului circular sau o semnificaţie a acestuia.

CONCLUZII
Din descrierea şi discuţiile asupra modelului circumplex este clar că este o metodă
ingenioasă de sumare a matricei scorurilor la test.

XI.6. CERCETĂRILE LUI PLUTCHIK


Plutchik a studiat o perioadă lungă de timpe emoţiile. Abordarea psiho-evoluţionistă (Plutchik,
1980) a emoţiilor le leagă de trăsături şi stări. Trăsăturile sunt privite ca stări afective (emoţii) care
persistă şi apar frecvent între-o varietate de situaţii. În cadrul teoriei sunt aduse noţiunile de mecanisme
de apărare şi mecanisme inconştiente pentru a putea explica conflictele emoţionale şi de coping,
tehnicile conştiente fiind folosite pentru rezolvarea acestor conflicte.
Aceasta este baza teoretică a testelor de emoţii ale lui Plutchik care sunt făcute să se potrivească
modelului circumplex. Aşa cum s-a afirmat trăsăturile de personalitate, în cadrul acestei teorii derivă din
emoţii. Trăsăturile rezultă din persistenţa situaţiilor care produc emoţii amestecate. De exemplu, o
persoană care întotdeauna simte teamă în situaţii dar care doreşte să fie plăcută de ceilalţi mult mai
probabil va dezvolta trăsătura de docilitate (Plutchik şi Conte, 1989). Dacă caracteristicile înnăscute ale
emoţiilor se reflectă în trăsăturile de personalitate, atunci, conform lui Plutchik şi Conte (1989), modelul
circumplex este bun pentru măsurarea trăsăturilor şi emoţiilor. În termenii modelului circumplex emoţiile
pot fi aduse ca faţete ale diferitor trăsături de personalitate.

a. Indexul profilului emoţional


Plutchik (1980) a descris măsurarea a opt emoţii de bază. Se presupune că toate trăsăturile de
personalitate rezultă din amestecul a două sau mai multe emoţii primare. Timiditatea implică frică, de
exemplu, iar melancolia implică tristeţea.
Indexul este un test cu alegeri forţate în care 12 termeni trăsături de personalitate sunt aranjaţi în
perechi, luându-se în seama toate combinaţiile posibile (excluzând patru perechi identice), subiecţii
trebuind să aleagă cuvântul din pereche care îi caracterizează cel mai mult. Pentru fiecare cuvânt este
ales scorul pe una sau mai multe dintre cele opt dimensiuni emoţionale de bază. Aceste dimensiuni
sunt: bucurie, acceptare, surpriză, frică, dezgust, tristeţe, aşteptare şi furie. Acest test măsoară toate
dimensiunile care sunt aranjate circumplex în termenii similarităţii şi bipolarităţii.
Subiecţii primesc un scor pentru fiecare dintre cele opt dimensiuni ale testului. Apoi acest scor
este convertit în centile pe baza unui eşantion de 500 de subiecţi de sex masculin şi 500 de subiecţi de
sex feminin. Aceste centile sunt reprezentate grafic într-un cerc împărţit în opt segmente, unde zero
este la centru cercului iar centilul 100 pe circumferinţa cercului. Autorii menţionează că
precizia/fidelitatea testului este ridicată (Plutchik şi Conte, 1989). Conform acestor autori valoarea mai
însemnată a EPI se bazează direct pe teoria emoţiilor, care a determinat alegerea unei dimensiuni ce
va fi măsurată, care va fi bază pentru identificarea componentelor emoţionale ale trăsăturilor şi în final
se va dovedi o bază pentru măsurarea conflictului amestecului dintre trăsături şi emoţii.

121
CORNEL HAVÂRNEANU

CONCLUZII
Nu s-a urmărit evidenţierea valorii Indexului Profilului Emoţional ci de a ilustra modelul
circumplex ca bază pentru construcţia unor teste. Plecând de la descrierea teoriei şi a
testului este clar că acest model poate fi utilizat în construcţia testului. Înainte de a analiza
valoarea acestui model, vom descrie pe scurt instrumentul dezvoltat de Plutchick, şi anume Indexul
Profilului de Personalitate, PPI.

b. Indexul Profilului de personalitate.


Testul EPI se bazează pe faptul că modelul circumplex care este cea mai bună descriere a
trăsăturilor. Trăsăturile utilizate în acest test sunt cele indicate de modelul circumplex al lui Conte (1975)
şi Conte şi Plutchick (1981), care investighează structura a 171 de itemi.
Versiunea finala a PPI-ului conţine 89 de itemi (termeni trăsături) la care subiecţii răspund pe o
scală cu 5 trepte de la “niciodată” la “foarte des”. Dimensiunile modelului circumplex sunt: acceptare,
supunere, pasivitate, asertivitate, sociabilitate, respingere, agresiune şi revoltă.
Întrebarea la care trebuie să se răspundă cu privire la PPI se referă la natura celor opt trăsături.
Dacă ele se potrivesc modelului circumplex şi ce vizează ele? După părerea autorilor faptul că
trăsăturile se potrivesc modelului are mai puţină importanţă din punct de vedere psihologic. Ele sunt au
mai puţină importanţă decât o structură factorială simplă, care ne informează în legătură cu mărimea
factorilor, intercorelaţii şi faptul că aceştia sunt factorii principali ai câmpului. Modelul circumplex ne
informează pur şi simplu că factorii pot fi aranjaţi logic pe circumferinţa unui cerc. Astfel se elimină
problema referitoare la faptul că unii factori pot să nu se potrivească prea bine paternului.
Este dificil de validat aceste dimensiuni. Plutchick şi Conte (1989) afirmă că analizând modul cum
termenii au fost grupaţi în jurul modelului circumplex, indicând faptul că aceştia au o structură explicită
asemănătoare. De exemplu, o grupare este clar legată de agresiune (e.g. “argumentativ”, “beligerant”)
şi un alt grup de cuvinte, cum ar fi sincer, puternic, şi candid (nepărtinitor) reflectă asertivitatea şi nu
agresiunea. Acest lucru ne atenţionează că argumentele psihometrice trebuie analizate cu atenţie.
Afirmaţia “o grupare este clar legată de agresivitate” nu semnifică nimic mai mult decât faptul că
autorii cred că acest lucru este adevărat. Pentru a spune că termenii sunt înrudiţi celui de agresiune nu
este o problemă de opţiune ci este nevoie de suport empiric care să ofere dovezi. Simpla aserţiune nu
este suficientă. Acest lucru este mai important pentru a doua aserţiune, şi anume că cuvinte similare
măsoară mai curând asertivitatea decât agresiunea. Această etichetare a dimensiunii este pur şi simplu
un aspect al validării. Este important pentru că un argument al acceptării modelului circumplex este
acela că dimensiunile trebuie să posede calităţile asemănării şi polarităţii.
Dimensiunile indexului profilului de personalitate sunt identificate doar în termenii itemilor lor, iar
această formă de validitate nu este satisfăcătoare. Faptul că ei sunt aranjaţi într-un circumplex ne dă
puţină informaţie despre structura lor. Este nevoie de o analiză factorială a acestor scale cu factori
principali de personalitate. Este posibil ca să rămână puţină varianţă neexplicată în IPP şi de aceea
putem avea nevoie ca descrierea circumplexă să fie înlocuită.

Concluzii
Aceste două exemple de teste ale lui Plutchik şi colegilor care se bazează pe modelul circumplex
care nu pare să aibă un suport suficient pentru a fi utilizat şi a avea valoare în construcţia testelor. Acest
tip de descriere ar putea fi utilă dacă s-ar arăta că variabilele din modelul circumplex nu se potrivesc cu
alte structuri. Acest lucru nu se aplică şi în cazul IPP, pentru că toate scalele corelează semnificativ cu
Scala Stimei de Sine a lui Fitts (1965). Aceasta înseamnă că acest scale nu sunt independente şi că

122
PSIHODIAGNOSTIC (I)

dispare structura modelului circumplex. După cum s-a sugerat anterioară analiza factorială a acestor
scale indică doar o mică varianţă rămasă neexplicată. Plutchik şi colegii săi au arătat că structura
modelului circumplex se potriveşte scalelor. Totuşi rezultă o mică semnificaţie psihologică din aceste
corelaţii cu scala stimei de sine, şi este posibilă o mai mare cantitate de varianţă a acestor itemi.
Aceleaşi argumente e aplică şi scalei emoţionale. Cele 12 termeni trăsături care au fost utilizaţi
pentru construcţia scalelor au fost selectaţi doar pe baza faptului că exista un bun acord între judecăţile
privitoare la consecinţele emoţiilor. Acest lucru nu este mai mult decât un aspect al validităţii. Ca în
cazul EPI o analiză factorială a acestor scale cu notele pentru factorii de personalitate ar releva natura
varianţei. În prezent etichetarea lor se face pur şi simplu în termenii validităţii şi teoriei emoţiilor a lui
Plutchik.
Aceste două exemple de teste construite după modelul circumplex nu par să ofere suficient
suport ca bază pentru construcţia testelor. Principale problemă a modelului provine din faptul că chiar
dacă există o descriere a datelor aceasta nu este o descriere informativă. Există puţină informaţie care
să ducă la concluzia că scala se potriveşte unui circumplex.
Modelul va fi util atunci când va fi clar faptul că modele psihometrice normale, cum ar fi o simplă
structură de factori, nu se potriveşte complexităţii datelor.

XI.7. REPERTORIUL CU TEST GRILĂ


Au fost dezvoltat de Kelly (1955) ca metodă de colectarea de date relevante pentru teoria
constructelor personale. Aceste instrumente nu sunt teste, deşi ele au fost astfel descrise de unii
psihologi. Esenţa teoriei constructelor, care stă la baza acestor instrumente este aceea că oamenii sunt
văzuţi ca oameni de ştiinţă care întotdeauna încearcă să dea un sens lumii înconjurătoare. Ei fac acest
lucru formând constructe care sunt dependente de experienţa lor cu o specificitate care ţine de propria
persoană. Kelly şi teoriile constructiviste (Bannister şi Main, 1968) consideră că testele psihologice
standard sunt lipsite de valoare deoarece semnificaţia itemilor este diferită pentru fiecare individ.
Repertoriul cu test şi grilă ajută la elucidarea semnificaţiei unor constructe importante din viaţa
individului.

Descrierea unui repertoriu


O listă conţine elemente şi constructe. “Elementele pot fi orice din lume, pentru a cita pe
Bannister (1973), filme, deschiderea unei cutii cu brânză, ..., tipuri de trandafiri ş.a.m.d.” Constructele
sunt discriminările pe care le face persoana între elementele listei. O astfel de listă ne ajută să elucidăm
astfel de constructe, respectiv elementele care sunt relevante.

Un exemplu de listă
Să presupunem că suntem interesaţi de constructele unei femei despre lume. Îi vom cere să
numească 15 persoane importante din viaţa ei, cum ar fi mama, tata, iubit, şeful de la serviciu etc.
Acestea vor fi elementele. Constructele vor fi obţinute de la subiect prin gruparea elementelor în trei şi
cerând subiectului să ne spună două grupe care sunt apropiate şi diferite de a treia. Astfel, putem obţine
că A şi B sunt inteligenţi, în timp ce C este slab. Constructul este: inteligent-slab. Asemănător vom
descoperi că D şi E sunt manieraţi în timp ce F este nemilos. Este important ca constructele să fie
elaborate de subiect deoarece sunt particulare pentru acesta. Există şi alte metode pentru a elabora
constructe, dar ele sunt esenţial echivalente metodei pe care au descris-o. Trebuie menţionat că există
mai multe tipuri de metode descrise de Kelly (1955), multe dintre ele au fost rar folosite. Una dintre ele

123
CORNEL HAVÂRNEANU

explorează relaţiile dintre constructe, în mod particular care constructe implică alte constructe (Hinkle,
1965).

Analiza listelor
Subiecţilor li se poate cere să ierarhizeze fiecare element al fiecărei construct sau să evalueze
fiecare element al fiecărui construct. Ambele metode au ca rezultat corelaţii între constructe. Este
posibil să vedem ce constructe merg împreună şi bineînţeles cum se plasează indivizi similari în funcţie
de aceste constructe. Astfel putem constata că inteligenţa şi cruzimea sunt corelate, şi apoi
întorcându-ne la elemente să constatăm, de exemplu, că un profesor de la liceu care este urât de
subiect este văzut în mod asemănător în relaţie cu mama.
Este clar că această metodă produce informaţii care sunt utile pentru înţelegerea indivizilor
particulari şi aceste liste par să fie potrivite pentru utilizare clinică Este dificil însă de stabilit ce se poate
face mai departe cu aceste informaţii, având în vedere faptul că listele pentru diferiţi indivizi nu sunt
compatibile.
Unii cercetători au analizat factorial listele (Slater, 1964, 1976) şi au dezvoltat un set statistic
sofisticat de programe computer în acest scop. Totuşi fiind un număr mic de observaţii pentru fiecare
listă, erorile statistice ale acestor analize factoriale pot fi atât de mari încât metoda de prelucrare
statistică să fie considerată ca fiind îndoielnică. Chiar dacă rezultă factori ei sunt specifici unui individ
particular şi de acea prezintă un interes ştiinţific redus.
Un număr mare de observaţii se pot face legat de afirmaţia că constructele sunt distincte şi
particulare pentru fiecare individ. Acest adevăr pare să fie banal. Toţi avem o experienţă de viaţă care
este privată şi care este diferită de a celorlalte persoane. Această experienţă este atât de diferită încât
testele sunt lipsite de valoare.
Dacă acest aspect ar fi adevărat atunci conversaţia şi înţelegerea dintre oameni ar fi imposibilă.
Faptul că lumea exterioară poate fi înţeleasă sugerează că pentru oameni există un nucleu comun de
semnificaţii chiar dacă aceste nu sunt identice.
Există câteva dificultăţi severe. Dacă constructele individuale folosite sunt atât de diferite atunci
ele pot fi elucidate pornind de la informaţiile din liste care sunt particulare pentru un individ, neputând fi
combinate cu rezultatele altor subiecţi şi neputându-se face inferenţe despre rezultatele unui subiect
comparativ cu cele ale altui subiect. Aceasta distruge scopul ştiinţific normal al descoperirii legilor
generale aplicabile tuturor sau unui număr mare de aspecte ale umanităţii. Dacă premisele listelor sunt
acceptate putem spune că psihologia ştiinţifică este imposibilă şi că pot fi înţeleşi doar indivizi separat.
Ar fi util să stabilim relaţii între măsurarea individului cu ajutorul listelor şi scorurile la anumite variabile
din mediu. Chiar dacă ar fi posibil să stabilim asemenea relaţii aceste nu ar fi utile deoarece
constructele sunt aprioric diferite unele de altele şi nu ar fi posibile inferenţele sau extrapolările. Doar în
domeniul clinic informaţiile rezultate prin folosirea listelor ar putea fi utile.
De exemplu o grilă ar putea fi folosită în terapia maritală. S-ar putea constata că soţul îşi vede
soţia ca pe o mamă în timp ce soţia îşi vede soţul ca tată. Această incompatibilitate poate crea
probleme. Discutarea acestor dificultăţi ar duce la îmbunătăţirea relaţiei. Să presupunem că dificultatea
rezidă în certuri frecvente. Deoarece constructele indivizilor sunt diferite nu se pot face generalizări.
Simţul comun ar sugera că o ipoteză rezonabilă ar fi să presupunem că atunci când bărbatul doreşte ca
soţia să reprezinte imaginea mamei iar femeile imaginea tatălui putem vorbi de o dizarmonie maritală.
Dacă această inferenţă este făcută atunci listele, distincte de interviu şi chestionar, care au constructe
comune, nu au raţiunea de a exista. Aceste motive stau la baza respingerii listelor pentru măsurare.

124