Sunteți pe pagina 1din 106

BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

PROF. UNIV. DR. CORNELIU EUGEN HAVÂRNEANU


BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

Introducere
Competenţe specifice acumulate
Competenţe profesionale şi descriptori
 Explicarea şi interpretarea fenomenelor psihologice, utilizând adecvat concepte şi teorii de bază din domeniu
 Elaborarea strategiei de cercetare prin identificarea şi utilizarea adecvată a anumitor metode de cercetare, în funcţie
de specificul fenomenului studiat
 Elaborarea strategiei de psihodiagnostic prin identificarea adecvată a metodelor si tehnicilor de evaluare psihologică,
în funcţie de scopul testării şi grupul ţintă.
 Evaluarea caracteristicilor psihometrice ale instrumentelor de evaluare psihologică.
 Explicarea şi interpretarea faptelor şi teoriilor utilizând cunoştinţe de bază din domeniu, precum şi observaţii şi informaţii
obţinute în mod propriu.
 Elaborarea de interpretări psihologice ale comportamentului şi ale proceselor mentale la diferite niveluri.
 Utilizarea adecvată în comunicarea profesională a conceptelor, metodelor şi instrumentelor specifice evaluării
psihologice (individuală, de grup şi organizaţională).
Competenţe transversale
 Autoevaluarea nevoilor de formare continuă în vederea adaptării competenţelor profesionale la dinamica contextului
social
 Îndeplinirea responsabilă a sarcinilor profesionale în conformitate cu valorile şi etica profesională

Obiectivele disciplinei
Obiectivul general
Formarea competenţelor de operare cu concepte fundamentale în domeniul psihologiei, de proiectare şi realizare a unui
demers de cercetare în psihologie, de evaluare critică a situaţiilor problematice şi a soluţiilor posibile în psihologie, de evaluare
psihologică a individului.
Obiectivele specifice
La finalizarea cu succes a acestei discipline, studenţii vor fi capabili să:
 Explice conceptele fundamentale în domeniul psihodiagnosticului.
 Utilizeze cunoștințele acumulate în activitatea de construcție, aplicare și interpretare a testelor psihologice.
 Interpreteze faptele şi fenomenele psihologice utilizând cunoştinţe de bază din domeniu.
 Analizeze principalelor calități psihometrice ale instrumentelor psihologice.

Structura cursului
Unitatea de învățare 1 – Istoria evoluției psihologiei diferențiale și psihodiagnosticului – 3 ore
Unitatea de învățare 2 – Măsurarea în psihologie - 4 ore
Unitatea de învățare 3 – Metoda testelor - 5 ore
Unitatea de învățare 4 – Fidelitatea – 5 ore
Unitatea de învățare 5 – Validitatea – 5 ore
Unitatea de învățare 6 – Standardizarea testelor - 3 ore
Unitatea de învățare 7 – Alte tipuri de teste psihologice – 3 ore

Instrucţiuni privind parcurgerea cursului: Vă recomandăm să parcurgeți unitățile de învățare în ordinea indicată în suportul
de curs. Fiecare unitate de învățare include aplicații, întrebări, teme de reflecție și teste de autoevaluare care au ca scop
facilitarea procesului de învățare. Deși nu sunt obligatorii, acestea susțin parcurgerea structurată, gradată și temeinică a
conținuturilor disciplinei. Temele de control obligatorii sunt semnalate și în unitățile de învățare corespunzătoare. Vă
sugerăm să rezolvați fiecare sarcină de lucru pe măsură ce parcurgeți fiecare unitate de învățare.

Evaluare
a. Evaluarea continuă: temele de control obligatorii, aflate la sfârşitul unităţii de învăţare 11, vor fi evaluate cu o notă de la
1 la 10 și apoi se va face media acestor note pentru a obține o notă finală pentru această formă de evaluare. Ponderea
acestei note la nota finală: 50%.
b. Evaluarea finală: examen scris sub forma unui test docimologic. Ponderea la nota finală: 50%
ALGORITM DE CALCUL:
Nota finală = 0,5 x nota la evaluare continuă + 0,5 x nota la evaluarea finală

95
CORNELIU-EUGEN HAVÂRNEANU

Bibliografie
Referinţe principale:
 Cosmovici, A., 1992, Resurse ale psihodiagnosticului, în Analele Universităţii “Al. I. Cuza” Iaşi, serie nouă 1, 1;
 Cosmovici, A., Crăciunescu, R., Cristescu, M., Neculau, A., Rudică, T., Teodorescu, S., 1972, 1985, Metode pentru
cunoaşterea personalităţii, E.D.P., Bucureşti;
 Havârneanu, C., 2000, Cunoaşterea psihologică a persoanei, Iaşi, Polirom;
 Holban, I. (coord.), 1977, Cunoaşterea elevului. O sinteză a metodelor, Bucureşti, Ed. Didactică şi Pedagogică;
 Mitrofan, N., 2009, Testarea psihologică – Aspecte teoretice și practice, Editura Polirom, Iaşi
 Mitrofan, N., Mitrofan, L., 2005, Testarea psihologică – inteligenţa şi aptitudinile, Editura Polirom, Iaşi
 Stan, A., 2002, Testul psihologic – evoluţie, construcţie, aplicaţie, Iaşi, Polirom
Referinţe suplimentare:
 Kaplan, R.M., Saccuzzo, D.P., 2001, Psychological Testing, Principles, Applications and Issues, Wadsworth Thomson
Learning, Fifth Edition.
 Groth-Marnat, G., 2003, Handbook of Psychological Assessment, Fourth Edition. JohnWiley & Sons, Inc.

96
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

Unitatea de învățare 1.
ISTORIA EVOLUȚIEI PSIHOLOGIEI DIFERENȚIALE ȘI PSIHODIAGNOSTICULUI

SCURT ISTORIC AL PSIHOLOGIEI DIFERENŢIALE ŞI ORIGINILE CUNOAŞTERII PSIHOLOGICE A PERSOANEI

De-a lungul istoriei umanităţii au existat numeroase preocupări de a găsi metode de selecţie a
indivizilor mai productivi sau care să corespundă obiectivelor de formare stabilite. Aceste preocupări au
dus la o utilizare pe scară largă a testelor şi altor metode de cunoaştere a persoanei în diferite domenii
aplicative fapt care ne oferă posibilitatea stabilirii unei cronologii a evoluţiei lor.

1. SPIRITUL PSIHOLOGIEI DIFERENŢIALE ŞI ORIGINILE EVALUĂRII

DuBois (1970), care este citat în multe manuale de psihometrie, Gregory (1992) şi Sattler (1992),
susţin că evaluarea a apărut în China în urmă cu 3000 de ani. Această afirmaţie nu este susţinută de
surse istorice. Brawman (1998) consideră că începând cu anul 165 î.Hr. în China se practica selecţia în
domeniul serviciilor publice.

1.1. Originile psihologiei diferenţiale

IMPORTANT
Psihologia diferenţială, ca ramură a psihologiei ştiinţifice, a apărut în Anglia la sfârşitul sec. al XIX-lea,
odată cu dezvoltarea empirismului şi ca o prelungire a teoriei darwiniste a evoluţionismului.

Dar reflexiile asupra variabilităţii indivizilor sunt mult mai vechi. Încă din antichitate întâlnim reflexii
ale filozofilor şi medicilor referitoare la variabilitatea indivizilor. Platon (427-347 î.Hr.), de exemplu în
Republica, consideră că există trei tipuri de indivizi corespunzătoare celor trei faţete ale sufletului uman:
"dorinţele", "raţiunea" care le controlează, şi "pasiunea" care corespunde sensului moral şi manifestărilor
sale. Aceste proprietăţi înnăscute permit indivizilor să ocupe funcţii sociale specifice (producători,
războinici, magistraţi) şi societatea este interesată să facă plasamente în funcţie de acestea. Consideraţii
asupra variabilităţii interindividuale a făcut şi Aristotel (384-322 î.Hr.) care a fost interesat de diferenţele
psihologice dintre rase şi dintre sexe, şi de caracteristicile individuale necesare în exercitarea diferitelor
meserii. Hippocrate (460-477 î.Hr.), părintele medicinii, descrie patru tipuri temperamentele pe care le
interpretează în termeni de "umori" şi de "elemente": colericul (la care predomină bila albă şi focul),
melancolicul (cu predominanţa bilei negre şi a pământului), flegmaticul (la care predomina flegma şi apa)
şi sanguinicul (la care predomină sângele). Vom recunoaşte în tipologiile moderne ale personalităţii, mai
ales în cea elaborată de Pavlov, o mare analogie cu tipurile lui Hippocrate.
În evul mediu, evaluarea aptitudinilor s-a practicat târziu în mai multe universităţi europene.
Cristian Von Wolff trebuie menţionat deoarece a fost primul care a intuit posibilitatea creării unei ramuri
matematice a psihologiei, pe care a numit-o "psihometrie".

97
CORNELIU-EUGEN HAVÂRNEANU

1.2. Teoria facultăţilor

IMPORTANT
În epoca modernă problema diferenţelor individuale a fost marcată de influenţa teoriei filosofice a
cunoaşterii care punea problema originii "ideilor" noaste, cum ar fi conceptele abstracte (Dumnezeu
de exemplu), categoriile gândirii (timpul, cauzalitatea) sau operaţiile mentale. Pentru filosofii idealişti ideile
sunt înnăscute, şi spiritul nostru are capacitatea de a le prelua direct. Pentru filosofii empirişti ideile sunt
elaborate pe baza informaţiilor furnizate de organele senzoriale.

În acest cadru al filosofiei idealiste s-a ajuns la definirea spiritului şi a facultăţilor mentale, care
permit accesul la cunoştinţe independent de senzaţii şi o descriere foarte generală a sufletului uman.
Thomas Reid (1710-1796), fondatorul şcolii ecoseze, prezintă o listă de "capacităţi ale sufletului":
douăzeci şi patru de "capacităţi active" ca faima, perseverarea eului, imitaţia, estimarea eului, nevoia de
putere, imaginaţia etc., şi şase "capacităţi intelectuale" ca percepţia, judecata, memoria, sensul moral etc.
Aceste facultăţi, sau capacităţi se pot manifesta slab sau foarte puternic la indivizi diferiţi, ceea ce
presupune existenţa unor diferenţe individuale între aceştia.
Dar interesul pentru aceste cadre descriptive este limitat. Ele sunt pure speculaţii iar cercetările
psihologiei diferenţiale trebuie să se bazeze pe observaţii sistematice, nu pe observaţii secvenţiale sau
pe simpla intuiţie, care nu face posibilă generalizarea. Ele sunt statice şi se bazează pe decupajul unei
scheme de funcţionare psihologică. În plus, postulatele ineiste nu oferă posibilitatea abordării
dezvoltării indivizilor şi rămân tributare accentuării rolului factorilor ereditari în explicarea diferenţelor
interindividuale.
Reminiscenţe ale teoriei facultăţilor şi o dezvoltare ulterioară a acesteia găsim şi la precursorii lui
Reid în psihologia modernă.
Alexander Bain (1818-1903), a reluat teoria facultăţilor mintale a lui Reid, pentru a descrie
diferenţele individuale într-o lucrare care abordează personalitatea, publicată în 1861 "Sur l'etude du
caractère".

IMPORTANT
Franz Joseph Gall (1758-1828), s-a inspirat mult din această lucrare, în tratatul său de frenologie, care
a avut un mare succes pe parcursul secolului al XIX-lea.

Pentru Gall există treizeci de facultăţi, fiecare facultate are un loc bine definit pe o regiune a
creierului, regiune care este foarte bine dezvoltată. Dezvoltarea creierului poate modifica forma
craniului, ceea ce oferă posibilitatea estimării dezvoltării unei anumite facultăţi. Fiecare facultate este
plasată într-o anumită regiune a creierului şi această regiune este mai dezvoltată. Dezvoltarea creierului
poate modifica forma craniului şi se poate estima dezvoltarea unei facultăţi prin palpare. Expresia "are
bosă de..." provine din frenologie (care a fost numită şi craniologie). Azi putem surâde de schematismul
frenologiei şi de naivitatea lui Gall, sau putem să ne indignăm de reducţionismul său. Dar această teorie,
ca toate teoriile; trebuie situată în contextul epocii în care a apărut. Cert este că teoria frenologică este
eronată: dimensiunile psihologice utilizate nu sunt fondate, creierul nu modifică forma craniului.
Frenologia are însă meritul de a accentua o idee forte nouă în epocă şi exactă în principiu: localizarea
în diferite zone ale creierului a funcţiilor psihice. Frenologia este un bun exemplu de teorie generală
(localizările cerebrale) care a fost confirmată prin cercetări diferenţiale.

98
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

1.3. Empirismul anglo-saxon

IMPORTANT
Empirismul a început să se dezvolte în Anglia începând cu Thomas Hobbes (1588-1679) şi John Locke
(1632-1704) care publică în 1690 "Essai sur l'entendement humain" (eseu asupra judecăţii umane), David
Hume (1711-11776), contemporan cu empiristul francez Etienne de Condillac (1711-1780), James Mill
(1773-1836) şi John Stuard Mill (1806-1873).

Pentru empirişti spiritul este o tablă nescrisă (tabula rasa) pe care se înscriu senzaţiile. Problema
fundamentală care apare este: cum simplele senzaţii pot da naştere la cunoştinţe sau "idei". Teoria
asociaţionistă rezolvă această problemă. La fel ca şi în chimie corpurile simple se asociază pentru a da
naştere la corpuri complexe, senzaţiile se asociază pentru a deveni cunoştinţe. Hume prezintă mai multe
legi de asociere: elementele se pot asocia prin contiguitate spaţială sau temporală, prin asemănare,
prin relaţii de cauzalitate. Filosofia empiristă furnizează teorii extrem de generale şi faptele prezentate
nu vizau confirmarea sau infirmarea lor ci, doar simpla ilustrare. Dacă teoria nu este ştiinţifică ea nu oferă
o bază pentru dezvoltarea practicii. În sfârşit, gândirea nu poate fi considerată ca un dat al cerului ci, ca
un fenomen natural căruia îi putem observa manifestările. Cu toate acestea psihologia diferenţială s-a
dezvoltat pornind de la filosofia empiristă. Această origine empiristă a determinat orientarea psihologiei
de la sfârşitul secolului al XIX-lea spre introspecţie şi analiza experimentală a fenomenelor senzoriale
elementare. Programul ambiţios al acestei psihologii este reconstituirea fenomenelor de conştiinţă
pornind de la senzaţii.
Dacă empirismul a permis apariţia unei psihologii experimentale el este mai puţin favorabil
psihologiei diferenţiale. Pentru a deveni obiect de cercetare, diferenţele individuale au nevoie de o
oarecare stabilitate. Aceasta stabilitate relativă îşi poate avea originea într-o puternică determinare
ereditară sau în influenţele mediului. În secolul XIX stabilitatea diferenţelor era pusă pe seama
determinanţilor ereditari. Empirismul, prin postulatul său de bază tinde să minimalizeze ponderea
factorilor ereditari. Bine înţeles, constatăm recunoaşterea existenţei unor diferenţe individuale. "Ideile"
nu sunt aceleaşi, sau nu se manifestă în acelaşi fel la indivizi diferiţi. Provenind de la diversitatea
senzaţiilor care stau la baza formării lor, originea lor nu are nimic misterios: ele nu sunt decât reflectarea
circumstanţelor şi pot fi modificate uşor modificând circumstanţele. Apriorismul ideilor explică interesul
scăzut pentru diferenţele individuale, manifestat de Wundt şi o parte din primii psihologi experimentaliști.
În cercetarea legilor generale ale asociaţiei variabilitate interindividuală este considerată ca o sursă de
eroare de care trebuie să ne ferim. Behaviorismul, fiind curentul psihologic cel mai apropiat de empirism
a fost cel mai puţin interesat de studiul diferenţelor individuale.
Nu există totuşi incompatibilitate între principiile empirismului şi luarea în consideraţie a
diferenţelor individuale stabile. Circumstanţele nu sunt singure responsabile de variabilitatea asociaţiilor.
T. Brown (1778-1820) şi A. Bain consideră că aspectele stabile sunt datorate unor caracteristici
constituţionale ale indivizilor. Ei evocă şi stabilitatea obiceiurilor formate. Filosoful evoluţionist Herbert
Spencer (1820-1903), care va avea o influenţă directă asupra fondatorului psihologiei franceze
Theodule Ribot (1839-1916), introduce ineismul în empirism pe baza evoluţiei. El consideră că
asociaţiile frecvent repetate în ontogeneză sunt transmise descendenţilor. Diferenţele individuale
sunt deci caractere dobândite şi transmise ereditar. Credinţa în ereditatea caracterelor era foarte
răspândită în secolul al XIX-lea. S-a demonstrat ulterior că ea era fără fundament. Dorind să găsească
bazele stabile ale variabilităţii indivizilor fondatorii psihologiei diferenţiale, Francis Galton în special, se
situează în curentul empirist-asociaţionist.

99
CORNELIU-EUGEN HAVÂRNEANU

1.4. Teoria evoluţiei


Prima teorie a evoluţiei a fost formulată de Jean-Baptiste de Lamarck. Finalist, Lamarck credea
că materia vie are o tendinţă naturală de perfecţionare. Aceste perfecţionări permit adaptarea la mediu
şi aceste caracteristici dobândite sunt transmise la descendenţi.
Charles Darwin (1809-1882) este un naturalist care a adunat numeroase observaţii. Lucrarea
sa de bază "Originea speciilor un mijloc de selecţie naturală sau lupta pentru existenţă în natură" a apărut
la Londra în 1859. Ca şi Lamarck, Darwin credea că speciile se nasc, se transformă şi dispar fără ca
Dumnezeu să intervină. Ca şi Lamarck el credea că această evoluţie este foarte lentă. Dar mecanismele
de evoluţie imaginate de Darwin sunt total diferite de cele ale lui Lamarck. Pentru Darwin evoluţia este
rezultatul unei selecţii care se manifestă pornind de la o variabilitate aleatoare a caracterelor ereditare
(prin hazard unele girafe se nasc cu un gât mai lung decât altele, aceasta le permite să ajungă la crengile
mai înalte, iar şansa lor de supravieţuire şi reproducere este astfel maximizată).

IMPORTANT
La baza mecanismului imaginat de Darwin se află variabilitatea între indivizii unei specii.

Ideea selecţiei naturale este preluată şi de economistul englez Thomas Malthus (1766-1835).
Pentru Mathus populaţie sporeşte mult mai rapid decât resursele. Există deci între indivizi o luptă pentru
existenţă care se manifestă prin războaie, epidemii, catastrofe, prin care se poate restabili echilibrul între
populaţie şi resurse. Şi în natură există o luptă pentru existenţă între indivizi. Lupta pentru existenţă
conduce la o selecţie naturală şi la supravieţuirea celor foarte apţi.
Impactul teoriei evoluţiei a fost considerabil: omul care era considerat o creaţie a divinităţii devine
un produs natural al evoluţiei. Darwinismul a determinat apariţia a două ramuri ale psihologiei:
psihologia comparată, care studiază diferenţele şi asemănările dintre speciile animale şi psihologia
diferenţială, care studiază diferenţele dintre indivizi.

1.5. Contribuţia lui Galton la apariţia psihologiei diferenţiale


Galton este unul dintre primii savanţi independenţi, toţi ceilalţi mari psihologi au fost universitari;
care a desfăşurat o activitate de cercetare în domenii diverse. El explorează sud-estul Africii realizând
numeroase observaţii geografice pe baza cărora redactează un manual practic pentru exploratori. Este
interesat de mecanică (construieşte un motor cu vapori, rotativ), meteorologie (foloseşte principiul
hărţilor meteorologice, descoperă anticiclonii), psihologie generală (realizează un dispozitiv pentru
studiul senzaţiilor, a imaginilor mentale şi asociaţiilor).

IMPORTANT
Activitatea sa în domeniul psihologiei are trei mari obiective: descrierea şi măsurarea variabilităţii
psihologice interindividuale, demonstrarea originii ereditare a acestei variabilităţi, folosirea implicaţilor
teoriei evoluţioniste pentru ameliorarea spaţiului uman (eugenismul).

În scopul observării variabilităţii interindividuale Galton inventează testele, probe care permit o
observaţie standardizată a conduitei. Acestea au fost realizate prin simplificarea unor situaţii
experimentale din laborator, facilitându-se aplicarea lor la un număr mare de subiecţi. În 1884 mai mult
de două mii de persoane au fost supuse măsurătorilor antropometrice. Pentru a condensa aceste
informaţii şi a putea evalua diferenţele dintre indivizi Galton a inventat etalonarea care permite
transformarea unei măsuri a performanţei în rang.

100
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

Matematicianul belgian Quetelet (1796-1874) consideră că distribuţia caracteristicilor fizice, de


exemplu talia, se realizează după legea Laplace-Gauss (distribuţia normală), la fel ca şi erorile de
măsurare. Galton consideră că acest aspect este valabil şi pentru caracteristicile psihologice. În acest
fel a putut fi stabilit un procedeu de măsură a diferenţelor interindividuale: diferenţele dintre indivizi
sunt diferenţele de abatere de la media populaţiei raportată la abaterea standard a distribuţiei
populaţiei respective. Distribuţia gaussiană a caracteristicilor psihologice este un postulat.
Galton consideră că variabilitatea indivizilor este de origine ereditară şi caută metode pentru
a demonstra acest aspect. Cercetarea legilor eredităţii presupune măsurarea asemănărilor între părinţi
şi copii în privinţa caracteristicilor fizice. Cu această ocazie, după 1880, el a inventat coeficientul de
corelaţie, tehnică care a fost perfecţionată mai târziu de Karl Pearsons (1857-1936) prin folosirea
teoremelor stabilite anterior de matematicianul francez Bravis. Coeficientul de corelaţie Bravis-
Pearsons, ca indice de corelaţie, a fost frecvent folosit în psihologia diferenţială. Galton a pus bazele
metodei de studiere a gemenilor, comparând gemenii de acelaşi sex cu gemenii de sexe diferite
(distincţia dintre gemenii monozigoţi şi cei dizigoţi a fost făcută mai târziu).
Galton a fost interesat şi de posibilitatea de intervenţie socială şi a pus bazele ştiinţifice ale
cercetărilor în domeniul eugeniei. În 1907 el a pus bazele unui laborator pentru studierea eugeniei în
care s-a elaborat toată statistica modernă. Eugenismul lui Galton constă în evitarea transmiterii genetice
anormale, ceea ce este o preocupare curentă şi azi. Galton caută înlocuirea selecţiei naturale printr-o
selecţie raţională bazată pe teoria evoluţiei, fiind în acest fel partizanul unui eugenism pozitiv.

2. APARIŢIA ŞI EVOLUŢIA PSIHOMETRIEI

Psihometria este o disciplină mai puţin cunoscută în ştiinţele umane datorită recunoaşterii sale
tardive în mediile ştiinţifice şi a dificultăţii pentru oamenii de ştiinţă şi lexicologi de a stabili definirea şi
particularităţile sale. Cristian Van Wolf, în 1732, a recunoscut că psihometria se leagă de psihologie şi
de măsurare, urmând să se stabilească dacă este vorba de o ramură a psihologiei, o ramificaţie a
măsurării, sau ambele.

DEFINIŢII
După Legendre (1993), psihometria este "măsurarea şi prelucrarea statistică a faptelor
psihice, mai ales prin metoda testelor". Pentru De Landshere (1979), psihometria constă într-un
"ansamblu de operaţii care, prin probe speciale (teste) şi tehnici ştiinţifice, determină şi evaluează
capacităţile psihice ale indivizilor: stabilirea nivelului mental, detectarea tendinţelor caracteristice,
estimarea aptitudinilor profesionale etc.".
Paul Dickens, Jocelyne Tournois, André Fieller şi Jean-Luc Kop (1994) "psihometria constă
într-un ansamblul de teorii şi metode de măsurare în psihologie ..., care nu se confundă cu studiul testelor
ci numai cu analiza datelor... şi care poate exista fără nici o referire la teste".

De-a lungul istoriei umanităţii au existat preocupări de a găsi metode de selecţie a indivizilor care
să corespundă obiectivelor de formare sau să fie mai productivi. Utilizarea pe sacră largă a testelor în
diferite domenii aplicative ne oferă posibilitatea stabilirii unei cronologii a evoluţiei lor.
După Mercier (1897), Wundt a fost primul care s-a interesat de psihometrie. În 1879, a înfiinţat
la Lepzig primul laborator de psihologie experimentală. Cercetările realizate au fost orientate spre
procesele senzoriale, mecanismele perceptive, dar şi asupra unor funcţii complexe ca atenţia, memoria
şi emoţia. Metodele de observaţie erau precise şi au fost realizate numeroase aparate de investigaţie
psihologică. În timp, mulţi psihologi ca Hall, Cattell, Spearman, Titchner, au vizitat acest laborator
preluând modelul pentru propriile lor universităţi.

101
CORNELIU-EUGEN HAVÂRNEANU

În 1888, Cattell deschide un laborator pentru testare, iar în 1890 propune două serii de probe
numite "teste mentale". Thorndike şi Lohman (1990) a publicat lista acestor teste:
1. presiune dinamometrică;
2. viteza de mişcare a braţelor;
3. ariile de sensibilitate şi de discriminare tactilă;
4. presiunea necesară pentru cauzare a unei dureri;
5. măsurarea sensibilităţii diferenţiale pentru o greutate de 100 de grame;
6. timp de reacţie simplu la sunet;
7. timpul necesar pentru denumirea culorilor;
8. divizarea unei lungimi de 50 de centimetri în două părţi egale;
9. evaluarea unei durate de 10 secunde;
10. numărul de litere reţinute după o singură prezentare auditivă.
Pe lângă acestea a mai folosit o probă pentru copii formată din 50 de teste distincte, 14 pentru
senzaţii vizuale, 8 pentru audiţie, 3 pentru gust şi miros, 7 pentru senzaţii presiune şi termice.
Utilizarea acestor teste nu a dus la un progres în diagnosticul aptitudinilor iar aceste instrumente
au continuat să fie utilizate pentru cercetarea psihologică. Binet şi Henri (1896) reproşează faptul că se
insistă pe investigarea proceselor psihice inferioare, senzaţii şi mişcări elementare, în detrimentul
funcţiilor superioare care caracterizează mai bine un individ. La om este mai important să cunoaştem
capacităţile de atenţie, imaginaţie şi inteligenţă decât aptitudinile tactile sau olfactive. Jurnalele
psihologice şi medicale din acea perioadă prezentau multe probe care nu erau organizate în ordinea
dificultăţii crescătoare. În încercarea de a sistematiza rezultatele obţinute, Spearman (1904) recurge la
analiza factorială şi constată că folosind coeficienţii de corelaţie putem obţine un factor general şi mai
mulţi factori specifici pentru fiecare test. Această descoperire a stat la baza teoriei celor doi factori.
În 1905, Binet şi Simon realizează scara metrică a inteligenţei care le-a permis să evalueze
nivelul mental al copiilor. Materialul era compus din 30 de itemi aşezaţi într-o ordine de dificultate
crescătoare pentru 3, 5, 7, 9 şi 11 ani.
Acest instrument viza funcţiile mentale superioare, dar erau şi probe pentru estimarea dezvoltării
senzoriomotorii. Deficienţa mentală era clasificată în trei categorii: idiot, imbecil şi debil mintal.
A doua şi a treia versiune a apărut în 1908 şi 1911. În 1909, Goddard traduce a doua versiune
publică în 1911, varianta americană revizuită care a fost apoi urmată de revizuire lui Kuhlman (1912) şi
Terman (1916).
Testul a fost tradus şi adaptat în multe ţări din Europa: în Germania de Maumann şi Bobertag,
în 1914, în Italia de Saffotti, în 1911, în Belgia de Decroly şi Degaud, în 1909, în Suedia de Jaederholm,
în 1914. în Marea Britanie de Burt, în 1921.
Varianta scării din 1908 este normalizată pe un eşantion de 300 de copii, cu vârste de la 3 la 13
ani şi s-a introdus noţiunea de vârstă mentală. Această metodă, foarte simplă, stabileşte nivelul intelectual
pentru fiecare vârstă cronologică. Seria de probe folosită constituie o scară metrică.
A treia variantă a scării apare în 1911, anul morţii lui Binet. Această variantă introduce noi probe,
unele pentru vârsta adultă, şi precizează tehnica de evaluare a vârstei mentale.
În 1912, Stern stabileşte formula coeficientului intelectual, prin raportarea vârstei mentale la
vârsta cronologică. QI = VM/VC
La sugestia lui Stern, Bobertag, utilizează primul acest procedeu de măsurare a intelectului, unde
1 reprezintă media. Dacă QI depăşeşte 1, subiectul este în avans faţă de vârsta cronologică, dacă este
inferior lui 1 el este sub medie pentru vârsta sa. La această formulă se aplică înmulţirea cu 100, în revizia
"Stenford", realizată de Terman (1916), luând forma QI = VM/VC * 100.
În 1911, Rossolimo raportează rezultatele a 8 probe sub forma unui grafic pe care l-a numit
profil.
Necesitatea examinării rapide a unui mare număr de recruţi, la sfârşitul primului război mondial,
a dus la realizarea a două baterii de teste colective, cunoscute sub numele de Army Alpha, în 1917 şi
Army Beta, în 1918 şi a scării Pintner Paterson (1915, 1917).

102
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

Problema testelor a ocupat un loc important la congresele internaţionale. Prima Conferinţă


internaţională de psihotehnică a avut loc la Geneva în 1920.
Tot în 1920, în Statele Unite, Woodworth introduce primul inventar de personalitate (Personal
Data Sheet), pentru o utilizare individuală şi în grup. Forma finală cuprinde 116 întrebări cu alegerea
răspunsurilor afirmative sau negative şi permite identificarea subiecţilor cu tulburări afective.
În 1921, în Elveţia, Rorschach prezintă o nouă tehnică de diagnosticare a personalităţii prin
interpretarea unor pete de cerneală.
În 1922, în Franţa, prin decret, se stabileşte activitatea de consilier de orientare care precede
plasarea tinerilor în instituţii comerciale sau industriale prin determinarea aptitudinilor fizice, morale şi
intelectuale. În acest domeniu, Strong elaborează în 1927 primul chestionar de interese profesionale.
În 1927, evoluţia analizei metodologice a permis lui Thorndike să reducă în serii de patru factori
aspectele măsurate ale inteligenţei (CAVD): Completare de imagini, Aritmetică, Vocabular şi Direcţionare.
Mai multe activităţi mentale sunt în final grupate în trei categorii: activităţi sociale, activităţi concrete şi
activităţi abstracte.
Metoda centroidă, de analiză factorială a fost folosită de Thurstone (1936) şi a dus la
descoperirea unor factori de grup, care nu sunt comuni pentru toate testele, ci numai unei serii de teste.
În acelaşi an, Doll prezintă scala sa de maturitate socială, care contribuia la evaluarea
aptitudinilor adaptative la subiecţii cu deficienţe intelectuale.
La 4 iulie 1936, Comitetul Central al Partidului Comunist al fostei URSS condamnă practicarea
psihotehnicii, considerată o pseudo-ştiinţă antimarxistă, ordonând distrugerea tuturor cărţilor de
psihometrie.
Pentru anul 1938 patru evenimente merită a fi menţionate. Bender propune o serie de nouă figuri
geometrice pentru a fi copiate cu scopul realizării unor cercetări neuropsihologice şi a dezvoltării mentale.
publică Raven versiunea finală matricilor progresive a care cuprind cinci serii de figuri lacunare cu ajutorul
cărora poate fi măsurată inteligenţa generală, eliminând influenţa factorilor culturali. Tot acum apare prima
revistă sistematică de teste psihologice numită Mental Measurements Yarbook, iar Gasell finalizează
scala de teste de dezvoltare pentru copii.
În 1939, David Wechsler realizează scala de diagnostic intelectual pentru adulţi, Wechsler-
Bellevue Intelligence Scale. Apoi în 1949, Wechsler Intelligence Scale for Children, iar în 1967 Wechsler
Preschool and Primary Scale of Intelligence. El a făcut o bună sinteză a probelor deja existente şi a
prezentat rezultatele sub forma unui profil psihologic renunţând la conceptul de vârstă mentală.
În 1940, Cattell, folosind analiza factorială, introduce probe neverbale foarte saturate în
factorul general de inteligenţă "g", foarte puţin influenţate de factorii socio-culturali.
În 1959, Guilford prezintă structura factorială a inteligenţei ca un ansamblu de abilităţi. Modelul
structural al intelectului cuprinde trei dimensiuni care prin combinare formează 120 de factori. Fiecare
factor este localizat la intersecţia a trei dimensiuni care-l determină.
Cattell, în 1963, pe baza teoriei factoriale, elaborează teoria inteligenţei "cristalizate" şi
"fluide". Inteligenţa cristalizată se manifestă atunci când sunt prezentate situaţii acumulate din mediul
social, şcolar şi cultural. Testele care se referă la aceasta sunt teste de inteligenţă generală care au, mai
ales, un conţinut educaţional şi şcolar. Inteligenţa fluidă este activată în situaţii noi, când subiectul trebuie
să sesizeze noi relaţii dând dovadă de creativitate. Acest potenţial este măsurat prin teste prin teste care
nu sunt influenţate cultural
În 1968, Lord şi Novik au făcut o sinteză de interpretare a datelor obţinute pe baza testelor
psihologice. Ei au dat definiţii sintactice explicite (matematice) pentru conceptele care au o semnificaţie
matematică (reală). Conceptul de scor adevărat a fost definit sintactic şi interpretat semantic ca scorul
observat la o persoană cu ajutorul unui test de o lungime infinită. Acesta este un scor observat aşteptat.
Pe baza teoriei numerelor mari au demonstrat că definiţia teoriei testelor este o definiţie pragmatică care
furnizează o interpretare semantică a scorurilor observate.

103
CORNELIU-EUGEN HAVÂRNEANU

Precizări conceptuale ale activității de psihodiagnostic


Examen psihologic
Orice examen psihologic implică câteva aspecte comune:
 relaţia examinator - subiect;
 evaluarea sarcinii rezolvate de subiect de către examinator;
 dorinţa examinatorului de a evalua comportamentul subiectului;
 calităţile specifice ale sarcinii, precum, de exemplu, ambiguitatea sau lipsa de familiaritate cu
stimulii.
Situaţia de examen psihologic este conceptualizată ca o interrelaţie între două persoane în care
ambele caută să afle informaţii prin mijlocirea interacţiunilor reciproce. Ambii, examinator şi subiect
furnizează un anumit imput în cadrul acestei interpretări, în termeni de stimuli şi ambele primesc un
feedback în termeni de răspunsuri. Scopul interacţiunii este informarea cu caracter specific (precum, de
exemplu, informarea sistematică despre subiect). Deşi în sistem ambele persoane primesc informaţii, iar
subiectul poate câştiga informaţii despre sine, scopul specific al testării este de a informa examinatorul.
Bazându-se pe ele, acesta va generaliza o serie de ipoteze despre modul cum funcţionează subiectul
într-un număr de situaţii sau interacţiuni diferite. În acest scop, examinatorul verbalizează un număr de
întrebări, de teste standardizate şi sistematice la care primeşte răspunsurile subiectului. În cadrul acestei
interacţiuni intervin o serie de factori care pot influenţa sistematic informaţiile precum, de exemplu: metoda
de testare, stilul de interviu, secvenţa de prezentare a testului sau testelor. Examinatorul aduce în examen
propria personalitate, trebuinţele şi caracteristicile sale psihofizice în interacţiunea care are loc, iar aceste
trăsături alături de metodologia de testare joacă un rol important în determinarea variabilelor la care
răspunde subiectul.
Sunt descrise cel puţin 6 variabile relevante: caracteristicile fizice ale examinatorului; prezenţa
sau absenţa sa din camera de testare; comportamentul său, "cald" sau "rece"; condiţionarea operată
asupra comportamentului verbal al subiectului; efectul examinatorului ca persoană în afara evaluării
personalităţii sale; efectul examinatorului ca persoană cu evaluarea personalităţii sale. Subiectul examinat
reacţionează şi răspunde la toţi stimulii care îl înconjoară şi răspunde la ceea ce este o mixtură de stimuli
relevanţi şi irelevanţi. Produsele sale sunt astfel un rezultat al reacţiilor sale particulare la itemii testului şi
la examinator ca întreg.
Examenul psihologic nu are o singură formă. În funcţie de obiectivul examenului, de gradul de
formalizare există diferite variante. Din perspectiva gradului de formalizare s-au constituit, încă de la
începutul secolului XX, două tipuri de abordări extreme pornind de la psihologia experimentală, psihologia
diferenţială şi psihologia clinică:
1. Examenul psihometric ale cărui principii şi metodologie foarte formalizată pornesc de la
definiţia lui E. L. Thorndike;
2. Examenul clinic, în cadrul căruia aspectul formal a scăzut din importantă şi examenul în întregul
său este centrat şi deschis către problemele caracteristice, specifice ale individului examinat. Înţelegerea
acestora cere o observare sensibilă prin mijloace adecvate şi datele integrate într-o impresie generală,
un întreg specific.
Atât în privinţa calităţilor psihometrice şi a standardizării, cât şi a gradului de deschidere faţă de
specificul subiectului examinat:
 foarte multe aspecte ale instrumentelor psihologice se leagă de dihotomizarea examinării în formală
şi deschisă;
 totuşi, diversitatea scopurilor şi situaţiilor care cer examinare au condus la forme mixte, în care, în
diverse grade sunt implicate şi să se păstreze si formalizarea si deschiderea.
Instrument psihologic
Un instrument psihologic este o procedură sistematică de a evalua comportamentul uneia sau
mai multe persoane. Caracteristicile profesionale ale testului ca instrument de evaluare sunt obiectivitatea
şi standardizarea. Un instrument de măsură profesionist trebuie evalueze pe o scală de unităţi egale,
standardizate. De asemenea, standardizarea înseamnă procedura de lucru, procedura de înregistrare a

104
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

rezultatelor, cotarea, interpretarea rezultatelor. Orice condiţii care afectează performanţa la instrumentul
de testare trebuie specificată: materialul de testare, instrucţiunile de administrare şi cotare, condiţiile de
examen.
Instrumentul psihologic nu este deplin obiectiv, dar gradul de obiectivitate implică certitudinea
interpretărilor: orice psihodiagnostician care ia cunoştinţă de o anume performanţă la test va ajunge la
aceeaşi evaluare privind rezultatele subiectului. Obiectivitatea înseamnă înregistrarea observaţiilor pentru
a elimina erorile de rememorare, notarea răspunsurilor după anume reguli. Cele mai obiective instrumente
sunt testele cu răspunsuri corecte pentru că se utilizează o grilă de corectare stabilă. Dar şi în testul cu
răspunsuri libere şi în observarea comportamentului se poate ajunge la un anumit grad de obiectivitate.
Există mai multe tipuri de instrumente psihologice. În general, din perspectiva gradului de
standardizare putem regăsi aceleaşi două extreme: probe strict formalizate; şi probe, precum incluse în
tehnicile proiective, care au capacitatea şi virtutea de a se deschide către problemele specifice individului,
dar ar căror grad de formalizare este mai puţin ridicat datorită atât ambiguităţii în materialul testului, cât
şi variabilităţii individuale a conţinuturilor răspunsurilor. Există şi o serie de instrumente psihometrice
foarte formalizate, dar care au relevanţă pentru examenul clinic special: unele sunt folosite în examenul
clinic pentru evaluarea gradului de deficienţă sau deteriorare; altele sunt folosite pentru evaluarea
normalităţii şi a gradului de discernământ.
Observaţia în examenul psihologic
Observaţia este o tehnică sistematică, obiectivă, ce trebuie să completeze orice examene. Prin
observaţie: se facilitează interpretarea rezultatelor obiective şi furnizează date obiective. De fapt, există
două extreme de realizare a observaţiei în examinarea psihologică. O manieră intuitivă care îl poate
conduce pe examinator în final la o imagine globală, dar mai puţin diferenţiată despre persoană. O
manieră formală, neutră, cu înregistrarea faptelor, cu cotarea sistematică a gesturilor conform unei grile,
ceea ce conduce la o imagine analitică, foarte diferenţiată, dau mai puţin integrată. În practică, nu orice
comportament poate fi analizat prin observaţia sistematică, pe porţiuni notate obiectiv. Uneori, observaţiile
ulterioare pot corecta interpretările iniţiale iar un fapt relativ minor se poate dovedi, ca semnificaţie, mai
important ca o serie de aspecte surprinse prin grila de observare sistematică. În acelaşi timp, notarea
impresiilor care apar în timpul testării suferă variaţii semnificative; uneori, impresiile se modifică în
decursul examenului în funcţie şi de natura activităţii în care este implicat subiectul iar aceste modificări
devin chiar centrul de interes al interpretărilor. Examenul este uneori centrat nu pe succesiunea de
momente, ci ca un proces global, structurat, dinamic. De regulă sunt incluse în observare: atitudinea
subiectului faţă de probe, faţă de examen, faţă de examinator, intensitatea muncii sale şi variaţiile ei;
încrederea în sine (insecuritatea, dependenţa, anxietatea, ambiţia, efectul succesului sau eşecului,
interesul obiectiv faţă de teste sau interesul ludic.
Conduita examinatorului
Atitudinea examinatorului poate evolua între obiectiv şi personal, subiectiv. În prima ipostază
apare formal, oferă instrucţiuni sau explicaţii neimplicativ, înregistrează răspunsurile sec, evită orice
apropiere personală sau abordare personală. În cea de a doua, pare să înlăture caracterul de examen
prin comportamentul său deschis, binevoitor, prin oferta de ajutor şi implicare emoţională. Se sprijină însă
adaptarea atitudinii la caracteristicile examenului şi ale subiectului examinat (vârstă, nivel de înţelegere
etc.). Atitudinile deschise care maschează caracterul de examen al situaţiei, în relaţia cu subiecţii anxioşi.
Cu cei neîncrezători, se recomandă o atitudine deschisă, cu explicaţi privind faptul că rezultatele
examenului nu se folosesc împotriva lor, cu explicarea semnificaţiei sarcinilor. În conduita sa în examen,
examinatorul profesionist nu are dreptul să se impacienteze, să manifeste o atitudine de tutelare,
pedagogică. Subiectul nu trebuie ajutat când este în dificultate, în afara situaţiilor când este evidentă
suferinţa sa din cauza nereuşitei. Explicaţiile nu trebuie să fie nici prea lungi, nici prea circumscrise; scurte
şi la obiect. nu va utiliza un test dacă nu cunoaşte instrucţiunile de administrare şi tehnica testului.
Supravegherea pe care o realizează în timpul rezolvării testului de către subiect nu îi permite să intervină
şi să perturbe spontaneitatea comportamentului şi activităţii subiectului, pentru că poate crea insecurităţi
acestuia.

105
CORNELIU-EUGEN HAVÂRNEANU

Funcțiile psihodiagnosticului
Psihodiagnosicul, ca activitate sistematică de evaluare psihologică, are următoarele funcții:
1. de a surprinde corect trăsături și capacități psihice individuale și de a evidenția interindividuală a
atributelor psihice;
2. de a evidenția cauzele ce au condus spre o anumită realitate prezentă, în special, în cazul disfuncțiilor
psihice;
3. de a anticipa evoluția probabilă a comportamentului persoanei în anumite condiții și situații
contextuale (funcția prognostică);
4. de a delimita cazurile de abatere, în sens pozitiv sau negativ, de la norma (etalonul) de dezvoltare
psihocomportamentală;
5. de a forma capacități de cunoaștere și autocunoaștere;
6. de a furniza date ale examenului psihologic în deciziile din consiliere și orientare vocațională;
7. de a sprijini deciziile de conduită în demersul din psihoterapie, asistență și consultanță psihologică;
8. de a verifica unele ipoteze științifice, testul fiind folosit în acest caz ca un instrument de cercetare.

3. CONCLUZII

Înaintea prezentării unor metode specifice de cunoaştere a persoanei, se impun câteva precizări
în legătură cu posibilitatea cunoaşterii psihologice.
a. În primul rând subliniem faptul că psihologia este o ştiinţă probabilistă, iar prin cunoaşterea psihologică
nu se ajunge la certitudine, ci este doar o cunoaştere probabilistică. Din această cauză în domeniul
psihologic nu vom putea stabili un diagnostic definitiv, ci doar un prognostic, care va trebui să fie
elaborat pe termen scurt, pentru a evita erorile predictive datorate evoluţiei în timp a subiecţilor,
modificărilor, uneori spectaculoase, determinate de multitudinea şi complexitatea factorilor implicaţi în
schimbare.
b. Cunoaşterea în domeniul aptitudinilor este mai avansată, precizia în măsurare fiind mult mai mare faţă
de alte aspecte ale personalităţii în care nu putem fi siguri de autenticitatea reacţiilor persoanei. Când
se pune problema cunoaşterii trăsăturilor de caracter, de exemplu, subiecţii activează mecanisme de
apărare, etalează doar aparenţe în spatele cărora ascund trăsăturile autentice. Pentru evitarea acestor
neajunsuri s-au înregistrat reacţiile subiecţilor în situaţii imaginate, pentru a releva aspecte ale
personalităţii fără ca aceştia să conştientizeze scopul urmărit. În acest fel au apărut şi s-au dezvoltat
testele proiective, majoritatea bazându-se pe concepţii psihanalitice. Dar, şi aceste instrumente
prezintă dezavantaje, deoarece trebuie demonstrată corespondenţă dintre manifestările subiecţilor în
situaţia imaginară şi cea reală, iar interpretarea presupune o teorie elaborată asupra motivaţiei şi a
modului în care ea se exprimă (A. Cosmovici, 1972, 1985).
c. Există divergenţe în legătură cu metodele utilizate în psihologie, precum şi în legătură cu valoarea
acestora. Fără a intra în analiza acestor puncte de vedere subliniem faptul că tendinţa unanim
acceptată este de împărţire a metodelor de cunoaştere în două categorii: metode clinice (observaţia,
convorbirea, metoda biografică) şi metode psihometrice sau experimentale (experimentul, testul şi
chestionarul). Diferenţa fundamentală dintre cele două categorii de metode apare în funcţie de scopul
urmărit, a gradului de precizie şi obiectivitate în cunoaştere.
d. Din punct de vedere al scopului, metodele clinice îşi propun o cunoaştere cât mai amănunţită a
persoanei, şi explicaţia evoluţiei sale, în timp ce metodele psihometrice se orientează spre stabilirea
rangului persoanei, poziţia sa în raport cu o populaţie normală. Aceasta face ca orientarea
predominantă în cazul metodelor clinice să fie cea calitativă, iar în cazul metodelor psihometrice
interpretarea predominant cantitativă.
e. În legătură cu gradul de precizie şi obiectivitate, metodele psihometrice folosind verificări statistice
riguroase, sunt mult mai exacte, specificându-se de fiecare dată limitele de eroare. Metodele clinice
prezintă un grad de obiectivitate şi precizie mai mic, deoarece sunt lipsite de criterii precise de
interpretare, această depinzând de subiectivitatea celui care face analiza.

106
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

f. În psihologia aplicată se manifestă tot mai mult tendinţa de apropiere a celor două metode, îmbinarea
ambelor categorii şi evitarea unilateralităţii, care nu poate fi decât dăunătoare. Interpretarea cantitativă
şi calitativă a rezultatelor obţinute prin metode psihometrice oferă atât posibilitatea ierarhizării
subiecţilor în funcţie de performanţă, cât şi explicarea modului de obţinere a performanţei. Metodele
clinice s-au perfecţionat, găsindu-se mijloace de standardizare a interpretărilor şi comparaţii în condiţii
mai exact determinate.

TEST DE AUTOEVALUARE (cu răspunsuri corecte ataşate la finalul cursului)


Apreciați valoarea de adevăr a următoarelor afirmații:
1. Galton a inventat etalonarea care permite transformarea unei măsuri a performanţei scoruri
standardizate pe baza mediei și abaterii standard.
a.ADEVĂRAT
b.FALS
2. Frenologia frenologiei constă în localizarea funcțiilor psihice în diferite zone ale creierului.
a.ADEVĂRAT
b.FALS
3. Galtoni a pus bazele eugeniei.
a.ADEVĂRAT
b.FALS
4. Primul care a intuit posibilitatea creării unei ramuri matematice a psihologiei, pe care a numit-o
psihometrie a fost Galton.
a.ADEVĂRAT
b.FALS
5. Empirismul a determinat orientarea psihologiei de la sfârşitul secolului al XIX-lea spre introspecţie şi
analiza experimentală a fenomenelor senzoriale elementare.
a.ADEVĂRAT
b.FALS
6. Galton a inventat etalonarea care permite transformarea unei măsuri a performanţei în rang.
a.ADEVĂRAT
b.FALS
7. Dezvoltarea creierului poate modifica forma craniului susțin empiriștii englezi.
a.ADEVĂRAT
b.FALS
8. Diferenţele dintre indivizi sunt diferenţele de abatere de la media populaţiei raportată la abaterea
standard a distribuţiei populaţiei respective.
a.ADEVĂRAT
b.FALS
9. Conceptul de scor adevărat a fost introdus în psihologie de Cattell in 1963.
a.ADEVĂRAT
b.FALS
10. Formula coeficientului intelectual, prin raportarea vârstei mentale la vârsta cronologică a fost introdusă
de Binet și Simon în 1905.
a.ADEVĂRAT
b.FALS
11. Matricile progresive Raven au marele avantaj că elimină influenţa factorilor culturali asupra
performanței.
a.ADEVĂRAT

107
CORNELIU-EUGEN HAVÂRNEANU

b.FALS
12.Rossolimo în 1921 foloseşte tehnica petelor de cerneală pentru studiul personalității.
a.ADEVĂRAT
b.FALS

108
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

Unitatea de învățare 2.
MĂSURAREA ÎN PSIHOLOGIE

1. MĂSURAREA ŞI EVALUAREA

DEFINIŢIE
După numeroşi autori, măsurarea este o operaţie care constă în asocierea, după anumite reguli, a
unor simboluri (de cele mai multe ori numerice), obiectelor, evenimentelor, sau indivizilor, pentru a
evalua gradul în care acestea prezintă anumite atribute.

După realizarea acestei operaţii, putem califica aceste simboluri ca "rezultate ale măsurării."
Pentru a fi semnificative, simbolurile numerice trebuie să fie însoţite de o unitate de măsură.

EXEMPLU
În cazul unei mese cu lungimea de doi metri, vom asocia numărul 2 cu termenul "metru", care este
unitatea de măsură utilizată şi care este aplicată de două ori pe lungimea mesei. Numărul 2 capătă o
semnificaţie în virtutea unei relaţii cu o lungime standard care este metrul.

În cazul măsurării atributelor fizice, interpretarea rezultatelor nu ridică, în mod obişnuit nici o
problemă. Măsurarea atributelor psihologice, cum ar fi , raţionamentul sau motivaţia, este foarte
complexă, existând foarte multe variabile care trebuie definite şi controlate pentru a obţine un rezultat
valabil. De asemeni, în educaţie este dificil să găsim o unitate de măsură care să fie considerată etalon.

EXEMPLU
Un rezultat de 40 răspunsuri corecte din 50, la o probă de randament, este dificil de interpretat, deoarece
40 de itemi corect rezolvaţi nu presupune, cu necesitate, un coeficient de dificultate egal pentru fiecare
item.

Deducem din definiţia precedentă că măsurarea presupune un proces de abstractizare. Dacă


asociem simboluri obiectelor sau indivizilor, vom măsura, de fapt, una sau mai multe dimensiuni dintre
toate cele pe care obiectele sau indivizii le posedă. De aceea este important să studiem natura acestor
atribute, înainte de a realiza măsurarea.
Observăm că nu toate atributele sunt în mod necesar măsurabile. Mai mult, o măsură se poate
aplică mai multor atribute, nu numai unuia singur. În acest caz, posibilitatea de a izola caracteristicile
atributului de măsurat este mai redusă, iar informaţiile obţinute vor fi deseori mai puţin utile.

Utilizarea simbolurilor numerice presupune deci cuantificarea atributelor. Această


cuantificare facilitează cunoaşterea rezultatelor relative, a gradului de prezenţă a acestora, sau
manifestarea unui atribut la un individ. În acest fel obţinem rezultate foarte detaliate şi foarte precise,
neinfluenţate de judecăţi personale, care ne permit să recurgem la modele de analiză matematică.
Procedeele de obţinere a unei măsurări trebuie să fie explicite. Pentru aceasta există reguli
precise care reglează procedeele de măsurare. Aceste reguli sunt fundamentale în construcţia şi
utilizarea unui instrument de măsură, deoarece validitatea lor determină validitatea instrumentului, şi în
consecinţă pe cea a rezultatelor. Nerespectarea acestor reguli duce la rezultate eronate, instabile şi chiar

109
CORNELIU-EUGEN HAVÂRNEANU

aberante. Acest ansamblu de reguli permite cuantificarea, fără echivoc, a atributelor unui obiect sau
individ şi reprezintă o măsură legitimă.

IMPORTANT
Formularea riguroasă a regulilor care permit asocierea simbolurilor numerice unor atribute, fac ca
rezultatele obţinute cu ajutorul unui instrument de măsură să fie reproductibile. Acesta este un aspect
esenţial pentru standardizarea unui instrument de măsură.

Un instrument de măsură este standardizat dacă toţi utilizatorii obţin rezultate similare. Această
similaritate depinde de invariabilitatea conţinutului măsurat, uniformitatea procedeelor şi condiţiilor
de administrare a instrumentului de măsură şi de constanţa criteriilor de corectare. Altfel spus, probele
aplicate trebuie să fie tot timpul aceleaşi pentru toţi subiecţii, instrucţiunile clar enunţate, durata şi
contextul administrării constant, iar criteriile de corectare invariabile şi obiective.
În concluzie, măsurarea standardizată permite cuantificarea datelor, o descriere foarte
obiectivă care furnizează informaţii comparabile.

DEFINIŢIE
Cu toate că măsurarea se vrea cât mai obiectivă posibil, evaluarea presupune prezenţa unor aspecte
subiective. Putem defini evaluarea ca fiind o operaţie care constă în a face o judecată de valoare, sau
a acorda o valoare unui obiect sau unei persoane, comparând obiectul, l sau persoana cu un criteriu dat.

Această operaţiune poate fi aplicată rezultatelor măsurării. Astfel, expresii ca "excelent",


"mediocru", "superior mediei", "succes", "eşec" sunt termeni de evaluare utilizaţi în educaţie. Trebuie
precizat că evaluarea unui rezultat obţinut în urma măsurării, este un aspect important când rezultatul
este dificil de interpretat în absenţa unei unităţi de măsură, care poate da o semnificaţie rezultatului
respectiv.

EXEMPLU care permite înţelegerea distincţiei dintre măsurare şi evaluare. Un prieten vă


informează că bunicul său are 90 de ani. Expresia "90 de ani" sau numărul 90 este rezultatul unei
măsurări. Pentru a asocia numărul 90 bunicului său, prietenul dumneavoastră a aplicat o regulă precisă
care constă în a determina de câte ori o unitate de măsură este cuprinsă între două momente precise:
data naşterii şi momentul în care se face relatarea. Din contra, dacă prietenul dumneavoastră vă spune
că bunicul său este foarte bătrân, el vă comunică rezultatul unei evaluări.

IMPORTANT
În baza acestui exemplu, putem constata că rezultatul măsurării este obiectiv, nici o judecată de valoare
nu apare, în timp ce rezultatul evaluării este subiectiv. Acesta este unul din principiile de bază care
diferenţiază măsurarea de evaluare.

Se poate obiecta că această distincţie nu este foarte clară, deoarece în toată lumea se spune că
un individ de 90 de ani este foarte bătrân. Avem aici o situaţie foarte frecventă din viaţa cotidiană, în care
rezultatul unei măsurări se înscrie cu uşurinţă în cadrul de referinţă care corespunde experienţei
anterioare. Noi cunoaştem unitatea de măsură, anii de existenţă, şi cunoaştem posibilităţile actuale ale

110
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

longevităţii umane. Dintre cele două informaţii, una se referă la unitatea de măsură, iar cealaltă la
posibilităţile sau limitele fenomenului studiat, care permite, foarte des, să se facă judecăţi de valoare unice
pe baza rezultatelor măsurării. În acest exemplu, criteriu care a servit ca bază de evaluare este
caracteristic unui ansamblu de indivizi. Este suficient ca această caracteristică să se modifice pentru ca
evaluarea să fie modificată. Dacă presupunem că durata de viaţă se prelungeşte la 200 de ani, atunci
judecata de valoare "foarte bătrân" nu mai este potrivită pentru o persoană de 90 de ani. Acest exemplu
ilustrează foarte bine caracterul subiectiv al evaluării.
În consecinţă, în educaţie şi psihologie se ignoră foarte frecvent unităţile de măsură şi limitele
fenomenului studiat. Această problemă poate fi rezolvată dacă evaluăm inteligenţa unui elev, aptitudinile,
interesele, calitatea randamentului său şcolar pe baza unui rezultat măsurabil. Mai mult, deseori, acest
rezultat este un număr care indică cantitatea răspunsurilor bune la un ansamblu de probleme puse în
cadrul unui test. Rezultatul de 60 obţinut de un elev la o probă de randament nu relevă nimic din calitatea
elevului şi nici din competenţa sa. Pentru a putea face o judecată de valoare, trebuie să avem acces la
ambele informaţii (conţinutului probei şi posibilităţile de rezolvare a probei).
Dacă cunoaştem natura problemelor pe care elevul le-a rezolvat în acea probă, vom putea
deduce capacităţile sau abilităţile necesare elevului pentru a rezolva proba. Cunoaşterea naturii
problemelor rezolvate sau a conţinutului probei este un compromis faţă de dificultatea de a stabili o unitate
de măsură sau un standard. Din contră, dacă vom cunoaşte posibilităţile de rezolvare a probei, prin
analiza rezultatelor obţinute de alţi elevi, vom putea elabora o judecată de valoare ca "excelent",
"mediocru", "superior mediei" sau "normal". În acest caz evaluarea se realizează folosind un criteriu
de bază şi caracteristicile unui ansamblu de elevi.

2. CLASIFICAREA SCĂRILOR DE MĂSURĂ

Problema clasificării scalelor de măsurare este legată de diversitatea utilizării numerelor (de
exemplu numerele pot face referiri la cantităţi dar şi la calităţi). De asemeni, există tipuri distincte de scale
de măsură cu care putem clasifica toate atributele măsurate. În ştiinţele umaniste, problema clasificării
scalelor de măsură, este o preocupare amforă pentru numeroşi cercetători. Mulţi dintre ei consideră că
pentru a înţelege precizia unei măsurări psihologice trebuie să luăm în consideraţie natura scalei utilizate
în cazul unui procedeu de măsurare.

IMPORTANT
Natura scalei de măsurare utilizată determină tipul de interpretare şi cantitatea de informaţii pe
care o putem extrage din rezultatele obţinute cu ajutorul acelei scale. Problema este legată de
legitimitatea utilizării unor procedee matematice pentru măsurarea atributelor umane care se referă la
aspecte psihologice.
Primul criteriu de diferenţiere a unui tip de scară, se referă la regulile care determină modul în
care numerele sunt asociate atributelor măsurate. O scală nu are raţiunea de a exista dacă nu există un
izomorfism (corespondenţă) între unele proprietăţi ale atributelor măsurate şi unele proprietăţi ale seriei
numerice.
Proprietăţile sau natura atributelor, utilizarea procedeelor concrete care vizează măsurarea
acestor atribute, sunt factori care limitează operaţiile empirice de bază aplicabile atributelor măsurate.

111
CORNELIU-EUGEN HAVÂRNEANU

EXEMPLU
Unui atribut ca sexul indivizilor îi poate fi asociat un număr care are valoare de etichetă (masculin
1 şi feminin 2) În consecinţă, chiar natura atributului măsurat nu ne oferă decât posibilitatea unor operaţii
empirice de clasificare şi de numărare.
Un al doilea exemplu ne permite să ilustră mai bine influenţa alegerii procedeelor concrete de
măsurare. Să presupunem că, fără să avem un instrument standardizat de măsurare, dorim să comparăm
înălţimea unor indivizi. Operaţiile empirice aplicabile rezultatelor acestor măsurări se vor limita la a plasa,
în ordine, indivizii, după talie. Însă dacă posedăm un instrument standard, care are la bază unităţi etalon,
şi repetăm măsurările, numărul operaţiilor empirice aplicabile acestor rezultate va fi mult mai mare. În
acest fel vom putea plasa indivizii în ordinea înălţimii, dar vom putea compara şi diferenţele dintre
înălţimile lor şi chiar stabili un raport între înălţimile indivizilor. Din aceste calcule putem stabili că X este
de două ori mai mare decât fiul său Y, constatare pe care nu o putem pune în evidenţă în absenţa unei
unităţi etalon.

Ceea ce caracterizează cel mai bine fiecare tip de scală, este studiul invarianţei. Aceasta
presupune ca transformările fiecărei scale să nu producă distorsiuni ale structurii acesteia.

EXEMPLU
Dacă vrem să exprimăm datele în unităţi diferite de unităţile de măsură originale, este necesar să putem
efectua această transformare, fără a modifica semnificaţia datelor. Mărimea invarianţei unei scale
stabileşte limitele referitoare la transformările matematice şi statistice care pot fi legitim aplicate datelor
obţinute printr-un procedeu de măsurare. În cazul scalelor prin care se stabileşte rangul indivizilor, în
funcţie de un atribut dat, toate transformările matematice efectuate asupra acestor date pentru
modificarea rangului, falsifică rezultatele şi în consecinţă acest tip de transformare nu poate fi legitim
aplicat la acest tip de scară.

IMPORTANT
Fiecare tip de scară de măsurare are anumite implicaţii:
În primul rând, fiecare tip de scală are anumite postulate. Dacă datele obţinute printr-un anumit
procedeu de măsură sunt conforme postulatelor unui anumit tip de scală, măsurarea va fi considerată ca
posedând proprietăţile inerente scalei respective. Niciodată un tip de scală nu poate face abstracţie de
postulatele care îi sunt proprii.
În al doilea rând, cu cât un tip e scală este mai complex, cu atât regulile care determină asocierea
numerelor unor atribute măsurate sunt restrictive şi multe din informaţiile furnizate de scală sunt precise,
ceea ce are efecte asupra reducerii, întinderii invarianţei scalei respective. Mai mult, postulatele
matematice ale unei scale foarte complexe permit utilizare unui mare număr de operaţii matematice şi
statistice.
O altă proprietate majoră a unei scale este aceea de a reflecta atributele măsurate.

EXEMPLU
Dacă dorim să măsurăm înălţimea elevilor unei clase este necesar să avem o scală care reflectă acest
atribut. Se întâmplă ca multe dintre conceptele ştiinţifice, de interes pentru cercetător, să poată fi
măsurate prin modalităţi rudimentare. Să presupunem că un cercetător doreşte să obţină un singur număr

112
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

care să reprezinte agresivitatea unui copil dintr-o grădiniţă. O metodă ar putea fi utilizarea interviului
psihologic clinic şi apoi evaluarea subiecţilor de la 1 la 10 în acord cu mărimea agresivităţii lor. Un aspect
foarte important pentru problema pusă în discuţie este ce atribute matematice generale trebuie să posede
scala de agresivitate realizată pentru evaluarea copiilor de la 1 la 10.

Atributele pe care trebuie să le posede o scală de măsurare sunt: magnitudinea sau mărimea,
intervale egale şi punctul zero.

DEFINIŢII
Când o scală are magnitudine, atunci un anumit atribut poate fi judecat ca fiind mai mare decât,
mai mic decât sau egal cu o altă stare a aceluiaşi atribut. Dacă revenim la exemplul anterior şi constatăm
că un clinician atribuie un scor de 8 pentru subiectul X şi 5 pentru subiectul Y, această scală de măsurare
reflectă diferenţele în magnitudine ale agresivităţii la cei doi subiecţi (subiectul X este mai agresiv decât
subiectul Y).
Intervale egale, înseamnă că magnitudinea unui atribut reprezentat de o unitate de măsură pe
o scală este egală, indiferent de locul unde este plasată unitatea pe scală. De exemplu, în cazul
măsurării înălţimii în cm., diferenţa între o persoană care are 160 cm. faţă de alta care are 161 cm., este
aceeaşi ca diferenţa care există între o persoană de 170 cm. şi alta de 171 cm. Un centimetru reflectă
aceeaşi cantitate (de înălţime), indiferent de locul în care este plasat centimetrul pe scală.

Acest aspect nu este respectat tot timpul. Să luăm exemplul clasamentului realizat la sfârşitul
unui campionat de fotbal. Diferenţa dintre echipa plasată pe locul întâi şi cea de pe locul doi este de un
loc, aceeaşi diferenţă existând şi între echipa plasată pe locul doi şi cea de pe locul trei. Dar în acest caz
nu putem spune că 1 - 2 = 2 - 3, aşa cum am stabilit în cazul diferenţelor de înălţime.

DEFINIŢIE
Punctul zero absolut, este valoarea care indică faptul că atributul care trebuie măsurat nu are nici o
valoare (mai bine spus are valoarea zero).

Zero pentru înălţime este o valoare a scalei care presupune lipsa înălţimii. În cazul măsurării
agresivităţii, cea mai mică notă pe care psihologul o poate atribui este 1. Această valoare nu indică
inexistenţa tendinţei agresive. Un copil care primeşte nota 1 poate să lovească uşor un alt copil sau să-l
jignească verbal, ocazional. Copilul are un nivel mic al agresivităţii, dar într-un sens relativ. Chiar dacă
valoare zero ar fi o parte componentă a scalei această nu presupune inexistenţa totală a agresivităţii.
Această scală de evaluare a agresivităţii nu are zero absolut.

APLICAŢIE
Dați exemple de atribute care nu posedă zero absolut și de atribute la care zero absolut se stabileşte
convențional.

113
CORNELIU-EUGEN HAVÂRNEANU

3. SCALA NOMINALĂ

Acest tip de scală este cunoscută şi sub denumirea de scală calitativă, scală categorială sau
scală de clasificare.
Forma cea mai simplă de observaţie constă în a stabili dacă două obiecte au doi indivizi sunt
calitativ asemănători sau diferiţi prin răspunsurile lor la o situaţie dată, sau când prezintă una sau mai
multe proprietăţi date. Vom putea astfel grupa proprietăţile sau indivizii în funcţie de una sau mai multe
caracteristici comune. Este suficient să precizăm criteriile utilizate pentru includerea obiectelor sau
indivizilor într-o clasă sau categorie. Apoi, după ce acest criteriu a fost stabilit şi s-a realizat repartiţia în
clase, putem denumi clasa respectivă pentru a desemna obiectele sau indivizii incluşi în acea clasă.
Numele clasei poate fi un număr sau un cuvânt.
Ţinând seama de procedura de clasificare, rigoarea de discriminare depinde de capacitate de
observaţie a evaluatorului şi de marja de imprecizie care este tolerată. În ştiinţele umane, când vorbim de
egalitate dintre indivizii unei clase, vom spune că acesta este aproximativ egală în funcţie de
complexitatea comportamentului uman şi de imprecizia relativă a mijloacelor de observaţie.

IMPORTANT
Operaţiile de clasificare şi enumerare sunt folosite în producerea unei scale nominale. Un caz
particular de clasificare este cel în care o clasă sau categorie cuprinde un singur obiect sau individ.
Numele acestei clase devine o etichetă atribuită acelui obiect sau individ.

În cazul în care simbolurile numerice sunt atribuite indivizilor, aceste simboluri nu reprezintă
cantităţi de atribute şi nu putem vorbi de posibilităţi de utilizare a matematicii sau statisticii, ci doar de
obţinerea unor informaţii calitative. Putem avea doar o corelaţie accidentală între aceste numere şi
atribuitele respective, dar acesta nu poate fi obiectul unei interpretări referitoare de sensul legăturii.
Singurele operaţii statistice posibile cu aceste date nominale sunt calculul frecvenţelor (numărul de
cazuri din fiecare categorie), identificarea modulului (categoria cu cei mai mulţi indivizi), calcului
coeficientului de contingenţă (verificare ipotezei referitoare la distribuţia cazurilor în categorii, evaluarea
interdependenţei a două principii de clasare).
Aceste operaţii statistice sunt realizabile şi la scalele de măsurare mai complexe. Trebuie să
facem distincţia între utilizarea numerelor în scopul identificării unei clase şi utilizarea numerelor care
reprezintă frecvenţa obiectelor sau indivizilor dintr-o clasă sau categorie. În primul caz, (identificarea unei
clase), utilizarea numerelor nu este o măsurare ci un indiciu, la care se respectă postulatele 1,2 şi 3. Mulţi
autori consideră că scara nominală nu este decât o formă de clasare. În acelaşi timp, majoritatea autorilor
consideră că operaţiile de clasare corespund criteriilor de definire a unei măsurări. Putem concluziona că
scala nominală constituie un nivel de măsurare primar. Utilizarea scalelor nominale este limitată în
ştiinţele umane şi nu furnizează indicaţii asupra aptitudinii atributelor.

EXEMPLU
Scală nominală este scala utilizată pentru diferenţierea tipurilor temperamentale (coleric, sanguinic,
flegmatic şi melancolic). Dacă considerăm că fiecare individ poate fi plasat doar într-unul din cele patru
tipuri enumerate, atunci aceste tipuri reprezintă mulţimea categoriilor sacalei nominale.

Uneori, pentru ca scala să îndeplinească condiţia de exhaustivitate, se introduce şi categoria "alte


situaţii", "şi alţii" etc. Pentru eficienţa cercetării această categorie specială trebuie să nu includă o parte
semnificativă a populaţiei studiate, fapt care ar diminua relevanţa rezultatelor.

114
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

În operaţiunea de culegere şi prelucrare a datelor, se recurge frecvent la codificarea acestora.


Prin codificare se înţelege transformarea unei mulţimi de obiecte, date, itemi, dintr-o formă sistematică
de prezentare într-o altă formă. De exemplu tipul coleric = 1, tipul sanguinic = 2, tipul flegmatic = 3, iar
tipul melancolic = 4.
Aceste coduri, utilizate în scala nominală trebuie considerate simple simboluri, proprietatea lor
de a fi diferite între ele permite discriminarea categoriilor.
Trebuie menţionat faptul că între categoriile unei scale nominale nu există relaţii de ierarhie,
ordinea prezentării fiind indiferentă.
Să presupunem că doi cercetători, în investigaţii independente, au obţinut următoarele rezultate:
TIP TEMPERAMENT Nr. SUBIECŢI Nr. SUBIECŢI
CERCETAREA 1 CERCETAREA 2
1 32 58
2 48 73
3 37 80
4 33 39
TOTAL 150 250

Menţionăm că în coloana din stânga avem coduri, etichete lipsite de semnificaţie cantitativă în
timp ce numerele din celelalte două coloane posedă această semnificaţie. Ansamblul numerelor din
coloana a doua şi a treia poartă numele de distribuţie a tipurilor temperamentale în grupurile studiate.

IMPORTANT
Fiecare număr reprezintă frecvenţa absolută a unei categorii din scală.

Compararea rezultatelor celor două cercetări ne conduce la constatarea că a doua cercetare


prezintă valori mai mari la fiecare categorie. Această constatare nu are valoare ştiinţifică deoarece al
doilea grup de cercetare este mai numeros decât primul, şi este normal ca frecvenţele să fie mai mari.

IMPORTANT
Pentru o comparaţie relevantă trebuie să utilizăm frecvenţele relative. Frecvenţa relativă pentru o
categorie se obţine prin împărţirea frecvenţei absolute la numărul total de subiecţi. Prin înmulţirea
frecvenţei relative cu 100, obţinem procente.

Comparaţiile efectuate după frecvenţele relative, sau procente capătă substanţă, deoarece
măsurătorile realizate pe eşantioane de mărimi diferite sunt aduse la un sistem de raportare comun, ceea
ce permite comparaţii.
Trebuie să se ţină seama de faptul că frecvenţele relative sunt sensibile la volumul eşantionului.
Astfel, 5 cazuri din 10 reprezintă 50%, în timp ce 6 cazuri din 10 reprezintă 60% din totalul cazurilor.
Diferenţa de unu între frecvenţele absolute se reflectă într-o diferenţă de 10 între procente. Dacă volumul
eşantionului ar fi fost 100, atunci 5 şi respectiv 6 cazuri ar fi reprezentat 5% şi respectiv 6%. Observăm
diferenţa mai mică între procentaje, datorată mărimii eşantionului. Din punt de vedere practic, acest
aspect impune raportarea numărului total de cazuri atunci când se folosesc frecvenţe relative sau
procente.

115
CORNELIU-EUGEN HAVÂRNEANU

Operaţii asupra categoriilor unei scale nominale


Asupra categoriilor unei scale nominale se pot efectua două tipuri de operaţii: gruparea
(condensarea) şi rafinarea (diversificarea).
Gruparea este acea operaţie prin care din două sau mai multe categorii se obţine o singură
categorie care va purta o etichetă nouă, distinctă de celelalte. Prin grupare o scală nominală cu n categorii
se transformă într-o scală nominală cu m categorii, unde m  n.
Rafinarea este operaţia prin care dintr-o categorie se obţin două sau mai multe categorii noi,
etichetate distinct. În acest fel o scală cu n categorii se transformă într-o scală cu m categorii, unde mn.
Asupra aceleaşi scale se pot efectua consecutiv ambele operaţii. Aceste operaţii corespund
necesităţilor practice de analiză şi sinteză, generalizare şi particularizare etc.
Aceste operaţii nu pot fi efectuate în mod arbitrar, în cazul unei scale nominale concrete,
responsabilitatea transformării revenind cercetătorului, care trebuie să respecte exigenţele de conţinut şi
cele formal logice.
Scala nominală care cuprinde categoriile de comunicare a lui Bales, permite plasarea
comunicărilor într-un grup în funcţie de rolul comunicării într-o discuţie. Clasificarea furnizează informaţii
despre dinamica comunicării, raportul dintre participanţii la discuţia în grup, mecanismele discuţiei.
Categoriile propuse de Bales sunt:
I. 1. manifestă solidaritate
2. manifestă diminuarea tensiunii
3. manifestă acordul, acceptă pasiv
4. dă o sugestie
5. emite o opinie
6. dă o orientare, o informare
7. cere o orientare, o informare
8. cere o opinie
9. cere o sugestie
10. manifestă dezacordul
11. exteriorizează tensiune
12. manifestă antagonism
Utilizând operaţiile de grupare, această scală se poate transforma, prin condensarea categoriilor,
în felul următor:
II. A. Reacţii pozitive (1, 2 şi 3)
B. Răspunsuri aşteptate (4, 5 şi 6)
C. Întrebări (7, 8 şi 9)
D. Reacţii negative (10, 11 şi 12)
Noua scală cuprinde 4 categorii, fiecare provenind din câte trei ale scalei iniţiale.
Un alt gen de grupare ar putea fi:
III. a. comunicare (6, 7)
b. evaluare (5, 6)
c. influenţă (4, 9)
d. decizie (3, 10)
e. tensiune (2, 11)
f. integrarea membrilor (1, 12)
O altă viziune sintetică a fenomenului studiat poate produce condensări de ordinul doi, prin
gruparea categoriilor din scala II:
IV. i. reacţii emoţionale pozitive (A)
ii. reacţii emoţionale neutre (B, C)
iii. reacţii emoţionale negative (D )
Trecerea inversă, de la scale condensate la scale diversificate (cum ar fi de la scala II la scala I)
se realizează prin operaţii de rafinare, şi este impusă de necesităţi analitice accentuate.

116
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

Prin gruparea excesivă se produce o pierdere de informaţii primare, în timp ce rafinarea excesivă
duce la o acumulare de amănunte care creează dificultăţi în perceperea esenţei problemei studiate. De
aici rezultă nevoia păstrării unui echilibru între cele două situaţii.
Volumul eşantionului este un element important în alegerea numărului de gradaţii pentru o scală
nominală. Un eşantion mic nu se poate studia folosind o scală nominală cu un număr mare de categorii,
iar un eşantion mare printr-o scală cu puţine categorii.
Efectul transformării scalelor asupra distribuţiei datelor unei cercetări concrete este important.
Singurul lucru constant rămâne numărul de membri ai eşantionului. Distribuţia subiecţilor pe clase se
modifică la orice grupare sau rafinare a categoriilor.

ÎNTREBARE
Cum vom proceda atunci când dorim să comparam datele obținute cu ajutorul unei scale nominale în mai
multe investigații independente în care efectivele studiate sunt diferite?

4. SCALA ORDINALĂ

Scalele ordinale sunt cunoscute şi sub numele de scale de ordine, scale de rang, scale
ierarhice, şi permit ordonarea observaţiilor, indivizilor, situaţiilor de la mic la mare, de la simplu la
complex, de la mai puţin la mai mult.
Operaţia de enumerare şi clasare în diferite clase sau categorii este omogenă, adică toţi indivizii
sau obiectele unei clase sunt considerate ca fiind echivalente, când printr-un atribut ei aparţin acelei clase.

IMPORTANT
În interiorul unei clase date, indivizii pot fi comparaţi în funcţie de gradul prezenţei unui atribut comun.
Trebuie să fim preocupaţi de ordinea relativă a obiectelor sau indivizilor.

Realizarea acestei ierarhii se bazează pe evaluarea unui atribut observat, printr-o comparaţie
directă sau indirectă. O scală poate fi obţinută, constatând că un obiect sau individ posedă atributul într-
un grad mai ridicat faţă de obiectul sau individul precedent din serie, ceea ce poate fi simbolic exprimat
astfel:
S1 < S2 < S3.............Sn (pentru n subiecţi)
Operaţiunea de ordonare presupune o discriminare foarte riguroasă faţă de simpla
categorizare, deoarece pentru fiecare obiect sau individ trebuie să stabilim gradul de prezenţă a unui
atribut, ceea ce nu înseamnă că scala indică cantitatea absolută a atributelor prezente, nici
amploarea diferenţelor sau raporturile dintre cantităţile atributelor prezente.

IMPORTANT
Atributul nu se exprimă în mod necesar în unităţi egale, chiar dacă numerele care le reprezintă sunt
la distanţe egale.
Un individ care se situează la rangul patru nu prezintă de două ori mai multe atribute decât cel care se
situează la rangul doi. În fine, scala ordinală nu poate exista în absenţa totală a unui atribut, ea nu admite
deci zero absolut.

117
CORNELIU-EUGEN HAVÂRNEANU

IMPORTANT
Simbolurile numerice atribuite obiectelor sau indivizilor, sunt ranguri care indică poziţia relativă a
acestora pe un continuum pentru atributul pe care dorim să-l măsurăm, ca în exemplul de mai jos.
S1 S2 S3 S4 S5 S6

Observăm că într-o scală ordinală direcţia continuumului este cunoscută. Singurele informaţii
cunoscute din acest continuum sunt de tipul "mai mic ca", "mai mare ca", "egal" sau "diferit" (<;>;=;),
între indivizi sau obiecte, în funcţie de atributul măsurat. Acest continuum reprezentat mai sus ne permite
să stabilim că:
S1 < S2; S4 > S3; S3  S5.

IMPORTANT
Datele scalelor ordinale pot fi analizate prin statistici neparametrice.

Se poate recurge la toate operaţiile statistice aplicabile scalelor nominale. Pentru aceste date
putem calcula mediana, centile, coeficienţi de corelaţie a rangurilor şi khi-pătrat. În acelaşi timp,
operaţiile algebrice de adunare, scădere, înmulţire şi împărţire nu au nici un sens dacă sunt aplicate
acestor date. Nu putem calcula media şi abaterea standard care ne oferă posibilitatea de a cunoaşte mai
mult decât poziţia relativă a obiectelor sau indivizilor. Aceasta este o limită importantă a informaţiilor care
pot fi furnizate de o scală ordinală, deoarece media sau abaterea standard reprezintă fundamentul
metodelor statistice utilizate în ştiinţele umane. Relaţiile funcţionale stabilite pe baza scalelor ordinale ne
oferă un indice, mai mult sau mai puţin satisfăcător, în comparaţie cu relaţiile exprimate de alte scale mult
mai complexe.
Mulţi autori consideră că scalele de măsurare psihologice furnizează informaţii despre ordinea
indivizilor, în funcţie de atributul măsurat sau asupra gradului la care fiecare individ prezintă acel atribut.
Aceşti autori aduc critici severe legate de utilizarea metodelor statistice puternice în analiza datelor
psihologice şi recomandă o mare prudenţă în interpretarea datelor obţinute cu ajutorul scalelor ordinale.
Crearea unei scale ordinale presupune, stabilirea unei relaţii de ordine între valorile posibile ale
variabilei studiate.

EXEMPLU
J. Piaget oferă modelul unei scale după criteriul slab structurat - înalt structurat, prin care evaluează
stadiul dezvoltării inteligenţei la copil.
Stadiul 1 exersarea reflexelor
Stadiul 2 reacţia circulară primară
Stadiul 3 reacţiile circulară secundare
Stadiul 4 coordonarea schemelor secundare şi aplicarea la situaţii noi
Stadiul 5 reacţia circulară terţiară şi descoperirea de mijloace noi prin
experimentare activă

118
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

Stadiul 6 inventarea unor mijloace noi de acţiune prin combinare mentală


Ordinea prezentată este de la simplu la complex. Utilizând această scală putem caracteriza
manifestările unui copil în funcţie de stadiul pe care l-a atins în dezvoltare. Dacă subiectul A este pasat
în stadiul 1, subiectul B în stadiul 2, iar subiectul C în stadiul 3, atunci putem face afirmaţia că subiectul
C are posibilităţi operatorii mai mari decât B sau C. Dar, caracteristicile scalei ordinale nu ne permit să
precizăm cu exactitate cu cât este mai complex C faţă de B sau faţă de A şi nici să comparăm diferenţa
dintre C şi B cu cea dintre B şi A.

5. SCALELE DE INTERVALE EGALE

Aranjarea ordinală poate da rezultate foarte complete dacă cunoaştem distanţa care separă
obiectele sau indivizii în funcţie de atributul măsurat. Dacă mai multe obiecte sau indivizi sunt la distanţe
egale, în funcţie de gradul pe care îl prezintă atributul, distanţa care le separă poate fi considerată ca o
unitate liniară de măsură şi scala constituită în acest fel se numeşte scală cu intervale egale sau scală
de intervale.
Egalitatea dintre intervale este necesară dacă dorim să cunoaştem diferenţele interindividuale
(diferenţele dintre indivizi referitoare la un atribut, pe un singur continuum) sau diferenţele intra-
individuale (diferenţele dintre poziţia unui individ în funcţie de mai multe atribute pe mai multe
continuumuri). O unitate reprezintă un aspect arbitrar, dar care poate avea o relaţie cu atributul pe care
dorim să-l măsurăm. Distanţele numerice egale reprezintă, în principiu distanţele empirice egale între
obiecte sau indivizi, în funcţie de atribut.
Se poate ajunge deseori la formularea unor enunţuri ştiinţifice în legătură cu diferenţele dintre
gradele la care obiectele sau indivizii prezintă un atribut. Sensul enunţurilor formulate presupun o
proprietate care se juxtapune obiectelor sau indivizilor, adică gradele de prezenţă a unui atribut pot fi
supuse operaţiilor de adunare şi scădere. Dacă această proprietate este satisfăcută atunci avem o scală
denumită "aditivă".
Unele scale aditive oferă posibilităţi limitate de măsurare dacă zero absolut nu poate fi stabilit.
De asemeni, scalele cu intervale egale permit măsurarea diferenţelor dintre gradele de prezenţă a
atributelor, dar nu indică amptitudinea absolută a acestor grade, deoarece ele nu admit zero absolut.
Ele presupun existenţa unui punct zero definit arbitrar. Zero nu este decât ceva arbitrar într-o scală de
interval, gradul de prezenţă a unui atribut care defineşte punctul zero are puţine şanse să corespundă
unei limite reale la care atributul dispare complet.

IMPORTANT
Din această cauză este imposibil să stabilim proporţii pe baza gradelor de prezenţă a unui atribut exprimat
pe o scală de intervale egale.

În acelaşi timp, considerăm că distanţele pe o scală de intervale egale au proprietatea de


adiţionare, ceea ce presupune existenţa unui zero absolut.

119
CORNELIU-EUGEN HAVÂRNEANU

DEFINIŢIE
Două enunţuri principale pot defini scalele cu intervale egale:
S1 < S2 < S3.............< Sn
S2 - S1 = S3 - S2 =S4 - S3.................Sn -Sn-1
unde S1..........Sn sunt grade relative la care un atribut se prezintă pentru diferiţi subiecţi.

Scala de interval ne permite să cunoaştem direcţia unui continuum, dar şi stabilirea diferenţelor
între poziţiile obiectelor sau indivizilor, precum şi efectuarea unor operaţii de tipul celor prezentate mai
jos.
1 2 3 4

S1 S2 S3 S4 S5 S6 S7 S8 S9 S10 S11

Acest continuum de intervale egale ne permite să stabilim că diferenţa dintre rezultatele (R) a
indivizilor 1 şi 2 este mai mică decât diferenţa dintre rezultatele indivizilor 2 şi 3. Se observă că dacă
diferenţa dintre rezultatele indivizilor 2 şi 3 este de 1,5 în timp ce diferenţa dintre rezultatele indivizilor 1
şi 2 sau 3 şi 4 este de 1.
Scorurile unei scale de interval nu indică amptitudinea absolută a unui atribut din cauza absenţei
unui zero absolut, iar operaţiile de înmulţire şi împărţire nu au sens decât dacă ele se aplică intervalelor
nu şi scorurilor. Însă operaţiile de adunare şi scădere sunt aplicabile atât intervalelor cât şi scorurilor.
Scorurile dintr-o scală de intervale pot fi supuse unei transformări liniare, fără ca structura scalei
să se modifice. Putem aduna sau scădea la fiecare scor o valoare constantă, sau putem împărţi sau
înmulţi fiecare scor printr-o constantă, fără a afecta nici poziţia relativă a obiectelor sau indivizilor pe un
continuum, nici egalitatea intervalelor, nici raporturile dintre intervale, nici forma generală a relaţiilor dintre
scorurile scalei faţă de o altă scală.

IMPORTANT
Scalele de intervale oferă, pe lângă posibilitatea operaţiilor statistice specifice scalelor mai puţin
complexe, calculul mediei abaterii standard, coeficientul de corelaţie Pearsons recurgerea la teste
de semnificaţie (F; t) şi folosirea unor numeroase tehnici statistice puternice.

Din acest motiv este de dorit să utilizăm scala de intervale egale în ştiinţele umane:
Dar concepte ca inteligenţa, aptitudinile şi personalitatea nu pot fi măsurate decât cu scale
ordinale deoarece acestea nu răspund exigenţelor scalelor de măsurare mai complexe. În consecinţă,
singurele operaţii statistice acceptate legitim cu acest tip de date sunt cele specifice scalelor ordinale.
Cercetarea în ştiinţele umane recurge, cu mare frecvenţă la analize statistice puternice. Această situaţie
a determinat numeroase dezbateri printre cercetători purtate asupra legitimităţii de a considera atributele
umane ca putând fi exprimate în unităţi egale. De fapt, înainte de a analiza rezultatele unei scale de
măsurare, în conformitate cu posibilităţile pe care ni le oferă scalele de intervale, este important să stabilim
empiric egalitatea intervalelor scalei respective. În cazul în care utilizăm mai multe metode de măsurare,
este posibil să determinăm procedeul de operare potrivit, dacă unităţile sunt egale sau nu. Alegerea

120
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

acestor operaţii se efectuează în funcţie de variabila analizată şi de concepţiile teoretice referitoare la


natura variabilei respective.
Diferite tehnici permit controlul dificultăţilor legate de alegerea scalei şi se va proceda într-un
anumit fel dacă postulatele corespunzătoare utilizării unei scale de intervale egale sunt satisfăcute.
O primă tehnică constă în utilizarea unei singure definiţii operaţionale pentru atributul măsurat.
Acesta presupune să nu definim variabile decât în funcţie de rezultatele obţinute la un test. Ele reprezintă
deci, în mod cert, puritate matematică, dar ele pot conduce la erori de interpretare conceptuală.
O a doua tehnică constă în a transforma rezultatele brute în scoruri derivate, care sunt ele însele
exprimate într-o scală de intervale egale.

6. SCALELE DE PROPORŢII SAU DE RAPORT

Această scală, care se aplică măsurătorilor fizice este o scală numerică. În măsurarea unui
atribut, zero absolut indică absenţa atributului la un obiect sau individ. O scală de proporţii poate fi stabilită
pentru un atribut, care la primă vedere, nu prezintă posibilitatea absenţei totale, când putem respinge
existenţa unei relaţii funcţionale între acel atribut şi un alt atribut sau fenomen care posedă proprietatea
de adunare (adică zero absolut).

EXEMPLU
Dacă putem vorbi de absenţa totală a căldurii, vom putea tot timpul verifica existenţa unei relaţii
funcţionale între căldură şi modificările termice. Absenţa totală a variaţiilor termice corespunde unui zero
absolut pentru temperatură (zero grade Kelvin).

Această procedură nu se poate aplica în toate situaţiile, mai ales în cazul atributelor psihologice.

IMPORTANT
O caracteristică a unei scale de proporţii constă în posibilitatea de a cunoaşte distanţa între zero absolut
şi poziţia unui obiect sau individ pe un continuum definit pe baza unui atribut dat. Amptitudinea absolută
a unei cantităţi dintr-un atribut este o dată cunoscută şi este posibil să cunoaştem poziţia unui scor
individual fără a fi necesar să situam alţi indivizi sau obiecte pe acest continuum. Numerele reprezintă
deci, într-o formă reală gradul prezenţei unui atribut la un individ sau la un obiect.

Mai mult, ca şi pentru scalele mai puţin complexe, direcţia continuumului este cunoscută, şi de
asemenea rangul indivizilor în funcţie de un anumit atribut, precum şi mărimea intervalelor dintre scoruri,
intervale care sunt evident egale. Scala de raport este deci o scală care dă informaţii foarte complete.
1 2 3 4

0 1 2 3 4 5 6 7 8 9 10
Putem compara poziţiile indivizilor pe continuum dar, în acelaşi timp, putem stabili că individul 2
prezintă dublul gardului atributului prezent la individul 1, individul 3 prezintă de 3,5 ori gradul atributului
individului 1, iar individul 4 prezintă de 4,5 ori gradul atributului individului 1.

121
CORNELIU-EUGEN HAVÂRNEANU

Dacă înmulţim sau împărţim scorurile unei scale de proporţii printr-o constantă, scala îşi conservă
proprietăţile, ordinea indivizilor sau obiectelor rămân aceeaşi, proporţiile dintre intervale şi dintre scoruri
rămân neschimbate, punctul zero este tot timpul prezent.
Din potrivă, dacă adunăm sau scădem o constantă din scorurile scalei, natura scalei se modifică.
Ordinea obiectelor sau indivizilor şi proporţiile dintre intervale rămân aceleaşi, dar proporţiile dintre scoruri
sunt modificate, iar zero absolut dispare.
Constatăm că informaţiile furnizate de o scală sunt cu atât mai precise, cu cât este mai mică
libertatea de a transforma scala fără a modifica informaţiile originale. O scală ordinală, de exemplu, poate
suporta toate transformările monotone fără ca informaţiile primare să fie modificate. La o scală de
intervale posibilităţile de transformare sunt mult mai restrânse. În sfârşit la scalele de proporţii
transformările permise sunt limitate la înmulţirea şi împărţirea printr-o constantă dacă dorim ca informaţiile
să rămână identice.
Postulatele unui model de scală de proporţii permit utilizarea tuturor operaţiilor aritmetice (+, -, x,
), atât cu intervalele cât şi cu scorurile. Posibilitatea utilizării celor patru operaţii autorizează folosirea
metodelor de analiză matematică şi statistică foarte puternice, incluzând faţă de operaţiile permise de
scalele mai puţin complexe şi calculul coeficientului de variaţie.
Dacă corectăm un test şi adunăm numărul itemilor rezolvaţi corect, obţinem un număr situat pe
o scală de proporţii. Dar, dacă utilizăm acest număr pentru a indica poziţia subiectului pe o scală care
măsoară un atribut psihologic, atunci acest număr nu poate fi interpretat pe baza regulilor unei scale de
proporţii. Astfel, inexistenţa unor răspunsuri corecte (ceea ce însemnă zero răspunsuri corecte) nu
corespunde absenţei totale a atributului psihologic măsurat.

EXEMPLU
Un scor zero la un test de randament lexical nu implică că abilităţile de lectură sunt nule. Mai mult, 50 de
itemi corect rezolvaţi, dintr-un test, nu corespunde dublului gradului unui atribut pentru care s-au rezolvat
25 de itemi din acelaşi test. Noi nu putem spune că un subiect care are un QI de 130 are o inteligenţă
dublă faţă de un subiect care are un QI de 65. De asemeni, nu putem vorbi de un QI nul, deoarece zaro
absolut nu există în măsurarea atributelor psihologice.
Atributele psihologice nu permit aplicarea procedeului de stabilire a unei relaţii funcţionale între
două atribute deoarece acestea nu prezintă posibilitatea absenţei totale. Scalele de proporţie nu sunt
convenabile măsurării atributelor psihologice.

7. CLASIFICAREA DATELOR OBŢINUTE PRIN MĂSURARE


Observaţiile obţinute printr-un procedeu de măsură pot fi fie constante ale unui individ sau altul,
sau a unor situaţii diferite pentru acelaşi individ, fie variabile.
Variabilele sunt cantităţi de un anumit tip care pot lua mai mult decât o singură valoare. Acestea
pot fi neordonate (exemplu: sexul) sau ordonate (exemplu: aşezarea în ordine a scorurilor obţinute la
un test de randament). Variabilele ordonate pot fi negraduate (exemplu: bun, rău, slab) sau graduate
(exprimate cu ajutorul scorurilor numerice). Variabilele graduate pot fi continue (există posibilitatea de a
lua toate valorile numerice inclusiv fracţii, de exemplu: temperatura, greutatea) sau discrete (scorurile nu
pot avea decât valori întregi, de exemplu: numărul de indivizi dintr-o categorie sau numărul copiilor dintr-
o familie). Variabilele dihotomice sunt cele care nu pot lua decât două valori, de exemplu 0 sau 1.
Acestea sunt cazuri particulare ale variabililor discrete.
Constanta este o cantitate a cărei valoare rămâne neschimbată indiferent de context.
8. MĂSURAREA ŞI STATISTICILE

122
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

Termenul de statistică este frecvent utilizat dar este util să stabilim câteva distincţii în legătură cu
folosirea acestuia în teoria psihometrică. Distingem o diferenţiere între statistica inferenţială şi cea
descriptivă. Prima vizează producerea unor enunţuri probabiliste în legătură cu valorile obţinute de
subiecţii unor eşantioane din populaţie. A doua se limitează la descrierea diverselor aspecte ale unui
ansamblu de date empirice. Analizele matematice referitoare la măsurarea tendinţei centrale, a dispersiei
sau a corelaţiilor pot duce la descrierea unui ansamblu de date empirice ale unui eşantion mai mare sau
mai mic. Într-o etapă ulterioară putem aplica acestor date descriptive un ansamblu de tehnici statistice
inferenţiale (calcului intervalului de confidenţă, teste de semnificaţie) care permit extinderea datelor
obţinute prin investigarea eşantionului la ansamblul populaţiei studiate.

IMPORTANT
În psihologie, problema eşantionării se referă pe de o parte la eşantionarea subiecţilor dar pe de altă parte
la eşantionarea conţinutului (a itemilor unui test).

Trebuie să facem distincţie între aceste două forme de eşantionare. Putem concepe un ansamblu
de itemi a unui test ca un eşantion a unei populaţii ipotetic infinite de itemi (universul itemilor) care
măsoară aceeaşi trăsătură. Teoria măsurării este preocupată de relaţiilor statistice între scorurile obţinute
la test şi scorurile ipotetice adică, scorurile care ar putea fi obţinute dacă toţi itemii din universul de itemi
ar fi utilizaţi pentru testare. După ce un instrument de măsură a fost construit şi când el face obiectul unor
cercetări empirice, este important să realizăm analize statistice (inferenţiale) pentru generalizarea datelor
obţinute pe eşantioane de subiecţi, la populaţia corespunzătoare. În construcţia unui instrument
preocuparea principală este examinarea posibilităţilor de extindere la populaţia de itemi a rezultatelor
obţinute cu ajutorul eşantionului de itemi. În consecinţă, este imposibil să ţinem seama în acelaşi timp, în
analize statistice, de cele două aspecte ale eşantionului. O manieră tipică de rezolvare practică a acestei
probleme este de a ţine seama, în mod explicit, de unul din cele două dimensiuni şi considerând că
cealaltă dimensiune poate eventual să influenţeze rezultatele.
Există posibilitatea să se rezolve această problemă într-o manieră mult mai sigură. Putem folosi
un eşantion foarte mare, fără a fi preocupaţi de erorile de eşantionare decât în raport cu celălalt eşantion.
În psihometrie când construim un instrument de măsură utilizăm un eşantion de subiecţi suficient de mare
pentru ca eroare de eşantionare referitoare la indivizi să fie puţin importantă. Problema reprezentativităţii
eşantionului de subiecţi fiind rezolvată, reprezentativitatea eşantionului conţinutului va deveni
preocuparea centrală.
Un eşantion de subiecţi relativ restrâns nu este suficient pentru un studiu de validitate pentru noul
instrument. Mai mult, dacă eşantionul de subiecţi este suficient de mare, atunci precizia testului va fi
independentă de numărul de subiecţi din eşantion şi va fi legată direct de conţinutul testului adică de
numărul de itemi.

9. CUNOAŞTEREA PERSOANEI ŞI ASPECTELE MĂSURĂRII

În ştiinţele umane măsura nu se aplică direct indivizilor ci, diferitelor caracteristici ale acestora la
care se face referire printr-o terminologie variată. Când vorbim de atribut, de proprietăţi sau de trăsătură,
facem referire la o particularitate care este prezentă şi se manifestă în diferite grade la indivizii unei clase
date, acestea nefiind în mod necesar prezente la toţi indivizii. Problema este de a cunoaşte dacă un
individ posedă unele proprietăţi.

123
CORNELIU-EUGEN HAVÂRNEANU

IMPORTANT
În cazul unei proprietăţi care se referă la abilitatea unui individ sau la personalitatea sa, măsurarea se
referă la comportamentele observabile şi măsurabile. Această proprietate este o construcţie, un concept
care se referă la un aspect precis al individului şi din care putem extrage un ansamblu de comportamente,
pe care îi vom considera indicatori ai proprietăţii respective.

Acest concept căruia îi atribuim un nume (perseverenţă, inteligenţă, autoritarism, etc.) nu există
în afara indivizilor. Pentru a fi raţional este necesară o coerenţă cu acele comportamentele observate, cu
organizarea şi structurarea lor. Pe baza observaţiilor indicatorilor unei proprietăţi a trăsăturii vom putea
presupune prezenţa, într-o măsură mai mare sau mai mică a proprietăţii, la un individ iar această
presupunere implică formularea unuia sau mai multor postulate sau o demonstraţie pentru stabilirea unei
relaţii între proprietăţi şi manifestările sale (indicatori comportamentali).
Un concept poate fi definit în două feluri, fie cu ajutorul altor concepte (definiţie teoretică sau
constitutivă) fie cu ajutorul procedeelor experimentale (definiţie empirică sau operaţională). Dacă unele
trăsături se pretează la definiţii relativ clare şi precise (aptitudine numerică, aptitudine verbală, etc.) altele
sunt foarte ambigue şi mai imprecise (onestitate, impulsivitate, etc.). În cazul în care presupunem că o
proprietate poate fi măsurată cu ajutorul unor indicatori, atunci proprietatea respectivă face obiectul unei
definiţii operaţionale riguroase în care trebuie precizate activităţile şi operaţiile la care se recurge pentru
a putea fi supuse procedeului de măsurare.
Cercetătorii caută în mod obişnuit izolarea unei proprietăţi. În acest fel ei limitează observaţiile
directe şi indicatorii la categoria de comportamente pertinente studiului lor, pentru a stabili indicatorii
proprietăţii. Valoarea inferenţei prin utilizarea unui procedeu de măsurare este dependent de natura
observaţiilor, care sunt în funcţie de interacţiunea anumitor factori. Caracteristice naturale ale proprietăţii,
teoria care o susţine, natura instrumentelor de măsură, şi experienţa cercetătorului sunt factori care
determină tipul de observaţie (direct sau indirect) şi în acelaşi timp veridicitatea cazurilor observate. Dar
ştiinţa vizează stabilirea consensurilor propriilor enunţuri referitoare la conceptele pe care le dezvoltă şi
este important ca observaţiile să poată fi reproduse. Din acest motiv condiţiile observaţiilor, timpul, locul
şi circumstanţele trebuie precizate. De asemenea, procedeul de măsurare trebuie să poată fi refolosit şi
rezultatele să fie verificabile. Mai mult, valoarea observaţiilor în ştiinţele umane, este limitată de diferite
surse de eroare, rezultatele măsurării fiind doar estimări ale indicatorilor proprietăţii studiate. Precizia
rezultatelor permite evaluarea valorilor observate, a intervalelor “de confidenţă” în interiorul cărora valorile
studiate au o probabilitate dată.
Pentru a elimina lacunele observaţiilor trebuie să elaborăm un instrument de măsură care să
permită evaluări cât mai precise ale indicatorilor. Elaborarea acestor instrumente presupune o bună
înţelegere a conceptelor. Primele baze de identificare a unei proprietăţi pot fi imperfecte datorită limitelor
observatorului şi a conceptelor eronate despre proprietatea respectivă. În cursul elaborării unei măsurări
numeroase schimbări sunt făcute asupra conceptelor legate de proprietatea măsurată. Primele estimări
sunt grosiere şi posedă multe erori. Cercetătorul poate perfecţiona scala de măsurare prin determinarea
relaţiei existente între proprietatea măsurată cu ajutorul scalei şi alte proprietăţi. În acest fel, măsurarea
devine mai rafinată dacă în timp se achiziţionează noi cunoştinţe.
Realizarea unor instrumente la care erorile de măsurare să fie cât mai mici şi care să permită
înregistrarea cât mai obiectivă a manifestărilor unei proprietăţi este mai mică în domeniul psihologiei. De
fapt, constatăm că nici măsurătorile fizice nu sunt perfecte. Simplul fapt de a face o măsurare, în care
intervine un observator şi folosirea unui instrument de măsură afectează rezultatele. Dacă metodele
respective permit eliminarea, într-o măsură mai mare sau mai mică, a efectelor procedeului de măsurare,
rămâne tot timpul o interacţiune nedeterminată între subiect şi observator.
Faptul că măsurarea presupune o eroare afectează certitudinea în stabilirea unei relaţii cauzale.
Concepţiile moderne de măsurare substituie modelului convenţional “cauză - efect”, enunţuri relative

124
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

asupra probabilităţii de manifestare a unui eveniment sau interacţiunilor dintre observaţii. În statistică,
proprietatea este măsurată în funcţie de acumularea unor evenimente (media) şi variaţia acestora
(varianţă).

TEST DE AUTOEVALUARE (cu răspunsuri corecte ataşate la finalul cursului)


Apreciați valoarea de adevăr a următoarelor afirmații:
1. Pe baza observaţiilor indicatorilor unei proprietăţi a trăsăturii vom putea presupune prezenţa, într-o
măsură mai mare sau mai mică a proprietăţii, la un individ:
a.ADEVĂRAT
b.FALS
2. Inteligenţa poate fi măsurată doar folosind scale ordinale
a.ADEVĂRAT
b.FALS
3. Dacă o variabilă este continuă atunci între două valori ale acelei variabile pot exista și ale valori
a.ADEVĂRAT
b.FALS
4. O scală de proporții nu posedă zero absolut.
a.ADEVĂRAT
b.FALS
5. Genul subiecților poate fi măsurat cu ajutorul unei scale ordinale:
a.ADEVĂRAT
b.FALS
6. Valoarea inferenţei prin utilizarea unui procedeu de măsurare este dependent de natura observaţiilor,
care sunt în funcţie de interacţiunea anumitor factori.
a.ADEVĂRAT
b.FALS
7. Definiția empirică sau operaționale presupune definirea unui concept cu ajutorul altor concepte.
a.ADEVĂRAT
b.FALS
8. Variabilele dihotomice sunt cele care nu pot lua decât două sau mai multe valori.
a.ADEVĂRAT
b.FALS
9. Eşantionarea conţinutului se referă la numărul de persoane cuprins într-un eșantion.
a.ADEVĂRAT
b.FALS
10 Dacă folosim o scală de raport determina mărimea absolută a unui atribut.
a.ADEVĂRAT
b.FALS
11. Agresivitatea subiecților poate fi măsurată cu ajutorul unei scale de proporții.
a.ADEVĂRAT
b.FALS
12. Într-o scală ordinală diferența dintre două valori ale unui atribut rămâne constantă indiferent de locul
unde plasăm această diferență pe scală.
a.ADEVĂRAT
b.FALS
13. Dacă un subiect are un QI de 100 este de două ori mai inteligent comparativ cu un subiect care alte
valoarea QI de 50
a.ADEVĂRAT

125
CORNELIU-EUGEN HAVÂRNEANU

b.FALS
14. Definiția teoretică sau constructivă presupune definirea conceptului cu ajutorul procedeelor
experimentale
a.ADEVĂRAT
b.FALS
15. Ordinea în care sunt prezentate categoriile într-o scală nominală este importantă
a.ADEVĂRAT
b.FALS
16. Media și abaterea standard trebuie calculate când folosim o scală ordinale pentru a obţine o precizie
cât mai mare în interpretarea rezultatelor.
a.ADEVĂRAT
b.FALS

126
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

Unitatea de învățare 3.
METODA TESTELOR

1. CONDUITA CA RELAŢIE

Faptul psihologic este o conduită, care implică o schemă de relaţii, pe care le studiază psihologul.
Conduita este manifestarea unei persoane într-o situaţie dată.
Dacă notăm conduita cu R (fideli tradiţiei anglo - saxone, unde R reprezintă iniţiala de la răspuns
sau reacţie), atunci aceasta depinde de personalitatea subiectului (P), care se confruntă cu o situaţie dată
(S).

IMPORTANT
Putem considera conduita în funcţie de personalitate şi situaţie: R = f(P,S)

În evoluţia psihologiei această relaţie a cunoscut diferite forme în funcţie de paradigmele


explicative la care au aderat cercetătorii.
Watson (1913), a pus bazele paradigmei behavioriste, în centrul atenţiei fiind plasat studiul
comportamentului exterior. Pentru acesta relaţia era de tipul R=f(S), aspectele legate de personalitatea
subiecţilor au fost neglijate deoarece psihologul nu poate pătrunde în interiorul "cutiei negre".
Woodworth (1929), complică schema de relaţii, sub forma S  O  R, scoţând în evidenţă
rolul organismului, dar se limitează doar la evocarea determinanţilor biologici ai comportamentului.
Pentru a evita orice confuzie trebuie menţionat faptul că variabilele S, R, P pot fi studiate la diferite
niveluri:
Conduita (R), reprezintă actul subiectului şi are componente endocrine, neurovegetative,
motorii, verbale. Psihologul se poate limita la studii fragmentare, luând în consideraţie doar o componentă,
dar poate cerceta şi relaţiile dintre mai multe componente. Astfel, o conduită manifestată printr-un răspuns
verbal, pate fi analizată din punct de vedere a structurii gramaticale, a naturii fonemelor, a semnificaţiei
sau a efectului produs pentru interlocutor.
Situaţia (S), pate fi de asemenea analizată la diferite niveluri. Stimulii fizici, care provin de la
diferite surse, acţionează de multe ori asupra subiecţilor, fără ca aceştia să conştientizeze. Lumina,
temperatura, umiditatea, presiunea atmosferică, compoziţia şi gradul de ionizare a aerului influenţează
dispoziţiile şi activităţile oamenilor. Percepţiile nu sunt simple fotografii ale obiectelor, ele sunt construcţii
ale experienţei, sunt influenţate de modul în care subiectul se raportează la situaţie, de atitudinea
acestuia. Situaţia este deci, relativă la subiect şi este important modul în care subiectul vede situaţia, în
funcţie de personalitatea sa.
Din aceste considerente relaţia nu este de tipul R=f(S,P) ci, R=f(S  P), săgeata dublă indicând
că există întotdeauna o interacţiune între S şi P, care nu sunt simple variabile aditive. Această interacţiune
poate fi cunoscută prin interpretarea răspunsurilor subiectului, care va dezvălui semnificaţia pe care
acesta o dă situaţiei.
Personalitatea (P), este o sinteză dinamică de aspecte morfologice şi fiziologice, dar şi
conative, afective, volitive. Cercetătorul trebuie să ţină seama de aceste aspecte şi chiar să ia în
consideraţie şi alte variabile ca: vârsta, sexul, integritatea senzorială, temperamentul, educaţia primită,
motivaţia etc. Personalitatea este în centrul relaţie, ea nu poate fi izolată din relaţie deoarece se manifestă
ca un nod de relaţii între situaţii şi răspunsuri.

127
CORNELIU-EUGEN HAVÂRNEANU

2. TIPURI DE RELAŢII ÎNTRE S - P - R

Există trei modalităţi clasice de abordare a acestor relaţii:


a. Relaţii funcţionale, utilizate pentru studiul funcţiilor psihice, unde aceeaşi persoană
reacţionează diferit la variabile cantitative şi calitative ale situaţiei.
S1 R1

S2 R2

S3 P R3

Sn Rn
În această figură S1, S2, S3, .....Sn, reprezintă situaţii cărora le corespund diferite răspunsuri R1, R2,
R3, ...Rn.

EXEMPLU
Evoluţia adaptării la întuneric (R) este în funcţie de timp (S), sau volumul materialului memorat (R) este
în funcţie de numărul de repetiţii, sau reacţiile defensive (R) sunt în funcţie de gradele diferite ale frustrării
(S).

b. Relaţii structurale, folosite pentru studiul structurii psihice, unde se studiază relaţiile dintre
răspunsurile obţinute de subiecţi pornind de la situaţii diferite.
S1 R1

S2 R2

S3 P R3

Sn Rn

În acest caz, situaţiilor diferite S1, S2, S3, .....Sn, le corespund răspunsuri diferite R1, R2, R3, ... Rn.
Aici se pune problema de a stabili relaţiile dintre răspunsurile R1, R2, R3, ... Rn,, care sunt dependente de
structura personalităţii. Aceste studii utilizează calcule de corelaţie şi analiza factorială. Astfel se pot
studia relaţiile dintre reacţiile obţinute în diferite situaţii care produc emoţii sau relaţiile dintre diferite
niveluri de eficienţă în sarcini diferite. Logica acestor studii se bazează pe faptul că dacă obţinem corelaţii
ridicate între răspunsurile subiecţilor la diferite situaţii, înseamnă că există un factor, în structura
personalităţii care justifică aceste corelaţii.

128
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

EXEMPLU
În acest fel Spearman a obţinut un factor "g" de inteligenţă generală şi mai mulţi factori "s", consideraţi
factori specifici, iar Thurstone mai mulţi factori de grup, printre care factorul numeric "N", factorul de
fluiditate verbală "W", factorul de comprehensiune verbală "V", un factor perceptiv "P", unul de
raţionament "R" (cu două forme raţionament inductiv I şi deductiv D).

c. Relaţii diferenţiale, folosite pentru studierea diferenţelor dintre indivizi, unde luăm în
consideraţie reacţiile unor persoane diferite la o singură situaţie standardizată.
P1 R1

P2 R2

S
P3 R3

Pn Rn
Diferenţele dintre R1, R2, R3,...Rn, se obţin datorită diferenţelor existente între P1, P2, P3, ... Pn. În
acest fel putem studia diferenţele dintre indivizi, dar putem compara şi reacţiile unor grupuri diferite, în
funcţie de anumite caracteristici ca: vârsta, sexul, etnia, nivelul cultural etc. În cel de al doilea caz putem
pune în evidenţă unele aspecte ale personalităţii, comune în diferite grade, tuturor subiecţilor care aparţin
unui grup selectat pe baza unor criterii dinainte stabilite.

EXEMPLU
Putem studia variaţiile eficienţei subiecţilor în diferite domenii de activitate în funcţie de experienţa
profesională a acestora, evoluţia percepţiilor în funcţie de vârstă şi sex, asemănările şi deosebirile de
mimică emotivă la populaţii care aparţin unor culturi diferite.

Acest tip de relaţie este folosit atât în cazul experimentului cât şi în cel al testului psihologic, dar
cele două aspecte nu sunt identice.

IMPORTANT
În situaţia experimentală, P1, P2, P3, ... Pn, este aceiaşi persoană în stări diferite. Situaţiile interne,
subiective pot fi diferite. De asemeni dacă sunt ingerate anumite substanţe(stimulatoare, deprimante,
droguri), reacţiile sunt determinate de acestea.

În cazul testului P1, P2, P3, ... Pn, sunt persoane diferite. Din aceasta cauză nu mai avem aceeaşi
certitudine în stabilirea relaţiilor dintre fapte şi nici atunci când interpretăm rezultatele, deoarece situaţia
este interpretată diferit de fiecare persoană. În cadrul relaţiilor S  P, necunoscând perfect persoana nu
putem şti care din factorii care acţionează asupra lui P1 determină R1 şi care din factorii care acţionează
asupra lui P2 determină R2. Dacă R1 şi R2 pot fi răspunsuri aproape identice P1 şi P2 sunt subiecţi foarte
diferiţi.

129
CORNELIU-EUGEN HAVÂRNEANU

În concluzie, între experiment şi test există o deosebire de precizie, testul fiind mai puţin precis
decât experimentul. Totuşi, testul rămâne o formă de experiment, pentru că provocăm o reacţie în condiţii
bine determinate ţi obţinem reacţii în aceste condiţii. Şi în cazul experimentului, chiar dacă aceste se
adresează aceloraşi subiecţi, starea acestora se poate modifica, subiecţii îşi pot schimba atitudinea şi pot
interveni factori care ne scapă de sub control. Pentru a evita erorile, în cazul experimentului vom folosi
grupe de subiecţi, şi în acest fel vom putea verifica dacă rezultatele sunt datorate stimulului şi nu
subiectivităţii subiecţilor. Condiţia care se impune pentru precizie, este ca subiecţii să fie echivalenţi.

3. DEFINIREA TESTELOR

Termenul a fost introdus în psihologie de James McKeen Cattell, psiholog american, elev a lui
Wundtt, care în 1890 denumeşte probele destinate cunoaşterii deosebirilor dintre indivizi "teste",
denumire care s-a păstrat şi astăzi (în engleză "test" înseamnă probă, încercare, experimentare).

DEFINIŢIE
Lee Cronbach, defineşte testul ca un "procedeu sistematizat de măsură a comportamentului unor
persoane şi de descriere a acestuia cu ajutorul unor scări numerice sau a unui sistem de categorii", (scări
nominale sau ordinale). Pe baza acestei definiţii testul cuprinde chestionarele, procedee pentru
observarea comportamentului social, aparate pentru măsurarea şi înregistrarea randamentului.
Pentru André Rey, "testul este un mijloc de a diferenţia indivizii în funcţie de un etalon", iar Anne
Anastasi (1976) consideră că "un test psihologic este măsurarea standardizată şi obiectivă a unei
modalităţi de comportament".
Asociaţia internaţională de psihotehnică şi Henri Piéron (1963) definesc testul "o probă
determinată, implicând o sarcină de executat, identică pentru toţi subiecţii examinaţi. Este o tehnică
precisă pentru aprecierea succesului sau pentru notarea numerică a reuşitei". Definiţia scoate în evidenţă
două aspecte importante: folosirea unei probe standardizate şi a unei tehnici exacte de apreciere a
rezultatelor.
P. Pichot observă că aceste definiţii elimină o categorie importantă de "teste" şi anume "testele"
proiective. După el, "testul psihologic este o situaţie standardizată servind drept stimul unui
comportament. Acest comportament este evaluat şi comparat statistic cu cel al altor indivizi plasaţi în
aceeaşi situaţie, ceea ce permite clasarea subiectului fie cantitativ, fie tipologic". În legătură cu "testele"
proiective", în literatura de specialitate se întâlneşte termenul de "tehnică proiectivă", deoarece aceste
"teste" nu sunt suficient de standardizate, mai ales în privinţa aprecierii şi interpretării rezultatelor. Acesta
este motivul care justifică eliminarea acestora din categoria testelor şi folosirea termenului de tehnică,
tocmai pentru a evidenţia specificul lor.
Ion Holban (1978), defineşte testul ca "instrument al metodei experimentale, organizat sub forma
unei probe standardizate din punct de vedere al conţinutului, al condiţiilor de aplicare şi al modalităţilor
de apreciere a rezultatelor, instrument ce este folosit în stabilirea unei anumite variabile". Autorul face
câteva observaţii importante referitoare la specificul acestor instrumente de cunoaştere. Testul impune
existenţa unei relaţii directe şi specializate între itemii testului şi variabilele de investigat. Orice test are
valoare numai în limitele diagnosticului variabilei pentru care a fost elaborat. Această relaţie nu este şi
inversă, adică pentru aceeaşi variabilă putem găsi un număr considerabil de teste, mai mult sau mai puţin
apropiate ca structură. De exemplu, multe teste de inteligenţă au fost construite după principiile şi modelul
testului elaborat de Binet, cărora li s-a schimbat, după caz, diferite categorii de itemi.
Andrei Cosmovici, (1996), defineşte testul ca "o probă standardizată, vizând determinarea cât
mai exactă a gradului de dezvoltare a unei însuşiri psihice sau fizice". Observăm, şi în acest caz accentul

130
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

care se pune în legătură cu standardizarea, dar şi determinarea cu ajutorul testelor o performanţelor de


care sunt capabile unele persoane datorită calităţilor fizice pe care le posedă.

IMPORTANT
În psihologie, termenul "test" are două sensuri:
a. Este o probă standardizată din punct de vedere al consemnului (explicarea sarcinilor de efectuat) şi a
modului de corectare, cotare şi interpretare a rezultatelor, acestea fiind fixate dinainte pentru a evita
eventualele variaţii care se pot datora persoanei care aplică, corectează şi interpretează testul.
b. Este o micro - situaţie, o simulare a unor caracteristici bine definite, în care vom plasa o persoană cu
scopul de a studia modul în care aceasta procedează în raport cu situaţia. Micro - situaţia reprodusă
trebuie să fie cât mai apropiată de situaţia reală din care a fost extrasă. Roger Mucchielli (1969),
consideră că un simulator este "un dispozitiv care reproduce, dup reguli şi garanţii bine precizate un
ansamblu de condiţii reale ale existenţei". Alţi autori, printre care Sorokin, Whyte (adversari ai metodei
testelor), susţin că singura probă valabilă este realitatea muncii, dacă vrem să judecăm capacităţile
unui subiect. Dar ei nu amintesc de faptul că această manieră de confruntare cu realitatea muncii este
o problemă foarte dificilă, care presupune consumuri considerabile de timp şi material, iar evaluarea
rezultatelor cere observaţii de lungă durată. Acestea sunt motivele care justifică utilitatea folosirii unor
micro - situaţii.

În acest fel, cu ajutorul testului se va extrage dintr-o situaţie concretă, reală un eşantion de condiţii
sau factori, consideraţi semnificativi pentru un anumit tip de comportament, ignorând aspectele
neesenţiale.

X1 X2 X3 X4 Y1 Y2
Y3
X5 X6 X7 X8

Yn-1 Yn
Xm-1 Xm

SITUAŢIA REALĂ SITUAŢIA TEST

EXEMPLU
Dacă vrem să cunoaştem capacitatea de abstractizare a unui subiect, atunci în vom cere să rezolve o
serie reprezentativă de sarcini de abstractizare, urmărind să extragem cât mai multe eşantioane de
conduită reprezentative pentru operaţia de abstractizare. Răspunsurile subiectului vor avea valoare
diagnostică dacă există o legătură reală între răspunsurile acestuia în situaţia experimentală (rezultatele
la test) şi conduita subiectului în situaţii concrete de viaţă. Dacă constatăm o strânsă legătură între
performanţa obţinută în rezolvarea sarcinilor la test şi capacitatea reală de abstractizare a subiectului,
atunci putem trage concluzia că testul are utilitate practică.

Constatăm că testul este o situaţie experimentală controlată, variabilele lui esenţiale trebuie să
fie dinainte cunoscute de examinator. Prin natura sa, testul tinde să reproducă, în condiţii artificiale,
condiţiile unei situaţii reale. În acest fel el devine o micro - situaţie tipică, simulată. Valoarea "simulatoare"
a testului va depinde de analiza situaţiei reale, de definirea variabilelor situaţiei reale şi a modului de

131
CORNELIU-EUGEN HAVÂRNEANU

interacţiune a acestor variabile. Aceasta implică, cunoaşterea structurii funcţionale a situaţiei şi


reproducerea, sub forma unui test a conţinutului psihologic a structurii funcţionale a situaţiei identificate.
Testul nu trebuie să piardă din vedere nici o variabilă esenţială a situaţiei concrete. În acest caz testul nu
este nici analitic, nici sintetic, ci analog cu situaţia reală, în sensul că modelează conţinutul psihologic al
activităţii reale, dar nu şi forma exterioară a acesteia.
În concluzie, deosebirile exterioare, de formă, între sarcina test şi sarcina reală, ascund mereu o
identitate internă, de conţinut sau de natură psihologică. Modalitatea de rezolvare a acestei probleme
este fundamentală pentru valoarea constructivă şi diagnostică a unui test (Roger Mucchielli, 1969).

IMPORTANT
Pentru a evita unele confuzii, este necesar să facem distincţia dintre teste şi chestionare. Reprezentanţii
şcolii germane definesc chestionarele ca fiind "teste subiective". Această atitudine este justificată de faptul
că precizia chestionarelor este mult mai mică, din cel puţin două motive. În primul rând, răspunsurile
obţinute cu ajutorul acestor instrumente sunt dezirabile, subiecţii au tendinţa de a face o bună impresie,
de a răspunde aşa cum cred ei că este bine şi nu aşa cum sunt în realitate. În al doilea rând, bazându-se
pe introspecţie (care este de fapt o retrospecţie), intervine uitarea, ceea ce face ca multe aspecte
esenţiale să fie neglijate.

Prin utilizarea testelor aceste limite sunt înlăturate, acesta fiind un instrument mult mai precis.
Distincţia esenţial - neesenţial este mai tranşantă în cazul testelor şi dispare posibilitatea de a măsura
aparenţele. Diferenţierile dintre persoane, evidenţiate cu ajutorul testelor, sunt esenţiale dacă
demonstrăm constanţa acestora. Testul este un instrument valoros dacă predicţia pe care o facem cu
ajutorul lui este pertinentă, adică dacă se referă la comportamente care persistă la un individ.

4. CLASIFICAREA TESTELOR

Testele ca mijloace de psihodiagnostic s-au dezvoltat într-un ritm accelerat, utilizându-se în


prezent, în practica psihologică peste 10.000 de teste, astfel încât este dificilă realizarea unei clasificări
care să surprindă cele mai sensibile diferenţe pe baza criteriilor care se iau în consideraţie pentru o
clasificare generală. Există în literatura psihologică numeroase clasificări ale testelor:
După paradigma teoretică la care aderă: reprezentanţii şcolii experimentaliste, care
descompun personalitatea în părţi componente, apelează la teste "sectoriale" folosind analiza factorială
şi metode metrice precise, în timp ce psihologii clinicieni, încearcă să cuprindă ansamblul personalităţii
cu ajutorul testelor holostice, folosind sau nu indicatori numerici.
După aspectul psihologic investigat: găsim teste intelectuale, care vizează cunoaşterea
proceselor cognitive (percepţie, memorie, capacitate de analiză şi sinteză etc.), teste de personalitate,
care vizează aspectul afectiv-atitudinal.
Această clasificare grupează pe de o parte testele intelectuale, care sunt metrice, iar pe de altă
parte testele de personalitate, care sunt analitice (chestionarele) sau holistice (testele proiective).
După gradul de standardizare și cuantificare, putem diferenția între teste psihometrice (în
cadrul cărora evaluare se produce numeric și prin raportarea la norme) și teste nepsihometrice (care fac
apel în emiterea concluziilor la virtuțile clinice de exprimare). În concepția lui Gustav A. Lienert, rezultatele
unui test psihometric (denumit de către acesta și test standardizat sau etalonat) capătă semnificație
cantitativă prin raportare la rezultatele unui grup de referință, numit și grup normativ, după ce au fost
create și anumite sisteme de etalonare. Testele informale, sau cele nepsihometrice, sunt destinate uzului
personal al psihologilor și al profesorilor, care își propun, de exemplu, să claseze doar membrii unei
singure clase cu care lucrează frecvent.

132
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

După modul de prezentare: testele pot fi orale, răspunsul subiectului se dă sub formă verbală,
teste scrise (numite creion - hârtie), teste instrumentale, la care se utilizează un suport concret (material
sau un aparat), teste informatizate, aplicate cu ajutorul computerului.
După modul de aplicare: teste individuale şi teste de grup. Testul individual are dezavantajul de
a aloca un timp de aplicare crescut pentru un singur subiect, dar are avantajul că oferă posibilitatea de a
observa mai bine reacțiile particulare în timpul examinării. Testul colectiv are ca principal avantaj
economia temporală a examinării și ca dezavanataj observarea ineficientă a subiectului.
După timpul alocat pentru răspuns: teste cu timp liber şi teste cu timp limitat.
După scopul urmărit (P. Pichot) distinge: teste de eficienţă, care măsoară o aptitudine sau o
capacitate, şi teste de personalitate prin care se urmăreşte explorarea fondului psihologic intim,
determinarea aspectelor motivaţionale, ale caracterului accentul fiind pus pe interpretarea calitativă a
datelor obţinute.
În funcție de utilizarea formei verbale de exprimare în producere răspunsului la situația de
test, putem distinge între teste verbale (care depind, de cele mai multe ori, de nivelul de cultură a
subietcului) și teste nonverbale (care nu depind de niivelul de cultură, fiind create special pentru a
contracara influența acestui factor).
În funcție de numărul de dimensiuni cuprinse în destinația psihodiagnostică a testului deosebim
între testele unidimensionale și testele multidimensionale. Acest criteriu se poate reformula în clasificare
testelor singulare (care posedă o singură componentă) și a bateriilor de teste. Exigențele în privința
realizării unidimensionalității unui instrument de investigație psihodiagnostică sunt foarte ridicate,
deoarece faptul psihic se află, prin esență, în interdependență.
În funcție de gradul de structurare a configurațiilor reacțiilor care provoacă comportamentul
analizat, putem discuta despre teste înalt structurate și teste slab structurate. În cele slab structurate,
stimularea nu este dată sub forma unei solicitări ce presupune o formă de răspuns dihotomică sau
polihotomică, ci sub o formă care impune un efort din partea subiectului de structurare a răspunsului.

Anna Anastasi propune următoarea clasificarea testelor, din punct de vedere a conținutului:
1. Teste de dezvoltare intelectuală generală
2. Teste de aptitudini individuale
2.1. Măsurarea aptitudinilor multiple
2.2. Teste de aptitudine speciale
2.3. Teste educaționale
2.4. Teste ocupaționale
3. Teste de personalitate
3.1. Inventare de autoraportare
3.2. Măsurare a intereselor și atitudinilor
3.3. Tehnici proiective
3.4. Alte tehnici pentru evaluarea personalității

Cronbach distinge între următoarele tipuri de teste:


1. Teste de capacitate (teste de performanță maximă)
1.1. Măsurarea capacității mentale generale
1.2. Măsurarea capacităților speciale
1.3. Teste de aptitudini
1.4. Teste de achiziție
1.5. Teste de expertiză
2. Teste de performanță tipice
2.1. Observații comportamentale
2.2. Procedee de autoraportare

133
CORNELIU-EUGEN HAVÂRNEANU

În schimb, Gustav Lienert (1961) propune o clasificare a testelor, acceptată și folosită de către
numeroși psihologi:
1. Teste de inteligență
1.1. Teste de inteligență generală
1.2. Teste speciale de inteligență
2. Teste de randament
2.1. Teste de randament motrice
2.2. Teste de randament senzoriale
2.3. Teste de randament psihic
3. Teste de personalitate
3.1. Teste de caracateristici
3.2. Teste de interese
3.3. Teste de dispoziții
3.4. Teste de caracter
3.5. Teste pentru stabilirea tipului de personalitate
O clasificare în detaliu a testelor psihologice este utilă şi eficientă din punct de vedere practic. În acest
fel putem distinge următoarele categorii de teste:
 teste de inteligenţă şi dezvoltare mintală, care măsoară aptitudinea cognitivă generală şi nivelul atins
în dezvoltarea caracteristicilor intelectuale;
 teste de aptitudini şi capacităţi, care au fost elaborate pentru măsurarea aptitudinilor de grup şi
specifice;
 teste de personalitate, care măsoară însuşiri de temperament şi caracter, acestea fiind împărţite în
două categorii:
1. teste obiective de personalitate, care-şi propun obţinerea unor date cuantificabile, cât mai puţin
influenţate de interpretările subiective şi evitarea tendinţei de faţadă a subiecţilor în momentul
elaborării răspunsului, deoarece aceştia nu conştientizează aspectele personalităţii vizate de test;
2. tehnici proiective, care valorizează mecanismul de proiecţie în cunoaşterea psihologică a
persoanei, trecând peste vigilenţa conştiinţei în încercarea de a studia inconştientul;
 teste de cunoştinţe sau docimologice, care măsoară nivelul cunoştinţelor acumulate de subiecţi şi
servesc ca modalitate de examinare şi notare.

TEST DE AUTOEVALUARE
1. Testul trebuie să fie analog cu situația reală.
a.ADEVĂRAT
b.FALS
2. Un chestionar este mai precis decât un test
a.ADEVĂRAT
b.FALS
3. Personalitatea se manifestă ca un nod de relaţii între situaţii şi răspunsuri.
a.ADEVĂRAT
b.FALS
4. Între test și chestionar există o diferență de standardizare.
a.ADEVĂRAT
b.FALS
5. Diferenţierile dintre persoane, evidenţiate cu ajutorul testelor, sunt esenţiale dacă demonstrăm
constanţa acestora.
a.ADEVĂRAT

134
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

b.FALS
6. În relație cu situația reală testul trebuie să fie sintetic.
a.ADEVĂRAT
b.FALS
7. Testul este un instrument valoros dacă predicţia pe care o facem cu ajutorul lui este pertinentă.
a.ADEVĂRAT
b.FALS
8. Analogia dintre test și situația reală este o analogie de formă.
a.ADEVĂRAT
b.FALS
9. Germanii definesc chestionarele ca fiind teste subiective.
a.ADEVĂRAT
b.FALS
10. Între test și chestionar există o diferență de formă.
a.ADEVĂRAT
b.FALS
11. Între sarcina test şi sarcina reală trebuie să existe o identitate internă de conţinut.
a.ADEVĂRAT
b.FALS
12. În relație cu situația reală testul trebuie să fie analitic.
a.ADEVĂRAT
b.FALS
13. Analogia dintre test și situația reală este o analogie de conținut.
a.ADEVĂRAT
b.FALS
14. Între test și chestionar există o diferență de precizie.
a.ADEVĂRAT
b.FALS
15. Răspunsurile dezirabile reprezintă o limita importantă a tetelor.
a.ADEVĂRAT
b.FALS
16. Distincţia esenţial - neesenţial este mai tranşantă în cazul testelor şi dispare posibilitatea de a măsura
aparenţele.
a.ADEVĂRAT
b.FALS

135
CORNELIU-EUGEN HAVÂRNEANU

Unitatea de învățare 4.
FIDELITATEA TESTELOR

Valoarea oricărui instrument de cunoaştere psihologică depinde de calităţile acestuia.

CITAT
R. Zazzo, în prefaţa la "Manuell pour l'examen psychologique de l'enfant" (1969), face câteva
reflecţii asupra metodei testelor din care cităm:
"Practicarea metodei testelor ridică o mulţime de probleme, unele create cu totul de prejudecăţile
şi ignoranţa unor oameni care vorbesc despre asta fără să ştie mare lucru, altele într-adevăr reale,
întâlnite şi rezolvate de bine de rău de către cei care construiesc testele şi le utilizează...
Un test nu este, de fapt, aşa cum cred adesea profanii, un dispozitiv misterios care ne informează
în mod automat şi infailibil despre facultăţile misterioase al căror nume scapă psihologiei comune.
Se confundă standardizarea probei cu un pretins automatism de aplicare. Se confundă, de
asemenea, natura insolită a anumitor factori la care încearcă să ajungă testele cu natura însăşi a metodei:
ca şi cum un test de ortografie nu ar indica natura acestei metode la fel de clar ca un test al factorului G,
de exemplu.
Se confundă, în sfârşit, precizia măsurărilor obţinute cu o afirmare a fixităţii pentru lucrul măsurat:
ca şi cum temperatura citită astăzi pe un termometru ar fixa febra la un nivel definitiv."

IMPORTANT
Vom sublinia faptul că orice instrument de cunoaştere psihologică trebuie utilizat ţinând seama de limitele
valorii sale diagnostice şi prognostice. Din această cauză psihologul trebuie să cunoască în amănunt
aceste calităţi înainte de a-l folosi pentru cunoaşterea psihologică a persoanei în diferite scopuri.

În acest capitol vom prezenta cele mai importante calităţi ale testelor: fidelitatea, validitatea şi
standardizarea.

1. DEFINIREA FIDELITĂŢII

Există frecvent credinţa eronată că testul ar măsura toate aspectele cuantificabile ale conduitelor
sau reacţiilor umane. În realitate testul extrage, din variaţiile teoretic infinite ale conduitelor subiectului,
un număr limitat de eşantioane de conduită, pe care le măsoară, oferind o imagine lacunară asupra
conduitei reale a persoanei testate.

Inconstanța măsurării
Se observă că testarea repetată a unei persoane cu aceeaşi probă, sau cu probe paralele duce
la obţinerea unor rezultate fluctuante, la o variaţie mai mult sau mai puţin accentuată.
Scorurile obţinute la testele psihologice provin din răspunsurile date de diferiţi subiecţi. Una din
caracteristicile comportamentului uman este că acesta se modifică în timp, aspect care ne face să ne
preocupe constanţa scorurilor. Eşantionarea itemilor, circumstanţele particulare de administrare
a testului şi caracteristicile subiecţilor determină inconstanţa în măsurare. Măsurările fizice sunt în
general stabile, iar diferenţele dintre scoruri sunt uşor de explicat, ceea ce nu se întâmplă în cazul
măsurătorilor psihologice, la care scorurile sunt influenţate de condiţii exterioare.

136
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

Consistența internă
Teoria preciziei testului (termen generic pentru desemnarea studiului consistenţei interne) este
importantă prin două probleme fundamentale:
Prima constă în gradul de consistenţă a rezultatelor, şi se referă la relaţia între scorurile
obţinute în diferite situaţii de aplicare a testelor; iar a doua la cauzele diferenţelor observate între
scoruri, deci a cunoaşte factorii care determină scorurilor inconstante şi importanţa efectului lor.

IMPORTANT
Caracterul inconsecvent al rezultatelor brute ridică problema fidelităţii instrumentului care în esenţă ridică
trei probleme:
a. Cât de variabile, de fluctuante sunt rezultatele subiectului de la o măsurare la alta?
În această situaţie fidelitatea constă în stabilitatea rezultatelor în timp şi în consecinţă în predictibilitatea
lor.
b. Valorile obţinute la o probă sunt adevăratele valori ale aspectului psihologic măsurat?
Diferenţele interindividuale, constatate în privinţa cotelor obţinute la test, pot fi explicate prin diferenţe
reale dintre subiecţi?
În această situaţie fidelitatea se referă la acurateţea, precizia cu care testul măsoară ceea ce şi-a propus
să măsoare.
c. Cât de mare este eroarea de măsurare (totalul erorilor întâmplătoare) a testului?
În această situaţie fidelitatea se referă la absenţa relativă a erorilor de măsurare.

Teoria clasică a testelor furnizează elementele de bază, necesare pentru rezolvarea acestei
probleme. Ea se bazează pe câteva postulate, definiţii şi relaţii.
După teoria clasică a testelor toate scorurile observate (X) sunt compuse din două părţi: un scor
adevărat (A) şi un scor eroare (E). Această relaţie poate fi reprezentată sub forma ecuaţiei: X = A + E
Se pune însă problema sensului pe care îl dăm scorului observat.

DEFINIŢIA SCORULUI ADEVĂRAT


Acest concept poate fi definit în mai multe feluri.
(1) Îl putem considera ca un scor obţinut cu un test perfect, deci un test care măsoară fără eroare.
De fapt, dacă putem efectua măsurări fără eroare, toate scorurile observate pot fi considerate ca
adevărate. Acest lucru este imposibil deoarece întotdeauna există un gard de eroare.
(2) Există şi o altă manieră de înţelegere a scorului adevărat. Lord şi Novick (1968) dau o altă
definiţie scorului adevărat elaborând postulatele de bază şi relaţiile dintre scorurilor adevărate şi eroare.
Scorul adevărat al unui subiect (s) obţinut cu un instrument dat (i) este definit ca valoarea
aşteptată a scorului observat:
Asi =  Xis
unde: Asi este o constantă, Xis este o variabilă oarecare, iar  este valoarea aşteptată.
Deci, scorul aşteptat al unui subiect (s) obţinut cu instrumentul (i) este valoarea aşteptată () a
răspunsului la instrumentul (i) dat de subiectul (s).
O altă manieră de exprimare a relaţiei dintre un scor adevărat şi un scor observat, constă în a
descrie scorul adevărat ca fiind scorul mediu a unui subiect pentru un număr infinit de utilizări a aceluiaşi
instrument de măsură.

DEFINIŢIA ERORII

137
CORNELIU-EUGEN HAVÂRNEANU

Un alt concept important în teoria clasică a testelor este cel de eroare (E). Eroarea poate fi
definită ca fiind diferenţa dintre scorul adevărat şi scorul observat:
Esi = Xis - Asi
Acest tip de eroare este datorată hazardului ceea ce exclude toate sursele sistematice de variaţie a erorii.
După aceste constatări putem apela la calcularea mediei şi a varianţei pornind de la relaţia iniţială
şi prin calcule vom obţine:
X m  Am
Media scorurilor observate este egală cu media scorurilor adevărate.
Termenul Em, dispare din ecuaţie când valorile aşteptate ale erorilor (variabile aleatoare) tind spre
zero. În consecinţă, efectele erorilor au tendinţa să se anuleze dacă numărul de observaţii tinde spre
infinit.
Aceeaşi procedură poate fi aplicată şi pentru varianţă şi vom obţine:
S2X = S2A + S2E atunci când erorile tind spre zero
Acesta este o ecuaţie fundamentală care are o mare importanţă pentru că ne permite să
construim o definiţie simplă şi interesantă a fidelităţii unui test.
Un postulat important a acestei teorii este că scorurile adevărate şi scorurile eroare nu sunt în
corelaţie, adică rAE = 0.
Se postulează de asemenea că scorurile eroare la diverse măsurări nu sunt în corelaţie, adică r E1E2 = 0.

DEFINIŢIE
FIDELITATEA CA RAPORT DE VARIANȚĂ
Este suficient să utilizăm egalitatea fundamentală pentru definirea fidelităţii:
S2X=S2A + S2E
Dacă împărţim fiecare din aceste elemente prin aceeaşi cantitate S2X, adică varianţa rezultatelor
observate, vom obţine:
S 2 X S 2 A S 2E S 2 A S 2E
  adică 1   unde
S 2X S 2X S 2X S 2X S 2X
S 2A
este proporţia varianţei observate care provine din varianţa adevărată
S2X
S 2E
este proporţia varianţei observate care provine din varianţa eroare.
S2X
S 2A
Precizia poate fi definită ca fiind un raport de varianţă: rXX 1  , unde rXX desemnează
1
2
SX
coeficientul de fidelitate, adică proporţia varianţei observate care provine din varianţa adevărată.
2
Sau putem scrie formula sub forma rXX 1  1  S 2E , adică unu minus proporţia varianţei observate care
SX
provine din varianţa eroare.

138
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

EXEMPLU
Relaţia care există între cele trei varianţe poate fi reprezentată sub forma:

(1) S2A S2E

(2) S2E S2A

Unde cazul (1) arată un raport de fidelitate mai mare decât cazul (2).
Coeficientul de fidelitate corespunde unui raport de varianţă şi poate lua valori între 0 şi 1, deci numai
valori pozitive. Ecuaţia următoare reflectă bine acest lucru.:
S 2E
rXX  1  2
1

S X
Dacă varianţa eroare (S2E) este maximă, ea este egală cu varianţa observată a testului (S 2X). În
acest caz, putem spune că varianţa observată este dată numai de erori şi coeficientul de fidelitate este
nul. Fidelitatea este certitudinea că un test măsoară scorurile adevărate, iar coeficientul de fidelitate dă
gradul de fidelitate.

Putem stabili un raport între scorurile adevărate şi scorurile observate. Dacă luăm în consideraţie
deviaţia scorurilor de la medie prin calcul vom obţine:
rXA  rXX
1

Corelaţia dintre scorurile adevărate şi scorurile observate este egală cu rădăcina pătrată a coeficientului
de fidelitate.

2. EROAREA STANDARD DE MĂSURARE

Variabilitatea scorurilor observate SX, poate să fie cunoscută direct, existând procedee pentru a
estima coeficientul de fidelitate. Dacă notăm (SE, abaterea standard a erorilor şi cu S2E varianţa erorilor),
pe baza acestor parametri putem rezolva o problemă practică.
S 2A
S2E = S2X - S2A , dar rXX  2 deci S 2 A  S 2 X rXX
1 1

S X
S2E = S2X -S2X rXX1 = S2X (1 - rXX1) S E  S X 1  rXX
1

SE este denumită eroarea standard de măsurare sau eroarea probabilă.


SE reprezintă eroarea aleatoare care nu poate fi eliminată din măsurare, dar trebuie luate măsuri
pentru a o reduce cât mai mult. Vom spune că măsurarea este fidelă sau precisă în măsura în care există
cât mai puţine erori posibile sau valoarea SE este cât mai mică posibil. Teoretic eroarea este nulă.
Noţiunea de fidelitate presupune reproducerea scorurilor, adică posibilitatea de a obţine aceleaşi
rezultate de la aceiaşi subiecţi, în aceleaşi condiţii dar, în ocazii diferite, cu teste care măsoară aceiaşi
trăsătură.
Teoria clasică a testelor este o soluţie pe care o putem aplica la teoria erorilor de măsurare. Se
precizează că pentru un scor adevărat dat, mai multe măsurări echivalente ale aceleiaşi trăsături în
aceleaşi condiţii este un mijloc pentru o bună aproximare. Scorurile obţinute se distribuie simetric
deasupra şi dedesubtul scorului adevărat. Distribuţia erorilor aleatoare se repartizează normal şi se
aşteaptă o distribuţie a scorurilor observate în scorului adevărat. Să presupunem că dispersia erorilor
este aceiaşi pentru fiecare subiect iar abaterea standard a erorilor poate să fie cunoscută sau estimată.
Aceasta se numeşte eroarea standard de măsurare: S E  S X 1  rXX
1

139
CORNELIU-EUGEN HAVÂRNEANU

IMPORTANT
Problema măsurării constă în a determina această eroare, pe care trebuie să s-o eliminăm, cât mai mult
posibil, pentru a controla factorii care influenţează scorurile observate.

EXEMPLU
Dacă SE = 1,3, rXX1 =0,60 şi SX = 2,00, atunci pe baza acestor date putem interpreta un rezultat observat
în funcţie de eroare şi putem determina limitele între care se poate situa rezultatul adevărat al subiecţilor
care au acelaşi rezultat observat.
Astfel:
X - 1SE < A < X + 1SE pentru o probabilitate de 0,68
X - 2SE < A < X + 2SE pentru o probabilitate de 0,95
X - 3SE < A < X + 3SE pentru o probabilitate de 0,99
Dacă X = 7 atunci avem:
7 - 1,3 < A < 7 + 1,3
7 - 2,6 < A < 7 + 2,6
7 - 3,9 < A < 7 + 3,9 adică 3,1 < A < 10,9
Aceasta înseamnă că pentru un rezultat observat 7, rezultatele adevărate pot fi situate între 3,1
şi 10,9, cu o probabilitate de 99,7%.

3. SURSELE ERORILOR DE MĂSURARE

Pentru a putea diminua pe cât posibil erorile de măsurare este important să cunoaştem sursele
de eroare. O variabilă produce erori dacă nu este validă şi dacă se obţin rezultate inconstante atunci când
se fac mai multe măsurări.

IMPORTANT
Există trei surse principale de eroare:
1. erori produse de testul însuşi;
2. erori legate de condiţiile de aplicare a testului;
3. erori legate de subiecţii care răspund la test.

Prima categorie cuprinde factori controlabili ca: eşantionarea itemilor, dacă testul presupune
măsurarea unei trăsături foarte precise, ambiguitatea enunţurilor, imprecizia instrucţiunilor în legătură cu
maniera de răspuns, o limită de timp neadecvată. Toate acestea determină răspunsuri date la întâmplare,
ceea ce duce la o instabilitate a răspunsurilor şi o reducere a fidelităţii testului.
A doua categorie se referă la procedeele de prezentare a testului. Dacă aceste procedee sunt
standard riscurile de eroare sunt scăzute. Lipsa de experienţă a grupului testat, neobişnuinţa subiecţilor
de a răspunde la teste poate fi un factor de eroare. Lipsa de concentrare a subiecţilor, erorile de redactare
a instrucţiunilor şi deficienţele de cronometrare, sunt erori care fac parte din această categorie.
Aceste două categorii conţin surse de eroare uşor de controlat, faţă de cele din a treia categorie,
unde sursele de eroare depind de subiecţi. Psihologii au evidenţiat multe surse de eroare de acest tip.

140
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

Aici le vom menţiona pe cele mai importante ca: motivaţia, obişnuinţa cu testarea, anxietatea, diferenţele
de învăţare şi variabile de natură fiziologică.
Există erori de măsurare dacă subiecţii examinaţi sunt motivaţi diferit. Dacă condiţiile de aplicare
a testului se modifică de la o aplicare la alta atunci trebuie să ne aşteptăm şi la o modificare a rezultatelor.
Testele de randament sunt afectate de aceste erori.
Se postulează că subiecţii au o experienţă echivalentă indiferent de procedeul utilizat şi maniera
de testare. Tot timpul, două situaţii indezirabile, care introduc erori de măsurare, pot să apară. Pe de o
parte, lipsa de experienţă a unor subiecţi, se materializează în incapacitatea acestora, mai mare sau mai
mică, de o obţine un randament ridicat, situaţie în care scorul nu reflectă gradul de prezenţă a trăsăturii
măsurate. Pe de altă parte, sunt persoane care au experienţă în rezolvarea testelor şi obţin un randament
ridicat, fapt care de asemenea nu este în concordanţă cu nivelul trăsăturii măsurate. Aceste două situaţii
determină erori de măsurare şi diminuează fidelitatea.
Multe persoane manifestă o oarecare nervozitate atunci când sunt testate. Există o marjă de
încredere, justificată sau nu, faţă de gradul prezenţei trăsăturii măsurate, care determină stări de
anxietate. Anxietatea afectează randamentul şi reduce punerea în valoare a posibilităţilor subiectului.
Un alt factor de eroare este legat de variabile fiziologice. Acest factor este inevitabil când acestea
sunt imprevizibile.

DEFINIŢIE PE BAZA CONSISTENȚEI INTERNE


Fidelitatea unui instrument de măsură se defineşte ca fiind corelaţia sau coeficientul de
concordanţă între două teste paralele sau două teste paralele la care eşantionul de itemi a fost extras din
aceeaşi populaţie de itemi. Indicele obţinut este un coeficient de corelaţie între măsurări care dau acelaşi
scor adevărat pentru fiecare subiect. Acest indice arată precizia cu care un item ne permită să măsurăm
o caracteristică. De asemenea, coeficientul de corelaţie la pătrat indică proporţia varianţei între două
măsurări.
S 2A
rXX1 = r2XA = 2
S X

Putem afirma, pe baza definiţiei fidelităţii, că acest coeficient indică proporţia din varianţa totală
care rezultă din diferenţele dintre scorurile adevărate. Din aceste diferenţe rezultă de fapt adevăratele
diferenţe dintre indivizi.
Acest coeficient este un indicator al inconstanţei erorilor, care are valoare minimă dacă testele
sunt într-adevăr paralele. El este denumit coeficient de precizie. Mulţi cercetători, printre care şi Lord şi
Novik (1968), au demonstrat că procedeele standard care servesc la estimarea coeficientului de fidelitate
şi la varianţa erorilor unui test presupun cel puţin două măsurări (scoruri) pentru fiecare subiect şi că
precizia estimării creşte o dată cu numărul acestor măsurări.
Varianţa erorii pentru un anumit subiect S2Esx presupune cel puţin două măsurări şi precizia creşte
o dată cu numărul observaţiilor asupra persoanei măsurate. Deşi coeficientul de precizie nu este nici
foarte pertinent şi nici foarte practic, el constituie totuşi un indice al gradului de imprecizie care poate fi
atribuit viciilor de formă sau de procedură.
Dacă itemii testelor paralele sunt extraşi din aceeaşi populaţie de itemi, coeficientul de fidelitate
indică gradul de certitudine cu care poate fi măsurată o trăsătură, chiar dacă s-a folosit doar un eşantion
de itemi din populaţia respectivă. În acest fel, mai multe eşantioane aleatoare, cu acelaşi număr de itemi,
pot să constituie teste paralele şi permit să se obţină mai mulţi coeficienţi de corelaţie. Media lor este cea
mai bună estimare a coeficientului de corelaţie aşteptat pentru testele paralele cu aceeaşi lungime,
eşantionate aleator. Numărul de itemi şi gradul de omogenitate al populaţiei de itemi, adică gradul în care
măsoară aceeaşi variabilă, sunt doi factori care determină această medie.

141
CORNELIU-EUGEN HAVÂRNEANU

IMPORTANT
Coeficientul care indică gradul legăturii între testele paralele, formate din eşantioane alese
aleator, este denumit coeficient de consistenţă internă. În practică testele nu satisfac exigenţele
testelor strict paralele, cu toate că în ansamblu ele măsoară acelaşi scor adevărat şi corelaţia între teste
este pozitivă. Coeficientul de fidelitate, cunoscut ca fiind corelaţia dintre teste paralele, este afectat de
varianţa proprie a fiecărui test.

4. METODE DE ESTIMARE A FIDELITĂŢII

4.1. Metoda testelor paralele

DEFINIŢIE
Această metodă constă în calcularea corelaţiei între două forme ale aceluiaşi test format din itemi
diferiţi. Ea dă o aproximare a gradului de echivalenţă între teste atunci când le aplicăm aceluiaşi grup de
subiecţi la un interval scurt de timp.

Acest tip de coeficient este mai fiabil decât coeficientul de precizie deoarece el indică corelaţia
dintre două forme aproape paralele. Imprecizia de măsurare şi varianţa adevărată care decurge din lipsa
paralelismului dintre forme (varianţa adevărată specifică), sunt tratate ca erori şi tind să reducă
coeficientul de echivalenţă. Intervalul de timp dintre cele două aplicări ale testului fiind mic, putem
considera că se produce o scădere a fluctuaţiilor posibile între scorurile adevărate datorate celor două
aplicări, ceea ce permite să reducem S2AF (varianţa eroare datorată fluctuaţiilor scorurilor adevărate, în
diferite ocazii) şi în consecinţă S2E (varianţa eroare).

4.2. Metoda test - retest

DEFINIŢIE
Metoda constă în a aplica acelaşi test de două ori aceluiaşi grup de subiecţi la un interval mai
mic sau mai mare de timp şi a calcula corelaţia dintre rezultatele obţinute.

Aplicarea acestei metode comportă mai multe dificultăţi. Efectul exerciţiului sau a memorării
poate influenţa subiecţii la a doua aplicare, astfel încât erorile înregistrate în cursul celor două prezentări
au tendinţa să fie în corelaţie. Mai mult, modificarea abilităţii subiecţilor contribuie de asemene la eroare.
Este deseori dificil de precizat dacă eroarea este efectul creşterii sau diminuării corelaţiei între rezultate.
După Gulliksen (1950), corelaţia va fi mai mare dacă intervalul de timp dintre cele două prezentări este
scurt şi oboseala intervine în mică măsură. În acest caz corelaţia obţinută este o supraestimare a
coeficientului de precizie. Dacă intervalul dintre prezentări este lung, memoria intervine mai puţin, iar
efectul este reducerea corelaţiei.
Dacă considerăm fluctuaţia scorurilor adevărate, eroare, fidelitatea este subestimată, iar dacă
efectul memoriei este considerat ca varianţă adevărată, fidelitatea este supraestimată. Varianţa atribuită
fluctuaţiei scorurilor adevărate creste o dată cu durata intervalului dintre cele două prezentări, iar efectul
memoriei scade. Intervalul ideal permite reducerea, pe cât posibil, a efectului combinat al celor doi factori.

142
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

IMPORTANT
A. Anastasi consideră că definirea exactă a varianţei eroare este dificilă. Un factor irelevant pentru un
scop diagnostic poate fi relevant pentru un altul şi invers. Deci, unul şi acelaşi factor poate fi considerat,
în funcţie de scopul testării, când varianţă adevărată când varianţă eroare.

EXEMPLU
Dacă se urmăreşte starea afectivă actuală a unei persoane (dispoziţia emoţională, nivelul anxietăţii etc.),
atunci se preferă teste care relevă varianţa cotelor brute de la o testare la alta. Dacă se urmăreşte
prognoza şcolară sau profesională, atunci se preferă teste care surprind stabilitatea în timp a conduitelor.
În primul caz stabilitatea în timp a rezultatelor este contraindicată, în celălalt ea este de dorit. Deci, sensul
erorii depinde de scopul testării. Când condiţiile care determină cota subiectului sunt mereu irelevante
pentru scopul urmărit, ele intră în categoria varianţei eroare şi putem spune că fidelitatea nu există sau
este foarte mică.

4.3. Metoda de analiză a varianţei interne


Metoda înjumătăţirii
Datorită limitelor pe care le posedă metodele prezentate anterior, şi a faptului că fidelitatea este
estimată printr-un coeficient de echivalenţă, metoda înjumătăţirii (split half) este utilă.

DEFINIŢIE
Procedeul constă în a ordona itemii în ordinea dificultăţii. Apoi vom împărţi testul în două,
echilibrând gradul de dificultate a fiecărei părţi pe baza indicelui pi (indicele de dificultate a itemului) pentru
fiecare item. În acest fel construim două teste de dificultate şi variabilitate echivalente în aşa fel încât
mediile şi abaterile standard să aibă valori cât mai apropiate posibil. Cele două teste vor măsura aceleaşi
scoruri adevărate deci, ele măsoară acelaşi conţinut şi există o corelaţie pozitivă perfectă între scorurile
adevărate.

Metoda presupune obţinerea unui scor de către fiecare subiect pentru fiecare jumătate şi
calcularea corelaţiei dintre aceste scoruri.
Metoda fidelităţii prin înjumătăţire nu poate fi utilizată pentru teste de viteză.

Coeficientul alfa şi coeficientul Kuder-Ricardson (KR20)


Este posibil să divizăm un test în atâtea părţi câţi itemi sunt. Putem postula că toţi itemii sunt
paraleli, deci au aceeaşi medie, aceeaşi varianţă şi intercorelaţii egale. Kuder şi Ricardson (1937) au
obţinut o ecuaţie care permite să obţinem coeficienţi de fidelitate. Cronbach a demonstrat că KR20 (caz
special al coeficientului ) este egal cu media tuturor coeficienţilor obţinuţi prin metoda înjumătăţirii,
calculaţi prin formula lui Rulon sau Guttman, pentru toate jumătăţile posibile ale unui test. KR20 este un
coeficient de omogenitate sau de consistenţă internă care dă o mai bună estimare a fidelităţii. El poate fi
considerat ca fiind corelaţia între teste paralele dacă eşantionarea itemilor s-a făcut prin hazard. Varianţa
adevărată este, deci dependentă de valoarea covarianţei dintre iremii unui test şi este determinată de
intercorelaţii şi varianţele itemilor. Aceasta ne permite să afirmăm că coeficientul KR20 (indicele de
consistenţă internă) depinde de corelaţiile dintre itemi, deci de gradul în care măsoară aceeaşi variabilă,
cum s-ar spune de omogenitatea itemilor.

143
CORNELIU-EUGEN HAVÂRNEANU

5. INTERPRETAREA COEFICIENTULUI DE FIDELITATE

Cum interpretăm un coeficient de fidelitate şi când poate fi considerat acceptabil? Răspunsul la


această întrebare nu este evident, dar există. Cum am văzut deja, pentru un test putem calcula mai mulţi
coeficienţi, diferiţi din punct de vedere a valorii calitative. Fiecare reprezintă estimarea valorii inconstanţei
rezultatelor şi nu o estimare a cauzei erorilor. Va trebui deci, să examinăm formele de interpretare a unui
coeficient de fidelitate.
Deşi există mai multe posibilităţi de calcul al coeficientului de fidelitate, în mod curent se vorbeşte
despre gradul de fidelitate pentru a desemna valoarea erorilor de măsurare cu testul respectiv.
Nunnally (1982) sugerează că cel puţin doi coeficienţi diferiţi trebuie utilizaţi pentru a cunoaşte
fidelitatea unui test: coeficientul  calculat pentru fiecare formă a testului şi corelaţia între forme
paralele. Alţi autori recomandă calcularea coeficientului de echivalenţă - stabilitate. Este important ca
cercetătorul să ţină seama de necesităţi şi de context. De exemplu, pentru o corectare subiectivă
efectuată de mai mulţi corectori, corelaţia mediei dintre scorurile celor două forme ale testului este un bun
indice de fidelitate. Metoda prin înjumătăţire poate fi folosită dacă nu există o formă paralelă a testului.
În toate cazurile va fi folosită metoda care duce la o estimare cât mai prudentă şi verosimilă.

IMPORTANT
Există patru forme de interpretare a unui coeficient de fidelitate:
- ca o corelaţie dintre scorurile obţinute şi scorurile adevărate;
- ca un standard de comparaţie a preciziei unui test cu precizia altor teste de aceeaşi natură;
- ca procent al subiecţilor care-şi schimbă rangul sau poziţia;
- ca un indice al gradului de eroare între scorurile individuale.

A. Corelaţia dintre scorurile obţinute şi scorurile adevărate

IMPORTANT
Coeficientul de fidelitate este un raport de varianţă, prin care se poate stabili cât din proporţia de varianţa
totală aparţine varianţei adevărate.

EXEMPLU
Dacă rXX1=0.90, putem spune că 90% din variabilitatea scorurilor observate decurge din varianţa
adevărată şi 10% din varianţa eroare. Evident că rXX1=0, presupune că variabilitatea este datorată în
totalitate erorilor.

De asemenea, un coeficient de fidelitate poate fi interpretat ca fiind proporţia din varianţa


observată care provine din diferenţele dintre scorurile adevărate. Mai precis, el indică gradul erori de
măsurare obţinut prin administrarea unei forme a unui test la un eşantion particular de subiecţi în condiţii
bine precizate.

B. Un standard de comparaţie a preciziei unui test cu precizia altor teste de aceeaşi natură
O valoare foarte ridicată de 0,90 sau mai mare, observată la un test standard, care serveşte la
măsurarea randamentului, aptitudinilor sau abilităţilor, poate servi drept criteriu de comparaţie pentru aţi
coeficienţi. Pentru testele de personalitate, norma criteriu se situează la 0,80.

144
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

C. Schimbarea rangului subiecţilor


Dacă precizia este perfectă, fiecare subiect primeşte acelaşi rang la fiecare prezentare a testului.
Thorndike şi Hagen (1977) au prezentat tabelele de schimbare a rangurilor pentru diversele valori ale
coeficientului de fidelitate. Rangurile pe care le au doi subiecţi se schimbă în funcţie de valoarea
coeficientului de fidelitate.

EXEMPLU
Dacă scorurile a doi subiecţi sunt plasate în cetilul 75 respectiv 50, aceste se inversează dacă precizia
testului are valori diferite. Dacă rXX1=0.60 sunt 33% şanse ca doi subiecţi plasaţi în cetilele 75 şi 50 să-şi
schimbe poziţia şi numai 2% şanse de schimbare a poziţiei dacă rXX1=0.90.

Schimbarea rangului dintre subiecţi nu depinde numai de precizia testului ci si de numărul


claselor. Cu cât clasele sunt mai mici cu atât există mai multe şanse de schimbare.

D. Gradul de eroare între scorurile individuale


Gradul de eroare este invers proporţional cu gradul de fidelitate a unui test. Problema este de a
determina pentru fiecare subiect intervalul în care se află scorul adevărat.

EXEMPLU
Presupunem o medie Xmed = 60, o abatere standard SX = 5 şi o fidelitate a testului rXX1 = 0.84. În
acest caz eroarea de măsurare este:
S E  S X 1  rXX = 5 1  0,84 = 2
1

Pentru un scor X = 57 şi un grad de confidenţă de 0,95 vom obţine:


X - ZSE  A  X + ZSE
57 - (1,96 x 2)  A  57 + (1,96 x 2)
53,08  A 60,92
unde Z este scorul standard luat de valorile care determină probabilităţi exacte pe o curbă normală, iar A
= scor adevărat.
Există deci, 95 % şanse ca un scor observat de 57 să corespundă unui scor adevărat situat intre
53 şi 61. Eroarea de măsurare care este un indice al variabilităţii scorurilor observate faţă de scorurile
adevărate constituie o estimare a gradului atenuare a scorurilor aşteptate la o eventuală nouă prezentare
a testului. Cu cât eroarea de măsurate este mai mare cu atât intervalul în care se plasează scorurile
adevărate este mai mare.

În concluzie:
1. Coeficientul de fidelitate teoretic se situează la 1,00, iar practic trebuie să fie cât mai ridicat posibil;
2. Fidelitatea unui test este un concept pur teoretic pentru că un coeficient de precizie se aplică exclusiv
unui test, unui eşantion de teste menţinând constant testul şi metoda de calcul.
3. Dacă comparăm gradul de fidelitate a mai multor teste, nu putem spune că un test este mai precis
decât altul decât dacă unul dintre ele are un coeficient de precizie foarte ridicat decât alte teste care
au fost prezentate de mai multe ori.

TEST DE AUTOEVALUARE
1. Cu cât clasele sunt mai puține cu atât există mai multe şanse de schimbare a rangului subiecților de la
măsurare la alta.

145
CORNELIU-EUGEN HAVÂRNEANU

a.ADEVĂRAT
b.FALS
2. Scorul adevărat al unui subiect (s) obţinut cu un instrument dat (i) este definit ca valoarea aşteptată a
scorului observat.
a.ADEVĂRAT
b.FALS
3. Coeficientul  este un bun indicator pentru cunoașterea stabilității în timp a unui test.
a.ADEVĂRAT
b.FALS
4. Eroarea standard de măsurare ne ajută să determinăm gradul de fluctuație a scorurilor adevărate.
a.ADEVĂRAT
b.FALS
5. Gradul de eroare este invers proporţional cu gradul de fidelitate a unui test.
a.ADEVĂRAT
b.FALS
6. Dacă rXX1 = 0.80 putem spune că 80% din variabilitatea scorurilor observate decurge din varianţa eroare
şi 20% din varianţa adevărată..
a.ADEVĂRAT
b.FALS
7. Pentru un test putem postula că toţi itemii sunt paraleli, deci au aceeaşi medie, aceeaşi varianţă şi
intercorelaţii egale.
a.ADEVĂRAT
b.FALS
8. Scorul adevărat este scorul mediu a unui subiect pentru un număr infinit de utilizări a aceluiaşi
instrument de măsură.
a.ADEVĂRAT
b.FALS
9. Pentru definirea exactă a varianţei eroare trebuie să ţinem seama de scopul testării.
a.ADEVĂRAT
b.FALS
10. Eroarea standard de măsurare ne ajută să determinăm gradul de fluctuație a scorurilor observate.
a.ADEVĂRAT
b.FALS
11. Dacă itemii testelor paralele sunt extraşi din aceeaşi populaţie de itemi, coeficientul de fidelitate indică
gradul de certitudine cu care poate fi măsurată o trăsătură
a.ADEVĂRAT
b.FALS
12. Schimbarea rangului dintre subiecţi depinde numai de precizia testului.
a.ADEVĂRAT
b.FALS
13. Consistența internă a unei probe se poate determina prin aplicare probei acelorași subiecți în două
momente diferite.
a.ADEVĂRAT
b.FALS
14. Coeficientul de fidelitate, indică proporţia varianţei observate care provine din varianţa adevărată.
a.ADEVĂRAT
b.FALS
15. Scorul adevărat este un scor obţinut cu un test perfect care măsoară fără eroare.
a.ADEVĂRAT
b.FALS

146
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

16. Un coeficientul de fidelitate rXX1 = - 0.80 că există foarte puține erori de măsurare.
a.ADEVĂRAT
b.FALS

147
CORNELIU-EUGEN HAVÂRNEANU

Unitatea de învățare 5.
VALIDITATEA TESTELOR

1. DEFINIŢIE ŞI GENERALITĂŢI

DEFINIŢII
Validitatea, care este determinată în funcţie de gradul de varianţă adevărată al variabilei măsurate, poate
fi definită ca fiind:
• gradul în care un test măsoară o trăsătură, un construct sau un factor;
• relaţia dintre scorurile obţinute la test şi o măsurare a unui criteriu exterior.
După Legendre (1993), validitatea este "capacitatea unui instrument de a măsura realmente ceea
ce şi-a propus să măsoare după utilizarea acestuia".

Conceptul de validitate este un termen generic care se referă la următoarele probleme:


 Tipul de test folosit este potrivit utilizării care i-a fost destinată?
 Care sunt trăsăturile măsurate de test?
 În prezent testul măsoară ceea ce el trebuie să măsoare?
 Informaţiile furnizate de test sunt utile pentru a lua decizii?
 Ce interpretări putem face pe baza scorurilor obţinute la test?
 Ce predicţii putem face pe baza acestor scoruri?
 Care este gradul de varianţă care rezultă din variabila măsurată de test?
Validitatea este tot timpul legată de o situaţie particulară ceea ce înseamnă că în alte condiţii, pe
alte eşantioane sau metode de analiză vom obţine rezultate diferite. Validitatea nu poate fi extinsă la
ansamblul situaţiilor. A spune că un test este mai valid decât altul nu are sens decât dacă testul se
dovedeşte a fi valid într-o foarte mare varietate de situaţii sau pentru un foarte mare număr de scopuri de
testare.

2. DISTINCŢIA DINTRE FIDELITATE ŞI VALIDITATE

IMPORTANT
Fidelitatea se referă la precizia cu care un test măsoară anumite caracteristici în timp ce
validitatea vizează calitatea măsurării.
Am definit fidelitatea ca fiind un raport de varianţă şi în aceeaşi manieră vom defini validitatea ca
fiind proporţia de varianţă adevărată care este pertinentă scopurilor de utilizare a unui test.

După cum s-a precizat deja validitatea vizează două aspecte: unul se referă la calitatea cu care
un test măsoară o trăsătură ipotetică sau un construct, iar al doilea se referă la relaţia dintre scorurile
obţinute la un test şi o măsură criteriu.
Definiţia validităţii poate fi exprimată prin ecuaţia: S2A = S2p + S2n
unde S2p = varianţa pertinentă
S2n = varianţa non pertinentă dar valabilă
Deci: S2X = S2p + S2n + S2E
Varianţa totală a unui test este formată din varianţa validă, varianţa non pertinentă dar şi din
varianţa eroare. Dacă varianţa eroare scade, deci fidelitatea creşte (S2A / S2X), varianţa validă potenţială

148
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

creşte, dar această varianţă poate fi pertinentă sau nu pentru o situaţie dată. De asemenea, o mică
varianţă eroare nu garantează o validitate mare şi în acelaşi timp o fidelitate mare este o condiţie necesară
dar nu suficientă pentru o validitate mare pentru un test dat într-o situaţie dată.

IMPORTANT
Studiul validităţii vizează erorile sistematice, cel al fidelităţii erorile aleatoare. Legătura dintre cele două
concepte evidenţiază faptul că un coeficient de validitate rXY nu poate depăşi valoarea rădăcinii pătrate a
coeficientului de fidelitate rXX1, ceea ce înseamnă că validitatea este tot timpul limitată de fidelitatea unui
test.

Următoarele situaţii demonstrează acest fapt:

EXEMPLU
1. O fidelitate mare şi o validitate mare
S2p S2n S2E

2. O fidelitate mare şi o validitate slabă


S2p S2n S2E

3. O fidelitate slabă şi o validitate relativ ridicată


S2p S2n S2E

4. O fidelitate slabă şi o validitate slabă:

S2p S2n S2E

unde: S2p = varianţa pertinentă


S2n = varianţa non pertinentă
S2E = varianţa eroare
S2A = S2p + S2n
Deci fidelitatea este o condiţie necesară dar nu suficientă , deoarece validitatea trebuie să fie
prezentă. Este important de subliniat că un test valid este în mod necesar şi fidel, dar un test fidel nu este
în mod necesar şi valid. O varianţă a erorii scăzută nu garantează o creştere a validităţii deoarece varianţa
adevărată poate fi în mare parte non pertinentă.

3. TIPURI DE VALIDITATE

Există mai multe tipuri de validitate în funcţie de scopul testării sau examinării: validitate
predictivă, validitate de conţinut, validitate teoretică. În literatura actuală se vorbeşte şi de validitate
aparentă (face validity), care se referă direct la conţinutul şi structura testului. Dacă un test are validitate
aparentă atunci există o corespondenţă logică evidentă între itemii testului şi ceea ce testul îşi propune
să măsoare.
Validitatea predictivă
Putem folosi testele pentru a face predicţii referitoare la randamentul subiecţilor pe baza unui
criteriu. Putem folosi drept criteriu media şcolară sau randamentul în muncă.

149
CORNELIU-EUGEN HAVÂRNEANU

EXEMPLU
Putem prezice nota școlară (criteriu) pe baza rezultatelor la un test de inteligență (predictor).
Un aspect important a acestui tip de validitate este criteriul, deoarece scorul obţinut la test este util în
măsura în care poate prezice un criteriu, conţinutul fiind în acest caz un aspect secundar.

Validitatea de conţinut
Dacă dorim să cunoaştem randamentul unui individ în universul situaţiilor în care testul este un
eşantion, conţinutul testului constituie aspectul primordial care trebui luat în seamă, şi atunci testul devine
universul în care itemii sunt eşantioane de situaţii. De asemenea, precizia răspunsurilor şi procedeul de
rezolvare a itemilor testului prezintă un mare interes. Evaluarea validităţii de conţinut se face în funcţie de
gradul de pertinenţă a eşantionului de itemi. Dar, neexistând un indice cantitativ de pertinenţă a
eşantionului, evaluarea se face prin judecăţi sau prin procese raţionale.

IMPORTANT
Important pentru validitatea de conținut este să stabilim dacă eșantionul de itemi din care este
construit testul este reprezentativ pentru universul infinit de itemi.

Validitatea de teoretică
Testele psihologice permit studierea caracteristicilor umane. În acest caz trebuie să cunoaştem
trăsătura pe care testul o măsoară. Dacă vom cunoaşte care este trăsătura măsurată, o vom putea utiliza
pentru studiul diferenţelor individuale şi pentru elaborarea teoriilor organizării trăsăturilor.
Pentru acest tip de validitate, trăsătura măsurată este aspectul esenţial şi estimarea validităţii se
face prin reliefarea prezenţei relative a trăsăturii.

IMPORTANT
Esențial pentru validitatea teoretică este să stabilim dacă testul măsoară într-adevăr constructul pentru
care a fost construit.

Reliefarea acestor prezenţe poate fi făcută în mai multe feluri folosind diverse surse, apelându-
se la studii de validitate predictivă şi de conţinut.

4. VALIDITATEA PREDICTIVĂ

Majoritatea testelor sunt folosite pentru predicţia randamentului. Testele de aptitudini şcolare
servesc pentru predicţia şanselor de reuşită şcolară, inventarele de interese permit cunoaşterea
câmpurilor de interese profesionale, inventarele de personalitate permit evidenţierea unor dezechilibre
psihice care pot determina anumite predispoziţii, testele de randament sunt utilizate pentru selecţie şi
plasare profesională, testele de aptitudini şi abilităţi profesionale permit predicţia productivităţii şi stabilităţii
în muncă.

150
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

IMPORTANT
În toate cazurile, variabila care face obiectul predicţiei este denumită criteriu. Criteriul este măsurarea
randamentului într-un mod diferit de cel desemnat de variabila predictivă. Modelul care permite măsurarea
acestui tip de validitate constă în stabilirea relaţiei între scorurile obţinute la test şi cele obţinute la criteriu.

Expresia "validitate predictivă" se referă la faptul că folosind testul putem realiza predicţia
criteriului. Expresia "validitate empirică" se referă la faptul că determinarea validităţii predictive presupune
totdeauna colectarea unor date empirice din care decurge relaţia dintre scorurile obţinute la test şi cele
obţinute la criteriu.

Validitatea predictivă şi luarea deciziilor


Predicţia vizează luarea unei decizii şi pentru aceasta validitatea predictivă este foarte utilă.
Atunci când dorim să luăm o decizie pentru selecţie, clasament sau plasament vom folosi teste care ne
oferă scoruri individuale pe baza cărora decidem. În acelaşi timp putem folosi şi alte urse de informaţii.
Este însă dificil să stabilim importanţa relativă a scorurilor la teste comparativ cu informaţiile care provin
din alte surse. Mulţi autori, printre care şi Brown (1970), susţin că măsurarea validităţii predictive măreşte
şansele ca o decizie luată pe baza scorurilor unui test să fie exactă, faţă de exactitatea unei decizii luată
pe baza unor alte surse de informaţii.

IMPORTANT
Validitatea unui test este judecată în funcţie de corelaţia sa cu criteriul şi de gradul în care scorurile criteriu
nu reprezintă corect scopul propus (slăbiciunea criteriului).

EXEMPLU
Să considerăm că pentru reuşita şcolară luăm media cumulată drept criteriu de evaluare a performanței.
Dacă testul ne permite predicţia, cu un anumit grad de precizie, a mediilor cumulate, este posibil ca
membrii consiliului profesoral să nu fie în măsură să aleagă tipul de student care va fi admis. În
consecinţă, folosirea testului a oferit posibilitatea de a fi admişi, într-o proporţie crescută, numai studenţii
care vor obţine medii ridicate. Studenţii aleşi în acest fel posedă însă şi alte caracteristici care sunt legate
de capacitatea de a obţine note ridicate. În concluzie, problema constă în avantajul de a lua decizii legate
de grupuri decât de indivizi. Validitatea este tot timpul estimată pe baza datelor grupului, şi logic enunţurile
referitoare la validitatea unui test ne vor trimite înapoi la validitatea unui ansamblu de scoruri şi nu la
scorul unui subiect.

Criteriile
În toate studiile de validitate predictivă criteriul este un element foarte important. Interesul pentru
un test predictor este tot timpul în funcţie de relaţia sa cu criteriul. Dacă un test are menirea să măsoare
un randament, va fi stabilit un standard de reuşită. Acest standard este un criteriu. În educaţie se foloseşte
frecvent media cumulată drept criteriu. Asta nu înseamnă că nu pot fi folosite şi alte criterii ca: aptitudinea
de integrare, de analiză de evaluare, cultura generală, capacitatea de adaptare, manifestarea unei
atitudini constructive în situaţii dificile. Este simplist să apelăm la un singur criteriu. Recurgerea la mai
multe criterii ridică o problemă interesantă. Dacă criteriile sunt puternic interrelaţionate combinarea unora
dintre ele nu aduce un aport prea mare decât dacă s-ar folosi unul singur, deoarece fiecare măsoară
acelaşi lucru. Din potrivă, dacă criteriile sunt slab interrelaţionate nu este recomandat să le combinăm,
deoarece ele măsoară aspecte diferite.

151
CORNELIU-EUGEN HAVÂRNEANU

IMPORTANT
Combinarea criteriilor ridică şi o altă problemă cunoscută sub numele de "dimensionalitate statistică".
Ghiselli (1964), evidenţiază două probleme:
- "dimensionalitatea dinamică" - un criteriu, considerat fundamental poate deveni impropriu în timp;
- "dimensionalităţii individului" este legată de diferenţele individuale.

EXEMPLU
Doi indivizi pot face aceeaşi muncă procedând în maniere total diferite dar amândoi fiind cotaţi la fel de
bine. Specialiştii sunt astfel confruntaţi cu dilema: acceptăm două metode de muncă la fel de valide sau
una este privilegiată în detrimentul alteia.

Caracteristicile unei măsuri - criteriu


Astin (1964), face distincţia între criteriu şi măsura-criteriu. El consideră criteriul un concept
general legat de randament Acest concept trebuie să fie exprimat în termeni operaţionali, conform unei
măsuri care apoi permite determinarea validităţi unui test. De exemplu reuşita la universitate este un
criteriu conceptual, iar media cumulată este o măsură - criteriu.

IMPORTANT
Măsura - criteriu are mai multe caracteristici:
• Caracteristică foarte importantă a măsurii - criteriu este pertinenţa sa, adică validitatea sa. Ea trebuie
să reflecte şi să măsoare aspectele fundamentale ale criteriului conceptual. Media cumulată este o
măsură - criteriu validă dacă reflectă şi măsoară corect aspectele importante ale reuşitei la
universitate. Evaluarea pertinenţei unei măsuri - criteriu se face prin procedee raţionale şi calitative.
Nu există un indice cantitativ eficace pentru exprimarea gradului de pertinenţă a unei măsuri - criteriu.
• A doua caracteristică a unei măsuri - criteriu este fidelitatea sau constanţa măsurărilor. O măsură
criteriu trebuie să fie constantă în timp indiferent de circumstanţe. O măsură - criteriu inconstantă nu
poate fi pusă în relaţie cu alta, iar indicele relaţiei cu predictorul nu va semnifica nimic, indiferent de
gradul acestuia. De exemplu, dacă folosim o măsură inconstantă pentru determinarea productivităţii
unui muncitor, atunci în cazul unei zile bune productivitatea va fi mare şi vom supraestima valoarea
sa, iar într-o zi proastă riscăm să subestimăm valoarea sa. Alegerea unei măsuri - criteriu este supusă
la cel puţin două constrângeri:
• Factorii care induc o eroare de măsurare trebuie controlaţi pentru că ei influenţează măsurile - criteriu
în acelaşi fel ca şi predictorii;
• Dacă controlul acestor factori nu ne permite să obţinem o măsură stabilă este posibil să creştem
stabilitatea alegând un număr mare de măsuri - criteriu sau alegând eşantioane în mai multe ocazii.
• A treia caracteristică a unei măsuri criteriu este absenţa contaminării. Măsurarea criteriului se va
efectua în condiţiile în care factorii non pertinenţi nu pot influenţa scorurile. Contaminarea poate să
apară uşor dacă măsura criteriu se prezintă sub forma unor scale de evaluare care sunt vulnerabile
datorită efectului de halo sau a tendinţei de indulgenţă. Instrucţiuni foarte precise de forma unei
descrieri detaliate a caracteristicilor de evaluat permite diminuarea riscului de contaminare.

IMPORTANT

152
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

Thorndike (1971) atrage atenţia asupra unui factor major de contaminare. Este cazul în care scorul criteriu
al unui subiect este influenţat de cunoaşterea de către evaluator a scorului la predictor a subiectului
respectiv. Thorndike aminteşte şi de efectul acestui factor asupra randamentului la criteriu al subiectului,
efect denumit "predicţie pentru sine". Mai mult, el semnalează două tipuri de contaminare între predictor
şi criteriu.

EXEMPLU
Atunci când dorim să cunoaştem dacă un test de lectură permite predicţia scorurilor la un test de atitudine
faţă de matematică, măsura criteriu va fi scorul la destul de atitudine faţă de matematică. Dacă evaluatorul
care atribuie aceste cote cunoaşte scorurile subiecţilor la testul de lectură (predictor), evaluările sale pot
fi influenţate. Riscurile de contaminare sunt probabil mai ridicate dacă un elev a obţinut un scor ridicat la
testul de lectură şi când el pare să aibă o atitudine negativă faţă de matematică. Subliniem că problema
riscă să apară dacă un subiect obţine un scor mic la testul de lectură dar manifestă o atitudine favorabilă
faţă de matematică. Soluţia, pentru evitarea acestei situaţii este de a evita ca evaluatorul să cunoască
scorurile subiecţilor la variabila predictor.

Menţionăm că cele mai bune măsuri - criteriu sunt cele care prezintă cât mai multe avantaje
practice, care sunt simplu de folosit, care sunt disponibile şi mai puţin costisitoare.

Categorii de măsuri - criteriu


Prima categorie constă în măsurarea directă a producţiei sau a randamentului: volumul de
vânzări, numărul de clienţi pe oră sau pe zi, numărul de accidente pe lună sau pe an, numărul de erori
pe unitate, media cumulată etc.
A doua categorie este formată din randamentul la un test, cum ar fi rezultatul la un examen sau
la testele administrate de serviciile de personal din întreprinderi: scalele de evaluare fac parte din această
categorie. Subliniem că distincţia dintre cele două categorii nu este exclusivistă. De exemplu, media
cumulată poate aparţine uneia sau alteia din cele două categorii, în funcţie de felul în care ea a fost
obţinută.
În cea de-a treia categorie, măsura - criteriu aparţine unui grup. Testele de personalitate şi în
particular chestionarele de interese sunt considerate valide dacă permit o bună clasificare a indivizilor în
grupuri bine precizate. Testele de aptitudini sunt valide dacă permit să distingem indivizii care vor reuşi
faţă de cei care vor eşua într-o activitate sau într-un program de studii dat.
A patra categorie este formată din măsurile - criteriu de natură statistică, cum ar fi coeficienţii de
saturaţie, coeficienţii de discriminare sau cei de consistenţă internă.
În concluzie, un test nu poate fi mai bun decât criteriile folosite pentru stabilirea validităţii, pentru
că toate slăbiciunile criteriilor se răsfrâng asupra testului şi îi limitează utilitatea. Dificultatea nu constă în
alegerea unei măsuri - criteriu pertinente, ci în faptul de a nu alege doar una. Pentru ca procesul de
validare să fie valabil este necesar să recurgem la mai multe măsuri criteriu.

153
CORNELIU-EUGEN HAVÂRNEANU

5. DETERMINAREA VALIDITĂŢII PREDICTIVE

Coeficientul de validitate

IMPORTANT
Metoda constă în a calcula corelaţia dintre scorurile la testul predictor şi scorurile la măsura - criteriu.
Calculul presupune parcurgerea a cinci etape distincte:
1. alegerea unui eşantion de subiecţi;
2. aplicarea testului predictor acestor subiecţi;
3. realizarea unor prelucrări specificate dacă este cazul;
4. colectarea datelor la criteriu;
5. calcularea corelaţiei între scorurile obţinute la predictor şi la criteriu;

Coeficientul de corelaţie astfel obţinut este un coeficient de validitate. El este notat cu r XY, unde
r este coeficientul de corelaţie, X predictorul şi Y criteriul. Este evident că toţi factorii care influenţează
coeficientul de corelaţie pot influenţa coeficientul de validitate şi că datele trebuie să respecte postulatele
necesare calculării coeficientului de corelaţie. Doi factori, care sunt de fapt postulate necesită o atenţie
deosebită.
În primul rând ştiindu-se că coeficientul de corelaţie Pearson este cel mai des folosit, postulatul
de liniaritate dintre două variabile este primordial. Dacă mai multe variabile sunt considerate ca fiind în
relaţie liniară este necesar să verificăm această legătură înainte de a calcula coeficientul de corelaţie.
Pentru a realiza această verificare vom trasa graficul produs de cele două variabile, fiecare axă
reprezentând una din cele două variabile. Dacă relaţia nu este liniară atunci vom transforma scorurile într-
o scală sau vom folosi o altă metodă de corelaţie pentru a estima coeficientul de validitate.
În al doilea rând vom lua în consideraţie întinderea diferenţelor individuale. Se ştie că o mică
variabilitate a scorurilor limitează valoarea pe care o poate avea un coeficient de corelaţie. Această este
o problemă majoră pentru studiul validităţii, când folosim mai multe grupe de subiecţi. Este preferabil să
folosim grupe eterogene, care prezintă o întindere mai mare a diferenţelor individuale.

Interpretarea coeficientului de validitate


Există mai multe forme de interpretare a unui coeficient de validitate. O primă formă constă în a
compara diferiţi coeficienţi şi de a alege testul care prezintă coeficientul cel mai ridicat pentru o situaţie
dată.
O altă formă de interpretare este transformarea coeficientului de validitate în procente de
varianţă. Prin ridicarea la pătrat a coeficientului de validitate obţinem proporţia din varianţă explicată prin
acesta. Astfel, dacă rXY = 0,60 atunci r2XY = 0,36 sau o proporţie de varianţă egală cu 0,36. Putem spune
că 36% din varianţă este împărţită între două variabile, sau că 36% din varianţa criteriului este datorată
variaţiei scorurilor testului predictor. Observăm că coeficientul de validitate trebuie să fie de circa 0,7071
pentru ca jumătate din varianţa criteriului să fie explicată prin varianţa scorurilor la predictor. În majoritatea
studiilor găsim raportări inferioare valorii 0,7071.

EXEMPLU
Wiggins (1974) prezintă un exemplu în care studiază relaţia posibilă între scorurile la un test care măsoară
dominanţa şi percepţia subiectului ca un leader, şi raportează un coeficient de validitate de 0,61. Aceasta
înseamnă că indivizii care au obţinut un scor ridicat la testul de dominanţă sunt percepuţi ca lideri faţă de
cei care prezintă scoruri mici. Autorul estimează că circa 37% din varianţa variabilei leader poate fi prezisă
pe baza scorurilor la testul de dominanţă. Mai mult, el subliniază că de fapt există trei interpretări posibile
prin utilizarea unor diagrame după metoda lui Cattell (1957).

154
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

În fig 2a toate elementele dominanţei sunt conţinute în leader, în b toate elementele leader sunt
conţinute în dominanţă, în c, 61% din elementele leader sunt comune cu cele ale dominanţei şi viceversa
şi sunt dimensiunile unei trăsături-sursă numită extraversiune.
În realitate, este mai plauzibil să cauţi predicţia posibilităţii de a fi perceput ca un leader pe baza
scorurilor obţinute la un test de dominanţă. Aceasta ne face să presupunem ca în fig a, că dominanţa
este o componentă majoră a leaderului acoperind 37% din varianţa explicată. Conform diagramei b
presupunerea este inversată. Diagrama sugerează mai degrabă că leaderul va fi o componentă majoră
a dominanţei. Diagrama c lasă să se presupună că chiar dacă 61% dintre elementele ambelor variabile
sunt comune, influenţa unei a treia variabile, comună celorlalte două intră în joc. Wiggins (1974),
sugerează o interpretare conform căreia dominanţa şi leaderul ar fi manifestări ale unei caracteristici mult
mai profunde, ca extraversiunea. Acest exemplu ilustrează complexitatea interpretării unei relaţii între un
predictor şi un criteriu.

O a treia formă de interpretare a unui coeficient de validitate ţine seama de caracteristicile


grupului care a fost ales, dacă testul este folosit pentru realizarea unei selecţii (Brogden, 1946). Autorul
demonstrează că pe baza postulatelor, coeficientul rXY poate fi interpretat direct ca fiind o măsură a
eficacităţii predictive, ca un raport între media scorurilor obţinute la măsura - criteriu a grupului selecţionat
şi cele ale tuturor grupelor de candidaţi neselecţionaţi. De exemplu, să presupunem că 200 de candidaţi
se prezintă pentru admiterea la un program de studii la care nu pot fi admişi decât 75, care să fie cei mai
buni. Cel mai bun procedeu este de a accepta toţi candidaţii, pentru un timp şi apoi să procedăm la
colectarea datelor - criteriu, pentru a selecta în final acei candidaţi care scorurile - criteriu cele mai ridicate.
Media scorurilor - criteriu a grupului selectat va fi mai ridicată decât toate mediile pe care le putem calcula
pornind de la fiecare combinaţie de 75 de candidaţi din cei 200 care s-au prezentat. Acest procedeu este
bun din punct de vedere teoretic, dar în practică este imposibil de aplicat.
Este rezonabil să aplicăm un test pentru selecţie şi să alegem 75 de candidaţi care au obţinut
scoruri ridicate la test. Coeficientul de validitate, după cum sugerează Brogden, este egal cu raportul între
randamentul mediu la criteriu, obţinut de grupul de 75 de candidaţi admişi pe baza testului predictor şi
randamentul mediu obţinut de 75 de candidaţi care ar fi fost aleşi dacă făceam selecţia pe baza scorurilor
- criteriu. Presupunem că obţinem un raport rXY = 0,80, ceea ce semnifică că grupul ales pe baza testului
predictor va avea un scor criteriu mediu egal cu patru cincimi din cel al grupului selectat pe baza scorurilor
criteriu. Metoda porneşte de la presupunerea că toţi candidaţii obţin un scor criteriu, ceea ce în practică
este imposibil.
O altă metodă de interpretare a coeficientului de validitate constă în predicţia erorilor. Aceasta
presupune utilizarea ecuaţiei de regresie.

155
CORNELIU-EUGEN HAVÂRNEANU

EXEMPLU DE CALCUL AL COEFICIENTULUI DE VALIDITATE


Să presupunem că prezentăm unui grup de 250 subiecţi un test, sub forma unei scala de
măsurare a nivelului de cultură generală. Scorurile la test sunt prezentate sub formă de note standard
STEN (standard ten) de la 1 la 10. Apoi, după un timp li se prezintă o scală de evaluare a atitudinii (gradul
de satisfacţie) faţă de introducerea unei noi specialităţi în programul de studiu. Este a scală cu 7 trepte în
care 1 înseamnă o atitudine foarte defavorabilă iar 7 o atitudine foarte favorabilă. Scorurile obţinute la
această scală constituie măsuri criteriu în acest exemplu.
Rezultatele celor două variabile sunt prezentate sub formă de frecvenţe în tabelul următor.
Scorurile la testul predictor (X)
Măsura-criteriu (Y) 1 2 3 4 5 6 7 8 9 10 
7 4 4
6 2 4 2 3 1 12
5 2 2 4 8 19 5 5 45
4 6 4 12 21 13 9 5 7 1 74
3 9 12 10 4 2 3 1 1 42
2 7 18 11 6 6 2 1 51
1 4 3 5 4 2 18
 26 37 40 37 27 24 30 15 9 5 250
Rezumatul statistic:
X = 1108 X2 = 6324 Xmed = 4,432 SX = 2,3776
Y = 883 Y = 3601
2 Ymed = 3,532 SY = 1,3888
XY = 4460
Este suficient să calculăm coeficientul de corelaţie între X (scorurile obţinute la testul de cultură
generală) şi Y (scorurile obţinute la scala de atitudine) pentru obţinerea coeficientului de validitate.
N  XY   X  Y 1115000  978364 136636
rXY     0,662
N X  x2
 2
N Y  Y
2
 2 594 ,4207   347 ,2189  206394 ,13

Putem interpreta acest coeficient în proporţii sau în procente de varianţă explicată (0,662 2 =
0,438). Putem spune că circa 44% din varianţa criteriului poate fi prezisă sau explicată prin varianţa
scorurilor obţinute la testul predictor. Acest procent de varianţă explicată este relativ ridicat comparativ cu
ceea ce întâlnim în general în studiile de validitate. Nu este simplu să stabilim cauzele rezultatelor foarte
ridicate în studiile de acest tip. Totdeauna, putem afirma că acest coeficient a fost obţinut pe un grup la
care nu s-a făcut o preselecţie, ceea ce presupune ca am folosit toţi subiecţii care au fost disponibili.
Particularitatea acestora este aceea că permit o întindere maximă a scorurilor la testul predictor, ceea ce
are ca efect creşterea valorii coeficientului de corelaţie.

6. VALIDITATE DE CONŢINUT

Dacă un profesor doreşte să evalueze cunoştinţele studenţilor la o materie el va construi un test


în care întrebările să cuprindă un eşantion reprezentativ a întregii materii. El se confruntă cu problema
validităţii de conţinut.

156
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

DEFINIŢIE
Validitatea de conținu se referă la gradul de reprezentativitate a eşantionului de întrebări. Problema
constă într-o analiză raţională a conţinutului testului şi se realizează prin intermediul judecăţilor de
valoare.

Decizia este subiectivă şi nu există un indicator numeric. Specialiştii consideră că există două
tipuri de validitate de conţinut: validitate aparentă şi validitate logică.
Validitatea aparentă se realizează prin analiza testului, efectuată de un expert care
concluzionează dacă acesta măsoară adevărate trăsătură pe care şi-a propus s-o măsoare. Acest tip de
validitate nu este cea mai importantă deoarece putem folosi alt tip de validitate mai pertinent.
Validitatea logică în care eşantionul de itemi este stabilit într-o manieră mult mai concretă decât
în cazul validităţii aparente. În acest caz se prezintă un tabel cu specificaţiile care conţin o definiţie clară
a aspectelor măsurate, obiectivele precise şi alegerea cât mai logică a itemilor pentru o divizare coerentă
a domeniului vizat.

EXEMPLU
Tabelul care urmează prezintă un exemplu cu specificaţiile pentru măsurarea cunoştinţelor acumulate în
legătură cu proprietăţile fizice ale pădurii:
obiective particulare
Cunoştinţe Cunoştinţe Cunoştinţe
Subiect specifice despre categorii despre metode Aplicaţii Total
Structura arborilor 10% 0 0 0 10%
Transformarea arborilor 10% 0 20% 0 30%
Caracteristicile esenţelor 20% 15% 0 10% 45%
Calculul cantităţilor 0 10% 0 5% 15%
Total 40% 25% 20% 15% 100%

7. VALIDITATEA TEORETICĂ

Începând cu anul 1955, Cronbach şi Meehl s-au ocupat de studierea validităţii teoretice propusă
de Asociaţie Psihologilor din America (APA) în anul precedent.

DEFINIŢIE
Validitatea teoretică este azi definită ca fiind un indicator al gradului în care un test măsoară constructul
pe care se presupune că-l măsoară.

Altfel spus, acest tip de validitate este utilă deoarece un test este construit pentru măsurarea unei
caracteristici pe care subiecţii o posedă în diferite grade. Constructul este descris printr-o definiţie
operaţională care precizează indicatorii observabili şi mijlocul prin care aceştia pot fi măsuraţi. Deseori un
test nu poate măsura toate aspectele constructului deoarece definiţia acestuia conţine elemente foarte
complexe şi vagi. Din această cauză validitatea teoretică este stabilită printr-o acumulare de evidenţe
decât printr-un singur indice. Specialiştii în măsurare se bazează pe teoria referitoare la trăsătura
măsurată şi fac predicţii asupra comportamentului la test într-o multitudine de situaţii. Aceste predicţii sunt
verificate experimental şi dacă se dovedesc a fi exacte duc la concluzia validităţii teoretice a testului. Dacă

157
CORNELIU-EUGEN HAVÂRNEANU

ele sunt false sau insuficient de exacte sunt mai multe explicaţii: sau experimentarea nu a fost bine
realizată, sau teoria care stă la baza construcţiei testului este falsă sau testul nu măsoară constructul
respectiv.
Pentru stabilirea validităţii teoretice toate sursele de predicţie pot fi folosite şi verificate empiric.
Următoarele elemente pot constitui criterii de evidenţiere a validităţii teoretice: toate informaţiile referitoare
la natura itemilor testului, omogenitatea testului, stabilitatea tuturor condiţiilor de aplicare, date referitoare
la validitatea de conţinut şi validitatea predictivă, predicţiile referitoare la diferite grupuri, modificarea
rezultatelor în timp, corelaţiile dintre construct şi diferite variabile demografice şi procedeele de măsurare
folosite de test.
Validitatea teoretică a unui test poate fi cunoscută în diferite moduri în funcţie de problema care
se pune. De exemplu putem fi interesaţi de proporţia de varianţă observată care decurge din variabila
măsurară de test sau de măsura în care randamentul la test coincide cu gradul de prezenţă a
caracteristicii pe care presupunem că o măsurăm.

Metode de studiere a validității teoretice


Pentru realizarea acestor constatări există posibilitatea folosirii mai multor metode: metode
intratest, metode intertest, metode criteriale, manipulări experimentale şi studii de generalizabilitate etc.
Metodele intratest vizează stabilirea validităţii de conţinut în funcţie de definiţiile operaţionale
ale constructului şi studii de omogenitate a testului cu ajutorul indicelui de consistenţă internă, prin
determinarea fie a coeficientului alpfa fie a coeficientului Kuder-Richarson.
Metodele intertest studiază corelaţiile dintre mai multe teste pentru a verifica dacă ele măsoară
acelaşi construct. Este vorba de a stabili validitatea congruentă corelând scorurile obţinute la noul test
cu cele ale unui test bine cunoscut. Dacă corelaţia este ridicată, putem presupune că noul test măsoară
acelaşi construct ca şi testul deja recunoscut pentru calităţile sale de măsurare. Aceste metode folosesc
şi studiile de analiză factorială, tehnică statistică utilizată pentru a determina numărul de factori, pe baza
cărora putem explica intercorelaţiile unui ansamblu de teste. Tehnica permite determinarea numărului de
factori şi explică mai bine scorurile obţinute la fiecare din teste precizând gradul de varianţă între scorurile
explicate de fiecare factor (cât la sută din varianţa totală este acoperită de varianţa fiecărui factor). Testele
care au în comun o varianţă ridicată sunt cele care măsoară acelaşi construct. Dacă această tehnică este
folosită pentru a studia validitatea, putem vorbi de validitate factorială ca un aspect al validităţii teoretice.

EXEMPLU
În tabelul de mai jos şase subteste, componente ale aceluiaşi test:
1 2 3 4 5 6
1.Reprezentare spaţială 1,00 0,37 0,27 0,47 0,59 0,35
2. Raţionament 1,00 0,37 0,46 0,42 0,43
3. Vocabular 1,00 0,31 0,27 0,63
4. Simţ mecanic 1,00 0,52 0,42
5.Percepţia dimensiunilor 1,00 0,37
6. Logică verbală 1,00

Constatăm că reprezentarea spaţială, măsurată cu ajutorul testului este relativ în legătură cu


percepţia dimensiunilor (r = 0,59), iar rezultatele la proba de vocabular sun în legătură cu cele de la logică
verbală (r = 0,63). Se observă prezenţa a doi factori principali iar testul format din şase subteste măsoară
în realitate doi factori. O analiză factorială prin metoda componentelor principale (Hotteling) şi a rotaţiei
factorilor prin metoda varimax permite următoarele constatări. Datele sunt prezentate în tabelul de mai
jos.
FACTOR 1 FACTOR 2

158
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

1. Reprezentare spaţială 0,78 0,12


2. Raţionament 0,54 0,46
3. Vocabular 0,11 0,89
4. Simţ mecanic 0,73 0,29
5.Percepţia dimensiunilor 0,84 0,15
6. Logică verbală 0,27 0,84
Numerele prezentate în tabel reprezintă coeficienţii de saturaţie, care sunt interpretaţi ca
coeficienţi de corelaţie între factori şi variabile. Testul original este considerat un test de aptitudini pentru
studii secundare. Dar rezultatele analizei factoriale arată evident că sunt două teste omogene fiecare
măsurând un construct. Primul este compus din itemi care măsoară reprezentare spaţială, simţul mecanic
şi percepţia dimensiunilor. Acest construct poate fi numit "aptitudini pentru ştiinţe tehnice". Al doilea test
este compus din itemi care măsoară vocabularul şi logica verbală, iar constructul măsurat poate fi numit
"aptitudine verbală".
Altă abordare, folosită în contextul metodelor interteste, constă în studierea validităţii convergente
şi divergente, propusă de Campbell şi Fiske. Validitatea convergentă permite să demonstrăm că două
teste măsoară acelaşi construct, în timp ce validitatea divergentă constă în a demonstra independenţa
sau lipsa de corelaţie a unui test cu alte teste care măsoară un construct diferit.
Studiile de validitate predictivă, care vizează stabilirea legăturii dintre predictor şi criteriu, adică
predicţia criteriului pe baza scorurilor obţinute la test, sunt indicatori buni ai constructului măsurat de test.
Această tehnică este deseori folosită pentru construirea inventarelor de interese generale sau
profesionale şi a testelor de personalitate. În aceste teste trebuie introduşi itemi care diferenţiază cu
adevărat grupurile şi care vor permite descrierea psihologică a subiecţilor după randamentul la test.
Studiile de generalizabilitate sunt foarte complexe, dar în acelaşi timp foarte complete. Un
model este studiul de validitate "multitrăsături-multimetode" propus de Campbell şi Fiske. Această tehnică
se bazează pe principiul în baza căruia un test măsoară un construct folosind o metodă particulară.
Rezultatele la test pot fi dependente de constructul măsurat, de metoda utilizată sau de combinaţia celor
două. Deci, dacă vom compara trăsătura care ne interesează cu alte trăsături, folosind diferite metod,
rezultatele pot fi variabile. Este vorba de fapt de studierea validităţii convergente, a validităţii divergente
şi a omogenităţii testului.

EXEMPLU
Dacă cu ajutorul a trei teste măsurăm trei trăsături, respectiv gradul de liberalism (A), cultura generală
(B), şi alienarea (C), aplicând aceluiaşi grup de subiecţi trei metode diferite: metoda (I), cu răspunsuri la
alegere, metoda (II), prin care se cere să se răspundă cu adevărat şi fals şi metoda (III), care presupune
completare de fraze obţinem următoarele rezultate:
METODA I METODA II METODA III
Trăsături A1 B1 C1 A2 B2 C2 A3 B3 C3
MET I A1 0,87
B1 0,64 0,80
C1 0,28 0,31 0,82
MET II A2 0,71 0,58 0,27 0,85
B2 0,25 0,66 0,32 0,61 0,78
C2 0,11 0,22 0,72 0,43 0,32 0,79
MET III A3 0,70 0,30 0,08 0,68 0,52 0,37 0,81
B3 0,27 0,66 0,09 0,57 0,70 0,28 0,65 0,79
C3 0,09 0,12 0,67 0,19 0,24 0,64 0,47 0,38 0,80
Acest tabel prezintă pe diagonala principală coeficienţii de fidelitate. Se observă că pentru
metoda (I) fidelitatea pentru cele trei teste este de 0,87, 0,80 şi respectiv 0,82.

159
CORNELIU-EUGEN HAVÂRNEANU

Din tabel putem desprinde patru categorii de rezultate:


Prima categorie este evidenţiată de diagonala principală unde sunt prezentate estimările
fidelităţii pentru fiecare test şi pentru fiecare metodă (acelaşi test, aceeaşi metodă). Observăm că aceşti
coeficienţi au valori ridicate şi stabile.
A doua categorie este formată din corelaţiile dintre trăsături diferite măsurate prin metode
diferite. Aceste sunt corelaţiile:
rA1, B2 = 0,25, rA1, C2 = 0,11, rB1, C2 = 0,22, rA1, B3 = 0,27, rA1, C3 = 0,09, rB1, C3 = 0,12,
rA2, B3 = 0,57, rA2, C3 = 0,19, rB2, C3 = 0,24, rB1, A2 = 0,58, rC1, A2 = 0,27, rC1, B2 = 0,32,
rB2, A3 = 0,52, rC2, A3 = 0,37, rC2, B3 = 0,28, rB1, A3 = 0,30, rC1, A3 = 0,08, rC1, B3 = 0,09.
Toate aceste valori ajută la studierea validităţii divergente, care este foarte mică faţă de corelaţiile
aceeaşi trăsături măsurată prin metode diferite (rA1, A2 = 0,71).
A treia categorie este formată din corelaţiile dintre diferite trăsături măsurate prin aceeaşi
metodă:
rA1, C1 = 0,28, rB1, C1 = 0,31, rA2, B2 = 0,61, rA2, C2 = 0,43, rA1, B1 = 0,64, rA3, B3 = 0,65,
rA3, C3 = 0,47, rB3, C3 = 0,38, rB2, C2 = 0,32.
Aceste corelaţii sunt măsuri ale varianţei care decurge din metodele folosite.
A patra categorie este formată din corelaţiile dintre aceeaşi trăsătură şi diferite metode:
rA1, A2 = 0,71, rB1, B2 = 0,66, rC1, C2 = 0,72, rA2, A3 = 0,68, rB2, B3 = 0,70, rC2, C3 = 0,64.
Aceşti coeficienţi sunt folosiţi pentru studierea validităţii convergente.
Pe baza acestor rezultate putem face următoarele constatări:
1. Coeficienţii de fidelitate trebuie să aibă valori ridicate, la fel şi corelaţiile aceleiaşi trăsături măsurate
prin diferite metode.(vezi diagonala principală şi corelaţiile
rA1, A2 = 0,71, rB1, B2 = 0,66, rC1, C2 = 0,72, rA2, A3 = 0,68, rB2, B3 = 0,70, rC2, C3 = 0,64). Mai mult coeficienţii
de corelaţie ale aceleiaşi trăsături măsurate prin diferite metode trebuie să fie mult mai mari decât
corelaţiile dintre trăsături diferite măsurate prin aceeaşi metodă (rA1, A2 = 0,71 mai mare faţă de rB1, A2
= 0,58 şi de asemeni mai mare decât rC1, A2 = 0,27 etc). Altfel spus diferenţele dintre trăsături trebuie
să fie mult mai importante decât diferenţele dintre metode.
2. Coeficienţii de corelaţie ale aceleiaşi trăsături măsurate prin diferite metode trebuie să fie mai mari
decât corelaţiile dintre trăsături diferite măsurate prin metode diferite (rA1, A2 = 0,71 mai mare faţă rA1,
B2 = 0,25, şi de asemeni mai mare decât rA1, C2 = 0,11 etc).
3. Corelaţiile dintre trăsături diferite trebuie să fie mici (rA1, C1 = 0,28), şi corelaţiile dintre trăsături diferite
trebuie să fie foarte mici faţă de corelaţiile faţă de măsurile aceleiaşi trăsături (r A1, C1 = 0,28 mai mic
faţă de rA1, A2 = 0,71).
Vom spune că există validitate convergentă dacă obţinem corelaţii ridicate între măsurile
aceleiaşi trăsături obţinute prin diferite metode (rA1, A2 = 0,71, rA1, A3 = 0,70) şi există validitate divergentă
dacă obţinem corelaţii scăzute între trăsături diferite măsurate prin aceiaşi metodă (rA1, C1 = 0,28).
Efectul metodei este relevant dacă corelaţiile testele care măsoară trăsături diferite sunt mai
ridicate pentru aceiaşi metodă decât pentru metode diferite. De exemplu putem vorbi de un efect al
metodei dacă rA1, C1 = 0,28 sau rB1, C1 = 0,31 sunt mai mari decât rA1, C2 = 0,11 şi rb1, C2 = 0,22. În acest caz
putem vorbi de un "efect de halo" metodologic care se manifestă prin tendinţa de supraestimare a
corelaţiilor dintre variabilele măsurate prin aceleaşi metode.
Specificăm că în contextul validităţii de construct fidelitatea testului este definită ca fiind gradul
de concordanţă dintre două măsurări a aceleiaşi trăsături cu aceiaşi metodă, iar validitatea este definită
prin gradul de concordanţă între două măsurări ale aceleiaşi trăsături prin metode diferite.

160
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

8. EVALUAREA ŞI INTERPRETAREA VALIDITĂŢII UNUI TEST ÎN CONTEXTUL SELECŢIE ŞI


CLASĂRII SUBIECŢILOR

Un avantaj al cercetării corelaţionale a validităţii este posibilitatea predicţiei scorurilor criteriu


pentru un subiect pe baza scorurilor la testul predictor. În practica psihologică se pune problema estimării
unui rezultat viitor (y) pe baza unei informaţii actuale (x) despre o persoană. Problema care se pune este
în ce măsură informaţia (x) ne spune ceva despre performanţa viitoare (y). Aceasta este o problemă de
predicţie sau prognostic, problemă importantă pentru inferenţa statistică.

EXEMPLU
În tabelul ne mai jos sunt prezentate cotele obţinute de un grup de elevi la testul matrici
progresive Raven şi notele la matematică. Testul Raven dă indicaţii asupra capacităţii intelectuale a
elevilor iar notele şcolare exprimă gradul de reuşită la matematică.
x COTE RAVEN
y 31-34 35-38 39-42 43-46 47-50 51-54 55-58 59-62
10 x
NOTE 9 xx x xx
8 x xxx
MATE 7 x xxxx xx xx
6 xx x xxx xxx x x x
5 x x
Rezultă un nor de puncte, care ne permite să facem o apreciere intuitivă despre forma relaţiei
dintre cele două variabile.
Pentru simplificare, putem ajusta o dreaptă norului de puncte obţinut. Această dreaptă, care
exprimă tendinţa punctelor de pe diagrama de dispersie, se numeşte linie de regresie. Calculul obişnuit
de corelaţie se bazează pe un model liniar de regresie, ceea ce însemnă că tendinţa norului de puncte
poate fi exprimată satisfăcător printr-o dreaptă. Această dreaptă este o aproximaţie.
Gradul de legătură dintre două variabile este dat de coeficientul de corelaţie. Dar, coeficientul de
corelaţie indică numai gradul de paralelism între două colecţii de date (x şi y), faptul că ele variază într-
un anumit fel una faţă de alta. În cazul problemelor de predicţie una din variabile are statutul de variabilă
independentă sau predictor (în exemplu x, cota la Raven) şi este cunoscut dinainte de experimentator. În
cazul corelaţiei nu există o distincţie netă între cele două tipuri de cote, nu se ştie care din variabile este
responsabilă de variaţia celeilalte, deci nu se ştie care este variabila independentă.
În cazul exemplului prezentat, cotele la testul Raven constituie variabila independentă, deoarece
inteligenţa este factorul care explică în bună măsură reuşita şcolară la matematică.
Coeficientul de corelaţie între cele două variabile este de 0,68 (net semnificativ). Dacă o corelaţie
este zero sau apropiată de zero, atunci nu se poate face o predicţie de la un factor la altul, deoarece
cunoaşterea unuia nu ne spune nimic despre celălalt. Prezenţa unei corelaţii semnificative (r0,50)
implică faptul că dacă ştim ceva despre x putem şti ceva şi despre y, între ele fiind un paralelism. La fel ,
dacă ştim ceva despre y putem şti ceva despre x. S-ar putea însă ca paralelismul lor să se datoreze unui
al treilea factor.
Predicţia liniară simplă presupune o ecuaţie de regresie pentru un singur predictor. Ecuaţia de
regresie este: Y = a + b XY X.
Y = scorul criteriu prezis pentru un subiect
X = scorul la testul predictor
a = o constantă datorată diferenţei dintre X med şi Y med
b X Y = coeficientul de regresie

161
CORNELIU-EUGEN HAVÂRNEANU

Dacă a = 0 atunci b X Y = r X Y (coeficientul de regresie este egal cu cel de corelaţie predictor -


criteriu).
Această ecuaţie este utilizată pentru note brute. Dacă folosim note standard ecuaţia devine:
Y Z = r X Y ZX

Dreapta care reprezintă o curbă de regresie


DREAPTA DE REREGRESIE
Y

b YX
a

0 X

APLICAŢIE
Să presupunem că suntem în posesia următoarelor date:
 Media scorurilor la testul Raven Xmed = 47,576
 Abaterea standard a scorurilor la testu Raven SX = 7,698
 Nota matematică a unui elev Ymed =7,030
 Abaterea standard a notelor la matematică SY = 1,287
 Corelația dintre scorurile la testul Raven și notele la matematică rYX = 0,69554
Formulele importante pentru determinarea ecuaţiei de regresie liniară simplă, cu un singur predictor sunt:
𝑠𝑦
bYX = rxy ∗
𝑠𝑥
a = Ymed - [Xmed (bYX)]
1,287
bYX = 0,695 ∗ 7,698
= 0,116 a = 7,030 - [47,576 x 0,116] = 1,511
Ecuaţia de regresie este Y = a + b XY X = 1,511+0,116 X
Dacă X este 44 pentru un subiect atunci Y = 1,511+0,116 x 44 = 6,615
Dacă se folosesc note standard Z atunci a = 0 iar b X Y = r X Y
Ecuaţia are forma ZY = r X Y ZX
X  X med 44  47,576
Pentru cota brută X = 44 atunci ZX = i   0,46
SX 7,698
ZY = 0,69554 x (-0,46) = - 0,319
Eroarea standard de estimare este S est = SY 1 r 2 XY  = 1,287 1 0,695 2  =0,925
Deci pentru un scor X = 44, Y = 6,615 şi S est = 6,615 putem stabili că 68% dintre subiecţii care prezintă
un scor la predictor egal cu 44 va obţine un scor la criteriu situat între 6,615  1(0,925) adică între 7,54
şi 5,69. De asemenea, în acest caz 95% dintre scorurile criteriu se situează între 6,615  1,96 (0,925)
adică între 8,428 şi 4,802.

Predicţia multivariată şi regresia multiplă

162
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

În acest caz este vorba de o estimare a nivelului variabilelor criteriu în funcţie de performanţele
la mai multe variabile ale testele din bateria folosită pentru predicţie. În practica psihologică este foarte
dificilă realizarea unei predicţii pornind de la datele oferite de o singură probă, folosind o singură variabilă.
Frecvent, se utilizează o informaţie mai bogată, provenită de la probe diferite, care sunt reunite într-o
baterie de teste. În alţi termeni, se pune problema de a prognostica o variabilă, de exemplu emotivitatea;
pornind de la o combinaţie de date oferite de mai multe teste. Predicţia reuneşte informaţii multiple, fiind
tradusă într-o cotă globală care însumează datele obţinute în urma testări psihologice. Dar, în obţinerea
acestei cote globale probele utilizate nu au ponderi egale. Când utilizăm o baterie de teste, variabilele
măsurate vor avea ponderi diferite în elaborarea predicţiei. Din această cauză predicţia trebuie să se
bazeze pe suma ponderată a cotelor obţinute în testarea psihologică. Luându-se în consideraţie faptul că
prin folosirea mai multor probe obţinem cote globale rezultate din reunirea cotelor parţiale, nu putem
combina cote brute diferite, deoarece acestea sunt exprimate în unităţi de măsură diferite. Acesta este
motivul pentru care cotele brute trebuie transformate în cote Z care oferă posibilitatea raportării la acelaşi
sistem de referinţă. Dacă vom proceda la simpla însumare a cotelor Z, atunci vom atribui ponderi egale
datelor obţinute. Problema care se pune este de optimiza predicţia luându-se în consideraţie informaţiile
cele mai relevante. Deci, se pune problema de a dispune de un set de ponderi care să maximizeze
corelaţia dintre variabila dependentă şi suma cotelor obţinute la teste. Predicţia nu face decât să rezume
corelaţia dintre suma ponderată a cotelor la testele din bateria folosită şi variabila dependentă. Această
corelaţie este dată de coeficientul de corelaţie multiplă şi permite calcularea ponderilor care facilitează o
corelaţie maximă între variabila dependentă şi suma cotelor la teste. Pe baza corelaţiei multiple R se
poate aprecia contribuţia relativă a variabilelor test la predicţia variabilei dependente. Coeficientul R2
indică proporţia din varianţa variabilei dependente explicabilă prin combinarea datelor obţinute la teste.
Apoi trebuie să se stabilească contribuţia relativă a fiecărei variabile test, care nu poate fi dedusă imediat
din simpla citire a coeficienţilor de regresie. Fiecare variabilă test prezintă o contribuţie directă şi una
indirectă la realizarea prognosticului. În practică predicţia realizată se datorează unui număr mic de
variabile test. Prin urmare contribuţia esenţială în predicţie revine unui număr redus de variabile din
combinaţia de variabile utilizate. Se reţin variabilele care prezintă o corelaţie ridicată cu variabila
dependentă şi corelaţii reduse cu celelalte variabile.
Calcularea coeficienţilor de regresie  oferă posibilitatea scrierii ecuaţiei de predicţie a variabilei
dependente pornind de la variabilele test în cote standardizate.
Ecuaţia de predicţie este Z Y = 1Z1 + 2Z2 + 3Z3 + .......+  n Z n
Unde : Z Y = variabila criteriu în cote standardizate
Z1, Z2, Z3 .... . Z n rezultatele la teste exprimate în cote standardizate
1, 2, 3 ........n coeficienţii de regresie parţială
Avantajele aplicării studiului corelaţionat la validitate se referă la obţinerea unui indice cantitativ
care descrie relaţia dintre predictor şi criteriu pentru un grup dat. Mai mult este posibilă predicţia unui scor
criteriu potenţial pentru fiecare subiect cu ajutorul ecuaţiei de regresie
Dezavantajele sunt legate de faptul că dacă relaţia dintre predictor şi criteriu nu este liniară trebuie
să se utilizeze tehnici speciale şi mult mai complexe. O altă limită a acestei metode provine din faptul că
un coeficient de validitate nu ne permite să obţinem o evaluare directă şi justă a deciziilor, deoarece
luarea deciziilor este fondată pe utilizarea unui test. Trebuie să subliniem că valoarea unui coeficient de
validitate, atunci când utilizăm un test, depinde de proporţia de subiecţi selecţionaţi şi de proporţia de
subiecţi care vor reuşi la test.

TEST DE AUTOEVALUARE

163
CORNELIU-EUGEN HAVÂRNEANU

Apreciați valoarea de adevăr a următoarelor afirmații:


1. Un avantaj al cercetării corelaţionale a validităţii este posibilitatea predicţiei scorurilor criteriu pe baza
scorurilor la testul predictor:
a.ADEVĂRAT
b.FALS
2. În ecuația de predicție cu "y" se notează predictorul.
a.ADEVĂRAT
b.FALS
3. Validitatea divergentă constă în a demonstra independenţa sau lipsa de corelaţie a unui test cu alte
teste care măsoară un construct diferit.
a.ADEVĂRAT
b.FALS
4. În ecuația de predicție cu "x" se notează criteriul.
a. ADEVĂRAT
b.FALS
5. Validitatea de construct depinde de consistența interna a testului.
a.ADEVĂRAT
b.FALS
6. În ecuația de predicție cu "a" reprezintă coeficientul de regresie.
a.ADEVĂRAT
b.FALS
7. Coeficienţii de saturaţie în analiza factorială sunt interpretaţi ca și coeficienţi de corelaţie între factori
şi variabile.
a.ADEVĂRAT
b.FALS
8. În ecuația de predicție cu "b X Y" reprezintă panta de regresie de regresie
a.ADEVĂRAT
b.FALS
9. Validitatea congruentă corelând scorurile obţinute la noul test cu cele ale unui test bine cunoscut.
a.ADEVĂRAT
b.FALS
10. Testele care au în comun o varianţă ridicată sunt cele care măsoară acelaşi construct.
a.ADEVĂRAT
b.FALS
11. Validitatea convergentă permite să demonstrăm că două teste măsoară acelaşi construct.
a.ADEVĂRAT
b.FALS
12. Fidelitate mare este o condiţie necesară dar nu suficientă pentru o validitate mare.
a.ADEVĂRAT
b.FALS
13. Predicţia pentru sine după Thorndike presupune evaluarea scorului la criteriu fără ca evaluatorul să
cunoască corul la predictor.
a.ADEVĂRAT
b.FALS
14. Dacă între predictor şi criteriu este o corelație de 0,7, atunci 36% din varianţa criteriului este
explicată de varianta predictorului.
a.ADEVĂRAT
b.FALS
15. Validitatea vizează pertinența măsurării.
a.ADEVĂRAT

164
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

b.FALS
16. Un test poate avea fidelitate mare dar validitate mică.
a.ADEVĂRAT
b.FALS

165
CORNELIU-EUGEN HAVÂRNEANU

Unitatea de învățare 6.
STANDARDIZAREA TESTELOR

1. SEMNIFICAŢIA STANDARDIZĂRII

Standardizarea unui test presupune respectarea unor norme.

IMPORTANT
Normele sunt seturi de scoruri obţinute de subiecţii eşantioanelor studiate. Standardizarea este
importantă pentru că permite interpretarea psihologică a scorurilor şi pornind de la aceasta se pot face
interpretări.

EXEMPLU
Să presupunem că un subiect obţine la un test de inteligenţă scorul 10. Dacă scorul de 10 a fost obţinut
doar de 2% din subiecţii populaţiei generale, se situează în topul celor mai bune scoruri. În acest caz este
evident că acea persoană are un nivel ridicat de inteligenţă. Dacă însă scorul de 10 se plasează la
extrema cealaltă, cu cele mai mici scoruri (după scorurile obţinute de 98% dintre subiecţi) putem spune
că subiectul are un nivel scăzut de inteligenţă.

Fără existenţa normelor este imposibil să cunoaştem semnificaţia scorului. Standardizarea testelor este
esenţială. Ea este folosită pentru utilizarea practică a testelor, cum ar fi în luarea unor decizii în ceea ce
priveşte orientarea profesională sau selecţia personalului. Normele sunt necesare şi atunci când testele
sunt utilizate pentru un scop precis, cum ar fi de exemplu selecţia militarilor care vor participa la o anumită
operaţiune armată.

IMPORTANT
Există o aplicaţia a testelor în care standardizarea nu este importantă, şi anume în analiza psihometrică
a diferenţelor individuale - studiul ştiinţific al atributelor umane, abilităţilor, personalităţii, motivaţiei şi
dispoziţiei. Pentru aceste aplicaţii psihometrice ale teoriei psihologice, scorurile brute, directe sunt
satisfăcătoare, iar transformarea lor în norme ar duce la pierderea de informaţii.

2. PROBLEME ALE STANDARDIZĂRII

Normele folosite pentru interpretarea semnificaţiei scorurilor unui test trebuie să fie precise. Dacă,
conform normelor, un scor este obţinut de primii 20% dintre subiecţii populaţiei acesta poate sau nu să
fie reprezentativ pentru norma grupului. Dacă normele nu sunt clare, ele pot duce la o interpretare greşită.
Acest pericol apare în domeniul clinic şi psihiatric, unde există teste care sunt folosite pentru stabilirea
diagnosticului. Dacă un copil este orientat spre o anumită formă de educaţie pe baza scorurilor obţinute
la teste, este important ca normele să fie clare.
Înainte de a descrie tehnicile de standardizare şi varietatea normelor care pot fi utilizate
considerăm că este necesar să facem o precizare. Faptul că testele psihologice pot fi uşor standardizate
ne dă posibilitatea să facem comparaţii precise cu normele grupurilor.

166
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

IMPORTANT
Normele sunt necesare pentru testele psihologice pentru că nu există un zero absolut al scalelor de
măsurare. Multe forme de măsurare au un zero absolut, lungimea, greutatea pot fi măsurate cu o astfel
de scală. Lipsa lui zero absolut ar face ca măsurarea să fie imprecisă şi neştiinţifică.

3. EŞANTIONAREA ÎN STANDARDIZARE

Eşantionarea este un factor crucial al standardizării unui test. Calitatea normelor depinde de
adecvarea la eşantionul pe care acestea se bazează. În eşantionare sunt două variabile importante:
mărimea şi reprezentativitatea.

IMPORTANT
Eşantionul normativ trebuie să fie o bună reflectare a populaţiei pe care o reprezintă şi trebuie să fie
suficient de mare pentru ca erorile standard ale statisticii descriptive, adică ale mediei, abaterii standard
şi distribuţiei, să fie neglijabile.

Pentru reducerea erorilor standard o mărime a eşantionului de 500 de subiecţi este mai mult
decât adecvată. Reprezentativitatea eşantionului este independentă de mărimea acestuia. Totuşi un
eşantion mic nu poate fi cu adevărat reprezentativ pentru o populaţie mare. Normele pentru o populaţie
generală trebuie să fie realizate pe eşantioane foarte mari, pentru o reprezentare clară, dar pentru
populaţii cu variaţii mici sau pentru grupurile omogene, aceste norme pot fi realizate pe eşantioane mai
mici.

EXEMPLU
Pentru 5000 de profesori universitari, un eşantion de 500 de subiecţi este reprezentativ.

Alegerea mărimii adecvate a eşantionului reprezentativ nu se face în manieră absolută.


Eşantionul depinde de populaţie, de mărimea şi omogenitatea acesteia. Astfel, profesorii de chimie sunt
mai omogeni decât populaţia de profesori în general şi ar putea fi reprezentată de un eşantion mic.

IMPORTANT
Un eşantion mic dar reprezentativ este superior unuia mare dar nereprezentativ. O valoare mică a erorii
standard nu are nici o valoare dacă valorile observate nu sunt clare.

4. METODE DE EŞANTIONARE

O populaţie eterogenă este o populaţie generală, în care există mai multe subseturi de
persoane care diferă unele de altele. Obţinerea unui eşantion pentru o populaţie generală este cea
mai dificilă problemă de eşantionare, pentru că trebuie obţinut un eşantion reprezentativ pentru
populaţia respectivă.

167
CORNELIU-EUGEN HAVÂRNEANU

a. Eşantionarea întâmplătoare / prin randomizate

IMPORTANT
Un eşantion este întâmplător dacă există şanse egale ca orice individ să fie ales ca membru al
eşantionului.

Dacă eşantionul este suficient de mare acesta poate fi într-adevăr reprezentativ pentru populaţia
pentru care a fost desemnat. Dacă nu cunoaştem care sunt categoriile importante ale populaţiei pentru
care vrem să realizăm eşantionul, atunci eşantionul întâmplător este cea mai simplă metodă pentru a
asigura reprezentativitatea.

EXEMPLU
Să presupunem că dorim să realizăm un eşantion al copiilor cu vârsta de 11 ani din Zair pentru a
standardiza testele pentru această vârstă. Ca noi veniţi în ţara respectivă nu aven informaţii despre
variabile importante care pot afecta învăţarea în şcoală, de acea un eşantion randomizat este cel mai
indicat pentru a obţine un eşantion reprezentativ. În această situaţie se obţine o listă a şcolilor primare
din zonele reprezentative pentru această ţară. Şcolile sunt numerotate şi se aleg la întâmplare numere
pentru a selecta şcolile. Apoi toţi copii de 11 ani din aceste şcoli selectate vor fi testaţi. În acest caz
testarea se realizează pe un număr fix de copii şi eşantionul va cuprinde aproximativ 1000 de copii.

Acest exemplu ilustrează un aspect important al eşantionării întâmplătoare, şi anume asigurarea


şanselor egale pentru toţi indivizii din populaţie pentru a fi selectaţi în eşantion. Este imposibil să obţinem
o listă a copiilor cu vârsta de 11 ani şi aceasta, de fapt, este principala dificultate a eşantionării
întâmplătoare: cum obţinem o listă preliminară din care să realizăm ulterior eşantionare sau, în limbaj de
eşantionare, cum definim populaţia.

Definirea populaţiei
Nu este suficient să definim teoretic o populaţie. Acest lucru pare uşor, de exemplu, populaţia
Marii Britanii conţine toate persoanele care locuiesc în ţara respectivă. Este necesar să avem câteva
definiţii operaţionale sau definiţii concrete. Ar fi nevoie de o listă, dar unde ar putea fi găsită? Dacă am
reduce discuţia, pentru moment, doar la persoanele adulte nu am avea la dispoziţie nici o listă. Listele de
vot sunt incomplete, cartea de telefon cuprinde numai o parte din populaţie. După cum se vede o definiţie
operaţională a populaţiei generale nu este uşor de dat.
Dacă dorim să stabilim norme speciale pentru teste, şi atunci este necesar să realizăm o
eşantionare specială a populaţiei. Din nou definirea teoretică şi operaţională poate fi dificilă. Dacă dorim
să facem un studiu al criminalităţii, este posibil să obţinem o listă a celor aflaţi în închisoare, să eliminăm
ceilalţi delicvenţi, rămânând numai cei din închisori. Apoi vom alege la întâmplare eşantionul de criminali.
În acest caz există posibilitatea de definire clară a populaţiei de criminali din închisoare. Dacă dorim să
stabilim şi norme legate de aspectul schizofrenic, această listă nu este suficientă, deoarece va fi imposibil
să desemnăm un eşantion reprezentativ din populaţia de criminali aflaţi în închisoare.
Bazele pentru definirea populaţie pot fi variate. My Ghaian consideră că pentru a defini populaţia
de copii din şcoală putem folosi fie o listă a copiilor fie o listă a şcolilor. Un eşantion randomizat plecând
de la lista şcolilor este mai uşor de obţinut. Dacă aceste unităţi sunt prea mari se va la o eşantionare
aleatorie a membrilor fiecărei dintre unităţi. Şcolile sunt unităţi suficient de mici pentru a putea fi folosite
ca bază pentru realizarea unei eşantionări întâmplătoare a copiilor.

Desemnarea unui eşantion dintr-o populaţie

168
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

IMPORTANT
Procedura standard pentru a ne asigura că fiecare membru al listei va intra în eşantion este aceea de a
folosi o listă de numere întâmplătoare. Fiecare individ din populaţie primeşte un număr care poate fi apoi
extras din lista de numere. Această procedură poate fi realizată cu ajutorul computerului.

Este posibilă selecţia eşantionului pe intervale sau prin fixarea proporţiilor de populaţie din
eşantion, doar dacă poziţia subiecţilor din listă a fost randomizată.
În concluzie, eşantionarea aleatorie se poate realiza doar dacă există o listă adecvată a
populaţiei. Pentru a ne asigura că eşantionul este reprezentativ, acesta trebuie să fie suficient de mare.
Aceasta înseamnă că folosirea eşantionării aleatorii pentru stabilirea normelor de standardizare este
consumatoare de timp şi costă prea mult, fiind preferată eşantionarea stratificată.

b. Eşantioanele stratificate

DEFINIŢIE
Eşantionarea stratificată implică divizarea unei populaţii eterogene într-un număr de mai multe populaţii
omogene, aceste eşantioane de populaţii omogene putând fi combinate pentru a o forma un eşantion
reprezentativ al întregii populaţii.

Deoarece populaţiile omogene implică eşantioane mici reprezentative, eşantionul stratificat este
mai reprezentativ ca mărime în comparaţie cu eşantionul aleator.

IMPORTANT
Reprezentativitatea eşantionului stratificat depinde de variabilele utilizate pentru stratificare. Dacă sunt
folosite prea multe variabile eşantionul va fi foarte mare. Dacă sunt utilizate variabile greşite atunci
eşantionul nu va mai fi reprezentativ.

Există o regulă simplă pentru selecţia variabilelor de stratificare: ele trebuie să fie corelate cu
variabilele care sunt studiate şi trebuie să micşorăm numărul de stratificări. Câteva exemple vor clarifica
aceste reguli:
Pentru a ilustra problema obţinerii unui bun eşantion stratificat pentru populaţie, vom analiza
normele testului de inteligenţă Lorge-Thorndike. Scorurile la test trebuie să fie corelate cu vârsta şi vom
analiza cum autorii au eşantionat fiecare grup de vârstă.

EXEMPLU
Definirea populaţiei: Comunităţile formează baza eşantionării. Pentru a obţine un eşantion
reprezentativ al acestor comunităţi se va folosi o eşantionare stratificată.
Variabilele de stratificare: Bazele stratificării sunt reprezentate de factorii care corelează cel mai înalt
cu scorul la testul de inteligenţă, în comunităţi:
a. nivelul de cultură generală;
b. proporţia diferitelor profesiuni;
c. procentajul de proprietari de locuinţe;
d. mediana valorii ratei la casă.

169
CORNELIU-EUGEN HAVÂRNEANU

Fiecare comunitate a fost clasificată în funcţie de aceste 4 variabile în 5 categorii de la foarte ridicat la
foarte scăzut. Stratificarea eşantionului pe aceste baze s-a realizat pentru 44 de comunităţi şi fiecare copil
din fiecare grup din eşantioanele comunităţilor a fost testat pentru stabilirea normelor.
Rezultă un număr de 11.000 de subiecţi pentru fiecare grup, pentru vârste de la 6 la 17 ani, deci în total
136.000.
Comentarii: Metoda de eşantionare trebuie să plece de la un eşantion reprezentativ al comunităţilor şi
apoi de la un eşantion reprezentativ al copiilor pentru fiecare dintre comunităţile alese. Realizarea unui
eşantion reprezentativ pentru o populaţie necesită selectarea unui număr mare de subiecţi, ceea ce
implică costuri ridicate şi timp. O astfel de standardizare stă la baza construirii testelor.

În acest caz stratificarea s-a bazat pe variabile care corelau ridicat cu inteligenţa. Dacă ar trebui
să stabilim normele pentru un test de anxietate am folosi alte criterii de stratificare. Thorndike şi Lorge au
folosit ca normă clasa socială pentru împărţirea pe subgrupe şi pentru a face comparaţia între ele. Aceste
norme s-au dovedit a fi mai utile decât cele generale.
Acest test este un bun exemplu pentru eşantionarea stratificată. Criteriul de stratificare nu este
acelaşi pentru un test de anxietate. Vom examina în continuare eşantionul populaţiei generale pentru un
test de personalitate “16 PF” (Cattell, Eber & Tatsuoka, 1970).

EXEMPLU
Autorii a considerat că un eşantion mic, bine stratificat este superior unui eşantion randomizat. De
aceea suntem interesaţi să examinăm cum autorii au standardizat acest test. Vom prezenta în continuare
modul în care s-a realizat eşantionarea pentru subiecţii de sex feminin.
Baza stratificării: SUA. a fost divizată în opt arii geografice şi 8 densităţi ale populaţiei. Populaţia a fost
împărţită în 5 grupe de vârstă şi 7 nivele de venit. Procentajul populaţiei pentru fiecare dintre aceste
categorii a fost reflectat cât mai exact posibil în eşantionul de femei. Acest eşantion a fost de aproximativ
1000 de persoane.
Comentarii: Se pare că planificarea din acest eşantion nu a fost bună. Nu toate categoriile sunt la fel
de bine reprezentate. De exemplu, există doar 30 de femei din zonele muntoase şi 239 din două categorii
de oraşe cu populaţie peste 1 milion de locuitori. Acest eşantion nu este suficient de mare. După cum am
precizat în cazul testului Thorndike-Lorge, 10.000 de cazuri ar fi necesare pentru a avea un eşantion
stratificat reprezentativ. Eşantionul folosit pentru standardizarea inventarului “16PF” este prea mic pentru
a face comparaţii semnificative între subgrupe.

Un număr de 1.000 de subiecţi, oricât de bine stratificat ar fi eşantionul, nu este o bază de


satisfacere pentru normele generale. Din aceste motive normele pentru acest test trebuie să fie tratate cu
prudenţă.

IMPORTANT
Reguli pentru normele generale
1. un eşantion stratificat este mult mai eficient decât unul randomizat şi este mai bine să fie utilizat pentru
testele standardizate;
2. patru criterii de clasificare sunt normal suficiente. Dacă se folosesc prea multe criterii creşte mărimea
eşantionului;
3. variabilele care vor fi utilizate în stratificare trebuie să coreleze ridicat cu testul. Variabilele sex, vârstă
şi clasă socială sunt importante;

170
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

4. în fiecare grup ar trebui să fie suficienţi subiecţi pentru a forma un eşantion adecvat. Dacă luăm 300
ca minimum într-o categorie şi dacă avem, de exemplu, 5 clase sociale, 2 sexe şi 5 grupe de vârstă
există deja 50 categorii de subiecţi, ceea ce înseamnă în total 15000 subiecţi;
5. pentru a avea un eşantion adecvat pentru o populaţie generală este nevoie inevitabil de un număr mare
de subiecţi.

c. Norme de grup speciale


Deoarece în standardizarea testelor apar probleme logistice şi financiare mulţi “constructori” de
teste preferă să folosească norme pentru grupele specifice pentru care testele sunt realizate. Pentru
aceste grupuri specifice se aplică aceleaşi principii de eşantionare. Deoarece aceste grupe sunt mai
omogene, eşantioanele reprezentative vor fi mai mici. Pentru a clarifica problemele standardizării testelor
pentru grupuri specifice vom examina normele publicate de autorii anumitor teste.

Scala conservatorismului (Wilson&Patterson, 1970).


Această scală vizează măsurarea dogmatismului sau rigidităţii, descrise de Rokeach (1960) ca
atitudine care are un efect profund în multe sfere ale vieţii, şi care poate fi observată în conflictele din
Beirut şi Belfast. S-a folosit un număr mare de norme, dar în manualul testului nu sunt precizate şi motivele
selecţiei acestora. În studiu au fost incluşi studenţi universitari din 4 ţări, studenţi din colegii de educaţie,
muncitori calificaţi, subiecţi de sex feminin de vârstă şcolară şi de sex masculin de toate vârstele.

Comentarii
Examinând numărului de subiecţi pentru fiecare grup constatăm că aceste norme trebuie privite
cu rezerve. Cel mai mare număr de subiecţi se găsesc în eşantionul ocupaţiilor din Noua Zeelandă - 340
de subiecţi. Un eşantion cu o astfel de mărime nu este reprezentativ pentru varietatea profesiunilor. Au
fost examinaţi 50 de studenţi din mai mult de 4 universităţi din Marea Britanie, multe dintre ele având mai
mult de 5.000 de studenţi. Din aceste motive eşantionul de studenţi nu poate fi folosit ca bază pentru
norme. Cele mai multe dintre eşantioane sunt prea mici pentru a fi reprezentative: 22 de tehnicieni de
laborator, 22 de lucrători din biserică şi 30 de oameni de afaceri.

Concluzii
Normele utilizate au o valoare prea mică şi nu pot fi folosite pentru interpretarea scorurilor la test.
Alegerea grupelor este interesantă, dar era nevoie de un număr mai mare de subiecţi. Nu este posibil ca
rezultatele obţinute de subiecţii acestor eşantioane să fie utilizate ca norme pentru o populaţie generală.
Normele specifice grupului trebuie să aibă la bază un eşantion mai larg şi mai reprezentativ decât cel
folosit în acest test.
În 1970 Kline a dezvoltat Ai3Q, un test al personalităţii obsesive. S-au stabilit normele pentru
diriginţii claselor a VI-a din Anglia.

Obţinerea eşantionului
Pentru a avea un eşantion reprezentativ al diriginţilor claselor a VI-a, autorii s-au asigurat mai
întâi că au un eşantion adecvat al claselor a VI-a. Astfel, baza eşantionului a fost să se examineze toţi
diriginţii claselor a VI-a dintr-un eşantion stratificat al claselor a VI-a. Acest lucru a fost foarte important.
Un eşantion de diriginţi din şcoli cu clase numeroase de a VI-a şi standarde academice foarte ridicate,
cum ar fi Manchester Grammar School, St. Paulus and Cheltenham Ladies, ar fi complet greşit dacă s-ar
fi folosit ca bază pentru norme.

Stratificarea variabilelor pentru şcoli


Au fost utilizate 4 variabile de stratificare. Deşi unele din aceste variabile nu mai au aplicabilitate,
ele reprezintă un exemplu bun pentru modul cum trebuie realizat un eşantion stratificat.
 surse de finanţare: şcoli publice, susţinere directă sau de la stat;

171
CORNELIU-EUGEN HAVÂRNEANU

 sex: băieţi, fete, mixte;


 localizare geografică: orăşele, oraşe mari, mediu rural;
 sistemul claselor: şcoli de gramatică, şcoli comprehensive şi colegii de 6 clase.
A fost destul de dificil să se realizeze un eşantion echilibrat ţinând seama de toate variabilele,
deoarece există puţine şcoli publice de stat în oraşele mici, cel puţin în afara Londrei. Cu toate acestea
un eşantion reflectând proporţiile acestor şcoli în populaţie, chiar dacă există doar două şcoli pentru
fiecare categorie, ar asigura norme suficient de precise. Au fost listate toate şcolile pentru fiecare
categorie şi au fost alese întâmplător două şcoli din fiecare categorie.
Eşantionul obţinut conţinea aproximativ 1.000 de subiecţi de sex feminin şi 1.000 de subiecţi de
sex masculin, acoperind doar nordul Angliei. Chiar dacă lucrăm cu categorii omogene de subiecţi din
anumite zone geografice ale ţării, este nevoie de un eşantion mare pentru a fi reprezentativ.
Myers-Briggs Type Indicator (Myers&Briggs, 1962). Acest test, care clasifică subiecţii în funcţie
de categoriile lui Jung (extravertiţi intuitivi, extravertiţi raţionali, etc.) îl vom folosi pentru a ilustra unele
dintre problemele eşantionării. Autorii acestui test au folosit un eşantion de 3.500 de băieţi şi 2.500 de
fete din 37 de şcoli din Pennsylvania. Acest eşantion este reprezentativ pentru acest stat, dar normele
pot să nu fie valabile pentru alte state. Autorii au folosit un eşantion de 4.500 de studenţi la arte şi inginerie
din 8 universităţi, care la admitere cereau un nivel ridicat de calificare al studenţilor. Subiecţii din acest
eşantion nu erau reprezentativi şi pentru studenţii altor colegii care nu aveau astfel de condiţie la admitere
şi care, de fapt, sunt cele mai numeroase în SUA.
Au fost folosite grupe normative neadecvate: copii adoptaţi (34 subiecţi de sex masculin şi 25 de
sex feminin) şi 40 de arhitecţi nu nivel ridicat de creativitate.
Chiar atunci când investigatorii ştiu cum trebuie stabilite normele de grup, adesea aceştia nu
reuşesc să le respecte deoarece nu au resursele de timp şi materiale necesare pentru aceasta.

IMPORTANT
Reguli pentru eşantionarea grupurilor special
1. stratificarea grupului în funcţie de variabilele care corelează ridicat cu testul;
2. numărul minim pentru eşantioane este 300. Adesea este necesar să facem eşantionarea în timp;
3. un eşantion mic, cum este în cazul scalei conservatorismului, este mai bun decât deloc. Dacă a fost
utilizat un eşantion mic, utilizatorii testului trebuie să fie avertizaţi în legătură cu acest aspect. Normele
bazate pe un eşantion mic sunt doar sugestive sau experimentale, ele pot şi complet greşite
Concluzii: În principal dificultăţile eşantionării nu sunt de natură teoretică sau intelectuală, ci practice
ţinând de insuficienţa resurselor. Dacă un test este folosit pentru a lua decizii este esenţial ca normele să
respecte standardele pe care le-am prezentat anterior. Un eşantion mare şi stratificat adecvat este
esenţial pentru a avea norme bune.

5. EXPRIMAREA REZULTATELOR

După ce grupurile normative au fost testate rezultatele trebuie să fie exprimate în formă numerică.
Există mai multe modalităţi de a face acest lucru. Cele mai multe dintre metode compară scorul individului
cu grupul normativ relevant.

Norme diferite
Vom descrie în continuare câteva dintre cele mai utilizate norme, precum şi avantajele şi
dezavantajele lor.
a. Centile

172
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

DEFINIŢIE
Un centil este un scor a cărui procentaj este dat de grupul normativ.

Al 30-lea centil este un scor sub care se găsesc 30% din subiecţii eşantionului. Acestea au
avantajul că pot fi înţelese de subiecţii testaţi.

IMPORTANT
Totuşi aceste norme au şi limite importante:
a. Centilele sunt scoruri ordinale pentru care nu se pot calcula parametri statistici;
b. Distribuţia centilelor este dreptunghiulară în timp ce distribuţia scorurilor testului se apropie de cea
normală. De aceea în jurul mediei diferenţele între subiecţi sunt mici, în timp ce la extreme apar
diferenţe mari între subiecţi.

Deoarece centilele nu pot fi analizate statistic şi pentru că afectează scorurile brute, aceste norme
nu sunt recomandate. Ele pot fi folosite doar pentru explicarea rezultatelor.

b. Scoruri standard
Cele mai utile norme sunt scorurile standard. Există o mare varietate de astfel de scoruri şi în
continuare vom discuta despre cele mai frecvent utilizate.

Scorurile Z

IMPORTANT
Scorurile standard se calculează prin împărţirea deviaţiei fiecărui scor de la medie la abaterea standard
a scorurilor.
X M
Formula de calcul este următoarea: Z  , unde

Z - scorul standard;
X - scorul obţinut la test;
M - media distribuţiei scorurilor;
 - abaterea standard a scorurilor

DEFINIŢIE
Abaterea standard a testului este măsura variabilităţii testului, cât de mult scorurile variază în jurul mediei.

Proprietăţile scorurilor Z
Cel mai mare avantaj al scorurilor Z în comparaţie cu notele brute, este că scorurile Z sunt
întotdeauna echivalente. Astfel, un scor Z de 2 înseamnă întotdeauna 2 abateri standard de la medie. Ele
permit compararea scorurilor obţinute la teste diferite.

SCORURI BRUTE Scoruri Z


50 0

173
CORNELIU-EUGEN HAVÂRNEANU

Să presupunem că avem un set de scoruri la un 55 1


test la care media este 50, iar abaterea standard de 5. În 60 2
tabelul următor prezentăm scorurile brute şi notele Z 45 -1
corespunzătoare, calculate după formula prezentată 43 -1,4
anterior:

IMPORTANT
Scorurile Z au o medie de 0, o abatere standard de 1 şi pot lua valori negative şi pozitive. Un scor Z mai
mare decât media este un scor pozitiv, iar scorul mai mic decât media este un scor Z negativ.

Transformarea scorurilor brute în scoruri Z este liniară, astfel că distribuţia scorurilor brute este
menţinută în scorurilor Z. Dacă distribuţia scorurilor brute este normal distribuită atunci scorurile Z vor
avea valori între +3 şi -3. Deoarece suprafaţa curbei normale este cunoscută, scorurile Z normal distribuite
au particularităţi informative.

EXEMPLU
Aproximativ 95% din distribuţia normală este plasată între 2 abateri standard de o parte şi de alta
a mediei distribuţiei. Un scor Z de 2 poate fi interpretat în termeni de procentaj: 2% dintre subiecţi au
rezolvat mai bine, celelalte 2 procente găsindu-se la celălalt capăt al distribuţiei.

Cu toate avantajele pe care le au scorurile Z, există două probleme majore, deşi acestea sunt
cele mai simple forme ale scorurilor standard. O scală care are ranguri mici (de la -3 la +3) şi o medie de
0, are mai puţină semnificaţie, de aceea sunt mai puţin utilizate de către psihologi.
Rezultatele la multe teste se distribuie mai mult sau mai puţin normal. Când distribuţia nu este
normală distribuţia scorurilor Z nu poate şi transformată în centile.
Pentru a depăşi aceste dificultăţi psihologii transformă scorurile Z în alte scoruri standard.

Scorurile Z transformate în alte scoruri standard


Scorurile Z pot fi transformate în alte scoruri standard, atunci când se dă media şi abaterea
standard. Aceste scoruri, la fel ca şi scorurile Z, sunt compatibile cu alte scoruri standard transformate cu
aceeaşi medie şi abatere standard.
Z t  a  bZ
, unde
Zt - scorul Z transformat
a - media distribuţiei transformate
b - abaterea standard a distribuţiei transformate
Z - scorul Z
După cum precizează şi Cronbach (1976), cel mai obişnuit scorurile Z sunt transformate în scoruri
standard cu media 50 şi abaterea de 10. În tabelul de mai jos sunt date scorurile Z transformate după
formula anterioară.

Scoruri brute Z scoruri Zt


55 1 60
60 2 70
45 -1 40
43 -1,4 36

174
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

Scorurile standard normalizate


Unii psihologi preferă scorurile standard normalizate. Inteligenţa, de exemplu, necesită să fie
normal distribuită (Vernon, 1961). De aceea se utilizează scoruri standard normal distribuite.

IMPORTANT
Pentru a normaliza un set de scoruri Z trebuie parcurşi mai mulţi paşi:
a. să se calculeze proporţia cumulată a eşantionului pentru fiecare scor brut;
b. calcularea frecvenţei cumulate pentru fiecare scor. Frecvenţa cumulată pentru scorul X este
reprezentată de numărul de subiecţi care au cote sub X;
c. poate fi calculată frecvenţa cumulată pentru valoarea din mijloc al fiecărui interval al scorului, adăugând
la scor jumătate din numărul de subiecţi care au acel scor. Dacă frecvenţa cumulată a lui X este 10 şi
6 subiecţi au scorul X, atunci punctul din mijloc este 13;
d. fiecare punct de mijloc al frecvenţei cumulate poate fi convertit într-o proporţie prin împărţire la N
(numărul de subiecţi);
e. în tabele statistice care arată suprafaţa curbei de distribuţie normală, aceste puncte de mijloc pot fi
transformate în scoruri Z;
f. aceste scoruri Z sunt normal distribuite şi se poate face referire la ele ca scoruri Zn;
g. scorurile Z normalizate pot fi transformate în orice tip de scoruri standard, utilizând formula dată
anterior.

Scorurile T
Buros (1972) consideră că dacă trebuie folosite scoruri standard normalizate, atunci trebuie
folosită o scală care să aibă media 50 şi abaterea standard de 10.

IMPORTANT
Alte scoruri standardizate normalizate
a. Stanine. Acestea au media de 5 şi abaterea standard de 2. Aceste scoruri împart curba normală în
nouă scoruri;
b. Notele sten, au media de 5,5 şi abaterea standard de 1,5. Acestea au fost folosite în special pentru
testele de personalitate şi împart curba în 10 scoruri;
c. Testul de inteligenţă Wechsler utilizează o scală cu media de 100 şi abaterea standard de 15;

Utilizarea scorurilor standard normalizate

IMPORTANT
Scorurile standard normalizate pot fi folosite în condiţii speciale:
a. doar când distribuţia originală este aproximativ normală. Dacă această distribuţie nu este normală, vor
rezulta erori, în special la extremele distribuţiei;
b. trebuie utilizate atunci când există anumite aşteptări teoretice în legătură cu distribuţia normală;
c. este esenţial ca grupul de standardizare să fie reprezentativ pentru distribuţie, pentru a reflecta cât mai
exact populaţia, în special la extreme.

175
CORNELIU-EUGEN HAVÂRNEANU

Concluzii
a. scorurile brute ale testelor psihologice au înţeles doar în relaţie cu scorurile normative ale grupului;
b. valoarea normelor depinde de eşantionul sau eşantioanele care au fost folosite. Doar când aceste
eşantioane sunt adecvate populaţiei, normele pot fi folosite fără rezerve;
c. Există eşantioane foarte largi, uneori de 10.000 de subiecţi;
d. Eşantioanele stratificate sunt mai eficiente decât cele randomizate, iar variabilele în funcţie de care
eşantionul ar trebui stratificat corelează ridicat cu variabilele testului;
e. Există multe metode de exprimare a scorurilor normative;
f. Centilele nu sunt recomandate pentru că nu pot fi prelucrate statistic;
g. Scorurile standard sunt recomandate, cele mai utile sunt scorurile standard cu media 50 şi abaterea
de 10;
h. Scorurile standard normalizate sunt recomandate numai în situaţii speciale. Dintre acestea scorurile
T sunt cele mai utile;
i. Orice test psihologic trebuie să respecte procedura de standardizare. Un set de scoruri standard
poate duce la concluzii eronate dacă eşantionarea este deficitară.

Etaloane normalizate
1. Etaloane în unități sigma
Cel mai simplu etalon în clase normalizate este reprezentat de unitățile sigma, în care folosim doar
media și abaterea standard. Cu ajutorul acestor indicatori putem construi un etalon în 3, 5 și 7 clase
normalizate, luând în calcul 1, 2 sau 3 abateri standard.

176
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

EXEMPLU
Să presupunem că am media de vârstă a studenților din anul 2 la Facultatea de Psihologie este de 19,32
ani și abaterea standard are valoare 4. Aceste scoruri se distribuie normal și putem construi un etalon în
clase normalizate. În continuare vom construi un etalon în unități de abateri standard cu 5 clase egale, în
care dimensiunea unei clase are valoarea unei abateri standard. Astfel, clasa de mijloc are intervalul [X -
s s
; X + ].
2 2

15,32 17,32 21,32 23,32


3s s s 3s
X- X- X X+ X+
2 2 2 2

Etalonul astfel format poate fi scris în același mod ca și etalonul în cvintile și are aceeași semnificație.
Evident că, la distribuția acestui etalon va trebui să furnizăm date legate de structura eșantionului
normativ, distribuția variabile și sistemul de etalonare folosit, în cazul nostru în cinci clase în unități de
abateri standard.
Scoruri Clasa Semnificația
Minim – 15,32 I Foarte tineri
15,33 – 17,32 II Tineri
17,33 – 21,32 III Medie
21,33 – 23,32 IV Maturi
23,33 – maxim V Foarte maturi

2. Etaloane în clase normalizate


Etaloane în clase normalizate nu sunt altceva decât derivații ale etaloanelor în unități sigma și se
bazează pe transformarea notelor z în alte categorii de note. Algoritmul de calcul este oarecum similar
celui utilizat în realizarea etaloanelor în unități sigma și se bazează pe fracțiuni de unități sigma.
Astfel, un etalon în cinci clase normalizate are ca fracțiune ale lui z valoare z/2 iar clasele devin:
Cumulat
I Min … -3z/2 6,7% din populaţie 6,7%
II -3z/2 … -z/2 24,2% din populaţie 30,9 %
III -z/2 … z/2 38,2% din populaţie 69,1%
IV z/2 … 3z/2 24,2% din populaţie 93.3%
V 3z/2 … Max. 6,7% din populaţie 100 %

Un etalon în șapte clase normalizate are ca fracțiune ale lui z valoarea z/3 iar clasele devin:
Cumulat
I Min … -5z/3 4,8% din populaţie 4,8%
II -5z/3 … -3z/3 11,1% din populaţie 15,9%
III -3z/3 … -z/3 21,2% din populaţie 37,1%
IV -z/3 … z/3 25,8% din populaţie 62,9%
V z/3 … 3z/3 21,2% din populaţie 84,1%
VI 3z/3 … 5z/3 11,1% din populaţie 95,2%
VII 5z/4 … Max. 4,8% din populaţie 100%

Un etalon în nouă clase normalizate are valoarea z/4 iar clasele devin:

177
CORNELIU-EUGEN HAVÂRNEANU

Cumulat
I Min … -7z/4 4,0% din populaţie 4,0%
II -7z/4 … -5z/4 6,6% din populaţie 10,6%
III -5z/4 … -3z/4 12,1% din populaţie 22,7%
IV -3z/4 … -z/4 17,5% din populaţie 40,2%
V -z/4… z/4 19,6% din populaţie 59,8%
VI z/4 … 3z/4 17,5% din populaţie 77,3%
VII 3z/4 … 5z/4 12,1% din populaţie 89,4%
VIII 5z/4 … 7z/4 6,6% din populaţie 96,0%
IX 7z/4 … Max. 4,0% din populaţie 100%

6. METODE ALTERNATIVE DE INTERPRETARE A SCORURILOR LA TEST

Există metode de interpretare a scorurilor care diferă de norme şi au valoare doar în anumite
circumstanţe.

1. Criteriu de conţinut
Dacă un test solicită anumite deprinderi sau comportamente pentru a fi completat, este nevoie
ca testul să reprezinte o măsură validă ipso facto a acestor deprinderi sau comportamente.

EXEMPLU
Dacă un test de muzică cere subiecţilor să recunoască acordul dominant într-o serie, subiecţii au abilităţi
muzicale dacă aleg itemii corecţi. Validitatea conţinutului este relevantă când conţinutul este clar
specificat. Acest lucru este relativ uşor de realizat pentru nivele elementare ştiinţifice, muzicale sau
matematice, când conţinutul creşte progresiv în dificultate pentru a măsura nivele tot mai ridicate de
cunoştinţe.

Validitatea conţinutului se aplică mai mult în cazul testelor de cunoştinţe şi de abilitate.


Am introdus termenul de conţinut valid deoarece criteriul de conţinut se aplică atunci când testele
au fost construite în aşa fel încât să aibă un conţinut valid.

EXEMPLU
Pentru testarea notaţiei muzicale, un test ar trebuie să conţină toate notaţiile muzicale, cu toate că
problema notaţiilor muzicale poate fi evaluată rapid în timpul execuţiei unei piese muzicale. Un scor de
100 percentile ar indica superioritate/deplină stăpânire, iar x % ar indica x % superioritate. În aceste teste
este nevoie să se stabilească punctele de critice în funcţie de care să se decidă dacă elevul poate să îşi
mai continue cursul. În multe şcoli astfel de evidenţe empirice lipsesc, fiind înlocuite cu punctele de vedere
arbitrare ale profesorilor.

Dificultăţi ale metodei criteriului


Problemele se pot datora restricţiilor metodei criteriului atunci când conţinutul nu este clar stabilit.
Itemii testului trebuie să reprezinte un eşantion din universul de itemi. Din această cauză este dificil să
argumentăm că un scor reprezintă cel mai bun procentaj pentru subiect. Aceasta înseamnă că acest
criteriu de conţinutul poate fi utilizat doar pentru interpretarea scorurilor testului când există un conţinut
specific slab sau ridicat al testului.

178
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

Concluzii:
Criteriul de conţinut este potrivit doar pentru testele de cunoştinţe şi doar atunci când conţinutul
poate fi clar definit. Pentru cel mai scăzut nivel educaţional al claselor primare un astfel de test poate fi
valabil. Schonell (1951) a dezvoltat un set de teste diagnostice pentru citire când rezultatele indicau
aspecte exacte, cum ar fi inversarea anumitor litere, confuzie între anumite litere.

2. Criteriul de predicţie
O altă metodă de interpretare a scorurilor testului şi care nu ţine seama de norme este
probabilitatea ca subiecţii, prin fiecare scor să reflecte un criteriu particular. Trebuie construit un tabel al
aşteptărilor. Există câteva aspecte care trebuie notate.
a. Tabelele de aşteptare pot fi construite doar când sunt posibile criterii clare ale scorurilor. Acest lucru
este posibil doar pentru anumite teste din domeniul industrial şi educaţional. Examinarea scorurilor
şi gradelor reprezintă un bun criteriu pentru tabele de expectanţe, deşi în şcoli şi universităţi
examinările practice nu sunt eliberate de note.
b. Aceste aşteptări nu sunt teoretice ci empirice. Aceasta înseamnă că în studiile realizate pe scară
largă trebuie să avem o populaţie relevantă. Trebuie să avem în vedere problemele legate de
eşantionare pentru stabilirea normelor. În acest sens tabelul probabilităţilor expectanţelor reprezintă
date normative.
c. Tabelul expectanţelor ilustrează o importantă dilemă a psihologiei aplicate şi psihometriei: utilizarea
predicţiei reale în caz individual. Dacă un scor particular la un test indică 0,45 probabilitate pentru
reuşită, aceasta înseamnă că 45% dintre indivizi (în eşantionul normativ) cu un astfel de scor,
promovează examenul. În acest caz tabelele de expectanţă ne arată că 45% dintre subiecţii care au
obţinut acest scor au reuşit la test. Un evaluator ar putea respinge toţi candidaţii cu un astfel de scor
sau i-ar putea accepta pe toţi. Pentru cazurile individuale aceasta ar putea fi decizie incorectă.
Aceasta este dilema psihologiei aplicate. Tabelele expectanţelor pot fi utilizate cu anumite rezerve.
În construirea tabelului expectanţelor eşantionul poate fi divizat în funcţie de criteriul grupurilor -
reuşita/nereuşita fiind un criteriu obişnuit şi util. Scorurile testului sunt divizate astfel încât să existe un
număr egal de indivizi pentru fiecare grup, cu excepţia extremelor, şi se calculează proporţia de subiecţi
din fiecare grup care a reuşit sau nu la examen. Această proporţie reprezintă, probabilitatea ca indivizii
cu aceste scoruri la test să reuşească la examen.
Dacă eşantionarea este săracă şi tabelul expectanţelor va fi cel mai probabil greşit. Este necesar
de un eşantion larg şi reprezentativ pentru realizarea tabelului de expectanţe, dar această abordare
prezintă câteva diferenţe faţă de standardizarea eşantionului. În locul stabilirii poziţiei relative a scorului
subiectului în grupul normativ, tabelul expectanţelor stabileşte poziţia relativă a performanţei în funcţie de
anumite criterii.

3. Metoda regresiei
Scorurile ipsative
Aceste scoruri apar în orice test cu răspunsuri forţate, în care fiecare alegere este cotată.

EXEMPLU
În Testul Mecanismelor de Apărare (Gleser & Ihelevisch, 1969) subiecţii au de ales, pentru fiecare item,
dintre cinci răspunsuri care reprezintă cinci mecanisme de apărare diferite, cele care sunt mai mult sau
mai puţin probabile. Scorul testului reprezintă forţa relativă a capacităţii de apărare a individului. Trebuie
să existe unele corelaţii negative între scoruri ca un artefact al sistemului de cotare, alegerea unui răspuns
să însemne excluderea celorlalte patru. Acest sistem de cotare nu poate fi o măsură absolută a capacităţii
de apărare. Un băutor poate considera whisky-ul ca băutura favorită, apoi ginul şi coniacul, combinaţia
însă este selectată şi de un dipsoman. Aceste alegeri pot fi greu comparate.

179
CORNELIU-EUGEN HAVÂRNEANU

Utilizarea scorurilor ipsative pentru testele cu alegeri forţate are următoarele efecte. Mai întâi
matricea de corelaţie nu are semnificaţie deoarece scalele sunt artificial corelate negativ. Analiza
factorială a corelaţiilor nu poate fi interpretată. În al doilea rând realizarea normelor pentru aceste scale
nu are sens, deoarece scorurile indivizilor nu pot fi comparate.
Ar putea fi folosite normele bazate pe ranguri. Aceasta înseamnă că 60% dintre bărbaţi dau primul
rang intereselor externe, interesul pentru broderie având ultimul rang. Acestea au totuşi o valoare
îndoielnică pentru că distanţele dintre ranguri nu sunt cunoscute.
Scorurile ipsative ale unui test sunt folosite ca bază de discuţie cu subiectul care a rezolvat testul.
Aceasta înseamnă că rangurile scorurilor pot fi explicate. Utilizarea lor este restrânsă la contexte în care
scorurile sunt utilizate ca bază de discuţie şi când cuantificările sunt relativ neimportante. Deci, aceste
teste pot fi folosite în psihologia clinică, orientare profesională şi consiliere, când este important să există
un raport de încredere între subiect şi examinator.

Concluzie

IMPORTANT
Testele normative sunt superioare testelor ipsative deoarece au o precizie mai mare în măsurarea
caracteristicilor psihologice.

Scorurile ipsative sunt potrivite ca bază de discuţie. Este la fel de posibil ca şi testele normative
să fie baze de discuţie, dar prezintă şi avantajul că fi analizate statistic, lucru care nu se poate realiza în
cazul scorurilor ipsative, acesta fiind un motiv în plus ca ele să nu fie folosite.

APLICAŢIE
Realizați un etalon în 7 clase normalizate, cunoscând că media are valoarea 20 și abaterea standard este
3.

TEST DE AUTOEVALUARE (cu răspunsuri corecte ataşate la finalul cursului)


Apreciați valoarea de adevăr a următoarelor afirmații:
1.Normele sunt seturi de scoruri obținute de subiecții eșantioanelor studiate:
a. ADEVĂRAT
b. FALS
2. În analiza psihometrică a diferențelor individuale, standardizarea testelor este foarte importantă:
a. ADEVĂRAT
b. FALS
3. Normele sunt necesare pentru testele psihologice pentru că nu există un zero absolut al scalelor de
măsurare:
a. ADEVĂRAT
b. FALS
4. Eșantionul normativ trebuie să fie o bună reflectare a populației pe care o reprezintă:
a. ADEVĂRAT
b. FALS
5. Reprezentativitatea eșantionului este independentă de mărimea acestuia:
a. ADEVĂRAT
b. FALS

180
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

6. Un eşantion este întâmplător dacă există şanse egale ca orice individ să fie ales ca membru al
eşantionului:
a. ADEVĂRAT
b. FALS
7. Eşantionarea stratificată implică divizarea unei populaţii eterogene într-un număr de mai multe populaţii
omogene:
a. ADEVĂRAT
b. FALS
8. Reprezentativitatea eşantionului stratificat nu depinde de variabilele utilizate pentru stratificare:
a. ADEVĂRAT
b. FALS
9. Un centil este un scor a cărui procentaj este dat de grupul normativ:
a. ADEVĂRAT
b. FALS
10. Centilele sunt scoruri pentru care se pot calcula parametri statistici:
a. ADEVĂRAT
b. FALS
11. Scorurile standard se calculează prin împărţirea deviaţiei fiecărui scor de la medie la abaterea
standard a scorurilor:
a. ADEVĂRAT
b. FALS
12. În formula de calcul a scorurilor standard, M reprezintă scorul obținut la test:
a. ADEVĂRAT
b. FALS
13. Abaterea standard a testului este măsura variabilităţii testului, cât de mult scorurile variază în jurul
mediei:
a. ADEVĂRAT
b. FALS
14. Un scor Z mai mare decât media este un scor negativ, iar scorul mai mic decât media este un scor Z
pozitiv:
a. ADEVĂRAT
b. FALS
15. În formula de calcul a scorurilor Z transformate, b semnifică media distribuției transformate:
a. ADEVĂRAT
b. FALS
16. Într-un etalon în șapte clase normalizate, prima clasă conține 4,8% dintre subiecți:
a. ADEVĂRAT
b. FALS

181
CORNELIU-EUGEN HAVÂRNEANU

Unitatea de învățare 7.
ALTE TIPURI DE TESTE PSIHOLOGICE

Vom discuta despre testele psihologice care nu fac parte din grupurile de teste de inteligență,
aptitudini, sau de personalitate. Ele sunt diferite ca natură şi au o coerenţă care nu se regăseşte în
categoriile prezentate anterior.

1. METODELE PERCEPTIV-GENETICE

Aceste metode au fost dezvoltate de către Kragh şi Smith (1970). Aceşti autori şi-au adus o
contribuţie importantă atât pentru dezvoltarea metodei dar şi a bazei teoretice.

IMPORTANT
Aceste metode, după cum sugerează şi numele, au ca obiect de studiu dezvoltarea percepţiei. La baza
acestei metode stă presupunerea că percepţia este un proces constructiv, care reflectă totalitatea
experienţelor noastre.

EXEMPLU
Dacă percepem o fată care iese din universitate, percepţia noastră conştientă este colorată de experienţa
noastră anterioară cu fetele şi universităţile. Procesul de percepţie este, bineînţeles, instantaneu şi scapă
controlului conştient.

IMPORTANT
Aceste metode caută să supună aceste procese examinării conştiente şi să releve experienţe critice de
viaţă şi conflictele inconştiente care afectează percepţia.

O astfel de descriere se potriveşte cu ceea ce este denumit în psihanaliză ca fiind mecanism de


apărare (Freud, 1946), de aceea nu trebuie să fim surprinşi că cele mai cunoscute teste de acest tip sunt
reprezentate de mecanismele defensive.
Metodele perceptiv-genetice fac apel la percepţia inconştientă prin prezentare serială a stimulilor,
mai întâi, în limitele pragului perceptiv pragul percepţiei şi apoi gradual descreşte viteza de prezentare la
tahitoscop. La fiecare prezentare subiectului i se cere să deseneze sau să descrie ceea ce a văzut.

IMPORTANT
Distorsiunile şi schimbările în descrierea stimulilor în timpul seriilor prezentate reflectă conflictele interne
şi experienţele individuale care afectează percepţia. Procesul instantaneu de percepţie este desfăcut în
fragmente şi expus inspecţiei prin această prezentare serială subliminală.

Există două teste, cel mai frecvent utilizate în cercetările perceptiv-genetice, testul mecanismului
defensiv, DMT (Kragh, 1985) şi tehnica meta-contrastului (Kragh şi Smith, 1970). Înainte de a descrie pe

182
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

scurt testul DMT vrem să discutăm despre raţiunea testelor perceptiv-genetice, şi dacă este posibil, în
principiu, ca un astfel de test să fie o măsură validă a proceselor inconştiente. Dacă acest lucru ar fi
posibil, aceste teste ar reprezenta cel bun instrument ştiinţific psihologic care a fost dezvoltat, deoarece,
ar evidenţia ceva care normal este în întregime inaccesibil, chiar prin definiţie, şi anume ar evidenţia
procesele inconştiente. Dacă s-ar demonstra testele perceptiv-genetice permit deschiderea pentru o
inspecţie publică a procesului privat de percepţie, o nouă ştiinţa ar fi posibil să apară. Astfel, blocajele
psihologiei ştiinţifice (se ştie că procesele noastre mentale sunt private şi inobservabile) ar putea fi
rezolvate.

DMT
În acest test se prezintă cartoane cu doi stimuli care diferă doar în detaliu. Aceştia sunt stimuli
adaptaţi ai TAT - ului. Pe fiecare carton se găseşte figura unui erou, un atribut al eroului, iar în fundal, la
periferia planşei, se găseşte o figură ameninţătoare, hidoasă.

IMPORTANT
Această figură hidoasă aflată la periferia planşei implică testul în măsurarea mecanismelor defensive,
deoarece distorsiunile de percepţie din timpul prezentării seriilor pot fi surprinse prin modul în care
subiecţii tratează ameninţarea.

Sjoback (1967), în descrierea pe care o face acestor teste, consideră că expunerile de la început,
când subiecţii văd puţin, prin răspunsurile lor reflectă procese primare, inconştiente, în timp ce expunerile
din ultimele stadii devin stimuli de graniţă. În schemele de cotare din testele perceptiv-genetice momentul
din seria de stimuli la care apare răspunsul este considerat ca fiind foarte important.
Există câteva aspecte care privesc cotarea şi interpretarea testelor perceptiv-genetice (pentru
aceste testul DMT este un exemplu tipic). Mai întâi, Kragh şi Smith (1970) argumentează că transformările
de înţeles, în dezvoltarea percepţiei, dezvăluită în seriile prezentate, fac posibilă reprezentarea istoriei
personalităţii în timpul prezent. Trecutul este disponibil direct investigaţiei experimentale. Noua formă şi
semnificaţiile ei pot fi înţelese doar prin referire la istoria vieţii subiectului. Într-adevăr experienţele sunt
actualizate prin utilizarea termenilor folosiţi în aceeaşi ordine în care au apărut în viaţă. Acesta este un
paralelism, şi semnifică faptul că anul precis al unui astfel de eveniment traumatic poate fi evidenţiat printr-
o serie perceptiv-genetică.
Acest lucru pare a fi fantastic şi există numeroase dovezi empirice pentru a respinge tehnica,
legăturile cu teoria psihanalitică neajutând în această privinţă.

IMPORTANT
Kline (1987), consideră că se poate renunţa la noţiunea de paralelism fără a abandona ideea că
importante experienţe de viaţă ar putea fi evidenţiate prin aceste tehnici. De fapt, s-a demonstrat că
paralelismul nu are semnificaţie.

În afară de evaluarea faptului că fiecare răspuns la testul DMT apare într-o secvenţă strictă de
timp şi de faptul că există o demarcaţie clară a ceea ce constituie un răspuns paralel (care nu este un
paralelism), paralelismul, în aceste teste însemnând că în anumite situaţii răspunsul de la începutul seriei
perceptiv-genetice reflectă evenimente de la începutul vieţii, iar unele situaţii de la sfârşitul seriei reflectă
evenimente de la sfârşitul vieţii. Deci se poate renunţa la paralelism, fără însă a pierde puterea de
interpretare.

183
CORNELIU-EUGEN HAVÂRNEANU

Validitatea metodelor perceptiv-genetice


Nu vom discuta în detaliu despre dovezile validităţii acestor metode, ci vom evidenţia principiile
care stau la baza acestor metode. Vom avea în vedere testul DMT, deoarece s-au făcut mai multe studii
legate de acest test în comparaţie cu alte teste perceptiv-genetice (Sjoback, 1988). Pentru mai multă
claritate vom descrie pe scurt modul cum este cotat DMT. Cotarea necesită deprinderi de cotare, şi deşi
cel mai nou manual (Kragh, 1985) îmbunătăţeşte metoda de cotare, care ar trebui supervizate practic.

IMPORTANT
Scorurile la DMT
Represia: eroul sau figura ameninţătoare trăiesc sau nu sunt umane; sau ambele sunt obiecte;
Izolarea: eroul sau figura ameninţătoare sunt separate sau izolate, sau una dintre ele nu poate fi
văzută;
Negarea: ameninţarea este empatic negată;
Reactanaţa: ameninţarea este transformată în opusul ei;
Identificarea cu agresorul: eroul devine agresor;
Întoarcerea împotriva sinelui: eroul sau atributele sale sunt periculoase sau inutile; atributele devin o
ameninţare pentru erou;

Sjoback (1988), care a lucrat cu acest test, consideră că nu există dovezi definitive ale validităţi
acestui test. Acest lucru se datorează în mare parte faptului că cei care utilizează testul consideră că
acesta este valid şi fac afirmaţii clinice în legătură cu clienţii lor, afirmaţii pe care le consideră ca fiind
adevărate. Cooper şi Kline (1982) încearcă să remedieze acest deficit, realizând un studiu intens al
testului DMT. Autorii ajung la concluzia că DMT măsoară aspecte diferite de ceea ce măsoară 16 PF.
Într-un alt studiu DMT a fost obiectiv cotat folosind analiza G (Holley, 1973), rezultând că factorul DMT
corelează pozitiv cu succesul în selecţia piloţilor şi este legat de mecanismele defensive perceptive
(Dixon, 1981), care sunt o măsură a represiei. După cum notează şi Kragh (1989), testul DMT este util în
selecţia piloţilor, motivul fiind acela că cu cât se apără mai mult, cu atât aceştia vor răspunde mai încet la
ameninţare, este mult mai probabil să fie implicaţi în accidente.
Există anumite dovezi că testul DMT ar putea fi valid, dar mai este mult până când acest lucru va
fi demonstrat. Cea mai bună modalitate pentru demonstrarea validităţii testului ar fi să se combine
psihanaliza cu investigarea pacienţilor a căror inconştient este aparent cunoscut. Dacă ar apărea un acord
cu judecăţile clinice, acest lucru ar fi o dovadă a validităţii testului DMT. Acesta pare să fie un bun
argument din mai multe puncte de vedere:
a. Ar fi clar din punctul de vedere al raţiunii acestor metode perceptiv-genetice că, în principiu, ar putea
fi folosit orice stimul care reprezentă o ameninţare. Una din dificultăţile cu care ar pute să se
confrunte testul DMT ar fi că figura nu este suficient de ameninţătoare, cel puţin pentru unii subiecţi.
Westerlundl (1976) în studiul legat de agresiunea pacienţilor schizofrenici a utilizat stimuli diferiţi
(între care şi stimuli orali). S-a constat că au apărut mecanisme defensive la stimulii orali, dar nu şi
la imagini controlate.
b. Fraza “mecanismele defensive au fost constatate” sugerează un aspect important. Când testul DMT
este cotat pentru un mecanism defensiv (să spunem reactanţă) atunci când figura ameninţătoare
este descrisă ca zâmbind sau fiind plină de dragoste, aceste lucru este considerat ca fiind un suport
obiectiv al teoriei freudiene. Această interpretare a mecanismului defensiv nu este cu nimic diferită
de cea a unui analist care construieşte o remarcă complementară celei făcută de subiect cu privire
la formarea reactanţei faţă de mamă. Cu alte cuvinte, cotarea la DMT se face identic cu interpretare
a actului de către un analist, care etichetează răspunsul ca fiind un mecanism de apărare.
c. Aceste măsurări realizate cu ajutorul testelor perceptiv-genetice fac publice date rezultate din
relatările făcute de subiecţi, care sunt înregistrate în condiţii precise. Din acest motiv metodele

184
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

perceptiv-genetice sunt utile, pentru că ne permit accesul la un proces care în mod normal este
inaccesibil.

Aceste inferenţe sunt făcute analizând descrierea mecanismelor de apărare. Rămâne însă să se
demonstreze că aceste răspunsuri indică mecanisme de apărare sau alte conflicte inconştiente. Dacă
acest lucru nu se va realiza, nu vom putea spune că testele sunt valide, iar testele nu vor mai putea fi
recomandate.

Concluzii

IMPORTANT
Discuţiile despre testele perceptiv-genetice, exemplificate prin testul DMT, indică faptul că acestea permit
accesul la un material care este normal inconştient. Studiile clinice, realizate de Kragh şi Smith (1970) şi
Sjoback (1988) susţin această concluzie. În această situaţie ni se pare util să se investigheze validitatea
testelor perceptiv-genetice curente şi să se testeze eficienţa altor stimuli. Congruenţa cu ipotezele clinice,
psihanalitice constituie o dovadă a faptului că cel puţin protocoalele testelor conţin un eşantion de material
relevant.

2. TESTELE SPECIALE UTILIZATE PENTRU PACIENŢII CARE AU LEZIUNI ALE CREIERULUI

Pacienţii cu leziuni ale creierului sau suspectaţi că ar avea leziuni ale creierului după accidente
sau lovituri, precum şi pacienţii care suferă de demenţă, sunt frecvent testaţi cognitiv pentru a evalua
gradul de deteriorare mentală. Aceste evaluări sunt utile nu doar pentru diagnostic, cum ar fi discriminarea
între efectele îmbătrânirii şi ale leziunilor (Goldstein şi Shelley, 1975) dar şi pentru tratamentele de
reabilitare şi tratament. Mulţi clinicieni utilizează teste de abilitate cognitivă pentru a face discriminări între
grupele psihiatrice care prezintă tulburări de gândire datorare unor leziuni ale creierului, chiar dacă
abilităţile lor cognitive nu sunt deteriorate. Schizofrenicii cu siguranţă fac parte din această categorie.
Vom discuta despre raţiunea şi natura testelor deficitului cognitiv.

a. Utilizarea unui standard al testelor de abilitate


O abordare obişnuită pentru măsurarea deficitului cognitiv constă în utilizarea unui standard ale
testelor de abilitate. WAIS-ul (Wechsler, 1958) este potrivit pentru acest scop, deoarece scalele permit
evaluarea anumitor deficienţe cognitive. După cum menţionează Howard (1989) diferite configuraţii ale
sub-scorurilor sunt utilizate de clinicieni pentru a indica anumite deficienţe cognitive de natură organică,
precum şi altor probleme psihiatrice. Maloney şi Ward (1976) discută în detaliu utilizarea WAIS-ului.
Utilizarea WAIS-ului pentru investigarea deficitelor cognitive este împiedicată de faptul că, deşi
acesta apelează la cumularea sub-scalelor, acestea sunt totuşi prea scurte.

IMPORTANT
Deficitele cognitive sunt mai bine evaluate nu printr-o măsurare globală a abilităţilor cognitive, ci prin teste
care să fie mult mai specifice, care vizează abilităţi limitate.
b. Teste speciale
Kay (1989) argumentează că testele de inteligenţă (QI), cum ar fi WAIS-ului, nu au fost construite
pentru a discrimina pur şi simplu între grupele de subiecţi anormali, deşi după cum am văzut este sunt
folosite în acest scop, şi că ar trebui folosite teste special construite care oferă sensibilitatea şi
discriminarea necesară. Kay consideră că aceste teste ar trebui să vizeze măsurarea proceselor şi

185
CORNELIU-EUGEN HAVÂRNEANU

funcţiilor cognitive. Pentru ca aceste teste să fie valabile este nevoie de o bază teoretică, ca cea evocată
de Sternberg (1981) şi Cattell (1971).
Goldenberg (1989) a fost preocupat de raţiunea dezvoltării acestor teste pentru folosirea lor în
diagnostic şi tratament în psihologia clinică.

IMPORTANT
Ideal ar fi ca realizarea testelor neuro-psihologice să vizeze cât mai mult posibil funcţii cognitive specifice.
Totuşi cele mai multe teste neuro-psihologice nu au o utilitate specifică pentru că ele sunt desemnate să
descrie statusul cognitiv al pacienţilor fără a face referinţă la creier.

Goldenberg argumentează că încercările de a construi teste pure pentru un singur factor ale
funcţiei cognitive specifice sunt foarte rare, chiar dacă acestea au avut succes. Trăsăturile, deprinderile
sau comportamentele sunt complexe factorial.
După cum susţine Goldenberg (1989) există unele consecinţe importante ale faptului că de fapt
nici unul din teste nu este precis neuro-anatomic. Din acest motiv diagnosticul neuro-psihologic este
însoţit de necesitatea de a administrare a unei baterii de teste. Testele neuro-psihologice cu un singur
factor şi deficienţele performanţei la un singur factor nu sunt necesare pentru a evidenţia disfuncţia unei
singure localizări neuro-anatomice sau a unei simple dimensiuni cognitive. De aceea este nevoie de o
baterie de teste neuro-psihologice.

IMPORTANT
În acest context, măsurarea utilă pentru psihologia clinică a unui deficit cognitiv, implică utilizarea unor
teste care să măsoare o mare varietate de funcţii în special acele procesări de informaţii care au fost
identificate ca fiind importante în psihologia cognitivă. Aceste măsurări pot să permită inferenţe cu privire
la locul şi extinderea leziunilor creierului.

Warrington (1975 a realizat studii pentru a elucida deficitele care apar în diferite tulburări
patologice). El a realizat studii de psihologie experimentală cognitivă asupra leziunilor implicate în
memoria sistematică şi recunoaşterea obiectelor. A realizat un instrument util - Testul de Recunoaştere
din Memorie (Warrington, 1984). Acest test cere subiecţilor să recunoască cuvinte sau obiecte care au
fost anterior prezentate. Se poate obţine un scor la recunoaşterea verbală şi cea vizuală şi se consideră
că rezultatele ar indica locul leziunilor din creier, ambele scoruri putând fi folosite ca bază pentru
diagnostic şi tratament. Acest test este doar o măsură şi nu reprezintă o parte dintr-o baterie.
O baterie tipică pentru evaluarea neuro-psihologică este Bateria Luria Nebraska (Golden, 1980),
care evaluează un rang neuro-psihologic. Aplicarea testului durează 3½. Această baterie măsoară
motricitatea, ritmul, funcţiile tactile şi vizuale, viteza de receptivitate şi expresivitate, scriere, citire,
memorie şi procesele intelectuale. Toate aceste teste s-au dovedit utile pentru construcţia unui tablou
cognitiv al deficitelor cognitive ale subiectului şi a posibilei deteriorări neuro-psihologice.

186
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

Concluzii

IMPORTANT
În esenţă aceste teste încearcă să evalueze funcţiile cognitive de bază, şi au ca fundament teoretic teoriile
psihologice cognitive. Normele sunt esenţiale pentru că ne permit să vedem care sunt afecţiunile tipice
ale creierului.

3. TESTE SPECIALE ŞI LISTE (CHECKLIST)

Vom discuta despre construcţia şi utilizarea testelor care sunt virtual liste (checklist).

EXEMPLU
Lista simptomelor sau caracteristicilor unei sesiuni de terapie. Acestea sunt adesea folosite în evaluare
şi în studii de psihoterapie, unde se urmăreşte evaluarea progresului sau rezultatelor terapiei sau a ceea
ce simt clienţii în legătură cu tratamentul.

În studiile lui Sheffield (Shapiro, 1990) sunt prezentate câteva teste de acest tip. Vom prezenta
şi noi câteva dintre aceste teste.

a. Teste de conţinut.
Deşi aceste teste sunt de natură clinică, teste similare au fost construite pentru a fi utilizate în
diferite contexte. În psihologia educaţională este posibil să se construiască liste (checklist) pentru
evaluarea performanţelor şcolare şi pentru evaluarea problemelor de comportament ale copiilor în clasă.
Stott (1957) a construit un set de teste care sunt utilizate în acest scop - Ghidul Bristol de Ajustare Socială
- care evaluează comportamentul copiilor la şcoală şi acasă. În psihologia ocupaţională listele sunt folosite
pentru evaluarea comportamentului angajaţilor şi sunt valabile pentru evaluarea caracteristicilor dezirabile
şi necesare pentru un anumit post. Chestionarul Analizei Poziţiei (McCormick, 1972) este un exemplu
pentru acest tip de teste.

b. Fidelitatea şi analiza factorială a testelor


Scala de evaluare SCL-90 (Derogatis, 1973) este un exemplu pentru acest tip de teste. Aceasta
constă într-o listă de 90 de simptome pe care subiecţii le evaluau cât de mult le-au resimţit în ultimele
două săptămâni. Itemi tipici au fost: simt critica celorlalţi, simt că orice lucru pe care îl fac este un efort,
exagerez etc. Este evident că dacă simptomele sunt bine alese şi pot fi utile, pentru diagnostic, în găsirea
unor grupări de simptoame, în evaluarea şi monitorizarea psihoterapiei, în care se presupune că dacă
lucrurile vor merge bine pe parcursul terapiei simptomele vor scădea în intensitate şi vor fi mai puţine ca
număr.

IMPORTANT
În utilizarea acestui tip de teste, care sunt complet empirice şi ateoretice, singurul criteriu pentru eşecul
sau succesul terapeutic îl reprezintă apariţia simptomelor.

Pentru astfel de scale trebuie să se demonstreze precizia şi să se arată că aceste scale conţin
unul sau mai mulţi factori. În prezent aceste demonstraţi sunt lipsite de semnificaţie. Se presupune că

187
CORNELIU-EUGEN HAVÂRNEANU

pacienţii fac raportări corecte, fie că au fie că nu au aceste simptome. Astfel, scala are sau nu consistenţă
internă.

IMPORTANT
Consistenţa internă şi fidelitatea reflectă pur şi simplu gradul în care aceste simptome se întâmplă să fie
asociate cu altele în viaţa de zi cu zi.

Acest lucru este departe de situaţia în care se încerca să se demonstreze că un set de itemi ai
unui test de personalitate sunt extraşi dintr-un domeniu comun de itemi, în care trebuia să se demonstreze
că aceşti itemi sunt legaţi. Pentru a cota precizia consistenţei interne a listelor (checklists) înseamnă pur
şi simplu supunerea la ritualul psihometric. Coeficienţii nu sunt importanţi.
Acelaşi lucru se întâmplă şi în cazul analizei factoriale. Informaţia că există x factori nu înseamnă
nimic mai mult decât că x grupe de simptoame tind să se grupeze împreună. Acestea pot confirma
categoriile de diagnostic, care pot prezenta interes clinic. Totuşi în multe situaţii astfel de factori pur şi
simplu reflectă asemănările semantice ale itemilor. Un exemplu de astfel de test este scala relaţiilor client-
terapeut, care a fost studiată de Shapiro (1990). Un cluster de itemi se referea la ceea ce simt pacienţii
despre terapeut iar altul se referea la descrierea terapeutului. Autorii nu fac referire la alte variabile care
s-ar afla în spatele testului. Universul de itemi din care a fost realizat testul a fost un set de itemi care
descriau terapeuţii. Aceasta este în contrast cu un set de itemi ai extraversiunii, care dacă testul este
valid reflectă un set larg de comportamente, care se află în spatele testului. Faptul că pot să existe mai
mulţi factori, nu numai unul, înseamnă doar că un scor nu poate fi utilizat bazându-ne doar pe o simplă
adiţionare a itemilor liste (checklist). Chiar dacă există câţiva factori într-o listă a simptomelor, numărul
absolut al simptomelor, înainte şi după tratament poate prezenta interes.

IMPORTANT
Din aceste argumente se poate vedea că în listele (checklist) nu revendică faptul că este măsurată o
variabilă prin intermediul itemilor, precizia şi construcţia factorială este mai puţin importantă decât în cazul
testelor psihometrice, unde variabilele sunt mai mult sau mai puţin o listă de itemi asemănători.

c. Liste (checklists) şi simţul comun


Aceste liste sunt construite intuitiv plecând de la simţul comun, rezultatul fiind acela că este greu
de găsit ceva nou. Simţul comun poate fi refuzat dacă ipoteza nu este confirmată. Acest lucru se întâmplă
pentru că, prin natura construcţiei lor aceste test nu pot produce noi variabile. Această situaţie
contrastează cu testele de personalitate psihometrice unde, variabilele obţinute în urma analizei
factoriale, cum fi extraversiunea, anxietatea, obsesii, permit psihologilor să dezvolte noi modele de
personalitate.

Concluzii: liste (checklist) şi natura factorilor

IMPORTANT
Esenţa problemei este legată de natura factorilor. Am subliniat importanţa testelor analizate factorial.
Totuşi aceste teste, măsoară factori pentru care există un tip de validitate externă.

Un astfel de exemplu este inteligenţa. Factorul inteligenţă, măsurat prin intermediul testelor de
inteligenţă, prezic succesul academic, ocupaţional. Dar există şi indexul ridicat al eredităţii.

188
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

Din nefericire unele teste măsoară pur şi simplu specificităţi umflate (Cattell, 1978). Astfel de
teste au o precizie ridicată şi itemii au o saturaţie mare în factorul măsurat. Totuşi factorii cu specificităţi
umflate pot fi distinşi de factorii independenţi, importanţi prin faptul că aceşti factori nu corelează cu alte
variabile. În esenţă multe liste (checklist) şi teste similare sunt de acest tip. Itemii formează factori pentru
că evident similari. În acest caz informaţia psihologică este obţinută din itemii înşişi.

EXEMPLU
În scala relaţiei client-terapeut există un item: “Deprinderile profesionale ale terapeutului meu sunt
impresionante”. Se presupune că acest item şi ceilalţi itemi similari permit distincţia celor care se bucură
de terapie, care se simt bine ca rezultat al terapiei. Totuşi nu se poate face mai mult decât această
inferenţă, şi anume că cei care se simt mai bine şi se bucură de terapia găsesc că terapeutul lor este
impresionant. Dacă rezultatele sunt slabe, pacienţii care nu se simt mai bine nu găsesc deprinderile
terapeutului lor ca fiind impresionante şi doar acest lucru putem să-l afirmăm.

Uneori aceste informaţii pot fi valabile dar nimic nu se adaugă analizând factorial aceste teste.
Testele au răspunsurile cuantificate în aşa fel încât să fie posibil să se comparare grupele statistice. Se
pare că este puţin mai mult decât cunoaşterea anterioară, care punea pe primul loc construcţia testului.

4. TESTE DE EMOŢII BAZATE PE MODELE CIRCUMPLEX ŞI ALTE MODELE SIMILARE

Există un mic grup de teste construite după modelul Guttman, numit şi modelul circumplex.

Descrierea modelului circumplex


Acesta este un model particular în care apare analiza în faţete (facet). O faţetă (facet) este un
sistem de clasificare în care fiecare faţetă (facet) poate avea mai multe nivele de clasificare. În analiza
faţetelor (facet), după cum menţionează Nunnally (1978) există un număr de stadii. Să presupunem că
avem o colecţia de teste. Mai întâi trebuie să sugerăm o structură a faţetei, în care există o anumită
combinaţie a tuturor categoriilor. Această structură propusă ar trebui să ne conducă la o matrice ipotetică
de intercorelaţiilor testelor. Atunci când matricea ipotetică este comparată cu corelaţiile actuale,
observate, sunt posibile testele statistice (ale potrivirii). Dacă suma faţetelor este bună, atunci cotarea
testului trebuie calculată ca o măsură a faţetelor de bază.

IMPORTANT
După cum argumentează Nunnally (1978) această analiză a faţetelor (facet) face referinţă la o analiză
corelaţională masivă deoarece se referă la structura ipotetică a întregii matrici mai curând decât la factorii
individuali. Faţetele (facet) pot fi explicate în termenii combinaţiilor lor, a factorilor ce stau la baza matricei.
Deşi este posibil să derive noi faţete (facet) din corelaţiile dintre teste, în mod obişnuit în analiza faţetelor
(facet) se începe cu ipotezele referitoare la faţete şi combinaţiile dintre acestea în cadrul fiecărui test.

În cadrul acestui model structura faţetelor este circulară. Fiecare variabilă poate fi privită ca un
cluster deoarece este un amestec al componentelor faţetelor. Începem cu variabila 1 (sunt 8 variabile)
fiecare variabilă are mai multe în comun cu variabilele vecine decât cu cele care se află la distanţă (de
exemplu variabila 1 cu 2, variabila 7 cu 8). Totuşi ele sunt aranjate într-un cerc, în care variabilele din
mijloc 4, 5 şi 6 au mai puţin în comun cu extremele decât între ele, în timp ce variabilele de la extreme ce
suprapun în termenii compoziţiei faţetelor (1 şi 8). Într-un model circumplex se pleacă de la diagonala

189
CORNELIU-EUGEN HAVÂRNEANU

părţilor matricei, numărul de faţete în comun începe de la zero şi apoi creşte indicând natura circulară a
naturii varianţei împărţite.
Nunnally (1978) ilustrează excelent modelul circumplex plecând de la faţetele comune, care clarifică
natura ordonării circulare. Trebuie menţionat că este posibil să convertim o matrice a faţetelor comune într-
o matrice ipotetică de corelaţii: numărul de faţete comune poate avea legătură cu procentajul de varianţă
comună, a cărui rădăcina pătrată este corelaţia. Reproducem aceasta în figura 1.
Trebuie să facem câteva precizări legate de acest model. Mai întâi, după cum argumentează
Nunnally (1978) acest model reprezintă un sumar elegant al datelor în matricei de corelaţie. Aceasta este
raţiunea analizei factoriale, dar din analiza factorială nu rezultă un număr evident de factori, dar ea poate
fi folosită pentru găsirea unui principiu de rezumare a datelor. Adepţii analizei corelaţionale masive susţin
că modelul circumplex permite acest lucru. McCrae şi Costa (1989) argumentează că modelul permite o
bună evaluare a personalităţii şi poate fi privit ca un model complementar la descrierea analitică a
factorilor.
Cooperant

A: Încrezător
Docil
Responsabil B: Stabil
B: Stabil
A: Încrezător C: Afectiv
C: Afectiv
B: Stabil
D: Supus
C: Afectiv

7 6 C: Afectiv
8 Modest
A: Încrezător
Managerial
1 5 D: Supus
B: Stabil
2 4 E: Neîncrezător
3
G: Ostil

D: Supus
A: Încrezător
E: Neîncrezător
F: Instabil
E: Neîncrezător
F: Instabil
G: Ostil Sceptic
F: Instabil
Competitiv
G: Ostil
Agresiv

Figura 1

IMPORTANT
Totuşi metoda analizei masive este complexă din punct de vedere logic şi statistic, iar dificultatea se
datorează lipsei de claritate în ceea ce priveşte diferenţele dintre noţiunile de faţetă şi variabilă.

O altă obiecţie a fost menţionată de Nunnally (1978). Analiza faţetelor, spre deosebire de analiza
factorială nu este o metodă de descoperire. Mai curând este o metodă de testare a ipotezei. Totuşi
modelul circumplex este o ipoteză extrem de complexă şi doar foarte rar este posibil ca ipoteza unei

190
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

structuri cu o astfel de complexitate să ducă la obţinerea de cunoştinţe curente în domenii psihometrice


principale ale personalităţii, motivaţiei şi abilităţii.
Din descrierea simplificată a modelului se poate observa că faţetele sunt fie prezente fie absente.
Totuşi în aplicaţiile realiste ale testelor psihologice o astfel de măsurare simplă este mai puţin probabilă.
Se poate avea în vedere şi greutatea diferită a diferitor faţete, iar acest lucru ar duce la complicarea
modelului circumplex.
Poate că cel mai important aspect se referă la faptul că analiza faţetelor nu este o metodă de
construcţie prin analiză a faţetelor de bază. Acest lucru deosebeşte modelul de analiza factorială.
Chiar dacă s-a arătat că este un model sumar al matricelor de corelaţie complexe, descrierea nu
pare să aibă o semnificaţie particulară. Este un punct de vedere subiectiv. Există autori care pot găsi o
descriere valabilă a modelului circular sau o semnificaţie a acestuia.

Concluzii
Din descrierea şi discuţiile asupra modelului circumplex este clar că este o metodă ingenioasă
de sumare a matricei scorurilor la test.

5. CERCETĂRILE LUI PLUTCHIK

Plutchik a studiat o perioadă lungă de timpe emoţiile. Abordarea psiho-evoluţionistă (Plutchik,


1980) a emoţiilor le leagă de trăsături şi stări.

IMPORTANT
Trăsăturile sunt privite ca stări afective (emoţii) care persistă şi apar frecvent între-o varietate de situaţii.

În cadrul teoriei sunt aduse noţiunile de mecanisme de apărare şi mecanisme inconştiente pentru
a putea explica conflictele emoţionale şi de coping, tehnicile conştiente fiind folosite pentru rezolvarea
acestor conflicte.
Aceasta este baza teoretică a testelor de emoţii ale lui Plutchik care sunt făcute să se potrivească
modelului circumplex. Aşa cum s-a afirmat trăsăturile de personalitate, în cadrul acestei teorii derivă din
emoţii. Trăsăturile rezultă din persistenţa situaţiilor care produc emoţii amestecate.

EXEMPLU
O persoană care întotdeauna simte teamă în situaţii dar care doreşte să fie plăcută de ceilalţi mult mai
probabil va dezvolta trăsătura de docilitate (Plutchik şi Conte, 1989).

Dacă caracteristicile înnăscute ale emoţiilor se reflectă în trăsăturile de personalitate, atunci,


conform lui Plutchik şi Conte (1989), modelul circumplex este bun pentru măsurarea trăsăturilor şi
emoţiilor. În termenii modelului circumplex emoţiile pot fi aduse ca faţete ale diferitor trăsături de
personalitate.

a. Indexul profilului emoţional


Plutchik (1980) a descris măsurarea a opt emoţii de bază. Se presupune că toate trăsăturile de
personalitate rezultă din amestecul a două sau mai multe emoţii primare. Timiditatea implică frică, de
exemplu, iar melancolia implică tristeţea.
Indexul este un test cu alegeri forţate în care 12 termeni trăsături de personalitate sunt aranjaţi în
perechi, luându-se în seama toate combinaţiile posibile (excluzând patru perechi identice), subiecţii

191
CORNELIU-EUGEN HAVÂRNEANU

trebuind să aleagă cuvântul din pereche care îi caracterizează cel mai mult. Pentru fiecare cuvânt este
ales scorul pe una sau mai multe dintre cele opt dimensiuni emoţionale de bază.

IMPORTANT
Aceste dimensiuni sunt: bucurie, acceptare, surpriză, frică, dezgust, tristeţe, aşteptare şi furie. Acest test
măsoară toate dimensiunile care sunt aranjate circumplex în termenii similarităţii şi bipolarităţii.

Subiecţii primesc un scor pentru fiecare dintre cele opt dimensiuni ale testului. Apoi acest scor
este convertit în centile pe baza unui eşantion de 500 de subiecţi de sex masculin şi 500 de subiecţi de
sex feminin. Aceste centile sunt reprezentate grafic într-un cerc împărţit în opt segmente, unde zero este
la centru cercului iar centilul 100 pe circumferinţa cercului. Autorii menţionează că precizia/fidelitatea
testului este ridicată (Plutchik şi Conte, 1989). Conform acestor autori valoarea mai însemnată a EPI se
bazează direct pe teoria emoţiilor, care a determinat alegerea unei dimensiuni ce va fi măsurată, care va
fi bază pentru identificarea componentelor emoţionale ale trăsăturilor şi în final se va dovedi o bază pentru
măsurarea conflictului amestecului dintre trăsături şi emoţii.

Concluzii

IMPORTANT
Nu s-a urmărit evidenţierea valorii Indexului Profilului Emoţional ci de a ilustra modelul circumplex ca bază
pentru construcţia unor teste. Plecând de al descrierea teoriei şi a testului este clar că acest model poate
fi utilizat în construcţia testului.

Înainte de a analiza valoarea acestui model, vom descrie pe scurt instrumentul dezvoltat de
Plutchick, şi anume Indexul Profilului de Personalitate, PPI.

b. Indexul Profilului de personalitate.


Testul PPI se bazează pe faptul că modelul circumplex care este cea mai bună descriere a
trăsăturilor. Trăsăturile utilizate în acest test sunt cele indicate de modelul cirumplex al lui Conte (1975)
şi Conte şi Plutchick (1981), care investighează structura a 171 de itemi.
Versiunea finala a PPI-ului conţine 89 de itemi (termeni trăsături) la care subiecţii răspund pe o
scală cu 5 trepte de la “niciodată” la “foarte des”. Dimensiunile modelului circumplex sunt: acceptare,
supunere, pasivitate, asertivitate, sociabilitate, respingere, agresiune şi revoltă.
Întrebarea la care trebuie să se răspundă cu privire la PPI se referă la natura celor opt trăsături.
Dacă ele se potrivesc modelului circumplex şi ce vizează ele? După părerea autorilor faptul că trăsăturile
se potrivesc modelului are mai puţină importanţă din punct de vedere psihologic. Ele sunt au mai puţină
importanţă decât o structură factorială simplă, care ne informează în legătură cu mărimea factorilor,
intercorelaţii şi faptul că aceştia sunt factorii principali ai câmpului. Modelul circumplex ne informează pur
şi simplu că factorii pot fi aranjaţi logic pe circumferinţa unui cerc. Astfel se elimină problema referitoare
la faptul că unii factori pot să nu se potrivească prea bine paternului.

IMPORTANT
Este dificil de validat aceste dimensiuni. Plutchick şi Conte (1989) afirmă că analizând modul cum termenii
au fost grupaţi în jurul modelului circumplex, indicând faptul că aceştia au o structură explicită
asemănătoare.

192
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

De exemplu, o grupare este clar legată de agresiune (e.g. “argumentativ”, “beligerant”) şi un alt
grup de cuvinte, cum ar fi sincer, puternic, şi candid (nepărtinitor) reflectă asertivitatea şi nu agresiunea.
Acest lucru ne atenţionează că argumentele psihometrice trebuie analizate cu atenţie.
Afirmaţia “o grupare este clar legată de agresivitate” nu semnifică nimic mai mult decât faptul că
autorii cred că acest lucru este adevărat. Pentru a spune că termenii sunt înrudiţi celui de agresiune nu
este o problemă de opţiune ci este nevoie de suport empiric care să ofere dovezi. Simpla aserţiune nu
este suficientă. Acest lucru este mai important pentru a doua aserţiune, şi anume că cuvinte similare
măsoară mai curând asertivitatea decât agresiunea. Această etichetare a dimensiunii este pur şi simplu
un aspect al validării. Este important pentru că un argument al acceptării modelului circumplex este acela
că dimensiunile trebuie să posede calităţile asemănării şi polarităţii.

IMPORTANT
Dimensiunile indexului profilului de personalitate sunt identificate doar în termenii itemilor lor, iar această
formă de validitate nu este satisfăcătoare. Faptul că ei sunt aranjaţi într-un circumplex ne dă puţină
informaţie despre structura lor. Este nevoie de o analiză factorială a acestor scale cu factori principali de
personalitate. Este posibil ca să rămână puţină varianţă neexplicată în IPP şi de aceea putem avea nevoie
ca descrierea circumplexă să fie înlocuită.

Concluzii
Aceste două exemple de teste ale lui Plutchik şi colegilor care se bazează pe modelul circumplex
care nu pare să aibă un suport suficient pentru a fi utilizat şi a avea valoare în construcţia testelor. Acest
tip de descriere ar putea fi utilă dacă s-ar arăta că variabilele din modelul circumplex nu se potrivesc cu
alte structuri. Acest lucru nu se aplică şi în cazul IPP, pentru că toate scalele corelează semnificativ cu
Scala Stimei de Sine a lui Fitts (1965). Aceasta înseamnă că acest scale nu sunt independente şi că
dispare structura modelului circumplex. După cum s-a sugerat anterioară analiza factorială a acestor
scale indică doar o mică varianţă rămasă neexplicată. Plutchik şi colegii săi au arătat că structura
modelului circumplex se potriveşte scalelor. Totuşi rezultă o mică semnificaţie psihologică din aceste
corelaţii cu scala stimei de sine, şi este posibilă o mai mare cantitate de varianţă a acestor itemi.
Aceleaşi argumente e aplică şi scalei emoţionale. Cele 12 termeni trăsături care au fost utilizaţi
pentru construcţia scalelor au fost selectaţi doar pe baza faptului că exista un bun acord între judecăţile
privitoare la consecinţele emoţiilor. Acest lucru nu este mai mult decât un aspect al validităţii. Ca în cazul
EPI o analiză factorială a acestor scale cu notele pentru factorii de personalitate ar releva natura varianţei.
În prezent etichetarea lor se face pur şi simplu în termenii validităţii şi teoriei emoţiilor a lui Plutchik.
Aceste două exemple de teste construite după modelul circumplex nu par să ofere suficient
suport ca bază pentru construcţia testelor. Principale problemă a modelului provine din faptul că chiar
dacă există o descriere a datelor aceasta nu este o descriere informativă. Există puţină informaţie care
să ducă la concluzia că scala se potriveşte unui circumplex.
Modelul va fi util atunci când va fi clar faptul că modele psihometrice normale, cum ar fi o simplă
structură de factori, nu se potriveşte complexităţii datelor.

193
CORNELIU-EUGEN HAVÂRNEANU

6. REPERTORIUL CU TEST GRILĂ

Au fost dezvoltat de Kelly (1955) ca metodă de colectarea de date relevante pentru teoria
constructelor personale. Aceste instrumente nu sunt teste, deşi ele au fost astfel descrise de unii
psihologi.

IMPORTANT
Esenţa teoriei constructelor, care stă la baza acestor instrumente este aceea că oamenii sunt văzuţi ca
oameni de ştiinţă care întotdeauna încearcă să dea un sens lumii înconjurătoare.

Ei fac acest lucru formând constructe care sunt dependente de experienţa lor cu o specificitate
care ţine de propria persoană. Kelly şi teoriile constructiviste (Bannister şi Main, 1968) consideră că
testele psihologice standard sunt lipsite de valoare deoarece semnificaţia itemilor este diferită pentru
fiecare individ. Repertoriul cu test şi grilă ajută la elucidarea semnificaţiei unor constructe importante din
viaţa individului.

Descrierea unui repertoriu


O listă conţine elemente şi constructe. “Elementele pot fi orice din lume, pentru a cita pe Bannister
(1973), filme, deschiderea unei cutii cu brânză, ..., tipuri de trandafiri ş.a.m.d.” Constructele sunt
discriminările pe care le face persoana între elementele listei. O astfel de listă ne ajută să elucidăm astfel
de constructe, respectiv elementele care sunt relevante.

Un exemplu de listă

EXEMPLU
Să presupunem că suntem interesaţi de constructele unei femei despre lume. Îi vom cere să numească
15 persoane importante din viaţa ei, cum ar fi mama, tata, iubit, şeful de la serviciu etc. Acestea vor fi
elementele. Constructele vor fi obţinute de la subiect prin gruparea elementelor în trei şi cerând subiectului
să ne spună două grupe care sunt apropiate şi diferite de a treia. Astfel, putem obţine că A şi B sunt
inteligenţi, în timp ce C este slab. Constructul este: inteligent-slab. Asemănător vom descoperi că D şi E
sunt manieraţi în timp ce F este nemilos. Este important ca constructele să fie elaborate de subiect
deoarece sunt particulare pentru acesta.

Există şi alte metode pentru a elabora constructe, dar ele sunt esenţial echivalente metodei pe
care au descris-o. Trebuie menţionat că există mai multe tipuri de metode descrise de Kelly (1955), multe
dintre ele au fost rar folosite. Una dintre ele explorează relaţiile dintre constructe, în mod particular care
constructe implică alte constructe (Hinkle, 1965).

Analiza listelor
Subiecţilor li se poate cere să ierarhizeze fiecare element al fiecărei construct sau să evalueze
fiecare element al fiecărui construct. Ambele metode au ca rezultat corelaţii între constructe. Este posibil
să vedem ce constructe merg împreună şi bineînţeles cum se plasează indivizi similari în funcţie de aceste
constructe. Astfel putem constata că inteligenţa şi cruzimea sunt corelate, şi apoi întorcându-ne la
elemente să constatăm, de exemplu, că un profesor de la liceu care este urât de subiect este văzut în
mod asemănător în relaţie cu mama.

194
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

IMPORTANT
Este clar că această metodă produce informaţii care sunt utile pentru înţelegerea indivizilor particulari şi
aceste liste par să fie potrivite pentru utilizare clinică Este dificil însă de stabilit ce se poate face mai
departe cu aceste informaţii, având în vedere faptul că listele pentru diferiţi indivizi nu sunt compatibile.

Unii cercetători au analizat factorial listele (Slater, 1964, 1976) şi au dezvoltat un set statistic
sofisticat de programe computer în acest scop. Totuşi fiind un număr mic de observaţii pentru fiecare listă,
erorile statistice ale acestor analize factoriale pot fi atât de mari încât metoda de prelucrare statistică să
fie considerată ca fiind îndoielnică. Chiar dacă rezultă factori ei sunt specifici unui individ particular şi de
acea prezintă un interes ştiinţific redus.
Un număr mare de observaţii se pot face legat de afirmaţia că constructele sunt distincte şi
particulare pentru fiecare individ. Acest adevăr pare să fie banal. Toţi avem o experienţă de viaţă care
este privată şi care este diferită de a celorlalte persoane. Această experienţă este atât de diferită încât
testele sunt lipsite de valoare.
Dacă acest aspect ar fi adevărat atunci conversaţia şi înţelegerea dintre oameni ar fi imposibilă.
Faptul că lumea exterioară poate fi înţeleasă sugerează că pentru oameni există un nucleu comun de
semnificaţii chiar dacă aceste nu sunt identice.
Există câteva dificultăţi severe. Dacă constructele individuale folosite sunt atât de diferite atunci
ele pot fi elucidate pornind de la informaţiile din liste care sunt particulare pentru un individ, neputând fi
combinate cu rezultatele altor subiecţi şi neputându-se face inferenţe despre rezultatele unui subiect
comparativ cu cele ale altui subiect. Aceasta distruge scopul ştiinţific normal al descoperirii legilor
generale aplicabile tuturor sau unui număr mare de aspecte ale umanităţii. Dacă premisele listelor sunt
acceptate putem spune că psihologia ştiinţifică este imposibilă şi că pot fi înţeleşi doar indivizi separat. Ar
fi util să stabilim relaţii între măsurarea individului cu ajutorul listelor şi scorurile la anumite variabile din
mediu. Chiar dacă ar fi posibil să stabilim asemenea relaţii aceste nu ar fi utile deoarece constructele sunt
apioric diferite unele de altele şi nu ar fi posibile inferenţele sau extrapolorile. Doar în domeniul clinic
informaţiile rezultate prin folosirea listelor ar putea fi utile.

EXEMPLU
O grilă ar putea fi folosită în terapia maritală. S-ar putea constata că soţul îşi vede soţia ca pe o mamă în
timp ce soţia îşi vede soţul ca tată. Această incompatibilitate poate crea probleme. Discutarea acestor
dificultăţi ar duce la îmbunătăţirea relaţiei. Să presupunem că dificultatea rezidă în certuri frecvente.
Deoarece constuctele indivizilor sunt diferite nu se pot face generalizări. Simţul comun ar sugera că o
ipoteză rezonabilă ar fi să presupunem că atunci când bărbatul doreşte ca soţia să reprezinte imaginea
mamei iar femeile imaginea tatălui putem vorbi de o dizarmonie maritală. Dacă această inferenţă este
făcută atunci listele, distincte de interviu şi chestionar, care au constructe comune, nu au raţiunea de a
exista. Aceste motive stau la baza respingerii listelor pentru măsurare.

APLICAŢIE
Care sunt criticile aduse cercetărilor lui Plutchik?

195
CORNELIU-EUGEN HAVÂRNEANU

TEST DE AUTOEVALUARE (cu răspunsuri corecte ataşate la finalul cursului)


Apreciați valoarea de adevăr a următoarelor afirmații:
1. Metodele perceptiv-genetice au ca obiect de studiu dezvoltarea percepției:
a. ADEVĂRAT
b. FALS
2. La baza metodelor perceptiv-genetice stă presupunerea că percepția nu reflectă totalitatea
experiențelor noastre:
a. ADEVĂRAT
b. FALS
3. Lista simptomelor sau caracteristicilor sunt rar folosite în evaluare și în studii de psihoterapie:
a. ADEVĂRAT
b. FALS
4. O fațetă este un sistem de clasificare în care o fațetă poate avea mai multe nivele de clasificare:
a. ADEVĂRAT
b. FALS
5. În opinia lui Plutchik, trăsăturile sunt privite ca stări afective care persistă și apar frecvent într-o varietate
de situații:
a. ADEVĂRAT
b. FALS

TEMĂ DE CONTROL OBLIGATORIE (4 ore)


La variabila capacitate generală de argumentare subiecţii testaţi au obţinut rezultatele prezentate mai jos.
Realizaţi etalonul în decile, respectiv cvartile şi precizaţi în care decil, respectiv cvartil se găseşte un
subiect care a obţinut nota 23,08.
Valori Frecv. Procent Procent valid
2,78 1 2,9 3,4
3,92 1 2,9 3,4
5,41 2 5,9 6,9
9,38 1 2,9 3,4
10,00 1 2,9 3,4
10,81 1 2,9 3,4
10,87 1 2,9 3,4
12,12 1 2,9 3,4
13,51 1 2,9 3,4
14,71 1 2,9 3,4
15,56 1 2,9 3,4
16,67 1 2,9 3,4
17,65 1 2,9 3,4
17,95 1 2,9 3,4
19,15 1 2,9 3,4
20,45 1 2,9 3,4
20,59 1 2,9 3,4
21,05 2 5,9 6,9
21,57 1 2,9 3,4
22,86 1 2,9 3,4
23,08 1 2,9 3,4

196
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

23,26 1 2,9 3,4


23,53 1 2,9 3,4
24,44 1 2,9 3,4
25,53 1 2,9 3,4
28,57 1 2,9 3,4
30,23 1 2,9 3,4
, 5 14,7 Missing
------- ------- -------
Total 34 100,0

TEMĂ DE CONTROL OBLIGATORIE (2 ore)


Un grup de subiecţi care au fost examinaţi folosindu-se un test care măsoară nivelul de umor, a obţinut
următoarele rezultate, M=7,5, SD=3,25. Transformaţi în note Z scorurile brute 2,25, 15,5 şi evaluaţi
subiecţii care au abţinut aceste scoruri.

TEMĂ DE CONTROL OBLIGATORIE (4 ore)


Un grup de subiecţi a obţinut următoarele rezultate:
Autocontrol: M1=19,8, SD1=3,8;
Nivel motivaţional: M2=25,9, SD2=3,3;
Sociabilitate: M3=14,8, SD3=2,5;
Rezistenţă la oboseală: M4=13,4, SD4=4,3;
Rezultatele obţinute de doi subiecţi la aceste probe sunt:
Autocontrol: S1=26, S2=18;
Nivel motivaţional: S1=24, S2=25;
Sociabilitate: S1=10, S2=3;
Rezistenţă la oboseală: S1=7, S2=25;
Cerinţe:
1. La care dintre probe a obţinut subiectul 1 cele mai bune rezultate?
2. La care dintre probe a obţinut subiectul 2 cele mai slabe rezultate?
3. Realizaţi ierarhia subiecţilor în funcţie de notele obţinute de subiecţi la cele 4 probe.

TEMĂ DE CONTROL OBLIGATORIE (2 ore)


Demonstraţi cu ajutorul unui exemplu care este modalitatea de comparare a valorilor diferitelor categorii
sau a rezultatelor între aceleaşi categorii obţinute în două cercetări diferite într-o scală nominală.

TEMĂ DE CONTROL OBLIGATORIE (2 ore)


În urma aplicării unui test s-a obţinut un coeficient de fidelitate rxx1 = 0,63. Abaterea standard a scorurilor
observate este Sx=2,9. Calculaţi între ce limite se poate situa un scor adevărat al subiecţilor care au
acelaşi rezultat observat de 7, cu o probabilitate de 68%.

197
CORNELIU-EUGEN HAVÂRNEANU

TEMĂ DE CONTROL OBLIGATORIE (2 ore)


Între variabilele atracţia pentru a anumită profesie şi realizare în plan social s-a obţinut un coeficient de
corelaţie de rxy=0,52. Interpretaţi coeficientul de validitate obţinut.

TEMĂ DE CONTROL OBLIGATORIE (4 ore)


Unui grup de subiecţi li s-au aplicat 3 scale: deducţie, evaluare argumente şi evaluare ipoteze. După
realizarea inventarului statistic de bază sumar, s-au obţinut următoarele rezultate:
Deducţie: M1=8,6, SD=1,9
Evaluare argumente: M2=8,7, SD2=2,2
Evaluare ipoteze: M3=9,3, SD=2,1
Doi subiecţi au obţinut următoarele rezultate:
Deducţie: x1=2, x2=11
Evaluare argumente: x1=12, x2=7
Evaluare ipoteze: x1=9, SD=8
1.Transformaţi în note T, stanine şi note sten rezultatele obţinute de cei doi subiecţi.
2. La care dintre scale a obţinut primul subiect cele mai slabe rezultate?
3. La care dintre scale a obţinut primul subiect cele mai bune rezultate?
4. Ierarhizaţi subiecţii în funcţie de rezultatele obţinute la cele trei scale.

TEME ŞI ÎNTREBĂRI RECAPITULATIVE (nu sunt obligatorii)


1. Descrieți relația dintre validitate și fidelitate pornind de la relația dintre coeficienți.
2. Care este distincția dintre criteriu și măsura criteriu?
3. Care sunt caracteristicile unei bune măsuri criteriu?
4. Descrieți cele trei forme de bază ale interpretării coeficientului de validitate.
5. Care sunt sursele principale de eroare în măsurare?
6. Care este sensul fundamental al termenului „test”?
7. Care este rolul analizei factoriale în determinarea validității de construct?

RĂSPUNSURI CORECTE Unitatea de învățare 1


1 fals 4 fals 7 fals 10 Fals
2 adevărat 5 adevărat 8 adevărat 11 Adevărat
3 adevărat 6 adevărat 9 fals 12 Fals
RĂSPUNSURI CORECTE Unitatea de învățare 2
1 adevărat 5 fals 9 fals 13 Fals
2 adevărat 6 adevărat 10 adevărat 14 Fals
3 adevărat 7 fals 11 fals 15 Fals
4 fals 8 fals 12 fals 16 Fals
RĂSPUNSURI CORECTE Unitatea de învățare 3
1 adevărat 5 adevărat 9 adevărat 13 Adevărat
2 fals 6 fals 10 fals 14 Adevărat
3 adevărat 7 adevărat 11 adevărat 15 Fals
4 fals 8 fals 12 fals 16 Adevărat

198
BAZELE TEORETICE ALE PSIHODIAGNOSTICULUI

RĂSPUNSURI CORECTE Unitatea de învățare 4


1 adevărat 5 adevărat 9 adevărat 13 Fals
2 adevărat 6 fals 10 fals 14 Adevărat
3 fals 7 adevărat 11 adevărat 15 Adevărat
4 Adevărat 8 adevărat 12 fals 16 Adevărat
RĂSPUNSURI CORECTE Unitatea de învățare 5
1 adevărat 5 adevărat 9 adevărat 13 Fals
2 fals 6 fals 10 fals 14 Fals
3 adevărat 7 adevărat 11 adevărat 15 Adevărat
4 fals 8 fals 12 adevărat 16 Adevărat
RĂSPUNSURI CORECTE Unitatea de învățare 6
1 adevărat 5 adevărat 9 adevărat 13 Adevărat
2 fals 6 adevărat 10 fals 14 Fals
3 adevărat 7 adevărat 11 adevărat 15 Fals
4 adevărat 8 fals 12 fals 16 Adevărat
RĂSPUNSURI CORECTE Unitatea de învățare 7
1 Adevărat 2 Fals 3 Fals 4 Adevărat
5 Adevărat

199

S-ar putea să vă placă și