Documente Academic
Documente Profesional
Documente Cultură
CORNEL HAVÂRNEANU
PSIHODIAGNOSTIC (I)
CUPRINS
I. SCURT ISTORIC AL PSIHOLOGIEI DIFERENŢIALE
ŞI ORIGINILE CUNOAŞTERII PSIHOLOGICE A PERSOANEI
II. MĂSURAREA ÎN PSIHOLOGIE
III. METODA TESTELOR
IV. FIDELITATEA TESTELOR
V. VALIDITATEA TESTELOR
VI. STANDARDIZAREA TESTELOR
VII. TESTELE DE INTELIGENŢĂ
VIII. TESTELE PENTRU ABILITĂŢI DE GRUP ŞI SPECIFICE
1. Tipuri de teste pentru abilităţi de grup
2. Avantajele măsurării factorilor primari
3. Teste de abilitate specifică şi alte teste
IX. TESTE DE ABILITĂŢI ŞI CUNOŞTINŢE
1. Sensul aptitudinii
2. Formele itemilor în testarea abilităţilor şi cunoştinţelor
X. TESTE PROIECTIVE ŞI OBIECTIVE DE PERSONALITATE
1. Testele obiective
2. Avantajele testelor obiective
3. Tipuri de teste obiective
4. Distincţia dintre testele obiective de abilitate, temperament şi dinamică
5. Ghid practic pentru construcţia testelor obiective de personalitate şi motivaţie
XI. ALTE TIPURI DE TESTE PSIHOLOGICE
1. Metodele perceptiv-genetice
2. DMT
3. Testele speciale utilizate pentru pacienţii care au leziuni ale creierului
4. Teste speciale şi liste (checklist)
5. Descrierea modelului circumplex
6. Cercetările lui Plutchik
7. Repertoriul cu test grilă
SCOPUL UNITĂŢII DE CURS
(a) să ofere informaţii referitoare la metodele de evaluare psihologică a persoanei
(b) să formeze abilităţile necesare evaluării psihologie
OBIECTIVE OPERAŢIONALE
După parcurgerea acestei unităţi de curs, studenţii ar trebui să aibă următoarele abilităţi:
(a) Înţelegerea conceptelor de bază în măsurare şi evaluare, şi înţelegerea caracteristicilor care
diferenţiază aceste concepte;
(b) Înţelegerea conceptului de fidelitate şi altor concepte specifice teoriei clasice a testelor precum
şi a relaţiilor dintre acestea;
(c) Aplicarea diferitelor metode de estimare a fidelităţii şi cunoaşterea caracteristicilor şi limitelor
acestora;
(d) Posibilitatea de a judeca valoarea coeficientului de fidelitate şi de a evalua semnificaţia acestuia
în diferite contexte de decizie;
(e) Analiza valorii unui coeficient de fidelitate în aprecierea importanţei factorilor analizaţi şi
cunoaşterea limitelor fidelităţii;
(f) Înţelegerea conceptului de validitate, distingerea diferitelor sale faţete şi determinarea valorii
predictive;
(g) Evaluarea şi interpretarea validităţii de conţinut şi a validităţii teoretice sau de construct;
(h) Transformarea cotelor brute în cote derivate. Realizarea etaloanelor. Interpretarea rezultatelor
pornind de la scorurile individuale;
(i) Înţelegerea conceptului de inteligenţă şi a modalităţilor de evaluare a inteligenţei
(j) Înţelegerea modului de construcţie şi utilizare a testelor pentru abilităţi de grup şi specifice
(k) Înţelegerea modului de construcţie şi utilizare a testelor de abilităţi şi cunoştinţe
(l) Înţelegerea modului de construcţie şi utilizare a testelor obiective de personalitate
(m) Înţelegerea modului de construcţie şi utilizare a altor tipuri de teste psihologice
(n) Înţelegerea modului de utilizare a testelor în psihologia educaţională
(o) Înţelegerea modului de utilizare a testelor în psihologia clinică
NOTĂ
Prezenţa la activităţile tutoriale este obligatorie deoarece se vor realiza lucrări practice de
laborator
PSIHODIAGNOSTIC (I)
De-a lungul istoriei umanităţii au existat numeroase preocupări de a găsi metode de selecţie a
indivizilor mai productivi sau care să corespundă obiectivelor de formare stabilite Aceste preocupări au
dus la o utilizare pe sacră largă a testelor şi altor metode de cunoaştere a persoanei în diferite domenii
aplicative fapt care ne oferă posibilitatea stabilirii unei cronologii a evoluţiei lor.
DuBois (1970), care este citat în multe manuale de psihometrie, Gregory (1992) şi Sattler
(1992), susţin că evaluarea a apărut în China în urmă cu 3000 de ani. Această afirmaţie nu este
susţinută de surse istorice. Brawman (1998) consideră că începând cu anul 165 î.Hr. în China se
practica selecţia în domeniul serviciilor publice.
5
CORNEL HAVÂRNEANU
6
PSIHODIAGNOSTIC (I)
7
CORNEL HAVÂRNEANU
8
PSIHODIAGNOSTIC (I)
fel a putut fi stabilit un procedeu de măsură a diferenţelor interindividuale: diferenţele dintre indivizi sunt
diferenţele de abatere de la media populaţiei raportată la abaterea standard a distribuţiei populaţiei
respective. Distribuţia gaussiană a caracteristicilor psihologice este un postulat.
Galton consideră că variabilitatea indivizilor este de origine ereditară şi caută metode pentru a
demonstra acest aspect. Cercetarea legilor eredităţii presupune măsurarea asemănărilor între părinţi şi
copii în privinţa caracteristicilor fizice. Cu această ocazie, după 1880, el a inventat coeficientul de
corelaţie, tehnică care a fost perfecţionată mai târziu de Karl Pearsons (1857-1936) prin folosirea
teoremelor stabilite anterior de matematicianul francez Bravis. Coeficientul de corelaţie Bravis-
Pearsons, ca indice de corelaţie, a fost frecvent folosit în psihologia diferenţială. Galton a pus bazele
metodei de studiere a gemenilor, comparând gemenii de acelaşi sex cu gemenii de sexe diferite
(distincţia dintre gemenii monozigoţi şi cei dizigoţi a fost făcută mai târziu).
Galton a fost interesat şi de posibilitatea de intervenţie socială şi a pus bazele ştiinţifice ale
cercetărilor în domeniul eugeniei. În 1907 el a pus bazele unui laborator pentru studierea eugeniei în
care s-a elaborat toată statistica modernă. Eugenismul lui Galton constă în evitarea transmiterii
genetice anormale, ceea ce este o preocupare curentă şi azi. Galton caută înlocuirea selecţiei naturale
printr-o selecţie raţională bazată pe teoria evoluţiei, fiind în acest fel partizanul unui eugenism pozitiv.
Psihometria este o disciplină mai puţin cunoscută în ştiinţele umane datorită recunoaşterii sale
tardive în mediile ştiinţifice şi a dificultăţii pentru oamenii de ştiinţă şi lexicologi de a stabili definirea şi
particularităţile sale. Cristian Van Wolf, în 1732, a recunoscut că psihometria se leagă de psihologie şi
de măsurare, urmând să se stabilească dacă este vorba de o ramură a psihologiei, o ramificaţie a
măsurării, sau ambele.
După Legendre (1993), psihometria este "măsurarea şi prelucrarea statistică a faptelor psihice,
mai ales prin metoda testelor". Pentru De Landshere (1979), psihometria constă într-un "ansamblu de
operaţii care, prin probe speciale (teste) şi tehnici ştiinţifice, determină şi evaluează capacităţile psihice
ale indivizilor: stabilirea nivelului mental, detectarea tendinţelor caracteristice, estimarea aptitudinilor
profesionale etc.".
Paul Dickens, Jocelyne Tournois, André Fieller şi Jean-Luc Kop (1994) "psihometria constă
într-un ansamblul de teorii şi metode de măsurare în psihologie ..., care nu se confundă cu studiul
testelor ci numai cu analiza datelor... şi care poate exista fără nici o referire la teste".
De-a lungul istoriei umanităţii au existat preocupări de a găsi metode de selecţie a indivizilor
care să corespundă obiectivelor de formare sau să fie mai productivi. Utilizarea pe sacră largă a testelor
în diferite domenii aplicative ne oferă posibilitatea stabilirii unei cronologii a evoluţiei lor.
După Mercier (1897), Wundt a fost primul care s-a interesat de psihometrie. În 1879, a înfiinţat
la Leipzig primul laborator de psihologie experimentală. Cercetările realizate au fost orientate spre
procesele senzoriale, mecanismele perceptive, dar şi asupra unor funcţii complexe ca atenţia, memoria
şi emoţia. Metodele de observaţie erau precise şi au fost realizate numeroase aparate de investigaţie
psihologică. În timp, mulţi psihologi ca Hall, Cattell, Spearman, Titchner, au vizitat acest laborator
preluând modelul pentru propriile lor universităţi.
9
CORNEL HAVÂRNEANU
În 1888, Cattell deschide un laborator pentru testare, iar în 1890 propune două serii de probe
numite "teste mentale". Thorndike şi Lohman (1990) a publicat lista acestor teste:
1. presiune dinamometrică;
2. viteza de mişcare a braţelor;
3. ariile de sensibilitate şi de discriminare tactilă;
4. presiunea necesară pentru cauzare a unei dureri;
5. măsurarea sensibilităţii diferenţiale pentru o greutate de 100 de grame;
6. timp de reacţie simplu la sunet;
7. timpul necesar pentru denumirea culorilor;
8. divizarea unei lungimi de 50 de centimetri în două părţi egale;
9. evaluarea unei durate de 10 secunde;
10. numărul de litere reţinute după o singură prezentare auditivă.
Pe lângă acestea a mai folosit o probă pentru copii formată din 50 de teste distincte, 14 pentru
senzaţii vizuale, 8 pentru audiţie, 3 pentru gust şi miros, 7 pentru senzaţii presiune şi termice.
Utilizarea acestor teste nu a dus la un progres în diagnosticul aptitudinilor iar aceste
instrumente au continuat să fie utilizate pentru cercetarea psihologică. Binet şi Henri (1896) reproşează
faptul că se insistă pe investigarea proceselor psihice inferioare, senzaţii şi mişcări elementare, în
detrimentul funcţiilor superioare care caracterizează mai bine un individ. La om este mai important să
cunoaştem capacităţile de atenţie, imaginaţie şi inteligenţă decât aptitudinile tactile sau olfactive.
Jurnalele psihologice şi medicale din acea perioadă prezentau multe probe care nu erau organizate în
ordinea dificultăţii crescătoare. În încercarea de a sistematiza rezultatele obţinute, Spearman (1904)
recurge la analiza factorială şi constată că folosind coeficienţii de corelaţie putem obţine un factor
general şi mai mulţi factori specifici pentru fiecare test. Această descoperire a stat la baza teoriei celor
doi factori.
În 1905, Binet şi Simon realizează scara metrică a inteligenţei care le-a permis să evalueze
nivelul mental al copiilor. Materialul era compus din 30 de itemi aşezaţi într-o ordine de dificultate
crescătoare pentru 3, 5, 7, 9 şi 11 ani.
Acest instrument viza funcţiile mentale superioare, dar erau şi probe pentru estimarea
dezvoltării senzoriomotorii. Deficienţa mentală era clasificată în trei categorii: idiot, imbecil şi debil
mintal.
A doua şi a treia versiune a apărut în 1908 şi 1911. În 1909, Goddard traduce a doua versiune
publică în 1911, varianta americană revizuită care a fost apoi urmată de revizuire lui Kuhlman (1912) şi
Terman (1916).
Testul a fost tradus şi adaptat în multe ţări din Europa: în Germania de Maumann şi Bobertag,
în 1914, în Italia de Saffotti, în 1911, în Belgia de Decroly şi Degaud, în 1909, în Suedia de
Jaederholm, în 1914, în Marea Britanie de Burt, în 1921.
Varianta scării din 1908 este normalizată pe un eşantion de 300 de copii, cu vârste de la 3 la 13
ani şi s-a introdus noţiunea de vârstă mentală. Această metodă, foarte simplă, stabileşte nivelul
intelectual pentru fiecare vârstă cronologică. Seria de probe folosită constituie o scară metrică.
A treia variantă a scării apare în 1911, anul morţii lui Binet. Această variantă introduce noi
probe, unele pentru vârsta adultă, şi precizează tehnica de evaluare a vârstei mentale.
10
PSIHODIAGNOSTIC (I)
În 1912, Stern stabileşte formula coeficientului intelectual, prin raportarea vârstei mentale la
vârsta cronologică. QI = VM/VC
La sugestia lui Stern, Bobertag, utilizează primul acest procedeu de măsurare a intelectului, unde
1 reprezintă media. Dacă QI depăşeşte 1, subiectul este în avans faţă de vârsta cronologică, dacă este
inferior lui 1 el este sub medie pentru vârsta sa. La această formulă se aplică înmulţirea cu 100, în revizia
"Stenford", realizată de Terman (1916), luând forma QI = VM/VC × 100.
În 1911, Rossolimo raportează rezultatele a 8 probe sub forma unui grafic pe care l-a numit
profil.
Necesitatea examinării rapide a unui mare număr de recruţi, la sfârşitul primului război mondial,
a dus la realizarea a două baterii de teste colective, cunoscute sub numele de Army Alpha, în 1917 şi
Army Beta, în 1918 şi a scării Pintner Paterson (1915, 1917).
Problema testelor a ocupat un loc important la congresele internaţionale. Prima Conferinţă
internaţională de psihotehnico a avut loc la Geneva în 1920.
Tot în 1920, în Statele Unite, Woodworth introduce primul inventar de personalitate (Personal Data
Sheet), pentru o utilizare individuală şi în grup. Forma finală cuprinde 116 întrebări cu alegerea
răspunsurilor afirmative sau negative şi permite identificarea subiecţilor cu tulburări afective.
În 1921, în Elveţia, Rorschach prezintă o nouă tehnică de diagnosticare a personalităţii prin
interpretarea unor pete de cerneală.
În 1922, în Franţa, prin decret se stabileşte activitatea de consilier de orientare care precede
plasarea tinerilor în instituţii comerciale sau industriale prin determinarea aptitudinilor fizice, morale şi
intelectuale. În acest domeniu, Strong elaborează în 1927 primul chestionar de interese profesionale.
În 1927, evoluţia analizei metodologice a permis lui Thorndike să reducă în serii de patru
factori aspectele măsurate ale inteligenţei (CAVD): Completare de imagini, Aritmetică, Vocabular şi
Direcţionare. Mai multe activităţi mentale sunt în final grupate în trei categorii: activităţi sociale, activităţi
concrete şi activităţi abstracte.
Metoda centroidă, de analiză factorială a fost folosită de Thurstone (1936) şi a dus la
descoperirea unor factori de grup, care nu sunt comuni pentru toate testele, ci numai unei serii de teste.
În acelaşi an, Doll prezintă scala sa de maturitate socială, care contribuia la evaluarea
aptitudinilor adaptative la subiecţii cu deficienţe intelectuale.
La 4 iulie 1936, Comitetul Central al Partidului Comunist al fostei URSS condamnă practicarea
psihotehnicii, considerată o pseudo-ştiinţă antimarxistă, ordonând distrugerea tuturor cărţilor de
psihometrie.
Pentru anul 1938 patru evenimente merită a fi menţionate. Bender propune o serie de nouă
figuri geometrice pentru a fi copiate cu scopul realizării unor cercetări neuropsihologice şi a dezvoltării
mentale. Raven publică versiunea finală a matricilor progresive care cuprind cinci serii de figuri lacunare
cu ajutorul cărora poate fi măsurată inteligenţa generală, eliminând influenţa factorilor culturali. Tot
acum apare prima revistă sistematică de teste psihologice numită Mental Measurements Yarbook, iar
Gasell finalizează scala de teste de dezvoltare pentru copii.
În 1939, David Wechsler realizează scala de diagnostic intelectual pentru adulţi., Wechsler-
Bellevue Intelligence Scale. Apoi în 1949, Wechsler Intelligence Scale for Children, iar în 1967
Wechsler Preschool and Primary Scale of Intelligence. El a făcut o bună sinteză a probelor deja
11
CORNEL HAVÂRNEANU
existente şi a prezentat rezultatele sub forma unui profil psihologic renunţând la conceptul de vârstă
mentală.
În 1940, Cattell, folosind analiza factorială, introduce probe neverbale foarte saturate în factorul
general de inteligenţă "g", foarte puţin influenţate de factorii socio-culturali.
În 1959, Guilford prezintă structura factorială a inteligenţei ca un ansamblu de abilităţi. Modelul
structural al intelectului cuprinde trei dimensiuni care prin combinare formează 120 de factori. Fiecare
factor este localizat la intersecţia a trei dimensiuni care-l determină.
Cattell, în 1963, pe baza teoriei factoriale, elaborează teoria inteligenţei "cristalizate" şi "fluide".
Inteligenţa cristalizată se manifestă atunci când sunt prezentate situaţii acumulate din mediul social,
şcolar şi cultural. Testele care se referă la aceasta sunt teste de inteligenţă generală care au, mai ales,
un conţinut educaţional şi şcolar. Inteligenţa fluidă este activată în situaţii noi, când subiectul trebuie să
sesizeze noi relaţii dând dovadă de creativitate. Acest potenţial este măsurat prin teste prin teste care
nu sunt influenţate cultural
În 1968, Lord şi Novik au făcut o sinteză de interpretare a datelor obţinute pe baza testelor
psihologice. Ei au dat definiţii sintactice explicite (matematice) pentru conceptele care au o semnificaţie
matematică (reală). Conceptul de scor adevărat a fost definit sintactic şi interpretat semantic ca scorul
observat la o persoană cu ajutorul unui test de o lungime infinită. Acesta este un scor observat aşteptat.
Pe baza teoriei numerelor mari au demonstrat că definiţia teoriei testelor este o definiţie pragmatică
care furnizează o interpretare semantică a scorurilor observate.
I.3. CONCLUZII
Înaintea prezentării unor metode specifice de cunoaştere a persoanei, se impun câteva precizări în
legătură cu posibilitatea cunoaşterii psihologice.
1. În primul rând subliniem faptul că psihologia este o ştiinţă probabilistă, iar prin cunoaşterea psihologică
nu se ajunge la certitudine, ci este doar o cunoaştere probabilistică. Din această cauză în domeniul
psihologic nu vom putea stabili un diagnostic definitiv, ci doar un prognostic, care va trebui să fie elaborat
pe termen scurt, pentru a evita erorile predictive datorate evoluţiei în timp a subiecţilor, modificărilor,
uneori spectaculoase, determinate de multitudinea şi complexitatea factorilor implicaţi în schimbare.
2. Cunoaşterea în domeniul aptitudinilor este mai avansată, precizia în măsurare fiind mult mai mare faţă
de alte aspecte ale personalităţii în care nu putem fi siguri de autenticitatea reacţiilor persoanei. Când se
pune problema cunoaşterii trăsăturilor de caracter, de exemplu, subiecţii activează mecanisme de
apărare, etalează doar aparenţe în spatele cărora ascund trăsăturile autentice. Pentru evitarea acestor
neajunsuri s-au înregistrat reacţiile subiecţilor în situaţii imaginate, pentru a releva aspecte ale
personalităţii fără ca aceştia să conştientizeze scopul urmărit. În acest fel au apărut şi s-au dezvoltat
testele proiective, majoritatea bazându-se pe concepţii psihanalitice. Dar, şi aceste instrumente prezintă
dezavantaje, deoarece trebuie demonstrată corespondenţă dintre manifestările subiecţilor în situaţia
imaginară şi cea reală, iar interpretarea presupune o teorie elaborată asupra motivaţiei şi a modului în
care ea se exprimă (A. Cosmovici, 1972, 1985).
3. Există divergenţe în legătură cu metodele utilizate în psihologie, precum şi în legătură cu valoarea
acestora. Fără a intra în analiza acestor puncte de vedere subliniem faptul că tendinţa unanim acceptată
este de împărţire a metodelor de cunoaştere în două categorii: metode clinice (observaţia, convorbirea,
12
PSIHODIAGNOSTIC (I)
13
CORNEL HAVÂRNEANU
După numeroşi autori, măsurarea este o operaţie care constă în asocierea, după anumite
reguli, a unor simboluri (de cele mai multe ori numerice), obiectelor, evenimentelor, sau indivizilor,
pentru a evalua gradul în care acestea prezintă anumite atribute. După realizarea acestei operaţii,
putem califica aceste simboluri ca "rezultate ale măsurării." Pentru a fi semnificative, simbolurile
numerice trebuie să fie însoţite de o unitate de măsură.
De exemplu: În cazul unei mese cu lungimea de doi metri, vom asocia numărul 2 cu termenul
"metru", care este unitatea de măsură utilizată şi care este aplicată de două ori pe lungimea mesei.
Numărul 2 capătă o semnificaţie în virtutea unei relaţii cu o lungime standard care este metrul.
În cazul măsurării atributelor fizice, interpretarea rezultatelor nu ridică, în mod obişnuit nici o
problemă. Măsurarea atributelor psihologice, cum ar fi , raţionamentul sau motivaţia, este foarte
complexă, existând foarte multe variabile care trebuie definite şi controlate pentru a obţine un rezultat
valabil. De asemeni, în educaţie este dificil să găsim o unitate de măsură care să fie considerată etalon.
De exemplu: Un rezultat de 40 răspunsuri corecte din 50, la o probă de randament, este dificil
de interpretat, deoarece 40 de itemi corect rezolvaţi nu presupune, cu necesitate, un coeficient de
dificultate egal pentru fiecare item.
Deducem din definiţia precedentă că măsurarea presupune un proces de abstractizare. Dacă
asociem simboluri obiectelor sau indivizilor, vom măsura, de fapt, una sau mai multe dimensiuni dintre
toate cele pe care obiectele sau indivizii le posedă. De aceea este important să studiem natura acestor
atribute, înainte de a realiza măsurarea.
Observăm că nu toate atributele sunt în mod necesar măsurabile. Mai mult, o măsură se poate
aplică mai multor atribute, nu numai unuia singur. În acest caz, posibilitatea de a izola caracteristicile
atributului de măsurat este mai redusă, iar informaţiile obţinute vor fi deseori mai puţin utile.
Utilizarea simbolurilor numerice presupune deci cuantificarea atributelor. Această
cuantificare facilitează cunoaşterea rezultatelor relative, a gradului de prezenţă a acestora, sau
manifestarea unui atribut la un individ. În acest fel obţinem rezultate foarte detaliate şi foarte precise,
neinfluenţate de judecăţi personale, care ne permit să recurgem la modele de analiză matematică.
Procedeele de obţinere a unei măsurări trebuie să fie explicite. Pentru aceasta există reguli
precise care reglează procedeele de măsurare. Aceste reguli sunt fundamentale în construcţia şi
utilizarea unui instrument de măsură, deoarece validitatea lor determină validitatea instrumentului, şi în
consecinţă pe cea a rezultatelor. Nerespectarea acestor reguli duce la rezultate eronate, instabile şi
chiar aberante. Acest ansamblu de reguli permite cuantificarea, fără echivoc, a atributelor unui obiect
sau individ şi reprezintă o măsură legitimă.
14
PSIHODIAGNOSTIC (I)
Formularea riguroasă a regulilor care permit asocierea simbolurilor numerice unor atribute, fac
ca rezultatele obţinute cu ajutorul unui instrument de măsură să fie reproductibile. Acesta este un
aspect esenţial pentru standardizarea unui instrument de măsură. Un instrument de măsură este
standardizat dacă toţi utilizatorii obţin rezultate similare. Această similaritate depinde de invariabilitatea
conţinutului măsurat, uniformitatea procedeelor şi condiţiilor de administrare a instrumentului de măsură
şi de constanţa criteriilor de corectare. Altfel spus, probele aplicate trebuie să fie tot timpul aceleaşi
pentru toţi subiecţii, instrucţiunile clar enunţate, durata şi contextul administrării constant, iar criteriile de
corectare invariabile şi obiective.
În concluzie, măsurarea standardizată permite cuantificarea datelor, o descriere foarte obiectivă
care furnizează informaţii comparabile.
Cu toate că măsurarea se vrea cât mai obiectivă posibil, evaluarea presupune prezenţa unor
aspecte subiective. Putem defini evaluarea ca fiind o operaţie care constă în a face o judecată de
valoare, sau a acorda o valoare unui obiect sau unei persoane, comparând obiectul, l sau persoana cu
un criteriu dat. Această operaţiune poate fi aplicată rezultatelor măsurării. Astfel, expresii ca "excelent",
"mediocru", "superior mediei", "succes", "eşec" sunt termeni de evaluare utilizaţi în educaţie. Trebuie
precizat că evaluarea unui rezultat obţinut în urma măsurării, este un aspect important când rezultatul
este dificil de interpretat în absenţa unei unităţi de măsură, care poate da o semnificaţie rezultatului
respectiv.
Un exemplu care permite înţelegerea distincţiei dintre măsurare şi evaluare. Un prieten vă
informează că bunicul său are 90 de ani. Expresia "90 de ani" sau numărul 90 este rezultatul unei
măsurări. Pentru a asocia numărul 90 bunicului său, prietenul dumneavoastră a aplicat o regulă precisă
care constă în a determina de câte ori o unitate de măsură este cuprinsă între două momente precise:
data naşterii şi momentul în care se face relatarea. Din contra, dacă prietenul dumneavoastră vă spune
că bunicul său este foarte bătrân, el vă comunică rezultatul unei evaluări.
În baza acestui exemplu, putem constata că rezultatul măsurării este pur descriptiv, nici o
judecată de valoare nu apare, în timp ce rezultatul evaluării este subiectiv. Acesta este unul din
principiile de bază care diferenţiază măsurarea de evaluare.
Se poate obiecta că această distincţie nu este foarte clară, deoarece în toată lumea se spune
că un individ de 90 de ani este foarte bătrân. Avem aici o situaţie foarte frecventă din viaţa cotidiană, în
care rezultatul unei măsurări se înscrie cu uşurinţă în cadrul de referinţă care corespunde experienţei
anterioare. Noi cunoaştem unitatea de măsură, anii de existenţă, şi cunoaştem posibilităţile actuale ale
longevităţii umane. Dintre cele două informaţii, una se referă la unitatea de măsură, iar cealaltă la
posibilităţile sau limitele fenomenului studiat, care permite, foarte des, să se facă judecăţi de valoare
unice pe baza rezultatelor măsurării. În acest exemplu, criteriu care a servit ca bază de evaluare este
caracteristic unui ansamblu de indivizi. Este suficient ca această caracteristică să se modifice pentru ca
evaluarea să fie modificată. Dacă presupunem că durata de viaţă se prelungeşte la 200 de ani, atunci
judecata de valoare "foarte bătrân" nu mai este potrivită pentru o persoană de 90 de ani. Acest exemplu
ilustrează foarte bine caracterul subiectiv al evaluării.
În consecinţă, în educaţie şi psihologie se ignoră foarte frecvent unităţile de măsură şi limitele
fenomenului studiat. Această problemă poate fi rezolvată dacă evaluăm inteligenţa unui elev,
aptitudinile, interesele, calitatea randamentului său şcolar pe baza unui rezultat măsurabil. Mai mult,
deseori, acest rezultat este un număr care indică cantitatea răspunsurilor bune la un ansamblu de
15
CORNEL HAVÂRNEANU
probleme puse în cadrul unui test. Rezultatul de 60 obţinut de un elev la o probă de randament nu
relevă nimic din calitatea elevului şi nici din competenţa sa. Pentru a putea face o judecată de valoare,
trebuie să avem acces la ambele informaţii (conţinutului probei şi posibilităţile de rezolvare a probei).
Dacă cunoaştem natura problemelor pe care elevul le-a rezolvat în acea probă, vom putea
deduce capacităţile sau abilităţile necesare elevului pentru a rezolva proba. Cunoaşterea naturii
problemelor rezolvate sau a conţinutului probei este un compromis faţă de dificultatea de a stabili o
unitate de măsură sau un standard. Din contră, dacă vom cunoaşte posibilităţile de rezolvare a probei,
prin analiza rezultatelor obţinute de alţi elevi, vom putea elabora o judecată de valoare ca "excelent",
"mediocru", "superior mediei" sau "normal". În acest caz evaluarea se realizează folosind un criteriu de
bază şi caracteristicile unui ansamblu de elevi.
În postulatele principale ale sistemului de numere, găsim principalele postulate ale măsurării:
1. Elementele sunt fie identice, fie diferite: a = b sau a ≠ b
2. Relaţia de identitate este simetrică: dacă a = b atunci b = a
3. Relaţia de identitate este tranzitivă: dacă a = b şi b = c atunci a = c
4. Relaţia de ordine este simetrică: dacă a > b atunci b < a
5. Relaţia de ordine este tranzitivă: dacă a > b şi b > c atunci a > c
6. Elementele pot fi adunate dacă a = p şi b > 0 atunci a + b > p
(adunarea cu zero lasă elementul neschimbat)
7. Adunarea este comutativă: a+b=b+a
16
PSIHODIAGNOSTIC (I)
Problema clasificării scalelor de măsurare este legată de diversitatea utilizării numerelor (de
exemplu numerele pot face referiri la cantităţi dar şi la calităţi). De asemeni, există tipuri distincte de
scale de măsură cu care putem clasifica toate atributele măsurate. În ştiinţele umaniste, problema
clasificării scalelor de măsură, este o preocupare amforă pentru numeroşi cercetători. Mulţi dintre ei
consideră că pentru a înţelege precizia unei măsurări psihologice trebuie să luăm în consideraţie natura
scalei utilizate în cazul unui procedeu de măsurare. Altfel spus, natura scalei de măsurare utilizată
determină tipul de interpretare şi cantitatea de informaţii pe care o putem extrage din rezultatele
obţinute cu ajutorul acelei scale Problema este legată de legitimitatea utilizării unor procedee
matematice pentru măsurarea atributelor umane care se referă la aspecte psihologice.
Primul criteriu de diferenţiere a unui tip de scară, se referă la regulile care determină modul în
care numerele sunt asociate atributelor măsurate. O scală nu are raţiunea de a exista dacă nu există un
izomorfism (corespondenţă) între unele proprietăţi ale atributelor măsurate şi unele proprietăţi ale seriei
numerice.
Proprietăţile sau natura atributelor, utilizarea procedeelor concrete care vizează măsurarea
acestor atribute, sunt factori care limitează operaţiile empirice de bază aplicabile atributelor măsurate.
De exemplu, unui atribut ca sexul indivizilor îi poate fi asociat un număr care are valoare de
etichetă (masculin 1 şi feminin 2) În consecinţă, chiar natura atributului măsurat nu ne oferă decât
posibilitatea unor operaţii empirice de clasificare şi de numărare.
Un al doilea exemplu ne permite să ilustră mai bine influenţa alegerii procedeelor concrete de
măsurare. Să presupunem că, fără să avem un instrument standardizat de măsurare, dorim să
comparăm înălţimea unor indivizi. Operaţiile empirice aplicabile rezultatelor acestor măsurări se vor
limita la a plasa, în ordine, indivizii, după talie. Însă dacă posedăm un instrument standard, care are la
bază unităţi etalon, şi repetăm măsurările, numărul operaţiilor empirice aplicabile acestor rezultate va fi
mult mai mare. În acest fel vom putea plasa indivizii în ordinea înălţimii, dar vom putea compara şi
diferenţele dintre înălţimile lor şi chiar stabili un raport între înălţimile indivizilor. Din aceste calcule
putem stabili că X este de două ori mai mare decât fiul său Y, constatare pe care nu o putem pune în
evidenţă în absenţa unei unităţi etalon.
Ceea ce caracterizează cel mai bine fiecare tip de scală, este studiul invarianţei. Aceasta
presupune ca transformările fiecărei scale să nu producă distorsiuni ale structurii acesteia.
De exemplu, dacă vrem să exprimăm datele în unităţi diferite de unităţile de măsură originale,
este necesar să putem efectua această transformare, fără a modifica semnificaţia datelor. Mărimea
invarianţei unei scale stabileşte limitele referitoare la transformările matematice şi statistice care pot fi
legitim aplicate datelor obţinute printr-un procedeu de măsurare. În cazul scalelor prin care se stabileşte
17
CORNEL HAVÂRNEANU
rangul indivizilor, în funcţie de un atribut dat, toate transformările matematice efectuate asupra acestor
date pentru modificarea rangului, falsifică rezultatele şi în consecinţă acest tip de transformare nu poate
fi legitim aplicat la acest tip de scară.
Fiecare tip de scară de măsurare are anumite implicaţii:
În primul rând, fiecare tip de scală are anumite postulate. Dacă datele obţinute printr-un anumit
procedeu de măsură sunt conforme postulatelor unui anumit tip de scală, măsurarea va fi considerată
ca posedând proprietăţile inerente scalei respective. Niciodată un tip de scală nu poate face abstracţie
de postulatele care îi sunt proprii.
În al doilea rând, cu cât un tip e scală este mai complex, cu atât regulile care determină
asocierea numerelor unor atribute măsurate sunt restrictive şi multe din informaţiile furnizate de scală
sunt precise, ceea ce are efecte asupra reducerii, întinderii invarianţei scalei respective. Mai mult,
postulatele matematice ale unei scale foarte complexe permit utilizare unui mare număr de operaţii
matematice şi statistice.
O altă proprietate majoră a unei scale este aceea de a reflecta atributele care trebuie măsurate.
De exemplu, dacă dorim să măsurăm înălţimea elevilor unei clase este necesar să avem o
scală care reflectă acest atribut. Se întâmplă ca multe dintre conceptele ştiinţifice, de interes pentru
cercetător, să poată fi măsurate prin modalităţi rudimentare. De exemplu, să presupunem că un
cercetător doreşte să obţină un singur număr care să reprezinte agresivitatea unui copil dintr-o
grădiniţă. O metodă ar putea fi utilizarea interviului psihologic clinic şi apoi evaluarea subiecţilor de la 1
la 10 în acord cu mărimea agresivităţii lor. Un aspect foarte important pentru problema pusă în discuţie
este ce atribute matematice generale trebuie să posede scala de agresivitate realizată pentru evaluarea
copiilor de la 1 la 10.
Atributele pe care trebuie să le posede o scală de măsurare sunt: magnitudinea sau mărimea,
intervale egale şi punctul zero.
Când o scală are magnitudine, atunci un anumit atribut poate fi judecat ca fiind mai mare
decât, mai mic decât sau egal cu o altă stare a aceluiaşi atribut. Dacă revenim la exemplul anterior şi
constatăm că un clinician atribuie un scor de 8 pentru subiectul X şi 5 pentru subiectul Y, această scală
de măsurare reflectă diferenţele în magnitudine ale agresivităţii la cei doi subiecţi (subiectul X este mai
agresiv decât subiectul Y).
Intervale egale, înseamnă că magnitudinea unui atribut reprezentat de o unitate de măsură pe
o scală este egală, indiferent de locul unde este plasată unitatea pe scală. De exemplu, în cazul
măsurării înălţimii în cm, diferenţa între o persoană care are 160 cm faţă de alta care are 161 cm, este
aceeaşi ca diferenţa care există între o persoană de 170 cm şi alta de 171 cm. Un centimetru reflectă
aceeaşi cantitate (de înălţime), indiferent de locul în care este plasat centimetrul pe scală.
Acest aspect nu este respectat tot timpul. Să luăm exemplul clasamentului realizat la sfârşitul
unui campionat de fotbal. Diferenţa dintre echipa plasată pe locul întâi şi cea de pe locul doi este de un
loc, aceeaşi diferenţă existând şi între echipa plasată pe locul doi şi cea de pe locul trei. Dar în acest
caz nu putem spune că 1–2 = 2–3, aşa cum am stabilit în cazul diferenţelor de înălţime.
Punctul zero absolut, este valoarea care indică faptul că atributul care trebuie măsurat nu are
nici o valoare (mai bine spus are valoarea zero). Zero pentru înălţime este o valoare a scalei care
presupune lipsa înălţimii. În cazul măsurării agresivităţii, cea mai mică notă pe care psihologul o poate
atribui este 1. Această valoare nu indică inexistenţa tendinţei agresive. Un copil care primeşte nota 1
18
PSIHODIAGNOSTIC (I)
poate să lovească uşor un alt copil sau să-l jignească verbal, ocazional. Copilul are un nivel mic al
agresivităţii, dar într-un sens relativ. Chiar dacă valoare zero ar fi o parte componentă a scalei această
nu presupune inexistenţa totală a agresivităţii. Această scală de evaluare a agresivităţii nu are zero
absolut.
Acest tip de scală este cunoscută şi sub denumirea de scală calitativă, scală categorială sau
scală de clasificare.
Forma cea mai simplă de observaţie constă în a stabili dacă două obiecte au doi indivizi sunt
calitativ asemănători sau diferiţi prin răspunsurile lor la o situaţie dată, sau când prezintă una sau mai
multe proprietăţi date. Vom putea astfel grupa proprietăţile sau indivizii în funcţie de una sau mai multe
caracteristici comune. Este suficient să precizăm criteriile utilizate pentru includerea obiectelor sau
indivizilor într-o clasă sau categorie. Apoi, după ce acest criteriu a fost stabilit şi s-a realizat repartiţia în
clase, putem denumi clasa respectivă pentru a desemna obiectele sau indivizii incluşi în acea clasă.
Numele clasei poate fi un număr sau un cuvânt.
Ţinând seama de procedura de clasificare, rigoarea de discriminare depinde de capacitate de
observaţie a evaluatorului şi de marja de imprecizie care este tolerată. În ştiinţele umane, când vorbim
de egalitate dintre indivizii unei clase, vom spune că acesta este aproximativ egală în funcţie de
complexitatea comportamentului uman şi de imprecizia relativă a mijloacelor de observaţie.
19
CORNEL HAVÂRNEANU
Un exemplu de scală nominală este scală utilizată pentru diferenţierea tipurilor temperamentale
(coleric, sanguinic, flegmatic şi melancolic). Dacă considerăm că fiecare individ poate fi plasat doar
într-unul din cele patru tipuri enumerate, atunci aceste tipuri reprezintă mulţimea categoriilor sacalei
nominale.
Uneori, pentru ca scala să îndeplinească condiţia de exhaustivitate, se introduce şi categoria
"alte situaţii", "şi alţii" etc. Pentru eficienţa cercetării această categorie specială trebuie să nu includă o
parte semnificativă a populaţiei studiate, fapt care ar diminua relevanţa rezultatelor.
În operaţiunea de culegere şi prelucrare a datelor, se recurge frecvent la codificarea acestora.
Prin codificare se înţelege transformarea unei mulţimi de obiecte, date, itemi, dintr-o formă sistematică
de prezentare într-o altă formă. De exemplu tipul coleric=1, tipul sanguinic=2, tipul flegmatic=3, iar tipul
melancolic=4.
Aceste coduri, utilizate în scala nominală trebuie considerate simple simboluri, proprietatea lor
de a fi diferite între ele permite discriminarea categoriilor.
Trebuie menţionat faptul că între categoriile unei scale nominale nu există relaţii de ierarhie,
ordinea prezentării fiind indiferentă.
Să presupunem că doi cercetători, în investigaţii independente, au obţinut următoarele
rezultate:
NR. SUBIECŢI NR. SUBIECŢI
TIP TEMPERAMENT
CERCETAREA 1 CERCETAREA 2
1 32 58
2 48 73
3 37 80
4 33 39
TOTAL 150 250
Menţionăm că în coloana din stânga avem coduri, etichete lipsite de semnificaţie cantitativă în
timp ce numerele din celelalte două coloane posedă această semnificaţie. Ansamblul numerelor din
coloana a doua şi a treia poartă numele de distribuţie a tipurilor temperamentale în grupurile studiate.
Fiecare număr reprezintă frecvenţa absolută a unei categorii din scală.
Compararea rezultatelor celor două cercetări ne conduce la constatarea că a doua cercetare
prezintă valori mai mari la fiecare categorie. Această constatare nu are valoare ştiinţifică deoarece al
doilea grup de cercetare este mai numeros decât primul, şi este normal ca frecvenţele să fie mai mari.
Pentru o comparaţie relevantă trebuie să utilizăm frecvenţele relative. Frecvenţa relativă pentru o
categorie se obţine prin împărţirea frecvenţei absolute la numărul total de subiecţi. Prin înmulţirea
frecvenţei relative cu 100, obţinem procente.
Comparaţiile efectuate după frecvenţele relative, sau procente capătă substanţă, deoarece
măsurătorile realizate pe eşantioane de mărimi diferite sunt aduse la un sistem de raportare comun,
ceea ce permite comparaţii.
Trebuie să se ţină seama de faptul că frecvenţele relative sunt sensibile la volumul eşantionului.
Astfel, 5 cazuri din 10 reprezintă 50%, în timp ce 6 cazuri din 10 reprezintă 60% din totalul cazurilor.
Diferenţa de unu între frecvenţele absolute se reflectă într-o diferenţă de 10 între procente. Dacă
volumul eşantionului ar fi fost 100, atunci 5 şi respectiv 6 cazuri ar fi reprezentat 5% şi respectiv 6%.
Observăm diferenţa mai mică între procentaje, datorată mărimii eşantionului. Din punct de vedere
20
PSIHODIAGNOSTIC (I)
practic, acest aspect impune raportarea numărului total de cazuri atunci când se folosesc frecvenţe
relative sau procente.
21
CORNEL HAVÂRNEANU
c. influenţă (4, 9)
d. decizie (3, 10)
e. tensiune (2, 11)
f. integrarea membrilor (1, 12)
O altă viziune sintetică a fenomenului studiat poate produce condensări de ordinul doi, prin
gruparea categoriilor din scala II:
IV. i. reacţii emoţionale pozitive (A)
ii. reacţii emoţionale neutre (B, C)
iii. reacţii emoţionale negative (D )
Trecerea inversă, de la scale condensate la scale diversificate (cum ar fi de la scala II la scala I)
se realizează prin operaţii de rafinare, şi este impusă de necesităţi analitice accentuate.
Prin gruparea excesivă se produce o pierdere de informaţii primare, în timp ce rafinarea
excesivă duce la o acumulare de amănunte care creează dificultăţi în perceperea esenţei problemei
studiate. De aici rezultă nevoia păstrării unui echilibru între cele două situaţii.
Volumul eşantionului este un element important în alegerea numărului de gradaţii pentru o
scală nominală. Un eşantion mic nu se poate studia folosind o scală nominală cu un număr mare de
categorii, iar un eşantion mare printr-o scală cu puţine categorii.
Efectul transformării scalelor asupra distribuţiei datelor unei cercetări concrete este important.
Singurul lucru constant rămâne numărul de membri ai eşantionului. Distribuţia subiecţilor pe clase se
modifică la orice grupare sau rafinare a categoriilor.
Scalele ordinale sunt cunoscute şi sub numele de scale de ordine, scale de rang, scale
ierarhice, şi permit ordonarea observaţiilor, indivizilor, situaţiilor de la mic la mare, de la simplu la
complex, de la mai puţin la mai mult.
Operaţia de enumerare şi clasare în diferite clase sau categorii este omogenă, adică toţi
indivizii sau obiectele unei clase sunt considerate ca fiind echivalente, când printr-un atribut ei aparţin
acelei clase. Dar, în interiorul unei clase date, indivizii pot fi comparaţi în funcţie de gradul prezenţei
unui atribut comun. Trebuie să fim preocupaţi de ordinea relativă a obiectelor sau indivizilor. Realizarea
acestei ierarhii se bazează pe evaluarea unui atribut observat, printr-o comparaţie directă sau indirectă.
O scală poate fi obţinută, constatând că un obiect sau individ posedă atributul într-un grad mai ridicat
faţă de obiectul sau individul precedent din serie, ceea ce poate fi simbolic exprimat astfel:
S1 < S2 < S3.............Sn (pentru n subiecţi)
Operaţiunea de ordonare presupune o discriminare foarte riguroasă faţă de simpla
categorizare, deoarece pentru fiecare obiect sau individ trebuie să stabilim gradul de prezenţă a unui
atribut, ceea ce nu înseamnă că scala indică cantitatea absolută a atributelor prezente, nici amploarea
diferenţelor sau raporturile dintre cantităţile atributelor prezente. În alţi termeni, atributul nu se exprimă
în mod necesar în unităţi egale, chiar dacă numerele care le reprezintă sunt la distanţe egale. De
exemplu, un individ care se situează la rangul patru nu prezintă de două ori mai multe atribute decât cel
22
PSIHODIAGNOSTIC (I)
care se situează la rangul doi. În fine, scala ordinală nu poate exista în absenţa totală a unui atribut, ea
nu admite deci zero absolut.
Simbolurile numerice atribuite obiectelor sau indivizilor, sunt ranguri care indică poziţia relativă
a acestora pe un continuum pentru atributul pe care dorim să-l măsurăm, ca în exemplul de mai jos.
S1 S2 S3 S4 S5 S6
Observăm că într-o scală ordinală direcţia continuumului este cunoscută. Singurele informaţii
cunoscute din acest continuum sunt de tipul "mai mic ca", "mai mare ca", "egal" sau "diferit" (<;>;=;≠),
între indivizi sau obiecte, în funcţie de atributul măsurat. Acest continuum reprezentat mai sus ne
permite să stabilim că:
S1 < S2; S4 > S3; S3 ≠ S5.
Datele scalelor ordinale pot fi analizate prin statistici neparametrice. Se poate recurge la toate
operaţiile statistice aplicabile scalelor nominale. Pentru aceste date putem calcula mediana, centile,
coeficienţi de corelaţie a rangurilor şi chi-pătrat. În acelaşi timp, operaţiile algebrice de adunare,
scădere, înmulţire şi împărţire nu au nici un sens dacă sunt aplicate acestor date. Nu putem calcula
media şi abaterea standard care ne oferă posibilitatea de a cunoaşte mai mult decât poziţia relativă a
obiectelor sau indivizilor. Aceasta este o limită importantă a informaţiilor care pot fi furnizate de o scală
ordinală, deoarece media sau abaterea standard reprezintă fundamentul metodelor statistice utilizate în
ştiinţele umane. Relaţiile funcţionale stabilite pe baza scalelor ordinale ne oferă un indice, mai mult sau
mai puţin satisfăcător, în comparaţie cu relaţiile exprimate de alte scale mult mai complexe.
Mulţi autori consideră că scalele de măsurare psihologice furnizează informaţii despre ordinea
indivizilor, în funcţie de atributul măsurat sau asupra gradului la care fiecare individ prezintă acel atribut.
Aceşti autori aduc critici severe legate de utilizarea metodelor statistice puternice în analiza datelor
psihologice şi recomandă o mare prudenţă în interpretarea datelor obţinute cu ajutorul scalelor ordinale.
Crearea unei scale ordinale presupune, stabilirea unei relaţii de ordine între valorile posibile ale
variabilei studiate.
J. Piaget, de exemplu oferă modelul unei scale după criteriul slab structurat - înalt structurat,
prin care evaluează stadiul dezvoltării inteligenţei la copil.
Stadiul 1 exersarea reflexelor
Stadiul 2 reacţia circulară primară
Stadiul 3 reacţiile circulară secundare
Stadiul 4 coordonarea schemelor secundare şi aplicarea la situaţii noi
Stadiul 5 reacţia circulară terţiară şi descoperirea de mijloace noi prin experimentare activă
Stadiul 6 inventarea unor mijloace noi de acţiune prin combinare mentală
Ordinea prezentată este de la simplu la complex. Utilizând această scală putem caracteriza
manifestările unui copil în funcţie de stadiul pe care l-a atins în dezvoltare. Dacă subiectul A este pasat
în stadiul 1, subiectul B în stadiul 2, iar subiectul C în stadiul 3, atunci putem face afirmaţia că subiectul
C are posibilităţi operatorii mai mari decât B sau C. Dar, caracteristicile scalei ordinale nu ne permit să
precizăm cu exactitate cu cât este mai complex C faţă de B sau faţă de A şi nici să comparăm diferenţa
dintre C şi B cu cea dintre B şi A.
23
CORNEL HAVÂRNEANU
Aranjarea ordinală poate da rezultate foarte complete dacă cunoaştem distanţa care separă
obiectele sau indivizii în funcţie de atributul măsurat. Dacă mai multe obiecte sau indivizi sunt la distanţe
egale, în funcţie de gradul pe care îl prezintă atributul, distanţa care le separă poate fi considerată ca o
unitate liniară de măsură şi scala constituită în acest fel se numeşte scală cu intervale egale sau scală
de intervale.
Egalitatea dintre intervale este necesară dacă dorim să cunoaştem diferenţele interindividuale
(diferenţele dintre indivizi referitoare la un atribut, pe un singur continuum) sau diferenţele intra-
individuale (diferenţele dintre poziţia unui individ în funcţie de mai multe atribute pe mai multe
continuumuri). O unitate reprezintă un aspect arbitrar, dar care poate avea o relaţie cu atributul pe care
dorim să-l măsurăm. Distanţele numerice egale reprezintă, în principiu distanţele empirice egale între
obiecte sau indivizi, în funcţie de atribut.
Se poate ajunge deseori la formularea unor enunţuri ştiinţifice în legătură cu diferenţele dintre
gradele la care obiectele sau indivizii prezintă un atribut. Sensul enunţurilor formulate presupun o
proprietate care se juxtapune obiectelor sau indivizilor, adică gradele de prezenţă a unui atribut pot fi
supuse operaţiilor de adunare şi scădere. Dacă această proprietate este satisfăcută atunci avem o
scală denumită "aditivă".
Unele scale aditive oferă posibilităţi limitate de măsurare dacă zero absolut nu poate fi stabilit.
De asemeni, scalele cu intervale egale permit măsurarea diferenţelor dintre gradele de prezenţă a
atributelor, dar nu indică amplitudinea absolută a acestor grade, deoarece ele nu admit zero absolut.
Ele presupun existenţa unui punct zero definit arbitrar. Zero nu este decât ceva arbitrar într-o scală de
interval, gradul de prezenţă a unui atribut care defineşte punctul zero are puţine şanse să corespundă
unei limite reale la care atributul dispare complet. Din această cauză este imposibil să stabilim proporţii
pe baza gradelor de prezenţă a unui atribut exprimat pe o scală de intervale egale. În acelaşi timp,
considerăm că distanţele pe o scală de intervale egale au proprietatea de adiţionare, ceea ce
presupune existenţa unui zero absolut.
Două enunţuri principale pot defini scalele cu intervale egale:
S1 < S2 < S3.............< Sn
S2 - S1 = S3 - S2 =S4 - S3.................Sn -Sn - 1
unde S1..........Sn sunt grade relative la care un atribut se prezintă pentru diferiţi subiecţi.
Scala de interval ne permite să cunoaştem direcţia unui continuum, dar şi stabilirea diferenţelor
între poziţiile obiectelor sau indivizilor, precum şi efectuarea unor operaţii de tipul celor prezentate mai
jos.
1 2 3 4
S1 S2 S3 S4 S5 S6 S7 S8 S9 S10 S11
Acest continuum de intervale egale ne permite să stabilim că diferenţa dintre rezultatele (R) a
indivizilor 1 şi 2 este mai mică decât diferenţa dintre rezultatele indivizilor 2 şi 3. Se observă că dacă
diferenţa dintre rezultatele indivizilor 2 şi 3 este de 1,5 în timp ce diferenţa dintre rezultatele indivizilor 1
şi 2 sau 3 şi 4 este de 1.
24
PSIHODIAGNOSTIC (I)
Scorurile unei scale de interval nu indică amplitudinea absolută a unui atribut din cauza
absenţei unui zero absolut, iar operaţiile de înmulţire şi împărţire nu au sens decât dacă ele se aplică
intervalelor nu şi scorurilor. Însă operaţiile de adunare şi scădere sunt aplicabile atât intervalelor cât şi
scorurilor.
Scorurile dintr-o scală de intervale pot fi supuse unei transformări liniare, fără ca structura scalei
să se modifice. Putem aduna sau scădea la fiecare scor o valoare constantă, sau putem împărţi sau
înmulţi fiecare scor printr-o constantă, fără a afecta nici poziţia relativă a obiectelor sau indivizilor pe un
continuum, nici egalitatea intervalelor, nici raporturile dintre intervale, nici forma generală a relaţiilor
dintre scorurile scalei faţă de o altă scală.
Scalele de intervale oferă, pe lângă posibilitatea operaţiilor statistice specifice scalelor mai puţin
complexe, calculul mediei abaterii standard, coeficientul de corelaţie Pearson recurgerea la teste de
semnificaţie (F; t) şi folosirea unor numeroase tehnici statistice puternice. Din acest motiv este de dorit
să utilizăm scala de intervale egale în ştiinţele umane:
Dar concepte ca inteligenţa, aptitudinile şi personalitatea nu pot fi măsurate decât cu scale
ordinale deoarece acestea nu răspund exigenţelor scalelor de măsurare mai complexe. În consecinţă,
singurele operaţii statistice acceptate legitim cu acest tip de date sunt cele specifice scalelor ordinale.
Cercetarea în ştiinţele umane recurge, cu mare frecvenţă la analize statistice puternice. Această situaţie
a determinat numeroase dezbateri printre cercetători purtate asupra legitimităţii de a considera
atributele umane ca putând fi exprimate în unităţi egale. De fapt, înainte de a analiza rezultatele unei
scale de măsurare, în conformitate cu posibilităţile pe care ni le oferă scalele de intervale, este
important să stabilim empiric egalitatea intervalelor scalei respective. În cazul în care utilizăm mai multe
metode de măsurare, este posibil să determinăm procedeul de operare potrivit, dacă unităţile sunt egale
sau nu. Alegerea acestor operaţii se efectuează în funcţie de variabila analizată şi de concepţiile
teoretice referitoare la natura variabilei respective.
Diferite tehnici permit controlul dificultăţilor legate de alegerea scalei şi se va proceda într-un
anumit fel dacă postulatele corespunzătoare utilizării unei scale de intervale egale sunt satisfăcute.
O primă tehnică constă în utilizarea unei singure definiţii operaţionale pentru atributul măsurat.
Acesta presupune să nu definim variabile decât în funcţie de rezultatele obţinute la un test. Ele
reprezintă deci, în mod cert, puritate matematică, dar ele pot conduce la erori de interpretare
conceptuală.
O a doua tehnică constă în a transforma rezultatele brute în scoruri derivate, care sunt ele
însele exprimate într-o scală de intervale egale.
Această scală, care se aplică măsurătorilor fizice este o scală numerică. În măsurarea unui
atribut, zero absolut indică absenţa atributului la un obiect sau individ. O scală de proporţii poate fi
stabilită pentru un atribut, care la primă vedere, nu prezintă posibilitatea absenţei totale, când putem
respinge existenţa unei relaţii funcţionale între acel atribut şi un alt atribut sau fenomen care posedă
proprietatea de adunare (adică zero absolut). De exemplu, dacă putem vorbi de absenţa totală a
căldurii, vom putea tot timpul verifica existenţa unei relaţii funcţionale între căldură şi modificările
25
CORNEL HAVÂRNEANU
termice. Absenţa totală a variaţiilor termice corespunde unui zero absolut pentru temperatură (zero
grade Kelvin). Această procedură nu se poate aplica în toate situaţiile, mai ales în cazul atributelor
psihologice.
Prima caracteristică a unei scale de proporţii constă în posibilitatea de a cunoaşte distanţa între
zero absolut şi poziţia unui obiect sau individ pe un continuum definit pe baza unui atribut dat.
Amplitudinea absolută a unei cantităţi dintr-un atribut este o dată cunoscută şi este posibil să
cunoaştem poziţia unui scor individual fără a fi necesar să situam alţi indivizi sau obiecte pe acest
continuum. Numerele reprezintă deci, într-o formă reală gradul prezenţei unui atribut la un individ sau la
un obiect.
Mai mult, ca şi pentru scalele mai puţin complexe, direcţia continuumului este cunoscută, şi de
asemenea rangul indivizilor în funcţie de un anumit atribut, precum şi mărimea intervalelor dintre
scoruri, intervale care sunt evident egale. Scala de raport este deci o scală care dă informaţii foarte
complete.
1 2 3 4
0 1 2 3 4 5 6 7 8 9 10
Putem compara poziţiile indivizilor pe continuum dar, în acelaşi timp, putem stabili că individul 2
prezintă dublul gardului atributului prezent la individul 1, individul 3 prezintă de 3,5 ori gradul atributului
individului 1, iar individul 4 prezintă de 4,5 ori gradul atributului individului 1.
Dacă înmulţim sau împărţim scorurile unei scale de proporţii printr-o constantă, scala îşi
conservă proprietăţile, ordinea indivizilor sau obiectelor rămân aceeaşi, proporţiile dintre intervale şi
dintre scoruri rămân neschimbate, punctul zero este tot timpul prezent.
Dimpotrivă, dacă adunăm sau scădem o constantă din scorurile scalei, natura scalei se
modifică. Ordinea obiectelor sau indivizilor şi proporţiile dintre intervale rămân aceleaşi, dar proporţiile
dintre scoruri sunt modificate, iar zero absolut dispare.
Constatăm că informaţiile furnizate de o scală sunt cu atât mai precise, cu cât este mai mică
libertatea de a transforma scala fără a modifica informaţiile originale. O scală ordinală, de exemplu,
poate suporta toate transformările monotone fără ca informaţiile primare să fie modificate. La o scală de
intervale posibilităţile de transformare sunt mult mai restrânse. În sfârşit la scalele de proporţii
transformările permise sunt limitate la înmulţirea şi împărţirea printr-o constantă dacă dorim ca
informaţiile să rămână identice.
Postulatele unui model de scală de proporţii permit utilizarea tuturor operaţiilor aritmetice (+, –,
×, ÷), atât cu intervalele cât şi cu scorurile. Posibilitatea utilizării celor patru operaţii autorizează
folosirea metodelor de analiză matematică şi statistică foarte puternice, incluzând faţă de operaţiile
permise de scalele mai puţin complexe şi calculul coeficientului de variaţie.
Dacă corectăm un test şi adunăm numărul itemilor rezolvaţi corect, obţinem un număr situat pe
o scală de proporţii. Dar, dacă utilizăm acest număr pentru a indica poziţia subiectului pe o scală care
măsoară un atribut psihologic, atunci acest număr nu poate fi interpretat pe baza regulilor unei scale de
proporţii. Astfel, inexistenţa unor răspunsuri corecte (ceea ce însemnă zero răspunsuri corecte) nu
26
PSIHODIAGNOSTIC (I)
corespunde absenţei totale a atributului psihologic măsurat. De exemplu un scor zero la un test de
randament lexical nu implică că abilităţile de lectură sunt nule. Mai mult, 50 de itemi corect rezolvaţi,
dintr-un test, nu corespunde dublului gradului unui atribut pentru care s-au rezolvat 25 de itemi din
acelaşi test. Noi nu putem spune că un subiect care are un QI de 130 are o inteligenţă dublă faţă de un
subiect care are un QI de 65. De asemeni, nu putem vorbi de un QI nul, deoarece zaro absolut nu
există în măsurarea atributelor psihologice. Atributele psihologice nu permit aplicarea procedeului de
stabilire a unei relaţii funcţionale între două atribute deoarece acestea nu prezintă posibilitatea absenţei
totale. Scalele de proporţie nu sunt convenabile măsurării atributelor psihologice.
Observaţiile obţinute printr-un procedeu de măsură pot fi fie constante ale unui individ sau altul,
sau a unor situaţii diferite pentru acelaşi individ, fie variabile.
Variabilele sunt cantităţi de un anumit tip care pot lua mai mult decât o singură valoare. Acestea
pot fi neordonate (exemplu: sexul) sau ordonate (exemplu: aşezarea în ordine a scorurilor obţinute la un
test de randament). Variabilele ordonate pot fi negraduate (exemplu: bun, rău, slab) sau graduate
(exprimate cu ajutorul scorurilor numerice). Variabilele graduate pot fi continue (există posibilitatea de a
lua toate valorile numerice inclusiv fracţii, de exemplu: temperatura, greutatea) sau discrete (scorurile
nu pot avea decât valori întregi, de exemplu: numărul de indivizi dintr-o categorie sau numărul copiilor
dintr-o familie). Variabilele dihotomice sunt cele care nu pot lua decât două valori, de exemplu 0 sau 1.
Acestea sunt cazuri particulare ale variabililor discrete.
Constanta este o cantitate a cărei valoare rămâne neschimbată indiferent de context.
Termenul de statistică este frecvent utilizat dar este util să stabilim câteva distincţii în legătură
cu folosirea acestuia în teoria psihometrică. Distingem o diferenţiere între statistica inferenţială şi cea
descriptivă. Prima vizează producerea unor enunţuri probabiliste în legătură cu valorile obţinute de
subiecţii unor eşantioane din populaţie. A doua se limitează la descrierea diverselor aspecte ale unui
ansamblu de date empirice. Analizele matematice referitoare la măsurarea tendinţei centrale, a
dispersiei sau a corelaţiilor pot duce la descrierea unui ansamblu de date empirice ale unui eşantion mai
mare sau mai mic. Într-o etapă ulterioară putem aplica acestor date descriptive un ansamblu de tehnici
statistice inferenţiale (calcului intervalului de confidenţă, teste de semnificaţie) care permit extinderea
datelor obţinute prin investigarea eşantionului la ansamblul populaţiei studiate.
În psihologie, problema eşantionării se referă pe de o parte la eşantionarea subiecţilor dar pe
de altă parte la eşantionarea conţinutului (a itemilor unui test). Trebuie să facem distincţie între aceste
două forme de eşantionare. Putem concepe un ansamblu de itemi a unui test ca un eşantion a unei
populaţii ipotetic infinite de itemi (universul itemilor) care măsoară aceeaşi trăsătură. Teoria măsurării
este preocupată de relaţiilor statistice între scorurile obţinute la test şi scorurile ipotetice adică, scorurile
care ar putea fi obţinute dacă toţi itemii din universul de itemi ar fi utilizaţi pentru testare. După ce un
instrument de măsură a fost construit şi când el face obiectul unor cercetări empirice, este important să
27
CORNEL HAVÂRNEANU
realizăm analize statistice (inferenţiale) pentru generalizarea datelor obţinute pe eşantioane de subiecţi,
la populaţia corespunzătoare. În construcţia unui instrument preocuparea principală este examinarea
posibilităţilor de extindere la populaţia de itemi a rezultatelor obţinute cu ajutorul eşantionului de itemi. În
consecinţă, este imposibil să ţinem seama în acelaşi timp, în analize statistice, de cele două aspecte ale
eşantionului. O manieră tipică de rezolvare practică a acestei probleme este de a ţine seama, în mod
explicit, de unul din cele două dimensiuni şi considerând că cealaltă dimensiune poate eventual să
influenţeze rezultatele.
Există posibilitatea să se rezolve această problemă într-o manieră mult mai sigură. Putem folosi
un eşantion foarte mare, fără a fi preocupaţi de erorile de eşantionare decât în raport cu celălalt
eşantion. În psihometrie când construim un instrument de măsură utilizăm un eşantion de subiecţi
suficient de mare pentru ca eroare de eşantionare referitoare la indivizi să fie puţin importantă.
Problema reprezentativităţii eşantionului de subiecţi fiind rezolvată, reprezentativitatea eşantionului
conţinutului va deveni preocuparea centrală.
Un eşantion de subiecţi relativ restrâns nu este suficient pentru un studiu de validitate pentru
noul instrument. Mai mult, dacă eşantionul de subiecţi este suficient de mare, atunci precizia testului va
fi independentă de numărul de subiecţi din eşantion şi va fi legată direct de conţinutul testului adică de
numărul de itemi.
În ştiinţele umane măsura nu se aplică direct indivizilor ci, diferitelor caracteristici ale acestora
la care se face referire printr-o terminologie variată. Când vorbim de atribut, de proprietăţi sau de
trăsătură, facem referire la o particularitate care este prezentă şi se manifestă în diferite grade la
indivizii unei clase date, acestea nefiind în mod necesar prezente la toţi indivizii. Problema este de a
cunoaşte dacă un individ posedă unele proprietăţi.
În cazul unei proprietăţi care se referă la abilitatea unui individ sau la personalitatea sa,
măsurarea se referă la comportamentele observabile şi măsurabile. Această proprietate este o
construcţie, un concept care se referă la un aspect precis al individului şi din care putem extrage un
ansamblu de comportamente, pe care îi vom considera indicatori ai proprietăţii respective. Acest
concept căruia îi atribuim un nume (perseverenţă, inteligenţă, autoritarism etc.) nu există în afara
indivizilor. Pentru a fi raţional este necesară o coerenţă cu acele comportamentele observate, cu
organizarea şi structurarea lor. Pe baza observaţiilor indicatorilor unei proprietăţi a trăsăturii vom putea
presupune prezenţa, într-o măsură mai mare sau mai mică a proprietăţii, la un individ iar această
presupunere implică formularea unuia sau mai multor postulate sau o demonstraţie pentru stabilirea
unei relaţii între proprietăţi şi manifestările sale (indicatori comportamentali).
Un concept poate fi definit în două feluri, fie cu ajutorul altor concepte (definiţie teoretică sau
constitutivă) fie cu ajutorul procedeelor experimentale (definiţie empirică sau operaţională). Dacă unele
trăsături se pretează la definiţii relativ clare şi precise (aptitudine numerică, aptitudine verbală etc.)
altele sunt foarte ambigue şi mai imprecise (onestitate, impulsivitate etc.). În cazul în care presupunem
că o proprietate poate fi măsurată cu ajutorul unor indicatori, atunci proprietatea respectivă face obiectul
unei definiţii operaţionale riguroase în care trebuie precizate activităţile şi operaţiile la care se recurge
pentru a putea fi supuse procedeului de măsurare.
28
PSIHODIAGNOSTIC (I)
Cercetătorii caută în mod obişnuit izolarea unei proprietăţi. În acest fel ei limitează observaţiile
directe şi indicatorii la categoria de comportamente pertinente studiului lor, pentru a stabili indicatorii
proprietăţii. Valoarea inferenţei prin utilizarea unui procedeu de măsurare este dependent de natura
observaţiilor, care sunt în funcţie de interacţiunea anumitor factori. Caracteristice naturale ale
proprietăţii, teoria care o susţine, natura instrumentelor de măsură, şi experienţa cercetătorului sunt
factori care determină tipul de observaţie (direct sau indirect) şi în acelaşi timp veridicitatea cazurilor
observate. Dar ştiinţa vizează stabilirea consensurilor propriilor enunţuri referitoare la conceptele pe
care le dezvoltă şi este important ca observaţiile să poată fi reproduse. Din acest motiv condiţiile
observaţiilor, timpul, locul şi circumstanţele trebuie precizate. De asemenea, procedeul de măsurare
trebuie să poată fi refolosit şi rezultatele să fie verificabile. Mai mult, valoarea observaţiilor în ştiinţele
umane, este limitată de diferite surse de eroare, rezultatele măsurării fiind doar estimări ale indicatorilor
proprietăţii studiate. Precizia rezultatelor permite evaluarea valorilor observate, a intervalelor “de
confidenţă” în interiorul cărora valorile studiate au o probabilitate dată.
Pentru a elimina lacunele observaţiilor trebuie să elaborăm un instrument de măsură care să
permită evaluări cât mai precise ale indicatorilor. Elaborarea acestor instrumente presupune o bună
înţelegere a conceptelor. Primele baze de identificare a unei proprietăţi pot fi imperfecte datorită limitelor
observatorului şi a conceptelor eronate despre proprietatea respectivă. În cursul elaborării unei măsurări
numeroase schimbări sunt făcute asupra conceptelor legate de proprietatea măsurată. Primele estimări
sunt grosiere şi posedă multe erori. Cercetătorul poate perfecţiona scala de măsurare prin determinarea
relaţiei existente între proprietatea măsurată cu ajutorul scalei şi alte proprietăţi. În acest fel, măsurarea
devine mai rafinată dacă în timp se achiziţionează noi cunoştinţe.
Realizarea unor instrumente la care erorile de măsurare să fie cât mai mici şi care să permită
înregistrarea cât mai obiectivă a manifestărilor unei proprietăţi este mai mică în domeniul psihologiei. De
fapt, constatăm că nici măsurătorile fizice nu sunt perfecte. Simplul fapt de a face o măsurare, în care
intervine un observator şi folosirea unui instrument de măsură afectează rezultatele. Dacă metodele
respective permit eliminarea, într-o măsură mai mare sau mai mică, a efectelor procedeului de
măsurare, rămâne tot timpul o interacţiune nedeterminată între subiect şi observator.
Faptul că măsurarea presupune o eroare afectează certitudinea în stabilirea unei relaţii
cauzale. Concepţiile moderne de măsurare substituie modelului convenţional “cauză - efect”, enunţuri
relative asupra probabilităţii de manifestare a unui eveniment sau interacţiunilor dintre observaţii. În
statistică, proprietatea este măsurată în funcţie de acumularea unor evenimente (media) şi variaţia
acestora (varianţă).
29
CORNEL HAVÂRNEANU
Faptul psihologic este o conduită, care implică o schemă de relaţii, pe care le studiază
psihologul. Conduita este manifestarea unei persoane într-o situaţie dată.
Dacă notăm conduita cu R (fideli tradiţiei anglo - saxone, unde R reprezintă iniţiala de la
răspuns sau reacţie), atunci aceasta depinde de personalitatea subiectului (P), care se confruntă cu o
situaţie dată (S).
În acest fel putem considera conduita în funcţie de personalitate şi situaţie: R=f(P,S).
În evoluţia psihologiei această relaţie a cunoscut diferite forme în funcţie de paradigmele
explicative la care au aderat cercetătorii.
Watson (1913), a pus bazele paradigmei behavioriste, în centrul atenţiei fiind plasat studiul
comportamentului exterior. Pentru acesta relaţia era de tipul R=f(S), aspectele legate de personalitatea
subiecţilor au fost neglijate deoarece psihologul nu poate pătrunde în interiorul "cutiei negre".
Woodworth (1929), complică schema de relaţii, sub forma S ⇒ O ⇒ R, scoţând în evidenţă
rolul organismului, dar se limitează doar la evocarea determinanţilor biologici ai comportamentului.
Pentru a evita orice confuzie trebuie menţionat faptul că variabilele S, R, P pot fi studiate la
diferite niveluri:
Conduita (R), reprezintă actul subiectului şi are componente endocrine, neurovegetative, motorii,
verbale. Psihologul se poate limita la studii fragmentare, luând în consideraţie doar o
componentă, dar poate cerceta şi relaţiile dintre mai multe componente. Astfel, o conduită
manifestată printr-un răspuns verbal, pate fi analizată din punct de vedere a structurii
gramaticale, a naturii fonemelor, a semnificaţiei sau a efectului produs pentru interlocutor.
Situaţia (S), pate fi de asemenea analizată la diferite niveluri. Stimulii fizici, care provin de la diferite
surse, acţionează de multe ori asupra subiecţilor, fără ca aceştia să conştientizeze. Lumina,
temperatura, umiditatea, presiunea atmosferică, compoziţia şi gradul de ionizare a aerului
influenţează dispoziţiile şi activităţile oamenilor. Percepţiile nu sunt simple fotografii ale obiectelor,
ele sunt construcţii ale experienţei, sunt influenţate de modul în care subiectul se raportează la
situaţie, de atitudinea acestuia. Situaţia este deci, relativă la subiect şi este important modul în
care subiectul vede situaţia, în funcţie de personalitatea sa.
Din aceste considerente relaţia nu este de tipul R=f(S,P) ci, R=f(S ⇔ P), săgeata dublă indicând
că există întotdeauna o interacţiune între S şi P, care nu sunt simple variabile aditive. Această
interacţiune poate fi cunoscută prin interpretarea răspunsurilor subiectului, care va dezvălui
semnificaţia pe care acesta o dă situaţiei.
Personalitatea (P), este o sinteză dinamică de aspecte morfologice şi fiziologice, dar şi conative,
afective, volitive. Cercetătorul trebuie să ţină seama de aceste aspecte şi chiar să ia în
30
PSIHODIAGNOSTIC (I)
consideraţie şi alte variabile ca: vârsta, sexul, integritatea senzorială, temperamentul, educaţia
primită, motivaţia etc. Personalitatea este în centrul relaţie, ea nu poate fi izolată din relaţie
deoarece se manifestă ca un nod de relaţii între situaţii şi răspunsuri.
S1 R1
S2 R2
S3 P R3
Sn Rn
În această figură S1, S2, S3, .....Sn, reprezintă situaţii cărora le corespund diferite răspunsuri R1,
R2, R3, ...Rn. De exemplu, evoluţia adaptării la întuneric (R) este în funcţie de timp (S), sau volumul
materialului memorat (R) este în funcţie de numărul de repetiţii, sau reacţiile defensive (R) sunt în
funcţie de gradele diferite ale frustrării (S).
b. Relaţii structurale, folosite pentru studiul structurii psihice, unde se studiază relaţiile dintre
răspunsurile obţinute de subiecţi pornind de la situaţii diferite.
S1 R1
S2 R2
S3 P R3
Sn Rn
În acest caz, situaţiilor diferite S1, S2, S3, .....Sn, le corespund răspunsuri diferite R1, R2, R3,
...Rn. Aici se pune problema de a stabili relaţiile dintre răspunsurile R1, R2, R3, ...Rn, care sunt
dependente de structura personalităţii. Aceste studii utilizează calcule de corelaţie şi analiza factorială.
Astfel se pot studia relaţiile dintre reacţiile obţinute în diferite situaţii care produc emoţii sau relaţiile
dintre diferite niveluri de eficienţă în sarcini diferite. Logica acestor studii se bazează pe faptul că dacă
obţinem corelaţii ridicate între răspunsurile subiecţilor la diferite situaţii, înseamnă că există un factor, în
structura personalităţii care justifică aceste corelaţii. În acest fel Spearman a obţinut un factor "g" de
31
CORNEL HAVÂRNEANU
inteligenţă generală şi mai mulţi factori "s", consideraţi factori specifici, iar Thurstone mai mulţi factori de
grup, printre care factorul numeric "N", factorul de fluiditate verbală "W", factorul de comprehensiune
verbală "V", un factor perceptiv "P", unul de raţionament "R" (cu două forme raţionament inductiv I şi
deductiv D).
c. Relaţii diferenţiale, folosite pentru studierea diferenţelor dintre indivizi, unde luăm în
consideraţie reacţiile unor persoane diferite la o singură situaţie standardizată.
P1 R1
P2 R2
S
P3 R3
Pn Rn
Diferenţele dintre R1, R2, R3,...Rn, se obţin datorită diferenţelor existente între P1, P2, P3,...Pn. În
acest fel putem studia diferenţele dintre indivizi, dar putem compara şi reacţiile unor grupuri diferite, în
funcţie de anumite caracteristici ca: vârsta, sexul, etnia, nivelul cultural etc. În cel de al doilea caz putem
pune în evidenţă unele aspecte ale personalităţii, comune în diferite grade, tuturor subiecţilor care
aparţin unui grup selectat pe baza unor criterii dinainte stabilite. De exemplu, putem studia variaţiile
eficienţei subiecţilor în diferite domenii de activitate în funcţie de experienţa profesională a acestora,
evoluţia percepţiilor în funcţie de vârstă şi sex, asemănările şi deosebirile de mimică emotivă la populaţii
care aparţin unor culturi diferite.
Acest tip de relaţie este folosit atât în cazul experimentului cât şi în cel al testului psihologic, dar
cele două aspecte nu sunt identice. În situaţia experimentală, P1, P2, P3, ...Pn, este aceiaşi persoană
în stări diferite. Situaţiile interne, subiective pot fi diferite. De asemeni dacă sunt ingerate anumite
substanţe (stimulatoare, deprimante, droguri), reacţiile sunt determinate de acestea.
În cazul testului P1, P2, P3, ...Pn, sunt persoane diferite. Din aceasta cauză nu mai avem
aceeaşi certitudine în stabilirea relaţiilor dintre fapte şi nici atunci când interpretăm rezultatele, deoarece
situaţia este interpretată diferit de fiecare persoană. În cadrul relaţiilor S ⇔ P, necunoscând perfect
persoana nu putem şti care din factorii care acţionează asupra lui P1 determină R1 şi care din factorii
care acţionează asupra lui P2 determină R2. Dacă R1 şi R2 pot fi răspunsuri aproape identice P1 şi P2
sunt subiecţi foarte diferiţi.
În concluzie, între experiment şi test există o deosebire de precizie, testul fiind mai puţin
precis decât experimentul. Totuşi, testul rămâne o formă de experiment, pentru că provocăm o reacţie
în condiţii bine determinate ţi obţinem reacţii în aceste condiţii. Şi în cazul experimentului, chiar dacă
aceste se adresează aceloraşi subiecţi, starea acestora se poate modifica, subiecţii îşi pot schimba
atitudinea şi pot interveni factori care ne scapă de sub control. Pentru a evita erorile, în cazul
experimentului vom folosi grupe de subiecţi, şi în acest fel vom putea verifica dacă rezultatele sunt
datorate stimulului şi nu subiectivităţii subiecţilor. Condiţia care se impune pentru precizie, este ca
subiecţii să fie echivalenţi.
32
PSIHODIAGNOSTIC (I)
Termenul a fost introdus în psihologie de James McKeen Cattell, psiholog american, elev a lui
Wundtt, care în 1890 denumeşte probele destinate cunoaşterii deosebirilor dintre indivizi "teste",
denumire care s-a păstrat şi astăzi (în engleză "test" înseamnă probă, încercare, experimentare).
Lee Cronbach, defineşte testul ca un "procedeu sistematizat de măsură a comportamentului
unor persoane şi de descriere a acestuia cu ajutorul unor scări numerice sau a unui sistem de
categorii", (scări nominale sau ordinale). Pe baza acestei definiţii testul cuprinde chestionarele,
procedee pentru observarea comportamentului social, aparate pentru măsurarea şi înregistrarea
randamentului.
Pentru André Rey, "testul este un mijloc de a diferenţia indivizii în funcţie de un etalon", iar
Anne Anastasi (1976) consideră că "un test psihologic este măsurarea standardizată şi obiectivă a
unei modalităţi de comportament".
Asociaţia internaţională de psihotehnică şi Henri Piéron (1963) definesc testul "o probă
determinată, implicând o sarcină de executat, identică pentru toţi subiecţii examinaţi. Este o tehnică
precisă pentru aprecierea succesului sau pentru notarea numerică a reuşitei". Definiţia scoate în
evidenţă două aspecte importante: folosirea unei probe standardizate şi a unei tehnici exacte de
apreciere a rezultatelor.
P. Pichot observă că aceste definiţii elimină o categorie importantă de "teste" şi anume
"testele" proiective. După el, "testul psihologic este o situaţie standardizată servind drept stimul unui
comportament. Acest comportament este evaluat şi comparat statistic cu cel al altor indivizi plasaţi în
aceeaşi situaţie, ceea ce permite clasarea subiectului fie cantitativ, fie tipologic". În legătură cu "testele"
proiective", în literatura de specialitate se întâlneşte termenul de "tehnică proiectivă", deoarece aceste
"teste" nu sunt suficient de standardizate, mai ales în privinţa aprecierii şi interpretării rezultatelor.
Acesta este motivul care justifică eliminarea acestora din categoria testelor şi folosirea termenului de
tehnică, tocmai pentru a evidenţia specificul lor.
Ion Holban (1978), defineşte testul ca "instrument al metodei experimentale, organizat sub
forma unei probe standardizate din punct de vedere al conţinutului, al condiţiilor de aplicare şi al
modalităţilor de apreciere a rezultatelor, instrument ce este folosit în stabilirea unei anumite variabile".
Autorul face câteva observaţii importante referitoare la specificul acestor instrumente de cunoaştere.
Testul impune existenţa unei relaţii directe şi specializate între itemii testului şi variabilele de investigat.
Orice test are valoare numai în limitele diagnosticului variabilei pentru care a fost elaborat. Această
relaţie nu este şi inversă, adică pentru aceeaşi variabilă putem găsi un număr considerabil de teste, mai
mult sau mai puţin apropiate ca structură. De exemplu, multe teste de inteligenţă au fost construite după
principiile şi modelul testului elaborat de Binet, cărora li s-a schimbat, după caz, diferite categorii de
itemi.
Andrei Cosmovici, (1996), defineşte testul ca "o probă standardizată, vizând determinarea cât
mai exactă a gradului de dezvoltare a unei însuşiri psihice sau fizice." Observăm, şi în acest caz
accentul care se pune în legătură cu standardizarea, dar şi determinarea cu ajutorul testelor o
performanţelor de care sunt capabile unele persoane datorită calităţilor fizice pe care le posedă.
În psihologie, termenul "test" are două sensuri:
33
CORNEL HAVÂRNEANU
X1 X2 X3 X4 Y1 Y2
X5 X6 X7 X8 Y3
Xm-1 Xm Yn-1 Yn
34
PSIHODIAGNOSTIC (I)
În concluzie, deosebirile exterioare, de formă, între sarcina test şi sarcina reală, ascund mereu
o identitate internă, de conţinut sau de natură psihologică. Modalitatea de rezolvare a acestei probleme
este fundamentală pentru valoarea constructivă şi diagnostică a unui test (Roger Mucchielli, 1969).
Pentru a evita unele confuzii, este necesar să facem distincţia dintre teste şi chestionare.
Reprezentanţii şcolii germane definesc chestionarele ca fiind "teste subiective". Această atitudine este
justificată de faptul că precizia chestionarelor este mult mai mică, din cel puţin două motive. În primul
rând, răspunsurile obţinute cu ajutorul acestor instrumente sunt dezirabile, subiecţii au tendinţa de a
face o bună impresie, de a răspunde aşa cum cred ei că este bine şi nu aşa cum sunt în realitate. În al
doilea rând, bazându-se pe introspecţie (care este de fapt o retrospecţie), intervine uitarea, ceea ce
face ca multe aspecte esenţiale să fie neglijate.
Prin utilizarea testelor aceste limite sunt înlăturate, acesta fiind un instrument mult mai precis.
Distincţia esenţial - neesenţial este mai tranşantă în cazul testelor şi dispare posibilitatea de a măsura
aparenţele. Diferenţierile dintre persoane, evidenţiate cu ajutorul testelor, sunt esenţiale dacă
demonstrăm constanţa acestora. Testul este un instrument valoros dacă predicţia pe care o facem cu
ajutorul lui este pertinentă, adică dacă se referă la comportamente care persistă la un individ.
Testele ca mijloace de psihodiagnostic s-au dezvoltat într-un ritm accelerat, utilizându-se în prezent,
în practica psihologică peste 10.000 de teste, astfel încât este dificilă realizarea unei clasificări care să
surprindă cele mai sensibile diferenţe pe baza criteriilor care se iau în consideraţie pentru o clasificare
generală. Există în literatura psihologică numeroase clasificări ale testelor:
După paradigma teoretică la care aderă: reprezentanţii şcolii experimentaliste, care descompun
personalitatea în părţi componente, apelează la teste "sectoriale" folosind analiza factorială şi metode
metrice precise, în timp ce psihologii clinicieni, încearcă să cuprindă ansamblul personalităţii cu ajutorul
testelor holistice, folosind sau nu indicatori numerici.
După aspectul psihologic investigat: găsim teste intelectuale, care vizează cunoaşterea
proceselor cognitive (percepţie, memorie, capacitate de analiză şi sinteză etc.), teste de personalitate, care
vizează aspectul afectiv - atitudinal.
Această clasificare grupează pe de o parte testele intelectuale, care sunt metrice, iar pe de altă
parte testele de personalitate, care sunt analitice (chestionarele) sau holistice (testele proiective).
După modul de prezentare: testele pot fi orale, răspunsul subiectului se dă sub formă verbală,
teste scrise (numite creion - hârtie), teste instrumentale, la care se utilizează un suport concret (material sau
un aparat), teste informatizate, aplicate cu ajutorul computerului.
După modul de aplicare: teste individuale şi teste de grup.
După timpul alocat pentru răspuns: teste cu timp liber şi teste cu timp limitat.
După scopul urmărit (P. Pichot) distinge: teste de eficienţă, care măsoară o aptitudine sau o
capacitate, şi teste de personalitate prin care se urmăreşte explorarea fondului psihologic intim,
determinarea aspectelor motivaţionale, ale caracterului accentul fiind pus pe interpretarea calitativă a datelor
obţinute.
35
CORNEL HAVÂRNEANU
O clasificare în detaliu a testelor psihologice este utilă şi eficientă din punct de vedere practic. În
acest fel putem distinge următoarele categorii de teste:
• teste de inteligenţă şi dezvoltare mintală, care măsoară aptitudinea cognitivă generală şi nivelul
atins în dezvoltarea caracteristicilor intelectuale;
• teste de aptitudini şi capacităţi, care au fost elaborate pentru măsurarea aptitudinilor de grup şi
specifice;
• teste de personalitate, care măsoară însuşiri de temperament şi caracter, acestea fiind împărţite
în două categorii:
1. teste obiective de personalitate, care-şi propun obţinerea unor date cuantificabile, cât mai
puţin influenţate de interpretările subiective şi evitarea tendinţei de faţadă a subiecţilor în
momentul elaborării răspunsului, deoarece aceştia nu conştientizează aspectele
personalităţii vizate de test;
2. tehnici proiective, care valorizează mecanismul de proiecţie în cunoaşterea psihologică a
persoanei, trecând peste vigilenţa conştiinţei în încercarea de a studia inconştientul;
• teste de cunoştinţe sau docimologice, care măsoară nivelul cunoştinţelor acumulate de subiecţi
şi servesc ca modalitate de examinare şi notare.
36
PSIHODIAGNOSTIC (I)
Există frecvent credinţa eronată că testul ar măsura toate aspectele cuantificabile ale
conduitelor sau reacţiilor umane. În realitate testul extrage, din variaţiile teoretic infinite ale conduitelor
subiectului, un număr limitat de eşantioane de conduită, pe care le măsoară, oferind o imagine lacunară
asupra conduitei reale a persoanei testate.
Se observă că testarea repetată a unei persoane cu aceeaşi probă, sau cu probe paralele duce
la obţinerea unor rezultate fluctuante, la o variaţie mai mult sau mai puţin accentuată.
Scorurile obţinute la testele psihologice provin din răspunsurile date de diferiţi subiecţi. Una din
caracteristicile comportamentului uman este că acesta se modifică în timp, aspect care ne face să ne
preocupe constanţa scorurilor. Eşantionarea itemilor, circumstanţele particulare de administrare a
testului şi caracteristicile subiecţilor determină inconstanţa în măsurare. Măsurările fizice sunt în general
37
CORNEL HAVÂRNEANU
stabile, iar diferenţele dintre scoruri sunt uşor de explicat, ceea ce nu se întâmplă în cazul măsurătorilor
psihologice, la care scorurile sunt influenţate de condiţii exterioare.
Teoria preciziei testului (termen generic pentru desemnarea studiului consistenţei interne) este
importantă prin două probleme fundamentale:
Prima constă în gradul de consistenţă a rezultatelor, şi se referă la relaţia între scorurile
obţinute în diferite situaţii de aplicare a testelor; iar a doua la cauzele diferenţelor observate între
scoruri, deci a cunoaşte factorii care determină scorurilor inconstante şi importanţa efectului lor.
Caracterul inconsecvent al rezultatelor brute ridică problema fidelităţii instrumentului care în
esenţă ridică trei probleme:
a. Cât de variabile, de fluctuante sunt rezultatele subiectului de la o măsurare la alta?
În această situaţie fidelitatea constă în stabilitatea rezultatelor în timp şi în consecinţă în
predictibilitatea lor.
b. Valorile obţinute la o probă sunt adevăratele valori ale aspectului psihologic măsurat?
Diferenţele interindividuale, constatate în privinţa cotelor obţinute la test, pot fi explicate prin
diferenţe reale dintre subiecţi?
În această situaţie fidelitatea se referă la acurateţea, precizia cu care testul măsoară ceea ce şi-a
propus să măsoare.
c. Cât de mare este eroarea de măsurare (totalul erorilor întâmplătoare) a testului?
În această situaţie fidelitatea se referă la absenţa relativă a erorilor de măsurare.
Teoria clasică a testelor furnizează elementele de bază, necesare pentru rezolvarea acestei
probleme. Ea se bazează pe câteva postulate, definiţii şi relaţii.
După teoria clasică a testelor toate scorurile observate (X) sunt compuse din două părţi: un scor
adevărat (A) şi un scor eroare (E). Această relaţie poate fi reprezentată sub forma ecuaţiei: X = A + E
Se pune însă problema sensului pe care îl dăm scorului observat.
Acest concept poate fi definit în mai multe feluri.
1. Îl putem considera ca un scor obţinut cu un test perfect, deci un test care măsoară
fără eroare. De fapt, dacă putem efectua măsurări fără eroare, toate scorurile
observate pot fi considerate ca adevărate. Acest lucru este imposibil deoarece
întotdeauna există un gard de eroare.
2. Există şi o altă manieră de înţelegere a scorului adevărat. Lord şi Novick (1968)
dau o altă definiţie scorului adevărat elaborând postulatele de bază şi relaţiile dintre
scorurilor adevărate şi eroare.
Scorul adevărat al unui subiect (s) obţinut cu un instrument dat (i) este definit ca valoarea
aşteptată a scorului observat:
Asi = ε Xis
unde: Asi este o constantă, Xis este o variabilă oarecare, iar ε este valoarea aşteptată.
Deci, scorul aşteptat al unui subiect (s) obţinut cu instrumentul (i) este valoarea aşteptată (ε) a
răspunsului la instrumentul (i) dat de subiectul (s).
O altă manieră de exprimare a relaţiei dintre un scor adevărat şi un scor observat, constă în a descrie
scorul adevărat ca fiind scorul mediu a unui subiect pentru un număr infinit de utilizări a aceluiaşi
instrument de măsură.
38
PSIHODIAGNOSTIC (I)
Un alt concept important în teoria clasică a testelor este cel de eroare (E). Eroarea poate fi
definită ca fiind diferenţa dintre scorul adevărat şi scorul observat:
Esi = Xis - Asi
Acest tip de eroare este datorată hazardului ceea ce exclude toate sursele sistematice de
variaţie a erorii.
După aceste constatări putem apela la calcularea mediei şi a varianţei pornind de la relaţia
iniţială şi prin calcule vom obţine:
X m = Am
Media scorurilor observate este egală cu media scorurilor adevărate.
Termenul Em, dispare din ecuaţie când valorile aşteptate ale erorilor (variabile aleatoare) tind
spre zero. În consecinţă, efectele erorilor au tendinţa să se anuleze dacă numărul de observaţii tinde
spre infinit.
Aceeaşi procedură poate fi aplicată şi pentru varianţă şi vom obţine:
S2X = S2A + S2E
atunci când erorile tind spre zero
Acesta este o ecuaţie fundamentală care are o mare importanţă pentru că ne permite să
construim o definiţie simplă şi interesantă a fidelităţii unui test.
Un postulat important a acestei teorii este că scorurile adevărate şi scorurile eroare nu sunt în
corelaţie, adică rAE = 0.
Se postulează de asemenea că scorurile eroare la diverse măsurări nu sunt în corelaţie, adică
rE1E2 = 0.
Este suficient să utilizăm egalitatea fundamentală pentru definirea fidelităţii:
S2X=S2A + S2E
Dacă împărţim fiecare din aceste elemente prin aceeaşi cantitate S2X, adică varianţa rezultatelor
observate, vom obţine:
S2X S2A S2E S2 A S2E
= + adică 1= +
S2X S2X S2X S2X S2X
S2 A S2E
unde este proporţia varianţei observate care provine din varianţa adevărată, iar este
S2X S2X
proporţia varianţei observate care provine din varianţa eroare.
S2A
Precizia poate fi definită ca fiind un raport de varianţă: rXX = unde rXX 1 desemnează
1
2
SX
coeficientul de fidelitate, adică proporţia varianţei observate care provine din varianţa adevărată.
S 2E
Sau putem scrie formula sub forma rXX = 1 − , adică unu minus proporţia varianţei observate
1
S X2
care provine din varianţa eroare.
Relaţia care există între cele trei varianţe poate fi reprezentată sub forma:
(1) S2A S2E
39
CORNEL HAVÂRNEANU
Unde cazul (1) arată un raport de fidelitate mai mare decât cazul (2).
Coeficientul de fidelitate corespunde unui raport de varianţă şi poate lua valori între 0 şi 1, deci
numai valori pozitive. Ecuaţia următoare reflectă bine acest lucru:
S2E
rXX = 1 − 2
1
S X
Dacă varianţa eroare (S2E) este maximă, ea este egală cu varianţa observată a testului (S2X). În
acest caz, putem spune că varianţa observată este dată numai de erori şi coeficientul de fidelitate este
nul. Fidelitatea este certitudinea că un test măsoară scorurile adevărate, iar coeficientul de fidelitate dă
gradul de fidelitate.
Putem stabili un raport între scorurile adevărate şi scorurile observate. Dacă luăm în
consideraţie deviaţia scorurilor de la medie prin calcul vom obţine:
rXA = rXX 1
Corelaţia dintre scorurile adevărate şi scorurile observate este egală cu rădăcina pătrată a
coeficientului de fidelitate.
Variabilitatea scorurilor observate SX, poate să fie cunoscută direct, existând procedee pentru a
estima coeficientul de fidelitate. Dacă notăm (SE, abaterea standard a erorilor şi cu S2E varianţa erorilor),
pe baza acestor parametri putem rezolva o problemă practică.
S2A
S2 E = S2 x - S2 A dar rXX 1
= 2 deci S 2 A = S 2 X rXX 1
S X
S2E = S2x -S2x rxx 1 = S2x (1 – rxx1) deci S E = S X 1 − rXX 1
SE este denumită eroarea standard de măsurare sau eroarea probabilă.
SE reprezintă eroarea aleatoare care nu poate fi eliminată din măsurare, dar trebuie luate
măsuri pentru a o reduce cât mai mult. Vom spune că măsurarea este fidelă sau precisă în măsura în
care există cât mai puţine erori posibile sau valoarea SE este cât mai mică posibil. Teoretic eroarea este
nulă.
Noţiunea de fidelitate presupune reproducerea scorurilor, adică posibilitatea de a obţine
aceleaşi rezultate de la aceiaşi subiecţi, în aceleaşi condiţii dar, în ocazii diferite, cu teste care măsoară
aceiaşi trăsătură.
Teoria clasică a testelor este o soluţie pe care o putem aplica la teoria erorilor de măsurare. Se
precizează că pentru un scor adevărat dat, mai multe măsurări echivalente ale aceleiaşi trăsături în
aceleaşi condiţii este un mijloc pentru o bună aproximare. Scorurile obţinute se distribuie simetric
deasupra şi dedesubtul scorului adevărat. Distribuţia erorilor aleatoare se repartizează normal şi se
aşteaptă o distribuţie a scorurilor observate în scorului adevărat. Să presupunem că dispersia erorilor
este aceiaşi pentru fiecare subiect iar abaterea standard a erorilor poate să fie cunoscută sau estimată.
Aceasta se numeşte eroarea standard de măsurare: S E = S X 1 − rXX 1
40
PSIHODIAGNOSTIC (I)
Problema măsurării constă în a determina această eroare, pe care trebuie să s-o eliminăm, cât
mai mult posibil, pentru a controla factorii care influenţează scorurile observate. De exemplu, dacă
SE=1,3, rxx1 =0,60 şi Sx = 2,00, atunci pe baza acestor date putem interpreta un rezultat observat în
funcţie de eroare şi putem determina limitele între care se poate situa rezultatul adevărat al subiecţilor
care au acelaşi rezultat observat.
Astfel:
X - 1SE < A < X + 1SE pentru o probabilitate de 0,68
X - 2SE < A < X + 2SE pentru o probabilitate de 0,95
X - 3SE < A < X + 3SE pentru o probabilitate de 0,99
Dacă X = 7 atunci avem:
7 - 1,3 < A < 7 + 1,3
7 - 2,6 < A < 7 + 2,6
7 - 3,9 < A < 7 + 3,9 adică 3,1 < A < 10,9
Aceasta înseamnă că pentru un rezultat observat 7, rezultatele adevărate pot fi situate între 3,1
şi 10,9, cu o probabilitate de 99,7%.
Pentru a putea diminua pe cât posibil erorile de măsurare este important să cunoaştem sursele
de eroare. O variabilă produce erori dacă nu este validă şi dacă se obţin rezultate inconstante atunci
când se fac mai multe măsurări. Există trei surse principale de eroare:
1. erori produse de testul însuşi;
2. erori legate de condiţiile de aplicare a testului;
3. erori legate de subiecţii care răspund la test
Prima categorie cuprinde factori controlabili ca: eşantionarea itemilor, dacă testul presupune
măsurarea unei trăsături foarte precise, ambiguitatea enunţurilor, imprecizia instrucţiunilor în legătură cu
maniera de răspuns, o limită de timp neadecvată. Toate acestea determină răspunsuri date la
întâmplare, ceea ce duce la o instabilitate a răspunsurilor şi o reducere a fidelităţii testului.
A doua categorie se referă la procedeele de prezentare a testului. Dacă aceste procedee sunt
standard riscurile de eroare sunt scăzute. Lipsa de experienţă a grupului testat, neobişnuinţa subiecţilor
de a răspunde la teste poate fi un factor de eroare. Lipsa de concentrare a subiecţilor, erorile de
redactare a instrucţiunilor şi deficienţele de cronometrare, sunt erori care fac parte din această
categorie.
Aceste două categorii conţin surse de eroare uşor de controlat, faţă de cele din a treia
categorie, unde sursele de eroare depind de subiecţi. Psihologii au evidenţiat multe surse de eroare de
acest tip. Aici le vom menţiona pe cele mai importante ca: motivaţia, obişnuinţa cu testarea, anxietatea,
diferenţele de învăţare şi variabile de natură fiziologică.
Există erori de măsurare dacă subiecţii examinaţi sunt motivaţi diferit. Dacă condiţiile de
aplicare a testului se modifică de la o aplicare la alta atunci trebuie să ne aşteptăm şi la o modificare a
rezultatelor. Testele de randament sunt afectate de aceste erori.
Se postulează că subiecţii au o experienţă echivalentă indiferent de procedeul utilizat şi
maniera de testare. Tot timpul, două situaţii indezirabile, care introduc erori de măsurare, pot să apară.
Pe de o parte, lipsa de experienţă a unor subiecţi, se materializează în incapacitatea acestora, mai
41
CORNEL HAVÂRNEANU
mare sau mai mică, de o obţine un randament ridicat, situaţie în care scorul nu reflectă gradul de
prezenţă a trăsăturii măsurate. Pe de altă parte, sunt persoane care au experienţă în rezolvarea testelor
şi obţin un randament ridicat, fapt care de asemenea nu este în concordanţă cu nivelul trăsăturii
măsurate. Aceste două situaţii determină erori de măsurare şi diminuează fidelitatea.
Multe persoane manifestă o oarecare nervozitate atunci când sunt testate. Există o marjă de
încredere, justificată sau nu, faţă de gradul prezenţei trăsăturii măsurate, care determină stări de
anxietate. Anxietatea afectează randamentul şi reduce punerea în valoare a posibilităţilor subiectului.
Un alt factor de eroare este legat de variabile fiziologice. Acest factor este inevitabil când
acestea sunt imprevizibile.
Problema erorilor de măsurare a fost prezentată anterior, dar este important să facem câteva
precizări suplimentare. Componentele "eroare" ale scorurilor observate la un subiect pot fi considerate
ca suma erorilor care provin din surse precise de eroare. Aceste surse de eroare sunt independente
unele de altele, între ele nu există nici o corelaţie. Acest aspect este un postulat.
Pentru fiecare sursă de eroare, se poate trasa curba erorilor mai multor subiecţi, în care
varianţa distribuţiei erorilor este formată din suma distribuţiilor provenite de la fiecare sursă de eroare.
Estimarea fidelităţii depinde de estimarea varianţei eroare, adică distribuţia erorilor (S2E). Metoda de
estimare a fidelităţii trebuie orientată spre estimarea diferitelor varianţe eroare (S2E), pentru că există
surse de eroare diferite care intervin de fiecare dată.
Pentru evaluarea unui coeficient de fidelitate este foarte important să cunoaştem metode pentru
a repera sursele de varianţă care pot interveni. Aceste surse pot fi următoarele:
varianţa distribuţiei erorilor ca rezultat al unei schimbări care apare într-o situaţie sau alta, într-un
mediu sau altul (S2E);
varianţa care decurge din subiectivitatea corectării (S2ES);
varianţa datorată hazardului (S2EH), sau altor surse: memorie (S2EM), oboseală (S2EO)
Fidelitatea unui instrument de măsură se defineşte ca fiind corelaţia sau coeficientul de
concordanţă între două teste paralele sau două teste paralele la care eşantionul de itemi a fost extras
din aceeaşi populaţie de itemi. Indicele obţinut este un coeficient de corelaţie între măsurări care dau
acelaşi scor adevărat pentru fiecare subiect. Acest indice arată precizia cu care un item ne permită să
măsurăm o caracteristică. De asemenea, coeficientul de corelaţie la pătrat indică proporţia varianţei
între două măsurări.
S2A
rXX = r XA = 2
1 2
S X
Putem afirma, pe baza definiţiei fidelităţii, că acest coeficient indică proporţia din varianţa totală
care rezultă din diferenţele dintre scorurile adevărate. Din aceste diferenţe rezultă de fapt adevăratele
diferenţe dintre indivizi.
Acest coeficient este un indicator al inconstanţei erorilor, care are valoare minimă dacă testele
sunt într-adevăr paralele. El este denumit coeficient de precizie. Mulţi cercetători, printre care şi Lord şi
Novik (1968), au demonstrat că procedeele standard care servesc la estimarea coeficientului de
fidelitate şi la varianţa erorilor unui test presupun cel puţin două măsurări (scoruri) pentru fiecare subiect
şi că precizia estimării creşte o dată cu numărul acestor măsurări.
Varianţa erorii pentru un anumit subiect S2Esx presupune cel puţin două măsurări şi precizia
creşte o dată cu numărul observaţiilor asupra persoanei măsurate. Deci, deşi coeficientul de precizie nu
este nici foarte pertinent şi nici foarte practic, el constituie totuşi un indice al gradului de imprecizie care
poate fi atribuit viciilor de formă sau de procedură.
42
PSIHODIAGNOSTIC (I)
Dacă itemii testelor paralele sunt extraşi din aceeaşi populaţie de itemi, coeficientul de fidelitate
indică gradul de certitudine cu care poate fi măsurată o trăsătură, chiar dacă s-a folosit doar un eşantion
de itemi din populaţia respectivă. În acest fel, mai multe eşantioane aleatoare, cu acelaşi număr de
itemi, pot să constituie teste paralele şi permit să se obţină mai mulţi coeficienţi de corelaţie. Media lor
este cea mai bună estimare a coeficientului de corelaţie aşteptat pentru testele paralele cu aceeaşi
lungime, eşantionate aleator. Numărul de itemi şi gradul de omogenitate al populaţiei de itemi, adică
gradul în care măsoară aceeaşi variabilă, sunt doi factori care determină această medie.
Coeficientul care indică gradul legăturii între testele paralele, formate din eşantioane alese
aleator, este denumit coeficient de consistenţă internă. În practică testele nu satisfac exigenţele testelor
strict paralele, cu toate că în ansamblu ele măsoară acelaşi scor adevărat şi corelaţia între teste este
pozitivă. Coeficientul de fidelitate, cunoscut ca fiind corelaţia dintre teste paralele, este afectat de
varianţa proprie a fiecărui test. Cu toate că este vorba de varianţă adevărată, ea este considerată ca
eroare. Coeficientul de echivalenţă este coeficientul reprezentat de corelaţia între teste sau forme
paralele şi varianţa specifică are ca efect subestimarea adevăratului coeficient de fidelitate.
43
CORNEL HAVÂRNEANU
pentru un scop diagnostic poate fi relevant pentru un altul şi invers. Deci, unul şi acelaşi factor poate fi
considerat, în funcţie de scopul testării, când varianţă adevărată când varianţă eroare. De exemplu,
dacă se urmăreşte starea afectivă actuală a unei persoane (dispoziţia emoţională, nivelul anxietăţii etc.),
atunci se preferă teste care relevă varianţa cotelor brute de la o testare la alta. Dacă se urmăreşte
prognoza şcolară sau profesională, atunci se preferă teste care surprind stabilitatea în timp a
conduitelor. În primul caz stabilitatea în timp a rezultatelor este contraindicată, în celălalt ea este de
dorit. Deci, sensul erorii depinde de scopul testării. Când condiţiile care determină cota subiectului sunt
mereu irelevante pentru scopul urmărit, ele intră în categoria varianţei eroare şi putem spune că
fidelitatea nu există sau este foarte mică.
44
PSIHODIAGNOSTIC (I)
Deşi există mai multe posibilităţi de calcul al coeficientului de fidelitate, în mod curent se
vorbeşte despre gradul de fidelitate pentru a desemna valoarea erorilor de măsurare cu testul respectiv.
Nunnally (1982) sugerează că cel puţin doi coeficienţi diferiţi trebuie utilizaţi pentru a cunoaşte
fidelitatea unui test: coeficientul α calculat pentru fiecare formă a testului şi corelaţia între forme
paralele. Alţi autori recomandă calcularea coeficientului de echivalenţă - stabilitate. Este important ca
cercetătorul să ţină seama de necesităţi şi de context. De exemplu, pentru o corectare subiectivă
efectuată de mai mulţi corectori, corelaţia mediei dintre scorurile celor două forme ale testului este un
bun indice de fidelitate. Metoda prin înjumătăţire poate fi folosită dacă nu există o formă paralelă a
testului.
În toate cazurile va fi folosită metoda care duce la o estimare cât mai prudentă şi verosimilă.
Există patru forme de interpretare a unui coeficient de fidelitate:
- ca o corelaţie dintre scorurile obţinute şi scorurile adevărate;
- ca un standard de comparaţie a preciziei unui test cu precizia altor teste de aceeaşi natură;
- ca procent al subiecţilor care-şi schimbă rangul sau poziţia;
- ca un indice al gradului de eroare între scorurile individuale.
Un standard de comparaţie a preciziei unui test cu precizia altor teste de aceeaşi natură
O valoare foarte ridicată de 0,90 sau mai mare, observată la un test standard, care serveşte la
măsurarea randamentului, aptitudinilor sau abilităţilor, poate servi drept criteriu de comparaţie pentru aţi
coeficienţi. Pentru testele de personalitate, norma criteriu se situează la 0,80.
45
CORNEL HAVÂRNEANU
De exemplu, presupunem o medie Xmed = 60, o abatere standard Sxx = 5 şi o fidelitate a testului
rxx 1 = 0.84. În acest caz eroarea de măsurare este:
S E = S X 1 − rXX 1 = 5 1 − 0,84 = 2
Pentru un scor X = 57 şi un grad de confidenţă de 0,95 vom obţine:
X - ZSE < A < X + ZSE
57 - (1,96 x 2) < A < 57 + (1,96 x 2)
53,08 < A< 60,92
unde Z este scorul standard luat de valorile care determină probabilităţi exacte pe o curbă normală, iar
A = scor adevărat.
Există deci, 95 % şanse ca un scor observat de 57 să corespundă unui scor adevărat situat
intre 53 şi 61. Eroarea de măsurare care este un indice al variabilităţii scorurilor observate faţă de
scorurile adevărate constituie o estimare a gradului atenuare a scorurilor aşteptate la o eventuală nouă
prezentare a testului. Cu cât eroarea de măsurate este mai mare cu atât intervalul în care se plasează
scorurile adevărate este mai mare.
ÎN CONCLUZIE:
1. Coeficientul de fidelitate teoretic se situează la 1,00, iar practic trebuie să fie cât mai
ridicat posibil.
2. Fidelitatea unui test este un concept pur teoretic pentru că un coeficient de precizie se
aplică exclusiv unui test, unui eşantion de teste menţinând constant testul şi metoda de calcul.
3. Dacă comparăm gradul de fidelitate a mai multor teste, nu putem spune că un test este mai precis
decât altul decât dacă unul dintre ele are un coeficient de precizie foarte ridicat decât alte teste care
au fost prezentate de mai multe ori.
46
PSIHODIAGNOSTIC (I)
V. VALIDITATEA TESTELOR
47
CORNEL HAVÂRNEANU
Varianţa totală a unui test este formată din varianţa validă, varianţa non pertinentă dar şi din
varianţa eroare. Dacă varianţa eroare scade, deci fidelitatea creşte (S2A / S2X), varianţa validă potenţială
creşte, dar această varianţă poate fi pertinentă sau nu pentru o situaţie dată. De asemenea, o mică
varianţă eroare nu garantează o validitate mare şi în acelaşi timp o fidelitate mare este o condiţie
necesară dar nu suficientă pentru o validitate mare pentru un test dat într-o situaţie dată.
Studiul validităţii vizează erorile sistematice, cel al fidelităţii erorile aleatoare.
Legătura dintre cele două concepte evidenţiază faptul că un coeficient de validitate rXY nu poate
depăşi valoarea rădăcinii pătrate a coeficientului de fidelitate rXX1, ceea ce înseamnă că validitatea este
tot timpul limitată de fidelitatea unui test. Următoarele situaţii demonstrează acest fapt:
1. O fidelitate mare şi o validitate mare
S2p S2n S2E
Există mai multe tipuri de validitate în funcţie de scopul testării sau examinării: validitate
predictivă, validitate de conţinut, validitate teoretică. În literatura actuală se vorbeşte şi de validitate
aparentă (face validity), care se referă direct la conţinutul şi structura testului. Dacă un test are validitate
aparentă atunci există o corespondenţă logică evidentă între itemii testului şi ceea ce testul îşi propune
să măsoare.
48
PSIHODIAGNOSTIC (I)
Validitatea de conţinut
Dacă dorim să cunoaştem randamentul unui individ în universul situaţiilor în care testul este un
eşantion, conţinutul testului constituie aspectul primordial care trebui luat în seamă, şi atunci testul
devine universul în care itemii sunt eşantioane de situaţii. De asemenea, precizia răspunsurilor şi
procedeul de rezolvare a itemilor testului prezintă un mare interes. Evaluarea validităţii de conţinut se
face în funcţie de gradul de pertinenţă a eşantionului de itemi. Dar, neexistând un indice cantitativ de
pertinenţă a eşantionului, evaluarea se face prin judecăţi sau prin procese raţionale.
Validitatea de teoretică
Testele psihologice permit studierea caracteristicilor umane. În acest caz trebuie să cunoaştem
trăsătura pe care testul o măsoară. Dacă vom cunoaşte care este trăsătura măsurată, o vom putea
utiliza pentru studiul diferenţelor individuale şi pentru elaborarea teoriilor organizării trăsăturilor.
Pentru acest tip de validitate, trăsătura măsurată este aspectul esenţial şi estimarea validităţii
se face prin reliefarea prezenţei relative a trăsăturii. Reliefarea acestor prezenţe poate fi făcută în mai
multe feluri folosind diverse surse, apelându-se la studii de validitate predictivă şi de conţinut. Ca şi în
ca validităţii de conţinut evaluarea se face prin raţionament.
Validitatea predictivă
Putem folosi testele pentru a face predicţii relative la randamentul subiecţilor la un criteriu.
Putem folosi drept criteriu media şcolară sau randamentul în muncă. Criteriul este un indicele de
predicţie dat de validitatea predictivă a unui test.
Un aspect important a acestui tip de validitate este criteriul, deoarece scorul obţinut la test este
util în măsura în care poate prezice un criteriu, conţinutul fiind în acest caz un aspect secundar.
Majoritatea testelor sunt folosite pentru predicţia randamentului. Testele de aptitudini şcolare
servesc pentru predicţia şanselor de reuşită şcolară, inventarele de interese permit cunoaşterea
câmpurilor de interese profesionale, inventarele de personalitate permit evidenţierea unor dezechilibre
psihice care pot determina anumite predispoziţii, testele de randament sunt utilizate pentru selecţie şi
plasare profesională, testele de aptitudini şi abilităţi profesionale permit predicţia productivităţii şi
stabilităţii în muncă.
În toate cazurile, variabila care face obiectul predicţiei este denumită criteriu. Criteriul este
măsurarea randamentului într-un mod diferit de cel desemnat de variabila predictivă. Modelul care
permite măsurarea acestui tip de validitate constă în stabilirea relaţiei între scorurile obţinute la test şi
cele obţinute la criteriu.
Expresia "validitate predictivă" se referă la faptul că folosind testul putem realiza predicţia
criteriului. Expresia "validitate empirică" se referă la faptul că determinarea validităţii predictive
presupune totdeauna colectarea unor date empirice din care decurge relaţia dintre scorurile obţinute la
test şi cele obţinute la criteriu.
49
CORNEL HAVÂRNEANU
Criteriile
În toate studiile de validitate predictivă criteriul este un element foarte important. Interesul
pentru un test predictor este tot timpul în funcţie de relaţia sa cu criteriul. Dacă un test are menirea să
măsoare un randament, va fi stabilit un standard de reuşită. Acest standard este un criteriu. În educaţie
se foloseşte frecvent media cumulată drept criteriu. Asta nu înseamnă că nu pot fi folosite şi alte criterii
ca: aptitudinea de integrare, de analiză de evaluare, cultura generală, capacitatea de adaptare,
manifestarea unei atitudini constructive în situaţii dificile. Este simplist să apelăm la un singur criteriu.
Recurgerea la mai multe criterii ridică o problemă interesantă. Dacă criteriile sunt puternic
interrelaţionate combinarea unora dintre ele nu aduce un aport prea mare decât dacă s-ar folosi unul
singur, deoarece fiecare măsoară acelaşi lucru. Din potrivă, dacă criteriile sunt slab interrelaţionate nu
este recomandat să le combinăm, deoarece ele măsoară aspecte diferite.
Combinarea criteriilor ridică şi o altă problemă cunoscută sub numele de "dimensionalitate
statistică". Ghiselli (1964), evidenţiază două probleme. Prima constă în faptul că un criteriu, considerat
că fiind fundamental poate deveni impropriu în timp. Ceea ce este azi considerat ca o măsură valabilă a
reuşitei poate să fie contestată în viitor. Aceasta este problema "dimensionalităţii dinamice". A doua
problemă este cea a "dimensionalităţii individului", şi este legată de diferenţele individuale. Doi indivizi
pot face aceeaşi muncă procedând în maniere total diferite dar amândoi fiind cotaţi la fel de bine.
Specialiştii sunt astfel confruntaţi cu dilema: acceptăm două metode de muncă la fel de valide sau una
este privilegiată în detrimentul alteia.
50
PSIHODIAGNOSTIC (I)
51
CORNEL HAVÂRNEANU
ÎN CONCLUZIE
Un test nu poate fi mai bun decât criteriile folosite pentru stabilirea validităţii, pentru că
toate slăbiciunile criteriilor se răsfrâng asupra testului şi îi limitează utilitatea. Dificultatea nu
constă în alegerea unei măsuri - criteriu pertinente, ci în faptul de a nu alege doar una.
Pentru ca procesul de validare să fie valabil este necesar să recurgem la mai multe măsuri criteriu.
Există patru metode principale pentru determinarea validităţii predictive, fiecare având avantaje
diferite. Toate permit calculul unui indice cantitativ a relaţiei dintre predictor şi criteriu. Aceste metode sunt:
1. indicele de eficacitate
2. scorurile de separare a categoriilor
3. indicele de separare a grupurilor
4. indicele de utilitate (coeficientul de validitate)
Coeficientul de validitate
Aceasta este folosit pentru a determina validitatea predictivă. Metoda constă în a calcula corelaţia dintre
scorurile la testul predictor şi scorurile la măsura - criteriu. Calculul presupune parcurgerea a cinci etape
distincte:
1. alegerea unui eşantion de subiecţi;
2. aplicarea testului predictor acestor subiecţi;
3. realizarea unor prelucrări specificate dacă este cazul;
4. Colectarea datelor la criteriu;
5. calcularea corelaţiei între scorurile obţinute la predictor şi la criteriu;
Coeficientul de corelaţie astfel obţinut este un coeficient de validitate. El este notat cu rxy, unde r
este coeficientul de corelaţie, X predictorul şi Y criteriul. Este evident că toţi factorii care influenţează
coeficientul de corelaţie pot influenţa coeficientul de validitate şi că datele trebuie să respecte
postulatele necesare calculării coeficientului de corelaţie. Doi factori, care sunt de fapt postulate
necesită o atenţie deosebită.
52
PSIHODIAGNOSTIC (I)
În primul rând ştiindu-se că coeficientul de corelaţie Pearson este cel mai des folosit,
postulatul de liniaritate dintre două variabile este primordial. Dacă mai multe variabile sunt considerate
ca fiind în relaţie liniară este necesar să verificăm această legătură înainte de a calcula coeficientul de
corelaţie. Pentru a realiza această verificare vom trasa graficul produs de cele două variabile, fiecare
axă reprezentând una din cele două variabile. Dacă relaţia nu este liniară atunci vom transforma
scorurile într-o scală sau vom folosi o altă metodă de corelaţie pentru a estima coeficientul de validitate.
În al doilea rând vom lua în consideraţie întinderea diferenţelor individuale. Se ştie că o mică
variabilitate a scorurilor limitează valoarea pe care o poate avea un coeficient de corelaţie. Această este
o problemă majoră pentru studiul validităţii, când folosim mai multe grupe de subiecţi. Este preferabil să
folosim grupe eterogene, care prezintă o întindere mai mare a diferenţelor individuale.
leader dominanţă
53
CORNEL HAVÂRNEANU
presupunerea este inversată. Diagrama sugerează mai degrabă că leaderul va fi o componentă majoră
a dominanţei. Diagrama c lasă să se presupună că chiar dacă 61% dintre elementele ambelor variabile
sunt comune, influenţa unei a treia variabile, comună celorlalte două intră în joc. Wiggins (1974),
sugerează o interpretare conform căreia dominanţa şi leaderul ar fi manifestări ale unei caracteristici
mult mai profunde, ca extraversiunea. Acest exemplu ilustrează complexitatea interpretării unei relaţii
între un predictor şi un criteriu.
O a treia formă de interpretare a unui coeficient de validitate ţine seama de caracteristicile
grupului care a fost ales, dacă testul este folosit pentru realizarea unei selecţii (Brogden, 1946). Autorul
demonstrează că pe baza postulatelor, coeficientul rxy poate fi interpretat direct ca fiind o măsură a
eficacităţii predictive, ca un raport între media scorurilor obţinute la măsura - criteriu a grupului
selecţionat şi cele ale tuturor grupelor de candidaţi neselecţionaţi. De exemplu, să presupunem că 200
de candidaţi se prezintă pentru admiterea la un program de studii la care nu pot fi admişi decât 75, care
să fie cei mai buni. Cel mai bun procedeu este de a accepta toţi candidaţii, pentru un timp şi apoi să
procedăm la colectarea datelor - criteriu, pentru a selecta în final acei candidaţi care scorurile - criteriu
cele mai ridicate. Media scorurilor - criteriu a grupului selectat va fi mai ridicată decât toate mediile pe
care le putem calcula pornind de la fiecare combinaţie de 75 de candidaţi din cei 200 care s-au
prezentat. Acest procedeu este bun din punct de vedere teoretic, dar în practică este imposibil de
aplicat.
Este rezonabil să aplicăm un test pentru selecţie şi să alegem 75 de candidaţi care au obţinut
scoruri ridicate la test. Coeficientul de validitate, după cum sugerează Brogden, este egal cu raportul
între randamentul mediu la criteriu, obţinut de grupul de 75 de candidaţi admişi pe baza testului
predictor şi randamentul mediu obţinut de 75 de candidaţi care ar fi fost aleşi dacă făceam selecţia pe
baza scorurilor - criteriu. Presupunem că obţinem un raport rxy = 0,80, ceea ce semnifică că grupul ales
pe baza testului predictor va avea un scor criteriu mediu egal cu patru cincimi din cel al grupului selectat
pe baza scorurilor criteriu. Metoda porneşte de la presupunerea că toţi candidaţii obţin un scor criteriu,
ceea ce în practică este imposibil.
O altă metodă de interpretare a coeficientului de validitate constă în predicţia erorilor. Aceasta
presupune utilizarea ecuaţiei de regresie.
54
PSIHODIAGNOSTIC (I)
Rezumatul statistic:
ΣX = 1108 ΣX2 = 6324 Xmed = 4,432 SX = 2,3776
ΣY = 883 ΣY2 = 3601 Ymed = 3,532 SY = 1,3888
ΣXY = 4460
Este suficient să calculăm coeficientul de corelaţie între X (scorurile obţinute la testul de cultură
generală) şi Y (scorurile obţinute la scala de atitudine) pentru obţinerea coeficientului de validitate.
N ∑ XY − ∑ X ∑ Y 1115000 − 978364 136636
rXY = = = = 0,662
N∑ X2 − (∑ x ) 2
N ∑Y2 − (∑ Y ) 2 (594,4207) × (347,2189) 206394,13
Putem interpreta acest coeficient în proporţii sau în procente de varianţă explicată
(0,6622 = 0,438). Putem spune că circa 44% din varianţa criteriului poate fi prezisă sau explicată prin
varianţa scorurilor obţinute la testul predictor. Acest procent de varianţă explicată este relativ ridicat
comparativ cu ceea ce întâlnim în general în studiile de validitate. Nu este simplu să stabilim cauzele
rezultatelor foarte ridicate în studiile de acest tip. Totdeauna, putem afirma că acest coeficient a fost
obţinut pe un grup la care nu s-a făcut o preselecţie, ceea ce presupune ca am folosit toţi subiecţii care
au fost disponibili. Particularitatea acestora este aceea că permit o întindere maximă a scorurilor la
testul predictor, ceea ce are ca efect creşterea valorii coeficientului de corelaţie.
55
CORNEL HAVÂRNEANU
Validitatea logică în care eşantionul de itemi este stabilit într-o manieră mult mai concretă
decât în cazul validităţii aparente. În acest caz se prezintă un tabel cu specificaţiile care conţin o
definiţie clară a aspectelor măsurate, obiectivele precise şi alegerea cât mai logică a itemilor pentru o
divizare coerentă a domeniului vizat.
Tabelul care urmează prezintă un exemplu cu specificaţiile pentru măsurarea cunoştinţelor
acumulate în legătură cu proprietăţile fizice ale pădurii:
OBIECTIVE PARTICULARE
Cunoştinţe Cunoştinţe
Cunoştinţe
SUBIECT despre despre
specifice Aplicaţii Total
categorii metode
Structura arborilor 10% 0 0 0 10%
Transformarea arborilor 10% 0 20% 0 30%
Caracteristicile esenţelor 20% 15% 0 10% 45%
Calculul cantităţilor 0 10% 0 5% 15%
Total 40% 25% 20% 15% 100%
56
PSIHODIAGNOSTIC (I)
Pentru realizarea acestor constatări există posibilitatea folosirii mai multor metode: metode
intratest, metode intertest, metode criteriale, manipulări experimentale şi studii de generalizabilitate etc.
Metodele intratest vizează stabilirea validităţii de conţinut în funcţie de definiţiile operaţionale
ale constructului şi studii de omogenitate a testului cu ajutorul indicelui de consistenţă internă, prin
determinarea fie a coeficientului alpha fie a coeficientului Kuder-Richarson.
Metodele intertest studiază corelaţiile dintre mai multe teste pentru a verifica dacă ele
măsoară acelaşi construct. Este vorba de a stabili validitatea congruentă corelând scorurile obţinute la
noul test cu cele ale unui test bine cunoscut. Dacă corelaţia este ridicată, putem presupune că noul test
măsoară acelaşi construct ca şi testul deja recunoscut pentru calităţile sale de măsurare. Aceste
metode folosesc şi studiile de analiză factorială, tehnică statistică utilizată pentru a determina numărul
de factori, pe baza cărora putem explica intercorelaţiile unui ansamblu de teste. Tehnica permite
determinarea numărului de factori şi explică mai bine scorurile obţinute la fiecare din teste precizând
gradul de varianţă între scorurile explicate de fiecare factor (cât la sută din varianţa totală este acoperită
de varianţa fiecărui factor). Testele care au în comun o varianţă ridicată sunt cele care măsoară acelaşi
construct. Dacă această tehnică este folosită pentru a studia validitatea, putem vorbi de validitate
factorială ca un aspect al validităţii teoretice.
Pentru exemplificare prezentăm în tabelul de mai jos şase subteste, componente ale aceluiaşi test:
1 2 3 4 5 6
1.Reprezentare spaţială 1,00 0,37 0,27 0,47 0,59 0,35
2. Raţionament 1,00 0,37 0,46 0,42 0,43
3. Vocabular 1,00 0,31 0,27 0,63
4. Simţ mecanic 1,00 0,52 0,42
5.Percepţia dimensiunilor 1,00 0,37
6. Logică verbală 1,00
57
CORNEL HAVÂRNEANU
Acest tabel prezintă pe diagonala principală coeficienţii de fidelitate. Se observă că pentru metoda (I)
fidelitatea pentru cele trei teste este de 0,87, 0,80 şi respectiv 0,82.
58
PSIHODIAGNOSTIC (I)
rA2, B3 = 0,57, rA2, C3 = 0,19, rB2, C3 = 0,24, rB1, A2 = 0,58, rC1, A2 = 0,27, rC1, B2 = 0,32,
rB2, A3 = 0,52, rC2, A3 = 0,37, rC2, B3 = 0,28, rB1, A3 = 0,30, rC1, A3 = 0,08, rC1, B3 = 0,09.
Toate aceste valori ajută la studierea validităţii divergente, care este foarte mică faţă de
corelaţiile aceeaşi trăsături măsurată prin metode diferite (rA1, A2 = 0,71).
A treia categorie este formată din corelaţiile dintre diferite trăsături măsurate prin aceeaşi
metodă:
rA1, C1 = 0,28, rB1, C1 = 0,31, rA2, B2 = 0,61, rA2, C2 = 0,43, rA1, B1 = 0,64, rA3, B3 = 0,65,
rA3, C3 = 0,47, rB3, C3 = 0,38, rB2, C2 = 0,32.
Aceste corelaţii sunt măsuri ale varianţei care decurge din metodele folosite.
A patra categorie este formată din corelaţiile dintre aceeaşi trăsătură şi diferite metode:
rA1, A2 = 0,71, rB1, B2 = 0,66, rC1, C2 = 0,72, rA2, A3 = 0,68, rB2, B3 = 0,70, rC2, C3 = 0,64.
Aceşti coeficienţi sunt folosiţi pentru studierea validităţii convergente.
Pe baza acestor rezultate putem face următoarele constatări:
1. Coeficienţii de fidelitate trebuie să aibă valori ridicate, la fel şi corelaţiile aceleiaşi trăsături măsurate
prin diferite metode(vezi diagonala principală şi corelaţiile rA1, A2 = 0,71, rB1, B2 = 0,66, rC1, C2 =
0,72, rA2, A3 = 0,68, rB2, B3 = 0,70, rC2, C3 = 0,64). Mai mult coeficienţii de corelaţie ale aceleiaşi
trăsături măsurate prin diferite metode trebuie să fie mult mai mari decât corelaţiile dintre trăsături
diferite măsurate prin aceeaşi metodă (rA1, A2 = 0,71 mai mare faţă de rB1, A2 = 0,58 şi de asemeni
mai mare decât rC1, A2 = 0,27 etc.). Altfel spus diferenţele dintre trăsături trebuie să fie mult mai
importante decât diferenţele dintre metode.
2. Coeficienţii de corelaţie ale aceleiaşi trăsături măsurate prin diferite metode trebuie să fie mai mari
decât corelaţiile dintre trăsături diferite măsurate prin metode diferite (rA1, A2 = 0,71 mai mare faţă
rA1, B2 = 0,25, şi de asemeni mai mare decât rA1, C2 = 0,11 etc).
3. Corelaţiile dintre trăsături diferite trebuie să fie mici (rA1, C1 = 0,28), şi corelaţiile dintre trăsături diferite
trebuie să fie foarte mici faţă de corelaţiile faţă de măsurile aceleiaşi trăsături (rA1, C1 = 0,28 mai
mic faţă de rA1, A2 = 0,71).
Vom spune că există validitate convergentă dacă obţinem corelaţii ridicate între măsurile
aceleiaşi trăsături obţinute prin diferite metode (rA1, A2 = 0,71, rA1, A3 = 0,70) şi există validitate divergentă
dacă obţinem corelaţii scăzute între trăsături diferite măsurate prin aceiaşi metodă (rA1, C1 = 0,28).
Efectul metodei este relevant dacă corelaţiile testele care măsoară trăsături diferite sunt mai
ridicate pentru aceiaşi metodă decât pentru metode diferite. De exemplu putem vorbi de un efect al
metodei dacă rA1, C1=0,28 sau rB1, C1=0,31 sunt mai mari decât rA1, C2=0,11 şi rb1, C2=0,22. În acest caz
putem vorbi de un "efect de halo" metodologic care se manifestă prin tendinţa de supraestimare a
corelaţiilor dintre variabilele măsurate prin aceleaşi metode.
Specificăm că în contextul validităţii de construct fidelitatea testului este definită ca fiind gradul
de concordanţă dintre două măsurări a aceleiaşi trăsături cu aceiaşi metodă, iar validitatea este definită
prin gradul de concordanţă între două măsurări ale aceleiaşi trăsături prin metode diferite.
59
CORNEL HAVÂRNEANU
Standardizarea unui test presupune respectarea unor norme. Normele sunt seturi de scoruri
obţinute de subiecţii eşantioanelor studiate. Standardizarea este importantă pentru că permite
interpretarea psihologică a scorurilor şi pornind de la aceasta se pot face interpretări. Să presupunem
că un subiect obţine la un test de inteligenţă scorul 10. Dacă scorul de 10 a fost obţinut doar de 2% din
subiecţii populaţiei generale, se situează în topul celor mai bune scoruri, este evident că acea persoană
are un nivel ridicat de inteligenţă. Dacă însă scorul de 10 se plasează la extrema cealaltă, cu cele mai
mici scoruri (după scorurile obţinute de 98% dintre subiecţi) putem spune că subiectul are un nivel
scăzut de inteligenţă. Fără existenţa normelor este imposibil să cunoaştem semnificaţia scorului.
Standardizarea testelor este esenţială. Ea este folosită pentru utilizarea practică a testelor, cum ar fi în
luarea unor decizii în ceea ce priveşte orientarea profesională şi selecţia personalului. Normele sunt
necesare şi atunci când testele sunt utilizate pentru un scop precis, cum ar fi de exemplu selecţia
militarilor care vor participa la o anumită operaţiune armată.
Există o aplicaţia a testelor în care standardizarea nu este importantă, şi anume în analiza
psihometrică a diferenţelor individuale - studiul ştiinţific al atributelor umane, abilităţilor, personalităţii,
motivaţiei şi dispoziţiei. Pentru aceste aplicaţii psihometrice ale teoriei psihologice, scorurile brute,
directe sunt satisfăcătoare, iar transformarea lor în norme ar duce la pierderea de informaţii.
Normele folosite pentru interpretarea semnificaţiei scorurilor unui test trebuie să fie precise.
Dacă, conform normelor, un scor este obţinut de primii 20% dintre subiecţii populaţiei acesta poate sau
nu să fie reprezentativ pentru norma grupului. Dacă normele nu sunt clare, ele pot duce la o interpretare
greşită. Acest pericol apare în domeniul clinic şi psihiatric, unde există teste care sunt folosite pentru
stabilirea diagnosticului. Dacă un copil este orientat spre o anumită formă de educaţie pe baza
scorurilor obţinute la teste, este important ca normele să fie clare.
Înainte de a descrie tehnicile de standardizare şi varietatea normelor care pot fi utilizate
considerăm că este necesar să facem o precizare. Faptul că tetele psihologice pot fi uşor standardizate
ne dă posibilitatea să facem comparaţii precise cu normele grupurilor.
Normele sunt necesare pentru tetele psihologice pentru că nu există un zero absolut al scărilor
de măsurare. Multe forme de măsurare au un zero absolut, lungimea, greutatea pot fi măsurate cu o
astfel de scală. Lipsa lui zero absolut ar face ca măsurarea să fie imprecisă şi neştiinţifică.
60
PSIHODIAGNOSTIC (I)
Eşantionarea este un factor crucial al standardizării unui test. Calitatea normelor depinde de
adecvarea la eşantionul pe care acestea se bazează. În eşantionare sunt două variabile importante:
mărimea şi reprezentativitatea. Eşantionul normativ trebuie să fie o bună reflectare a populaţiei pe
care o reprezintă şi trebuie să fie suficient de mare pentru ca erorile standard ale statisticii descriptive,
adică ale mediei, abaterii standard şi distribuţiei, să fie neglijabile.
Pentru reducerea erorilor standard o mărime a eşantionului de 500 de subiecţi este mai mult
decât adecvată. Reprezentativitatea eşantionului este independentă de mărimea acestuia. Totuşi un
eşantion mic nu poate fi cu adevărat reprezentativ pentru o populaţie mare. Normele pentru o populaţie
generală trebuie să fie realizate pe eşantioane foarte mari, pentru o reprezentare clară, dar pentru
populaţii cu variaţii mici sau pentru grupurile omogene, aceste norme pot fi realizate pe eşantioane mai
mici. De exemplu, pentru 5000 de profesori universitari, un eşantion de 500 de subiecţi este
reprezentativ.
Alegerea mărimii adecvate a eşantionului reprezentativ nu se face în manieră absolută.
Eşantionul depinde de populaţie, de mărimea şi omogenitatea acesteia. Astfel, profesorii de chimie sunt
mai omogeni decât populaţia de profesori în general şi ar putea fi reprezentată de un eşantion mic. Un
eşantion mic dar reprezentativ este superior unuia mare dar nereprezentativ. O valoare mică a erorii
standard nu are nici o valoare dacă valorile observate nu sunt clare.
61
CORNEL HAVÂRNEANU
eşantionării întâmplătoare: cum obţinem o listă preliminară din care să realizăm ulterior eşantionare
sau, în limbaj de eşantionare, cum definim populaţia.
Definirea populaţiei
Nu este suficient să definim teoretic o populaţie. Acest lucru pare uşor, de exemplu, populaţia
Marii Britanii conţine toate persoanele care locuiesc în ţara respectivă. Este necesar să avem câteva
definiţii operaţionale sau definiţii concrete. Ar fi nevoie de o listă, dar unde ar putea fi găsită? Dacă am
reduce discuţia, pentru moment, doar la persoanele adulte nu am avea la dispoziţie nici o listă. Listele
de vot sunt incomplete, cartea de telefon cuprinde numai o parte din populaţie. După cum se vede o
definiţie operaţională a populaţiei generale nu este uşor de dat.
Dacă dorim să stabilim norme speciale pentru teste, şi atunci este necesar să realizăm o
eşantionare specială a populaţiei. Din nou definirea teoretică şi operaţională poate fi dificilă. Dacă dorim
să facem un studiu al criminalităţii, este posibil să obţinem o listă a celor aflaţi în închisoare, să
eliminăm ceilalţi delicvenţi, rămânând numai cei din închisori. Apoi vom alege la întâmplare eşantionul
de criminali. În acest caz există posibilitatea de definire clară a populaţiei de criminali din închisoare.
Dacă dorim să stabilim şi norme legate de aspectul schizofrenic, această listă nu este suficientă,
deoarece va fi imposibil să desemnăm un eşantion reprezentativ din populaţia de criminali aflaţi în
închisoare.
Bazele pentru definirea populaţie pot fi variate. My Ghaian consideră că pentru a defini
populaţia de copii din şcoală putem folosi fie o listă a copiilor fie o listă a şcolilor. Un eşantion
randomizat plecând de la lista şcolilor este mai uşor de obţinut. Dacă aceste unităţi sunt prea mari se va
la o eşantionare aleatorie a membrilor fiecărei dintre unităţi. Şcolile sunt unităţi suficient de mici pentru a
putea fi folosite ca bază pentru realizarea unei eşantionări întâmplătoare a copiilor.
Desemnarea unui eşantion dintr-o populaţie
Procedura standard pentru a ne asigura că fiecare membru al listei va intra în eşantion este
aceea de a folosi o listă de numere întâmplătoare. Fiecare individ din populaţie primeşte un număr care
poate fi apoi extras din lista de numere. Această procedură poate fi realizată cu ajutorul computerului.
Este posibilă selecţia eşantionului pe intervale sau prin fixarea proporţiilor de populaţie din
eşantion, doar dacă poziţia subiecţilor din listă a fost randomizată.
În concluzie, eşantionarea aleatorie se poate realiza doar dacă există o listă adecvată a
populaţiei. Pentru a ne asigura că eşantionul este reprezentativ, acesta trebuie să fie suficient de mare.
Aceasta înseamnă că folosirea eşantionării aleatorii pentru stabilirea normelor de standardizare este
consumatoare de timp şi costă prea mult, fiind preferată eşantionarea stratificată.
b. Eşantioanele stratificate
Eşantionarea stratificată implică divizarea unei populaţii eterogene într-un număr de mai multe
populaţii omogene, aceste eşantioane de populaţii omogene putând fi combinate pentru a o forma un
eşantion reprezentativ al întregii populaţii. Deoarece populaţiile omogene implică eşantioane mici
reprezentative, eşantionul stratificat este mai reprezentativ ca mărime în comparaţie cu eşantionul
aleator.
Reprezentativitatea eşantionului stratificat depinde de variabilele utilizate pentru stratificare.
Dacă sunt folosite prea multe variabile eşantionul va fi foarte mare. Dacă sunt utilizate variabile greşite
atunci eşantionul nu va mai fi reprezentativ. Există o regulă simplă pentru selecţia variabilelor de
62
PSIHODIAGNOSTIC (I)
stratificare: ele trebuie să fie corelate cu variabilele care sunt studiate şi trebuie să micşorăm numărul
de stratificări. Câteva exemple vor clarifica aceste reguli:
Pentru a ilustra problema obţinerii unui bun eşantion stratificat pentru populaţie, vom analiza
normele testului de inteligenţă Lorge-Thorndike. Scorurile la test trebuie să fie corelate cu vârsta şi vom
analiza cum autorii au eşantionat fiecare grup de vârstă.
Definirea populaţiei: Comunităţile formează baza eşantionării. Pentru a obţine un eşantion
reprezentativ al acestor comunităţi se va folosi o eşantionare stratificată.
Variabilele de stratificare: Bazele stratificării sunt reprezentate de factorii care corelează cel
mai înalt cu scorul la testul de inteligenţă, în comunităţi:
a. nivelul de cultură generală;
b. proporţia diferitelor profesiuni;
c. procentajul de proprietari de locuinţe;
d. mediana valorii ratei la casă.
Fiecare comunitate a fost clasificată în funcţie de aceste 4 variabile în 5 categorii de la foarte
ridicat la foarte scăzut. Stratificarea eşantionului pe aceste baze s-a realizat pentru 44 de comunităţi şi
fiecare copil din fiecare grup din eşantioanele comunităţilor a fost testat pentru stabilirea normelor.
Rezultă un număr de 11.000 de subiecţi pentru fiecare grup, pentru vârste de la 6 la 17 ani,
deci în total 136.000.
Comentarii:
Metoda de eşantionare trebuie să plece de la un eşantion reprezentativ al comunităţilor şi apoi
de la un eşantion reprezentativ al copiilor pentru fiecare dintre comunităţile alese. Realizarea unui
eşantion reprezentativ pentru o populaţie necesită selectarea unui număr mare de subiecţi, ceea ce
implică costuri ridicate şi timp. O astfel de standardizare stă la baza construirii testelor.
În acest caz stratificarea s-a bazat pe variabile care corelau ridicat cu inteligenţa. Dacă ar
trebui să stabilim normele pentru un test de anxietate am folosi alte criterii de stratificare. Thorndike şi
Lorge au folosit ca normă clasa socială pentru împărţirea pe subgrupe şi pentru a face comparaţia între
ele. Aceste norme s-au dovedit a fi mai utile decât cele generale.
Acest test este un bun exemplu pentru eşantionarea stratificată. Criteriul de stratificare nu
este acelaşi pentru un test de anxietate. Vom examina în continuare eşantionul populaţiei generale
pentru un test de personalitate “16 PF” (Cattell, Eber & Tatsuoka, 1970).
Autorii a considerat că un eşantion mic, bine stratificat este superior unui eşantion randomizat.
De aceea suntem interesaţi să examinăm cum autorii au standardizat acest test. Vom prezenta în
continuare modul în care s-a realizat eşantionarea pentru subiecţii de sex feminin.
Baza stratificării:
SUA a fost divizată în opt arii geografice şi 8 densităţi ale populaţiei. Populaţia a fost împărţită
în 5 grupe de vârstă şi 7 nivele de venit. Procentajul populaţiei pentru fiecare dintre aceste categorii a
fost reflectat cât mai exact posibil în eşantionul de femei. Acest eşantion a fost de aproximativ 1000 de
persoane.
Comentarii:
Se pare că planificarea din acest eşantion nu a fost bună. Nu toate categoriile sunt la fel de
bine reprezentate. De exemplu, există doar 30 de femei din zonele muntoase şi 239 din două categorii
63
CORNEL HAVÂRNEANU
de oraşe cu populaţie peste 1 milion de locuitori. Acest eşantion nu este suficient de mare. După cum
am precizat în cazul testului Thorndike-Lorge, 10.000 de cazuri ar fi necesare pentru a avea un eşantion
stratificat reprezentativ. Eşantionul folosit pentru standardizarea inventarului “16PF” este prea mic
pentru a face comparaţii semnificative între subgrupe.
Un număr de 1.000 de subiecţi, oricât de bine stratificat ar fi eşantionul, nu este o bază de
satisfacere pentru normele generale. Din aceste motive normele pentru acest test trebuie să fie tratate
cu prudenţă.
64
PSIHODIAGNOSTIC (I)
Concluzii
Normele utilizate au o valoare prea mică şi nu pot fi folosite pentru interpretarea scorurilor la
test. Alegerea grupelor este interesantă, dar era nevoie de un număr mai mare de subiecţi. Nu este
posibil ca rezultatele obţinute de subiecţii acestor eşantioane să fie utilizate ca norme pentru o populaţie
generală. Normele specifice grupului trebuie să aibă la bază un eşantion mai larg şi mai reprezentativ
decât cel folosit în acest test.
În 1970 Kline a dezvoltat Ai3Q, un test al personalităţii obsesive. S-au stabilit normele pentru
diriginţii claselor a VI-a din Anglia.
Obţinerea eşantionului
Pentru a avea un eşantion reprezentativ al diriginţilor claselor a VI-a, autorii s-au asigurat mai
întâi că au un eşantion adecvat al claselor a VI-a. Astfel, baza eşantionului a fost să se examineze toţi
diriginţii claselor a VI-a dintr-un eşantion stratificat al claselor a VI-a. Acest lucru a fost foarte important.
Un eşantion de diriginţi din şcoli cu clase numeroase de a VI-a şi standarde academice foarte ridicate,
cum ar fi Manchester Grammar School, St. Paulus and Cheltenham Ladies, ar fi complet greşit dacă s-
ar fi folosit ca bază pentru norme.
65
CORNEL HAVÂRNEANU
Chiar atunci când investigatorii ştiu cum trebuie stabilite normele de grup, adesea aceştia nu
reuşesc să le respecte deoarece nu au resursele de timp şi materiale necesare pentru aceasta.
Reguli pentru eşantionarea grupurilor speciale
1. stratificarea grupului în funcţie de variabilele care corelează ridicat cu testul;
2. umărul minim pentru eşantioane este 300. Adesea este necesar să facem eşantionarea în timp;
3. un eşantion mic, cum este în cazul scalei conservatorismului, este mai bun decât deloc. Dacă a
fost utilizat un eşantion mic, utilizatorii testului trebuie să fie avertizaţi în legătură cu acest aspect.
Normele bazate pe un eşantion mic sunt doar sugestive sau experimentale, ele pot şi complet
greşite.
CONCLUZII
În principal dificultăţile eşantionării nu sunt de natură teoretică sau intelectuală, ci practice
ţinând de insuficienţa resurselor. Dacă un test este folosit pentru a lua decizii este esenţial
ca normele să respecte standardele pe care le-am prezentat anterior. Un eşantion mare şi
stratificat adecvat este esenţial pentru a avea norme bune.
După ce grupurile normative au fost testate rezultatele trebuie să fie exprimate în formă
numerică. Există mai multe modalităţi de a face acest lucru. Cele mai multe dintre metode compară
scorul individului cu grupul normativ relevant.
Norme diferite
Vom descrie în continuare câteva dintre cele mai utilizate norme, precum şi avantajele şi
dezavantajele lor.
a. Centile
Un centil este un scor a cărui procentaj este dat de grupul normativ. Al 30-lea centil este un
scor sub care se găsesc 30% din subiecţii eşantionului. Acestea au avantajul că pot fi înţelese de
subiecţii testaţi.
Totuşi aceste norme au şi limite importante:
a) Centilele sunt scoruri ordinale pentru care nu se pot calcula parametri statistici;
b) Distribuţia centilelor este dreptunghiulară în timp ce distribuţia scorurilor testului se apropie de cea
normală. De aceea în jurul mediei diferenţele între subiecţi sunt mici, în timp ce la extreme apar
diferenţe mari între subiecţi.
Deoarece centilele nu pot fi analizate statistic şi pentru că afectează scorurile brute, aceste
norme nu sunt recomandate. Ele pot fi folosite doar pentru explicarea rezultatelor.
b. Scoruri standard
Cele mai utile norme sunt scorurile standard. Există o mare varietate de astfel de scoruri şi în
continuare vom discuta despre cele mai frecvent utilizate.
66
PSIHODIAGNOSTIC (I)
Scorurile Z
Scorurile standard se calculează prin împărţirea deviaţiei fiecărui scor de la medie la abaterea standard
a scorurilor. Formala de calcul este următoarea:
X−M
Z= , unde
σ
Z - scorul standard;
X - scorul obţinut la test;
M - media distribuţiei scorurilor;
σ - abaterea standard a scorurilor
Abaterea standard a testului este măsura variabilităţii testului, cât de mult scorurile variază în
jurul mediei.
Proprietăţile scorurilor Z
Cel mai mare avantaj al scorurilor Z în comparaţie cu notele brute, este că scorurile Z sunt
întotdeauna echivalente. Astfel, un scor Z de 2 înseamnă întotdeauna 2 abateri standard de la medie.
Ele permit compararea scorurilor obţinute la teste diferite.
Să presupunem că avem un set de scoruri la un test la care media este 50, iar abaterea
standard de 5. În tabelul următor prezentăm scorurile brute şi notele Z corespunzătoare, calculate după
formula prezentată anterior:
67
CORNEL HAVÂRNEANU
68
PSIHODIAGNOSTIC (I)
Există metode de interpretare a scorurilor care diferă de norme şi au valoare doar în anumite
circumstanţe.
69
CORNEL HAVÂRNEANU
cursul. În multe şcoli astfel de evidenţe empirice lipsesc, fiind înlocuite cu punctele de vedere arbitrare
ale profesorilor.
CONCLUZI
Criteriul de conţinut este potrivit doar pentru testele de cunoştinţe şi doar atunci când
conţinutul poate fi clar definit. Pentru cel mai scăzut nivel educaţional al claselor primare un
astfel de test poate fi valabil. Schonell (1951) a dezvoltat un set de teste diagnostice pentru
citire când rezultatele indicau aspecte exacte, cum ar fi inversarea anumitor litere, confuzie între
anumite litere.
70
PSIHODIAGNOSTIC (I)
Dacă eşantionarea este săracă şi tabelul expectanţelor va fi cel mai probabil greşit. Este
necesar de un eşantion larg şi reprezentativ pentru realizarea tabelului de expectanţe, dar această
abordare prezintă câteva diferenţe faţă de standardizarea eşantionului. În locul stabilirii poziţiei relative
a scorului subiectului în grupul normativ, tabelul expectanţelor stabileşte poziţia relativă a performanţei
în funcţie de anumite criterii.
CONCLUZIE
Testele normative sunt superioare testelor ipsative deoarece au o precizie mai mare în
măsurarea caracteristicilor psihologice. Scorurile ipsative sunt potrivite ca bază de discuţie.
Este la fel de posibil ca şi testele normative să fie baze de discuţie, dar prezintă şi avantajul
că fi analizate statistic, lucru care nu se poate realiza în cazul scorurilor ipsative, acesta fiind un motiv în
plus ca ele să nu fie folosite.
71
CORNEL HAVÂRNEANU
Testele de inteligenţă reprezintă unele dintre cele mai vechi teste psihologice. Binet şi Simon
(1905) au dezvoltat aceste teste la Paris, descoperindu-se apoi avantajele lor pentru educaţie. Aceste
teste au fost ulterior dezvoltate, devenind cele mai utilizate teste de inteligenţă cunoscute şi sub numele
de Scala Standford Binet.
În acelaşi timp Spearman (1904) a raportat prima analiză factorială a abilităţilor umane. Autorul
consideră că abilităţile umane sunt explicate în termenii factorului g, un factor de abilitate generală, şi a
factorilor specifici. Spearman a dezvoltat noţiunea de inteligenţă ca factor general, care reprezintă încă
cea mai modernă încercare de măsurare a inteligenţei.
72
PSIHODIAGNOSTIC (I)
73
CORNEL HAVÂRNEANU
O2 – originalitate - la fel ca şi O1 este un factor relativ nou descoperit pe baza testelor lui Guildford, în
care subiecţii trebuiau să combine 2 obiecte într-unul nou, funcţional. Testului viza evaluarea
producţiei convergente a transformărilor semantice, în prezent acesta având pondere în factorul
producţie divergentă (Guildford şi Hoepfner, 1971);
A - ochirea - implică coordonarea rapidă ochi-mână;
Rd - abilitatea de reprezentare prin desen - în desenarea obiectelor stimul este cotată precizia liniilor şi
curbelor;
D - raţionament deductiv - implică deducţia, raţionamentul plecând de la general la particular;
Mc - coordonare motorie generală;
Amu - înclinaţie muzicală şi sensibilitate totală - factor descoperit în testul lui Seashore (aptitudine
muzicală);
Fe - fluenţa expresiei - descoperit de Guildford (1967), exprimarea verbală pentru evaluarea ideilor.
ams - viteză motorie - descoperit de Guildford;
asd - viteza de discriminare a simbolurilor - descoperit de Guildford;
J - judecată - abilitatea de a rezolva probleme atunci când judecata şi estimarea au un rol important.
Acest factor a fost descoperit de Guildford;
Factorii de ordinul doi rezultă din corelaţiile dintre factorii primari. Cattell şi Horn (1966) au
descris cinci factori secundari care se bazează pe factorii primari.
gf - inteligenţa fluidă - include inferenţe, inducţie, memoria span, flexibilitatea de închidere, precum şi
viteza intelectuală.
gc - inteligenţa cristalizată - este un factor al testelor tradiţionale. Se bazează pe factorii abilităţilor
verbale, mecanice, numerice şi sociale.
gv - vizualizare - are la bază deprinderile în care vizualizarea este importantă cum ar fi: orientarea
spaţială şi desprinderea marginilor formei. Cattell consideră că în cercetările anterioare vizualizarea
apare ca factor primar.
gr - capacitatea de restabilire sau fluenţa generală - include fluenţa ideatică, fluenţa asociativă, testele
de asociaţii irelevante.
gs - factorul vitezei cognitive - afectează viteza pentru o mare varietate de sarcini. Include viteza în
performanţa mecanică, scriere sau calcul numeric.
Inteligenţa fluidă şi cea cristalizată sunt cei mai largi factori de ordinul doi influenţând mult
varianţa testului de abilitate.
74
PSIHODIAGNOSTIC (I)
Majoritatea testelor de inteligenţă măsoară amestecat atât inteligenţa cristalizată cât şi cea
fluidă.
După ce am definit inteligenţa ca abilitate de bază prin care se deduc corelaţii şi se percep
relaţiile, trebuie să fim preocupaţi de itemi ca pot fi folosiţi pentru a măsura această abilitate. Fluiditatea
intelectuală poate fi măsurată prin intermediul unor sarcini nefamiliare sau cu materiale foarte bine
cunoscute de diferiţi indivizi în procesul de învăţare astfel încât să nu afecteze rezultatele. Inteligenţa
cristalizată poate fi testată cu ajutorul unor materiale care reflectă deprinderile achiziţionate şi valorizate
cultural. În acest caz vor apărea diferenţe în parte datorate educaţiei sau clasei sociale.
Nu vom descrie fiecare tip de item care poate să apară în testele de inteligenţă. Vom discuta
doar despre acei itemi care sunt cei mai frecvent folosiţi şi care au o pondere mare în factorii respectivi.
În testele de inteligenţă este important ca itemii să varieze uşor în dificultate. În scopuri
comparative este util ca acelaşi tip de itemi să fie folosiţi pentru grupe de vârstă diferite. Itemii trebuie să
fie flexibili. Este util ca forma itemului să fie aplicabilă la o mare varietate de situaţii. Există tipuri de itemi
care sunt utilizaţi atât pentru măsurarea inteligenţei fluide cât şi a celei cristalizate. Vom descrie în
continuare diferiţi itemi utilizaţi în testele de inteligenţă.
75
CORNEL HAVÂRNEANU
Analogii
Analogia este un tip de item care se găseşte în cele mai multe teste de inteligenţă. Nivelul de
dificultate este uşor de modificat dacă ţinem seama de relaţia dintre elemente. Datorită înaltului grad de
flexibilitate, pot fi construite analogii pentru o mare varietate de situaţii. Sternberg a analizat factorial
aceşti itemi în încercarea de a clarifica procesele cognitive implicate în rezolvarea de probleme care
solicită inteligenţa.
Exemple de analogii
Exemplele au fost alese pentru a evidenţia modalităţile de măsurare a factorului g.
Analogiile sunt folosite pentru testarea factorului g deoarece soluţiile lor implică deducerea relaţiei
relevante între prima parte a analogiei şi aplicarea acesteia la restul analogiei:
Item 1: Cotobatura este pentru pasăre ceea ce este vipera pentru ...
a. animal, b. furnică, c. peşte, d. pasăre, e. reptilă
Acesta este un item uşor şi este o măsură a gc (inteligenţei cristalizate) deoarece cunoştinţele
biologice elementare necesare pentru rezolvarea acestui item reprezintă o expectanţă culturală. Itemul
este uşor pentru că relaţia cu membrii unei clase este simplă şi pentru că soluţia, de a pune “viperă”
într-o clasă analogă, nu ar trebui să necesite efort la vârsta de 9 ani. Dacă itemul este folosit în studii
interculturale ar putea să apară eşec dacă speciile respective nu sunt prezente în arealul geografic cu
care sunt familiarizaţi subiecţii.
76
PSIHODIAGNOSTIC (I)
Bacchae este o tragedie lui Eurupide şi trebuie să ne uităm după o lucrare non-tragică. Aceasta este
“Ciclopii” (The Cyclos).
Acest item ilustrează faptul că un item de analogie dificil poate să nu fie o bună măsură nici a
abilităţii cristalizate şi nici a celui fluide, atunci când conţinutul acestora este obscur. În testul de analogii
a lui Miller (Miller, 1970) rezolvarea itemilor presupune un nivel ridicat de informaţii. Itemii măsoară
inteligenţa cristalizată, nivelul ridicat de dificultate al acestora datorându-se dificultăţii relaţiilor dintre
conţinuturile analogiei. Itemul 4 este un exemplu pentru un astfel de item:
Item 4: Televizorul este pentru microscop la fel ca telefonul pentru ...
a. amplificator, b. microprocesor, c. microundă, d. microfon, e. difuzor.
Acest item cu siguranţă necesită anumite cunoştinţe şi el trebuie să măsoare inteligenţa
cristalizată. Totuşi chiar dacă subiectul cunoaşte dispozitivele electronice mici, relaţia care trebuie
dedusă nu este la fel de simplă ca în exemplul anterior. Este o relaţie a distanţei mărimii amplificării în
câmpul vizual. Răspunsul corect este a.
Distractorii acestui item au fost cu atenţie aleşi. Subiecţii care nu vor realiza relaţia precisă vor
alege microfon. Toţi distractorii care au fost aleşi se referă la sunete sau micro pentru a nu permite
ghicirea lor.
Exemplele pe care le-am prezentat reprezintă baze ale analogiilor, dar marele lor avantaj este
acela că pot fi construite foarte multe tipuri de relaţii pe baza lor. Poate fi manipulată mărimea în
analogii:
Item 5: Şoimul este pentru vultur la fel ca duba pentru ... răspunsul corect este camion.
Este un item simplu care măsoare inteligenţa cristalizată şi este folosit pentru copii din şcoala
primară.
Exemplul următor ne arată cât de abstracte pot fi analogiile.
Item 6: mare este pentru enormitate la fel ca obosit, pentru ... răspunsul corect este apatie.
Acest item măsoară gc pentru că depinde de bogăţia vocabularului. Relaţia dintre substantiv şi
adjectiv nu este dificil de dedus. După cum s-a demonstrat (Vernon, 1961) vocabularul este cel mai bun
predictor al abilităţii cristalizate şi raţionamentul verbal are pondere mare în acest factor de ordinul 2.
Toate aceste şase exemple de itemi măsoară inteligenţa cristalizată deoarece raţionamentele
sunt expresia culturii noastre. Acest tip de itemi pot fi folosiţi şi pentru a testa inteligenţa fluidă.
Cattell (1971) argumenta că inteligenţa fluidă poate fi testată folosind itemi care sunt
supraînvăţaţi de subiecţii unei culturi sau itemi care sunt la fel de nefamiliari subiecţilor din punct de
vedere educativ sau social. Relaţiile dintre literele din alfabet şi relaţiile numerice pot fi testate în
analogii. De asemenea pot fi folosiţi itemii vizuali, non-verbali, configuraţii spaţiale.
Exemplele de itemi vizuali, numerici sau alfabetici sunt simple şi pot fi banali pentru a fi adecvaţi
testelor de inteligenţă. Ei au fost incluşi pentru că ilustrează modul în care analogiile pot fi folosite
pentru a măsura inteligenţa fluidă. Pentru aceşti itemi calitatea lor ar trebui determinată prin intermediul
analizei de item sau analizei factoriale.
77
CORNEL HAVÂRNEANU
Item 7.
a. b. c. d. e.
Aceasta este un exemplu tipic de item non-verbal gc care măsoară abilitatea spaţială. Se
observă că nu este nevoie de nici un fel de cunoştinţe pentru a rezolva acest item simplu. Pot fi
construiţi itemi de acest tip care au un nivel ridicat de dificultate. Similar sunt folosiţi itemi non-verbali
pentru testarea interculturală a inteligenţei.
Item 8: E este pentru H la fel ca G pentru .......
a. P, b. J, c. K, d. O, e. F
Este un item simplu bazat pe succesiunea alfabetică. Tipul de raţionament cerut pentru
rezolvarea itemului este similar celui implicat în rezolvarea itemilor verbali.
Item 9: D este pentru W la fel ca L pentru .............
a. O, b. N, c. T, d. R, e. H
Între D şi W este o relaţie de simetrie, au poziţie simetrică la începutul alfabetului şi la sfârşitul
acestuia. O simetrie asemănătoare trebuie găsită pentru L.
Item 10 25 este pentru 10 la fel ca 53 pentru ..........
a. 2, b. 8, c. 35, d. 15, e. 24
Relaţia nu este evidentă dar nu necesită multă matematică sau abilităţi de calcul pentru a o
descoperi: 10 este produsul dintre 2 şi 5.
Exemplele de analogii prezentate arată cum aceste forme de itemi pot testa abilitatea de a
deduce relaţii de diferite tipuri, de nivele diferite de dificultate şi folosind o varietate de materiale verbale
şi non-verbale. Nivelul de dificultate se referă mai curând la complexitatea relaţiei care trebuie dedusă,
decât la caracterul confuz al informaţiilor necesare.
Un bun test de inteligenţă poate fi construit folosind analogii de diferite tipuri. După cum am
discutat anterior varianţa unui test poate fi împărţită în varianţă adevărată şi varianţă eroare. Scorurile
obţinute la un test nou, construit dintre-un singur tip de itemi, vor fi compuse din varianţa specifică
itemilor. Nu se recomandă în practica psihometrică să se folosească teste alcătuite dintr-un singur tip de
itemi. Astfel Matricile Progresive Raven sunt administrate împreună cu un test de vocabular. MPR
măsoară inteligenţa fluidă în timp ce testele de vocabular măsoară aptitudinea cristalizată. Aplicarea
MPR împreună cu testele verbale au ca scop reducerea varianţei specifice a itemilor.
78
PSIHODIAGNOSTIC (I)
testarea gc sunt necesare informaţii despre nivelul educaţional şi clasă socială, deoarece acestea pot
afecta nivelul de inteligenţă fără ca raţionamentul cerut să fie dificil.
Exemple
1. Vrabie, graur, liliac, pescăruş, rândunică. Acesta este un item simplu care măsoară abilitatea
cristalizată şi are la bază abilitatea de a face distincţia între păsări şi non-păsări (mamifere - păsări).
2. Concret, abstract, îmblănit, iubitor, iute. Este un item foarte simplu pentru gc, în care alegerea
răspunsului corect se bazează pe existenţa unui adverb printre adjective. Se observă că răspunsul
corect poate să nu fie concret, la fel ca în cazul substantivelor Acest lucru distinge itemii testului de
inteligenţă de cei ai testelor de cunoştinţe, care de asemenea solicită deducerea relaţiilor
3. 24, 63, 10, 48, 35. Acesta este un exemplu de item numeric, despre care nu ştim sigur dacă
măsoară inteligenţa cristalizată şi care depinde de evidenţele empirice. Relaţia dintre patru numere
constă în faptul că dacă adunăm 1, ele sunt pătrate. Numai numărul 10 din şir nu are această
proprietate. Fiind necesare cunoştinţe de matematică pentru a rezolva acest item problema devine
una de abilitate cristalizată, pentru a descoperi relaţia aceasta.
4.
Acesta este un exemplu de item non-verbal. Este un item uşor. Doar unul dintre itemi nu are linii
drepte, şi nu sunt necesare cunoştinţe pentru rezolvarea lui. De aceea poate fi folosit pentru
măsurarea inteligenţei fluide la copii. Observăm că şi pentru aceşti itemi nu este o problemă
creşterea nivelului de dificultate. Atât inteligenţa fluidă cât şi cea cristalizată poate fi testată folosind
o mare varietate de astfel de itemi.
2. Secvenţe
Această formă de itemi poate fi folosită atât pentru itemii verbali, non-verbali sau numerici,
pentru testarea ambelor aspecte ale factorului g. Totuşi se potriveşte mai bine itemilor non-verbali şi
numerici. În cazul itemilor numerici soluţionarea lor nu implică prea multe cunoştinţe matematice sau de
raţionament. Secvenţele non-verbale sunt singurele forme de item care alcătuiesc Matricele Progresive
Raven. Acesta este unul dintre cele mai bune teste care măsoară abilitatea fluidă (Carroll, 1983).
Exemple de itemi
a) 9, 13, 15, 19, 21....
Acesta este un exemplu de item numeric, pentru a cărui rezolvare nu sunt necesare cunoştinţe de
matematică, deoarece itemul creşte cu 4 apoi cu 2.
b) 0,4, 2,4, 14,4, 86,4 .....
Acest item demonstrează că un item poate fi dificil. Relaţia este simplu de determinat dar necesită
cunoaşterea operaţiilor cu zecimale.
c)
Acesta este cel mai simplu item non-verbal posibil. Credem că este clar cum aceste materiale pot fi
folosite pentru construcţia itemilor.
79
CORNEL HAVÂRNEANU
d)
Această secvenţă este mai dificilă, subiecţii fiind rugaţi să completeze secvenţa selectând răspunsul
corect dintre cinci posibile.
Trebuie notat faptul că în unele situaţii secvenţele pot să nu fie complete. Se dă începutul şi sfârşitul
itemului, iar subiecţii trebuie să completeze mijlocul.
e) minuscul, foarte mic, mic, ............. larg, enorm. Subiecţii trebuie să aleagă între minuscul, mare,
enorm, greu.
Acest item ilustrează secvenţele verbale. Bineînţeles că aceşti itemi se potrivesc doar pentru
abilitatea cristalizată, oferind informaţii despre ponderea vocabularului în gc.
Aceste trei forme de itemi sunt mult utilizaţi în teste de inteligenţă. După cum am văzut aceşti
itemi sunt folosiţi pentru că pot utiliza o varietate de materiale şi pot avea nivele diferite de dificultate. Ei
sunt utili pentru măsurarea ambelor abilităţi.
Pentru a reduce monotonia testării (plictiseala reduce întotdeauna precizia şi validitatea
testului) s-au imaginat şi itemi de bază:
1. Variante ale analogiilor. Heim (1975) a utilizat o variantă interesantă a analogiilor standard. Erau
date două cuvinte subiecţilor. Aceştia trebuiau să selecteze dintr-o listă un cuvânt care se află în
relaţie similară cu ambele cuvinte date. Aceşti itemi pot avea un nivel de dificultate ridicat şi pentru
rezolvarea lor este nevoie de un vocabular bogat. Cu ajutorul lor se testează inteligenţa cristalizată
a subiecţilor cu un nivel educaţional ridicat.
2. Variante ale itemului 2 similitudini. Este prezentată o listă de cuvinte cu trăsături comune. Subiecţii
trebuiau să aleagă din listă un cuvânt sau cuvintele care nu au aceste trăsături comune.
3. Variante ale secvenţelor.
a. subiecţilor le se cerea să găsească itemul din mijlocul unei serii;
b. subiecţilor li se cerea să nu completeze următorul termen ci unul din final;
c. subiecţii trebuiau să rearanjeze termenii în secvenţe.
Rezolvarea acestor itemi depinde de abilitatea de a deduce relaţiile dintre termenii itemului. La
bază stă abilitatea de raţionament care este esenţa inteligenţei, inteligenţa care este definită prin
analiză factorială. Corelaţiile dintre testele de inteligenţă şi criteriile externe indică faptul că abilitatea de
raţionament este utilă într-un larg context de relaţii sociale.
Alte tipuri de itemi
Există şi alte tipuri de itemi care au fost utilizaţi pentru testarea în special a inteligenţei
cristalizate.
1. Vocabular După cum deja am menţionat vocabularul este testul care are ponderea cea mai mare în
factorul inteligenţă cristalizată şi sunt incluse în testele de inteligenţă individuală.
2. Informaţii generale Sunt de asemenea utilizate pentru măsurarea inteligenţei cristalizate. O
persoană mai inteligentă poate vedea mai multe legături între noile materiale şi ceea ce ştie deja în
comparaţie cu o persoană mai puţin inteligentă.
3. Itemi variaţi Jense a realizat un catalog cu itemi care sunt mai buni pentru testele actuale. Mulţi
dintre ei sunt foarte asemănători cu itemii de bază care au fost descrişi.
Această listă cuprinde: asemănări verbale - când două (cele mai asemănătoare cuvinte) trebuie
selectate; opuşi similari - când trebuie realizate perechi de cuvinte antonime; completarea
propoziţiilor - trebuie completate spaţiile albe ale unei propoziţii; proverbe – elucidarea conţinutului
unor proverbe; probleme de raţionament logic; clasificare verbală - când trebuie alese dintr-o listă
cuvintele din categorii asemănătoare; silogisme; sinonime; realizarea din inferenţe plecând de la
80
PSIHODIAGNOSTIC (I)
materialul prezentat; inferenţe sintactice - când înţelesul cuvântului trebuie să fie dedus; „pedigriu” -
descoperirea relaţiilor dintre indivizi; probleme de raţionament numeric.
4. Toţi aceşti itemi verbali sunt exemple ale abilităţii de raţionament pe care testele de inteligenţă
încearcă să o măsoare. Jensen a realizat şi o listă a diferitelor tipuri de itemi non-verbali care pot fi
găsite în aceste teste.
Itemi non-verbali. includ desene care conţin erori ce trebuie descoperite; clasificarea figurilor -
în care trebuie descoperite două figuri care pot fi puse împreună dintr-o serie; figuri încastrate, unde
trebuie descoperită o formă care este încastrată în alte figuri; completarea gestaltului, unde forme şi
figuri familiare trebui completate; figuri reversibile, unde subiecţii trebuie să manipuleze mental forme
geometrice; numărarea blocurilor, unde sunt prezentate blocuri de desene care trebuie numărate
(ultimele două teste măsoară abilitatea spaţială); compararea blocurilor, în care desenele blocurilor
trebuie să fie comparate pentru a judeca asemănarea şi deosebirea; vizualizarea spaţială, în care
subiecţii trebuie să imagineze cum o bucată de hârtie va fi împăturiră pentru a obţine un anumită formă.
Itemii testelor de performanţă includ realizarea unor structuri din mărgele, asamblarea
obiectelor; desenarea oamenilor; găsirea drumurilor prin labirint.
În afara ultimelor două teste toate celelalte tipuri de itemi solicită abilităţi de bază, raţionalizare
şi descoperirea relaţiilor.
Testele de inteligenţă se pot divide în două categorii - teste individuale şi de grup. După cum
sugerează şi numele testelor primele presupun ca subiecţii să fie testaţi cât unul odată, în timp ce
testele de grup presupun ca un mai mare număr de persoane să fie testaţi simultan.
81
CORNEL HAVÂRNEANU
QI - ul
Coeficientul de inteligenţă, QI, este pur şi simplu un scor standardizat sau normalizat cu o
medie de 100 şi o abatere standard de 15. O astfel de standardizare ne oferă posibilitatea de a face
comparaţii între scoruri şi în acelaşi timp acestea să fie mai pline de semnificaţie.
Iniţial QI era obţinut prin împărţirea vârstei mentale a copilului, care este rezultatul la test, la
vârsta cronologică, rezultatul fiind înmulţit cu 100. Astfel dacă un copil de 12 ani avea o vârstă mentală
de 12 ani, rezulta un QI de 100. Similar la vârsta mentală de 8 ani se obţinea un QI de 66. Ulterior s-a
renunţat la această metodă deoarece s-a constatat că în anumite cazuri atunci când diferenţa dintre
vârsta mintală şi cea cronologică este de un an sau de doi ani se obţine aceeaşi valoare a coeficientului
de inteligenţă.
De exemplu: 6ani/5ani × 100 = 120 şi 12 ani/10 ani × 100 = 120. În cele două cazuri coeficienţii
de inteligenţă sunt identici, deşi în primul caz diferenţa dintre vârsta mintală şi cea cronologică este de
un an iar cel de al doilea caz de doi ani.
De asemenea s-a constatat că după 15 ani vârsta mentală nu mai creşte în acelaşi ritm cu
vârsta cronologică.
Din aceste motive metoda de calcul a QI-ului a fost înlocuită cu scorurile standardizate calculate
prin raportarea performanţei individuale a subiectului la performanţa medie a grupului de vârstă.
TEME OBLIGATORII
TEMA NR. 1
La variabila capacitate generală de argumentare subiecţii testaţi au obţinut rezultatele prezentate mai
jos.
Realizaţi etalonul în decile, respectiv cvartile şi precizaţi în care decil, respectiv cvartil se găseşte un
subiect care a obţinut nota 23,08.
Valori Frecv. Procent Procent valid
2,78 1 2,9 3,4
3,92 1 2,9 3,4
5,41 2 5,9 6,9
9,38 1 2,9 3,4
10,00 1 2,9 3,4
82
PSIHODIAGNOSTIC (I)
TEMA NR. 2
Un grup de subiecţi care au fost examinaţi folosindu-se un test care măsoară nivelul de umor, a
obţinut următoarele rezultate, M=7,5, SD=3,25
Transformaţi în note Z scorurile brute 2,25, 15,5 şi evaluaţi subiecţii care au obţinut aceste scoruri.
TEMA NR. 3
Un grup de subiecţi a obţinut următoarele rezultate:
Autocontrol: M1=19,8, SD1=3,8;
Nivel motivaţional: M2=5,9, SD2=3,3;
Sociabilitate: M3=14,8, SD3=2,5;
Rezistenţă la oboseală: M4=13,4, SD4=4,3;
Rezultatele obţinute de doi subiecţi la aceste probe sunt:
Autocontrol: S1=26, S2=18;
Nivel motivaţional: S1=24, S2=25;
Sociabilitate: S1=10, S2=3;
Rezistenţă la oboseală: S1=7, S2=25;
Cerinţe:
La care dintre probe a obţinut subiectul 1 cele mai bune rezultate?
La care dintre probe a obţinut subiectul 2 cele mai slabe rezultate?
Realizaţi ierarhia subiecţilor în funcţie de notele obţinute de subiecţi la cele 4 probe.
83
CORNEL HAVÂRNEANU
TEMA NR. 4
Demonstraţi cu ajutorul unui exemplu care este modalitatea de comparare a valorilor diferitelor
categorii sau a rezultatelor între aceleaşi categorii obţinute în două cercetări diferite într-o
scală nominală.
TEMA NR. 5
În urma aplicării unui test s-a obţinut un coeficient de fidelitate rxx1 = 0,63. Abaterea standard a
scorurilor observate este Sx=2,9.
Calculaţi între ce limite se poate situa un scor adevărat al subiecţilor care au acelaşi rezultat
observat de 7, cu o probabilitate de 68%.
TEMA NR. 6
Între variabilele atracţia pentru a anumită profesie şi realizare în plan social s-a obţinut un
coeficient de corelaţie de rxy=0,52. Interpretaţi coeficientul de validitate obţinut.
TEMA NR. 7
Unui grup de subiecţi li s-au aplicat 3 scale: deducţie, evaluare argumente şi evaluare ipoteze.
După realizarea inventarului statistic de bază sumar, s-au obţinut următoarele rezultate:
Deducţie: M1=8,6, SD=1,9
Evaluare argumente: M2=8,7, SD2=2,2
Evaluare ipoteze: M3=9,3, SD=2,1
Doi subiecţi au obţinut următoarele rezultate:
Deducţie: x1=2, x2=11
Evaluare argumente: x1=12, x2=7
Evaluare ipoteze: x1=9, SD=8
1. Transformaţi în note T, stanine şi note sten rezultatele obţinute de cei doi subiecţi
2. La care dintre scale a obţinut primul subiect cele mai slabe rezultate?
3. La care dintre scale a obţinut primul subiect cele mai bune rezultate?
4. Ierarhizaţi subiecţii în funcţie de rezultatele obţinute la cele trei scale.
84
PSIHODIAGNOSTIC (I)
După cum s-a constat factorul „g” are două componente care asigură o bună proporţie de
varianţă în măsurarea abilităţii. Există şi factori importanţi pe care testele de inteligenţă nu le măsoară.
Unii dintre aceştia, cum ar fi „W” - fluenţa verbală (abilitatea de a elabora cuvinte pornind de la o literă
dată) par să fie înguşti şi specializaţi, în timp ce alţii, cum ar fi „V” - abilitatea verbală - par să fie mai
largi, de interes mai general. Factorii de vizualizare şi reamintire par să aibă o importanţă mai mare în
viaţa cotidiană.
Testele au fost construite pentru a măsura şi alte abilităţi în afara de inteligenţă. Au fost realizate
teste care să măsoare abilităţi utile în educaţie, pentru selecţie şi orientare, în psihologia industrială
unde se pune accentul pe selecţia persoanelor pentru meserii potrivite. Chiar dacă testele de abilitate,
cum ar fi abilitatea spaţială sau verbală, sunt valabile pentru predicţia succesului educaţional şi
profesional, nu înseamnă că factorul general „g” nu este implicat în rezolvarea de probleme. Factorul „g”
este important, la fel şi ceilalţi factori. De exemplu, un nivel ridicat al lui „g” este necesar atât pentru un
inginer cât şi pentru un bun jurnalist. Totuşi un nivel ridicat al abilităţii spaţiale este necesar pentru un
inginer, dar reprezintă un slab avantaj pentru un jurnalist. Pentru acesta din urmă este necesar un nivel
ridicat la abilităţii verbale.
85
CORNEL HAVÂRNEANU
concept şi fiecare arc o relaţie dintre concepte sau dintre acestea şi proprietăţile esenţiale adiacente.
Cunoştinţele care alcătuiesc reţeaua semantică sunt organizate ierarhic, în funcţie de gradul lor de
generalitate. Reţeaua semantică conţine două tipuri de relaţii: a) relaţii de subordonare; b) relaţii de
coordonare.
Se face apel la strategia inductivă, subiectul trebuind să găsească o noţiune supraordonată pe
baza desprinderii notelor comune ale unui grup de noţiuni şi să identifice elementele de contrast
(exemplele diferenţiatoare). Strategia inductivă se bazează pe activitatea de analiză şi comparaţie.
Strategia inductivă prezintă la copii (până la 10-11 ani) o formă particulară. Ei nu reuşesc să
extragă informaţia necesară din exemplul diferenţiator.
Sarcina de lucru: subiectul trebuie să identifice cuvintele care nu pot fi incluse într-o categorie cu
celelalte.
De exemplu: aici, azi, ieri, deunăzi mâine
mahomedan, catolic, ortodox, budist, protestant
După cum am menţionat anterior abilitatea verbală are o pondere ridicată în inteligenţa
cristalizată. Testele de abilitate verbală au o validitate ridicată. Ele măsoară abilitatea verbală şi
corelează ridicat cu inteligenţa cristalizată.
Alte teste de abilitate verbală, folosite în special pentru adulţi, conţin pasaje scrise, cu întrebări cu
alegeri multiple pentru a testa înţelegerea. Aceste teste au pondere mare în abilitatea cristalizată şi
adesea sunt folosite ca teste de inteligenţă mai curând decât ca test care măsoară abilitatea mentală.
Testele de abilitate verbală nu pot fi confundate cu cele de cunoştinţe. Cunoştinţele sunt
reprezentate de cunoştinţele de gramatică, vocabular, sintaxă. Aceste teste sunt dependente sau
corelează cu teste de abilitate verbală dar nu sunt identice. Un individ cu abilitate verbală ridicată care
se mută recent în altă ţară cu limbă diferită de a sa va prezenta un nivel scăzut de cunoştinţe în acea
limbă. Atunci când redactăm itemii de raţionament verbal este important să nu includem itemi prea
dificili care necesită cunoştinţe considerabile de gramatică.
Alţi itemi utilizaţi în scalele de raţionament verbal sunt testele de comprehensiune şi înţelegere, în
care se cere subiecţilor să explice înţelesul unor proverbe, în mod obişnuit în forma alegerilor multiple,
şi a testelor de vocabular.
De exemplu: Ce înţelegi prin cuvintele: apogeu, cronică, polemică, pertinent?
Citiţi cu atenţie proverbul „Spune-mi cu cine te însoţeşti ca să-ţi spun cine eşti”.
Cu care din proverbele de mai jos se aseamănă cel mai mult din punct de vedere al conţinutului:
1. Promisiunea dată e datorie curată
2. Buturuga mică răstoarnă carul mare
3. Omul din soţii lui se cunoaşte
4. Cine se scoală de dimineaţă, departe ajunge
5. Cine s-a fript în ciorbă, suflă şi în iaurt
6. Din pomul bun şi roadă bună se face
7. Năravul din fire nu are lecuire
8. Fiecare îşi trage spuza pe turta lui
Itemii acestor teste pot viza şi stabilirea unor relaţii dintre noţiuni. Aspectul psihologic vizat este
capacitatea de a înţelege sensul noţiunilor şi de stabilire a legăturilor dintre acestora, operare cu
raţionamente inductive analogice. Din punct de vedere structural - operatoriu gândirea constă din
86
PSIHODIAGNOSTIC (I)
structuri cognitive (=informaţii structurate) şi operaţii sau secvenţe de operaţii (= strategii) ce se poartă
asupra acestor structuri. Structura cognitivă tipică pentru gândire este noţiunea, care structurează
informaţiile generale, necesare şi esenţiale despre obiect sau stare de lucruri. Operaţiile sau prelucrările
(procesările) la care este supusă informaţia psihică sunt extrem de variate şi organizate ierarhic.
La nivel mediu de analiză a gândirii operaţia cea mai însemnată este raţionamentul (inferenţa).
Raţionamentul inductiv analogic, relevat de acest tip de sarcină, presupune inducerea unei structuri.
Adică, se bazează pe descoperirea unei reţele constante de conexiuni între elementele unei mulţimi şi
apoi aplicarea acestei structuri la o situaţie nouă.
Dacă descompunem raţionamentul reclamat în elemente componente (operaţii minimale),
obţinem şapte elemente componente: codarea, inferenţa, punerea în corespondenţă, aplicarea structurii
descoperite, compararea, justificarea, răspunsul.
Detectarea şi transferul structurii de la o problemă - sursă la o problemă - ţintă este dependentă
de schemele cognitive ale subiecţilor. Schemele cognitive sunt blocuri organizate de cunoştinţe
ireductibile la componentele sale, corespunzătoare unor mulţimi de elemente din realitate.
Cercetările au arătat că dintr-o baterie de teste de inteligenţă, subtestele verbale au valoarea
predictivă cea mai bună pentru reuşita şcolară ţinând cont de implicarea limbajului în procesul de
instruire.
Rezultatele la acest tip de teste sunt puternic influenţate de nivelul cultural.
Sarcina de lucru constă în identificarea legăturilor semantice dintre noţiunile unei perechi date
şi formarea unei noi perechi pe baza relaţiei stabilită anterior. Subiectul trebuie să aleagă al doilea
termen al perechii (primul fiind dat) din patru posibilităţi.
De exemplu:
Cer – albastru Iarbă - ………………/ verde, cardă, mare, deasă
Pasărea – zboară Peştele -…………… / fuge, înoată, sare, rapid
Toate aceste teste au pondere ridicată în abilitatea cristalizată.
87
CORNEL HAVÂRNEANU
Factorul „N” este aptitudinea de manipularea rapidă a unui sistem simbolic urmând o serie de
reguli specifice, cu condiţia ca atât sistemul simbolic cât şi regulile să fie perfect asimilate. În cazul
acestui test sistemul simbolic corespunde simbolurilor numerice, iar regulile sunt de operaţie aritmetică
simplă.
Sarcina de lucru: Subiectul trebuie să rezolve itemul, pe baza celor patru operaţii aritmetice,
indicând răspunsul corect din mai multe variante posibile.
De exemplu: Cât este: 5/5/4 a. 1/5 c. 4 e. 25/4
b. 1/4 d. 5
Este clar că abilitatea numerică vizează viteza şi precizia manipulării numerelor. Aceşti itemi nu
solicită o abilitate ridicată de raţionament, de aceea există o corelaţie modestă cu cunoştinţele
matematice.
Sau modele desfăşurate în plan care prin pliere pot forma figuri geometrice:
88
PSIHODIAGNOSTIC (I)
De exemplu: Care din cele patru figuri A,B,C,D, poate fi confecţionată din modelul desfăşurat:
A B C D
A B C D E
VIII.1.5. Viteza perceptivă de închidere
Acesta este un alt factor perceptiv care apare în analiza factorială a testelor. Implică abilitatea de
a completa o formă atunci când lipsesc părţi ale sale. Acestor factor corelează 0,61 cu fluenţa verbală.
Itemii
Cuvintele degradate reprezintă un tip particular de itemi. Cuvintele sunt prezentate cu bucăţi de
litere lipsă, subiecţii trebuind să le identifice. Esenţial pentru această viteză de închidere este aceea că
recunoaşterea actuală poate fi dificilă dacă degradarea cuvintelor este considerabilă. Itemi similar pot
cere subiecţilor să identifice numere sau litere degradate (din care lipsesc bucăţi).
May a utilizat un astfel de test pentru a studia flexibilitatea gândirii. Itemii erau prezentaţi pe
computer, unde degradarea era întrerupând anumite numere sau pixeli relevanţi.
De exemplu: identificaţi cuvântul scris mai jos:
89
CORNEL HAVÂRNEANU
1. A.B.C.D. 3.M.N.P.S.
2. B.C.D.F. 4. A.E.I.O.
Un alt test este reprezentat de clasificarea figurilor. Fiecare item este reprezentat de 2 sau 3
grupuri, fiecare dintre ele fiind alcătuit din 3 figuri geometrice care sunt asemănătoare prin respectarea
aceleaşi reguli. Al doilea rând al fiecărui item este reprezentat de 8 figuri. Subiecţii trebuie să descopere
regula şi să clasifice aceste 8 figuri în grupuri asemănătoare.
VIII.1.10. Originalitate 2
Acest factor este relativ nou, fiind extras de Cattell (1974) din primul factor originalitate. Diferă ca
sens de originalitate, aici trebuind să fie utilizată în situaţii de constrângere şi există itemi tipici pentru
măsurarea lui.
90
PSIHODIAGNOSTIC (I)
Itemi
Subiecţii sunt rugaţi să combine două obiecte pentru a realiza un nou obiect funcţional. Poate fi
obţinută şi o măsură a fluenţei ideatice la fel de bine ca şi o măsură a factorului originalitate.
Acesta acoperă tipurile de itemi folosiţi pentru a măsura 10 dintre cei mai importanţi factori
primari. Unii dintre aceşti itemi au fost discutaţi în lista care cuprindea variate tipuri de itemi ale testelor
de inteligenţă. Factorul de compensaţia gr, care este aspectul educaţional cel mai important pentru
factorii de ordinul 2, apare din cei doi factori de inteligenţă, fiind că îmbrăţişează originalitatea şi fluenţa
care corelează cu creativitatea cel puţin pentru a limita extinderea/evaluarea.
Deşi multe dintre testele care măsoară factorii primari au pondere în structura factorilor
secundari, se poate pune întrebarea de ce mai avem nevoie de aceste teste care măsoară factorii
primari. În aplicarea testelor psihometrice în domeniul educaţiei, clinic şi profesional este nevoie uneori
să măsurăm una dintre abilităţile mai specifice ale subiectului. De exemplu, dacă dorim să selectăm
subiecţii pentru zboruri de antrenament cu elicopterul, vom selecta subiecţii care au abilitate spaţială şi
ne-am concentra asupra acesteia. Acum factorul de vizualizare este important, dar am fi mult mai
precişi dacă am testa separat factorii primari care compun acest factor secundar. Am obţine două
scoruri identice la al doilea factor dar care sunt compuse din scoruri diferite ale factorilor de ordinul 1.
Nu înseamnă că factorii de ordinul 2 nu sunt importanţi. Pentru multe situaţii testele de inteligenţă
sunt cea mai utilă măsură. Una dintre problemele testării unui număr mare de factori primari este acea
că ele tind să coreleze, varianţa lor fiind explicată de factorul g. Aceasta este problema principală a
testelor de aptitudini. Ele nu diferenţiază destul între aspectele primare ale factorului g.
Din cauza naturii analizei factoriale nu putem spune că există un număr finit de abilităţi umane.
Factorii primari explică mult din varianţă atunci când se foloseşte un număr mare de teste de abilitate.
După cum argumentează Cattell multe dintre testele în varianta creion-hârtie (în forma modernă teste
computerizate) măsoară diferite abilităţi care sunt utile pentru educaţia academică. Totuşi sunt multe
abilităţi care pot fi observate în viaţa cotidiană şi pentru care nu există teste, cum ar fi de exemplu,
abilităţile practice ale meşteşugarilor. Dacă aceste abilităţi şi deprinderi ar fi supuse analizei factoriale
este posibil ca să deducem noi factori.
Apare problema diferenţei dintre un factor general şi un factor specific. Pentru toate testele
construite există pericolul obţinerii unui factor specific folosind un număr mare de itemi similari. Aceşti
factori nu corelează decât cu itemi similari. Acest lucru a apărut, parţial, în modelul abilităţilor umane a
lui Guilford (1967) care postulează existenţa a 120 de abilităţi.
În psihometrie există un acord asupra faptului că există un anumit număr de abilităţi speciale, şi
testele pot fi divizate pentru a le măsura. Vom discuta în continuare despre aceste teste care vizează
abilităţi speciale.
91
CORNEL HAVÂRNEANU
Abilitatea muzicală
Shuter (1968) consideră că aceste abilităţi pot fi măsurate folosind mai multe tipuri de teste.
Acest lucru este surprinzător ştiind că abilitatea mentală este diferită de inteligenţă precum şi de alte
abilităţi, nu sunt suficiente pentru expertiza aptitudinii muzicale. Se poate argumenta că îndemânarea
muzicală reprezintă pur şi simplu cunoştinţe pe care oricine le poate dobândi. Aceasta este concluzia
unui studiu realizat pe muzicieni. Este adevărat că cu efort o anumită măiestrie în muzică poate fi
obţinută de mulţi oameni. Totuşi viteza cu care muzicienii talentaţi învaţă, sugerează că trebuie să
existe abilităţi speciale. Există un număr de abilităţi speciale, dar cea mai renumită este cea dezvoltată
de Seashore (1919) în cercetările făcute asupra abilităţii mentale.
Itemii
Cele mai multe teste de abilitate mentală conţin itemi pe care orice muzician le-ar poseda. Sunt
măsurate înălţimea schimbării, analizele acordurilor, memorie, ritm, armonie, intensitate. Unele teste
folosesc pianul, altele tonurile pure. Seashore a încercat să măsoare abilităţile muzicale de bază, în
sensul tonalităţii, ritmului şi auzului muzical. Acestea corelează din punctul de vedere a lui Shuter
(1968) ca un factor muzical general.
Abilitate artistică
Abilitatea artistică are sens în explicarea diferenţelor individuale ale abilităţii de a desena, de a
picta şi a măiestriei artistice, deşi nu este nici o îndoială că exerciţiul şi metodele bune pot duce la
dezvoltarea abilităţilor artistice. Totuşi factorii care intră în alcătuirea abilităţilor artistice sunt
necunoscuţi.
La aceasta se adaugă faptul că selecţia în şcolile de artă se face, în mod obişnuit pe baza
performanţelor. Cel mai cunoscut test este Testul Evaluării Artei a lui Meier (1963), care cerea
subiecţilor să evalueze care dintre desene este mai bun, unul fiind o lucrare de artă iar celălalt o
versiune alterată. Nu există dovezi că acesta ar fi un test valid şi este îndoielnică încredere într-un
astfel de test.
92
PSIHODIAGNOSTIC (I)
Problema scalei Bayley, la fel ca şi a altor scări de măsurare a dezvoltării, este slaba corelaţie cu
inteligenţa măsurată mai târziu. Damarin (1978) afirmă că este greu să stabilim clinic sau în termeni
teoretici ce anume determină aceste rezultate. De fapt scorurile nu corelează ridicat cu QI-ul de mai
târziu pentru că conţinutul este total diferit.
Considerăm că aceste scale de măsurare a dezvoltării copiilor evaluează dezvoltarea dar nu sunt
legate de inteligenţă stabilită ulterior. Cattell (1971) sugerează că acest lucru nu trebuie să ne surprindă,
pentru că viteza de dezvoltare a diferitor specii, chiar şi a mamiferelor corelează negativ cu poziţia lor
pe scara filogenetică.
Aceste scări se pot dovedi utile pentru diagnosticarea unor cazuri severe de retard cu o bază
organică. Nu sunt recomandate ca indice al inteligenţei pentru cazurile normale, nemedicale.
93
CORNEL HAVÂRNEANU
La fel ca în cazul listei factorilor cognitivi, care reprezintă cele mai importante variabile din
domeniul cognitiv care trebuie măsurate, lista prezentată mai sus prezintă cele mai importante variabile
în domeniul psihomotor.
Unii dintre factori nu au o componentă psihologică, cum ar şi rezistenţa sau viteza membrelor
(există o componentă psihologică determinativă atunci când persoana abandonează sarcina), în timp ce
alţi factori, cum ar fi viteza de reacţie şi alegerea reacţiei corelează ridicat cu inteligenţa (variabilitatea
reacţiei s-a sugerat că ar fi o posibilă măsură obiectivă a variabilităţii QI-ului) (Jensen, 1980, Kleine,
1990).
Testele psihomotorii
Multe dintre testele care măsoară aceşti factori sunt pur şi simplu teste fizice. Testul Purdue
Pegboard constă într-o placă de lemn cu goluri în care subiecţii trebuie să introducă forme. Testul
rotorului constă într-un plan cu un spot pe care subiectul trebuie să menţină un cursor. Se înregistrează
dacă contactul este menţinut sau nu. Măsurarea timpilor de reacţie pentru stimuli luminoşi
corespunzători unor taste care trebuie apăsate când apare lumina. Poate fi măsurat timpul de reacţie al
subiectului atunci când acesta stă cu mâna pe un buton, dar şi timpul de mişcare pentru a căuta butonul
necesar pentru a da răspunsul. Variabilitatea timpilor de reacţie corelează 0,40 cu factorul g.
O măsurare interesantă a realizat Fleishman pentru a prezice succesul în meserie în selecţia
ocupaţională. Corespunzător acestor factori psihomotori autorii au realizat scări de măsurare pentru
diferite posturi, astfel ca postul şi persoana să se potrivească. Aceşti factori sunt mai curând fizici decât
psihologici, corelează cu performanţa din viaţa reală şi variază în diferitele stadii de educaţie
(Fleishman, 1966). Aceste probe sunt utile pentru selecţia profesională în sarcini specifice.
94
PSIHODIAGNOSTIC (I)
Teste de aptitudine
Testul de aptitudine verbală se referă la testarea factorului de abilitate verbală. Testul aptitudinii
de scriere este un amestec de itemi. Acest ultim tip de aptitudine ar trebui să fie construit empiric
selectând itemi care să discrimineze între subiecţii care nu posedă aptitudinea. Examinarea bateriilor de
teste de aptitudine confirmă această analiză, multe dintre ele conţin teste de acest tip: unifactoriale şi
multifactoriale.
95
CORNEL HAVÂRNEANU
96
PSIHODIAGNOSTIC (I)
obţinute în urma aplicării bateriei DAT ar putea fi obţinute mult mai eficient folosind un test de
inteligenţă.
Un posibil contra argument este acela că influenţa factorului g s-ar manifesta printr-un nivel mai
ridicat al scorurilor, dar evidenţiind profilul scorurilor la testele de aptitudine. Din nefericire acest lucru nu
se întâmplă. În parte acest lucru este cauzat de faptul că nu toate scalele sunt în mod egal saturate de
factorul g.
Puterea diferenţială a testelor de aptitudine este iluzorie deoarece scalele au pondere diferită în
factorul g. Quereschi (1972) prezintă rezultatele obţinute cu ajutorul analizei factoriale relevând 4 factori
care acoperă cel mai mult din varianţă. Ar fi fost interesant să vedem puterea predictivă a testelor de
aptitudine după ce factorul g ar fi extras. O analiză factorială oblică permite investigarea influenţei
factorului g deoarece aceşti factori sunt corelaţi.
Există corelaţii între testul DAT şi testul de inteligenţă Otis, 0,81 cu raţionamentul verbal, 0,69 cu
abilitatea numerică, 0,65 cu raţionamentul abstract, 0,58 cu relaţii spaţiale, 0,61 cu raţionamentul verbal,
0,31 cu precizia şi viteza de scriere, 0,48 cu citit/scris pe litere, 0,48 cu logica propoziţiilor. Aceste
corelaţii argumentează faptul că testul DAT este în principal un test de inteligenţă ineficient.
Pentru selecţia şi orientarea profesională avem nevoie de mai multă informaţie decât ne poate
oferi factorul g. Acestea pot fi date prin măsurarea altor grupe de factori, cum ar fi abilitatea spaţială şi
verbală. Un test de aptitudine constă în teste pentru diferite grupuri de factori şi o colecţie arbitrară de
deprinderi.
97
CORNEL HAVÂRNEANU
98
PSIHODIAGNOSTIC (I)
3. Itemii trebuie să acopere toate nivelele de dificultate pentru a asigura o distribuţie normală şi
simetrică.
4. Itemii să fie cotaţi obiectiv.
5. Norme bune. Este valabilă standardizarea.
6. Testele de aptitudini se potrivesc unei scale Rasch. sau altor modele derivate din teoria răspunsului
la itemi.
99
CORNEL HAVÂRNEANU
c. Conţinutul testului. Folosind un set de itemi cu răspunsuri multiple este posibilă o precisă abordare
a conţinutului testului, ceea ce permite psihologului să evalueze cât de potrivite este testul pentru
scopul propus.
3. Itemi perechi
Sarcina subiectului este de a potrivi itemii din două liste. Aceşti itemi se potrivesc materialelor
factuale sau celor intuitive. Autorii şi cărţile, clasele şi mamiferele sunt exemple de astfel de itemi
perechi. Putem avea 4 nume de autori A, B, C, D şi 8 titluri de cărţi. Subiecţii indică, folosind o literă
100
PSIHODIAGNOSTIC (I)
(cea corespunzătoare autorului) cine a scris o anumită carte. Aceşti itemi permit cea mai uşoară testare
în detaliu a cunoştinţelor. Deşi ar pute fi construiţi şi itemi cu alegeri multiple, numărul lor ar fi mai mare,
ar fi nevoie de 4 itemi cu alegeri multiple şi 32 de distractori. Itemi adevărat-fals ar pute fi folosiţi ‚în
acest scop, dar ar fi mai complicat decât folosirea itemilor perechi. Ar fi necesari 4 itemi, câte unul
pentru fiecare autor. Nu poate fi folosit acelaşi exemplu pentru fiecare din cei 4 itemi deoarece
răspunsul anterior poate influenţa răspunsurile la itemii următori. Astfel dacă autorul A scris cartea 1,
autorul B, C sau D nu mai pot scrie cartea 1.
Trebuie să precizăm că pentru itemii adevărat-fals, unde informaţiile sunt prezentate subiectului
iar itemii testează înţelegerea, este foarte dificil să folosim itemi pereche în locul lor. Itemii adevărat-fals
sunt mai buni atunci când se testează informaţia prezentată în test.
Pentru a reduce efectul de ghicire şi să ne asigurăm că subiecţii rezolvă itemii făcând alegeri
pentru fiecare item, răspunsurile nu trebuie să devină evidente iar listele trebuie să nu fie egale ca
lungime.
Scrierea itemilor
Criterii pentru alegerea itemilor:
1. Claritate. Alegeţi forma itemului care este cea mai clară pentru subiect.
2. Ghicire. Alegeţi forma care reduce efectele ghicirii la minim.
3. Precizie. Alegeţi forma care este cea mai clară şi mai simplă.
4. Relaţiile dintre itemi. Verificaţi dacă variantele itemilor sau chiar itemii nu dau răspunsul sau
sugestii pentru alţi itemi.
5. Echilibru. Acolo unde toate alegerile sunt posibile, alegeţi tipul de item care este cel mai rar.
101
CORNEL HAVÂRNEANU
CONCLUZII
Aceste categorii de itemi sunt utile doar în situaţiile în care răspunsul trebuie să fie cât mai
precis. Itemii cu răspuns liber sunt dificil de redactat. De aceea itemi cu răspunsuri limitate
reprezintă o formă superioară.
Cotarea lor este dificilă, aceşti itemii nu pot fi prezentaţi şi cotaţi în formă computerizată.
Ghicirea
În cazul itemilor cu alegeri multiple şi a celor cu răspunsuri limitate poate apărea ghicirea care
introduce varianţa de eroare şi scade validitatea. Am menţionat anterior că subiectul poate rezolva prin
ghicire jumătate dintre itemii adevărat-fals.
Ghicirea este inevitabilă chiar în cadrul unor examene de admitere, promovare sau selecţie
pentru o anumită profesie.
1. Subiecţii sunt instruiţi să ghicească. În instrucţiunile testelor se cere subiecţilor să ghicească. “Nu
lăsaţi spaţii goale. Dacă nu ştiţi un răspuns sau nu sunteţi sigur, ghiciţi soluţia corectă. ”
2. Completaţi la întâmplare un test apoi cotaţi-l. Această completare este echivalentă ghicirii. Un
sistem computerizat de cotare poate fi programat să realizate acest lucru.
102
PSIHODIAGNOSTIC (I)
103
CORNEL HAVÂRNEANU
Vom discuta despre testele de obiective de personalitate, care încearcă să acopere unele dintre
defectele chestionarelor de personalitate, deşi după cum vom vedea aceste teste au alte probleme.
Chestionarele de personalitate sunt superficiale şi de obicei transparente fiind uşor de falsificat,
sunt prea necizelate pentru a încapsula bogăţia şi fineţea personalităţii. Testele obiective şi proiective
de personalitate, împreună, caută să elimine aceste neajunsuri. Cu toate obiecţiile aduse de Eysenck
(1957) şi alţi autori în ceea ce priveşte lipsa lor de validitate şi fidelitate, ar fi greşit să se renunţe la ele,
deoarece aceste teste pot fi utile atât în aplicaţii practice cât şi în cercetare.
Înainte de defini aceste categorii de teste trebuie să facem distincţia, în cadrul testelor de
personalitate, între măsurarea nomotetică şi cea idiografică.
Testele nomotetice sunt legate de dezvoltarea unor reguli pentru înţelegerea personalităţii.
Vizează măsurarea trăsăturilor sau dimensiunilor comune, în funcţie de care oamenii diferă.
Chestionarele de personalitate sunt măsurări nomotetice tipice, iar analiza factorială reprezintă cea mai
potrivită tehnică statistică pentru analiza testelor nomotetice. Psihometria, ca domeniu al psihologiei,
este în principal interesată de studiul diferenţelor individuale, măsurarea făcându-se prin urmare cu
ajutorul testelor nomotetice.
Testele idiografice, în contrast cu cele nomotetice, vizează măsurarea individuală a persoanei, a
tuturor aspectelor de personalitate pe care acesta nu le împarte cu nimeni. Aceste aspecte unice şi
individuale de personalitate sunt măsurate cu ajutorul testelelor obiective de personalitate.
104
PSIHODIAGNOSTIC (I)
Motivul pentru care discutăm despre testele obiective este acela că dacă se demonstrează că ele
sunt valide, ele ar avea un avantaj clar faţă de chestionare şi faţă de unele teste proiective.
1. Faptul că este sunt inaccesibile ghicirii, deoarece scopul lor este neclar face să fie mai potrivite în
selecţie şi în psihologia aplicată în comparaţie cu alte teste de personalitate.
2. Este mai puţin probabil că în aceste teste să apară seturi de răspunsuri dezirabile, cum se întâmplă
în cazul chestionarelor.
3. Este posibil ca unele teste obiective, în special măsurările fiziologice, să poată fi utilizate în studiile
transculturale ale personalităţii, domeniu în care chestionarele au o valoare îndoielnică (Kline,
1977).
Din aceste motive dezvoltarea validităţii testelor obiective de personalitate reprezintă un aspect
important al psihometriei, cu toate că în prezent există puţine dovezi de progres în acest sens.
105
CORNEL HAVÂRNEANU
Situaţia stimul-instrucţiune.
Aceasta variază de-a lungul următorilor parametri:
1. Reacţie vs. lipsa de reacţie. În mod obişnuit este cerută reacţia la stimul, dar nu întotdeauna se
întâmplă acest lucru, cum este cazul testului de sensibilitate la durere.
2. Răspunsuri inventive vs. răspunsuri selective. Testul TAT cere răspunsuri inventive, iar itemii
chestionarelor de personalitate cer răspunsuri selective.
3. Răspunsuri unice vs. răspunsuri repetitive
4. Secvenţe de răspunsuri ordonate vs. secvenţe de răspunsuri neordonate
5. Răspunsuri omogene vs. pattern-uri de răspuns. Unele teste cer răspunsuri de acelaşi fel, alte
răspunsuri variate.
6. Răspunsuri naturale vs. limitate. “Lucrează în ritmul tău propriu” comparativ cu “Lucrează cât mai
repede posibil” exemplifică aceşti parametri.
7. Reacţii de încheiere vs. reacţie la reacţie. Subiectul reacţionează fie la materialul testului, fie la
propriile reacţii, ca în evaluare.
Cattell şi Warburton (1967) adaugă la aceşti şapte parametri alte cinci dimensiuni importante,
dintre care primele trei sunt subiective şi au o importanţă particulară pentru testele obiective.
8. Semnificaţie imediată vs. semnificaţie atribuită. În testele timpilor de reacţie nu există o altă
semnificaţie în spatele testului însuşi. În alte teste, de exemplu cele care examinează opiniile, există
atribuiri externe şi simbolice, acestea fiind implicate în distorsiunile tipice ale testelor, ridicând
probleme legate de distorsiunea subiectivă a cuvintelor şi conceptelor.
9. Prezentare unui item vs. prezentare globală. Unele teste constau într-o singură sarcină, iar altele
într-un set de itemi.
10. Aspectul psihologic al testului. Unele răspunsuri la teste solicită cogniţia (o judecată corectă), alte o
judecare a sentimentelor iar altele judecarea familiarităţii sau recunoaşterea.
11. Variaţia motivelor pentru acceptarea situaţiei test.
106
PSIHODIAGNOSTIC (I)
Totuşi nu toate combinaţiile parametrilor sunt viabile, este clar că există un număr foarte mare de
tipuri de teste obiective: 213x26 ceea ce ar duce la 50.000 de tipuri de teste.
Deşi există principii pentru construcţia testelor obiective, toate aceste 50.000 de categorii nu pot fi
folosite. Cattell şi Warburton (1967) au scurtat lista la 64 de categorii desemnate, luând în considerare
cele mai importante tipuri de stimuli şi parametri de cotare, permiţând 8 varietăţi pentru fiecare.
Această taxonomie nu este suficientă pentru a înţelege testele obiective. Este important să
înţelegem forma dar trebuie să avem în vedere şi conţinutul lor.
107
CORNEL HAVÂRNEANU
O prima dificultate vizează categoriile de variabile care pot fi măsurate - abilităţi, temperament,
motivaţie. Nu există un motiv pentru care testele obiective nu pot măsura variabile din aceste sfere, şi
este necesar să facem distincţia dintre ele.
Este suficient ca prin analiză factorială să descoperim care sunt variabilele pe care le măsoară
testele obiective, dar bineînţeles după ce ele au fost construite. Ar fi util un ghid de construcţie a
testului, chiar dacă dovezile empirice sunt necesare pentru a asigura validitatea testului.
Cattell şi Warburton (1967) prezintă o serie de detalii în legătură cu această problemă:
1. Sunt definite două situaţii: iniţiale şi complexe.
2. Definirea situaţiei iniţiale: o situaţie iniţială provoacă atingerea scopului şi este un simbol al scopului
sau al realizării lui. Acest lucru poate fi descoperit prin procesul de analiză, adică prin analiza
statistică a paternului unei secvenţe de comportament care apare în timp. O situaţie iniţială poate fi
recunoscută din relaţia cu scopul. În studiul jurnalului unui subiect pe o perioadă de o lună, folosind
teste obiective (Cattell, Horn şi Sweney, 1970) Kline şi Grindley (1974) au arătat că o astfel de
relaţie apare din dinamica variabilelor măsurate cu ajutorul testelor cu evenimentele din viaţa reală.
3. Definirea situaţiilor complexe: Acestea sunt dependente de precizia evaluării situaţiilor iniţiale.
4. Dacă se schimbă situaţia iniţială, se modifică şi scorul testului obiectiv. Dacă se schimbă
complexitatea se modifică şi scorul la un test cognitiv. Toate celelalte teste sunt teste de
temperament.
5. Astfel pare uşor de măsurat dinamica şi abilităţile subiecţilor. Este relativ uşor obţinem o măsurare
pură asigurându-ne că una din aceste clase de variabile se menţine constantă. De exemplu, dacă
măsurăm abilitatea, care de altfel este uşor de măsurat, diferenţele dintre scoruri nu reflectă
diferenţe de abilitate ci diferenţele de dinamică, cum ar fi cât de mult efort depun subiecţii.
Asemănător, în procedura de selecţie reală a subiecţilor, în care toţi subiecţii depun efor, testele de
abilitate sunt pur şi simplu cognitive.
6. După construirea unui test acesta trebuie să fie supus unei analize factoriale, pentru a demonstra
că acesta măsoară ceea ce şi-a propus să măsoare.
Având acest ghid de realizare a testelor obiective psihologul trebuie să construiască un
raţionament pentru elaborarea testelor obiective. Totuşi, aceste taxonomii şi analize sunt foarte
abstracte şi din acest motiv autorii prezintă o serie de indicaţii practice bazate pe propria intuiţie şi
experienţa lor considerabilă în construirea testelor obiective.
Cattell şi Warburton (1967) listează cinci aspecte care trebuie evitate, la care de obicei recurg
amatorii în construirea de teste obiective:
1. Evitarea itemilor de tip chestionar, care prin definiţie nu pot intra în construcţia unui fi un test
obiectiv. După cum am menţionat anterior itemii chestionarelor pot fi utilizaţi ca bază pentru testele
obiective pentru a defini anumite comportamente tipice.
2. Evitarea problemelor şi a itemilor tip puzzle. Acestea sunt utilizate pentru măsurarea variabilelor
cognitive.
108
PSIHODIAGNOSTIC (I)
3. Să nu avem încredere prea multă în “situaţiile stres”. Acestea surprind cel mai bine frica şi
agresiunea, dar există şi alte emoţii pe care acestea nu le surprind.
4. Evitarea testelor cu preferinţe stilistice şi estetice. Este adevărat că acestea pot surprinde anumite
aspecte de personalitate. Dar este absurd să gândim că ele pot măsura toate aspectele de
personalitate, chiar dacă trebuie să ignorăm faptul evident că răspunsurile la aceste teste sunt
influenţate de educaţie şi cultură.
5. Evitarea simplei utilizări a testelor proiective - răspunsurile la acestea sunt complexe din punct de
vedere factorial (Wenig, 1952).
Pe lângă aceste cinci aspecte care trebuie evitate atunci când se realizează un test obiectiv,
există şi alte caracteristici.
Vom discuta despre cele mai importante dintre ele.
1. Motivaţia diferită a subiecţilor. Acesta reprezintă o dificultate a tuturor testelor, dar este acută
în testele obiective în care subiectul nu are nuci o idee legată de ceea ce testul poate să măsoare şi
pare o pierdere de timp. Totuşi există persoane care se consideră performante şi care întotdeauna
încearcă să rezolve cât mai bine itemii testului, de aceea factorii motivaţionali neintenţionaţi influenţează
rezultatele.
Cattell şi Warburton (1967) discută cinci posibilităţi de reducere a acestei distorsiuni:
a. Testul este divizat în două părţi, pentru care motivaţia se consideră ca fiind la fel. Scorul este
diferenţa dintre cele două părţi sau proporţia celor două, o parte fiind considerată deliberat ca fiind
afectată de motivaţie.
b. Să motivăm subiecţii astfel încât să putem presupune că nu mai apar diferenţe între motivaţiile
indivizilor. După cum menţionează Cattell şi Warburton, acest lucru se poate realiza prin utilizarea
unor impulsuri de bază, cum ar fi sexul, frica, furia, mai curând decât folosirea unor impulsuri care
au mai puţină semnificaţie, cum ar fi sentimentele modelate cultural, dintre care menţionăm
sentimentele faţă de familie sau cele religioase, care au o mai mare variaţie. În practică apar însă
probleme etice, unele stimulări fiind dificil de realizat (de exemplu înfometarea este imposibil de
realizat), în prezent se utilizează frecvent ca stimuli şocuri electrice sau poze cu figuri nude.
c. Cotarea poate fi restricţionată de aspectul stilistic sau formal al performanţei subiectului, deoarece
acestea sunt mai puţin influenţate de motivaţie, după cum menţionează Cattell şi Warburton, putând
fi recunoscute ca specifice într-o mare varietate de situaţii.
Toate aceste trei metode se aplică în testele temperamentale mai curând decât în testele obiective
dinamice. Ultimele două puncte se plică testelor dinamice.
d. Este posibil ca nivelul motivaţional al subiectului să acopere întreaga baterie de teste care este
analizată factorial. Dacă se întâmplă acest lucru toate variabilele care au pondere substanţială
într-un factor ar putea fi înlocuite.
e. Constructorul de teste trebuie să motiveze subiectul pentru a obţine o implicare completă a
acestuia. Practic acest lucru nu este uşor de realizat.
2. Testul ca situaţie. Testul poate fi privit va o situaţie care implică anumite comportamente
sociale, care reprezintă un aspect important al personalităţii. Mischel (1968) a contestat testele de
personalitate considerându-le invalide deoarece scorurile sunt determinate situaţional.
109
CORNEL HAVÂRNEANU
Cattell şi Warburton (1967) subliniază faptul că testul este o situaţie specifică şi că putem crea un
set de testele obiective care să implice interacţiuni sociale. Aceste situaţii în miniatură, sunt dificil de
creat şi complicat de aplicat în practică.
110
PSIHODIAGNOSTIC (I)
111
CORNEL HAVÂRNEANU
Considerăm că exemplele date sunt suficiente pentru a indica marea varietate a testelor
obiective. Tot ceea ce rămâne de făcut este să investigăm şi să stabilim dacă ele sunt valide şi dacă
măsoară aspecte importante ale personalităţii.
112
PSIHODIAGNOSTIC (I)
Vom discuta despre testele psihologice care nu fac parte din grupurile de teste pe care le-am
analizat în cursurile anterioare. Ele sunt diferite ca natură şi au o coerenţă care nu se regăseşte în
categoriile prezentate anterior.
113
CORNEL HAVÂRNEANU
XI.2. DMT
În acest test se prezintă cartoane cu doi stimuli care diferă doar în detaliu. Aceştia sunt stimuli
adaptaţi ai TAT - ului. Pe fiecare carton se găseşte figura unui erou, un atribut al eroului, iar în fundal, la
periferia planşei, se găseşte o figură ameninţătoare, hidoasă. Această figură hidoasă aflată la periferia
planşei implică testul în măsurarea mecanismelor defensive, deoarece distorsiunile de percepţie din
timpul prezentării seriilor pot fi surprinse prin modul în care subiecţii tratează ameninţarea. Sjoback
(1967), în descrierea pe care o face acestor teste, consideră că expunerile de la început, când subiecţii
văd puţin, prin răspunsurile lor reflectă procese primare, inconştiente, în timp ce expunerile din ultimele
stadii devin stimuli de graniţă. În schemele de cotare din testele perceptiv-genetice momentul din seria
de stimuli la care apare răspunsul este considerat ca fiind foarte important.
Există câteva aspecte care privesc cotarea şi interpretarea testelor perceptiv-genetice (pentru
aceste testul DMT este un exemplu tipic). Mai întâi, Kragh şi Smith (1970) argumentează că
transformările de înţeles, în dezvoltarea percepţiei, dezvăluită în seriile prezentate, fac posibilă
reprezentarea istoriei personalităţii în timpul prezent. Trecutul este disponibil direct investigaţiei
experimentale. Noua formă şi semnificaţiile ei pot fi înţelese doar prin referire la istoria vieţii subiectului.
Într-adevăr experienţele sunt actualizate prin utilizarea termenilor folosiţi în aceeaşi ordine în care au
apărut în viaţă. Acesta este un paralelism, şi semnifică faptul că anul precis al unui astfel de eveniment
traumatic poate fi evidenţiat printr-o serie perceptiv-genetică.
Acest lucru pare a fi fantastic şi există numeroase dovezi empirice pentru a respinge tehnica,
legăturile cu teoria psihanalitică neajutând în această privinţă. Kline (1987), consideră că se poate
renunţa la noţiunea de paralelism fără a abandona ideea că importante experienţe de viaţă ar putea fi
evidenţiate prin aceste tehnici. De fapt, s-a demonstrat că paralelismul nu are semnificaţie. În afară de
evaluarea faptului că fiecare răspuns la testul DMT apare într-o secvenţă strictă de timp şi de faptul că
există o demarcaţie clară a ceea ce constituie un răspuns paralel (care nu este un paralelism),
paralelismul, în aceste teste însemnând că în anumite situaţii răspunsul de la începutul seriei perceptiv-
genetice reflectă evenimente de la începutul vieţii, iar unele situaţii de la sfârşitul seriei reflectă
evenimente de la sfârşitul vieţii. Deci se poate renunţa la paralelism, fără însă a pierde puterea de
interpretare.
Scorurile la DMT
- Represia: eroul sau figura ameninţătoare trăiesc sau nu sunt umane; sau ambele sunt obiecte;
- Izolarea: eroul sau figura ameninţătoare sunt separate sau izolate, sau una dintre ele nu poate fi
văzută;
- Negarea: ameninţarea este empatic negată;
- Reactanţa: ameninţarea este transformată în opusul ei;
- Identificarea cu agresorul: eroul devine agresor;
114
PSIHODIAGNOSTIC (I)
- Întoarcerea împotriva sinelui: eroul sau atributele sale sunt periculoase sau inutile; atributele devin o
ameninţare pentru erou;
Sjoback (1988), care a lucrat cu acest test, consideră că nu există dovezi definitive ale validităţi
acestui test. Acest lucru se datorează în mare parte faptului că cei care utilizează testul consideră că
acesta este valid şi fac afirmaţii clinice în legătură cu clienţii lor, afirmaţii pe care le consideră ca fiind
adevărate. Cooper şi Kline (1982) încearcă să remedieze acest deficit, realizând un studiu intens al
testului DMT. Autorii ajung la concluzia că DMT măsoară aspecte diferite de ceea ce măsoară 16 PF.
Într-un alt studiu DMT a fost obiectiv cotat folosind analiza G (Holley, 1973), rezultând că factorul DMT
corelează pozitiv cu succesul în selecţia piloţilor şi este legat de mecanismele defensive perceptive
(Dixon, 1981), care sunt o măsură a represiei. După cum notează şi Kragh (1989), testul DMT este util
în selecţia piloţilor, motivul fiind acela că cu cât se apără mai mult, cu atât aceştia vor răspunde mai
încet la ameninţare, este mult mai probabil să fie implicaţi în accidente.
Există anumite dovezi că testul DMT ar putea fi valid, dar mai este mult până când acest lucru va
fi demonstrat. Cea mai bună modalitate pentru demonstrarea validităţii testului ar fi să se combine
psihanaliza cu investigarea pacienţilor a căror inconştient este aparent cunoscut. Dacă ar apărea un
acord cu judecăţile clinice, acest lucru ar fi o dovadă a validităţii testului DMT. Acesta pare să fie un bun
argument din mai multe puncte de vedere:
a. Ar fi clar din punctul de vedere al raţiunii acestor metode perceptiv-genetice că, în principiu, ar
putea fi folosit orice stimul care reprezentă o ameninţare. Una din dificultăţile cu care ar pute să se
confrunte testul DMT ar fi că figura nu este suficient de ameninţătoare, cel puţin pentru unii subiecţi.
Westerlundl (1976) în studiul legat de agresiunea pacienţilor schizofrenici a utilizat stimuli diferiţi
(între care şi stimuli orali). S-a constat că au apărut mecanisme defensive la stimulii orali, dar nu şi
la imagini controlate.
b. Fraza “mecanismele defensive au fost constatate” sugerează un aspect important. Când testul DMT
este cotat pentru un mecanism defensiv (să spunem reactanţă) atunci când figura ameninţătoare
este descrisă ca zâmbind sau fiind plină de dragoste, aceste lucru este considerat ca fiind un suport
obiectiv al teoriei freudiene. Această interpretare a mecanismului defensiv nu este cu nimic diferită
de cea a unui analist care construieşte o remarcă complementară celei făcută de subiect cu privire
la formarea reactanţei faţă de mamă. Cu alte cuvinte, cotarea la DMT se face identic cu interpretare
a actului de către un analist, care etichetează răspunsul ca fiind un mecanism de apărare.
c. Aceste măsurări realizate cu ajutorul testelor perceptiv-genetice fac publice date rezultate din
relatările făcute de subiecţi, care sunt înregistrate în condiţii precise. Din acest motiv metodele
perceptiv-genetice sunt utile, pentru că ne permit accesul la un proces care în mod normal este
inaccesibil.
Aceste inferenţe sunt făcute analizând descrierea mecanismelor de apărare. Rămâne însă să se
demonstreze că aceste răspunsuri indică mecanisme de apărare sau alte conflicte inconştiente. Dacă
acest lucru nu se va realiza, nu vom putea spune că testele sunt valide, iar testele nu vor mai putea fi
recomandate.
CONCLUZII
Discuţiile despre testele perceptiv-genetice, exemplificate prin testul DMT, indică faptul că
acestea permit accesul la un material care este normal inconştient. Studiile clinice, realizate
de Kragh şi Smith (1970) şi Sjoback (1988) susţin această concluzie. În această situaţie ni se
115
CORNEL HAVÂRNEANU
pare util să se investigheze validitatea testelor perceptiv-genetice curente şi să se testeze eficienţa altor
stimuli. Congruenţa cu ipotezele clinice, psihanalitice constituie o dovadă a faptului că cel puţin
protocoalele testelor conţin un eşantion de material relevant.
XI.3. TESTELE SPECIALE UTILIZATE PENTRU PACIENŢII CARE AU LEZIUNI ALE CREIERULUI
Pacienţii cu leziuni ale creierului sau suspectaţi că ar avea leziuni ale creierului după accidente
sau lovituri, precum şi pacienţii care suferă de demenţă, sunt frecvent testaţi cognitiv pentru a evalua
gradul de deteriorare mentală. Aceste evaluări sunt utile nu doar pentru diagnostic, cum ar fi
discriminarea între efectele îmbătrânirii şi ale leziunilor (Goldstein şi Shelley, 1975) dar şi pentru
tratamentele de reabilitare şi tratament. Mulţi clinicieni utilizează teste de abilitate cognitivă pentru a
face discriminări între grupele psihiatrice care prezintă tulburări de gândire datorare unor leziuni ale
creierului, chiar dacă abilităţile lor cognitive nu sunt deteriorate. Schizofrenicii cu siguranţă fac parte din
această categorie.
Vom discuta despre raţiunea şi natura testelor deficitului cognitiv.
b. Teste speciale
Kay (1989) argumentează că testele de inteligenţă (QI), cum ar fi WAIS-ului, nu au fost construite
pentru a discrimina pur şi simplu între grupele de subiecţi anormali, deşi după cum am văzut este sunt
folosite în acest scop, şi că ar trebui folosite teste special construite care oferă sensibilitatea şi
discriminarea necesară. Kay consideră că aceste teste ar trebui să vizeze măsurarea proceselor şi
funcţiilor cognitive. Pentru ca aceste teste să fie valabile este nevoie de o bază teoretică, ca cea
evocată de Sternberg (1981) şi Cattell (1971).
Goldenberg (1989) a fost preocupat de raţiunea dezvoltării acestor teste pentru folosirea lor în
diagnostic şi tratament în psihologia clinică. Ideal ar fi ca realizarea testelor neuro-psihologice să vizeze
cât mai mult posibil funcţii cognitive specifice. Totuşi cele mai multe teste neuro-psihologice nu au o
utilitate specifică pentru că ele sunt desemnate să descrie statusul cognitiv al pacienţilor fără a face
referinţă la creier. Goldenberg argumentează că încercările de a construi teste pure pentru un singur
factor ale funcţiei cognitive specifice sunt foarte rare, chiar dacă acestea au avut succes. Trăsăturile,
deprinderile sau comportamentele sunt complexe factorial.
După cum susţine Goldenberg (1989) există unele consecinţe importante ale faptului că de fapt
nici unul din teste nu este precis neuro-anatomic. Din acest motiv diagnosticul neuro-psihologic este
116
PSIHODIAGNOSTIC (I)
CONCLUZII
În esenţă aceste teste încearcă să evalueze funcţiile cognitive de bază, şi au ca fundament
teoretic teoriile psihologice cognitive. Normele sunt esenţiale pentru că ne permit să vedem
care sunt afecţiunile tipice ale creierului.
Vom discuta despre construcţia şi utilizarea testelor care sunt virtual liste (checklist). De exemplu,
lista simptomelor sau caracteristicilor unei sesiuni de terapie. Acestea sunt adesea folosite în evaluare
şi în studii de psihoterapie, unde se urmăreşte evaluarea progresului sau rezultatelor terapiei sau a
ceea ce simt clienţii în legătură cu tratamentul. În studiile lui Sheffield (Shapiro, 1990) sunt prezentate
câteva teste de acest tip. Vom prezenta şi noi câteva dintre aceste teste.
a. Teste de conţinut.
Deşi aceste teste sunt de natură clinică, teste similare au fost construite pentru a fi utilizate în
diferite contexte. În psihologia educaţională este posibil să se construiască liste (checklist) pentru
evaluarea performanţelor şcolare şi pentru evaluarea problemelor de comportament ale copiilor în
clasă. Stott (1957) a construit un set de teste care sunt utilizate în acest scop - Ghidul Bristol de
Ajustare Socială - care evaluează comportamentul copiilor la şcoală şi acasă. În psihologia ocupaţională
listele sunt folosite pentru evaluarea comportamentului angajaţilor şi sunt valabile pentru evaluarea
caracteristicilor dezirabile şi necesare pentru un anumit post. Chestionarul Analizei Poziţiei (McCormick,
1972) este un exemplu pentru acest tip de teste.
117
CORNEL HAVÂRNEANU
118
PSIHODIAGNOSTIC (I)
119
CORNEL HAVÂRNEANU
părţilor matricei, numărul de faţete în comun începe de la zero şi apoi creşte indicând natura circulară a
naturii varianţei împărţite.
Nunnally (1978) ilustrează excelent modelul circumplex plecând de la faţetele comune, care clarifică
Cooperant natura ordonării
circulare. Trebuie
A: Încrezător
B: Stabil Docil menţionat că este
Responsabil C: Afectiv posibil să
B: Stabil
D: Supus
A: Încrezător C: Afectiv convertim o
B: Stabil D: Supus
C: Afectiv E: Neîncrezător matrice a faţetelor
H: Ascendent comune într-o
matrice ipotetică de
7 6 C: Afectiv corelaţii: numărul
8 D: Supus Modest
A: Încrezător de faţete comune
Managerial B: Stabil 1 5 E: Neîncrezător
G: Ostil F: Instabil poate avea
H: Ascendent 2 4 legătură cu
3
procentajul de
D: Supus varianţă comună, a
A: Încrezător E: Neîncrezător
F: Instabil F: Instabil cărui rădăcina
G: Ostil G: Ostil
E: Neîncrezător pătrată este
H: Ascendent
F: Instabil Sceptic
G: Ostil corelaţia.
Competitiv
H: Ascendent Reproducem
Agresiv aceasta în figura 1.
Figura 1
Trebuie să facem câteva precizări legate de acest model. Mai întâi, după cum argumentează
Nunnally (1978) acest model reprezintă un sumar elegant al datelor în matricei de corelaţie. Aceasta
este raţiunea analizei factoriale, dar din analiza factorială nu rezultă un număr evident de factori, dar ea
poate fi folosită pentru găsirea unui principiu de rezumare a datelor. Adepţii analizei corelaţionale
masive susţin că modelul circumplex permite acest lucru. McCrae şi Costa (1989) argumentează că
modelul permite o bună evaluare a personalităţii şi poate fi privit ca un model complementar la
descrierea analitică a factorilor.
Totuşi metoda analizei masive este complexă din punct de vedere logic şi statistic, iar dificultatea
se datorează lipsei de claritate în ceea ce priveşte diferenţele dintre noţiunile de faţetă şi variabilă.
O altă obiecţie a fost menţionată de Nunnally (1978). Analiza faţetelor, spre deosebire de analiza
factorială nu este o metodă de descoperire. Mai curând este o metodă de testare a ipotezei. Totuşi
modelul circumplex este o ipoteză extrem de complexă şi doar foarte rar este posibil ca ipoteza unei
structuri cu o astfel de complexitate să ducă la obţinerea de cunoştinţe curente în domenii psihometrice
principale ale personalităţii, motivaţiei şi abilităţii.
Din descrierea simplificată a modelului se poate observa că faţetele sunt fie prezente fie absente.
Totuşi în aplicaţiile realiste ale testelor psihologice o astfel de măsurare simplă este mai puţin probabilă.
Se poate avea în vedere şi greutatea diferită a diferitor faţete, iar acest lucru ar duce la complicarea
modelului circumplex.
Poate că cel mai important aspect se referă la faptul că analiza faţetelor nu este o metodă de
construcţie prin analiză a faţetelor de bază. Acest lucru deosebeşte modelul de analiza factorială.
120
PSIHODIAGNOSTIC (I)
Chiar dacă s-a arătat că este un model sumar al matricelor de corelaţie complexe, descrierea nu
pare să aibă o semnificaţie particulară. Este un punct de vedere subiectiv. Există autori care pot găsi o
descriere valabilă a modelului circular sau o semnificaţie a acestuia.
CONCLUZII
Din descrierea şi discuţiile asupra modelului circumplex este clar că este o metodă
ingenioasă de sumare a matricei scorurilor la test.
121
CORNEL HAVÂRNEANU
CONCLUZII
Nu s-a urmărit evidenţierea valorii Indexului Profilului Emoţional ci de a ilustra modelul
circumplex ca bază pentru construcţia unor teste. Plecând de la descrierea teoriei şi a
testului este clar că acest model poate fi utilizat în construcţia testului. Înainte de a analiza
valoarea acestui model, vom descrie pe scurt instrumentul dezvoltat de Plutchick, şi anume Indexul
Profilului de Personalitate, PPI.
Concluzii
Aceste două exemple de teste ale lui Plutchik şi colegilor care se bazează pe modelul circumplex
care nu pare să aibă un suport suficient pentru a fi utilizat şi a avea valoare în construcţia testelor. Acest
tip de descriere ar putea fi utilă dacă s-ar arăta că variabilele din modelul circumplex nu se potrivesc cu
alte structuri. Acest lucru nu se aplică şi în cazul IPP, pentru că toate scalele corelează semnificativ cu
Scala Stimei de Sine a lui Fitts (1965). Aceasta înseamnă că acest scale nu sunt independente şi că
122
PSIHODIAGNOSTIC (I)
dispare structura modelului circumplex. După cum s-a sugerat anterioară analiza factorială a acestor
scale indică doar o mică varianţă rămasă neexplicată. Plutchik şi colegii săi au arătat că structura
modelului circumplex se potriveşte scalelor. Totuşi rezultă o mică semnificaţie psihologică din aceste
corelaţii cu scala stimei de sine, şi este posibilă o mai mare cantitate de varianţă a acestor itemi.
Aceleaşi argumente e aplică şi scalei emoţionale. Cele 12 termeni trăsături care au fost utilizaţi
pentru construcţia scalelor au fost selectaţi doar pe baza faptului că exista un bun acord între judecăţile
privitoare la consecinţele emoţiilor. Acest lucru nu este mai mult decât un aspect al validităţii. Ca în
cazul EPI o analiză factorială a acestor scale cu notele pentru factorii de personalitate ar releva natura
varianţei. În prezent etichetarea lor se face pur şi simplu în termenii validităţii şi teoriei emoţiilor a lui
Plutchik.
Aceste două exemple de teste construite după modelul circumplex nu par să ofere suficient
suport ca bază pentru construcţia testelor. Principale problemă a modelului provine din faptul că chiar
dacă există o descriere a datelor aceasta nu este o descriere informativă. Există puţină informaţie care
să ducă la concluzia că scala se potriveşte unui circumplex.
Modelul va fi util atunci când va fi clar faptul că modele psihometrice normale, cum ar fi o simplă
structură de factori, nu se potriveşte complexităţii datelor.
Un exemplu de listă
Să presupunem că suntem interesaţi de constructele unei femei despre lume. Îi vom cere să
numească 15 persoane importante din viaţa ei, cum ar fi mama, tata, iubit, şeful de la serviciu etc.
Acestea vor fi elementele. Constructele vor fi obţinute de la subiect prin gruparea elementelor în trei şi
cerând subiectului să ne spună două grupe care sunt apropiate şi diferite de a treia. Astfel, putem obţine
că A şi B sunt inteligenţi, în timp ce C este slab. Constructul este: inteligent-slab. Asemănător vom
descoperi că D şi E sunt manieraţi în timp ce F este nemilos. Este important ca constructele să fie
elaborate de subiect deoarece sunt particulare pentru acesta. Există şi alte metode pentru a elabora
constructe, dar ele sunt esenţial echivalente metodei pe care au descris-o. Trebuie menţionat că există
mai multe tipuri de metode descrise de Kelly (1955), multe dintre ele au fost rar folosite. Una dintre ele
123
CORNEL HAVÂRNEANU
explorează relaţiile dintre constructe, în mod particular care constructe implică alte constructe (Hinkle,
1965).
Analiza listelor
Subiecţilor li se poate cere să ierarhizeze fiecare element al fiecărei construct sau să evalueze
fiecare element al fiecărui construct. Ambele metode au ca rezultat corelaţii între constructe. Este
posibil să vedem ce constructe merg împreună şi bineînţeles cum se plasează indivizi similari în funcţie
de aceste constructe. Astfel putem constata că inteligenţa şi cruzimea sunt corelate, şi apoi
întorcându-ne la elemente să constatăm, de exemplu, că un profesor de la liceu care este urât de
subiect este văzut în mod asemănător în relaţie cu mama.
Este clar că această metodă produce informaţii care sunt utile pentru înţelegerea indivizilor
particulari şi aceste liste par să fie potrivite pentru utilizare clinică Este dificil însă de stabilit ce se poate
face mai departe cu aceste informaţii, având în vedere faptul că listele pentru diferiţi indivizi nu sunt
compatibile.
Unii cercetători au analizat factorial listele (Slater, 1964, 1976) şi au dezvoltat un set statistic
sofisticat de programe computer în acest scop. Totuşi fiind un număr mic de observaţii pentru fiecare
listă, erorile statistice ale acestor analize factoriale pot fi atât de mari încât metoda de prelucrare
statistică să fie considerată ca fiind îndoielnică. Chiar dacă rezultă factori ei sunt specifici unui individ
particular şi de acea prezintă un interes ştiinţific redus.
Un număr mare de observaţii se pot face legat de afirmaţia că constructele sunt distincte şi
particulare pentru fiecare individ. Acest adevăr pare să fie banal. Toţi avem o experienţă de viaţă care
este privată şi care este diferită de a celorlalte persoane. Această experienţă este atât de diferită încât
testele sunt lipsite de valoare.
Dacă acest aspect ar fi adevărat atunci conversaţia şi înţelegerea dintre oameni ar fi imposibilă.
Faptul că lumea exterioară poate fi înţeleasă sugerează că pentru oameni există un nucleu comun de
semnificaţii chiar dacă aceste nu sunt identice.
Există câteva dificultăţi severe. Dacă constructele individuale folosite sunt atât de diferite atunci
ele pot fi elucidate pornind de la informaţiile din liste care sunt particulare pentru un individ, neputând fi
combinate cu rezultatele altor subiecţi şi neputându-se face inferenţe despre rezultatele unui subiect
comparativ cu cele ale altui subiect. Aceasta distruge scopul ştiinţific normal al descoperirii legilor
generale aplicabile tuturor sau unui număr mare de aspecte ale umanităţii. Dacă premisele listelor sunt
acceptate putem spune că psihologia ştiinţifică este imposibilă şi că pot fi înţeleşi doar indivizi separat.
Ar fi util să stabilim relaţii între măsurarea individului cu ajutorul listelor şi scorurile la anumite variabile
din mediu. Chiar dacă ar fi posibil să stabilim asemenea relaţii aceste nu ar fi utile deoarece
constructele sunt aprioric diferite unele de altele şi nu ar fi posibile inferenţele sau extrapolările. Doar în
domeniul clinic informaţiile rezultate prin folosirea listelor ar putea fi utile.
De exemplu o grilă ar putea fi folosită în terapia maritală. S-ar putea constata că soţul îşi vede
soţia ca pe o mamă în timp ce soţia îşi vede soţul ca tată. Această incompatibilitate poate crea
probleme. Discutarea acestor dificultăţi ar duce la îmbunătăţirea relaţiei. Să presupunem că dificultatea
rezidă în certuri frecvente. Deoarece constructele indivizilor sunt diferite nu se pot face generalizări.
Simţul comun ar sugera că o ipoteză rezonabilă ar fi să presupunem că atunci când bărbatul doreşte ca
soţia să reprezinte imaginea mamei iar femeile imaginea tatălui putem vorbi de o dizarmonie maritală.
Dacă această inferenţă este făcută atunci listele, distincte de interviu şi chestionar, care au constructe
comune, nu au raţiunea de a exista. Aceste motive stau la baza respingerii listelor pentru măsurare.
124