Sunteți pe pagina 1din 153

Prof univ. dr.

Corneliu Havârneanu

CUNOASTEREA PSIHOLOGICA A PERSOANEI

1
Unitatea de învățare 1
ISTORIA EVOLUȚIEI PSIHOLOGIEI DIFERENȚIALE ȘI
PSIHODIAGNOSTICULUI

SCURT ISTORIC AL PSIHOGIEI DIFERENŢIALE ŞI ORIGINILE CNOAŞTERII


PSIHOOGICE A PRSOANEI

De-a lungul istoriei umanităţii au existat numeroase preocupări de a găsi metode de


selecţie a indivizilor mai productivi sau care să corespundă obiectivelor de formare stabilite
Aceste preocupări au dus la o utilizare pe sacră largă a testelor şi altor metode de cunoaştere a
persoanei în diferite domenii aplicative fapt care ne oferă posibilitatea stabilirii unei
cronologii a evoluţiei lor.
1. Spiritul psihologiei diferenţiale şi originile evaluării
DuBois (1970), care este citat în multe manuale de psihometrie, Gregory (1992) şi
Sattler (1992), susţin că evaluarea a apărut în China în urmă cu 3000 de ani. Această afirmaţie
nu este susţinută de surse istorice. Brawman (1998) consideră că începând cu anul 165 î. Hr.
în China se practica selecţia în domeniul serviciilor publice.

1.1. Originile psihologiei diferenţiale.

IMPORTANT Psihologia diferenţială, ca ramură a psihologiei ştiinţifice , a apărut în


Anglia la sfârşitul sec. al XIX-lea, odată cu dezvoltarea empirismului şi ca o prelungire a teoriei
darwiniste a evoluţionismului.

Dar reflexiile asupra variabilităţii indivizilor sunt mult mai vechi. Încă din antichitate
întâlnim reflexii ale filozofilor şi medicilor referitoare la variabilitatea indivizilor. Platon
(427-347 î.Hr.), de exemplu în Republica, consideră că există trei tipuri de indivizi
corespunzătoare celor trei faţete ale sufletului uman: "dorinţele", "raţiunea" care le
controlează, şi "pasiunea" care corespunde sensului moral şi manifestărilor sale. Aceste
proprietăţi înnăscute permit indivizilor să ocupe funcţii sociale specifice (producători,
războinici, magistraţi) şi societatea este interesată să facă plasamente în funcţie de acestea.
Consideraţii asupra variabilităţii interindividuale a făcut şi Aristotel (384-322 î.Hr.) care a
fost interesat de diferenţele psihologice dintre rase şi dintre sexe, şi de caracteristicile
individuale necesare în exercitarea diferitelor meserii. Hippocrate (460-477 î. HR.), părintele
medicinii, descrie patru tipuri temperamentele pe care le interpretează în termeni de "umori"
şi de "elemente": colericul (la care predomină bila albă şi focul), melancolicul (cu
predominanţa bilei negre şi a pământului), flegmaticul (la care predomina flegma şi apa) şi
sanguinicul (la care predomină sângele). Vom recunoaşte în tipologiile moderne ale
personalităţii, mai ales în cea elaborată de Pavlov, o mare analogie cu tipurile lui Hippocrate.
În evul mediu, evaluarea aptitudinilor s-a practicat târziu în mai multe universităţi
europene. Cristian Von Wolff trebuie menţionat deoarece a fost primul care a intuit
posibilitatea creării unei ramuri matematice a psihologiei, pe care a numit-o "psihometrie".

2
1.2. Teoria facultăţilor

IMPORTANT În epoca modernă problema diferenţelor individuale a fost


marcată de influenţa teoriei filosofice a cunoaşterii care punea problema originii "ideilor"
noaste, cum ar fi conceptele abstracte (Dumnezeu de exemplu), categoriile gândirii (timpul,
cauzalitatea) sau operaţiile mentale. Pentru filosofii idealişti ideile sunt înnăscute, şi spiritul
nostru are capacitatea de a le prelua direct. Pentru filosofii empirişti ideile sunt elaborate pe
baza informaţiilor furnizate de organele senzoriale.
În acest cadru al filosofiei idealiste s-a ajuns la definirea spiritului şi a facultăţilor
mentale, care permit accesul la cunoştinţe independent de senzaţii şi o descriere foarte
generală a sufletului uman. Thomas Reid (1710-1796), fondatorul şcolii ecoseze, prezintă o
listă de "capacităţi ale sufletului": douăzeci şi patru de "capacităţi active" ca faima,
perseverarea eului, imitaţia, estimarea eului, nevoia de putere, imaginaţia etc., şi şase
"capacităţi intelectuale" ca percepţia, judecata, memoria, sensul moral etc. Aceste facultăţi,
sau capacităţi se pot manifesta slab sau foarte puternic la indivizi diferiţi, ceea ce presupune
existenţa unor diferenţe individuale între aceştia.
Dar interesul pentru aceste cadre descriptive este limitat. Ele sunt pure speculaţii iar
cercetările psihologiei diferenţiale trebuie să se bazeze pe observaţii sistematice, nu pe
observaţii secvenţiale sau pe simpla intuiţie, care nu face posibilă generalizarea. Ele sunt
statice şi se bazează pe decupajul unei scheme de funcţionare psihologică. În plus,
postulatele ineiste nu oferă posibilitatea abordării dezvoltării indivizilor şi rămân tributare
accentuării rolului factorilor ereditari în explicarea diferenţelor interindividuale.
Reminiscenţe ale teoriei facultăţilor şi o dezvoltare ulterioară a acesteia găsim şi la
precursorii lui Reid în psihologia modernă.
Alexander Bain (1818-1903), a reluat teoria facultăţilor mintale a lui Reid, pentru a
descrie diferenţele individuale într-o lucrare care abordează personalitatea, publicată în 1861
"Sur l'etude du caractere".

IMPORTANT Franz Joseph Gall (1758-1828), s-a inspirat mult din această
lucrare, în tratatul său de frenologie, care a avut un mare succes pe parcursul secolului al
XIX-lea.
Pentru Gall există treizeci de facultăţi, fiecare facultate are un loc bine definit pe o
regiune a creierului, regiune care este foarte bine dezvoltată. Dezvoltarea creierului poate
modifica forma craniului, ceea ce oferă posibilitatea estimării dezvoltării unei anumite
facultăţi. Fiecare facultate este plasată într-o anumită regiune a creierului şi această regiune
este mai dezvoltată. Dezvoltarea creierului poate modifica forma craniului şi se poate estima
dezvoltarea unei facultăţi prin palpare. Expresia "are bosă de..." provine din frenologie (care a
fost numită şi craniologie). Azi putem surâde de schematismul frenologiei şi de naivitatea lui
Gall, sau putem să ne indignăm de reducţionismul său. Dar această teorie, ca toate teoriile;
trebuie situată în contextul epocii în care a apărut. Cert este că teoria frenologică este eronată:
dimensiunile psihologice utilizate nu sunt fondate, creierul nu modifică forma craniului.
Frenologia are însă meritul de a accentua o idee forte nouă în epocă şi exactă în principiu:
3
localizarea în diferite zone ale creierului a funcţiilor psihice. Frenologia este un bun
exemplu de teorie generală (localizările cerebrale) care a fost confirmată prin cercetări
diferenţiale.
1.3. Empirismul anglo-saxon

IMPORTANT
Empirismul a început să se dezvolte în Anglia începând cu Thomas Hobbes (1588-
1679) şi John Locke (1632-1704) care publică în 1690 "Essai sur l'entendement humain"
(eseu asupra judecăţii umane), David Hume (1711-11776), contemporan cu empiristul francez
Etienne de Condillac (1711-1780), James Mill (1773-1836) şi John Stuard Mill (1806-1873).
Pentru empirişti spiritul este o tablă nescrisă (tabula rasa) pe care se înscriu senzaţiile.
Problema fundamentală care apare este: cum simplele senzaţii pot da naştere la cunoştinţe
sau "idei". Teoria asociaţionistă rezolvă această problemă. La fel ca şi în chimie corpurile
simple se asociază pentru a da naştere la corpuri complexe, senzaţiile se asociază pentru a
deveni cunoştinţe. Hume prezintă mai multe legi de asociere: elementele se pot asocia prin
contiguitate spaţială sau temporală, prin asemănare, prin relaţii de cauzalitate. Filosofia
empiristă furnizează teorii extrem de generale şi faptele prezentate nu vizau confirmarea sau
infirmarea lor ci, doar simpla ilustrare. Dacă teoria nu este ştiinţifică ea nu oferă o bază
pentru dezvoltarea practicii. În sfârşit, gândirea nu poate fi considerată ca un dat al cerului ci,
ca un fenomen natural căruia îi putem observa manifestările. Cu toate acestea psihologia
diferenţială s-a dezvoltat pornind de la filosofia empiristă. Această origine empiristă a
determinat orientarea psihologiei de la sfârşitul secolului al XIX-lea spre introspecţie şi
analiza experimentală a fenomenelor senzoriale elementare. Programul ambiţios al acestei
psihologii este reconstituirea fenomenelor de conştiinţă pornind de la senzaţii.
Dacă empirismul a permis apariţia unei psihologii experimentale el este mai puţin
favorabil psihologiei diferenţiale. Pentru a deveni obiect de cercetare, diferenţele individuale
au nevoie de o oarecare stabilitate. Aceasta stabilitate relativă îşi poate avea originea într-o
puternică determinare ereditară sau în influenţele mediului. În secolul XIX stabilitatea
diferenţelor era pusă pe seama determinanţilor ereditari. Empirismul, prin postulatul său de
bază tinde să minimalizeze ponderea factorilor ereditari. Bine înţeles, constatăm
recunoaşterea existenţei unor diferenţe individuale. "Ideile" nu sunt aceleaşi, sau nu se
manifestă în acelaşi fel la indivizi diferiţi. Provenind de la diversitatea senzaţiilor care stau la
baza formării lor, originea lor nu are nimic misterios: ele nu sunt decât reflectarea
circumstanţelor şi pot fi modificate uşor modificând circumstanţele. Apriorismul ideilor
explică interesul scăzut pentru diferenţele individuale, manifestat de Wundt şi o parte din
primii psihologi experimentaliti. În cercetarea legilor generale ale asociaţiei variabilitate
interindividuală este considerată ca o sursă de eroare de care trebuie să ne ferim.
Behaviorismul, fiind curentul psihologic cel mai apropiat de empirism a fost cel mai puţin
interesat de studiul diferenţelor individuale.
Nu există totuşi incompatibilitate între principiile empirismului şi luarea în
consideraţie a diferenţelor individuale stabile. Circumstanţele nu sunt singure responsabile de
variabilitatea asociaţiilor. T. Brown (1778-1820) şi A. Bain consideră că aspectele stabile
sunt datorate unor caracteristici constituţionale ale indivizilor. Ei evocă şi stabilitatea

4
obiceiurilor formate. Filosoful evoluţionist Herbert Spencer (1820-1903), care va avea o
influenţă directă asupra fondatorului psihologiei franceze Theodule Ribot (1839-1916),
introduce ineismul în empirism pe baza evoluţiei. El consideră că asociaţiile frecvent
repetate în ontogeneză sunt transmise descendenţilor. Diferenţele individuale sunt deci
caractere dobândite şi transmise ereditar. Credinţa în ereditatea caracterelor era foarte
răspândită în secolul al XIX-lea. S-a demonstrat ulterior că ea era fără fundament. Dorind să
găsească bazele stabile ale variabilităţii indivizilor fondatorii psihologiei diferenţiale, Fracis
Galton în special, se situiează în curentul empirist-asociaţionist.
1.4. Teoria evoluţiei
Prima teorie a evoluţiei a fost formulată de Jean-Baptiste de Lamarck. Finalist,
Lamarck credea că materia vie are o tendinţă naturală de perfecţionare. Aceste perfecţionări
permit adaptarea la mediu şi aceste caracteristici dobândite sunt transmise la descendenţi.
Charles Darwin (1809-1882) este un naturalist care a adunat numeroase observaţii.
Lucrarea sa de bază "Originea speciilor un mijloc de selecţie naturală sau lupta pentru
existenţă în natură" a apărut la Londra în 1859. Ca şi Lamarck, Darwin credea că speciile se
nasc, se transformă şi dispar fără ca Dumnezeu să intervină. Ca şi Lamarck el credea că
această evoluţie este foarte lentă. Dar mecanismele de evoluţie imaginate de Darwin sunt total
diferite de cele ale lui Lamarck. Pentru Darwin evoluţia este rezultatul unei selecţii care se
manifestă pornind de la o variabilitate aleatoare a caracterelor ereditare (prin hazard unele
girafe se nasc cu un gât mai lung decât altele, aceasta le permite să ajungă la crengile mai
înalte, iar şansa lor de supravieţuire şi reproducere este astfel maximizată).

IMPORTANT
La baza mecanismului imaginat de Darwin se află variabilitatea între indivizii unei
specii.
Ideea selecţiei naturale este preluată şi de economistul englez Thomas Malthus
(1766-1835). Pentru Mathus populaţie sporeşte mult mai rapid decât resursele. Există deci
între indivizi o luptă pentru existenţă care se manifestă prin războaie, epidemii, catastrofe,
prin care se poate restabili echilibrul între populaţie şi resurse. Şi în natură există o luptă
pentru existenţă între indivizi. Lupta pentru existenţă conduce la o selecţie naturală şi la
supravieţuirea celor foarte apţi.
Impactul teoriei evoluţiei a fost considerabil: omul care era considerat o creaţie a
divinităţii devine un produs natural al evoluţiei. Darwinismul a determinat apariţia a două
ramuri ale psihologiei: psihologia comparată, care studiază diferenţele şi asemănările dintre
speciile animale şi psihologia diferenţială, care studiază diferenţele dintre indivizi.
1.5. Contribuţia lui Galton la apariţia psihologiei diferenţiale
Galton este unul dintre primii savanţi independenţi, toţi ceilalţi mari psihologi au fost
universitari; care a desfăşurat o activitate de cercetare în domenii diverse. El explorează sud-
estul Africii realizând numeroase observaţii geografice pe baza cărora redactează un manual
practic pentru exploratori. Este interesat de mecanică (construieşte un motor cu vapori,
rotativ), meteorologie (foloseşte principiul hărţilor meteorologice, descoperă anticiclonii),
psihologie generală (realizeză un dispozitiv pentru studiul senzaţiilor, a imaginilor mentale
şi asociaţiilor).

5
IMPORTANT
Activitatea sa în domeniul psihologiei are trei mari obiective: descrierea şi măsurarea
variabilităţii psihologice interindividuale, demonstrarea originii ereditare a acestei
variabilităţi, folosirea implicaţilor teoriei evoluţioniste pentru ameliorarea spaţiului uman
(eugenismul).
În scopul observării variabilităţii interindividuale Galton inventează testele, probe care
permit o observaţie standardizată a conduitei. Acestea au fost realizate prin simplificarea
unor situaţii experimentale din laborator, facilitându-se aplicarea lor la un număr mare de
subiecţi. În 1884 mai mult de două mii de persoane au fost supuse măsurătorilor
antropometrice. Pentru a condensa aceste informaţii şi a putea evalua diferenţele dintre
indivizi Galton a inventat etalonarea care permite transformarea unei măsuri a performanţei
în rang.
Matematicianul belgian Quetelet (1796-1874) consideră că distribuţia caracteristicilor
fizice, de exemplu talia, se realizează după legea Laplace-Gauss (distribuţia normală), la fel
ca şi erorile de măsurare. Galton consideră că acest aspect este valabil şi pentru
caracteristicile psihologice. În acest fel a putut fi stabilit un procedeu de măsură a diferenţelor
interindividuale: diferenţele dintre indivizi sunt diferenţele de abatere de la media
populaţiei raportată la abaterea standard a distribuţiei populaţiei respective. Distribuţia
gaussiană a caracteristicilor psihologice este un postulat.
Galton consideră că variabilitatea indivizilor este de origine ereditară şi caută metode
pentru a demonstra acest aspect. Cercetarea legilor eredităţii presupune măsurarea
asemănărilor între părinţi şi copii în privinţa caracteristicilor fizice. Cu această ocazie, după
1880, el a inventat coeficientul de corelaţie, tehnică care a fost perfecţionată mai târziu de
Karl Pearsons (1857-1936) prin folosirea teoremelor stabilite anterior de matematicianul
francez Bravis. Coeficientul de corelaţie Bravis-Pearsons, ca indice de corelaţie, a fost
frecvent folosit în psihologia diferenţială. Galton a pus bazele metodei de studiere a
gemenilor, comparând gemenii de acelaşi sex cu gemenii de sexe diferite (distincţia dintre
gemenii monozigoţi şi cei dizigoţi a fost făcută mai târziu).
Galton a fost interesat şi de posibilitatea de intervenţie socială şi a pus bazele
ştiinţifice ale cercetărilor în domeniul eugeniei. În 1907 el a pus bazele unui laborator pentru
studierea eugeniei în care s-a elaborat toată statistica modernă. Eugenismul lui Galton constă
în evitarea transmiterii genetice anormale, ceea ce este o preocupare curentă şi azi. Galton
caută înlocuirea selecţiei naturale printr-o selecţie raţională bazată pe teoria evoluţiei, fiind în
acest fel partizanul unui eugenism pozitiv.
2. APARIŢIA ŞI EVOLUŢIA PSIHOMETRIEI
Psihometria este o disciplină mai puţin cunoscută în ştiinţele umane datorită
recunoaşterii sale tardive în mediile ştiinţifice şi a dificultăţii pentru oamenii de ştiinţă şi
lexicologi de a stabili definirea şi particularităţile sale. Cristian Van Wolf, în 1732, a
recunoscut că psihometria se leagă de psihologie şi de măsurare, urmând să se stabilească
dacă este vorba de o ramură a psihologiei, o ramificaţie a măsurării, sau ambele.

DEFINIȚIE:

6
DEFINIŢII
După Legendre (1993), psihometria este "măsurarea şi prelucrarea statistică a
faptelor psihice, mai ales prin metoda testelor". Pentru De Landshere (1979), psihometria
constă într-un "ansamblu de operaţii care, prin probe speciale (teste) şi tehnici ştiinţifice,
determină şi evaluează capacităţile psihice ale indivizilor: stabilirea nivelului mental,
detectarea tendinţelor caracteristice, estimarea aptitudinilor profesionale etc.".
Paul Dickens, Jocelyne Tournois, André Fieller şi Jean-Luc Kop (1994) "psihometria
constă într-un ansamblul de teorii şi metode de măsurare în psihologie ..., care nu se confundă
cu studiul testelor ci numai cu analiza datelor... şi care poate exista fără nici o referire la
teste".
De-a lungul istoriei umanităţii au existat preocupări de a găsi metode de selecţie a
indivizilor care să corespundă obiectivelor de formare sau să fie mai productivi. Utilizarea pe
sacră largă a testelor în diferite domenii aplicative ne oferă posibilitatea stabilirii unei
cronologii a evoluţiei lor.
După Mercier (1897), Wundt a fost primul care s-a interesat de psihometrie. În 1879,
a înfiinţat la Lepzig primul laborator de psihologie experimentală. Cercetările realizate au fost
orientate spre procesele senzoriale, mecanismele perceptive, dar şi asupra unor funcţii
complexe ca atenţia, memoria şi emoţia. Metodele de observaţie erau precise şi au fost
realizate numeroase aparate de investigaţie psihologică. În timp, mulţi psihologi ca Hall,
Cattell, Spearman, Titchner, au vizitat acest laborator preluând modelul pentru propriile lor
universităţi.
În 1888, Cattell deschide un laborator pentru testare, iar în 1890 propune două serii
de probe numite "teste mentale". Thorndike şi Lohman (1990) a publicat lista acestor teste:
1. presiune dinamometrică;
2. viteza de mişcare a braţelor;
3. ariile de sensibilitate şi de discriminare tactilă;
4. presiunea necesară pentru cauzare a unei dureri;
5. măsurarea sensibilităţii diferenţiale pentru o greutate de 100 de grame;
6. timp de reacţie simplu la sunet;
7. timpul necesar pentru denumirea culorilor;
8. divizarea unei lungimi de 50 de centimetri în două părţi egale;
9. evaluarea unei durate de 10 secunde;
10. numărul de litere reţinute după o singură prezentare auditivă.
Pe lângă acestea a mai folosit o probă pentru copii formată din 50 de teste distincte, ,
14 pentru senzaţii vizuale, 8 pentru audiţie, 3 pentru gust şi miros, 7 pentru senzaţii presiune
şi termice.
Utilizarea acestor teste nu a dus la un progres în diagnosticul aptitudinilor iar aceste
instrumente au continuat să fie utilizate pentru cercetarea psihologică. Binet şi Henri (1896)
reproşează faptul că se insistă pe investigarea proceselor psihice inferioare, senzaţii şi mişcări
elementare, în detrimentul funcţiilor superioare care caracterizează mai bine un individ. La
om este mai important să cunoaştem capacităţile de atenţie, imaginaţie şi inteligenţă decât
aptitudinile tactile sau olfactive. Jurnalele psihologice şi medicale din acea perioadă prezentau

7
multe probe care nu erau organizate în ordinea dificultăţii crescătoare. În încercarea de a
sistematiza rezultatele obţinute, Spearman (1904) recurge la analiza factorială şi constată că
folosind coeficienţii de corelaţie putem obţine un factor general şi mai mulţi factori specifici
pentru fiecare test. Această descoperire a stat la baza teoriei celor doi factori.
În 1905, Binet şi Simon realizează scara metrică a inteligenţei care le-a permis să
evalueze nivelul mental al copiilor. Materialul era compus din 30 de itemi aşezaţi într-o
ordine de dificultate crescătoare pentru 3, 5, 7, 9 şi 11 ani.
Acest instrument viza funcţiile mentale superioare, dar erau şi probe pentru estimarea
dezvoltării senzoriomotorii. Deficienţa mentală era clasificată în trei categorii: idiot, imbecil
şi debil mintal.
A doua şi a treia versiune a apărut în 1908 şi 1911. În 1909, Goddard traduce a doua
versiune publică în 1911, varianta americană revizuită care a fost apoi urmată de revizuire lui
Kuhlman (1912) şi Terman (1916).
Testul a fost tradus şi adaptat în multe ţări din Europa: în Germania de Maumann şi
Bobertag, în 1914, în Italia de Saffotti, în 1911, în Belgia de Decroly şi Degaud, în 1909, în
Suedia de Jaederholm, în 1914. în Marea Britanie de Burt, în 1921.
Varianta scării din 1908 este normalizată pe un eşantion de 300 de copii, cu vârste de
la 3 la 13 ani şi s-a introdus noţiunea de vârstă mentală. Această metodă, foarte simplă,
stabileşte nivelul intelectual pentru fiecare vârstă cronologică. Seria de probe folosită
constituie o scară metrică.
A treia variantă a scării apare în 1911, anul morţii lui Binet. Această variantă introduce
noi probe, unele pentru vârsta adultă, şi precizează tehnica de evaluare a vârstei mentale.
În 1912, Stern stabileşte formula coeficientului intelectual, prin raportarea vârstei
mentale la vârsta cronologică. QI = VM/VC
La sugestia lui Stern, Bobertag, utilizează primul acest procedeu de măsurare a
intelectului, unde 1 reprezintă media. Dacă QI depăşeşte 1, subiectul este în avans faţă de
vârsta cronologică, dacă este inferior lui 1 el este sub medie pentru vârsta sa. La această
formulă se aplică înmulţirea cu 100, în revizia "Stenford", realizată de Terman (1916), luând
forma QI = VM/VC * 100.
În 1911, Rossolimo raportează rezultatele a 8 probe sub forma unui grafic pe care l-a
numit profil.
Necesitatea examinării rapide a unui mare număr de recruţi, la sfârşitul primului război
mondial, a dus la realizarea a două baterii de teste colective, cunoscute sub numele de Army
Alpha, în 1917 şi Army Beta, în 1918 şi a scării Pintner Paterson (1915, 1917).
Problema testelor a ocupat un loc important la congresele internaţionale. Prima
Conferinţă internaţională de psihotehnică a avut loc la Geneva în 1920.
Tot în 1920, în Statele Unite, Woodworth introduce primul inventar de personalitate
(Personal Data Sheet), pentru o utilizare individuală şi în grup. Forma finală cuprinde 116
întrebări cu alegerea răspunsurilor afirmative sau negative şi permite identificarea subiecţilor
cu tulburări afective.
În 1921, în Elveţia, Rorschach prezintă o nouă tehnică de diagnosticare a
personalităţii prin interpretarea unor pete de cerneală.
În 1922. în Franţa, prin decret se stabileşte activitatea de consilier de orientare care
precede plasarea tinerilor în instituţii comerciale sau industriale prin determinarea

8
aptitudinilor fizice, morale şi intelectuale. În acest domeniu, Strong elaborează în 1927
primul chestionar de interese profesionale.
În 1927, evoluţia analizei metodologice a permis lui Thorndike să reducă în serii de
patru factori aspectele măsurate ale inteligenţei (CAVD): Completare de imagini, Aritmetică,
Vocabular şi Direcţionare. Mai multe activităţi mentale sunt în final grupate în trei categorii:
activităţi sociale, activităţi concrete şi activităţi abstracte.
Metoda centroidă, de analiză factorială a fost folosită de Thurstone (1936) şi a dus la
descoperirea unor factori de grup, care nu sunt comuni pentru toate testele, ci numai unei serii
de teste.
În acelaşi an, Doll prezintă scala sa de maturitate socială, care contribuia la evaluarea
aptitudinilor adaptative la subiecţii cu deficienţe intelectuale.
La 4 iulie 1936, Comitetul Central al Partidului Comunist al fostei URSS condamnă
practicarea psihotehnicii, considerată o pseudo-ştiinţă antimarxistă, ordonând distrugerea
tuturor cărţilor de psihometrie.
Pentru anul 1938 patru evenimente merită a fi menţionate. Bender propune o serie de
nouă figuri geometrice pentru a fi copiate cu scopul realizării unor cercetări neuropsihologice
şi a dezvoltării mentale. publică Raven versiunea finală matricilor progresive a care cuprind
cinci serii de figuri lacunare cu ajutorul cărora poate fi măsurată inteligenţa generală,
eliminând influenţa factorilor culturali. Tot acum apare prima revistă sistematică de teste
psihologice numită Mental Measurements Yarbook, iar Gasell finalizează scala de teste de
dezvoltare pentru copii.
În 1939, David Wechsler realirează scala de diagnostic intelectual pentru adulţi.,
Wechsler-Bellevue Intelligence Scale. Apoi în 1949, Wechsler Intelligence Scale for
Children, iar în 1967 Wechsler Preschool and Primary Scale of Intelligence. El a făcut o bună
sinteză a probelor deja existente şi a prezentat rezultatele sub forma unui profil psihologic
renunţând la conceptul de vârstă mentală.
În 1940, Cattell, folosind analiza factorială, introduce probe neverbale foarte
saturate în factorul general de inteligenţă "g", foarte puţin influenţate de factorii socio-
culturali.
În 1959, Guilford prezintă structura factorială a inteligenţei ca un ansamblu de
abilităţi. Modelul structural al intelectului cuprinde trei dimensiuni care prin combinare
formează 120 de factori. Fiecare factor este localizat la intersecţia a trei dimensiuni care-l
determină.
Cattell, în 1963, pe baza teoriei factoriale, elaborează teoria inteligenţei "cristalizate"
şi "fluide". Inteligenţa cristalizată se manifestă atunci când sunt prezentate situaţii acumulate
din mediul social, şcolar şi cultural. Testele care se referă la aceasta sunt teste de inteligenţă
generală care au, mai ales, un conţinut educaţional şi şcolar. Inteligenţa fluidă este activată în
situaţii noi, când subiectul trebuie să sesizeze noi relaţii dând dovadă de creativitate. Acest
potenţial este măsurat prin teste prin teste care nu sunt influenţate cultural
În 1968, Lord şi Novik au făcut o sinteză de interpretare a datelor obţinute pe baza
testelor psihologice. Ei au dat definiţii sintactice explicite (matematice) pentru conceptele care
au o semnificaţie matematică (reală). Conceptul de scor adevărat a fost definit sintactic şi
interpretat semantic ca scorul observat la o persoană cu ajutorul unui test de o lungime
infinită. Acesta este un scor observat aşteptat. Pe baza teoriei numerelor mari au demonstrat

9
că definiţia teoriei testelor este o definiţie pragmatică care furnizează o interpretare semantică
a scorurilor observate.

3. CONCLUZII
Înaintea prezentării unor metode specifice de cunoaştere a persoanei, se impun câteva
precizări în legătură cu posibilitatea cunoaşterii psihologice.
a. În primul rând subliniem faptul că psihologia este o ştiinţă probabilistă, iar prin
cunoaşterea psihologică nu se ajunge la certitudine, ci este doar o cunoaştere probabilistică. Din
această cauză în domeniul psihologic nu vom putea stabili un diagnostic definitiv, ci doar un
prognostic, care va trebui să fie elaborat pe termen scurt, pentru a evita erorile predictive datorate
evoluţiei în timp a subiecţilor, modificărilor, uneori spectaculoase, determinate de multitudinea şi
complexitatea factorilor implicaţi în schimbare.
b. Cunoaşterea în domeniul aptitudinilor este mai avansată, precizia în măsurare fiind
mult mai mare faţă de alte aspecte ale personalităţii în care nu putem fi siguri de autenticitatea
reacţiilor persoanei. Când se pune problema cunoaşterii trăsăturilor de caracter, de exemplu,
subiecţii activează mecanisme de apărare, etalează doar aparenţe în spatele cărora ascund
trăsăturile autentice. Pentru evitarea acestor neajunsuri s-au înregistrat reacţiile subiecţilor în
situaţii imaginate, pentru a releva aspecte ale personalităţii fără ca aceştia să conştientizeze
scopul urmărit. În acest fel au apărut şi s-au dezvoltat testele proiective, majoritatea bazându-se
pe concepţii psihanalitice.
o Dar, şi aceste instrumente prezintă dezavantaje, deoarece trebuie demonstrată
corespondenţă dintre manifestările subiecţilor în situaţia imaginară şi cea reală,
iar interpretarea presupune o teorie elaborată asupra motivaţiei şi a modului în
care ea se exprimă (A. Cosmovici, 1972, 1985).
c. Există divergenţe în legătură cu metodele utilizate în psihologie, precum şi în legătură
cu valoarea acestora. Fără a intra în analiza acestor puncte de vedere subliniem faptul că tendinţa
unanim acceptată este de împărţire a metodelor de cunoaştere în două categorii: metode clinice
(observaţia, convorbirea, metoda biografică) şi metode psihometrice sau experimentale
(experimentul, testul şi chestionarul).
Diferenţa fundamentală dintre cele două categorii de metode apare în funcţie de scopul
urmărit, a gradului de precizie şi obiectivitate în cunoaştere.
d. Din punct de vedere al scopului, metodele clinice îşi propun o cunoaştere cît mai
amănunţită a persoanei, şi explicaţia evoluţiei sale, în timp ce metodele psihometrice se
orientează spre stabilirea rangului persoanei, poziţia sa în raport cu o populaţie normală. Aceasta
face ca orientarea predominantă în cazul metodelor clinice să fie cea calitativă, iar în cazul
metodelor psihometrice interpretarea predominant cantitativă.
e. În legătură cu gradul de precizie şi obiectivitate, metodele psihometrice folosind
verificări statistice riguroase, sînt mult mai exacte, specificându-se de fiecare dată limitele de
eroare. Metodele clinice prezintă un grad de obiectivitate şi precizie mai mic, deoarece sînt
lipsite de criterii precise de interpretare, această depinzând de subiectivitatea celui care face
analiza.
f. În psihologia aplicată se manifestă tot mai mult tendinţa de apropiere a celor două
metode, îmbinarea ambelor categorii şi evitarea unilateralităţii, care nu poate fi decât dăunătoare.

10
Interpretarea cantitativă şi calitativă a rezultatelor obţinute prin metode psihometrice oferă atât
posibilitatea ierarhizării subiecţilor în funcţie de performanţă, cît şi explicarea modului de
obţinere a performanţei. Metodele clinice s-au perfecţionat, găsindu-se mijloace de standardizare
a interpretărilor şi comparaţii în condiţii mai exact determinate.

TEST DE AUTOEVALUARE (cu răspunsuri corecte ataşate la finalul cursului)


Apreciați valoarea de adevăr a următoarelor afirmații:
1. Galton a inventat etalonarea care permite transformarea unei măsuri a performanţei scoruri
standardizate pe baza mediei și abaterii standard.
a.ADEVĂRAT
b.FALS
2. Frenologia frenologiei constă în localizarea funcțiilor psihice în diferite zone ale creierului.
a.ADEVĂRAT
b.FALS
3. Galtoni a pus bazele eugeniei.
a.ADEVĂRAT
b.FALS
4. Primul care a intuit posibilitatea creării unei ramuri matematice a psihologiei, pe care a
numit-o psihometrie a fost Galton.
a.ADEVĂRAT
b.FALS
5. Empirismul a determinat orientarea psihologiei de la sfârşitul secolului al XIX-lea spre
introspecţie şi analiza experimentală a fenomenelor senzoriale elementare.
a.ADEVĂRAT
b.FALS
6. Galton a inventat etalonarea care permite transformarea unei măsuri a performanţei în
rang.
a.ADEVĂRAT
b.FALS
7. Dezvoltarea creierului poate modifica forma craniului susțin empiriștii englezi.
a.ADEVĂRAT
b.FALS
8. Diferenţele dintre indivizi sunt diferenţele de abatere de la media populaţiei raportată la
abaterea standard a distribuţiei populaţiei respective.
a.ADEVĂRAT
b.FALS
9. Conceptul de scor adevărat a fost introdus în psihologie de Cattell in 1963.
a.ADEVĂRAT
b.FALS
10. Formula coeficientului intelectual, prin raportarea vârstei mentale la vârsta cronologică a
fost introdusă de Binet și Simon în 1905.
a.ADEVĂRAT
b.FALS
11. Matricile progresive Raven au marele avataj că eliminâ influenţa factorilor culturali
asupra performanței.
a.ADEVĂRAT

11
b.FALS
12.Rossolimo în 1921 foloseste tehnica petelor de cerneală pentru studiul personalității.
a.ADEVĂRAT
b.FALS

12
Unitatea de învățare 2.
MĂSURAREA ÎN PSIHOLOGIE

1 MĂSURAREA ŞI EVALUAREA

DEFINIŢIE
După numeroşi autori, măsurarea este o operaţie care constă în asocierea, după
anumite reguli, a unor simboluri (de cele mai multe ori numerice), obiectelor,
evenimentelor, sau indivizilor, pentru a evalua gradul în care acestea prezintă anumite
atribute.
După realizarea acestei operaţii, putem califica aceste simboluri ca "rezultate ale
măsurării." Pentru a fi semnificative, simbolurile numerice trebuie să fie însoţite de o unitate
de măsură.

EXEMPLU

În cazul unei mese cu lungimea de doi metri, vom asocia numărul 2 cu termenul
"metru", care este unitatea de măsură utilizată şi care este aplicată de două ori pe lungimea
mesei. Numărul 2 capătă o semnificaţie în virtutea unei relaţii cu o lungime standard care este
metrul.
În cazul măsurării atributelor fizice, interpretarea rezultatelor nu ridică, în mod
obişnuit nici o problemă. Măsurarea atributelor psihologice, cum ar fi , raţionamentul sau
motivaţia, este foarte complexă, existând foarte multe variabile care trebuie definite şi
controlate pentru a obţine un rezultat valabil. De asemeni, în educaţie este dificil să găsim o
unitate de măsură care să fie considerată etalon.

EXEMPLU
Un rezultat de 40 răspunsuri corecte din 50, la o probă de randament, este dificil de
interpretat, deoarece 40 de itemi corect rezolvaţi nu presupune, cu necesitate, un coeficient de
dificultate egal pentru fiecare item.
Deducem din definiţia precedentă că măsurarea presupune un proces de abstractizare.
Dacă asociem simboluri obiectelor sau indivizilor, vom măsura, de fapt, una sau mai multe
dimensiuni dintre toate cele pe care obiectele sau indivizii le posedă. De aceea este important
să studiem natura acestor atribute, înainte de a realiza măsurarea.
Observăm că nu toate atributele sunt în mod necesar măsurabile. Mai mult, o măsură
se poate aplică mai multor atribute, nu numai unuia singur. În acest caz, posibilitatea de a
izola caracteristicile atributului de măsurat este mai redusă, iar informaţiile obţinute vor fi
deseori mai puţin utile.

Utilizarea simbolurilor numerice presupune deci cuantificarea atributelor. Această


cuantificare facilitează cunoaşterea rezultatelor relative, a gradului de prezenţă a acestora, sau
manifestarea unui atribut la un individ. În acest fel obţinem rezultate foarte detaliate şi foarte
precise, neinfluenţate de judecăţi personale, care ne permit să recurgem la modele de analiză
matematică.
Procedeele de obţinere a unei măsurări trebuie să fie explicite. Pentru aceasta există
reguli precise care reglează procedeele de măsurare. Aceste reguli sunt fundamentale în

13
construcţia şi utilizarea unui instrument de măsură, deoarece validitatea lor determină
validitatea instrumentului, şi în consecinţă pe cea a rezultatelor. Nerespectarea acestor reguli
duce la rezultate eronate, instabile şi chiar aberante. Acest ansamblu de reguli permite
cuantificarea, fără echivoc, a atributelor unui obiect sau individ şi reprezintă o măsură
legitimă.

IMPORTANT
Formularea riguroasă a regulilor care permit asocierea simbolurilor numerice unor
atribute, fac ca rezultatele obţinute cu ajutorul unui instrument de măsură să fie
reproductibile. Acesta este un aspect esenţial pentru standardizarea unui instrument de
măsură.
Un instrument de măsură este standardizat dacă toţi utilizatorii obţin rezultate similare.
Această similaritate depinde de invariabilitatea conţinutului măsurat, uniformitatea
procedeelor şi condiţiilor de administrare a instrumentului de măsură şi de constanţa
criteriilor de corectare. Altfel spus, probele aplicate trebuie să fie tot timpul aceleaşi pentru
toţi subiecţii, instrucţiunile clar enunţate, durata şi contextul administrării constant, iar
criteriile de corectare invariabile şi obiective.
În concluzie, măsurarea standardizată permite cuantificarea datelor, o descriere
foarte obiectivă care furnizează informaţii comparabile.

DEFINIŢIE
Cu toate că măsurarea se vrea cât mai obiectivă posibil, evaluarea presupune prezenţa
unor aspecte subiective. Putem defini evaluarea ca fiind o operaţie care constă în a face o
judecată de valoare, sau a acorda o valoare unui obiect sau unei persoane, comparând
obiectul, l sau persoana cu un criteriu dat.
Această operaţiune poate fi aplicată rezultatelor măsurării. Astfel, expresii ca
"excelent", "mediocru", "superior mediei", "succes", "eşec" sunt termeni de evaluare utilizaţi
în educaţie. Trebuie precizat că evaluarea unui rezultat obţinut în urma măsurării, este un
aspect important când rezultatul este dificil de interpretat în absenţa unei unităţi de măsură,
care poate da o semnificaţie rezultatului respectiv.

EXEMPLU care permite înţelegerea distincţiei dintre măsurare şi evaluare. Un


prieten vă informează că bunicul său are 90 de ani. Expresia "90 de ani" sau numărul 90 este
rezultatul unei măsurări. Pentru a asocia numărul 90 buniclui său, prietenul dumneavoastră a
aplicat o regulă precisă care constă în a determina de câte ori o unitate de măsură este
cuprinsă între două momente precise: data naşterii şi momentul în care se face relatarea. Din
contra, dacă prietenul dumneavoastră vă spune că bunicul său este foarte bătrân, el vă
comunică rezultatul unei evaluări.

IMPORTANT
În baza acestui exemplu, putem constata că rezultatul măsurării este obiectiv, nici o
judecată de valoare nu apare, în timp ce rezultatul evaluării este subiectiv. Acesta este unul
din principiile de bază care diferenţiază măsurarea de evaluare.
Se poate obiecta că această distincţie nu este foarte clară, deoarece în toată lumea se
spune că un individ de 90 de ani este foarte bătrân. Avem aici o situaţie foarte frecventă din
viaţa cotidiană, în care rezultatul unei măsurări se înscrie cu uşurinţă în cadrul de referinţă
14
care corespunde experienţei anterioare. Noi cunoaştem unitatea de măsură, anii de existenţă,
şi cunoaştem posibilităţile actuale ale longevităţii umane. Dintre cele două informaţii, una se
referă la unitatea de măsură, iar cealaltă la posibilităţile sau limitele fenomenului studiat, care
permite, foarte des, să se facă judecăţi de valoare unice pe baza rezultatelor măsurării. În acest
exemplu, criteriu care a servit ca bază de evaluare este caracteristic unui ansamblu de indivizi.
Este suficient ca această caracteristică să se modifice pentru ca evaluarea să fie modificată.
Dacă presupunem că durata de viaţă se prelungeşte la 200 de ani, atunci judecata de valoare
"foarte bătrân" nu mai este potrivită pentru o persoană de 90 de ani. Acest exemplu ilustrează
foarte bine caracterul subiectiv al evaluării.
În consecinţă, în educaţie şi psihologie se ignoră foarte frecvent unităţile de măsură şi
limitele fenomenului studiat. Această problemă poate fi rezolvată dacă evaluăm inteligenţa
unui elev, aptitudinile, interesele, calitatea randamentului său şcolar pe baza unui rezultat
măsurabil. Mai mult, deseori, acest rezultat este un număr care indică cantitatea răspunsurilor
bune la un ansamblu de probleme puse în cadrul unui test. Rezultatul de 60 obţinut de un elev
la o probă de randament nu relevă nimic din calitatea elevului şi nici din competenţa sa.
Pentru a putea face o judecată de valoare, trebuie să avem acces la ambele informaţii
(conţinutului probei şi posibilităţile de rezolvare a probei).
Dacă cunoaştem natura problemelor pe care elevul le-a rezolvat în acea probă, vom
putea deduce capacităţile sau abilităţile necesare elevului pentru a rezolva proba. Cunoaşterea
naturii problemelor rezolvate sau a conţinutului probei este un compromis faţă de dificultatea
de a stabili o unitate de măsură sau un standard. Din contră, dacă vom cunoaşte posibilităţile
de rezolvare a probei, prin analiza rezultatelor obţinute de alţi elevi, vom putea elabora o
judecată de valoare ca "excelent", "mediocru", "superior mediei" sau "normal". În acest caz
evaluarea se realizează folosind un criteriu de bază şi caracteristicile unui ansamblu de
elevi.
2. CLASIFICAREA SCĂRILOR DE MĂSURĂ
Problema clasificării scalelor de măsurare este legată de diversitatea utilizării
numerelor (de exemplu numerele pot face referiri la cantităţi dar şi la calităţi). De asemeni,
există tipuri distincte de scale de măsură cu care putem clasifica toate atributele măsurate. În
ştiinţele umaniste, problema clasificării scalelor de măsură, este o preocupare amforă pentru
numeroşi cercetători. Mulţi dintre ei consideră că pentru a înţelege precizia unei măsurări
psihologice trebuie să luăm în consideraţie natura scalei utilizate în cazul unui procedeu de
măsurare.

IMPORTANT: natura scalei de măsurare utilizată determină tipul de interpretare şi


cantitatea de informaţii pe care o putem extrage din rezultatele obţinute cu ajutorul acelei
scale Problema este legată de legitimitatea utilizării unor procedee matematice pentru
măsurarea atributelor umane care se referă la aspecte psihologice.
Primul criteriu de diferenţiere a unui tip de scară, se referă la regulile care determină modul în
care numerele sunt asociate atributelor măsurate. O scală nu are raţiunea de a exista dacă nu
există un izomorfism (corespondenţă) între unele proprietăţi ale atributelor măsurate şi unele
proprietăţi ale seriei numerice.
Proprietăţile sau natura atributelor, utilizarea procedeelor concrete care vizează măsurarea
acestor atribute, sunt factori care limitează operaţiile empirice de bază aplicabile atributelor
măsurate.

15
EXEMPLU
Unui atribut ca sexul indivizilor îi poate fi asociat un număr care are valoare de
etichetă (masculin 1 şi feminin 2) În consecinţă, chiar natura atributului măsurat nu ne oferă
decât posibilitatea unor operaţii empirice de clasificare şi de numărare.
Un al doilea exemplu ne permite să ilustră mai bine influenţa alegerii procedeelor
concrete de măsurare. Să presupunem că, fără să avem un instrument standardizat de
măsurare, dorim să comparăm înălţimea unor indivizi. Operaţiile empirice aplicabile
rezultatelor acestor măsurări se vor limita la a plasa, în ordine, indivizii, după talie. Însă dacă
posedăm un instrument standard, care are la bază unităţi etalon, şi repetăm măsurările,
numărul operaţiilor empirice aplicabile acestor rezultate va fi mult mai mare. În acest fel vom
putea plasa indivizii în ordinea înălţimii, dar vom putea compara şi diferenţele dintre
înălţimile lor şi chiar stabili un raport între înălţimile indivizilor. Din aceste calcule putem
stabili că X este de două ori mai mare decât fiul său Y, constatare pe care nu o putem pune în
evidenţă în absenţa unei unităţi etalon.
Ceea ce caracterizează cel mai bine fiecare tip de scală, este studiul invarianţei.
Aceasta presupune ca transformările fiecărei scale să nu producă distorsiuni ale structurii
acesteia.

EXEMPLU
Dacă vrem să exprimăm datele în unităţi diferite de unităţile de măsură originale, este
necesar să putem efectua această transformare, fără a modifica semnificaţia datelor. Mărimea
invarianţei unei scale stabileşte limitele referitoare la transformările matematice şi statistice
care pot fi legitim aplicate datelor obţinute printr-un procedeu de măsurare. În cazul scalelor
prin care se stabileşte rangul indivizilor, în funcţie de un atribut dat, toate transformările
matematice efectuate asupra acestor date pentru modificarea rangului, falsifică rezultatele şi
în consecinţă acest tip de transformare nu poate fi legitim aplicat la acest tip de scară.

IMPORTANT Fiecare tip de scară de măsurare are anumite implicaţii:


În primul rând, fiecare tip de scală are anumite postulate. Dacă datele obţinute printr-
un anumit procedeu de măsură sunt conforme postulatelor unui anumit tip de scală, măsurarea
va fi considerată ca posedând proprietăţile inerente scalei respective. Niciodată un tip de scală
nu poate face abstracţie de postulatele care îi sunt proprii.
În al doilea rând, cu cât un tip e scală este mai complex, cu atât regulile care
determină asocierea numerelor unor atribute măsurate sunt restrictive şi multe din
informaţiile furnizate de scală sunt precise, ceea ce are efecte asupra reducerii, întinderii
invarianţei scalei respective. Mai mult, postulatele matematice ale unei scale foarte complexe
permit utilizare unui mare număr de operaţii matematice şi statistice.
O altă proprietate majoră a unei scale este aceea de a reflecta atributele măsurate.

EXEMPLU dacă dorim să măsurăm înălţimea elevilor unei clase este necesar să
avem o scală care reflectă acest atribut. Se întâmplă ca multe dintre conceptele ştiinţifice, de
interes pentru cercetător, să poată fi măsurate prin modalităţi rudimentare. Să presupunem că
un cercetător doreşte să obţină un singur număr care să reprezinte agresivitatea unui copil
dintr-o grădiniţă. O metodă ar putea fi utilizarea interviului psihologic clinic şi apoi evaluarea

16
subiecţilor de la 1 la 10 în acord cu mărimea agresivităţii lor. Un aspect foarte important
pentru problema pusă în discuţie este ce atribute matematice generale trebuie să posede scala
de agresivitate realizată pentru evaluarea copiilor de la 1 la 10.
Atributele pe care trebuie să le posede o scală de măsurare sunt: magnitudinea sau
mărimea, intervale egale şi punctul zero.

DEFINIŢII
Când o scală are magnitudine, atunci un anumit atribut poate fi judecat ca fiind mai
mare decât, mai mic decât sau egal cu o altă stare a aceluiaşi atribut. Dacă revenim la
exemplul anterior şi constatăm că un clinician atribuie un scor de 8 pentru subiectul X şi 5
pentru subiectul Y, această scală de măsurare reflectă diferenţele în magnitudine ale
agresivităţii la cei doi subiecţi (subiectul X este mai agresiv decât subiectul Y).
Intervale egale, înseamnă că magnitudinea unui atribut reprezentat de o unitate de
măsură pe o scală este egală, indiferent de locul unde este plasată unitatea pe scală. De
exemplu, în cazul măsurării înălţimii în cm., diferenţa între o persoană care are 160 cm. faţă
de alta care are 161 cm., este aceeaşi ca diferenţa care există între o persoană de 170 cm. şi
alta de 171 cm. Un centimetru reflectă aceeaşi cantitate (de înălţime), indiferent de locul în
care este plasat centimetrul pe scală.
Acest aspect nu este respectat tot timpul. Să luăm exemplul clasamentului realizat la
sfârşitul unui campionat de fotbal. Diferenţa dintre echipa plasată pe locul întâi şi cea de pe
locul doi este de un loc, aceeaşi diferenţă existând şi între echipa plasată pe locul doi şi cea de
pe locul trei. Dar în acest caz nu putem spune că 1 - 2 = 2 - 3, aşa cum am stabilit în cazul
diferenţelor de înălţime.

DEFINIŢIE
Punctul zero absolut, este valoarea care indică faptul că atributul care trebuie măsurat
nu are nici o valoare (mai bine spus are valoarea zero).
Zero pentru înălţime este o valoare a scalei care presupune lipsa înălţimii. În cazul
măsurării agresivităţii, cea mai mică notă pe care psihologul o poate atribui este 1. Această
valoare nu indică inexistenţa tendinţei agresive. Un copil care primeşte nota 1 poate să
lovească uşor un alt copil sau să-l jignească verbal, ocazional. Copilul are un nivel mic al
agresivităţii, dar într-un sens relativ. Chiar dacă valoare zero ar fi o parte componentă a scalei
această nu presupune inexistenţa totală a agresivităţii. Această scală de evaluare a agresivităţii
nu are zero absolut.

APLICAŢIE
Dați exemple de atribute care nu posedă zero absolut și de atribute la care zero absolut
se stabileste convențional.

3. SCALA NOMINALĂ.
Acest tip de scală este cunoscută şi sub denumirea de scală calitativă, scală
categorială sau scală de clasificare.
Forma cea mai simplă de observaţie constă în a stabili dacă două obiecte au doi
indivizi sunt calitativ asemănători sau diferiţi prin răspunsurile lor la o situaţie dată, sau când
prezintă una sau mai multe proprietăţi date. Vom putea astfel grupa proprietăţile sau indivizii

17
în funcţie de una sau mai multe caracteristici comune. Este suficient să precizăm criteriile
utilizate pentru includerea obiectelor sau indivizilor într-o clasă sau categorie. Apoi, după ce
acest criteriu a fost stabilit şi s-a realizat repartiţia în clase, putem denumi clasa respectivă
pentru a desemna obiectele sau indivizii incluşi în acea clasă. Numele clasei poate fi un număr
sau un cuvânt.
Ţinând seama de procedura de clasificare, rigoarea de discriminare depinde de
capacitate de observaţie a evaluatorului şi de marja de imprecizie care este tolerată. În ştiinţele
umane, când vorbim de egalitate dintre indivizii unei clase, vom spune că acesta este
aproximativ egală în funcţie de complexitatea comportamentului uman şi de imprecizia
relativă a mijloacelor de observaţie.

IMPORTANT
Operaţiile de clasificare şi enumerare sunt folosite în producerea unei scale nominale. Un caz particular de
clasificare este cel în care o clasă sau categorie cuprinde un singur obiect sau individ. Numele acestei clase devine o
etichetă atribuită acelui obiect sau individ.
În cazul în care simbolurile numerice sunt atribuite indivizilor, aceste simboluri nu
reprezintă cantităţi de atribute şi nu putem vorbi de posibilităţi de utilizare a matematicii sau
statisticii, ci doar de obţinerea unor informaţii calitative. Putem avea doar o corelaţie
accidentală între aceste numere şi atribuitele respective, dar acesta nu poate fi obiectul unei
interpretări referitoare de sensul legăturii. Singurele operaţii statistice posibile cu aceste date
nominale sunt calculul frecvenţelor (numărul de cazuri din fiecare categorie), identificarea
modulului (categoria cu cei mai mulţi indivizi), calcului coeficientului de cotingenţă
(verificare ipotezei referitoare la distribuţia cazurilor în categorii, evaluarea interdependenţei a
două principii de clasare).
Aceste operaţii statistice sunt realizabile şi la scalele de măsurare mai complexe.
Trebuie să facem distincţia între utilizarea numerelor în scopul identificării unei clase şi
utilizarea numerelor care reprezintă frecvenţa obiectelor sau indivizilor dintr-o clasă sau
categorie. În primul caz, (identificarea unei clase), utilizarea numerelor nu este o măsurare ci
un indiciu, la care se respectă postulatele 1,2 şi 3. Mulţi autori consideră că scara nominală nu
este decât o formă de clasare. În acelaşi timp, majoritatea autorilor consideră că operaţiile de
clasare corespund criteriilor de definire a unei măsurări. Putem concluziona că scala
nominală constituie un nivel de măsurare primar. Utilizarea scalelor nominale este limitată
în ştiinţele umane şi nu furnizează indicaţii asupra amptitudinii atributelor.

EXEMPLU de scală nominală este scală utilizată pentru diferenţierea tipurilor temperamentale.
(coleric, sanguinic, flegmatic şi melancolic). Dacă considerăm că fiecare individ poate fi plasat doar într-unul din
cele patru tipuri enumerate, atunci aceste tipuri reprezintă mulţimea categoriilor sacalei nominale.
Uneori, pentru ca scala să îndeplinească condiţia de exhaustivitate, se introduce şi
categoria "alte situaţii", "şi alţii" etc. Pentru eficienţa cercetării această categorie specială
trebuie să nu includă o parte semnificativă a populaţiei studiate, fapt care ar diminua relevanţa
rezultatelor.
În operaţiunea de culegere şi prelucrare a datelor, se recurge frecvent la codificarea
acestora. Prin codificare se înţelege transformarea unei mulţimi de obiecte, date, itemi, dintr-o
formă sistematică de prezentare într-o altă formă. De exemplu tipul coleric = 1, tipul
sanguinic = 2, tipul flegmatic = 3, iar tipul melancolic = 4.
Aceste coduri, utilizate în scala nominală trebuie considerate simple simboluri,
proprietatea lor de a fi diferite între ele permite discriminarea categoriilor.

18
Trebuie menţionat faptul că între categoriile unei scale nominale nu există relaţii de
ierarhie, ordinea prezentării fiind indiferentă.
Să presupunem că doi cercetători, în investigaţii independente, au obţinut următoarele
rezultate:

TIP Nr. SUBIECŢI Nr. SUBIECŢI


TEMPERAMENT CERCETAREA 1 CERCETAREA 2
1 32 58
2 48 73
3 37 80
4 33 39
TOTAL 150 250
Menţionăm că în coloana din stânga avem coduri, etichete lipsite de semnificaţie
cantitativă în timp ce numerele din celelalte două coloane posedă această semnificaţie.
Ansamblul numerelor din coloana a doua şi a treia poartă numele de distribuţie a tipurilor
temperamentale în grupurile studiate.

IMPORTANT

Fiecare număr reprezintă frecvenţa absolută a unei categorii din scală.


Compararea rezultatelor celor două cercetări ne conduce la constatarea că a doua
cercetare prezintă valori mai mari la fiecare categorie. Această constatare nu are valoare
ştiinţifică deoarece al doilea grup de cercetare este mai numeros decât primul, şi este normal
ca frecvenţele să fie mai mari.

IMPORTANT
Pentru o comparaţie relevantă trebuie să utilizăm frecvenţele relative. Frecvenţa relativă
pentru o categorie se obţine prin împărţirea frecvenţei absolute la numărul total de subiecţi.
Prin înmulţirea frecvenţei relative cu 100, obţinem procente.
Comparaţiile efectuate după frecvenţele relative, sau procente capătă substanţă,
deoarece măsurătorile realizate pe eşantioane de mărimi diferite sunt aduse la un sistem de
raportare comun, ceea ce permite comparaţii.
Trebuie să se ţină seama de faptul că frecvenţele relative sunt sensibile la volumul
eşantionului. Astfel, 5 cazuri din 10 reprezintă 50%, în timp ce 6 cazuri din 10 reprezintă 60%
din totalul cazurilor. Diferenţa de unu între frecvenţele absolute se reflectă într-o diferenţă de
10 între procente. Dacă volumul eşantionului ar fi fost 100, atunci 5 şi respectiv 6 cazuri ar fi
reprezentat 5% şi respectiv 6%. Observăm diferenţa mai mică între procentaje, datorată
mărimii eşantionului. Din punt de vedere practic, acest aspect impune raportarea numărului
total de cazuri atunci când se folosesc frecvenţe relative sau procente.
Operaţii asupra categoriilor unei scale nominale
Asupra categoriilor unei scale nominale se pot efectua două tipuri de operaţii:
gruparea (condensarea) şi rafinarea (diversificarea.).
Gruparea este acea operaţie prin care din două sau mai multe categorii se obţine o
singură categorie care va purta o etichetă nouă, distinctă de celelalte. Prin grupare o scală
nominală cu n categorii se transformă într-o scală nominală cu m categorii, unde m  n.

19
Rafinarea este operaţia prin care dintr-o categorie se obţin două sau mai multe
categorii noi, etichetate distinct. În acest fel o scală cu n categorii se transformă într-o scală cu
m categorii, unde m  n.
Asupra aceleaşi scale se pot efectua consecutiv ambele operaţii. Aceste operaţii
corespund necesităţilor practice de analiză şi sinteză, generalizare şi particularizare etc.
Aceste operaţii nu pot fi efectuate în mod arbitrar, în cazul unei scale nominale
concrete, responsabilitatea transformării revenind cercetătorului, care trebuie să respecte
exigenţele de conţinut şi cele formal logice.
Scala nominală care cuprinde categoriile de comunicare a lui Bales, permite plasarea
comunicărilor într-un grup în funcţie de rolul comunicării într-o discuţie. Clasificarea
furnizează informaţii despre dinamica comunicării, raportul dintre participanţii la discuţia în
grup, mecanismele discuţiei.
Categoriile propuse de Bales sunt:
I. 1. manifestă solidaritate
2. manifestă diminuarea tensiunii
3. manifestă acordul, acceptă pasiv
4. dă o sugestie
5. emite o opinie
6. dă o orientare, o informare
7. cere o orientare, o informare
8. cere o opinie
9. cere o sugestie
10. manifestă dezacordul
11. exteriorizează tensiune
12. manifestă antagonism
Utilizând operaţiile de grupare, această scală se poate transforma, prin condensarea
categoriilor, în felul următor:
II. A. Reacţii pozitive (1, 2 şi 3)
B. Răspunsuri aşteptate (4, 5 şi 6)
C. Întrebări (7, 8 şi 9)
D. Reacţii negative (10, 11 şi 12)
Noua scală cuprinde 4 categorii, fiecare provenind din câte trei ale scalei iniţiale.
Un alt gen de grupare ar putea fi:
III. a. comunicare (6, 7)
b. evaluare (5, 6)
c. influenţă (4, 9)
d. decizie (3, 10)
e. tensiune (2, 11)
f. integrarea membrilor (1, 12)
O altă viziune sintetică a fenomenului studiat poate produce condensări de ordinul doi,
prin gruparea categoriilor din scala II :
IV. i. reacţii emoţionale pozitive (A)
ii. reacţii emoţionale neutre (B, C)
iii. reacţii emoţionale negative (D )
Trecerea inversă, de la scale condensate la scale diversificate (cum ar fi de la scala II
la scala I) se realizează prin operaţii de rafinare, şi este impusă de necesităţi analitice
accentuate.
Prin gruparea excesivă se produce o pierdere de informaţii primare, în timp ce
rafinarea excesivă duce la o acumulare de amănunte care creează dificultăţi în perceperea

20
esenţei problemei studiate. De aici rezultă nevoia păstrării unui echilibru între cele două
situaţii.
Volumul eşantionului este un element important în alegerea numărului de gradaţii
pentru o scală nominală. Un eşantion mic nu se poate studia folosind o scală nominală cu un
număr mare de categorii, iar un eşantion mare printr-o scală cu puţine categorii.
Efectul transformării scalelor asupra distribuţiei datelor unei cercetări concrete este
important. Singurul lucru constant rămâne numărul de membri ai eşantionului. Distribuţia
subiecţilor pe clase se modifică la orice grupare sau rafinare a categoriilor.

INTREBARE
Cum vom proceda atunci când dorim să comparam datele obținute cu ajutorul unei
scale nominale în mai multe investigații independente în care efectivele istudiate sunt diferite?

4. SCALA ORDINALĂ.
Scalele ordinale sunt cunoscute şi sub numele de scale de ordine, scale de rang, scale
ierarhice, şi permit ordonarea observaţiilor, indivizilor, situaţiilor de la mic la mare, de la
simplu la complex, de la mai puţin la mai mult.
Operaţia de enumerare şi clasare în diferite clase sau categorii este omogenă, adică toţi
indivizii sau obiectele unei clase sunt considerate ca fiind echivalente, când printr-un atribut
ei aparţin acelei clase.

IMPORTANT
În interiorul unei clase date, indivizii pot fi comparaţi în funcţie de gradul prezenţei
unui atribut comun. Trebuie să fim preocupaţi de ordinea relativă a obiectelor sau indivizilor.
Realizarea acestei ierarhii se bazează pe evaluarea unui atribut observat, printr-o comparaţie
directă sau indirectă. O scală poate fi obţinută, constatând că un obiect sau individ posedă
atributul într-un grad mai ridicat faţă de obiectul sau individul precedent din serie, ceea ce
poate fi simbolic exprimat astfel:
S1 < S2 < S3.............Sn (pentru n subiecţi)
Operaţiunea de ordonare presupune o discriminare foarte riguroasă faţă de simpla
categorizare, deoarece pentru fiecare obiect sau individ trebuie să stabilim gradul de prezenţă
a unui atribut, ceea ce nu înseamnă că scala indică cantitatea absolută a atributelor
prezente, nici amploarea diferenţelor sau raporturile dintre cantităţile atributelor prezente.

IMPORTANT
Atributul nu se exprimă în mod necesar în unităţi egale, chiar dacă numerele care le
reprezintă sunt la distanţe egale.
Un individ care se situează la rangul patru nu prezintă de două ori mai multe atribute decât cel
care se situează la rangul doi. În fine, scala ordinală nu poate exista în absenţa totală a unui
atribut, ea nu admite deci zero absolut.

21
IMPORTANT
Simbolurile numerice atribuite obiectelor sau indivizilor, sunt ranguri care indică
poziţia relativă a acestora pe un continuum pentru atributul pe care dorim să-l măsurăm, ca în
exemplul de mai jos.

S1 S2 S3 S4 S5 S6

Observăm că într-o scală ordinală direcţia continuumului este cunoscută. Singurele


informaţii cunoscute din acest continuum sunt de tipul "mai mic ca", "mai mare ca", "egal"
sau "diferit" (<;>;=;), între indivizi sau obiecte, în funcţie de atributul măsurat. Acest
continuum reprezentat mai sus ne permite să stabilim că:
S1 < S2; S4 > S3; S3  S5.

IMPORTANT
Datele scalelor ordinale pot fi analizate prin statistici neparametrice.
Se poate recurge la toate operaţiile statistice aplicabile scalelor nominale. Pentru aceste date
putem calcula mediana, centile, coeficienţi de corelaţie a rangurilor şi khi-pătrat. În acelaşi
timp, operaţiile algebrice de adunare, scădere, înmulţire şi împărţire nu au nici un sens dacă
sunt aplicate acestor date. Nu putem calcula media şi abaterea standard care ne oferă
posibilitatea de a cunoaşte mai mult decât poziţia relativă a obiectelor sau indivizilor. Aceasta
este o limită importantă a informaţiilor care pot fi furnizate de o scală ordinală, deoarece
media sau abaterea standard reprezintă fundamentul metodelor statistice utilizate în ştiinţele
umane. Relaţiile funcţionale stabilite pe baza scalelor ordinale ne oferă un indice, mai mult
sau mai puţin satisfăcător, în comparaţie cu relaţiile exprimate de alte scale mult mai
complexe.
Mulţi autori consideră că scalele de măsurare psihologice furnizează informaţii despre
ordinea indivizilor, în funcţie de atributul măsurat sau asupra gradului la care fiecare individ
prezintă acel atribut. Aceşti autori aduc critici severe legate de utilizarea metodelor statistice
puternice în analiza datelor psihologice şi recomandă o mare prudenţă în interpretarea datelor
obţinute cu ajutorul scalelor ordinale.
Crearea unei scale ordinale presupune, stabilirea unei relaţii de ordine între valorile
posibile ale variabilei studiate.

EXEMPLU
J. Piaget oferă modelul unei scale după criteriul slab structurat - înalt structurat, prin care
evaluează stadiul dezvoltării inteligenţei la copil.
Stadiul 1 exersarea reflexelor
Stadiul 2 reacţia circulară primară
Stadiul 3 reacţiile circulară secundare

22
Stadiul 4 coordonarea schemelor secundare şi aplicarea la situaţii noi
Stadiul 5 reacţia circulară terţiară şi descoperirea de mijloace noi prin
experimentare activă
Stadiul 6 inventarea unor mijloace noi de acţiune prin combinare mentală
Ordinea prezentată este de la simplu la complex. Utilizând această scală putem
caracteriza manifestările unui copil în funcţie de stadiul pe care l-a atins în dezvoltare. Dacă
subiectul A este pasat în stadiul 1, subiectul B în stadiul 2, iar subiectul C în stadiul 3, atunci
putem face afirmaţia că subiectul C are posibilităţi operatorii mai mari decât B sau C. Dar,
caracteristicile scalei ordinale nu ne permit să precizăm cu exactitate cu cât este mai complex
C faţă de B sau faţă de A şi nici să comparăm diferenţa dintre C şi B cu cea dintre B şi A.

5. SCALELE DE INTERVALE EGALE


Aranjarea ordinală poate da rezultate foarte complete dacă cunoaştem distanţa care
separă obiectele sau indivizii în funcţie de atributul măsurat. Dacă mai multe obiecte sau
indivizi sunt la distanţe egale, în funcţie de gradul pe care îl prezintă atributul, distanţa care le
separă poate fi considerată ca o unitate liniară de măsură şi scala constituită în acest fel se
numeşte scală cu intervale egale sau scală de intervale.
Egalitatea dintre intervale este necesară dacă dorim să cunoaştem diferenţele
interindividuale (diferenţele dintre indivizi referitoare la un atribut, pe un singur continuum)
sau diferenţele intra-individuale (diferenţele dintre poziţia unui individ în funcţie de mai
multe atribute pe mai multe continuumuri). O unitate reprezintă un aspect arbitrar, dar care
poate avea o relaţie cu atributul pe care dorim să-l măsurăm. Distanţele numerice egale
reprezintă, în principiu distanţele empirice egale între obiecte sau indivizi, în funcţie de
atribut.
Se poate ajunge deseori la formularea unor enunţuri ştiinţifice în legătură cu
diferenţele dintre gradele la care obiectele sau indivizii prezintă un atribut. Sensul enunţurilor
formulate presupun o proprietate care se juxtapune obiectelor sau indivizilor, adică gradele de
prezenţă a unui atribut pot fi supuse operaţiilor de adunare şi scădere. Dacă această proprietate
este satisfăcută atunci avem o scală denumită "aditivă".
Unele scale aditive oferă posibilităţi limitate de măsurare dacă zero absolut nu poate fi
stabilit. De asemeni, scalele cu intervale egale permit măsurarea diferenţelor dintre gradele de
prezenţă a atributelor, dar nu indică amptitudinea absolută a acestor grade, deoarece ele nu
admit zero absolut. Ele presupun existenţa unui punct zero definit arbitrar. Zero nu este decât
ceva arbitrar într-o scală de interval, gradul de prezenţă a unui atribut care defineşte punctul
zero are puţine şanse să corespundă unei limite reale la care atributul dispare complet.

IMPORTANT
Din această cauză este imposibil să stabilim proporţii pe baza gradelor de prezenţă a
unui atribut exprimat pe o scală de intervale egale.
În acelaşi timp, considerăm că distanţele pe o scală de intervale egale au proprietatea
de adiţionare, ceea ce presupune existenţa unui zero absolut.

DEFINIŢIE
Două enunţuri principale pot defini scalele cu intervale egale:
S1 < S2 < S3.............< Sn
S2 - S1 = S3 - S2 =S4 - S3.................Sn -Sn - 1
unde S1..........Sn sunt grade relative la care un atribut se prezintă pentru diferiţi subiecţi.

23
Scala de interval ne permite să cunoaştem direcţia unui continuum, dar şi stabilirea
diferenţelor între poziţiile obiectelor sau indivizilor, precum şi efectuarea unor operaţii de
tipul celor prezentate mai jos.
1 2 3 4

S1 S2 S3 S4 S5 S6 S7 S8 S9 S10 S11

Acest continuum de intervale egale ne permite să stabilim că diferenţa dintre


rezultatele (R) a indivizilor 1 şi 2 este mai mică decât diferenţa dintre rezultatele indivizilor 2
şi 3. Se observă că dacă diferenţa dintre rezultatele indivizilor 2 şi 3 este de 1,5 în timp ce
diferenţa dintre rezultatele indivizilor 1 şi 2 sau 3 şi 4 este de 1.
Scorurile unei scale de interval nu indică amptitudinea absolută a unui atribut din
cauza absenţei unui zero absolut, iar operaţiile de înmulţire şi împărţire nu au sens decât dacă
ele se aplică intervalelor nu şi scorurilor. Însă operaţiile de adunare şi scădere sunt aplicabile
atât intervalelor cât şi scorurilor.
Scorurile dintr-o scală de intervale pot fi supuse unei transformări liniare, fără ca
structura scalei să se modifice. Putem aduna sau scădea la fiecare scor o valoare constantă,
sau putem împărţi sau înmulţi fiecare scor printr-o constantă, fără a afecta nici poziţia relativă
a obiectelor sau indivizilor pe un continuum, nici egalitatea intervalelor, nici raporturile dintre
intervale, nici forma generală a relaţiilor dintre scorurile scalei faţă de o altă scală.

IMPORTANT
Scalele de intervale oferă, pe lângă posibilitatea operaţiilor statistice specifice scalelor
mai puţin complexe, calculul mediei abaterii standard, coeficientul de corelaţie Pearsons
recurgerea la teste de semnificaţie (F; t) şi folosirea unor numeroase tehnici statistice
puternice.
Din acest motiv este de dorit să utilizăm scala de intervale egale în ştiinţele umane:
Dar concepte ca inteligenţa, aptitudinile şi personalitatea nu pot fi măsurate decât cu
scale ordinale deoarece acestea nu răspund exigenţelor scalelor de măsurare mai complexe. În
consecinţă, singurele operaţii statistice acceptate legitim cu acest tip de date sunt cele
specifice scalelor ordinale. Cercetarea în ştiinţele umane recurge, cu mare frecvenţă la analize
statistice puternice. Această situaţie a determinat numeroase dezbateri printre cercetători
purtate asupra legitimităţii de a considera atributele umane ca putând fi exprimate în unităţi
egale. De fapt, înainte de a analiza rezultatele unei scale de măsurare, în conformitate cu
posibilităţile pe care ni le oferă scalele de intervale, este important să stabilim empiric
egalitatea intervalelor scalei respective. În cazul în care utilizăm mai multe metode de
măsurare, este posibil să determinăm procedeul de operare potrivit, dacă unităţile sunt egale
sau nu. Alegerea acestor operaţii se efectuează în funcţie de variabila analizată şi de
concepţiile teoretice referitoare la natura variabilei respective.
Diferite tehnici permit controlul dificultăţilor legate de alegerea scalei şi se va proceda
într-un anumit fel dacă postulatele corespunzătoare utilizării unei scale de intervale egale sunt
satisfăcute.
O primă tehnică constă în utilizarea unei singure definiţii operaţionale pentru atributul
măsurat. Acesta presupune să nu definim variabile decât în funcţie de rezultatele obţinute la

24
un test. Ele reprezintă deci, în mod cert, puritate matematică, dar ele pot conduce la erori de
interpretare conceptuală.
O a doua tehnică constă în a transforma rezultatele brute în scoruri derivate, care sunt
ele însele exprimate într-o scală de intervale egale.

6. SCALELE DE PROPORŢII SAU DE RAPORT


Această scală, care se aplică măsurătorilor fizice este o scală numerică. În măsurarea
unui atribut, zero absolut indică absenţa atributului la un obiect sau individ. O scală de
proporţii poate fi stabilită pentru un atribut, care la primă vedere, nu prezintă posibilitatea
absenţei totale, când putem respinge existenţa unei relaţii funcţionale între acel atribut şi un
alt atribut sau fenomen care posedă proprietatea de adunare (adică zero absolut).

EXEMPLU
Dacă putem vorbi de absenţa totală a căldurii, vom putea tot timpul verifica existenţa
unei relaţii funcţionale între căldură şi modificările termice. Absenţa totală a variaţiilor
termice corespunde unui zero absolut pentru temperatură (zero grade Kelvin).
Această procedură nu se poate aplica în toate situaţiile, mai ales în cazul atributelor
psihologice.

IMPORTANT
O caracteristică a unei scale de proporţii constă în posibilitatea de a cunoaşte distanţa între
zero absolut şi poziţia unui obiect sau individ pe un continuum definit pe baza unui atribut
dat. Amptitudinea absolută a unei cantităţi dintr-un atribut este o dată cunoscută şi este posibil
să cunoaştem poziţia unui scor individual fără a fi necesar să situam alţi indivizi sau obiecte
pe acest continuum. Numerele reprezintă deci, într-o formă reală gradul prezenţei unui atribut
la un individ sau la un obiect.
Mai mult, ca şi pentru scalele mai puţin complexe, direcţia continuumului este
cunoscută, şi de asemenea rangul indivizilor în funcţie de un anumit atribut, precum şi
mărimea intervalelor dintre scoruri, intervale care sunt evident egale. Scala de raport este deci
o scală care dă informaţii foarte complete.
1 2 3 4

0 1 2 3 4 5 6 7 8 9 10

Putem compara poziţiile indivizilor pe continuum dar, în acelaşi timp, putem stabili că
individul 2 prezintă dublul gardului atributului prezent la individul 1, individul 3 prezintă de
3,5 ori gradul atributului individului 1, iar individul 4 prezintă de 4,5 ori gradul atributului
individului 1.
Dacă înmulţim sau împărţim scorurile unei scale de proporţii printr-o constantă, scala
îşi conservă proprietăţile, ordinea indivizilor sau obiectelor rămân aceeaşi, proporţiile dintre
intervale şi dintre scoruri rămân neschimbate, punctul zero este tot timpul prezent.

25
Din potrivă, dacă adunăm sau scădem o constantă din scorurile scalei, natura scalei se
modifică. Ordinea obiectelor sau indivizilor şi proporţiile dintre intervale rămân aceleaşi, dar
proporţiile dintre scoruri sunt modificate, iar zero absolut dispare.
Constatăm că informaţiile furnizate de o scală sunt cu atât mai precise, cu cât este mai
mică libertatea de a transforma scala fără a modifica informaţiile originale. O scală ordinală,
de exemplu, poate suporta toate transformările monotone fără ca informaţiile primare să fie
modificate. La o scală de intervale posibilităţile de transformare sunt mult mai restrânse. În
sfârşit la scalele de proporţii transformările permise sunt limitate la înmulţirea şi împărţirea
printr-o constantă dacă dorim ca informaţiile să rămână identice.
Postulatele unui model de scală de proporţii permit utilizarea tuturor operaţiilor
aritmetice (+, -, x, ), atât cu intervalele cât şi cu scorurile. Posibilitatea utilizării celor patru
operaţii autorizează folosirea metodelor de analiză matematică şi statistică foarte puternice,
incluzând faţă de operaţiile permise de scalele mai puţin complexe şi calculul coeficientului
de variaţie.
Dacă corectăm un test şi adunăm numărul itemilor rezolvaţi corect, obţinem un număr
situat pe o scală de proporţii. Dar, dacă utilizăm acest număr pentru a indica poziţia
subiectului pe o scală care măsoară un atribut psihologic, atunci acest număr nu poate fi
interpretat pe baza regulilor unei scale de proporţii. Astfel, inexistenţa unor răspunsuri corecte
(ceea ce însemnă zero răspunsuri corecte) nu corespunde absenţei totale a atributului
psihologic măsurat.

EXEMPLU
Un scor zero la un test de randament lexical nu implică că abilităţile de lectură sunt nule. Mai mult, 50
de itemi corect rezolvaţi, dintr-un test, nu corespunde dublului gradului unui atribut pentru care s-au rezolvat 25
de itemi din acelaşi test. Noi nu putem spune că un subiect care are un QI de 130 are o inteligenţă dublă faţă de
un subiect care are un QI de 65. De asemeni, nu putem vorbi de un QI nul, deoarece zaro absolut nu există în
măsurarea atributelor psihologice.
Atributele psihologice nu permit aplicarea procedeului de stabilire a unei relaţii
funcţionale între două atribute deoarece acestea nu prezintă posibilitatea absenţei totale.
Scalele de proporţie nu sunt convenabile măsurării atributelor psihologice.

7. CLASIFICAREA DATELOR OBŢINUTE PRIN MĂSURARE


Observaţiile obţinute printr-un procedeu de măsură pot fi fie constante ale unui
individ sau altul, sau a unor situaţii diferite pentru acelaşi individ, fie variabile.
Variabilele sunt cantităţi de un anumit tip care pot lua mai mult decât o singură
valoare. Acestea pot fi neordonate (exemplu: sexul) sau ordonate (exemplu: aşezarea în
ordine a scorurilor obţinute la un test de randament). Variabilele ordonate pot fi negraduate
(exemplu: bun, rău, slab) sau graduate (exprimate cu ajutorul scorurilor numerice).
Variabilele graduate pot fi continue (există posibilitatea de a lua toate valorile numerice
inclusiv fracţii, de exemplu: temperatura, greutatea) sau discrete (scorurile nu pot avea decât
valori întregi, de exemplu: numărul de indivizi dintr-o categorie sau numărul copiilor dintr-o
familie). Variabilele dihotomice sunt cele care nu pot lua decât două valori, de exemplu 0 sau
1. Acestea sunt cazuri particulare ale variabililor discrete.
Constanta este o cantitate a cărei valoare rămâne neschimbată indiferent de context.

8. MĂSURAREA ŞI STATISTICILE
Termenul de statistică este frecvent utilizat dar este util să stabilim câteva distincţii în
legătură cu folosirea acestuia în teoria psihometrică. Distingem o diferenţiere între statistica
inferenţială şi cea descriptivă. Prima vizează producerea unor enunţuri probabiliste în
legătură cu valorile obţinute de subiecţii unor eşantioane din populaţie. A doua se limitează la

26
descrierea diverselor aspecte ale unui ansamblu de date empirice. Analizele matematice
referitoare la măsurarea tendinţei centrale, a dispersiei sau a corelaţiilor pot duce la descrierea
unui ansamblu de date empirice ale unui eşantion mai mare sau mai mic. Într-o etapă
ulterioară putem aplica acestor date descriptive un ansamblu de tehnici statistice inferenţiale
(calcului intervalului de confidenţă, teste de semnificaţie) care permit extinderea datelor
obţinute prin investigarea eşantionului la ansamblul populaţiei studiate.

IMPORTANT
În psihologie, problema eşantionării se referă pe de o parte la eşantionarea subiecţilor dar
pe de altă parte la eşantionarea conţinutului (a itemilor unui test).
Trebuie să facem distincţie între aceste două forme de eşantionare. Putem concepe un
ansamblu de itemi a unui test ca un eşantion a unei populaţii ipotetic infinite de itemi
(universul itemilor) care măsoară aceeaşi trăsătură. Teoria măsurării este preocupată de
relaţiilor statistice între scorurile obţinute la test şi scorurile ipotetice adică, scorurile care ar
putea fi obţinute dacă toţi itemii din universul de itemi ar fi utilizaţi pentru testare. După ce un
instrument de măsură a fost construit şi când el face obiectul unor cercetări empirice, este
important să realizăm analize statistice (inferenţiale) pentru generalizarea datelor obţinute pe
eşantioane de subiecţi, la populaţia corespunzătoare. În construcţia unui instrument
preocuparea principală este examinarea posibilităţilor de extindere la populaţia de itemi a
rezultatelor obţinute cu ajutorul eşantionului de itemi. În consecinţă, este imposibil să ţinem
seama în acelaşi timp, în analize statistice, de cele două aspecte ale eşantionului. O manieră
tipică de rezolvare practică a acestei probleme este de a ţine seama, în mod explicit, de unul
din cele două dimensiuni şi considerând că cealaltă dimensiune poate eventual să influenţeze
rezultatele.
Există posibilitatea să se rezolve această problemă într-o manieră mult mai sigură.
Putem folosi un eşantion foarte mare, fără a fi preocupaţi de erorile de eşantionare decât în
raport cu celălalt eşantion. În psihometrie când construim un instrument de măsură utilizăm
un eşantion de subiecţi suficient de mare pentru ca eroare de eşantionare referitoare la indivizi
să fie puţin importantă. Problema reprezentativităţii eşantionului de subiecţi fiind rezolvată,
reprezentativitatea eşantionului conţinutului va deveni preocuparea centrală.
Un eşantion de subiecţi relativ restrâns nu este suficient pentru un studiu de validitate
pentru noul instrument. Mai mult, dacă eşantionul de subiecţi este suficient de mare, atunci
precizia testului va fi independentă de numărul de subiecţi din eşantion şi va fi legată direct de
conţinutul testului adică de numărul de itemi.

9. CUNOAŞTEREA PERSOANEI ŞI ASPECTELE MĂSURĂRII


În ştiinţele umane măsura nu se aplică direct indivizilor ci, diferitelor caracteristici ale
acestora la care se face referire printr-o terminologie variată. Când vorbim de atribut, de
proprietăţi sau de trăsătură, facem referire la o particularitate care este prezentă şi se manifestă
în diferite grade la indivizii unei clase date, acestea nefiind în mod necesar prezente la toţi
indivizii. Problema este de a cunoaşte dacă un individ posedă unele proprietăţi.

IMPORTANT
În cazul unei proprietăţi care se referă la abilitatea unui individ sau la personalitatea sa,
măsurarea se referă la comportamentele observabile şi măsurabile. Această proprietate este o
construcţie, un concept care se referă la un aspect precis al individului şi din care putem
extrage un ansamblu de comportamente, pe care îi vom considera indicatori ai proprietăţii
respective.

27
Acest concept căruia îi atribuim un nume (perseverenţă, inteligenţă, autoritarism, etc.) nu
există în afara indivizilor. Pentru a fi raţional este necesară o coerenţă cu acele
comportamentele observate, cu organizarea şi structurarea lor. Pe baza observaţiilor
indicatorilor unei proprietăţi a trăsăturii vom putea presupune prezenţa, într-o măsură mai
mare sau mai mică a proprietăţii, la un individ iar această presupunere implică formularea
unuia sau mai multor postulate sau o demonstraţie pentru stabilirea unei relaţii între
proprietăţi şi manifestările sale (indicatori comportamentali).
Un concept poate fi definit în două feluri, fie cu ajutorul altor concepte (definiţie
teoretică sau constitutivă) fie cu ajutorul procedeelor experimentale (definiţie empirică sau
operaţională). Dacă unele trăsături se pretează la definiţii relativ clare şi precise (aptitudine
numerică, aptitudine verbală, etc.) altele sunt foarte ambigue şi mai imprecise (onestitate,
impulsivitate, etc.). În cazul în care presupunem că o proprietate poate fi măsurată cu ajutorul
unor indicatori, atunci proprietatea respectivă face obiectul unei definiţii operaţionale
riguroase în care trebuie precizate activităţile şi operaţiile la care se recurge pentru a putea fi
supuse procedeului de măsurare.
Cercetătorii caută în mod obişnuit izolarea unei proprietăţi. În acest fel ei limitează
observaţiile directe şi indicatorii la categoria de comportamente pertinente studiului lor,
pentru a stabili indicatorii proprietăţii. Valoarea inferenţei prin utilizarea unui procedeu de
măsurare este dependent de natura observaţiilor, care sunt în funcţie de interacţiunea anumitor
factori. Caracteristice naturale ale proprietăţii, teoria care o susţine, natura instrumentelor de
măsură, şi experienţa cercetătorului sunt factori care determină tipul de observaţie (direct sau
indirect) şi în acelaşi timp veridicitatea cazurilor observate. Dar ştiinţa vizează stabilirea
consensurilor propriilor enunţuri referitoare la conceptele pe care le dezvoltă şi este important
ca observaţiile să poată fi reproduse. Din acest motiv condiţiile observaţiilor, timpul, locul şi
circumstanţele trebuie precizate. De asemenea, procedeul de măsurare trebuie să poată fi
refolosit şi rezultatele să fie verificabile. Mai mult, valoarea observaţiilor în ştiinţele umane,
este limitată de diferite surse de eroare, rezultatele măsurării fiind doar estimări ale
indicatorilor proprietăţii studiate. Precizia rezultatelor permite evaluarea valorilor observate, a
intervalelor “de confidenţă” în interiorul cărora valorile studiate au o probabilitate dată.
Pentru a elimina lacunele observaţiilor trebuie să elaborăm un instrument de măsură
care să permită evaluări cât mai precise ale indicatorilor. Elaborarea acestor instrumente
presupune o bună înţelegere a conceptelor. Primele baze de identificare a unei proprietăţi pot
fi imperfecte datorită limitelor observatorului şi a conceptelor eronate despre proprietatea
respectivă. În cursul elaborării unei măsurări numeroase schimbări sunt făcute asupra
conceptelor legate de proprietatea măsurată. Primele estimări sunt grosiere şi posedă multe
erori. Cercetătorul poate perfecţiona scala de măsurare prin determinarea relaţiei existente
între proprietatea măsurată cu ajutorul scalei şi alte proprietăţi. În acest fel, măsurarea devine
mai rafinată dacă în timp se achiziţionează noi cunoştinţe.
Realizarea unor instrumente la care erorile de măsurare să fie cât mai mici şi care să
permită înregistrarea cât mai obiectivă a manifestărilor unei proprietăţi este mai mică în
domeniul psihologiei. De fapt, constatăm că nici măsurătorile fizice nu sunt perfecte. Simplul
fapt de a face o măsurare, în care intervine un observator şi folosirea unui instrument de
măsură afectează rezultatele. Dacă metodele respective permit eliminarea, într-o măsură mai
mare sau mai mică, a efectelor procedeului de măsurare, rămâne tot timpul o interacţiune
nedeterminată între subiect şi observator.
Faptul că măsurarea presupune o eroare afectează certitudinea în stabilirea unei relaţii
cauzale. Concepţiile moderne de măsurare substituie modelului convenţional “cauză - efect”,
enunţuri relative asupra probabilităţii de manifestare a unui eveniment sau interacţiunilor
dintre observaţii. În statistică, proprietatea este măsurată în funcţie de acumularea unor
evenimente (media) şi variaţia acestora (varianţă).

28
TEST DE AUTOEVALUARE (cu răspunsuri corecte ataşate la finalul cursului)
Apreciați valoarea de adevăr a următoarelor afirmații:
1. Pe baza observaţiilor indicatorilor unei proprietăţi a trăsăturii vom putea presupune
prezenţa, într-o măsură mai mare sau mai mică a proprietăţii, la un individ:
a.ADEVĂRAT
b.FALS
2. Inteligenţa pote fi măsurată doar folosind scale ordinale
a.ADEVĂRAT
b.FALS
3. Dacă o variabilă este continuă atunci între două valori ale acelei variabile pot exista și ale
valori
a.ADEVĂRAT
b.FALS
4. O scală de proporțiit nu posedă zero absolut.
a.ADEVĂRAT
b.FALS
5. Genul subiecților poate fi măsurat cu ajutorul unei scale ordimale:
a.ADEVĂRAT
b.FALS
6. Valoarea inferenţei prin utilizarea unui procedeu de măsurare este dependent de natura
observaţiilor, care sunt în funcţie de interacţiunea anumitor factori.
a.ADEVĂRAT
b.FALS
7. Definiția empirică sau operaționale presupune definirea unui concept cu ajutorul altor
concepte.
a.ADEVĂRAT
b.FALS
8. Variabilele dihotomice sunt cele care nu pot lua decât două sau mai multe valori.
a.ADEVĂRAT
b.FALS
9. Eşantionarea conţinutului se referă la numărul de persoane cuprins într-un eșantion.
a.ADEVĂRAT
b.FALS
10 Dacă folosim o scală de raport determina mărimea absolută a unui atribut.
a.ADEVĂRAT
b.FALS
11. Agresivitatea subiecților poate fi măsutată cu ajutorul unei scale de preoporții.
a.ADEVĂRAT
b.FALS
12. Într-o scală ordinală diferența dintre două valori ale unui atribut rămâne constantă
indiferent de locul unde plasăm această difernță pe scală.
a.ADEVĂRAT
b.FALS
13Dacă un subiect are un QI de 100este de duuă ori mai inteligent comparativ cu un subiect
care alre valoarea QI de 50
a.ADEVĂRAT
b.FALS

29
14. Definiția teoretică sau constructivă presupune definirea conceptului cu ajutorul
procedeelor experimentale
a.ADEVĂRAT
b.FALS
15. Ordinea în care sjunt prezentate categoriile într-o scală nominală este importantă
a.ADEVĂRAT
b.FALS
16. Media și abaterea standard trebuie calculate când folosim o scală ordinale pentru a obtine
o precizie cât mai mare în interpretarea rezultatelor.
a.ADEVĂRAT
b.FALS

30
Unitatea de învățare 3
METODA TESTELOR

1. CONDUITA CA RELAŢIE
Faptul psihologic este o conduită, care implică o schemă de relaţii, pe care le studiază
psihologul. Conduita este manifestarea unei persoane într-o situaţie dată.
Dacă notăm conduita cu R (fideli tradiţiei anglo - saxone, unde R reprezintă iniţiala de la
răspuns sau reacţie), atunci aceasta depinde de personalitatea subiectului (P), care se
confruntă cu o situaţie dată (S).

IMPORTANT
Putem considera conduita în funcţie de personalitate şi situaţie:
R = f(P,S)
În evoluţia psihologiei această relaţie a cunoscut diferite forme în funcţie de
paradigmele explicative la care au aderat cercetătorii.
Watson (1913), a pus bazele paradigmei behavioriste, în centrul atenţiei fiind plasat
studiul comportamentului exterior. Pentru acesta relaţia era de tipul R = f(S), aspectele legate
de personalitatea subiecţilor au fost neglijate deoarece psihologul nu poate pătrunde în
interiorul "cutiei negre".
Woodworth (1929), complică schema de relaţii, sub forma S  O  R, scoţând în
evidenţă rolul organismului, dar se limitează doar la evocarea determinanţilor biologici ai
comportamentului.
Pentru a evita orice confuzie trebuie menţionat faptul că variabilele S, R, P pot fi
studiate la diferite niveluri:
Conduita (R), reprezintă actul subiectului şi are componente endocrine,
neurovegetative, motorii, verbale. Psihologul se poate limita la studii fragmentare, luând în
consideraţie doar o componentă, dar poate cerceta şi relaţiile dintre mai multe componente.
Astfel, o conduită manifestată printr-un răspuns verbal, pate fi analizată din punct de vedere a
structurii gramaticale, a naturii fonemelor, a semnificaţiei sau a efectului produs pentru
interlocutor.
Situaţia (S), pate fi de asemenea analizată la diferite niveluri. Stimulii fizici, care
provin de la diferite surse, acţionează de multe ori asupra subiecţilor, fără ca aceştia să
conştientizeze. Lumina, temperatura, umiditatea, presiunea atmosferică, compoziţia şi gradul
de ionizare a aerului influenţează dispoziţiile şi activităţile oamenilor. Percepţiile nu sunt
simple fotografii ale obiectelor, ele sunt construcţii ale experienţei, sunt influenţate de modul
în care subiectul se raportează la situaţie, de atitudinea acestuia. Situaţia este deci, relativă la
subiect şi este important modul în care subiectul vede situaţia, în funcţie de personalitatea sa.
Din aceste considerente relaţia nu este de tipul R = f (S,P) ci, R = f (S  P), săgeata
dublă indicând că există întotdeauna o interacţiune între S şi P, care nu sunt simple variabile
aditive. Această interacţiune poate fi cunoscută prin interpretarea răspunsurilor subiectului,
care va dezvălui semnificaţia pe care acesta o dă situaţiei.
Personalitatea (P), este o sinteză dinamică de aspecte morfologice şi fiziologice, dar
şi conative, afective, volitive. Cercetătorul trebuie să ţină seama de aceste aspecte şi chiar să
ia în consideraţie şi alte variabile ca: vârsta, sexul, integritatea senzorială, temperamentul,
educaţia primită, motivaţia etc. Personalitatea este în centrul relaţie, ea nu poate fi izolată din
relaţie deoarece se manifestă ca un nod de relaţii între situaţii şi răspunsuri.

2. TIPURI DE RELAŢII ÎNTRE S - P - R


Există trei modalităţi clasice de abordare a acestor relaţii:

31
a. Relaţii funcţionale, utilizate pentru studiul funcţiilor psihice, unde aceeaşi persoană
reacţionează diferit la variabile cantitative şi calitative ale situaţiei.

S1 R1

S2 R2

S3 P R3

Sn Rn

În această figură S1, S2, S3, .....Sn, reprezintă situaţii cărora le corespund diferite
răspunsuri R1, R2, R3, ...Rn.

EXEMPLU
Evoluţia adaptării la întuneric (R) este în funcţie de timp (S), sau volumul materialului
memorat (R) este în funcţie de numărul de repetiţii, sau reacţiile defensive (R) sunt în funcţie
de gradele diferite ale frustrării (S).
b. Relaţii structurale, folosite pentru studiul structurii psihice, unde se studiază
relaţiile dintre răspunsurile obţinute de subiecţi pornind de la situaţii diferite.

S1 R1

S2 R2

S3 P R3

Sn Rn
În acest caz, situaţiilor diferite S1, S2, S3, .....Sn, le corespund răspunsuri diferite R1, R2,
R3, ...Rn. Aici se pune problema de a stabili relaţiile dintre răspunsurile R1, R2, R3, ...Rn,, care
sunt dependente de structura personalităţii. Aceste studii utilizează calcule de corelaţie şi
analiza factorială. Astfel se pot studia relaţiile dintre reacţiile obţinute în diferite situaţii care
produc emoţii sau relaţiile dintre diferite niveluri de eficienţă în sarcini diferite. Logica
acestor studii se bazează pe faptul că dacă obţinem corelaţii ridicate între răspunsurile
subiecţilor la diferite situaţii, înseamnă că există un factor, în structura personalităţii care
justifică aceste corelaţii.

32
EXEMPLU
În acest fel Spearman a obţinut un factor "g" de inteligenţă generală şi mai mulţi
factori "s", consideraţi factori specifici, iar Thurstone mai mulţi factori de grup, printre care
factorul numeric "N", factorul de fluiditate verbală "W", factorul de comprehensiune verbală
"V", un factor perceptiv "P", unul de raţionament "R" (cu două forme raţionement inductiv I
şi deductiv D).
c. Relaţii diferenţiale, folosite pentru studierea diferenţelor dintre indivizi, unde luăm
în consideraţie reacţiile unor persoane diferite la o singură situaţie standardizată.

P1 R1

P2 R2

S
P3 R3

Pn Rn
Diferenţele dintre R1, R2, R3,...Rn, se obţin datorită diferenţelor existente între P1, P2,
P3,...Pn. În acest fel putem studia diferenţele dintre indivizi, dar putem compara şi reacţiile
unor grupuri diferite, în funcţie de anumite caracteristici ca: vârsta, sexul, etnia, nivelul
cultural etc. În cel de al doilea caz putem pune în evidenţă unele aspecte ale personalităţii,
comune în diferite grade, tuturor subiecţilor care aparţin unui grup selectat pe baza unor
criterii dinainte stabilite.

EXEMPLU
Putem studia variaţiile eficienţei subiecţilor în diferite domenii de activitate în funcţie
de experienţa profesională a acestora, evoluţia percepţiilor în funcţie de vârstă şi sex,
asemănările şi deosebirile de mimică emotivă la populaţii care aparţin unor culturi diferite.
Acest tip de relaţie este folosit atât în cazul experimentului cît şi în cel al testului
psihologic, dar cele două aspecte nu sunt identice.

IMPORTANT
În situaţia experimentală, P1, P2, P3, ...Pn, este aceiaşi persoană în stări diferite. Situaţiile interne,
subiective pot fi diferite. De asemeni dacă sunt ingerate anumite substanţe(stimulatoare, deprimante, droguri),
reacţiile sunt determinate de acestea.
În cazul testului P1, P2, P3, ...Pn, sunt persoane diferite. Din aceasta cauză nu mai
avem aceeaşi certitudine în stabilirea relaţiilor dintre fapte şi nici atunci când interpretăm
rezultatele, deoarece situaţia este interpretată diferit de fiecare persoană. În cadrul relaţiilor
S  P, necunoscând perfect persoana nu putem şti care din factorii care acţionează asupra lui

33
P1 determină R1 şi care din factorii care acţionează asupra lui P2 determină R2. Dacă R1 şi R2
pot fi răspunsuri aproape identice P1 şi P2 sunt subiecţi foarte diferiţi.
În concluzie, între experiment şi test există o deosebire de precizie, testul fiind mai
puţin precis decât experimentul. Totuşi, testul rămâne o formă de experiment, pentru că
provocăm o reacţie în condiţii bine determinate ţi obţinem reacţii în aceste condiţii. Şi în cazul
experimentului, chiar dacă aceste se adresează aceloraşi subiecţi, starea acestora se poate
modifica, subiecţii îşi pot schimba atitudinea şi pot interveni factori care ne scapă de sub
control. Pentru a evita erorile, în cazul experimentului vom folosi grupe de subiecţi, şi în acest
fel vom putea verifica dacă rezultatele sunt datorate stimulului şi nu subiectivităţii subiecţilor.
Condiţia care se impune pentru precizie, este ca subiecţii să fie echivalenţi.

3. DEFINIREA TESTELOR
Termenul a fost introdus în psihologie de James McKeen Cattell, psiholog american,
elev a lui Wundtt, care în 1890 denumeşte probele destinate cunoaşterii deosebirilor dintre
indivizi "teste", denumire care s-a păstrat şi astăzi (în engleză "test" înseamnă probă,
încercare, experimentare).

DEFINIŢIE
Lee Cronbach, defineşte testul ca un "procedeu sistematizat de măsură a
comportamentului unor persoane şi de descriere a acestuia cu ajutorul unor scări numerice sau
a unui sistem de categorii", (scări nominale sau ordinale). Pe baza acestei definiţii testul
cuprinde chestionarele, procedee pentru observarea comportamentului social, aparate pentru
măsurarea şi înregistrarea randamentului.
Pentru André Rey, "testul este un mijloc de a diferenţia indivizii în funcţie de un
etalon", iar Anne Anastasi (1976) consideră că "un test psihologic este măsurarea
standardizată şi obiectivă a unei modalităţi de comportament".
Asociaţia internaţională de psihotehnică şi Henri Piéron (1963) definesc testul "o
probă determinată, implicând o sarcină de executat, identică pentru toţi subiecţii examinaţi.
Este o tehnică precisă pentru aprecierea succesului sau pentru notarea numerică a reuşitei".
Definiţia scoate în evidenţă două aspecte importante: folosirea unei probe standardizate şi a
unei tehnici exacte de apreciere a rezultatelor.
P. Pichot observă că aceste definiţii elimină o categorie importantă de "teste" şi anume
"testele" proiective. După el, "testul psihologic este o situaţie standardizată servind drept
stimul unui comportament. Acest comportament este evaluat şi comparat statistic cu cel al
altor indivizi plasaţi în aceeaşi situaţie, ceea ce permite clasarea subiectului fie cantitativ, fie
tipologic". În legătură cu "testele" proiective", în literatura de specialitate se întâlneşte
termenul de "tehnică proiectivă", deoarece aceste "teste" nu sunt suficient de standardizate,
mai ales în privinţa aprecierii şi interpretării rezultatelor. Acesta este motivul care justifică
eliminarea acestora din categoria testelor şi folosirea termenului de tehnică, tocmai pentru a
evidenţia specificul lor.
Ion Holban (1978), defineşte testul ca "instrument al metodei experimentale, organizat
sub forma unei probe standardizate din punct de vedere al conţinutului, al condiţiilor de
aplicare şi al modalităţilor de apreciere a rezultatelor, instrument ce este folosit în stabilirea
unei anumite variabile". Autorul face câteva observaţii importante referitoare la specificul
acestor instrumente de cunoaştere. Testul impune existenţa unei relaţii directe şi specializate
între itemii testului şi variabilele de investigat. Orice test are valoare numai în limitele
diagnosticului variabilei pentru care a fost elaborat. Această relaţie nu este şi inversă, adică
pentru aceeaşi variabilă putem găsi un număr considerabil de teste, mai mult sau mai puţin
apropiate ca structură. De exemplu, multe teste de inteligenţă au fost construite după

34
principiile şi modelul testului elaborat de Binet, cărora li s-a schimbat, după caz, diferite
categorii de itemi.
Andrei Cosmovici, (1996), defineşte testul ca "o probă standardizată, vizând
determinarea cât mai exactă a gradului de dezvoltare a unei însuşiri psihice sau fizice."
Observăm, şi în acest caz accentul care se pune în legătură cu standardizarea, dar şi
determinarea cu ajutorul testelor o performanţelor de care sunt capabile unele persoane
datorită calităţilor fizice pe care le posedă.

IMPORTANT
În psihologie, termenul "test" are două sensnri:
a. Este o probă standardizată din punct de vedere al consemnului (explicarea sarcinilor
de efectuat) şi a modului de corectare, cotare şi interpretare a rezultatelor, acestea fiind fixate
dinainte pentru a evita eventualele variaţii care se pot datora persoanei care aplică, corectează
şi interpretează testul.
b. Este o micro - situaţie, o simulare a unor caracteristici bine definite, în care vom
plasa o persoană cu scopul de a studia modul în care aceasta procedează în raport cu situaţia.
Micro - situaţia reprodusă trebuie să fie cât mai apropiată de situaţia reală din care a fost
extrasă. Roger Mucchielli (1969), consideră că un simulator este "un dispozitiv care
reproduce, dup reguli şi garanţii bine precizate un ansamblu de condiţii reale ale existenţei".
Alţi autori, printre care Sorokin, Whyte (adversari ai metodei testelor), susţin că singura probă
valabilă este realitatea muncii, dacă vrem să judecăm capacităţile unui subiect. Dar ei nu
amintesc de faptul că această manieră de confruntare cu realitatea muncii este o problemă
foarte dificilă, care presupune consumuri considerabile de timp şi material, iar evaluarea
rezultatelor cere observaţii de lungă durată. Acestea sunt motivele care justifică utilitatea
folosirii unor micro - situaţii.
În acest fel, cu ajutorul testului se va extrage dintr-o situaţie concretă, reală un
eşantion de condiţii sau factori, consideraţi semnificativi pentru un anumit tip de
comportament, ignorând aspectele neesenţiale.

X X X X Y Y
1 2 3 4 1 Y 2
X X X X
3
5 6 7 8
Yn-1 Yn
Xm-1 Xm

SITIAŢIA REALĂ SITUAŢIA TEST

35
EXEMPLU: dacă vrem să cunoaştem capacitatea de abstractizare a unui subiect,
atunci în vom cere să rezolve o serie reprezentativă de sarcini de abstractizare, urmărind să
extragem cât mai multe eşantioane de conduită reprezentative pentru operaţia de abstractizare.
Răspunsurile subiectului vor avea valoare diagnostică dacă există o legătură reală între
răspunsurile acestuia în situaţia experimentală (rezultatele la test) şi conduita subiectului în
situaţii concrete de viaţă. Dacă constatăm o strânsă legătură între performanţa obţinută în
rezolvarea sarcinilor la test şi capacitatea reală de abstractizare a subiectului, atunci putem
trage concluzia că testul are utilitate practică.
Constatăm că testul este o situaţie experimentală controlată, variabilele lui esenţiale
trebuie să fie dinainte cunoscute de examinator. Prin natura sa, testul tinde să reproducă, în
condiţii artificiale, condiţiile unei situaţii reale. În acest fel el devine o micro - situaţie tipică,
simulată. Valoarea "simulatoare" a testului va depinde de analiza situaţiei reale, de definirea
variabilelor situaţiei reale şi a modului de interacţiune a acestor variabile. Aceasta implică,
cunoaşterea structurii funcţionale a situaţiei şi reproducerea, sub forma unui test a conţinutului
psihologic a structurii funcţionale a situaţiei identificate. Testul nu trebuie să piardă din
vedere nici o variabilă esenţială a situaţiei concrete. În acest caz testul nu este nici analitic,
nici sintetic, ci analog cu situaţia reală, în sensul că modelează conţinutul psihologic al
activităţii reale, dar nu şi forma exterioară a acesteia.
În concluzie, deosebirile exterioare, de formă, între sarcina test şi sarcina reală, ascund
mereu o identitate internă, de conţinut sau de natură psihologică. Modalitatea de rezolvare a
acestei probleme este fundamentală pentru valoarea constructivă şi diagnostică a unui test
(Roger Mucchielli, 1969).

IMPORTANT Pentru a evita unele confuzii, este necesar să facem distincţia dintre
teste şi chestionare. Reprezentanţii şcolii germane definesc chestionarele ca fiind "teste
subiective". Această atitudine este justificată de faptul că precizia chestionarelor este mult mai
mică, din cel puţin două motive. În primul rând, răspunsurile obţinute cu ajutorul acestor
instrumente sunt dezirabile, subiecţii au tendinţa de a face o bună impresie, de a răspunde aşa
cum cred ei că este bine şi nu aşa cum sunt în realitate. În al doilea rând, bazându-se pe
introspecţie (care este de fapt o retrospecţie), intervine uitarea, ceea ce face ca multe aspecte
esenţiale să fie neglijate.
Prin utilizarea testelor aceste limite sunt înlăturate, acesta fiind un instrument mult mai
precis. Distincţia esenţial - neesenţial este mai tranşantă în cazul testelor şi dispare
posibilitatea de a măsura aparenţele. Diferenţierile dintre persoane, evidenţiate cu ajutorul
testelor, sunt esenţiale dacă demonstrăm constanţa acestora. Testul este un instrument valoros
dacă predicţia pe care o facem cu ajutorul lui este pertinentă, adică dacî se referă la
comportamente care persistă la un individ.

4. CLASIFICAREA TESTELOR
Testele ca mijloace de psihodiagnostic s-au dezvoltat într-un ritm accelerat, utilizându-se
în prezent, în practica psihologică peste 10.000 de teste, astfel încât este dificilă realizarea unei
clasificări care să surprindă cele mai sensibile diferenţe pe baza criteriilor care se iau în
consideraţie pentru o clasificare generală. Există în literatura psihologică numeroase clasificări
ale testelor:
După paradigma teoretică la care aderă: reprezentanţii şcolii experimentaliste, care
descompun personalitatea în părţi componente, apelează la teste "sectoriale" folosind analiza

36
factorială şi metode metrice precise, în timp ce psihologii clinicieni, încearcă să cuprindă
ansamblul personalităţii cu ajutorul testelor holostice, folosind sau nu indicatori numerici.
După aspectul psihologic investigat: găsim teste intelectuale, care vizează cunoaşterea
proceselor cognitive (percepţie, memorie, capacitate de analiză şi sinteză etc), teste de
personalitate, care vizează aspectul afectiv - atitudinal.
Această clasificare grupează pe de o parte testele intelectuale, care sunt metrice, iar pe de
altă parte testele de personalitate, care sunt analitice (chestionarele) sau holistice (testele
proiective).
După modul de prezentare: testele pot fi orale, răspunsul subiectului se dă sub formă
verbală, teste scrise (numite creion - hârtie), teste instrumentale, la care se utilizează un suport
concret (material sau un aparat), teste informatizate, aplicate cu ajutorul computerului.
După modul de aplicare: teste individuale şi teste de grup.
După timpul alocat pentru răspuns: teste cu timp liber şi teste cu timp limitat.
După scopul urmărit (P. Pichot) distinge: teste de eficienţă, care măsoară o aptitudine
sau o capacitate, şi teste de personalitate prin care se urmăreşte explorarea fondului psihologic
intim, determinarea aspectelor motivaţionale, ale caracterului accentul fiind pus pe interpretarea
calitativă a datelor obţinute.
O clasificare în detaliu a testelor psihologice este utilă şi eficientă din punct de vedere
practic. În acest fel putem distinge următoarele categorii de teste:
• teste de inteligenţă şi dezvoltare mintală, care măsoară aptitudinea cognitivă generală
şi nivelul atins în dezvoltarea caracteristicilor intelectuale;
• teste de aptitudini şi capacităţi, care au fost elaborate pentru măsurarea aptitudinilor
de grup şi specifice;
• teste de personalitate, care măsoară însuşiri de temperament şi caracter, acestea fiind
împărţite în două categorii:
1. teste obiective de personalitate, care-şi propun obţinerea unor date cuantificabile,
cât mai puţin influenţate de interpretările subiective şi evitarea tendinţei de faţadă
a subiecţilor în momentul elaborării răspunsului, deoarece aceştia nu
conştientizează aspectele personalităţii vizate de test;
2. tehnici proiective, care valorizează mecanismul de proiecţie în cunoaşterea
psihologică a persoanei, trecând peste vigilenţa conştiinţei în încercarea de a
studia inconştientul;
teste de cunoştinţe sau docimologice, care măsoară nivelul cunoştinţelor acumulate de subiecţi şi
servesc ca modalitate de examinare şi notare.

TEST DE AUTOEVALUARE:

1. Testul trebue să fie analog cu situația reală.


a.ADEVĂRAT
b.FALS
2. Un chestinar ste mai precis decât untest
a.ADEVĂRAT
b.FALS
3. Personalitatea se manifestă ca un nod de relaţii între situaţii şi răspunsuri.
a.ADEVĂRAT
b.FALS

37
4. Între test și chestionar există o diferență de standardizare.
a.ADEVĂRAT
b.FALS
5. Diferenţierile dintre persoane, evidenţiate cu ajutorul testelor, sunt esenţiale dacă
demonstrăm constanţa acestora.
a.ADEVĂRAT
b.FALS
6. În relație cu situația reală testul trebuie să fie sintetic.
a.ADEVĂRAT
b.FALS
7. Testul este un instrument valoros dacă predicţia pe care o facem cu ajutorul lui este
pertinentă.
a.ADEVĂRAT
b.FALS
8. Analogia dintre test și situația reală este o analogie de formă.
a.ADEVĂRAT
b.FALS
9. Germanii definesc chestionarele ca fiind teste subiective.
a.ADEVĂRAT
b.FALS
10. Între test și chestionar există o diferență de formă.
a.ADEVĂRAT
b.FALS
11.. Între sarcina test şi sarcina reală trbuie să existe oidentitate internă de conţinut.
a.ADEVĂRAT
b.FALS
12.În relație cu situația reală testul trebuie să fie analitic.
a.ADEVĂRAT
b.FALS
13. Analogia dintre test și situația reală este o analogie de conținut.
a.ADEVĂRAT
b.FALS
14. Între test și chestionar există o diferență de preczie.
a.ADEVĂRAT
b.FALS
15. Rapunsurile dezirabile reprezintă o limita importantă a tetelor.
a.ADEVĂRAT
b.FALS
16. Distincţia esenţial - neesenţial este mai tranşantă în cazul testelor şi dispare posibilitatea
de a măsura aparenţele.
a.ADEVĂRAT
b.FALS

38
Unitatea de învățare 4
FIDELITATEA TESTELOR

Valoarea oricărui instrument de cunoaştere psihologică depinde de calităţile acestuia.

CITAT R. Zazzo în prefaţa la "Manuell pour l'examen psychologique de l'enfant"


(1969) face câteva reflecţii asupra metodei testelor din care cităm:
"Practicarea metodei testelor ridică o mulţime de probleme, unele create cu totul de
prejudecăţile şi ignoranţa unor oameni care vorbesc despre asta fără să ştie mare lucru, altele
într-adevăr reale, întâlnite şi rezolvate de bine de rău de către cei care construiesc testele şi le
utilizează...
Un test nu este, de fapt, aşa cum cred adesea profanii, un dispozitiv misterios care ne
informează în mod automat şi infailibil despre facultăţile misterioase al căror nume scapă
psihologiei comune.
Se confundă standardizarea probei cu un pretins automatism de aplicare. Se confundă, de
asemenea, natura insolită a anumitor factori la care încearcă să ajungă testele cu natura însăşi
a metodei: ca şi cum un test de ortografie nu ar indica natura acestei metode la fel de clar ca
un test al factorului G, de exemplu.
Se confundă, în sfârşit, precizia măsurărilor obţinute cu o afirmare a fixităţii pentru lucrul
măsurat: ca şi cum temperatura citită astăzi pe un termometru ar fixa febra la un nivel
definitiv."

IMPORTANT
Vom sublinia faptul că orice instrument de cunoaştere psihologică trebuie utilizat
ţinând seama de limitele valorii sale diagnostice şi prognostice. Din această cauză psihologul
trebuie să cunoască în amănunt aceste calităţi înainte de a-l folosi pentru cunoaşterea
psihologică a persoanei în diferite scopuri.
În acest capitol vom prezenta cele mai importante calităţi ale testelor: fidelitatea,
validitatea şi standardizarea.

1. Definirea fidelităţii
Există frecvent credinţa eronată că testul ar măsura toate aspectele cuantificabile ale
conduitelor sau reacţiilor umane. În realitate testul extrage, din variaţiile teoretic infinite ale
conduitelor subiectului, un număr limitat de eşantioane de conduită, pe care le măsoară,
oferind o imagine lacunară asupra conduitei reale a persoanei testate.
Inconstanța masurării
Se observă că testarea repetată a unei persoane cu aceeaşi probă, sau cu probe paralele
duce la obţinerea unor rezultate fluctuante, la o variaţie mai mult sau mai puţin accentuată.
Scorurile obţinute la testele psihologice provin din răspunsurile date de diferiţi
subiecţi. Una din caracteristicile comportamentului uman este că acesta se modifică în timp,
aspect care ne face să ne preocupe constanţa scorurilor. Eşantionarea itemilor,
circumstanţele particulare de administrare a testului şi caracteristicile subiecţilor
determină inconstanţa în măsurare. Măsurările fizice sunt în general stabile, iar diferenţele
dintre scoruri sunt uşor de explicat, ceea ce nu se întâmplă în cazul măsurătorilor psihologice,
la care scorurile sunt influenţate de condiţii exterioare.

39
Consistența internă
Teoria preciziei testului (termen generic pentru desemnarea studiului consistenţei
interne) este importantă prin două probleme fundamentale:
Prima constă în gradul de consistenţă a rezultatelor, şi se referă la relaţia între
scorurile obţinute în diferite situaţii de aplicare a testelor; iar a doua la cauzele diferenţelor
observate între scoruri, deci a cunoaşte factorii care determină scorurilor inconstante şi
importanţa efectului lor.

IMPORTANT
Caracterul inconsecvent al rezultatelor brute ridică problema fidelităţii instrumentului
care în esenţă ridică trei probleme:
a. Cât de variabile, de fluctuante sunt rezultatele subiectului de la o măsurare la alta?
În această situaţie fidelitatea constă în stabilitatea rezultatelor în timp şi în consecinţă în
predictibilitatea lor.
b. Valorile obţinute la o probă sunt adevăratele valori ale aspectului psihologic măsurat?
Diferenţele interindividuale, constatate în privinţa cotelor obţinute la test, pot fi explicate prin
diferenţe reale dintre subiecţi?
În această situaţie fidelitatea se referă la acurateţea, precizia cu care testul măsoară ceea ce
şi-a propus să măsoare.
c. Cât de mare este eroarea de măsurare (totalul erorilor întâmplătoare) a testului?
În această situaţie fidelitatea se referă la absenţa relativă a erorilor de măsurare.

Teoria clasică a testelor furnizează elementele de bază, necesare pentru rezolvarea acestei
probleme. Ea se bazează pe câteva postulate, definiţii şi relaţii.
După teoria clasică a testelor toate scorurile observate (X) sunt compuse din două părţi: un
scor adevărat (A) şi un scor eroare (E). Această relaţie poate fi reprezentată sub forma
ecuaţiei: X = A + E
Se pune însă problema sensului pe care îl dăm scorului observat.

DEFINIŢIA SCORULUI ADEVĂRAT


Acest concept poate fi definit în mai multe feluri.
(1) Îl putem considera ca un scor obţinut cu un test perfect, deci un test care măsoară fără
eroare. De fapt, dacă putem efectua măsurări fără eroare, toate scorurile observate pot fi
considerate ca adevărate. Acest lucru este imposibil deoarece întotdeauna există un gard de
eroare.
(2) Există şi o altă manieră de înţelegere a scorului adevărat. Lord şi Novick (1968)
dau o altă definiţie scorului adevărat elaborând postulatele de bază şi relaţiile dintre scorurilor
adevărate şi eroare.
Scorul adevărat al unui subiect (s) obţinut cu un instrument dat (i) este definit ca
valoarea aşteptată a scorului observat:
Asi =  Xis
unde: Asi este o constantă, Xis este o variabilă oarecare, iar  este valoarea aşteptată.
Deci, scorul aşteptat al unui subiect (s) obţinut cu instrumentul (i) este valoarea
aşteptată () a răspunsului la instrumentul (i) dat de subiectul (s).
O altă manieră de exprimare a relaţiei dintre un scor adevărat şi un scor observat,
constă în a descrie scorul adevărat ca fiind scorul mediu a unui subiect pentru un număr infinit
de utilizări a aceluiaşi instrument de măsură.

40
DEFINIŢIA ERORII
Un alt concept important în teoria clasică a testelor este cel de eroare (E). Eroarea
poate fi definită ca fiind diferenţa dintre scorul adevărat şi scorul observat:
Esi = Xis - Asi
Acest tip de eroare este datorată hazardului ceea ce exclude toate sursele sistematice de
variaţie a erorii.
După aceste constatări putem apela la calcularea mediei şi a varianţei pornind de la
relaţia iniţială şi prin calcule vom obţine:
X m  Am
Media scorurilor observate este egală cu media scorurilor adevărate.
Termenul Em, dispare din ecuaţie când valorile aşteptate ale erorilor (variabile
aleatoare) tind spre zero. În consecinţă, efectele erorilor au tendinţa să se anuleze dacă
numărul de observaţii tinde spre infinit.
Aceeaşi procedură poate fi aplicată şi pentru varianţă şi vom obţine:
S2X = S2A + S2E atunci când erorile tind spre zero
Acesta este o ecuaţie fundamentală care are o mare importanţă pentru că ne permite să
construim o definiţie simplă şi interesantă a fidelităţii unui test.
Un postulat important a acestei teorii este că scorurile adevărate şi scorurile eroare nu
sunt în corelaţie, adică rAE = 0.
Se postulează de asemenea că scorurile eroare la diverse măsurări nu sunt în corelaţie, adică
rE1E2 = 0.

DEFINIŢIA FIDELITĂȚII CA RAPORT DE VARIANȚĂ


Este suficient să utilizăm egalitatea fundamentală pentru definirea fidelităţii:
S2X=S2A + S2E
Dacă împărţim fiecare din aceste elemente prin aceeaşi cantitate S2X, adică varianţa
rezultatelor observate, vom obţine:
S2X S2A S2E S2 A S2E
  1  
S2X S2X S2X adică S2 X S2 X
S2A
2
unde S X este proporţia varianţei observate care provine din varianţa adevărată
S2E
2
iar S X este proporţia varianţei observate care provine din varianţa eroare.
S2A
rXX 
1
1
Precizia poate fi definită ca fiind un raport de varianţă: S X2 unde rXX
desemnează coeficientul de fidelitate, adică proporţia varianţei observate care provine din
varianţa adevărată.
S 2E
rX X  1 
1

Sau putem scrie formula sub forma S X2 , adică unu minus proporţia varianţei
observate care provine din varianţa eroare.

41
EXEMPLU
Relaţia care există între cele trei varianţe poate fi reprezentată sub forma:

(1) S2A S2E

(2) S2E S2A

Unde cazul (1) arată un raport de fidelitate mai mare decât cazul (2).
Coeficientul de fidelitate corespunde unui raport de varianţă şi poate lua valori între 0 şi 1,
deci numai valori pozitive. Ecuaţia următoare reflectă bine acest lucru.:
S2E
rXX 1  1  2
S X
Dacă varianţa eroare (S2E) este maximă, ea este egală cu varianţa observată a testului
(S2X). În acest caz, putem spune că varianţa observată este dată numai de erori şi coeficientul
de fidelitate este nul. Fidelitatea este certitudinea că un test măsoară scorurile adevărate, iar
coeficientul de fidelitate dă gradul de fidelitate.
Putem stabili un raport între scorurile adevărate şi scorurile observate. Dacă luăm în
consideraţie deviaţia scorurilor de la medie prin calcul vom obţine:
rXA  rXX 1
Corelaţia dintre scorurile adevărate şi scorurile observate este egală cu rădăcina pătrată a
coeficientului de fidelitate.

2. Eroroarea standar de măsurare


Variabilitatea scorurilor observate SX, poate să fie cunoscută direct, existând procedee
pentru a estima coeficientul de fidelitate. Dacă notăm (SE, abaterea standard a erorilor şi cu
S2E varianţa erorilor), pe baza acestor parametri putem rezolva o problemă practică.
S2A
S2E = S2X - S2A dar rXX 1  2 deci S 2 A  S 2 X rXX 1
S X
S2E = S2X -S2X rXX1 = S2X (1 - rXX1) S E  S X 1  rXX 1
SE este denumită eroarea standard de măsurare sau eroarea probabilă.
SE reprezintă eroarea aleatoare care nu poate fi eliminată din măsurare, dar trebuie
luate măsuri pentru a o reduce cât mai mult. Vom spune că măsurarea este fidelă sau precisă
în măsura în care există cât mai puţine erori posibile sau valoarea SE este cât mai mică posibil.
Teoretic eroarea este nulă.
Noţiunea de fidelitate presupune reproducerea scorurilor, adică posibilitatea de a
obţine aceleaşi rezultate de la aceiaşi subiecţi, în aceleaşi condiţii dar, în ocazii diferite, cu
teste care măsoară aceiaşi trăsătură.
Teoria clasică a testelor este o soluţie pe care o putem aplica la teoria erorilor de
măsurare. Se precizează că pentru un scor adevărat dat, mai multe măsurări echivalente ale
aceleiaşi trăsături în aceleaşi condiţii este un mijloc pentru o bună aproximare. Scorurile
obţinute se distribuie simetric deasupra şi dedesubtul scorului adevărat. Distribuţia erorilor
aleatoare se repartizează normal şi se aşteaptă o distribuţie a scorurilor observate în scorului
adevărat. Să presupunem că dispersia erorilor este aceiaşi pentru fiecare subiect iar abaterea

42
standard a erorilor poate să fie cunoscută sau estimată. Aceasta se numeşte eroarea standard
de măsurare : S E  S X 1  rXX 1

IMPORTANT
Problema măsurării constă în a determina această eroare, pe care trebuie să s-o
eliminăm ,cât mai mult posibil, pentru a controla factorii care influenţează scorurile observate.

EXEMPLU
Dacă SE = 1,3, rXX1 =0,60 şi SX = 2,00, atunci pe baza acestor date putem interpreta un
rezultat observat în funcţie de eroare şi putem determina limitele între care se poate situa
rezultatul adevărat al subiecţilor care au acelaşi rezultat observat.
Astfel:
X - 1SE < A < X + 1SE pentru o probabilitate de 0,68
X - 2SE < A < X + 2SE pentru o probabilitate de 0,95
X - 3SE < A < X + 3SE pentru o probabilitate de 0,99
Dacă X = 7 atunci avem:
7 - 1,3 < A < 7 + 1,3
7 - 2,6 < A < 7 + 2,6
7 - 3,9 < A < 7 + 3,9 adică 3,1 < A < 10,9
Aceasta înseamnă că pentru un rezultat observat 7, rezultatele adevărate pot fi situate
între 3,1 şi 10,9, cu o probabilitate de 99,7%.
3. Sursele erorilor de măsurare
Pentru a putea diminua pe cât posibil erorile de măsurare este important să cunoaştem
sursele de eroare. O variabilă produce erori dacă nu este validă şi dacă se obţin rezultate
inconstante atunci când se fac mai multe măsurări.

IMPORTANT
Există trei surse principale de eroare:
1. erori produse de testul însuşi;
2. erori legate de condiţiile de aplicare a testului;
3. erori legate de subiecţii care răspund la test
Prima categorie cuprinde factori controlabili ca: eşantionarea itemilor, dacă testul
presupune măsurarea unei trăsături foarte precise, ambiguitatea enunţurilor, imprecizia
instrucţiunilor în legătură cu maniera de răspuns, o limită de timp neadecvată. Toate acestea
determină răspunsuri date la întâmplare, ceea ce duce la o instabilitate a răspunsurilor şi o
reducere a fidelităţii testului.
A doua categorie se referă la procedeele de prezentare a testului. Dacă aceste procedee
sunt standard riscurile de eroare sunt scăzute. Lipsa de experienţă a grupului testat,
neobişnuinţa subiecţilor de a răspunde la teste poate fi un factor de eroare. Lipsa de
concentrare a subiecţilor, erorile de redactare a instrucţiunilor şi deficienţele de cronometrare,
sunt erori care fac parte din această categorie.
Aceste două categorii conţin surse de eroare uşor de controlat, faţă de cele din a treia
categorie, unde sursele de eroare depind de subiecţi. Psihologii au evidenţiat multe surse de

43
eroare de acest tip. Aici le vom menţiona pe cele mai importante ca: motivaţia, obişnuinţa cu
testarea, anxietatea, diferenţele de învăţare şi variabile de natură fiziologică.
Există erori de măsurare dacă subiecţii examinaţi sunt motivaţi diferit. Dacă condiţiile
de aplicare a testului se modifică de la o aplicare la alta atunci trebuie să ne aşteptăm şi la o
modificare a rezultatelor. Testele de randament sunt afectate de aceste erori.
Se postulează că subiecţii au o experienţă echivalentă indiferent de procedeul utilizat
şi maniera de testare. Tot timpul, două situaţii indezirabile, care introduc erori de măsurare,
pot să apară. Pe de o parte, lipsa de experienţă a unor subiecţi, se materializează în
incapacitatea acestora, mai mare sau mai mică, de o obţine un randament ridicat, situaţie în
care scorul nu reflectă gradul de prezenţă a trăsăturii măsurate. Pe de altă parte, sunt persoane
care au experienţă în rezolvarea testelor şi obţin un randament ridicat, fapt care de asemenea
nu este în concordanţă cu nivelul trăsăturii măsurate. Aceste două situaţii determină erori de
măsurare şi diminuează fidelitatea.
Multe persoane manifestă o oarecare nervozitate atunci când sunt testate. Există o
marjă de încredere, justificată sau nu, faţă de gradul prezenţei trăsăturii măsurate, care
determină stări de anxietate. Anxietatea afectează randamentul şi reduce punerea în valoare a
posibilităţilor subiectului.
Un alt factor de eroare este legat de variabile fiziologice. Acest factor este inevitabil
când acestea sunt imprevizibile.

DEFINIŢIE PE BAZA CONSISTENȚEI INTERNE


Fidelitatea unui instrument de măsură se defineşte ca fiind corelaţia sau coeficientul
de concordanţă între două teste paralele sau două teste paralele la care eşantionul de itemi a
fost extras din aceeaşi populaţie de itemi. Indicele obţinut este un coeficient de corelaţie între
măsurări care dau acelaşi scor adevărat pentru fiecare subiect. Acest indice arată precizia cu
care un item ne permită să măsurăm o caracteristică. De asemenea, coeficientul de corelaţie la
pătrat indică proporţia varianţei între două măsurări.
S2A
2
rXX1 = r2XA = S X
Putem afirma, pe baza definiţiei fidelităţii, că acest coeficient indică proporţia din
varianţa totală care rezultă din diferenţele dintre scorurile adevărate. Din aceste diferenţe
rezultă de fapt adevăratele diferenţe dintre indivizi.
Acest coeficient este un indicator al inconstanţei erorilor, care are valoare minimă dacă
testele sunt într-adevăr paralele. El este denumit coeficient de precizie. Mulţi cercetători,
printre care şi Lord şi Novik (1968), au demonstrat că procedeele standard care servesc la
estimarea coeficientului de fidelitate şi la varianţa erorilor unui test presupun cel puţin două
măsurări (scoruri) pentru fiecare subiect şi că precizia estimării creşte o dată cu numărul
acestor măsurări.
Varianţa erorii pentru un anumit subiect S2Esx presupune cel puţin două măsurări şi
precizia creşte o dată cu numărul observaţiilor asupra persoanei măsurate. Deşi coeficientul de
precizie nu este nici foarte pertinent şi nici foarte practic, el constituie totuşi un indice al
gradului de imprecizie care poate fi atribuit viciilor de formă sau de procedură.
Dacă itemii testelor paralele sunt extraşi din aceeaşi populaţie de itemi, coeficientul de
fidelitate indică gradul de certitudine cu care poate fi măsurată o trăsătură, chiar dacă s-a
folosit doar un eşantion de itemi din populaţia respectivă. În acest fel, mai multe eşantioane
aleatoare, cu acelaşi număr de itemi, pot să constituie teste paralele şi permit să se obţină mai
mulţi coeficienţi de corelaţie. Media lor este cea mai bună estimare a coeficientului de
corelaţie aşteptat pentru testele paralele cu aceeaşi lungime, eşantionate aleator. Numărul de
44
itemi şi gradul de omogenitate al populaţiei de itemi, adică gradul în care măsoară aceeaşi
variabilă, sunt doi factori care determină această medie.

IMPORTANT
Coeficientul care indică gradul legăturii între testele paralele, formate din eşantioane
alese aleator, este denumit coeficient de consistenţă internă. În practică testele nu satisfac
exigenţele testelor strict paralele, cu toate că în ansamblu ele măsoară acelaşi scor adevărat şi
corelaţia între teste este pozitivă. Coeficientul de fidelitate, cunoscut ca fiind corelaţia dintre
teste paralele, este afectat de varianţa proprie a fiecărui test
.

4. Metode de estimare a fidelităţii


4.1.Metoda testelor paralele.

DEFINIŢIE
Această metodă constă în calcularea corelaţiei între două forme ale aceluiaşi test
format din itemi diferiţi. Ea dă o aproximare a gradului de echivalenţă între teste atunci când
le aplicăm aceluiaşi grup de subiecţi la un interval scurt de timp.
Acest tip de coeficient este mai fiabil decât coeficientul de precizie deoarece el indică
corelaţia dintre două forme aproape paralele. Imprecizia de măsurare şi varianţa adevărată
care decurge din lipsa paralelismului dintre forme (varianţa adevărată specifică), sunt tratate
ca erori şi tind să reducă coeficientul de echivalenţă. Intervalul de timp dintre cele două
aplicări ale testului fiind mic, putem considera că se produce o scădere a fluctuaţiilor posibile
între scorurile adevărate datorate celor două aplicări, ceea ce permite să reducem S2AF
(varianţa eroare datorată fluctuaţiilor scorurilor adevărate, în diferite ocazii) şi în consecinţă
S2E (varianţa eroare).
4.2.Metoda test - retest

DEFINIŢIE
Metoda constă în a aplica acelaşi test de două ori aceluiaşi grup de subiecţi la un
interval mai mic sau mai mare de timp şi a calcula corelaţia dintre rezultatele obţinute.
Aplicarea acestei metode comportă mai multe dificultăţi. Efectul exerciţiului sau a
memorării poate influenţa subiecţii la a doua aplicare, astfel încât erorile înregistrate în cursul
celor două prezentări au tendinţa să fie în corelaţie. Mai mult, modificarea abilităţii subiecţilor
contribuie de asemene la eroare. Este deseori dificil de precizat dacă eroarea este efectul
creşterii sau diminuării corelaţiei între rezultate. După Gulliksen (1950), corelaţia va fi mai
mare dacă intervalul de timp dintre cele două prezentări este scurt şi oboseala intervine în
mică măsură. În acest caz corelaţia obţinută este o supraestimare a coeficientului de precizie.
Dacă intervalul dintre prezentări este lung, memoria intervine mai puţin, iar efectul este
reducerea corelaţiei.
Dacă considerăm fluctuaţia scorurilor adevărate, eroare, fidelitatea este subestimată,
iar dacă efectul memoriei este considerat ca varianţă adevărată, fidelitatea este supraestimată.
Varianţa atribuită fluctuaţiei scorurilor adevărate creste o dată cu durata intervalului dintre
cele două prezentări, iar efectul memoriei scade. Intervalul ideal permite reducerea, pe cât
posibil, a efectului combinat al celor doi factori.

45
IMPORTANT
A. Anastasi consideră că definirea exactă a varianţei eroare este dificilă. Un factor
irelevant pentru un scop diagnostic poate fi relevant pentru un altul şi invers. Deci, unul şi
acelaşi factor poate fi considerat, în funcţie de scopul testării, când varianţă adevărată când
varianţă eroare.

EXEMPLU
Dacă se urmăreşte starea afectivă actuală a unei persoane (dispoziţia emoţională,
nivelul anxietăţii etc.), atunci se preferă teste care relevă varianţa cotelor brute de la o testare
la alta. Dacă se urmăreşte prognoza şcolară sau profesională, atunci se preferă teste care
surprind stabilitatea în timp a conduitelor. În primul caz stabilitatea în timp a rezultatelor este
contraindicată, în celălalt ea este de dorit. Deci, sensul erorii depinde de scopul testării. Când
condiţile care determină cota subiectului sunt mereu irelevante pentru scopul urmărit, ele intră
în categoria varianţei eroare şi putem spune că fidelitatea nu există sau este foarte mică.

4.3. Metoda de analiză a varianţei interne


Metoda înjumătăţirii
Datorită limitelor pe care le posedă metodele prezentate anterior, şi a faptului că
fidelitatea este estimată printr-un coeficient de echivalenţă, metoda înjumătăţirii (split half)
este utilă.

DEFINIŢIE
Procedeul constă în a ordona itemii în ordinea dificultăţii. Apoi vom împărţi testul în
două, echilibrând gradul de dificultate a fiecărei părţi pe baza indicelui pi (indicele de
dificultate a itemuilui) pentru fiecare item. În acest fel construim două teste de dificultate şi
variabilitate echivalente în aşa fel încât mediile şi abaterile standard să aibă valori cât mai
apropiate posibil. Cele două teste vor măsura aceleaşi scoruri adevărate deci, ele măsoară
acelaşi conţinut şi există o corelaţie pozitivă perfectă între scorurile adevărate
Metoda presupune obţinerea unui scor de către fiecare subiect pentru fiecare jumătate
şi calcularea corelaţiei dintre aceste scoruri.
Metoda fidelităţii prin înjumătăţire nu poate fi utilizată pentru teste de viteză.
Coeficientul alfa şi coeficientul Kuder-Ricardson (KR20)
Este posibil să divizăm un test în atâtea părţi câţi itemi sunt. Putem postula că toţi itemii sunt
paraleli, deci au aceeaşi medie, aceeaşi varianţă şi intrcorelaţii egale. Kuder şi Ricardson
(1937) au obţinut o ecuaţie care permite să obţinem coeficienţi de fidelitate. Cronbach a
demonstrat că KR20 (caz special al coeficientului ) este egal cu media tuturor coeficienţilor
obţinuţi prin metoda înjumătăţirii, calculaţi prin formula lui Rulon sau Guttman, pentru toate
jumătăţile posibile ale unui test. KR20 este un coeficient de omogenitate sau de consistenţă
internă care dă o mai bună estimare a fidelităţii. El poate fi considerat ca fiind corelaţia între
teste paralele dacă eşantionarea itemilor s-a făcut prin hazard.Varianţa adevărată este, deci
dependentă de valoarea covarianţei dintre iremii unui test şi este determinată de intercorelaţii
şi varianţele itemilor. Aceasta ne permite să afirmăm că coeficientul KR20 (indicele de
consistenţă internă) depinde de corelaţiile dintre itemi, deci de gradul în care măsoară aceeaşi
variabilă, cum s-ar spune de omogenitatea itemilor.

46
5. INTERPRETAREA COEFICIENTULUI DE FIDELITATE
Cum interpretăm un coeficient de fidelitate şi când poate fi considerat acceptabil ?
Răspunsul la această întrebare nu este evident, dar există. Cum am văzut deja, pentru un test
putem calcula mai mulţi coeficienţi, diferiţi din punct de vedere a valorii calitative. Fiecare
reprezintă estimarea valorii inconstanţei rezultatelor şi nu o estimare a cauzei erorilor. Va
trebui deci, să examinăm formele de interpretare a unui coeficient de fidelitate.
Deşi există mai multe posibilităţi de calcul al coeficientului de fidelitate, în mod curent
se vorbeşte despre gradul de fidelitate pentru a desemna valoarea erorilor de măsurare cu
testul respectiv.
Nunnally (1982) sugerează că cel puţin doi coeficienţi diferiţi trebuie utilizaţi pentru a
cunoaşte fidelitatea unui test: coeficientul  calculat pentru fiecare formă a testului şi
corelaţia între forme paralele. Alţi autori recomandă calcularea coeficientului de echivalenţă
- stabilitate. Este important ca cercetătorul să ţină seama de necesităţi şi de context. De
exemplu, pentru o corectare subiectivă efectuată de mai mulţi corectori, corelaţia mediei
dintre scorurile celor două forme ale testului este un bun indice de fidelitate. Metoda prin
înjumătăţire poate fi folosită dacă nu există o formă paralelă a testului.
În toate cazurile va fi folosită metoda care duce la o estimare cât mai prudentă şi
verosimilă.

IMPORTANT
Există patru forme de interpretare a unui coeficient de fidelitate:
- ca o corelaţie dintre scorurile obţinute şi scorurile adevărate;
- ca un standard de comparaţie a preciziei unui test cu precizia altor teste de aceeaşi
natură;
- ca procent al subiecţilor care-şi schimbă rangul sau poziţia;
- ca un indice al gradului de eroare între scorurile individuale.

A. CORELAŢIA DINTRE SCORURILE OBŢINUTE ŞI SCORURILE ADEVĂRATE

IMPORTANT
Coeficientul de fidelitate este un raport de varianţă, prin care se poate stabili cât din
proporţia de varianţa totală aparţine varianţei adevărate.

EXEMPLU
Dacă rXX1 = 0.90, putem spune că 90% din variabilitatea scorurilor observate decurge din
variaţa adevărată şi 10% din varianţa eroare. Evident că rXX1 = 0, presupune că variabilitatea
este datorată în totalitate erorilor.
De asemenea, un coeficient de fidelitate poate fi interpretat ca fiind proporţia din
varianţa observată care provine din diferenţele dintre scorurile adevărate. Mai precis, el indică
gradul erori de măsurare obţinut prin administrarea unei forme a unui test la un eşantion
particular de subiecţi în condiţii bine precizate.

47
B. UN STANDARD DE COMPARAŢIE A PRECIZIEI UNUI TEST CU PRECIZIA
ALTOR TESTE DE ACEEAŞI NATURĂ
O valoare foarte ridicată de 0,90 sau mai mare, observată la un test standard, care
serveşte la măsurarea randamentului, aptitudinilor sau abilităţilor, poate servi drept criteriu de
comparaţie pentru aţi coeficienţi. Pentru testele de personalitate, norma criteriu se situează la
0,80.

C. SCHIMBAREA RANGULUI SUBIECŢILOR


Dacă precizia este perfectă, fiecare subiect primeşte acelaşi rang la fiecare prezentare a
testului. Thorndike şi Hagen (1977) au prezentat tabelele de schimbare a rangurilor pentru
diversele valori ale coeficientului de fidelitate. Rangurile pe care le au doi subiecţi se schimbă
în funcţie de valoarea coeficientului de fidelitate.

EXEMPLU
Dacă scorurile a doi subiecţi sunt plasate în cetilul 75 respectiv 50, aceste se
inversează dacă precizia testului are valori diferite. Dacă rXX1 = 0.60 sunt 33% şanse ca doi
subiecţi plasaţi în cetilele 75 şi 50 să-şi schimbe poziţia şi numai 2% şanse de schimbare a
poziţiei dacă rXX1 = 0.90.
Schimbarea rangului dintre subiecţi nu depinde numai de precizia testului ci si de
numărul claselor. Cu cât clasele sunt mai mici cu atât există mai multe şanse de schimbare.

D.:GRADUL DE EROARE ÎNTRE SCORURILE INDIVIDUALE


Gradul de eroare este invers proporţional cu gradul de fidelitate a unui test. Problema
este de a determina pentru fiecare subiect intervalul în care se află scorul adevărat.

EXEMPLU
Presupunem o medie Xmed = 60, o abatere standard SX = 5 şi o fidelitate a testului rXX1
= 0.84. În acest caz eroarea de măsurare este:
S E  S X 1  rXX 1
= 5 1  0,84 = 2
Pentru un scor X = 57 şi un grad de confidenţă de 0,95 vom obţine:
X - ZSE  A  X + ZSE
57 - (1,96 x 2)  A  57 + (1,96 x 2)
53,08  A 60,92
unde Z este scorul standard luat de valorile care determină probabilităţi exacte pe o
curbă normală, iar A = scor adevărat.
Există deci, 95 % şanse ca un scor observat de 57 să corespundă unui scor adevărat
situat intre 53 şi 61. Eroarea de măsurare care este un indice al variabilităţii scorurilor
observate faţă de scorurile adevărate constituie o estimare a gradului atenuare a scorurilor
aşteptate la o eventuală nouă prezentare a testului. Cu cât eroarea de măsurate este mai mare
cu atât intervalul în care se plasează scorurile adevărate este mai mare
.
În concluzie:
1. Coeficientul de fidelitate teoretic se situează la 1,00, iar practic trebuie să fie cât
mai ridicat posibil;

48
2. Fidelitatea unui test este un concept pur teoretic pentru că un coeficient de precizie
se aplică exclusiv unui test, unui eşantion de teste menţinând constant testul şi
metoda de calcul.
3. Dacă comparăm gradul de fidelitate a mai multor teste, nu putem spune că un test
este mai precis decât altul decât dacă unul dintre ele are un coeficient de precizie
foarte ridicat decât alte teste care au fost prezentate de mai multe ori.

TEST DE AUTOEVALUARE:

1. Cu cât clasele sunt mai puține cu atât există mai multe şanse de schimbare a rangului
subiecților de la masurare la alta.
a.ADEVĂRAT
b.FALS
2. Scorul adevărat al unui subiect (s) obţinut cu un instrument dat (i) este definit ca valoarea
aşteptată a scorului observat.
a.ADEVĂRAT
b.FALS
3. Coeficientul  este un bun indicator pentru cunoașterea stabilității în timp a unui test.
a.ADEVĂRAT
b.FALS
4. Eroarea standard de măsurare ne ajută să determinăm gradul de fluctuație a scorurilor
adevărate.
a.ADEVĂRAT
b.FALS
5. Gradul de eroare este invers proporţional cu gradul de fidelitate a unui test.
a.ADEVĂRAT
b.FALS
6. Dacă rXX1 = 0.80 putem spune că 80% din variabilitatea scorurilor observate decurge din
variaţa eroare şi 20% din varianţa adevărată..
a.ADEVĂRAT
b.FALS
7. Pentru un test putem postula că toţi itemii sunt paraleli, deci au aceeaşi medie, aceeaşi
varianţă şi intercorelaţii egale.
a.ADEVĂRAT
b.FALS
8. Scorul adevărat este scorul mediu a unui subiect pentru un număr infinit de utilizări a
aceluiaşi instrument de măsură.
a.ADEVĂRAT
b.FALS
9. Pentru definirea exactă a varianţei eroare trebuie să tinem seama de scopul tetării.
a.ADEVĂRAT
b.FALS
10. Eroarea standard de măsurare ne ajută să determinăm gradul de fluctuație a scorurilor
observate.
a.ADEVĂRAT
b.FALS

49
11. Dacă itemii testelor paralele sunt extraşi din aceeaşi populaţie de itemi, coeficientul de
fidelitate indică gradul de certitudine cu care poate fi măsurată o trăsătură
a.ADEVĂRAT
b.FALS
12. Schimbarea rangului dintre subiecţi depinde numai de precizia testului.
a.ADEVĂRAT
b.FALS
13. Consitența internă a unei probe se poate setermina prin alicare preobei acelorași subiecți
în două momente diferite.
a.ADEVĂRAT
b.FALS
14. Coeficientul de fidelitate, indică proporţia varianţei observate care provine din varianţa
adevărată.
a.ADEVĂRAT
b.FALS
15. Scorul adevărat este un scor obţinut cu un test perfect care măsoară fără eroare.
a.ADEVĂRAT
b.FALS
16. Un coeficientul de fidelitate rXX1 = - 0.80 că există foarte puține erori de măsurare.
a.ADEVĂRAT
b.FALS

50
Unitatea de învățare 5
VALIDITATEA TESTELOR

1. DEFINIŢIE ŞI GENERALITĂŢI

DEFINIŢII
Validitatea, care este determinată în funcţie de gradul de varianţă adevărată al
variabilei măsurate, poate fi definită ca fiind:
• gradul în care un test măsoară o trăsătură, un construct sau un factor;
• relaţia dintre scorurile obţinute la test şi o măsurare a unui criteriu exterior.
După Legendre (1993), validitatea este "capacitatea unui instrument de a măsura
realmente ceea ce şi-a propus să măsoare după utilizarea acestuia".

Conceptul de validitate este un termen generic care se referă la următoarele probleme:


• Tipul de test folosit este potrivit utilizării care i-a fost destinată?
• Care sunt trăsăturile măsurate de test?
• În prezent testul măsoară ceea ce el trebuie să măsoare?
• Informaţiile furnizate de test sunt utile pentru a lua decizii?
• Ce interpretări putem face pe baza scorurilor obţinute la test?
• Ce predicţii putem face pe baza acestor scoruri?
• Care este gradul de varianţă care rezultă din variabila măsurată de test?
Validitatea este tot timpul legată de o situaţie particulară ceea ce înseamnă că în alte
condiţii, pe alte eşantioane sau metode de analiză vom obţine rezultate diferite. Validitatea nu
poate fi extinsă la ansamblul situaţiilor. A spune că un test este mai valid decât altul nu are
sens decât dacă testul se dovedeşte a fi valid într-o foarte mare varietate de situaţii sau pentru
un foarte mare număr de scopuri de testare.

2. DISTINCŢIA DINTRE FIDELITATE ŞI VALIDITATE

IMPORTANT
Fidelitatea se referă la precizia cu care un test măsoară anumite caracteristici în timp
ce validitatea vizează calitatea măsurării.
Am definit fidelitatea ca fiind un raport de varianţă şi în aceeaşi manieră vom defini
validitatea ca fiind proporţia de varianţă adevărată care este pertinentă scopurilor de
utilizare a unui test.
După cum s-a precizat deja validitatea vizează două aspecte: unul se referă la calitatea
cu care un test măsoară o trăsătură ipotetică sau un construct, iar al doilea se referă la relaţia
dintre scorurile obţinute la un test şi o măsură criteriu.
Definiţia validităţii poate fi exprimată prin ecuaţia: S2A = S2p + S2n
unde S2p = varianţa pertinentă
S2n = varianţa non pertinentă dar valabilă
Deci: S2X = S2p + S2n + S2E
Varianţa totală a unui test este formată din varianţa validă, varianţa non pertinentă dar
şi din varianţa eroare. Dacă varianţa eroare scade, deci fidelitatea creşte (S 2A / S2X), varianţa
validă potenţială creşte, dar această varianţă poate fi pertinentă sau nu pentru o situaţie dată.
De asemenea, o mică varianţă eroare nu garantează o validitate mare şi în acelaşi timp o

51
fidelitate mare este o condiţie necesară dar nu suficientă pentru o validitate mare pentru un
test dat într-o situaţie dată.

IMPORTANT
Studiul validităţii vizează erorile sistematice, cel al fidelităţii erorile aleatoare.
Legătura dintre cele două concepte evidenţiază faptul că un coeficient de validitate r XY nu
poate depăşi valoarea rădăcinii pătrate a coeficientului de fidelitate rXX1, ceea ce înseamnă că
validitatea este tot timpul limitată de fidelitatea unui test.
Următoarele situaţii demonstrează acest fapt:

EXEMPLU
1. O fidelitate mare şi o validitate mare
S2p S2n S2E
2. O fidelitate mare şi o validitate slabă
S2p S2n S2E
3. O fidelitate slabă şi o validitate relativ ridicată
S2p S2n S2E
4. O fidelitate slabă şi o validitate slabă:

S2p S2n S2E

unde: S2p = varianţa pertinentă


S2n = varianţa non pertinentă
S2E = varianţa eroare
S2A = S2p + S2n

Deci fidelitatea este o condiţie necesară dar nu suficientă , deoarece validitatea trebuie
să fie prezentă. Este important de subliniat că un test valid este în mod necesar şi fidel, dar un
test fidel nu este în mod necesar şi valid. O varianţă a erorii scăzută nu garantează o creştere a
validităţii deoarece varianţa adevărată poate fi în mare parte non pertinentă.

3. TIPURI DE VALIDITATE
Există mai multe tipuri de validitate în funcţie de scopul testării sau examinării:
validitate predictivă, validitate de conţinut, validitate teoretică. În literatura actuală se
vorbeşte şi de validitate aparentă (face validity), care se referă direct la conţinutul şi structura
testului. Dacă un test are validitate aparentă atunci există o corespondenţă logică evidentă
între itemii testului şi ceea ce testul îşi propune să măsoare.
Validitatea predictivă
Putem folosi testele pentru a face predicţii referitoare la randamentul subiecţilor pe
baza unui criteriu. Putem folosi drept criteriu media şcolară sau randamentul în muncă.

52
EXEMPLU
Putem prezice nota școlatră (criteriu) pa baza rezultalelo la un test de inteligență
(predictor)
Un aspect important a acestui tip de validitate este criteriul, deoarece scorul obţinut la test este
util în măsura în care poate prezice un criteriu, conţinutul fiind în acest caz un aspect
secundar.

Validitatea de conţinut
Dacă dorim să cunoaştem randamentul unui individ în universul situaţiilor în care
testul este un eşantion, conţinutul testului constituie aspectul primordial care trebui luat în
seamă, şi atunci testul devine universul în care itemii sunt eşantioane de situaţii. De asemenea,
precizia răspunsurilor şi procedeul de rezolvare a itemilor testului prezintă un mare interes.
Evaluarea validităţii de conţinut se face în funcţie de gradul de pertinenţă a eşantionului de
itemi. Dar, neexistând un indice cantitativ de pertinenţă a eşantionului, evaluarea se face prin
judecăţi sau prin procese raţionale.

IMPORTANT
Important pentru validitatea de conținul este să stabilim dacă eșantionul de itemi din care
este construit testul este reprezentativ pentru universul infinit de itemi.

Validitatea de teoretică
Testele psihologice permit studierea caracteristicilor umane. În acest caz trebuie să
cunoaştem trăsătura pe care testul o măsoară. Dacă vom cunoaşte care este trăsătura măsurată,
o vom putea utiliza pentru studiul diferenţelor individuale şi pentru elaborarea teoriilor
organizării trăsăturilor.
Pentru acest tip de validitate, trăsătura măsurată este aspectul esenţial şi estimarea
validităţii se face prin reliefarea prezenţei relative a trăsăturii.

IMPORTANT
Esențial pentru validitatea teoretică este să stabilim dacă testul măsoară într-adevăr
constructul pentru care a fost construit.

Reliefarea acestor prezenţe poate fi făcută în mai multe feluri folosind diverse surse,
apelându-se la studii de validitate predictivă şi de conţinut.

4. VALIDITATEA PREDICTIVĂ
Majoritatea testelor sunt folosite pentru predicţia randamentului. Testele de aptitudini
şcolare servesc pentru predicţia şanselor de reuşită şcolară, inventarele de interese permit
cunoaşterea câmpurilor de interese profesionale, inventarele de personalitate permit
evidenţierea unor dezechilibre psihice care pot determina anumite predispoziţii, testele de
randament sunt utilizate pentru selecţie şi plasare profesională, testele de aptitudini şi abilităţi
profesionale permit predicţia productivităţii şi stabilităţii în muncă.

IMPORTANT
53
În toate cazurile, variabila care face obiectul predicţiei este denumită criteriu. Criteriul
este măsurarea randamentului într-un mod diferit de cel desemnat de variabila predictivă.
Modelul care permite măsurarea acestui tip de validitate constă în stabilirea relaţiei între
scorurile obţinute la test şi cele obţinute la criteriu.
Expresia "validitate predictivă" se referă la faptul că folosind testul putem realiza
predicţia criteriului. Expresia "validitate empirică" se referă la faptul că determinarea
validităţii predictive presupune totdeauna colectarea unor date empirice din care decurge
relaţia dintre scorurile obţinute la test şi cele obţinute la criteriu.
Validitatea predictivă şi luarea deciziilor
Predicţia vizează luarea unei decizii şi pentru aceasta validitatea predictivă este foarte
utilă. Atunci când dorim să luăm o decizie pentru selecţie, clasament sau plasament vom
folosi teste care ne oferă scoruri individuale pe baza cărora decidem. În acelaşi timp putem
folosi şi alte urse de informaţii. Este însă dificil să stabilim importanţa relativă a scorurilor la
teste comparativ cu informaţiile care provin din alte surse. Mulţi autori, printre care şi Brown
(1970), susţin că măsurarea validităţii predictive măreşte şansele ca o decizie luată pe baza
scorurilor unui test să fie exactă, faţă de exactitatea unei decizii luată pe baza unor alte surse
de informaţii.

IMPORTANT
Validitatea unui test este judecată în funcţie de corelaţia sa cu criteriul şi de gradul în
care scorurile criteriu nu reprezintă corect scopul propus (slăbiciunea criteriului).

EXEMPLU
Să considerăm că pentru reuşita şcolară luăm media cumulată drept criteriu de
evaluare a performanței. Dacă testul ne permite predicţia, cu un anumit grad de precizie, a
mediilor cumulate, este posibil ca membrii consiliului profesoral să nu fie în măsură să aleagă
tipul de student care va fi admis. În consecinţă, folosirea testului a oferit posibilitatea de a fi
admişi, într-o proporţie crescută, numai studenţii care vor obţine medii ridicate. Studenţii aleşi
în acest fel posedă însă şi alte caracteristici care sunt legate de capacitatea de a obţine note
ridicate. În concluzie, problema constă în avantajul de a lua decizii legate de grupuri decât de
indivizi. Validitatea este tot timpul estimată pe baza datelor grupului, şi logic enunţurile
referitoare la validitatea unui test ne vor trimite înapoi la validitatea unui ansamblu de scoruri
şi nu la scorul unui subiect.
Criteriile
În toate studiile de validitate predictivă criteriul este un element foarte important.
Interesul pentru un test predictor este tot timpul în funcţie de relaţia sa cu criteriul. Dacă un
test are menirea să măsoare un randament, va fi stabilit un standard de reuşită. Acest standard
este un criteriu. În educaţie se foloseşte frecvent media cumulată drept criteriu. Asta nu
înseamnă că nu pot fi folosite şi alte criterii ca: aptitudinea de integrare, de analiză de
evaluare, cultura generală, capacitatea de adaptare, manifestarea unei atitudini constructive în
situaţii dificile. Este simplist să apelăm la un singur criteriu. Recurgerea la mai multe criterii
ridică o problemă interesantă. Dacă criteriile sunt puternic interrelaţionate combinarea unora
dintre ele nu aduce un aport prea mare decât dacă s-ar folosi unul singur, deoarece fiecare
măsoară acelaşi lucru. Din potrivă, dacă criteriile sunt slab interrelaţionate nu este recomandat
să le combinăm, deoarece ele măsoară aspecte diferite.

54
IMPORTANT
Combinarea criteriilor ridică şi o altă problemă cunoscută sub numele de "dimensionalitate
statistică". Ghiselli (1964), evidenţiază două probleme:
- "dimensionalitatea dinamică" - un criteriu, considerat fundamental poate deveni
impropriu în timp;
- "dimensionalităţii individului" este legată de diferenţele individuale.

EXEMPLU
Doi indivizi pot face aceeaşi muncă procedând în maniere total diferite dar amândoi
fiind cotaţi la fel de bine. Specialiştii sunt astfel confruntaţi cu dilema: acceptăm două metode
de muncă la fel de valide sau una este privilegiată în detrimentul alteia.

Caracteristicile unei măsuri - criteriu


Astin (1964), face distincţia între criteriu şi măsura-criteriu. El consideră criteriul un
concept general legat de randament Acest concept trebuie să fie exprimat în termeni
operaţionali, conform unei măsuri care apoi permite determinarea validităţi unui test. De
exemplu reuşita la universitate este un criteriu conceptual, iar media cumulată este o măsură -
criteriu.

IMPORTANT
Măsura - criteriu are mai multe caracteristici:
• caracteristică foarte importantă a măsurii - criteriu este pertinenţa sa, adică validitatea
sa. Ea trebuie să reflecte şi să măsoare aspectele fundamentale ale criteriului conceptual.
Media cumulată este o măsură - criteriu validă dacă reflectă şi măsoară corect aspectele
importante ale reuşitei la universitate. Evaluarea pertinenţei unei măsuri - criteriu se face prin
procedee raţionale şi calitative. Nu există un indice cantitativ eficace pentru exprimarea
gradului de pertinenţă a unei măsuri - criteriu.
• A doua caracteristică a unei măsuri - criteriu este fidelitatea sau constanţa măsurărilor.
O măsură criteriu trebuie să fie constantă în timp indiferent de circumstanţe. O măsură -
criteriu inconstantă nu poate fi pusă în relaţie cu alta, iar indicele relaţiei cu predictorul nu va
semnifica nimic, indiferent de gradul acestuia. De exemplu, dacă folosim o măsură
inconstantă pentru determinarea productivităţii unui muncitor, atunci în cazul unei zile bune
productivitatea va fi mare şi vom supraestima valoarea sa, iar într-o zi proastă riscăm să
subestimăm valoarea sa. Alegerea unei măsuri - criteriu este supusă la cel puţin două
constrângeri:
• factorii care induc o eroare de măsurare trebuie controlaţi pentru că ei influenţează
măsurile - criteriu în acelaşi fel ca şi predictorii;
• dacă controlul acestor factori nu ne permite să obţinem o măsură stabilă este posibil să
creştem stabilitatea alegând un număr mare de măsuri - criteriu sau alegând eşantioane în mai
multe ocazii.
• A treia caracteristică a unei măsuri criteriu este absenţa contaminării. Măsurarea
criteriului se va efectua în condiţiile în care factorii non pertinenţi nu pot influenţa scorurile.
Contaminarea poate să apară uşor dacă măsura criteriu se prezintă sub forma unor scale de

55
evaluare care sunt vulnerabile datorită efectului de halo sau a tendinţei de indulgenţă.
Instrucţiuni foarte precise de forma unei descrieri detaliate a caracteristicilor de evaluat
permite diminuarea riscului de contaminare.

IMPORTANT Thorndike (1971) atrage atenţia asupra unui factor major de


contaminare. Este cazul în care scorul criteriu al unui subiect este influenţat de cunoaşterea de
către evaluator a scorului la predictor a subiectului respectiv. Thorndike aminteşte şi de
efectul acestui factor asupra randamentului la criteriu al subiectului, efect denumit "predicţie
pentru sine". Mai mult, el semnalează două tipuri de contaminare între predictor şi criteriu.

EXEMPLU
Atunci când dorim să cunoaştem dacă un test de lectură permite predicţia scorurilor la
un test de atitudine faţă de matematică, măsura criteriu va fi scorul la destul de atitudine faţă
de matematică. Dacă evaluatorul care atribuie aceste cote cunoaşte scorurile subiecţilor la
testul de lectură (predictor), evaluările sale pot fi influenţate. Riscurile de contaminare sunt
probabil mai ridicate dacă un elev a obţinut un scor ridicat la testul de lectură şi când el pare
să aibă o atitudine negativă faţă de matematică. Subliniem că problema riscă să apară dacă un
subiect obţine un scor mic la testul de lectură dar manifestă o atitudine favorabilă faţă de
matematică. Soluţia, pentru evitarea acestei situaţii este de a evita ca evaluatorul să cunoască
scorurile subiecţilor la variabila predictor.
Menţionăm că cele mai bune măsuri - criteriu sunt cele care prezintă cât mai multe
avantaje practice, care sunt simplu de folosit, care sunt disponibile şi mai puţin costisitoare.

Categorii de măsuri - criteriu


Prima categorie constă în măsurarea directă a producţiei sau a randamentului: volumul
de vânzări, numărul de clienţi pe oră sau pe zi, numărul de accidente pe lună sau pe an,
numărul de erori pe unitate, media cumulată etc.
A doua categorie este formată din randamentul la un test, cum ar fi rezultatul la un
examen sau la testele administrate de serviciile de personal din întreprinderi: scalele de
evaluare fac parte din această categorie. Subliniem că distincţia dintre cele două categorii nu
este exclusivistă. De exemplu, media cumulată poate aparţine uneia sau alteia din cele două
categorii, în funcţie de felul în care ea a fost obţinută.
În cea de-a treia categorie, măsura - criteriu aparţine unui grup. Testele de
personalitate şi în particular chestionarele de interese sunt considerate valide dacă permit o
bună clasificare a indivizilor în grupuri bine precizate. Testele de aptitudini sunt valide dacă
permit să distingem indivizii care vor reuşi faţă de cei care vor eşua într-o activitate sau într-
un program de studii dat.
A patra categorie este formată din măsurile - criteriu de natură statistică, cum ar fi
coeficienţii de saturaţie, coeficienţii de discriminare sau cei de consistenţă internă.
În concluzie, un test nu poate fi mai bun decât criteriile folosite pentru stabilirea
validităţii, pentru că toate slăbiciunile criteriilor se răsfrâng asupra testului şi îi limitează
utilitatea. Dificultatea nu constă în alegerea unei măsuri - criteriu pertinente, ci în faptul de a
nu alege doar una. Pentru ca procesul de validare să fie valabil este necesar să recurgem la
mai multe măsuri criteriu.

56
5. DETERMINAREA VALIDITĂŢII PREDICTIVE
Coeficientul de validitate

IMPORTANT
Metoda constă în a calcula corelaţia dintre scorurile la testul predictor şi scorurile la
măsura - criteriu. Calculul presupune parcurgerea a cinci etape distincte:
1. alegerea unui eşantion de subiecţi;
2. aplicarea testului predictor acestor subiecţi;
3. realizarea unor prelucrări specificate dacă este cazul;
4. Colectarea datelor la criteriu;
5. calcularea corelaţiei între scorurile obţinute la predictor şi la criteriu;
Coeficientul de corelaţie astfel obţinut este un coeficient de validitate. El este notat cu
r XY, unde r este coeficientul de corelaţie, X predictorul şi Y criteriul. Este evident că toţi
factorii care influenţează coeficientul de corelaţie pot influenţa coeficientul de validitate şi că
datele trebuie să respecte postulatele necesare calculării coeficientului de corelaţie. Doi
factori, care sunt de fapt postulate necesită o atenţie deosebită.
În primul rând ştiindu-se că coeficientul de corelaţie Pearson este cel mai des folosit,
postulatul de liniaritate dintre două variabile este primordial. Dacă mai multe variabile sunt
considerate ca fiind în relaţie liniară este necesar să verificăm această legătură înainte de a
calcula coeficientul de corelaţie. Pentru a realiza această verificare vom trasa graficul produs
de cele două variabile, fiecare axă reprezentând una din cele două variabile. Dacă relaţia nu
este liniară atunci vom transforma scorurile într-o scală sau vom folosi o altă metodă de
corelaţie pentru a estima coeficientul de validitate.
În al doilea rând vom lua în consideraţie întinderea diferenţelor individuale. Se ştie că
o mică variabilitate a scorurilor limitează valoarea pe care o poate avea un coeficient de
corelaţie. Această este o problemă majoră pentru studiul validităţii, când folosim mai multe
grupe de subiecţi. Este preferabil să folosim grupe eterogene, care prezintă o întindere mai
mare a diferenţelor individuale.
Interpretarea coeficientului de validitate
Există mai multe forme de interpretare a unui coeficient de validitate. O primă formă
constă în a compara diferiţi coeficienţi şi de a alege testul care prezintă coeficientul cel mai
ridicat pentru o situaţie dată.
O altă formă de interpretare este transformarea coeficientului de validitate în procente
de varianţă. Prin ridicarea la pătrat a coeficientului de validitate obţinem proporţia din
varianţă explicată prin acesta. Astfel, dacă rXY = 0,60 atunci r2XY = 0,36 sau o proporţie de
varianţă egală cu 0,36. Putem spune că 36% din varianţă este împărţită între două variabile,
sau că 36% din varianţa criteriului este datorată variaţiei scorurilor testului predictor.
Observăm că coeficientul de validitate trebuie să fie de circa 0,7071 pentru ca jumătate din
varianţa criteriului să fie explicată prin varianţa scorurilor la predictor. În majoritatea studiilor
găsim raportări inferioare valorii 0,7071.

EXEMPLU Wiggins (1974) prezintă un exemplu în care studiază relaţia posibilă


între scorurile la un test care măsoară dominanţa şi percepţia subiectului ca un leader, şi
raportează un coeficient de validitate de 0,61. Aceasta înseamnă că indivizii care au obţinut
un scor ridicat la testul de dominanţă sunt percepuţi ca lideri faţă de cei care prezintă scoruri
mici. Autorul estimează că circa 37% din varianţa variabilei leader poate fi prezisă pe baza

57
scorurilor la testul de dominanţă. Mai mult, el subliniază că de fapt există trei interpretări
posibile prin utilizarea unor diagrame după metoda lui Cattell (1957).
Se introduce figura 2 din carte Pag115
În fig 2a toate elementele dominanţei sunt conţinute în leader, în b toate elementele
leader sunt conţinute în dominanţă, în c, 61% din elementele leader sunt comune cu cele ale
dominanţei şi viceversa şi sunt dimensiunile unei trăsături-sursă numită extraversiune.
În realitate, este mai plauzibil să cauţi predicţia posibilităţii de a fi perceput ca un
leader pe baza scorurilor obţinute la un test de dominanţă. Aceasta ne face să presupunem ca
în fig a, că dominanţa este o componentă majoră a leaderului acoperind 37% din varianţa
explicată. Conform diagramei b presupunerea este inversată. Diagrama sugerează mai degrabă
că leaderul va fi o componentă majoră a dominanţei. Diagrama c lasă să se presupună că chiar
dacă 61% dintre elementele ambelor variabile sunt comune, influenţa unei a treia variabile,
comună celorlalte două intră în joc. Wiggins (1974), sugerează o interpretare conform căreia
dominanţa şi leaderul ar fi manifestări ale unei caracteristici mult mai profunde, ca
extraversiunea. Acest exemplu ilustrează complexitatea interpretării unei relaţii între un
predictor şi un criteriu.

O a treia formă de interpretare a unui coeficient de validitate ţine seama de


caracteristicile grupului care a fost ales, dacă testul este folosit pentru realizarea unei selecţii
(Brogden, 1946). Autorul demonstrează că pe baza postulatelor, coeficientul rXY poate fi
interpretat direct ca fiind o măsură a eficacităţii predictive, ca un raport între media scorurilor
obţinute la măsura - criteriu a grupului selecţionat şi cele ale tuturor grupelor de candidaţi
neselecţionaţi. De exemplu, să presupunem că 200 de candidaţi se prezintă pentru admiterea
la un program de studii la care nu pot fi admişi decât 75, care să fie cei mai buni. Cel mai bun
procedeu este de a accepta toţi candidaţii, pentru un timp şi apoi să procedăm la colectarea
datelor - criteriu, pentru a selecta în final acei candidaţi care scorurile - criteriu cele mai
ridicate. Media scorurilor - criteriu a grupului selectat va fi mai ridicată decât toate mediile pe
care le putem calcula pornind de la fiecare combinaţie de 75 de candidaţi din cei 200 care s-au
prezentat. Acest procedeu este bun din punct de vedere teoretic, dar în practică este imposibil
de aplicat.
Este rezonabil să aplicăm un test pentru selecţie şi să alegem 75 de candidaţi care au
obţinut scoruri ridicate la test. Coeficientul de validitate, după cum sugerează Brogden, este
egal cu raportul între randamentul mediu la criteriu, obţinut de grupul de 75 de candidaţi
admişi pe baza testului predictor şi randamentul mediu obţinut de 75 de candidaţi care ar fi
fost aleşi dacă făceam selecţia pe baza scorurilor - criteriu. Presupunem că obţinem un raport
rXY = 0,80, ceea ce semnifică că grupul ales pe baza testului predictor va avea un scor criteriu
mediu egal cu patru cincimi din cel al grupului selectat pe baza scorurilor criteriu. Metoda
porneşte de la presupunerea că toţi candidaţii obţin un scor criteriu, ceea ce în practică este
imposibil.
O altă metodă de interpretare a coeficientului de validitate constă în predicţia erorilor.
Aceasta presupune utilizarea ecuaţiei de regresie.

EXEMPLU DE CALCUL AL COEFICIENTULUI DE VALIDITATE Să presupunem că


prezentăm unui grup de 250 subiecţi un test, sub forma unei scala de măsurare a nivelului de
cultură generală. Scorurile la test sunt prezentate sub formă de note standard STEN (standard
ten) de la 1 la 10. Apoi, după un timp li se prezintă o scală de evaluare a atitudinii (gradul de
satisfacţie) faţă de introducerea unei noi specialităţi în programul de studiu. Este a scală cu 7
trepte în care 1 înseamnă o atitudine foarte defavorabilă iar 7 o atitudine foarte favorabilă.
Scorurile obţinute la această scală constituie măsuri criteriu în acest exemplu.
58
Rezultatele celor două variabile sunt prezentate sub formă de frecvenţe în tabelul
următor.
Scorurile la testul predictor (X)
Măsura-criteriu 1 2 3 4 5 6 7 8 9 10 
(Y)
7 4 4
6 2 4 2 3 1 12
5 2 2 4 8 19 5 5 45
4 6 4 1 2 1 9 5 7 1 74
2 1 3
3 9 1 1 4 2 3 1 1 42
2 0
2 7 1 1 6 6 2 1 51
8 1
1 4 3 5 4 2 18
 2 3 4 3 2 2 30 15 9 5 250
6 7 0 7 7 4

Rezumatul statistic:
X = 1108 X2 = 6324 Xmed = 4,432 SX = 2,3776
Y = 883 Y = 3601
2
Ymed = 3,532 SY = 1,3888
XY = 4460
Este suficient să calculăm coeficientul de corelaţie între X (scorurile obţinute la testul
de cultură generală) şi Y (scorurile obţinute la scala de atitudine) pentru obţinerea
coeficientului de validitate.
N  XY   X  Y 1115000  978364 136636
rXY     0,662
N X2  x  2

N Y 2  Y
2 594,4207  347,2189 206394,13
 
Putem interpreta acest coeficient în proporţii sau în procente de varianţă explicată
(0,6622 = 0,438). Putem spune că circa 44% din varianţa criteriului poate fi prezisă sau
explicată prin varianţa scorurilor obţinute la testul predictor. Acest procent de varianţă
explicată este relativ ridicat comparativ cu ceea ce întâlnim în general în studiile de validitate.
Nu este simplu să stabilim cauzele rezultatelor foarte ridicate în studiile de acest tip.
Totdeauna, putem afirma că acest coeficient a fost obţinut pe un grup la care nu s-a făcut o
preselecţie, ceea ce presupune ca am folosit toţi subiecţii care au fost disponibili.
Particularitatea acestora este aceea că permit o întindere maximă a scorurilor la testul
predictor, ceea ce are ca efect creşterea valorii coeficientului de corelaţie.

6. Validitate de conţinut
Dacă un profesor doreşte să evalueze cunoştinţele studenţilor la o materie el va
construi un test în care întrebările să cuprindă un eşantion reprezentativ a întregii materii. El
se confruntă cu problema validităţii de conţinut.

DEFINIŢIE
Validitatea de conținu se referă la gradul de reprezentativitate a eşantionului de
întrebări. Problema constă într-o analiză raţională a conţinutului testului şi se realizează prin
intermediul judecăţilor de valoare.

59
Decizia este subiectivă şi nu există un indicator numeric. Specialiştii consideră că există
două tipuri de validitate de conţinut: validitate aparentă şi validitate logică.
Validitatea aparentă se realizează prin analiza testului, efectuată de un expert care
concluzionează dacă acesta măsoară adevărate trăsătură pe care şi-a propus s-o măsoare.
Acest tip de validitate nu este cea mai importantă deoarece putem folosi alt tip de validitate
mai pertinent.
Validitatea logică în care eşantionul de itemi este stabilit într-o manieră mult mai
concretă decât în cazul validităţii aparente. În acest caz se prezintă un tabel cu specificaţiile
care conţin o definiţie clară a aspectelor măsurate, obiectivele precise şi alegerea cât mai
logică a itemilor pentru o divizare coerentă a domeniului vizat.

EXEMPLU Tabelul care urmează prezintă un exemplu cu specificaţiile pentru


măsurarea cunoştinţelor acumulate în legătură cu proprietăţile fizice ale pădurii:
obiective particulare
Cunoştinţe Cunoştinţe Cunoştinţe
subiect specifice despre despre Aplica Tota
categorii metode ţii l
Structura arborilor 10% 0 0 0 10%
Transformarea arborilor 10% 0 20% 0 30%
Caracteristicile esenţelor 20% 15% 0 10% 45%
Calculul cantităţilor 0 10% 0 5% 15%
Total 40% 25% 20% 15% 100
%

7. Validitatea teoretică
Începând cu anul 1955, Cronbach şi Meehl s-au ocupat de studierea validităţii teoretice
propusă de Asociaţie Psihologilor din America (APA) în anul precedent.

DEFINIŢIE
Validitatea teoretică este azi definită ca fiind un indicator al gradului în care un test
măsoară constructul pe care se presupune că-l măsoară.
Altfel spus, acest tip de validitate este utilă deoarece un test este construit pentru
măsurarea unei caracteristici pe care subiecţii o posedă în diferite grade. Constructul este
descris printr-o definiţie operaţională care precizează indicatorii observabili şi mijlocul prin
care aceştia pot fi măsuraţi. Deseori un test nu poate măsura toate aspectele constructului
deoarece definiţia acestuia conţine elemente foarte complexe şi vagi. Din această cauză
validitatea teoretică este stabilită printr-o acumulare de evidenţe decât printr-un singur indice.
Specialiştii în măsurare se bazează pe teoria referitoare la trăsătura măsurată şi fac predicţii
asupra comportamentului la test într-o multitudine de situaţii. Aceste predicţii sunt verificate
experimental şi dacă se dovedesc a fi exacte duc la concluzia validităţii teoretice a testului.
Dacă ele sunt false sau insuficient de exacte sunt mai multe explicaţii: sau experimentarea nu
a fost bine realizată, sau teoria care stă la baza construcţiei testului este falsă sau testul nu
măsoară constructul respectiv.
Pentru stabilirea validităţii teoretice toate sursele de predicţie pot fi folosite şi
verificate empiric. Următoarele elemente pot constitui criterii de evidenţiere a validităţii
teoretice: toate informaţiile referitoare la natura itemilor testului, omogenitatea testului,
stabilitatea tuturor condiţiilor de aplicare, date referitoare la validitatea de conţinut şi

60
validitatea predictivă, predicţiile referitoare la diferite grupuri, modificarea rezultatelor în
timp, corelaţiile dintre construct şi diferite variabile demografice şi procedeele de măsurare
folosite de test.
Validitatea teoretică a unui test poate fi cunoscută în diferite moduri în funcţie de
problema care se pune. De exemplu putem fi interesaţi de proporţia de varianţă observată care
decurge din variabila măsurară de test sau de măsura în care randamentul la test coincide cu
gradul de prezenţă a caracteristicii pe care presupunem că o măsurăm.
Metode devstudiere a valiității teoretice
Pentru realizarea acestor constatări există posibilitatea folosirii mai multor metode:
metode intratest, metode intertest, metode criteriale, manipulări experimentale şi studii de
generalizabilitate etc.
Metodele intratest vizează stabilirea validităţii de conţinut în funcţie de definiţiile
operaţionale ale constructului şi studii de omogenitate a testului cu ajutorul indicelui de
consistenţă internă, prin determinarea fie a coeficientului alpfa fie a coeficientului Kuder-
Richarson.
Metodele intertest studiază corelaţiile dintre mai multe teste pentru a verifica dacă ele
măsoară acelaşi construct. Este vorba de a stabili validitatea congruentă corelând scorurile
obţinute la noul test cu cele ale unui test bine cunoscut. Dacă corelaţia este ridicată, putem
presupune că noul test măsoară acelaşi construct ca şi testul deja recunoscut pentru calităţile
sale de măsurare. Aceste metode folosesc şi studiile de analiză factorială, tehnică statistică
utilizată pentru a determina numărul de factori, pe baza cărora putem explica intercorelaţiile
unui ansamblu de teste. Tehnica permite determinarea numărului de factori şi explică mai
bine scorurile obţinute la fiecare din teste precizând gradul de varianţă între scorurile
explicate de fiecare factor (cât la sută din varianţa totală este acoperită de varianţa fiecărui
factor). Testele care au în comun o varianţă ridicată sunt cele care măsoară acelaşi construct.
Dacă această tehnică este folosită pentru a studia validitatea, putem vorbi de validitate
factorială ca un aspect al validităţii teoretice.

EXEMPLU În tabelul de mai jos şase subteste, componente ale aceluiaşi test:
1 2 3 4 5 6
1.Reprezentare spaţială 1,00 0,37 0,27 0,47 0,59 0,35
2. Raţionament 1,00 0,37 0,46 0,42 0,43
3. Vocabular 1,00 0,31 0,27 0,63
4. Simţ mecanic 1,00 0,52 0,42
5.Percepţia dimensiunilor 1,00 0,37
6. Logică verbală 1,00

Constatăm că reprezentarea spaţială, măsurată cu ajutorul testului este relativ în legătură cu


percepţia dimensiunilor (r = 0,59), iar rezultatele la proba de vocabular sun în legătură cu cele
de la logică verbală (r = 0,63). Se observă prezenţa a doi factori principali iar testul format din
şase subteste măsoară în realitate doi factori. O analiză factorială prin metoda componentelor
principale (Hotteling) şi a rotaţiei factorilor prin metoda varimax permite următoarele
constatări. Datele sunt prezentate în tabelul de mai jos.

FACTOR 1 FACTOR 2
1. Reprezentare spaţială 0,78 0,12
2. Raţionament 0,54 0,46
3. Vocabular 0,11 0,89

61
4. Simţ mecanic 0,73 0,29
5.Percepţia dimensiunilor 0,84 0,15
6. Logică verbală 0,27 0,84

Numerele prezentate în tabel reprezintă coeficienţii de saturaţie, care sunt interpretaţi


ca coeficienţi de corelaţie între factori şi variabile. Testul original este considerat un test de
aptitudini pentru studii secundare. Dar rezultatele analizei factoriale arată evident că sunt două
teste omogene fiecare măsurând un construct. Primul este compus din itemi care măsoară
reprezentare spaţială, simţul mecanic şi percepţia dimensiunilor. Acest construct poate fi
numit "aptitudini pentru ştiinţe tehnice". Al doilea test este compus din itemi care măsoară
vocabularul şi logica verbală, iar constructul măsurat poate fi numit "aptitudine verbală".
altă abordare, folosită în contextul metodelor interteste, constă în studierea validităţii
convergente şi divergente, propusă de Campbell şi Fiske. Validitatea convergentă permite să
demonstrăm că două teste măsoară acelaşi construct, în timp ce validitatea divergentă constă
în a demonstra independenţa sau lipsa de corelaţie a unui test cu alte teste care măsoară un
construct diferit.
Studiile de validitate predictivă, care vizează stabilirea legăturii dintre predictor şi
criteriu, adică predicţia criteriului pe baza scorurilor obţinute la test, sunt indicatori buni ai
constructului măsurat de test. Această tehnică este deseori folosită pentru construirea
inventarelor de interese generale sau profesionale şi a testelor de personalitate. În aceste teste
trebuie introduşi itemi care diferenţiază cu adevărat grupurile şi care vor permite descrierea
psihologică a subiecţilor după randamentul la test.
Studiile de generalizabilitate sunt foarte complexe, dar în acelaşi timp foarte
complete. Un model este studiul de validitate "multităsături-multimetode" propus de
Campbell şi Fiske. Această tehnică se bazează pe principiul în baza căruia un test măsoară un
construct folosind o metodă particulară. Rezultatele la test pot fi dependente de constructul
măsurat, de metoda utilizată sau de combinaţia celor două. Deci, dacă vom compara trăsătura
care ne interesează cu alte trăsături, folosind diferite metod, rezultatele pot fi variabile. Este
vorba de fapt de studierea validităţii convergente, a validităţii divergente şi a omogenităţii
testului.

EXEMPLU
Dacă cu ajutorul a trei teste măsurăm trei trăsături, respectiv gradul de liberalism (A),
cultura generală (B), şi alienarea (C), aplicând aceluiaşi grup de subiecţi trei metode diferite:
metoda (I), cu răspunsuri la alegere, metoda (II), prin care se cere să se răspundă cu adevărat
şi fals şi metoda (III), care presupune completare de fraze obţinem următoarele rezultate:
METODA I METODA II METODA III
Trăsături A1 B1 C1 A2 B2 C2 A3 B3 C3
MET I A1 0,87
B1 0,64 0,80
C1 0,28 0,31 0,82
MET II A2 0,71 0,58 0,27 0,85
B2 0,25 0,66 0,32 0,61 0,78
C2 0,11 0,22 0,72 0,43 0,32 0,79
MET A3 0,70 0,30 0,08 0,68 0,52 0,37 0,81
III
B3 0,27 0,66 0,09 0,57 0,70 0,28 0,65 0,79
C3 0,09 0,12 0,67 0,19 0,24 0,64 0,47 0,38 0,80

62
Acest tabel prezintă pe diagonala principală coeficienţii de fidelitate. Se observă că
pentru metoda (I) fidelitatea pentru cele trei teste este de 0,87, 0,80 şi respectiv 0,82.
Din tabel putem desprinde patru categorii de rezultate:
Prima categorie este evidenţiată de diagonala principală unde sunt prezentate
estimările fidelităţii pentru fiecare test şi pentru fiecare metodă (acelaşi test, aceeaşi metodă).
Observăm că aceşti coeficienţi au valori ridicate şi stabile.
A doua categorie este formată din corelaţiile dintre trăsături diferite măsurate prin
metode diferite. Aceste sunt corelaţiile:
rA1, B2 = 0,25, rA1, C2 = 0,11, rB1, C2 = 0,22, rA1, B3 = 0,27, rA1, C3 = 0,09, rB1, C3 = 0,12,
rA2, B3 = 0,57, rA2, C3 = 0,19, rB2, C3 = 0,24, rB1, A2 = 0,58, rC1, A2 = 0,27, rC1, B2 = 0,32,
rB2, A3 = 0,52, rC2, A3 = 0,37, rC2, B3 = 0,28, rB1, A3 = 0,30, rC1, A3 = 0,08, rC1, B3 = 0,09.
Toate aceste valori ajută la studierea validităţii divergente, care este foarte mică faţă de
corelaţiile aceeaşi trăsături măsurată prin metode diferite (rA1, A2 = 0,71).
A treia categorie este formată din corelaţiile dintre diferite trăsături măsurate prin
aceeaşi metodă:
rA1, C1 = 0,28, rB1, C1 = 0,31, rA2, B2 = 0,61, rA2, C2 = 0,43, rA1, B1 = 0,64, rA3, B3 = 0,65,
rA3, C3 = 0,47, rB3, C3 = 0,38, rB2, C2 = 0,32.
Aceste corelaţii sunt măsuri ale varianţei care decurge din metodele folosite.
A patra categorie este formată din corelaţiile dintre aceeaşi trăsătură şi diferite
metode:
rA1, A2 = 0,71, rB1, B2 = 0,66, rC1, C2 = 0,72, rA2, A3 = 0,68, rB2, B3 = 0,70, rC2, C3 = 0,64.
Aceşti coeficienţi sunt folosiţi pentru studierea validităţii convergente.
Pe baza acestor rezultate putem face următoarele constatări:
1. Coeficienţii de fidelitate trebuie să aibă valori ridicate, la fel şi corelaţiile aceleiaşi
trăsături măsurate prin diferite metode.(vezi diagonala principală şi corelaţiile
rA1, A2 = 0,71, rB1, B2 = 0,66, rC1, C2 = 0,72, rA2, A3 = 0,68, rB2, B3 = 0,70, rC2, C3 = 0,64). Mai mult
coeficienţii de corelaţie ale aceleiaşi trăsături măsurate prin diferite metode trebuie să fie mult
mai mari decât corelaţiile dintre trăsături diferite măsurate prin aceeaşi metodă (r A1, A2 = 0,71
mai mare faţă de rB1, A2 = 0,58 şi de asemeni mai mare decât rC1, A2 = 0,27 etc). Altfel spus
diferenţele dintre trăsături trebuie să fie mult mai importante decât diferenţele dintre metode.
2. Coeficienţii de corelaţie ale aceleiaşi trăsături măsurate prin diferite metode trebuie
să fie mai mari decât corelaţiile dintre trăsături diferite măsurate prin metode diferite (rA1, A2 =
0,71 mai mare faţă rA1, B2 = 0,25, şi de asemeni mai mare decât rA1, C2 = 0,11 etc).
3. Corelaţiile dintre trăsături diferite trebuie să fie mici (rA1, C1 = 0,28), şi corelaţiile
dintre trăsături diferite trebuie să fie foarte mici faţă de corelaţiile faţă de măsurile aceleiaşi
trăsături (rA1, C1 = 0,28 mai mic faţă de rA1, A2 = 0,71).
Vom spune că există validitate convergentă dacă obţinem corelaţii ridicate între
măsurile aceleiaşi trăsături obţinute prin diferite metode (rA1, A2 = 0,71, rA1, A3 = 0,70) şi există
validitate divergentă dacă obţinem corelaţii scăzute între trăsături diferite măsurate prin
aceiaşi metodă (rA1, C1 = 0,28).
Efectul metodei este relevant dacă corelaţiile testele care măsoară trăsături diferite sunt
mai ridicate pentru aceiaşi metodă decât pentru metode diferite. De exemplu putem vorbi de
un efect al metodei dacă rA1, C1 = 0,28 sau rB1, C1 = 0,31 sunt mai mari decât rA1, C2 = 0,11 şi rb1,
C2 = 0,22. În acest caz putem vorbi de un "efect de halo" metodologic care se manifestă prin
tendinţa de supraestimare a corelaţiilor dintre variabilele măsurate prin aceleaşi metode.
Specificăm că în contextul validităţii de construct fidelitatea testului este definită ca
fiind gradul de concordanţă dintre două măsurări a aceleiaşi trăsături cu aceiaşi metodă, iar
validitatea este definită prin gradul de concordanţă între două măsurări ale aceleiaşi trăsături
prin metode diferite.

63
8 Evaluarea şi interpretarea validităţii unui test în contextul selecţie şi clasării
subiecţilor.
Un avantaj al cercetării corelaţionale a validităţii este posibilitatea predicţiei scorurilor
criteriu pentru un subiect pe baza scorurilor la testul predictor. În practica psihologică se pune
problema estimării unui rezultat viitor (y) pe baza unei informaţii actuale (x) despre o
persoană. Problema care se pune este în ce măsură informaţia (x) ne spune ceva despre
performanţa viitoare (y). Aceasta este o problemă de predicţie sau prognostic, problemă
importantă pentru inferenţa statistică.

EXEMPLU
În tabelul ne mai jos sunt prezentate cotele obţinute de un grup de elevi la testul
matrici progresive Raven şi notele la matematică. Testul Raven dă indicaţii asupra capacităţii
intelectuale a elevilor iar notele şcolare exprimă gradul de reuşită la matematică.
x COTE RAVEN
y 31-34 35-38 39-42 43-46 47-50 51-54 55-58 59-62
10 x
NOTE 9 xx x xx
8 x xxx
MAT 7 x xxxx xx xx
E
6 xx x xxx xxx x x x
5 x x

Rezultă un nor de puncte, care ne permite să facem o apreciere intuitivă despre forma relaţiei
dintre cele două variabile.
Pentru simplificare, putem ajusta o dreaptă norului de puncte obţinut. Această dreaptă,
care exprimă tendinţa punctelor de pe diagrama de dispersie, se numeşte linie de regresie.
Calculul obişnuit de corelaţie se bazează pe un model liniar de regresie, ceea ce însemnă că
tendinţa norului de puncte poate fi exprimată satisfăcător printr-o dreaptă. Această dreaptă
este o aproximaţie.
Gradul de legătură dintre două variabile este dat de coeficientul de corelaţie. Dar,
coeficientul de corelaţie indică numai gradul de paralelism între două colecţii de date (x şi y),
faptul că ele variază într-un anumit fel una faţă de alta. În cazul problemelor de predicţie una
din variabile are statutul de variabilă independentă sau predictor (în exemplu x, cota la Raven)
şi este cunoscut dinainte de experimentator. În cazul corelaţiei nu există o distincţie netă între
cele două tipuri de cote, nu se ştie care din variabile este responsabilă de variaţia celeilalte,
deci nu se ştie care este variabila independentă.
În cazul exemplului prezentat, cotele la testul Raven constituie variabila indepandentă,
deoarece inteligenţa este factorul care explică în bună măsură reuşita şcolară la matematică.
Coeficientul de corelaţie între cele două variabile este de 0,68 (net semnificativ). Dacă
o corelaţie este zero sau apropiată de zero, atunci nu se poate face o predicţie de la un factor la
altul, deoarece cunoaşterea unuia nu ne spune nimic despre celălalt. Prezenţa unei corelaţii
semnificative (r  0,50) implică faptul că dacă ştim ceva despre x putem şti ceva şi despre y,
între ele fiind un paralelism. La fel , dacă ştim ceva despre y putem şti ceva despre x. S-ar
putea însă ca paralelismul lor să se datoreze unui al treilea factor.
Predicţia liniară simplă presupune o ecuaţie de regresie pentru un singur predictor.
Ecuaţia de regresie este: Y = a + b XY X.

64
Y = scorul criteriu prezis pentru un subiect
X = scorul la testul predictor
a = o constantă datorată diferenţei dintre X med şi Y med
b X Y = coeficientul de regresie
Dacă a = 0 atunci b X Y = r X Y (coeficientul de regresie este egal cu cel de corelaţie
predictor - criteriu).
Această ecuaţie este utilizată pentru note brute. Dacă folosim note standard ecuaţia
devine:
YZ = r X Y ZX
Dreapta care reprezintă o curbă de regresie
DREAPTA DE
Y REREGRESIE

b YX
a

0 X

APLICAŢIE
Să presupunem că suntem în posesia următoarelordate:
Media scorurilor la testul Raven Xmed = 47,576
Abaterea standard a scorurilor la testu Raven SX = 7,698
Nota matematică a unui elev Ymed =7,030
Abaterea standard a notelor la matematică SY = 1,287
Corelația dintre scorurile la testul Raven și notele la matematică rYX = 0,69554

Formulele importante pentru determinarea ecuaţiei de regresie liniară simplă, cu un singur


predictor sunt:

b Y X = r XY* a = Ymed - [Xmed (bYX)]

b Y X = 0,695 *
a = 7,030 - [47,576 x 0,116] = 1,511
Ecuaţia de regresie este Y = a + b XY X = 1,511+0,116 X
Dacă X este 44 pentru un subiect atunci Y = 1,511+0,116 x 44 = 6,615

65
Dacă se folosesc note standard Z atunci a = 0 iar b X Y = r X Y
Ecuaţia are forma ZY = r X Y ZX
X i  X med 44  47,576
  0,46
Pentru cota brută X = 44 atunci ZX = S X 7, 698
ZY = 0,69554 x (-0,46) = - 0,319
1  r 2 XY  1  0,6952 
Eroarea standard de estimare este S est = SY = 1,287 =0,925
Deci pentru un scor X = 44, Y = 6,615 şi S est = 6,615 putem stabili că 68% dintre subiecţii
care prezintă un scor la predictor egal cu 44 va obţine un scor la criteriu situat între 6,615 
1(0,925) adică între 7,54 şi 5,69. De asemenea, în acest caz 95% dintre scorurile criteriu se
situează între 6,615  1,96 (0,925) adică între 8,428 şi 4,802.
Predicţia multivariată şi regresia multiplă
În acest caz este vorba de o estimare a nivelului variabilelor criteriu în funcţie de
performanţele la mai multe variabile ale testele din bateria folosită pentru predicţie. În
practica psihologică este foarte dificilă realizarea unei predicţii pornind de la datele oferite de
o singură probă, folosind o singură variabilă. Frecvent, se utilizează o informaţie mai bogată,
provenită de la probe diferite, care sunt reunite într-o baterie de teste. În alţi termeni, se pune
problema de a prognostica o variabilă, de exemplu emotivitatea; pornind de la o combinaţie
de date oferite de mai multe teste. Predicţia reuneşte informaţii multiple, fiind tradusă într-o
cotă globală care însumează datele obţinute în urma testări psihologice. Dar, în obţinerea
acestei cote globale probele utilizate nu au ponderi egale. Când utilizăm o baterie de teste,
variabilele măsurate vor avea ponderi diferite în elaborarea predicţiei. Din această cauză
predicţia trebuie să se bazeze pe suma ponderată a cotelor obţinute în testarea psihologică.
Luându-se în consideraţie faptul că prin folosirea mai multor probe obţinem cote globale
rezultate din reunirea cotelor parţiale, nu putem combina cote brute diferite, deoarece acestea
sunt exprimate în unităţi de măsură diferite. Acesta este motivul pentru care cotele brute
trebuie transformate în cote Z care oferă posibilitatea raportării la acelaşi sistem de referinţă.
Dacă vom proceda la simpla însumare a cotelor Z, atunci vom atribui ponderi egale datelor
obţinute. Problema care se pune este de optimiza predicţia luându-se în consideraţie
informaţiile cele mai relevante. Deci, se pune problema de a dispune de un set de ponderi care
să maximizeze corelaţia dintre variabila dependentă şi suma cotelor obţinute la teste. Predicţia
nu face decât să rezume corelaţia dintre suma ponderată a cotelor la testele din bateria folosită
şi variabila dependentă. Această corelaţie este dată de coeficientul de corelaţie multiplă şi
permite calcularea ponderilor care facilitează o corelaţie maximă între variabila dependentă şi
suma cotelor la teste. Pe baza corelaţiei multiple R se poate aprecia contribuţia relativă a
variabilelor test la predicţia variabilei dependente. Coeficientul R2 indică proporţia din
varinaţa variabilei dependente explicabilă prin combinarea datelor obţinute la teste. Apoi
trebuie să se stabilească contribuţia relativă a fiecărei variabile test, care nu poate fi dedusă
imediat din simpla citire a coeficienţilor de regresie. Fiecare variabilă test prezintă o
contribuţie directă şi una indirecă la realizarea prognosticului. În practică predicţia realizată se
datorează unui număr mic de variabile test. Prin urmare contribuţia esenţială în predicţie
revine unui număr redus de variabile din combinaţia de variabile utilizate. Se reţin variabilele
care prezintă o corelaţie ridicată cu variabila dependentă şi corelaţii reduse cu celelalte
variabile.
Calcularea coeficienţilor de regresie  oferă posibilitatea scrierii ecuaţiei de predicţie a
variabilei dependente pornind de la variabilele test în cote standardizate.
Ecuaţia de predicţie este Z Y = 1Z1 + 2Z2 + 3Z3 + .......+  n Z n
Unde : Z Y = variabila criteriu în cote standardizate
Z1, Z2, Z3 .... . Z n rezultatele la teste exprimate în cote standardizate

66
1, 2, 3 ........n coeficienţii de regresie parţială
Avantajele aplicării studiului corelaţionat la validitate se referă la obţinerea unui indice
cantitativ care descrie relaţia dintre predictor şi criteriu pentru un grup dat. Mai mult este
posibilă predicţia unui scor criteriu potenţial pentru fiecare subiect cu ajutorul ecuaţiei de
regresie
Dezavantajele sunt legate de faptul că dacă relaţia dintre predictor şi criteriu nu este
liniară trebuie să se utilizeze tehnici speciale şi mult mai complexe. O altă limită a acestei
metode provine din faptul că un coeficient de validitate nu ne permite să obţinem o evaluare
directă şi justă a deciziilor, deoarece luarea deciziilor este fondată pe utilizarea unui test.
Trebuie să subliniem că valoarea unui coeficient de validitate, atunci când utilizăm un test,
depinde de proporţia de subiecţi selecţionaţi şi de proporţia de subiecţi care vor reuşi la test.

TEST DE AUTOEVALUARE:
Apreciați valoarea de adevăr a următoarelor afirmații:
1.Un avantaj al cercetării corelaţionale a validităţii este posibilitatea predicţiei scorurilor
criteriu pe baza scorurilor la testul predictor:
a.ADEVĂRAT
b.FALS
2. În ecuația de predicție cu "y" se noteză predictorul.
a.ADEVĂRAT
b.FALS
3. Validitatea divergentă constă în a demonstra independenţa sau lipsa de corelaţie a unui test
cu alte teste care măsoară un construct diferit.
a.ADEVĂRAT
b.FALS
4. În ecuația de predicție cu "x" se noteză criteriul.
a. ADEVĂRAT
b.FALS
5. Validittea de construct depinde de consistența interna a testului.
a.ADEVĂRAT
b.FALS
6. În ecuația de predicție cu "a" reprezintă coeficientul de regresie.
a.ADEVĂRAT
b.FALS
7. Coeficienţii de saturaţie în analiza factorială sunt interpretaţi ca și coeficienţi de corelaţie
între factori şi variabile.
a.ADEVĂRAT
b.FALS
8. În ecuația de predicție cu "b X Y" reprezintă panta de regresie de regresie
a.ADEVĂRAT
b.FALS
9. Validitatea congruentă corelând scorurile obţinute la noul test cu cele ale unui test bine
cunoscut.
a.ADEVĂRAT
b.FALS
67
10. Testele care au în comun o varianţă ridicată sunt cele care măsoară acelaşi construct.
a.ADEVĂRAT
b.FALS
11. Validitatea convergentă permite să demonstrăm că două teste măsoară acelaşi construct.
a.ADEVĂRAT
b.FALS
12.Fidelitate mare este o condiţie necesară dar nu suficientă pentru o validitate mare.
a.ADEVĂRAT
b.FALS
13. Predicţia pentru sine după Thorndike presupune evaluarea scorului la criteriu fară ca
evaluatorul să cunoască corul la predictor.
a.ADEVĂRAT
b.FALS
14. Dacă între predictor ți criteriu este o cotelație de 0,7, atunci 36% din varianăa criteriului
este explicată de varianta predictorului.
a.ADEVĂRAT
b.FALS
15. Validitatea vizează pertinența măsurării.
a.ADEVĂRAT
b.FALS
16. Un test poate avea fidelitate mare dar validitate mică.
a.ADEVĂRAT
b.FALS

68
Unitatea de învățare 6
STANDARDIZAREA TESTELOR

1. SEMNIFICAŢIA STANDARDIZĂRII

Standardizarea unui test presupune respectarea unor norme.

IMPORTANT
Normele sunt seturi de scoruri obţinute de subiecţii eşantioanelor studiate.
Standardizarea este importantă pentru că permite interpretarea psihologică a scorurilor şi
pornind de la aceasta se pot face interpretări.

EXEMPLU
Să presupunem că un subiect obţine la un test de inteligenţă scorul 10. Dacă scorul de
10 a fost obţinut doar de 2% din subiecţii populaţiei generale, se situează în topul celor mai
bune scoruri. În acest caz este evident că acea persoană are un nivel ridicat de inteligenţă.
Dacă însă scorul de 10 se plasează la extrema cealaltă, cu cele mai mici scoruri (după
scorurile obţinute de 98% dintre subiecţi) putem spune că subiectul are un nivel scăzut de
inteligenţă.
Fără existenţa normelor este imposibil să cunoaştem semnificaţia scorului.
Standardizarea testelor este esenţială. Ea este folosită pentru utilizarea practică a testelor, cum
ar fi în luarea unor decizii în ceea ce priveşte orientarea profesională sau selecţia personalului.
Normele sunt necesare şi atunci când testele sunt utilizate pentru un scop precis, cum ar fi de
exemplu selecţia militarilor care vor participa la o anumită operaţiune armată.

IMPORTANT

Există o aplicaţia a testelor în care standardizarea nu este importantă, şi anume în


analiza psihometrică a diferenţelor individuale - studiul ştiinţific al atributelor umane,
abilităţilor, personalităţii, motivaţiei şi dispoziţiei. Pentru aceste aplicaţii psihometrice ale
teoriei psihologice, scorurile brute, directe sunt satisfăcătoare, iar transformarea lor în norme
ar duce la pierderea de informaţii.

2. PROBLEME ALE STANDARDIZĂRII


Normele folosite pentru interpretarea semnificaţiei scorurilor unui test trebuie să fie
precise. Dacă, conform normelor, un scor este obţinut de primii 20% dintre subiecţii
populaţiei acesta poate sau nu să fie reprezentativ pentru norma grupului. Dacă normele nu
sunt clare, ele pot duce la o interpretare greşită. Acest pericol apare în domeniul clinic şi
psihiatric, unde există teste care sunt folosite pentru stabilirea diagnosticului. Dacă un copil
este orientat spre o anumită formă de educaţie pe baza scorurilor obţinute la teste, este
important ca normele să fie clare.
Înainte de a descrie tehnicile de standardizare şi varietatea normelor care pot fi
utilizate considerăm că este necesar să facem o precizare. Faptul că testele psihologice pot fi
uşor standardizate ne dă posibilitatea să facem comparaţii precise cu normele grupurilor.

69
IMPORTANT

Normele sunt necesare pentru testele psihologice pentru că nu există un zero absolut al
scalelor de măsurare. Multe forme de măsurare au un zero absolut, lungimea, greutatea pot fi
măsurate cu o astfel de scală. Lipsa lui zero absolut ar face ca măsurarea să fie imprecisă şi
neştiinţifică.

3. EŞANTIONAREA ÎN STANDARDIZARE
Eşantionarea este un factor crucial al standardizării unui test. Calitatea normelor
depinde de adecvarea la eşantionul pe care acestea se bazează. În eşantionare sunt două
variabile importante: mărimea şi reprezentativitatea.

IMPORTANT

Eşantionul normativ trebuie să fie o bună reflectare a populaţiei pe care o reprezintă şi


trebuie să fie suficient de mare pentru ca erorile standard ale statisticii descriptive, adică ale
mediei, abaterii standard şi distribuţiei, să fie neglijabile.
Pentru reducerea erorilor standard o mărime a eşantionului de 500 de subiecţi este mai
mult decât adecvată. Reprezentativitatea eşantionului este independentă de mărimea acestuia.
Totuşi un eşantion mic nu poate fi cu adevărat reprezentativ pentru o populaţie mare. Normele
pentru o populaţie generală trebuie să fie realizate pe eşantioane foarte mari, pentru o
reprezentare clară, dar pentru populaţii cu variaţii mici sau pentru grupurile omogene, aceste
norme pot fi realizate pe eşantioane mai mici.

EXEMPLU

Pentru 5000 de profesori universitari, un eşantion de 500 de subiecţi este reprezentativ.


Alegerea mărimii adecvate a eşantionului reprezentativ nu se face în manieră absolută.
Eşantionul depinde de populaţie, de mărimea şi omogenitatea acesteia. Astfel, profesorii de
chimie sunt mai omogeni decât populaţia de profesori în general şi ar putea fi reprezentată de
un eşantion mic.

IMPORTANT

Un eşantion mic dar reprezentativ este superior unuia mare dar nereprezentativ. O
valoare mică a erorii standard nu are nici o valoare dacă valorile observate nu sunt clare.

4. METODE DE EŞANTIONARE
O populaţie eterogenă este o populaţie generală, în care există mai multe subseturi de
persoane care diferă unele de altele. Obţinerea unui eşantion pentru o populaţie generală este
cea mai dificilă problemă de eşantionare, pentru că trebuie obţinut un eşantion reprezentativ
pentru populaţia respectivă.

70
a. Eşantionarea întâmplătoare / prin randomizate

IMPORTANT
Un eşantion este întâmplător dacă există şanse egale ca orice individ să fie ales ca
membru al eşantionului.
Dacă eşantionul este suficient de mare acesta poate fi într-adevăr reprezentativ pentru
populaţia pentru care a fost desemnat. Dacă nu cunoaştem care sunt categoriile importante ale
populaţiei pentru care vrem să realizăm eşantionul, atunci eşantionul întâmplător este cea mai
simplă metodă pentru a asigura reprezentativitatea.

EXEMPLU

Să presupunem că dorim să realizăm un eşantion al copiilor cu vârsta de 11 ani din


Zair pentru a standardiza testele pentru această vârstă. Ca noi veniţi în ţara respectivă nu aven
informaţii despre variabile importante care pot afecta învăţarea în şcoală, de acea un eşantion
randomizat este cel mai indicat pentru a obţine un eşantion reprezentativ. În această situaţie se
obţine o listă a şcolilor primare din zonele reprezentative pentru această ţară. Şcolile sunt
numerotate şi se aleg la întâmplare numere pentru a selecta şcolile. Apoi toţi copii de 11 ani
din aceste şcoli selectate vor fi testaţi. În acest caz testarea se realizează pe un număr fix de
copii şi eşantionul va cuprinde aproximativ 1000 de copii.
Acest exemplu ilustrează un aspect important al eşantionării întâmplătoare, şi anume
asigurarea şanselor egale pentru toţi indivizii din populaţie pentru a fi selectaţi în eşantion.
Este imposibil să obţinem o listă a copiilor cu vârsta de 11 ani şi aceasta, de fapt, este
principala dificultate a eşantionării întâmplătoare: cum obţinem o listă preliminară din care să
realizăm ulterior eşantionare sau, în limbaj de eşantionare, cum definim populaţia.
Definirea populaţiei
Nu este suficient să definim teoretic o populaţie. Acest lucru pare uşor, de exemplu,
populaţia Marii Britanii conţine toate persoanele care locuiesc în ţara respectivă. Este necesar
să avem câteva definiţii operaţionale sau definiţii concrete. Ar fi nevoie de o listă, dar unde ar
putea fi găsită? Dacă am reduce discuţia, pentru moment, doar la persoanele adulte nu am
avea la dispoziţie nici o listă. Listele de vot sunt incomplete, cartea de telefon cuprinde numai
o parte din populaţie. După cum se vede o definiţie operaţională a populaţiei generale nu este
uşor de dat.
Dacă dorim să stabilim norme speciale pentru teste, şi atunci este necesar să realizăm o
eşantionare specială a populaţiei. Din nou definirea teoretică şi operaţională poate fi dificilă.
Dacă dorim să facem un studiu al criminalităţii, este posibil să obţinem o listă a celor aflaţi în
închisoare, să eliminăm ceilalţi delicvenţi, rămânând numai cei din închisori. Apoi vom alege
la întâmplare eşantionul de criminali. În acest caz există posibilitatea de definire clară a
populaţiei de criminali din închisoare. Dacă dorim să stabilim şi norme legate de aspectul
schizofrenic, această listă nu este suficientă, deoarece va fi imposibil să desemnăm un
eşantion reprezentativ din populaţia de criminali aflaţi în închisoare.
Bazele pentru definirea populaţie pot fi variate. My Ghaian consideră că pentru a
defini populaţia de copii din şcoală putem folosi fie o listă a copiilor fie o listă a şcolilor. Un
eşantion randomizat plecând de la lista şcolilor este mai uşor de obţinut. Dacă aceste unităţi

71
sunt prea mari se va la o eşantionare aleatorie a membrilor fiecărei dintre unităţi. Şcolile sunt
unităţi suficient de mici pentru a putea fi folosite ca bază pentru realizarea unei eşantionări
întâmplătoare a copiilor.

Desemnarea unui eşantion dintr-o populaţie

IMPORTANT

Procedura standard pentru a ne asigura că fiecare membru al listei va intra în eşantion


este aceea de a folosi o listă de numere întâmplătoare. Fiecare individ din populaţie primeşte
un număr care poate fi apoi extras din lista de numere. Această procedură poate fi realizată cu
ajutorul computerului.
Este posibilă selecţia eşantionului pe intervale sau prin fixarea proporţiilor de
populaţie din eşantion, doar dacă poziţia subiecţilor din listă a fost randomizată.
În concluzie, eşantionarea aleatorie se poate realiza doar dacă există o listă adecvată a
populaţiei. Pentru a ne asigura că eşantionul este reprezentativ, acesta trebuie să fie suficient
de mare. Aceasta înseamnă că folosirea eşantionării aleatorii pentru stabilirea normelor de
standardizare este consumatoare de timp şi costă prea mult, fiind preferată eşantionarea
stratificată.

b. Eşantioanele stratificate

DEFINIŢIE
Eşantionarea stratificată implică divizarea unei populaţii eterogene într-un număr de
mai multe populaţii omogene, aceste eşantioane de populaţii omogene putând fi combinate
pentru a o forma un eşantion reprezentativ al întregii populaţii.
Deoarece populaţiile omogene implică eşantioane mici reprezentative, eşantionul
stratificat este mai reprezentativ ca mărime în comparaţie cu eşantionul aleator.

IMPORTANT
Reprezentativitatea eşantionului stratificat depinde de variabilele utilizate pentru
stratificare. Dacă sunt folosite prea multe variabile eşantionul va fi foarte mare. Dacă sunt
utilizate variabile greşite atunci eşantionul nu va mai fi reprezentativ.
Există o regulă simplă pentru selecţia variabilelor de stratificare: ele trebuie să fie
corelate cu variabilele care sunt studiate şi trebuie să micşorăm numărul de stratificări. Câteva
exemple vor clarifica aceste reguli:
Pentru a ilustra problema obţinerii unui bun eşantion stratificat pentru populaţie, vom
analiza normele testului de inteligenţă Lorge-Thorndike. Scorurile la test trebuie să fie
corelate cu vârsta şi vom analiza cum autorii au eşantionat fiecare grup de vârstă.

72
EXEMPLU

Definirea populaţiei: Comunităţile formează baza eşantionării. Pentru a obţine un eşantion


reprezentativ al acestor comunităţi se va folosi o eşantionare stratificată.

Variabilele de stratificare: Bazele stratificării sunt reprezentate de factorii care corelează


cel mai înalt cu scorul la testul de inteligenţă, în comunităţi:
a. nivelul de cultură generală;
b. proporţia diferitelor profesiuni;
c. procentajul de proprietari de locuinţe;
d. mediana valorii ratei la casă.

Fiecare comunitate a fost clasificată în funcţie de aceste 4 variabile în 5 categorii de la


foarte ridicat la foarte scăzut. Stratificarea eşantionului pe aceste baze s-a realizat pentru 44 de
comunităţi şi fiecare copil din fiecare grup din eşantioanele comunităţilor a fost testat pentru
stabilirea normelor.

Rezultă un număr de 11.000 de subiecţi pentru fiecare grup, pentru vârste de la 6 la 17 ani,
deci în total 136.000.

Comentarii:

Metoda de eşantionare trebuie să plece de la un eşantion reprezentativ al comunităţilor


şi apoi de la un eşantion reprezentativ al copiilor pentru fiecare dintre comunităţile alese.
Realizarea unui eşantion reprezentativ pentru o populaţie necesită selectarea unui număr mare
de subiecţi, ceea ce implică costuri ridicate şi timp. O astfel de standardizare stă la baza
construirii testelor.

În acest caz stratificarea s-a bazat pe variabile care corelau ridicat cu inteligenţa. Dacă
ar trebui să stabilim normele pentru un test de anxietate am folosi alte criterii de stratificare.
Thorndike şi Lorge au folosit ca normă clasa socială pentru împărţirea pe subgrupe şi pentru a
face comparaţia între ele. Aceste norme s-au dovedit a fi mai utile decât cele generale.
Acest test este un bun exemplu pentru eşantionarea stratificată. Criteriul de stratificare
nu este acelaşi pentru un test de anxietate. Vom examina în continuare eşantionul populaţiei
generale pentru un test de personalitate “16 PF” (Cattell, Eber & Tatsuoka, 1970).

EXEMPLU

Autorii a considerat că un eşantion mic, bine stratificat este superior unui eşantion
randomizat. De aceea suntem interesaţi să examinăm cum autorii au standardizat acest test.
Vom prezenta în continuare modul în care s-a realizat eşantionarea pentru subiecţii de sex
feminin.

Baza stratificării:

SUA. a fost divizată în opt arii geografice şi 8 densităţi ale populaţiei. Populaţia a fost
împărţită în 5 grupe de vârstă şi 7 nivele de venit. Procentajul populaţiei pentru fiecare dintre

73
aceste categorii a fost reflectat cât mai exact posibil în eşantionul de femei. Acest eşantion a
fost de aproximativ 1000 de persoane.

Comentarii:

Se pare că planificarea din acest eşantion nu a fost bună. Nu toate categoriile sunt la fel de
bine reprezentate. De exemplu, există doar 30 de femei din zonele muntoase şi 239 din două
categorii de oraşe cu populaţie peste 1 milion de locuitori. Acest eşantion nu este suficient de
mare. După cum am precizat în cazul testului Thorndike-Lorge, 10.000 de cazuri ar fi
necesare pentru a avea un eşantion stratificat reprezentativ. Eşantionul folosit pentru
standardizarea inventarului “16PF” este prea mic pentru a face comparaţii semnificative între
subgrupe.

Un număr de 1.000 de subiecţi, oricât de bine stratificat ar fi eşantionul, nu este o bază


de satisfacere pentru normele generale. Din aceste motive normele pentru acest test trebuie să
fie tratate cu prudenţă.

IMPORTANT
Reguli pentru normele generale
1. un eşantion stratificat este mult mai eficient decât unul randomizat şi este mai bine
să fie utilizat pentru testele standardizate;
2. patru criterii de clasificare sunt normal suficiente. Dacă se folosesc prea multe
criterii creşte mărimea eşantionului;
3. variabilele care vor fi utilizate în stratificare trebuie să coreleze ridicat cu testul.
Variabilele sex, vârstă şi clasă socială sunt importante;
4. în fiecare grup ar trebui să fie suficienţi subiecţi pentru a forma un eşantion adecvat.
Dacă luăm 300 ca minimum într-o categorie şi dacă avem, de exemplu, 5 clase sociale, 2
sexe şi 5 grupe de vârstă există deja 50 categorii de subiecţi, ceea ce înseamnă în total 15000
subiecţi;
5. pentru a avea un eşantion adecvat pentru o populaţie generală este nevoie inevitabil
de un număr mare de subiecţi.
c. Norme de grup speciale
Deoarece în standardizarea testelor apar probleme logistice şi financiare mulţi
“constructori” de teste preferă să folosească norme pentru grupele specifice pentru care testele
sunt realizate. Pentru aceste grupuri specifice se aplică aceleaşi principii de eşantionare.
Deoarece aceste grupe sunt mai omogene, eşantioanele reprezentative vor fi mai mici. Pentru
a clarifica problemele standardizării testelor pentru grupuri specifice vom examina normele
publicate de autorii anumitor teste.
Scala conservatorismului (Wilson & Patterson, 1970). Această scală vizează
măsurarea dogmatismului sau rigidităţii, descrise de Rokeach (1960) ca atitudine care are un
efect profund în multe sfere ale vieţii, şi care poate fi observată în conflictele din Beirut şi
Belfast. S-a folosit un număr mare de norme, dar în manualul testului nu sunt precizate şi
motivele selecţiei acestora. În studiu au fost incluşi studenţi universitari din 4 ţări, studenţi din
colegii de educaţie, muncitori calificaţi, subiecţi de sex feminin de vârstă şcolară şi de sex
masculin de toate vârstele.
Comentarii
Examinând numărului de subiecţi pentru fiecare grup constatăm că aceste norme
trebuie privite cu rezerve. Cel mai mare număr de subiecţi se găsesc în eşantionul ocupaţiilor
74
din Noua Zeelandă - 340 de subiecţi. Un eşantion cu o astfel de mărime nu este reprezentativ
pentru varietatea profesiunilor. Au fost examinaţi 50 de studenţi din mai mult de 4 universităţi
din Marea Britanie, multe dintre ele având mai mult de 5.000 de studenţi. Din aceste motive
eşantionul de studenţi nu poate fi folosit ca bază pentru norme. Cele mai multe dintre
eşantioane sunt prea mici pentru a fi reprezentative: 22 de tehnicieni de laborator, 22 de
lucrători din biserică şi 30 de oameni de afaceri.
Concluzii
Normele utilizate au o valoare prea mică şi nu pot fi folosite pentru interpretarea
scorurilor la test. Alegerea grupelor este interesantă, dar era nevoie de un număr mai mare de
subiecţi. Nu este posibil ca rezultatele obţinute de subiecţii acestor eşantioane să fie utilizate
ca norme pentru o populaţie generală. Normele specifice grupului trebuie să aibă la bază un
eşantion mai larg şi mai reprezentativ decât cel folosit în acest test.
În 1970 Kline a dezvoltat Ai3Q, un test al personalităţii obsesive. S-au stabilit normele
pentru diriginţii claselor a VI-a din Anglia.
Obţinerea eşantionului
Pentru a avea un eşantion reprezentativ al diriginţilor claselor a VI-a, autorii s-au
asigurat mai întâi că au un eşantion adecvat al claselor a VI-a. Astfel, baza eşantionului a fost
să se examineze toţi diriginţii claselor a VI-a dintr-un eşantion stratificat al claselor a VI-a.
Acest lucru a fost foarte important. Un eşantion de diriginţi din şcoli cu clase numeroase de a
VI-a şi standarde academice foarte ridicate, cum ar fi Manchester Grammar School, St. Paulus
and Cheltenham Ladies, ar fi complet greşit dacă s-ar fi folosit ca bază pentru norme.
Stratificarea variabilelor pentru şcoli
Au fost utilizate 4 variabile de stratificare. Deşi unele din aceste variabile nu mai au
aplicabilitate, ele reprezintă un exemplu bun pentru modul cum trebuie realizat un eşantion
stratificat.
surse de finanţare: şcoli publice, susţinere directă sau de la stat;
sex: băieţi, fete, mixte;
localizare geografică: orăşele, oraşe mari, mediu rural;
sistemul claselor: şcoli de gramatică, şcoli comprehensive şi colegii de 6
clase.
A fost destul de dificil să se realizeze un eşantion echilibrat ţinând seama de toate
variabilele, deoarece există puţine şcoli publice de stat în oraşele mici, cel puţin în afara
Londrei. Cu toate acestea un eşantion reflectând proporţiile acestor şcoli în populaţie, chiar
dacă există doar două şcoli pentru fiecare categorie, ar asigura norme suficient de precise. Au
fost listate toate şcolile pentru fiecare categorie şi au fost alese întâmplător două şcoli din
fiecare categorie.
Eşantionul obţinut conţinea aproximativ 1.000 de subiecţi de sex feminin şi 1.000 de
subiecţi de sex masculin, acoperind doar nordul Angliei. Chiar dacă lucrăm cu categorii
omogene de subiecţi din anumite zone geografice ale ţării, este nevoie de un eşantion mare
pentru a fi reprezentativ.
Myers-Briggs Type Indicator (Myers&Briggs, 1962). Acest test, care clasifică
subiecţii în funcţie de categoriile lui Jung (extravertiţi intuitivi, extravertiţi raţionali, etc.) îl
vom folosi pentru a ilustra unele dintre problemele eşantionării. Autorii acestui test au folosit
un eşantion de 3.500 de băieţi şi 2.500 de fete din 37 de şcoli din Pennsylvania. Acest
eşantion este reprezentativ pentru acest stat, dar normele pot să nu fie valabile pentru alte
state. Autorii au folosit un eşantion de 4.500 de studenţi la arte şi inginerie din 8 universităţi,
care la admitere cereau un nivel ridicat de calificare al studenţilor. Subiecţii din acest eşantion
nu erau reprezentativi şi pentru studenţii altor colegii care nu aveau astfel de condiţie la
admitere şi care, de fapt, sunt cele mai numeroase în SUA.

75
Au fost folosite grupe normative neadecvate: copii adoptaţi (34 subiecţi de sex
masculin şi 25 de sex feminin) şi 40 de arhitecţi nu nivel ridicat de creativitate.
Chiar atunci când investigatorii ştiu cum trebuie stabilite normele de grup, adesea
aceştia nu reuşesc să le respecte deoarece nu au resursele de timp şi materiale necesare pentru
aceasta.

IMPORTANT
Reguli pentru eşantionarea grupurilor special
1. stratificarea grupului în funcţie de variabilele care corelează ridicat cu testul;
2. numărul minim pentru eşantioane este 300. Adesea este necesar să facem eşantionarea în
timp;
3. un eşantion mic, cum este în cazul scalei conservatorismului, este mai bun decât deloc.
Dacă a fost utilizat un eşantion mic, utilizatorii testului trebuie să fie avertizaţi în legătură cu
acest aspect. Normele bazate pe un eşantion mic sunt doar sugestive sau experimentale, ele
pot şi complet greşite
Concluzii
În principal dificultăţile eşantionării nu sunt de natură teoretică sau intelectuală, ci practice
ţinând de insuficienţa resurselor. Dacă un test este folosit pentru a lua decizii este esenţial ca
normele să respecte standardele pe care le-am prezentat anterior. Un eşantion mare şi
stratificat adecvat este esenţial pentru a avea norme bune.

5. EXPRIMAREA REZULTATELOR
După ce grupurile normative au fost testate rezultatele trebuie să fie exprimate în
formă numerică. Există mai multe modalităţi de a face acest lucru. Cele mai multe dintre
metode compară scorul individului cu grupul normativ relevant.
Norme diferite
Vom descrie în continuare câteva dintre cele mai utilizate norme, precum şi avantajele
şi dezavantajele lor.

a. Centile

DEFINIŢIE
Un centil este un scor a cărui procentaj este dat de grupul normativ.
Al 30-lea centil este un scor sub care se găsesc 30% din subiecţii eşantionului. Acestea
au avantajul că pot fi înţelese de subiecţii testaţi.

IMPORTANT
Totuşi aceste norme au şi limite importante:
a. Centilele sunt scoruri ordinale pentru care nu se pot calcula parametri statistici;
b. Distribuţia centilelor este dreptunghiulară în timp ce distribuţia scorurilor testului se
apropie de cea normală. De aceea în jurul mediei diferenţele între subiecţi sunt mici, în timp
ce la extreme apar diferenţe mari între subiecţi.
Deoarece centilele nu pot fi analizate statistic şi pentru că afectează scorurile brute,
aceste norme nu sunt recomandate. Ele pot fi folosite doar pentru explicarea rezultatelor.

76
b. Scoruri standard
Cele mai utile norme sunt scorurile standard. Există o mare varietate de astfel de
scoruri şi în continuare vom discuta despre cele mai frecvent utilizate.
Scorurile Z

IMPORTANT
Scorurile standard se calculează prin împărţirea deviaţiei fiecărui scor de la medie la
abaterea standard a scorurilor.
Formula de calcul este următoarea:
XM
Z , unde

Z - scorul standard;
X - scorul obţinut la test;
M - media distribuţiei scorurilor;
 - abaterea standard a scorurilor

DEFINIŢIE
Abaterea standard a testului este măsura variabilităţii testului, cât de mult scorurile
variază în jurul mediei

Proprietăţile scorurilor Z
Cel mai mare avantaj al scorurilor Z în comparaţie cu notele brute, este că scorurile Z
sunt întotdeauna echivalente. Astfel, un scor Z de 2 înseamnă întotdeauna 2 abateri standard
de la medie. Ele permit compararea scorurilor obţinute la teste diferite.
Să presupunem că avem un set de scoruri la un test la care media este 50, iar abaterea
standard de 5. În tabelul următor prezentăm scorurile brute şi notele Z corespunzătoare,
calculate după formula prezentată anterior:

Scoruri brute Scoruri Z


50 0
55 1
60 2
45 -1
43 -1,4

IMPORTANT
Scorurile Z au o medie de 0, o abatere standard de 1 şi pot lua valori negative şi
pozitive. Un scor Z mai mare decât media este un scor pozitiv, iar scorul mai mic decât media
este un scor Z negativ.
Transformarea scorurilor brute în scoruri Z este liniară, astfel că distribuţia scorurilor
brute este menţinută în scorurilor Z. Dacă distribuţia scorurilor brute este normal distribuită
atunci scorurile Z vor avea valori între +3 şi -3. Deoarece suprafaţa curbei normale este
cunoscută, scorurile Z normal distribuite au particularităţi informative.

77
EXEMPLU

Aproximativ 95% din distribuţia normală este plasată între 2 abateri standard de o
parte şi de alta a mediei distribuţiei. Un scor Z de 2 poate fi interpretat în termeni de
procentaj: 2% dintre subiecţi au rezolvat mai bine, celelalte 2 procente găsindu-se la celălalt
capăt al distribuţiei.
Cu toate avantajele pe care le au scorurile Z, există două probleme majore, deşi
acestea sunt cele mai simple forme ale scorurilor standard. O scală care are ranguri mici (de
la -3 la +3) şi o medie de 0, are mai puţină semnificaţie, de aceea sunt mai puţin utilizate de
către psihologi.
Rezultatele la multe teste se distribuie mai mult sau mai puţin normal. Când
distribuţia nu este normală distribuţia scorurilor Z nu poate şi transformată în centile.
Pentru a depăşi aceste dificultăţi psihologii transformă scorurile Z în alte scoruri
standard.
Scorurile Z transformate în alte scoruri standard
Scorurile Z pot fi transformate în alte scoruri standard, atunci când se dă media şi
abaterea standard. Aceste scoruri, la fel ca şi scorurile Z, sunt compatibile cu alte scoruri
standard transformate cu aceeaşi medie şi abatere standard.
Z t  a  bZ , unde
Zt - scorul Z transformat
a - media distribuţiei transformate
b - abaterea standard a distribuţiei transformate
Z - scorul Z
După cum precizează şi Cronbach (1976), cel mai obişnuit scorurile Z sunt
transformate în scoruri standard cu media 50 şi abaterea de 10. În tabelul de mai jos sunt date
scorurile Z transformate după formula anterioară.

Scoruri brute Z scoruri Zt


55 1 60
60 2 70
45 -1 40
43 -1,4 36

Scorurile standard normalizate


Unii psihologi preferă scorurile standard normalizate. Inteligenţa, de exemplu, necesită
să fie normal distribuită (Vernon, 1961). De aceea se utilizează scoruri standard normal
distribuite.

IMPORTANT
Pentru a normaliza un set de scoruri Z trebuie parcurşi mai mulţi paşi:
a. să se calculeze proporţia cumulată a eşantionului pentru fiecare scor brut;
b. calcularea frecvenţei cumulate pentru fiecare scor. Frecvenţa cumulată pentru scorul X este
reprezentată de numărul de subiecţi care au cote sub X;
c. poate fi calculată frecvenţa cumulată pentru valoarea din mijloc al fiecărui interval al
scorului, adăugând la scor jumătate din numărul de subiecţi care au acel scor. Dacă frecvenţa
cumulată a lui X este 10 şi 6 subiecţi au scorul X, atunci punctul din mijloc este 13;

78
d. fiecare punct de mijloc al frecvenţei cumulate poate fi convertit într-o proporţie prin
împărţire la N (numărul de subiecţi);
e. în tabele statistice care arată suprafaţa curbei de distribuţie normală, aceste puncte de
mijloc pot fi transformate în scoruri Z;
f. aceste scoruri Z sunt normal distribuite şi se poate face referire la ele ca scoruri Zn;
g. scorurile Z normalizate pot fi transformate în orice tip de scoruri standard, utilizând
formula dată anterior.

Scorurile T
Buros (1972) consideră că dacă trebuie folosite scoruri standard normalizate, atunci
trebuie folosită o scală care să aibă media 50 şi abaterea standard de 10.

IMPORTANT
Alte scoruri standardizate normalizate
a.Stanine. Acestea au media de 5 şi abaterea standard de 2. Aceste scoruri împart curba
normală în nouă scoruri;
b.Notele sten, au media de 5,5 şi abaterea standard de 1,5. Acestea au fost folosite în special
pentru testele de personalitate şi împart curba în 10 scoruri;
c.Testul de inteligenţă Wechsler utilizează o scală cu media de 100 şi abaterea standard de 15;
Utilizarea scorurilor standard normalizate

IMPORTANT
Scorurile standard normalizate pot fi folosite în condiţii speciale:
a. doar când distribuţia originală este aproximativ normală. Dacă această distribuţie nu este
normală, vor rezulta erori, în special la extremele distribuţiei;
b. trebuie utilizate atunci când există anumite aşteptări teoretice în legătură cu distribuţia
normală;
c. este esenţial ca grupul de standardizare să fie reprezentativ pentru distribuţie, pentru a
reflecta cât mai exact populaţia, în special la extreme.

Concluzii
a. scorurile brute ale testelor psihologice au înţeles doar în relaţie cu scorurile normative ale
grupului;
b. valoarea normelor depinde de eşantionul sau eşantioanele care au fost folosite. Doar când
aceste eşantioane sunt adecvate populaţiei, normele pot fi folosite fără rezerve;
c. Există eşantioane foarte largi, uneori de 10.000 de subiecţi;
d. Eşantioanele stratificate sunt mai eficiente decât cele randomizate, iar variabilele în
funcţie de care eşantionul ar trebui stratificat corelează ridicat cu variabilele testului;
e. Există multe metode de exprimare a scorurilor normative;
f. Centilele nu sunt recomandate pentru că nu pot fi prelucrate statistic;
g. Scorurile standard sunt recomandate, cele mai utile sunt scorurile standard cu media 50 şi
abaterea de 10;
h. Scorurile standard normalizate sunt recomandate numai în situaţii speciale. Dintre acestea
scorurile T sunt cele mai utile;
i. Orice test psihologic trebuie să respecte procedura de standardizare. Un set de scoruri
standard poate duce la concluzii eronate dacă eşantionarea este deficitară.

79
Etaloane normalizate
1. Etaloane în unități sigma
Cel mai simplu etalon în clase normalizate este reprezentat de unitățile sigma, în care
folosim doar media și abaterea standard. Cu ajutorul acestor indicatori putem construi un
etalon în 3, 5 și 7 clase normalizate, luând în calcul 1, 2 sau 3 abateri standard.

EXEMPLU
Să presupunem că am media de vârstă a studenților din anul 2 la Facultatea de
Psihologie este de 19,32 ani și abaterea standard are valoare 4. Aceste scoruri se distribuie
normal și putem construi un etalon în clase normalizate. În continuare vom construi un etalon
în unități de abateri standard cu 5 clase egale, în care dimensiunea unei clase are valoarea unei
abateri standard. Astfel, clasa de mijloc are intervalul [X - ; X + ]

15,32 17,32 21,32 23,32

X- X- X X+ X+

80
Etalonul astfel format poate fi scris în același mod ca și etalonul în cvintile și are aceeași
semnificație. Evident că, la distribuția acestui etalon va trebui să furnizăm date legatte de
structura eșantionului normativ, distribuția variabile și sistemul de etalonare folosit, în cazul
nostru în cinci clase în unități de abateri standard.
Scoruri Clasa Semnificația
Minim – 15,32 I Foarte tineri
15,33 – 17,32 II Tineri
17,33 – 21,32 III Medie
21,33 – 23,32 IV Maturi
23,33 – maxim V Foarte maturi

2. Etaloane în clase normalizate


Etaloane în clase normalizate nu sunt altceva decât derivații ale etaloanelor în unități
sigma și se bazează pe transformarea notelor z în alte categorii de note. Algoritmul de calcul
este oarecum similar celui utilizat în realizarea etaloanelor în unități sigma și se bazează pe
fracțiuni de unități sigma.
Astfel, un etalon în cinci clase normalizate are ca fracțiune ale lui z valoare z/2 iar clasele
devin:
Cumulat
I Min … -3z/2 6,7% din populaţie 6,7%
II -3z/2 … -z/2 24,2% din populaţie 30,9 %
III -z/2 … z/2 38,2% din populaţie 69,1%
IV z/2 … 3z/2 24,2% din populaţie 93.3%
V 3z/2 … Max. 6,7% din populaţie 100 %

Un etalon în șapte clase normalizate are ca fracțiune ale lui z valoarea z/3 iar clasele devin:
Cumulat
I Min … -5z/3 4,8% din populaţie 4,8%
II -5z/3 … -3z/3 11,1% din populaţie 15,9%
III -3z/3 … -z/3 21,2% din populaţie 37,1%
IV -z/3 … z/3 25,8% din populaţie 62,9%
V z/3 … 3z/3 21,2% din populaţie 84,1%
VI 3z/3 … 5z/3 11,1% din populaţie 95,2%
VII 5z/4 … Max. 4,8% din populaţie 100%

Un etalon în nouă clase normalizate are valoarea z/4 iar clasele devin:
Cumulat
I Min … -7z/4 4,0% din populaţie 4,0%
II -7z/4 … -5z/4 6,6% din populaţie 10,6%
III -5z/4 … -3z/4 12,1% din populaţie 22,7%
IV -3z/4 … -z/4 17,5% din populaţie 40,2%
V -z/4… z/4 19,6% din populaţie 59,8%
VI z/4 … 3z/4 17,5% din populaţie 77,3%
VII 3z/4 … 5z/4 12,1% din populaţie 89,4%
VIII 5z/4 … 7z/4 6,6% din populaţie 96,0%
IX 7z/4 … Max. 4,0% din populaţie 100%

81
6. METODE ALTERNATIVE DE INTERPRETARE A SCORURILOR LA
TEST

Există metode de interpretare a scorurilor care diferă de norme şi au valoare doar în


anumite circumstanţe.
1. Criteriu de conţinut
Dacă un test solicită anumite deprinderi sau comportamente pentru a fi completat, este
nevoie ca testul să reprezinte o măsură validă ipso facto a acestor deprinderi sau
comportamente.

EXEMPLU
Dacă un test de muzică cere subiecţilor să recunoască acordul dominant într-o serie,
subiecţii au abilităţi muzicale dacă aleg itemii corecţi. Validitatea conţinutului este relevantă
când conţinutul este clar specificat. Acest lucru este relativ uşor de realizat pentru nivele
elementare ştiinţifice, muzicale sau matematice, când conţinutul creşte progresiv în dificultate
pentru a măsura nivele tot mai ridicate de cunoştinţe.
Validitatea conţinutului se aplică mai mult în cazul testelor de cunoştinţe şi de
abilitate.
Am introdus termenul de conţinut valid deoarece criteriul de conţinut se aplică atunci
când testele au fost construite în aşa fel încât să aibă un conţinut valid.

EXEMPLU

Pentru testarea notaţiei muzicale, un test ar trebuie să conţină toate notaţiile muzicale,
cu toate că problema notaţiilor muzicale poate fi evaluată rapid în timpul execuţiei unei piese
muzicale. Un scor de 100 percentile ar indica superioritate/deplină stăpânire, iar x % ar indica
x % superioritate. În aceste teste este nevoie să se stabilească punctele de critice în funcţie de
care să se decidă dacă elevul poate să îşi mai continue cursul. În multe şcoli astfel de evidenţe
empirice lipsesc, fiind înlocuite cu punctele de vedere arbitrare ale profesorilor.
Dificultăţi ale metodei criteriului
Problemele se pot datora restricţiilor metodei criteriului atunci când conţinutul nu este
clar stabilit. Itemii testului trebuie să reprezinte un eşantion din universul de itemi. Din
această cauză este dificil să argumentăm că un scor reprezintă cel mai bun procentaj pentru
subiect. Aceasta înseamnă că acest criteriu de conţinutul poate fi utilizat doar pentru
interpretarea scorurilor testului când există un conţinut specific slab sau ridicat al testului.
Concluzii:
Criteriul de conţinut este potrivit doar pentru testele de cunoştinţe şi doar atunci când
conţinutul poate fi clar definit. Pentru cel mai scăzut nivel educaţional al claselor primare un
astfel de test poate fi valabil. Schonell (1951) a dezvoltat un set de teste diagnostice pentru
citire când rezultatele indicau aspecte exacte, cum ar fi inversarea anumitor litere, confuzie
între anumite litere.
2. Criteriul de predicţie
O altă metodă de interpretare a scorurilor testului şi care nu ţine seama de norme este
probabilitatea ca subiecţii, prin fiecare scor să reflecte un criteriu particular. Trebuie construit
un tabel al aşteptărilor. Există câteva aspecte care trebuie notate.
a. Tabelele de aşteptare pot fi construite doar când sunt posibile criterii clare ale
scorurilor. Acest lucru este posibil doar pentru anumite teste din domeniul

82
industrial şi educaţional. Examinarea scorurilor şi gradelor reprezintă un bun
criteriu pentru tabele de expectanţe, deşi în şcoli şi universităţi examinările
practice nu sunt eliberate de note.
b. Aceste aşteptări nu sunt teoretice ci empirice. Aceasta înseamnă că în studiile
realizate pe scară largă trebuie să avem o populaţie relevantă. Trebuie să avem în
vedere problemele legate de eşantionare pentru stabilirea normelor. În acest sens
tabelul probabilităţilor expectanţelor reprezintă date normative.
c. Tabelul expectanţelor ilustrează o importantă dilemă a psihologiei aplicate şi
psihometriei: utilizarea predicţiei reale în caz individual. Dacă un scor particular
la un test indică 0,45 probabilitate pentru reuşită, aceasta înseamnă că 45% dintre
indivizi (în eşantionul normativ) cu un astfel de scor, promovează examenul. În
acest caz tabelele de expectanţă ne arată că 45% dintre subiecţii care au obţinut
acest scor au reuşit la test. Un evaluator ar putea respinge toţi candidaţii cu un
astfel de scor sau i-ar putea accepta pe toţi. Pentru cazurile individuale aceasta ar
putea fi decizie incorectă. Aceasta este dilema psihologiei aplicate. Tabelele
expectanţelor pot fi utilizate cu anumite rezerve.
În construirea tabelului expectanţelor eşantionul poate fi divizat în funcţie de criteriul
grupurilor - reuşita/nereuşita fiind un criteriu obişnuit şi util. Scorurile testului sunt divizate
astfel încât să existe un număr egal de indivizi pentru fiecare grup, cu excepţia extremelor, şi
se calculează proporţia de subiecţi din fiecare grup care a reuşit sau nu la examen. Această
proporţie reprezintă, probabilitatea ca indivizii cu aceste scoruri la test să reuşească la
examen.
Dacă eşantionarea este săracă şi tabelul expectanţelor va fi cel mai probabil greşit.
Este necesar de un eşantion larg şi reprezentativ pentru realizarea tabelului de expectanţe, dar
această abordare prezintă câteva diferenţe faţă de standardizarea eşantionului. În locul
stabilirii poziţiei relative a scorului subiectului în grupul normativ, tabelul expectaneţelor
stabileşte poziţia relativă a performanţei în funcţie de anumite criterii.
3. Metoda regresiei
Scorurile ipsative
Aceste scoruri apar în orice test cu răspunsuri forţate, în care fiecare alegere este
cotată.

EXEMPLU

În Testul Mecanismelor de Apărare (Gleser & Ihelevisch, 1969) subiecţii au de ales,


pentru fiecare item, dintre cinci răspunsuri care reprezintă cinci mecanisme de apărare
diferite, cele care sunt mai mult sau mai puţin probabile. Scorul testului reprezintă forţa
relativă a capacităţii de apărare a individului. Trebuie să existe unele corelaţii negative între
scoruri ca un artefact al sistemului de cotare, alegerea unui răspuns să însemne excluderea
celorlalte patru. Acest sistem de cotare nu poate fi o măsură absolută a capacităţii de apărare.
Un băutor poate considera whisky - ul ca băutura favorită, apoi ginul şi coniacul, combinaţia
însă este selectată şi de un dipsoman. Aceste alegeri pot fi greu comparate.
Utilizarea scorurilor ipsative pentru testele cu alegeri forţate are următoarele efecte.
Mai întâi matricea de corelaţie nu are semnificaţie deoarece scalele sunt artificial corelate
negativ. Analiza factorială a corelaţiilor nu poate fi interpretată. În al doilea rând realizarea
normelor pentru aceste scale nu are sens, deoarece scorurile indivizilor nu pot fi comparate.
Ar putea fi folosite normele bazate pe ranguri. Aceasta înseamnă că 60% dintre bărbaţi
dau primul rang intereselor externe, interesul pentru broderie având ultimul rang. Acestea au
totuşi o valoare îndoielnică pentru că distanţele dintre ranguri nu sunt cunoscute.

83
Scorurile ipsative ale unui test sunt folosite ca bază de discuţie cu subiectul care a
rezolvat testul. Aceasta înseamnă că rangurile scorurilor pot fi explicate. Utilizarea lor este
restrânsă la contexte în care scorurile sunt utilizate ca bază de discuţie şi când cuantificările
sunt relativ neimportante. Deci, aceste teste pot fi folosite în psihologia clinică, orientare
profesională şi consiliere, când este important să există un raport de încredere între subiect şi
examinator.
Concluzie

IMPORTANT
Testele normative sunt superioare testelor ipsative deoarece au o precizie mai mare în
măsurarea caracteristicilor psihologice.
Scorurile ipsative sunt potrivite ca bază de discuţie. Este la fel de posibil ca şi testele
normative să fie baze de discuţie, dar prezintă şi avantajul că fi analizate statistic, lucru care
nu se poate realiza în cazul scorurilor ipsative, acesta fiind un motiv în plus ca ele să nu fie
folosite.

APLICAŢIE
1.Realizați un etalon în 7 clase normalizate, cunoscând că media are valoarea 20 și abaterea
standard este 3.

TEST DE AUTOEVALUARE (cu răspunsuri corecte ataşate la finalul cursului)


Apreciați valoarea de adevăr a următoarelor afirmații:
1.Normele sunt seturi de scoruri obținute de subiecții eșantioanelor studiate:
a. ADEVĂRAT
B. FALS
2. În analiza psihometrică a diferențelor individuale, standardizarea testelor este foarte
importantă:
a. ADEVĂRAT
b. FALS
3. Normele sunt necesare pentru testele psihologice pentru că nu există un zero absolut al
scalelor de măsurare:
a. ADEVĂRAT
b. FALS
4. Eșantionul normativ trebuie să fie o bună reflectare a populației pe care o reprezintă:
a. ADEVĂRAT
b. FALS
5. Reprezentativitatea eșantionului este independentă de mărimea acestuia:
a. ADEVĂRAT
b. FALS
6. Un eşantion este întâmplător dacă există şanse egale ca orice individ să fie ales ca membru
al eşantionului:
a. ADEVĂRAT
b. FALS

84
7. Eşantionarea stratificată implică divizarea unei populaţii eterogene într-un număr de mai
multe populaţii omogene:
a. ADEVĂRAT
b. FALS
8. Reprezentativitatea eşantionului stratificat nu depinde de variabilele utilizate pentru
stratificare:
a. ADEVĂRAT
b. FALS
9. Un centil este un scor a cărui procentaj este dat de grupul normativ:
a. ADEVĂRAT
b. FALS
10. Centilele sunt scoruri pentru care se pot calcula parametri statistici:
a. ADEVĂRAT
b. FALS
11. Scorurile standard se calculează prin împărţirea deviaţiei fiecărui scor de la medie la
abaterea standard a scorurilor:
a. ADEVĂRAT
b. FALS
12. În formula de calcul a scorurilor standard, M reprezintă scorul obținut la test:
a. ADEVĂRAT
b. FALS
13. Abaterea standard a testului este măsura variabilităţii testului, cât de mult scorurile variază
în jurul mediei:
a. ADEVĂRAT
b. FALS
14. Un scor Z mai mare decât media este un scor negativ, iar scorul mai mic decât media este
un scor Z pozitiv:
a. ADEVĂRAT
b. FALS
15. În formula de calcul a scorurilor Z transformate, b semnifică media distribuției
transformate:
a. ADEVĂRAT
b. FALS
16. Într-un etalon în șapte clase normalizate, prima clasă conține 4,8% dintre subiecți:
a. ADEVĂRAT
b. FALS

85
Unitatea de învățare 7.
TESTELE DE INTELIGENȚĂ

Contextul istoric al testelor de inteligență


Testele de inteligenţă reprezintă unele dintre cele mai vechi teste psihologice. Binet şi
Simon (1905) au dezvoltat aceste teste la Paris, descoperindu-se apoi avantajele lor pentru
educaţie. Aceste teste au fost ulterior dezvoltate, devenind cele mai utilizate teste de
inteligenţă cunoscute şi sub numele de Scala Standford Binet.
În acelaşi timp Spearman (1904) a raportat prima analiză factorială a abilităţilor umane.
Autorul consideră că abilităţile umane sunt explicate în termenii factorului g, un factor de
abilitate generală, şi a factorilor specifici. Spearman a dezvoltat noţiunea de inteligenţă ca
factor general, care reprezintă încă cea mai modernă încercare de măsurare a inteligenţei.

Definiţie inteligenţei şi a factorului g


Jensen (1980) menţionează că există un număr foarte mare de definiţii ale inteligenţei
atât psihologice cât şi nepsihologice. Ascuţit, perspicace şi rapid sunt adesea termeni folosiţi
în definiţie, opuşii lor fiind vag/neclar, lent/apatic şi încet. Astfel de definiţii sunt prea vagi
pentru a avea utilitate ştiinţifică.
Borring (1923) încearcă să depăşească această dificultate definind inteligenţa ca fiind
ceea ce măsoară testele de inteligenţă. Această definiţie este circulară şi inutilă, fără
posibilitatea de a defini precis şi clar ceea ce măsoară testele.

IMPORTANT
Totuşi factorul măsurat de testele de inteligenţă poate fi definit. Aceste teste măsoară
un factor, în mod obişnuit denumit „gf”, aptitudinea fluidă. Un factor poate fi definit prin
variabilele care au pondere mare în acesta.
Inteligenţa, dacă o considerăm ca fiind egală cu aptitudinea fluidă, poate fi obiectiv
definită prin factorii care au pondere în aceasta. Astfel, inteligenţa poate fi văzută ca o
abilitate raţională vastă şi de bază, utilă în soluţionarea unei mari varietăţi de probleme.
Abilitatea de rezolvare a problemelor nu este specifică doar pentru testele de
inteligenţă, aspect demonstrat de faptul că scorurile la testele de inteligenţă corelează cu alte
criterii externe, cum ar fi succesul academic şi performanţa profesională (Jensen, 1980, Kline,
1990).

DEFINIŢIE
Putem defini inteligenţa, măsurată de testele de inteligenţă, ca o abilitate raţională de
bază a individului angajat în rezolvarea de probleme de diferite tipuri.

Importanţa lui este atestată de faptul că întotdeauna apare un factor mai larg în orice
analiză factorială a abilităţilor. Totuşi inteligenţa se manifestă prin deprinderi particulare care
sunt valorizate prin cultură.

IMPORTANT
Acest aspect al inteligenţei este definit prin factorul „gc” sau aptitudinea cristalizată,
care este aptitudinea fluidă exprimată cultural.

86
Pentru a înţelege mai bine ceea ce testele de inteligenţă dar şi alte teste de aptitudini
sau abilităţi încearcă să măsoare vom prezenta în continuare structura factorială a abilităţilor.

Structura factorială a abilităţilor umane


Structura abilităţilor umane a fost stabilită folosindu-se analiza factorială.
Cattell şi Haktian (1974) au găsit o serie de factori ai abilităţilor primare:
V - abilitatea verbală - înţelegerea cuvintelor şi ideilor. Cuprinde sarcini ca sinonime,
înţelesul proverbelor, analogii. Este probabil cel mai bun indicator al inteligenţei cristalizate –
gc;
N - factor numeric - este uşurinţa în a manipula numerele. Acesta se distinge factorial de
raţionamentul aritmetic;
S - factorul spaţial - abilitatea de a vizualiza figuri bi şi tridimensionale atunci când
orientarea lor este alterată;
P - Viteza de percepţie şi factorul acurateţe - implică evaluarea figurilor atunci când
perechile de stimuli sunt similare sau diferite;
Cs - Viteza de închiderea - se referă la abilitatea de completare a gestaltului atunci când
lipsesc părţi din stimuli. Viteza de închidere verbală corelează 0,61 cu fluenţa verbală, ceea ce
sugerează că familiarizarea cu anumite cuvinte are un rol important pentru acest factor;
I - raţionament inductiv - implică inducţia, raţionamentul plecând de la particular la general.
Ma - memoria asociativă sau mecanică - se referă la memorarea perechilor de cuvinte între
care nu există legătură. Aceasta corelează cu testul perechilor cuvânt-număr şi cu testul
perechilor figură-număr;
Mk - abilitate şi cunoştinţe mecanice;
Cf - flexibilitatea de închidere - implică ignorarea stimulilor irelevanţi din câmpul perceptiv
pentru a găsi figurile stimul. Conform lui Cattell şi Haktian acest factor este o manifestare a
independenţei şi este legat de factorul de personalitate independenţă.
Ms - memoria span - este reamintirea de scurtă durată a literelor. A fost utilizată în testul
WISC şi WAIS. Corelaţia între Ma şi Ms este doar de 0,18;
Sp - citirea pe litere - recunoaşterea lipsei literelor/sunetelor din cuvinte. Cattell şi Haktian
consideră că acest factor nu apare ca factor în studiile anterioare, deoarece s-a folosit doar un
singur test pentru acest factor, fiind imposibilă obţinerea unui factor. Deoarece există o bună
corelaţie cu V şi W atunci când se scrie/pronunţă un cuvânt literă cu literă/sunet cu sunet, se
consideră că acest factor fie este primar, fie dependent de aceşti doi factori;
E - judecata estetică - abilitatea de a detecta principiile artistice de bază. La fel ca şi Mk acest
factor este dependent de experienţa anterioară;
Mm - memoria semnificaţiilor - implică învăţarea legăturilor dintre perechile între care există
legături cu sens. Corelaţia dintre Mm şi Ma este de 0,35 ceea ce demonstrează că acestea sunt
comportamental diferite;
O1 - originalitatea flexibilităţii ideatice - rezultă din testele lui Guildford şi Hoepfner (1971)
care urmăresc producerea divergentă a celulelor claselor semantice din modelul lui Guildford.
Există o corelaţie ridicată între acest factor şi Fl şi O2;
Fl - fluenţa ideatică - abilitatea de a reproduce rapid idei pe o temă dată. Se distinge de Wl,
fluenţa cuvintelor şi fluenţa asociativă şi expresivă care nu sunt cuprinse în acest studiu, dar
care sunt analizate de (Guildford şi Hoepfner);
W - fluenţa cuvintelor - rapida producere a unor cuvinte după o literă cerută dar fără a cere şi
un anumit înţeles. Acest factor a fost descoperit anterior de Cattell în 1933;
O2 . originalitate - la fel ca şi O1 este un factor relativ nou descoperit pe baza testelor lui
Guildford, în care subiecţii trebuiau să combine 2 obiecte într-unul nou, funcţional. Testului
viza evaluareaproducţiei convergente a transformărilor semantice, în prezent acesta având
pondere în factorul producţie divergentă (Guildford şi Hoepfner, 1971);

87
A - ochirea - implică coordonarea rapidă ochi-mână;
Rd - abilitatea de reprezentare prin desen - în desenarea obiectelor stimul este cotată precizia
liniilor şi curbelor;
D - raţionament deductiv - implică deducţia, raţionamentul plecând de la general la
particular;
Mc - coordonare motorie generală;
Amu - înclinaţie muzicală şi sensibilitate totală - factor descoperit în testul lui Seashore
(aptitudine muzicală);
Fe - fluenţa expresiei - descoperit de Guildford (1967), exprimarea verbală pentru evaluarea
ideilor.
ams - viteză motorie - descoperit de Guildford;
asd - viteza de discriminare a simbolurilor - descoperit de Guildford;
J - judecată - abilitatea de a rezolva probleme atunci când judecata şi estimarea au un rol
important. Acest factor a fost descoperit de Guildford;
Factorii de ordinul doi rezultă din corelaţiile dintre factorii primari. Cattell şi Horn
(1966) au descris cinci factori secundari care se bazează pe factorii primari.

IMPORTANT
gf - inteligenţa fluidă - include inferenţe, inducţie, memoria span, flexibilitatea de
închidere, precum şi viteza intelectuală.
gc- inteligenţa cristalizată - este un factor al testelor tradiţionale. Se bazează pe factorii
abilităţilor verbale, mecanice, numerice şi sociale.
gv - vizualizare - are la bază deprinderile în care vizualizarea este importantă cum ar fi:
orientarea spaţială şi desprinderea marginilor formei. Cattell consideră că în cercetările
anterioare vizualizarea apare ca factor primar.
gr - capacitatea de restabilire sau fluenţa generală - include fluenţa ideatică, fluenţa
asociativă, testele de asociaţii irelevante.
gs - factorul vitezei cognitive - afectează viteza pentru o mare varietate de sarcini. Include
viteza în performanţa mecanică, scriere sau calcul numeric.
Inteligenţa fluidă şi cea cristalizată sunt cei mai largi factori de ordinul doi influenţând
mult varianţa testului de abilitate.

Aptitudinea fluidă şi cristalizată


Natura acestor două abilităţi a fost studiată de Cattell (1967 şi 1971).

DEFINIŢIE
În concepţia sa inteligenţa fluidă, care este o abilitate raţională de bază ereditară şi
reflectă eficienţa fluxului de informaţii prin creier care este transpusă în deprinderi valorizate
cultural (diferit de la o cultură la alta). Astfel se produce inteligenţa cristalizată.
Din punctul de vedere al construcţiei testului trebuie făcută o distincţie.

IMPORTANT

Aptitudinea cristalizată poate fi testată prin intermediul itemilor care solicită


cunoştinţe şi deprinderi relevante pe care trebuie să le aibă indivizii unei culturi. Aptitudinea
fluidă poate fi măsurată fie prin sarcini care nu solicită cunoştinţe sau solicită cunoştinţe care

88
sunt supraînvăţate astfel încât au devenit automate, fie prin intermediul unor sarcini care sunt
atât de inedite încât subiecţii trebuie să le lucreze din nou.
Majoritatea testelor de inteligenţă măsoară amestecat atât inteligenţa cristalizată cât şi
cea fluidă.

Factorii g, gf, gc ai lui Spearman


Analiza factorială a abilităţilor a dus la o varietate de factori de structură care au la
bază numeroasele corelaţii dintre variabilele din sfera abilităţilor. Se observă că factorul g pe
care multe teste de inteligenţă încearcă să-l măsoare a fost împărţit în aptitudinea cristalizată
şi fluidă. Acestea sunt înalt corelate la vârstele tinere, însă indivizii învaţă sau nu (în funcţie
de familie şi cultură ) deprinderi culturale la nivele diferite.
Nu numai Cattell s-a ocupat de aceste două noţiuni ale factorului g. Carroll (1983) şi
colegii au obţinut independent o structură şi factori primari asemănătoare cu cei ai lui Cattell.

IMPORTANT
Analiza factorială a postulat structura abilităţilor atât de diferită încât nici un test de
inteligenţă nu ar putea fi construit (Guildford, 1967).
Analiza factorială pe bazează pe rotaţiile Procustes, în care nu trebuie să aveam
încredere, apărând probleme de calcul prin aceea că sunt utilizate rotaţiile ortogonale care
automat exclud factorii de ordinul 2 şi astfel factorul g.
Unii autori au încercat să egaleze aptitudinea fluidă cu factorul g a lui Spearman.
(Undeheim, 1981, Crombach, 1984). Gustaffson (1988) consideră că dificultăţile tehnice
asociate identificării pot fi rezolvate prin analiza probalităţii maxime.

IMPORTANT

Astfel, aptitudinea fluidă este de fapt factorul g a lui Spearman, iar aptitudinea
cristalizată este echivalentă cu factorul cunoştinţe educative care a fost extras de Vernon şi
cunoscut ca factorul v.ed. Atât gc cât şi v.ed, reprezintă expresii ale aptitudinii fluide în
cultură.
Este mai bine să privim factorul g ca un amestec de cei doi factori, aptitudine fluidă şi
cristalizată, bază a abilităţii raţionale, abilitate de a percepe relaţii şi a deduce corelaţii şi care
pot fi aplicate la orice tip de sarcină.

ITEMII TESTELOR DE INTELIGENŢĂ

După ce am definit inteligenţa ca abilitate de bază prin care se deduc corelaţii şi se


percep relaţiile, trebuie să fim preocupaţi de itemi ca pot fi folosiţi pentru a măsura această
abilitate.

IMPORTANT
Fluiditatea intelectuală poate fi măsurată prin intermediul unor sarcini nefamiliare sau
cu materiale foarte bine cunoscute de diferiţi indivizi în procesul de învăţare astfel încât să nu
afecteze rezultatele.

89
Inteligenţa cristalizată poate fi testată cu ajutorul unor materiale care reflectă
deprinderile achiziţionate şi valorizate cultural. În acest caz vor apărea diferenţe în parte
datorate educaţiei sau clasei sociale.
Nu vom descrie fiecare tip de item care poate să apară în testele de inteligenţă. Vom
discuta doar despre acei itemi care sunt cei mai frecvent folosiţi şi care au o pondere mare în
factorii respectivi.
În testele de inteligenţă este important ca itemii să varieze uşor în dificultate. În
scopuri comparative este util ca acelaşi tip de itemi să fie folosiţi pentru grupe de vârstă
diferite. Itemii trebuie să fie flexibili. Este util ca forma itemului să fie aplicabilă la o mare
varietate de situaţii. Există tipuri de itemi care sunt utilizaţi atât pentru măsurarea inteligenţei
fluide cât şi a celei cristalizate. Vom descrie în continuare diferiţi itemi utilizaţi în testele de
inteligenţă.

Analogii
Analogia este un tip de item care se găseşte în cele mai multe teste de inteligenţă.

IMPORTANT
Nivelul de dificultate este uşor de modificat dacă ţinem seama de relaţia dintre
elemente. Datorită înaltului grad de flexibilitate, pot fi construite analogii pentru o mare
varietate de situaţii
Sternberg a analizat factorial aceşti itemi în încercarea de a clarifica procesele
cognitive implicate în rezolvarea de probleme care solicită inteligenţa.

EXEMPLU

Exemplele au fost alese pentru a evidenţia modalităţile de măsurare a factorului g.

Analogiile sunt folosite pentru testarea facoturlui g deoarece soluţiile lor implică deducerea
relaţiei relevante între prima parte a analogiei şi aplicarea acesteia la restul analogiei:

Item 1: Cotobatura este pentru pasăre ceea ce este vipera pentru .......
a. animal, b. furnică, c. peşte, d. pasăre. e. reptilă
Acesta este un item uşor şi este o măsură a gc (inteligenţei cristalizate) deoarece
cunoştinţele biologice elementare necesare pentru rezolvarea acestui item reprezintă o
expectanţă culturală. Itemul este uşor pentru că relaţia cu membrii unei clase este simplă şi
pentru că soluţia, de a pune “viperă” într-o clasă analogă, nu ar trebui să necesite efort la
vârsta de 9 ani. Dacă itemul este folosit în studii interculturale ar putea să apară eşec dacă
speciile respective nu sunt prezente în arealul geografic cu care sunt familiarizaţi subiecţii.
Distractori cu alegeri multiple
Este important ca distractorii să distragă evident.

IMPORTANT
Pentru un item este important să observăm în ce proporţie subiecţii dintr-un eşantion
completează fiecare distractor.
Astfel, dacă trei distractori sunt evident greşiţi, pentru rezolvarea corectă, nimeni nu-i
va alege, iar itemul devine uşor de ghicit. Se întâmplă ca în urma analizei de itemi, un item să
fie eliminat deoarece corelaţia acestuia cu scorul total al testului să fie considerabil redusă.

90
Uneori este dificil să se conceapă buni distractori. O modalitate de a obţine distractori
buni este aceea de a prezenta itemii unui grup de subiecţi care dau răspunsuri libere. Cele mai
frecvente răspunsuri greşite date de subiecţi sunt considerate ca fiind buni distractori. Poziţia
răspunsului corect trebuie să fie întotdeauna întâmplătoare pentru ca astfel răspunsurile
corecte să nu fie date în funcţie de poziţia lor.

EXEMPLE
Item 2: Papagalul este pentru pasăre ceea ce este koala pentru ........
a. animal, b. furnică, c. mamifer, d. pasăre, e. reptilă.
Acest item reprezintă un echivalent intercultural pentru itemul 1, evident folosit în Australia.
Analiza de item, prin compararea valorilor lui p, a corelaţiilor între item şi scorul total precum
şi ponderea în factor a itemului, permite să vedem dacă aceşti item sunt echivalenţi. De
asemenea pot fi comparate curbele de distribuţie ale itemilor.
Item 3: Samson Agonistes este pentru Comus ceea ce este The Bacchae pentru ........
a. Oedipus Rex, b. Medaea, c. The Cyclos, d. Prometheus Bound, e. The Tempest
Am utilizat acest item pentru a ilustra anumite aspecte ale unui item. Este clar faptul că
acest item necesită cunoştinţe literare. Este un item dificil dacă nu ştim cine a scris aceste
texte şi natura cuvintelor. Dificultatea vine mai curând de la conţinutul implicat şi nu de la
relaţii. Este posibil ca acesta să fie un item sărac pentru că relaţia nu este dificil de dedus.
Comus este opusul tragediei. The Bacchae este o tragedie lui Eurupide şi trebuie să ne uităm
după o lucrare non-tragică. Aceasta este “Ciclopii” (The Cyclos).
Acest item ilustrează faptul că un item de analogie dificil poate să nu fie o bună măsură nici a
abilităţii cristalizate şi nici a celui fluide, atunci când conţinutul acestora este obscur. În testul
de analogii a lui Miller (Miller, 1970) rezolvarea itemilor presupune un nivel ridicat de
informaţii. Itemii măsoară inteligenţa cristalizată, nivelul ridicat de dificultate al acestora
datorându-se dificultăţii relaţiilor dintre conţinuturile analogiei. Itemul 4 este un exemplu
pentru un astfel de item:
Item 4: Televizorul este pentru microscop la fel ca telefonul pentru ............
a. amplificator, b. microprocesor, c. microundă, d. microfon, e. difuzor.
Acest item cu siguranţă necesită anumite cunoştinţe şi el trebuie să măsoare inteligenţa
cristalizată. Totuşi chiar dacă subiectul cunoaşte dispozitivele electronice mici, relaţia care
trebuie dedusă nu este la fel de simplă ca în exemplul anterior. Este o relaţie a distanţei
mărimii amplificării în câmpul vizual. Răspunsul corect este a.
Distractorii acestui item au fost cu atenţie aleşi. Subiecţii care nu vor realiza relaţia precisă
vor alege microfon. Toţi distractorii care au fost aleşi se referă la sunete sau micro pentru a nu
permite ghicirea lor.

Exemplele pe carele-am prezentat reprezintă baze ale analogiilor, dar marele lor avantaj este
acela că pot fi construite foarte multe tipuri de relaţii pe baza lor. Poate fi manipulată mărimea
în analogii:

Item 5: Şoimul este pentru vultur la fel ca duba pentru ....răspunsul corect este camion.

Este un item simplu care măsoare inteligenţa cristalizată şi este folosit pentru copii din şcoala
primară.

Exemplul următor ne arată cât de abstracte pot fi analogiile.

Item 6: mare este pentru enormitate la fel ca obosit, pentru ...răspunsul corect este apatie.

91
Acest item măsoară gc pentru că depinde de bogăţia vocabularului. Relaţia dintre substantiv şi
adjectiv nu este dificil de dedus. După cum s-a demonstrat (Vernon, 1961) vocabularul este
cel mai bun predictor al abilităţii cristalizate şi raţionamentul verbal are pondere mare în acest
factor de ordinul 2.
Toate aceste şase exemple de itemi măsoară inteligenţa cristalizată deoarece
raţionamentele sunt expresia culturii noastre. Acest tip de itemi pot fi folosiţi şi pentru a testa
inteligenţa fluidă.

IMPORTANT
Cattell (1971) argumenta că inteligenţa fluidă poate fi testată folosind itemi care sunt
supraînvăţaţi de subiecţii unei culturi sau itemi care sunt la fel de nefamiliari subiecţilor din
punct de vedere educativ sau social
Relaţiile dintre literele din alfabet şi relaţiile numerice pot fi testate în analogii. De
asemenea pot fi folosiţi itemii vizuali, non-verbali, configuraţii spaţiale.
Exemplele de itemi vizuali, numerici sau alfabetici sunt simple şi pot fi banali pentru a
fi adecvaţi testelor de inteligenţă. Ei au fost incluşi pentru că ilustrează modul în care
analogiile pot fi folosite pentru a măsura inteligenţa fluidă. Pentru aceşti itemi calitatea lor ar
trebui determinată prin intermediul analizei de item sau analizei factoriale.

EXEMPLU

Item 7.

este pentru la fel ca pentru

a. b. c. d. e.

Aceasta este un exemplu tipic de item non-verbal gc care măsoară abilitatea spaţială.
Se observă că nu este nevoie de nici un fel de cunoştinţe pentru a rezolva acest item simplu.
Pot fi construiţi itemi de acest tip care au un nivel ridicat de dificultate. Similar sunt folosiţi
itemi non-verbali pentru testarea interculturală a inteligenţei.

Item 8: E este pentru H la fel ca G pentru .......

a. P, b. J, c. K, d. O, e. F

Este un item simplu bazat pe succesiunea alfabetică. Tipul de raţionament cerut pentru
rezolvarea itemului este similar celui implicat în rezolvarea itemilor verbali.

Item 9: D este pentru W la fel ca L pentru .............

a. O, b. N, c. T, d. R, e. H

92
Între D şi W este o relaţie de simetrie, au poziţie simetrică la începutul alfabetului şi la
sfârşitul acestuia. O simetrie asemănătoare trebuie găsită pentru L.

Item 10: 25 este pentru 10 la fel ca 53 pentru ..........

a. 2, b. 8, c. 35, d. 15, e. 24

Relaţia nu este evidentă dar nu necesită multă matematică sau abilităţi de calcul pentru a o
descoperi: 10 este produsul dintre 2 şi 5.
Exemplele de analogii prezentate arată cum aceste forme de itemi pot testa abilitatea
de a deduce relaţii de diferite tipuri, de nivele diferite de dificultate şi folosind o varietate de
materiale verbale şi non-verbale. Nivelul de dificultate se referă mai curând la complexitatea
relaţiei care trebuie dedusă, decât la caracterul confuz al informaţiilor necesare.
Un bun test de inteligenţă poate fi construit folosind analogii de diferite tipuri. După
cum am discutat anterior varianţa unui test poate fi împărţită în varianţă adevărată şi varianţă
eroare. Scorurile obţinute la un test nou, construit dintre-un singur tip de itemi, vor fi compuse
din varianţa specifică itemilor. Nu se recomandă în practica psihometrică să se folosească
teste alcătuite dintr-un singur tip de itemi. Astfel Matricile Progresive Raven sunt administrate
împreună cu un test de vocabular. MPR măsoară inteligenţa fluidă în timp ce testele de
vocabular măsoară aptitudinea cristalizată. Aplicarea MPR împreună cu testele verbale au ca
scop reducerea varianţei specifice a itemilor.

Alţi itemi folosiţi în testele de inteligenţă


1. Similitudini

IMPORTANT
Aceşti itemi constau dintr-un set de substantive, verbe, obiecte, numere, forme/figuri
care toate, în afară de unu fac parte din aceeaşi categorie.
Subiectul trebuie să aleagă elementul care nu se potriveşte cu celelalte. Subiectul
trebuie să deducă relaţia dintre itemi pentru a stabili asemănările şi diferenţele dintre membrii
clasei. La fel ca şi în cazul analogiilor, această formă de itemi poate fi uşor manipulată din
punctul de vedere al nivelului de dificultate, atât al relaţiilor implicate cât şi al informaţiei
solicitate. Pentru testarea gf va fi nevoie de itemi care necesită un nivel scăzut de informaţii.
Pentru testarea gc sunt necesare informaţii despre nivelul educaţional şi clasă socială,
deoarece acestea pot afecta nivelul de inteligenţă fără ca raţionamentul cerut să fie dificil.

EXEMPLE

1.Vrabie, graur, liliac, pescăruş, rândunică. Acesta este un item simplu care măsoară
abilitatea cristalizată şi are la bază abilitatea de a face distincţia între păsări şi non-păsări
(mamifere - păsări).

2.Concret, abstract, îmblănit, iubitor, iute. Este un item foarte simplu pentru gc, în care
alegerea răspunsului corect se bazează pe existenţa unui adverb printre adjective. Se observă
că răspunsul corect poate să nu fie concret, la fel ca în cazul substantivelor Acest lucru
distinge itemii testului de inteligenţă de cei ai testelor de cunoştinţe, care de asemenea solicită
deducerea relaţiilor

93
3.24, 63, 10, 48, 35. Acesta este un exemplu de item numeric, despre care nu ştim sigur
dacă măsoară inteligenţa cristalizată şi care depinde de evidenţele empirice. Relaţia dintre
patru numere constă în faptul că dacă adunăm 1 ele sunt pătrate.Numai numărul 10 din şir nu
are această proprietate. Fiind necesare cunoştinţe de matematică pentru a rezolva acest item
problema devine una de abilitate cristalizată, pentru a descoperi relaţia aceasta.

4.

Acesta este un exemplu de item non-verbal. Este un item uşor. Doar unul dintre itemi
nu are linii drepte, şi nu sunt necesare cunoştinţe pentru rezolvarea lui. De aceea poate fi
folosit pentru măsurarea inteligenţei fluide la copii. Observăm că şi pentru aceşti itemi nu este
o problemă creşterea nivelului de dificultate. Atât inteligenţa fluidă cât şi cea cristalizată
poate fi testată folosind o mare varietate de astfel de itemi.

2. Secvenţe

IMPORTANT
Această formă de itemi poate fi folosită atât pentru itemii verbali, non-verbali sau
numerici, pentru testarea ambelor aspecte ale factorului g.
Totuşi se potriveşte mai bine itemilor non-verbali şi numerici. În cazul itemilor
numerici soluţionarea lor nu implică prea multe cunoştinţe matematice sau de raţionament.
Secvenţele non-verbale sunt singurele forme de item care alcătuiesc Matricele Progresive
Raven. Acesta este unul dintre cele mai bune teste care măsoară abilitatea fluidă (Carroll,
1983).

EXEMPLE

1. 9, 13, 15, 19, 21.... Acesta este un exemplu de item numeric, pentru a cărui rezolvare nu
sunt necesare cunoştinţe de matematică, deoarece itemul creşte cu 4 apoi cu 2.

2. 0,4, 2,4, 14,4, 86,4 .....

Acest item demonstrează că un item poate fi dificil. Relaţia este simplu de determinat dar
necesită cunoaşterea operaţiilor cu zecimale.

3.

94
Acesta este cel mai simplu item non-verbal posibil. Credem că este clar cum aceste materiale
pot fi folosite pentru construcţia itemilor.

4.

Această secvenţă este mai dificilă, subiecţii fiind rugaţi să completeze secvenţa selectând
răspunsul corect dintre cinci posibile.

Trebuie notat faptul că în unele situaţii secvenţele pot să nu fie complete. Se dă începutul şi
sfârşitul itemului, iar subiecţii trebuie să completeze mijlocul.

5. minuscul, foarte mic, mic, ............. larg, enorm. Subiecţii trebuie să aleagă între minuscul,
mare, enorm, greu.

Acest item ilustrează secvenţele verbale. Bineînţeles că aceşti itemi se potrivesc doar pentru
abilitatea cristalizată, oferind informaţii despre ponderea vocabularului în gc.
Aceste trei forme de itemi sunt mult utilizaţi în teste de inteligenţă. După cum am
văzut aceşti itemi sunt folosiţi pentru că pot utiliza o varietate de materiale şi pot avea nivele
diferite de dificultate. Ei sunt utili pentru măsurarea ambelor abilităţi.
Pentru a reduce monotonia testării (plictiseala reduce întotdeauna precizia şi
validitatea testului) s-au imaginat şi itemi de bază:
1. Variante ale analogiilor. Heim (1975) a utilizat o variantă interesantă a analogiilor
standard. Erau date două cuvinte subiecţilor. Aceştia trebuiau să selecteze dintr-o
listă un cuvânt care se află în relaţie similară cu ambele cuvinte date. Aceşti itemi
pot avea un nivel de dificultate ridicat şi pentru rezolvarea lor este nevoie de un
vocabular bogat. Cu ajutorul lor se testează inteligenţa cristalizată a subiecţilor cu
un nivel educaţional ridicat.
2. Variante ale itemului 2 similitudini. Este prezentată o listă de cuvinte cu trăsături
comune. Subiecţii trebuiau să aleagă din listă un cuvânt sau cuvintele care nu au
aceste trăsături comune.
3. Variante ale secvenţelor.
a. subiecţilor le se cerea să găsească itemul din mijlocul unei serii;
b. subiecţilor li se cerea să nu completeze următorul termen ci unul din final;
c. subiecţii trebuiau să rearanjeze termenii în secvenţe.
Rezolvarea acestor itemi depinde de abilitatea de a deduce relaţiile dintre termenii
itemului. La bază stă abilitatea de raţionament care este esenţa inteligenţei, inteligenţa care
este definită prin analiză factorială. Corelaţiile dintre testele de inteligenţă şi criteriile externe
indică faptul că abilitatea de raţionament este utilă într-un larg context de relaţii sociale.

Alte tipuri de itemi


Există şi alte tipuri de itemi care au fost utilizaţi pentru testarea în special a inteligenţei
cristalizate.

95
1. Vocabular După cum deja am menţionat vocabularul este testul care are ponderea
cea mai mare în factorul inteligenţă cristalizată şi sunt incluse în testele de
inteligenţă individuală.
2. Informaţii generale Sunt de asemenea utilizate pentru măsurarea inteligenţei
cristalizate. O persoană mai inteligentă poate vedea mai multe legături între noile
materiale şi ceea ce ştie deja în comparaţie cu o persoană mai puţin inteligentă.
3. Itemi variaţi Jense a realizat un catalog cu itemi care sunt mai buni pentru testele
actuale. Mulţi dintre ei sunt foarte asemănători cu itemii de bază care au fost
descrişi.
Această listă cuprinde: asemănări verbale - când două (cele mai asemănătoare
cuvinte) trebuie selectate; opuşi similari - când trebuie realizate perechi de cuvinte
antonime; completarea propoziţiilor - trebuie completate spaţiile albe ale unei
propoziţii; proverbe – elucidarea conţinutului unor proverbe; probleme de
raţionament logic; clasificare verbală - când trebuie alese dintr-o listă cuvintele
din categorii asemănătoare; silogisme; sinonime; realizarea din inferenţe
plecând de la materialul prezentat; inferenţe sintactice - când înţelesul cuvântului
trebuie să fie dedus; „pedigriu” - descoperirea relaţiilor dintre indivizi; probleme
de raţionament numeric.
4. Toţi aceşti itemi verbali sunt exemple ale abilităţii de raţionament pe care testele
de inteligenţă încearcă să o măsoare. Jensen a realizat şi o listă a diferitelor tipuri
de itemi non-verbali care pot fi găsite în aceste teste.

Itemi non-verbali. includ desene care conţin erori ce trebuie descoperite; clasificarea
figurilor - în care trebuie descoperite două figuri care pot fi puse împreună dintr-o serie; figuri
încastrate, unde trebuie descoperită o formă care este încastrată în alte figuri; completarea
gestaltului, unde forme şi figuri familiare trebui completate; figuri reversibile, unde subiecţii
trebuie să manipuleze mental forme geometrice; numărarea blocurilor, unde sunt prezentate
blocuri de desene care trebuie numărate (ultimele două teste măsoară abilitatea spaţială);
compararea blocurilor, în care desenele blocurilor trebuie să fie comparate pentru a judeca
asemănarea şi deosebirea; vizualizarea spaţială, în care subiecţii trebuie să imagineze cum o
bucată de hârtie va fi împăturiră pentru a obţine un anumită formă.
Itemii testelor de performanţă includ realizarea unor structuri din mărgele,
asamblarea obiectelor; desenarea oamenilor; găsirea drumurilor prin labirint.
În afara ultimelor două teste toate celelalte tipuri de itemi solicită abilităţi de bază,
raţionalizare şi descoperirea relaţiilor.

TESTE DE INTELIGENŢĂ INDIVIDUALE ŞI DE GRUP

Testele de inteligenţă se pot divide în două categorii - teste individuale şi de grup.


După cum sugerează şi numele testelor primele presupun ca subiecţii să fie testaţi cât unul
odată, în timp ce testele de grup presupun ca un mai mare număr de persoane să fie testaţi
simultan.
Avantajele testelor individuale
Există câteva avantaje ale testelor de inteligenţă administrate individual, în comparaţie
cu administrarea în grup.

96
IMPORTANT
În primul rând se elimină o serie surse de eroare cum ar fi: întoarcerea a două pagini
odată sau ruperea creionului sau stiloului.
Aceste aspecte au o importanţă minoră dar atunci când deciziile sunt luate pe baza
scorurilor testului aceste surse de eroare trebuie eliminate.

IMPORTANT
Testele individuale permit cercetătorului să observe cum subiecţii rezolvă itemii.
Acest lucru poate da informaţii în legătură cu dificultăţile pe care le poate avea
subiectul. De exemplu, un subiect poate să găsească un itemi dificil şi să refuze să continue
testul până când nu va reuşi să rezolve corect acel item, chiar dacă nu este capabil de acest
lucru. Acest mod de abordare a problemelor poate să ajute la explicarea dificultăţilor care apar
în rezolvarea problemelor din şcoală, universitate sau de la locul de muncă. Alţi subiecţi
lucrează cu mare viteză, iar când se confruntă cu un item dificil ei dau pur şi simplu primul
răspuns care le vine în minte fără să încerce să-l rezolve. Aceste informaţii dau mai multe
informaţii despre subiect decât scorul la testul de inteligenţă.

IMPORTANT
Un alt avantaj al acestor teste, în comparaţie cu cele de grup, este acela că putem să ne
asigurăm să subiectul a încercat cu adevărat să rezolve itemii, sau dacă acest lucru nu este
posibil, cel puţin să ştim dacă a fost angajat în rezolvarea itemilor testului.
Scorul mic la un test se poate datora faptului că subiectul nu a fost motivat.
Din aceste motive testele de inteligenţă individuală dau cea mai precisă măsură a
inteligenţei. Două astfel de teste au fost dezvoltate de Wechsler (1944, 1974) şi Standford-
Binet (Termaan şi Merrill, 1960).

Avantajele testelor de grup

IMPORTANT
Cel mai evident avantaj al acestor teste, în special în psihologia aplicată, este că
permite testarea unui număr mare de subiecţi odată.
Psihologul nu trebuie să aibă acelaşi nivel de pregătire şi abilităţi ca în cazul celui care
realizează administrarea individuală a testelor. Din aceste motive practice şi financiare testele
de grup sunt superioare testelor individuale.

IMPORTANT

Teste de grup sunt cu adevărat obiective, în timp ce testele individuale sunt subiective
pentru că cercetătorul doreşte să realizeze un profil cât mai bun al subiectului .
Vernon şi Jensen (1961) argumentează că există o corelaţie ridicată între testele de
grup şi cele individuale şi că un test de grup bun poate da o măsură validă a inteligenţei. Cea
mai comună metodă de validare a testelor de teste de inteligenţă de grup este aceea a
corelaţiei cu testele individuale.

97
Concluzii:
Din mai multe motive testele de inteligenţă de grup sunt satisfăcătoare. Există anumite
probleme specifice legate de persoană care fac ca un test individual să fie preferat, dar nu
trebuie să uităm corelaţia ridicată dintre cele două tipuri de teste.

QI - ul

IMPORTANT
Coeficientul de inteligenţă, QI, este pur şi simplu un scor standardizat sau normalizat
cu o medie de 100 şi o abatere standard de 15.
O astfel de standardizare ne oferă posibilitatea de a face comparaţii între scoruri şi în
acelaşi timp acestea să fie mai pline de semnificaţie.
Iniţial QI era obţinut prin împărţirea vârstei mentale a copilului, care este rezultatul la
test, la vârsta cronologică, rezultatul fiind înmulţit cu 100. Astfel dacă un copil de 12 ani avea
o vârstă mentală de 12 ani, rezulta un QI de 100. Similar la vârsta mentală de 8 ani se obţinea
un QI de 66. Ulterior s-a renunţat la această metodă deoarece s-a constatat că în anumite
cazuri atunci când diferenţa dintre vârsta mintală şi cea cronologică este de un an sau de doi
ani se obţine aceeaşi valoare a coeficientului de inteligenţă..
De exemplu: 6ani/5ani x 100 = 120 şi 12 ani/10 ani x 100 = 120. În cele două cazuri
coeficienţii de inteligenţă sunt identici, deşi în primul caz diferenţa dintre vârsta mintală şi cea
cronologică este de un an iar cel de al doilea caz de doi ani.
De asemenea s-a constatat că după 15 ani vârsta mentală nu mai creşte în acelaşi ritm
cu vârsta cronologică.

IMPORTANT

Din aceste motive metoda de calcul a QI -ului a fost înlocuită cu scorurile


standardizate calculate prin raportarea performanţei individuale a subiectului la performanţa
medie a grupului de vârstă.

APLICAŢIE
1.Dați exemple de câte 3 itemi pentru vocabular, secvențe, analogii și similitudini.

TEST DE AUTOEVALUARE (cu răspunsuri corecte ataşate la finalul cursului)


Apreciați valoarea de adevăr a următoarelor afirmații:
1. Inteligența este o abilitate rațională vastă și de bază, utilă în soluționarea unei mari varietăți
de probleme.
a. ADEVĂRAT
B. FALS
2. Inteligența se manifestă prin deprinderi particulare care sunt valorizate de cultură:
a. ADEVĂRAT

98
b. FALS
3. Aptitudinea cristalizată este aptitudinea fluidă exprimată cultural:
a. ADEVĂRAT
b. FALS
4. Memoria span este reamintirea de lungă durată a literelor:
a. ADEVĂRAT
b. FALS
5. Memoria semnificațiilor și memoria mecanică sunt comportamental diferite:
a. ADEVĂRAT
b. FALS
6. Raționamentul deductiv pleacă de la particular la general:
a. ADEVĂRAT
b. FALS
7. Inteligența cristalizată se bazează pe factorii abilităților verbale, mecanice, numerice și
sociale:
a. ADEVĂRAT
b. FALS
8. Aptitudinea fluidă poate fi măsurată prin sarcini care solicită cunoștințe și deprinderi
relevante pe care trebuie să le aibă indivizii unei culturi:
a. ADEVĂRAT
b. FALS
9. Itemii de tip similitudini constau dintr-un set de substantive, verbe, obiecte, numere,
forme/figuri care toate, în afară de unu fac parte din aceeași categorie:
a. ADEVĂRAT
b. FALS
10. Vocabularul este testul care are ponderea cea mai scăzută în factorul inteligență
cristalizare:
a. ADEVĂRAT
b. FALS

99
Unitatea de învățare 8.
TESTELE PENTRU ABILITĂŢI DE GRUP ŞI SPECIFICE

După cum s-a constat factorul „g” are două componente care asigură o bună proporţie
de varianţă în măsurarea abilităţii. Există şi factori importanţi pe care testele de inteligenţă nu
le măsoară. Unii dintre aceştia, cum ar fi „W” - fluenţa verbală (abilitatea de a elabora cuvinte
pornind de la o literă dată) par să fie înguşti şi specializaţi, în timp ce alţii, cum ar fi „V” -
abilitatea verbală - par să fie mai largi, de interes mai general. Factorii de vizualizare şi
reamintire par să aibă o importanţă mai mare în viaţa cotidiană.
Testele au fost construite pentru a măsura şi alte abilităţi în afara de inteligenţă. Au
fost realizate teste care să măsoare abilităţi utile în educaţie, pentru selecţie şi orientare, în
psihologia industrială unde se pune accentul pe selecţia persoanelor pentru meserii potrivite.

IMPORTANT
Chiar dacă testele de abilitate, cum ar fi abilitatea spaţială sau verbală, sunt valabile
pentru predicţia succesului educaţional şi profesional, nu înseamnă că factorul general „g” nu
este implicat în rezolvarea de probleme.
Factorul „g” este important, la fel şi ceilalţi factori.

EXEMPLU

Un nivel ridicat al lui „g” este necesar atât pentru un inginer cât şi pentru un bun
jurnalist. Totuşi un nivel ridicat al abilităţii spaţiale este necesar pentru un inginer, dar
reprezintă un slab avantaj pentru un jurnalist. Pentru acesta din urmă este necesar un nivel
ridicat la abilităţii verbale.

TIPURI DE TESTE PENTRU ABILITĂŢI DE GRUP


Vom trece în revistă itemii pentru principalele teste de abilitate şi vom discuta despre
valoarea şi avantajele utilizării acestor teste.
1. Teste de abilitate verbală

IMPORTANT

Esenţa testelor de abilitate verbală este acea de a înţelege cuvintele sau ideile. Ele
cuprind sinonime, înţelegerea proverbelor, vocabular şi analogii verbale. Abilitatea verbală
este probabil cel mai bun indicator al inteligenţei cristalizate.
Itemi
Vom descrie itemii în termenii a ceea ce ei încearcă să măsoare.
Într-unul dintre cele mai bune teste de raţionament verbal „Scala de Raţionament
Verbal din testul de aptitudine diferenţiată” (Bennet, 1962) itemii au o singură formă de tipul
analogiilor verbale.

100
IMPORTANT

Aspectul psihologic vizat este capacitatea de a stabili categorii pe baza unor


caracteristici sau însuşiri comune între noţiuni.

DEFINIŢIE
O colecţie de obiecte sau fenomene reunite în aceeaşi grupare sau categorie, pe baza
unor caracteristici determinate formează ceea ce numim o clasă.
Noţiunea rezumă informaţia esenţială cu privire la o clasă de obiecte sau fenomene.
De regulă conţinuturile semantice din domenii de cunoştinţe bine structurate sunt
organizate în reţele semantice. Reţeaua semantică este formată din noduri şi arcuri. Fiecare
nod reprezintă un concept şi fiecare arc o relaţie dintre concepte sau dintre acestea şi
proprietăţile esenţiale adiacente.

IMPORTANT

Cunoştinţele care alcătuiesc reţeaua semantică sunt organizate ierarhic, în funcţie de


gradul lor de generalitate. Reţeaua semantică conţine două tipuri de relaţii: a) relaţii de
subordonare; b) relaţii de coordonare.
Se face apel la strategia inductivă, subiectul trebuind să găsească o noţiune
supraordonată pe baza desprinderii notelor comune ale unui grup de noţiuni şi să identifice
elementele de contrast (exemplele diferenţiatoare). Strategia inductivă se bazează pe
activitatea de analiză şi comparaţie.
Strategia inductivă prezintă la copii (până la 10 - 11 ani) o formă particulară. Ei nu
reuşesc să extragă informaţia necesară din exemplul diferenţiator.

EXEMPLU

Sarcina de lucru: subiectul trebuie să identifice cuvintele care nu pot fi incluse într-o
categorie cu celelalte.

De exemplu: aici, azi, ieri, deunăzi mâine

mahomedan, catolic, ortodox, budist, protestant


După cum am menţionat anterior abilitatea verbală are o pondere ridicată în inteligenţa
cristalizată. Testele de abilitate verbală au o validitate ridicată. Ele măsoară abilitatea verbală
şi corelează ridicat cu inteligenţa cristalizată.
Alte teste de abilitate verbală, folosite în special pentru adulţi, conţin pasaje scrise, cu
întrebări cu alegeri multiple pentru a testa înţelegerea. Aceste teste au pondere mare în
abilitatea cristalizată şi adesea sunt folosite ca teste de inteligenţă mai curând decât ca test
care măsoară abilitatea mentală.

101
IMPORTANT
Testele de abilitate verbală nu pot fi confundate cu cele de cunoştinţe. Cunoştinţele
sunt reprezentate de cunoştinţele de gramatică, vocabular, sintaxă. Aceste teste sunt
dependente sau corelează cu teste de abilitate verbală dar nu sunt identice.
Un individ cu abilitate verbală ridicată care se mută recent în altă ţară cu limbă diferită
de a sa va prezenta un nivel scăzut de cunoştinţe în acea limbă. Atunci când redactăm itemii
de raţionament verbal este important să nu includem itemi prea dificili care necesită
cunoştinţe considerabile de gramatică.
Alţi itemi utilizaţi în scalele de raţionament verbal sunt testele de comprehensiune şi
înţelegere, în care se cere subiecţiilor să explice înţelesul unor proverbe, în mod obişnuit în
forma alegerilor multiple, şi a testelor de vocabular.

EXEMPLU
Ce înţelegi prin cuvintele: apogeu, cronică, polemică, pertinent
Citiţi cu atenţie proverbul „Spune-mi cu cine te însoţeşti ca să-ţi spun cine eşti”
1.Cu care din proverbele de mai jos se aseamănă cel mai mult din punct de vedere al
conţinutului:
2.Promisiunea dată e datorie curată
3.Buturuga mică răstoarnă carul mare
4.Omul din soţii lui se cunoaşte
5.Cine se scoală de dimineaţă, departe ajunge
6.Cina s-a fript în ciorbă, suflă şi în iaurt
7.Din pomul bun şi roadă bună se face
8.Năravul din fire nu are lecuire
9. Fiecare îşi trage spuza pe turta lui
Itemii acestor teste pot viza şi stabilirea unor relaţii dintre noţiuni.

IMPORTANT
Aspectul psihologic vizat este capacitatea de a înţelege sensul noţiunilor şi de stabilire a
legăturilor dintre acestora, operare cu raţionamente inductive analogice.
Din punct de vedere structural - operatoriu gândirea constă din structuri cognitive
(=informaţii structurate) şi operaţii sau secvenţe de operaţii (= strategii) ce se poartă asupra
acestor structuri. Structura cognitivă tipică pentru gândire este noţiunea, care structurează
informaţiile generale, necesare şi esenţiale despre obiect sau stare de lucruri. Operaţiile sau
prelucrările (procesările) la care este supusă informaţia psihică sunt extrem de variate şi
organizate ierarhic.

IMPORTANT
La nivel mediu de analiză a gândirii operaţia cea mai însemnată este raţionamentul
(inferenţa). Raţionamentul inductiv analogic, relevat de acest tip de sarcină, presupune
inducerea unei structuri.
Adică, se bazează pe descoperirea unei reţele constante de conexiuni între elementele
unei mulţimi şi apoi aplicarea acestei structuri la o situaţie nouă.

102
IMPORTANT

Dacă descompunem raţionamentul reclamat în elemente componente (operaţii


minimale), obţinem şapte elemente componente: codarea, inferenţa, punerea în
corespondenţă, aplicarea structurii descoperite, compararea, justificarea, răspunsul.
Detectarea şi transferul structurii de la o problemă - sursă la o problemă - ţintă este
dependentă de schemele cognitive ale subiecţilor.

DEFINIŢIE
Schemele cognitive sunt blocuri organizate de cunoştinţe ireductibile la componentele
sale, corespunzătoare unor mulţimi de elemente din realitate.
Cercetările au arătat că dintr-o baterie de teste de inteligenţă, subtestele verbale au
valoarea predictivă cea mai bună pentru reuşita şcolară ţinând cont de implicarea limbajului în
procesul de instruire.
Rezultatele la acest tip de teste sunt puternic influenţate de nivelul cultural.
Sarcina de lucru constă în identificarea legăturilor semantice dintre noţiunile unei
perechi date şi formarea unei noi perechi pe baza relaţiei stabilită anterior. Subiectul trebuie să
aleagă al doilea termen al perechii (primul fiind dat) din patru posibilităţi.

EXEMPLU

Cer – albastru Iarbă - ………………/ verde, cardă, mare, deasă

Pasărea – zboară Peştele -…………… / fuge, înoată, sare, rapid


Toate aceste teste au pondere ridicată în abilitatea cristalizată.

2. Abilitatea numerică

DEFINIŢIE
Abilitatea numerică este uşurinţa de a manipula rapid şi corect numerele.
Nu are o legătură foarte apropiată cu abilitatea matematică, care corelează ridicat cu
raţionamentul inductiv, abilitatea spaţială şi cei doi factori de inteligenţă. Bineînţeles
numerele nu pot fi manipulate făcând excepţie de regulile matematice, astfel că itemii solicită
un nivel minim de cunoştinţe aritmetice.
Itemi

IMPORTANT
Într-un test pentru adulţi itemii cu alegeri multiple ar trebui folosiţi nu pentru a creşte
dificultatea matematică, ci pentru a testa viteza şi precizia.
În testul aptitudinilor diferenţiale, de exemplu, itemii testează următoarele procese:
adiţionarea, extragerea, divizarea, rădăcina pătrată, procentaje, fracţii.

103
IMPORTANT

Aspectul psihologic vizat este aptitudinea de a folosi cu uşurinţă simboluri matematice.


Se referă la factorul „N” a lui Thurstone.
Testele ce vizează factorul numeric sunt probe de calcul simplu ce trebuie executat
într-un timp limitat. Factorul numeric astfel măsurat este o aptitudine specifică, primară care
nu dă informaţii despre aptitudinea la matematică. Testul nu face apel la raţionament
aritmetic, ci doar la folosirea rapidă de simboluri numerice.

DEFINIŢIE
Factorul „N” este aptitudinea de manipularea rapidă a unui sistem simbolic urmând o
serie de reguli specifice, cu condiţia ca atât sistemul simbolic cât şi regulile să fie perfect
asimilate.
În cazul acestui test sistemul simbolic corespunde simbolurilor numerice, iar regulile
sunt de operaţie aritmetică simplă.
Sarcina de lucru: Subiectul trebuie să rezolve itemul, pe baza celor patru operaţii
aritmetice, indicând răspunsul corect din mai multe variante posibile.

EXEMPLU

Cât este: 5/5/4 a. 1/5 c. 4 e. 25/4

b. 1/4 d. 5
Este clar că abilitatea numerică vizează viteza şi precizia manipulării numerelor.
Aceşti itemi nu solicită o abilitate ridicată de raţionament, de aceea există o corelaţie modestă
cu cunoştinţele matematice.

3. Abilitatea spaţială

DEFINIŢIE
Aceasta este abilitatea de a vizualiza figurile cu două sau trei dimensiuni atunci când
orientarea lor se schimbă.
Este o abilitate importantă pentru anumite forme de matematică, cum ar fi geometria
sau topografia, anumite domenii din chimie unde structurile sunt importante.
Itemii
În mod obişnuit itemii constau într-o formă urmată de un set de alte forme. Subiecţilor
li se cere să precizeze care dintre formele din set este la fel ca exemplarul rotit. Alţi itemi cer
subiectului să identifice dintr-un set de forme pe cea care este la fel cu prima văzută în
oglindă sau răsturnată.

IMPORTANT
104
Trebuie să precizăm că itemii spaţiali de acest tip în care formele geometrice sunt
reorientate în spaţiu şi trebuie recunoscute sunt ideale pentru prezentarea în formă
computerizată, unde reorientarea poate fi uşor controlată.
Un alt tip de itemi de abilitate spaţială cuprind o mulţime de blocuri în care înălţimea
coloanelor variază. Subiecţii sunt rugaţi să extragă numărul total de cărămizi din ansamblu,
inclusiv pe cele care nu se văd.
Un lat tip de itemi indică un aranjament de îndoituri ale hârtiei indicând numărul de
îndoituri. Dedesubtul acestora se găseşte o serie de construcţii din foi îndoite, subiectul
trebuind să indice din care dintre ansambluri a fost realizată construcţia.

IMPORTANT

Aspectele psihologice vizate sunt percepţia şi reprezentarea spaţială (factorii P şi S


definiţi de Thurstone în cadrul teoriei multifactoriale a inteligenţei)- care se referă la
vizualizarea spaţială a obiectelor cu posibilitatea de a imagina în plan mintal elementele
“ascunse”.
Factorii prezintă legături puternice cu inteligenţa generală şi sunt cel mai puţin
influenţaţi de mediul socio-cultural al copilului.
Sarcina de lucru: constă în găsirea numărului de cuburi din fiecare construcţie
incluzând atât cuburile care se văd cât şi cele care nu se văd.

EXEMPLU

Din câte cuburi este compusă următoarea figură?

Sau modele desfăşurate în plan care prin pliere pot forma figuri geometrice:

Care din cele patru figuri A,B,C,D, poate fi confecţionată din modelul desfăşurat?

4. Viteza de percepţie şi factorul precizie

105
DEFINIŢIE
Acest factor implică recunoaşterea rapidă a detaliilor observate şi abilitatea de a
percepe asemănările şi deosebirile în structura percepută.
Se pare că este o abilitate importantă pentru anumite profesiuni, cum ar cea de pilot
sau operator radar în care factorul perceptiv joacă un rol important (Carroll, 1971; Nunnally,
1978)
Itemii

IMPORTANT
Viteaza este importantă în măsurarea acestui factor. Itemii nu sunt dificili dacă se dă
timp de lucru nelimitat
Pentru măsurarea vitezei de percepere, de exemplu în Testul de Aptitudini
Diferenţială, itemii conţin forme care trebuie comparate cu alte forme, subiecţii trebuind să
marcheze pe cei asemănători sau diferiţi, sau conţin combinaţii de numere sau litere care
trebuie comparate cu alte combinaţii similare. Numărul mare de itemi trebuie completat într-
un timp limită.

EXEMPLU

Care din figurile notate A, B, C, D, E, este identică cu figura din stânga imaginii?

A B C D E

5. Viteza perceptivă de închidere


Acesta este un alt factor perceptiv care apare în analiza factorială a testelor.

DEFINIŢIE
Implică abilitatea de a completa o formă atunci când lipsesc părţi ale sale.
Acestor factor corelează 0,61 cu fluenţa verbală.
Itemii
Cuvintele degradate reprezintă un tip particular de itemi. Cuvintele sunt prezentate cu
bucăţi de litere lipsă, subiecţii trebuind să le identifice. Esenţial pentru această viteză de
închidere este aceea că recunoşterea actuală poate fi dificilă dacă degradarea cuvintelor este
considerabilă. Itemi similar pot cere subiecţilor să identifice numere sau litere degradate (din
care lipsesc bucăţi).
May a utilizat un astfel de test pentru a studia flexibilitatea gândirii. Itemii erau
prezentaţi pe computer, unde degradarea era întrerupând anumite numere sau pixeli relevanţi.

106
EXEMPLU

Identificaţi cuvântul scris mai sus:

6. Raţionamentul inductiv.

IMPORTANT

Acest factor implică inducţia, raţionamentul pornind de la specific la general. Este o


variabilă cu pondere mare în aptitudinea fluidă.
Itemi
Un test tipic pentru raţionamentul inductiv sunt literele grupate. Sunt prezentate 5
seturi de câte 4 litere. Subiecţii trebuie să găsească regula care leagă cele 4 litere din set şi să
selecteze setul care nu se potriveşte.

EXEMPLU

Alegeţi unul din cele patru seturi de litere care nu se potriveşte să fie împreună cu
celelalte trei:

1.A.B.C.D. 3.M.N.P.S.

2.B.C.D.F. 4. A.E.I.O.
Un alt test este reprezentat de clasificarea figurilor. Fiecare item este reprezentat de 2
sau 3 grupuri, fiecare dintre ele fiind alcătuit din 3 figuri geometrice care sunt asemănătoare
prin respectarea aceleaşi reguli. Al doilea rând al fiecărui item este reprezentat de 8 figuri.
Subiecţii trebuie să descopere regula şi să clasifice aceste 8 figuri în grupuri asemănătoare.
7. Fluenţa ideatică

DEFINIŢIE
Este abilitatea de a produce un număr mare de idei pe o anumită temă dată. Se pune
accent mai mult pe viteză şi fluenţă decât pe calitate.
Itemi
Se dă un număr de obiecte cerându-li-se subiecţilor să precizeze cât mai multe moduri
posibile de folosire a acestora. În alt teste est folosită o listă de obiecte care se aseamănă din
punctul de vedere al utilizării. De exemplu: găsiţi cât mai multe moduri de utilizare a unei
cărămizi

107
8. Fluenţa cuvintelor

IMPORTANT

Acest factor pune are pune accentul pe creativitate sau gândirea divergentă, în
concepţia lui Guildford. Acest factor corelează cu fluenţa ideatică, dar este diferit de acesta.
Implică abilitatea de a produce cât mai multe cuvinte pornind de la o literă dată, cvinte care să
nu fie legate semantic.
Itemii
Să se scrie cât mai multe cuvinte posibil dându-se litera de la început, sfârşit sau
ambele litere de la început şi sfârşit.

9.Originalitate flexibilităţii ideatice.


Este o măsură a originalităţii ideilor aşa cum a fost studiată de Guildford.
Itemii
Sunt asemănători cu cei care măsoară fluenţa ideatică. Măsura acestui factor este o
evaluare a originalităţii ideilor produse ca răspuns la un item.

IMPORTANT
Originalitatea poate fi reprezentată de o judecată subiectivă sau poate fi original în
sensul rarităţii, în comparaţie cu normele.
Această ultimă formă este mai precisă în comparaţie cu prima. Totuşi deşi ultima
formă este mai precisă decât judecăţile subiective, este posibil să fie mai puţin validă deoarece
raritatea răspunsului nu înseamnă că este originalitate se referă la sensul cuvântului.
Schizofrenicii şi psihoticii pot da răspunsuri stupide care pot fi cotate în factor. De exemplu,
la modalităţile de utilizare a penei, un subiect poate scrie microscop, scalp şi ţintă nucleară,
acestea pot fi utilizări normativ originale, totuşi total ridicole.
10. Originalitate 2
Acest factor este relativ nou, fiind extras de Cattell (1974) din primul factor
originalitate.

IMPORTANT

Diferă ca sens de originalitate, aici trebuind să fie utilizată în situaţii de constrângere)


şi există itemi tipici pentru măsurarea lui.

Itemi
Subiecţii sunt rugaţi să combine două obiecte pentru a realiza un nou obiect
funcţional. Poate fi obţinută şi o măsură a fluenţei ideatice la fel de bine ca şi o măsură a
factorului originalitate.
Acesta acoperă tipurile de itemi folosiţi pentru a măsura 10 dintre cei mai importanţi
factori primari. Unii dintre aceşti itemi au fost discutaţi în lista care cuprindea variate tipuri de
itemi ale testelor de inteligenţă. Factorul de compensaţia gr, care este aspectul educaţional cel
mai important pentru factorii de ordinul 2, apare din cei doi factori de inteligenţă, fiind că

108
îmbrăţişează originalitatea şi fluenţa care corelează cu creativitatea cel puţin pentru a limita
extinderea/evaluarea.
AVANTAJELE MĂSURĂRII FACTORILOR PRIMARI
Deşi multe dintre testele care măsoară factorii primari au pondere în structura
factorilor secundari, se poate pune întrebarea de ce mai avem nevoie de aceste teste care
măsoară factorii primari. În aplicarea testelor psihometrice în domeniul educaţiei, clinic şi
profesional este nevoie uneori să măsurăm una dintre abilităţile mai specifice ale subiectului.

EXEMPLU

Dacă dorim să selectăm subiecţii pentru zboruri de antrenament cu elicopterul, vom


selecta subiecţii care au abilitate spaţială şi ne-am concentra asupra acesteia. Acum factorul
de vizualizare este important, dar am fi mult mai precişi dacă am testa separat factorii primari
care compun acest factor secundar. Am obţine două scoruri identice la al doilea factor dar
care sunt compuse din scoruri diferite ale factorilor de ordinul 1.
Nu înseamnă că factorii de ordinul 2 nu sunt importanţi. Pentru multe situaţii testele de
inteligenţă sunt cea mai utilă măsură. Una dintre problemele testării unui număr mare de
factori primari este acea că ele tind să coreleze, varianţa lor fiind explicată de factorul g.
Aceasta este problema principală a testelor de aptitudini. Ele nu diferenţiază destul între
aspectele primare ale factorului g.

TESTE DE ABILITATE SPECIFICĂ ŞI ALTE TESTE

Din cauza naturii analizei factoriale nu putem spune că există un număr finit de
abilităţi umane. Factorii primari explică mult din varianţă atunci când se foloseşte un număr
mare de teste de abilitate. După cum argumentează Cattell multe dintre testele în varianta
creion-hârtie (în forma modernă teste computerizate) măsoară diferite abilităţi care sunt utile
pentru educaţia academică. Totuşi sunt multe abilităţi care pot fi observate în viaţa cotidiană
şi pentru care nu există teste, cum ar fi de exemplu, abilităţile practice ale meşteşugarilor.
Dacă aceste abilităţi şi deprinderi ar fi supuse analizei factoriale este posibil ca să deducem
noi factori.

IMPORTANT

Apare problema diferenţei dintre un factor general şi un factor specific. Pentru toate
testele construite există pericolul obţinerii unui factor specific folosind un număr mare de
itemi similari. Aceşti factori nu corelează decât cu itemi similari. Acest lucru a apărut, parţial,
în modelul abilităţilor umane a lui Guilford (1967) care postulează existenţa a 120 de abilităţi.
În psihometrie există un acord asupra faptului că există un anumit număr de abilităţi
speciale, şi testele pot fi divizate pentru a le măsura. Vom discuta în continuare despre aceste
teste care vizează abilităţi speciale.
Abilitatea muzicală
Shuter (1968) consideră că aceste abilităţi pot fi măsurate folosind mai multe tipuri de
teste. Acest lucru este surprinzător ştiind că abilitatea mentală este diferită de inteligenţă
precum şi de alte abilităţi, nu sunt suficiente pentru expertiza aptitudinii muzicale. Se poate
argumenta că îndemânarea muzicală reprezintă pur şi simplu cunoştinţe pe care oricine le
poate dobândi. Aceasta este concluzia unui studiu realizat pe muzicieni. Este adevărat că cu

109
efort o anumită măiestrie în muzică poate fi obţinută de mulţi oameni. Totuşi viteza cu care
muzicienii talentaţi învaţă, sugerează că trebuie să existe abilităţi speciale. Există un număr de
abilităţi speciale, dar cea mai renumită este cea dezvoltată de Seashore (1919) în cercetările
făcute asupra abilităţii mentale.
Itemii
Cele mai multe teste de abilitate mentală conţin itemi pe care orice muzician le-ar
poseda. Sunt măsurate înălţimea schimbării, analizele acordurilor, memorie, ritm, armonie,
intensitate. Unele teste folosesc pianul, altele tonurile pure. Seashore a încercat să măsoare
abilităţile muzicale de bază, în sensul tonalităţii, ritmului şi auzului muzical. Acestea
corelează din punctul de vedere a lui Shuter (1968) ca un factor muzical general.

Abilitate artistică

IMPORTANT

Abilitatea artistică are sens în explicarea diferenţelor individuale ale abilităţii de a


desena, de a picta şi a măiestriei artistice, deşi nu este nici o îndoială că exerciţiul şi metodele
bune pot duce la dezvoltarea abilităţilor artistice. Totuşi factorii care intră în alcătuirea
abilităţilor artistice sunt necunoscuţi.
La aceasta se adaugă faptul că selecţia în şcolile de artă se face, în mod obişnuit pe
baza performanţelor. Cel mai cunoscut test este Testul Evaluării Artei a lui Meier (1963), care
cerea subiecţilor să evalueze care dintre desene este mai bun, unul fiind o lucrare de artă iar
celălalt o versiune alterată. Nu există dovezi că acesta ar fi un test valid şi este îndoielnică
încredere într-un astfel de test.

Abilităţile copiilor mici


Psihologii care activează în domeniul psihologiei dezvoltării au realizat un număr de
măsurători în speranţa de a măsura inteligenţa sau dezvoltarea intelectului de la vârste foarte
fragede, din momentul în care copilul este capabil să răspundă. Scala de dezvoltarea a copiilor
realizată de Bayley (1969), de exemplu, este potrivită pentru copii de 2-30 de luni. Acest test
reprezintă o măsurare tipică a abilităţilor copiilor.
Testul de dezvoltare Gesell măsoară dezvoltarea mentală, dezvoltarea motorie, dar şi
comportamentul social la copilului, pe o scală de evaluare. Noţiunea de item este dificil de
aplicat deoarece copilului i se prezintă un sunet de clopoţel, examinatorul notând reacţia
acestuia. Un alt item este întoarcerea pentru a observa un obiect în mişcare. Aceşti itemi se
aplică la vârste foarte fragede, măsurând atenţia şi răspunsul. La vârsta de un an itemii se
concentrează spre măsurarea abilităţii de comunicare şi a dezvoltării conceptelor. Se
consideră că şi imitaţia reprezintă un indicator important al dezvoltării în scala Bayley,
copiilor cerându-li-se să manipuleze păpuşi, căni, jucării, şi să mâzgâlească. Aceste
comportamente sunt urmărite atât spontan dar şi ca imitaţie.

IMPORTANT

Problema scalei Bayley, la fel ca şi a altor scări de măsurare a dezvoltării, este slaba
corelaţie cu inteligenţa măsurată mai târziu. Damarin (1978) afirmă că este greu să stabilim
clinic sau în termeni teoretici ce anume determină aceste rezultate. De fapt scorurile nu
corelează ridicat cu QI-ul de mai târziu pentru că conţinutul este total diferit.

110
Considerăm că aceste scale de măsurare a dezvoltării copiilor evaluează dezvoltarea
dar nu sunt legate de inteligenţă stabilită ulterior. Cattell (1971) sugerează că acest lucru nu
trebuie să ne surprindă, pentru că viteza de dezvoltare a diferitor specii, chiar şi a mamiferelor
corelează negativ cu poziţia lor pe scra filogenetică.
Aceste scări se pot dovedi utile pentru diagnosticarea unor cazuri severe de retard cu o
bază organică. Nu sunt recomandate ca indice al inteligenţei pentru cazurile normale,
nemedicale.

Abilităţi fizice şi psihomotorii


Au un rol important în sport dar şi în cadrul anumitor sarcini, cum ar fi scrierea şi
dactilografierea.
Aceste abilităţii motorii au fost obiect de studiu în mai multe cercetări realizate de
Fleishman şi colegii (Fleishman, 1964, 1975; Fleishman şi Quaintace, 1984). Au fost izolaţi
19 factori principali. Aceşti factori au fost rezumaţi de Peterson şi Bownas (1982),
considerându-se că ei sunt o bună măsură a naturii acestor abilităţi psihometrice.
1. Forţa statică: gradul forţei musculare exercitat pentru a mişca continuu un obiect greu.
Test - dinamometru,
2. Forţa explozivă: abilitatea de a mobiliza energia pentru un efort exploziv, ca în aruncare.
3. Forţa dinamică: braţe şi trunchi puternice pentru a mişca continuu greutatea propriului
corp.
4. Rezistenţă: abilitatea de a menţine activitatea fizică pe o perioadă îndelungată de timp.
5. Evaluarea flexibilităţii: abilitatea de a îndoi/flexa grupuri de muşchi.
6. Flexibilitatea dinamică: abilitatea de a repeta mişcările trunchiului sau ale membrelor
atunci când sunt cerinţe legate de viteză şi flexibilitate.
7. Echilibrul corpului: abilitatea de a menţine corpul în balans.
8. Timpul de alegere a reacţiei: viteza de reacţie la un stimul atunci când se prezintă mai
mulţi stimuli.
9. Timpul de reacţie: viteza de reacţie la un singur stimul.
10. Viteza de mişcare a membrelor: viteza cu care pot fi executate mişcări ale membrelor.
11. Viteza încheietură-deget: viteza de execuţie a mişcărilor di articulaţia mâinii
12. Coordonarea corpului: abilitatea de a coordona trunchiul.
13. Coordonarea membrelor: vizează. abilitatea de a coordona membrele
14. Dexteritatea degetelor: abilitatea de a coordona mişcarea degetelor. Nu se referă la
abilitatea de a manipula maşini sau de a controla mecanisme diferite.
15. Dexteritatea manuală: similar cu cea anterioară, dar se referă la mâini.
16. Siguranţa/precizia braţ-mână: abilitatea de a face mişcări braţ-mână precise şi
sigure.
17. Nivelul controlului: abilitatea de a face ajustări motorii în timp pentru a schimba
relativ viteza faţă de o ţintă în mişcare.
18. Precizia controlului. Abilitatea de a controla mişcările musculare necesare pentru
a lucra la o maşină sau de a controla mecanisme.
La fel ca în cazul listei factorilor cognitivi, care reprezintă cele mai importante
variabile din domeniul cognitiv care trebuie măsurate, lista prezentată mai sus prezintă cele
mai importante variabile în domeniul psihomotor.

111
IMPORTANT

Unii dintre factori nu au o componentă psihologică, cum ar şi rezistenţa sau viteza


membrelor (există o componentă psihologică determinativă atunci când persoana
abandonează sarcina), în timp ce alţi factori, cum ar fi viteza de reacţie şi alegerea reacţiei
corelează ridicat cu inteligenţa (variabilitatea reacţiei s-a sugerat că ar fi o posibilă măsură
obiectivă a variabilităţii QI -ului) (Jensen, 1980; Kleine, 1990)

Testele psihomotorii
Multe dintre testele care măsoară aceşti factori sunt pur şi simplu teste fizice. Testul
Purdue Pegboard constă într-o placă de lemn cu goluri în care subiecţii trebuie să introducă
forme. Testul rotorului constă într-un plan cu un spot pe care subiectul trebuie să menţină un
cursor. Se înregistrează dacă contactul este menţinut sau nu. Măsurarea timpilor de reacţie
pentru stimuli luminoşi corespunzători unor taste care trebuie apăsate când apare lumina.
Poate fi măsurat timpul de reacţie al subiectului atunci când acesta stă cu mâna pe un buton,
dar şi timpul de mişcare pentru a căuta butonul necesar pentru a da răspunsul. Variabilitatea
timpilor de reacţie corelează 0,40 cu factorul g.
O măsurare interesantă a realizat Fleishman pentru a prezice succesul în meserie în
selecţia ocupaţională. Corespunzător acestor factori psihomotori autorii au realizat scări de
măsurare pentru diferite posturi, astfel ca postul şi persoana să se potrivească. Aceşti factori
sunt mai curând fizici decât psihologici, corelează cu performanţa din viaţa reală şi variază în
diferitele stadii de educaţie (Fleishman, 1966). Aceste probe sunt utile pentru selecţia
profesională în sarcini specifice.

TEST DE AUTOEVALUARE (cu răspunsuri corecte ataşate la finalul cursului)


Apreciați valoarea de adevăr a următoarelor afirmații:
1. Esența testelor de abilitate verbală este aceea de a înțelege cuvintele sau ideile:
a. ADEVĂRAT
B. FALS
2. Conținuturile semantice din domenii de cunoștințe bine structurate sunt organizate în rețele
semantice:
a. ADEVĂRAT
b. FALS
3. Strategia inductivă nu se bazează pe activitatea de analiză și comparație:
a. ADEVĂRAT
b. FALS
4. Testele de cunoștințe sunt independente de testele de abilitatea verbală:
a. ADEVĂRAT
b. FALS
5. Schemele cognitive sunt blocuri organizate de cunoştinţe ireductibile la componentele sale,
corespunzătoare unor mulţimi de elemente din realitate.
a. ADEVĂRAT
b. FALS
6. Abilitatea numerică solicită un nivel ridicat de cunoștințe matematice:
a. ADEVĂRAT
b. FALS

112
7. Factorul „N” este aptitudinea de manipularea rapidă a unui sistem simbolic urmând o serie
de reguli specifice:
a. ADEVĂRAT
b. FALS

113
Unitatea de învățare 9.
TESTE DE ABILITĂŢI ŞI CUNOŞTINŢE

SENSUL APTITUDINII

Termenul de aptitudine, în limba engleză, este frecvent folosit pentru a desemna o


capacitate naturală, potrivită şi chiar inteligenţa. Este utilizat în mod obişnuit pentru a descrie
o persoană care are aptitudine, de exemplu, pentru calculatoare sau pentru matematică.
Aptitudinea este de asemenea şi termen psihologic, existând o varietate de teste de aptitudini,
unele larg utilizate, cum ar fi Testul Aptitudinilor Diferenţiale - DAT (Bennet, 1962). Este
clar că aptitudinea este un cuvânt care are mai multe înţelesuri şi este important să se
definească precis ceea ce se înţelege prin aptitudine sau cel puţin să se clarifice ambiguitatea
conceptului. Acest lucru este necesar pentru că testele sunt definiţii operaţionale ale
variabilelor.

DEFINIŢIE
În psihologie, aptitudinea se referă la un ansamblu de abilităţi care pot avea o anumită
valoare într-o cultură dată.
Astfel în DAT putem găsi atât teste verbale cât şi neverbale. Aceste două tipuri de
teste relevă confuzia din cadrul conceptului care include ambii factori (verbal şi nonverbal)
cât şi unele abilităţi şi deprinderi separate.
Astfel abilitatea verbală este un factor primar, „V”, dat de sinonime, înţelesul
proverbelor şi analogii. Aptitudinea de scriere nu emerge ca un factor. Este o colecţie de
abilităţi care poate fi utilă în societatea modernă, birocratică. Ea implică, de exemplu, viteză şi
precizia copierii şi scrierii, calcule simple, verificarea conştientă a listelor şi abilitatea de a
rezista la sarcini monotone. Nu este doar multifactorială, deoarece multe dintre acestea sunt
mai mult caracteristici temperamentale decât aspecte care ţin de sfera abilităţilor. Psihometric
aptitudinile amintite mai sus sunt distincte.
Teste de aptitudine

IMPORTANT
Testul de aptitudine verbală se referă la testarea factorului de abilitate verbală. Testul
aptitudinii de scriere este un amestec de itemi.
Acest ultim tip de aptitudine ar trebui să fie construit empiric selectând itemi care să
discrimineze între subiecţii care nu posedă aptitudinea. Examinarea bateriilor de teste de
aptitudine confirmă această analiză, multe dintre ele conţin teste de acest tip: unifactoriale şi
multifactoriale.
Problemele testelor de aptitudini
Unul dintre cele mai folosite teste de aptitudini pentru selecţie şi orientare profesională
este DAT (Bennet, 1962). Vom discuta despre variabilele care sunt măsurate pentru a înţelege
mai bine dificultăţile generale implicate în folosirea testelor de aptitudini. Acestea sunt: testul
de raţionament verbal, abilitate numerică, raţionament abstract, viteza şi aptitudinea de
scriere, raţionament mecanic, relaţii spaţiale, gramatică şi silabisire (scriere literă cu literă).
1. Testele trebuie să fie unifactoriale
Teoria clasică a erorii de testare stă la baza metodelor de construcţie a testelor folosite
de psihometricieni. Este clar că pentru a realiza o bună testare, testele să fie unifactoriale.

114
Numai în cazul în care avem două scoruri identice putem vorbi de semnificaţie psihologică
identică.

IMPORTANT
Testele multifactoriale sunt cel mai bine înlocuite cu teste care măsoară separat
fiecare factor.
Dacă se face acest lucru este posibil să se dovedească puterea de predicţie prin
ponderea diferită a factorilor, această pondere fiind determinată prin realizarea regresiei
multiple pentru criteriu. Astfel, pentru aptitudinile de scriere s-a realizat o corelaţie multiplă
între testele separate pentru diferiţi factori putând fi calculată astfel performanţa în acest
domeniu, mărimea coeficienţilor  fiind folosiţi pentru a vedea ponderea scorurilor testului.
Examinarea variabilelor DAT ilustrează problema testelor multifactoriale. Am
menţionat deja testul pentru aptitudinea de scriere, dar testele de gramatică şi citire/scriere pe
litere vizează clar aspecte ce ţin de cunoştinţe. Un scor de 12,1 la factorul de citire/scriere pe
litere nu înseamnă exact acelaşi lucru cu abilitatea de a citi/scrie pe litere (care se bazează pe
percepţia cuvintelor incorecte) şi corelează cu abilitatea verbală „V” şi fluenţa verbală „W”.
Factorul de citi/scrie pe litere este probabil limitat, iar testul de citire/scriere pe litere din DAT
are pondere în acest factor împreună cu „V” şi „W”. Testul de citire/scriere pe litere este un
exemplu de variabilă multifactorială şi este fără îndoială util în munca aplicată pentru a şti
dacă o persoană poate sau nu citi/scrie pe litere.
Testul de a citi/scrie pe litere poate fi util în orientarea şi selecţia profesională şi
reprezintă un argument în favoarea ideii că testele unifactoriale trebuie alese de fiecare dată
când este posibil.

IMPORTANT
Citirea/scrierea pe litere nu este o aptitudine ci o cunoştinţă. De aceea nu ar fi nici un
motiv ca o cunoştinţă, definită ca o informaţie să fie unifactorială. Citirea/scrierea pe litere
poate fi dependentă de achiziţionarea a 2 factori: abilitatea verbală şi fluenţa verbală.
Aptitudinea de scriere este mai curând este un set de abilităţi necesare pentru un set
particular de deprinderi. Deoarece a citi/scrie pe litere este o cunoştinţă, aptitudinea poate fi
considerată ca având mai multe componente, factori puri, separaţi de abilităţi şi cunoştinţe. În
realitate lucrurile nu stau chiar aşa. Pur şi simplu cunoştinţele sunt utile în multe meserii.
Chiar dacă nu este o aptitudine este bine să se includă un test care să fie utilizat pentru
orientarea şi selecţia profesională. Acelaşi argument se aplică şi pentru testul de gramatică,
deşi aici cunoştinţele sunt mai mult decât o funcţie doar a factorului V.
2. Factorul g şi testele de aptitudini
O altă problemă a testelor de aptitudini se referă la faptul că în ciuda multitudinii
variabilelor, ele sunt rar diferenţiale. Acest lucru se datorează intervenţiei factorului g
(Quereshi, 1972). Manualul testului DAT relevă o dificultate comună tuturor testelor de
aptitudine. Astfel, inginerii au un scor mare la toate grupele de teste nu doar la aptitudinea
mecanică. Dacă încercăm să folosim DAT pentru orientare sau selecţie, rezultatele nu ne vor
ajuta. Suma scorurilor la DAT este probabil cel mai bun predictor al succesului în meserie,
fiind o bună măsură a factorului g.
Rezultatele indică faptul că ingineri, dintre toate grupele testate, au cel mai ridicat
nivel la factorul g şi că scalele din DAT au pondere mare în factorul g. Esenţial este că aceste
scale măsoară factorul g. Totuşi factorul g este măsurat folosindu-se un conţinut specific al
unui test particular de aptitudini. Dacă g trebuie măsurat atunci este mai bine să se folosească

115
scale necontaminate de alţi factori. Informaţiile obţinute în urma aplicării bateriei DAT ar
putea fi obţinute mult mai eficient folosind un test de inteligenţă.
Un posibil contra argument este acela că influenţa factorului g s-ar manifesta printr-un
nivel mai ridicat al scorurilor, dar evidenţiind profilul scorurilor la testele de aptitudine. Din
nefericire acest lucru nu se întâmplă. În parte acest lucru este cauzat de faptul că nu toate
scalele sunt în mod egal saturate de factorul g.
Puterea diferenţială a testelor de aptitudine este iluzorie deoarece scalele au pondere
diferită în factorul g. Quereschi (1972) prezintă rezultatele obţinute cu ajutorul analizei
factoriale relevând 4 factori care acoperă cel mai mult din varianţă. Ar fi fost interesant să
vedem puterea predictivă a testelor de aptitudine după ce factorul g ar fi extras. O analiză
factorială oblică permite investigarea influenţei factorului g deoarece aceşti factori sunt
corelaţi.
Există corelaţii între testul DAT şi testul de inteligenţă Otis, 0,81 cu raţionamentul
verbal, 0,69 cu abilitatea numerică, 0,65 cu raţionamentul abstract, 0,58 cu relaţii spaţiale,
0,61 cu raţionamentul verbal, 0,31 cu precizia şi viteza de scriere, 0,48 cu citit/scris pe litere,
0,48 cu logica propoziţiilor. Aceste corelaţii argumentează faptul că testul DAT este în
principal un test de inteligenţă ineficient.

IMPORTANT

Pentru selecţia şi orientarea profesională avem nevoie de mai multă informaţie decât
ne poate oferi factorul g. Acestea pot fi date prin măsurarea altor grupe de factori, cum ar fi
abilitatea spaţială şi verbală. Un test de aptitudine constă în teste pentru diferite grupuri de
factori şi o colecţie arbitrară de deprinderi.

2. Aptitudini şi capacităţi
Adesea se face confuzie între termenii de aptitudine sau potenţial şi cel de capacitate.

DEFINIŢII
Aptitudinea se referă potenţialul individului în achiziţionarea unor deprinderi,
capacitatea sau abilitatea se referă la posedarea unor deprinderi care au fost achiziţionate prin
experienţă sau antrenament deliberat.
Când selectăm indivizii pentru un curs de pregătire sau pentru anumite locuri de
muncă (cum este selecţia soldaţilor), măsurarea abilităţii este esenţială. Aici trebuie să
măsurăm abilităţile principale care sunt implicate în ocupaţie. În general selecţia de personal
nu se realizează aşa. În multe cazuri avem de a face cu indivizi care deja au deprinderile şi
pregătirea necesară. Pentru aceste situaţii un test de aptitudini oferă informaţii mai
semnificative. Dacă dorim un chirurg vom alege pe cineva care are diploma nu una care are
capacitate.

IMPORTANT
Dacă indivizii au deprinderile şi pregătirea achiziţionate este mai bine să folosim
aptitudinile ca măsură a selecţiei decât abilităţile sau capacităţile.
Pentru tinerii care doresc să participe la un curs de pregătire testele de aptitudini sunt
utile pentru diferenţiere. După cum am arătat ele tind să măsoare doar aptitudinea generală,
care este mai bine măsurată printr-un test de inteligenţă. Dacă un factor sau un grup de factori
specifici sunt mai importanţi pentru un post atunci se vor folosi teste pentru aceşti factori.
116
În consecinţă testele de cbilităţi nu sunt valabile aşa cum sugerează numele lor.
Valoarea testul DAT rezidă în măsurarea inteligenţei generală şi a grupului de factori
specifici. Pentru multe posturi aptitudinile sunt cel mai sensibil indice al performanţei. Dintre
subiecţii care au acelaşi nivel al deprinderilor se va selecta persoana cu cel mai ridicat scor a
lui g, deoarece este mult mai probabil ca aceasta să aplice mai bine cunoştinţele şi să
achiziţioneze noi informaţii pentru a progresa.

Testele de abilităţi şi cunoştinţe

DEFINIŢIE
Toate testele care evaluează cum stăpânesc subiecţii un anumit câmp sunt teste de
abilităţi sau de cunoştinţe.
Astfel, probele folosite pentru examinarea publică din şcoală, universitate sunt toate
teste de abilităţi şi de cunoştinţe. Aceste sunt teste cu calitate ridicată şi unele dintre ele, care
se potrivesc criteriilor psihometrice sunt teste bune.
Criteriile unui bun test de abilităţi şi cunoştinţe
1. Trebuie să acopere conţinutul cursului sau la domeniului de cunoştinţe. Una dintre
problemele acestor teste este că nu acoperă întreaga arie a cursului, candidaţii
putând promova cunoscând doar o mică parte din curs.
2. Trebuie să fie solid. Adică trebuie să aibă un număr mare de itemi şi să fie obiectiv
cotat.
3. Trebuie să fie valid. Multe teste nu sunt valide, deşi curios multe dintre ele sunt
utile pentru scopuri de selecţie. Astfel dacă se cere subiecţilor să realizeze un eseu
este evidenţiată abilitatea verbală. Pentru o bună examinare a cunoaşterii limbii
engleze se folosesc teste de cunoştinţe, teste pentru măsurarea factorului g şi de
abilitate verbală. Toate aceste caracteristici sunt valabile, dar este mai bine să fie
măsurate separat. Se poate pune şi problema de a selecta absolvenţi pentru un post.
Absolvirea liceului poate reprezenta un efort ridicat de învăţare dar nu şi un nivel
ridicat al inteligenţei sau abilităţii verbale. Pe de altă parte poate fi nevoie de un
nivel ridicat al inteligenţei dar de puţine cunoştinţe. Testul pe care îl vom alege va
depinde de natura postului care trebuie ocupat. Unii educatori pot fi mulţumiţi
dacă testează abilitatea verbală şi inteligenţa, considerând că acestea sunt
caracteristici suficiente de promovare la un nivel superior de şcolarizare. Alţii îl
privesc ca asimilarea integrală a unui curs. De exemplu, examinarea medicală este
privită ca un test de cunoştinţe pe care subiecţii trebuie să-l rezolve în proporţie de
100% pentru a promova. Psihometric cea mai bună soluţie a fost găsită de
universităţile americane. Selecţia doctoranzilor se face după inteligenţă, abilităţi
verbale şi numerice, pentru a vedea dacă studenţii sunt suficient de capabili.
Gradul/diploma/treapta de examinare sunt acordate prin măsurarea pur şi simplu a
abilităţilor.

Caracteristicile unui bun test de abilităţi şi cunoştinţe


1. Mulţi itemi aleşi pentru a acoperi întregul câmp. Pot fi consultaţi experţi pentru a
verifica. Aceasta implică consultaţii cu specialişti asupra diferitor subiecte pentru a
specifica ce trebuie ştiut, în diferite stadii, pentru acele specialităţi. Pentru testarea
copiilor trebuie să fim capabili să specificăm ce trebuie ca aceştia să cunoască la
fiecare vârstă. Specialiştii trebuie să ierarhizeze diferitele aspecte ale unui materii
după importanţa lor.

117
2. Selecţia itemilor să ţină seama de criterii definite obiectiv. Pentru aceasta este
necesar că obiectivele să fie cât mai clare pentru a fi folosite la evaluarea itemilor.
Schonell şi Schonell (1950) au realizat un test pentru diagnosticarea dificultăţilor
subiecţilor la aritmetică sau citire/scrire pe litere. Acest test a fost în aşa fel divizat
încât se pot descoperi exact dificultăţile cu care se confruntă subiecţii, de exemplu
confuzia între b şi d. Aceste teste sunt foarte utile pentru diagnosticul dificultăţilor
de învăţare şi reprezintă forme speciale ale acestor teste. Testele care au conţinutul
precis selectat pot duce la obţinerea unor scoruri care să fie folosite drept criterii
de referinţă. Dacă un subiect are scorul 85 la un test de matematică, criteriul de
referinţă al scorului ar indica faptul că subiectul a rezolvat corect 85% dintre
problemele de algebră care implică inversiunea matricei.
3. Itemii trebuie să acopere toate nivelele de dificultate pentru a asigura o distribuţie
normală şi simetrică.
4. Itemii să fie cotaţi obiectiv.
5. Norme bune. Este valabilă standardizarea.
6. Testele de aptitudini se potrivesc unei scale Rasch. sau altor modele derivate din
teoria răspunsului la itemi.

FORMELE ITEMILOR ÎN TESTAREA ABILITĂŢILOR ŞI CONOŞTINŢELOR


1. Itemi cu alegere multiplă. Sunt cei mai folosiţi itemi în cadrul acestor teste,
deoarece se potrivesc unei mari varietăţi de teme. Fiecare item are două părţi: a) tulpina care
conţine întrebarea sau problema şi b) opţiunile care constituie un set de răspunsuri posibile,
dintre care subiectul trebuie să aleagă unul. Multe teste au patru sau cinci variante de răspuns.
Vom prezenta câteva dintre cele mai acceptate reguli pentru scrierea unor itemi cu
alegeri multiple, reguli care ilustrează avantajele acestora în comparaţie cu testele tradiţionale
de aptitudini.

IMPORTANT
a. Itemii trebuie să fie cât mai simpli posibil. Este nevoie de acest lucru pentru a
reduce contaminarea scorurilor testului la factorul V, abilitate verbală şi gc,
inteligenţa cristalizată.
b. Toţi distractorii (variantele incorecte) trebuie să fie la fel de plauzibili. Dacă
distractorii sunt evident incorecţi itemul este fără valoare, deoarece acesta va fi
rezolvat corect de toţi subiecţii. Distractorii cei mai buni sunt aleşi selectând
răspunsurile greşite la itemi într-o sarcină în care subiecţii primesc răspunsurile la
itemi în forma deschis-închis.
c. Trebuie să fie o singură variantă de răspuns corectă. Uneori dacă privim problema
dintr-o perspectivă diferită poate să ne apară corect un alt răspuns. Dacă se
întâmplă acest lucru trebuie să renunţăm la acel item sau să schimbăm distractorii.
d. Să ne asigurăm că distractorii nu reprezintă răspunsul corect pentru alţi itemi sau
evidenţiază răspunsul corect la alţi itemi.
e. Să evităm scrierea itemilor doar pentru că sunt uşor de scris.
f. Să se evite folosirea distractorului “nici una/unul dintre” cu excepţia itemilor în
care sunt evident corecţi.
g. Să se evite folosirea distractorului “toate dintre” care slăbeşte itemul.

Acestea sunt cele mai importante reguli care trebuie respectate atunci când scriem
itemi cu răspunsuri multiple, unele dintre ele având aplicabilitate şi pentru alte tipuri de itemi.

118
Avantajele folosirii acestor tipuri de itemi
a. Itemii pot fi uşor cotaţi. Acesta este un aspect important pentru testele care acoperă
o mare cantitate de material. Ele permit ca testele să fie lungi, ceea ce
îmbunătăţeşte precizia şi validitatea testelor. Uşurinţa cotării reduce erorile de
scriere. Răspunsul cu alegere multiplă poate fi cotat folosindu-se chei de marcare
ideale pentru cotarea computerizată. Seturile de itemi cu alegeri multiple sunt uşor
de prezentat pe computer.
b. Ghicirea. Aceasta poate fi o problemă, dar testele cu alegere multiplă reduc
posibilitatea de a ghici răspunsul corect din cinci variante prezentate, în condiţiile
în care distractorii sunt la fel de atractivi.
c. Conţinutul testului. Folosind un set de itemi cu răspunsuri multiple este posibilă o
precisă abordare a conţinutului testului, ceea ce permite psihologului să evalueze
cât de potrivite este testul pentru scopul propus.

2. Itemi adevărat - fals

DEFINIŢIE
Aceşti itemi constau în afirmaţii pe care subiectul trebuie să le marcheze ca fiind
adevărate sau false.
Folosirea acestor itemi ridică o serie de probleme:
a. Ghicirea. Reprezintă o dificultatea reală deoarece există 50% şanse ca să se
ghicească răspunsul corect. Testul reprezintă un balans între răspunsul adevărat
sau fals. Un subiect care alege fie numai răspunsul fals, fie numai cel adevărat la
toţi itemii va obţine 50% din scorul total.
b. Este dificil să scrii itemi care sunt irevocabil aderarăţi sau falşi.
c. Banalitatea. Nevoia de precizie ne determină să punem accentul pe itemii banali.
Ultimele două obiecţii sunt cele mai relevante pentru testele din ştiinţele sociale şi
artă. În ştiinţe adevărul absolut (în sensul dat de item) este posibil. În general, itemii adevărat-
fals constau în afirmaţii care pot fi înlocuite cu itemi cu alegeri multiple şi care reduc efectul
de ghicire.
Totuşi există o clasă de itemi de acest tip care sunt utili. În cadrul acestora sunt
prezentate subiectului informaţiile, testul măsurând abilitatea acestuia de a înţelege.

EXEMPLU
Kline (1986) prezintă două distribuţii ale inteligenţei, una pentru subiecţii de sex
feminin iar cealaltă pentru cei de sex masculin. S-au folosit itemi de tipul adevărat-fals.
a. Există mai mulţi bărbaţi decât femei cu un QI foarte mic, mai mic de 45;
b. Există mai mulţi bărbaţi decât femei cu un QI foarte ridicat, mai mare de 140;
c. Distribuţia inteligenţei subiecţilor de sex feminin este aproximativ bimodală;
d. Distribuţia inteligenţei subiecţilor de sex masculin este aproximativ normală;
e. Media QI-ului la bărbaţi şi femei este aproximativ aceeaşi;
f. Există mai multe femei decât bărbaţi cu un QI între 120 şi 140;
g. Există mai multe bărbaţi decât femei cu un QI între 50 şi 60;
Această metodă de testare a înţelegerii materialului este utilă şi contrazice pe
cei care susţin că obiectivul itemilor testului este de a măsura dacă materialul este
învăţat mecanic. Un subiect care nu poate înţelege sau interpreta un item poate doar
să-l ghicească.

119
Aceşti itemi pot fi folosiţi pentru o testare detaliată a cunoştinţelor. Astfel, pot fi
calculaţi următorii coeficienţi (coeficienţi teta): corelaţia tetraconică, corelaţie biserială,
corelaţia punct biserială, tau, ro, phi, index.ul G.

Concluzii cu privire la itemii adevărat-fals

IMPORTANT

Aceşti itemi sunt utili pentru testarea înţelegerii unui material prezentat şi pentru
examinarea detaliată a cunoştinţelor, pentru care itemi cu alegeri multiple ar fi stângaci.
Trebuie reţinut faptul că precizia lor este diminuată de ghicire. Din aceste motive sunt de
preferat itemii cu alegeri multiple.

3. Itemi perechi
Sarcina subiectului este de a potrivi itemii din două liste. Aceşti itemi se potrivesc
materialelor factuale sau celor intuitive. Autorii şi cărţile, clasele şi mamiferele sunt exemple
de astfel de itemi perechi. Putem avea 4 nume de autori A, B, C, D şi 8 titluri de cărţi.
Subiecţii indică, folosind o literă (cea corespunzătoare autorului) cine a scris o anumită carte.
Aceşti itemi permit cea mai uşoară testare în detaliu a cunoştinţelor. Deşi ar pute fi construiţi
şi itemi cu alegeri multiple, numărul lor ar fi mai mare, ar fi nevoie de 4 itemi cu alegeri
multiple şi 32 de distractori. Itemi adevărat-fals ar pute fi folosiţi‚ în acest scop, dar ar fi mai
complicat decât folosirea itemilor perechi. Ar fi necesari 4 itemi, câte unul pentru fiecare
autor. Nu poate fi folosit acelaşi exemplu pentru fiecare din cei 4 itemi deoarece răspunsul
anterior poate influenţa răspunsurile la itemii următori. Astfel dacă autorul A scris cartea 1,
autorul B, C sau D nu mai pot scrie cartea 1.

IMPORTANT

Trebuie să precizăm că pentru itemii adevărat-fals, unde informaţiile sunt prezentate


subiectului iar itemii testează înţelegerea, este foarte dificil să folosim itemi pereche în locul
lor. Itemii adevărat-fals sunt mai buni atunci când se testează informaţia prezentată în test.
Pentru a reduce efectul de ghicire şi să ne asigurăm că subiecţii rezolvă itemii făcând
alegeri pentru fiecare item, răspunsurile nu trebuie să devină evidente iar listele trebuie să nu
fie egale ca lungime.
Concluzii: comparaţie între cele trei tipuri de itemi
a. Factori specifici. Trebuie minimalizat varianţa specifică datorată unui singur tip de
item. Într-o baterie de teste varianţa specifică a unui anumit tip de item poate avea
pondere într-un factor, care ar putea fi un factor de grup veritabil, deşi este vorba
de o specificitate exagerată - abilitatea de a răspunde la un tip particular de item. O
varietate de itemi ar fi în acest caz mai avantajoasă.
b. Plictiseala. Folosirea unor itemi variaţi ar reduce plictiseala trăită de subiect în
timpul completării unor teste, după cum argumentează Crombach (1976) şi ar
îmbunătăţi precizia procedurii de testare.
c. Eficienţa itemilor. În construcţia testelor se doreşte un maxim de eficienţă a
itemilor. Am văzut anterior că eficienţa itemului depinde de cât de mult material se
doreşte a fi testat. Pentru a obţine cel mai bun tip de item trebuie respectate
următoarele reguli:

120
1. Cele mai multe materiale să fie testate cu ajutorul itemilor cu alegeri
multiple, aceştia reprezentând itemii de bază în testele de cunoştinţe.
2. Pentru informaţii factuale detaliate sunt utili itemii adevărat-fals şi perechi.
3. Pentru testarea materialului prezentat într-un test sunt valabili itemii
adevărat-fals.
4. Pentru motivele prezentate anterior este mai bine să se folosească un
amestec format din mai multe categorii de itemi, deşi mulţi itemi adevărat-
fals cresc dificultăţile datorate ghicirii.

IMPORTANT

Scrierea itemilor
Criterii pentru alegerea itemilor:
Claritate. Alegeţi forma itemului care este cea mai clară pentru subiect.
Ghicire. Alegeţi forma care reduce efectele ghicirii la minim.
Precizie. Alegeţi forma care este cea mai clară şi mai simplă.
Relaţiile dintre itemi. Verificaţi dacă variantele itemilor sau chiar itemii nu dau răspunsul
sau sugestii pentru alţi itemi.
Echilibru. Acolo unde toate alegerile sunt posibile, alegeţi tipul de item care este cel mai
rar.
Alte tipuri de itemi
Cele 3 categorii de itemi pe care le-am discutat anterior sunt cele mai comune şi utile
în cadrul testelor de cunoştinţe. Există şi alte categorii de itemi utile în condiţiile în care
materialul rămâne intransigent la testarea cu ajutorul celor 3 metode.
a. Itemi cu răspuns limitat. Aceşti itemi cer subiectului să dea propriul lor răspuns,
care este totuşi restrictiv, pentru a ne asigua obiectiv că itemii au rezolvaţi.
b. Itemi cu răspuns liber. Subiectul poate completa cu ceea ce crede . Se acceptă doar
un singur răspuns pe care subiectul poate să-l dea. Aceşti itemi trebuie analizaţi cu
atenţie şi trebuie cotaţi obiectiv. Să presupunem că vrem să testăm cunoştinţele
subiecţilor despre liniile oblice. Întrebarea “Ce sunt liniile oblice?” este prea
generală necesitând un eseu mai curând decât un răspuns simplu. Trebuie să fim
mai specifici. Am putea folosi itemi adevărat-fals sau cu răspunsuri multiple. În
forma răspunsului liber am putea folosi întrebarea “Cum diferă liniile oblice de
cele ortogonale?” Este prea vagă, deoarece subiecţii pot preciza doar că liniile
oblice formează un unghi mai mic de 90 de grade. Astfel putem întreba “Ce
informaţii cu putem obţine de la unghiurile dintre liniile oblice?” Avantajul acestor
tipuri de itemi este acela că reprezintă cel puţin o testare a memoriei mecanice, nu
apar distractori şi este mai interesant pentru subiect să completeze decât să
compare între variantele prezentate la itemii cu alegeri multiple.
c. Itemi cu alegeri limitate. Sunt mai atractivi şi precişi. Itemul cu răspuns liber dat
anterior ca exemplu pentru acest tip ar apărea astfel: “Despre unghiurile dintre
liniile oblice putem şti că..........”

121
Concluzii

IMPORTANT

Aceste categorii de itemi sunt utile doar în situaţiile în care răspunsul trebuie să fie cât
mai precis. Itemii cu răspuns liber sunt dificil de redactat De aceea itemi cu răspunsuri
limitate reprezintă o formă superioară.
Cotarea lor este dificilă, aceşti itemii nu pot fi prezentaţi şi cotaţi în formă
computerizată.
Ghicirea
În cazul itemilor cu alegeri multiple şi a celor cu răspunsuri limitate poate apărea
ghicirea care introduce varianţa de eroare şi scade validitatea. Am menţionat anterior că
subiectul poate rezolva prin ghicire jumătate dintre itemii adevărat-fals.
Ghicirea este inevitabilă chiar în cadrul unor examene de admitere, promovare sau
selecţie pentru o anumită profesie.
1. Subiecţii sunt instruiţi să ghicească. În instrucţiunile testelor se cere subiecţilor să
ghicească. “Nu lăsaţi spaţii goale. Dacă nu ştiţi un răspuns sau nu sunteţi sigur,
ghiciţi soluţia corectă. ”
2. Completaţi la întâmplare un test apoi cotaţi-l. Această completare este echivalentă
ghicirii. Un sistem computerizat de cotare poate fi programat să realizate acest
lucru.
Formula de corecţie a ghicirii
Unii utilizatori de teste folosesc o formulă de corectare a ghicirii. Cea utilizată formulă
este:
g
xcorect  c  , unde
n 1
x corect - scoruri corectate pentru ghicire;
c - numărul de răspunsuri corecte;
g - numărul de răspunsuri greşite;
n - numărul de variante ale itemului
Există cel puţin 4 probleme ale corectării ghicirii:
1. Se presupune că toate răspunsurile greşite se datorează ghicirii, ceea ce nu este în
mod necesar adevărat; Subiecţii pot să nu fie informaţi. Formula de ghicire nu ia în
considerare acest lucru.
2. Se presupune că atunci când apare ghicirea există un număr egal de şanse pentru
fiecare variantă. Pentru anumiţi itemi pot fi schimbaţi distractorii şi totuşi subiecţii
să ghicească răspunsul. Pentru aceşti subiecţi formula de corecţie subestimează
performanţa.
3. Itemii pot avea un număr diferit de variante, necesitând corecţii ale ghiciri diferite.
4. Corecţia ghicirii se aplica mediei subiecţilor. Pentru cazurile individuale aceasta
poate să fie greşită.

IMPORTANT

Pentru toate aceste motive formula de corecţie a ghicirii este rudimentară. Suntem de
acord cu Vernon (1960) care afirmă că ghicirea poate fi ignorată în testele cu variante
multiple cu un număr mare de itemi. Având în vedere problemele itemilor adevărat-fals

122
trebuie folosit doar un număr redus de astfel de itemi. Ghicirea este încurajată în testele de
viteză. Nu se recomandă corecţia ghicirii.

APLICAŢIE
1. Care sunt regulile pentru scrierea unor itemi cu alegeri multiple?
2. Care sunt dezavantajele folosirii itemilor de tip adevărat-fals? Cum pot fi aceastea
contracarate?
3. Dați un exemplu în care itemii de tip adevărat-fals sunt utili.

TEST DE AUTOEVALUARE (cu răspunsuri corecte ataşate la finalul cursului)


Apreciați valoarea de adevăr a următoarelor afirmații:
1. În psihologie, aptitudinea se referă la un ansamblu de abilităţi care pot avea o anumită
valoare într-o cultură dată:
a. ADEVĂRAT
B. FALS
2. Testul de aptitudine verbală se referă la testarea factorului de abilitate verbală:
a. ADEVĂRAT
b. FALS
3. Testele multifactoriale nu sunt cel mai bine înlocuite cu teste care măsoară separat fiecare
factor:
a. ADEVĂRAT
b. FALS
4. Citirea este independent de achiziționarea factorilor de abilitate verbală:
a. ADEVĂRAT
b. FALS
5. Pentru selecția și orientarea profesională sunt suficiente informațiile oferite de factorul g:
a. ADEVĂRAT
b. FALS
6. Aptitudinea se referă la potențialul individului în achiziționarea unor deprinderi:
a. ADEVĂRAT
b. FALS
7. Testele care evaluează cum stăpânesc subiecţii un anumit câmp sunt teste de abilităţi :
a. ADEVĂRAT
b. FALS
8. Pentru ca un test de abilități să fie considerat bun, selecția itemilor trebuie să țină seama de
criterii definite obiectiv:
a. ADEVĂRAT
b. FALS
9. Precizia itemilor adevărat-fals este diminuată de ghicire:
a. ADEVĂRAT
b. FALS
10. În cazul itemilor perechi unde toate alegerile sunt posibile, alegeți tipul de item care este
cel mai des:
a. ADEVĂRAT
123
b. FALS
11. In formula de corecție a ghicirii, n reprezintă numărul de variante ale itemului:
a. ADEVĂRAT
b. FALS

124
Unitatea de învățare 10.
TESTE OBIECTIVE DE PERSONALITATE

Vom discuta despre testele de personalitate, care încearcă să acopere unele dintre
defectele chestionarelor de personalitate, deşi după cum vom vedea aceste teste au alte
probleme.

IMPORTANT
Chestionarele de personalitate sunt superficiale şi de obicei transparente fiind uşor de
falsificat, sunt prea necizelate pentru a încapsula bogăţia şi fineţea personalităţii. Testele
obiective şi proiective de personalitate, împreună, caută să elimine aceste neajunsuri.
Cu toate obiecţiile aduse de Eysenck (1957) şi alţi autori în ceea ce priveşte lipsa lor
de validitate şi fidelitate, ar fi greşit să se renunţe la ele, deoarece aceste teste pot fi utile atât
în aplicaţii practice cât şi în cercetare.
Înainte de defini aceste categorii de teste trebuie să facem distincţia, în cadrul testelor
de personalitate, între măsurarea nomotetică şi cea idiografică.

IMPORTANT
Testele nomotetice sunt legate de dezvoltarea unor reguli pentru înţelegerea
personalităţii. Vizează măsurarea trăsăturilor sau dimensiunilor comune, în funcţie de care
oamenii diferă.
Chestionarele de personalitate sunt măsurări nomotetice tipice, iar analiza factorială
reprezintă cea mai potrivită tehnică statistică pentru analiza testelor nomotetice. Psihometria,
ca domeniu al psihologiei, este în principal interesată de studiul diferenţelor individuale,
măsurarea făcându-se prin urmare cu ajutorul testelor nomotetice.

IMPORTANT

Testele idiografice, în contrast cu cele nomotetice, vizează măsurarea individuală a


persoanei, a tuturor aspectelor de personalitate pe care acesta nu le împarte cu nimeni. Aceste
aspecte unice şi individuale de personalitate sunt măsurate cu ajutorul testelelor proiective.
Având în vedere această distincţie este uşor să înţelegem de ce psihologii clinicieni,
care lucrează cu indivizii şi nu cu grupuri, folosesc testele proiective, în timp ce psihologii din
cercetare, cum ar fi Eysenck, descriu testele proiective „ca vehicule ale imaginaţiei
dezordonate a clinicienilor”. Considerăm ca adevărată afirmaţia lui Allport (1937) care afirmă
că testele nomotetice nu reuşesc să măsoare ceea ce este interesant în personalitate.

TESTELE OBIECTIVE
Cattell (1973 şi 1957) consideră că în studiul personalităţii există trei surse de date: L.
Q şi T.

IMPORTANT
Datele L, date de viaţă, se referă la observaţiile comportamentului actual, datele Q
derivă din chestionare, iar datele T se referă la măsurarea prin teste obiective, definite ca teste
a căror scop este ascuns subiecţilor.

125
Cattell priveşte datele L ca un criteriu pe care se bazează toate testele, indiferent de
tipul lor. Pentru autor testele obiective reprezintă a treia sursă principală de date cantitative
din domeniul personalităţii. Aceste teste sunt mai puţin utilizate decât chestionarele sau testele
proiective.

DEFINIŢIE
Cattell (1957) şi Cattell şi Warburton (1967) definesc testele obiective ca teste a căror
scop este ascuns subiecţilor, provocând distorsiuni deliberate, şi a căror cotare este obiectivă.
Cronbach (1976) a denumit aceste teste ca teste de performanţă.
Conform definiţiei testelor obiective, testele proiective cotate obiectiv pot fi incluse în
categoria testelor obiective.

IMPORTANT
Testul Rorschach astfel cotat este inclus în categoria testelor obiective (Cattell şi
Warburton, 1967).
Totuşi noi preferăm să includem teste proiective cotate obiectiv în categoria testelor
proiective, pentru că după cum consideră autorii lor şi categoria testelor proiective reprezintă
un instrument pentru măsurarea personalităţii.
AVANTAJELE TESTELOR OBIECTIVE
Motivul pentru care discutăm despre testele obiective este acela că dacă se
demonstrează că ele sunt valide, ele ar avea un avantaj clar faţă de chestionare şi faţă de unele
teste proiective.
1. Faptul că este sunt inaccesibile ghicirii, deoarece scopul lor este neclar face să fie
mai potrivite în selecţie şi în psihologia aplicată în comparaţie cu alte teste de
personalitate.
2. Este mai puţin probabil că în aceste teste să apară seturi de răspunsuri dezirabile,
cum se întâmplă în cazul chestionarelor.
3. Este posibil ca unele teste obiective, în special măsurările fiziologice, să poată fi
utilizate în studiile transculturale ale personalităţii, domeniu în care chestionarele
au o valoare îndoielnică (Kline, 1977).
Din aceste motive dezvoltarea validităţii testelor obiective de personalitate reprezintă
un aspect important al psihometriei, cu toate că în prezent există puţine dovezi de progres în
acest sens.

TIPURI DE TESTE OBIECTIVE


Cattell şi Warburton (1967) în compendiul testelor obiective listează 688 de teste, din
care derivă 2300 de variabile şi acestea reprezintă doar o parte din testele obiective care pot fi
construite. Este evident din definiţie că teste conţin sarcini care pot fi obiectiv cotate, şi pe
care subiecţii nu le pot ghici.

EXEMPLU

Ca exemplu vom da sarcina de curăţare a pantofilor, folosind perii şi cremă de


pantofi. Vor fi extrase din test următoarele variabile:
1. Numărul de întrebări puse înainte de a începe curăţarea.
2. Timpul scurs înainte de a începe.
3. Tipul necesar pentru realizarea sarcinii.

126
4. Numărul de periaje folosit în procesul de curăţare.
5. A înlocuit subiectul pantofii?
6. A potrivit subiectul peria şi crema?
7. A folosit material moale?
8. A înlocuit subiectul şireturile?
9. A curăţat subiectul limba de la pantofi?
Este clar că se pot folosi o infinitate de astfel de variabile, singura limită fiind
ingeniozitatea cercetătorului. Aceste variabile ne indică o dificultate serioasă a testelor
obiective: validitatea lor. Cum putem şti ceea ce măsoară fiecare dintre aceste teste? Aceasta
este dificultatea testelor, pentru că dacă noi ne dăm seama ce măsoară, atunci şi subiecţii vor
fi capabili să ghicească acest lucru şi în acest caz, prin definiţie aceste teste încetează să mai
fie obiective.
Problema validităţii testelor obiective
Nici un test obiectiv nu poate fi folosit fără să nu existe dovezi empirice ale validităţii
şi fidelităţii testului.
Raţiunea testelor obiective
După cum indică şi cele nouă variabile din exemplu dat anterior, trebuie să existe o
raţiune în construcţia acestor teste. O abordare posibilă în principiu, dar mare consumatoare
de timp în practică ar fi să se inventeze măsuri obiective, care să fie puse într-un test empiric.
Acest lucru este imposibil. Marea majoritate a testelor obiective nu au nici o dovadă a
validităţii lor. Motivele construirii testelor obiective trebuie menţionate, chiar dacă ele au doar
o valoare orientativă.
Cattell şi Warburton (1967) au prezentat o taxonomie a testelor obiective şi un set de
principii pentru construirea unor astfel de teste obiective: ambele vor fi discutate pentru că
ajută la înţelegerea lor.

O taxonomie a testelor obiective

IMPORTANT
Există trei surse de variaţie în testele psihologice:
1. Instrucţiunile testului. Acestea influenţează modul cum subiectul se raportează la test.
2. Materialele testului
3. Cotarea răspunsului
Observăm că primele două categorii nu sunt independente, deoarece instrucţiunile se
referă la materialele testului aceste două surse de variaţie grupează într-o singură categorie
situaţia stimul-instrucţiune.
Situaţia stimul-instrucţiune.
Aceasta variază de-a lungul următorilor parametri:
1. Reacţie vs lipsa de reacţie. În mod obişnuit este cerută reacţia la stimul, dar nu
întotdeauna se întâmplă acest lucru, cum este cazul testului de sensibilitate la
durere.
2. Răspunsuri inventive vs răspunsuri selective. Testul TAT cere răspunsuri
inventive, iar itemii chestionarelor de personalitate cer răspunsuri selective.
3. Răspunsuri unice vs răspunsuri repetitive
4. Secvenţe de răspunsuri ordonate vs secvenţe de răspunsuri neordonate
5. Răspunsuri omogene vs paternuri de răspuns. Unele teste cer răspunsuri de acelaşi
fel, alte răspunsuri variate.

127
6. Răspunsuri naturale vs limitate. “Lucrează în ritmul tău propriu” comparativ cu
“Lucrează cât mai repede posibil” exemplifică aceşti parametri.
7. Reacţii de încheiere vs reacţie la reacţie. Subiectul reacţionează fie la materialul
testului, fie la propriile reacţii, ca în evaluare.
Cattell şi Warburton (1967) adaugă la aceşti şapte parametri alte cinci dimensiuni
importante, dintre care primele trei sunt subiective şi au o importanţă particulară pentru testele
obiective.
8. Semnificaţie imediată vs semnificaţie atribuită. În testele timpilor de reacţie nu
există o altă semnificaţie în spatele testului însuşi. În alte teste, de exemplu cele
care examinează opiniile, există atribuiri externe şi simbolice, acestea fiind
implicate în distorsiunile tipice ale testelor, ridicând probleme legate de
distorsiunea subiectivă a cuvintelor şi conceptelor.
9. Prezentare unui item vs prezentare globală. Unele teste constau într-o singură
sarcină, iar altele într-un set de itemi.
10. Aspectul psihologic al testului. Unele răspunsuri la teste solicită cogniţia (o
judecată corectă), alte o judecare a sentimentelor iar altele judecarea familiarităţii
sau recunoaşterea.
11. Variaţia motivelor pentru acceptarea situaţiei test.
12. Variaţia libertăţii pentru a finaliza situaţia test.
Această taxonomie indică o uriaşă varietate de teste obiective posibile - există 213
(8192) tipuri de situaţii stimul-instrucţiuni.
Taxonomia nu este completă dacă ignorăm cea de a treia sursă de variaţie - cotarea
răspunsurilor. Deşi parametrii cotarea răspunsului nu sunt total independenţi de parametrii
descrişi anterior, ei trebuie luaţi în seamă pentru a vedea numărul total de teste care poate fi
produs de parametrii stimul-instrucţiune şi cotarea răspunsului.
Parametrii de cotare a răspunsului
1. Obiectivitate vs auto-evaluare. Acesta este parametrul cel mai important care trebuie
să fie bine înţeles înainte de a cunoaşte natura testelor obiective, şi care adesea
seamănă cu inventarele de personalitate. Vom exemplifica acest parametru.

EXEMPLU

Într-un test li se cere subiecţilor să evalueze dacă o sarcină particulară (de exemplu, o
chelneriţă care aduce în 10 minute şase fripturi pe o masă) este forte bună, bună, slabă, sau
foarte slabă. Se vor cota numărul de răspunsuri slab sau foarte slab etc, adică numărul de
evaluări critice. Această cotare este în întregime obiectivă şi imposibil pentru subiect să o
ghicească. Deşi acest mod de cotare poate fi comparat cu cel al inventarelor de personalitate,
de fapt el este diferit. Toate teste obiective sunt obiective în termenii acestui prim parametru.
În final precizăm că inventarele de personalitate standard pot fi considerate obiective în
privinţa acestui parametru. De exemplu, putem lua în seamă toate răspunsurile “da” sau
“adevărat” şi toate răspunsurile “fals”.
2. Comportament deschis vs răspuns fiziologic. Comportamentele deschise implică
întreg organismul, în timp ce răspunsurile fiziologice implică părţi ale organismului,
cum ar fi dilatarea pupilei, înroşire etc.
3. Cotarea parametrică vs neparametrică a răspunsurilor. Cotarea parametrică implică
dimensiuni ale răspunsului, cum ar fi timp, erori sau repetiţii. Cotarea neparametrică
implică numărul şi varietatea claselor de răspuns, ca în multe teste de creativitate.
4. Cantitatea sau numărul total de răspunsuri vs fracţiuni ale răspunsului care întrunesc
un anumit criteriu.

128
5. Cotarea omogenă a scorurilor vs cotare legată de paternuri. Prima cotare este posibilă
doar când testul este cotat ca întreg, la fel ca în cazul inventarelor de personalitate. Al
doilea tip de cotare, poate avea mai multe forme. Un exemplu ar fi diferenţa de timp în
completarea primei şi celei de a doua părţi a testului.
6. Scoruri normative vs ipsative. Scorul normativ a fost descris în prima parte a cursului.
Scorul ipsativ a unui subiect la un item este deviaţia scorului subiectului la itemul
respectiv de la media scorurilor.
Totuşi nu toate combinaţiile parametrilor sunt viabile, este clar că există un număr
foarte mare de tipuri de teste obiective: 213x26 ceea ce ar duce la 50.000 de tipuri de teste.
Deşi există principii pentru construcţia testelor obiective, toate aceste 50.000 de
categorii nu pot fi folosite. Cattell şi Warburton (1967) au scurtat lista la 64 de categorii
desemnate, luând în considerare cele mai importante tipuri de stimuli şi parametri de cotare,
permiţând 8 varietăţi pentru fiecare.
Această taxonomie nu este suficientă pentru a înţelege testele obiective. Este important
să înţelegem forma dar trebuie să avem în vedere şi conţinutul lor.

IMPORTANT
O prima dificultate vizează categoriile de variabile care pot fi măsuratate - abilităţi,
temperament, motivaţie. Nu există un motiv pentru care testele obiective nu pot măsura
variabile din aceste sfere, şi este necesar să facem distincţia dintre ele

DISTINCŢIA DINTRE TESTELE OBIECTIVE DE ABILITATE,


TEMPERAMENT ŞI DINAMICĂ
Este suficient ca prin analiză factorială să descoperim care sunt variabilele pe care le
măsoară testele obiective, dar bineînţeles după ce ele au fost construite. Ar fi util un ghid de
construcţie a testului, chiar dacă dovezile empirice sunt necesare pentru a asigura validitatea
testului.
Cattell şi Warburton (1967) prezintă o serie de detalii în legătură cu această problemă:
1. Sunt definite două situaţii: iniţiale şi complexe.
2. Definirea situaţiei iniţiale: o situaţie iniţială provoacă atingerea scopului şi este un
simbol al scopului sau al realizării lui. Acest lucru poate fi descoperit prin procesul
de analiză, adică prin analiza statistică a paternului unei secvenţe de comportament
care apare în timp. O situaţie iniţială poate fi recunoscută din relaţia cu scopul. În
studiul jurnalului unui subiect pe o perioadă de o lună, folosind teste obiective
(Cattell, Horn şi Sweney, 1970) Kline şi Grindley (1974) au arătat că o astfel de
relaţie apare din dinamica variabilelor măsurate cu ajutorul testelor cu
evenimentele din viaţa reală.
3. Definirea situaţiilor complexe: Acestea sunt dependente de precizia evaluării
situaţiilor iniţiale.
4. Dacă se schimbă situaţia iniţială, se modifică şi scorul testului obiectiv. Dacă se
schimbă complexitatea se modifică şi scorul la un test cognitiv. Toate celelalte
teste sunt teste de temperament.
5. Astfel pare uşor de măsurat dinamica şi abilităţile subiecţilor. Este relativ uşor
obţinem o măsurare pură asigurându-ne că una din aceste clase de variabile se
menţine constantă. De exemplu, dacă măsurăm abilitatea, care de altfel este uşor
de măsurat, diferenţele dintre scoruri nu reflectă diferenţe de abilitate ci diferenţele
de dinamică, cum ar fi cât de mult efort depun subiecţii. Asemănător, în procedura
de selecţie reală a subiecţilor, în care toţi subiecţii depun efor, testele de abilitate
sunt pur şi simplu cognitive.

129
6. După construirea unui test acesta trebuie să fie supus unei analize factoriale, pentru
a demonstra că acesta măsoară ceea ce şi-a propus să măsoare.
Având acest ghid de realizare a testelor obiective psihologul trebuie să construiască un
raţionament pentru elaborarea testelor obiective. Totuşi, aceste taxonomii şi analize sunt
foarte abstracte şi din acest motiv autorii prezintă o serie de indicaţii practice bazate pe
propria intuiţie şi experienţa lor considerabilă în construirea testelor obiective.

GHID PRACTIC PENTRU CONSTRUCŢIA TESTELOR OBIECTIVE DE


PERSONALITATE ŞI MOTIVAŢIE
Cattell şi Warburton (1967) listează cinci aspecte care trebuie evitate, la care de obicei
recurg amatorii în construirea de teste obiective:
1. Evitarea itemilor de tip chestionar, care prin definiţie nu pot intra în construcţia
unui fi un test obiectiv. După cum am menţionat anterior itemii chestionarelor pot
fi utilizaţi ca bază pentru testele obiective pentru a defini anumite comportamente
tipice.
2. Evitarea problemelor şi a itemilor tip puzzle. Acestea sunt utilizate pentru
măsurarea variabilelor cognitive.
3. Să nu avem încredere prea multă în “situaţiile stres”. Acestea surprind cel mai bine
frica şi agresiunea, dar există şi alte emoţii pe care acestea nu le surprind.
4. Evitarea testelor cu preferinţe stilistice şi estetice. Este adevărat că acestea pot
surprinde anumite aspecte de personalitate. Dar este absurd să gândim că ele pot
măsura toate aspectele de personalitate, chiar dacă trebuie să ignorăm faptul
evident că răspunsurile la aceste teste sunt influenţate de educaţie şi cultură.
5. Evitarea simplei utilizări a testelor proiective - răspunsurile la acestea sunt
complexe din punct de vedere factorial (Wenig, 1952).
Pe lângă aceste cinci aspecte care trebuie evitate atunci când se realizează un test
obiectiv, există şi alte caracteristici.
Vom discuta despre cele mai importante dintre ele.
1. Motivaţia diferită a subiecţilor. Acesta reprezintă o dificultate a tuturor testelor, dar
este acută în testele obiective în care subiectul nu are nici o idee legată de ceea ce testul poate
să măsoare şi pare o pierdere de timp. Totuşi există persoane care se consideră performante şi
care întotdeauna încearcă să rezolve cât mai bine itemii testului, de aceea factorii
motivaţionali neinţenţionaţi influenţează rezultatele.

IMPORTANT
Cattell şi Warburton (1967) discută cinci posibilităţi de reducere a acestei distorsiuni:
1.Testul este divizat în două părţi, pentru care motivaţia se consideră ca fiind la fel. Scorul
este diferenţa dintre cele două părţi sau proporţia celor două, o parte fiind considerată
deliberat ca fiind afectată de motivaţie.
2.Să motivăm subiecţii astfel încât să putem presupune că nu mai apar diferenţe între
motivaţiile indivizilor. După cum menţionează Cattell şi Warburton, acest lucru se poate
realiza prin utilizarea unor impulsuri de bază, cum ar fi sexul, frica, furia, mai curând decât
folosirea unor impulsuri care au mai puţină semnificaţie, cum ar fi sentimentele modelate
cultural, dintre care menţionăm sentimentele faţă de familie sau cele religioase, care au o mai
mare variaţie. În practică apar însă probleme etice, unele stimulări fiind dificil de realizat (de
exemplu înfometarea este imposibil de realizat), în prezent se utilizează frecvent ca stimuli
şocuri electrice sau poze cu figuri nude.

130
3.Cotarea poate fi restricţionată de aspectul stilistic sau formal al performanţei subiectului,
deoarece acestea sunt mai puţin influenţate de motivaţie, după cum menţionează Cattell şi
Warburton, putând fi recunoscute ca specifice într-o mare varietate de situaţii.
Toate aceste trei metode se aplică în testele temperamentale mai curând decât în testele
obiective dinamice. Ultimele două puncte se plică testelor dinamice.
4.Este posibil ca nivelul motivaţional al subiectului să acopere întreaga baterie de teste care
este analizată factorial. Dacă se întâmplă acest lucru toate variabilele care au pondere
substanţială într-un factor ar putea fi înlocuite.
5.Constructorul de teste trebuie să motiveze subiectul pentru a obţine o implicare completă
a acestuia. Practic acest lucru nu este uşor de realizat.

2. Testul ca situaţie. Testul poate fi privit ca o situaţie care implică anumite


comportamente sociale, care reprezintă un aspect important al personalităţii. Mischel (1968) a
contestat testele de personalitate considerându-le invalide deoarece scorurile sunt determinate
situaţional.
Cattell şi Warburton (1967) subliniază faptul că testul este o situaţie specifică şi că
putem crea un set de testele obiective care să implice interacţiuni sociale. Aceste situaţii în
miniatură, sunt dificil de creat şi complicat de aplicat în practică.

3. Influenţa abilităţilor şi a cunoştinţelor asupra testelor obiective. Dacă încercăm să


măsurăm personalitatea (sau motivaţia) folosind testele obiective influenţa abilităţii şi a
cunoştinţelor asupra scorului la teste distorsionează rezultatele.

EXEMPLU

Să presupunem că măsurăm interesele. Cantitatea de informaţii relevante pentru un


domeniu particular este o măsură a interesului subiectului pentru domeniul respectiv (Cattell
şi Child, 1975). Astfel, copii care sunt interesaţi de fotbal sau cricket au, în mod obişnuit,
foarte multe informaţii la zi în legătură cu viaţa şi cariera jucătorilor. Este clar că această
măsurare este distorsionată de variabilele abilitate. Este mai probabil ca un subiect foarte
inteligent şi cu un nivel mediu al interesului, să obţină acelaşi scor cu un subiect mai puţin
inteligent dar cu un nivel foarte ridicat al interesului. Deci măsurarea pur şi simplu a cantităţii
de informaţii nu dă o măsură a interesului. O modalitate de a depăşi această dificultate este
folosirea scorurilor ipsative pentru fiecare subiect în parte. Acest lucru implică folosirea ca
scor la test devianţa subiectului de la medie.

IMPORTANT
Cattell şi Warburton (1967) sugerează că 5 metode pentru a lămuri efectele abilităţii
asupra testelor obiective de personalitate:
1.În crearea testului să se reducă cât mai mult posibil cerinţele care se bazează pe abilităţi
sau cunoştinţe.
2.La fel ca şi pentru depăşirea problemei motivaţiei, diferenţele de abilitate pot fi reduse
folosind un raport sau diferenţa dintre scorurile unui test împărţit în două părţi.
3.Toate testele ar trebui analizate factorial iar factorii în care abilităţile au pondere să fie
înlocuiţi.

131
4.Utilizarea unui conţinut variat al testelor obiective, angajând întreaga varietate de
interese umane. Cu cât un test este mai variat cu atât este mai posibil ca acesta să măsoare
întregul spectru al personalităţii umane.
Până acum am discutat despre problemelor implicate în construirea testelor obiective
de personalitate şi motivaţie, şi despre ghidul formal care ajută la dezvoltarea acestui tip de
teste. În completarea acestor parametri şi taxonomii, Cattell şi Warburton admit că anumite
idei şi intuiţii vagi sunt importante în construirea testelor. Acestea includ:
1. intuiţie clinică;
2. observarea incidentelor critice din viaţa de zi cu zi şi care se reflectă în diferenţele
de personalitate;
3. folclor, proverbe, aforisme
4. situaţii emoţionale din jocuri sau sport;
5. conversaţii observate;
6. surse literare.
Testele obiective pot fi aplicate în grup sau individual.

Concluzii

IMPORTANT

La fel ca şi în cazul celorlalte teste este esenţial să se demonstreze validitatea şi acest


lucru poate fi realizat doar prin analiza factorială a variabilelor din câmpul personalităţii,
abilităţii şi motivaţiei.
Doar puţine din aceste teste au un nivel ridicat al validităţii. În cazul majorităţii
testelor obiective validitatea lor nu este cunoscută.
Exemple de teste obiective:
1. Agitaţia măsurată prin „agitometru” Acesta este un scaun cu contacte electrice, în
diferite puncte, care se închid prin mişcare. Scorul este reprezentat de numărul de mişcări
înregistrate într-o anumită perioadă de timp. Ipoteza care stă la baza construcţiei acestui test
este acela că agitaţia este un semn al anxietăţii. Era de aşteptat ca testul să aibă pondere în
factorul anxietate. Totuşi testul nu are pondere în factorul anxietate, ilustrând dificultatea de
construire a testelor obiective.
Trebuie să notăm faptul că dacă subiecţii îşi dau seama că scaunul măsoară mişcarea
ei vor fi greu de păcălit. Se pune problema reacţiei pe care o vor avea subiecţii, vor fi rigizi,
naturali, sau se vor comporta altfel?
2. Desenarea lentă a unei linii. Se cere subiecţilor să deseneze o linie pe o foaie cât
mai lent posibil. Scorurile care vor deriva din test: lungimea liniilor, dacă subiectul va înşela,
prin ridicarea creionului astfel încât să nu lase nici o urmă sau prin opriri. Acest ultim scor se
aştepta să aibă pondere în factorul psihotism al lui Eysenck, şi pondere negativă în factorul G
a lui Cattell. Nici una dintre aceste ponderi nu este susţinută de dovezi.
3. Consimţirea de a face farse. Acest test este un chestionar în care subiectul îşi
exprimă disponibilitatea de a face practic glume. Raţiunea testului este că subiecţii timizi s-ar
bucura de aceste glume. Acest lucru este susţinut de analiza factorială. Surprinzător s-a
constat că acest test are pondere în factorul anxietate - subiecţii stabili fiind cei care se bucură
mai mult de astfel de glume.
4. Rata metabolismului bazal. Acesta este un exemplu de test obiectiv fiziologic. Cel
mai mic consum de oxigen al subiecţilor este convertit în calorii pe oră pe metri pătraţi din
suprafaţă a corpului. S-a considerat că acest test are pondere în factorul extraversiune şi

132
exuberanţă. Totuşi testul are pondere într-un număr de variabile de personalitate şi ilustrează
probleme legate de încercarea de a crea măsurători fiziologice ale personalităţii. Aceste teste
trebuie să aibă dovezi clare ale validităţii.
Aceste patru exemple indică motivele pentru care au fost construite testele obiective.
Vom da în continuare exemple de alte câteva teste obiective, care conform lui Hundleby
(1973) au câteva dovezi ale validităţii:
Cel mai mare număr de recunoaşteri ale fragilităţii sau greşelilor de execuţie în
oglindă
Cea mai mare supunere în răspunsurile de la chestionare
Cel mai mare scor într-o listă de neplăceri
Toate aceste teste au pondere în factorul anxietate. Următoarele teste au pondere în
factorul asertivitate.
Preferinţa pentru cărţi cu titluri acceptabile social în comparaţie cu cele care au titluri
sub formă de întrebări
Cea mai rapidă viteză de bate/lovi uşor
Cel mai rapid tempo al mânii sau a rotirii piciorului
Cea mai rapidă viteză de citire atunci cât se cere subiectului să citească cu o viteză
normală
Cea mai mare viteză de citire a unei poezii şi de copiere a unor figuri
Cea mai mare preferinţă pentru activităţile sofisticate şi rafinate
Considerăm că exemplele date sunt suficiente pentru a indica marea varietate a testelor
obiective. Tot ceea ce rămâne de făcut este să investigăm şi să stabilim dacă ele sunt valide şi
dacă măsoară aspecte importante ale personalităţii.

APLICAŢIE
1.Realizați o comparație între testele nomotetice și cele idiografice.
2. Care sunt avantajele testelor obiective?
3. Care sunt sursele de variație în testele psihologice?

TEST DE AUTOEVALUARE (cu răspunsuri corecte ataşate la finalul cursului)


Apreciați valoarea de adevăr a următoarelor afirmații:
1. Testele nomotetice vizează măsurarea trăsăturilor comune în funcție de care indivizii
diferă:
a. ADEVĂRAT
B. FALS
2. Testele idiografice vizează măsurarea individuală a persoanei:
a. ADEVĂRAT
b. FALS
3. Aspectele unice și individuale de personalitate nu pot fi măsurate cu ajutorul testelor
proiective:
a. ADEVĂRAT
b. FALS
4. Cattell (1957) definește testele obiective ca teste a căror scop este relevat subiecților:
a. ADEVĂRAT
b. FALS
5. Testul Rorshach nu este inclus în categoria testelor obiective:
133
a. ADEVĂRAT
b. FALS
6. Instrucțiunile testului sunt o sursă de variație:
a. ADEVĂRAT
b. FALS
7. Testul poate fi privit ca o situație care implică anumite comportamente sociale:
a. ADEVĂRAT
b. FALS

134
Unitatea de învățare 11.
ALTE TIPURI DE TESTE PSIHOLOGICE

Vom discuta despre testele psihologice care nu fac parte din grupurile de teste pe care
le-am analizat în cursurile anterioare. Ele sunt diferite ca natură şi au o coerenţă care nu se
regăseşte în categoriile prezentate anterior.
1. Metodele perceptiv-genetice
Aceste metode au fost dezvoltate de către Kragh şi Smith (1970). Aceşti autori şi-au
adus o contribuţie importantă atât pentru dezvoltarea metodei dar şi a bazei teoretice.

IMPORTANT
Aceste metode, după cum sugerează şi numele, au ca obiect de studiu dezvoltarea
percepţiei. La baza acestei metode stă presupunerea că percepţia este un proces constructiv,
care reflectă totalitatea experienţelor noastre.

EXEMPLU
Dacă percepem o fată care iese din universitate, percepţia noastră conştientă este
colorată de experienţa noastră anterioară cu fetele şi universităţile. Procesul de percepţie este,
bineînţeles, instantaneu şi scapă controlului conştient.

IMPORTANT
Aceste metode caută să supună aceste procese examinării conştiente şi să releve
experienţe critice de viaţă şi conflictele inconştiente care afectează percepţia.
O astfel de descriere se potriveşte cu ceea ce este denumit în psihanaliză ca fiind
mecanism de apărare (Freud, 1946), de aceea nu trebuie să fim surprinşi că cele mai
cunoscute teste de acest tip sunt reprezentate de mecanismele defensive.
Metodele perceptiv-gentice fac apel la percepţia inconştientă prin prezentare serială a
stimulilor, mai întâi, în limitele pragului perceptiv pragul percepţiei şi apoi gradual descreşte
viteza de prezentare la tahitoscop. La fiecare prezentare subiectului i se cere să deseneze sau
să descrie ceea ce a văzut.

IMPORTANT
Distorsiunile şi schimbările în descrierea stimulilor în timpul seriilor prezentate
reflectă conflictele interne şi experienţele individuale care afectează percepţia. Procesul
instantaneu de percepţie este desfăcut în fragmente şi expus inspecţiei prin această prezentare
serială subliminală.
Există două teste, cel mai frecvent utilizate în cercetările perceptiv-genetice, testul
mecanismului defensiv, DMT (Kragh, 1985) şi tehnica meta-contrastului (Kragh şi Smith,
1970). Înainte de a descrie pe scurt testul DMT vrem să discutăm despre raţiunea testelor
perceptiv-genetice, şi dacă este posibil, în principiu, ca un astfel de test să fie o măsură validă
a proceselor inconştiente. Dacă acest lucru ar fi posibil, aceste teste ar reprezenta cel bun
instrument ştiinţific psihologic care a fost dezvoltat, deoarece, ar evidenţia ceva care normal
este în întregime inaccesibil, chiar prin definiţie, şi anume ar evidenţia procesele inconştiente.

135
Dacă s-ar demonstra testele perceptiv-genetice permit deschiderea pentru o inspecţie publică a
procesului privat de percepţie, o nouă ştiinţa ar fi posibil să apară. Astfel, blocajele
psihologiei ştiinţifice (se ştie că procesele noastre mentale sunt private şi inobservabile) ar
putea fi rezolvate.
DMT
În acest test se prezintă cartoane cu doi stimuli care diferă doar în detaliu. Aceştia sunt
stimuli adaptaţi ai TAT - ului. Pe fiecare carton se găseşte figura unui erou, un atribut al
eroului, iar în fundal, la periferia planşei, se găseşte o figură ameninţătoare, hidoasă.

IMPORTANT
Această figură hidoasă aflată la periferia planşei implică testul în măsurarea
mecanismelor defensive, deoarece distorsiunile de percepţie din timpul prezentării seriilor pot
fi surprinse prin modul în care subiecţii tratează ameninţarea.
Sjoback (1967), în descrierea pe care o face acestor teste, consideră că expunerile de la
început, când subiecţii văd puţin, prin răspunsurile lor reflectă procese primare, inconştiente,
în timp ce expunerile din ultimele stadii devin stimuli de graniţă. În schemele de cotare din
testele perceptiv-genetice momentul din seria de stimuli la care apare răspunsul este
considerat ca fiind foarte important.
Există câteva aspecte care privesc cotarea şi interpretarea testelor perceptiv-genetice
(pentru aceste testul DMT este un exemplu tipic). Mai întâi, Kragh şi Smith (1970)
argumentează că transformările de înţeles, în dezvoltarea percepţiei, dezvăluită în seriile
prezentate, fac posibilă reprezentarea istoriei personalităţii în timpul prezent. Trecutul este
disponibil direct investigaţiei experimentale. Noua formă şi semnificaţiile ei pot fi înţelese
doar prin referire la istoria vieţii subiectului. Într-adevăr experienţele sunt actualizate prin
utilizarea termenilor folosiţi în aceeaşi ordine în care au apărut în viaţă. Acesta este un
paralelism, şi semnifică faptul că anul precis al unui astfel de eveniment traumatic poate fi
evidenţiat printr-o serie perceptiv-genetică.
Acest lucru pare a fi fantastic şi există numeroase dovezi empirice pentru a respinge
tehnica, legăturile cu teoria psihanalitică neajutând în această privinţă.

IMPORTANT
Kline (1987), consideră că se poate renunţa la noţiunea de paralelism fără a abandona
ideea că importante experienţe de viaţă ar putea fi evidenţiate prin aceste tehnici. De fapt, s-a
demonstrat că paralelismul nu are semnificaţie.
În afară de evaluarea faptului că fiecare răspuns la testul DMT apare într-o secvenţă
strictă de timp şi de faptul că există o demarcaţie clară a ceea ce constituie un răspuns paralel
(care nu este un paralelism), paralelismul, în aceste teste însemnând că în anumite situaţii
răspunsul de la începutul seriei perceptiv-genetice reflectă evenimente de la începutul vieţii,
iar unele situaţii de la sfârşitul seriei reflectă evenimente de la sfârşitul vieţii. Deci se poate
renunţa la paralelism, fără însă a pierde puterea de interpretare.
Validitatea metodelor perceptiv-genetice
Nu vom discuta în detaliu despre dovezile validităţii acestor metode, ci vom evidenţia
principiile care stau la baza acestor metode. Vom avea în vedere testul DMT, deoarece s-au
făcut mai multe studii legate de acest test în comparaţie cu alte teste perceptiv-genetice
(Sjoback, 1988). Pentru mai multă claritate vom descrie pe scurt modul cum este cotat DMT.
Cotarea necesită deprinderi de cotare, şi deşi cel mai nou manual (Kragh, 1985) îmbunătăţeşte
metoda de cotare, care ar trebui supervizate practic.

136
IMPORTANT
Scorurile la DMT
Represia: eroul sau figura ameninţătoare trăiesc sau nu sunt umane; sau ambele sunt obiecte;
Izolarea: eroul sau figura ameninţătoare sunt separate sau izolate, sau una dintre ele nu poate
fi văzută;
Negarea: ameninţarea este empatic negată;
Reactanaţa: ameninţarea este transformată în opusul ei;
Identificarea cu agresorul: eroul devine agresor;
Întoarcerea împotriva sinelui: eroul sau atributele sale sunt periculoase sau inutile; atributele
devin o ameninţare pentru erou;
Sjoback (1988), care a lucrat cu acest test, consideră că nu există dovezi definitive ale
validităţi acestui test. Acest lucru se datorează în mare parte faptului că cei care utilizează
testul consideră că acesta este valid şi fac afirmaţii clinice în legătură cu clienţii lor, afirmaţii
pe care le consideră ca fiind adevărate. Cooper şi Kline (1982) încearcă să remedieze acest
deficit, realizând un studiu intens al testului DMT. Autorii ajung la concluzia că DMT
măsoară aspecte diferite de ceea ce măsoară 16 PF. Într-un alt studiu DMT a fost obiectiv
cotat folosind analiza G (Holley, 1973), rezultând că factorul DMT corelează pozitiv cu
succesul în selecţia piloţilor şi este legat de mecanismele defensive perceptive (Dixon, 1981),
care sunt o măsură a represiei. După cum notează şi Kragh (1989), testul DMT este util în
selecţia piloţilor, motivul fiind acela că cu cât se apără mai mult, cu atât aceştia vor răspunde
mai încet la ameninţare, este mult mai probabil să fie implicaţi în accidente.
Există anumite dovezi că testul DMT ar putea fi valid, dar mai este mult până când
acest lucru va fi demonstrat. Cea mai bună modalitate pentru demonstrarea validităţii testului
ar fi să se combine psihanaliza cu investigarea pacienţilor a căror inconştient este aparent
cunoscut. Dacă ar apărea un acord cu judecăţile clinice, acest lucru ar fi o dovadă a validităţii
testului DMT. Acesta pare să fie un bun argument din mai multe puncte de vedere:
a. Ar fi clar din punctul de vedere al raţiunii acestor metode perceptiv-genetice că, în
principiu, ar putea fi folosit orice stimul care reprezentă o ameninţare. Una din
dificultăţile cu care ar pute să se confrunte testul DMT ar fi că figura nu este
suficient de ameninţătoare, cel puţin pentru unii subiecţi. Westerlundl (1976) în
studiul legat de agresiunea pacienţilor schizofrenici a utilizat stimuli diferiţi (între
care şi stimuli orali). S-a constat că au apărut mecanisme defensive la stimulii
orali, dar nu şi la imagini controlate.
b. Fraza “mecanismele defensive au fost constatate” sugerează un aspect important.
Când testul DMT este cotat pentru un mecanism defensiv (să spunem reactanţă)
atunci când figura ameninţătoare este descrisă ca zâmbind sau fiind plină de
dragoste, aceste lucru este considerat ca fiind un suport obiectiv al teoriei
freudiene. Această interpretare a mecanismului defensiv nu este cu nimic diferită
de cea a unui analist care construieşte o remarcă complementară celei făcută de
subiect cu privire la formarea reactanţei faţă de mamă. Cu alte cuvinte, cotarea la
DMT se face identic cu interpretare a actului de către un analist, care etichetează
răspunsul ca fiind un mecanism de apărare.
c. Aceste măsurări realizate cu ajutorul testelor perceptiv-genetice fac publice date
rezultate din relatările făcute de subiecţi, care sunt înregistrate în condiţii precise.
Din acest motiv metodele perceptiv-genetice sunt utile, pentru că ne permit accesul
la un proces care în mod normal este inaccesibil.

137
Aceste inferenţe sunt făcute analizând descrierea mecanismelor de apărare. Rămâne
însă să se demonstreze că aceste răspunsuri indică mecanisme de apărare sau alte conflicte
inconştiente. Dacă acest lucru nu se va realiza, nu vom putea spune că testele sunt valide, iar
testele nu vor mai putea fi recomandate.

Concluzii

IMPORTANT

Discuţiile despre testele perceptiv-genetice, exemplificate prin testul DMT, indică


faptul că acestea permit accesul la un material care este normal inconştient. Studiile clinice,
realizate de Kragh şi Smith (1970) şi Sjoback (1988) susţin această concluzie. În această
situaţie ni se pare util să se investigheze validitatea testelor perceptiv-genetice curente şi să se
testeze eficienţa altor stimuli. Congruenţa cu ipotezele clinice, psihanalitice constituie o
dovadă a faptului că cel puţin protocoalele testelor conţin un eşantion de material relevant.

2. TESTELE SPECIALE UTILIZATE PENTRU PACIENŢII CARE AU LEZIUNI


ALE CREIERULUI
Pacienţii cu leziuni ale creierului sau suspectaţi că ar avea leziuni ale creierului după
accidente sau lovituri, precum şi pacienţii care suferă de demenţă, sunt frecvent testaţi
cognitiv pentru a evalua gradul de deteriorare mentală. Aceste evaluări sunt utile nu doar
pentru diagnostic, cum ar fi discriminarea între efectele îmbătrânirii şi ale leziunilor
(Goldstein şi Shelley, 1975) dar şi pentru tratamentele de reabilitare şi tratament. Mulţi
clinicieni utilizează teste de abilitate cognitivă pentru a face discriminări între grupele
psihiatrice care prezintă tulburări de gândire datorare unor leziuni ale creierului, chiar dacă
abilităţile lor cognitive nu sunt deteriorate. Schizofrenicii cu siguranţă fac parte din această
categorie.
Vom discuta despre raţiunea şi natura testelor deficitului cognitiv.
a. Utilizarea unui standard al testelor de abilitate
O abordare obişnuită pentru măsurarea deficitului cognitiv constă în utilizarea unui
standard ale testelor de abilitate. WAIS-ul (Wechsler, 1958) este potrivit pentru acest scop,
deoarece scalele permit evaluarea anumitor deficienţe cognitive. După cum menţionează
Howard (1989) diferite configuraţii ale sub-scorurilor sunt utilizate de clinicieni pentru a
indica anumite deficienţe cognitive de natură organică, precum şi altor probleme psihiatrice.
Maloney şi Ward (1976) discută în detaliu utilizarea WAIS-ului.
Utilizarea WAIS-ului pentru investigarea deficitelor cognitive este împiedicată de
faptul că, deşi acesta apelează la cumularea sub-scalelor, acestea sunt totuşi prea scurte.

IMPORTANT

Deficitele cognitive sunt mai bine evaluate nu printr-o măsurare globală a abilităţilor
cognitive, ci prin teste care să fie mult mai specifice, care vizează abilităţi limitate.

b. Teste speciale
Kay (1989) argumentează că testele de inteligenţă (QI), cum ar fi WAIS-ului, nu au
fost construite pentru a discrimina pur şi simplu între grupele de subiecţi anormali, deşi după
cum am văzut este sunt folosite în acest scop, şi că ar trebui folosite teste special construite

138
care oferă sensibilitatea şi discriminarea necesară. Kay consideră că aceste teste ar trebui să
vizeze măsurarea proceselor şi funcţiilor cognitive. Pentru ca aceste teste să fie valabile este
nevoie de o bază teoretică, ca cea evocată de Sternberg (1981) şi Cattell (1971).
Goldenberg (1989) a fost preocupat de raţiunea dezvoltării acestor teste pentru
folosirea lor în diagnostic şi tratament în psihologia clinică.

IMPORTANT
Ideal ar fi ca realizarea testelor neuro-psihologice să vizeze cât mai mult posibil
funcţii cognitive specifice. Totuşi cele mai multe teste neuro-psihologice nu au o utilitate
specifică pentru că ele sunt desemnate să descrie statusul cognitiv al pacienţilor fără a face
referinţă la creier.
Goldenberg argumentează că încercările de a construi teste pure pentru un singur
factor ale funcţiei cognitive specifice sunt foarte rare, chiar dacă acestea au avut succes.
Trăsăturile, deprinderile sau comportamentele sunt complexe factorial.
După cum susţine Goldenberg (1989) există unele consecinţe importante ale faptului
că de fapt nici unul din teste nu este precis neuro-anatomic. Din acest motiv diagnosticul
neuro-psihologic este însoţit de necesitatea de a administrare a unei baterii de teste. Testele
neuro-psihologice cu un singur factor şi deficienţele performanţei la un singur factor nu sunt
necesare pentru a evidenţia disfuncţia unei singure localizări neuro-anatomice sau a unei
simple dimensiuni cognitive. De aceea este nevoie de o baterie de teste neuro-psihologice.

IMPORTANT

În acest context, măsurarea utilă pentru psihologia clinică a unui deficit cognitiv,
implică utilizarea unor teste care să măsoare o mare varietate de funcţii în special acele
procesări de informaţii care au fost identificate ca fiind importante în psihologia cognitivă.
Aceste măsurări pot să permită inferenţe cu privire la locul şi extinderea leziunilor creierului.
Warrington (192, 1975 a realizat studii pentru a elucida deficitele care apar în diferite
tulburări patologice El a realizat studii de psihologie experimentală cognitivă asupra leziunilor
implicate în memoria sistematică şi recunoaşterea obiectelor. A realizat un instrument util -
Testul de Recunoaştere din Memorie (Warrington, 1984). Acest test cere subiecţilor să
recunoască cuvinte sau obiecte care au fost anterior prezentate. Se poate obţine un scor la
recunoaşterea verbală şi cea vizuală şi se consideră că rezultatele ar indica locul leziunilor din
creier, ambele scoruri putând fi folosite ca bază pentru diagnostic şi tratament. Acest test este
doar o măsură şi nu reprezintă o parte dintr-o baterie.
O baterie tipică pentru evaluarea neuro-psihologică este Bateria Luria Nebraska
(Golden, 1980), care evaluează un rang neuro-psihologic. Aplicarea testului durează 3 1 2 .
Această baterie măsoară motricitatea, ritmul, funcţiile tactile şi vizuale, viteza de receptivitate
şi expresivitate, scriere, citire, memorie şi procesele intelectuale. Toate aceste teste s-au
dovedit utile pentru construcţia unui tablou cognitiv al deficitelor cognitive ale subiectului şi a
posibilei deteriorări neuro-psihologice.

139
Concluzii

IMPORTANT

În esenţă aceste teste încearcă să evalueze funcţiile cognitive de bază, şi au ca


fundament teoretic teoriile psihologice cognitive. Normele sunt esenţiale pentru că ne permit
să vedem care sunt afecţiunile tipice ale creierului.

3. TESTE SPECIALE ŞI LISTE (CHECKLIST)


Vom discuta despre construcţia şi utilizarea testelor care sunt virtual liste (checklist).

EXEMPLU
Lista simptomelor sau caracteristicilor unei sesiuni de terapie. Acestea sunt adesea
folosite în evaluare şi în studii de psihoterapie, unde se urmăreşte evaluarea progresului sau
rezultatelor terapiei sau a ceea ce simt clienţii în legătură cu tratamentul.
În studiile lui Sheffield (Shapiro, 1990) sunt prezentate câteva teste de acest tip. Vom
prezenta şi noi câteva dintre aceste teste.
a. Teste de conţinut.
Deşi aceste teste sunt de natură clinică, teste similare au fost construite pentru a fi
utilizate în diferite contexte. În psihologia educaţională este posibil să se construiască liste
(checklist) pentru evaluarea performanţelor şcolare şi pentru evaluarea problemelor de
comportament ale copiilor în clasă. Stott (1957) a construit un set de teste care sunt utilizate în
acest scop - Ghidul Bristol de Ajustare Socială - care evaluează comportamentul copiilor la
şcoală şi acasă. În psihologia ocupaţională listele sunt folosite pentru evaluarea
comportamentului angajaţilor şi sunt valabile pentru evaluarea caracteristicilor dezirabile şi
necesare pentru un anumit post. Chestionarul Analizei Poziţiei (McCormick, 1972) este un
exemplu pentru acest tip de teste.
b. Fidelitatea şi analiza factorială a testelor
Scala de evaluare SCL-90 (Derogatis, 1973) este un exemplu pentru acest tip de teste.
Aceasta constă într-o listă de 90 de simptome pe care subiecţii le evaluau cât de mult le-au
resimţit în ultimele două săptămâni. Itemi tipici au fost: simt critica celorlalţi, simt că orice
lucru pe care îl fac este un efort, exagerez etc. Este evident că dacă simptomele sunt bine alese
şi pot fi utile, pentru diagnostic, în găsirea unor grupări de simptoame, în evaluarea şi
monitorizarea psihoterapiei, în care se presupune că dacă lucrurile vor merge bine pe
parcursul terapiei simptomele vor scădea în intensitate şi vor fi mai puţine ca număr.

IMPORTANT

În utilizarea acestui tip de teste, care sunt complet empirice şi ateoretice, singurul
criteriu pentru eşecul sau succesul terapeutic îl reprezintă apariţia simptomelor.
Pentru astfel de scale trebuie să se demonstreze precizia şi să se arată că aceste scale
conţin unul sau mai mulţi factori. În prezent aceste demonstraţi sunt lipsite de semnificaţie. Se
presupune că pacienţii fac raportări corecte, fie că au fie că nu au aceste simptome. Astfel,
scala are sau nu consistenţă internă.

140
IMPORTANT
Consistenţa internă şi fidelitatea reflectă pur şi simplu gradul în care aceste simptome
se întâmplă să fie asociate cu altele în viaţa de zi cu zi.
Acest lucru este departe de situaţia în care se încerca să se demonstreze că un set de
itemi ai unui test de personalitate sunt extraşi dintr-un domeniu comun de itemi, în care
trebuia să se demonstreze că aceşti itemi sunt legaţi. Pentru a cota precizia consistenţei interne
a listelor (checklists) înseamnă pur şi simplu supunerea la ritualul psihometric. Coeficienţii nu
sunt importanţi.
Acelaşi lucru se întâmplă şi în cazul analizei factoriale. Informaţia că există x factori
nu înseamnă nimic mai mult decât că x grupe de simptoame tind să se grupeze împreună.
Acestea pot confirma categoriile de diagnostic, care pot prezenta interes clinic. Totuşi în
multe situaţii astfel de factori pur şi simplu reflectă asemănările semantice ale itemilor. Un
exemplu de astfel de test este scala relaţiilor client-terapeut, care a fost studiată de Shapiro
(1990). Un cluster de itemi se referea la ceea ce simt pacienţii despre terapeut iar altul se
referea la descrierea terapeutului. Autorii nu fac referire la alte variabile care s-ar afla în
spatele testului. Universul de itemi din care a fost realizat testul a fost un set de itemi care
descriau terapeuţii. Aceasta este în contrast cu un set de itemi ai extraversiunii, care dacă
testul este valid reflectă un set larg de comportamente, care se află în spatele testului. Faptul
că pot să existe mai mulţi factori, nu numai unul, înseamnă doar că un scor nu poate fi utilizat
bazându-ne doar pe o simplă adiţionare a itemilor liste (checklist). Chiar dacă există câţiva
factori într-o listă a simptomelor, numărul absolut al simptomelor, înainte şi după tratament
poate prezenta interes.

IMPORTANT

Din aceste argumente se poate vedea că în listele (checklist) nu revendică faptul că


este măsurată o variabilă prin intermediul itemilor, precizia şi construcţia factorială este mai
puţin importantă decât în cazul testelor psihometrice, unde variabilele sunt mai mult sau mai
puţin o listă de itemi asemănători.
c. Liste (checklists) şi simţul comun
Aceste liste sunt construite intuitiv plecând de la simţul comun, rezultatul fiind acela
că este greu de găsit ceva nou. Simţul comun poate fi refuzat dacă ipoteza nu este confirmată.
Acest lucru se întâmplă pentru că, prin natura construcţiei lor aceste test nu pot produce noi
variabile. Această situaţie contrastează cu testele de personalitate psihometrice unde,
variabilele obţinute în urma analizei factoriale, cum fi extraversiunea, anxietatea, obsesii,
permit psihologilor să dezvolte noi modele de personalitate.

Concluzii: liste (checklist) şi natura factorilor

IMPORTANT
Esenţa problemei este legată de natura factorilor. Am subliniat importanţa testelor
analizate factorial. Totuşi aceste teste, măsoară factori pentru care există un tip de validitate
externă.

141
Un astfel de exemplu este inteligenţa. Factorul inteligenţă, măsurat prin intermediul
testelor de inteligenţă, prezic succesul academic, ocupaţional. Dar există şi indexul ridicat al
eredităţii.
Din nefericire unele teste măsoară pur şi simplu specificităţi umflate (Cattell, 1978).
Astfel de teste au o precizie ridicată şi itemii au o saturaţie mare în factorul măsurat. Totuşi
factorii cu specificităţi umflate pot fi distinşi de factorii independenţi, importanţi prin faptul
că aceşti factori nu corelează cu alte variabile. În esenţă multe liste (checklist) şi teste similare
sunt de acest tip. Itemii formează factori pentru că evident similari. În acest caz informaţia
psihologică este obţinută din itemii înşişi.

EXEMPLU

În scala relaţiei client-terapeut există un item: “Deprinderile profesionale ale


terapeutului meu sunt impresionante”. Se presupune că acest item şi ceilalţi itemi similari
permit distincţia celor care se bucură de terapie, care se simt bine ca rezultat al terapiei. Totuşi
nu se poate face mai mult decât această inferenţă, şi anume că cei care se simt mai bine şi se
bucură de terapia găsesc că terapeutul lor este impresionant. Dacă rezultatele sunt slabe,
pacienţii care nu se simt mai bine nu găsesc deprinderile terapeutului lor ca fiind
impresionante şi doar acest lucru putem să-l afirmăm.
Uneori aceste informaţii pot fi valabile dar nimic nu se adaugă analizând factorial
aceste teste. Testele au răspunsurile cuantificate în aşa fel încât să fie posibil să se comparare
grupele statistice. Se pare că este puţin mai mult decât cunoaşterea anterioară, care punea pe
primul loc construcţia testului.
4. Teste de emoţii bazate pe modele circumplex şi alte modele similare
Există un mic grup de teste construite după modelul Guttman, numit şi modelul
circumplex.

DESCRIEREA MODELULUI CIRCUMPLEX


Acesta este un model particular în care apare analiza în faţete (facet). O faţetă (facet)
este un sistem de clasificare în care fiecare faţetă (facet) poate avea mai multe nivele de
clasificare. În analiza faţetelor (facet), după cum menţionează Nunnally (1978) există un
număr de stadii. Să presupunem că avem o colecţia de teste. Mai întâi trebuie să sugerăm o
structură a faţetei, în care există o anumită combinaţie a tuturor categoriilor. Această structură
propusă ar trebui să ne conducă la o matrice ipotetică de intercorelaţiilor testelor. Atunci când
matricea ipotetică este comparată cu corelaţiile actuale, observate, sunt posibile testele
statistice (ale potrivirii). Dacă suma faţetelor este bună, atunci cotarea testului trebuie
calculată ca o măsură a faţetelor de bază.

IMPORTANT

După cum argumentează Nunnally (1978) această analiză a faţetelor (facet) face
referinţă la o analiză corelaţională masivă deoarece se referă la structura ipotetică a întregii
matrici mai curând decât la factorii individuali. Faţetele (facet) pot fi explicate în termenii
combinaţiilor lor, a factorilor ce stau la baza matricei. Deşi este posibil să derive noi faţete
(facet) din corelaţiile dintre teste, în mod obişnuit în analiza faţetelor (facet) se începe cu
ipotezele referitoare la faţete şi combinaţiile dintre acestea în cadrul fiecărui test.

142
În cadrul acestui model structura faţetelor este circulară. Fiecare variabilă poate fi
privită ca un cluster deoarece este un amestec al componentelor faţetelor. Începem cu
variabila 1 (sunt 8 variabile) fiecare variabilă are mai multe în comun cu variabilele vecine
decât cu cele care se află la distanţă (de exemplu variabila 1 cu 2, variabila 7 cu 8). Totuşi ele
sunt aranjate într-un cerc, în care variabilele din mijloc 4, 5 şi 6 au mai puţin în comun cu
extremele decât între ele, în timp ce variabilele de la extreme ce suprapun în termenii
compoziţiei faţetelor (1 şi 8). Într-un model circumplex se pleacă de la diagonala părţilor
matricei, numărul de faţete în comun începe de la zero şi apoi creşte indicând natura circulară
a naturii varianţei împărţite.
Nunnally (1978) ilustrează excelent modelul circumplex plecând de la faţetele
comune, care clarifică natura ordonării circulare. Trebuie menţionat că este posibil să
convertim o matrice a faţetelor comune într-o matrice ipotetică de corelaţii: numărul de faţete
comune poate avea legătură cu procentajul de varianţă comună, a cărui rădăcina pătrată este
corelaţia. Reproducem aceasta în figura 1.
Trebuie să facem câteva precizări legate de acest model. Mai întâi, după cum
argumentează Nunnally (1978) acest model reprezintă un sumar elegant al datelor în matricei
de corelaţie. Aceasta este raţiunea analizei factoriale, dar din analiza factorială nu rezultă un
număr evident de factori, dar ea poate fi folosită pentru găsirea unui principiu de rezumare a
datelor. Adepţii analizei corelaţionale masive susţin că modelul circumplex permite acest
lucru. McCrae şi Costa (1989) argumentează că modelul permite o bună evaluare a
personalităţii şi poate fi privit ca un model complementar la descrierea analitică a factorilor.

Cooperant

A: Încrezător
B: Stabil Docil
Responsabil C: Afectiv
D: Supus B: Stabil
A: Încrezător C: Afectiv
B: Stabil D: Supus
C: Afectiv E: Neîncrezător
H: Ascendent

7 6 C: Afectiv
8 D: Supus Modest
A: Încrezător
B: Stabil 1 5 E: Neîncrezător
Managerial F: Instabil
G: Ostil
H: Ascendent 2 4
3
Figura 1 D: Supus
A: Încrezător E: Neîncrezător
F: Instabil F: Instabil
G: Ostil G: Ostil
H: Ascendent E: Neîncrezător
F: Instabil Sceptic
G: Ostil
Competitiv H: Ascendent

Agresiv

143
IMPORTANT

Totuşi metoda analizei masive este complexă din punct de vedere logic şi statistic, iar
dificultatea se datorează lipsei de claritate în ceea ce priveşte diferenţele dintre noţiunile de
faţetă şi variabilă.
O altă obiecţie a fost menţionată de Nunnally (1978). Analiza faţetelor, spre deosebire
de analiza factorială nu este o metodă de descoperire. Mai curând este o metodă de testare a
ipotezei. Totuşi modelul circumplex este o ipoteză extrem de complexă şi doar foarte rar este
posibil ca ipoteza unei structuri cu o astfel de complexitate să ducă la obţinerea de cunoştinţe
curente în domenii psihometrice principale ale personalităţii, motivaţiei şi abilităţii.
Din descrierea simplificată a modelului se poate observa că faţetele sunt fie prezente
fie absente. Totuşi în aplicaţiile realiste ale testelor psihologice o astfel de măsurare simplă
este mai puţin probabilă. Se poate avea în vedere şi greutatea diferită a diferitor faţete, iar
acest lucru ar duce la complicarea modelului circumplex.
Poate că cel mai important aspect se referă la faptul că analiza faţetelor nu este o
metodă de construcţie prin analiză a faţetelor de bază. Acest lucru deosebeşte modelul de
analiza factorială.
Chiar dacă s-a arătat că este un model sumar al matricelor de corelaţie complexe,
descrierea nu pare să aibă o semnificaţie particulară. Este un punct de vedere subiectiv. Există
autori care pot găsi o descriere valabilă a modelului circular sau o semnificaţie a acestuia.
Concluzii
Din descrierea şi discuţiile asupra modelului circumplex este clar că este o metodă
ingenioasă de sumare a matricei scorurilor la test.

5. Cercetările lui Plutchik


Plutchik a studiat o perioadă lungă de timpe emoţiile. Abordarea psiho-evoluţionistă
(Plutchik, 1980) a emoţiilor le leagă de trăsături şi stări.

IMPORTANT
Trăsăturile sunt privite ca stări afective (emoţii) care persistă şi apar frecvent între-o
varietate de situaţii.
În cadrul teoriei sunt aduse noţiunile de mecanisme de apărare şi mecanisme
inconştiente pentru a putea explica conflictele emoţionale şi de coping, tehnicile conştiente
fiind folosite pentru rezolvarea acestor conflicte.
Aceasta este baza teoretică a testelor de emoţii ale lui Plutchik care sunt făcute să se
potrivească modelului circumplex. Aşa cum s-a afirmat trăsăturile de personalitate, în cadrul
acestei teorii derivă din emoţii. Trăsăturile rezultă din persistenţa situaţiilor care produc
emoţii amestecate.

EXEMPLU
O persoană care întotdeauna simte teamă în situaţii dar care doreşte să fie plăcută de
ceilalţi mult mai probabil va dezvolta trăsătura de docilitate (Plutchik şi Conte, 1989).
Dacă caracteristicile înnăscute ale emoţiilor se reflectă în trăsăturile de personalitate,
atunci, conform lui Plutchik şi Conte (1989), modelul circumplex este bun pentru măsurarea
trăsăturilor şi emoţiilor. În termenii modelului circumplex emoţiile pot fi aduse ca faţete ale
diferitor trăsături de personalitate.
a. Indexul profilului emoţional
144
Plutchik (1980) a descris măsurarea a opt emoţii de bază. Se presupune că toate
trăsăturile de personalitate rezultă din amestecul a două sau mai multe emoţii primare.
Timiditatea implică frică, de exemplu, iar melancolia implică tristeţea.
Indexul este un test cu alegeri forţate în care 12 termeni trăsături de personalitate sunt
aranjaţi în perechi, luându-se în seama toate combinaţiile posibile (excluzând patru perechi
identice), subiecţii trebuind să aleagă cuvântul din pereche care îi caracterizează cel mai mult.
Pentru fiecare cuvânt este ales scorul pe una sau mai multe dintre cele opt dimensiuni
emoţionale de bază.

IMPORTANT

Aceste dimensiuni sunt: bucurie, acceptare, surpriză, frică, dezgust, tristeţe, aşteptare
şi furie. Acest test măsoară toate dimensiunile care sunt aranjate circumplex în termenii
similarităţii şi bipolarităţii.
Subiecţii primesc un scor pentru fiecare dintre cele opt dimensiuni ale testului. Apoi
acest scor este convertit în centile pe baza unui eşantion de 500 de subiecţi de sex masculin şi
500 de subiecţi de sex feminin. Aceste centile sunt reprezentate grafic într-un cerc împărţit în
opt segmente, unde zero este la centru cercului iar centilul 100 pe circumferinţa cercului.
Autorii menţionează că precizia/fidelitatea testului este ridicată (Plutchik şi Conte, 1989).
Conform acestor autori valoarea mai însemnată a EPI se bazează direct pe teoria emoţiilor,
care a determinat alegerea unei dimensiuni ce va fi măsurată, care va fi bază pentru
identificarea componentelor emoţionale ale trăsăturilor şi în final se va dovedi o bază pentru
măsurarea conflictului amestecului dintre trăsături şi emoţii.

Concluzii

IMPORTANT
Nu s-a urmărit evidenţierea valorii Indexului Profilului Emoţional ci de a ilustra
modelul circumplex ca bază pentru construcţia unor teste. Plecând de al descrierea teoriei şi a
testului este clar că acest model poate fi utilizat în construcţia testului.
Înainte de a analiza valoarea acestui model, vom descrie pe scurt instrumentul
dezvoltat de Plutchick, şi anume Indexul Profilului de Personalitate, PPI.

b. Indexul Profilului de personalitate.


Testul PPI se bazează pe faptul că modelul circumplex care este cea mai bună
descriere a trăsăturilor. Trăsăturile utilizate în acest test sunt cele indicate de modelul
cirumplex al lui Conte (1975) şi Conte şi Plutchick (1981), care investighează structura a 171
de itemi.
Versiunea finala a PPI-ului conţine 89 de itemi (termeni trăsături) la care subiecţii
răspund pe o scală cu 5 trepte de la “niciodată” la “foarte des”. Dimensiunile modelului
circumplex sunt: acceptare, supunere, pasivitate, asertivitate, sociabilitate, respingere,
agresiune şi revoltă.
Întrebarea la care trebuie să se răspundă cu privire la PPI se referă la natura celor opt
trăsături. Dacă ele se potrivesc modelului circumplex şi ce vizează ele? După părerea autorilor
faptul că trăsăturile se potrivesc modelului are mai puţină importanţă din punct de vedere
psihologic. Ele sunt au mai puţină importanţă decât o structură factorială simplă, care ne
informează în legătură cu mărimea factorilor, intercorelaţii şi faptul că aceştia sunt factorii
principali ai câmpului. Modelul circumplex ne informează pur şi simplu că factorii pot fi
145
aranjaţi logic pe circumferinţa unui cerc. Astfel se elimină problema referitoare la faptul că
unii factori pot să nu se potrivească prea bine paternului.

IMPORTANT
Este dificil de validat aceste dimensiuni. Plutchick şi Conte (1989) afirmă că analizând
modul cum termenii au fost grupaţi în jurul modelului circumplex, indicând faptul că aceştia
au o structură explicită asemănătoare.
De exemplu, o grupare este clar legată de agresiune (e.g. “argumentativ”, “beligerant”)
şi un alt grup de cuvinte, cum ar fi sincer, puternic, şi candid (nepărtinitor) reflectă
asertivitatea şi nu agresiunea. Acest lucru ne atenţionează că argumentele psihometrice
trebuie analizate cu atenţie.
Afirmaţia “o grupare este clar legată de agresivitate” nu semnifică nimic mai mult
decât faptul că autorii cred că acest lucru este adevărat. Pentru a spune că termenii sunt
înrudiţi celui de agresiune nu este o problemă de opţiune ci este nevoie de suport empiric care
să ofere dovezi. Simpla aserţiune nu este suficientă. Acest lucru este mai important pentru a
doua aserţiune, şi anume că cuvinte similare măsoară mai curând asertivitatea decât
agresiunea. Această etichetare a dimensiunii este pur şi simplu un aspect al validării. Este
important pentru că un argument al acceptării modelului circumplex este acela că
dimensiunile trebuie să posede calităţile asemănării şi polarităţii.

IMPORTANT

Dimensiunile indexului profilului de personalitate sunt identificate doar în termenii


itemilor lor, iar această formă de validitate nu este satisfăcătoare. Faptul că ei sunt aranjaţi
într-un circumplex ne dă puţină informaţie despre structura lor. Este nevoie de o analiză
factorială a acestor scale cu factori principali de personalitate. Este posibil ca să rămână
puţină varianţă neexplicată în IPP şi de aceea putem avea nevoie ca descrierea circumplexă să
fie înlocuită.
Concluzii
Aceste două exemple de teste ale lui Plutchik şi colegilor care se bazează pe modelul
circumplex care nu pare să aibă un suport suficient pentru a fi utilizat şi a avea valoare în
construcţia testelor. Acest tip de descriere ar putea fi utilă dacă s-ar arăta că variabilele din
modelul circumplex nu se potrivesc cu alte structuri. Acest lucru nu se aplică şi în cazul IPP,
pentru că toate scalele corelează semnificativ cu Scala Stimei de Sine a lui Fitts (1965).
Aceasta înseamnă că acest scale nu sunt independente şi că dispare structura modelului
circumplex. După cum s-a sugerat anterioară analiza factorială a acestor scale indică doar o
mică varianţă rămasă neexplicată. Plutchik şi colegii săi au arătat că structura modelului
circumplex se potriveşte scalelor. Totuşi rezultă o mică semnificaţie psihologică din aceste
corelaţii cu scala stimei de sine, şi este posibilă o mai mare cantitate de varianţă a acestor
itemi.
Aceleaşi argumente e aplică şi scalei emoţionale. Cele 12 termeni trăsături care au fost
utilizaţi pentru construcţia scalelor au fost selectaţi doar pe baza faptului că exista un bun
acord între judecăţile privitoare la consecinţele emoţiilor. Acest lucru nu este mai mult decât
un aspect al validităţii. Ca în cazul EPI o analiză factorială a acestor scale cu notele pentru
factorii de personalitate ar releva natura varianţei. În prezent etichetarea lor se face pur şi
simplu în termenii validităţii şi teoriei emoţiilor a lui Plutchik.
Aceste două exemple de teste construite după modelul circumplex nu par să ofere
suficient suport ca bază pentru construcţia testelor. Principale problemă a modelului provine
146
din faptul că chiar dacă există o descriere a datelor aceasta nu este o descriere informativă.
Există puţină informaţie care să ducă la concluzia că scala se potriveşte unui circumplex.
Modelul va fi util atunci când va fi clar faptul că modele psihometrice normale, cum ar
fi o simplă structură de factori, nu se potriveşte complexităţii datelor.

6. Repertoriul cu test grilă


Au fost dezvoltat de Kelly (1955) ca metodă de colectarea de date relevante pentru
teoria constructelor personale. Aceste instrumente nu sunt teste, deşi ele au fost astfel descrise
de unii psihologi.

IMPORTANT
Esenţa teoriei constructelor, care stă la baza acestor instrumente este aceea că oamenii
sunt văzuţi ca oameni de ştiinţă care întotdeauna încearcă să dea un sens lumii înconjurătoare.
Ei fac acest lucru formând constructe care sunt dependente de experienţa lor cu o
specificitate care ţine de propria persoană. Kelly şi teoriile constructiviste (Bannister şi Main,
1968) consideră că testele psihologice standard sunt lipsite de valoare deoarece semnificaţia
itemilor este diferită pentru fiecare individ. Repertoriul cu test şi grilă ajută la elucidarea
semnificaţiei unor constructe importante din viaţa individului.
Descrierea unui repertoriu
O listă conţine elemente şi constructe. “Elementele pot fi orice din lume, pentru a cita
pe Bannister (1973), filme, deschiderea unei cutii cu brânză, ..., tipuri de trandafiri ş.a.m.d.”
Constructele sunt discriminările pe care le face persoana între elementele listei. O astfel de
listă ne ajută să elucidăm astfel de constructe, respectiv elementele care sunt relevante.

Un exemplu de listă

EXEMPLU
Să presupunem că suntem interesaţi de constructele unei femei despre lume. Îi vom
cere să numească 15 persoane importante din viaţa ei, cum ar fi mama, tata, iubit, şeful de la
serviciu etc. Acestea vor fi elementele. Constructele vor fi obţinute de la subiect prin gruparea
elementelor în trei şi cerând subiectului să ne spună două grupe care sunt apropiate şi diferite
de a treia. Astfel, putem obţine că A şi B sunt inteligenţi, în timp ce C este slab. Constructul
este: inteligent-slab. Asemănător vom descoperi că D şi E sunt manieraţi în timp ce F este
nemilos. Este important ca constructele să fie elaborate de subiect deoarece sunt particulare
pentru acesta.
Există şi alte metode pentru a elabora constructe, dar ele sunt esenţial echivalente
metodei pe care au descris-o. Trebuie menţionat că există mai multe tipuri de metode descrise
de Kelly (1955), multe dintre ele au fost rar folosite. Una dintre ele explorează relaţiile dintre
constructe, în mod particular care constructe implică alte constructe (Hinkle, 1965).
Analiza listelor
Subiecţilor li se poate cere să ierarhizeze fiecare element al fiecărei construct sau să
evalueze fiecare element al fiecărui construct. Ambele metode au ca rezultat corelaţii între
constructe. Este posibil să vedem ce constructe merg împreună şi bineînţeles cum se plasează
indivizi similari în funcţie de aceste constructe. Astfel putem constata că inteligenţa şi
cruzimea sunt corelate, şi apoi întorcându-ne la elemente să constatăm, de exemplu, că un
profesor de la liceu care este urât de subiect este văzut în mod asemănător în relaţie cu mama.

147
IMPORTANT

Este clar că această metodă produce informaţii care sunt utile pentru înţelegerea
indivizilor particulari şi aceste liste par să fie potrivite pentru utilizare clinică Este dificil însă
de stabilit ce se poate face mai departe cu aceste informaţii, având în vedere faptul că listele
pentru diferiţi indivizi nu sunt compatibile.
Unii cercetători au analizat factorial listele (Slater, 1964, 1976) şi au dezvoltat un set
statistic sofisticat de programe computer în acest scop. Totuşi fiind un număr mic de
observaţii pentru fiecare listă, erorile statistice ale acestor analize factoriale pot fi atât de mari
încât metoda de prelucrare statistică să fie considerată ca fiind îndoielnică. Chiar dacă rezultă
factori ei sunt specifici unui individ particular şi de acea prezintă un interes ştiinţific redus.
Un număr mare de observaţii se pot face legat de afirmaţia că constructele sunt
distincte şi particulare pentru fiecare individ. Acest adevăr pare să fie banal. Toţi avem o
experienţă de viaţă care este privată şi care este diferită de a celorlalte persoane. Această
experienţă este atât de diferită încât testele sunt lipsite de valoare.
Dacă acest aspect ar fi adevărat atunci conversaţia şi înţelegerea dintre oameni ar fi
imposibilă. Faptul că lumea exterioară poate fi înţeleasă sugerează că pentru oameni există un
nucleu comun de semnificaţii chiar dacă aceste nu sunt identice.
Există câteva dificultăţi severe. Dacă constructele individuale folosite sunt atât de
diferite atunci ele pot fi elucidate pornind de la informaţiile din liste care sunt particulare
pentru un individ, neputând fi combinate cu rezultatele altor subiecţi şi neputându-se face
inferenţe despre rezultatele unui subiect comparativ cu cele ale altui subiect. Aceasta distruge
scopul ştiinţific normal al descoperirii legilor generale aplicabile tuturor sau unui număr mare
de aspecte ale umanităţii. Dacă premisele listelor sunt acceptate putem spune că psihologia
ştiinţifică este imposibilă şi că pot fi înţeleşi doar indivizi separat. Ar fi util să stabilim relaţii
între măsurarea individului cu ajutorul listelor şi scorurile la anumite variabile din mediu.
Chiar dacă ar fi posibil să stabilim asemenea relaţii aceste nu ar fi utile deoarece constructele
sunt apioric diferite unele de altele şi nu ar fi posibile inferenţele sau extrapolorile. Doar în
domeniul clinic informaţiile rezultate prin folosirea listelor ar putea fi utile.

EXEMPLU

O grilă ar putea fi folosită în terapia maritală. S-ar putea constata că soţul îşi vede soţia
ca pe o mamă în timp ce soţia îşi vede soţul ca tată. Această incompatibilitate poate crea
probleme. Discutarea acestor dificultăţi ar duce la îmbunătăţirea relaţiei. Să presupunem că
dificultatea rezidă în certuri frecvente. Deoarece constuctele indivizilor sunt diferite nu se pot
face generalizări. Simţul comun ar sugera că o ipoteză rezonabilă ar fi să presupunem că
atunci când bărbatul doreşte ca soţia să reprezinte imaginea mamei iar femeile imaginea
tatălui putem vorbi de o dizarmonie maritală. Dacă această inferenţă este făcută atunci listele,
distincte de interviu şi chestionar, care au constructe comune, nu au raţiunea de a exista.
Aceste motive stau la baza respingerii listelor pentru măsurare.

APLICAŢIE
1. Care sunt criticile aduse cercetărilor lui Plutchik?

148
TEST DE AUTOEVALUARE (cu răspunsuri corecte ataşate la finalul cursului)
Apreciați valoarea de adevăr a următoarelor afirmații:
1. Metodele perceptiv-genetice au ca obiect de studiu dezvoltarea percepției:
a. ADEVĂRAT
B. FALS
2. La baza metodelor perceptiv-genetice stă presupunerea că percepția nu reflectă totalitatea
experiențelor noastre:
a. ADEVĂRAT
b. FALS
3. Lista simptomelor sau caracteristicilor sunt rar folosite în evaluare și în studii de
psihoterapie:
a. ADEVĂRAT
b. FALS
4. O fațetă este un sistem de clasificare în care o fațetă poate avea mai multe nivele de
clasificare:
a. ADEVĂRAT
b. FALS
5. În opinia lui Plutchik, trăsăturile sunt privite ca stări afective care persistă și apar frecvent
într-o varietate de situații:
a. ADEVĂRAT
b. FALS

149
TEMĂ DE CONTROL OBLIGATORIE (4 ore)
La variabila capacitate generală de argumentare subiecţii testaţi au obţinut rezultatele
prezentate mai jos.
Realizaţi etalonul în decile, respectiv cvartile şi precizaţi în care decil, respectiv cvartil se
găseşte un subiect care a obţinut nota 23,08.

Valori Frecv. Procent Procent valid


2,78 1 2,9 3,4
3,92 1 2,9 3,4
5,41 2 5,9 6,9
9,38 1 2,9 3,4
10,00 1 2,9 3,4
10,81 1 2,9 3,4
10,87 1 2,9 3,4
12,12 1 2,9 3,4
13,51 1 2,9 3,4
14,71 1 2,9 3,4
15,56 1 2,9 3,4
16,67 1 2,9 3,4
17,65 1 2,9 3,4
17,95 1 2,9 3,4
19,15 1 2,9 3,4
20,45 1 2,9 3,4
20,59 1 2,9 3,4
21,05 2 5,9 6,9
21,57 1 2,9 3,4
22,86 1 2,9 3,4
23,08 1 2,9 3,4
23,26 1 2,9 3,4
23,53 1 2,9 3,4
24,44 1 2,9 3,4
25,53 1 2,9 3,4
28,57 1 2,9 3,4
30,23 1 2,9 3,4
, 5 14,7 Missing
------- ------- -------
Total 34 100,0

TEMĂ DE CONTROL OBLIGATORIE (2 ore)


Un grup de subiecţi care au fost examinaţi folosindu-se un test care măsoară nivelul de
umor, a obţinut următoarele rezultate, M=7,5, SD=3,25. Transformaţi în note Z scorurile brute
2,25, 15,5 şi evaluaţi subiecţii care au abţinut aceste scoruri.

150
TEMĂ DE CONTROL OBLIGATORIE (4 ore)
Un grup de subiecţi a obţinut următoarele rezultate:
Autocontrol: M1=19,8, SD1=3,8;
Nivel motivaţional: M2=5,9, SD2=3,3;
Sociabilitate: M3=14,8, SD3=2,5;
Rezistenţă la oboseală: M4=13,4, SD4=4,3;

Rezultatele obţinute de doi subiecţi la aceste probe sunt:


Autocontrol: S1=26, S2=18;
Nivel motivaţional: : S1=24, S2=25;
Sociabilitate: S1=10, S2=3;
Rezistenţă la oboseală: : S1=7, S2=25;

Cerinţe:
1. La care dintre probe a obţinut subiectul 1 cele mai bune rezultate?
2. La care dintre probe a obţinut subiectul 2 cele mai slabe rezultate?
3. Realizaţi ierarhia subiecţilor în funcţie de notele obţinute de subiecţi la cele 4 probe.

TEMĂ DE CONTROL OBLIGATORIE (2 ore)


Demonstraţi cu ajutorul unui exemplu care este modalitatea de comparare a valorilor
diferitelor categorii sau a rezultatelor între aceleaşi categorii obţinute în două cercetări diferite
într-o scală nominală.

TEMĂ DE CONTROL OBLIGATORIE (2 ore)


În urma aplicării unui test s-a obţinut un coeficient de fidelitate rxx] = 0,63. Abaterea standard
a scorurilor observate este Sx=2,9. Calculaţi între ce limite se poate situa un scor adevărat al
subiecţilor care au acelaşi rezultat observat de 7, cu o probabilitate de 68%.

TEMĂ DE CONTROL OBLIGATORIE (2 ore)


Între variabilele atracţia pentru a anumită profesie şi realizare în plan social s-a obţinut
un coeficient de corelaţie de rxy=0,52. Interpretaţi coeficientul de validitate obţinut.

TEMĂ DE CONTROL OBLIGATORIE (4 ore)


Unui grup de subiecţi li s-au aplicat 3 scale: deducţie, evaluare argumente şi evaluare ipoteze.
După realizarea inventarului statistic de bază sumar, s-au obţinut următoarele rezultate:

Deducţie: M1=8,6, SD=1,9


Evaluare argumente: M2=8,7, SD2=2,2
Evaluare ipoteze: M3=9,3, SD=2,1

151
Doi subiecţi au obţinut următoarele rezultate:

Deducţie: x1=2, x2=11


Evaluare argumente: x1=12, x2=7
Evaluare ipoteze: x1=9, SD=8

1.Transformaţi în note T, stanine şi note sten rezultatele obţinute de cei doi subiecţi
2.La care dintre scale a obţinut primul subiect cele mai slabe rezultate?
3.La care dintre scale a obţinut primul subiect cele mai bune rezultate?
4.Ierarhizaţi subiecţii în funcţie de rezultatele obţinute la cele trei scale.

TEME ŞI ÎNTREBĂRI RECAPITULATIVE (nu sunt obligatorii)


1. Descrieți relația dintre validitate și fidelitate pronind de la relația dintre coeficinți.
2. Care este distincția dintre criteriu și măsura criteriu?
3. Care sunt caracteristicile unei bune măsuri criteriu?
4. Descrieți cele trei forme de bază ale interpretării coeficientului de validitate.
5. Care sunt sursele principale de eroare în măsurare?
6. Care este sensul fundamental al termenului „test”?
7. Care este rolul analizei factoriale în determinarea validității de construct?

RĂSPUNSURI CORECTE Unitatea de învățare 1


1 fals 4 fals 7 fals 10 Fals
2 adevărat 5 adevărat 8 adevărat 11 Adevărat
3 adevărat 6 adevărat 9 fals 12 Fals
RĂSPUNSURI CORECTE Unitatea de învățare 2
1 adevărat 5 fals 9 fals 13 Fals
2 adevărat 6 adevărat 10 adevărat 14 Fals
3 adevărat 7 fals 11 fals 15 Fals
4 fals 8 fals 12 fals 16 Fals
RĂSPUNSURI CORECTE Unitatea de învățare 3
1 adevărat 5 adevărat 9 adevărat 13 Adevărat
2 fals 6 fals 10 fals 14 Adevărat
3 adevărat 7 adevărat 11 adevărat 15 Fals
4 fals 8 fals 12 fals 16 Adevărat
RĂSPUNSURI CORECTE Unitatea de învățare 4
1 adevărat 5 adevărat 9 adevărat 13 Fals
2 adevărat 6 fals 10 fals 14 Adevărat
3 fals 7 adevărat 11 adevărat 15 Adevărat
4 Adevărat 8 adevărat 12 fals 16 Adevărat
RĂSPUNSURI CORECTE Unitatea de învățare 5
1 adevărat 5 adevărat 9 adevărat 13 Fals
2 fals 6 fals 10 fals 14 Fals
3 adevărat 7 adevărat 11 adevărat 15 Adevărat
4 fals 8 fals 12 adevărat 16 Adevărat

152
RĂSPUNSURI CORECTE Unitatea de învățare 6
1 adevărat 5 adevărat 9 adevărat 13 Adevărat
2 fals 6 adevărat 10 fals 14 Fals
3 adevărat 7 adevărat 11 adevărat 15 Fals
4 adevărat 8 fals 12 fals 16 Adevărat
RĂSPUNSURI CORECTE Unitatea de învățare 7
1 Adevărat 4 Fals 7 Adevărat 10 fals
2 Adevărat 5 Adevărat 8 Fals
3 Adevărat 6 Fals 9 Adevărat
RĂSPUNSURI CORECTE Unitatea de învățare 8
1 Adevărat 3 Fals 5 Adevărat 7 Adevărat
2 Adevărat 4 Fals 6 Fals
RĂSPUNSURI CORECTE Unitatea de învățare 9
1 Adevărat 5 Fals 9 Adevărat 10 Fals
1 Adevărat 4 Fals 7 Adevărat 11 Adevărat
2 Adevărat 5 Fals 8 Adevărat
RĂSPUNSURI CORECTE Unitatea de învățare 10
1 Adevărat 3 Fals 5 Fals 7 Adevărat
2 Adevărat 4 Fals 6 Adevărat
RĂSPUNSURI CORECTE Unitatea de învățare 11
1 Adevărat 2 Fals 3 Fals 4 Adevărat
5 Adevărat

153

S-ar putea să vă placă și