Sunteți pe pagina 1din 88

UNIVERSITATEA TRANSILVANIA DIN BRAŞOV

FACULTATEA DE PSIHOLOGIE ŞI ŞTIINŢELE EDUCAŢIEI

METODE DE
CERCETARE CANTITATIVĂ

AUREL ION CLINCIU


BRAŞOV 2014

1
CAPITOLUL 1

DEMERS ŞTIINŢIFIC ÎN PSIHOLOGIE ŞI PEDAGOGIE


Moto
„Întreaga ştiinţă nu este altceva decât o
rafinare a gândirii de zi cu zi”
Einstein – Fizică şi realitate

1.1. Discurs profan, discurs savant, discurs ştiinţific


Oamenii nu au aşteptat constituirea psihologiei ca ştiinţă (ceea ce s-a produs foarte
târziu) pentru a dezvolta cunoştinţe utile privind semenii, care au fost transmise pe cale orală
sau scrisă. Şi într-un caz şi în celălalt, depozitarul imensului patrimoniu de experienţă care
derivă din aşa-numita “psihologie naivă” sau a simţului comun, o constituie limba. De
altminteri ipoteza lexicală a fost în repetate rânduri invocată în studiul ştiinţific al
personalităţii, plecând de la Klages, la Thurstone, la Cattell şi până la creatorii celui mai
elaborat model al personalităţii, Big five (Minulescu, 1994, p. 90). Acest tip de discurs, numit
de Richelle (1995) discurs profan, exprimă în limbaj natural cunoaşterea lumii
înconjurătoare, a celei umane, sau chiar a celei interioare: „lexicul unei limbi trimite la o
anumită modalitate de a decupa realitatea, de a delimita obiecte, modalitate care trimite la
rândul ei la caracteristicile culturii”.
Chiar structura limbii, prin morfologie şi sintaxă, indică activităţi de punere în relaţie,
exprimând raporturi de cauzalitate, de temporalitate, de consecinţă, comune şi discursului
ştiinţific. Discursul ce emerge din bunul simţ (simţul comun) respectă două tipuri de
constrângeri:
 să se raporteze corect la realitate;
 să comunice clar, fără echivoc relaţiile descoperite, care se vor verifica în acţiunea
practică, curentă.
Astfel de observaţii, reţinute în zicători, proverbe, legende, mituri sau poveşti ne spun
că „leneşul mai mult aleargă şi scumpul mai mult păgubeşte”, că „cine se-aseamănă, se-
adună”, sau că „vulpea care nu ajunge la struguri spune că sunt acri” şi sunt dezvoltate printr-
un mecanism inductiv, la un capăt fiind observaţia cazuală (ocazională), la celălalt formularea
aforistică sau zicătoarea, un fel de lege a acestui discurs profan. De multe ori, deoarece aceste
observaţii cazuale nu sunt sistematice, precise şi se bazează pe un număr insuficient de

2
observaţii, care nu sunt atent verificate, ele pot duce la concluzii greşite. Astfel, geniile nu ar
avea aptitudini sociale şi pentru sport şi s-ar trece mai repede („ce se coace repede, se trece
repede”), oamenii „însemnaţi” (cu stigmate) ar trebui evitaţi, iar persoanele cu buze subţiri ar
fi rele la suflet etc.
Metoda ştiinţifică afirmă că evenimentele se desfăşoară după principii precise şi
utilizează observaţii obiective şi sistematice pentru a determina care sunt acele principii. Aşa
cum afirmă Richelle, ştiinţa nu este decât un discurs, o altă modalitate de a folosi limba, care
rafinează şi specializează atât de mult limbajul curent, încât, prin conceptele lor, ea ajunge la
descrieri şi explicaţii foarte depărtate, sau chiar în opoziţie cu simţul comun.
Prezentăm mai jos caracteristicile de bază ale metodei ştiinţifice, aşa cum sunt ele
indicate de Smith (1998, p. 32):
 Ştiinţa este sistematică, formală şi obiectivă, de aceea ea pleacă foarte rar de la
observaţii cazuale. Ea urmăreşte un set de reguli prin care menţine un mare grad de
formalitate ştiinţifică şi cere ca omul de ştiinţă să fie cât de obiectiv este posibil, atât în
proiectarea cercetării, cât şi în interpretarea rezultatelor acesteia.
 Ştiinţa aspiră la simplicitate şi ordine, deoarece ea pleacă de la ordinea implicită
existentă în univers: aşa cum fizicienii ştiu că mişcarea planetelor sau a electronilor pe
orbite are regularitate, ştiinţele comportamentului aşteaptă să regăsească ordinea care
îl guvernează.
 Ştiinţa este precisă pentru că ea măsoară şi cuantifică cu atenţie observaţiile. Aceasta
presupune efort şi timp cheltuite, dar plusul de precizie face una din diferenţele majore
faţă de discursul profan.
 Cunoaşterea ştiinţifică este reproductibilă: urmând aceleaşi procedee sau metode,
cercetători diferiţi trebuie să ajungă la aceleaşi rezultate. Replicarea (repetiţia unei
cercetări) este o modalitate de a-i verifica rezultatele, ceea ce îi dă o mare acurateţe şi
sens.
 Ştiinţa procură o cunoaştere cumulativă: publicându-şi rezultatele în cărţi şi jurnale, ea
dă ocazia apariţiei a noi ipoteze şi idei, ce se construiesc pe o fundaţie preexistentă.
 Pentru Karl Popper, filozof al ştiinţei, această sporire a cunoştinţelor în cadrul speciei
umane se face după modelul evoluţiei darwiniste a speciilor: vor supravieţui acele
ipoteze şi teorii care sunt selectate pentru că rezistă mai bine la tendinţele de
respingere. Dincolo de universul fizic (Lumea 1) există universul experienţei
subiective (Lumea 2) şi universul creaţiei umane (Lumea 3). Pentru Popper

3
falsificabilitatea (falsiability) este chiar linia de demarcaţie între discursul ştiinţific şi
cel profan, o ipoteză fiind ştiinţifică atunci când poate fi verificată prin observare sau
experimentată în laborator.
 Să mai adăugăm o trăsătură a discursului ştiinţific: el se sprijină pe fapte şi se supune
unei permanente puneri în problemă prin intermediul lor.

Între discursul profan şi cel ştiinţific există, după Richelle o zonă intermediară, cea a
discursului savant, care se bazează tot pe limbaje specializate (juridic, al esteticii, filozofic).
Diferenţa dintre discursul savant şi discursul ştiinţific este aceea că ultimul încearcă
întotdeauna să-şi autoverifice validitatea prin confruntarea empirică cu realitatea. Există însă
două tipuri de discurs ştiinţific, logica şi matematica, care fac excepţie de la regula anterioară.
Plecând de la axiome, matematica derivă propoziţii tot mai complexe, respectând cu rigoare
regulile raţionamentului şi exigenţele demonstraţiei. Validarea ei, ca şi în cazul logicii, nu este
una empirică, ci una internă. De ce se potrivesc aşa de bine „hainele” logico-matematice peste
universul fizic şi ce statut au obiectele ideale create de ele (există sau nu cu adevărat entităţile
ideale?), sunt probleme care ţin de filozofia ştiinţei.
Cercetarea ştiinţifică poate fi fundamentală (de bază), adică atacă o problemă de
ordin foarte general (sau care nu are consecinţe, finalităţi practice immediate), şi aplicată,
desemnată din start să soluţioneze probleme practice, cum ar fi, pentru psihologi, problema
suicidului, a obezităţii, a drogurilor, a fumatului sau a alcoolismului. Chiar dacă beneficiile
cercetării fundamentale nu sunt imediat vizibile, pe termen lung ea duce cel mai adesea la
importante aplicaţii practice. Cercetări ale modului cum gândesc oamenii au fost foarte utile
pentru inteligenţa artificială (sistemul expert sau reţelele neuronale). În plus, încercând să
determine cauzalitatea, scopurile majore ale psihologiei ştiinţifice sunt să descrie, să prezică
şi să controleze comportamentul, aplicând ceea ce s-a învăţat teoretic la situaţii reale de viaţă
(aceasta dintr-o perspectivă mai degrabă behavioristă).
Descrierea trebuie să includă nu numai comportamente obiectiv observabile, adică ce
auzim şi ce vedem, făcând presupuneri asupra mecanismelor interne sau asupra proceselor
subiacente numai în măsura în care le putem articula într-un discurs teoretic elaborat.
Predicţia: dacă descrierea are în vedere comportamentul deja produs, predicţia are în
vedere comportamentul înainte de a apărea, ea statuând o anumită expectanţă faţă de acesta.
Predicţii facem şi în viaţa cotidiană, însă în ştiinţă aceasta îmbracă forma unei ipoteze, care
este o propoziţie specifică şi clară ce poate fi testată dacă este adevărată sau falsă.

4
Controlul unui comportament este posibil când ştim ce determină acel comportament
şi se leagă strâns de capacitatea înţelegerii lui. Întărirea comportamentului la B.F. Skinner este
un exemplu în acest sens.
Aplicaţia are scopul de a utiliza cunoaşterea şi tehnicile derivate în rezolvarea unor
scopuri practice: programele pe computer pentru învăţarea matematicii, testele de aptitudini şi
de inteligenţă arată beneficiile concrete ale cunoaşterii psihologice în viaţa obişnuită.
Înţelegerea înseamnă că am dobândit cunoaşterea reală a cauzelor unui
comportament. Deşi în psihologie înţelegerea cauzelor ca în fizică sau medicină este rară,
munca ştiinţifică aduce totuşi mereu un plus de înţelegere asupra faptelor studiate. Înţelegerea
face posibilă explicaţia faptelor care circumscriu domeniul unei ştiinţe, triada descriere –
explicaţie - predicţie, reţinând, după Valeriu Ceauşu, cele mai însemnate caracteristici ale
metodei ştiinţifice.

1.2. Rolul teoriei şi al cercetării


O teorie este un set organizat de concepte şi de propoziţii desemnate să ajute omul de
ştiinţă să înţeleagă, să explice şi să prezică femomenele. Teoria lui Darwin asupra evoluţiei
ne-a adus o mai bună înţelegere a raporturilor dintre specii, iar teoriile freudiene ne arată
modul în care inconştientul influenţează comportamentul. Odată ce avem o teorie, putem
deriva din ea ipoteze care devin obiectul testării prin cercetarea ştiinţifică: teoria atracţiei
interumane poate produce ipoteza că similaritatea atitudinilor şi a preferinţelor creşte
posibilitatea atracţiei dintre oameni.
Totuşi, teoriile nu sunt egale unele cu altele: unele sunt mai elaborate, mai consistente
sau mai bune decât altele. O teorie bună se caracterizează prin:
 încorporează într-un cadru logic şi consistent toate, sau foarte multe din faptele şi
observaţiilor existente (are mare putere de cuprindere);
 produce noi ipoteze prin care se prezic noi observaţii (putere derivativă);
 este economicoasă, adică acoperă cel mai bine fenomenele de care se ocupă, având cea
mai simplă formă posibilă;
 este testabilă şi falsifiabilă, adică ipotezele ei pot fi testate (şi în laborator) şi pot fi
dovedite, potenţial, că sunt false. Atunci când o teorie este extrem de generală, încât
pare să se potrivească tuturor faptelor şi deci nu poate fi falsificată, este un semn că ea
nu este o teorie bună.

5
Cercetarea este un proces de investigare şi de căutare pe care ştiinţa îl utilizează cu
grijă, pentru a ajunge la o mai bună înţelegere a fenomenului. Observaţiile care conduc la
cercetare au o mare varietate de forme ce depind de scopul cercetării. Un studiu ştiinţific, de
exemplu, colectează informaţii de la un set de subiecţi, făcând o analiză atentă a informaţiilor,
pentru a ajunge la un set de concluzii întemeiate. De multe ori cercetătorii îşi reiau studiile
pentru a verifica dacă, în final, ajung la aceleaşi concluzii. Odată dezvoltată o teorie bună,
care se referă la fenomene importante, aceasta conduce la o considerabilă cantitate de muncă
de cercetare. Fiecare domeniu are asemenea teorii puternice: Skinner în învăţare, Freud în
psihologia clinică, Piaget în psihologia dezvoltării, toate punând în mişcare multe cercetări
evaluative.Rezultatele acestor cercetări relative la o anumită teorie, duc la modificări ale
acesteia, modificări care generează alte şi alte cercetări. Se creează astfel un mecanism
circular prin care cunoaşterea ştiinţifică se îmbogăţeşte ca volum şi acurateţe. Chiar şi teoriile
nepotrivite pot fi valoroase dacă conduc la cercetări atente, căci prin acestea se elimină parte
din explicaţiile posibile, stimulând noi cercetări şi, în consecinţă, teorii mai bune. Astfel,
teoria frenologică a “boselor”, ce permitea localizarea “facultăţilor mintale”, a dus la apariţia
teoriei localizării funcţiilor cerebrale, cu o primă mare confirmare prin descoperirea de către
Broca a centrului vorbirii, pentru ca aceasta să genereze teoria localizării largi sau teoriile
echipotenţiale privind cortexul cerebral, care au lărgit considerabil înţelegerea mecanismelor
de funcţionare a creierului. În acelaşi fel, teoria bioritmurilor, ce sugerează regularităţi
rezultate din ritmurile biologice (fizic, emoţional şi intelectual) s-a dovedit a fi greşită, căci ea
nu se punea în relaţie nici cu performanţele ridicare, nici cu eşecurile în anumite activităţi,
ceea ce nu a împiedicat totuşi industria electronică să vândă o mare cantitate de programe şi
soft legate de bioritmuri. Generare de
ipoteze

Construcţia Testarea ei în
teoriei şi laborator
modificarea ei

Figura 1. Interrelaţia dintre teorie şi cercetare

6
1.3. Metode descriptive şi corelaţionale
Demersurile care sunt descriptive sau corelaţionale pot fi considerate amândouă ca
nonexperimentale (o metodă este nonexperimentală când comportamentul este observat şi
măsurat fără a fi controlat sau manipulat). Asemenea metode sunt adesea folosite pentru a
îndeplini scopurile descripţiei şi predicţiei, căci ne permit să examinăm cu atenţie şi să
descriem cu precizie o multitudine de comportamente. De aceea ele ne procură o bază pentru
a face predicţii cu privire la relaţiile cauză-efect. Cele mai obişnuit folosite ca metode
nonexperimentale sunt studiile de caz, studiul şi observaţia naturalistă.

Studiul de caz este o analiză în profunzime a comportamentului unei singure


persoane, ale cărei gânduri, emoţii, atitudini, interese, sunt investigate cu grijă, detaliat. Este o
metodă ce probează adâncimea efortului individual în încercarea de a înţelege mai bine
comportamentul, conduita şi originile sale. Studiul de caz este foarte util pentru că dă
psihologului clarificări despre un caz individual, care poate servi ca bază pentru
comportament la modul general. Pornind de la un singur caz, micul Hans, Freud a formulat
ipotezele sale despre dezordinea psihică numită fobie, în timp ce Jean Piaget a construit teoria
sa despre geneza structurilor inteligenţei pronind de la studiul propriilor săi copii. Dar,
deoarece se pleacă doar de la o persoană, această bază nu este niciodată suficient de fermă,
concluziile trebuind verificate atent pe multe alte cazuri, prin cercetări ulterioare.

Studiul (survey) este un procedeu de a evalua sau prezice vederile, reacţiile ori
părerile unui număr mare de oameni în legătură cu o problemă limitată. Cercetătorul creează o
listă de întrebări şi o prezintă într-o formă standardizată fiecărui participant, în mod tipic
folosind atât ancheta, cât şi chestionarul. Investigând un număr mare de persoane dintr-o
populaţie foarte largă, scopul este de a generaliza prin extrapolarea rezultatelor la întreaga
populaţie. Expectaţiile de vot din anchetele sociologice, părerea despre abandonarea pedepsei
cu moartea sau legalizarea avorturilor sunt câteva exemple de utilizare a metodei. Această
metodă, atunci când este elaborată şi condusă cu grijă, ne poate oferi o importantă cantitate de
informaţii despre vederile, atitudinile, opiniile, preferinţele unui număr mare de oameni, ceea
ce îi ajută pe psihologi să construiască ipoteze, pe politicieni să-şi dezvolte campaniile
electorale şi pe comercianţi să-şi lanseze anumite produse. Dar dacă eşantionul ales nu este
reprezentativ, sau dacă cei chestionaţi dau mai degrabă răspunsurile aşteptate decât cele reale,
riscul de eroare devine foarte mare. O altă limitare a metodei provine din faptul că ea este
indicativă pentru opinia publică într-un anumit moment, după care anumite evenimente o pot

7
modifica radical. Un sondaj telefonic de opinie ca cel făcut în 1936 în America (după 1990 şi
în România), a indicat succesul unui candidat la preşedenţie, care nu a fost cel real (F.D.
Roosevelt) din simplul motiv că cei care aveau telefon tindeau să fie mai curând republicani
decât democraţi.

Observaţia naturalistă este cea în care psihologul observă comportamentele care


apar, fără a le modifica sau intefera cu ele. Asemenea observaţii se pot face şi în laborator, dar
şi în cadrul natural, putând avea o mare extensie în studierea animalelor sau a copiilor.
Avantajul este aprecierea comportamentului în cadrul lui natural, dezavantajul fiind
dificultatea de a fi total obiectiv sau neimplicat. Studiind adolescenţii din insula Samoa din
Mările Sudului, Margaret Mead, una din creatoarele psihologiei transculturale, arăta în cartea
sa, apărută în 1928, “Caming of age in Samoa” că adolescenţii acestei insule nu aveau
competitivitatea şi violenţa cu care această vârstă se asociază în cultura americană. Un alt
cercetător (Freeman, 1983) a adus o altă lumină asupra problemei, arătând că rata suicidului,
comportamentul violent şi competitiv au un nivel ridicat şi în aceste insule.

Designul corelaţional este necesar când vrem să depăşim simpla descripţie şi să


determinăm relaţia dintre două variabile care ne interesează. Variabilă este orice însuşire ce
poate lua mai multe valori diferite, cum ar fi de pildă satisfacţia maritală, ce poate fi evaluată
pe o scală cu 5, 7 sau 9 trepte şi pusă în legătură cu similaritatea de vârstă a membrilor
cuplului sau cu începutul, mijlocul sau perioada târzie a căsniciei. Printr-un astfel de procedeu
corelaţional aflăm câte ceva despre relaţie, dar nimic despre cauza care a produs-o, pentru că
nu am făcut nimic pentru a controla sau manipula vreo variabilă. Şi totuşi, metoda ne indică
unde să căutăm o relaţie între elemente, pentru a construi acolo un studiu experimental, în
care să evidenţiem modificările variabilelor dependente în funcţie de cele independente. De
exemplu, ştim că există o relaţie între fumat, cancerul de plămâni şi bolile coronariene, ceea
ce ne permite ca, în condiţii de laborator, să dezvoltăm un studiu de tip cauză-efect, expunând
sistematic animale la fumul de ţigară şi descoperind astfel o relaţie cauzală.

1.4. Metoda experimentală


Coloana vertebrală a cercetării psihologice este experimentul, o cercetare care implică
manipularea uneia sau mai multor variabile, ceea ce conduce la descoperirea de relaţii tip
cauză-efect. In experiment, cercetătorul variază sistematic condiţiile pentru a înregistra
efectele lor asupra comportamentului. Condiţiile care se pot schimba în experiment se numesc

8
variabile şi ele pot fi elemente prin care diferă subiecţii (sex, vârstă, nivel cultural, etnie,
etc.), iar măsurile ce vor fi culese sunt diferite valori cum ar fi presiunea arterială, pulsul, etc.
Variabilele pe care la poate lua în consideraţie, schimba sau manipula cercetătorul se
cheamă variabile independente, iar cele măsurate pentru a vedea cum se schimbă prin
manipularea experimentală, se cheamă variabile dependente (se numesc aşa pentru că depind
de nivelul schimbării variabilelor independente). Un al treilea tip de variabile sunt cele
explicative, cum ar fi anxietatea, depresia, gândirea, motivaţia, ca elemente interne de legătură
între celelalte două tipuri. Metoda experimentală, ce va fi detaliată ulterior, include un grup
experimental (pe care se desfăşoară întreaga procedură) şi un grup de control, sau grup
martor. Ambele grupuri sunt măsurate iniţial şi după experiment, pentru a face comparaţii
statistice.Experimentul ridică şi probleme de eşantionare (eşantion reprezentativ sau aleator,
simplu sau stratificat) care constituie capitole importante ale cercetării şi statisticii, probleme
pe care le vom detalia la vremea potrivită.
Cvasi-experimentul este acela în care psihologul studiază variabile independente pe
care el nu le poate controla sau manipula. Asemenea variabile independente se numesc
variabile naturale, căci se bazează pe condiţii preexistente: putem studia diferenţele masculin-
feminin, dar nu noi manipulăm apartenenţa la gen. Putem studia efectul experienţei şi
antrenamentul asupra nivelului de anxietate la un grup de paraşutişti,dar opţiunea lor pentru
acest sport le aparţine în întregime. Deşi nu putem găsi în acest tip de studii o puternică relaţie
cauză-efect (ca atunci când avem variabile independete), putem totuşi avea un nivel de
încredere ridicat în rezultatele noastre şi în cazul cvasiexperimentului.

CONCLUZII ŞTIINŢIFICE

RELAŢII CAUZĂ-EFECT
Manipulăm sistematic variabilele independente
şi măsurăm efectul asupra variabilelor dependente

CORELAŢIE
Observăm gradul de relaţie
dintre variabile

DESCRIERE
Descriem mai ales
ceea ce vedem

Figura 2. Nivelurile înţelegerii ştiiţifice (după Smith, 1998, p. 37)

9
1.5. Conducerea unei cercetări ştiinţifice
Ştiinţa începe de obicei cu descrierea, după care încearcă să stabilească nivelul relaţiei
dintre variabile (corelaţia), pentru ca în final să conducă adevărate experimente, pentru a
ajunge la o înţelegere de tip cauză-efect, ideal ultim al ştiinţei (vezi figura 2).Fiecare studiu
ştiinţific implică un număr de etape sau paşi, începând cu o cunoaştere iniţială a problemei aşa
cum se află ea în câmpul ştiinţific şi terminând cu publicarea unui articol într-o revistă de
specialitate (vezi diagrama de la figura 3).

A avea o cunoaştere Dezvolţi o idee Treci în revistă toate


prealabila asupra ariei iniţială studiile relevante
ce va fi studiată despre problemă

Faci designul Desprinzi ipoteze din Dobândeşti


studiului teorie cunoaşterea detaliată
asupra teoriei ce va fi
testată

Determini populaţia Expui fiecare Desfăşori studiul


şi alegi un eşantion participant la actual
reprezentativ condiţiile
experimentale

Scrii articolul de Desprinzi concluziile Faci analiza statistică


jurnal descriind la care ai ajuns a datelor obţinute
studiul şi rezultatele

Figura 3. Conducerea unei cercetări ştiinţifice (după Smith, 1998, p. 37)

1.6. Diversitatea umană şi problemele cercetării


Variabilitatea umană este un fapt atestat de foarte multă vreme, ea fiind prezentă ca
tamă de meditaţie filozofică în “Republica” lui Platon. Omul de ştiinţă contemporan,
psihologii cu precădere, nu s-au mulţumit să constate aceste diferenţe interindividuale, ci şi-au
propus să şi le explice, apelând la o prealabolă exprimare a lor în termeni cantitativi.
Problema determinării diferenţelor individuale l-a preocupat foarte mult pe Galton, precursor
al metodei psihometrice, dar şi pe Binet, creatorul psihometriei, cu a sa „Scară metrică a

10
inteligenţei”, apoi pe Spearman, Thurstone, Vernon, Burt, Guilford, Cattell şi alţii. Fiecărui
individ (uman sau animal) îi este specific un grup de însuşiri caracteristice, combinate într-o
“ecuaţie personală”, variabilitatea fiind specifică naturii vii şi nevii. Variabilitatea se extinde
de la om la grupurile şi macrogrupurile sociale (familial, cultural, etnic, religios). Expresia
statistica a variabilităţii este variaţa sau dispersia, care arată împrăştierea valorilor observate
în jurul unor valori centrale. Având o mulţime de elemente diferenţiatoare, generate fie de
ereditate, fie de mediu sau de educaţie, fiinţa umană devine abordabilă cu instrumentele
matematice, pentru că variabilitatea face posibilă cuantificarea, măsurarea.
Dacă în prima jumătate a secolului diversitatea a fost rareori luată în considerare, ea a
crescut progresiv ca importanţă, psihologii încercând să studieze diversitatea în sine:
diferenţele de vârstă, de sex, de cultură, de nivel socio-economic, de apartenenţă la o etnie,
religie, rasă se combină într-o manieră infinită, cercetarea ştiinţifică trebuind să ţină seama de
aceste diferenţe, creând pe cât se poate loturi omogene în toate privinţele, mai puţin cea
investigată. Astfel, bărbaţii se pare că sunt mai predispuşi la violenţă, la alcoolism, în timp ce
femeile tind mai frecvent spre depresii. Diferenţele de gen sunt şi în aptitudinea pentru
matematică (mai tipic masculină) faţă de aptitudinile verbale (mai tipic feminine), dar nu se
poate stabili cu exactitate dacă aceste diferenţe au o fundamentare biologică sau una socială.
Etnicitatea marchează arii ca religia, interesele şi valorile unei persoane, o cultură
influenţează mai strâns contextul social în care o persoană creşte (etica muncii, valori
religioase, atitudini faţă de sănătate, învăţătură sau artă). Părinţii asiatici, de exemplu, dau
o mai mare importanţă educaţiei şcolare decât negrii sau hispanicii americani. Diferenţe
sistematice între grupuri rasiale, etnice şi culturale apar în ce priveşte agresivitatea,
standardele morale, atitudinea copiilor faţă de familie sau faţă de bătrâni, nivelul educaţional,
venitul, pattern-urile de limbaj, ceea ce face ca generalizările reieşite din studii să fie adesea
riscante.
Vârsta este unul din cei mai diferenţiatori factori, majoritatea testelor de inteligenţă
dând standarde separate pe ani, junătăţi de an (bateria WISC chiar din 4 în 4 luni), în timp ce
la vârstele mai înaintate discriminarea vizuală, auditivă, viteza de reacţie şi empanul memoriei
de scurtă durată descresc.
Nivelul socioeconomic are un impact substanţial, căci afectează o gamă largă de
variabile. Veniturile mai mari sunt asociate cu o nutriţie mai bogată, oportunităţi educaţionale
mai mari, nivel mai mare al inteligenţei, o mai mare motivaţie de a munci, de a se autorealiza.
Cercetările care studiază diferenţele dintre grupuri, culturi, etnii, dau o bază de informaţie
mult mai solidă, ajutându-ne să prezicem mai bine comportamentele. Şi poate că aceasta va

11
contribui în noul mileniu la mai buna înţelegere dintre grupuri, la reducerea discriminării, la
optimizarea potenţialului fiecărei persoane, indiferent de grupul de apartenenţă. Pentru
psihologie, această diversitate care rezultă din enorma variabilitate umană a fost unul dintre
motivele cristalizării ei mai lente ca ştiinţă, dar şi a apariţiei de ramuri specifice cum ar fi
psihologia diferenţială, psihologia copilului şi a vârstelor, psihologia dezvoltării sau
psihologia transculturală.

Autoevaluare
1. Analizaţi contribuţia psihologiei simţului comun la dezvoltarea psihologiei ştiinţifice.
2. Analizaţi similitudinile şi diferenţele dintre limbajul profan şi cel savant sau ştiinţific.
3 Definiţi caracteristicile cunoaşterii ştiinţifice şi modul cum răspunde psihologia acestor
deziderate.
4 Evaluaţi scopurile cercetării şiinţifice în psihologie şi pedagogie.
5 Cercetarea şi teoria şiinţifică au un raport de circularitate. Analizaţi evoluţia stadiilor
acestor raporturi.
6 Evaluaţi rolul metodelor descriptive şi corelaţionale în psihologie, exemplificând cu
indicarea avantajelor şi dezavantajelor fiecărei metode.
7 Indicaţi rolul, importanţa şi specificul metodei experimentale în psihologie.
8 Detaliaţi într-un mic eseu etapele unei cercetări ştiinţifice în psihopedagogie, de la
cunoaşterea prealabilă la articolul ştiinţific final, urmărind diagrama din curs.

Bibliografie
1. Doron, R., Parot, F., Dicţionar de psihologie, Ed. Humanitas, Bucureşti, 1999.
2. Dworetzky, J.P., Davis, N.J., Human Development. A Lifespan Approach, West Publishing
Company, St. Paul, New York, Los Angeles, San Francisco, 1989.
3. Richelle, M., Parot, F., Introducere în psihologie. Istoric şi metode, Ed. Humanitas,
Bucureşti, 1995.
4. Pitariu, H.D., Managementul resurselor umane. Măsurarea performanţelor profesionale,
Ed. All, Bucureşti, 1994.
5. Radu, I., Metodologie psihologică şi analiza datelor, Ed. Sincron, Cluj, 1993.
6. Smith, B.D., Psyhology. Science and Undestanding, International Edition, Mc Graw Hill,
1998.

12
CAPITOLUL 2

IPOTEZELE DE CERCETARE
VALIDITATEA UNEI CERCETĂRI EXPERIMENTALE

2.1. Ipotezele de cercetare


Chiar dacă Richelle (1999)1 regreta „faptul că noţiunea de ipoteză a căzut oarecum în
dizgraţie, în favoarea cuvintelor teorie sau model, care nu au aceeaşi conotaţie de prudenţă şi
scepticism”, noi împărtăşim mai degrabă opinia lui Fraisse, potrivit căruia elaborarea ipotezei
este cea mai importantă şi mai creativă fază dintr-un experiment sau cercetare. Aceasta
datorită rolului ei de „cheie de boltă”, de „inimă” sau de nucleu al întregii cercetări, elementul
care leagă teoria de practică şi pe amândouă de metodologia statistică a demersului explicativ,
împingând efectiv cunoaşterea ştiinţifică înainte.

2.1.1. Definire: ce este o ipoteză?


 După Reber, ea este „orice afirmaţie, propoziţie sau presupunere care serveşte drept
tentativă în explicarea anumitor fapte.”2 Prin extensie, o ipoteză este şi o strategie adoptată
cu scopul de a rezolva o anumită problemă (perspectivă cognitivistă).
 Este o atitudine individuală care determină sensul unei alegeri (Piéron3).
 Ipoteza este „o propoziţie supusă verificării prin proba faptelor” (Richelle), o etapă iniţială
a demersului ştiinţific care declanşează proceduri specifice de căutare (observaţie sau
experiment). Fiind formulată la începutul cercetării, ipoteza se deosebeşte de teorie prin
caracterul provizoriu al explicaţiilor date, în măsura în care teoria reuneşte sintetic doar
datele confirmate.

1
M. Richelle, în Doron, R., Parot, F. (1999). Dicţionar de psihologie. Bucureşti: Editura Humanitas, p. 426 şi
urm.
2
Reber, A.S. (1985). The Penguin Dictionary of Psychology. London: Penguin Books, p. 336.
3
Piéron, H. (2001). Vocabularul Psihologiei. Bucureşti: Univers Enciclopedic, p. 182.

13
2.1.2. Geneză: cum se naşte o ipoteză de cercetare?
Houser4 identifică trei surse ale ipotezelor: experienţa personală, cercetările anterioare
şi teoria ştiinţifică. În prima accepţiune Piaget a dezvoltat un punct de vedere revendicat şi
dezvoltat ulterior de psihologia cognitivă: orice rezolvare de probleme pleacă de la tatonări
anticipative ale soluţiilor prin emiterea de ipoteze de rezolvare, în ceea ce se va numi „spaţiul
problemei” sau „câmpul problemei”. Pe de altă parte, personologul Kelly (1995) sugera că
fiecare persoană este un om de ştiinţă, în măsura în care fiecare ne angajăm cu regularitate în
a formula şi testa ipoteze, rezultatele acestor condensări „ştiinţifice” spontane şi empirice
fiind chiar constructele personale. În aceeaşi problemă Zlate5 distinge între două tipuri de
ipoteze: cele integrate teoriei şi cele încorporate cercetării ştiinţifice. Dacă într-o teorie
ipoteza postulează existenţa unor entităţi sau a unor relaţii între entităţi sau fapte, într-o
cercetare ipoteza este mult mai concret şi clar specificată. „Ipoteza, în cadrul teoriei, este
totdeauna speculativă, conjuncturală şi provizorie”, afirmă autorul, care identifică drept
ipoteze toate enunţurile, axiomele, postulatele, legile sau teoremele acesteia.
Asimilând cercetarea ştiinţifică verificării de relaţii dintre variabile, Rateau6 vede
sensul acestei experienţe doar în raport cu o problemă bine definită şi de interes pentru
comunitatea ştiinţifică. Aceasta înseamnă că orice cercetare are nevoie de un cadru de
referinţă teoretic, cercetătorul trebuind „să se intereseze în permanenţă asupra teoriilor
existente, a evoluţiei şi a contradicţiilor lor.” Această interacţiune permanentă dintre planul
experienţei şi al teoriei ar permite rafinarea simultană a ambelor planuri.
Pentru a sublinia legătura specială pe care o operează ipotezele între planurile
empirice şi cele teoretice, Charboneau (1988)7 subliniază caracterul progresiv şi procesual al
elaborării ipotezelor, deoarece punctul de plecare este integrarea informaţiilor deja
disponibile, apoi conceptualizarea şi operaţionalizarea acestora sub formă de ipoteze.
 În prima etapă se emit ipoteze generale, care sunt de fapt reflecţiile cercetătorului
rezultate din lecturile sale, ghidate de cunoştinţele generale şi modelele (paradigmele)
pe care el le are.
 Deoarece ipotezele generale nu sunt direct verificabile, el trebuie să le
operaţionalizeze pentru a deveni ipoteze de cercetare, ceea ce va permite tuturor
cercetătorilor să le înţeleagă într-un acelaşi mod.
4
Houser, R. (1998). Counseling and Educational Research. Evaluation and Application. Thousand Oaks,
London, New Delhi: Sage Publications, p. 83 şi urm.
5
Zlate, M. (2000). Introducere în psihologie. Iaşi: Editura Polirom, p. 391.
6
Rateau, P. (2004). Metodele şi statisticile experimentale în ştiinţele umane. Iaşi: Editura Polirom, p. 16.
7
Charboneau, C. (1988). În Robert, M. (coord.). Foundements et étapes de la recherche scientifique en
psychologie. Paris, Quebec: Maloine S.A. Edisan.

14
 A treia etapă este cea în care ipotezele de cercetare sunt puse la probă prin intermediul
aparatului statistic şi a ipotezelor statistice, ceea ce permite să se precizeze limita de
valabilitate a măsurătorilor, pentru a distinge dacă ele reflectă o regularitate sau sunt
doar un efect al hazardului.

2.1.3.Tipuri de ipoteze de cercetare


Moore (1983)8 propune o tipologie simplă şi larg accesibilă pentru clasificarea
ipotezelor. Întreaga investigaţie pleacă de la ipoteza de nul, deoarce scopul oricărei cercetări
constă în infirmarea acesteia, faptul putând fi formulat verbal astfel: nu există diferenţe
semnificative între grupurile studiate, cele care apar datorându-se hazardului. Matematic,
exprimarea este următoarea:
Hoμ1 = μ2
În care Ho este ipoteza de nul, iar μ (miu, simbol grec) indică media populaţiei. Şi totuşi, în
literatura de specialitate rareori vom întâlni formulată ca atare această ipoteză, din cauza
caracterului ei universal şi implicit.
Atunci când teoriile şi cercetările anterioare lasă să se întrevadă că este posibil să
existe o diferenţă între grupurile studiate, dar datele sunt încă insuficiente pentru a prezice
direcţia exactă a acesteia, avem o ipoteză alternativă bidirecţională, ce poate fi redată simbolic
astfel:
H1μ1 ≠ μ2
în care H1 reprezintă ipoteza specifică (alternativă) bidirecţională, iar μ1 şi μ2 sunt mediile
celor două grupuri.
Cea mai precisă dintre ipoteze este cea unidirecţională, când se compară mediile a
două grupuri şi, folosind o variabilă independentă ca stimul, se anticipează un scor mai mare
sau mai mic la variabila dependentă. Formula matematică este:
H1μ1 < μ2 sau H1μ1 > μ2
În afara acestei tipologii simple şi elegante se pot invoca multe alte dihotomii.
Ipoteze simple versus ipoteze complexe: unele ipoteze permit trecerea rapidă de la
propoziţia sau asumpţiunea care serveşte ca tentativă în explicarea unor fapte (ipoteza de
cercetare) la instrumentarea demersului necesar dovedirii valabilităţii ei. Relaţia dintre
zgomot şi eficienţa în muncă este curent operaţionalizată în cercetările despre stres în muncă;
palierele de echilibru, care sunt stadiile dezvoltării psihogenetice postulate de Piaget, sau

8
Ap. Houser, op. cit., p. 84.

15
stadialitatea afectivă şi cea psihomorală, propuse de Freud, respectiv de Kohlberg, sunt însă
mult mai greu de dovedit experimental. Alegerea situaţiilor concludente care probează ideea
de stadiu poate fi atât de nuanţată încât este posibil ca o altă centrare sau selecţie să poată da
rezultate diferite.9 De aceea pare a fi foarte pertinentă opinia lui Richelle care nu vede o
legătură directă între gradul de elaborare/completitudine al unei ipoteze şi valoarea
concluziilor care decurg din ea: „O ipoteză foarte complicată poate să ducă la rezultate
nesemnificative, după cum o ipoteză foarte simplă poate să deschidă drumul spre fapte de o
mare importanţă.”10
Ipoteze inductive (izvorâte din fapte izolate) versus ipoteze deductive (cu origine în
cercetări sau teorii deja recunoscute) fac trimiterea la o dihotomie şi mai utilă, şi anume
ipoteze empirice - care sunt generalizări integrate într-o teorie, dar care pleacă de la fapte şi
experienţă -, versus ipoteze teoretice - care nu au o incidenţă empirică evidentă, deoarece
pleacă de la consecinţele testabile ale unei teorii.
Ipoteze exploratorii versus ipoteze explicativ-interpretative: primele abordează
categorii noi de fapte sau de probleme, au conexiuni mai slabe cu teoria şi de aceea sunt mai
vagi şi mai puţin riguroase, pe când cele din a doua categorie depăşesc cadrul cercetării în
care au apărut, încercând să refacă legătura cu conceptele şi legile mai generale ale teoriei de
la care a plecat cercetarea. Deoarece nu există siguranţa că interpretarea dată este şi cea mai
bună, ori singura posibilă, acestea au nevoie ele însele de alte verificări ulterioare pentru a le
determina mai exact limitele de valabilitate, deci ele relansează practic întregul ciclu al
cercetării.
Ipoteze cauzale şi ipoteze de covarianţă: uneori regularitatea semnalată de cercetare
indică o evoluţie paralelă (directă sau inversă) a unui fapt cu alt fapt, fără a se putea face o
inferenţă sigură privitoare la cauzalitatea relaţiei, şi atunci ipotezele vor fi de covariaţie. Este
şi cazul cvasi-experimentului unde, neputând manipula variabila independentă de tipul
apartenenţei de gen, mediu geografic sau vârstă, cercetătorul nu poate da statut de cauzalitate
relaţiei desprinse. În ipotezele cauzale, din contră, se anticipează relaţii de acest tip între
variaţii exterioare subiectului (variabila independentă) şi efectele lor asupra subiectului
(variabila dependentă). Ele sunt tipice doar metodei experimentale şi sunt singurele care
permit postularea de legi, de unde şi valoarea lor metodologică specială.

9
Cercetările transculturale au evidenţiat deja limitele de generalitate ale acestor teorii pentru alte contexte decât
cel în care ele au apărut (cultura vest europeană, versus alte tipuri de culturi).
10
Parot, F., Richelle, M. (1995). op. cit., p. 192.

16
La toate acestea se mai pot adăuga şi alte categorii, cum ar fi ipotezele ad-hoc şi
ipotezele aleatorii. Atunci când ipotezele de bază ale unei cercetări nu sunt confirmate, ori
cînd efectul scontat nu apare, cercetătorul încearcă să le apere invocând alte ipoteze,
construite ad-hoc care - atunci când sunt probate ulterior de alte cercetări - pot fi utile,
deoarece pot preciza mai bine condiţiile în care efectele anticipate pot apărea. Ipotezele
aleatorii nu au însă nici măcar această valoare euristică, ele neavând nici un rol în progresul
cunoaşterii, deoarece cel mai adesea sunt elaborate fără parcurgerea atentă a domeniului
teoretic şi de cercetare, dând o pondere mult prea mare elementului hazard, inspiraţie de
moment etc.
Aceste tipuri de clasificări ridică automat o altă problemă, cea a valorii ipotezelor şi a
criteriilor de identificare a acesteia. Cerinţele unei bune ipoteze sunt următoarele:
 Ea trebuie să fie testabilă: putem afirma că există viaţă în univers, dar afirmaţia nu
poate deveni o ipoteză valoroasă atâta vreme cât nu dispunem de mijloacele tehnice
necesare testării ei.
 Ca şi în cazul unei teorii, o ipoteză bună trebuie să fie falsificabilă (Popper), ceea ce
înseamnă că cineva poate aduna dovezi asupra falsităţii sau incorectitudinii ei. Putem
susţine ipoteza discontinuităţii faliilor spaţio-temporale în producerea fenomenelor
paranormale de tipul fantomelor, dar deoarece nu suntem încă în posesia
instrumentelor cu care să înregistrăm şi să măsurăm fenomenele de aceste tip, rezultă
implicit că nu avem în nici un fel posibilitatea de a dovedi validitatea sau invaliditatea
unei asemenea ipoteze.
 ipoteză trebuie să fie raţională (plauzibilă), rezultând din faptul că există o
probabilitate suficient de mare ca ea să fie adevărată (este verosimilă). De exemplu,
dacă a face o legătură între performanţa şcolară şi inteligenţă este rezonabil, a face
legătura între performanţa şcolară şi unii indicatori antropometrici (perimetrul cranian)
nu mai este rezonabil.
 ipoteză trebuie să fie parcimonioasă (economicoasă) în sensul că dintre două ipoteze
de aceeaşi valoare explicativă este preferabilă ipoteza cea mai simplă şi care se
potriveşte cel mai bine cu teoriile curente din domeniu.
 Moore (1983)11 adaugă la aceste condiţii încă două elemente de apreciere a valorii
unei ipoteze, şi anume scurtimea (ipoteza trebuie formulată în termenii cei mai concişi

11
Apud Houser, op. cit., p. 87.

17
posibili) şi claritatea (proprietate care se referă la uşurinţa cu care altcineva poate
înţelege acea ipoteză).
 ipoteză are şi rolul de a ne ghida în alegerea celor mai potrivite metode statistice
pentru a o proba: „Trebuie să existe consistenţă (potrivire) între ipotezele identificate
şi tipurile de statistici utilizate”, afirmă Houser.
Sumarizând, valoarea unei ipoteze constă în fecunditatea ei, adică în capacitatea de a
oferi explicaţii unui ansamblu semnificativ de fapte, asigurând astfel progresul cercetării.

2.2. Validitatea unei cercetări experimentale

2.2.1. Validitatea internă


Validitatea internă presupune faptul că schimbările survenite la nivelul variabilei
dependente sunt datorate efectului schimbării la nivelul variabilei independente, şi nu ca
urmare a altor variabile străine, explicaţii alternative sau ipoteze rivale. Când aceste variabile
externe cercetării pot fi controlate se poate aprecia că rezultatele sunt datorate tratamentului
experimental şi în acest caz cercetarea are validitate internă.
Iată variabilele externe semnalate de Campbell şi Stanley (1963)12 care pot ameninţa
validitatea internă a unei cercetări:
 Istoria: se referă la evenimentele specfice, provenite din mediul exterior, apărute între
prima şi a doua măsurătoare şi care devin surse de distorsiune, deoarece se supra-adaugă
la variabilele experimentale. Istoria poate fi controlată prin existenţa grupului de control,
care este supus pe parcursul studiului la aceleaşi evenimente ca şi grupul experimental,
exceptând bineînţeles tratamentul experimental.
 Maturaţia: sunt procese ce operează în interiorul subiectului ca funcţie a trecerii timpului:
creştere, îmbătrânire, oboseală, înfometare etc., procese care pot fi simultan biologice şi
psihologice. Creşterea forţei musculare, a coordonărilor de fineţe, dar şi a oboselii pot în
mod egal apărea între cele două faze ale cercetării, generând schimbări de tip
maturaţional, care pot fi contrabalansate prin grupul de control, ca şi în cazul precedent.
 Testarea: prin faptul că în ambele faze (pretest şi posttest) se administrează acelaşi tip de
teste poate apărea aşa-numita „deşteptăciune în testare” care afectează rezultatul la
posttest, în sensul creşterii lui. Subiectul învaţă din faza de pretest să se acordeze pe acel
tip de informaţie sau comportament aşteptat de la el, aşa cum a văzut în pretest. De aceea

12
Campbell, D.T., Stanley, J.C. (1963). Experimental and cvasi-experimental designs for research and teaching.
Chicago: Rand McNally, pp. 171-246.

18
este important ca toţi subiecţii să parcurgă faza de pretest şi de posttest, ceea ce duce la
efectul de balansare a efectului de învăţare pentru ambele grupe experimentale.
 Instrumentaţia: atunci când există fază de pretest şi de posttest, schimbările survenite la
nivelul variabilei dependente pot fi datorate instrumentului în sine, în cazul în care el se
schimbă de la o fază a cercetării la alta şi când el nu este echivalent până la identitate în
faza a doua comparativ cu prima. Uneori schimbările apar la nivelul observatorilor sau
judecătorilor celor două tipuri de performanţe, aici instrumentul fiind substituit
cercetătorilor înşişi.
 Regresia statistică: apare atunci când grupurile au fost selecţionate pe baza scorurilor
extreme (aşa-numitele grupuri de contrast, cum ar fi studenţi foarte buni şi foarte slabi,
subiecţi foarte inteligenţi şi non-inteligenţi etc.). Semnalată încă de către Galton, regresia
statistică constă din tendinţa scorurilor extreme de a regresa spre medie. Selectând subiecţi
de la extremele curbei lui Gauss, scorurile la teste vor tinde în timp spre nivelare, adică
spre valoarea medie, scăderea lor la faza de posttest având această cauză, şi nu una ce
rezultă din manipularea experimentală.
 Erorile de selecţie: selecţia diferenţiată (non-aleatoare) intervine atunci când participanţi
cu particularităţi diferite (cum ar fi factorii vârstă, instrucţie sau sex) se află în grupul de
control şi în cel experimental, rezultatele constatate putându-se datora nu tratamentului
experimental, ci tocmai acestor particularităţi diferenţiatoare. Aceste variabile incluse sau
confundate pot fi deci sursa reală a variaţiei VD, mascând sau distorsionând efectul real al
VI. Dacă, de exemplu, grupul experimental are elevi cu o medie de vârstă mai mare,
rezultatele lor superioare la probele de citit-scris s-ar putea datora unor elemente care se
confundă cu factorul vârstă (maturitate globală mai mare, expunere mai îndelungată la
experienţa citit-scrisului sau pur şi simplu prezenţa mai multor oportunităţi de învăţare).
Pentru a combate această sursă de eroare putem proceda astfel: împărţim participanţii
după criteriile reperate a avea importanţă (vârstă, sex, clasă, studiile părinţilor etc.) şi apoi
le repartizăm randomizat (aleator) în grupurile de control şi experimental, pentru a
produce efectul de balansare / echilibrare între grupuri.
 Mortalitatea experimentală: se referă la subiecţii care sunt prezenţi în faza iniţială a
cercetării, dar dispar pe parcurs, din grupul martor sau - şi mai rău! - chiar din grupul
experimental. Această ameninţare a validităţii studiului poate fi totuşi contracarată prin
introducerea unei faze de pretest pentru a determina dacă cei care au „dispărut” din
cercetare sunt sistematic diferiţi de cei care au urmat-o până la capăt.

19
 Interacţiunea selecţie-maturaţie: combină ameninţările la adresa validităţii din cele două
surse, selecţia şi maturaţia, deşi trebuie spus că maturaţia este caracteristica mai
definitorie care face ca cele două grupuri să difere.
Cook şi Campbell (1979)13 mai adaugă la aceste surse de distorsiune încă patru categorii:
 Difuziunea tratamentului experimental: atunci când grupul de control este într-o strânsă
proximitate cu cel experimental, este posibil ca cei din grupul de control să fi identificat
idei interesante apărute în cursul comunicării dintre participanţi şi să le utilizeze ca
răspuns la variabila independentă. Pericolul contaminării prin difuziunea tratamentului
poate fi evitat prin selecţia grupului de control din şcoli sau locaţii diferite, ori prin
alegerea de secvenţe temporare diferite, ceea ce reduce drastic posibilitatea de contact şi
de comunicare între cele două grupuri.
 Rivalitatea compensatorie a grupului de control (efectul John Henry): atunci când
vechiul mod de lucru este ameninţat de noua procedură experimentală propusă, unii
subiecţi se vor strădui din răsputeri să dovedească faptul că vechiul lor procedeu lor este
mai bun. Cel mai bine ar fi ca participanţii nici să nu ştie din ce grup fac parte -
experimental sau de control - pentru a nu produce acest tip nedorit de competiţie.
 Egalizarea compensatorie a tratamentului: membrii grupului de control s-ar putea simţi
nedreptăţiţi dacă vor crede că celor din grupul experimental li se alocă mai mult interes şi
resurse şi - pentru a-i mulţumi - conducerea le-ar putea aloca resurse suplimentare
neprevăzute, ceea ce ar putea atenua efectul tratamentului experimental.
 Demoralizarea ofensată a grupului de control: afectaţi de faptul că ei nu le află printre
„cei aleşi” (în grupul experimental) şi că nu vor primi tratamentul experimental, grupul de
control va avea performanţe mult mai scăzute, în principal dintr-o motivaţie mai scăzută.

2.2.2. Validitatea externă şi generalizabilitatea rezultatelor


Se referă la măsura în care relaţiile desprinse în laborator pot fi extinse şi generalizate
la alte situaţii similare, ceea ce ne-ar permite să afirmăm că ele sunt valide extern. Pentru
acest acpect, Brach şi Glass (1968) au propus un termen care a fost ulterior preluat şi
consacrat de psihologia cognitivă, şi anume validitatea ecologică, care accentuează asupra
valabilităţii generalizării datelor de laborator în condiţii de mediu natural. Ei au identificat
zece catagorii de factori care afectează acest tip de validitate.

13
Cook, T.D., Campbell, D.T. (1979). Quasi-experimentation. Design and analys issues for field settings.
Chicago: Rand MacNally.

20
 Descrierea explicită a tratamentului experimental: variabila independentă trebuie
descrisă suficient de amănunţit, astfel încât cel care va relua şi replica experimentul să
o poată reproduce, deşi trebuie menţionat că în intervenţiile terapeutice sau
educaţionale acest lucru este unul foarte greu de realizat.
 Interferenţele tratamentelor multiple: dacă participanţii primesc mai mult decât un
tratament, este foarte greu de dovedit care tratament, sau care combinaţie de
tratamente, a dus la rezultatul apărut. Mai ales atunci când mai multe tratamente sunt
aplicate simultan, se dovedeşte a fi foarte greu de stabilit ponderea cu care fiecare
componentă a participat la obţinerea rezultatului final.
 Efectul Hawthorne: o cercetare din anii '40 la Western Electric Company a arătat că
indiferent de condiţiile de iluminare - slabe sau bune - productivitatea lucrătorilor a
crescut, în principal din cauza faptului că simpla lor includere în studiu a generat o
puternică motivaţie, ceea ce a dus la creşterea productivităţii şi la grupul martor, cel
care avea o iluminare mai scăzută.
 Efectul disruptiv al noutăţii: un tratament poate să creeze o perturbare a activităţii
dar, odată asimilat, poate să aibă consecinţe benefice în mod constant.
 Efectul de examinator: eficienţa tratamentului nu este aceeaşi dacă cel care îl
administrează este cercetăror sau student, psiholog sau profesor, diriginte sau o
persoană neutră. Deoarece efectul experimental nu va mai apărea în condiţiile absenţei
celui care a administrat tratamentul, acesta nu poate fi generalizat.
 Sensibilizarea la pretestare: mai ales atunci când subiecţilor li cere să reflecteze sau
să-şi exprime atitudinea faţă de un fenomen, cei care au avut în prealabil o fază de
pretest vor fi mai sensibili la tratamentul experimental decât ceilalţi.
 Sensibilizarea posttest: ca şi în cazul precedent, faptul de a administra un test (în orice
fază a experimentului) ajută subiectul să colecteze informaţii utile într-o manieră în
care cei care nu au participat la testare nu o pot face.
 Interacţiunea istoriei cu efectul tratamentului: se produce deoarece anumiţi factori
contextuali în care se desfăşoară cercetarea nu pot fi replicaţi exact într-o fază
ulterioară a cercetării şi de aceea efectele tratamentului nu mai pot fi generalizate şi la
alte situaţii.
 Măsurarea variabilei dependente: când VD este măsurată printr-un test cu alegere
multiplă sau printr-o grilă de observaţie perceptivă concluziile reieşite din cele două
metode pot fi destul de divergente.

21
 Interacţiunea dintre timpul măsurătorii şi efectele comportamentului: atunci când
posttestul este administrat imediat, el poate să dea rezultate diferite faţă de
administrarea lui întârziată, la distanţă de săptămâni sau de luni/ani.

La toate aceste probleme ale validităţii externe, oarecum universale, cercetarea psiho-
pedagogică ridică în plus şi probleme specifice. Un experiment care ar urma să dovedească
cât de eficace este o nouă tehnică de predare, de evaluare sau de consiliere, ar trebui să aibă în
vedere că nu este rezonabil să se aştepte schimbări rapide în planul formării atitudinilor,
cunoştinţelor sau deprinderilor. Studiul va produce deci schimbări nesemnificative pentru
perioade scurte de timp (de zile sau săptămâni), dar ar putea să dea bune rezultate după
trecerea unor perioade de timp mai lungi (de luni, semestre). Intervenţiile destinate
schimbărilor importante în cunoaştere, personalitate sau comportament nu se pot realiza prin
experimente scurte şi nici prin una-două şedinţe. Pe de altă parte, cel care administrează
tratamentul (profesor, consilier şcolar sau psiholog) ar putea să nu respecte aceleaşi proceduri
în aplicarea lui (standardizarea tratamentului) de unde şi necesitatea de a fi antrenaţi sau chiar
supervizaţi în acest sens.

Autoevaluare
1. Definiţi în ce constă o ipoteză de cercetare şi care este rolul ei în acest proces.
2. Care este geneza unei ipoteze de cercetare valoroasă? (Indicaţi cinci criterii de valoare).
3. Din tipologia ipotezelor de cecetare propuse în curs analizaţi cuplurile ipoteză de nul -
ipoteză specifică şi ipoteză unidirecţională - ipoteză bidirecţională.
4. Analizaţi rolul istoriei, maturaţiei şi al morţii experimentale în problematica validităţii
interne a unei cercetări experimentale.
5. Selectaţi pentru o analiză mai detaliată trei dintre elementele cele mai importante care pot
distorsiona semnificativ validitatea externă a unei cercetări experimentale psihopedagogice şi
indicaţi modul în care acestea pot fi controlate sau contracarate.

Bibliografie
1. Campbell, D.T., Stanley, J.C. (1963). Experimental and cvasi-experimental designs
for research and teaching. Chicago: Rand McNally.
2. Doron, R., Parot, F. (1999). Dicţionar de psihologie. Bucureşti: Editura Humanitas.
3. Houser, R. (1998). Counseling and Educational Research. Evaluation and
Application. Thousand Oaks, London, New Delhi: Sage Publications.

22
4. Piéron, H. (2001). Vocabularul Psihologiei. Bucureşti: Univers Enciclopedic.
5. Rateau, P. (2004). Metodele şi statisticile experimentale în ştiinţele umane. Iaşi: Ed.
Polirom.
6. Reber, A.S. (1985). The Penguin Dictionary of Psychology. London: Penguin Books.
7. Robert, M. (coord.). (1988) Foundements et étapes de la recherche scientifique en
psychologie. Paris, Quebec: Maloine S.A. Edisan.
8. Zlate, M. (2000). Introducere în psihologie. Iaşi: Editura Polirom.

23
CAPITOLUL 3

TIPURI DE DESIGN AL CERCETĂRILOR


EXPERIMENTALE ŞI NONEXPERIMENTALE

3.1. Definirea designului experimental


Design-urile de cercetare indică decizia luată în legătură cu grupurile utilizate şi de
câte ori (cine şi când) li se administrează variabila independentă, ţinând sub control
variabilele interne şi externe care ar putea ameninţa validitatea demersului. Pentru a simplifica
problema şi a-i da o expresie simbolică, prezentăm câteva notaţii utile care se referă la
elementele incluse într-un design experimental:
R = distribuţia randomizată a subiecţilor pe condiţiile şi grupurile experimentale;
X = tratamentul experimental (VI);
O = observaţii sau măsurători ale variabilei dependente (VD) în faza de pretest,
posttest sau interimar).
Designul de cercetare constituie şi o cale de a controla principalele surse de
distorsiuni pentru validitatea internă a cercetării: maturarea şi istoria sunt controlate prin
prezenţa grupului de control, aşa cum am arătat deja, selecţia diferenţiată prin distribuţia
randomizată a condiţiilor şi criteriilor etc. În acelaşi timp însă el poate fi gândit şi ca o
structură a cercetării, deoarece el este elementul de legătură al tuturor celorlalte elemente
implicate în proiectul de cercetare.
Reluând notaţiile, pentru a le face mai explicite, R se referă la grupurile implicate în
cercetare, fiecare grup având propria sa linie în structura designului. Principalele tipuri de
construcţie a grupurilor sunt prin randomizare (de aceea selecţia aleatorie este notată cu R),
grupuri ne-echivalente (N) sau grupuri balansate (B), ori grupuri apariate (A), astfel costruite
încât să realizeze echivalenţa simultan după mai multe criterii, ca vârstă, sex, pregătire
profesională, vechime etc.
O se referă la observaţiile sau măsurătorile care pot fi unice (de exemplu înalţimea),
alcătuite din scale omogene, alcătuite din mai mulţi itemi reuniţi într-o scală (de anxietate, de
exemplu), sau din mai multe subscale, reunite într-o scală compozită sau într-o baterie
(sentimente anxioase, gânduri anxioase plus simptome fizice ale anxietăţii, reunite toate în

24
scala de anxietate a lui Burns). Când vrem să diferenţiem între măsurători specifice putem
folosi indici: O1, O2, O3.
X se referă la tratamente sau intervenţii, care pot fi simple sau complexe (aplicarea de
stimuli auditivi sau luminoşi, prin comparaţie cu o metodă nouă de formare sau de training
educaţional). Când dorim să diferenţiem între intervenţii, putem de asemenea să utilizăm
indici (X1, X2, X3 etc.).
Timpul este o componentă de bază dintr-un design de cercetare experimentală, deşi el
este mai greu de figurat ca atare. De regulă, ordinea în care apar celelalte simboluri sugerează
şi secvenţa temporală, care de fapt nu apare explicit în design.
R O1 X O2
R O1 O2
Figura 3.1. Design experimental pe grupuri randomizate,
cu grup experimental şi grup de control şi cu măsurători pretest şi posttest14.

În care: - R reprezintă selecţia randomizată a grupurilor;


- X reprezintă intervenţia (manipularea experimentală) asupra variabilei
independente;
- O1 şi O2 reprezintă etapele măsurării;
- pretestul şi posttestul sunt simultane pentru ambele grupe (experimental şi de
control);
- există două linii ale designului, câte una pentru fiecare grup.
Prezentăm mai jos câteva tipuri de design experimental, indicând scopul lor, gradul de
control al variabilelor şi câteva caracteristici definitorii.

Tip de design Scopul său Grad de control Caracteristici


al variabilei
străine
Experimentul real Comparaţia tratamentelor Mare cantitate a  Manipularea variabilei
(veritabil, adică cu grupurilor asupra controlului. independente;
grupuri de pretest şi post controlului ori a  Distribuţia randomizată a
test, sau numai posttest). abordărilor tradiţionale. grupurilor.
Cvasi-experimental (serii Comparaţia între grupuri Cantitate  Manipularea variabilei

Prelucrare după Hohn, M., Vârgă, D. (2000). Ghid practic de psihologie experimentală. Timişoara: Tipografia
14

Universităţii de Vest, p. 33.

25
temporale de genul AB ori a aceluiaşi grup în moderată a independente;
AB). diferite momente controlului.  Distribuire nerandomizată a
temporale. subiecţilor în grupuri;
 Multiple evaluări ale
variabilei dependente.
Pre-experimental (de Comparaţii între grupuri Control minim.  Manipularea variabilei
exemplu o singură sau în cadrul aceluiaşi independente sau măsurarea
secvenţă pretest - grup, dar în general nu la unui eveniment care a
posttest). o mare distanţă apărut doar pentru un grup,
temporală. pentru care examinatorul nu
are nici un control;
 Distribuire nerandomizată a
subiecţilor în grupuri.
Descriptiv (de exemplu A descrie un eveniment Nici un control  Nici o manipulare a
studiu cauzal - sau un fenomen. asupra variabilei independente;
comparativ - evenimentelor  Distribuire nerandomizată a
observaţional). sau fenomenelor. subiecţilor în grupuri.
Figura 3.2. Categorii de design-uri de cercetări cantitative (Sursa: R. Houser15).

3.2. Planuri experimentale de bază16

Design 1. Un singur grup cu pretest şi posttest


O1 X O2
Scopul: de a determina dacă o metodă de predare va creşte calitatea scrierii.

A. Procedura
1. Se administrează pretestul şi se măsoară (O1) scorul la un test grafometric pentru un
singur grup, înainte de a-l expune la o nouă metodă de predare.
2. Se expune (X) grupul la noua metodă de predare pentru o perioadă de timp, de exemplu
un semestru.
3. Se dă posttestul şi se măsoară (O2) scorul la acelaşi test grafometric după expunerea la
tratament.

15
Houser, R. (1998). Counseling and Educational Research. Evaluation and Application. Thousand Oaks,
London, New Delhi: Sage Publications, p. 22.
16
Adaptat după Campbell, D.T., Stanley, J.C. (1966). Experimental and Cvasi-experimental Designs for
Research. Rand McNally and Company.

26
4. Se compară semnificaţia statistică a diferenţei mediilor (testul t Student) pentru a vedea
dacă diferenţa atinge pragul semnificaţiei statistice şi la ce nivel (p = .05 sau p = .01).

B. Validitatea
Validitatea internă
Avantaje: deoarece se referă la aceiaşi subiecţi, care sunt măsuraţi în două situaţii -
înainte şi după tratamentul experimental X - selecţia şi mortalitatea experimentală sunt uşor
de controlat.
Dezavantaje: nesiguranţa că diferenţa dintre O2 şi O1 este datorată doar tratamentului.
Ipoteze rivale, şi deci erori posibile sunt foarte multe: istoria (între timp unii subiecţi şi-au pus
ochelari), maturaţia (pot fi mai obosiţi la O2 pentru că elevii sunt la sfârşit de semestru sau
poate de an şcolar), efectul testării (la a doua testare apare o motivaţie mai bună sau este indus
efectul învăţării), regresia statistică (dacă comparaţia se face splitând clasa în cei buni şi cei
slabi), moartea experimentală (mulţi subiecţi nu au primit şi pe O1 şi pe O2).

Design 2. Design cu două grupuri - de control şi experimental,


ambele randomizate - cu fazele de pretest şi de posttest

Pretest Tratament Posttest


Grupul experimental R O1 X O2
Grupul de control R O1 O2

A. Procedura
1. Se selectează subiecţii aleator (randomizat) dintr-o populaţie.
2. Aceştia se distribuie tot randomizat în grupul experimental şi în cel de control.
3. Se măsoară la ambele grupuri variabila dependentă (O1), apoi se determină media şi
abaterea standard, pentru a se constata echivalenţa grupurilor (testul t, testul Levene).
4. Se păstrează toate condiţiile identice pentru ambele grupuri, cu excepţia expunerii gupului
experimental la tratamentul X, prin variabila independentă, pentru o perioadă de timp
specificată.
5. Se testează şi se măsoară variabila dependentă (O2) pentru ambele grupuri, pentru a li se
determina media şi abaterea standard.
6. Se determină diferenţa O2 - O1 pentru ambele grupuri, separat.

27
7. Se compară aceste diferenţe pentru a concluziona dacă aplicarea tratamentului
experimental X se asociază cu o schimbare semnificativă care apare la grupul de
experimental, comparativ cu grupul martor, pentru a se putea astfel respinge ipoteza de
nul (Hoμ1 ≠ μ2).
Designul 2 ar putea fi extins cu una sau mai multe linii experimentale, caz în care ar arăta
astfel:
Pretest Tratament
Posttest
Grupul experimental 1 R O1 X (Metoda a) O2
Grupul experimental 2 R O1 X (Metoda b) O2
Grupul de control R O1 O2

B. Validitatea
a. Validitatea internă
1. Validitatea internă devine mult mai puternică în acest tip de design, deoarece variabilele
străine ce pot apărea între O1 şi O2 pot fi considerate ca balansate şi sub control, în măsura în
care ele afectează în mod egal ambele grupuri.
2. Deoarece tratarea diferenţiată a grupurilor experimental şi de control (profesor diferit, clase
diferite, atmosferă diferită) poate crea un tip de eroare constând din dezamăgirea grupului de
control, subiecţii vor fi testaţi individual ori în grupuri mici, prin distribuirea randomizată a
timpului, a locului şi a condiţiilor experimentale.
3. Atunci când sunt implicaţi observatori sau evaluatori, este bine ca ei să nu ştie cărui grup
(experimental sau de control) sunt asignaţi subiecţii.
4. Selecţia diferenţiată este controlată prin metoda randomizată de selecţie iar maturarea,
efectele de pretestare şi regresia statistică apar în mod egal pentru ambele grupuri.
Mortalitatea experimentală diferenţiată poate fi evaluată pentru pattern-uri atipice, nealeatorii,
deoarece există faza de pretest.

b. Validitatea externă
Pot fi generalizate, şi până la ce limită, concluziile acestui tip de demers?
1. În acest tip de design validitatea externă poate fi compromisă doar în situaţia în care
pretestul ar sensibiliza sau ar altera doar răspunsurile subiecţilor care sunt supuşi
tratamentului experimental (interacţiunea pretestării cu X).

28
2. Interacţiunea selecţiei cu X: pot apărea destorsiuni semnificative atunci când subiecţii
selecţionaţi pentru tratament diferă într-un fel oarecare de cei pe care vrem să generalizăm
concluziile, de exemplu elevi din şcoli profesionale versus elevi din liceele obişnuite,
elevi din clase de elită (sau de recuperare, în învăţământul inclusiv) versus cei din clasele
obişnuite.
3. Efectele de reactivitate la procedurile experimentale apar doar dacă subiecţii ştiu că fac
parte din grupul experimental sau din cel de control. Soluţia pentru acest caz este ca ei să
nu ştie din start şi să nu afle nici pe parcurs din care grup fac parte, măsurătorile O1 şi O2
putând apărea ca unele de rutină ale evaluării şcolare, iar tratamentul X ca făcând parte
din programul şcolar normal.

Design 3. Designul cu patru grupe randomizate al lui Solomon

Grup Pretest Tratament Posttest Diferenţă


1. Pretestat R O1 X O2 1D O1, X, M, I
2. Pretestat R O1 O2 2D O1, M, I
3. Nepretestat R X O2 3D X, M, I
4. Nepretestat R O2 4D M, I

A. Procedura
Deoarece efectele măsurate O2 reprezintă expresia unor variate combinaţii de variabile
(pretestarea O1, variabila independentă X, maturarea M sau istoria I), pentru a determina doar
efectul tratamentului X, vom face diferenţa dintre 3D şi 4D; doar efectul pretestării O 1,
scădem 4D din 2D, iar pentru a determina efectul interacţiunii dintre pretestarea O1 şi X se
adună 2D cu 3D, iar rezultatele se scad din 1D.
Raţiunea acestui tip de design este aceea că prin adăugarea în cercetare a liniilor 3 şi 4
(subiecţi nepretestaţi), validitatea externă câştigă mult, deoarece se extinde posibilitatea
generalizării. Aceasta însă doar în cazul în care pretestarea determină sensibilizarea celor care
sunt expuşi la tratamentul experimental. Pentru aceasta însă, condiţia obligatorie este
distribuirea randomizată pentru toate cele patru grupuri, şi aceasta deoarece doar aşa putem
presupune că scorurile la pretestare din grupurile 3 şi 4 ar fi fost echivalente cu grupurile 1 şi
2. Nefiind pretestate însă, efectul acestora nu va apărea în scorurile lor (O2), ceea ce ne
îndreptăţeşte să facem diferenţa 4D - 2D pentru a evidenţia rolul pretestării (O1).

29
B. Validitate
Acest design permite determinarea simultană a principalelor efecte ale pretestării, ca şi
al interacţiunii efectelor pretestării cu tratamentul experimental X. Comparând grupul 1 cu
grupul 4 se poate determina efectul combinat al maturării şi istoriei. De fapt, designul de tip
Solomon presupune o experimentare dublă, cu şi fără pretest, iar atunci când între ele există o
bună congruenţă a rezultatelor, se poate acorda o mare încredere acestora, oricare ar fi ele.

Design 4. Design cu grup de control randomizat, doar cu fază de posttest


Pretest Tratament Posttest
Grupul experimental R X O2
Grupul de control R O2

A. Procedura
Aşa cum se poate observa, designul 4 preia chiar ultimele două coloane ale designului
lui Solomon. Şi aici repartizarea pe cele două grupuri se face randomizat, ceea ce permite
cercetătorului să ştie ca la momentul respectiv cele două grupuri erau egale. După aceasta
urmează expunerea X la tratamentul experimental, apoi cele două grupuri sunt testate pentru
prima dată. Prin comparaţia lor printr-un test statistic corespunzător se determină dacă efectul
constatat la grupul experimental a apărut prin şansă (hazard), sau se datorează tratamentului
X, adică variabilei independente.

B. Validitatea
Autorii apreciază că designul 4 este superior designului 2, deoarece aici nu poate
apărea nici o interacţiune dintre pretestare şi tratament. Este un tip de demers care este
deosebit de util atunci când pretestarea este neconvenabilă sau prea costisitoare, ori atunci
când subiecţii trebuie să-şi apere anonimatul. Pe de altă parte, atunci când mărimea
eşantioanelor este mică - şi de aceea se impune verificarea echivalenţei - designul 2 este de
preferat designului 4.

Designul 5. Design cu grup de control nerandomizat,


cu fazele de pretest şi de posttest
Pretest Tratament Posttest
Grupul experimental O1 X O2
Grupul de control O1 O2

30
A. Procedură
Deşi mai puţin valoros ca designul 2, de care diferă doar prin distribuţia
nerandomizată a subiecţilor, designul 5 este unul deosebit de util în cercetarea
psihopedagogică, unde adesea grupurile experimental şi cel de control se iau în calitatea lor de
grupuri natural constituite (clasele de elevi), astfel selecţionate încât să fie cât mai mai
similare atunci când li se administrează pretestul. Aceasta înseamnă că cele două grupuri au
medii şi abateri standard foarte asemănătoare şi că testul de semnificaţie t nu respinge ipoteza
de nul.

B. Validitate
Validitate internă
 Satisfăcătoare, dacă cele două grupuri au media şi abaterea standard similare la faza de
pretest.
 Pentru a sesiza în principal efectul tratamentului X, controlul trebuie să aibă în vedere
efectele pretestării, istoriei, al maturaţiei şi al instrumentării.
 Dintre acestea, istoria şi instrumentarea pot fi surse importante de distorsiune sau
contaminare.
 Mortalitatea experimentală este una foarte uşor de dedus prin comparaţia
înregistrărilor din faza pretest-posttest.
 În absenţa randomizării, este probabil să apară posibilitatea unor diferenţe critice,
influenţate de scorurile la pretest, cum ar fi motivaţia mai mare a voluntarilor, fundalul
cultural diferit etc., care pot afecta datele la faza de posttest.
 Regresia statistică poate fi evitată, dar numai prin control. Dacă două şcoli sunt
fundamental diferite după un criteriu (să zicem după QI-ul elevilor) şi echivalente
după celelalte criterii importante, atunci cele două grupuri trebuie construite prin
apariere (matched = potrivire), astfel încât şcoala mai slabă să nu fie penalizată.

Validitatea externă
Designul 5 are câteva însemnate avantaje practice, în măsura în care are în vedere
clase intacte şi nu dezorganizează programul şcolar. Implicând o largă varietate de clase din
diverse locuri, validitatea externă poate creşte semnificativ, mai ales prin controlul
interacţiunii selecţiei cu al tratamentului X. În plus, este mult mai uşor să conduci un

31
experiment autorizat, fără ca subiecţii să ştie cărui grup aparţin (experimental sau de control),
prin clase intacte, natural constituite.

Designul 6. Design contrabalansat


Atunci când designul precedent nu poate fi aplicat din cauza numărului prea mic de
subiecţi dintr-o clasă şi atunci când distribuirea subiecţilor nu se poate face aleator se
utilizează designul de mai jos, care nu presupune faza de pretest, ci doar pe cea de posttest,
după expunerea la tratamentul experimental X. De remarcat faptul că X poate avea în acest
caz mai multe intensităţi, notate cu indicii a, b, c şi d.

Replicări Xa Xb Xc Xd
1 A B C D
2 B D A C
3 C A D B
4 D C B A
Media scoruri coloane

A. Procedură
1. Fiecare subiect din grupele A, B, C, D este expus la fiecare variaţie a lui X (ca şi la absenţa
lui X, dacă se folosesc grupurile de control), în diferitele etape ale experimentului. Când se
aplică la 4 grupe, tratamentul X este prezentat fiecărui grup în fiecare etapă, astfel încât
fiecare dintre modalităţile lui X este precedată şi urmează de un număr egal de ori.
2. La sfârşitul experimentului este calculată media fiecărei coloane, care este de fapt scorul
mediu pentru toate grupele expuse la una din stările lui X. Comparaţia dintre coloane ajută la
evidenţierea efectului pe care aceste stări sau intensităţi ale lui X le au asupra performanţei
grupului.

B. Validitate
1. Designul 6 îl compensează pe precedentul pe linia posibilităţii ca nerandomizarea
grupurilor să le facă neechivalente din mai multe perspective, introducând diferenţe care sunt
tot atâtea surse de distorsiune pentru X. Designul contrabalansat roteşte aceste diferenţe dintre
subiecţi, expunând toate grupurile la toate variaţiile lui X, controlând în acelaşi timp şi efectul
de ordine. Dacă un grup este mai inteligent, fiecare stare a lui X profită în mod egal de acest
fapt.

32
2. Efectul de contaminare a interacţiunii (selecţie-maturaţie de exemplu) poate să se
repercuteze asupra datelor dacă o stare a lui X oboseşte mult grupul. Slăbiciunea de bază a
designului 6 este aceea că dacă aplicarea unei forme a lui X are efecte remanente (reziduale) -
ca în cazul medicamentelor sau al substanţelor chimice de tipul cofeinei - trebuie lăsat să
treacă destul de mult timp pentru a administra starea următoare a lui X.

Design 7. Design cu grup experimental seriat în timp


Pretest Tratament Posttest
O1, O2, O3, O4 X O5, O6, O7, O8
A. Procedură
Unica diferenţă dintre designul 1 şi acesta este aceea că acum sunt efectuate mai multe
măsurători, înainte şi după introducerea tratamentului X.
Validitate internă
Prelevarea mai multor măsurători procură mai mult control asupra unor surse de
distorsiune a validităţii interne decât o poate face designul 1. Dacă, de exemplu, nu există
diferenţe însemnate între cele 4 scoruri O iniţiale, diferenţa dintre O5 şi O6 nu va putea fi pusă
pe seama efectelor de maturaţie, testare sau regresie statistică. De aceea schimbările de
instrumentaţie sau efectele de selecţie şi de mortalitate experimentală pot fi mai bine
controlate. Singura sursă de afectare a validităţii interne este doar istoria contemporană, ca
schimbările de mediu (vreme, cataclism, scandal public etc.) sau variaţiile ciclice (weekend-
ul, examinările sumative ş.a.).

Validitate externă
1. Generalizarea datelor acestui demers depinde de condiţiile experimentale, în măsura în care
pretestarea modifică subiecţii, astfel încât ei pot să nu mai fie reprezentativi pentru întreaga
populaţie.
2. Poate apărea interacţiunea dintre selecţia diferenţiată şi X (tratament), atunci când aceasta
nu este evitată cu grijă, ca în cazul subiecţilor voluntari, care nu mai reprezintă întreaga
populaţie.

Design 8. Design cu grup de control seriat în timp


Pretest Tratament Posttest
Grup experimental O1, O2, O3, O4 X O5, O6, O7, O8
Grup de control O1, O2, O3, O4 O5, O6, O7, O8

33
Acesta este un design foarte similar cu cel precedent dar, prin introducerea grupului de
control, se poate controla şi efectul istoriei contemporane: dacă ambele grupuri au făcut
experienţa unui eveniment particular şi grupul experimental înregistrează o creştere de la O4
la O5, pe când cel de control nu, câştigul poate fi pus mai ferm pe seama procedeului
experimental X aplicat şi mai puţin pe eveniment. Designul 8 este superior şi lui 5 în privinţa
controlului efectului de selecţie-maturare: dacă un grup are o rată de creştere mai mare decât a
celuilalt, acest câştig accelerat va apărea şi în faza de pretest, la acelaşi grup.
Posttestul multiplu, utilizat în design-urile 7 şi 8, relevă informaţii pe care cele cu un
singur posttest nu o pot face. De exemplu, dacă X are o influenţă de scurtă durată, ce tinde să
dispară cu vremea, aceste tipuri de design vor putea surprinde acest trend. Ori, variaţia lui X
poate fi puternică, dar şi de scurtă durată, sau moderată ca intensitate, dar de lungă durată.
Atunci când mai multe grupuri sunt pretestate simultan, dar pretestul se face la intervale
diferenţiate de timp, apare ca posibil designul de mai jos, care începe cu mai multe grupuri
testate în acelaşi timp, dar la care posttestul are loc la diferite intervale de timp (T1,T2 ...Tn).

Pretest tratament postteste


Grup A O1 X O2
Grup B O1 X O2
Grup C O1 X O2
Grup D O1 X O2
Grup D O1 X O2
T1 T2 T3 T4 T5

Această strategie este deosebit de utilă atunci când apar factori maturaţionali şi când
efectul testării seriale în interiorul unui grup trebuie minimizat. Mai mult, prin adăugarea unui
grup de control, cu acelaşi pattern de pretest-posttest, dar fără tratamentul X, poate fi evaluat
şi efectul acestuia.
Sumarizăm în tabelul de mai jos sursele de distorsiune (invaliditate) al celor opt tipuri
de design experimental prezentate anterior ca fiind definitorii pentru planurile de bază.

34
Surse de distorsiune Design-uri experimentale
Control Control Control
redus riguros parţial
1 2 3 4 5 6 7 8
Validitate internă
Istoria contemporană - + + + + + - +
Proces maturaţional - + + + + + + +
Proceduri de pretestare - + + + + + + +
Instrumente de măsură - + + + + + ? +
Regresie statistică ? + + + ? + + +
Selecţia diferenţiată a subiecţilor + + + + + + + +
Moartea experimentală + + + + + + + +
Interacţiunea selecţie-maturaţie - + + + - ? + +
Validitate externă
Interacţiunea selecţiei cu X - ? ? ? ? ? ? -
Interacţiunea pretestării cu X - - + + - ? - -
Proceduri experimentale reactive ? ? ? ? ? ? ? ?
Interferenţele multiple ale tratamentului -

Figura 2.3. Factori care prejudiciază validitatea design-urilor experimentale.17


Notă: Semnul „+” înseamnă controlul unui factor, „-” absenţa controlului, „?” sugerează că poate
exista o oarecare sursă de îngrijorare iar blancul („ ”) indică faptul că factorul este nerelevant.

3.3. Designurile cvasi-experimentale


Designurile cvasi-experimentale sunt cele care sunt „aproape experimentale”,
exceptând faptul că participanţii nu sunt distribuiţi randomizat în grupuri. În studiile cvasi-
experimentale cercetătorul studiază efectele tratamentului pe grupuri intacte, nestând în
puterea sa distribuirea participanţilor în grupul experimental şi în cel de control.
Stevens şi Salvin18 au condus un studiu privind efectul învăţării prin cooperare în
şcoli, dezvoltat pe două niveluri:
X = şcoli elementare cu învăţare prin cooperare
Control = şcoli tradiţionale elementare.

17
Prelucrare după Van Dalen & Meyer (1996). Understanding Educational Research. New York: McGraw Hill,
p. 291.
18
Apud D. Mertens, 1998, p. 77.

35
Deoarece pentru implementarea tratamentului a fost necesară cooperarea şcolii, cercetătorul
nu a avut posibilitatea de a asigura participarea randomizată. Studiul este deci cvasi-
experimental pentru că s-a lucrat cu grupuri intacte, putându-se determina numeroase
măsurători ale achiziţiilor, atitudinilor sau relaţiilor sociale.

a. Designul cu grup de comparaţie static


Acesta presupune administrarea tratamentului la grupul experimental şi compararea
performanţelor sale la posttest cu grupul de control după schema:
Grup experimental X O2
Grup de control O2
Trăsăturile principale ale acestui demers sunt două:
a. selecţia diferenţiată, deoarece grupurile trebuie să difere de la început printr-o
caracteristică;
b. moartea experimentală, atunci când participanţii ies din studiu.

b. Designul cu grup de control neechivalent


Este similar cu designul precedent, adăugându-se în plus doar faza de pretest, schema
devenind următoarea:
O1 X O2
O1 O2
Utilizarea pretestului se face în scopul de a controla cumva selecţia diferenţiată şi moartea
experimentală.

3.4. Design-uri descriptive


Cercetările descriptive includ 4 tipuri de abordări: ancheta (studiul), abordarea
observaţională, corelaţională şi cauzal-comparativă, asupra primelor trei existând un mai
mare acord al cercetătorilor. Design-urile descriptive implică nedistribuirea aleatorie în
grupuri şi nici manipularea vreunei variabile independente. Scopul acestor cercetări este acela
de a descrie evenimentele ori caracteristicile unei populaţii identificate. O anchetă dintr-un
design descriptiv implică utilizarea unei forme de auto-raportare (ancheta pe bază de interviu
sau pe bază de chestionar) pentru a putea clarifica percepţiile, atitudinile sau comportamentul
grupului ţintă studiat. Scopul anchetei nu este deci acela de a măsura efectele unei intervenţii
sau ale unui tratament.

36
Cercetarea descriptivă observaţională evită autoraportările şi clarifică caracteristicile
personale prin observaţia altora sau prin ratinguri. Singurul domeniu de interes vizează
comportamentul grupului ţintă. Cercetătorii care apelează la acest tip de metode sunt interesaţi
de identificarea sistematică a variabilelor de interes, metoda bazându-se doar pe observaţii
efectuate de observatori antrenaţi.
Un alt tip de design descriptiv este cel corelaţional. Deoarece comportamentul uman
are o mare variabilitate situaţională şi contextuală, se pune problema separării variabilelor
care influenţează la exterior percepţiile, atitudinile sau comportamentele noastre. În
consecinţă, cercetătorii utilizează metodele corelaţionale pentru a identifica şi înţelege relaţiile
dintre o multitudine de variabile sau modul cum covariază ele. Îm acest tip de design de
cercetare variabila independentă este prezentă, dar nu se pune problema manipulării sale, ci a
identificării sale după ce faptele deja s-au produs. După ce ea a fost identificată, grupurile sunt
comparate între ele în virtutea experienţelor sau a structurii diferite pe care ele le-au avut,
ceea ce ar putea conduce la inferenţe valide cu privire la variabila independentă. Cu alte
cuvinte, designurile corelaţionale le amorsează şi le pregătesc pe cele veritabil-experimentale,
singurele care surprind relaţiile de cauzalitate.

Sumar
 Metodele de cercetare cantitative se numesc astfel pentru că ele convertesc rezultatele în
unităţi de măsură cuantificabile, în scopul analizei statistice.
 Adiţional, cercetătorul are cel mai adesea controlul asupra variabilelor de care el se
interesează.
 În astfel de cercetări există patru tipuri de variabile: independente, dependente, externe
(controlate şi necontrolate) şi interne (sau explanatorii).
 Design-urile de cercetare cele mai strâns asociate cu demersurile cantitative sunt: design-
urile real-experimental, cvasi-experimentul, design-urile pre-experimental şi cel
descriptiv.
 Designul experimental real implică asigurarea distribuţiei aleatoare (randomizate) a
subiecţilor în grupuri şi manipularea variabilei independente.
 Designul cvasi-experimental manipulează variabila independentă, dar nu asignează
distribuirea randomizată a subiecţilor în grupuri, pe care le ia deja constituite.

37
 Designul pre-experimental implică asignarea nerandomizată, cu manipulare, dar controlul
cercetătorului asupra variabilelor externe este cel mai mic din toate cele patru tipuri de
design.
 Design-urile descriptive includ ancheta, observaţia, studiul corelaţional şi cel cauzal-
comparativ. Aceste demersuri nu implică nici repartizarea aleatorie şi nici manipularea
variabilei independente. Ele constituie doar încercări ale cercetătorului de a caracteriza
evenimente ori condiţii ale populaţiei identificate.

Aprofundare
Trei probleme de interes în legătură cu designul de cercetare
a. Tipul de tratament al variabilelor: inima designului experimental sunt variabilele pe
care cercetătorul le poate manipula, adică variabilele independente (VI), care se şi află
de fapt sub controlul său. Există însă o multitudine de alte variabile de interes şi care
nu sunt manipulabile: apartenenţa de gen, de rasă, de condiţii socio-economice, de
nivel cultural etc. De aceea s-au dezvoltat unele tipuri de abordări, cum ar fi cele
comparative sau cercetările corelaţionale. Cu siguranţă că aceste variabile non-
manipulabile („etichetă”) pot fi combinate cu cele manipulabile în aşa-numitele studii
experimentale cu design factorial.
b. Efectele de ordine: în asemenea studii cercetătorii sunt preocupaţi de faptul că
expunerea la un tratament înaintea altuia are anumite efecte, diferite atunci când
tratamentul se administrează în ordine inversă. Pentru a contrabalansa efectul de ordine
se utilizează împărţirea grupurilor în care tratamentul se aplică într-o anumită ordine
(AB) şi - după măsurarea efectelor - se inversează ordinea (BA).
c. Aparierea (matching-ul): acolo unde randomizarea nu este posibilă (de exemplu în
cvasi-experiment), cercetătorul poate alege să „potrivească” participanţii după un
număr de variabile care prezintă importanţă (gen, vârstă, nivel de inteligenţă sau de
studii, dizabilităţi etc.). Potrivindu-i în perechi (de unde şi cuvântul apariere) între
grupul de control şi cel experimental cercetătorul poate controla câteva variabile
externe, dar problema care apare este chiar potrivirea în sine, care niciodată nu poate
realiza o echivalenţă perfectă. Participanţii pentru care nu s-a găsit o pereche potrivită
şi aproximativ echivalentă vor trebui eliminaţi din cercetare. Aparierea de mai mult de
una-două variabile este deja generatoare de foarte mari probleme tehnice.

38
3.5. Fişă de programare a cercetării
I. Definirea problemei
A. Raţiunea generală a studiului: de a determina dacă un organism aflat sub influenţa
unui drog puternic poate fi făcut să coopereze.
B. Ipoteza definită operaţional: de a determina efectele apomorfinei asupra
comportamentului de rozător al şobolanului şi de a vedea dacă şobolanul poate fi
condiţionat să-şi întoarcă capul cât se află sub influenţa apomorfinei.
II. Clasificarea variabilelor
A. VI (variabilă independentă): apamorfina.
B. VD (variabila dependentă): întoarcerea capului.
C. Variabila secundară: concentrarea drogului, modul de aplicare, greutatea
subiecţilor.
III. Tipuri de investigaţie
A. Tipul general de investigaţie: experiment de laborator.
B. Tipul specific de design: design de două grupe randomizate.

IV. Metoda
A. Subiecţii: 12 şobolani femele tip Lang-Evans cu glugă, vârsta de trei luni, greutatea
240-290 grame.
B. Instrumentarea: un tub restrictiv de 2/2 inci diametru, 7 inci lungime, a fost folosit
pentru ţinerea şobolanului în timpul experimentului. Două buloane, unul la fiecare
margine a tubului, trec prin centrul tubului pentru a ţine şobolanul înăuntru. La 1
inci de capătul tubului a fost plasată o celulă fotoelectrică, la 1/2 inci de centrul
său.
C. Procedura:
1. Fiecare şobolan evoluează în şedinţe de o oră pe zi, zece zile consecutive.
2. În timpul fiecărei şedinţe un şobolan a fost plasat în tub, cu capul în afara marginii.
3. De fiecare dată când şobolanul a întors capul suficient spre dreapta pentru a
întrerupe o radiaţie fotoelectrică, i s-a prezentat un bloc de lemn de ronţăit în faţa
sa, pentru 15 secunde, printr-o bară retractabilă.
4. În fiecare zi în tub au fost plasaţi 6 şobolani injectaţi cu un drog, în timp ce ceilalţi
au fost injectaţi intraperitoneal cu 2,0 mg/Kg cu apmorfină, 20 de minute înainte
de a fi puşi în tub.

39
5.Datele au fost prelucrate prin testul t, după formula În fiecare oră a fost înregistrat
numărul de întoarceri ale capului, pentru fiecare subiect în parte.
6.: Datele au fost prelucrate prin testul t, după formula:

x  x 
 
 A B
t
SS  SS  
A B  1 1 
  
 n  1   n  1  n 
     A nB 
 A   B 

V. Tipul de analiză: testul t


VI. Concluzii
1. Apomorfina induce un sindrom compulsiv de roadere la şobolani.
2. Efectele apomorfinei pot fi cuantificate empiric.
3. Se poate lucra cu subiecţii aflaţi sub influenţa unui drog puternic
şi de asemenea pot fi condiţionaţi pentru a emite anumite
comportamente.

3.6. Tipuri de experimente


3.6.1. Experimentul de laborator
Dacă vom considera caracterul provocat şi prezenţa unui control al variabilelor ca
fiind trăsăturile definitorii pentru experiment, ele se regăsesc în întregime în experimentul de
laborator, acesta fiind cadrul care permite în sens strict manipularea variabilelor. El
presupune scoaterea subiectului (subiecţilor) din situaţia obişnuită de viaţă şi introducerea
într-o ambianţă artificială, anume creată (camere, aparatură, condiţii şi programe special
create). Cu siguranţă că acest tip de experiment operează un anumit decupaj al realităţii, din
multitudinea de variabile care determină comportamentul fiind selectate doar câteva pentru a
fi verificate, altele fiind controlate, iar unele ignorate.
Experimentul de laborator are o serie de avantaje, care ţin în primul rând de precizie şi
rigurozitate, de faptul că oferă, pe lângă datele calitative, date cuantificabile (cantitative), ceea
ce permite stabilirea de relaţii cauzale între fenomene. Constituirea psihologiei ca ştiinţă
autonomă, prin desprinderea ei de filozofie, se datorează experimentului, "metoda cea mai
importantă, mai precisă şi mai fecundă" (Roşca, Al., 1971, p. 11). Limitările metodei ţin de
gradul ei mare de artificialitate: o parte din variabile îşi pierd realismul când sunt introduse în

40
laborator; unele elemente originale ale situaţiei reale se pierd, pentru a apărea altele generate
de noua situaţie; numai anumite variabile pot fi selectate din situaţia reală; experimentatorul
poate sugera involuntar ce aşteaptă de la subiecţi, care îşi modifică reacţiile în sensul aşteptat;
subiecţii, prin tendinţele de faţadă sau prin conformismul social, prezintă reacţiile care promit
recompensa aşteptată.
Perfecţionarea experimentului de laborator se face pe direcţia creării unor situaţii
experimentale cât mai apropiate de viaţa reală, dar, oricum, validitatea externă rămâne
problema lui ce mai mare. În fond artificialitatea situaţiei de laborator este punctul forte, dar şi
cel vulnerabil al metodei: pe de o parte printr-un mai bun control al variabilelor externe şi prin
posibilitatea explorării variabilelor complexe, el pune fără ambiguitate în evidenţă
cauzalitatea; pe de altă parte abstragerea variabilelor din contextul lor natural de acţionare,
combinarea lor după „reţeta” experimentală, constituie o denaturare a acţiunii lor. De aceea,
în timp ce unii văd în această metodă experimentul „pur”, „adevărat” sau „ştiinţific”, alţii
(Chapanis, apud Roşca, 1973, p. 12) „... observă că experimentele de laborator sunt numai
modele aproximative ale situaţiilor vieţii reale”.
Prezenţa experimentului poate induce aşa numitul efect Rosenthal în rândul
subiecţilor. Mai mult, el poate introduce (intenţionat sau nu) distorsiuni în înregistrarea
datelor, mai ales prin omiterea acelora ce contravin ipotezelor formulate. Unele erori pot fi
sistematice, involuntare (bias, în engleză), altele nesistematice (transcrierea greşită a unor
rezultate, înregistrări neatente etc.) Pentru a-l cita din nou pe Roşca, „fără îndoială că
aducerea subiectului în condiţii de laborator ridică numeroase obiecţii şi dificultăţi, dar ele nu
sunt de natură, nici pe departe, să invalideze experimentul” (op. cit., p. 12).

3.6.2. Experimentul natural, sau de teren


Metoda prin care experimentul îşi câştigă în bună măsură validitatea sa externă şi
ecologică este realizată prin mutarea locului său de acţiune din laborator, în viaţa reală, pe
teren, “în natură" (de unde şi numele său). Acest tip de experiment, complementar celui de
laborator, are în linii mari aceleaşi caracteristici: producerea fenomenului prin varierea
condiţiilor, repetarea lui etc.
Avantajele experimentului natural sunt numeroase: subiecţii sunt observaţi în
condiţiile lor naturale de existenţă; variabila independentă are caracteristici reale,
nemodificate; experimentatorul nu influenţează prin prezenţa sa (care poate fi chiar
disimulată, necunoscută) situaţia experimentală; motivarea subiecţilor nu este una extrinsecă
(recompensa aşteptată), ci este generată de situaţia reală, ceea ce poate oferi temeiul unor

41
generalizări mai valide. Din această cauză, experimentul natural, de teren, îşi găseşte o largă
zonă de aplicare în şcoală, în educaţie: introducerea unui procedeu nou de predare, urmărirea
efectelor evaluării şi examinării elevilor, modificarea programului de lucru, schimbarea
regulamentului de ordine interioară fac din această metodă o cale de studiere, dar şi de
ameliorare a procesului instructuv-educativ.
Şi totuşi câştigurile într-o direcţie (cadrul natural de desfăşurare, realism, validitate
externă) se fac cu preţul unor dezavantaje: intervin o serie întreagă de factori (externi sau
interni) care pot modifica conduita; controlul riguros al variabilelor este mult mai dificil; de
multe ori situaţia naturală ia pe nepregătite experimentatorul; multe din situaţiile naturale sunt
ireversibile, aşa că posibilitatea provocării şi repetării sunt foarte mici; complexitatea situaţiei
reale face dificilă selectarea şi punerea în legătură a variabilelor explanatorii, după o schemă
cauzală riguroasă.
Maurice Duverger (apud Celchea, S., 1982, p. 112) distinge experimentul de teren
pasiv şi activ (în primul cercetătorul nu manipulează variabilele, el anunţă o schimbare şi
caută înlănţuirea de fapte care a produs-o, în timp ce în al doilea caz el intervine direct sau
indirect în introducerea factorilor experimentali). După durata lor în timp, experimentul de
teren poate fi instantaneu sau de durată (extins pe luni sau ani de zile), iar după gradul de
cuprindere poate fi restrâns (clasă, echipă de muncă) sau foarte extins (o zonă întreagă sau o
mare colectivitate).

3.6.3. Experimentul psihopedagogic


O formă particulară a experimentului natural, cu largi aplicaţii în instrucţie şi educaţie
o constituie experimentul psihopedagogic. În cadrul oricărui experiment de acest tip avem
de-a face cu o multitudine de variabile, declanşate în principal de factorul uman (personalităţi
umane în interacţiune).
Experimentul psihopedagogic are două funcţii majore: cea constitutivă (cunoaşterea,
consemnarea, radiografierea situaţiei existente la un moment dat) şi cea formativ-ameliorativă
(introducerea în grupul studiat a unor factori de progres în vederea ameliorării situaţiei
constatate, schimbarea presupunând modificarea acţiunii educaţionale prin perfecţionarea
practicii educative nemijlocite). Cele două funcţiuni (gnoseologică şi praxiologică) se
presupun reciproc, pentru că produsul cunoaşterii este rezultatul unei acţiuni care, la rândul ei,
se desfăşoară conform cu rezultatele cunoaşterii.
Foarte frecvent verificarea superiorităţii unui procedeu didactic beneficiază de această
metodă: comparând performanţele elevilor înainte şi după introducerea unui nou procedeu

42
didactic, comparaţia clasei la care s-a predat tradiţional cu cea pe care s-a experimentat,
tragem concluzii valide asupra procedeului, aceasta fiind o cale de ameliorare a tehnologiei
didactice. Deşi nici o reformă din educaţie nu poate face abstracţie de investigaţii
experimentale prealabile, experimentarea în şcoală vizează câteva domenii cheie:
 studiul programelor de învăţământ sub raportul organizării volumului, gradului de
dificultate, succesiunii, ritmului, numărului de exerciţii necesare;
 ameliorarea tehnologiei didactice prin cercetări privitoare la metodele şi procedeele
didactice utilizate în predare, eficienţa predării;
 studiul personalităţii elevului în raport cu activitatea de învăţare (variabilele
psihologice şi psihosociale cu relevanţă în randamentul şcolar);
 cercetări privitoare la personalitatea profesorului, cu repercusiuni asupra activităţii de
predare-învăţare (stiluri de predare, variabile de personalitate implicate);
 investigarea randamentului şcolar prin ameliorarea tehnicilor de apreciere şi evaluare a
muncii şcolare (vezi Drăgan şi Nicola, 1993, p. 44).

3.6.4. Experimentul ex post facto


Încă John Stuart Mill împărţea experimentele în artificiale (în care situarea
experimentală este creată de cercetător) şi naturale (situaţia fiind oferită de natură), iar Claude
Bernard vorbea despre experimentele active (sau provocate) şi cele pasive (sau invocate).
Aceste distincţii s-au fixat în cuplul terminologic experiment proiectat şi experiment ex post
facto (Chapin, 1947), care are astăzi o largă acceptare.
Psihologii consideră că ne putem înţelege mai bine investigând nu numai prezentul şi
viitorul, ci şi analizând evenimentele trecutului, în încercarea de a detecta cauzele
schimbărilor actuale, bune sau rele. Există raţiuni importante pentru această investigaţie: este
imposibil să te reîntorci în trecut pentru a-l controla experimental, şi, în a doilea rând,
societatea nu ne-ar putea permite să provocăm şi să manipulăm variabile de genul război,
calamităţi naturale, revoluţii, epidemii. „Putem defini cercetarea ex post facto ca o
investigaţie empirică sistematică în care variabila independentă nu a fost direct controlată,
pentru că ea deja s-a produs sau pentru că ea este prin natura ei nemanipulabilă.” (Robinson,
1981, p. 80). În acest tip de experiment, activitatea cercetătorului seamănă cu cea a
detectivului care rezolvă o crimă, căci toate faptele ce au legătură cu un eveniment sunt puse
împreună pentru ca, printr-un proces de eliminare, cauzele nerelevante să fie înlăturate până
ce rămân cele care pot fundamenta o explicaţie validă.

43
Abilitatea de a determina relaţii cauzale este limitată în acest tip de cercetare, numită
studiu de teren ex post facto, deoarece un eveniment a apărut simultan cu altele şi, neputând
manipula variabila independentă, nu putem face inferenţa cauzală. Investigatorul construieşte
totuşi o ipoteză, defineşte o posibilă variabilă independentă şi identifică variabilă dependentă
actuală , încercând să tragă o concluzie asupra relaţiei dintre ele. Astfel, studiind persoanele
care nu au avut cancer, cele care trăiesc şi au cancer şi cele care au murit de cancer se poate
face o legătură strânsă între numărul de ţigări fumate şi maladia canceroasă, fără a putea însă
vorbi de cauzalitate în sens strict: experimentul ex post facto este o cale indirectă de a testa
ipotezele.
Şi totuşi acest tip de experiment are o mare răspândire pentru că nu costă prea mult,
poate apela la metode gen creion-hârtie, permite includerea unui număr mare de subiecţi, deci
o economie de timp însemnată. Limitările metodei pleacă de la lipsa de control a variabilelor
(deoarece variabila independentă nu poate fi manipulată) ceea ce poate genera o probabilitate
crescută de interpretare incorectă a datelor şi posibilitatea foarte redusă de a folosi procedee
statistice avansate pentru analiza acestora. În psihologie, C. Cox (1926) a dat o replică ex post
facto studiului experimental al lui Terman despre supradotaţi, calculând retroactiv QI-ul
pentru 510 persoane din istorie, considerate a fi fost eminente sau genii (vezi Copiii capabili
de performanţe superioare, 1981, p. 147).
Studiile de laborator ex post facto sunt o altă modalitate a acestei metode putând fi
definite ca investigaţii ştiinţifice de laborator în care variabila independentă nu este strict
controlată, deoarece ea a apărut deja, era prezentă. Investigatorul trebuie să explice o ipoteză,
să analizeze toate datele legate de eveniment pentru a putea trage concluzii. După
desfăşurarea unui anumit studiu experimental, cercetătorul intuieşte că există o relaţie între
unele variabile necontrolate şi fluctuaţiile variabilei dependente. De aceea ele vor fi selectate
şi vor deveni variabile independente într-un experiment controlat.
În unele cazuri, acest tip de experiment analizează variabile evazive, care s-au dovedit
a avea influenţă perturbatoare, într-un experiment iniţial, asupra variabilei dependente. Deci
ele sunt o cale de a scuti timp şi bani, prin identificarea surselor ce dau peste cap experimente
controlate. Fiind mai degrabă legate de disfuncţiile altor experimente, studiile de laborator ex
post facto au multe limitări, pentru că ele nu manipulează variabila independentă, variabila
secundară nu este controlată, informaţia dată de ele este strâns legată de experimentul propriu-
zis şi de aceea sunt considerate a nu fi o adevărată investigaţie, pentru că nu se autosusţin.
Rezultatele lor se vor publica, în consecinţă, odată cu studiul principal în care au apărut.

44
3.6.5. Alte tipuri de experimente
Sydenstriker făcea diferenţa între experimentul simultan şi succesiv, superpozabilă
experimentului transversal (controlul grupului experimental cu grupul de control) şi
longitudinal (comparaţia grupului experimental cu sine însuşi, la momente diferite de timp).
Putem apoi distinge între experimentul explanator (care nu are o ipoteză prealabilă şi
se montează pentru a vedea ce se întâmplă) cu cel de confirmare (de verificare a unei ipoteze
principale, explicit formulată). Există de asemenea experimentul pilot (un fel de repetiţie, pe
lot mic de subiecţi, a unui experiment, pentru a verifica corectitudinea designului
experimental), şi experimentul crucial (verifică ipoteza de bază, fundamentală, a unei teorii,
sau forţează alegerea între două ipoteze reciproc exclusive).
Toate aceste experimente pot fi înţelese prin opoziţie la experimentul „adevărat”, de
confirmare (sau provocat), în care fenomenele sunt provocate în condiţii controlate, pentru a
verifica ipoteza de cercetare, prin manipularea variabilei independente. Alţi autori (Zlate,
2000, pp. 128-129) vorbesc şi despre autoexperiment, experimentul cu un singur subiect şi
experimentul mintal ce şi-au găsit utilitatea în diverse domenii ale psihologiei (socială,
cognitivă etc.).

Autoevaluare
1. Analizaţi într-un mic eseu (una, două pagini) sursele de probleme pe care le are la
dispoziţie psihologul consilier şcolar pentru a conduce investigaţii de tip experimental.
2. Luaţi din literatura de specialitate un experiment şi analizaţi calităţile ipotezelor specifice.
3. Detaliaţi problemele care se pun în legătură cu alegerea subiecţilor unui experiment, sub
raportul preciziei şi al reprezentativităţii.
4. Definiţi principalele planuri experimentale.
5. Evaluaţi valoarea şi limitele cvasiexperimentului.
6. Construiţi o fişă de programare a unei cercetări experimentale imaginare, desfăşurate în
şcoală, după modelul propus în curs.
7. Comparaţi experimentul de laborator cu cel natural (sau de teren) în privinţa avantajelor şi
a dezavantajelor fiecăruia.
8. Evaluaţi locul şi rolul experimentului psihopedagogic în şcoală.
9. Arătaţi care sunt tipurile de experimente ex post facto, indicând pe scurt valoarea şi
deficienţele fiecărui tip.
10. Analizaţi specificul şi valoarea metodei experimentale în evoluţia psihologiei ca ştiinţă.

45
Bibliografie
1. Campbell, D.T., Stanley, J.C. (1963). Experimental and cvasi-experimental designs
for research and teaching. Chicago: Rand McNally.
2. Chelcea, S. (1982). Experimentul în psihosociologie. Bucureşti: Editura Ştiinţifică şi
Enciclopedică.
3. Cook, T.D., Campbell, D.T. (1979). Quasi-experimentation. Design and analys issues
for field settings. Chicago: Rand MacNally.
4. Hohn, M., Vârgă, D. (2000). Ghid practic de psihologie experimentală. Timişoara:
Tipografia Universităţii de Vest.
5. Houser, R. (1998). Counseling and Educational Research. Evaluation and
Application. Thousand Oaks, London, New Delhi: Sage Publications.
6. Van Dalen & Meyer (1996). Understanding Educational Research. New York:
McGraw Hill.

46
REZUMAT
Planuri experimentale de bază
R O1 X O2
R O1 O2
Design 1. Un singur grup cu pretest şi posttest
O1 X O2

Design 2. Design cu două grupuri - de control şi experimental, ambele randomizate -


cu fazele de pretest şi de posttest
Pretest Tratament Posttest
Grupul experimental R O1 X O2
Grupul de control R O1 O2
Pretest Tratament
Posttest
Grupul experimental 1 R O1 X (Metoda a) O2
Grupul experimental 2 R O1 X (Metoda b) O2
Grupul de control R O1 O2

Design 3. Designul cu patru grupe randomizate al lui Solomon


Grup Pretest Tratament Posttest Diferenţă
1. Pretestat R O1 X O2 1D O1, X, M, I
2. Pretestat R O1 O2 2D O1, M, I
3. Nepretestat R X O2 3D X, M, I
4. Nepretestat R O2 4D M, I

Design 4. Design cu grup de control randomizat, doar cu fază de posttest


Pretest Tratament Posttest
Grupul experimental R X O2
Grupul de control R O2

Design 5. Design cu grup de control nerandomizat, cu fazele de pretest şi de posttest


Pretest Tratament Posttest
Grupul experimental O1 X O2
Grupul de control O1 O2

47
Design 6. Design contrabalansat
Replicări Xa Xb Xc Xd
1 A B C D
2 B D A C
3 C A D B
4 D C B A
Media scoruri coloane

Design 7. Design cu grup experimental seriat în timp


Pretest Tratament Posttest
O1, O2, O3, O4 X O5, O6, O7, O8

Design 8. Design cu grup de control seriat în timp


Pretest Tratament Posttest
Grup experimental O1, O2, O3, O4 X O5, O6, O7, O8
Grup de control O1, O2, O3, O4 O5, O6, O7, O8

Pretest tratament postteste


Grup A O1 X O2
Grup B O1 X O2
Grup C O1 X O2
Grup D O1 X O2
Grup D O1 X O2
T1 T2 T3 T4 T5

Design-urile cvasi-experimentale
a. Designul cu grup de comparaţie static
Grup experimental X O2
Grup de control O2
b. Design cu grup de control neechivalent
O1 X O2
O1 O2

48
CAPITOLUL 4

DEZVOLTAREA SCALELOR

4.1. Introducere
O bună parte din activitatea practică a psihologului se sprijină pe diagnoza unor
aspecte cantitative ale aptitudinilor şi dimensiunilor definitorii pentru personalitate. În acest
scop el utilizează instrumente ale căror calităţi psihometrice trebuie construite şi evaluate în
cunoştinţă de cauză. În plus, pentru unele dimensiuni psihologice, pedagogice sau sociologice
specialistul trebuie să dezvolte singur scale destinate măsurării constructelor respective. Mai
mult, literatura domeniului face adesea referiri la aceste caracteristici, considerându-se
implicit valabil că psihologul este avizat în legătură cu aspectele tehnice implicate de
construcţia şi dezvoltarea scalelor psihodiagnostice.
Pe de altă parte, deşi se recunoaşte tacit că statistica este printre cele mai importante
instrumente al profesiunii de psiholog, ea determină încă o reacţie de rezistenţă, sau chiar de
respingere din partea studenţilor sau a novicilor, din cauza caracterului ei abstract şi
formalizat, sau a evoluţiei sale foarte rapide, prin care demersul matematic devine tot mai
sofisticat, parcă anume rezervat unei elite capabile să ţină pasul cu ceea ce s-a numit
„imperialismul metodologic” al ştiinţei. Capitolul pe care îl deschidem prin aceste rânduri
indică la modul clar cum o cunoaştere psihologică abstractă, de tip statistico-matematic,
devine extrem de utilă în contextul psihologic foarte concret al construcţiei de scale. El este
destinat a oferi reperele pe care psihologul, pedagogul sau sociologul trebuie să le aibă în
dezvoltarea scalelor de măsură a unor constructe specifice domeniului de activitate propriu.

4.2. Paşii de urmat în dezvoltarea scalelor

4.2.1. Pasul unu: determinăm cu claritate ceea ce dorim să măsurăm


a. Recursul la o teorie valabilă
Ne putem imagina efortul psihologului de a asambla un set semnificativ de mare de
itemi presupuşi a avea legătură cu constructul măsurat, de a-l aplica unei populaţii destul de
numeroase, de a introduce item cu item datele într-un program de prelucrare statistică, de a

49
desfăşura o analiză factorială exploratorie pentru a determina care itemi bat în direcţia
constructului presupus a fi măsurat şi care în alte direcţii, de a-i selecta şi reuni pe cei mai
reprezentativi într-o scală uni- sau multidimensională, de a determina gradul de consistenţă
internă (de omogenitate) al fiecărei subscale, stabilitatea ei în timp sau legătura cu constructul
măsurat prin corelare cu alte scale presupuse a măsura aceeaşi dimensiune. Un astfel de
demers – tipic pentru dezvoltarea unei scale – presupune un mare consum de energie şi el ar
putea să nu fie răsplătit cu rezultate corespunzătoare. Aceasta deoarece specialistul trebuie să
aibă o cunoaştere şi o conceptualizare prealabilă a domeniului care urmează să fie investigat,
fie din parcurgerea literaturii şi a teoriilor în legătură cu problema/ dimensiunea respectivă, fie
dintr-o experienţă prealabilă, fie – şi este cazul cel mai fericit – din amândouă direcţiile. Prin
aceasta dorim să afirmăm că aspectele tehnice care vor fi invocate în paginile care urmează nu
trebuie supraestimate în detrimentul înţelegerii naturii reale a conceptului sau faptului
psihologic care urmează a fi măsurat.
Recursul la teoriile cele mai consistente referitoare la acest construct este
fundamentală pentru că aceasta ne ajută şi ne ghidează în selectarea elementelor sale
esenţiale, care vor fi ulterior transformate în itemii scalei sau ai chestionarului. Multe dintre
dimensiunile şi constructele care definesc aspecte psihice, comportamentale sau sociale sunt
subtile, ambigue şi nu îşi găsesc o expresie directă sau deplină în experienţa de practician. De
aceea este foarte important să ne facem o idee cât mai clară despre ceea ce urmează a fi
măsurat. În acest sens teoria este de cel mai mare ajutor, pentru că ea ne ajută să ne facem o
idee clară asupra aspectului ce va fi abordat psihometric. Coroborând mai multe puncte de
vedere teoretice despre o problemă se degajă elementele sale esenţiale, dar şi neclarităţile sau
ambiguităţile, fapt care ajută specialistul să decidă dacă este necesară o nouă direcţie de
abordare şi să construiască o primă schiţă a acesteia.
De exemplu, suntem preocupaţi de o problemă practică, cum ar fi cea a tulburărilor de
citit-scris, şi observăm că această este mult mai frecventă la băieţi decât la fete. Am remarcat
de asemenea faptul că printre disgrafici şi dislexici proporţia stângacilor este de câteva ori mai
mare decât în restul populaţiei, ceea ce ne îndreptăţeşte să credem că aceste tulburări sunt
asociate cu probleme de lateralizare (manuală şi/sau corticală) a unor funcţii importante. De
aceea am dori să creăm un instrument care să fie utilizat ca adjuvant în tulburările
instrumentale şi care să diagnosticheze gradul de lateralizare manuală.
Literatura domeniului dominanţei manuale ne atrage atenţia asupra câtorva aspecte
esenţiale:

50
 stângăcia poate fi ereditară sau non-ereditară, adică produsă prin alte mecanisme, cum
ar fi excesul de testosteron din primele luni de sarcină, care inhibă dezvoltarea
emisferei stângi, cel mai adesea dominantă în populaţia de bază, sau stângăcia
accidentală, prin scoaterea din uz a mâinii dominante un interval mai lung de 8 luni;
 mecanismul asimetriei cerebrale are o transmitere genetică, gena LRRTM1 având o
mare contribuţie la aceasta, ea fiind însă implicată şi în producerea schizofreniei;
 există o genă (rs după expresia lui Annett, 197219) care controlează orientarea levogiră
sau dextrogiră a unei persoane;
 lateralizarea manuală se asociază strâns cu lateralizarea corticală a limbajului şi cu
dominanţa cerebrală;
 lateralizarea manuală este impusă şi de presiunile socio-culturale enorme pentru
utilizarea mâinii drepte, presiuni evidenţiabile la aproape toate popoarele, din toate
timpurile, în unele culturi ea având şi importante conotaţii religioase;
 rata stângacilor este aproximativ constantă (10% din populaţie) de-a lungul timpurilor,
deşi de-a lungul vieţii nuei singure persoane ea pare a fi într-o descreştere accentuată
spre vârstele adulte, datorită mortalităţii mai accentuate a stângacilor, de unde şi
speranţa de viaţă mai redusă a acestora;
 bolile autoimune, alergiile, tulburările de somn, depresiile şi tentativele de suicid,
alături de problemele de învăţat, balbism şi enurezis nocturn sunt mult mai frecvente
pentru stângaci;
 problema lateralizării nu se pune doar pentru utilizarea preferenţială a unei mâini, ci şi
pentru picior, hemicorp sau pentru organele de simţ cele mai performante (ochi şi
urechi), putându-se vorbi de o lateralizare omogenă sau eterogenă (încrucişată);
 problemele de citit-scris-vorbit apar mai frevent la anumite categorii de stângaci
(lateralizare încrucişată, nefamilială, patologică etc.);
 s-a avansat ideea că modul de tratare cerebrală a informaţiei de către stângaci este mai
curând integrat-holistic şi nu analitic-discursiv ca la dreptaci, de unde şi plusul lor de
creativitate;
 stângacii se întâlnesc mult mai frecvent printre cei care urmează meserii vizuale, şi
foarte rar în cele dependente de limbă;

19
Annett, M. (1992). Spatial ability in subgroups of left- and right-handers. In British Journal of Psyuchology,
83, pp. 493-515.

51
 măsurarea gradului de lateralizare cunoaşte câteva metode20 de tip chestionar, dar pot
fi gândite şi metode bazate pe acţiune şi observare (Annett, 1972);
 dincolo de stângăcia „tare” sau dreptăcia „tare”, există variantele lor mai moi, o
multitudine de probleme fiind asociate mai curând cu lipsa unei lateralizări ferme,
decât cu stângăcia în sine;
 stângăcia pare să aibă efecte dezadaptative şcolar mult mai mari printre elevii de gen
masculin decât printre cei de gen feminin.

Din toată această masă de informaţii şi din altele de acelaşi tip trebuie extrasă cea de
interes pentru scopurile scalei ce va fi construită şi apoi conceptualizată. Operaţionalizarea
enormei mase de informaţii despre stângaşi şi stângăcie înseamnă traducerea acesteia într-o
formă care să poată fi măsurată, în cazul nostru sub forma itemilor unui chestionar sau a unor
probe practice care vor compune itemii unui test de lateralitate. Aşa cum se observă, unele
dintre informaţiile de mai sus par a fi mai importante decât altele, având rolul de a ghida
întregul demers de construcţie a scalei. Mergând de exemplu pe modelul genetic al lui Annett
vom putea determina opt categorii referitoare la lateralitatea manuală. Dacă avem în vedere
problema omogenităţii/eterogenităţii lateralizătii va trebui să generăm şi să includem în scală
itemi legaţi de preferinţa pentru membrele inferioare, pentru ochi, ureche, hemicorp. Dacă
luăm în calcul dimensiunea ereditară a stângăciei vom avea itemi legaţi de frecvenţa acestei
particularităţi printre rudele apropiate, iar dacă avem în vedere dimensiunea ei evolutivă pe
scala vârstelor vom avea itemi care să distingă între manifestările timpurii şi cele ulterioare
ale stângăciei.

b. Nivelul de specificitate al scalei


Din exemplul de mai sus se poate vedea că problema lateralizării poate fi abordată
într-un cadru mai larg şi mai general sau într-un cadru mai restrâns şi mai specific. Faptul de a
fi mai globală poate fi un avantaj, dar preţul plătit este o lungime mai mare a scalei şi o
consistenţă internă mai scăzută. Se ştie că, cu cât nivelul de specificitate este mai ridicat,
itemii se corelează mai strâns între ei şi cu constructul sau variabila latentă măsurată. De
exemplu, dacă chestionarul de lateralitate construit este unul antropologic, el va include itemi
care privesc atitudinea culturală faţă de dextralitate, cum ar fi dacă ai prefera să fii operat de

20
Oldfield, 1971: Edinburgh Handedness Questionnaire; Annett, 1970: Laterality tests and interests.

52
un chirurg dreptaci sau stângaci (Holder, 1992, Hand Preference Questionnaire21); dacă scala
este destinată vârstei de peste 14 ani, ea poate fi una care doar întreabă oamenii despre mâna
cu care scriu, desenează, taie, aruncă, se perie, mătură, deschid o cutie etc. (Edinburgh
Handedness Inventory, EHI, Oldfield, 197122); dacă este destinată determinării obiective a
mâinii dominante, se vor folosi itemi acţionali, grupaţi într-o scală ca cea a lui Annett, unde se
folosesc în acţiune efectivă cocoloaşe de hârtie, foarfece, chibrituri, periuţă de dinţi, ciocan de
jucărie etc. Copiii pot fi examinaţi şi în clasă, cerându-li-se să se joace în perechi pentru a
exersa acţiunile care vor fi observate, fapt ce va face posibilă completarea grilei de observaţie
sau a chestionarului acţional de către observator.
Într-o abordare de tip obiectiv noi23 am propus determinarea unui indice de lateralitate
prin două probe de tip acţiune, cronometrate: tapping (puncte bătute rapid pe o foaie de hârtie
cu creionul, cu mâna dreaptă, apoi cu mâna stângă, câte 10 secunde pentru fiecare, singura
constrângere fiind numărul de puncte) şi trasaj (linii verticale, drepte, apropiate, executate
rapid, câte 6 secunde cu mâna dreaptă, apoi cu cea stângă, după o execuţie demonstrativă
prealabilă a examinatorului).
Gradele de specificitate şi de obiectivitate cele mai ridicate sunt în ultimul exemplu,
deoarece probele sunt simple, clare, uşor de testat, iar dispozitivul de înregistrare este unul
precis. Mai mult, se operaţionalizează bine problema lateralizării pentru sarcinile motrice
grosiere şi pentru cele de fineţe, ambele fiind agregate într-un concludent Indice motric.
De această cerinţă a specificităţii se leagă şi problema a ce includem în scală pentru a
fi măsurat. În cazul de mai sus distincţia este evidentă: itemii sunt de tip autoraportare (primul
exemplu), rezultaţi din observaţie (al doilea exemplu) sau rezultaţi din măsurarea efectivă a
unor comportamente induse (al treilea exemplu).
Dacă am alcătui o scală care amestecă cele trei maniere de obţinere a itemilor ar
rezulta probabil un instrument compozit, eterogen, mai puţin maniabil. Problema se referă
însă nu numai la cum sunt produşi itemii, ci şi la conţinutul lor. De exemplu, dacă concepem
anxietatea ca pe un fenomen psihic (o teamă difuză, fără obiect) nu are rost să amestecăm
elemente somatice într-o fenomenologie psiho-comportamentală. Dar dacă am relevat
conotaţiile psihosomatice ale acesteia, putem concepe şi operaţionaliza anxietatea mult mai
nuanţat, dintr-o parte afectivă, una cognitivă şi una somatică, cum a procedat Burns în

21
Holder, M.K. (1992). Hand Preference Questionnaire: One Gets What one Asks For. M. Phil thesis,
Department of Antropology, Rutgers University, New Jersey, USA.
22
Oldfield, R.C. (1971). The assessment and analysis of hanhdedness: The Edinburgh Inventory.
Neuropsychologia, 9, pp. 77-114.
23
Clinciu, A.I. (2003). Vizual şi auditiv în structura cognitivă umană. Teză de doctorat nepublicată.
Universitatea Bucureşti, Facultatea de Psihologie şi Ştiinţele Educaţiei.

53
chestionarul său. Acesta şi-a construit Inventarul de anxietate astfel încât indicele global
obţinut să fie o expresie a sentimentelor anxioase, a gândurilor anxioase şi a simptomelor
anxioase de ordin fiziologic. Această perspectivă asupra anxietăţii este mult mai nuanţată şi
mai utilă într-o cercetare despre stres decât una care ar evalua doar aspectele cognitive sau
afective ale acesteia.
Pe de altă parte, într-un chestionar de scheme cognitive anxioase ar trebui respectată
reţeta cognitivistă de abordare, fiind eliminate referirile somatice la anxietate, în favoarea
cogniţiilor patologice.

4.2.2. Pasul al doilea: generarea unui set mare de itemi


a. Lungimea şi redundanţa setului iniţial de itemi
Pasul acesta presupune crearea efectivă a unui mare număr de itemi, posibili candidaţi
la forma finală a scalei. Aceştia trebuie să fie gândiţi astfel încât să fie efectiv în legătură cu
constructul latent măsurat, deşi dovezile în acest sens vor fi culese mai târziu. Scopul de
ansamblu al scalei va fi cel care ne ghidează în procesul de generare al itemilor, care sunt
proiectaţi fiecare ca un mic test separat, corelat cu variabila latentă măsurată. Dacă fiecare
item este sensibil asociat cu această variabilă, prin agregarea unui număr mare de itemi se
speră ca scala rezultată să fie o expresie mult mai concludentă a variabilei sau a constructului
respectiv. Un test/scală bun(ă) este aşa datorită celor mai mici unităţi care îl compun şi care
sunt itemii săi.
Universul itemilor care descriu un construct psihologic este foarte larg şi deschis, de
aceea nu se pot stabili cu precizie graniţele sale. Vom fi de acord însă că putem asambla un
număr mare de itemi, că aceştia pot corela ridicat între ei la un nivel ridicat, scala fiind una
omogenă, fără ca doar prin aceasta ea să fi prins esenţa constructului respectiv. Fericire, sens
existenţial, satisfacţie în muncă, adaptare şcolară sau la locul de muncă, complianţă, identitate
sexuală, satisfacţie maritală etc. sunt concepte vagi, care au nevoie de un cadru teoretic care
să le clarifice, dar şi de o bună experienţă pentru a genera itemii care să le surprindă esenţa.
O problemă importantă a acestei faze de construcţie a scalei este cea a redundanţei:
trebuie ea evitată, trebuie admisă, şi până la ce nivel? Teoreticienii admit că, atunci când vrem
să construim o scală, redundanţa nu este deloc un lucru rău, aceasta deoarece itemii
redundanţi sunt şi intercorelaţi, prezenţa lor ducând la creşterea consistenţei interne a scalei.
Singura problemă este să avem o redundanţă bună, folositoare, care se referă la constructul
măsurat, şi nu la aspecte incidentale ale itemilor, cum ar fi acelea legate de detalii minore de
formulare. Când exprimi aceeaşi idee în două moduri distinct diferite redundanţa respectivă

54
poate fi utilă, pentru că nu putem şti cu suguranţă care dintre formulări este mai diagnostică şi
mai bine acceptată de subiecţi. De exemplu „Nu am nici un fel de jenă în a aborda persoane
necunoscute” şi „Îmi vine uşor să intru în vorbă cu persoane necunoscute” sunt enunţuri
foarte similare, deoarece au în vedere dimensiunea inhibiţiei, definitorie pentru fobia socială.
Diferenţele nu sunt însă pe sensul principal al enunţurilor, ci pe conotaţiile rezultate din
modul de exprimare al ideii: în prima situaţie propoziţia începe negativ, în a doua afirmativ;
în prima cuvântul jenă are şi conotaţii etice („fără ruşine”), ceea ce nu este cazul în a doua; în
prima formulare a aborda este mai pretenţios decât mai familiarul a intra în vorbă. Nu ştim
însă care dintre cele două formulări este cea mai bună şi de aceea le putem include în forma
iniţială a scalei, urmând să amânăm decizia legată de selecţia celui mai bun item până la
prelucrarea datelor rezultate din aplicarea instrumentului.
O regulă spune că putem tolera o oarecare redundanţă şi în faza finală de construcţie a
unei scale, deşi teoretic este permisă mai multă redundanţă în faza iniţială decât în cea finală,
pentru a da ocazia constructorului scalei să-şi manifeste preferinţele şi să selecteze forma mai
bună a itemilor redundanţi.
Problema redundanţei angajează direct o problemă la fel de importantă, cea a
numărului de itemi care compun setul iniţial. Noi ştim că un atribut fundamental al scalei
este consistenţa sa internă şi că aceasta este dependentă de două lucruri: de gradul de corelare
al fiecărui item cu scorul final la constructul măsurat şi de numărul de itemi ai scalei. De
aceea putem afirma că, cu cât un set iniţial de itemi este mai larg, cu atât este mai bine,
deoarece avem de unde selecta. Trebuie ştiut însă foarte bine că un set de itemi prea extins,
dintre care mulţi se repetă, poate genera consumuri de timp suplimentare, sau chiar plictiseală,
putând compromite sinceritatea şi autenticitatea răspunsurilor. De aceea cercetătorul poate
elimina din start itemii neclari, cu relevanţă scăzută sau cu prea multă similaritate, pentru a
rămâne în final la un set iniţial rezonabil, pe care să-l aplice într-o singură şedinţă, pentru a nu
avea prea multă „moarte experimentală”.
Deşi nu există reguli fixe, paritatea dintre lotul iniţial de itemi şi cel final poate fi de
de 4/1 sau 3/1 (30-40 de itemi iniţiali pentru o scală de 10 itemi) sau, cel mai adesea de 2/1,
atunci când itemii sunt construiţi cu grijă şi cu o bună cunoaştere a constructului măsurat.
Deoarece forma iniţială depinde de cea finală, cât de lungă trebuie să fie o scală pentru a avea
calităţi psihometrice bune? Este un răspuns dificil de furnizat, deoarece fiecare item poate fi
considerat ca o singură scală şi există chiar scale alcătuite dintr-un singur item.24 În mod

24
Torque Test este o probă cu un singur item care îşi propune să determine simultan preferinţa manuală şi
dominanţa cerebrală. Subiectul îşi scrie numele cu o mână şi apoi îl încercuieşte, după care face acelaşi lucru cu

55
obişnuit, cu cât o scală are mai mulţi itemi, cu atât mai mult ea poate dispune de calităţi
psihometrice (fidelitate, validitate, sensibilitate) mai bune; 50-60 de itemi pentru o scală
unidimensională reprezintă limita de sus, iar 10-20 de itemi limita de jos. Scalele sub 10 itemi
pot fi utile instrumente de screening, dar nu diferenţiază decât grosier între subiecţi, pe când
scalele lungi dau diferenţieri de mai mare fineţe.

b. Reguli de scriere a itemilor unei scale


Deşi procesul cel mai delicat, mai creativ şi interesant din toată ciclicitatea descrisă
aici, scrierea itemilor nu este strict normată, lăsând loc masiv inspiraţiei, creativităţii şi
experienţei în domeniu. Scopul acestei etape este pur şi simplu acela de a identifica o
multitudine de maniere în care constructul se leagă de viaţa reală sau de comportament.
Pentru aceasta recursul la instrumente similare, la literatura (adnotată) a problemei pot fi
foarte utile („itemi de import”), dar la ce bun să încerci să compui o scală când deja există
altele similare? Motivul pentru care încercăm altceva este pentru că sperăm să o facem mai
bine decât alţii sau pentru că mergem pe o cale nouă şi nebătătorită. A scrie repede, la
inspiraţie şi relaxând spiritul critic poate fi cel mai recomandat, deşi personal cred că această
fază este cu atât mai productivă cu cât creativitatea şi spontaneitatea ei sunt mai bine pregătite
prin faza de documentare teoretică (parcurgerea literaturii aferente pentru a ne face o idee
cuprinzătoare şi nuanţată despre constructul în cauză) şi prin faza de incubaţie/gestaţie, când
lăsăm informaţia „să dospească” şi să se decanteze.
Un creator avizat ştie că înainte de a se aşterne pe scris itemi el trebuie să aibă o
reprezentarea complexă şi nuanţată a constructului de măsurat; că a notat determinările
esenţiale ale acestuia pe o foaie de hârtie, pe care le-a studiat încercând să le pună mental în
legătură cu tema scalei sale, pentru a-l orienta ca un fel de ghid. De exemplu, fericirea
conjugală depinde ea doar de calitatea vieţii sexuale a cuplului, sau şi de implicarea soţilor în
responsabilităţile casnice (creşterea copiilor, elaborarea bugetului şi a modului de cheltuire a
banilor, implicarea în curăţenie), de calitatea comunicării dintre soţi, de gradul de
independenţă reciprocă acordat, de valorile comune, de toleranţa faţă de profesia celuilalt, de

cealaltă mână. Mâna care produce cea mai frumoasă scriere este cea preferată; dacă ambele cercuri sunt orientate
în sensul acelor de ceasornic, dominanţa cerebrală este de dreapta; dacă ambele cercuri sunt orientate în sensul
invers acelor de ceasornic, dominanţa cerebrală este de stânga; dominanţa cerebrală este mixtă în situaţia în care
un cerc are o orientare şi celălalt orientarea inversă.
Testul pare seducător prin simplitate şi acurateţe, dar are multe inconveniente. Asfel, mai ales în cazul scrierii,
preferinţa manuală poate fi impusă prin educaţie, subiectul efectuând multe alte acţiuni cu cealaltă mână. La o
singură aplicare poate interveni cu o oarecare probabilitate hazardul; nu ştim nimic de faptul dacă preferinţa
pentru mână se extinde şi asupra piciorului etc. (Vezi Molly Kalafut, Left-handedness. Nature or Nurture,
Blessing or Course?).

56
acceptarea prietenilor partenerului, de multitudinea de proiecte şi interese comune, de jocurile
comune, de aspectele hedonice şi nonhedonice ale relaţiei etc.?
Deşi este foarte greu de fixat reguli, dăm mai jos câteva caracteristici ale itemilor
buni şi răi, indicând şi cele mai frecvente erori care pot apărea în scrierea acestora.
 Deşi nu este indicat să sacrificăm înţelesul itemilor în favoarea scurtimii lor se
recomandă ca itemii să fie scurţi şi clari. Putem formula acelaşi item astfel: „La o
petrecere reţin cu uşurinţă chipurile şi numele musafirilor”; „Îmi trebuie destul de mult
timp şi am adesea mari probleme în a memora de la prima întâlnire numele sau
chipurile invitaţilor la o petrecere mai mare”. Al doilea enunţ este de evitat pentru că
este lung şi neclar, pentru că introduce termenii destul de mult şi mai mare care sunt
vagi.
 Nivelul de dificultate al citirii la care sunt scrişi itemii este de asemenea important.
Iată doi itemi din Miller Marital Locus of Control: „Adesea găsesc comportamentul
soţului meu nepredictibil”; „Când suntem în conflict, soţul meu este acela care
reconciliază cel mai adesea situaţia”. Cuvintele nepredictibil şi reconciliază ţin de un
nivel mai ridicat de cultură, fiind pretenţioase în raport cu omul comun. Deşi există o
mulţime de metode de a determina vârsta lecturii, s-a căzut de acord că nivelul de
lectură al omului care citeşte ziarul este corespunzător clasei a şasea (12 -13 ani).
Multe chestionare de personalitate (MMPI, CPI) presupun o vârstă a lecturii tipică
acestui nivel, fenomen de care dacă nu ţinem seama, reducem spectrul de utilizare al
unui instrument doar la anumite categorii de persoane. O propoziţie de lungime medie
pentru clasa a şasea are între 14 - 18 cuvinte şi 24 de silabe; pentru clasa a şaptea ea
are 18 cuvinte şi 24 de silabe. Pentru majoritatea instrumentelor care aspiră spre o
utilizare extensivă în populaţie nivelul de lectură anticipat este între clasa a cincea şi a
şasea. Dificultatea citirii şi înţelegerii unui text provine nu numai din lungimea sa, ci şi
din caracteristicile sintactice şi semantice ale itemului.
 Cele mai frecvente erori de evitat sunt negaţia, dubla negaţie şi enunţurile dublu
încapsulate (cu dublă determinare). De exemplu formularea „Nu-mi place să nu-mi fac
temele” trebuie evitată, pentru că răspunsul solicită un efort de analiză mare iar
rezultatul final este nesigur. De fapt şi negaţia simplă creează probleme de claritate: la
itemul „Nu-mi plac rromii” răspunsul Nu poate să semnifice simultan acordul (nu, nu-
mi plac) sau dezacordul (nu sunt de acord cu propoziţia respectivă). Dubla determinare
este mai greu de sesizat. „Mă enervează la culme invidia şi dorinţa de răzbunare a
oamenilor” pune respondentul în dificultate atunci când sursa enervării sale este ori

57
numai invidia, ori numai dorinţa de răzbunare. Scorul pozitiv la acest item nu distinge
dacă prima, a doua sau ambele determinări trebuie să fie prezente pentru a răspunde
afirmativ la itemul respectiv. Alt exemplu: „Sprijin drepturile rromilor pentru că
discriminarea este un păcat pedepsit de Dumnezeu”. Pot să sprijin drepturile rromilor
pentru că discriminarea este împotriva valorilor democraţiei, pe care eu le apăr, şi nu
pentru ea că este un păcat pedepsit de instanţa divină.

 Trebuie evitate pe cât se poate erorile de formulare care produc ambiguitate.


„Reprezentanţii noştri din guvern ar trebui să susţină cu mai mulţi bani cercetarea
ştiinţifică” induce confuzie din cauza pronumelui noştri: se referă la noi ca popor, la
noi ca grup de partid sau la noi, cei din sistemul de învăţământ? Alteori confuzia
pleacă de la utilizarea formei adjectivale în locul substantivului: „Tratamentul
diabetului trebuie să fie o prioritate a sistemului de sănătate” sună mai bine şi mai clar
decât „Tratamentul diabeticilor trebuie să fie o prioritate a sistemului de sănătate”,
pentru că un sistem de sănătate se luptă cu boala la modul cel mai general, şi abia în
secundar cu cei care i-au căzut deja victimă. La aceste surse de ambiguitate se mai
adaugă şi propoziţiile cu dublu înţeles. „Guvernul N. a dat în primire corect gestiunea
ţării” poate produce multă ilaritate şi confuzie printre respondenţi din cauza sintagmei
a da în primire care în jargon înseamnă a muri.
 Propoziţii cu conţinut pozitiv şi negativ prezente în aceeaşi scală constituie o
precauţie necesară pentru a evita distorsionarea răspunsurilor subiectului prin nevoia
de conformism, de a fi de acord sau de a consimţi. În chestionarul de Stimă de sine
(RSE) al lui Rosenberg (1965) propoziţia „Aş vrea să am mai mult respect pentru
mine” este urmată de „Uneori mă simt inutil”, ambele afirmative ca formă, dar una cu
conţinut pozitiv iar celaltă negativ. Acest lucru obligă respondentul să evalueze cu
atenţie fiecare item înainte de a da un răspuns, ceea ce duce la evitarea tendinţelor de
contaminare pe care l-ar produce formularea exclusiv pozitivă a itemilor. DeVellis şi
Callahan (1993)25 remarcă faptul că această precauţiune de a introduce itemi cu
polaritate inversă, negativă, are un preţ, deoarece se poate produce o confuzie (mai
ales în cazul chestionarelor lungi) între gradul de acord al respondentului şi conţinutul
itemului, fără a mai ţine cont de polaritatea negativă şi de exprimarea tăriei atributului
de măsurat. Concluzia ar fi că itemii formulaţi în direcţie opusă au performanţe mai

25
DeVellis, R.F., Callahan, L.F. (1993). A brief measure of helplesness: The helplesness subscale of
Rheumatology Attitude Index. Journal of Rheumatology, 20, pp. 866-869.

58
slabe decât cei cu orientare directă şi că dezavantajele includerii lor în scală atârnă mai
greu decât presupusele beneficii. Soluţia ar fi, mai ales pentru chestionarele mai lungi,
ca numărul acestor itemi să fie mai mic decât cei formulaţi pozitiv, dar să fie
diseminaţi printre aceştia.

4.2.3. Pasul al treilea: determinarea tipului de format al măsurătorii


Această chestiune are în vedere mai puţin itemul şi mai mult formatul tipului de scală
pe care subiectul va răspunde. Deşi mulţi autori nu fac distincţia între o scală şi un index
aceasta există şi trebuie luată în considerare. O scală diferă de un index prin aceea că într-un
index itemii nu au nevoie să fie puşi într-o anumită ordine, fiecare item având aceeaşi pondere
şi importanţă, ceea ce permite însumarea lor cu scoruri egale, rezultatul fiind chiar indexul. În
sens foarte larg, o scală este un set de numere ori de alte simboluri utilizate pentru a desemna
caracteristici ale unei variabile şi care este utilizată pentru măsurare. Numerele de pe un
termometru sau cuvintele „mic” „mediu” şi „mare” de pe cutia de aer condiţionat sunt scale.
Vogt (1999, p. 256) distinge şi un înţeles mai special al cuvântului scală care este „un grup de
măsuri relaţionate cu o variabilă. Itemii dintr-o scală sunt aranjaţi într-o anumită ordine a
intensităţii sau a importanţei lor.”26

a. Scalele Likert sau de tip Likert


Sunt cele mai larg utilizate în ştiinţele sociale pentru determinarea atitudinilor datorită
faptului că sunt uşor de construit şi tind să aibă o mare fidelitate, ele fiind potrivite şi pentru
cosntrucute multidimensionale. Răspunsurile respondentului sunt gradate de la Puternic de
acord, De acord, Nici acord, nici dezacord, Dezacord, Dezacord puternic. Tipul de expresii
verbale pentru a măsura intensitatea poate varia considerabil, subiecţii putând fi chestionaţi
dacă aprobă în totalitate, aprobă parţial, dezaprobă uşor, dezaprobă în totalitate. Deoarece
scalele Likert sunt destinate opiniilor, credinţelor şi atitudinilor, este o problemă alegerea
răspunsurilor potrivite pentru categoriile extreme, care nu trebuie să fie de genul întotdeauna
sau niciodată, pentru că aceste situaţii se întâlnesc destul de rar în viaţa reală. În consecinţă
ele vor fi alese cât mai rar, pentru a nu contribui prin aceasta la descreşterea variabilităţii
scorurilor pentru itemul respectiv.
De fapt, scalele Likert au o interesantă caracteristică, rezultată din faptul că ele au
două modalităţi de a grada intensitatea constructului respectiv pentru populaţia studiată. Una

26
Vogt, W.P. (1999). Dictionary of Statistics and Methodology. A Nontechnical Guide for the Social Sciences.
Sec. edition. Thousand Oaks, London, New Delhi: Sage Publications, p. 256.

59
ţine chiar de modalităţile de gradare a acordului/dezacordului din variantele de răspuns
propuse, fapt de care am vorbit deja.
O a doua modalitate ţine de tăria/slăbiciunea modului cum este exprimat itemul însuşi.
De exemplu, opinia despre politicienii români post-decembrişti ar putea fi exprimată la trei
niveluri de tărie („duritate”):
1. „Dezastrul moral şi economic din România post-revoluţionară este integral opera politicienilor
incompetenţi pe care i-am avut.”
2. „Deoarece nu am avut o clasă politică constituită în timp, liderii politici ai României post-
revoluţionare au întârziat evoluţia economico-socială a ţării din cauza greşelilor provocate de lipsa lor
de experienţă.”
3. „În pofida unor greşeli cauzate de lipsa de experienţă, politicienii români sunt pe cale să
construiască o democraţie reală în România post-revoluţionară.”

Cum tendinţa obişnuită a majorităţii oamenilor este aceea de nu fi – din bun simţ –
prea ofensiv-agresivi, prima afirmaţie ar putea discrimina doar printre cazurile extreme,
deoarece este una foarte tare. Ultima afirmaţie, care este cea mai moale şi mai împăciuitoristă
are un caracter mai agreabil, ar putea conveni majorităţii oamenilor, dar ar putea indica mai
mult lipsa opiniei, decât prezenţa ei. Ori o cercetare caută mai curând ceea ce este şi se
manifestă (prezenţa), decât ceea ce nu este (absenţa). Aşadar este o iluzie să credem că un
item poate baleia întreg spectrul unei opinii în unităţi de lungime egală. Avem doar
posibilitatea ca, din combinarea tăriei/slăbiciunii modului de formulare a itemilor şi din
tipurile de gradaţii de pe scala de răspuns folosită să „centrăm” itemul pentru zona
populaţională şi pe problema care ne interesează. Itemul trebuie să răspundă la întrebarea:
„Cum sunt dispuşi să răspundă oamenii la diferitele intensităţi sau tării ale constructului
măsurat prin acest item?”. Iată şi două exemple de itemi construiţi pe scala Likert:

Prin sistemul reformei de la Bologna, învăţământul românesc s-a integrat bine învăţământului
european.
1. Dezacord 2. Dezacord 3. Dezacord 4. Acord 5. Acord 6. Acord
puternic moderat uşor uşor moderat puternic
Combaterea consumului de ţigări este o prioritate naţională de vârf.
1. Complet 2. Mai curând 3. Aşa şi aşa 4. Mai curând 5. Complet
adevărat adevărat neadevărat neadevărat

60
b. Scalele Thurstone
Modalitate complexă, rafinată şi dificilă de a construi itemii unei scale, iniţiată de
Thurstone, acest tip de scală şi-a pierdut mult din relevanţă în favoarea scalelor Likert. În
principiu eleganţa şi dificultatea metodei vine din pre-calibrarea itemilor şi asamblarea lor
pentru a răspunde la diferite niveluri de prezenţă în item a atributului sau a constructului
măsurat. De regulă, în acest tip de scală răspunsurile nu mai au o multitudine de nuanţe,
deoarece gradarea intensităţii este pe verticală (mai mulţi itemi asamblaţi pe o aceeaşi coloană
în funcţie de mărimea progresivă a atributului măsurat), şi nu pe orizontală (modalităţi din ce
în ce mai accentuate ale intensităţii atributului la un singur item, tipic pentru scala Likert).
Astfel, pentru aceeaşi idee se generează mai mulţi itemi (care au formulări diferite) care să
reprezinte intervale egale de-a lungul unui continuum vertical, ceea ce conferă scalei
proprietăţi matematice remarcabile, pentru că se pretează la tratamente statistice tipice
scalelor de intervale. Nunaly (1978) susţine că este incomparabil mai uşor să explici principul
unei scale Thurstone decât să o construieşti. A găsi itemi care să „rezoneze” la intervale egale
cu constructul măsurat (ca un diapazon acordat pe o anumită frecvenţă) este destul de dificil.
Acest deziderat exprimat de scalele Thurstone şi-a găsit totuşi o manieră de rezolvare prin
Teoria răspunsului la itemi, unde calibrarea acestora urmăreşte totuşi un cu totul alt demers.

Prezentăm mai jos două răspunsuri tipice pentru scala Thurstone.

Exemplul 1.

Când un elev are dificultăţi de învăţare, profesorii:


Adevărat Fals
Îl insultă
Îl critică sau ironizează
Îi întrerup răspunsul
Nu au nici o reacţie
Îi explică suplimentar
Îl încurajează
Fac cu el pregătire după ore

61
Exemplul 2.
a. Faptul de a termina cu medie mare şcoala şi de a prinde un liceu bun este tot ce-mi doresc ca
răsplată de la copilul meu. Acord ........................ Dezacord ...................
b. Pentru mine ca părinte cea mai mare răsplată din partea copilului este să fie sănătos şi să meargă la
şcoală. Acord ........................ Dezacord ....................
c. Fericirea copilului meu nu are nimic de-a face cu ceea ce el dobândeşte prin educaţia şcolară sau cu
scopurile materiale. Acord ........................ Dezacord ....................

Modalitatea de gradare pe verticală şi de construire a ierarhiei nu este o operaţiune


foarte simplă. Metoda utilizată de Thurstone (1929) a fost cea a comparării perechilor de
răspunsuri, deoarece ea presupune ca subiecţii-observatori să judece de exemplu enunţurile A,
B, C luate câte două (A cu B, A cu C şi B cu C), să evalueze din frecvenţa aprecierilor ordinea
ierarhică a celor trei enunţuri, după care să construiască un indice pentru distanţa dintre ele,
care va fi exprimat în termeni de probabilitate prin raportarea la curba lui Gauss. Scala
obţinută în felul acesta va putea fi verificată: pornind de la valorile ei trebuie să se poată face
predicţii asupra viitoarelor alegeri ale indivizilor.27

c. Scalele Guttman
Acestea sunt un tip de scală creat de Louis Guttman. Original ea a fost destinată să fie
utilizată după ce datele au fost colectate, pentru a vedea dacă ietemii dintr-un index pot fi
aranjaţi într-o scală în funcţie de tăria sau de puterea lor. De exemplu, într-o cercetare despre
avorturi itemii unui chestionar pot fi aranjaţi ierarhic ca intensitate astfel:
Aţi fi de acord ca femeile să facă avort dacă:
1. A nu face avort i-ar periclita viaţa proprie?
2. Fătul este malformat?
3. Este prea săracă pentru a se putea ocupa în mod adecvat de copil?
4. Ea nu mai doreşte să aibă copii?

Cine ar răspunde la această întrebare ar face-o într-o manieră scalară: persoanele care au
răspuns afirmativ la întrebarea 4 ar fi răspuns afirmativ şi la întrebările 1, 2, 3; cele care au
răspuns la întrebarea 3 ar fi răspuns şi la întrebările 1 şi 2, dar nu obligatoriu şi la 4, şi aşa mai
departe. Dacă scala nu ar fi de tip Guttman, nu ar exista un astfel de pattern şi răspunsul
afirmativ la numărul 4 nu ar implica răspunsurile afirmative şi la celelalte 3 întrebări.

27
Vezi Laurens, S., Moscovici, S. (2007). Construirea scalelor. In S. Moscovici, F. Bruschini (coord.),
Metodologia ştiinţelor socioumane. Iaşi: Polirom, pp. 482-414.

62
Scalele Guttman sunt foarte utile şi indicate pentru informaţiile obiective sau în
situaţiile în care este logic necesar ca, dacă ai răspuns afirmativ la un anumit nivel dintr-o
ierahie, aceasta înseamnă să faci acelaşi lucru şi pentru nivelurile inferioare ale ierarhiei. De
exemplu, la întrebarea dacă fumaţi, variantele de răspuns pot fi organizate ierarhic astfel: nu
fumez deloc; fumez sub 10 ţigări pe zi; fumez sub 20 de ţigări pe zi; fumez sub 30 de ţigări pe
zi; fumez mai mult de 30 de ţigări pe zi. Variantele de răspuns sunt aranjate astfel că nivelul la
care este prezent atributul este indicat de cel mai de sus item la care subiectul a dat un răspuns
afirmativ, cei de sub el fiind şi ei implicit afirmativi (deoarece reprezintă niveluri mai scăzute
ale atributului). Deci această scală presupune o gradaţie şi decelarea punctului critic în care
răspunsul afirmativ devine negativ.
Dacă pentru informaţiile obiective scala Guttman este foarte indicată, pentru alte
categorii de fenomene este dificil de ordonat răspunsurile într-o manieră uniformă pentru toţi
indivizii, fapt care limitează utilizarea acestui tip de scală. Pentru situaţiile în care ordonarea
itemilor este importantă, modelele bazate pe teoria răspunsului la itemi par a oferi soluţii mai
adecvate. Prezentă mai jos doi dintre itemii scalei de depresie Beck, asamblaţi pe o scală
Guttman:
A. TRISTEŢE

1. Nu mă simt trist.
2. Mă simt trist.
3. Sunt trist tot timpul şi nu pot scăpa de tristeţe.
4. Sunt atât de trist şi de nefericit încât nu mai pot suporta.

B. PESIMISM

1. Viitorul nu mă descurajează.
2. Mă simt descurajat când mă gândesc la viitor.
3. Simt că nu am ce aştepta de la viitor.
4. Simt că viitorul este fără speranţă şi nimic nu se mai poate îndrepta.

d. Scala de distanţă socială Bogardus


Acest tip de scală a apărut în 1923, fiind destinată să măsoare distanţa socială, adică
distanţa care separă un grup de altul. De aici rezultă posibilitatea de a da o expresie
măsurabilă raporturilor de discriminare socială dintre grupurile etnice, naţionale sau

63
religioase. Scala Bogardus poate fi considerată în acelaşi timp şi o scală de proximitate
deoarece indică cea mai mică proximitate acceptabilă pentru un individ faţă de grupul luat în
considerare. Individul este chestionat dacă ar fi dispus, de exemplu, să trăiască în aceeaşi ţară
cu rromi; să trăiască în aceeaşi localitate cu aceştia; să aibă vecini rromi; să locuiască în
aceeaşi casă cu rromi; să aibă prieteni de etnie rromă; să aibă rude rromi; să aibă un copil care
se căsătoreşte cu o persoană de etnie rromă.
Populaţiile pot fi comparate simultan trecând pe verticală categoriile de proximitate iar
pe orizontală populaţiile ce vor fi comparate: negri, latino, europeni, asiatici, sau turci, evrei,
polonezi, spanioli etc., pentru America. Sau români, maghiari, saşi, ţigani, ruteni etc. perntru
România. Evident, distanţele studiate sunt unele sociale şi nu fizice, dar exprimarea în termeni
fizici a acestora este judicioasă. Acest tip de scală permite compararea atitudinilor grupurilor
faţă de alte grupuri deoarece enunţurile despre obiectul social studiat pot să fie astfel clasate
pentru a indica fie proximitatea, fie distanţa. „Scalele construite în acest fel dau rezultate în
acelaşi timp interesante şi valide” apreciază Laurens şi Moscovici (op. cit., p. 391).

e. Numărul optim al categoriilor de răspuns


Cei mai mulţi dintre itemii scalelor se prezintă sub forma unui trunchi comun care este
enunţul de bază al itemului, şi o categorie de descriptori care să indice gradul de
acord/dezacord al respondentului cu enunţul respectiv. Atenţia noastră ce centrează acum pe
această a doua categorie. Statistica ne învaţă că o caracteristică importantă a unui item sau set
de itemi este variabilitatea/varianţa. Teoria răspunsului la itemi determină tocmai relaţia
existentă între variabilitatea itemului şi a scalei ca întreg. Cu cât este mai mare această
variabilitate cu atât este mai bine, deoarece variabilitatea itemilor contribuie la creşterea
variabilităţii de ansamblu a întregii scale. Cu cât ea este mai mare, cu atât se pot determina
mai multe categorii de scor şi deci scala este mai discriminativă.
Variabilitatea unei scale depinde de doi factori: de numărul itemilor (cu cât mai mulţi
itemi, cu atât mai multă variabilitate) şi de numărul variantelor de răspuns pe care aceştia le
prezintă (cu cât mai multe, cu atât mai mare este şi variabilitatea itemului). De aici şi interesul
pentru problema abordată în acest paragraf. Vom distinge deci existenţa unor itemi cu o
manieră de scorare săracă. Deoarece sunt necesare cel puţin două posibilităţi de răspuns, acest
mod de operare poartă numele de scorare binară. În măsura în care există posibilitatea de a
avea o multitudine de clase de scor, să zicem 100, cum se poate distinge fără falsă precizie
între nivelurile 66 şi 67 de anxietate, de exemplu? Cu cât mai multe clasele de răspuns, cu atât

64
posibilitatea de a diferenţia realmente între valorile de scor apropiate descreşte. În practică
rareori se folosesc mai mult de 7-11 clase de scor şi foarte frecvent între 3 şi 7.
Opţiunea binară de scorare este frecvent utilizată, căci, deşi au cea mai mică
variabilitate a scorurilor per item, scalele de acest tip se completează extrem de facil şi rapid,
lăsând deschisă posibilitatea de a introduce un număr mai mare de itemi pentru a creşte
variabilitatea de ansamblu a scalei sau pentru a vedea cum noi categorii de fapte coroborează
cu constructul măsurat. Această manieră de scorare este tipică – dar nu exclusivă! – scalelor
Thurstone şi Guttman datorită complexităţii de construcţie a itemului, care agregă pe verticală
mai multe enunţuri gradate ierarhic. De asemenea, acest tip de itemi este numit şi cu alegere
forţată28. Datorita uşurinţei cu care se lucrează, opţiunea binară este extrem de utilă în
completarea listelor de adjective prin care se investighează trăsăturile de personalitate
(modelele Big Five).
Dacă la un pol sunt opţiunile binare, la celalălalt pol este numărul mare sau foarte
mare de clase de scor care pot aduce, cum am arătat anterior, o falsă precizie, adică o falsă
variabilitate. Din statistică ştim că variabilitatea poate fi descompusă într-o parte bună, numită
şi sistematică, deoarece este strâns legată de oscilaţiile reale ale prezenţei constructului
măsurat în item, şi dintr-o parte rea, de eroare. Deoarece creştarea variabilităţii pe scalele cu
număr mare de variante de răspuns se face în contul erorii, şi nu al variabilităţii sistematice,
nu este indicat să avem prea multe valori de scor. Numărul acestora este impus finalmente de
abilitatea respondenţilor de a discrimina semnificativ între variantele de scor propuse pentru
fiecare item. Această capacitate depinde şi de aranjarea în pagină a variantelor de răspuns
asfel încât acestea să sugereze un continuum. Astfel secvenţa:

Aproape niciodată Rareori Din când în când Deseori Aproape mereu

sugerează bine un continuu temporal, divizat în unităţi discrete de tipul frecvenţei de apariţie.
O problemă importantă este dacă optăm pentru un număr impar de categorii de
răspuns, ceea ce în principiu este bine, pentru că se creează o anumită simetrie în jurul unui
punct zero natural. Acest fapt oferă însă de multe ori indecişilor posibilitatea refugierii în
răspunsul evaziv din mijloc. Numărul par sau impar de opţiuni este mai puţin important decât
modul cum sunt aranjate variantele de răspuns astfel ca distanţele dintre ele să fie aproximativ
egale pentru a exprima gradul de acord sau de dezacord. Aceasta pentru că datele vor fi
codificate numeric prin cifre (1, 2, 3, 4, 5 pentru cinci variante de răspuns, de la foarte puţin

28
Atenţie, itemii cu alegere forţată nu sunt numai cei binari, de tipul Adevărat/Fals sau Da/Nu, ci şi unii itemi
pari pentru care, neexistând varianta ehivocă din mijloc („aşa şi aşa”), subiectul trebuie să opteze clar într-o
direcţie sau în alta.

65
sau deloc, la foarte mult sau în întregime, ori invers 7, 6, 5, 4, 3, 2, 1 pentru o scală care
începe de exemplu cu totdeauna şi se termină cu niciodată). Se poate construi astfel un
continuum divizat într-un număr de trepte (3-7 trepte), de la dezacordul total, la acordul
deplin sau invers.
În legătură cu punctul de simetrie din mijloc, el poate avea semnificaţii diferite. Astfel
nici acord, nici dezacord indică mai curând o atitudine apatică, pe când la fel de mult acord şi
dezacord sugerează o atracţie egală faţă de ambele variante de răspuns. Deci în cazul
numărului impar de variante de răspuns trebuie să controlăm ca subiectul să nu selecteze
varianta neutră doar pentru a evita o alegere, oferind astfel un răspuns echivoc, cu o valoare
discutabilă. În majoritatea situaţiilor cercetătorul încearcă să evite echivocul punctului central
şi să forţeze o alegere clară, dar trebuie spus că opţiunea pentru variante pare/impare de
răspuns este funcţie de întrebare, de răspus şi de scopul investigaţiei. Într-o cercetare cu două
variante extreme de răspuns (ce situaţii preferi: pe cele plicticoase?; pe cele primejdioase?)
introducerea variantei de răspuns între cele două poate fi pe deplin justificată, subiecţii
neputând alege întotdeauna între situaţii atât de tranşant delimitate.
Ca tip de format al răspunsurilor amintim şi diferenţialul semantic al lui Osgood şi
Tannenbaum (1955). Utilizat în studierea atitudinilor de grup, acest mod de scalare presupune
identificarea unui grup ce este studiat (să zicem avocaţi) şi a unei liste de perechi de adjective.
Onest __ __ __ __ __ __ __ __ __ Neonest
Competent __ __ __ __ __ __ __ __ __ Incompetent
Vorbăreţ __ __ __ __ __ __ __ __ __ Taciturn

Liniuţele (de regulă 7 sau 9) reconstituie un continuu între polii definiţi de cele două
adjective, subiectul marcând cu un X punctul de pe acest continuu pe care el crede că se află
membrii categoriei respective, după care trece la ratingul următoarei perechi de adjective,
până la epuizarea întregii liste. Prin prelucrarea separată pe fiecare pereche de adjective se
poate obţine un portret robot al grupului respectiv. Deoarece acest tip de scală are foarte multe
din caracteristicile necesare unor prelucrări matematice riguroase, finalmente itemii valoroşi
care au fost selectaţi pot fi asamblaţi într-o scală omogenă (de onestitate, de competenţă, de
moralitate etc.).

Analogul vizual reprezintă un format foarte similar cu cel precedent, cu o singură


diferenţă majoră: continuumul nu mai este segregat într-un număr discret de categorii de
răspuns, ci subiectul marchează efectiv un semn pe linia continuă dintre cele două adjective,

66
exact în locul unde crede că s-ar plasa opinia, credinţa sau experienţa sa. Ceea ce se
înregistrează şi se prelucrează este distanţa măsurată faţă de unul dintre poli (se porneşte de
regulă de la cel care înseamnă absenţa).

Nici urmă de frică _____________________________x_____________ Frică paralizantă

Deşi pare seducător, acest tip de scală are destul de multe dezavantaje. De multe ori
precizia sa este o falsă precizie, marcarea punctului pe linie implicând şi o doză de hazard sau
de circumstanţialitate. Un subiect va distinge cu greu între o frică de 6,7 cm de una de 6,5 cm.
Mai mult, asignarea valorilor scalei poate fi una idiosincratică, adică distanţele marcate să
aibă semnificaţii diferite de la un subiect la altul sau la acelaşi subiect la perioade de timp
diferite.
Şi totuşi, aceasta poate fi un tip de măsurătoare foarte utilă atunci când cercetările se
fac pe acelaşi subiect pentru a măsura diferenţele pe care tratamentul experimental le poate
aduce în tratarea fobiilor, în creşterea nivelului de motivaţie sau în alte direcţii. Astfel, dacă
scala Likert împarte un continuu într-un număr finit şi mic de categorii, fiind foarte maniabilă,
dar mai puţin sensibilă, scala analogului vizual poate fi sensibilă la diferenţe mici: dacă
răspunsurile la post-manipulare se depărtează semnificativ şi în aceeaşi direcţie în raport cu
faza de pre-manipulare, se pot detecta diferenţele mici pe care le-a adus tratamentul
experimental. Scala poate fi folosită şi ca una alcătuită dintr-un singur item, caz în care nu se
mai poate distinge cu claritate între instabilitatea măsurătorii şi instabilitatea fenomenului
măsurat. Prin urmare, cea mai bună strategie ar fi aceea de a dezvolta mai multe măsurătorii
de tipul analogului vizual pentru acelaşi fenomen, de a le asambla într-o scală şi de a-i
determina consistenţa internă (stabilitatea).

O ultimă problemă este cea legată de cadrul temporal la care pot face sau nu referire
itemii unei scale. Preluând distincţia pe care a făcut-o Cattell în legătură cu unele dispoziţii de
personalitate care au un caracter situaţional, în timp ce altele reprezintă structuri stabile de
personalitate numite trăsături, Spielberger a dezvoltat scala STAI, în fapt o măsură a anxietăţii
ca stare (conjuncturală) şi ca trăsătură de personalitate (stabilă). Se ştie de asemenea că multe
componente ale personalităţii au mai multă sau mai puţină stabilitate pe axa timpului:
fenomenologia afectivă de exemplu (emoţie, anxietate, depresie) este mai fluctuantă decât cea
cognitivă (inteligenţă, memorie).
O scală trebuie să facă referinţe şi la dimensiunea temporală? Răspunsul este
nuanţat: dacă constructul măsurat are o variabilitate temporală mare răspunsul este Da, dacă el

67
este stabil în timp (cazul trăsăturilor de personalitate) răspunsul este Nu. Astfel, chestionarul
de depresie Burns se aplică periodic pacienţilor depresivi pentru a monitoriza evoluţia
depresiei lor în timp. Multe chestionare care urmăresc aspecte fluctuante menţionează în
instructaj formule de tipul în ultima lună, în ultima săptămână, în ultimele zile, în ultimul timp
etc. Unele chestionare includ itemi destinaţi detectării modificărilor de dispoziţie apărute
recent (un eveniment stresant) sau pe perioade mai lungi de timp (reforma post-revoluţie,
intrarea ţării în NATO etc.). Chiar formatul de răspuns al itemilor poate avea în vedere
decuparea continuumului temporal în unităţi mai mici (uneori, din când în când, des, în
ultimul timp etc.).

Înainte de a supune judecăţii experţilor forma preliminară a unei scale, constructorul


trebuie să aibă în vedere dacă include sau nu şi scale de validare, care să diminueze sau să
controleze tendinţa respondenţilor la dezirabilitate socială sau la fraudă. De exemplu Sandra
Bem (BSRI, 1976), a inclus o scală de dezirabilitate socială ca tampon între itemii care
măsoară masculinitatea şi cei care măsoară feminitatea. Eysenck a inclus în EPI (Eysenck
Personality Inventory) o scală de minciună, devenită ulterior o scală de dezirabilitate socială
în EPQ (Eysenck Personality Questionnaire).
În forma veche, dar şi în cea revizuită a MMPI (Minnesota Multiphasic Personality
Inventory) Hathaway şi McKinley au propus mai multe scale de validare, care sunt primele ce
vor fi evaluate de psiholog pentru a determina de cât credit se poate bucura profilul unui
respondent. Problema validării se poate rezolva fie construind scale anume destinate acestui
scop, fie preluând unele deja existente pentru a le insera în chestionar pe post de distractor şi
de mijloc de control.

4.2.4. Pasul al patrulea: revizia setului iniţial de itemi de către experţi


Avizul experţilor este foarte necesar în legătură cu câteva probleme, sfatul lor
scutindu-ne de cheltuieli mari de resurse pentru obţinerea de rezultate discutabile ca valoare.
Expertiza acestora este necesară pentru a determina:
 faptul dacă definiţia şi operaţionalizarea fenomenului sau a constructului ce va fi
măsurat sunt bune sau în acord cu ceea ce şi ei ştiu despre acestea;
 cât de relevanţi sunt itemii selecţionaţi pentru a fi incluşi în formatul iniţial al scalei, în
raport cu constructul măsurat;
 claritatea, conciziunea şi alte elemente legate de modul de formulare al itemilor;

68
 evidenţierea fenomenelor sau a caracteristicilor importante asociate cu constructul ce
va fi măsurat care nu s-au materializat în itemi corespunzători, setul iniţial trebuind
deci augmentat cu noi itemi.
Prin revizuirea multitudinii de demersuri prin care vrem să surprindem constructul ce
ne interesează şi prin examenul critic al itemilor destinaţi acestui scop experţii ne pot ajuta la
maximizarea validităţii de construct şi de conţinut a scalei. Trebuie însă precizat că cel care ia
deciziile finale este cel care construieşte efectiv scala, şi nu experţii. Este posibil ca faza
pregătitoare pe care constructorul de scală a parcurs-o să-i fi dat un grad de cuprindere şi de
înţelegere a problemei mai bun decât al fiecărui expert în parte, aşadar solicitarea lor de a fi
eliminaţi anumiţi itemi trebuie examinată cu atenţie pentru a vedea dacă ea are sau nu temei.
În al doilea rând, cel mai adesea experţii vor tinde să elimine itemii redundanţi, eliminând
astfel posibilitatea constructorului de scală de a alege şi de a păstra dintre cele două formulări
aparent echivalente ale unor itemi, pe cea care se impune din analiza datelor rezultate din
aplicarea instrumentului.

4.2.5. Pasul al cincilea: administrarea setului iniţial de itemi


Prima aplicare a unui instrument nou creat se face pe un lot suficient de larg pentru a
da rezultate stabile referitoare la universul itemilor. Cât de mare şi de reprezentativ trebuie să
fie aceste eşantion este în continuare obiect de dezbatere printre specialişti. Pentru o scală
unidimensională, 250-300 de subiecţi sunt suficienţi pentru a desfăşura o analiză factorială,
urmată de o analiză de itemi şi de scală, tehnici care vor ghida procesul de selecţie a itemilor
ce evidenţiază cel mai bine constructul măsurat. Eşantionul iniţial se va mări în funcţie şi de
numărul de subscale care vor fi extrase.
Dacă eşantionul este mic din punct de vedere numeric pot apărea erori prin şansă sau
hazard, erori ce se vor repercuta asupra corelaţiilor dintre itemi şi scală, astfel că unii itemi,
iniţial promiţători, să fie descoperiţi la retestare a fi de fapt unii slabi. Mai mult, loturile mici
au o probabilitate mai mare de a elimina anumite categorii de indivizi cărora li se adresează
scala respectivă. Pe de altă parte, dacă în eşantionul extras caracteristica măsurată este slab
distribuită, valorile parametrilor obţinuţi (media şi abaterea standard în principal) sunt mai
greu de extrapolat la populaţia generală. Gradul de generalizabilitate al acestora este în cazul
de faţă unul redus.
De multe ori populaţiile la care avem acces (elevi de liceu, studenţi din campusuri
etc.) sunt destul de diferite în privinţa caracteristicii măsurate faţă de populaţia ţintă a scalei.
Unele diferenţe majore pot apărea din cauza conotaţiilor particulare pe care anumite cuvinte

69
sau expresii le au într-o anumită categorie populaţională, generînd sensuri care nu au fost
avute în vedere intenţionat de către constructorul scalei sau care nu se regăsesc ca atare şi în
populaţia ţintă mai largă.

4.2.6. Pasul al şaselea: evaluarea itemilor din setul iniţial


Operaţiunile descrise la acest nivel sunt cele mai tehnice şi constituie inima întregului
proces de construcţie al scalelor.

a. Examinarea iniţială a performanţei itemilor


Cea mai importantă calitate pe care o căutăm în această fază la un item este corelaţia
sa ridicată cu variabila latentă pe care dorim să o evidenţiem prin constructul măsurat. Dar,
cum această corelaţie nu poate fi determinată (dacă am şti valoarea ei nu ar mai avea rost să
dezvoltăm o scală), noi putem face inferenţe în legătură cu aceasta plecând de la corelaţia
dintre itemi şi de la corelaţia acestora cu scorul final la scală. Ca principiu, cu cât corelaţia
dintre itemi este mai mare, cu atât mai mare este şi fidelitatea itemilor; cu cât itemii sunt mai
fideli, cu atât mai mare este fidelitatea întregii scale.
Deci, prima calitate a unei scale este aceea de a fi una înalt intercorelată, lucru care se
poate pune în evidenţă prin matricea de intercorelaţii. Un examen atent al acesteia relevă
existenţa unor itemi care au corelaţii negative cu majoritatea celorlalţi itemi. Aceasta se poate
întâmpla din mai multe cauze. De exemplu, itemii cu conţinut negativ care au fost scoraţi
invers; itemii care, deşi scoraţi în acelaşi mod, măsoară constructe diferite (dominanţă vs.
supunere, stabilitate emoţională vs. emotivitate). În principiu, aceştia ar putea fi reuniţi într-o
scală supraordonată unidimensională, dar cu doi poli (bipolară). Pentru această categorie
există mai multe soluţii. Prima ar fi aranjarea şi numerotarea descriptorilor invers în text, în
funcţie de conţinutul itemilor, soluţie care nu este recomandabilă, pentru că nu este comodă
pentru subiect. În timpul completării, regularitatea dispunerii itemilor în scală creează
respondentului o anumită rutină prin care administrarea acesteia devine mai facilă. Inversarea
distruge această regularitate, obligând respondentul la mai mult efort. A doua şi cea mai
practică soluţie este aceea de a construi separat grile de corecţie pentru fiecare dintre
dimensiunile măsurate de scală, prin care anumiţi itemi vor fi scoraţi direct iar alţii invers.
Pentru datele introduse în calculator în format de scală Likert, cea mai convenabilă
soluţie este scorarea inversă a itemilor care ne interesează după formula: Nou = (x+1) - vechi.
De exemplu, aplicând formula de mai sus pentru o scală cu 7 trepte, 7 devine 1, 6 devine 2
etc., iar 1 devine 7. În SPSS există şi opţiunea Recode into the same variable, prin care

70
vechea variabilă este înlocuită cu cea rezultată după scorarea inversă. Avantajul este acela că
se poate face transformarea simultană, în bloc, a tuturor variabilelor de acelaşi format (cu
acelaşi număr de categorii de răspuns, definite în acelaşi fel).
Pentru că nu suntem întotdeauna siguri dacă rezultatul obţinut prin scorare inversă este
mai bun decât cel precedent, este bine să lucrăm pe o copie a fişierului sursă, copie numită de
exemplu „Itemi inversaţi”. Nu întotdeauna inversarea scorării, urmată de refacerea matricii de
intercorelaţii, rezolvă problema unui item. Este posibil ca el să fie corelat pozitiv cu unii
dintre itemi şi negativ cu alţii, deoarece el poate fi expresie a unui alt construct. În acest caz
soluţia potrivită este eliminarea itemului respectiv, pentru a nu periclita omogenitatea de
ansamblu a scalei.

b. Corelaţia item-scală
În SPSS procedeul de lucru pentru acest tip de analiză este relativ simplu, deoarece se
urmează următoarea secvenţă: Analyse→Scale→Reliability→Alpha→Statistics, de unde se
activează Item, Scale; Scale if item deleted (scala, dacă itemul ar fi înlăturat). Dacă dorim să
obţinem şi o matrice de intercorelaţii sau o matrice de covarianţe, în dreapta-sus avem panoul
Inter-Item, de unde selectăm Correlations sau Covariances (vezi imaginea de mai jos).
Finalmente dăm Continue pentru fereastra Reliability Analysis: Statistics şi apoi OK din
fereastra Reliability Analysis, după ce vom fi introdus în panoul de lucru din dreapta-sus
(Items:) toţi itemii care vor fi supuşi analizei.

Figura 3.1. Ferestrele de dialog pentru Relyability Analysis şi Statstics.


Rezultatele arată în felul ca în fragmetele de output prezentate mai jos.

71
R E L I A B I L I T Y A N A L Y S I S - S C A L E (A L P H A)

Mean Std Dev Cases


1. CEDA001 .1500 .3601 60.0
2. CEDA002 .1833 .3902 60.0
3. CEDA003 .1167 .3237 60.0
4. CEDA004 .3833 .4903 60.0
5. CEDA005 .1667 .3758 60.0
6. CEDA006 .5333 .5031 60.0
7. CEDA007 .3500 .4810 60.0
8. CEDA008 .3167 .4691 60.0
9. CEDA009 .4667 .5031 60.0
10. CEDA010 .1500 .3601 60.0
……………………………………………………………………………………………………………
Item-total Statistics
Scale Scale Corrected
Mean Variance Item- Alpha
if Item if Item Total if Item
Deleted Deleted Correlation Deleted
CEDA001 28.7500 133.4788 .2944 .8785
CEDA002 28.7167 133.4607 .2712 .8787
CEDA003 28.7833 135.0879 .1149 .8799
CEDA004 28.5167 133.4065 .2128 .8793
CEDA005 28.7333 133.1141 .3231 .8782
CEDA006 28.3667 136.6429 -.0713 .8825
CEDA007 28.5500 132.9975 .2550 .8788
CEDA008 28.5833 132.4845 .3105 .8782
CEDA009 28.4333 132.6226 .2746 .8786
CEDA010 28.7500 131.9534 .4804 .8770
……………………………………………………………………………................................................
Reliability Coefficients
N of Cases = 165 N of Items = 112
Alpha = .8800
……………………………………………………………………………………………………………
Figura 4.2. Outputurile rezultate din comenzile prezentate mai sus.

72
Fiecare dintre fragmentele de output de mai sus trebuie examinate cu mare atenţie.
Primul element investigat este varianţa itemilor, pentru că de aceasta depinde finalmente
variabilitatea întregii scale. Dacă toţi indivizii investigaţi ar răspunde doar într-un singur fel la
un item, varianţa (variabilitatea) sa ar fi zero, el nefiind de nici un folos în surprinderea
constructului de măsurat. Cum unii subiecţi răspund într-un fel, iar alţii în altul, fiecare item
are variabilităţi mai mari sau mai mici: cei mai dezirabili sunt cei cu variabilitate mare. În
cazul de mai sus, itemii cu cea mai mare variabilitate sunt în ordine 6, 9, 4, 7 şi 8, care au o
abatere standard în jur de 0,50.
Experienţa statistică ne arată că este mai bine să nu examinăm abaterea standard
separat, făcând abstracţie de medie. În principiu, cu cât aceasta este mai apropiată de centrul
intervalului de răspuns, cu atât este mai bine, pentru că ea va face posibilă mai multă
variabilitate a itemului. În condiţiile în care la stânga au fost plasaţi descriptorii pentru
dezacord şi la dreapta pentru acord, dacă media este asimetrică spre dreapta (negativ)
înseamnă că majoritatea respondenţilor au ţinut să fie de acord cu conţinutul itemului
respectiv, deci el a fost formulat „moale”; dacă asimetria este spre stânga (pozitivă) înseamnă
că majoritatea şi-a exprimat dezacordul cu conţinutul itemului (formulare sa a fost cam
„tare”).
În cazurile de asimetrie se ştie de asemenea faptul că puterea discriminativă a itemului
este mai mare pe „coada” (creoda) curbei gaussiene şi mai mică pe ramura sa mai scurtă. Cum
o distribuţie simetrică (cu media pe centrul seriei de variaţie) are două cozi lungi, înseamnă că
puterea discriminativă a unui item de acest fel este maximă, el putând distinge la fel de bine în
ambele direcţii.
În cazul nostru, deoarece numărul itemilor destinaţi depistării dezordinilor alimentare
a fost foarte mare – 112 – am folosit scorarea dihotomică, deci valoarea medie optimă ar
trebui să cadă la jumătatea intervalului 0 – 1, adică în jurul lui 0,50, ceea ce se întâmplă doar
pentru itemii 6 şi 9.29 Verificarea simultană a mediei şi abaterii standard este o condiţie
prealabilă obligatorie pentru o tentativă de selecţie a itemilor care se bazează în principal pe
corelaţie. Din această analiză reiese că, la prima vedere, itemii 7 şi 9 au simultan cele mai
bune varianţe şi valori medii.
Decizia finală se ia însă după ce se analizează atent datele din panoul Item-total
Statistics care are următoarea structură: primele două coloane dau valorile medii şi abaterile

29
Trebuie menţionat că ipoteza răspândirii gaussiene a simptomelor tulburărilor alimentare în populaţia de bază
este una care nu poate fi susţinută, deoarece o mulţime de itemi care determină anorexia şi bulimia sunt relativ
rar întâlniţi la persoanele obişnuite. Aceştia itemi vor avea probabil o altă distribuţie pentru populaţiile speciale
pe care scala va fi validată.

73
standard pentru valorile totale ale scalei, în situaţia în care itemul nu participă la scorul total.
Pentru scalele cu număr mare de itemi corecţia adusă la parametrii scalei prin absenţa unei
singure valori de scor este neglijabilă, dar ea devine cu atât mai importantă cu cât numărul
itemilor scalei este mai mic, fiind importantă de exemplu pentru scala de 10 itemi. Coloana
Corrected Item-Total Correlation este de maximă importanţă în luarea deciziei de selecţie
deoarece ea indică gradul de asociere a fiecărui item cu scorul total, adică saturaţia sa în
variabila latentă măsurată. În cazul nostru itemul 10 are o corelaţie excelentă cu scala (.48), în
timp ce itemii 3, 4 şi mai ales 6 au corelaţii slabe (itemul 6 chiar negativă) cu scorul total.
Dacă scala noastră ar fi unidimensională (adică ar măsura doar un singur construct şi
nu mai multe) o valoare a corelaţiei item-scală în jur de .30 ar fi suficientă pentru includerea
itemului în scală, iar una de .40 aproape că ne forţează să facem acest lucru. Aici este cazul să
spunem că nu ne vom concentra atenţia doar pe numerele de cod ale itemilor, fapt care ne
împiedică să ştim care este conţinutul lor. Cu foaia de test în mână, după ce am identificat
itemii cu formulări foarte asemănătoare (redundanţi), luăm în cunoştinţă de cauză decizia de
a-i păstra pe cei cu calităţile psihometrice cele mai bune şi de a-i elimina pe cei mai slabi.
Ultima coloană are de asemenea un rol important în luarea deciziei relative la selecţia
itemilor deoarece ne indică cât ar fi fost coeficientul de consistenţă internă alpha dacă itemul
analizat ar fi fost eliminat. Prin compararea cu scorul de referinţă al acestui coeficient (.88
pentru toată scala iniţială, adică foarte mare) putem vedea dacă absenţa itemului ameliorează
valoarea lui alpha (caz în care el trebuie eliminat) sau dimpotrivă, o scade (semn că este unul
util). În cazul nostru itemul 6 este sigur unul condamnat, deoarece el dă o corelaţie uşor
negativă cu scala şi nu este consistent cu aceasta (absenţa lui din scală îl măreşte pe alpha).
Şi totuşi nu suntem încă în măsură să luăm decizia finală pentru că nu am răspuns clar
la întrebarea fundamentală dacă itemii testului măsoară sau bat în direcţia unei singure
variabile (scală unidimensională) sau a mai multora (scală multidimensională, neomogenă).
Supoziţia implicită pentru indicele de consistenţă internă alpha al lui Cronbach este aceea că
toţi itemii măsoară o singură variabilă latentă, fapt ce nu este dat prin definiţie, ci trebuie atent
verificat.

c. Analiza factorială exploratorie


În această fază a procesului de construcţie analiza factorială exploratorie devine
obligatorie. Aşa cum se va observa când se parcurge până la capăt cursul de Statistică
avansată, o analiză factorială este o tehnică pretenţioasă, pentru că are nevoie de un număr
mare de subiecţi, de ordinul sutelor, pentru a furniza o soluţie stabilă şi bine adecvată datelor.

74
Am solicitat din start un număr cel puţin mediu de subiecţi (250-300) pentru a efectua o
analiză factorială corectă deoarece când este desfăşurată pe prea puţine cazuri, ea poate să dea
valori instabile, ce compromit uneori iremediabil întregul proces de construcţie a scalei. Să
reţinem deci că, în această fază de construcţie a scalei, determinarea prin analiză factorială a
variabilei latente care stă în spatele unui set de itemi este un fapt crucial.
Mergând mai departe cu exerciţiul nostru prezentăm secvenţa de lucru pentru a efectua
analiza factorială exploratorie: Analyse→DataReduction→Factor, care produce deschiderea
următoarei fereastre de lucru, în care vom introduce (prima fereastră, panoul din dreapta-sus)
toate datele de analizat, adică toţi itemii chestionarului nostru.

Figura 3.3. Ferestrele de dialog pentru lansarea analizei factoriale exploratorii.

Pentru un număr aşa de mare de itemi nu vom efectua nici o rotaţie (butonul din
mijloc de la figura din stânga de mai sus), dar de la Options putem să selectăm Supress
absolute values less than: (suprimarea valorilor mai mici decât:) pentru a pune valoarea de
.30 în ferestruica respectivă, care are din setare valoarea .10, dar neactivată (vezi fereastra din
dreapta-jos). În felul acesta valorile ce indică saturaţii mici şi nesemnificative în factorii
descoperiţi nu vor mai fi afişaţi, fapt ce uşurează inspecţia vizuală, selecţia şi luarea deciziilor.
Trebuie precizat că metoda componentelor principale – care este opţiunea de bază a
programului – este utilă mai ales pentru a vedea dacă există un factor general (cu o varianţă
mai mare de 50%) ce defineşte variabilă latentă, sau dacă nu cumva există mai mulţi factori
de magnitudine mai mică, ce acoperă întreaga varianţă a scorurilor scalei studiate. Vom putea
vedea deci dacă avem de-a face cu o scală uni- sau multi-dimensională.
Atragem de asemenea atenţia asupra faptului că dacă o singură variabilă inclusă în
panoul de lucru are varianţa zero, analiza factorială nu mai poate fi efectuată. Deoarece acesta
este şi cazul chestionarului nostru, identificăm variabila sau variabilele cu varianţă zero prin

75
Frequencies ori Descriptives. În cazul nostru itemul 66 trebuie eliminat din analiză (şi din
scală deoarece, având varianţa zero, el nu are nici o utilitate), după care reluăm analiza
factorială. Aceasta va produce mai multe output-uri, din care două sunt esenţiale.

Figura 3.4. Unul dintre outputurile analizei factoriale


indicând factorii selecţionaţi şi valorile lor eigen.

Outputul de mai sus indică faptul că itemii iniţiali nu produc un singur factor general,
ci câteva zeci (fapt curent în construcţia de scale cu număr mare de itemi), din care primul
acoperă doar 13,36% din varianţă (deci este foarte departe de a fi un factor general), al doilea
8,21%, al treilea 4,96% etc. Chiar şi al şaisprezecelea factor produce o valoare eigen peste 2
(2,08%), ceea ce poate părea un adevărat coşmar statistic. Lucrurile nu stau însă chiar aşa.
Dacă analizăm cu atenţie outputul al doilea din figura 1.4, observăm că acesta devine o
adevărată grilă de selecţie pentru factorii mai importanţi care vor fi reţinuţi. Astfel, itemii vor
fi alocaţi la acei factori pentru care ei au cele mai mari corelaţii (saturaţii în factorul
respectiv). Atunci când se poate, itemii cu saturaţii negative se alocă la factorul cu care
corelează pozitiv mai semnificativ, pentru a nu schimba maniera de scorare; la valori foarte
apropiate ale saturaţiilor, un item se alocă scalei mai scurte pentru a o fortifica, deoarece ştim
că puterea unei scale depinde şi de numărul itemilor care o compun.
Observăm că, după ce încep să fie alocaţi la primii trei factori, mai rămân foarte puţini
itemi sau deloc pentru factorii următori, şi această deoarece mulţi itemi îşi împart varianţa
între mai mulţi factori (nu sunt foarte specifici). Alocând itemii factorului pentru care ei au
cea mai mare saturaţie, celorlalţi factori le rămân tot mai puţini itemi, aceasta deoarece primii
factori dau corelaţii mai mari cu itemii, având deci prioritate în selecţia acestora. De fapt

76
afişarea în tabel a factorilor de la stânga la dreapta se face în ordinea magnitudii lor, dată de
mărimea corelaţiilor cu itemii, dar şi de numărul acestor corelaţii. Itemii care nu se
repartizează în primele 3-4 categorii vor putea defini şi ei nişte factori de magnitudine mai
redusă, dar reunindu-i în scale şi studiind alpha pentru acestea vom observa că consistenţa
internă este din ce în ce mai mică pentru factorii extraşi ultimii.

Figura 4.5. Unul dintre outputurile analizei factoriale


indicând factorii selecţionaţi şi valorile lor eigen.
Cum o scală trebuie să aibă o consistenţă internă de peste .70 (aceasta fiind foarte
bună peste .80 şi excelentă peste .90) scalele mici neatingând aceste valori trebuie în principiu
abandonate, pentru că ele sunt expresia unor construncte ce au o valoare îndoielnică. În cazul
de mai sus, itemii 5, 7, 8, 10, 13, 16, 17, 20, 21, 22 etc. vor fi alocaţi primei scale; itemii 3, 9,
19 etc. celei de a doua, iar itemii 15, 24, 43 etc. celei de a treia. O atenţie specială impune
itemul 3, care poate fi distribuit şi la factorul 2 şi la 3 (decizia o luăm ulterior, când evaluăm
care dintre cele două subscale are mai mare nevoie de el) sau la itemul 22, care corelează
semnificativ şi cu factorul 1 (pozitiv) şi cu factorul 3 (negativ). În aceste situaţii se observă cât
de importantă este mărimea lotului pentru luarea unei decizii corecte, bazată pe analiza
factorială. Hotărârea de a aloca itemii într-o scală sau alta poate fi irevocabilă, chiar dacă
datele ulterioare nu confirmă deciziile noastre de acum. Prin mărirea semnificativă a
numărului de subiecţi, soluţia factorială poate să aducă o mulţime de diferenţe, ceea ce
relansează practic întreg procesul de reconstrucţie a scalei. Din această cauză vom căuta să
luăm decizii importante şi definitive doar dacă eşantionul pe care s-a efectuat analiza
factorială este unul sufiucient de mare şi de reprezentativ.

77
Finalmente, scala desemnând factorul 1 arată ca în figura de mai jos.
R E L I A B I L I T Y A N A L Y S I S - S C A L E (A L P H A)
Mean Std Dev Cases
1. CEDA005 .2000 .4031 65.0
2. CEDA007 .3231 .4713 65.0
3. CEDA008 .3231 .4713 65.0
4. CEDA010 .1538 .3636 65.0
5. CEDA013 .4154 .4966 65.0
6. CEDA016 .5385 .5024 65.0
7. CEDA017 .4154 .4966 65.0
8. CEDA020 .1231 .3311 65.0
9. CEDA021 .4462 .5010 65.0
10. CEDA022 .3385 .4769 65.0
Statistics for Mean Variance Std Dev N of Variables
scale 11.9846 86.4841 9.2997 50
Item-total Statistics
Scale Scale Corrected
Mean Variance Item- Alpha
if Item if Item Total if Item
Deleted Deleted Correlation Deleted
CEDA005 11.7846 84.0154 .3121 .9203
CEDA007 11.6615 83.3212 .3418 .9202
CEDA008 11.6615 83.4462 .3270 .9204
CEDA010 11.8308 83.3928 .4456 .9192
CEDA013 11.5692 81.3115 .5500 .9180
CEDA016 11.4462 82.5635 .4018 .9197
CEDA017 11.5692 81.7178 .5034 .9185
CEDA020 11.8615 83.4337 .4862 .9190
CEDA021 11.5385 83.8149 .3636 .9202
CEDA022 11.6462 83.1385 .3586 .9201
....................................................................................................................................................................
Reliability Coefficients
N of Cases = 165.0 N of Items = 50

Figura 4.6. Unul dintre outputurile analizei factoriale


indicând factorii selecţionaţi şi valorile lor eigen.

78
d. Scurt raport despre scală
Se pare că scala 1 obţinută de noi este una foarte bună deoarece la ea contribuie 50 de
itemi ce-i dau o consistenţă internă extrem de mare (alpha = 0,92). Fiecare item dă corelaţii de
peste 0,30 cu scala, dar şi mai mari. Scorul mediu la această scală este de 11,98, cu o abatere
standard de 9,30. Totuşi valorile medii ale itemilor nu sunt centrate majoritar pe valoarea
mijlocie de scor (0,50), ci sunt mai mici, fapt ce indică o asimetrie rezultată din cauza
caracterului mai curând clinic al testului. Aceşti itemi discriminează bine printre subiecţii care
au valori mai mari ale scorurilor, dar mai slab pentru cei cu valori submedii. Scala urmează a
fi verificată şi validată contra criteriul extern pe populaţii clinice care prezintă realmente
dezordinile alimentare diagnosticate.
Studiind itemii care îl compun, primul factor a fost numit Stimă de sine negativă
legată de aspectul fizic (50 de itemi), al doilea Propensiune anorexică (12 itemi) şi al treilea
Propensiune bulimică (12 itemi). Deoarece cei trei factori sunt mediu-slab corelaţi între ei,
scorurile lor separate pot fi agregate într-un scor global, adică într-un Index al tulburărilor
alimentare, definit de preocuparea pentru aspectul fizic şi pentru pierderea controlului asupra
ingestiei de alimente.
Numărul relativ mic de subiecţi pe care s-a desfăşurat analiza factorială (N = 165)
ridică totuşi semne de întrebare în legătură cu stabilitatea soluţiilor găsite, care trebuie
verificate şi definitivate pe populaţii mai largi.

4.3. Criterii de selecţie a itemilor pentru optimizarea lungimii scalei


Până în acest stadiu de dezvoltare al scalelor de tulburări alimentare cercetătorul are
un număr bun de itemi (72), distribuiţi pe trei subscale în raport cu care aceştia au o fidelitate
destul de ridicată. Şi totuşi, se observă diferenţe relativ însemnate între acestea: prima are un
alpha de .92, a doua de doar de .70, iar a treia de .58. Alpha pentru toată scala este de .94. Se
pare deci că scalele 2 şi 3 nu sunt suficient de fidele, aceasta probabil şi din cauza scurtimii
lor. Se admite că scalele scurte sunt bune, pentru că se completează uşor şi nu pun prea mare
presiune pe subiecţi. Prin opoziţie, scalele mai lungi creează mai mult stres la completare, dar
au caracteristici psihometrice mai bune (consistenţă internă, alte forme de fidelitate şi de
validite, putere de discriminare mai mari). Este deci de dorit găsirea unui echilibru între
scurtimea scalei şi calităţile sale psihometrice.
Atunci când fidelitatea unei scale este prea mică, scurtimea ei nu este o calitate în sine.
Dacă cercetătorul nu poate asigura nici un înţeles unei scale scurte, nu s-a câştigat nimic prin

79
scurtimea ei. În cazul de faţă există o satisfacţie legată de calitatea primei scale. Pentru cea de
a doua şi de a treia ar putea reîncepe travaliul de a genera itemi suplimentari, care să surprindă
mai specific bulimia şi anorexia şi care vor trebui aplicaţi unor populaţii clinice identificate a
avea aceste afecţiuni.

În rezumat, pentru a clarifica criteriile după care păstrăm unii itemi în scală şi-i
eliminăm pe alţii, furnizăm în sinteză cele mai importante repere orientative:
 sunt preferabili itemii care au valori medii apropiate de valoarea centrală, au varianţă
mare, se corelează bine cu ceilalţi itemi şi – mai ales – corelează la un nivel ridicat
(peste .30, sau chiar peste .40) cu scorul total la scală;
 vor fi primii eliminaţi itemii care dau varianţa zero, corelaţii slabe sau negative cu
scala (chiar după scorarea inversă);
 itemii care corelează slab cu scala vor fi de asemenea printre primii eliminaţi;
 vor fi eliminaţi şi itemii a căror prezenţă în scală nu numai că nu ameliorează
consistenţa sa internă, ci chiar o coboară;
 itemii care corelează slab cu dimensiunea/dimensiunile latente măsurate, dar corelează
bine cu alţi factori secundari, vor fi şi ei eliminaţi din scală, dar vor fi analizaţi pentru
a dezvolta eventual noi scale, dacă ei par să sugereze existenţa altor constructe valide;
 dintre itemii foarte similari ca şi formulare şi conţinut se păstrează doar aceia care dau
cea mai bună corelaţie cu scorul total la scală.
Nu putem omite o întrebare legitimă: cât de mic trebuie să fie pragul corelaţiei item-
scală pentru a reţine un item în scală? Răspunsul depinde şi de intenţiile autorului: doreşte el o
scală scurtă şi relativ puternică, sau o scală mai lungă, dar care dă mai multe nuanţe, fiind mai
stabilă şi mai fidelă? În primul caz pragul de selecţie este mai ridicat (în principiu peste r =
.40), în al doilea ceva mai scăzut (dar rareori sub r = .30).
Efectul eliminării sau includerii unor itemi în scală trebuie şi el bine ştiut. Dacă
cunoaştem corelaţia medie a scalei rezultate putem aplica o formulă care ne ajută să anticipăm
care va fi efectul adăugării sau eliminării unui item. Această formulă este:

N r
alpha 
1  ( N  1)  r
în care N este numărul de itemi şi r corelaţia medie inter-itemi. Putem astfel determina ce se
întâmplă dacă la o scală cu corelaţia iter-itemi de .30 adăugăm sau scoatem un item: alpha =
[10·.30]/[1+9·.30] = .81 pentru 10 itemi; alpha = [11·.30]/[1+10·.30] = .83 pentru 11 itemi;

80
alpha = [9·.30]/[1+8·.30] = .79 pentru 9 itemi. Vedem că diferenţa de doar doi itemi ridică
consistenţa internă de la .79 la. 83, ceea ce este important. În general, dacă corelaţia inter-
itemi a unui item este egală sau cu puţin sub corelaţia inter-itemi medie, păstrarea itemului în
scală are un efect de creştere a lui alpha; când această corelaţie este mult sub medie, ea poate
să ducă la descreşterea lui alpha şi deci itemul rău trebuie eliminat.
O soluţie interesantă pentru a verifica stabilitatea caracteristicilor unei scale este
propusă de DeVellis (2003, pp. 99-100), ea constând în splitarea lotului. Când lotul este unul
suficient de mare el poate fi împărţit în jumătăţi. Când lotul nu este suficient de mare,
împărţirea se poate face în părţi inegale, partea cea mai mare fiind rezervată pentru
determinările principale, pe când cea de a doua pentru verificarea constanţei rezultatelor
găsite. Deci prima parte din lot foloseşte la evaluarea şi selecţia itemilor, la construcţia
scalelor şi la determinarea lui alpha pentru fiecare subscală; cea de a doua parte este utilă
pentru replicarea datelor şi pentru a verifica dacă ele se regăsesc pe un lot foarte similar.
Avantajele acestei metode – care obligă din start la abordarea unui număr mare de
subiecţi, de peste 500-600 de persoane – sunt însemnate. În primul rând împărţirea se poate
face aleatoriu, ceea ce asigură echivalenţa grupurilor, randomizarea generând două eşantioane
echivalente. Dacă acestea ar fi abordate în două momente temporale diferite există
probabilitatea ca factorul timp să aducă modificări (fie şi discrete) la cel de al doilea grup, sau
ca el să difere prin alte caracteristici de primul grup. Apoi, un nou grup presupune expunerea
subiecţilor la alt personal de cercetare, în altă perioadă a anului, cu instrumente care pot diferi
uşor de primele (forma iniţială şi forma definitivă a scalei), ceea ce poate introduce alte
distorsiuni nedorite. Dar cel mai însemnat avantaj al splitării grupului original este acela că la
ambele subgrupuri vom avea forma originală a instrumentului, ceea ce permite revenirea la
decizia eliminării unor itemi dacă grupul de control indică necesitatea schimbării acestei
decizii. Dacă pentru primul grup, cel pe care s-a făcut selecţia itemilor, există posibilitatea ca
factori de şansă să fie confundaţi cu covariaţia itemilor, la al doilea – unde itemii sunt deja
selectaţi – o asemenea posibilitate nu mai există. Finalmente, prin reunirea celor două grupuri
în unul singur se obţin caracteristici psihometrice mai sigure şi mai aproape de realitate decât
pentru fiecare grup luat separat.

4.4. Alte analize utile pentru determinarea fidelităţii scalei


Ideea că prin coeficientul alpha al lui Cronbach se rezolvă problema fidelităţii unui
test/scale este una eronată deoarece în esenţă acesta indică doar măsura în care itemii
formează un set omogen, bine sau satisfăcător corelat cu scorul total la test. Alpha nu ne

81
spune totuşi dacă scala nou creată surprinde sau nu cu adevărat estenţa constructului căutat,
pentru aceasta trebuind desfăşurate nenumărate studii de validare, pentru oricare nouă
extensie legată de utilizarea scalei. Chiar fidelitatea presupune determinarea prin test-retest a
stabilităţii în timp a rezultatelor obţinute, corelaţia dintre o formă a testului şi forma sa
paralelă etc. Cum fidelitatea este cea mai importantă precondiţie a validităţii, trebuie spus că
programul SPSS oferă alături de alpha şi posibilitatea determinării fidelităţii prin metoda
jumătăţirii (split-half).
Demersurile necesare acestui tip de analiză sunt foarte asemănăroare cu cele presupuse
de determinarea lui alpha (Analyse→Scale→Reliability→Split-half→Statistics), doar că de
la Statistics acum se dezactivează Descriptives for (Item, Scale, Scale if item deleted), deja
determinate anterior.

Figura 4.7. Ferestrele de dialog pentru Split-half şi Statistics.

Output-ul acestei serii de comenzi este un indicator al consistenţei interne care ia în calcul o
jumătate a testului comparată cu cealaltă, prin două metode: cea a lui Spearman-Brown şi cea
a lui Guttman. Echivalenţa jumătăţilor se stabileşte şi prin compararea coeficientului alpha
pentru fiecare jumătate în parte. Cele două jumătăţi comparate sunt luate de computer ca
atare, dar dacă vrem să determinăm split-half pentru numerele pare şi cele impare, introducem
în panoul de lucru întâi itemii pari, apoi pe cei pari, dăm OK şi vom obţine analiza dorită.
R E L I A B I L I T Y A N A L Y S I S - S C A L E (S P L I T)
Reliability Coefficients
N of Cases = 165 N of Items = 112
Correlation between forms = .80 Equal-length Spearman-Brown = .89
Guttman Split-half = .89 Unequal-length Spearman-Brown = .89
56 Items in part 1 56 Items in part 2
Alpha for part 1 = .85 Alpha for part 2 = .87
Figura 4.8. Rezultatele outputului pentru Split-half.

82
Corelaţiile obţinute prin splitare sunt identice prin cele două metode (.89) iar valorile
alpha pentru prima parte (.85) şi pentru cea de a doua (.87) sunt extrem de asemănătoare, de
unde deducem că există o foarte bună consistenţă internă pentru fiecare jumătate a testului.30
Procesul de construcţiei a unei scale nu se opreşte aici. Destinul acesteia depinde doar
parţial de calităţile psihometrice identificarte preliminar şi mai mult de utilitatea ei reală, de
posibilitatea implicării ei într-o multitudine de aplicaţii practice sau de cercetări. Cel mai
adesea validitatea este cea care impune în timp o scală şi aceasta poate fi probată într-o
multitudine de maniere. Prezentăm mai jos o matrice de intercorelaţii dintre cei trei factori
rezultaţi pentru Scala de tulburări alimentare şi cele trei categorii de mecanisme de apărare
decelate de DSQ (The Defense Style Questionnaire) creat de Andrews, Singh şi Bond.
FACTOR1 FACTOR2 FACTOR3 DSQ Mec. DSQ Mec.
mature nevrotice
FACTOR1 -
FACTOR2 .38** -
FACTOR3 .32** .28** -
DSQ Mec. mature -.09 .16 .01 -
DSQ Mec. nevrotice .23* .10 .18 .19* -
DSQ Mec. imature .51** .31** .29** .21* .53**
Notă: ** Correlaţia este semnificativă la pragul de 0,01 (bidirecţional).
* Correlaţia este semnificativă la pragul de 0,05 (bidirecţional.
Figura 4.9. Matrice de intercorelaţii dintre cei trei factori identificaţi şi DSQ.

Din tabelul de mai sus rezultă că factorul 1 se validează la un nivel foarte ridicat prin
corelare cu mecanismele de apărare imature (r = .53) şi la un nivel mai scăzut cu cele
nevrotice (r = .23). Aceasta atrage atenţia asupra faptului că factorul 1 are un conţinut negativ
şi că ar trebui să se numească Stimă de sine negativă legată de aspectul fizic. Factorii 2 şi 3 se
validează şi ei concurent cu mecanismele de apărare imature, dar la niveluri mai scăzute (r =
.31, respectiv r = .29). Evident că această primă confirmare are nevoie de o mulţime de alte
studii, dar aceasta presupune ca instrumentul să fie publicat şi lansat pentru a-şi îndeplini
rolurile pentru care el a fost proiectat.

30
Notă: Aceste determinări au fost făcute pe tot setul de itemi doar ca exerciţiu, înainte de selecţia şi sortarea pe
scale a itemilor, ele trebuind reluate pentru subscalele obţinute în finalul procesului de construcţie, ca şi pentru
scala globală care le include pe toate trei. Dublarea numărului de subiecţi pentru a obţine o soluţie factorială
stabilă relansează practic întreg procesul de reconstrucţie al scalelor.

83
CAPITOLUL 5S

RAPORTUL DE LABORATOR (LAB-REPORT)


ILUZIA MÜLLER-LYER

1. Introducere: pentru Introducere clarificaţi motivele pentru care acest experiment a


fost condus în maniera în care s-a făcut. Lucraţi plecând de la aspectele de ordin general spre
cele specifice, fără însă a vă menţine doar în aspecte de ordin general. Acesta nu este un
raport despre absolut orice are de-a face cu iluziile vizuale, sau totul despre orice care are
leagătură cu iluziile geometrice, aşa că nu lăsaţi cititorul să creadă că cercetarea îi adresează
mai multe probleme decât o face. La sfârşitul acestei secţiuni veţi fi procurat o justificare
ştiinţifică pentru predicţiile specifice pe care le-aţi făcut. Reamintiţi-vă că ipotezele formulate
trebuie să curgă natural sub forma de paragraf, adică nu vor fi formulate separat de restul
introducerii.

2. Metode: pentru această secţiune este nevoie să fi etichetat corect cele cinci
subsecţiuni.

Participanţi este prima dintre acestea. În această subsecţiune veţi descrie eşantionul
utilizat, clarificând ce populaţie reprezintă aceştia şi câţi au participat efectiv. Arătaţi cum au
fost ei recrutaţi şi cum au fost bonificaţi pentru timpul pe care l-au alocat cercetării. Asiguraţi-
vă că aţi inclus fiecare aspect relevant în legătură cu eşantionul. Pentru a avea un model
despre ce este relevant, consultaţi articolul lui Predebon (2000), sau orice alt articol pe care l-
aţi citit, pentru a observa ce detalii legate de populaţie au fost incluse acolo.

Instrumente: următoarea subsecţiune descrie instrumentele sau aparatele utilizate.


Această secţiune furnizează informaţii în legătură cu echipamentele folosite pentru
prezentarea stimulilor. Dacă aceasta s-a făcut computerizat, asiguraţi-vă că ştiţi ce tip de
computer a fost utilizat. În experimentul nostru nu a fost cazul.

Materiale: această subsecţiune descrie stimulii utilizaţi. Este nevoie să descrieţi


figurile Müller-Lyer standard (unghiuri ascuţite şi oblice) şi cele cu unghiuri drepte, incluzând

84
detalii ca cele legate de lungimea liniilor (10 cm axul şi 3 cm extensiile), mărimea unghiurilor
dintre ax şi extensii (30° la cele ascuţite şi 150° la cele oblice). Pentru a avea o idee mai clară
puteţi utiliza articolele din Referinţe, dar nu uitaţi să folosiţi cuvintele proprii şi să precizaţi
de ce s-a folosit formatul creion-hârtie, şi nu cel computerizat. Nu intraţi în detalii
nesemnificative, fără repercusiuni asupra rezultatelor, cum ar fi tipul de creion/pix utilizat
pentru a marca jumătatea axului de către fiecare participant. Este bine de precizat cum s-a
controlat ca perceperea stimulilor să fie în acelaşi fel pentru fiecare participant.

Design: subsecţiunea referitoare la design-ul cercetării, se referă la faptul dacă el a


fost de tipul intrasubiecţi (within) sau intersubiecţi (between). Veţi preciza apoi care au fost
variabilele independentă şi dependentă. De asemenea veţi indica şi câte condiţii experimentale
au fost prezentate participanţilor. Toţi participanţii au primit figurile în aceeaşi ordine sau a
fost utilizată o ordine randomizată pentru fiecare participant?

Procedură: în această subsecţiune veţi descrie ce au făcut efectiv participanţii. Aici


veţi informa cititorul despre fiecare lucru care s-a făcut pentru colectarea datelor. Dacă au fost
date instrucţiuni speciale, descrieţi-le. S-au alocat perioade de odihnă pentru subiecţi? Dacă
da, câte şi de ce durată? Care a fost rata de prezentare a stimulilor? Clarificaţi cum a fost
înregistrat punctul de mijloc al axului. Nu intraţi în detalii nesemnificative (cum au stat
participanţii pe scaune, la ce distanţă unul de altul etc.) dar asiguraţi-vă că aţi dat suficiente
informaţii astfel încât dacă cineva ar putea să refacă cu exactitate studiul, fără a da informaţii
de detaliu care nu ar aduce nici un fel de modificări asupra rezultatelor experimentului.

3. Rezultate: pentru secţiunea Rezultate veţi face câteva precizări în legătură cu ce


transformări (active sau nonactive) aţi făcut cu datele brute pentru a le putea efectua
sumarizarea statistică. Au existat şi date neutilizate? Dacă da, după ce criteriu au fost ele
omise din analiză? După aceasta veţi sumariza datele utilizând statisticile descriptive din
SPSS şi veţi testa ipotezele statistice, selectând cele mai adecvate metode în raport cu datele
de cercetare. O cale elegantă este aceea de a include într-un tabel mediile şi eroarea standard
pentru cele şase condiţii experimentale, dar şi pentru categoriile de analiză derivate (1+2+3 şi
4+5+6; 1+4, 2+5, 3+6). Acesta va primi titlul de Tabel 1, titlu scris cu corp 11, ce va fi plasat
deasupra tabelului, urmat de suficientă informaţie utilă pentru a înţelege ce gen de informaţie
este sumarizată în acesta, fără formulări de tipul tabel cu… După aceasta veţi comenta pe

85
scurt rezultatele, în sensul de a sublinia cât de similare/disimilare sunt figurile cu unghiuri
ascuţite comparativ cu cele care au unghiuri drepte.
Următoarea parte a secţiunii Rezultate va conţine un sumar al statisticilor inferenţiale
utilizate, adică a celor şase Teste t pentru un singur eşantion (One Sample t-test) aplicate
pentru a proba ipoteza potrivit căreia media pentru fiecare dintre cele şase condiţii este
semnificativ diferită de zero (care reprezintă punctul de mijloc al liniei). Când comentaţi
rezultatele statisticilor inferenţiale, clarificaţi într-un paragraf ce test aţi aplicat, ce rezultat
statistic aţi obţinut şi care este nivelul său de semnificaţie, respectând standardele APA din
curs. O propoziţie scurtă va indica ce înseamnă fiecare dintre rezultatele astfel obţinute.
Există în Power Point-ul cursului 6 solicitarea de a testa şi alte ipoteze statistice, cum
ar fi cele bazate pe diferenţa dintre primele trei condiţii însumate (unghiuri ascuţite/oblice) şi
celelalte trei (unghiuri drepte), pentru a vedea dacă iluzia este la fel de puternică în ambele
categorii de condiţii. De asemenea pot fi comparate extensiile externe (1 şi 4) cu cele interne
(2 şi 5) şi ambele categorii de extensii simple (1+4; 2+5) cu extensiile duble (3+6). Ca
mijloace de testare a ipotezelor puteţi folosi atât diferenţa cât şi corelaţia, după ce veţi verifica
dacă sunt întrunite condiţiile aplicării testelor parametrice respective. În cazul că le veţi folosi,
este bine ca toate aceste forme de testare să verifice ipoteze de cercetare deja prezente în
secţiunea introductivă. Ca mijloace statistice suplimentare este indicat să utilizaţi histograme,
boxploturi şi scattere, pe care le veţi introduce în text doar dacă sunt relevante, astfel editate
încât unităţile de măsură de pe axe să fie adecvate, iar titrarea lor să fie în limba română.

4. Discuţiile vor răspunde la trei întrebări:


a. Sunt rezultatele dvs. consistente cu predicţiile pe care le-aţi făcut?
b. Sunt rezultatele dvs. consistente cu cele ale altor cercetători?
c. Ce probleme au rămas fără răspuns şi cum ar putea acestea să primească răspuns?

a. Aşadar, în prima parte a discuţiilor reamintiţi pe scurt cititorului ce predicţii aţi


făcut şi apoi comentaţi modul în care datele de cercetare sunt consistente sau inconsistente cu
acestea. b. A doua parte discuţiilor este aceea în care vă întoarceţi la partea introductivă:
argumentând scopul pentru care aţi condus această cercetare trebuie să demonstraţi cum se
încadrează ea în imaginea de ansamblu oferită de cercetările precedente. c. În ultima parte a
discuţiilor veţi vorbi despre munca viitoare, trebuind să aduceţi o justificare ştiinţifică pentru
sugestiile pe care le faceţi. Dar, în loc să vă lansaţi în speculaţii vagi, este mai bine să arătaţi
în ce măsură metodologia pe care aţi utilizat-o diferă de a altora şi în ce fel diferă interpretarea

86
rezultatelor. Priviţi de jur-împrejur în orizontul problemei pentru a avea o perspectivă care să
vă permită să determinaţi în ce măsură această cercetare a mişcat înainte problema specifică
investigată şi ce ar fi bine de făcut în viitor din perspectivă ştiinţifică. Pont: nu este deloc util
să afirmaţi că veţi relua studiul cu mai mulţi participanţi! Încredinţaţi-vă că aţi utilizat corect
acest mini-ghid de lab-report şi că aţi făcut corect trimiterile.

Referinţele: se adiţionează la final, după regulile cunoscute, astfel că ceea ce aţi citat
în text să se regăsească la referinţe şi reciproc.

87
88

S-ar putea să vă placă și