Documente Academic
Documente Profesional
Documente Cultură
INTRODUCERE 17
Capitolul
1. TEORIE ŞI EXPERIMENT ÎN
PSIHOLOGIE 19
2. VARIABILĂ ŞI MĂSURĂTOARE 43
3. PLANURI EXPERIMENTALE 57
4. CONDIŢIILE UNUI MODEL
EXPERIMENTAL EFICIENT 91
5. CONTROLUL EXPERIMENTAL 111
6. DESFĂŞURAREA EXPERIMENTULUI 153
7. CVASIEXPERIMENTUL 189
8. EXPERIMENTE CU UN SINGUR SUBIECT 201
9. ETICA CERCETĂRII EXPERIMENTALE 211
5
6
CUPRINS DETALIAT
INTRODUCERE 17
CAPITOLUL 1
TEORIE ŞI EXPERIMENT ÎN PSIHOLOGIE 19
1.1 Teoria ştiinţifică 19
1.2 Finalitatea demersului ştiinţific 20
1.3 Paradigmele ştiinţei 21
1.4 Alte moduri de a face « psihologie » 22
1.5 Creativitate ştiinţifică şi hazard 25
1.6 Teorie şi experiment 25
1.7 Obiectivitatea demersului ştiinţific 27
1.8 Ştiinţă şi experiment. Specificul metodei
experimentale 28
1.9 Stadialitatea cercetării ştiinţifice 30
1.9.1 Identificarea problemei de cercetat 31
1.9.2 Formularea ipotezelor 33
CAPITOLUL 2
VARIABILĂ ŞI MĂSURĂTOARE 43
2.1 Noţiunea de variabilă 43
2.2 Clasificarea variabilelor 44
2.3 Măsurarea în psihologia experimentală 46
7
2.4 Varietatea măsurătorilor
47
psihologice
2.5 Conţinutul operaţiilor de măsurare 49
2.6 Proprietăţile scalelor de măsurare 49
2.6.1 Scala nominală 51
2.6.2 Scala ordinală 52
2.6.3 Scala interval 53
2.6.4 Scala raport (ratio scale) 54
CAPITOLUL 3
PLANURI EXPERIMENTALE 57
3.1 Clasificarea planurilor experimentale 57
3.2 Planuri experimentale cu o singură 62
variabilă independentă
3.2.1 Planuri experimentale cu grupuri
independente 62
3.2.2 Planuri experimentale cu măsurători 63
repetate
3.2.2.1 Avantajele planului experimental cu
măsurători repetate 65
3.2.2.2 Dezavantaje 66
3.3 Planuri experimentale complexe 66
3.4 Planul bifactorial 68
3.5 Variabila parametru 70
3.6 Efecte principale (main effects) 75
3.7 Interacţiuni între variabile 80
3.8 Tipuri de interacţiuni 80
3.9 Avantajele planului factorial 85
3.10 Modele factoriale mixte 86
3.11 Planul experimental optim 88
3.12 Modelul experimental cibernetic 89
CAPITOLUL 4
CONDIŢIILE UNUI MODEL EXPERIMENTAL 91
EFICIENT
4.1 Validitatea experimentului 91
4.1.1 Validitatea internă 92
4.1.2 Validitatea de construct 94
8
4.1.3 Validitatea externă 95
CAPITOLUL 5
CONTROLUL EXPERIMENTAL 111
5.1 Înţelesurile noţiunii de control
experimental 111
5.2 Precursori ai controlului experimental 113
5.2.1 Analiza evenimentelor 114
5.2.2 Varierea circumstanţelor 114
5.2.2.1 Metoda diferenţelor 115
5.2.2.2 Metoda variaţiilor concomitente 116
5.2.2.3 Metoda acordului 116
5.3 Strategii de control experimental 117
5.3.1 Controlul în laborator 117
9
5.3.2 Proiectarea judicioasă a
experimentului 118
5.3.3 Măsurarea adecvată a răspunsului 119
5.3.4 Replicarea experimentului 120
5.4 Controlul în planurile experimentale cu
grupuri independente 121
5.4.1 Contribuţia lui Ronald Fisher 121
5.4.2 Randomizarea 124
5.4.2.1 Randomizarea completă 125
5.4.2.2 Randomizarea în blocuri 128
5.4.2.3 Randomizarea în pătrat latin 130
5.4.3 Tabelele de randomizare 132
5.4.4 Utilizarea variabilelor moderatoare 133
5.4.5 Controlul statistic 133
5.5 Controlul în design-urile cu măsurători
repetate 135
5.5.1 Balansarea completă 135
5.5.1.1 Randomizarea în blocuri în planurile
experimentale cu măsurători repetate 136
5.5.1.2 Contrabalansarea 138
5.5.2 Balansarea incompletă 139
5.5.3 Controlul prin rotirea ordinii de start 140
5.5.4 Controlul efectelor transferului 140
5.5.5 Controlul efectelor de ordine şi secvenţă 142
5.6 Controlul defectuos 144
5.6.1 Experiment cu un singur grup testat la
final 144
5.6.2 Experiment cu grup de control
neechivalent 145
5.6.3 Experimentul expus efectelor de ordine şi
de secvenţă 146
5.7 Controlul caracteristicilor sociale ale
experimentului 147
5.7.1 Experimentul ca un context social 147
5.7.2 Cerinţele de rol 150
10
CAPITOLUL 6
DESFĂŞURAREA EXPERIMENTULUI 153
6.1 Alegerea probei de cercetat 153
6.1.1 Activarea optimă 154
6.1.2 Sesizarea faptului ştiinţific 155
6.1.3 Informare şi documentare 155
6.1.3.1 Consultarea surselor teoretice 158
6.2 Alegerea metodei şi a procedurilor 159
6.3 Definirea condiţiilor experimentale 160
6.4 Alegerea subiecţilor 161
6.5 Selecţia subiecţilor 161
6.6 Dimensionarea optimă a eşantionului 162
6.6.1 Mărimea eşantionului funcţie de puterea
testului statistic 163
6.6.2 Mărimea eşantionului funcţie de mărimea
efectelor 164
6.6.3 Mărimea eşantionului şi eroarea
standard a mediei 166
6.7 Construirea propriului chestionar ca
instrument de cercetare 167
6.8 Pretestarea 169
6.9 Valorificarea şi interpretarea datelor
experimentale 169
6.9.1 Inferenţa statistică 170
6.9.1.1 Testul ipotezei de nul 171
6.9.1.2 Metoda intervalelor de încredere 176
6.9.1.3 Analiza de varianţă ANOVA 178
6.9.1.3.1 ANOVA pentru grupuri independente 178
6.9.1.3.2 ANOVA pentru desig-nuri cu măsurători
repetate
183
6.9.1.4 Determinarea mărimii efectelor 186
CAPITOLUL 7
CVASIEXPERIMENTUL 189
7.1 Experiment şi cvasiexperiment 189
7.2 Specificul cvasiexperimentului 190
7.3 Tipuri de cvasiexperiment 193
7.3.1 Cvasiexperimentul cu grupuri
neechivalente 193
11
7.3.2 Cvasiexperimentul mixt 194
7.3.3 Plan experimental cu linia de regresie
discontinuă 195
7.3.4 Design-uri experimentale fără grupuri de
control 196
CAPITOLUL 8
EXPERIMENTE CU UN SINGUR SUBIECT 199
8.1 Utilitatea experimentului cu un singur
subiect 199
8.2 Avantajele experimentelor cu un singur
subiect 202
8.3 Controlul în experimentele cu un singur
subiect 204
8.3.1 Obţinerea unei tendinţe stabile 204
8.3.2 Întreruperea tratamentului 205
8.3.3 Modelul tratamentelor repetate 205
8.3.4 Modificarea unei variabile pentru a i se
determina efectul 207
8.3.5 Determinarea mai multor tendinţe
(multiple- baseline design) 207
8.3.6 Schimbarea succesivă a criteriului 208
CAPITOLUL 9
ETICA CERCETĂRII EXPERIMENTALE 209
9.1 Tratarea subiecţilor umani 209
9.1.1 Decizia de a realiza un experiment 212
ştiinţific
9.1.2 Consimţământul avizat 210
9.1.3 Protejarea stării de bine a subiecţilor 211
9.1.4 Confidenţialitatea 212
9.1.5 Respectarea demnităţii 212
9.1.6 Convorbirile finale 213
9.2 Etica experimentării pe animale 214
12
13
Introducere
14
O primă raţiune este aceea că psihologia este, acum în prag de
mileniu, o ştiinţă ca oricare alta.
Al doilea motiv este acela că metoda experimentală desparte
istoria psihologiei în două mari etape: etapa copilăriei şi a
romantismului care ţine până prin 1879, când Wundt a înfiinţat la
Leipzig primul laborator de psihologie, şi etapa propriu-zis ştiinţifică
în care se instituie tradiţia verificării experimentale a teoriilor
psihologice.
La fel ca celelalte ştiinţe, psihologia este departe de a avea
confirmate prin experiment toate construcţiile sale teoretice dar este
un fapt de necontestat că elementele esenţiale ale edificiului său
teoretic, legile sale, începând de la cele psihofiziologice până la cele
care controlează procesele cognitive de înalt ordin, au în bună parte o
astfel de susţinere experimentală.
În sfârşit, o a treia raţiune a unor consideraţii epistemologice
ţine pe de o parte de locul central al psihologiei experimentale în
ansamblul disciplinelor psihologice, iar pe de altă parte de faptul că
schimburile psihologiei cu alte ştiinţe, schimburi care se produc în
sferele aplicative, trebuie evaluate din perspectiva filosofiei ştiinţei.
Toate acestea sunt suficiente motive pentru a trata psihologia
experimentală, chiar şi numai în treacăt, în primul capitol, din
perspectiva noţiunilor de ştiinţă, de teorie ştiinţifică şi de a trece în
revistă funcţiile, obiectivele şi modalitatea de testare empirică a
acestor teorii.
Lucrarea are însă ca nucleu central problematica modelelor
experimentale, a controlului variabilelor şi condiţiilor, precum şi aceea
a derulării experimentului psihologic. Toate acestea fac obiectul
capitolelor al treilea, al patrulea şi al cincilea care ocupă ponderea cea
mai mare în economia lucrării.
Ideea de măsurătoare este, alături de aceea privind
posibilitatea exprimării numerice a regularităţilor şi legilor, una dintre
paradigmele cele mai rodnice care au apropiat psihologia de statutul
râvnit al ştiinţelor pozitive, începând cu sfârşitul secolului al XIX lea.
Spre deosebire de aceste ştiinţe psihologia are o libertate limitată de a
se juca cu numerele. În matematică, acest „joc” a condus la crearea
unor modele a căror utilitate a fost descoperită, mai târziu, de fizica
modernă.
În psihologie lucrurile stau altfel: există o serie de
constrângeri în a exprima prin numere procesualitatea vieţii psihice,
dincolo de care, cifrele ne îndepărtează de fapte şi ne conduc la
mistificări şi la extravaganţe. Este motivul pentru care semnificaţia şi
utilitatea sistemului măsurătorilor psihologice, împreună cu avantajele
15
şi limitele diferitelor metode de măsurare sunt tratate pe larg, alături
de problema variabilelor, în primul capitol.
Metoda experimentală nu este în exclusivitate o metodă de
laborator. Ea este utilizată oriunde exigenţele ei pot fi întrunite într-o
măsură satisfăcătoare, adică în mediul organizaţional, în mediu şcolar,
etc. De aceea, urmând exemplul altor lucrări, am luat în discuţie, în
capitolul şapte, cvasiexperimentele, împreună cu avantajele şi mai ales
cu dezavantajele privitoare la probabilitatea mai scăzută a rezultatelor
la care conduc aceste tipuri de cercetări psihologice.
În final, nu doar în virtutea tradiţiei lucrărilor de acest gen ci
pornind de la lipsa unor reglementări autohtone, am zăbovit în ultimul
capitol asupra principiilor de etică privind experimentul psihologic,
principii cu o largă recunoaştere şi adânc recunoscute în comunitatea
ştiinţifică din ţările occidentale.
Lucrarea de faţă nu este o lucrare de metodologie a cercetării.
Ca atare, unele teme cum sunt acelea ale studiilor corelaţionale, nu şi-
ar fi găsit locul printre metode care ţintesc, în cele din urmă, explicaţia
cauzală.
Din acelaşi motiv, lucrarea nu conţine tradiţionalul capitol de
statistică matematică, şi se limitează la tratarea principială a
problemelor legate de inferenţa statistică şi analiza de varianţă,
metode esenţiale de interpretare a rezultatelor unui experiment
psihologic.
CAPITOLUL I
16
Ştiinţa, poate fi definită ca un ansamblu de cunoştinţe,
structurate într-un sistem coerent de teorii. Astfel, psihologia în
ansamblu ei reuneşte un sumum integrat de teorii, mai generale sau
mai particulare, ca de exemplu teoria sistemului psihic uman, teoria
dinamică a personalităţii, teoria BIG –FIVE sau teoria răspunsului la
itemi în domeniul aplicativ al psihometriei.
17
dedicat elaborării unor teorii mai puţin ambiţioase, ca scop dar cu o
mai mare putere de precizie (Teoria percepţiei vorbirii - theory of
speech perception, sau teoria constructelor personale).
18
asociere regulată între două variabile. Legile statistice nu presupun o
regularitate perfectă. Frustrarea, de exemplu, nu conduce întotdeauna
la agresiune. Mai trebuie menţionat că noţiunea de lege nu implică
obligatoriu existenţa unei relaţii de tip cauză-efect. Orice relaţie care
se manifestă cu regularitate între fenomene este o lege.
Când descriem evenimentele încercăm să surprindem relaţiile
legice dintre ele, de aceea descrierea şi descoperirea legilor constituie
două laturi ale aceleiaşi activităţi ştiinţifice.
19
d) Cauzalitatea. Convingerea că toate lucrurile au o cauză este
numită determinism. Determinismul rigid susţine că dacă ar fi
cunoscute toate legile comportamentului împreună cu toate influenţele
care se exercită asupra sa, atunci ar putea fi efectuate predicţii exacte
cu privire la manifestările sale viitoare. Opusă acestei direcţii de
gândire este orientarea care recunoaşte existenţa voinţei libere, a
liberului arbitru.
În domeniul psihologiei şi al ştiinţelor sociale mai corect este
să vorbim despre un determinism statistic care postulează existenţa
unor relaţii probabiliste între fenomenele cauză şi cele efect. Un
exemplu edificator pentru acest tip de determinism este concluzia
cercetărilor că fumatul cauzează cancerul pulmonar deşi nu toţi
fumătorii contractează această boală. Un alt exemplu este al relaţiei de
cauzalitate dintre sărăcie şi delicvenţă deşi nu toţi oamenii săraci
devin delicvenţi şi în ciuda faptului că printre ei delicvenţi se numără
şi oameni bogaţi.
20
principii desprinse din cercetări precedente care, în virtutea
caracterului cumulativ al ştiinţei, nu mai trebuie dovedite. Iată un
exemplu ipotetic: Presupunem că dorim să verificăm ipoteza
apărărilor perceptive. Într-un experiment asociativ verbal subiecţilor li
se prezintă cu timpi mici de expunere cuvinte tabu intercalate printre
cuvinte neutre. Pentru a verifica existenţa, respectiv inexistenţa unei
încărcături emoţionale, subiecţii vor fi conectaţi la un
psihogalvanometru. În raportul de cercetare în care vom prezenta
rezultatele experimentului nu va fi nevoie să argumentăm existenţa
unei legături între modificările de conductanţă ale pielii şi trăirile
emoţionale ale subiectului, efectul psihogalvanic constituind un
adevăr intrat definitiv în patrimoniul ştiinţei.
Tot în categoria autorităţii se înscrie şi practica acceptată şi
standardizată de comunitatea ştiinţifică de a sprijini argumentaţia unui
material redactat (articol, raport de cercetare, etc.) pe citarea unor
autori ale căror rezultate ştiinţifice au o largă recunoaştere.
Totuşi într-un demers ştiinţific accentul prea mare pe
autoritate, poate să ducă la poziţii dogmatice ori istoria ştiinţei nu este
altceva decât istoria luptei pentru libertatea spiritului.
Logica, în calitate de ştiinţă a formelor perfecte de gândire,
permite extragerea unor concluzii corecte din datele de care dispunem.
Logica matematică, logicele neoclasice furnizează psihologiei modele
pertinente pentru explicarea operaţiilor cognitive. Totuşi Scolastica
este un exemplu extrem care ilustrează limitele logicii în obţinerea
unor adevăruri care sunt mult mai accesibile prin observarea realităţii.
O categorie aparte o constituie aşa-numitele metode intuitive.
Manifestate fie ca simţ comun, fie ca misticism ele ne facilitează o
percepţie spontană sau o judecată nefundamentată pe o procesualitate
raţională.
Simţul comun are la bază concordanţa judecăţii personale cu
experienţa unui larg grup de oameni. El are două limite importante: a)
Variază cu timpul şi cu condiţiile, lipsindu-i verificarea sistematică a
părerilor care ghidează practica. Părerile sunt considerate adevărate
atâta timp cât practica funcţionează; b) Este mai degrabă teoretic decât
practic lipsindu-i capacitatea de a prezice noi date.
Există însă şi un simţ comun al comunităţii ştiinţifice în virtutea căruia
se apreciază dacă o teorie pare sau nu plauzibilă (Vadum şi Rankin,
op.cit.). El este puternic impregnat de formaţia ştiinţifică a membrilor
acestei comunităţi.
Misticismul este o cale de cunoaştere bazată pe intuiţia directă,
asociată cu starea alterată de conştiinţă. El se sustrage în totalitate
verificării şi prin aceasta el se situează la polul opus ştiinţei.
21
Obiectivitatea este criteriul esenţial care separă ştiinţa de alte forme de
cunoaştere a comportamentului uman. Unele dintre acestea cum sunt
autoritatea, simţul comun sau misticismul nu au pretenţia de a se
constitui în alternative ale cunoaşterii psihologice şi de aceea coexistă,
ca soluţii individuale de viaţă, cu psihologia.
Iată, de exemplu, misticismul poate constitui pentru un om de ştiinţă o
opţiune personală, care îl poate mobiliza în obţinerea unor rezultate
ştiinţifice deosebite. Niciodată însă faptele ştiinţifice nu vor putea fi
susţinute prin argumente de natură mistică. La fel, autoritatea, joacă
un rol minor în ştiinţă care nu acceptă altă formă de autoritate în afară
de autoritatea adevărului ştiinţific. În ultimele decenii unii cercetători
au fost din ce în ce mai preocupaţi să valorifice tezaurul de cunoaştere
psihologică encodat în limbaj (R.B. Cattell, Allport, Odbert, ş.a.).
Faţă de alte preocupări care ţin de falsa ştiinţă psihologia se detaşează
în mod tranşant. Pseudoştiinţa este „oricare dintre disciplinele sau
mişcările privite ca psihologie dar care nu întrunesc criteriile
psihologiei” (McBurney, op.cit. p. 32).
Există mai multe pseudopsihologii: parapsihologia, bioritmul,
astrologia ş.a. Forma cea mai populară a pseudoştiinţei este
parapsihologia. Aceasta nu satisface caracteristicile care definesc
ştiinţa, adică definiţia precisă a termenilor, descoperirea legilor care
guvernează fenomenele abordate, repetabilitatea faptelor observate,
etc.
În măsura în care se substituie cunoaşterii ştiinţifice, pseudoştiinţa
poate aduce oamenilor şi societăţii în ansamblul ei reale deservicii.
22
Exemple de descoperiri care au la bază serendipitatea sunt:
condiţionarea operantă, descoperirea efectului de întărire pe care îl are
stimularea electrică a ariei septale a formaţiei reticulate, etc.
Dimpotrivă, alţi autori (Vadum şi Rankin, op.cit.) cred că
insigh-tul de care vorbesc gestaltiştii are la bază probabil un întreg
lanţ de procese şi operaţii preconştiente prin care informaţia
acumulată este prelucrată şi restructurată până ajunge să se exprime în
forme noi şi originale.
24
persoane, care, aşa cum plastic se exprimă McBurney (1983), privesc
peste umărul omului de ştiinţă, au şanse să vadă aceleaşi lucruri.
Obiectivitatea se referă deci la repetabilitatea procedurii de a obţine,
în anumite circumstanţe date, mereu şi mereu aceleaşi rezultate.
Opusă observaţiei obiective este observaţia subiectivă.
Rezultatele unei observaţii subiective nu sunt în principiu
reproductibile de către o altă persoană. Iată un exemplu preluat din
McBurney (op.cit.): Ana poate spune, „Am senzaţia de sărat.” O astfel
de propoziţie este subiectivă pentru că nimeni nu este obligat să
creadă că ea a avut această senzaţie de sărat. Pe de altă parte
propoziţia „Ana spune că a avut senzaţia de sărat” este obiectivă
pentru că toate persoanele de faţă pot verifica dacă Ana a făcut această
afirmaţie. Observatorul poate deci să înregistreze în mod obiectiv
constatarea subiectivă a Anei.
Obiectivitatea este una dintre caracteristicile care desparte
tranşant ştiinţa de alte domenii cum sunt religia, politica sau arta. De
aceea ştiinţa pune un accent atât de mare pe corectitudinea metodelor
de cercetare. Obiectivitatea mai înseamnă că ştiinţa în general,
respectiv psihologia care este în discuţie, nu este parohială ci
universală, adică demersurile şi rezultatele sale sunt posibil de accesat,
în mod potenţial, de oricare persoană care are competenţa necesară.
25
Ea a fost preluată de psihologie din fizică (Golu, M.,1975).
Experimentul este definit de Cook şi Campbell (1976) ca fiind
orice eveniment (tratament) produs în condiţii naturale sau controlate,
care intervine în viaţa respondenţilor şi al cărui efect poate fi evaluat
empiric.
Scopul esenţial al metodei experimentale este de a
fundamenta teoriile ştiinţifice prin testarea ipotezelor lor fundamentale
(Shaughnessy, E., Zechmeister, J. Zechmeister, 2000).
Metoda experimentală mai este utilizată în testarea utilităţii
anumitor intervenţii de natura psihopedagogică, terapeutică, de
promovare a produselor sau de ameliorare a diverselor aspecte ale
vieţii.
Pentru că în multe privinţe experimentul este un tip de
observaţie structurată şi pentru că el însuşi implică observaţia, nu ar
trebui făcută o distincţie prea tranşantă între metoda experimentală şi
metodele descriptive (Shaughnessy, E., Zechmeister, J., Zechmeister,
2000).
Specificitatea metodei experimentale este dată de o seamă de
caracteristici care o deosebesc de celelalte metode, utilizate de
cercetător (observaţia, testul psihologic, convorbirea, analiza
produselor activităţii, etc).
Psihologia experimentală este, potrivit unei definiţii de tip butadă a lui
Paul Fraisse (1970), o psihologie elaborată cu ajutorul metodei
experimentale. Ea este, după unii autori o ramură a psihologiei care
supune experimentării faptele înregistrate pe calea observaţiei spre a
le verifica şi stabili legile (Dict. Larouse, 2000). Şi celelalte ramuri al
psihologiei utilizează metoda experimentală. Cu toate acestea,
psihologia experimentală îşi propune să inventarieze şi totodată să
coordoneze modelele experimentale cele mai reprezentative din ariile
diverse ale psihologiei cu dublul scop, atât didactic, ilustrativ, dar mai
ales pentru a desprinde paradigmele, principiile metodologice apte să
ghideze cercetările viitoare. Psihologia experimentală poate fi astfel
definită ,,ca un ansamblu de principii, norme, reguli care stau la baza
organizării şi desfăşurării experimentului în psihologie …’’ M. Aniţei
(2000, p. 22). Autorul citat este de părere că psihologia experimentală
nu este o disciplină autonomă ci o metodă sau un anume mod prin
care variatele domenii ale psihologiei realizează cunoaşterea
ştiinţifică.
Cercetătorul experimentalist intervine activ în producerea
fenomenului psihic studiat. El creează şi controlează condiţiile apariţiei
şi desfăşurării acestui fenomen menţinând constanţi factorii care pot
influenţa conduita cu excepţia acelora care sunt studiaţi. Experimentul
26
permite posibilitatea repetării sale de către acelaşi experimentator sau
de către alţi cercetători în scopul verificării datelor obţinute. Aceste date
sunt rezultatul unor măsurători exacte dar şi al unor observaţii
sistematice.
Experimentul psihologic se remarcă prin rigurozitatea datelor
obţinute dar şi printr-o serie de inconveniente. Una dintre limitele sale
este dată de caracterul artificial al condiţiilor de laborator în care este
situat subiectul, deosebite de condiţiile reale în care au loc fenomenele
psihice studiate. Experimentele de laborator nu sunt decât modele
aproximative ale situaţiilor reale în care acţionează subiecţii.
La aceasta se adaugă şi faptul că în condiţii de laborator, pe de
o parte, poate fi studiat un număr redus de aspecte, iar pe de altă parte,
din multitudinea de factori care pot influenţa conduita studiată în
condiţii reale, doar o mică parte poate fi luată în considerare. Nu mai
puţin adevărată este constatarea că experimentatorul poate influenţa
comportamentul subiectului prin ecuaţia sa personală.
27
Kneller (1978) distinge două mari faze ale cercetării ştiinţifice:
Ciclul descoperirii şi ciclul validării. Primul include eforturile, uneori
solitare alteori în echipă, de a efectua observaţii, de a emite ipoteze
care sunt riguros testate. În a doua fază, în urma comunicării
rezultatelor, acestea sunt verificate de către comunitatea ştiinţifică.
Alţi cercetători repetă experimentul şi dacă sunt obţinute rezultate
similare, cercetarea este validată. Ştiinţa se bazează numai pe fapte
reproductibile, adică replicate în alte cercetări, desfăşurate cu aceleaşi
metode şi în aceleaşi condiţii dar în locuri diferite şi cu alţi subiecţi.
Următorul exemplu, comentat de A. Dragu (2003), este elocvent
pentru succesiunea celor două cicluri: Efectul Ringelman, fenomen
pus în evidenţă de inginerul francez cu acelaşi nume, a suscitat un
interes deosebit din partea comunităţii ştinţifice.
Experimentul efectuat de Ringelman, ale cărui date arătau o
descreştere dramatică a efortului fizic individual pe măsură ce
numărul participanţilor la experiment creştea de la unu la opt
persoane, a fost replicat de Ingham şi colaboratorii săi, în 1974, apoi
de un alt colectiv de cercetători, condus de Latane, în 1979 şi 1988.
De asemenea, Weldon şi Garagano în 1988 precum şi Williams, Nida,
Baca& Latane, în 1989 s-au ocupat de acest fenomen. Replicările au
confirmat, unele parţial, altele în cea mai mare parte, rezultatele lui
Ringelman, dar au contribuit totodată la adâncirea cauzelor care
generează acest efect. Ringelman pusese acest efect pe seama lipsei de
coordonare a efortului în grup. Ingham şi colaboratorii au demonstrat
rolul lipsei de motivaţie în generarea efectului de irosire socială, iar
Latane a dovedit că fenomenul este generat de acţiunea simultană a
lipsei de coordonare a efortului şi de diminuarea motivaţiei. Studiile
mai recente atribuie acest efect fenomenului de irosire socială adică
difuziei responsabilităţii indivizilor la nivelul grupului. Sentimentul
anonimatului este acela care diminuează motivaţia şi diluează
responsabilitatea participanţilor
Cercetarea ştiinţifică parcurge următorii paşi:
1) Identificarea şi definirea problemei de cercetat;
2) Formularea ipotezelor;
3) Testarea ipotezelor; derularea cercetării;
1 4) Elaborarea concluziilor.
Trebuie precizat că aceste etape nu sunt rigide, de la o
cercetare la alta această schemă putând căpăta concretizari mai mult
sau mai puţin diferite. Să le trecem succint în revistă.
28
Nu este deloc, aşa cum s-ar putea presupune, o etapă facilă cu
atât mai mult cu cât:
a) Nu orice poate fi experimentat. Sunt probleme pe care stadiul
actual al ştiinţei, sau considerente de ordin etic fac imposibilă
abordarea lor pe cale experimentală. De exemplu multe dintre
conceptele psihanalizei nu pot fi abordate experimental. De
asemenea, manipularea unor variabile psihofiziologice sau de
personalitate poate afecta grav echilibrul persoanei. Dar cele
mai grave limitări provin din experimentatorul însuşi, din
capacitatea lui de a sesiza faptul ştiinţific.
b) Sesizarea unui fapt demn de cercetat care prezintă
interes şi valoare ştiinţifică se produce pe fondul unor
cunoştinţe teoretice solide, bine structurate care ajută
cercetătorul să sesizeze problema acolo unde simţul
comun o trece neobsevată.
29
De obicei cercetarea unei probleme noi se axează pe
strângerea de date de observaţie şi mai puţin pe testarea unei teorii
ştiinţifice. Totuşi trebuie să recunoaştem că şi cele mai elementare
observaţii nu pot fi efectuate în afara unor cunoştinţe care provin
dintr-o teorie sau din teorii anterioare. Există două modalităţi de
cunoaştere ştiinţifică:
30
-Este adevărată sau falsă;
-Poate fi testată empiric.
Ipoteza reprezintă un răspuns anticipat pe care cercetătorul îl dă
problemei puse. El realizează, astfel, un contur coerent al unui model
sau al unei teorii ştiinţifice care urmează a fi verificată odată cu
ipoteza enunţată. Sursele ipotezelor sunt variate. Una dintre ele este de
natură inductivă şi constă în observarea unui fapt inedit în cursul unui
experiment. Deşi se naşte din observarea faptelor, ipoteza se
reformulează în termenii proprii stadiului atins de ştiinţă. Un exemplu
va fi edificator: Piaget emite ipoteza obiectului permanent pe baza
observării comportamentului unui copil de 13 luni care are tendinţa de
a căuta o minge în locul unde altădată a reuşit să o recupereze şi nu
din locul unde mai recent nu reuşise să o găsească.
Ipotezele sunt, în alte cazuri, deduse dintr-o serie de legi sau
regularităţi deja stabilite între anumite fenomene. Aceasta presupune
cunoaşterea în profunzime a literaturii consacrată problemei studiate.
Un fond larg de cunoştinţe echivalează cu un fond larg de ipoteze
latente (Al. Roşca, 1971). Paul Fraisse (1970) ilustrează calea
deductivă enunţând două legi privitoare la recunoaşterea unui cuvânt:
pragul de recunoaştere a unui cuvânt (timpul minim de expunere
necesar) este cu atât mai mic cu cât frecvenţa cuvântului în limbă este
mai mare;
pragul de recunoaştere pentru orice stimul este mai scurt dacă
subiectul are o atitudine perceptivă adecvată (informaţii asupra naturii
stimulului).
Din cele două legi s-a dedus următoarea ipoteză: pragul de
recunoaştere a cuvintelor de frecvenţă egală este mai mic dacă
subiectul are elaborată o atitudine preperceptivă adecvată.
Etapa formulării ipotezei este faza cea mai creativă a
experimentului. Confruntat cu o serie de fapte şi cunoştinţe
cercetătorul presupune existenţa unei relaţii pe care căută să o verifice.
Aşa cum am mai spus, una dintre condiţiile esenţiale îndeplinite de
ipotezele ştiinţifice este aceea de a fi testabile. Potrivit lui Hempel
(1966) ipoteza este orice aserţiune testabilă neavând importanţă dacă
scopul ei este să explice un anumit fapt sau să exprime o lege
generală sau o propoziţie mult mai complexă .
Odată emisă ipoteza va conduce la anumite implicaţii, adică la
predicţii privind ce anume va fi observat într-o anumită situaţie
particulară. Ipotezele sunt implicaţii test de tipul „dacă… atunci”
bazate pe presupunerea că aserţiunea este adevărată. Mai precis ele
prevăd că dacă sunt îndeplinite anumite condiţii vor avea loc anumite
31
evenimente. Calea pe care sunt obţinute implicaţiile testabile ale unei
ipoteze este calea deductivă.
Specific metodei deductive este opunerea a două teorii care
oferă pentru acelaşi fenomen explicaţii opuse, extragerea unor
predicţii şi testarea acestora pentru eliminarea uneia dintre teorii.
Experimentul care testează cele două teorii se numeşte experiment
crucial, dat fiind faptul că inevitabil una va fi respinsă (Roşca Al., op.
cit.)
32
Există două tipuri de planuri experimentale: experimentale şi
observaţionale. În cercetările experimentale variabilele independente
(condiţiile) sunt manipulate de experimentator pe baza unui plan. În
studiile observaţionale, care sunt pasive în raport cu condiţiile
experimentale pe care le găsesc preexistente, cercetătorul le selectează
sau aşteaptă să se producă.
„În proiectarea unui studiu cercetătorii trebuie să anticipeze ce
se va întâmpla în ciclul validării examinând cercetarea planificată
pentru a vedea dacă eventualele breşe ar putea fi completate. Ei
trebuie să se întrebe, de exemplu, dacă există evenimente sau condiţii,
altele decât cele specificate în ipoteze care variază astfel încât un critic
ar putea susţine că ele, mai degrabă decât evenimentele sau condiţiile
presupuse, determină rezultatele cercetării.” (Vadum şi Rankin, op. cit.
p. 14.)
33
Termenul operaţionalizare a fost introdus în medicină în 1927
de medicul Percy Bridgman şi preluat în psihologie de către S.S.
Stevens în 1935.
Operaţionalizarea termenilor echivalează cu definirea lor
precisă, în termeni de operaţii observabile astfel încât alţi cercetători
să înţeleagă cu claritate şi să poată reface, în alte condiţii, cercetarea
respectivă.
Percy Bridgman a susţinut că, la fel ca şi datele ştiinţifice,
conceptele ştiinţifice trebuie să fie publice. Potrivit operaţionalismului
conceptele ştiinţifice ar trebui să fie definite în concordanţă cu
operaţiile prin care acestea sunt măsurate.
Definiţia operaţională este un enunţ prin care cercetătorul
indică maniera în care un concept ştiinţific poate fi obiectivat sau
măsurat. De exemplu, noţiunea de înfometare, atât de vehiculată în
cercetările având ca temă sau bazate pe condiţionarea operantă, este
operaţionalizată în experimentele efectuate pe şobolani prin indicarea
numărului de ore cât durează deprivarea acestora de hrană.
Definirea operaţională a conceptelor presupune indicarea
operaţiilor sau procedurilor care clarifică înţelesul acelor concepte.
Dacă definiţia operaţională face uz de o măsurătoare superfluă
a conceptului se ajunge la rezultate îndoielnice. De exemplu, dacă
utilizăm ca semn al anxietăţii răsucirea de către subiect a nasturelui de
la haină, ignorând măsurători a căror validitate este dovedită
(răspunsul electrogalvanic al pielii sau rezultatele chestionarelor
consacrate cum sunt „Scala anxietăţii manifeste Taylor” (Taylor
Manifest Anxiety Scale), sau „Foaia de autoanaliză” a lui R. B.
Cattell, atunci este posibil ca teoria construită pe baza acestui
experiment să aibă serioase deficienţe.
Este de dorit ca un concept ştiinţific să fie operaţionalizat din
mai multe puncte de vedere, adică făcând apel la cât mai multe
operaţii care i-ar putea epuiza sensul. Utilizarea cât mai multor căi
de înţelegere a conceptului prin intermediul unor definiţii operaţionale
diverse poartă numele de operaţie convergentă.
Reţinem că operaţionalismul contemporan adaugă înţelesului
consacrat de Brigman şi pe acela că un concept poate fi definit în
relaţie cu o teorie ştiinţifică mai largă decât aceea care îl conţine
iniţial.
Reţinem ca pe o notă esenţială a definirii operaţionale a
conceptelor ştiinţifice prezentarea clară a termenilor astfel încât
înţelesul lor privitor la evenimente care pot fi observate sau la teoria
care explică aceste evenimente să fie cât mai riguros precizat .
34
1.9.4 Elaborarea şi redactarea concluziilor
35
mai moderne s-au dezvoltat din cercetări aplicate. Aşa este cazul
teoriei detecţiei semnalelor a cărei raţiune este aceea de a explica
modul cum operatorul de radar reuşeşte să detecteze semnalele rare
cum sunt ţintele inamice.
Există şi domenii practice-aplicative ale psihologiei ştiinţifice
care nu se interesează de teorie fiind focalizate pe probleme practice,
aşa cum sunt de exemplu evaluarea metodelor de predare sau a
eficacităţii unei campanii publicitare. Totuşi, în aceste domenii pot
apărea date neconcordante care stimulează apariţia unor teorii care să
restabilească unitatea ştiinţei.
36
aşteaptă să se producă variaţiile în natură, fie le înregistrează pe cele
deja existente. În această categorie intră experimentele efectuate în
condiţii naturale. „Observatorii naturalişti încearcă să observe pattern-
urile evenimentelor într-o situaţie dată fără să evidenţieze vreo
condiţie antecedentă ca fiind de un interes special” (Mc. Burney, op.
cit. p. 33). În cazul cercetărilor observaţionale manipularea condiţiilor
antecedente fie nu este posibilă, fie nu este morală.
Evidenţierea relaţiilor de tip cauză-efect este mai lesne
posibilă în cercetările experimentale decât în cele observaţionale. Cu
toate acestea cercetările de tip observaţional nu sunt nici pe departe
lipsite de interes pentru psihologie, deoarece relaţiile de tip cauzal nu
sunt singurele relaţii de care se interesează psihologia. Adesea se
întâmplă ca experimentul să nu reprezinte cea mai bună metodă de
cercetare (Vadum şi Rankin 1998).
Funcţie de stadiul de clarificare a ipotezelor sunt cercetări cu
caracter exploratoriu pentru a identifica ce anume este demn de
cercetat şi cercetări unde ipotezele sunt fie rezultatul observării
sistematice a unor evenimente, fie al demersurilor deductive originate
în teoriile ştiinţifice deja existente.
Cercetările mai pot fi clasificate funcţie de locul unde se
desfăşoară. Cercetările de laborator, spre deosebire de cercetările de
teren desfăşurate în instituţii şcolare, organizaţii economice, etc, se
caracterizează printr-un control strict al condiţiilor experimentale.
Atât experimentele cât şi studiile se pot desfăşura în laborator
sau pe teren. Experimentele şi studiile observaţionale efectuate în
afara laboratorului se numesc experimente de teren (field
experiments), respectiv studii de teren (field studies). Când natura
creează tipuri de variaţii ale evenimentelor de tipul celor realizate în
laborator, cercetarea se numeşte experiment natural.
37
experimentatorul trebuie să se conformeze limitelor biologice ale
speciei. Dimpotrivă, în experimentele pe subiecţi umani cercetătorul
are o mai mare liberate în a alege acel tip de răspuns care să exprime
optim efectele manipulării experimentale. În astfel de cercetări omul
de ştiinţă restricţionează largul repertoriu comportamental al
subiecţilor la câteva categorii. De exemplu dintre multiplele aspecte
ale reacţiei verbale, cercetătorul se poate focaliza doar pe numărul de
verbe şi adverbe.
Cercetările pot fi astfel clasificate în joase, medii şi înalte
privitor la impunerea de către cercetător a unor unităţi asupra
răspunsurilor subiecţilor. La fel, ele pot fi împărţite în alte trei nivele
după prima dimensiune, gradul de control la dispoziţia cercetătorului.
38
încotro se îndreaptă psihologia secolului al XX-lea ar fi util să
întrevedem care sunt temele majore ale cercetării care polarizează
interesul comunităţii psihologilor. Un astfel de studiu a fost întreprins
de A.P.A în 1952. Este vorba de un program care a cuprins două
proiecte: Primul, a evaluat gradul de dezvoltarea al ştiinţei psihologiei
la acea vreme. În acest scop Sigmund Koch, conducătorul acestui
proiect, a solicitat celor mai reprezentativi psihologi americani să scrie
câte un capitol despre domeniul lor. Aceste capitole au generat şase
volume care conţin un sumum al cunoştinţelor de psihologie la
momentul respectiv.
Al doilea proiect a fost condus de către Kenneth E. Clark de
la Univ. Minnesota. Proiectul a fost de natură empirică şi a urmărit să
contureze mai clar cunoştinţele despre profesiunea de psiholog.
Subiecţii pe care s-a efectuat cercetarea au fost membrii APA de pe tot
cuprinsul ţării. În staff-ul central al APA care a condus cercetarea a
fost cooptat şi R. Thorndike. El a avut ideea de a realiza triade de câte
trei psihologi din istoria psihologiei ale căror contribuţii remarcabile
erau egale dar diferite din punctul de vedere al domeniilor asupra
cărora s-au aplecat. Un chestionar conţinând astfel de triade a fost
expediat la 200 de psihologi americani cerându-li-se să ierarhizeze
personalităţile din fiecare triadă în ordinea importanţei contribuţiei lor.
Ipoteza lui Thorndike era că preferinţele psihologilor evaluatori vor
exprima de fapt interesele lor faţă de ariile psihologiei. În adevăr, pe
baza rezultatelor, care au confirmat că evaluările psihologilor au fost
influenţate de domeniul psihologiei în care erau implicaţi (cercetare,
psihologia muncii, clinică, etc.), preşedintele APA de la acea vreme
Lee J. Crombach a conchis că există două curente privind
metodologia, gândirea şi preferinţele în psihologia sec. XX. Cronbach
a vorbit într-un studiu de existenţa a două direcţii în cercetarea
psihologică contemporană şi anume una, experimentală, alta de natură
corelaţională. Psihologii experimentalişti menţin pe cât posibil
constante diferenţele între indivizi şi variază condiţiile experimentale.
Psihologii corelaţionişti, dimpotrivă, vor să ţină constante condiţiile
pentru a face cât mai pregnante diferenţele dintre subiecţii cercetării.
Ulterior, Gordon Allport (1992) analizând dezvoltarea
teoriilor personalităţii a prefigurat două mari direcţii cărora li se
subsumează cercetările din acest domeniu, orientările nomotetică şi
ideografică. Vom vedea într-un capitol viitor, că sub aspectul
planurilor experimentale, orientarea nomotetică implică
experimentarea cu grupuri de subiecţi, pe când direcţia ideografică
cuprinde experimente efectuate cu un singur subiect.
39
CAPITOLUL 2
40
VARIABILĂ ŞI MĂSURĂTOARE
42
Variabila cantitativă variază în mărime (ex: viteza de răspuns,
intensitatea etc). Valorile ei se situează pe un continuum şi semnifică
gradul sau mărimea dimensiunii măsurate.
Variabilă calitativă – variază în privinţa tipului, felului (ex:
înclinare sau întoarcere la stânga sau la dreapta într-un labirint). Multe
variabile considerate în mod comun a fi calitative şi discrete se
dovedesc a fi cantitative şi continui: intro-extraversia, normal-
neurotic, masculinitate-feminitate, scorurile la foaia de autoanaliză a
lui Cattell, etc.
Criteriile de clasificare a variabilelor nu se exclud reciproc ci
dimpotrivă se regăsesc în aceeaşi variabilă. Astfel o variabilă
independentă cum este tipul temperamental poate fi discontinuă,
calitativă şi invocată.
De asemenea, unele variabilele independente sunt exprimate
cantitativ altele calitativ. O variabilă independentă, cantitativă este,
spre exemplu, intensitatea unui stimul sonor la auzul căruia subiectul
trebuie să apese pe o pedală. Putem alege diverse valori de 10,
20….60Hz. Un exemplu de variabilă independentă calitativă îl
constituie un stimul vizual colorat în roşu, verde, galben şi albastru.
Cele patru culori sunt numite modalităţi sau condiţii.
d) Variabile fizice şi nonfizice
Variabilă fizică - aspect al variabilei (independente sau
dependente) care poate fi exprimat ca mărime fizică (exemple:
intensitatea luminii stimul, amplitudinea undelor cerebrale, etc).
Variabilă nonfizică – aspect al condiţiilor de testare care este
exprimat în termeni comportamentali sau procese cognitive (exemple:
privare – nonprivare de somn, familiarizarea – nonfamiliarizarea cu
situaţia de testare, etc).
Un tip aparte de variabilă nonfizică este variabila subiect care
se bazează pe diferenţele individuale ale subiecţilor incluşi în
experiment, ca de exemplu, introversiunea-extraversiunea, ciclotimia-
schizotimia, masculinitatea-feminitatea, etc. Iată două exemple care
ilustrează modul în care variabila subiect poate fi luată ca variabilă
independentă sau ca variabilă dependentă:
1) Ipoteza verificată într-un experiment este că tipurile
temperamentale sunt caracterizate prin viteze de răspuns diferite.
Variabila independentă, de tip subiect are două modalităţi,
introversiunea şi extroversiunea. Se compară performanţele medii la
un test de reactivitate pentru cele două grupuri independente,
introvertiţii şi extravertiţii.
2) În al doilea experiment ipoteza verificată este aceea că
dimensinea extro-introversie va înclina spre un pol sau spre altul,
43
funcţie de experienţa anterioară. Variabila subiect este tema
povestioarei audiate înainte de măsurarea intro-extraversiunii cu un
chestionar potrivit. Un grup de subiecţi audia o povestire tristă, iar
celălalt asculta o poveste care degaja optimism.
e) Gradul de intervenţie al experimentatorului în manipularea
variabilei: variabilă manipulată – variabilă invocată sau naturală.
Variabila invocată este variabila independentă proprie
cvasiexperimentelor (vezi mai pe larg § 9.2). Variabilele invocate sunt
de obicei variabile subiect sau variabile demografice (vârstă, sex,
nivel de şcolarizare, etc).
Există situaţii când în acelaşi experiment o variabilă propriu
zisă coexistă cu o variabilă invocată.
f) După tipul de plan experimental care le utilizează: variabile
intrasubiect-variabile intersubiect (vezi şi 3.2).
Variabile intrasubiect sunt variabile independente ale căror
valori sau condiţii sunt parcurse de către toţi subiecţii incluşi în
experiment. Decelarea efectelor produse la nivelul comportamentului
de către manipularea variabilei independente este posibilă prin
compararea subiectului cu el însuşi.
Sunt utilizare în experimentele cu măsurători repetate numite,
în literatura anglo-saxonă „within subjects experiments.”
Variabilele intersubiect sunt variabile independente ale căror
valori sau modalităţi sunt parcurse de grupuri diferite de subiecţi. Ele
sunt prezente în modelele experimentale cu grupuri independente
(„independent groups plans” sau between-subjects plans).
44
Măsurarea variabilelor studiate constituie o trăsătură
proeminentă a psihologiei moderne (L. E. Tyler, W. Bruce Walsh,
1979) şi multe dintre progresele ei sunt legate de evoluţia
psihometriei. Astfel, pretenţiile că acuitatea senzorială este un semn al
inteligenţei, că tipul de personalitate al mamei care respinge copilul ar
fi cauza autismului acestuia, sau că loboctomia prefrontală ar vindeca
unele boli psihice sunt exemple de aserţiuni care au fost respinse odată
cu introducerea în domeniile respective a unor tehnici de măsurare
precise (Vadum şi Rankin, op. cit).
În general rezultatele unei cercetări sunt influenţate în mod
considerabil de instrumentele cu care sunt măsurate variabilele incluse
în modelul experimental.
De aceea în faza de proiectare a experimentului cercetătorii
acordă o mare importanţă strategiilor de măsurare care vor fi utilizate
în cercetare.
45
psihologice: aptitudini, deprinderi, interese, emoţii, acuităţi senzoriale,
atitudini, trăsături de personalitate, etc (Vadum şi Rankin, 1998).
De obicei într-o cercetare experimentală sunt utilizate mai
multe tipuri de măsurători, adică măsurători cu caracter
psihofiziologic precum şi măsurători psihologice. Pe de altă parte
aparatele utilizate pot fi din categoria celor consacrate de alte cercetări
sau care sunt livrate de diferite firme (tahistoscop, poligraf, aparat
pentru studiul reacţiilor, psihogalvanometru, etc) altele pot fi realizate
ad-hoc potrivit modelului teoretic şi al nevoilor de experimentare al
unui anumit cercetător. Exemple din a doua categorie de aparate sunt
ceasul lui Mackworth pentru abordarea experimentală a
comportamentului vigilent sau „Microcurba de lucru” un aparat
românesc realizat, pentru nevoile de experimentare în domeniul
oboselii ale unui colectiv de psihologi condus de Valeriu Ceauşu
(1965)
Funcţie de gradul de control pe care subiectul îl are faţă de
propriile reacţii măsurătorile se împart în reactive şi nonreactive.
Măsurătorile reactive pot fi influenţate, în mod voluntar sau
involuntar de către subiecţi. Chestionarele de personalitate, interviul,
observaţia intră în această categorie.
Dimpotrivă măsurătorile nonreactive se caracterizează prin
lipsa controlului subiecţilor, în această categorie intrând măsurătorile
psihofiziologice efectuate cu psihogalvanometrul, electromiograful,
electroencefalograful, etc.
Este de preferat, ori de câte ori este posibil, ca măsurătorile
reactive să fie completate cu măsurători nonreactive. Din păcate
utilizarea măsurătorilor nonreactive cum sunt cele bazate pe cercetarea
de arhivă sau prin utilizarea observatorului ascuns este limitată de
principiul etic al intimităţii.
O altă limitare este dată de stadiul tehnologiei care într-un
anumit moment al dezvoltării nu oferă posibilitatea efectuării unor
măsurători nonreactive a anumitor variabile psihice. Astfel atitudinile,
convingerile, nu pot fi evaluate altfel decât prin chestionare. În astfel
de situaţii Vadum şi Rankin (1998) recomandă utilizarea încrucişată a
mai multor tehnici reactive. În acest mod se infirmă explicaţia rivală
că măsurătorile ar fi dependente de un anumit tip de măsurătoare.
46
„ Măsurarea, scrie Piaget (op.cit., p. 59) constă, în principiu,în
aplicarea numărului la datele discontinue sau continue ce urmează a fi
evaluate”. Apelul la număr, continuă autorul citat, se datorează
proprietăţilor sale (incluziunea care stă la baza clasificării şi ordinea
pe care se reazemă serierea).
Aceasta permite ca anumite proprietăţi ale obiectelor sau
evenimentelor să fie reprezentate prin proprietăţi ale sistemului
numerelor (D. Mc. Burney, 1983). De aceea operaţiile aritmeticii
elementare (adunarea, scăderea, înmulţirea, împărţirea) sunt
aplicabile, în principiu, rezultatelor măsurătorii. Doar în principiu,
deoarece în cazul unor măsurători psihologice acestea sunt fără sens.
De exemplu doi oameni având fiecare un QI de 75 nu fac la un loc cât
unul cu un QI de 150.
Asemănător, în domeniul măsurătorilor fizice este fără sens să
spunem că este de două ori mai cald astăzi decât ieri dacă temperatura
de azi este de 24 de grade Celsius, comparativ cu cea de ieri care a
fost doar de 12 grade Celsius. Să mai obsevăm că în privinţa
măsurătorilor lungimii, masei, vitezei cele patru operaţii îşi găsesec o
mare utilitate.
Motivul lipsei de sens a acestor operaţii în cazul măsurătorilor
psihologice este că, la acestea, valoarea zero este arbitrară, adică nu
înseamnă în realitate lipsa totală, în cazul unui individ, a caracteristicii
psihice măsurate. De fapt, aşa cum observă Piaget (op.cit., p.62),
„ marea dificultate a psihologiei (privitor la măsurare n.n.) este…lipsa
unităţilor de măsură”. În lipsa lor este aproape imposibil să defineşti
valoarea zero.
47
numeroşi autori se referă (Tyler şi Walsch 1979, McBurney, 1983,
Vadum şi Rankin, 1998) prezenţa reperului 0 cu sens.
Să le trecem succint în revistă după Vadum şi Rankin (1998)
în ordinea generalităţii lor :
Proprietatea egalităţii este confirmată dacă doi subiecţi care
ocupă acelaşi loc pe scală sunt egali din punctul de vedere al însuşirii
măsurate.
Proprietatea ordinii de rang există dacă cele mai mari scoruri
de pe scală aparţin persoanelor care deţin însuşirea măsurată în cel
mai înalt grad.
O scală are proprietatea intervalelor egale dacă distanţele
egale între scoruri pe toată lungimea scalei echivalează cu diferenţe
egale în însuşirea măsurată. Scala coeficienţilor de inteligenţă cu
media 100 şi abaterea standard egală cu 15 nu are această proprietate
întrucât diferenţa între QI-urile 78-80 nu este egală cu diferenţa 110-
112, deoarece primul interval aparţine subiecţilor cu o inteligenţă
situată în media inferioară, pe când a doua diferenţă se situează în
media superioară.
Proprietatea rapoartelor egale se referă la faptul că rezultatul
împărţirii unui scor de pe scală cu un altul poate fi utilizat în
compararea cu sens a celor două scoruri. Astfel, dacă efectuăm câtul
dintre înălţimea subiectului A de 180cm şi a lui B de 150cm obţinem
180:150=1.2 Putem afirma că subiectul A este mai înalt de 1,2 ori
decât subiectul B. Nu acelaşi lucru este posibil cu doi coeficienţi de
inteligenţă. În psihologie este lipsit de sens un raport efectuat între doi
coeficienţi de inteligenţă.
Să presupunem că am administrat un chestionar de anxietate
la mai mulţi subiecţi, scorurile minim şi maxim posibile fiind 0 şi
respectiv, 20. Dacă un subiect A obţine un scor de 10 iar altul B de 20,
nu avem nici un temei să spunem că subiectul B este două ori mai
anxios decât subiectul A. O astfel de comparaţie este posibilă numai
dacă transformăm aceste scoruri în note standard.
O a cincea proprietate este existenţa unei semnificaţii
psihologice pentru valoarea 0 de pe scală. Stevens a realizat o scală a
zgomotului unde reperul 0 are sens, anume că în spaţii izolate fonic
sursele de zgomot sunt eliminate. În general în experimentele din
domeniul senzaţiilor reperul 0 de pe scală semnifică lipsa senzaţiei
datorită situării intensităţii stimulului cu mult sub pragul senzorial
absolut.
În sistemul de măsurare propus de Stevens între cele patru
proprietăţi există o relaţie de subsidiere în sensul că ultima,
proprietatea rapoartelor egale le înglobează automat pe celelalte trei, a
48
treia pe celelalte două şi a doua pe prima. Deci o scală care are
proprietatea intervalelor egale va avea obligatoriu şi proprietăţile
ordinii de rang şi a egalităţii. Proprietatea unui reper zero semnificativ,
pare să fie totuşi proprietatea cea mai generală, pe care nu o au decât
scalele raport.
Sistemul de măsurare elaborat de Stevens poate fi rezumat în
tabelul următor:
Tipuri de scale
Proprietăţi
Nominală Ordinală Intervale Raport
Egalitatea x X X x
Ordinea de rang
X X x
Intervale egale
X x
Raporturi egale
x
Zero
semnificativ x
1. Introvert
49
2. Extrovert
3. Nevrotism
4. Psihoticism
50
Scala interval constituie al treilea tip de măsurare cu
proprietăţile, egalităţii, ordinii de rang şi egalităţii intervalelor. Ea
suplineşte principalul dezavantaj al primelor două tipuri : ne perimte
să stabilim distanţa dintrei doi subiecţi d.p.d.v. al caracteristicii
psihologice utilizate. Testele şcolare se situează, cu unele rezerve, în
această categorie. Acest sistem prezintă totuşi o limitare, anume accea
că nu are un punct zero real. De fapt evaluarea nivelului cunoştinţelor
asimilate în şcoală nu presupune definirea riguroasă a unui punct zero
al cunoaşterii. Totuşi lipsa unui punct zero real face ca scorurilor la
teste, obţinute prin acest tip de măsurare, să nu li se poată aplica
operaţia împărţirii.
Iată un exemplu. Aceluiaşi elev i s-a precizat sarcina astfel:
Ştim că cel mai mult îţi place matematica şi cel mai puţin sportul. Pe o
scală gradată de la unu la şapte te rog să arăţi unde se situează fizica,
informatica şi geografia din moment ce mate se situează pe poziţia
şapte iar sportul pe poziţia unu. Răspunsul elevului a fost acesta :
7. Mate
6. Fizica
5.
4. Informatică
3.
2. Geografie
1. Sport
51
Scala raport (ratio scale) are toate cele cinci proprietăţi. În
adevăr ele sunt caracterizate prin existenţa unui punct zero real şi prin
posibilitatea de a trata rezultatele măsurătorii prin toate cele patru
operaţii aritmetice fundamentale.
Puţine sunt scalele utilizate în psihologie care se încadrează în
această categorie. Un exemplu îl constituie scala de intensitate a
zgomotului, unde valoarea zero semnifică absenţa oricărei surse de
zgomot.
Un alt exemplu de măsurătoare de tip scală raport poate fi
găsit în studiul timpului de reacţie. În adevăr, în acest caz punctul zero
înseamnă că reacţia subiectului la vederea stimulului are loc
instantaneu. Nu este locul aici să explicăm de ce în realitate subiecţii
obţin timpi mai mari de zero. Timpul de reacţie mediu al unui subiect
se obţine prin utilizarea tuturor celor patru operaţii aritmetice (L.Tyler
şi B. Walsh op. cit.).
Un alt exemplu care ilustrează modul cum funcţionează acest
sistem de măsurare este următorul: Să presupunem că sarcina de
evaluare a disciplinelor şcolare este formulată de această dată
astfel (D. McBurney, 1983): “ Dacă pe o scală cu capetele libere
(open-ended scale) preferinţa ta pentru fizică se situează la gradaţia 10
unde se vor situa matematica, informatica, geografia şi sportul? Dacă
o disciplină îţi este indiferentă noteaz-o cu zero. Dacă pe una o preferi
de două ori mai mult decât pe alta, acordă-i un punctaj de două ori mai
mare. Dacă o disciplină iţi displace acordă-i un punctaj negativ.
Utilizează orice număr, pozitiv sau negativ, pe care îl consideri
necesar, nefiind nici o limită în sus sau în jos pe scală. Să mai
presupunem că elevul a dat următoarea evaluare:
30
20 Matematica
15
10 Fizica
0 Informatica
-10 Geografia
-20
-30 Sportul
-40
52
evenimente sau obiecte (Aici, asemenea autorilor citaţi mai sus,
utilizăm noţiunea de obiect în sensul său cel mai general de obiect
matematic).
Adevărul este că marea majoritate a măsurătorilor variabilelor
psihologice se încadrează în al treilea nivel, al scalelor interval, sau
este de dorit să fie astfel. Lipsa unui zero real trebuie să ne amintească
mereu că din păcate nu putem utiliza oricare operaţie aritmetică atunci
când dorm să interpretăm rezultatele la un test. De asemenea,
operaţiile matematice sofisticate pot fi uneori lipsite de sens când
datele obţinute într-o cercetare aparţin unuia dintre nivelurile
elementare ale sistemului de măsurători eleborat de Stevens. Altfel
spus, nu toate operaţiile aritmetice care se aplică numerelor au sens în
domeniul scorurilor la teste sau în evaluarea caracteristicilor
psihologice. Dintre toate tipurile de scale studiate scara raport este cea
ma puternică, în sensul că ne permite să derivăm toate informaţiile pe
care ni le prezintă celelate scale, enumerate în ordinea descrescătoare
a aportului lor informaţional: cu intervale, ordinală şi nominală.
Putem identifica şi o ordine inversă, aceea a aşa numitelor
“transformări permisibile “ (D. McBurney, 1983). Este vorba de
numărul permis de procedee de a atasa numere unor atribute psihice în
limitele regulilor permise de fiecare scală de măsurare.
Întorcându-ne la exemplificările efectuate în legătură cu
fiecare sistem de măsurare, scara nominală permite cea mai mare
libertate în sensul că, semnificaţia tipurilor nu se schimbă dacă le
ataşăm numere de la o mie în sus sau dacă le ataşăm literele
alfabetului cu condiţia ca etichetele să fie diferite şi să nu permită nici
o confuzie.
De asemenea numerele din scala ordinală pot fi schimbate în
orice fel cu condiţia să fie conservată ordinea preferinţei. În cazul
scării interval putem aduna sau scădea, înmulţi sau împărţi numerele
printr-o constantă fără ca semnificaţia diferenţelor (distanţelor) dintre
materiile preferate să se schimbe.
Dimpotrivă în cazul scalelor raport putem schimba numerele
care corespund treptelor scării apreciative doar prin multiplicarea lor
printr-o constantă pozitivă.
Fireşte cercetătorul trebuie să facă efortul de a găsi în
experimentele sale acele variabile care se pretează a fi măsurate cu
scara ordinală deoarece în cadrul acestui sistem de măsurare sunt
permise toate operaţiile aritmetice, deci pot fi surprinse mai multe
relaţii care sunt atribuibile fenomenului psihic investigat.
Pe de altă parte trebuie să înţelegem şi pericolele unor
interpretări eronate care pot surveni când unor date obţinute prin
53
măsurători, de exemplu ordinale, le aplicăm proceduri matematice
sofisticate care în acest context sunt lipsite de sens. De exemplu este
complet eronat să spunem că un subiect care a rezolvat 40 de itemi la
testul Matricile Progresive Standard este de două ori mai bun decât
un altul care a rezolvat doar 20. Pentru a efectua astfel de comparaţii
aceste măsurători sunt convertite în altele de un cu totul alt tip numite
clase normalizate sau note standard, acestea din urmă aparţinând
scalei de tip interval. Adesea măsurători efectuate pe o scală inferioară
sunt transformate prin formule matematice adecvate în mărimi care
aparţin unei scale de măsurare superioare d.p.d.v. al operaţiilor
matematice permise.
Către sfârşitul secolului al XIX-lea Lambert A. Quetelet,
matematician belgian a observat că variaţiile individuale în domeniul
măsurătorilor fiziologice tind să se conformeze unei anumite ordini.
Ulterior Galton, în Anglia, a aplicat metoda lui Quetelet în domeniul
unor variabile psihologice cum este acuitatea vederii. Efectuând
măsurători ale unor variabile psihologice dar şi fiziologice
(circumferinţa toracelui) pe grupuri mari de soldaţi (în total aprox
5000) Galton a ajuns la concluzia că regularitatea după care tind să se
distribuie diferenţele individuale se supune unei legi universale.
CAPITOLUL 3
54
PLANURI EXPERIMENTALE
Planul experimental reprezintă unitatea strategiilor alese de
experimentator pentru a preîntîmpina eventualele surse de eroare
(McBurney, op.cit.).
55
contrabalansarea ordinii
tratatamentelor ABBA
Design cu
Câte variabile independente are design-
ul ?
Design omogen
cu grupuri tal cu este parcursă de
Design mixt
independente măsurători un subiect:
obţinute prin: repetate
Efectele repetării
preexistente în
Egalizarea
comparate
grupurilor
natură sau în
tratamentului sunt
complet
Design
Design
incom-
lineare ?
societate
plet
Sunt parcurse Da Nu
Design cu grupuri randomiz.
toate
secvenţele ?
Design cu gr. egalizate
Da Nu
Design cu blocuri
Design cu ordine
contrabalansată,
randomizate
ABBA
implementarea
secvenţelor de
Design cu
tratamente
tuturor
Figura 1. Design cu
secvenţe de Pătrat
Schema modele - tratamente latin
lor experimentale Ordine de start rotită realizate ca:
56
Astfel, în interiorul modelelor experimentale complexe,
funcţie de tipurile de variabile implementate, distingem planurile
omogene (conţin variabile de acelaşi tip) de modelele mixte
(utilizează simultan tipuri diferite de factori).
În cadrul grupei de planuri experimentale care operează cu o
singură variabilă, funcţie de frecvenţa cu care o condiţie
experimentală este dată subiecţilor, avem:
a) Planuri cu grupuri independente, fiecare subiect parcurgând
o condiţie experimentală o singură dată. Conţin variabile de tip
intersubiect; mai sunt numite „between-subjects designs”.
La rândul lor, planurile experimentale cu grupuri
independente (independent groups design) sunt clasificate de
Shaughnessey, et. al. (1998) astfel: modele cu grupuri randomizate,
modele cu grupuri egalizate şi modele cu grupuri naturale.
b) Modelele experimentale cu măsurători repetate. Ele au
implementate, aşa cum am văzut în capitolul precedent, variabile de
tip intrasubiect; fiecărui subiect i se aplică de mai multe ori acelaşi
tratament. Din această cauză, mai sunt numite „ within-subject
designs”.
Trebuie menţionat că cele două tipuri de modele, anume cele
cu grupuri independente şi cele cu măsurători repetate (inter’ şi
intrasubiecţi) permit tipuri de comparaţie diferită. Astfel în cadrul
modelului intersubiect comparaţia mediilor performanţelor
experimentale are loc între grupurile distincte alocate nivelurilor
variabilei independente. Dimpotrivă modelul intrasubiect se bazează
pe comparaţii efectuate între performanţele aceloraşi subiecţi obţinute
pe măsură ce trec de la o modalitate experimentală la alta, adică de la
un nivel la altul al variabilei independente.
Factorii (variabilele) de tip intersubiect (between – subjects
factors) sunt factori cu randomizare completă. În dizainurle
experimentale care utilizează acest tip de factori, subiecţii sunt mai
întâi egalizaţi din punctul de vedere al unor variabile care ar putea
influenţa într-un sens nedorit rezultatele experimentului (sex, vârstă,
nivel de studii, profesie, etc.), apoi sunt repartizaţi în mod aleatoriu la
condiţiile experimentale.
În cazul factorilor de tip intrasubiecţi (within-subjects factors)
subiecţii, alocaţi prin randomizare, parcurg toate nivelele specifice
unui factor. Această modalitate este specifică design-urilor utilizate în
evaluarea eficacităţii diferitelor condiţii experimentale: procedee de
învăţare sau de predare, formule psihoterapeutice, etc. Performanţele
subiecţilor sunt evaluate prin măsurători repetate, de exemplu la
începutul şi la sfârşitul fiecărui tip de tratament.
57
Experimentele de acest tip întâmpină două tipuri de dificultăţi:
1) Deoarece sunt comparate performanţele aceluiaşi subiect în
condiţii experimentale diferite, este posibil ca rezultatele la un
tratament consecvent să fie influenţate de tratamentul precedent.
De exemplu, într-un experiment care testează impactul asupra
calităţii percepţiei a două niveluri de iluminare a spaţiului de lucru
(intens şi slab), performanţele într-o sarcină de discriminare
perceptivă, obţinute la un iluminat inferior, ar putea să fie cu atât mai
reduse cu cât iluminatul precedent a fost mai intens. Pentru
contracararea acestui efect se utilizează metoda contrabalansării:
jumătate dintre subiecţi vor efectua sarcina de discriminare perceptivă
mai întâi în condiţii de iluminat slab şi apoi în condiţii de iluminat
intens. Cealaltă jumătate va parcurge cele două condiţii experimentale
într-o ordine inversă.
2) În unele experimente care evaluează eficacitatea unor
tratamente, prin măsurarea repetată a performanţelor aceloraşi
subiecţi, este posibil să intervină aşa-zisul efect de ordine: un
tratament A este mai eficient când este precedat de tratamentul B
decât când urmează sau precedă tratamentele C şi D.
În astfel de situaţii Vadum şi Rankin (op. cit.) propun tratarea
ordinii ca un factor distinct al planului experimental. Cele trei condiţii
experimentale A, B, C, vor fi combinate în toate tipurile de ordine
posibile, adică şase: ABC, ACB, BCA, BAC, CBA, CAB. Fiecărei
variante îi vor fi alocaţi, prin randomizare, subiecţi diferiţi. Această
metodă are dezavantajul că necesită un număr cu atât mai mare de
subiecţi cu cât numărul tratamentelor cuprinse în plan este mai mare.
Astfel, dacă pentru trei condiţii experimentale rezultă şase combinaţii,
pentru patru vor fi posibile 24 de secvenţe, iar pentru cinci vor rezulta
120 de variante. Deoarece pentru fiecare tip de ordine se vor aloca
prin randomizare alţi şi alţi subiecţi, pentru testarea celor cinci
tratamente ar trebui un număr de 120 de subiecţi. Observăm că
subiecţii sunt repartizaţi în mod aleatoriu la fiecare secvenţă de ordine
a condiţiilor experimentale. În experimentale cu mai multe condiţii
experimentale, repartizarea subiecţilor prin randomizare la aceste
tipuri de tratamente contracarează efectul de ordine, aşa cum
repartizarea întâmplătoare a subiecţilor la grupuri controlează efectele
diferenţelor individuale.
Un alt criteriu care funcţionează în interiorul categoriei de
experimente cu grupuri independente poartă asupra modului de
alocare a subiecţilor la grupurile experimentale şi din acest punct de
vedere modelele experimentale se clasifică în:
58
o planuri cu grupuri randomizate;
o planuri cu grupuri egalizate (matching groups plans);
o planuri cu grupuri naturale.
59
Se regăsesc în experimente ca atare, cu o singură variabilă,
sau cel mai adesea combinate cu un alt sau (mai rar) cu alte modele
experimentale cu o singură variabilă. Dintr-o perspectivă opusă putem
afirma că orice experiment cu design experimental complex poate fi
divizat în atâtea modele experimentale cu o singură variabilă, câte
variabile independente are implementate.
Sunt preferate experimentele de tip factorial care iau în
considerare acţiunea simultană şi interacţiunea mai multor variabile în
producerea unui anumit efect. Totuşi, atunci când sunt utilizate
experimente cu o singură variabilă independentă este benefic, pentru
validitatea experimentului, ca singura variabilă implementată să aibă
mai multe modalităţi iar acestea să fie administrate, după caz, fie
aceloraşi subiecţi (design cu măsurători repetate) fie unor grupuri
distincte (design cu grupuri independente).
Cazul cel mai elocvent este acela al testării diferitelor metode
de predare. Variabila independentă este metoda de învăţare care
cuprinde mai mult de două posibilităţi respectiv, metoda globală,
metoda fracţionată progresivă, metoda fracţionată repetitivă, etc.
Acestea sunt modalităţile variabilei independente. Prin manipularea
variabilei independente de-a lungul acestor modalităţi este de aşteptat
să înregistrăm o serie de variaţii în variabila dependentă, adică în
nivelul competenţelor dobândite de subiecţi. Sunt de preferat
experimentele cu mai multe valori ale variabilei independente atunci
când dorim să determinăm forma grafică a funcţiei care descrie relaţia
dintre variabila independentă şi cea dependentă. Un alt motiv pentru
care cercetătorii preferă acest tip de model experimental este acela al
eliminării altor explicaţii posibile privitoare la datele obţinute.
60
avea subiecţi care se regăsesc în celelalte grupuri sau ar împărtăşi
caracteristici comune altor grupuri cu care este comparat.
61
de vedere statistic, ordinea de parcurgere a unei succesiuni de condiţii
sau stimuli va trebui să fie pentru fiecare subiect mereu alta pentru a
nu avantaja vreo situaţie în raport cu altele.
Atunci când fiecărui subiect urmează să i se aplice toate
condiţiile prevăzute în modelul experimental este nevoie să utilizeze
procedura randomizării ordinii în care vor fi administrate situaţiile
experimentale. Ea este cu atât mai necesară în situaţiile când fiecare
stimul urmează să fie administrat de mai multe ori. În acest caz se
utilizează randomizarea în bloc, procedură care constă în a parcurge
aleatoriu fiecare situaţie experimentală de două ori dar niciodată
succesiv, şi cu interpunerea cel puţin a unei alte condiţii experimentale
între două repetiţii astfel: B D A C A C D B.
Este bine să se utilizeze acest model ori de câte ori este posibil
ca un eficient mijloc de control al variabilităţii individuale a
performanţelor cu respectarea a două condiţii de bază:
(1) Dacă trecerea unui subiect printr-o condiţie experimentală
nu va afecta participarea sa la condiţia următoare sub aspectul
sensibilităţii nemodificate sau al păstrării confidenţialităţii scopului
cercetării;
(2) Condiţiile experimentale nu vor produce efecte
contrastante asupra comportamentului de răspuns ca atunci când un
subiect învăţând o procedură printr-o anumită metodă trebuie să
reînveţe aceeaşi procedură printr-o metodă diferită, fapt care este
practic imposibil.
Există două tipuri de modele experimentale în care
măsurătorile sunt repetate: design-ul complet şi planul incomplet. În
cazul primului model, deoarece fiecare subiect este trecut prin toate
tratamentele, se poate spune că experimentele aplicate unui singur
subiect formează un experiment complet.
În design-ul incomplet nu sunt utilizate toate condiţiile
experimentale, iar acestea sunt administrate unui subiect o singură
dată. Este cazul modelului experimental în pătrat latin şi a modelului
bazat pe rotirea unei ordini de start care a fost obţinută prin
randomizarea ordinii iniţiale a condiţiilor experimentale (random
starting order with rotation).
62
3.2.2.1 Avantajele planului experimental
cu măsurători repetate
3.2.2.2 Dezavantaje
64
Dacă efectul singular al unei variabile independete este numit
efect principal, atunci este subliniat faptul că cercetătorul efectuează
un decupaj în anasamblul efectelor posibile într-un plan experimental
şi se interesează doar de rezultatul varierii sistematice a unei singure
variabile. Noţiunea de efect principal, mai evidenţiază faptul că, de
asemenea, într-un mod artificial, se face abstracţie de efectul variabilei
parametru, care în mod provizoriu este uniformizată, (avereged sau
collapsed), focalizarea având loc doar pe media efectelor produse de
aceasta asupra variabilei dependente. În limba engleză ambele sensuri
sunt condensate într-o singură expresie, main effect.
Planurile complexe sunt denumite în mod obişnuit planuri
factoriale şi au implementate mai multe variabile.
Planul factorial este acel tip de cercetare care cuprinde toate
combinaţiile posibile a cel puţin două valori a două sau multe
variabile independente. Combinaţiile sunt testate experimental atât
prin parcurgerea situaţiilor experimentale rezultate de către toţi
subiecţii, fie prin alocarea în mod aleatoriu a subiecţilor la ele, de data
aceasta comparaţiile efectuându-se între grupuri diferite.
Planurile factoriale sunt preferate altor modele experimentale
deoarece surprind mai bine specificul activităţii psihice în sensul că,
cel mai adesea, efectul unei variabile asupra comportamentului
depinde de acţiunea altor variabile testate. Planurile factoriale cuprind
toate combinaţiile posibile între valorile variabilelor studiate urmând
ca printr-o serie de metode statistice cum sunt testul diferenţelor dintre
mediile grupurilor sau analiza de varianţă să se stabilească ce
combinaţii produc modificări semnificative în variabila dependentă,
altele decât cele datorate hazardului. Pe de altă parte aducând în
experimentul de laborator, care este doar un decupaj al fenomenului
real, o combinaţie cât mai amplă de influenţe, contracarăm caracterul
artificial al cercetării (Al. Roşca, 1971) şi îi sporim validitatea
externă.
Din punct de vedere teoretic într-un experiment poate fi
implementat un număr nelimitat de variabile independente, iar fiecare
dintre ele ar putea avea oricâte nivele sau modalităţi. Dacă acest fapt
ar fi posibil, experimentul de laborator ar atinge o validitate externă
comparabilă cu aceea a experimentelor naturale, deoarece principalul
său avantaj este, aşa cum am văzut deja, acela că oferă posibilitatea de
a fi identificate interacţiunile dintre variabile, interacţiuni care
modelează mai bine specificul sistemic al psihicului uman decât
efectele variabilelor considerate separat.
65
Din păcate, din punct de vedere practic, planuri cu mai mult de patru
cinci variabile independente sunt neinterpretabile (Shaughnessey, et.
al., op. cit.).
Cel care are prioritatea introducerii modelului factorial în
ştiinţă este R.A. Fisher. El a aplicat acest model în 1926 într-un
experiment în care au fost testate efectele fertilizării terenurilor
agricole asupra producţiei de ovăz (Vadum şi Rankin, 1998). Modelul
său experimental şi-a găsit o largă aplicabilitate în psihologie deoarece
el permite studiul efectelor interacţiunii variabilelor manipulate în
experiment asupra variabilei dependente. O interacţiune are loc dacă
efectele unei variabile A asupra unei variabile dependente X depind de
o a treia variabilă. Astfel de interacţiuni sunt frecvente la nivelul
psihicului uman. Ele au o mare valoare atât explicativă, privitoare la
funcţionarea acestuia, cât şi aplicativă, referitoare la eficacitatea unor
metode psihopedagogice sau psihoterapeutice menite să
îmbunătăţească eforturile adaptative ale oamenilor şi calitatea vieţii
lor. Există mai multe modele factoriale, funcţie de numărul
variabilelor independente utilizate.
Cel mai frecvent model factorial este cel bifactorial.
66
nivele: BI -motivare slabă, BII – Motivare medie, BIII – motivare
înaltă. Reprezentarea grafică a acestui model va fi un tabel cu 6
căsuţe, acestea corespunzând numărului condiţiilor experimentale care
vor fi parcurse de subiecţii de experiment: două modalităţi ale
variabilei A înmulţite cu trei modalităţi ale variabilei B dau şase
condiţii (tratamente) experimentale. Acestea sunt: A1,B1; A1,B2;
A1,B3; A2,B1; A2,B2; A2,B3. Pentru comoditatea analizelor
statistice sunt preferate modelele factoriale unde numărul
modalităţilor celor doi factori este acelaşi.
B1 B2 B3
Niveluri ale motivării
Scăzută Scăzută
trebuinţă de trebuinţă de
realizare & realizare &
Un experiment
declin cognitiv fără declin
factorial este acela în care
sunt manipulate cel puţin două variabile experimentale având fiecare
două sau mai multe modalităţi (nivele, valori) şi o variabilă
67
dependentă. În modelele factoriale variabilele independente poartă
denumirea de factori. Sensul acestui termen este diferit, neavând
nimic comun cu acela care este utilizat în analiza factorială.
Trebuinţa de
realizare
54
slabi
49 buni
exista nu exista
declin declin
R3
M3
Randamentul
R2
şcolar
Motivaţia
M2
R1
M1
I1 I2 I3
Nivelurile de inteligenţă
X2Y1 A,B,C,D,E
A,B,C,D,E X2Y2
71
Variabila independentă X Variabila independenta Y
A B C D E A B C D E
X1 X1 X2 X2 X1 X1 X2 X1 X2 X1
Y1 Y2 Y1 Y2 Y2 Y2 Y2 Y1 Y1 Y1
A B C D E A B C D E
X2 X1 X2 X1 X2 X2 X2 X1 X1 X2
Y1 Y1 Y2 Y2 Y1 Y2 Y1 Y2 Y1 Y2
Variabila independentă X
Variabila independenta Y
Variabila independentă X
G1 G2
72
G3 G4
73
Participanţilor la experiment li s-a comunicat că participă la
realizarea unui joc în forma concursului de întrebări, joc destinat unui
anumit colegiu. În fiecare grup a fost introdus un complice.
Experimentatorii au manipulat scrutinul astfel încât, în calitate
de căpitan al grupului să fie ales complicele desemnat. Rasa
căpitanilor (albi, negri) a constituit prima variabilă independentă.
Funcţie de instructajul primit, căpitanii alegeau întrebările (uşoare sau
dificile) la care grupul trebuia să găsească răspunsurile corecte într-un
timp limitat. Funcţie de nivelul de dificultate al întrebărilor strădaniile
grupurilor erau urmate de succes sau de eşec, acest rezultat constituind
cea de-a doua variabilă independentă. Experimentul concretizează un
plan factorial de tipul doi ori doi, având, deci, patru condiţii
experimentale: căpitani albi cu succes, căpitani negri cu succes,
căpitani albi cu eşec, căpitani negri cu eşec în rezolvarea de către
grupul condus a întrebărilor alese.
După concurs, fiecare participant a completat un chestionar prin care a
evaluat căpitanul grupului său. Mediile evaluărilor primite de fiecare
căpitan sunt date în tabelul următor.
Efectul principal al variabilei Performanţa grupului se
determină apelând la statistici descriptive, astfel:
Se calculează media generală a modalităţii succes a
acestei variabile, însumând mediile căpitanilor albi şi
negri şi împărţind rezultatul la doi, adică (309.6 + 280.9) /
2 = 590 / 2 = 295.2.
Se procedează într-un mod asemănător la calcularea
mediei generale a modalităţii eşec, respectiv (155.3 +
196.1) / 2 = 351.4 / 2 = 175.7
Efectul principal al variabilei Performanţa grupului se
determină calculând diferenţa dintre cele două medii
generale, corespunzătoare celor două niveluri, eşec,
respectiv succes: 295 – 175.7 = 119.3
Se apelează la statisticile inferenţiale pentru a stabili dacă
această diferenţă este statistic semnificativă.
Efectul
principal
Performanţa grupului
Rasa căpitanilor
al variabilei
Albă Neagră
Performanţa
grupului
Eşec / Succes
74
309.6 280.9 295.2
155.3 196.1 175.7
238.5 232.4
Efectul
principal
al variabilei
Rasa
căpitanului
75
celei de-a doua variabile independente (Vadum şi Rankin, 1998). „În
orice plan factorial, observă Shaughnessey şi col. (op. cit. pp. 304),
este posibil să testăm predicţii privitoare la efectul general al fiecărei
variabile independente ignorând efectele altei (altor) variabile
independente.”
Revenind la experimentul întreprins de Hass şi colaboratorii,
să observăm că datele din tabelul anterior sunt aparent contradictorii.
Astfel, comparând mediile evaluărilor primite de căpitani, ai căror
grupuri au înregistrat succes la concurs, observăm o netă superioritate
a liderilor de culoare faţă de cei albi. Pe de altă parte, comparaţia
mediilor în condiţii de eşec conduce la un rezultat opus: căpitanii albi
au fost mai bine evaluaţi decât cei negri. Cu alte cuvinte, manipularea
variabilei Performanţa grupului, de-a lungul celor două modalităţi
(succes, eşec), produce rezultate diferite, funcţie de rasa de
apartenenţă a căpitanului. În acelaşi mod, variabila rasă determină
efecte diferite funcţie de faptul dacă grupul condus eşuează sau are
succes la concurs.
400
Scoruri la evaluare
300
200
Negri Succes
Albi Eşec
Eşec Succes Negri Albi
Performanţa Rasa căpitanului
77
depinde de valorile celeilalte. Cu alte cuvinte, o variabilă A va avea un
efect diferit asupra variabilei dependente dacă este combinată cu
nivelul B1 al variabilei B decât dacă ar fi combinată cu nivelul B 2 al
aceleiaşi variabile.
Prin efectul variabilei independente, din punct de vedere
formal, se înţelege forma sau panta curbei care exprimă relaţia dintre
variabilele independente.
În planul realităţii psihice efectul semnifică modificarea
produsă variabilei dependentă, adică schimbarea cauzată la nivelului
unui anumit aspect al comportamentului, ca urmare a manipulării
experimentale a variabilei independente
O cale relativ simplă de a decide că există o interacţiune
între două variabile este aceea de a observa dacă cele două linii ale
graf-ului sunt paralele sau nu. Dacă liniile sunt paralele efectul este
zero.
Dacă nu ţinem cont de interacţiunile care pot exista între
variabilele independente ale unui model experimental riscăm să
ajungem la concluzii contradictorii, ca în experimentul lui Hass
discutat anterior.
Acolo unde efectul principal (main effect) este zero trebuie
căutate alte variabile a căror influenţă moderează efectul unei anumite
variabile aflate în studiu. Saunders a introdus în deceniul şase al
secolului trecut noţiunea de variabilă moderatoare care condiţionează
relaţia dintre un predictor şi criteriu (varabila dependentă).
78
Să revenim la exemplul lui Hass. Efectul moderator al
variabilei rasa asupra interacţiunii dintre performanţa grupului şi
modul cum coechipierii evaluează liderul se apropie de tipul de
interacţiune antagonică.
Totuşi, dacă diferenţa dintre media evaluărilor primite de
căpitanii albi şi media celor negri ar fi pozitivă când grupul are succes
şi negativă (cu semn schimbat) în condiţii de eşec (este valabilă şi
reciproca: diferenţa pentru succes - negativă şi diferenţa pentru eşec -
pozitivă), cele două linii ar avea orientarea clar antagonică din figura
11.
la evaluare
negri
Scoruri
albi
succes insucces
Medie Medie
Var. indep.
mare mică
Medie Medie
mică mare
79
Variabila parametru
Tabelul 3. Tendinţa mediilor variabilei dependente
într-un design cu interacţiune antagonică
mare Vp2
Efectul principal
Var. depend.
Medie Medie
moderată 80 mare
Medie Medie
inferioar moderată
ă
Variabila parametru
Vp2
Efect principal
Var. depend.
Vp1
Vi1 Vi2
81
Figura 13. Modelul interacţiunii sinergice
Medie Medie
mare Foarte
mare
Medie Medie
mică mică
Variabila parametru
82
Vadum şi Rankin (op. cit.) menţionează trei avantaje
principale ale acestei metode: eficacitatea, caracterul cuprinzător şi
validitatea externă.
1) Ideea eficacităţii este justificată prin numărul mare de
comparaţii care pot fi efectuate cu ajutorul aceluiaşi număr de subiecţi
care sunt incluşi într-un experiment unifactorial şi, implicit, prin
cantitatea mai mare de informaţii pe care o produce. Într-un
experiment unifactorial cu un număr N de subiecţi care vor fi împărţiţi
în două grupuri egale, experimental şi de control vor fi posibile 2N / 2
comparaţii. Într-un experiment bifactorial vor fi posibile 2(2N / 2) =
2N comparaţii. Dacă la acestea mai adăugăm cele două efecte
principale şi interacţiunea între variabile avem o reprezentare mai
apropiată de complexitatea reală a informaţiilor pe care le permite un
experiment factorial, comparativ cu unul unifactorial.
Acelaşi adevăr exprimat în unităţi de informaţie este mult mai
sugestiv: Informaţia maximă obţinută pe baza comparaţiilor între cele
două eşantioane, într-un experiment cu o singură variabilă
independentă este E = N biţi. Într-un experiment factorial de tipul 2 x
2 cu variabilele A şi B avem : E = 2N biţi, la care se adaugă două
comparaţii pentru estimarea efectului principal al factorului A, adică
2N/4 biţi şi alte două comparaţii pentru estimarea efectului principal al
factorului B, respectiv 2N/4 biţi. Deci, E = 2N + 2(2N/4 ) = 3N biţi .
Menţinând numărul de subiecţi şi numărul de modalităţi
constante, creşterea cu câte o unitate a numărului factorilor în planul
factorial determină o creştere exponenţială a informaţiei. Din păcate,
aşa cum remarcă Vadum şi Rankin (op. cit) planurile cu mai mult de
trei factori sunt greu, dacă nu chiar imposibil de interpretat.
2) Caracterul cuprinzător al modelelor factoriale este asigurat
de posibilitatea testării interacţiunilor între variabile.
3) Validitatea externă este evaluată prin posibilitatea de a
testa efectul unei variabile de-a lungul nivelelor celeilalte variabile,
adică pentru toate condiţiile experimentale generate de a doua
variabilă. Dacă interacţiunea variabilelor nu este confirmată statistic,
atunci efectele pot fi generalizate pentru toate aceste condiţii. Dacă
dimpotrivă interacţiunea celor două variabile este confirmată de testul
F al analizei de varianţă, generalizarea rezultatelor pentru toate
condiţiile luate în considerare este problematică.
83
O altă categorie de modele experimentale o constituie cele mixte care
conţin atât variabile independente intrasubiecţi cât şi variabile
intersubiecţi (vezi în § 2.2), atât variabile subiect cât şi variabile
invocate. Variabila intrasubiect este ,,administrată” fiecărui subiect în
parte ca şi când ar fi un singur grup, pe când din punctul de vedere al
celeilalte variabile independente, care de cele mai multe ori este de tip
invocat, sunt două grupuri, iar modificările variabilei dependente sunt
comparate intergrup, adică intersubiecţi.
Spre exemplificare să luăm un experiment ipotetic în care o
variabilă independentă este vârsta (tineri-bătrâni) iar a doua variabilă
independentă ar putea fi două momente distincte ale unei zile de
muncă, dimineaţa şi seara.
A,B,C,D,E, A,B,C,D,E
F,G,H,I,J F,G,H,I,J
84
comparând performanţa sa la test de la începutul zilei cu aceea de la
sfârşit.
Variabila vârstă este de tip intersubiect deoarece din acest
punct de vedere avem două grupuri de subiecţi (tineri-batrâni) iar
efectele ei asupra performanţelor la testul de atenţie pot fi decelate
prin comparaţia unor perechi de subiecţi diferiţi, bătrân-tânăr.
Să luăm un alt exemplu. Presupunem că într-un experiment
privind memoria de scurtă durată, variabila lungimea materialului de
memorat are două valori, lista de 10 cuvinte şi lista de 20 de cuvinte.
Subiecţii vor avea ca sarcină să memoreze şi apoi să reproducă lista
formată din 10 silabe, apoi lista de 20 de silabe fără sens. Aceste doua
liste reprezintă două situaţii experimentale diferite, respectiv două
modalităţi ale variabilei independente. Dacă dorim să verificăm
ipoteza că performanţele mnezice sunt dependente de lungimea
materialului memorat, performanţa fiecărui subiect la prima listă va fi
comparată cu aceea obţinută la acea de-a doua listă.
Atunci când utilizăm două grupuri distincte, astfel încât unui
grup i se administrează prima listă iar celuilalt a doua listă, comparaţia
se va efectua între grupuri iar variabila va fi de tipul intrasubiect.
Un alt exemplu de plan factorial mixt este următorul:
Andrew Baum şi Glenn Davis (1980), citaţi de McBurney (op.
cit.) au întreprins un experiment privitor la sursele de stres şi la
comportamentul social al studenţilor. Subiecţii au fost alocaţi la
condiţiile experimentale prin randomizare.
Este vorba de un exemplu de mixtură de experiment şi de
cvasiexperiment deoarece numai partea a doua s-a desfăşurat în
laborator iar prima a îmbrăcat forma experimentului de teren deoarece
s-a desfăşurat în dormitorul fetelor de la un colegiu. Căminul a fost
transformat prin desfiinţarea unor pereţi şi prin crearea a trei holuri de
acces dintre care două erau scurte iar al treilea mai lung. Observarea
frecvenţei comportamentelor sociale a fost efectuată de un observator
ignorat care nu a cunoscut ipoteza cercetării. Pe fiecare hol s-a
înregistrat o activitate egală pe toată durata experimentului. Totuşi
când aceste activităţi au fost evaluate, s-a constatat că, în holurile mai
scurte, activităţile sociale au fost de două ori mai frecvente decât în
holul lung.
Într-o a doua fază a experimentului o serie de subiecţi
recrutaţi la întâmplare dintre cei ale căror holuri la dormitoare erau
scurte sau lungi au fost invitaţi la laborator. Când studenta sosea, era
introdusă într-o cameră, unde era prezent un complice şi era rugată să
aştepte cinci minute. În acest timp erau numărate locurile pe care ea le
interpunea între sine şi complice şi era măsurat timpul cât zăbovea cu
85
privirea asupra complicelui. După cinci minute apărea
experimentatorul care o chestiona în legătură cu cât de confortabil se
simţea în acel moment. Datele obţinute au arătat că fetele de pe
coridorul lung se aşezau mai departe de complice, îl priveau mai puţin
şi se simţeau mai puţin confortabil decât cele de pe coridorul scurt.
86
3.12 Experimentul cibernetic
87
CAPITOLUL 4
CONDIŢIILE
UNUI MODEL EXPERIMENTAL EFICIENT
88
Dintre multiplele condiţii pe care trebuie să le îndeplinească
un experiment ştiinţific riguros, trei sunt mai des invocate de unii
autori (Cook şi Campbell, op.cit., Vadum şi Rankin, op.cit.,
Shaughnessy, et. al. op. cit.): validitatea, fidelitatea şi sensibilitatea.
Este vorba în primul rând de validitatea concluziilor derivate
din cercetarea experimentală.
89
relaţii interpretabile de tip cauză efect, adică de a infera drept cauză a
modificărilor observate la nivelul variabilei dependente, manipularea
de către experimentator a variabilei independente (Shaughnessy, E.,
Zechmeister, J., Zechmeister, 2000).
În anumite experimente este posibil să intervină o a doua
condiţie experimentală (De exemplu, cu grupul de control
experimentăm într-o altă zi decât cu cel experimental) din cauza căreia
nu putem şti cât din modificările variabilei dependente este atribuibil
variabilei independente şi cât unei anumite condiţii diferite în care s-a
efectuat cercetarea (de ex. alte zile din săptămână; când avem
suficiente informaţii că zilele diferite de experimentare influenţează
semnificativ răspunsurile subiecţilor).
Aceste experimente nu au validitate internă pentru că nu se
ştie dacă efectele măsurate la nivelul variabilei dependente sunt
cauzate de variabila independentă deoarece ea a covariat împreună cu
o alta, anume cu zilele când a avut loc experimentarea.
Confuzia (confounding) între variabile „este acel tip de
eroare, privind validitatea internă, când efectele a două variabile
independente nefiind posibil de separat, rezultă o anumită confuzie în
interpretarea rezultatelor. Confuzia variabilelor (a unei condiţii cu o
variabilă independentă) este una dintre cele mai mari ameninţări ale
validităţii experimentelor” (Vadum şi Rankin, op. cit. pp. 71).
În general o variabilă produce efecte dacă înregistrează o
anumită variaţie. Dacă este ţinută constantă aceasta nu produce efecte.
De aceea o manieră eficientă de a elimina efectul condiţiilor
perturbatoare este aceea de a le menţine constante. În plan explicativ,
este eliminată posibilitatea unor explicaţii alternative cu privire la
efectele observate în comportamentul subiecţilor, inferenţa cea mai
probabilă punând efectele pe seama variaţiilor variabilei independente.
Cine ne spune care condiţii sunt şi care nu sunt covariante cu
variabila independentă din experimentul nostru? De obicei valorificăm
experienţa personală şi aceea relatată de autorii unor experimente
(McBurney, 1983), orientându-ne spre cauzele alternative pe care le
considerăm plauzibile, spre factorii care ar putea afecta
comportamentul studiat dar fără a avea controlul tuturor influenţelor
perturbatoare posibile. De aceea cercetătorul nu exclude niciodată
posibilitatea să fi omis sau să nu fi anticipat alte şi alte surse de
confuzie (Shaughnessy, E., Zechmeister, J., Zechmeister, 2000).
Cele mai multe confuzii sunt posibile atunci când nu putem
controla variabila independentă. Este cazul experimentelor ex. post
factum (cvasi experimente) unde variabilele sunt invocate (sexul,
tranşe de vârstă, etc). De exemplu, în privinţa diferenţelor de sex
90
există o mare confuzie între variabila sex şi o serie de variabile
covariante cum sunt cele legate de influenţele sociale diferite la care
sunt supuse persoanele care le aparţin încă de la naştere. La fel,
relaţia IQ – rasa este bruiată de o serie de alte variabile care sunt
confundate cu rasa: nivelul de educaţie al părinţilor, nivelul de venit
şi calitatea şcolilor la care copii de culoare au acces.
Nu este posibil un control complet al variabilelor care ar putea
covaria cu variabila independentă. Întotdeauna este posibil ca acţiunea
unei variabile străine care permite o a doua explicaţie, concurentă cu
prima, să fie confundată cu acţiunea variabilei independente, urmând
ca cercetări ulterioare să reliefeze acest fapt.
Experimentul lui McGinnies efectuat în 1949 asupra apărării
perceptive este concludent pentru confuzia efectului variabilelor. Pe
baza teoriei psihanalitice, McGinnies a emis ipoteza că stimulii
ameninţători vor declanşa mecanisme de apărare perceptivă pentru a
împiedica conştientizarea lor şi apariţia anxietăţii. Pe această bază în
ipoteza cercetării s-a prezumat că termenii tabu vor înregistra timpi de
recunoaştere mai lungi decât cei neutri. McGinnies a prezentat pe
ecranul unui tahistoscop cuvinte tabu şi cuvinte neutre. Ipoteza părea
să fie confirmată deoarece subiecţii aveau nevoie de un timp de
expunere mai lung pentru a recunoaşte termenii cu încărcătură
anxiogenă.
Totuşi după numai un an, în 1950 Howes şi Solomon (Vadum
şi Rankin, 1998) au arătat că relaţia dintre variabila independentă
(prezenţa-absenţa încărcăturii anxiogene în cuvintele stimul) şi
variabila dependentă (timpul de recunoaştere) a fost interferată de o a
treia variabilă, frecvenţa celor două tipuri de cuvinte în limbajul
curent.
Existenţa unei variabile străine face posibilă apariţia unei alte
explicaţii la fel de plauzibile, anume că lungirea timpului de răspuns s-
ar datora frecvenţei mai reduse în limbajul curent a cuvintelor tabu
decât conţinutului lor anxiogen. Prin aceasta validitatea internă a
experimentului lui McGinnies a fost afectată.
În astfel de situaţii soluţia este aceea de a organiza un nou
experiment în care cuvintele tabu să fie însoţite de cuvinte neutre cu o
frecvenţă egală. Acest experiment mai aşteaptă încă să fie efectuat.
91
constructelor teoretice pe care cercetătorul intenţionează să le măsoare
(Anastasi, 1988). Altfel spus, validitatea de construct se referă la
faptul dacă rezultatele cercetării susţin teoria pe care acestea se bizuie.
Dacă un experiment este validat, conceptual nu ar trebui să existe o
teorie alternativă care să prezică aceleaşi rezultate, sau să lase loc unei
explicaţii rivale aceleia afirmate rezumativ de ipoteze.
Rolul experimentelor ştiinţifice este tocmai acela de a verifica
ipoteze şi teorii ştiinţifice. Dar ipotezele se împart în principale şi
auxiliare. Ipotezele auxiliare sunt anumite condiţii particulare ale
experimentului. Şi ele trebuie să fie adevărate pentru a testa ipotezele
principale.
Iată un exemplu preluat după McBurney (1983) care este
elocvent atât în ce priveşte slaba validitate de construct dar şi confuzia
între ipoteza principală şi ipotezele auxiliare. Presupunem că vrem să
testăm ipoteza că anxietatea conduce la învăţare. Subiecţii anxioşi sunt
selectaţi pe criteriul dacă îşi rod unghiile. Sarcina de învăţare constă în
a scrie cu degetele de la picioare. Dacă nu se constată nici o diferenţă
între lotul experimental şi cel de control se poate conchide că ipoteza a
fost falsă. Totuşi nu ipoteza principală a fost testată ci două ipoteze
auxiliare: una că rosul degetelor este un indicator al anxietăţii şi
cealaltă, că scrierea cu degetele de la picioare este o sarcină de
învăţare adecvată. Criteriile validităţii de construct nu sunt satisfăcute
pentru că variabilele rosul degetelor şi scrierea cu picioarele nu
constituie operaţionalizări, respectiv măsurători adecvate ale
conceptului de anxietate, respectiv învăţare.
Validitatea de construct nu poate fi garantată printr-un
procedeu anume. Putem însă proiecta experimentul astfel încât să
sporim şansele ca acesta să fie cât mai valid. În cazul în speţă acest
fapt ar fi posibil prin utilizarea unui instrument de testare a anxietăţii
cum este Taylor Manifest Anxiety Scale precum şi a unei măsurători
standardizate a sarcinii de învăţare, cum este învăţarea unei liste de
cuvinte aleatoare.
92
pentru condiţiile care au fost prevăzute în modelul experimental
(Vadum şi Rankin, 1998). Validarea externă a concluziilor unui
experiment are în vedere valabilitatea lor în cazul altor subiecţi, altor
situaţii, altor perioade de timp, altor condiţii etc. (McBurney, 1983,
Shaughnessy şi col., 2000).
De aceea, validarea externă a unei cercetări nu se poate limita
la o singură cercetare. Numai după ce alţi cercetători vor confirma
rezultatele iniţiale prin refacerea experimentului pe alţi subiecţi şi în
alte condiţii se va ajunge la validarea externă (divergentă) a cercetării
propriu-zise.
Trebuie, totuşi, menţionat că problema validităţii externe nu
este întotdeauna foarte presantă în psihologia experimentală. Sunt
experimente care sunt destinate testării unor ipoteze care au fost
deduse dintr-o teorie psihologică iar problema validităţii externe este
irelevantă. Shaughnessy et. al. (op.cit.) consideră că experimentele de
laborator nu sunt destinate imitării cazurilor cele mai tipice care se
găsesc în natură ci să răspundă unor probleme de care cercetătorul este
preocupat.
Căile de creştere a validităţii externe a experimentelor sunt:
(1) Includerea în experiment a caracteristicilor care urmează a
fi generalizate. Totuşi, libertatea cercetătorului este limitată de o serie
de constrângeri etice: nu tot ceea ce am dori să experimentăm poate fi
supus experimentării.
(2) Includerea în experiment a unui eşantion de subiecţi,
condiţii sau situaţii în raport cu care urmează să fie generalizate
rezultatele. Dacă motive etice sau de altă natură împiedică o astfel de
eşantionare, cercetătorul poate apela la un număr mai mare de situaţii
în care regularitatea testată experimental poate avea loc. Pe baza
acestor condiţii multiple concluziile experimentului pot fi
generalizate.
(3) Repetarea (replicarea) procedurilor unui experiment în alte
situaţii şi pe alţi subiecţi. Dat fiind că replicările nu reproduc întocmai
toate condiţiile experimentului originar (alţi experimentatori, alte
aparate, alte laboratoare) este mai corect să vorbim de replicări
parţiale.
O replicare parţială furnizează două tipuri de verificări pentru
experimentul originar:
(a) Confirmarea fidelităţii (consistenţei) dacă urmând aceleaşi
proceduri de bază se obţin rezultate similare.
(b) Confirmarea validităţii externe, dacă aceleaşi rezultate
sunt obţinute cu proceduri care totuşi sunt uşor diferite faţă de cele
utilizate în primul experiment.
93
Criteriul validităţii externe ar părea imposibil de realizat
deoarece cel mai adesea replicările experimentelor sunt doar parţiale.
Totuşi este un fapt împărtăşit de comunitatea ştiinţifică, anume că,
deşi diferenţele între subiecţii şi condiţiile celor două experimente
sunt reale, există o anumită continuitate a comportamentului uman
care traversează timpul, culturile, condiţiile de experimentare, etc.
continuitate care dă conţinut la ceea ce filosofii numesc natura umană.
Pe de altă parte, validitatea externă înseamnă generalizarea unor
relaţii conceptuale între variabilele studiate şi nu generalizarea
condiţiilor, manipulărilor, situaţiilor eşantioanelor, etc. ( Shaughnessy
şi col., cit.)
94
Validităţile internă, de construct şi statistică se aseamănă
deoarece în cazul celei dintâi încercăm să eliminăm variabilele
alternative care ar putea determina modificări în comportamentul care
ne interesează iar în cazul validităţii de construct încercăm să
eliminăm explicaţiile alternative ale datelor experimentale. Validitatea
statistică ne spune cât de probabile sunt răspunsurile prezumate şi cât
de improbabile sunt explicaţiile alternative.
Atât în cazul validităţii interne cât şi al celei de construct, un
spor de probabilitate (validitate statistică) se obţine prin producerea
aceloraşi date la refacerea experimentului.
În cazul validităţii interne trebuie proiectat un alt experiment
pentru a controla sursele de confuzie între unele condiţii şi variabila
independentă. În cazul validităţii de construct va fi proiectat un nou
experiment care va testa care dintre teoriile rivale este susţinută de
datele experimentale.
Interacţiuni interferente. Între validităţi există o relaţie de
contrarietate: când una creşte cealaltă scade, deşi este de dorit ca
ambele să crească.
Într-o astfel de relaţie se află validitatea internă şi validitatea
externă. Cu cât un experiment dispune de un control mai riguros al
variabilelor, cu atât validitatea sa internă şi sensibilitatea sa sunt mai
mari. Totuşi, odată cu aceste calităţi dobândite în intensiune,
experimentul pierde în extensiune, în forţa de generalizare a
concluziilor sale la alte situaţii, alţi indivizi şi alte condiţii de
experimentare. Binenînţeles, că între cele două validităţi nu este totuşi
o opoziţie funciară. Cercetătorul are mereu posibilitatea de a alege o
poziţie de echilibru sau de a accentua una sau alta dintre cele două
validităţi funcţie, de obiectivele urmărite.
95
validităţi discutate, iar pe verticală, de fapt în ordine temporară,
validitatea fiecărei faze a experimentului. Acestea au fost shiţate de o
manieră generală în § 1.9 şi vor fi reluate mai în detaliu în capitolul
şase.
VG = Vp x Vd x Vf
unde:
VG = validitatea experimentului
Vp = validitatea stadiilor pregătitoare ale
experimentului (identificarea problemei,
documentarea, emiterea ipotezei)
Vd = validitatea fazei de derulare a experimentului
Vf = validitatea fazei finale (prelucrarea şi
interpretarea experimentului)
96
fenomenelor psihice decât o fac artele, religia, miturile sau alte forme
de cunoaştere neştiinţifică la care ne-am referit în primul capitol.
Este de aceea util, urmând deja o tradiţie instituită de o serie
de lucrări de psihologie experimentală (Campbell, Fiske, 1959,
Campbell, 1960, Cook şi Campbell, op.cit. ), să ne referim în cele ce
urmează la principalele tipuri de ameninţări la adresa celor mai
importante tipuri de validitate, pentru ca pe urmă, într-un capitol
distinct, să trecem în revistă căile esenţiale de contracarare a acestor
pericole.
97
Evenimente externe planului experimental (de exemplu faptul
că la o situaţie experimentală care conţine un anumit potenţial de
insucces se mai adaugă efectul unei zile mohorâte, ecoul unui
eveniment social sau politic de genul celui petrecut în S.U.A la 11
septembrie 2001).
99
renunţarea la un subiect care a obţinut un rezultat echivalent la testul
preexperiment.
100
4.2.1.8. Experimentatori diferiţi
101
variaţiei variabilei independente. Acest fapt ar fi posibil păstrând un
singur experimentator, ca o garanţie că răspunsurile subiecţilor nu vor
mai fi influenţate de această variabilă care acum este menţinută
constantă. Totuşi, utilizând într-un experiment un singur
experimentator, un singur tip de stimuli, reducem şansele de
generalizare a rezultatelor. Parcurgând un raţionament ca cel de mai
sus, Shaughnessy şi col. ajung să generalizeze următorul principiu:
„Controlul variabilelor străine prin menţinerea lor constante conduce
la experimente mai sensibile cu o validitate externă mai redusă, pe
când controlul obţinut prin balansarea lor determină o mai scăzută
sensibilitate dar şi o validitate externă mai mare” (op. cit. p. 228).
102
făcută publică, dă naştere competiţiei şi implcit unor eforturi susţinute
din partea grupului de control de a inversa efectele aşteptate.
Dimpotrivă, în alte situaţii, persoanele din grupul de control
pot să-şi deprecieze în mod voit performanţele deoarece se simt
dezavantajaţi, comparativ cu cei din grupul de control, pur şi simplu
că nu primesc nici un tratament.
103
exemplificare să revenim la experimentul Hawthorne. Cercetătorii
verificau relaţia între modificarea unor condiţii de mediu şi rezultatele
muncii. Aparent, modificarea sistematică a variabilei independente
(condiţiile de muncă) era cauza ameliorării randamentului în muncă.
Totuşi psihologia socială a dezvăluit o întreagă fenomenologie,
subiectivă, inobservabilă care însoţeşte şi influenţează sistemul
relaţiilor sociale dintr-o organizaţie. Astăzi se ştie că nu stimulentele,
în sine, sunt cele care determină hărnicia în muncă, ci modul cum sunt
ele percepute (de exemplu cât sunt de echitabile). În adevăr,
participantele la experimentul Hawthorne erau influenţate nu de noile
condiţii, în sine, ci de faptul că se ştiau implicate într-un experiment.
După o interpretare mai recentă a lui Bramel şi Friend, citaţi
de Mc. Burney (op. cit.), muncitorii erau suspicioşi faţă de manageri şi
de aceea modificându-şi rezultatele muncii ei au vrut să aibă controlul
acelor condiţii de muncă ce aveau importanţă pentru ei, cum a fost
cazul pauzelor de lucru.
Toate acestea conduc la ipoteza unui adevărat efect de
ambiguitate al variabilelor independente care este potenţial activ dacă
se ignoră teoria că experimentul psihologic, la care subiecţii participă
în mod voluntar, trebuie considerat ca o situaţie socială în care
participanţii vor să joace rolul de subiecţi buni (cum vrea
experimentatorul ca ei să se comporte), adică să procedeze în acord cu
supoziţiile lor despre ce aşteaptă experimentatorul de la ei.
104
dintre ele să nu fie posibilă in celelalte, chiar dacă sunt de acelaşi tip:
şcoală, organizaţie economică, etc.
Domeniul în care validitatea cercetării este cel mai amplu
ameninţată este cel al cercetării sociale. În aria psihofiziologică
acestea sunt mai reduse, deoarece similitudinea acestor
comportamente este mult mai mare.
105
Aşa de pildă creşterea sensibilităţii unui experiment poate conduce la
scăderea validităţii sale externe deoarece unele regularităţi cu un nivel
scăzut de manifestare pot să fie proprii unui fenomen anume şi nu
întregii clase de fenomene din care primul face parte.
Shaughnessy et. al. (op. cit.) consideră că validitatea externă a
experimentelor, ca o extrapolare a rezultatelor asupra altor indivizi,
situaţii şi condiţii, ridică următoarele probleme:
Validitatea externă se află adesea într-o relaţie de opoziţie cu
validitatea internă. Creşterea validităţii interne prin repartizarea
aleatoare a subiecţilor la condiţiile experimentale nu asigură automat
validitatea externă a experimentului, în sensul că eşantionul de
subiecţi poate să nu fie îndeajuns de reprezentativ. Uneori cercetătorul
trebuie să opteze pentru creşterea uneia sau alteia dintre cele două
tipuri de validităţi.
O altă problemă este aceea că nu întotdeauna scopul principal
al cercetătorului este de a extrapola rezultatele cercetării ci dimpotrivă
de a confirma o serie de ipoteze care sunt generate de o anumită teorie
ştiinţifică. Când însă intenţia sa este de a generaliza rezultatele
experimentului, validitatea externă poate fi asigurată parcurgând
următoarele căi:
(1) Includerea în experiment a unor caracteristici ale situaţiei
în raport cu care se intenţionează generalizarea rezultatelor. Aici
libertatea cercetătorului este limitată de o serie de constrângeri etice,
deoarece extrapolarea datelor despre comportamentul subiecţilor în
laborator asupra unor condiţii de viaţă reală (droguri, diferite forme de
abuz, agresiune, manipulare, etc) ar presupune condiţii experimentale
inacceptabile.
(2) Includerea în experiment a unor eşantioane reprezentative
din dimensiunea care urmează să fie generalizată (indivizi, situaţii sau
condiţii). În acest caz selecţia prin randomizare este mai potrivită
decât repartiţia întâmplătoare.
(3) Repetarea experimentului pe alţi subiecţi. Se aşteaptă ca
rezultatele să întrunească un mare grad de similaritate cu cele
originale, obţinute la primul experiment.
Cel mai adesea replicările nefiind în totalitate identice
experimentului originar, nici sub aspectul condiţiilor de desfăşurare a
experimentului, nici sub aspectul subiecţilor care cel mai adesea sunt
alţii, este mai corect să vorbim de repetări parţiale.
Autorii citaţi anterior consideră că replicările parţiale au un
dublu avantaj: Pe de o parte furnizează informaţii despre fidelitatea
experimentului, în măsura în care, repetând aceleaşi proceduri de
bază, se obţin rezultate similare, iar pe de altă parte se confirmă
106
validitatea externă dacă se obţin rezultate asemănătoare pe subiecţi
diferiţi şi cu proceduri, deşi asemănătoare totuşi diferite în anumite
privinţe.
107
CAPITOLUL 5
108
CONTROLUL EXPERIMENTAL
109
Utilizarea unui grup de control sau a unei condiţii de
control;
Randomizarea; alocarea aleatoare a subiecţilor la
condiţiile, respectiv la sarcinile experimentale.
110
situaţia de control. În acest fel se obţine o reducere considerabilă a
erorii de variaţie datorată diferenţelor dintre subiecţi.
(2) Al doilea înţeles al termenului control se referă la
controlul experimental, adică la abilitatea de a restrânge sau canaliza
sursele de variabilitate în cercetare. Prin controlul experimental se
asigură validitatea internă a experimentului, ceea ce echivalează cu
creşterea probabilităţii inferenţelor cauzale.
Controlul experimental înseamnă limitarea surselor de
variabilitate într-un experiment până ce comportamentul devine înalt
predictibil, adică acesta se manifestă ca un efect, foarte probabil, al
variabilei independente. Controlul se realizează prin:
111
După Mill descoperirea relaţiilor cauzale între fenomene
implică doi paşi succesivi şi anume, analiza evenimentelor şi
cercetarea relaţiilor cauzale.
112
psihologie (Vadum şi Rankin, 1998). Să le trecem succint în revistă în
cele ce urmează.
a1
Tratamente
Efect
a2 a2
a3 a3
113
5.2.2.2 Metoda variaţiilor concomitente
114
utilizarea metodelor diferenţelor şi a variaţiilor concomitente poate
confirma ipoteza prin respingerea explicaţiilor rivale.
Strategiile de control utilizate în psihologia experimentală pot
fi clasificate în strategii generale şi specifice.
115
ipoteze cum ar fi de exemplu aceea a diluţiei responsabilităţii, ori de
câte ori sarcina se desfăşoară în grup, am putea utiliza copii care
participă la un anumit joc sau adulţi implicaţi într-o sarcină de lucru)
cât şi mijloacele, montajele, dispozitivele, uneori inedite, care
urmează să asigure o anumită sensibilitate în desfăşurarea
experimentului. Această preparare are rolul de a controla cât mai
riguros relaţia dintre variabila independentă şi variabila dependentă.
Este cât se poate de important ca fiecare experiment să fie
precedat de o fază pregătitoare asemănătoare întrucâtva situaţiei din
biologie, unde anumite studii sunt efectuate pe o serie de preparate, de
exemplu preparatul de broască pe care Helmoltz a studiat viteza de
conducţie a excitaţiei nervoase (Vadum şi Rankin, op.cit). Această
fază de pregătire a experimentului este prezentă şi în cercetările de
psihologie deşi cele mai multe studii omit să precizeze acest lucru.
Ideea de preparat şi de preparare a unui experiment este cel
mai bine ilustrată de cercetările lui Skinner efectuate pe un preparat
psihologic sui-generis, cutia lui Skinner. Acest labirint modelat pentru
a studia învăţarea pe animale mici, şobolani şi porumbei, a făcut
posibilă o măsurătoare inedită a comportamentului de răspuns,
anume, rata de răspuns în raport cu anumite programe de întărire.
Preparate sui generis reprezintă eşantioanele care într-o fază
anterioară experimentului au fost selecţionate într-un fel anume, ca de
exemplu, grupurile disjuncte radicalizate în privinţa unei caracteristici
(persoane anxioase – persoane neanxioase).
De fapt toate experimentele, pe care, cu titlu exemplificativ,
le-am menţionat până acum, nici nu pot fi concepute în afara acestei
faze de preparare, care cuprinde nu numai pregătirea logistică dar şi
analiza în profunzime a planului experimental prin care se încearcă
anticiparea unor eventuale probleme care pot apărea pe parcursul
experimentării.
Deşi ar fi de dorit, din păcate, aşa cum am mai menţionat, nu
pot fi controlaţi toţi factorii posibili, ci numai aceia despre care
cercetătorul crede că ar putea influenţa rezultatele cercetării, cauzele
alternative cum le numesc Shaughnessy şi col. (2000). De aceea
psihologul nu trebuie să excludă posibilitatea prezenţei unor factori
perturbatori a căror acţiune nu a anticipat-o.
O serie de factori pe care am dori să-i menţinem constanţi în
experiment nu îi putem controla prin metodele obişnuite. Aceşti
factori sunt reprezentaţi de caracteristicile psihologice ale subiecţilor
care participă la experiment, de diferenţele lor individuale. Aceste
diferenţe ar putea reprezenta cauze alternative şi ar afecta validitatea
experimentului.
116
5.3.3 Măsurarea adecvată a răspunsului
117
Refacerea experimentului constituie, fără îndoială, cea mai
eficientă formă de control. În esenţă replicarea înseamnă repetarea
unui experiment pentru a verifica constanţa datelor obţinute iniţial.
Prin replicare se controlează fidelitatea rezultatelor experimentale
(vezi § 4.3). În general teoriile ştiinţifice se sprijină pe adevăruri care
au fost replicate.
Faptele ştiinţifice care nu rezistă acestui standard sunt
abandonate.
McBurney (op. cit.) menţionează entuziasmul stârnit în comunitatea
ştiinţifică, în deceniul al şaptelea al secolului trecut, de experimentele
asupra transferului de memorie la viermele planaria, prin injectarea de
ţesut de la congeneri antrenaţi către cei neantrenaţi. Nu este nevoie să
discutăm consecinţele extraordinare pe care acest fapt ştiinţific le-ar
putea avea asupra condiţiei umane. După mai bine de două decenii de
replicări pe viermi sau pe şobolani, reluări soldate cu rezultate
contradictorii, interesul pentru tema în discuţie a diminuat treptat,
aceasta fiind de fapt soarta tuturor cercetărilor experimentale
neconfirmate.
Există două tipuri de replicări:
118
variabilei independente. Acest fapt afectează grav validitatea
rezultatelor experimentului.
Controlul în aceste planuri experimentale se realizează pe
baza randomizării şi a controlului statistic. Aceste metode vor fi
abordate în cele ce urmează, nu înainte, de a face o paranteză cu
valoare nu doar istoriografică, pentru problema în discuţie, ci mai ales
principială.
119
obţinută de pe două loturi de teren cărora, în faza de efectuare a
lucrărilor de însămânţare, li s-au aplicat două tratamente diferite, care
de fapt sunt două modalităţi ale variabilei independente: unui lot i se
administrează procedura de fertilizare a terenului, pe când celuilalt lot
nu i se aplică nici un tratament. Dacă pe lotul fertilizat se obţine o
producţie mai mare, diferenţa ar putea fi atribuită acestui tratament.
Dar pentru ca această inferenţă să atingă un anumit grad de certitudine
ar trebui ca experimentul să fi reluat ani şi ani de-a rândul de către
acelaşi experimentator (validare convergentă) sau de către alţi
experimentatori, pe terenuri agricole cu condiţii pedologice cât mai
diferite (validare divergentă). Geniul lui Fisher s-a dovedit în găsirea
unei soluţii de a satisface condiţia replicabilităţii experimentului de o
manieră foarte comodă. El a împărţit terenul într-un număr de blocuri
egale. Fiecare bloc, la rândul lui a fost divizat în două părţi egale.
Dacă terenul ar fi împărţit în 10 blocuri, ar rezulta 20 de parcele
perechi. Aplicând fertilizarea în ficare pereche doar unei parcele, ar
rezulta 10 comparaţii ale producţiei agricole, deci ar rezulta
posibilitatea replicării de 10 ori a experimentului iniţial. Totuşi
alocarea tratamentelor în fiecare pereche ar trebui efectuată la
întâmplare pentru a exclude orice influenţă datorată preferinţelor
experimentatorului, sau altor deosibiri intervenite pe durata creşterii
plantelor.
Fisher a procedat la fertilizarea parcelelor în fiecare pereche
prin randomizare. Iată cum, printr-un demers ingenios, modelul
experimental capătă două caracteristici esenţiale ale controlului
variabilelor, replicarea şi randomizarea.
Însumând producţia de pe cele 10 parcele fertilizate şi
împărţind-o la 10 se obţine producţia medie. Se procedează
asemănător cu parcelele nefertilizate. Comparând producţiile medii de
pe cele două categorii de parcele, s-ar putea obţine o diferenţă medie,
să zicem, de o tonă, diferenţa avntajând terenul fertilizat. Dar la un
astfel de avantaj s-ar putea să fi contribuit şi alte variabile care nu au
putut fi controlate, de exemplu pe unele parcele poate au căzut
cantităţi mai mari de precipitaţii. În astfel de cazuri nu se poate decât
presupune, fără să existe certitudinea, că fertilizarea este cauza
producţiei mai mari.
În limbajul ştiinţiifc de astăzi această presupunere este
ipoteza ştiinţifică.
Fisher s-a gândit că, dacă nu pot fi eliminate cu totul sursele
de variaţie, este oportună calcularea erorii introduse de astfel de
influenţe perturbatoare, deoarece se poate şti, astfel, câtă încredere
poate fi acordată datelor obţinute. Continuând să prezentăm
120
raţionamentul lui Fisher, aşa cum se va vedea, nu doar din motive de
discursivitate, anticipăm problematica metodei inferenţei statistice,
care deşi va fi tratată într-o secţiune distinctă, nu este mai puţin în
substanţa ei o veritabilă metodă de a controla validitatea concluziilor
la care conduc reultatele unui experiment psihologic.
Revenind la demersul lui Fisher, acesta a presupus mai întâi
că fertilizarea nu a avut nici un efect. Această supoziţie a fost numită
de Fisher ipoteza de nul. Cu alte cuvinte nu manipularea
experimentală a produs diferenţa ci întâmplarea. În aceste condiţii,
logic ar fi să evaluăm efectul factorilor întâmplători. În acest scop,
fără a ţine cont de tratamentul real, considerăm, la întâmplare, că 10
parcele, luate la întâmplare, au primit fertilizarea, deşi este posibil ca
în realitate unele sau toate să nu fi primit şi, la fel, considerăm că
celelalte 10 loturi nu au fost fertlizate, deşi este posibil ca unele sau
chiar toate să fi pimit tratamentul respectiv. Efectuând, din nou,
diferenţa între cele două producţii medii se obţine o diferenţă medie
care este efectul variabilelor necontrolate, deci al întâmplării. Reluând
întraga operaţie de 500 de ori, Fisher a obţinut un eşantion tot atât de
mare de erori. Această procedură statistică se numeşte test de
randomizare sau testul Monte Carlo şi poate fi lesne realizat cu
ajutorul computerului.
Era un fapt deja ştiut că, odată cu studiile lui Gauss, erorile
sistematice au tendinţa de a se distribui după curba normală,
distribuţie care a fost obţinută şi reprezentată grafic de Fisher. Să
presupunem că pentru valoarea de o tonă, cât a fost diferenţa dintre
cele două tratamente experimentale, citim pe ordonata graficului o
frecvenţă de 5, cu alte cuvinte dintre cele 500 de erori medii 5 au fost
mai mari sau egale cu o tonă.
Dacă fertilizarea nu a avut nici un efect, cum se afirmă în
ipoteza de nul, atunci probabilitatea de a obţine o diferenţă de o tonă
între cele două categorii de parcele este p = 5 : 500 = 0.01. Aceasta
înseamnă că dacă am efectua 100 de astfel de experimente, doar într-
un singur caz variabilele necontrolate ar cauza diferenţa de producţie
menţionată şi că în 99 de cazuri aceasta s-ar datora fertilizării solului.
Prin urmare întrucât p (probabilitatea ca ipoteza de nul să fie
adevărată) este doar de 0.01, este repinsă ipoteza nulă şi se admite
ipoteza de lucru, anume că sporul de productivitate s-a datorat
fertilizării.
Comunitatea ştiinţifică a adoptat propunerea lui Fisher ca
pragul de semnificaţie, respectiv punctul de la care ipoteza nulă poate
fi respinsă, să fie fixat la o valoare P mai mică sau egală cu 0.5.
Această valoare se numeşte prag alfa şi se notează cu .
121
În exemplul cu blocuri randomizate p< (0.01<0.5), deci
ipoteza nulă poate fi respinsă iar diferenţa de producţie observată între
cele două categorii de parcele este considerată statistic semnificativă
la un nivel de probabilitate de .01.
O variantă mult mai frecvent utilizată a testului de
randomizare este testul statistic „ t „ propus în 1908 de către William
Gosset pe care acest autor l-a publicat sub pseudonimul Student, astăzi
fiind cunoscut ca metoda Fisher-Student. Vom reveni în detaliu asupra
acestei metode în § 6.9.1.1
Se impune, la sfârşitul acestor consideraţii, că modelele de
control propuse de Fisher sunt aplicabile şi aplicate în mod curent în
psihologie, prin simpla înlocuire a termenilor de bloc şi parcelă cu
acelea de grup şi de subiecţi de experiment. Noţiunea de tratament
poate fi generalizată pentru a îngloba toate tipurile de condiţii
experimentale sau variabile independente care, fiind manipulate de
experimentator, determină acele modificări în comportament care sunt
prezumate în ipotezele cercetării.
5.4.2 Randomizarea
123
(averaging) diferenţelor dintre subiecţii implicaţi în experiment
(Shaughnessy şi col. 2000).
Egalizarea grupurilor se efectuează ori de câte ori suspectăm
că ar exista o înaltă corelaţie între variabila egalizată şi variabila
dependentă. Prin egalizare reducem la zero efectul variabilei
perturbatoare asupra variabilei dependente. Raţiunea efectului de
atenuare a variabilelor perturbatoare prin egalizarea lor rezidă în
faptul, menţionat anterior, că o variabilă poate produce efecte doar
dacă este manipulată sau dacă există diferenţe dintre nivelurile ei. De
exemplu, dacă studiem efectul unei anumite metode de învăţare ar
trebui să egalizăm subiecţii din punctul de vedere al nivelului de
inteligenţă deoarece este un loc comun că există o corelaţie
semnificativă între inteligenţă şi succesul în învăţare. Variatele
niveluri de inteligenţă distribuite în populaţie fac din aceasta un factor
activ de influenţare a reuşitei şcolare. De aceea este oportun ca într-o
fază de pretestare să egalizăm subiecţii d.p.d.v. al nivelului
inteligenţei prin aplicarea unui test potrivit. Modul în care subiecţii
egali sunt repartizaţi la grupuri trebuie să fie bazat pe randomizare.
Shaugnessy şi col (op. cit.) propun utilizarea metodei
grupurilor egalizate în situaţiile când, din varii motive, cercetătorul
trebuie să experimenteze cu un număr foarte mic de subiecţi, care
diferă între ei printr-o serie de caracteristici. Aceste diferenţe pot ele
însele să producă efecte care s-ar putea suprapune peste efectele
variabilei independente producând confuzie în interpretarea datelor
experimentale. Întrucât numărul de subiecţi este redus, este exclusă
utilizarea planului cu grupuri randomizate. În unele situaţii soluţia o
reprezintă planul cu măsurători repetate (repeated mesaures design)
unde aceeaşi subiecţi parcurg toate condiţiile experimentale. Există
totuşi situaţii când această metodă nu poate fi utilizată deoarece
trecerea subiecţilor de la un nivel la altul al variabilei independente
generează fenomene de transfer. De exemplu în experimentele care
testează diferite metode de învăţare sau de tratament este nevoie să se
lucreze cu câte un grup separat pentru fiecare condiţie experimentală.
În astfel de situaţii cel mai indicat este planul experimental cu grupuri
egalizate (matched group plan).
Să presupunem că vrem să evaluăm eficacitatea a trei
programe compensatorii în domeniul deficitului intelectual dar nu
avem disponibili decât 9 subiecţi cu niveluri diferite de handicap.
Deoarece variabila independentă (strategia compensatorie) are trei
modalităţi este necesar să utilizăm trei grupuri distincte de câte trei
subiecţi. Dacă am repartiza subiecţii prin randomizare la cele trei
grupuri, numărul de subiecţi într-un grup este prea mic pentru a fi
124
siguri că randomizarea a uniformizat diferenţele individuale. Prin
urmare, este posibil ca diferenţele care vor fi observate între grupuri,
după parcurgerea tratamentului să se datoreze nivelelor diferite de
handicap cu care experimentul a luat startul şi nu valorii intrinseci a
programelor compensatorii. Utilizând metoda grupurilor egalizate
cercetătorul va evalua prin metode psihodiagnostice adecvate nivelul
mintal al fiecărui subiect. El va putea clasifica subiecţii astfel: deficit
sever (S), deficit mediu (M), deficit uşor (U). În continuare sunt
formate triplete cu acelaşi nivel de handicap care corespund celor trei
condiţii experimentale. Subiecţii cu acelaşi nivel vor fi repartizaţi
aleatoriu la fiecare program de recuperare. Este necesar să procedăm
astfel pentru a egaliza alte diferenţe individuale. Planul experimental
va putea fi reprezentat grafic astfel:
S S S
M M M
U U U
126
opt blocuri. Pentru a face mai sugestivă procedura, cifrele „culese” din
şirul randomizat au fost îngroşate.
Presupunem că subiecţilor care se înscriu, prin voluntariat, li
se distribuie, în ordinea sosirii, bonuri numerotate de la 1 la 40.
În tabelul care urmează sunt trecute cu rol exemplificativ
primele două şi ultimul din cele 10 blocuri. Subiecţii S 1…S40 au fost
repartizaţi, pe măsura ce s-au înscris la experiment, la fiecare din cele
40 de poziţii cât totalizează cele zece blocuri experimentale.
127
Un posibil dezavantaj al randomizării în blocuri îl reprezintă
creşterea variabilităţii intra-grup care ar putea afecta validitatea
internă a experimentului.
Un altul ar putea să fie numărul mare de subiecţi, de obicei
egal cu numărul de combinaţii posibile între situaţiile experimentale
A C B D
B A D C
128
C D A B
D B C A
129
A C D B
C B A D
B D C A
D A B C
130
Noţiunea de variabilă moderatoare a fost introdusă în 1956 de
către Sounders în legătură cu psihodiagnosticul progresiv din
domeniul selecţiei profesionale. O variabilă moderatoare echivalează
cu acea variabilă subiect despre care se presupune ca ar avea efecte
diferenţiatoare şi ar afecta validitatea unui predictor (Pitariu,1983).
În literatură sunt citate studii care au evidenţiat caracterul de
variabile moderatoare al următoarelor însuşiri: caracteristici
demografice (sex,vârsta), nivel educaţional şi socioeconomic, atribute
psihice (motivaţie, interese ocupaţionale, experienţă, etc).
Procedura se utilizează ori de câte ori o sursă de variaţie nu
poate fi îndepărtată şi, pentru a fi controlată, este tratată ca variabilă
independentă. Se obţin astfel informaţii suplimentare despre relaţia
dintre variabilele aflate în studiu.
McBurney (op.cit.) oferă un exemplu privitor la un lot de
studenţi care urmează să treacă prin două condiţii experimentale Aşi
B. Subiecţii, diferă în privinţa formei de învăţământ pe care o
urmează: curs de zi şi seral. Rezultatele ar putea fi afectate de o serie
de condiţii asociate acestui statut: studenţii la seral sunt mai în vârstă,
sunt căsătoriţi, cu mai multe responsabilităţi. Putem controla această
sursă străină de variaţie îndepărtând din eşantion elevii de la seral dar
prin aceasta am afecta generalizabilitatea rezultatelor. O altă soluţie
este să tratăm această sursă de variaţie ca pe o variabilă independentă
şi să urmărim modul în care influenţează (moderează) efectele celor
două condiţii experimentale asupra subiecţilor.
131
Controlul statistic, într-un sens mai îngust, se referă la
posibilitatea de a egaliza subiecţii, ca să spunem aşa, „pe hârtie”
atunci când acest lucru nu este posibil în sens real.
Să presupunem că două clase sunt comparate din punctul de
vedere al efectului diferit pe care îl au asupra notelor două metode
distincte de predare. Diferenţele produse de cele două metode vor
interfera totuşi cu nivelurile diferite ale coeficienţilor de inteligenţă,
adică fiecare elev va profita de o metodă sau alta, funcţie de nivelul
său de inteligenţă.
Controlul statistic ne dă posibilitatea prin intermediul analizei
de varianţă să comparăm cele două clase, nu pe baza notelor absolute
ci pe baza diferenţelor individuale dintre nota reală şi nota aşteptată de
profesor. Această notă este derivată în mod ipotetic dacă se cunoaşte
relaţia matematică dintre notele la disciplina respectivă şi coeficienţii
de inteligenţă ai elevilor din cele două clase. Această funcţie
matematică se numeşte ecuaţie de regresie şi este o linie imaginară
care uneşte pătratele abaterilor coeficienţilor de inteligenţă de la
media celor două clase. Este posibil să reprezentăm pe graficul acestei
funcţii poziţia ocupată de fiecare subiect, poziţie care se află la
intersecţia valorii QI-ului individual, reprezentat pe abscisă, cu nota
obţinută de elev, reprezentată pe ordonată. Distanţele dintre poziţiile
individuale şi linia de regresie, având ca referinţă ordonata sistemului
de axe rectangulare, ne dau informaţii despre magnitudinea profitului
fiecărui elev de pe urma metodei de predare, funcţie de nivelul său de
inteligenţă. Fără metoda analizei de varianţă aceste inferenţe nu ar fi
posibile.
Cook şi Campbell (1979) au teoretizat problema validităţii
concluziilor bazate pe teste statistice. Astfel validitatea acestor
concluzii se confruntă cu două ameninţări respectiv cu erorile de tip I
şi de tip II. Eroarea de tip I constă respingerea ipotezei de nul când
aceasta este adevărată, ceea ce echivalează cu a confunda efectele
unor surse variaţie străine cu efectele aşteptate ale variabilei
manipulate experimental.
Eroarea de tip II apare atunci când admitem ipoteza de nul
deşi aceasta este falsă ceea ce înseamnă că efecte reale ale variabilei
independente nu vor fi sesizate pentru că vor fi confundate cu efectele
surselor de variaţie insuficient controlate. (vezi în § 6.6.1 puterea
testului statistic)
Cauzele acestor erori, potrivit autorilor citaţi sunt:
132
o puterea scăzută a controlului statistic (omiterea unor
efecte slab manifeste dar importante pentru
obiectivele cercetării);
o violarea condiţiilor în baza cărora este permisă
efectuarea testelor statistice (efectuarea de teste
statistice fără ca eşantionul de date să fie reprezentativ
pentru populaţia de apartenenţă sau fără să aibă o
distribuţie normală);
o creşterea probabilităţii erorilor de inferenţă statistică
odată cu creşterea numărului de teste statistice;
o inconstanţa scorurilor subiecţilor la variabila
dependentă datorită unor condiţii improprii de
desfăşurare a experimentului.
133
5.5.1.1 Randomizarea în blocuri în planurile experimentale
cu măsurători repetate
134
cuprinde 6 x 4 = 24. Rezultă că vor trebui repartizate toate cele 24 de
combinaţii posibile la subiecţii care participă la experiment.
Ordinea în care vor fi prezentate cele 24 de blocuri este
realizată prin randomizare, după metoda deja prezentată în § 5.2.2,
utilizând tabelele cu numere randomizate. Fiind vorba de un plan cu
grupuri independente subiecţii erau asignaţi aleatoriu, fiecare, la o
singură condiţie experimentală din bloc, astfel încât, în final, rezultau
grupuri echivalente. De această dată, fiind vorba de un plan cu
măsurători repetate, fiecare subiect trecând în mod repetat prin fiecare
bloc, astfel încât fiecare condiţie experimentală să îi fie aplicată într-
un număr egal, procedura de mixare a condiţiilor în blocuri distincte,
folosind, numerele randomizate se repetă pentru fiecare subiect. Se
poate realiza doar pentru primul subiect randomizarea repartizării
blocurilor pe subiect. Pentru ceilalţi subiecţi putem roti condiţiile în
fiecare bloc astfel încât a doua condiţie trece pe primul loc, a treia
condiţie ajunge pe locul al doilea şi tot aşa mai departe. Atunci când
experimentul se desfăşoară astfel încât subiecţii nu îşi pot împărtăşi
ordinea în care sunt date culorile, schimbarea succesiunii blocurilor
pentru ceilalţi subiecţi, odată ce aceasta a fost realizată prin
randomizare pentru primul subiect, este o precauţie de prisos.
Subiecţi B L O C U R I
1 2 3 4
Florin A B C D B A C D C A B D D A B C
Andreea B C D A C D A B D A B C A C B D
Magda C D A B D A B C A C B D C B A D
Nicu D A B C A C B D B C A D C B A D
Subiecţi B L O C U R I
5 6 7 8
Florin A C B D B C A D C B A D D A C B
Andreea B C A D C B A D D A C B A B D C
Magda D A C B A B D C B C D A C A D B
Nicu D A C B A B D C B C D A C A D B
Subiecţi B L O C U R I
9 10 11 12
Florin A B D C B C D A C A D B D B A C
Andreea B C D A C A D B D B A C A C D B
Magda D B A C A C D B B A D C C B D A
Nicu D B A C A C D B B A D C C B D A
135
Subiecţi B L O C U R I
13 14 15 16
Florin A C D B B A D C C B D A D B C A
Andreea B A D C C B D A D B C A A D C B
Magda D B C A A D C B B D C A C D B A
Nicu D B C A A D C B B D C A C D B A
Subiecţi B L O C U R I
17 18 19 20
Florin A D C B B D C A C D B A D C B A
Andreea B D C A C D B A D C B A A D B C
Magda D C B A A D B C B D A C C D A B
Nicu C B A D D B C A C D A B C A B D
Subiecţi B L O C U R I
21 22 23 24
Florin A D B C B D A C C D A B D C A B
Andreea B D A C C D A B D C A B A B D C
Magda D C A B A B D C B C D A C D A B
Nicu D C B A A D B C B D A C C D A B
5.5.1.2 Contrabalansarea
136
5.5.2 Balansarea incompletă
137
5.5.3 Controlul prin rotirea ordinii de start
138
măsurători repetate nu ar trebui să fie utilizat atunci când poate apărea
fenomenul de transfer.” Problema mai gravă, continuă autorul citat,
este că transferul este posibil să apară în oricare design cu măsurători
repetate.
Cu toate acestea, datorită avantajelor lor incontestabile, nu se
poate renunţa la aceste planuri experimentale cu măsurători repetate,
mai ales că, aşa cum s-a mai menţionat, verificarea anumitor ipoteze
reclamă astfel de experimente.
De aceea, cercetătorul trebuie să evalueze existenţa efectelor
transferului pentru a putea fi sigur că rezultatele obţinute se datorează
în adevăr manipulării condiţiilor experimentale.
Poulton (1982) a propus o procedură constând în manipularea
aceleiaşi variabile independente în două planuri experimentale
diferite: un experiment cu măsurători repetate, în care subiecţii
parcurg toate condiţiile experimentale şi un experiment complet, cu
grupuri randomizate. Experimentul cu grupuri randomizate este
utilizat ca experiment martor deoarece apariţia transferului este
improbabilă deoarece fiecare subiect parcurge o singură condiţie
experimentală. Dacă rezultatele obţinute în planul intrasubiect (within
subject plan ) nu sunt diferite de cele generate de experimentul cu
grupuri randomizate se poate considera că transferul nu a avut loc.
Validitatea internă nefiind afectată rezultă că nu există nici o sursă de
confuzie iar datele experimentale sunt interpretabile.
Mai elegantă este tehnica propusă de Shaughnessey şi col.
(op.cit.) care utilizează, ca să spunem aşa, chiar resursele interne ale
planului experimental cu măsurători repetate. Procedeul constă în a
utiliza, chiar în scopul testării ipotezei care ne interesează, a unui plan
incomplet cu măsurători repetate, care să cuprindă toate secvenţele
posibile, rezultate din combinarea nivelurilor variabilei independente.
Astfel dacă variabila independentă cuprinde patru tratamente, vor
rezulta 24 de secvenţe cu ordini diferite ale condiţiilor experimentale.
Fiecare, dintre cele patru tipuri de tratamente se va regăsi într-un
număr egal, de şase, în fiecare din poziţiile 1,2,3,4., adică condiţia A
se va afla de şase ori pe prima poziţie, condiţia B de şase ori ş.a..m.d.
Reamintim că fiecare secvenţă de tratamente este parcursă de câte un
subiect diferit, desemnat aleatoriu, adică în total 24 de subiecţi. Prin
urmare şase subiecţi vor parcurge mai întâi condiţia A, alţi şase vor
primi, la început tratamentul B ş.a.m.d. Suntem interesaţi, în această
fază a interpretării rezultatelor, doar de tratamentele care se situează,
în secvenţe (blocuri), pe primul loc, deoarece, prima poziţie
echivalează cu primul stadiu al achiziţiei de un anume tip, specifică
transferului. Astfel parcurgerea condiţiei A are ca rezultat o achiziţie
139
care va fi transferată asupra rezolvării sarcinii B. Efectele transferului
sunt de obicei evidenţiate prin comparaţia performanţei condiţiei A cu
aceea măsurată în condiţia B.
Deoarece, subiecţi diferiţi au fost repartizaţi celor patru
condiţii experimentale aflate pe prima poziţie în secvenţe, putem
considera că avem un plan cu patru blocuri randomizate. Este de
aşteptat ca efectele transferului să fie minime deoarece fiecare subiect
a primit o singură condiţie experimentală, deci nu există repetarea
sarcinii.
Pe de altă parte rezultatele obţinute pe baza întregului
experiment, pot fi afectate de transfer, deoarece fiecare subiect a
parcurs toate tratamentele din secvenţa care i-a fost alocată.
Comparaţia rezultatelor interpretate la nivelul blocurilor randomizate
cu cele obţinute la nivelul întregului plan poate să releve diferenţe, caz
în care existenţa transferului ar fi dovedită.
140
prin toate condiţiile experimentale. Există două strategii de bază
pentru contracararea efectelor de ordine şi de secvenţă:
Privind dinspre subiect, controlul efectului ordinii şi
secvenţei intrasubiect are loc prin compararea subiectului
cu el însuşi, într-o situaţie experimentală şi în cealaltă
(within subjects). Dintr-o altă perspectivă, aceea a
planului, în modelul experimental intrasubiect variabila
dependentă este măsurată la fiecare subiect în cadrul
tuturor condiţiilor experimentale, adică pentru toate
nivelurile de-a lungul cărora este manipulată variabila
independentă.
Urmând aceleaşi două perspective, controlul ordinii şi
secvenţei se realizează prin compararea subiecţilor între ei
(between subjects), variaţiile variabilei dependente fiind
observate la fiecare subiect doar la un singur nivel al
variabilei independente.
Alegerea unuia sau altuia dintre aceste modele experimentale
depinde de specificul ipotezelor care urmează a fi testate (Vadum şi
Rankin, 1998).
Modelul cu măsurători repetate este în general perturbat de
efectele de ordine şi de secvenţă.
Uneori subiecţii trecând de la o condiţie experimentală la alta
îşi modifică atitudinea faţă de experiment pentru că deja capătă
anumite informaţii care îi fac avizaţi în raport cu intenţiile reale ale
experimentului. În aceste cazuri comparaţiile intrasubiecţi nu mai sunt
potrivite şi se utilizează două grupuri diferite fiecare parcurgând una
dintre cele două condiţii experimentale.
Iată în continuare un exemplu de experiment în care controlul
nici nu ar putea fi realizat altfel decât utilizând grupuri independente,
alocate fiecărui nivel al variabilei independente.
Stanley Schacter (1959) a testat experimental ipoteza că
inducerea anxietăţii va determina subiecţii să caute compania altor
persoane. Au fost utilizate două grupe de subiecţi. Grupului
experimental i s-a indus starea de anxietate prin anunţarea că după
zece minute vor primi un şoc electric dureros de la aparatul la care
erau conectaţi. Grupului de control i s-a spus că va primi un şoc slab şi
nedureros. În cele zece minute care precedau presupusul şoc, care de
altfel nici nu a fost dat, subiecţii completau un chestionar despre
preferinţele lor de a aştepta şocul singuri sau împreună cu alţii.
Procentajul comportamentului prosocial a fost de 30% în grupul de
control faţă de 60% în grupul experimental.
141
5.6 Controlul defectuos
142
Experimentul cu un singur grup testat la final este de tipul:
X O1
O1 X
O2
Eventualul progres înregistrat la finalul cursului nu poate să
fie atribuit cu certitudine programului de instruire deoarece în acest
interval au putut acţiona şi alţi factori asupra cărora experimentatorul
nu a avut nici un control. Principalele surse de eroare sunt efectele de
ordine şi de secvenţă la care ne-am referit în § 5.5.5, dar şi o serie de
evenimente care pot surveni în intervalul dintre cele două testări.
Validitatea internă a experimentului este afectată de aceste
surse străine de variaţie.
144
O serie de autori ( Orne, 1962, Vadum şi Rankin, op.cit) au
abordat experimentul ca pe o situaţie socială. Ei au avut în vedere
inevitabilele interacţiuni care au loc între subiecţi şi experimentator,
între subiecţii înşişi în calitate de participanţi la experiment şi între
subiecţi şi cultura cărei îi aparţin precum şi deformările pe care aceste
interacţiuni le pot introduce într-un experiment.
Un exemplu clasic privitor la consecinţele acestor interacţiuni
asupra validităţii experimentului îl reprezintă aşa-zisul efect
Hawthorne. La uzinele cu acelaşi nume din SUA, în deceniul al treilea
al secolului trecut, s-a desfăşurat un experiment natural în care erau
măsurate efectele unor îmbunătăţiri ale condiţiilor de muncă asupra
productivităţii.
Manipulând aceste condiţii în calitate de variabile
experimentale cercetătorii au fost surprinşi să constate că
productivitatea creştea chiar când stimulentele erau retrase.
Ulterior cercetătorii au explicat aceste rezultate apelând la o
altă variabilă decât cele care au fost manipulate (pauze dese, orar
săptămânal redus, etc).
Creşterea productivităţii muncii, s-a datorat percepţiei
favorabile pe care personalul a avut-o faţă de aceste schimbări.
Rezultă că oamenii sunt sensibili şi reacţionează în mod specific faţă
de tratamentul şi atenţia specială pe care o primesc în calitate de
participanţi la experiment.
M. Orne (op.cit.) a dovedit în mod convingător că subiecţii se
comportă în timpul experimentelor altfel decât în situaţiile obişnuite.
Cel mai izbitor este faptul că ei acceptă o serie de sarcini plictisitoare
sau chiar periculoase pe care în situaţiile de viaţă curente nu le-ar
accepta.
El explică aceste comportamente prin influenţa exercitată de
cultura noastră care valorizează rolul cercetătorului şi al
experimentelor în progresul societăţii.
Atitudinile oamenilor faţă de experimente sunt puternic
influenţate de o serie de reprezentări sociale legate de ştiinţă. Una
dintre acestea este aceea că în timpul experimentelor subiectul este
protejat faţă de efectele nocive ale condiţiilor experimentale.
Ei manifestă, prin urmare o mare disponibilitate de a adopta
rolul de „buni subiecţi”, adică de a fi cooperanţi şi de a nu prejudicia
în vreun fel experimentul. În acest scop subiecţii inventează, pe baza
unui anumit „folclor”, creat în jurul experimentelor, o serie de ipoteze
legate de scopul experimentului şi de felul în care ar trebui să se
comporte pe durata lor.
145
Indicii pe care în mod eronat subiecţii îi identifică într-un
experiment, indici pe baza cărora ei presupun anumite aşteptări din
partea experimentatorului în legătură cu participarea lor la experiment
şi în virtutea cărora ajung să se comporte într-un anumit mod, au fost
desemnaţi generic de Martin Orne drept caracteristici aşteptate
(caracteristics demand). Ele pot interfera cu efectele variabilei
independente mistificând rezultatele experimentului.
În acest sens este elocvent un experiment întreprins de Orne
si Scheibe (Vadum şi Rankin, 1998) în domeniul deprivării
senzoriale.
Ei au dorit să verifice dacă nu cumva unele dintre efectele
care sunt atribuite deprivării senzoriale se datorează de fapt
caracteristicilor aşteptate.
Autorii citaţi au implementat un plan cu grupuri independente.
Grupul experimental a fost supus la o serie de influenţe de tipul
caracteristicilor solicitate.
Astfel, în sala de testare erau ostentativ expuse pe o „măsuţă
de urgenţă” tot felul de medicamente şi accesorii medicale, iar
subiecţilor li s-a efectuat anamneza medicală. Subiecţilor nu li s-a
comunicat nimic altceva în legătură cu scopul experimentului, dar
toată atmosfera era ca şi cum subiecţii ar fi participat la un experiment
de deprivare senzorială.
Ei au fost introduşi, ulterior într-o altă sală unde „ condiţiile
de deprivare erau absente” iar subiecţii primeau la alegere o sarcină
care să îi ţină ocupaţi încă patru ore.
Subiecţii din grupul de control au primit un tratament identic
numai că lor li s-a spus că fac parte din grupul de control al unui
experiment de deprivare senzorială.
Variabila dependentă a constituit-o relatările subiecţilor
despre experienţele deosebite pe care le-au avut în timpul
experimentului. Comparaţia acestor relatări, pe cele două grupuri, a
confirmat ipoteza iniţială.
Ar mai trebui adăugat că rezultatele oricărui experiment pot fi
influenţate de „ecuaţia personală” a cercetătorului, prin faptul că, de o
manieră inconştientă comportamentul lui poate trăda faţă de
participanţi aşteptările sau chiar ipotezele experimentului, în forma
autoprofeţiei împlinite. Cu alte cuvinte el poate introduce
neintenţionat o serie de deformări datorită unor atitudini, preferinţe
etc. Ca urmare comportamentul lui poate sugera, fără să vrea, ca
subiecţii să se comporte în sensul care i-ar confirma astfel ipotezele
cercetării.
146
Rezultă că toate cele trei efecte menţionate şi anume, efectul
Hawthorne, caracteristicile aşteptate, şi ecuaţia personală reprezintă
faţete ale comportamentului examinatorului: comportamentul
perceput de către participanţii la experiment şi anumite aspecte mai
puţin conştientizate ale comportamentului său manifest.
Controlul acestor efecte se poate realiza prin:
1) Standardizarea tuturor condiţiilor experimentale. Aceasta
înseamnă menţinerea constantă a unor evenimente, implicând
standardizarea comportamentului examinatorului pentru toate
grupurile participante la experiment, astfel încât acelaşi tip de
influenţe sau acelaşi grad de atenţie să fie dat atât grupului de control
cât şi celui experimental.
Uniformizarea conduitei experimentatorului se obţine prin:
Administrarea în grup a anumitor condiţii experimentale.
Când este posibil instructajele date subiecţilor vor fi înregistrate
anterior pe suport magnetic.
Asigurarea condiţiilor ca experimentatorul să nu cunoască ce
condiţie experimentală parcurge subiectul la un moment dat.
McBurney (op.cit.) menţionează un experiment propriu în care
altcineva înregistrase dacă subiecţii erau sau nu erau fumători.
Ulterior, odată cu finalizarea experimentului subiecţii au fost împărţiţi
în fumători şi nefumători în vederea studierii efectului fumatului
asupra sensibilităţii gustative.
Este interesantă ideea vehiculată de unii autori (Vadum şi
Rankin, op.cit.) că trebuie evitat acel tip de plan experimental unde
grupului de control nu i se aplică nici un tratament. Dimpotrivă, este
de dorit să i se aplice un tratament contrar celui aplicat grupului
experimental pentru a funcţiona acelaşi tip de relaţie care există între
experimentator şi grupul experimental.
2) Repartizarea subiecţilor la grupurile independente sau la
condiţiile experimentale prin tehnicile de randomizare, îndeosebi când
eşantionul este mare.
3) Controlul statistic. Are aici rolul de a evalua amploarea
deformărilor rezultatelor experimentului de către variabilele sociale
ale experimentului psihologic şi de a stabili nivelul de încredere care
trebuie acordat acestor rezultate.
147
Se referă la deformarea comportamentului subiectului pe
durata experimentului ca urmare a modului propriu de înţelegere a
cerinţelor experimentului.
Am menţionat deja două forme ale comportamentul
disimulat pe durata desfăşurării experimentului :
(1) Disimularea în subiecţi cumsecade (good-subject
tendency), comportament determinat de ceea ce subiectul crede că
experimentatorul aşteaptă de la el ;
(2) Comportamentul în situaţia de evaluare. El are la bază,
potrivit lui Mc.Burney (op.cit.), aprehensiunea evaluării, adică
părerea participanţilor că toate experimentele implică diverse tipuri de
evaluări deghizate. De aici comportamentul subiecţilor de a fi mai
rapizi decât sunt în mod firesc, sau de a fi mai inteligenţi decât o
dovedesc în situaţiile reale.
Fireşte că aceste comportamente falsificatoare sunt
determinate de mecanisme psihice mult mai complexe în care
psihologia eului şi cea umanistă ar revendica implicarea
mecanismelor de apărare şi a imaginii de sine, după cum psihologia
cognitivă ar accentua contribuţia metacogniţiei, în autevaluările tacite
faţă de ceea ce subiectul crede că alţii aşteaptă de la el.
Următorul experiment este elocvent pentru acest tip de
deformare .
Subiecţilor hipnotizaţi într-o etapă anterioară, li s-a cerut să
arunce cu acid în faţa unei persoane care era protejată de un geam
invizibil.
Unui grup de control căruia în mod fals i s-a spus că va fi
hipnotizat i s-a cerut acelasi lucru. Şi aici cinci din şase subiecţi s-au
conformat cerinţei. Ulterior ei au relatat că s-au comportat astfel
deoarece au intuit că fuseseră luate măsuri de protejare a persoanei
ţintă.
Un alt experiment, citat de McBurney, este cel întreprins de
Milgram(1963) unde subiecţii erau determinaţi să creadă că
administrează, fără voia lor, şocuri electrice altor persoane iar marea
lor majoritate răspundea acestei cerinţe.
Observăm că subiecţii din ambele experimente s-au conformat
astfel propriei lor aşteptări cu privire la cerinţele unui experiment
psihologic.
Aşteptările de rol împreună cu tendinţa de a fi un bun subiect
îl pot determina pe participant să se comporte ca şi când nu ar intui
scopul adevărat al experimentului, chiar când acesta este foarte
transparent pentru el. El adoptă în calitate de subiect un comportament
148
de tipul “ca şi când“ nu ar cunoaşte adevăratul scop al experimentului
deoarece nu vrea să îl supere pe experimentator.
Sunt utilizate mai frecvent următoarele strategii de limitare a
efectelor cerinţelor de rol:
1) O primă strategie este aceea de a masca pentru subiect
scopul adevărat al experimenului. Se utilizează un pretext fals care să
pară cât mai plauzibil. Totuşi există fie riscul de a modifica
comportamentul într-o direcţie neconvenabilă pentru experiment,
contrazicând ipoteza cercetării, fie de a încălca etica profesională. La
acesta se mai adaugă faptul că subiecţii dispun deja de unele
informaţii despre experimente care le creează un anumit montaj faţă
de experimentul la care participă, încât este dificil de găsit acel pretext
care să ascundă de o manieră credibilă adevăratul scop al
experimentului.
2) O altă strategie constă în a împărţi experimentul în două,
astfel încât datele să fie obţinute din două locuri diferite, subiecţii
fiind astfel lipsiţi de perspectiva întregului, şi implicit de scopul
adevărat al cercetării. Astfel într-o primă fază, subiecţilor li se
determină cu un test potrivit aptitudinea verbală. În adoua fază a
experimentului, la testrea aptitudinii tehnice participă doar subiecţii cu
performanţe medii fără să cunoască crieteriul după care au fost
selecţionaţi.
3) O a treia strategie menţionată de McBurney constă în a
apela la măsurători al căror sens nu poate fi ghicit de subiect cum ar fi
cazul comportamentelor neverbale pentru experimentele privind
interacţiunile sociale (cât de aproape stau interlocutorii, dacă se
privesc în ochi, etc.).
4) O ultimă cale de contracarare a efectului cerinţelor de rol o
constituie realizarea experimentului fără ca subiecţii să fie conştienţi
de acest fapt. Este cazul experimentelor în care sunt studiate efectele
locurilor de şedere asupra interacţiunilor sociale.
149
150
CAPITOLUL 6
DESFĂŞURAREA EXPERIMENTULUI
152
Abordarea corectă, încă din faza iniţială, a unei probleme de
cercetat aduce în actualitate pregătirea teoretică anterioară consolidată
pe durata şcolarităţii şi alimentată continuu de educaţia permanentă.
Sesizarea unei probleme care merită să fie cercetată este posibilă pe un
teren de solidă cunoaştere a domeniului respectiv. De fapt sesizarea
unui fenomen a cărui cercetare poate să sporească nivelul cunoaşterii
este posibilă pe un fond larg şi bine structurat de cunoştinţe. A observa
nu înseamnă doar a detecta un fenomen ci şi a-l recunoaşte şi interpreta
prin operaţiile de clasificare şi categorializare, posibile tocmai graţie
unor informaţii solide în domeniul cercetat. Receptivitatea
cercetătorului faţă de aspecte care scapă de obicei observatorului comun
este una enculturată, educată şi antrenată.
153
mod logic etapei de documentare. Ea reprezintă în
ştiinţă calea inductivă de cunoaştere.
o Abilitatea de a sesiza fapte care de obicei scapă
observaţiei obişnuite este posibilă dacă observatorul
se detaşează de unele prejudecăţi, clişee care pot
masca aspectele semnificative. Experimentele lui Carl
Dunker (1945) privind condiţiile care facilitează
găsirea soluţiei la diferite sarcini experimentale care
antrenau fixitatea obiectuală (Subiectul nu întrezărea
o nouă utilitate a obiectului care ar fi condus la
soluţionarea problemei, datorită unei utilităţi
consacrate de experienţa trecută) au arătat importanţa
inducerii de către experimentator a unui montaj,
contrar celui provocat de utilitatea „consacrată”. El le
spunea subiecţilor când nu întrezăreau soluţia
problemei, „Nu fiţi orb!). Vadum şi Rankin (1998)
propun studenţilor care debutează în cercetarea
psihologică autoinducerea unui astfel de montaj.
o Luarea în considerare a unor ipoteze alternative în
explicarea datelor de observaţie.
o Abordarea unor aspecte obişnuite, familiare dintr-o
perspectivă nefamiliară, asemenea copilului care se
minunează de orice. Multe fapte comune ascund
aspecte esenţiale pentru înţelegerea unui anumit
fenomen .
o Abordarea unor fapte neobişnuite prin raportarea la
ceea ce ne este familiar cunoscut.
o Deschiderea la serendipitate.
o Utilizarea teoriilor în generarea ideilor noi. O teorie
ştiinţifică este euristică dacă permite derivarea prin
deducţie a unor noi ipoteze.
o Explorarea analogiilor şi metaforelor. „Metaforele
sunt figuri de stil bazate pe analogii care se aplică
obiectelor şi evenimentelor la care , în mod obişnuit
nu se aplică”. (Vadum şi Rankin, op.cit., p.274). În
ştiinţă ele servesc proceselor de modelare. Modelele
reprezintă o modalitate eficientă de transfer a ceea ce
cunoaştem într-un domeniu asupra unor fenomene pe
care urmează să le investigăm. Ele facilitează
emiterea de noi ipoteze.
o Focalizarea atenţiei pe fapte neobişnuite. Anomaliile
comportamentale, de exemplu, pot facilita înţelegerea
154
unor fenomene, prin faptul că ilustrează de o manieră
radicală regularităţi dificil de sesizat în condiţii
obişnuite.
o Căutarea golurilor în cunoaştere. Teoriile ştiinţifice,
rapoartele de cercetare conţin unele imperfecţiuni care
pot fi datorate limitelor cunoaşterii în domeniul
respectiv. Sesizarea lor poate conduce la emiterea
unor noi ipoteze şi la elaborarea unor noi teorii
ştiinţifice.
o Adoptarea unei atitudini sceptice în legătură cu unele
descoperiri, metode sau interpretări. Calea raţională în
ştiinţă a fost inaugurată de R. Descartes, filosof
francez, care în cartea sa celebră „Discurs despre
metoda de a ne conduce bine raţiunea şi de a căuta
adevărul în ştiinţe”, apărută în 1637 (în româneşte,
1990, Ed. Acad.), propune aşa-zisa îndoială metodică,
atitudine cognitivă, menită să spulbere dogmele şi să
nu ia ca adevărate decât faptele dovedite pe cale
deductivă. O atitudine sceptică, plină de
discernământ, care supune verificării ştiinţifice
metodele şi rezultatele predecesorilor este o bună cale
de elaborare a noi ipoteze ştiinţifice.
o Îmbunătăţirea aparatelor, tehnicilor de măsurare şi
procedurilor poate conduce la deschiderea unor noi
orizonturi în cercetare. Este elocvent cazul imageriei
corticale bazate pe rezonanţa magnetică prin care
poate fi studiată specificitatea funcţionării corticale în
anumite tipuri de sarcini experimentale.
o Focalizarea pe probleme practice.
156
pe care acesta se focalizează şi de asemenea asupra modului în care
această problemă a fost soluţionată sau asupra modului în care autorul
a încercat să o soluţioneze.
Parcurgerea conţinutului articolului ne ajută să sesizăm unele
imperfecţiuni legate de metodă sau omiterea unor importante aspecte.
Este important să procedăm la o preluare critică, plină de
discernământ a ideilor şi concluziilor articolului pentru a ne contura,
astfel, un punct de vedere original.
158
Pentru a nu putea fi reţinuţi, stimulii ar trebui prezentaţi,
dacă nu toţi odată într-o sesiune, atunci cel puţin şapte,
aceasta fiind limita recunoscută a volumului memoriei de
scurtă durată.
159
Există în literatura de specialitate o întreagă dispută dacă
voluntariatul este într-adevăr un criteriu aleatoriu de constituire a
eşantionului experimental. Voluntariatul poate să mascheze o serie de
constrângeri în virtutea cărora unele persoane participă la experiment
(la studenţi nevoia de a-şi ameliora situaţia şcolară, la alte persoane
nevoia de câştig, etc.).
160
Privitor la eşantionul optim de măsurători efectuate la nivelul
variabilei dependente, în concordanţă cu cele spuse în § 5.3.3, mai
trebuie menţionat că testele psihologice sunt, prin definiţie, eşantioane
reprezentative ale comportamentului investigat. Când sunt utilizate
alte tehnici de măsurare această condiţie rămâne la fel de stringentă.
161
În general se optează pentru o putere a testului statistic de
peste 80%. Într-un plan experimental riguros realizat, sensibil, pot fi
sesizate cele mai mici efecte ale variabilei independente care în
condiţii experimentale mai puţin riguroase ar putea rămâne
neobservate.
În proiectarea unui experiment ar trebui să plecăm de la o
anumită estimare a mărimii efectelor produse de variabila
independentă asupra variabilei dependente. Acest lucru este posibil
consultând datele publicate despre experimente efectuate în domeniul
care ne interesează sau efectuând un studiu pilot. Ambele procedee ne
oferă doi parametri de care avem absolută nevoie, diferenţa medie şi
abaterea standard. Mărimea efectului, respectiv magnitudinea
diferenţei între grupul experimental şi cel de control, notată cu d, se
poate calcula cu formula d = Md – As, unde: Md este media
diferenţelor observate iar As este abaterea standard (Vadum şi Rankin,
1998). Această metodă poartă numele de media standardizată a
diferenţelor sau metoda Cohen.
Shaugnessey et. al. (op. cit.) consideră că aşa-zisa analiză de
putere a unui experiment trebuie efectuată încă din faza de proiectare
a planului. În acest scop autorii propun următorul algoritm cu doi paşi:
o Estimarea mărimii efectelor variabilei independente
pe baza consultării rezultatelor unor experimente în
care a fost implementată variabila care ne interesează.
Este vorba de a anticipa dacă efectele variabilei
manipulate experimental vor fi greu sesizabile (efecte
mici), mediu sau uşor detectabile (efecte de mărime
mare).
o Alegerea din tabele de putere a mărimii eşantionului
necesară detectării efectelor estimate.
162
de 30 de subiecţi pentru a surprinde efecte
mari;
de 76 de subiecţi pentru efecte medii;
de 464 de subiecţi pentru a detecta cele mai
mici
cte.
Efectele cele mai mici sunt sesizate de testele statistice cele mai
puternice (Shaughnessey, et. al., op. cit.)
Între puterea testului statistic şi numărul de subiecţi există o
relaţie logaritmică.
Pentru o anumită magnitudine a efectelor şi pentru o anumită
putere a testului statistic rezultă un număr optim de subiecţi. Aceste
relaţii matematice sunt de obicei prezentate în formă grafică.
100 D=0.50
90
80
70
60
50
40
30
20
10
0 50 100 150
163
6.6.3 Mărimea eşantionului
funcţie de eroarea standard a mediei
x
x =
N
Se observă că pentru a reduce eroarea standard a mediei la
jumătate ar trebui să dublăm rădăcina pătrată a numărului de subiecţi
ceea ce echivalează, de fapt, cu a mări de patru ori numărul de
subiecţi.
Pornind de la diferite valori ipotetice ale abaterii standard şi
ale abaterii standard a mediei se poate obţine o infinitate de curbe ca
reprezentări grafice ale formulei matematice de mai sus.
Pentru o colecţie de valori ale variabilei dependente având
abaterea standard de 3.16, se poate obţine, pentru relaţia eroarea
standard a mediei – număr de subiecţi, o funcţie logaritmică. Potrivit
acestei relaţii, o eroare standard a mediei egală cu unitatea poate fi
atinsă de un eşantion de aproximativ 10 subiecţi.
164
Eroarea standard a mediei
0 10 40 160
Număr subiecţi
165
în legătură cu anxietatea şi cu eventualele operaţionalizări ale acestei
noţiuni care au fost întreprinse în alte cercetări.
De exemplu, variabila dependentă măsurată ar putea să fie
nivelul anxietăţii induse de dificultatea sarcinii experimentale. La
întrebarea, „Aveţi suficiente rezerve de energie pentru a face faţă
situaţiilor dificile?” există mai multe răspunsuri posibile, dar unele, ca
cele care urmează, nu ar avea relevanţă pentru scopul cercetării:
1. Întotdeauna
2. Uneori
2 3. Rareori
3
Întrebările cu răspuns deschis sunt utile fie atunci când există
mult prea multe variante de răspuns, fie ca un stadiu incipient al
construirii unei scheme de răspuns, când se inventariază repertoriul
răspunsurilor posibile la o anumită categorie de subiecţi.
Întrebările cu răspuns deschis prezintă avantajul obţinerii unor
informaţii foarte variate dar şi dezavantajul că implică serioase
dificultăţi de cuantificare în vederea evidenţierii anumitor modele
comportamentale sau atitudinale la subiecţii investigaţi.
În general forma răspunsurilor închise poate să varieze de la
un chestionar la altul. Funcţie de obiectivele urmărite în cercetare
formatul răspunsurilor poate cuprinde răspunsuri exhaustive de tipul
„DA – NU”, „Acord-Dezacord” etc. Creşterea preciziei măsurătorii
poate fi realizată dacă se utilizează diferite scări de evaluare. Acestea
pot varia funcţie de criteriul general de evaluare care poate fi criteriul
frecvenţei comportamentului (vezi mai sus), criteriul importanţei
(foarte mică, medie, mare, foarte mare), criteriul probabilităţii (foarte
limitată, limitată, moderată, mare, foarte mare, etc). Scările de
evaluare pot fi diferite în privinţa numărului de gradaţii care pot fi de
trei, cinci, şapte, nouă. Sunt preferate numerele impare deoarece
permit o reprezentare mai exactă a mijlocului scării unde se situează
valorile medii. În cazul chestionarelor mai elaborate, gradaţiilor de pe
scară li se ataşează descripţii sau ancore care permit o evaluare mai
166
fină de către persoanele fără antrenament în utilizarea acestor
instrumente de evaluare.
Dintre întrebările cu răspuns închis se detaşează cele cu
alegere forţată. Acestea controlează foarte eficace tendinţele
subiecţilor de falsificare a răspunsurilor.
În multe situaţii, când sunt cercetate aspecte delicate cum sunt
cele privind consumul de droguri sau comportamentele antisociale,
obţinerea cooperării subiectului implică măsuri speciale pentru
asigurarea de o manieră, „vizibilă” pentru subiect, a confidenţialităţii
răspunsurilor la chestionar. Un tip de chestionar care are astfel de
facilităţi a fost realizat de Stanley Warner în 1965 (Vadum şi Rankin,
1998). El este prevăzut cu un sistem de răspuns care permite păstrarea
secretului dat de fiecare subiect dar permite calculul procentului de
subiecţi dintr-un lot care au dat un anumit tip de răspuns.
6.8 Pretestarea
167
Cea mai bună cale de a răspunde la întrebarea de mai sus este,
aşa cum am văzut în, să repetăm experimentul pe alţi subiecţi, alte
situaţii şi cu alţi experimentatori, ca o modalitate de a-i verifica, în
acelaşi timp, fidelitatea (consistenţa) şi validitatea externă.
Totuşi, replicările nu sunt totdeauna posibile, motiv pentru
care cercetătorii încearcă să emită concluzii pe baza datelor obţinute,
verificând generalizabilitatea lor dincolo de cadrele eşantionului
utilizat. În acest scop ei utilizează inferenţa statistică.
168
Cea mai utilizată metodă de inferenţă a unor concluzii plecând
de la eşantioane de date este aceea a ipotezei de nul.
Testul ipotezei de nul ne ajută să decidem dacă efectele
observate într-un experiment se datorează variabilei independente sau
erorii de variaţie. Acest test statistic presupune ca subiecţii celor două
grupuri comparate au fost extraşi prin randomizare dintr-o populaţie
mult mai numeroasă. Totuşi, Fisher, referindu-se la această metodă,
consideră că testul t aproximează foarte bine testul de randomizare
chiar atunci când grupurile comparate nu sunt extrase dintr-o
populaţie foarte largă (Vadum şi Rankin, 1998).
Testul ipotezei de nul presupune următorii paşi:
169
afirma că schimbările în variabila dependentă sunt cauzate de
variabila independentă.
Totuşi, această metodă de inferenţă statistică testează adevărul
sau falsitatea ipotezei de nul şi nu a ipotezei ştiinţifice care este testată
de experimentul însuşi. De aceea ar fi mai nimerit, aşa cum vom vedea
mai departe, ca interpretarea testului să fie efectuată în termenii
ipotezei de nul, după cum urmează: dintr-o 100 de testări ale ipotezei
de nul, în cinci dintre ele este posibil să se producă faptele
experimentale aşteptate, chiar dacă ipoteza de nul ar fi adevărată.
Într-o formă plastică am putea spune că fiecare efect aşteptat
care se produce este o palmă pe obrazul ipotezei de nul. Ea nu poate
suporta fără să fie compromisă mai mult de cinci palme, ceea ce
echivalează cu pragul de semnificaţie.
Este posibil să greşim uneori faţă de biata ipoteză de nul şi să
o pălmuim deşi spune adevărul, anume că efectele observate nu sunt
cauzate de variabila independentă. Deci pragul de semnificaţie
exprimă probabilitatea de a comite o eroare de tip I, adică de a
respinge ipoteza de nul în condiţiile în care aceasta este adevărată.
(Reamintim că eroarea de tip I apare atunci când ipoteza de nul este
respinsă deşi aceasta este adevărată. Ea este controlată prin testul
ipotezei de nul.)
Am putea să reducem tipul I de eroare alegând un prag de
semnificaţie cu mult mai mic, de exemplu, acceptând că dintr-o mie
de teste ale ipotezei de nul doar în unul dintre ele variabila
independentă ar produce efectele scontate chiar dacă ipoteza de nul
este adevărată. Totuşi, o restrângere atât de mare a pragului de
semnificaţie poate creşte riscul ca cercetătorul să comită eroarea de tip
II. (Reamintim că eroarea de tip II constă în admiterea ipotezei de nul
când aceasta este falsă. Ea este controlată printr-un plan experimental
care asigură controlul sever al variabilelor şi replicarea
experimentului, fapt care facilitează depistarea efectelor reale ale
variabilei independente. Cu cât experimentul este mai corect proiectat
cu atât forţa concluziilor sale va fi mai mare.
Se poate observa că există un adevărat cerc vicios privitor la
cele două tipuri de erori. Restrângerea probabilităţii uneia dintre ele
creşte şansele de producere ale celeilalte.
Această stare de aparent relativism, proprie ştiinţei moderne,
nu înseamnă decât că certitudinile în ştiinţă sunt statistice iar
psihologia nu face excepţie de la această regulă. Aşa cum, judicios
constată Shaugnessey et.al (op. cit. p. 248), acesta este motivul unei
anumite prudenţe specifică concluziilor unor cercetări bazate pe
inferenţa statistică.
170
Astfel, cercetătorii „rareori utilizează cuvântul dovedesc când
descriu rezultatele unui experiment care a implicat statisticile
inferenţiale. În schimb ei descriu rezultatele ca fiind consistente cu
ipotezele, confirmând sau suportând ipotezele.”
Am văzut că testul semnificaţiei ipotezei de nul (numit şi
testul „t”) este susceptibil de două abordări diferite. Ele sunt posibile
deoarece producerea unui eveniment poate fi estimată în termenii
teoriei probabilităţii din două perspective: ca o probabilitate „p”,
numită nivel de semnificaţie, (Comunitatea ştiinţifică acceptă un p mai
mic sau egal cu 5%) de a avea loc sau ca o probabilitate „q” de a nu se
produce, unde: p = 100% - q.
Astfel, putem afirma că un efect este posibil în 100-q % din
cazuri şi/sau nu este posibilă în 100-p % din cazuri (cazurile se referă
la situaţiile în care testul ipotezei de nul ar fi repetat de 100 de ori, în
aceleaşi condiţii).
Am putea vorbi de o interpretare de tip clasic, potrivit căreia
ipoteza de nul afirmă ca rezultatele experimentului (de exemplu
diferenţa între mediile grupurilor comparate) sunt nesemnificative,
acestea datorându-se întâmplării sau erorilor de eşantionare, testul „t”
conducându-ne la adevărul sau falsitatea ipotezei de nul. Prin
respingerea acesteia confirmăm ipoteza ştiinţifică în care se afirmă că
efectele observate în variabila dependentă sunt cauzate de variabila
independentă.
J. Cohen (1995), J. Shaugnessey et. al (op. cit.) avansează o
perspectivă oarecum diferită a testului ipotezei de nul, dezvoltând
consecinţele logice ale definiţiei de pe celălalt versant al interpretării.
Autorii citaţi anterior consideră că, întrucât testul ipotezei de nul
pleacă de la premisa că ipoteza de nul este adevărată (Variabila
independentă nu produce nici un efect asupra variabilei dependente)
logic este să considerăm că el determină probabilitatea ca diferenţele
înregistrate cu privire la variabila dependentă să fie semnificative,
dacă ipoteza de nul este adevărată. Dacă această probabilitate este
mică ipoteza de nul este respinsă şi se conchide că efectul variabilei
independente este unul semnificativ statistic. „Cheia înţelegerii
testului ipotezei de nul – subliniază J. Shagnessey et. al (op. cit., p.
246) – este înţelegerea faptului că utilizăm legile probabilităţii pentru
a estima probabilitatea unui rezultat numai atunci când plecăm de la
supoziţia că factorii întâmplători constituie singura cauză a acelui
rezultat „ … „Un rezultat statistic semnificativ este acela care are doar
o mică probabilitate de a se produce dacă ipoteza de nul este
adevărată”.
171
Următorul exemplu va face mai intuitivă deosebirea dintre
aceste două puncte de vedere. Să presupunem că în urma derulării
unui anumit experiment şi a statisticilor aferente, un anumit rezultat
are o probabilitate de p = .02. Potrivit interpretării clasice există 98 %
şanse ca ipoteza ştiinţifică să fie confirmată de rezultatul obţinut şi 2
% şanse ca ipoteza nulă să fie adevărată.
Potrivit interpretării propuse de J. Shaugnessey et. al (op. cit.)
există doar 2 % şanse să existe un efect semnificativ statistic al
variabilei independente, în forma rezultatului obţinut, în condiţiile în
care, de fapt, ipoteza nulă fiind adevărată, nu există nici un efect real
al variabilei independente asupra variabilei dependente.
Din această perspectivă autorii identifică patru posibile erori
în interpretarea testului ipotezei de nul:
1. Confuzia dintre semnificaţia statistică a unui rezultat şi
valoarea sa practică şi interpretativă. Un rezultat
experimental poate să fie semnificativ statistic fără să aibă
neapărat o semnificaţie psihologică. Acest fapt este posibil
deoarece semnificaţia statistică este dependentă de mărimea
eşantionului. De exemplu o diferenţă între preferinţele
bărbaţilor (media = 5.5) şi ale femeilor (media =5.6),
observată într-un experiment cu două grupuri randomizate,
care au cuprins 1000 de femei şi, respectiv 1000 de bărbaţi,
poate să fie semnificativă statistic la un nivel de semnificaţie
de .01, dar fără valoare practică, deci fără să ne poate conduce
la o concluzie pertinentă. Un fapt experimental care este
semnificativ statistic, dobândeşte valoare interpretativă din
punct de vedere psihologic dacă are o anumită magnitudine,
care poate fi evaluată prin metoda estimării mărimii efectelor,
care va fi discutată în subcapitolul consacrat analizei de
varianţă.
2. Concluzionarea nejustificată că un experiment are validitate
internă numai pentru că a produs rezultate semnificative din
punct de vedere statistic. Autorii atrag atenţia că există
nenumărate cazuri când experimente cu o slabă validitate
internă, caracterizate prin confuzia dintre efectele variabilei
independente şi ale variabilelor străine, au dat rezultate
semnificative statistic. Aceste rezultate nu pot fi interpretate
în lipsa calităţii validităţii interne care elimină riscul confuziei
şi al explicaţiilor alternative.
3. Înţelegerea eronată a testului ipotezei de nul ca o modalitate
de a determina probabilitatea ca ipoteza de nul să fie
adevărată, confuzie conţinută în concluzii de acest tip:”
172
Probabilitatea de obţinere a acestor rezultate doar ca urmare a
întâmplării este mai mică decât .05.” (J. Shaugnessey et. al op.
cit., p. 250).
Formularea este eronată, argumentează autorii citaţi, deoarece
testul ipotezei nul nu estimează probabilitatea ipotezei de nul de a fi
adevărată, întrucât întreaga procedură se bizuie pe presupunerea că
ipoteza de nul este adevărată.
Dimpotrivă, testul în cauză estimează cât de probabil este
rezultatul experimentului dacă ipoteza de nul este adevărată. Dacă
această probabilitate este mai mică de .05 atunci ipoteza de nul este
respinsă. De aceea, conchid autorii citaţi, formularea corectă a
concluziei ar putea fi următoarea: „Rezultatele se vor produce cu o
probabilitate mai mică de .05 presupunând că ipoteza de nul este
adevărată” J. Shaugnessey et. al op. cit., p. 250).
Interpretarea eronată a probabilităţii unui rezultat
experimental ca o expresie a repetabilităţii efective a acelui rezultat
dacă experimentul va fi replicat. Revenind la exemplul anterior,
probabilitatea de p = .02 nu este un indiciu că faptul experimental va fi
obţinut în 99 de cazuri dacă experimentul va fi repetat de 100 de ori.
Dimpotrivă, singura cale de a fi siguri că un rezultat va fi repetat este
aceea de a replica experimentul însuşi.
Confruntaţi cu atâtea posibile capcane ale metodei inferenţei
statistice studenţii şi tinerii cercetători ar putea încerca un anumit
sentiment deconcertant. Totuşi ei au suficiente motive să fie
încrezători când vor să generalizeze rezultatele experimentelor pe care
le întreprind. Testul semnificaţiei ipotezei de nul (NHST – null
hypothesis significance testing) poate fi completat cu o serie de tehnici
de analiză, ca de exemplu analiza datelor exprimate grafic, analiza
intervalelor de încredere, estimarea mărimii efectelor cauzate de
variabila independentă asupra variabilei dependente, prin care se poate
ajunge la un nivel acceptabil de încredere în rezultatele experimentale
obţinute.
Cohen (1995, p. 1002) după o critică pertinentă a limitelor
testului semnificaţiei ipotezei de nul, formulează următoarea concluzie
încurajatoare: „ … Dispunem de un ansamblu de tehnici statistice,
care, utilizate inteligent, pot să uşureze eforturile noastre. Dar, dat
fiind dificultăţile inducţiei statistice, trebuie să ne bizuim în cele din
urmă, aşa cum au procedat cercetătorii din trecut, pe repetarea
experimentelor”.
De asemenea, calea esenţială rămâne perfecţionarea sau
stăpânirea atât a teoriilor care explică faptele ştiinţifice abordate
experimental, cât şi a tehnicilor de măsurare, fapt care permite
173
formularea unor ipoteze cât mai testabile şi creşterea validităţii interne
a experimentelor.
174
ar putea să se situeze valoarea adevărată a unei anumite caracteristici a
populaţiei.
Iată un exemplu: Să presupunem că cercetarea preferinţelor
pentru băuturi răcoritoare, efectuată pe un eşantion reprezentativ din
populaţia elevilor de liceu constată că o anumită marcă este preferată
de 55 % dintre persoanele intervievate, cu un prag de probabilitate de
5 %. Aceasta înseamnă că procentajul adevărat, care ar rezulta dacă
studiu ar fi efectuat pe întreaga populaţie ţintă, s-ar situa între 55
plus/minus 5, adică între 50 şi 60 %.
O estimare mai riguroasă a limitelor probabile în care se
situează mărimea unei caracteristici a populaţiei ţintă se realizează
prin metoda intervalelor de încredere, deoarece, pe lângă pragul de
probabilitate se ia în calcul şi eroarea standard a mediei.
Intervalul de încredere se determină cu formula:
MSerror
CI = X
n
tcrit
Unde:
CI- interval de încredere (confidence interval)
X – media
MSerror - eroarea standard a mediei
t crit – valoarea lui t pentru un anumit prag de probabilitate (nivel de
încredere) şi pentru un anumit număr de grade de libertate df (degree
of freedom).
176
Cercetătorul este interesat să maximizeze variaţia sistematică
intergrupuri determinată de variabila independentă şi să minimizeze
cele două tipuri de variaţie întâmplătoare şi anume variaţiile intragrup
şi intergrup.
Semnificaţia statistică a diferenţei între mediile a fiecare două
grupuri poate fi controlată prin testul t, dar atunci când variabila
independentă are mai multe niveluri, cărora li s-au repartizat grupuri
diferite de subiecţi, este nevoie să se ia în considerare diferenţele
dintre mai multe grupuri pentru a putea conchide dacă variaţia
variabilei independente de-a lungul nivelelor sale a avut vre-un efect
asupra variabilei dependente. În astfel de situaţii tehnica de inferenţă
statistică cea mai potrivită este analiza de varianţă ANOVA.
Analiza de varianţă este un test de inferenţă statistică, numit
testul F (de la numele celui care l-a conceput, statisticianul Ronald
Fisher) test focalizat pe sursele de variaţie într-un experiment pentru a
evalua dacă efectul datorat variabilei independente este mai mare
decât acela care e aşteptat ca urmare a erorii de variaţie
(Shaugnessey, et.al., op.cit.). Testul F este un raport între varianţa
intergrupuri şi varianţa intragrupuri. Trebuie încă o dată precizat că
variaţia existentă între grupuri însumează variaţia datorată erorii de
eşantionare, pe de o parte şi variaţia sistematică, introdusă de variabila
independentă, pe de altă parte. Ar fi ideal dacă, într-un plan
experimental ar putea fi separat efectul variabilei independente de
eroarea de variaţie. Cum acest lucru nu este posibil, Fisher a imaginat
un raport matematic în care eroarea de variaţie apare şi la numărător şi
la numitor, acest fapt facilitând decelarea contribuţiei variabilei
independente la varianţa totală intergrupuri.
Surse de variaţie df SS MS F P
Variaţia între 6 198.98 33.16 27.2 .0001
grupuri
Variaţia intragrup 63 77.13 1.22
Varianţa totată 69 276.11
179
atât eroarea de variaţie datorată diferenţelor dintre subiecţi, diferenţe
care nu au putut fi eliminate în totalitate prin randomizare ci doar
egalizate plus variaţia sistematică produsă de manipularea variabilei
independente. În tabelul rezumativ valoarea lui MS de 33.16 exprimă
la un loc aceste două tipuri de varianţă. Se observă că acest număr este
trecut pe linia varianţei intergrupuri. El a fost obţinut împărţind
valoarea lui SS, de pe aceeaşi linie, la numărul corespunzător al
gradelor de libertate (degree of freedom - df). În principiu, numărul
gradelor de libertate este dat de diminuarea cu o unitate a numărului
indivizilor sau condiţiilor luate în considerare. În acest caz df =
numărul grupurilor – 1 = 7-1 =6.
b) Determinarea numitorului. El este reprezentat de valoarea
lui MS din tabel, care, pe linia corespunzătoare variaţiei intragrup este
de 1.22. În adevăr cea mai semnificativă sursă de variaţie, alta decât
variaţia sistematică a variabilei independente care este aşteptată de
experimentator, este aceea dată de deosebirile dintre subiecţii aceluiaşi
grup. În orice experiment creşterea validităţii interne conduce la
minimizarea variabilităţii intragrup şi la maximizarea variabilităţii
intergrupuri. Valoarea lui MS de 1.22 a fost obţinută împărţind
valoarea lui SS de 77.13 la numărul gradelor de libertate, adică la 63.
Gradele de libertate sunt, în acest caz, rezultatul înmulţirii numărului
de grupuri cu numărul gradelor de libertate din fiecare grup. Într-un
grup fiind 10 subiecţi, df = 10 – 1 = 9. Deci, 7 x 9 = 63.
c) Calculul raportului şi interpretarea lui F.
33.16
Deci F= 27.2
1.22
(2) Analiza detaliată a surselor sistematice de variaţie
Dacă analiza de tip omnibus confirmă că existenţa unui efect
al variabilei independente, în continuare se justifică efectuarea unor
comparaţii mai sistematice.
Paşii care trebuie întreprinşi sunt similari celor din analiza
omnibus. Experimentatorul trebuie să răspundă la două întrebări:
a) Există diferenţe privind numărul de erori în situaţia
experimentală în care subiectul este singur şi situaţia când subiectul
rezolvă sarcina experimentală în grup?;
b) Are loc o creştere a numărului de erori pe măsură ce creşte
mărimea grupului?.
Pentru aceasta vor fi efectuate comparaţii între mediile performanţelor
pe diferite combinaţii ale nivelurilor variabilei independente, astfel: I /
(II + III + IV + V + VI + VII) sau I + II / III + IV + V + VI + VII)
sau I + II + III / IV + V + VII.
180
6.9.1.3.2 ANOVA pentru designuri cu măsurători
repetate
181
Performanţele individuale la fiecare stimul au fost exprimate
prin mediana celor şase scoruri. Pentru un număr mic de măsurători,
efectuate pe un singur subiect media, fiind neconcludentă deoarece
este influenţată de eventualele scoruri extreme, este înlocuită cu
mediana, aceasta reprezentând o modalitate mai adecvată de a rezuma
statistic performanţa fiecărui subiect.
Următorul pas constă în a condensa performanţele individuale
sub forma mediilor, pe fiecare condiţie experimentală, deoarece
verificarea ipotezei, că subiecţii pot diferenţia intervalele de timp
considerate, presupune controlul statistic al semnificaţiei diferenţelor
între mediile calculate la nivelul fiecărui interval de timp. Aceste
medii sunt date în tabelul anterior.
Programe speciale, realizate pe computer, efectuează atât
statisticile descriptive cât şi cele inferenţiale implicate în analiza de
varianţă, şi le fac vizibile pe monitor sau la imprimantă în forma unor
tabele rezumative.
2515.6
2 = 2515.6 646.9 = .80
184
X1 X 2
d Cohen =
unde:
n 1 s
1 1
2
n 2 1 s 2 2
s=
N
185
Semnificaţia dobândită astfel rămâne doar rezultatul jocului
întâmplării.
Din perspectiva acestei noi proceduri apare clar cât de
amăgitoare este inferenţa statistică, dacă semnificaţia statistică a unui
rezultat (diferenţă între medii, corelaţie, grupare de factori, etc) nu
este verificată prin alte tehnici cum sunt cele deja trecute în revistă în
subcapitolul precedent: analiza graficelor, marginea de eroare,
intervalele de încredere, coeficientul lui Cohen, etc.
CAPITOLUL 7
CVASIEXPERIMENTUL
186
Este o procedură de cercetare în legătură cu care omul de
ştiinţă nu are controlul deplin al tuturor aspectelor. Ne reamintim că,
privitor la experimente (true experiments), semnificaţia controlului
este aceea de a limita efectele diverselor ameninţări la adresa
validităţii. Aşa cum am văzut în capitolul cinci, în experimentul de
laborator, cercetătorul controlează modul de recrutare a subiecţilor şi
procedurile de desfăşurare a experimentului. Subiecţii sunt de obicei
recrutaţi pe criterii aleatoare deoarece acest procedeu este singurul
care ne permite să presupunem că efectele variabilei independente pot
fi confundate cu efectele altor variabile doar din întâmplare. Pentru
testarea ipotezei că modificările variabilei dependente sunt efectele
jocului hazardului se utilizează metoda ipotezei de nul la care ne-am
referit pe larg în § 6.9.1
Experimentul propriu zis (experimentul de laborator) prezintă,
faţă de cel invocat cel puţin avantajul unui control mult mai eficient
asupra surselor de variaţie din cadrul experimentului. Totuşi, o serie
de fenomene psihosociale nu pot fi aduse în laborator fără riscul
schematizării şi, prin aceasta, al îndepărtării de realitate. În aceste
cazuri sunt preferate studiile de teren, experimentele naturale.
Shaughnessey et al. (op. cit.) menţionează două raţiuni care
justifică utilizarea cvasiexperimentelor : 1) Testarea, respectiv
extinderea validităţii externe a unor concluzii fundamentate prin
cercetări de laborator ; 2) Fundamentarea unor decizii guvernamentale
sau ale altor organisme de a introduce schimbări benefice în viaţa şi
activitatea oamenilor.
Este adevărat că depăşind o serie de inconveniente ale
experimentului de laborator, dintre care cel mai important este slaba
sa validitate ecologică, desfăşurarea unor experimente în condiţii
naturale întâmpină alt gen de dificultăţi. Pe scurt acestea sunt : a)
Dificultăţi în obţinerea aprobărilor de la autorităţi ; b) Dificultăţi în
recrutarea participanţilor. Shaughnessey et al (op.cit.) pun problema
implicaţiilor frustrante ale repartizării subiecţilor prin randomizare la
condiţiile experimentale, întrucât ei acceptă mai greu alternativa de a
nimeri în grupa celor care, de exemplu, beneficiază de o metodă veche
de predare, comparativ cu una nouă, incitantă sau de a nu primi un
tratament psihoterapeutic cu efecte benefice, în situaţia când pică în
grupul de control.
Mc Burney (op.cit.) face recomandarea ca aceste experimente
să fie preferate celor propriu-zise doar atunci când o creştere a
validităţii experimentului este mai mare decât diminuarea controlului
care le este specifică.
187
Comparativ cu experimentele de laborator experimentele de
teren se deosebesc prin următoarele caracteristici:
Mai este numit experiment ex post facto (Cook, T., D., &
Campbell, D. T., 1979). Alţi autori (Shaughnessey, et.al., op.cit.)
tratează cvasiexperimentul în contextul mai larg al experimentelor de
teren (fields experiments).
Prin cvasiexperiment putem denumi toate experimentele unde
dintr-o cauză sau alta controlul cercetătorului este limitat dintr-un
motiv sau altul.
Cvasiexperimentul sau experimentul invocat, reprezintă o
procedură de cercetare în care experimentatorul trebuie să selecteze
subiecţii pentru diferite condiţii experimentale, recrutându-i din
grupuri preexistente. Planul utilizat în aceste experimente se mai
numeşte plan cu grupuri naturale, iar variabilele independente poartă
denumirea de variabile subiect (Shaughnessey et.al.,2000). Acestea
cuprind diferite tipuri de diferenţe individuale cum sunt cele
referitoare la vârstă, sex, sau personalitate (intro’-extraversiunea,
submisia – ascendenţa, etc.). Design-ul cu grupuri naturale este
oportun în situaţii când din cauza unor constrângeri etice nu este
posibilă manipularea experimentală a variabilei independente. Astfel,
deşi cercetătorul este interesat de simptomatica psihopatologică
consecutivă consumului de droguri, nu îi trece prin minte să
administreze aceste substanţe, nici chiar subiecţilor voluntari, pentru a
înregistra fenomenologia subiectivă. El însă îşi poate recruta subiecţii
dintre pacienţii clinicilor de dezintoxicare.
Un cvasiexperiment este şi acela când un cercetător nu poate
studia efectele schimbării programului de lucru asupra productivităţii
decât atunci când managerii se hotărăsc să procedeze la aceste
schimbări. În experimentele cu variabile invocate asignarea subiecţilor
188
la condiţiile întâmplătoare nu mai este întâmplătoare. Deja persoanele
sunt selecţionate în vârstnici şi tineri, femei şi bărbaţi, longilini şi
picnici, etc. Aceasta afectează validitatea experimentului.
Totuşi, este nevoie ca eşantionul să fie constituit aleatoriu
deoarece numai astfel suntem îndreptăţiţi să presupunem în ipoteza
nulă că rezultatele experimentului s-ar putea datora hazardului. Prin
infirmarea ipotezei de nul este justificat să inferăm că rezultatele
experimentului sunt efectul modificărilor variabilei independente.
Variabilele invocate, de tip subiect, nu sunt manipulate de
către experimentator. Modalităţile sale sunt deja distribuite în mod
natural (sexul, vârsta, trăsăturile de temperament, sănătatea-boala, etc)
sau în mod artificial (nivelele de instrucţie, dependenţa de droguri,
comportamentul suicidar, sau devianţa de la norme), iar cercetătorul
nu face altceva decât să ia act de prezenţa lor. De exemplu, categoriile
de persoane de sex masculin şi respectiv feminin preexistă unui
experiment care s-ar interesa de diferenţele dintre sexe la o cutare sau
cutare sarcină experimentală. La fel, un experiment care se interesează
de diferenţele de vârstă sau de statut profesional găseşte grupurile deja
existente. În aceste cazuri variabilele independente (adică diferenţele
între grupuri) sunt create fie de natură fie de condiţiile sociale sau de
instituţii iar experimentatorul nu face altceva decât să aleagă acele
valori care satisfac nevoile sale de experimentare.
În experimentul propriu zis cercetătorul manipulează
variabilele independente, pe când în cvasiexperiment acesta observă
categoriile de subiecţi preexistente acelei cercetări. Experimentele cu
grupuri naturale sunt cvasiexperimente deoarece sunt mai degrabă
cercetări corelaţionale care se interesează de legăturile statistice care
există între diferitele caracteristici psihocomportamentale şi diferite
tipuri de performanţă. Cazul extrem de cvasiexperiment îl reprezintă
cercetarea nonexperimentală unde cercetătorul nu are nici un control
asupra variabilei independente rolul său limitându-se la înregistrarea
efectelor asupra comportamentului.
Am mai menţionat că, in cazul cvasiexperimentelor, variabila
independentă se mai numeşte variabilă invocată. În identificarea
corectă a modalităţilor unei variabile invocate se întâmpină uneori
serioase dificultăţi. Astfel, modalităţile pe care le considerăm ca fiind
diferenţiatoare pentru anumite grupuri de indivizi, pot să nu fie
aspectele esenţiale care în mod real diferenţiază grupurile respective.
Aşa de pildă utilizând ca variabilă invocată nivelurile inteligenţei,
două grupuri de subiecţi, diferenţiate pe acest criteriu, pot să difere în
mod real şi esenţial în privinţa influenţelor culturale diferite la care ei
au fost supuşi de-a lungul vieţii. Aşa cum remarcă McBurney (op. cit),
189
în cazul variabilelor invocate, o serie de aspecte diferenţiatoare
preexistă şi înseamnă mult mai mult cu privire la ceea ce diferenţiază
două grupuri decât propriile noastre măsurători. Aceasta face să nu
ştim uneori cu precizie dacă modalităţile variabilei invocate sunt cele
care determină diferenţele comportamentale sau acestea din urmă sunt
efectul acelor aspecte care acţionează în surdină şi pe care cercetătorul
le-a trecut cu vederea.
Următorul exemplu ne va ajuta să înţelegem mai clar acest
fapt. Presupunem că suntem interesaţi de efectele pe care înaintarea în
vârstă le poate avea asupra nivelului de inteligenţă. Ipoteza va fi
verificată pe trei categorii de vârstă: adolescenţi, tineri, adulţi şi
bătrâni. Este totuşi posibil ca diferenţele privind nivelul de inteligenţă
să nu se datoreze deosebirilor de vărstă ci mai degrabă, aşa cum
observă critic Anastasi, (op.cit.) referindu-se la cercetările lui
Wechsler, accesului diferit al acestor persoane, care aparţin unor
generaţii diferite, la binefacerile mijlocelor de cultură şi de informare.
Mai trebuie menţionată o serioasă problemă legată de
experimentele cu grupuri naturale. Fiind cercetări de tip corelaţional
există tentaţia de a utiliza metoda corelaţiei în efectuarea de inferenţe
cauzale. Ori, aşa cum s-a arătat, o relaţie între două variabile poate fi
considerată cauzală numai dacă sunt satisfăcute simultan aceste trei
condiţii (Cook, Campbell, op.cit.):
190
de confundare Mc.Burney (op. cit) ce permit explicaţii alternative ale
efectelor studiate.
191
Reamintim ceea ce am menţionat, câteva pagini mai înainte,
că o relaţie cauzală poate fi inferată între două variabile numai dacă
acestea covariază, dacă variabila „cauza” precedă efectul şi dacă nu
poate fi invocată o explicaţie alternativă pentru datele obţinute, alta
decât aceea rezumată şi anticipată în ipoteza ştiinţifică.
192
aceasta sporind şansa unei validităţi interne acceptabile iar pe de altă
parte pentru că experimentatorul a avut un anumit control asupra
variabilelor independente. Deşi invocate, nivelele acestora au fost cu
bună ştiinţă „radicalizate” în sensul că subiecţii cu anxietate moderată
la test nu au fost incluşi în experiment. Acelaşi caracter disjunctiv l-au
avut cele două modalităţi ale situaţiei, în care a fost determinat ritmul
cardiac, cu excluderea unei situaţii moderat de anxiogene.
193
Nota la colocviu
SN
NIVEL SN NIVEL SN
4 PRETEST POSTEST
195
2
2
2
2 2
1 2 3
V O I A J U L
CAPITOLUL 8
196
EXPERIMENTE CU UN SINGUR SUBIECT
197
care înfăţişau obiecte comune. Proporţia imaginilor diferite şi a celor
similare cu ale profesorului au fost de 50%.
Rezultatele experimentului au produs rezultate în afara
oricăror dubii care nu au nevoie de a fi confirmate statistic: De fiecare
dată când copilul a văzut imagini diferite a fost tastată denumirea
obiectului văzut de facilitator. A fost clar că acesta nu doar ajuta la
exprimarea gândurilor copilului ci introducea pe canalul de
comunicare propriile sale conţinuturi mentale.
Cu toată utilitatea sa, acest design experimental, bazat pe un
control riguros al variabilelor, pare să fi căzut în desuetitudine.
În adevăr, tradiţia cercetărilor psihologice din ultima vreme
pune, aşa cum am văzut în capitolele precedente, un mare accent pe
statistici din ce în ce mai complexe. Uneori ele sunt utilizate într-un
mod oarecum gratuit pentru simplu fapt că cei care le întrebuinţează,
le stăpânesc foarte bine.
Totuşi, această extensie este rezultatul unei atitudini
fundamentale a cercetătorilor potrivit căreia un experiment este cu atât
mai valid cu cât implică mai mulţi subiecţi. Ori, aşa cum vom vedea
mai departe, statistica nu este decât un mijloc de a controla sursele de
variabilitate, altele decât cele introduse de cercetător prin manipularea
condiţiilor experimentale. Aşa cum am văzut, dincolo de un anumit
prag, creşterea eşantionului experimental aduce cu sine doar
nesemnificative creşteri ale preciziei datelor experimentale. Mai mult,
unii autori (Vadum şi Rankin, op.cit.) menţionează posibilitatea ca
unele procedee statistice să mascheze anumite aspecte interesante ale
fenomenelor studiate.
Până prin anii 30 ai secolului trecut, când metodele statistice
nu luaseră o asemenea amploare, marea majoritate a pionierilor
cercetării experimentale şi-a bazat studiile pe un număr redus de
subiecţi, unul cel mult doi. Aşa de pildă este cazul lui Fechner care a
dezvoltat tehnicile de determinare a pragurilor senzoriale şi a
descoperit legea intensităţii senzaţiei experimentând cu un singur
subiect.
În aceeaşi tradiţie mai trebuie menţionate cercetările lui
Ebbinghaus asupra memoriei care a experimentat pe sine însuşi, ale
lui Wilhelm Wundt, cercetările introspecţioniştilor, gestaltiştilor ş.a.
De asemenea, experimentele efectuate de Watson în domeniul
formării fobiei la copii, sau cele efectuate de Pavlov în domeniul
reflexelor condiţionate, s-au focalizat pe un singur subiect.
Aşa cum remarcă McBurney (op. cit.), cercetătorii raliaţi
acestei tradiţii plecau de la supoziţia că subiecţii, umani sau animale
sunt esenţialmente echivalenţi, fiind de ajuns să studiezi un individ
198
pentru a descifra o regularitate care este proprie speciei căreia acesta
îi aparţine.
De fapt cele două tradiţii se deosebesc după cum concep sursa
variabilităţii comportamentului subiectului sau a subiecţilor de
experiment.
Cercetătorii care operează cu un singur subiect cred că cea mai mare
parte a variabilităţii este determinată de situaţie şi în acest scop ei
încearcă să o controleze prin efectuarea unui număr cât mai mare de
observaţii, pe acelaşi individ şi prin repetarea de mai multe ori a
experimentului.
Dimpotrivă, ceilalţi, care aplică elaborate tehnici statistice
pentru prelucrarea datelor obţinute pe numeroşi subiecţi, consideră că
sursa variabilităţii este intrinsecă. De exemplu la oameni,
variabilitatea este proprie naturii umane şi se exprimă în diferenţe
interindividuale.
După pionieri ai psihologiei diferenţiale (Quetelet, Galton şi
mai apoi Pearson) variabilitatea interindividuală în jurul mediei este
expresia eşecului naturii de a realiza persoana medie ideală.
Problema cercetătorilor ar fi deci aceea de a face deosebirea
între variabilitatea creată prin manipulare experimentală şi aceea care
este naturală, acest control fiind posibil pe cale statistică.
Deşi dominantă în zilele noastre, tradiţia experimentelor care
utilizează numeroşi subiecţi, nu poate fi considerată singura cale justă,
chiar dacă, fără o aprofundare temeinică, am fi tentaţi, cum din păcate
se mai întâmplă, să apreciem seriozitatea şi validitatea unei cercetări,
nu intensiv ci extensiv, prin numărul de subiecţi antrenaţi în
experiment.
Skinner, în plină tradiţie de utilizare extensivă a statisticii în
psihologia experimentală, prefera să studieze un animal o mie de ore,
decât o mie de indivizi timp de o oră (Mc. Burney, op.cit.)
Trebuie totuşi menţionat că fiecare din cele două abordări are
propriile ei raţiuni. Astfel cercetarea bazată pe un singur subiect este
mai potrivită în domeniul psihofiziologiei şi în general al
caracteristicilor psihice mai intens legate de bagajul ereditar decât în
domeniul proceselor psihice de un mai înalt ordin, unde diversitatea
comportamentelor este expresia şi şansa evoluţiei mecanismelor
adaptative. Pe de altă parte, aşa cum remarcă Vadum şi Rankin
(op.cit.) experimentele cu un singur subiect sunt mai potrivite în
abordarea unor fenomene neobişnuite, rare sau în testarea diferitelor
forme de tratament.
Prin urmare, fenomenul care urmează a fi cercetat, ghidează el
însuşi opţiunea cercetătorului privind modelul experimental potrivit.
199
Dacă cercetăm, spre exemplu, pragul absolut al frecvenţei critice de
fuziune este suficient un număr redus de subiecţi umani, cu condiţia
ca ei să fie normali iar condiţiile experimentale să fie riguros
controlate. Rezultatele cercetării vor putea fi extinse (validitate
externă) şi asupra altor subiecţi aparţinând aceleiaşi populaţii (de
exemplu subiecţii cu vârsta cuprinsă între 45-50 de ani).
Dimpotrivă dacă ne propunem să studiem procesele de
formare a noţiunilor şi în general a gândirii categoriale la puberi va
trebui să studiem un lot reprezentativ de subiecţi din populaţia ţintă,
iar datele vor fi interpretate prin metode statistice cum sunt studiul
corelaţional, analiza factorială sau analiza de varianţă.
Ar mai trebui să adăugăm că cele două abordări nu sunt chiar
atât de diferite în substanţa lor. Ceea ce le unifică este ceea ce unifică
de fapt abordările ideografică şi nomotetică.
Allport (1992) propune, în abordarea personalităţii, un echilibru între
cele două direcţii dar observaţia este valabilă pretutindeni în
psihologie unde acestea sunt utilizate.
De fapt ambele abordări, deşi din perspective diferite, sunt
interesate de mărimea eşantionului: abordarea bazată pe un singur caz
urmăreşte, prin numeroasele observaţii, să obţină un eşantion cât mai
reprezentativ al comportamentului unicului subiect implicat în
experiment. Abordarea experimentală bazată pe numeroşi subiecţi
urmăreşte atenuarea surselor străine de variaţie prin realizarea unui
eşantion cât mai reprezentativ al unui ipotetic subiect mediu. Ambele
abordări fac apel la acest subiect, numai că pentru prima el este
întrupat chiar în individul studiat, în timp ce pentru a doua abordare el
este locul de intersecţie al tuturor măsurilor individuale.
200
variabilei independente. Acest fapt este posibil prin controlul riguros
al surselor de variaţie, reducând la minimum toate efectele străine care
bruiază relaţia dintre variabila independentă şi cea comportamentală.
„Costurile realizării unor standarde înalte de validitate internă sunt
mai reduse decât în cazul experimentelor cu mai mulţi subiecţi.
Concret, acest fapt este posibil, pe de o parte prin controlul riguros al
condiţiilor experimentale şi prin creşterea numărului de observaţii sau
prin repetarea de mai multe ori a experimentului.
Faptul că nu numărul subiecţilor hotărăşte validitatea unui
experiment îl dovedeşte următorul exemplu pe care îl redăm după
McBurney (op. cit.): Doi cercetători care abordează acelaşi fenomen,
prin aceleaşi două variabile, obţin următoarele rezultate: primul
lucrând cu 10 subiecţi găseşte o corelaţie de .765 la un P=.01; Al
doilea testând 50 de subiecţi obţine un coeficient de corelaţie de .361
la P=.01.
Datele care merită mai multă încredere sunt cele obţinute de
primul cercetător deoarece efectele variabilei independente sunt mai
mari, acest fapt fiind exprimat de coeficientul de corelaţie, mai mare
de mai bine de două ori, decât al doilea. Un alt argument în sprijinul
acestei opţiuni este că pătratele coeficienţilor de corelaţie, care
exprimă în procente cât anume din varianţa rezultatelor experimentale
(modificările variabilei dependente) este explicabilă prin manipularea
variabilei independente, sunt semnificativ inegale, adică 58.5 pentru
primul cercetător şi 13 pentru al doilea.
3. Evitarea dificultăţilor etice şi practice. Cercetarea pe un
singur subiect nu ridică probleme ca acelea implicate de
experimentele cu grupuri independente unde subiecţii din grupul de
control nu primesc un tratament care le-ar fi benefic cum ar fi acela de
atenuare a tendinţelor suicidare.
4. Flexibilitatea planului. Experimentatorul are posibilitatea să
modifice instrucţiunile sau întărirea atunci când constată că acestea nu
provoacă reacţiile comportamentale aşteptate. Acest lucru nu este
posibil în experimentele pe mai mulţi subiecţi pentru că, efectuând
aceste schimbări în cazul unuia dintre ei, rezultatele nu ar mai fi
comparabile.
201
Pentru înţelegerea acestui model experimental apelăm la indici :
A1B1A2B2 unde A1 semnifică faza de început prin care se obţine
aşazisa line de bază (base line) a răspunsurilor subiecului în condiţiile
în care acesta nu primeşte stimulul, iar B1 desemnează faza de aplicare
a tratamentului experimental. Repetarea fazei A, (A1), semnifică
întreruperea tratamentului, pentru a se controla dacă răspunsurile date
în faza B se datorează în adevăr tratamentului. Reluarea Fazei B ,(B1),
în ultima etapă ar trebui să conducă la aceleaşi rezultate ca în B1.
În designurile cu un singur subiect sunt utilizate următoarele
strategii de control :
202
sau măcar într-un nivel constant, atunci putem conchide că
ameliorarea subiectului se datorează condiţiei experimentale parcurse.
203
În prima parte a experimentului, conform instructajului,
părinţii au ignorat scărpinatul copilului. Faza aceasta nu a putut dura
mai mult de trei zile deoarece problema copilului trebuia rezolvată
urgent. În a doua fază, a atenţiei sociale, părinţii îi tot repetau
copilului să termine cu scărpinatul. În etapa finală părinţii au ignorat
din nou gesturile copilului. Autorii au sintetizat rezultatele în două
grafice. În primul grafic cele două curbe ale atenţiei sociale şi ale
frecvenţei scărpinatului coincid foarte mult, aceasta fiind o confirmare
a ipotezei că scărpinatul era declanşat de atenţia pe care părinţii o
dădeau acestui comportament. Etapele de ignorare (deci de întrerupere
a tratamentului experimental) au înregistrastrat scăderi dramatice ale
scărpinatului şi au contribuit la creşterea nivelului de certitudine a
acestei tendinţe. Într-un al doilea grafic autorii au prezentat pe abscisă
perioadele calendaristice ale experimentului care a durat din iunie
1976 până în iunie 1978. Pe ordonată au prezentat numărul de
zgârieturi ca un indicator al frecvenţei comportamentului incriminat.
Frecvenţa luată ca nivel de referinţă
Frecvenţa comportamentului
tratamentului
tratamentului
Frecvenţa la
reluarea
Etapa
Stin-
gere
de
Etapele experimentului
205
I+II+III ş.a.m.d. În acest caz manipularea experimentală constă în
acordarea întăririi pentru fiecare dintre secvenţele menţionate. În acest
mod putem controla dacă fiecare progres în învăţare este un rezultat al
întăririi.
CAPITOLUL 9
206
9.1 Tratarea subiecţilor umani
207
Psihologul desfăşoară experimentul cu respect faţă de
subiecţi, preocupat fiind de demnitatea şi starea lor de bine.
Cercetătorul are obligaţia de a aprecia dacă investigaţia sa
este acceptabilă d.p.d.v. etic, şi de a se îngriji să fie respectate
drepturile subiecţilor umani participanţi la experiment.
Responsabilitatea privind tratamentul etic al participanţilor la
experiment este individuală. Cu toate acestea multe instituţii
au comitete care supervizeză activitatea de cercetare.
Studenţii au voie să întreprindă cercetări doar sub egida
facultăţii care este subiect de sancţiuni profesionale.
208
o Indicaţia de a păstra copia consimţământului.
209
9.1.4 Confidenţialitatea
210
Ideea de libertate faţă de coerciţie este strâns legată de aceea
a dreptului la intimitate ca unul dintre drepturile fundamentale ale
omului. Această idee a câştigat tot mai mult teren în ultimul secol.
Preocupat să respecte dreptul la intimitate al subiecţilor săi,
cercetătorul se confruntă cu imperativul de a acorda cel puţin tot atâta
importanţă intereselor societăţii care pot evolua într-un sens opus,
acela de a acumula în scop de autoreglare cunoştinţe care pot fi
obţinute tocmai prin violarea intimităţii indivizilor săi.
Claritatea înţelegerii între cercetător şi participanţii la
experimentul său este esenţială şi constituie pentru el o preocupare
constantă. Acesta trebuie să respecte toate obligaţiile asumate
prevăzute în contract.
Cercetătorul trebuie să ia toate măsurile pentru a împiedica
prejudicierea fizică sau mentală a persoanelor care participă la
experiment. El trebuie să îi informeze dacă există riscul vreunui
prejudiciu şi să obţină consensul înainte de a începe experimentul.
Dacă experimentul implică riscuri majore acesta va fi evitat. Totuşi,
majoritatea situaţiilor experimentale implică un anumit stress datorită
caracterului lor de noutate pentru subiect. Cercetătorul are obligaţia de
a lua toate măsurile pentru diminuarea acestuia.
Debriefing-ul reprezintă deconspirarea de către
experimentator a scopului adevărat al experimentului în vederea
creşterii gradului de informare al subiecţilor si al împiedicării
producerii oicărui prejudiciu, ca urmare a mascării scopului adevărat
al cercetării. Debriefing-ul este folosit de către cercetător pentru a
evalua gradul de mascare a sensului rezultatelor experimentale. Unii
subiecţi pot accepta cu greu că au fost înşelaţi şi ca urmare pot adopta
rolul de “subiecti buni”.
Pe de alta parte ei pot conştientiza într-un grad diferit
mascarea intenţiilor cercetării datorită modului în care sunt
chestionaţi. Mult mai multe şanse sunt ca subiectul să conştientizeze
mai bine mascarea scopului cercetării dacă nu este întrebat direct dacă
are ceva de întrebat ci dacă este invitat să evoce ce anume i s-a părut
fals în explicaţiile preliminare date de experimentator cu privire la
adevăratul scop al experimentului.
La finalul experimentului discuţia finală cu subiectul ţinteşte
următoarele scopuri:
Obţinerea unor informaţii preţioase despre modul în care a intuit
scopul experimentului pentru a evalua corect influenţele efectelor
exercitate de caracteristicile solicitate :
211
1. Atenţionarea subiectului să nu divulge celorlalţi participanţi
informaţii legate de sarcina experimentală (de exemplu, într-
un experiment mnezic, ce cuvinte a trebuit să memoreze?).
2. Corectarea unor informaţii date în mod eronat pentru a masca
scopul adevărat al cercetării sau destinaţia anumitor teste.
3. Creşterea beneficiului pe care un subiect îl poate avea în
calitatea sa de participant la cercetare. Cercetătorul îi poate
transmite o serie de cunoştinţe care au rezultat din cercetare
care să îmbunătăţească nivelul de înţelegere al problematicii
abordate în experiment.
212
În 1985 a fost elaborat “Actul privind protecţia animalelor”
document cu putere de lege care reglementează experimentele pe
animale. El însărcinează o serie de organisme guvernamentale să
avizeze şi să controleze cercetările pe animale.
Iată câteva din reglementările conţinute în aceată reglementare, pe
care le reproducem după Vadum şi Rankin (op.cit., p. 177).
213
BIBLIOGRAFIE SELECTIVĂ
214
Aniţei, M., (200) Introducere în psihologia experimentală,
Bucureşti.
Barlow, D.,H., & Hersen, M. (1984) Single case experimental
designs: Strategies for studying behavior change, NewYork,
Pergamon Press.
Dragu, A., (2003) Psihologia activităţii sportive, E.D.P., Bucureşti.
Ceauşu, V. şi col. (1965) Microcurba de lucru şi valoarea sa ca
mijloc de determinare a capacităţii de adaptare şi a fatigabilităţii.
Revista de psihologie, tom11, nr.2.
Cohen, J., (1988), Statistical power analysis for the behavioral
sciencies, Hilsdale.
Cohen, J., (1995) The earth around (p<.05). American
psychologist, 49, p. 997-1003.
Cook, T., D., & Campbell, D. T., (1979), Quasi experimentation:
Plan & analysis issues for field settings. Chicago: Rand McNally.
Cook Th. D., Campbell, D.T., (1976), The Design and Conduct of
Quasi-Experriments in Field Settings, Dunnette M.,(Editor)
Handbook of Industrial Psychology, RandMcNally College Publishing
Comp., Chicago, pp.223-326.
Evans, R., & Donnerstein, E., (1974) Some implications for
psychological research of early versus late term participation by
college students; Journal of research in personality, 8, 102-109.
Floru R., (1967) Psihofiziologia atenţiei, Ed. Ştiinţifică, Bucureşti.
Fraisse, P., (1970) Psihologia experimentală, Ed. Ştiinţifică,
Bucureşti.
Garcia, J., & Koelling, R.A (1966) The relatio of que to conseqence
in avoidance learning. Psychonomic Sciencie, 4,124-124.
Golu, M., (1975), Principii de psihologie cibernetică, Editura Şt. şi
Encicl., Bucureşti.
Hass, R. G., Katz, I., Rizzo, N., Bailey, J., & Eisenstadt, D.
(1991) Cross racial appraisal as related to attitude ambivalence and
cognitive complexity. Personality and Social Psychology Bulletin, 17,
83-9.
Hornstein, G., 1992 The Return of the Repressed; Psychology’s
Problematic Relations With Psychoanalysys, 1909/1960, American
Psychologist, vol, 47, No 2, 254-261.
Matarazzo, J., (1992) Psychological Testing and Assessment in the
21st Century, American Psyhcologist, No, 8, 1007-1018.
Mitrofan, N., (2001) Psihometria şi direcţiile ei de dezvoltare la
început de mileniu, Zlate, M., (coord.) Psihologia la răspântia
mileniilor, Ed. Polirom.
215
Mc Burney, D., H., (1983), Experimental Psychology, Wadsworth
Publishing Company Belmont, California.
Piaget, J., (1972) Dimensiuni interdisciplinare ale psihologiei, Ed.
Şt., Bucureşti.
Popper, K., R., (1959) The logic of scientific discovery, Basic
Books, New York.
Radu, I., (1993) Metodologie psihologică şi analiza datelor, Ed.
Sincron, Cluj.
Roşca, Al., (1963) Tratat de psihologie experimentală, Ed.
Academiei, Bucureşti, 1963.
Roşca Al., (1971) Metodologie şi tehnici experimentale în
psihologie, Ed. ştiinţifică, Bucureşti.
Shaughnessey, J.,J., Zechmeister, E.,B., Zechmeister, J., S., (2000)
Research Methods în Psychology, Fifth ed., McGraw Hill, Boston.
Sintion, F., Sintion, J., (1987) Sindromul nevrotic al curselor lungi,
Revista de psihologie, t.33, nr.4, p. 311 – 326, Bucureşti.
Tyler, L.,E., Bruce Walsh, (1979) Test and Mesurement 3rd edition,
Prentice-Hall., Enghewood Clifs, New Jersey.
Vadum, A., C., & Rankin, N., O., (1998) Psychological Research,
McGraw-Hill, Boston.
Woodworth, R. S., (1967) Experimental Psychology, London,
1967.
Zlate, M., (1994) Introducere în psihologie, Ed. ''Şansa'',
Bucureşti.
216