Documente Academic
Documente Profesional
Documente Cultură
METODE DE
CERCETARE CANTITATIVĂ
1
CAPITOLUL 1
2
observaţii, care nu sunt atent verificate, ele pot duce la concluzii greşite. Astfel, geniile nu ar
avea aptitudini sociale şi pentru sport şi s-ar trece mai repede („ce se coace repede, se trece
repede”), oamenii „însemnaţi” (cu stigmate) ar trebui evitaţi, iar persoanele cu buze subţiri ar
fi rele la suflet etc.
Metoda ştiinţifică afirmă că evenimentele se desfăşoară după principii precise şi
utilizează observaţii obiective şi sistematice pentru a determina care sunt acele principii. Aşa
cum afirmă Richelle, ştiinţa nu este decât un discurs, o altă modalitate de a folosi limba, care
rafinează şi specializează atât de mult limbajul curent, încât, prin conceptele lor, ea ajunge la
descrieri şi explicaţii foarte depărtate, sau chiar în opoziţie cu simţul comun.
Prezentăm mai jos caracteristicile de bază ale metodei ştiinţifice, aşa cum sunt ele
indicate de Smith (1998, p. 32):
Ştiinţa este sistematică, formală şi obiectivă, de aceea ea pleacă foarte rar de la
observaţii cazuale. Ea urmăreşte un set de reguli prin care menţine un mare grad de
formalitate ştiinţifică şi cere ca omul de ştiinţă să fie cât de obiectiv este posibil, atât în
proiectarea cercetării, cât şi în interpretarea rezultatelor acesteia.
Ştiinţa aspiră la simplicitate şi ordine, deoarece ea pleacă de la ordinea implicită
existentă în univers: aşa cum fizicienii ştiu că mişcarea planetelor sau a electronilor pe
orbite are regularitate, ştiinţele comportamentului aşteaptă să regăsească ordinea care
îl guvernează.
Ştiinţa este precisă pentru că ea măsoară şi cuantifică cu atenţie observaţiile. Aceasta
presupune efort şi timp cheltuite, dar plusul de precizie face una din diferenţele majore
faţă de discursul profan.
Cunoaşterea ştiinţifică este reproductibilă: urmând aceleaşi procedee sau metode,
cercetători diferiţi trebuie să ajungă la aceleaşi rezultate. Replicarea (repetiţia unei
cercetări) este o modalitate de a-i verifica rezultatele, ceea ce îi dă o mare acurateţe şi
sens.
Ştiinţa procură o cunoaştere cumulativă: publicându-şi rezultatele în cărţi şi jurnale, ea
dă ocazia apariţiei a noi ipoteze şi idei, ce se construiesc pe o fundaţie preexistentă.
Pentru Karl Popper, filozof al ştiinţei, această sporire a cunoştinţelor în cadrul speciei
umane se face după modelul evoluţiei darwiniste a speciilor: vor supravieţui acele
ipoteze şi teorii care sunt selectate pentru că rezistă mai bine la tendinţele de
respingere. Dincolo de universul fizic (Lumea 1) există universul experienţei
subiective (Lumea 2) şi universul creaţiei umane (Lumea 3). Pentru Popper
3
falsificabilitatea (falsiability) este chiar linia de demarcaţie între discursul ştiinţific şi
cel profan, o ipoteză fiind ştiinţifică atunci când poate fi verificată prin observare sau
experimentată în laborator.
Să mai adăugăm o trăsătură a discursului ştiinţific: el se sprijină pe fapte şi se supune
unei permanente puneri în problemă prin intermediul lor.
Între discursul profan şi cel ştiinţific există, după Richelle o zonă intermediară, cea a
discursului savant, care se bazează tot pe limbaje specializate (juridic, al esteticii, filozofic).
Diferenţa dintre discursul savant şi discursul ştiinţific este aceea că ultimul încearcă
întotdeauna să-şi autoverifice validitatea prin confruntarea empirică cu realitatea. Există însă
două tipuri de discurs ştiinţific, logica şi matematica, care fac excepţie de la regula anterioară.
Plecând de la axiome, matematica derivă propoziţii tot mai complexe, respectând cu rigoare
regulile raţionamentului şi exigenţele demonstraţiei. Validarea ei, ca şi în cazul logicii, nu este
una empirică, ci una internă. De ce se potrivesc aşa de bine „hainele” logico-matematice peste
universul fizic şi ce statut au obiectele ideale create de ele (există sau nu cu adevărat entităţile
ideale?), sunt probleme care ţin de filozofia ştiinţei.
Cercetarea ştiinţifică poate fi fundamentală (de bază), adică atacă o problemă de
ordin foarte general (sau care nu are consecinţe, finalităţi practice immediate), şi aplicată,
desemnată din start să soluţioneze probleme practice, cum ar fi, pentru psihologi, problema
suicidului, a obezităţii, a drogurilor, a fumatului sau a alcoolismului. Chiar dacă beneficiile
cercetării fundamentale nu sunt imediat vizibile, pe termen lung ea duce cel mai adesea la
importante aplicaţii practice. Cercetări ale modului cum gândesc oamenii au fost foarte utile
pentru inteligenţa artificială (sistemul expert sau reţelele neuronale). În plus, încercând să
determine cauzalitatea, scopurile majore ale psihologiei ştiinţifice sunt să descrie, să prezică
şi să controleze comportamentul, aplicând ceea ce s-a învăţat teoretic la situaţii reale de viaţă
(aceasta dintr-o perspectivă mai degrabă behavioristă).
Descrierea trebuie să includă nu numai comportamente obiectiv observabile, adică ce
auzim şi ce vedem, făcând presupuneri asupra mecanismelor interne sau asupra proceselor
subiacente numai în măsura în care le putem articula într-un discurs teoretic elaborat.
Predicţia: dacă descrierea are în vedere comportamentul deja produs, predicţia are în
vedere comportamentul înainte de a apărea, ea statuând o anumită expectanţă faţă de acesta.
Predicţii facem şi în viaţa cotidiană, însă în ştiinţă aceasta îmbracă forma unei ipoteze, care
este o propoziţie specifică şi clară ce poate fi testată dacă este adevărată sau falsă.
4
Controlul unui comportament este posibil când ştim ce determină acel comportament
şi se leagă strâns de capacitatea înţelegerii lui. Întărirea comportamentului la B.F. Skinner este
un exemplu în acest sens.
Aplicaţia are scopul de a utiliza cunoaşterea şi tehnicile derivate în rezolvarea unor
scopuri practice: programele pe computer pentru învăţarea matematicii, testele de aptitudini şi
de inteligenţă arată beneficiile concrete ale cunoaşterii psihologice în viaţa obişnuită.
Înţelegerea înseamnă că am dobândit cunoaşterea reală a cauzelor unui
comportament. Deşi în psihologie înţelegerea cauzelor ca în fizică sau medicină este rară,
munca ştiinţifică aduce totuşi mereu un plus de înţelegere asupra faptelor studiate. Înţelegerea
face posibilă explicaţia faptelor care circumscriu domeniul unei ştiinţe, triada descriere –
explicaţie - predicţie, reţinând, după Valeriu Ceauşu, cele mai însemnate caracteristici ale
metodei ştiinţifice.
5
Cercetarea este un proces de investigare şi de căutare pe care ştiinţa îl utilizează cu
grijă, pentru a ajunge la o mai bună înţelegere a fenomenului. Observaţiile care conduc la
cercetare au o mare varietate de forme ce depind de scopul cercetării. Un studiu ştiinţific, de
exemplu, colectează informaţii de la un set de subiecţi, făcând o analiză atentă a informaţiilor,
pentru a ajunge la un set de concluzii întemeiate. De multe ori cercetătorii îşi reiau studiile
pentru a verifica dacă, în final, ajung la aceleaşi concluzii. Odată dezvoltată o teorie bună,
care se referă la fenomene importante, aceasta conduce la o considerabilă cantitate de muncă
de cercetare. Fiecare domeniu are asemenea teorii puternice: Skinner în învăţare, Freud în
psihologia clinică, Piaget în psihologia dezvoltării, toate punând în mişcare multe cercetări
evaluative.Rezultatele acestor cercetări relative la o anumită teorie, duc la modificări ale
acesteia, modificări care generează alte şi alte cercetări. Se creează astfel un mecanism
circular prin care cunoaşterea ştiinţifică se îmbogăţeşte ca volum şi acurateţe. Chiar şi teoriile
nepotrivite pot fi valoroase dacă conduc la cercetări atente, căci prin acestea se elimină parte
din explicaţiile posibile, stimulând noi cercetări şi, în consecinţă, teorii mai bune. Astfel,
teoria frenologică a “boselor”, ce permitea localizarea “facultăţilor mintale”, a dus la apariţia
teoriei localizării funcţiilor cerebrale, cu o primă mare confirmare prin descoperirea de către
Broca a centrului vorbirii, pentru ca aceasta să genereze teoria localizării largi sau teoriile
echipotenţiale privind cortexul cerebral, care au lărgit considerabil înţelegerea mecanismelor
de funcţionare a creierului. În acelaşi fel, teoria bioritmurilor, ce sugerează regularităţi
rezultate din ritmurile biologice (fizic, emoţional şi intelectual) s-a dovedit a fi greşită, căci ea
nu se punea în relaţie nici cu performanţele ridicare, nici cu eşecurile în anumite activităţi,
ceea ce nu a împiedicat totuşi industria electronică să vândă o mare cantitate de programe şi
soft legate de bioritmuri. Generare de
ipoteze
Construcţia Testarea ei în
teoriei şi laborator
modificarea ei
6
1.3. Metode descriptive şi corelaţionale
Demersurile care sunt descriptive sau corelaţionale pot fi considerate amândouă ca
nonexperimentale (o metodă este nonexperimentală când comportamentul este observat şi
măsurat fără a fi controlat sau manipulat). Asemenea metode sunt adesea folosite pentru a
îndeplini scopurile descripţiei şi predicţiei, căci ne permit să examinăm cu atenţie şi să
descriem cu precizie o multitudine de comportamente. De aceea ele ne procură o bază pentru
a face predicţii cu privire la relaţiile cauză-efect. Cele mai obişnuit folosite ca metode
nonexperimentale sunt studiile de caz, studiul şi observaţia naturalistă.
Studiul (survey) este un procedeu de a evalua sau prezice vederile, reacţiile ori
părerile unui număr mare de oameni în legătură cu o problemă limitată. Cercetătorul creează o
listă de întrebări şi o prezintă într-o formă standardizată fiecărui participant, în mod tipic
folosind atât ancheta, cât şi chestionarul. Investigând un număr mare de persoane dintr-o
populaţie foarte largă, scopul este de a generaliza prin extrapolarea rezultatelor la întreaga
populaţie. Expectaţiile de vot din anchetele sociologice, părerea despre abandonarea pedepsei
cu moartea sau legalizarea avorturilor sunt câteva exemple de utilizare a metodei. Această
metodă, atunci când este elaborată şi condusă cu grijă, ne poate oferi o importantă cantitate de
informaţii despre vederile, atitudinile, opiniile, preferinţele unui număr mare de oameni, ceea
ce îi ajută pe psihologi să construiască ipoteze, pe politicieni să-şi dezvolte campaniile
electorale şi pe comercianţi să-şi lanseze anumite produse. Dar dacă eşantionul ales nu este
reprezentativ, sau dacă cei chestionaţi dau mai degrabă răspunsurile aşteptate decât cele reale,
riscul de eroare devine foarte mare. O altă limitare a metodei provine din faptul că ea este
indicativă pentru opinia publică într-un anumit moment, după care anumite evenimente o pot
7
modifica radical. Un sondaj telefonic de opinie ca cel făcut în 1936 în America (după 1990 şi
în România), a indicat succesul unui candidat la preşedenţie, care nu a fost cel real (F.D.
Roosevelt) din simplul motiv că cei care aveau telefon tindeau să fie mai curând republicani
decât democraţi.
8
variabile şi ele pot fi elemente prin care diferă subiecţii (sex, vârstă, nivel cultural, etnie,
etc.), iar măsurile ce vor fi culese sunt diferite valori cum ar fi presiunea arterială, pulsul, etc.
Variabilele pe care la poate lua în consideraţie, schimba sau manipula cercetătorul se
cheamă variabile independente, iar cele măsurate pentru a vedea cum se schimbă prin
manipularea experimentală, se cheamă variabile dependente (se numesc aşa pentru că depind
de nivelul schimbării variabilelor independente). Un al treilea tip de variabile sunt cele
explicative, cum ar fi anxietatea, depresia, gândirea, motivaţia, ca elemente interne de legătură
între celelalte două tipuri. Metoda experimentală, ce va fi detaliată ulterior, include un grup
experimental (pe care se desfăşoară întreaga procedură) şi un grup de control, sau grup
martor. Ambele grupuri sunt măsurate iniţial şi după experiment, pentru a face comparaţii
statistice.Experimentul ridică şi probleme de eşantionare (eşantion reprezentativ sau aleator,
simplu sau stratificat) care constituie capitole importante ale cercetării şi statisticii, probleme
pe care le vom detalia la vremea potrivită.
Cvasi-experimentul este acela în care psihologul studiază variabile independente pe
care el nu le poate controla sau manipula. Asemenea variabile independente se numesc
variabile naturale, căci se bazează pe condiţii preexistente: putem studia diferenţele masculin-
feminin, dar nu noi manipulăm apartenenţa la gen. Putem studia efectul experienţei şi
antrenamentul asupra nivelului de anxietate la un grup de paraşutişti,dar opţiunea lor pentru
acest sport le aparţine în întregime. Deşi nu putem găsi în acest tip de studii o puternică relaţie
cauză-efect (ca atunci când avem variabile independete), putem totuşi avea un nivel de
încredere ridicat în rezultatele noastre şi în cazul cvasiexperimentului.
CONCLUZII ŞTIINŢIFICE
RELAŢII CAUZĂ-EFECT
Manipulăm sistematic variabilele independente
şi măsurăm efectul asupra variabilelor dependente
CORELAŢIE
Observăm gradul de relaţie
dintre variabile
DESCRIERE
Descriem mai ales
ceea ce vedem
9
1.5. Conducerea unei cercetări ştiinţifice
Ştiinţa începe de obicei cu descrierea, după care încearcă să stabilească nivelul relaţiei
dintre variabile (corelaţia), pentru ca în final să conducă adevărate experimente, pentru a
ajunge la o înţelegere de tip cauză-efect, ideal ultim al ştiinţei (vezi figura 2).Fiecare studiu
ştiinţific implică un număr de etape sau paşi, începând cu o cunoaştere iniţială a problemei aşa
cum se află ea în câmpul ştiinţific şi terminând cu publicarea unui articol într-o revistă de
specialitate (vezi diagrama de la figura 3).
10
inteligenţei”, apoi pe Spearman, Thurstone, Vernon, Burt, Guilford, Cattell şi alţii. Fiecărui
individ (uman sau animal) îi este specific un grup de însuşiri caracteristice, combinate într-o
“ecuaţie personală”, variabilitatea fiind specifică naturii vii şi nevii. Variabilitatea se extinde
de la om la grupurile şi macrogrupurile sociale (familial, cultural, etnic, religios). Expresia
statistica a variabilităţii este variaţa sau dispersia, care arată împrăştierea valorilor observate
în jurul unor valori centrale. Având o mulţime de elemente diferenţiatoare, generate fie de
ereditate, fie de mediu sau de educaţie, fiinţa umană devine abordabilă cu instrumentele
matematice, pentru că variabilitatea face posibilă cuantificarea, măsurarea.
Dacă în prima jumătate a secolului diversitatea a fost rareori luată în considerare, ea a
crescut progresiv ca importanţă, psihologii încercând să studieze diversitatea în sine:
diferenţele de vârstă, de sex, de cultură, de nivel socio-economic, de apartenenţă la o etnie,
religie, rasă se combină într-o manieră infinită, cercetarea ştiinţifică trebuind să ţină seama de
aceste diferenţe, creând pe cât se poate loturi omogene în toate privinţele, mai puţin cea
investigată. Astfel, bărbaţii se pare că sunt mai predispuşi la violenţă, la alcoolism, în timp ce
femeile tind mai frecvent spre depresii. Diferenţele de gen sunt şi în aptitudinea pentru
matematică (mai tipic masculină) faţă de aptitudinile verbale (mai tipic feminine), dar nu se
poate stabili cu exactitate dacă aceste diferenţe au o fundamentare biologică sau una socială.
Etnicitatea marchează arii ca religia, interesele şi valorile unei persoane, o cultură
influenţează mai strâns contextul social în care o persoană creşte (etica muncii, valori
religioase, atitudini faţă de sănătate, învăţătură sau artă). Părinţii asiatici, de exemplu, dau
o mai mare importanţă educaţiei şcolare decât negrii sau hispanicii americani. Diferenţe
sistematice între grupuri rasiale, etnice şi culturale apar în ce priveşte agresivitatea,
standardele morale, atitudinea copiilor faţă de familie sau faţă de bătrâni, nivelul educaţional,
venitul, pattern-urile de limbaj, ceea ce face ca generalizările reieşite din studii să fie adesea
riscante.
Vârsta este unul din cei mai diferenţiatori factori, majoritatea testelor de inteligenţă
dând standarde separate pe ani, junătăţi de an (bateria WISC chiar din 4 în 4 luni), în timp ce
la vârstele mai înaintate discriminarea vizuală, auditivă, viteza de reacţie şi empanul memoriei
de scurtă durată descresc.
Nivelul socioeconomic are un impact substanţial, căci afectează o gamă largă de
variabile. Veniturile mai mari sunt asociate cu o nutriţie mai bogată, oportunităţi educaţionale
mai mari, nivel mai mare al inteligenţei, o mai mare motivaţie de a munci, de a se autorealiza.
Cercetările care studiază diferenţele dintre grupuri, culturi, etnii, dau o bază de informaţie
mult mai solidă, ajutându-ne să prezicem mai bine comportamentele. Şi poate că aceasta va
11
contribui în noul mileniu la mai buna înţelegere dintre grupuri, la reducerea discriminării, la
optimizarea potenţialului fiecărei persoane, indiferent de grupul de apartenenţă. Pentru
psihologie, această diversitate care rezultă din enorma variabilitate umană a fost unul dintre
motivele cristalizării ei mai lente ca ştiinţă, dar şi a apariţiei de ramuri specifice cum ar fi
psihologia diferenţială, psihologia copilului şi a vârstelor, psihologia dezvoltării sau
psihologia transculturală.
Autoevaluare
1. Analizaţi contribuţia psihologiei simţului comun la dezvoltarea psihologiei ştiinţifice.
2. Analizaţi similitudinile şi diferenţele dintre limbajul profan şi cel savant sau ştiinţific.
3 Definiţi caracteristicile cunoaşterii ştiinţifice şi modul cum răspunde psihologia acestor
deziderate.
4 Evaluaţi scopurile cercetării şiinţifice în psihologie şi pedagogie.
5 Cercetarea şi teoria şiinţifică au un raport de circularitate. Analizaţi evoluţia stadiilor
acestor raporturi.
6 Evaluaţi rolul metodelor descriptive şi corelaţionale în psihologie, exemplificând cu
indicarea avantajelor şi dezavantajelor fiecărei metode.
7 Indicaţi rolul, importanţa şi specificul metodei experimentale în psihologie.
8 Detaliaţi într-un mic eseu etapele unei cercetări ştiinţifice în psihopedagogie, de la
cunoaşterea prealabilă la articolul ştiinţific final, urmărind diagrama din curs.
Bibliografie
1. Doron, R., Parot, F., Dicţionar de psihologie, Ed. Humanitas, Bucureşti, 1999.
2. Dworetzky, J.P., Davis, N.J., Human Development. A Lifespan Approach, West Publishing
Company, St. Paul, New York, Los Angeles, San Francisco, 1989.
3. Richelle, M., Parot, F., Introducere în psihologie. Istoric şi metode, Ed. Humanitas,
Bucureşti, 1995.
4. Pitariu, H.D., Managementul resurselor umane. Măsurarea performanţelor profesionale,
Ed. All, Bucureşti, 1994.
5. Radu, I., Metodologie psihologică şi analiza datelor, Ed. Sincron, Cluj, 1993.
6. Smith, B.D., Psyhology. Science and Undestanding, International Edition, Mc Graw Hill,
1998.
12
CAPITOLUL 2
IPOTEZELE DE CERCETARE
VALIDITATEA UNEI CERCETĂRI EXPERIMENTALE
1
M. Richelle, în Doron, R., Parot, F. (1999). Dicţionar de psihologie. Bucureşti: Editura Humanitas, p. 426 şi
urm.
2
Reber, A.S. (1985). The Penguin Dictionary of Psychology. London: Penguin Books, p. 336.
3
Piéron, H. (2001). Vocabularul Psihologiei. Bucureşti: Univers Enciclopedic, p. 182.
13
2.1.2. Geneză: cum se naşte o ipoteză de cercetare?
Houser4 identifică trei surse ale ipotezelor: experienţa personală, cercetările anterioare
şi teoria ştiinţifică. În prima accepţiune Piaget a dezvoltat un punct de vedere revendicat şi
dezvoltat ulterior de psihologia cognitivă: orice rezolvare de probleme pleacă de la tatonări
anticipative ale soluţiilor prin emiterea de ipoteze de rezolvare, în ceea ce se va numi „spaţiul
problemei” sau „câmpul problemei”. Pe de altă parte, personologul Kelly (1995) sugera că
fiecare persoană este un om de ştiinţă, în măsura în care fiecare ne angajăm cu regularitate în
a formula şi testa ipoteze, rezultatele acestor condensări „ştiinţifice” spontane şi empirice
fiind chiar constructele personale. În aceeaşi problemă Zlate5 distinge între două tipuri de
ipoteze: cele integrate teoriei şi cele încorporate cercetării ştiinţifice. Dacă într-o teorie
ipoteza postulează existenţa unor entităţi sau a unor relaţii între entităţi sau fapte, într-o
cercetare ipoteza este mult mai concret şi clar specificată. „Ipoteza, în cadrul teoriei, este
totdeauna speculativă, conjuncturală şi provizorie”, afirmă autorul, care identifică drept
ipoteze toate enunţurile, axiomele, postulatele, legile sau teoremele acesteia.
Asimilând cercetarea ştiinţifică verificării de relaţii dintre variabile, Rateau6 vede
sensul acestei experienţe doar în raport cu o problemă bine definită şi de interes pentru
comunitatea ştiinţifică. Aceasta înseamnă că orice cercetare are nevoie de un cadru de
referinţă teoretic, cercetătorul trebuind „să se intereseze în permanenţă asupra teoriilor
existente, a evoluţiei şi a contradicţiilor lor.” Această interacţiune permanentă dintre planul
experienţei şi al teoriei ar permite rafinarea simultană a ambelor planuri.
Pentru a sublinia legătura specială pe care o operează ipotezele între planurile
empirice şi cele teoretice, Charboneau (1988)7 subliniază caracterul progresiv şi procesual al
elaborării ipotezelor, deoarece punctul de plecare este integrarea informaţiilor deja
disponibile, apoi conceptualizarea şi operaţionalizarea acestora sub formă de ipoteze.
În prima etapă se emit ipoteze generale, care sunt de fapt reflecţiile cercetătorului
rezultate din lecturile sale, ghidate de cunoştinţele generale şi modelele (paradigmele)
pe care el le are.
Deoarece ipotezele generale nu sunt direct verificabile, el trebuie să le
operaţionalizeze pentru a deveni ipoteze de cercetare, ceea ce va permite tuturor
cercetătorilor să le înţeleagă într-un acelaşi mod.
4
Houser, R. (1998). Counseling and Educational Research. Evaluation and Application. Thousand Oaks,
London, New Delhi: Sage Publications, p. 83 şi urm.
5
Zlate, M. (2000). Introducere în psihologie. Iaşi: Editura Polirom, p. 391.
6
Rateau, P. (2004). Metodele şi statisticile experimentale în ştiinţele umane. Iaşi: Editura Polirom, p. 16.
7
Charboneau, C. (1988). În Robert, M. (coord.). Foundements et étapes de la recherche scientifique en
psychologie. Paris, Quebec: Maloine S.A. Edisan.
14
A treia etapă este cea în care ipotezele de cercetare sunt puse la probă prin intermediul
aparatului statistic şi a ipotezelor statistice, ceea ce permite să se precizeze limita de
valabilitate a măsurătorilor, pentru a distinge dacă ele reflectă o regularitate sau sunt
doar un efect al hazardului.
8
Ap. Houser, op. cit., p. 84.
15
stadialitatea afectivă şi cea psihomorală, propuse de Freud, respectiv de Kohlberg, sunt însă
mult mai greu de dovedit experimental. Alegerea situaţiilor concludente care probează ideea
de stadiu poate fi atât de nuanţată încât este posibil ca o altă centrare sau selecţie să poată da
rezultate diferite.9 De aceea pare a fi foarte pertinentă opinia lui Richelle care nu vede o
legătură directă între gradul de elaborare/completitudine al unei ipoteze şi valoarea
concluziilor care decurg din ea: „O ipoteză foarte complicată poate să ducă la rezultate
nesemnificative, după cum o ipoteză foarte simplă poate să deschidă drumul spre fapte de o
mare importanţă.”10
Ipoteze inductive (izvorâte din fapte izolate) versus ipoteze deductive (cu origine în
cercetări sau teorii deja recunoscute) fac trimiterea la o dihotomie şi mai utilă, şi anume
ipoteze empirice - care sunt generalizări integrate într-o teorie, dar care pleacă de la fapte şi
experienţă -, versus ipoteze teoretice - care nu au o incidenţă empirică evidentă, deoarece
pleacă de la consecinţele testabile ale unei teorii.
Ipoteze exploratorii versus ipoteze explicativ-interpretative: primele abordează
categorii noi de fapte sau de probleme, au conexiuni mai slabe cu teoria şi de aceea sunt mai
vagi şi mai puţin riguroase, pe când cele din a doua categorie depăşesc cadrul cercetării în
care au apărut, încercând să refacă legătura cu conceptele şi legile mai generale ale teoriei de
la care a plecat cercetarea. Deoarece nu există siguranţa că interpretarea dată este şi cea mai
bună, ori singura posibilă, acestea au nevoie ele însele de alte verificări ulterioare pentru a le
determina mai exact limitele de valabilitate, deci ele relansează practic întregul ciclu al
cercetării.
Ipoteze cauzale şi ipoteze de covarianţă: uneori regularitatea semnalată de cercetare
indică o evoluţie paralelă (directă sau inversă) a unui fapt cu alt fapt, fără a se putea face o
inferenţă sigură privitoare la cauzalitatea relaţiei, şi atunci ipotezele vor fi de covariaţie. Este
şi cazul cvasi-experimentului unde, neputând manipula variabila independentă de tipul
apartenenţei de gen, mediu geografic sau vârstă, cercetătorul nu poate da statut de cauzalitate
relaţiei desprinse. În ipotezele cauzale, din contră, se anticipează relaţii de acest tip între
variaţii exterioare subiectului (variabila independentă) şi efectele lor asupra subiectului
(variabila dependentă). Ele sunt tipice doar metodei experimentale şi sunt singurele care
permit postularea de legi, de unde şi valoarea lor metodologică specială.
9
Cercetările transculturale au evidenţiat deja limitele de generalitate ale acestor teorii pentru alte contexte decât
cel în care ele au apărut (cultura vest europeană, versus alte tipuri de culturi).
10
Parot, F., Richelle, M. (1995). op. cit., p. 192.
16
La toate acestea se mai pot adăuga şi alte categorii, cum ar fi ipotezele ad-hoc şi
ipotezele aleatorii. Atunci când ipotezele de bază ale unei cercetări nu sunt confirmate, ori
cînd efectul scontat nu apare, cercetătorul încearcă să le apere invocând alte ipoteze,
construite ad-hoc care - atunci când sunt probate ulterior de alte cercetări - pot fi utile,
deoarece pot preciza mai bine condiţiile în care efectele anticipate pot apărea. Ipotezele
aleatorii nu au însă nici măcar această valoare euristică, ele neavând nici un rol în progresul
cunoaşterii, deoarece cel mai adesea sunt elaborate fără parcurgerea atentă a domeniului
teoretic şi de cercetare, dând o pondere mult prea mare elementului hazard, inspiraţie de
moment etc.
Aceste tipuri de clasificări ridică automat o altă problemă, cea a valorii ipotezelor şi a
criteriilor de identificare a acesteia. Cerinţele unei bune ipoteze sunt următoarele:
Ea trebuie să fie testabilă: putem afirma că există viaţă în univers, dar afirmaţia nu
poate deveni o ipoteză valoroasă atâta vreme cât nu dispunem de mijloacele tehnice
necesare testării ei.
Ca şi în cazul unei teorii, o ipoteză bună trebuie să fie falsificabilă (Popper), ceea ce
înseamnă că cineva poate aduna dovezi asupra falsităţii sau incorectitudinii ei. Putem
susţine ipoteza discontinuităţii faliilor spaţio-temporale în producerea fenomenelor
paranormale de tipul fantomelor, dar deoarece nu suntem încă în posesia
instrumentelor cu care să înregistrăm şi să măsurăm fenomenele de aceste tip, rezultă
implicit că nu avem în nici un fel posibilitatea de a dovedi validitatea sau invaliditatea
unei asemenea ipoteze.
ipoteză trebuie să fie raţională (plauzibilă), rezultând din faptul că există o
probabilitate suficient de mare ca ea să fie adevărată (este verosimilă). De exemplu,
dacă a face o legătură între performanţa şcolară şi inteligenţă este rezonabil, a face
legătura între performanţa şcolară şi unii indicatori antropometrici (perimetrul cranian)
nu mai este rezonabil.
ipoteză trebuie să fie parcimonioasă (economicoasă) în sensul că dintre două ipoteze
de aceeaşi valoare explicativă este preferabilă ipoteza cea mai simplă şi care se
potriveşte cel mai bine cu teoriile curente din domeniu.
Moore (1983)11 adaugă la aceste condiţii încă două elemente de apreciere a valorii
unei ipoteze, şi anume scurtimea (ipoteza trebuie formulată în termenii cei mai concişi
11
Apud Houser, op. cit., p. 87.
17
posibili) şi claritatea (proprietate care se referă la uşurinţa cu care altcineva poate
înţelege acea ipoteză).
ipoteză are şi rolul de a ne ghida în alegerea celor mai potrivite metode statistice
pentru a o proba: „Trebuie să existe consistenţă (potrivire) între ipotezele identificate
şi tipurile de statistici utilizate”, afirmă Houser.
Sumarizând, valoarea unei ipoteze constă în fecunditatea ei, adică în capacitatea de a
oferi explicaţii unui ansamblu semnificativ de fapte, asigurând astfel progresul cercetării.
12
Campbell, D.T., Stanley, J.C. (1963). Experimental and cvasi-experimental designs for research and teaching.
Chicago: Rand McNally, pp. 171-246.
18
este important ca toţi subiecţii să parcurgă faza de pretest şi de posttest, ceea ce duce la
efectul de balansare a efectului de învăţare pentru ambele grupe experimentale.
Instrumentaţia: atunci când există fază de pretest şi de posttest, schimbările survenite la
nivelul variabilei dependente pot fi datorate instrumentului în sine, în cazul în care el se
schimbă de la o fază a cercetării la alta şi când el nu este echivalent până la identitate în
faza a doua comparativ cu prima. Uneori schimbările apar la nivelul observatorilor sau
judecătorilor celor două tipuri de performanţe, aici instrumentul fiind substituit
cercetătorilor înşişi.
Regresia statistică: apare atunci când grupurile au fost selecţionate pe baza scorurilor
extreme (aşa-numitele grupuri de contrast, cum ar fi studenţi foarte buni şi foarte slabi,
subiecţi foarte inteligenţi şi non-inteligenţi etc.). Semnalată încă de către Galton, regresia
statistică constă din tendinţa scorurilor extreme de a regresa spre medie. Selectând subiecţi
de la extremele curbei lui Gauss, scorurile la teste vor tinde în timp spre nivelare, adică
spre valoarea medie, scăderea lor la faza de posttest având această cauză, şi nu una ce
rezultă din manipularea experimentală.
Erorile de selecţie: selecţia diferenţiată (non-aleatoare) intervine atunci când participanţi
cu particularităţi diferite (cum ar fi factorii vârstă, instrucţie sau sex) se află în grupul de
control şi în cel experimental, rezultatele constatate putându-se datora nu tratamentului
experimental, ci tocmai acestor particularităţi diferenţiatoare. Aceste variabile incluse sau
confundate pot fi deci sursa reală a variaţiei VD, mascând sau distorsionând efectul real al
VI. Dacă, de exemplu, grupul experimental are elevi cu o medie de vârstă mai mare,
rezultatele lor superioare la probele de citit-scris s-ar putea datora unor elemente care se
confundă cu factorul vârstă (maturitate globală mai mare, expunere mai îndelungată la
experienţa citit-scrisului sau pur şi simplu prezenţa mai multor oportunităţi de învăţare).
Pentru a combate această sursă de eroare putem proceda astfel: împărţim participanţii
după criteriile reperate a avea importanţă (vârstă, sex, clasă, studiile părinţilor etc.) şi apoi
le repartizăm randomizat (aleator) în grupurile de control şi experimental, pentru a
produce efectul de balansare / echilibrare între grupuri.
Mortalitatea experimentală: se referă la subiecţii care sunt prezenţi în faza iniţială a
cercetării, dar dispar pe parcurs, din grupul martor sau - şi mai rău! - chiar din grupul
experimental. Această ameninţare a validităţii studiului poate fi totuşi contracarată prin
introducerea unei faze de pretest pentru a determina dacă cei care au „dispărut” din
cercetare sunt sistematic diferiţi de cei care au urmat-o până la capăt.
19
Interacţiunea selecţie-maturaţie: combină ameninţările la adresa validităţii din cele două
surse, selecţia şi maturaţia, deşi trebuie spus că maturaţia este caracteristica mai
definitorie care face ca cele două grupuri să difere.
Cook şi Campbell (1979)13 mai adaugă la aceste surse de distorsiune încă patru categorii:
Difuziunea tratamentului experimental: atunci când grupul de control este într-o strânsă
proximitate cu cel experimental, este posibil ca cei din grupul de control să fi identificat
idei interesante apărute în cursul comunicării dintre participanţi şi să le utilizeze ca
răspuns la variabila independentă. Pericolul contaminării prin difuziunea tratamentului
poate fi evitat prin selecţia grupului de control din şcoli sau locaţii diferite, ori prin
alegerea de secvenţe temporare diferite, ceea ce reduce drastic posibilitatea de contact şi
de comunicare între cele două grupuri.
Rivalitatea compensatorie a grupului de control (efectul John Henry): atunci când
vechiul mod de lucru este ameninţat de noua procedură experimentală propusă, unii
subiecţi se vor strădui din răsputeri să dovedească faptul că vechiul lor procedeu lor este
mai bun. Cel mai bine ar fi ca participanţii nici să nu ştie din ce grup fac parte -
experimental sau de control - pentru a nu produce acest tip nedorit de competiţie.
Egalizarea compensatorie a tratamentului: membrii grupului de control s-ar putea simţi
nedreptăţiţi dacă vor crede că celor din grupul experimental li se alocă mai mult interes şi
resurse şi - pentru a-i mulţumi - conducerea le-ar putea aloca resurse suplimentare
neprevăzute, ceea ce ar putea atenua efectul tratamentului experimental.
Demoralizarea ofensată a grupului de control: afectaţi de faptul că ei nu le află printre
„cei aleşi” (în grupul experimental) şi că nu vor primi tratamentul experimental, grupul de
control va avea performanţe mult mai scăzute, în principal dintr-o motivaţie mai scăzută.
13
Cook, T.D., Campbell, D.T. (1979). Quasi-experimentation. Design and analys issues for field settings.
Chicago: Rand MacNally.
20
Descrierea explicită a tratamentului experimental: variabila independentă trebuie
descrisă suficient de amănunţit, astfel încât cel care va relua şi replica experimentul să
o poată reproduce, deşi trebuie menţionat că în intervenţiile terapeutice sau
educaţionale acest lucru este unul foarte greu de realizat.
Interferenţele tratamentelor multiple: dacă participanţii primesc mai mult decât un
tratament, este foarte greu de dovedit care tratament, sau care combinaţie de
tratamente, a dus la rezultatul apărut. Mai ales atunci când mai multe tratamente sunt
aplicate simultan, se dovedeşte a fi foarte greu de stabilit ponderea cu care fiecare
componentă a participat la obţinerea rezultatului final.
Efectul Hawthorne: o cercetare din anii '40 la Western Electric Company a arătat că
indiferent de condiţiile de iluminare - slabe sau bune - productivitatea lucrătorilor a
crescut, în principal din cauza faptului că simpla lor includere în studiu a generat o
puternică motivaţie, ceea ce a dus la creşterea productivităţii şi la grupul martor, cel
care avea o iluminare mai scăzută.
Efectul disruptiv al noutăţii: un tratament poate să creeze o perturbare a activităţii
dar, odată asimilat, poate să aibă consecinţe benefice în mod constant.
Efectul de examinator: eficienţa tratamentului nu este aceeaşi dacă cel care îl
administrează este cercetăror sau student, psiholog sau profesor, diriginte sau o
persoană neutră. Deoarece efectul experimental nu va mai apărea în condiţiile absenţei
celui care a administrat tratamentul, acesta nu poate fi generalizat.
Sensibilizarea la pretestare: mai ales atunci când subiecţilor li cere să reflecteze sau
să-şi exprime atitudinea faţă de un fenomen, cei care au avut în prealabil o fază de
pretest vor fi mai sensibili la tratamentul experimental decât ceilalţi.
Sensibilizarea posttest: ca şi în cazul precedent, faptul de a administra un test (în orice
fază a experimentului) ajută subiectul să colecteze informaţii utile într-o manieră în
care cei care nu au participat la testare nu o pot face.
Interacţiunea istoriei cu efectul tratamentului: se produce deoarece anumiţi factori
contextuali în care se desfăşoară cercetarea nu pot fi replicaţi exact într-o fază
ulterioară a cercetării şi de aceea efectele tratamentului nu mai pot fi generalizate şi la
alte situaţii.
Măsurarea variabilei dependente: când VD este măsurată printr-un test cu alegere
multiplă sau printr-o grilă de observaţie perceptivă concluziile reieşite din cele două
metode pot fi destul de divergente.
21
Interacţiunea dintre timpul măsurătorii şi efectele comportamentului: atunci când
posttestul este administrat imediat, el poate să dea rezultate diferite faţă de
administrarea lui întârziată, la distanţă de săptămâni sau de luni/ani.
La toate aceste probleme ale validităţii externe, oarecum universale, cercetarea psiho-
pedagogică ridică în plus şi probleme specifice. Un experiment care ar urma să dovedească
cât de eficace este o nouă tehnică de predare, de evaluare sau de consiliere, ar trebui să aibă în
vedere că nu este rezonabil să se aştepte schimbări rapide în planul formării atitudinilor,
cunoştinţelor sau deprinderilor. Studiul va produce deci schimbări nesemnificative pentru
perioade scurte de timp (de zile sau săptămâni), dar ar putea să dea bune rezultate după
trecerea unor perioade de timp mai lungi (de luni, semestre). Intervenţiile destinate
schimbărilor importante în cunoaştere, personalitate sau comportament nu se pot realiza prin
experimente scurte şi nici prin una-două şedinţe. Pe de altă parte, cel care administrează
tratamentul (profesor, consilier şcolar sau psiholog) ar putea să nu respecte aceleaşi proceduri
în aplicarea lui (standardizarea tratamentului) de unde şi necesitatea de a fi antrenaţi sau chiar
supervizaţi în acest sens.
Autoevaluare
1. Definiţi în ce constă o ipoteză de cercetare şi care este rolul ei în acest proces.
2. Care este geneza unei ipoteze de cercetare valoroasă? (Indicaţi cinci criterii de valoare).
3. Din tipologia ipotezelor de cecetare propuse în curs analizaţi cuplurile ipoteză de nul -
ipoteză specifică şi ipoteză unidirecţională - ipoteză bidirecţională.
4. Analizaţi rolul istoriei, maturaţiei şi al morţii experimentale în problematica validităţii
interne a unei cercetări experimentale.
5. Selectaţi pentru o analiză mai detaliată trei dintre elementele cele mai importante care pot
distorsiona semnificativ validitatea externă a unei cercetări experimentale psihopedagogice şi
indicaţi modul în care acestea pot fi controlate sau contracarate.
Bibliografie
1. Campbell, D.T., Stanley, J.C. (1963). Experimental and cvasi-experimental designs
for research and teaching. Chicago: Rand McNally.
2. Doron, R., Parot, F. (1999). Dicţionar de psihologie. Bucureşti: Editura Humanitas.
3. Houser, R. (1998). Counseling and Educational Research. Evaluation and
Application. Thousand Oaks, London, New Delhi: Sage Publications.
22
4. Piéron, H. (2001). Vocabularul Psihologiei. Bucureşti: Univers Enciclopedic.
5. Rateau, P. (2004). Metodele şi statisticile experimentale în ştiinţele umane. Iaşi: Ed.
Polirom.
6. Reber, A.S. (1985). The Penguin Dictionary of Psychology. London: Penguin Books.
7. Robert, M. (coord.). (1988) Foundements et étapes de la recherche scientifique en
psychologie. Paris, Quebec: Maloine S.A. Edisan.
8. Zlate, M. (2000). Introducere în psihologie. Iaşi: Editura Polirom.
23
CAPITOLUL 3
24
scala de anxietate a lui Burns). Când vrem să diferenţiem între măsurători specifice putem
folosi indici: O1, O2, O3.
X se referă la tratamente sau intervenţii, care pot fi simple sau complexe (aplicarea de
stimuli auditivi sau luminoşi, prin comparaţie cu o metodă nouă de formare sau de training
educaţional). Când dorim să diferenţiem între intervenţii, putem de asemenea să utilizăm
indici (X1, X2, X3 etc.).
Timpul este o componentă de bază dintr-un design de cercetare experimentală, deşi el
este mai greu de figurat ca atare. De regulă, ordinea în care apar celelalte simboluri sugerează
şi secvenţa temporală, care de fapt nu apare explicit în design.
R O1 X O2
R O1 O2
Figura 3.1. Design experimental pe grupuri randomizate,
cu grup experimental şi grup de control şi cu măsurători pretest şi posttest14.
Prelucrare după Hohn, M., Vârgă, D. (2000). Ghid practic de psihologie experimentală. Timişoara: Tipografia
14
25
temporale de genul AB ori a aceluiaşi grup în moderată a independente;
AB). diferite momente controlului. Distribuire nerandomizată a
temporale. subiecţilor în grupuri;
Multiple evaluări ale
variabilei dependente.
Pre-experimental (de Comparaţii între grupuri Control minim. Manipularea variabilei
exemplu o singură sau în cadrul aceluiaşi independente sau măsurarea
secvenţă pretest - grup, dar în general nu la unui eveniment care a
posttest). o mare distanţă apărut doar pentru un grup,
temporală. pentru care examinatorul nu
are nici un control;
Distribuire nerandomizată a
subiecţilor în grupuri.
Descriptiv (de exemplu A descrie un eveniment Nici un control Nici o manipulare a
studiu cauzal - sau un fenomen. asupra variabilei independente;
comparativ - evenimentelor Distribuire nerandomizată a
observaţional). sau fenomenelor. subiecţilor în grupuri.
Figura 3.2. Categorii de design-uri de cercetări cantitative (Sursa: R. Houser15).
A. Procedura
1. Se administrează pretestul şi se măsoară (O1) scorul la un test grafometric pentru un
singur grup, înainte de a-l expune la o nouă metodă de predare.
2. Se expune (X) grupul la noua metodă de predare pentru o perioadă de timp, de exemplu
un semestru.
3. Se dă posttestul şi se măsoară (O2) scorul la acelaşi test grafometric după expunerea la
tratament.
15
Houser, R. (1998). Counseling and Educational Research. Evaluation and Application. Thousand Oaks,
London, New Delhi: Sage Publications, p. 22.
16
Adaptat după Campbell, D.T., Stanley, J.C. (1966). Experimental and Cvasi-experimental Designs for
Research. Rand McNally and Company.
26
4. Se compară semnificaţia statistică a diferenţei mediilor (testul t Student) pentru a vedea
dacă diferenţa atinge pragul semnificaţiei statistice şi la ce nivel (p = .05 sau p = .01).
B. Validitatea
Validitatea internă
Avantaje: deoarece se referă la aceiaşi subiecţi, care sunt măsuraţi în două situaţii -
înainte şi după tratamentul experimental X - selecţia şi mortalitatea experimentală sunt uşor
de controlat.
Dezavantaje: nesiguranţa că diferenţa dintre O2 şi O1 este datorată doar tratamentului.
Ipoteze rivale, şi deci erori posibile sunt foarte multe: istoria (între timp unii subiecţi şi-au pus
ochelari), maturaţia (pot fi mai obosiţi la O2 pentru că elevii sunt la sfârşit de semestru sau
poate de an şcolar), efectul testării (la a doua testare apare o motivaţie mai bună sau este indus
efectul învăţării), regresia statistică (dacă comparaţia se face splitând clasa în cei buni şi cei
slabi), moartea experimentală (mulţi subiecţi nu au primit şi pe O1 şi pe O2).
A. Procedura
1. Se selectează subiecţii aleator (randomizat) dintr-o populaţie.
2. Aceştia se distribuie tot randomizat în grupul experimental şi în cel de control.
3. Se măsoară la ambele grupuri variabila dependentă (O1), apoi se determină media şi
abaterea standard, pentru a se constata echivalenţa grupurilor (testul t, testul Levene).
4. Se păstrează toate condiţiile identice pentru ambele grupuri, cu excepţia expunerii gupului
experimental la tratamentul X, prin variabila independentă, pentru o perioadă de timp
specificată.
5. Se testează şi se măsoară variabila dependentă (O2) pentru ambele grupuri, pentru a li se
determina media şi abaterea standard.
6. Se determină diferenţa O2 - O1 pentru ambele grupuri, separat.
27
7. Se compară aceste diferenţe pentru a concluziona dacă aplicarea tratamentului
experimental X se asociază cu o schimbare semnificativă care apare la grupul de
experimental, comparativ cu grupul martor, pentru a se putea astfel respinge ipoteza de
nul (Hoμ1 ≠ μ2).
Designul 2 ar putea fi extins cu una sau mai multe linii experimentale, caz în care ar arăta
astfel:
Pretest Tratament
Posttest
Grupul experimental 1 R O1 X (Metoda a) O2
Grupul experimental 2 R O1 X (Metoda b) O2
Grupul de control R O1 O2
B. Validitatea
a. Validitatea internă
1. Validitatea internă devine mult mai puternică în acest tip de design, deoarece variabilele
străine ce pot apărea între O1 şi O2 pot fi considerate ca balansate şi sub control, în măsura în
care ele afectează în mod egal ambele grupuri.
2. Deoarece tratarea diferenţiată a grupurilor experimental şi de control (profesor diferit, clase
diferite, atmosferă diferită) poate crea un tip de eroare constând din dezamăgirea grupului de
control, subiecţii vor fi testaţi individual ori în grupuri mici, prin distribuirea randomizată a
timpului, a locului şi a condiţiilor experimentale.
3. Atunci când sunt implicaţi observatori sau evaluatori, este bine ca ei să nu ştie cărui grup
(experimental sau de control) sunt asignaţi subiecţii.
4. Selecţia diferenţiată este controlată prin metoda randomizată de selecţie iar maturarea,
efectele de pretestare şi regresia statistică apar în mod egal pentru ambele grupuri.
Mortalitatea experimentală diferenţiată poate fi evaluată pentru pattern-uri atipice, nealeatorii,
deoarece există faza de pretest.
b. Validitatea externă
Pot fi generalizate, şi până la ce limită, concluziile acestui tip de demers?
1. În acest tip de design validitatea externă poate fi compromisă doar în situaţia în care
pretestul ar sensibiliza sau ar altera doar răspunsurile subiecţilor care sunt supuşi
tratamentului experimental (interacţiunea pretestării cu X).
28
2. Interacţiunea selecţiei cu X: pot apărea destorsiuni semnificative atunci când subiecţii
selecţionaţi pentru tratament diferă într-un fel oarecare de cei pe care vrem să generalizăm
concluziile, de exemplu elevi din şcoli profesionale versus elevi din liceele obişnuite,
elevi din clase de elită (sau de recuperare, în învăţământul inclusiv) versus cei din clasele
obişnuite.
3. Efectele de reactivitate la procedurile experimentale apar doar dacă subiecţii ştiu că fac
parte din grupul experimental sau din cel de control. Soluţia pentru acest caz este ca ei să
nu ştie din start şi să nu afle nici pe parcurs din care grup fac parte, măsurătorile O1 şi O2
putând apărea ca unele de rutină ale evaluării şcolare, iar tratamentul X ca făcând parte
din programul şcolar normal.
A. Procedura
Deoarece efectele măsurate O2 reprezintă expresia unor variate combinaţii de variabile
(pretestarea O1, variabila independentă X, maturarea M sau istoria I), pentru a determina doar
efectul tratamentului X, vom face diferenţa dintre 3D şi 4D; doar efectul pretestării O 1,
scădem 4D din 2D, iar pentru a determina efectul interacţiunii dintre pretestarea O1 şi X se
adună 2D cu 3D, iar rezultatele se scad din 1D.
Raţiunea acestui tip de design este aceea că prin adăugarea în cercetare a liniilor 3 şi 4
(subiecţi nepretestaţi), validitatea externă câştigă mult, deoarece se extinde posibilitatea
generalizării. Aceasta însă doar în cazul în care pretestarea determină sensibilizarea celor care
sunt expuşi la tratamentul experimental. Pentru aceasta însă, condiţia obligatorie este
distribuirea randomizată pentru toate cele patru grupuri, şi aceasta deoarece doar aşa putem
presupune că scorurile la pretestare din grupurile 3 şi 4 ar fi fost echivalente cu grupurile 1 şi
2. Nefiind pretestate însă, efectul acestora nu va apărea în scorurile lor (O2), ceea ce ne
îndreptăţeşte să facem diferenţa 4D - 2D pentru a evidenţia rolul pretestării (O1).
29
B. Validitate
Acest design permite determinarea simultană a principalelor efecte ale pretestării, ca şi
al interacţiunii efectelor pretestării cu tratamentul experimental X. Comparând grupul 1 cu
grupul 4 se poate determina efectul combinat al maturării şi istoriei. De fapt, designul de tip
Solomon presupune o experimentare dublă, cu şi fără pretest, iar atunci când între ele există o
bună congruenţă a rezultatelor, se poate acorda o mare încredere acestora, oricare ar fi ele.
A. Procedura
Aşa cum se poate observa, designul 4 preia chiar ultimele două coloane ale designului
lui Solomon. Şi aici repartizarea pe cele două grupuri se face randomizat, ceea ce permite
cercetătorului să ştie ca la momentul respectiv cele două grupuri erau egale. După aceasta
urmează expunerea X la tratamentul experimental, apoi cele două grupuri sunt testate pentru
prima dată. Prin comparaţia lor printr-un test statistic corespunzător se determină dacă efectul
constatat la grupul experimental a apărut prin şansă (hazard), sau se datorează tratamentului
X, adică variabilei independente.
B. Validitatea
Autorii apreciază că designul 4 este superior designului 2, deoarece aici nu poate
apărea nici o interacţiune dintre pretestare şi tratament. Este un tip de demers care este
deosebit de util atunci când pretestarea este neconvenabilă sau prea costisitoare, ori atunci
când subiecţii trebuie să-şi apere anonimatul. Pe de altă parte, atunci când mărimea
eşantioanelor este mică - şi de aceea se impune verificarea echivalenţei - designul 2 este de
preferat designului 4.
30
A. Procedură
Deşi mai puţin valoros ca designul 2, de care diferă doar prin distribuţia
nerandomizată a subiecţilor, designul 5 este unul deosebit de util în cercetarea
psihopedagogică, unde adesea grupurile experimental şi cel de control se iau în calitatea lor de
grupuri natural constituite (clasele de elevi), astfel selecţionate încât să fie cât mai mai
similare atunci când li se administrează pretestul. Aceasta înseamnă că cele două grupuri au
medii şi abateri standard foarte asemănătoare şi că testul de semnificaţie t nu respinge ipoteza
de nul.
B. Validitate
Validitate internă
Satisfăcătoare, dacă cele două grupuri au media şi abaterea standard similare la faza de
pretest.
Pentru a sesiza în principal efectul tratamentului X, controlul trebuie să aibă în vedere
efectele pretestării, istoriei, al maturaţiei şi al instrumentării.
Dintre acestea, istoria şi instrumentarea pot fi surse importante de distorsiune sau
contaminare.
Mortalitatea experimentală este una foarte uşor de dedus prin comparaţia
înregistrărilor din faza pretest-posttest.
În absenţa randomizării, este probabil să apară posibilitatea unor diferenţe critice,
influenţate de scorurile la pretest, cum ar fi motivaţia mai mare a voluntarilor, fundalul
cultural diferit etc., care pot afecta datele la faza de posttest.
Regresia statistică poate fi evitată, dar numai prin control. Dacă două şcoli sunt
fundamental diferite după un criteriu (să zicem după QI-ul elevilor) şi echivalente
după celelalte criterii importante, atunci cele două grupuri trebuie construite prin
apariere (matched = potrivire), astfel încât şcoala mai slabă să nu fie penalizată.
Validitatea externă
Designul 5 are câteva însemnate avantaje practice, în măsura în care are în vedere
clase intacte şi nu dezorganizează programul şcolar. Implicând o largă varietate de clase din
diverse locuri, validitatea externă poate creşte semnificativ, mai ales prin controlul
interacţiunii selecţiei cu al tratamentului X. În plus, este mult mai uşor să conduci un
31
experiment autorizat, fără ca subiecţii să ştie cărui grup aparţin (experimental sau de control),
prin clase intacte, natural constituite.
Replicări Xa Xb Xc Xd
1 A B C D
2 B D A C
3 C A D B
4 D C B A
Media scoruri coloane
A. Procedură
1. Fiecare subiect din grupele A, B, C, D este expus la fiecare variaţie a lui X (ca şi la absenţa
lui X, dacă se folosesc grupurile de control), în diferitele etape ale experimentului. Când se
aplică la 4 grupe, tratamentul X este prezentat fiecărui grup în fiecare etapă, astfel încât
fiecare dintre modalităţile lui X este precedată şi urmează de un număr egal de ori.
2. La sfârşitul experimentului este calculată media fiecărei coloane, care este de fapt scorul
mediu pentru toate grupele expuse la una din stările lui X. Comparaţia dintre coloane ajută la
evidenţierea efectului pe care aceste stări sau intensităţi ale lui X le au asupra performanţei
grupului.
B. Validitate
1. Designul 6 îl compensează pe precedentul pe linia posibilităţii ca nerandomizarea
grupurilor să le facă neechivalente din mai multe perspective, introducând diferenţe care sunt
tot atâtea surse de distorsiune pentru X. Designul contrabalansat roteşte aceste diferenţe dintre
subiecţi, expunând toate grupurile la toate variaţiile lui X, controlând în acelaşi timp şi efectul
de ordine. Dacă un grup este mai inteligent, fiecare stare a lui X profită în mod egal de acest
fapt.
32
2. Efectul de contaminare a interacţiunii (selecţie-maturaţie de exemplu) poate să se
repercuteze asupra datelor dacă o stare a lui X oboseşte mult grupul. Slăbiciunea de bază a
designului 6 este aceea că dacă aplicarea unei forme a lui X are efecte remanente (reziduale) -
ca în cazul medicamentelor sau al substanţelor chimice de tipul cofeinei - trebuie lăsat să
treacă destul de mult timp pentru a administra starea următoare a lui X.
Validitate externă
1. Generalizarea datelor acestui demers depinde de condiţiile experimentale, în măsura în care
pretestarea modifică subiecţii, astfel încât ei pot să nu mai fie reprezentativi pentru întreaga
populaţie.
2. Poate apărea interacţiunea dintre selecţia diferenţiată şi X (tratament), atunci când aceasta
nu este evitată cu grijă, ca în cazul subiecţilor voluntari, care nu mai reprezintă întreaga
populaţie.
33
Acesta este un design foarte similar cu cel precedent dar, prin introducerea grupului de
control, se poate controla şi efectul istoriei contemporane: dacă ambele grupuri au făcut
experienţa unui eveniment particular şi grupul experimental înregistrează o creştere de la O4
la O5, pe când cel de control nu, câştigul poate fi pus mai ferm pe seama procedeului
experimental X aplicat şi mai puţin pe eveniment. Designul 8 este superior şi lui 5 în privinţa
controlului efectului de selecţie-maturare: dacă un grup are o rată de creştere mai mare decât a
celuilalt, acest câştig accelerat va apărea şi în faza de pretest, la acelaşi grup.
Posttestul multiplu, utilizat în design-urile 7 şi 8, relevă informaţii pe care cele cu un
singur posttest nu o pot face. De exemplu, dacă X are o influenţă de scurtă durată, ce tinde să
dispară cu vremea, aceste tipuri de design vor putea surprinde acest trend. Ori, variaţia lui X
poate fi puternică, dar şi de scurtă durată, sau moderată ca intensitate, dar de lungă durată.
Atunci când mai multe grupuri sunt pretestate simultan, dar pretestul se face la intervale
diferenţiate de timp, apare ca posibil designul de mai jos, care începe cu mai multe grupuri
testate în acelaşi timp, dar la care posttestul are loc la diferite intervale de timp (T1,T2 ...Tn).
Această strategie este deosebit de utilă atunci când apar factori maturaţionali şi când
efectul testării seriale în interiorul unui grup trebuie minimizat. Mai mult, prin adăugarea unui
grup de control, cu acelaşi pattern de pretest-posttest, dar fără tratamentul X, poate fi evaluat
şi efectul acestuia.
Sumarizăm în tabelul de mai jos sursele de distorsiune (invaliditate) al celor opt tipuri
de design experimental prezentate anterior ca fiind definitorii pentru planurile de bază.
34
Surse de distorsiune Design-uri experimentale
Control Control Control
redus riguros parţial
1 2 3 4 5 6 7 8
Validitate internă
Istoria contemporană - + + + + + - +
Proces maturaţional - + + + + + + +
Proceduri de pretestare - + + + + + + +
Instrumente de măsură - + + + + + ? +
Regresie statistică ? + + + ? + + +
Selecţia diferenţiată a subiecţilor + + + + + + + +
Moartea experimentală + + + + + + + +
Interacţiunea selecţie-maturaţie - + + + - ? + +
Validitate externă
Interacţiunea selecţiei cu X - ? ? ? ? ? ? -
Interacţiunea pretestării cu X - - + + - ? - -
Proceduri experimentale reactive ? ? ? ? ? ? ? ?
Interferenţele multiple ale tratamentului -
17
Prelucrare după Van Dalen & Meyer (1996). Understanding Educational Research. New York: McGraw Hill,
p. 291.
18
Apud D. Mertens, 1998, p. 77.
35
Deoarece pentru implementarea tratamentului a fost necesară cooperarea şcolii, cercetătorul
nu a avut posibilitatea de a asigura participarea randomizată. Studiul este deci cvasi-
experimental pentru că s-a lucrat cu grupuri intacte, putându-se determina numeroase
măsurători ale achiziţiilor, atitudinilor sau relaţiilor sociale.
36
Cercetarea descriptivă observaţională evită autoraportările şi clarifică caracteristicile
personale prin observaţia altora sau prin ratinguri. Singurul domeniu de interes vizează
comportamentul grupului ţintă. Cercetătorii care apelează la acest tip de metode sunt interesaţi
de identificarea sistematică a variabilelor de interes, metoda bazându-se doar pe observaţii
efectuate de observatori antrenaţi.
Un alt tip de design descriptiv este cel corelaţional. Deoarece comportamentul uman
are o mare variabilitate situaţională şi contextuală, se pune problema separării variabilelor
care influenţează la exterior percepţiile, atitudinile sau comportamentele noastre. În
consecinţă, cercetătorii utilizează metodele corelaţionale pentru a identifica şi înţelege relaţiile
dintre o multitudine de variabile sau modul cum covariază ele. Îm acest tip de design de
cercetare variabila independentă este prezentă, dar nu se pune problema manipulării sale, ci a
identificării sale după ce faptele deja s-au produs. După ce ea a fost identificată, grupurile sunt
comparate între ele în virtutea experienţelor sau a structurii diferite pe care ele le-au avut,
ceea ce ar putea conduce la inferenţe valide cu privire la variabila independentă. Cu alte
cuvinte, designurile corelaţionale le amorsează şi le pregătesc pe cele veritabil-experimentale,
singurele care surprind relaţiile de cauzalitate.
Sumar
Metodele de cercetare cantitative se numesc astfel pentru că ele convertesc rezultatele în
unităţi de măsură cuantificabile, în scopul analizei statistice.
Adiţional, cercetătorul are cel mai adesea controlul asupra variabilelor de care el se
interesează.
În astfel de cercetări există patru tipuri de variabile: independente, dependente, externe
(controlate şi necontrolate) şi interne (sau explanatorii).
Design-urile de cercetare cele mai strâns asociate cu demersurile cantitative sunt: design-
urile real-experimental, cvasi-experimentul, design-urile pre-experimental şi cel
descriptiv.
Designul experimental real implică asigurarea distribuţiei aleatoare (randomizate) a
subiecţilor în grupuri şi manipularea variabilei independente.
Designul cvasi-experimental manipulează variabila independentă, dar nu asignează
distribuirea randomizată a subiecţilor în grupuri, pe care le ia deja constituite.
37
Designul pre-experimental implică asignarea nerandomizată, cu manipulare, dar controlul
cercetătorului asupra variabilelor externe este cel mai mic din toate cele patru tipuri de
design.
Design-urile descriptive includ ancheta, observaţia, studiul corelaţional şi cel cauzal-
comparativ. Aceste demersuri nu implică nici repartizarea aleatorie şi nici manipularea
variabilei independente. Ele constituie doar încercări ale cercetătorului de a caracteriza
evenimente ori condiţii ale populaţiei identificate.
Aprofundare
Trei probleme de interes în legătură cu designul de cercetare
a. Tipul de tratament al variabilelor: inima designului experimental sunt variabilele pe
care cercetătorul le poate manipula, adică variabilele independente (VI), care se şi află
de fapt sub controlul său. Există însă o multitudine de alte variabile de interes şi care
nu sunt manipulabile: apartenenţa de gen, de rasă, de condiţii socio-economice, de
nivel cultural etc. De aceea s-au dezvoltat unele tipuri de abordări, cum ar fi cele
comparative sau cercetările corelaţionale. Cu siguranţă că aceste variabile non-
manipulabile („etichetă”) pot fi combinate cu cele manipulabile în aşa-numitele studii
experimentale cu design factorial.
b. Efectele de ordine: în asemenea studii cercetătorii sunt preocupaţi de faptul că
expunerea la un tratament înaintea altuia are anumite efecte, diferite atunci când
tratamentul se administrează în ordine inversă. Pentru a contrabalansa efectul de ordine
se utilizează împărţirea grupurilor în care tratamentul se aplică într-o anumită ordine
(AB) şi - după măsurarea efectelor - se inversează ordinea (BA).
c. Aparierea (matching-ul): acolo unde randomizarea nu este posibilă (de exemplu în
cvasi-experiment), cercetătorul poate alege să „potrivească” participanţii după un
număr de variabile care prezintă importanţă (gen, vârstă, nivel de inteligenţă sau de
studii, dizabilităţi etc.). Potrivindu-i în perechi (de unde şi cuvântul apariere) între
grupul de control şi cel experimental cercetătorul poate controla câteva variabile
externe, dar problema care apare este chiar potrivirea în sine, care niciodată nu poate
realiza o echivalenţă perfectă. Participanţii pentru care nu s-a găsit o pereche potrivită
şi aproximativ echivalentă vor trebui eliminaţi din cercetare. Aparierea de mai mult de
una-două variabile este deja generatoare de foarte mari probleme tehnice.
38
3.5. Fişă de programare a cercetării
I. Definirea problemei
A. Raţiunea generală a studiului: de a determina dacă un organism aflat sub influenţa
unui drog puternic poate fi făcut să coopereze.
B. Ipoteza definită operaţional: de a determina efectele apomorfinei asupra
comportamentului de rozător al şobolanului şi de a vedea dacă şobolanul poate fi
condiţionat să-şi întoarcă capul cât se află sub influenţa apomorfinei.
II. Clasificarea variabilelor
A. VI (variabilă independentă): apamorfina.
B. VD (variabila dependentă): întoarcerea capului.
C. Variabila secundară: concentrarea drogului, modul de aplicare, greutatea
subiecţilor.
III. Tipuri de investigaţie
A. Tipul general de investigaţie: experiment de laborator.
B. Tipul specific de design: design de două grupe randomizate.
IV. Metoda
A. Subiecţii: 12 şobolani femele tip Lang-Evans cu glugă, vârsta de trei luni, greutatea
240-290 grame.
B. Instrumentarea: un tub restrictiv de 2/2 inci diametru, 7 inci lungime, a fost folosit
pentru ţinerea şobolanului în timpul experimentului. Două buloane, unul la fiecare
margine a tubului, trec prin centrul tubului pentru a ţine şobolanul înăuntru. La 1
inci de capătul tubului a fost plasată o celulă fotoelectrică, la 1/2 inci de centrul
său.
C. Procedura:
1. Fiecare şobolan evoluează în şedinţe de o oră pe zi, zece zile consecutive.
2. În timpul fiecărei şedinţe un şobolan a fost plasat în tub, cu capul în afara marginii.
3. De fiecare dată când şobolanul a întors capul suficient spre dreapta pentru a
întrerupe o radiaţie fotoelectrică, i s-a prezentat un bloc de lemn de ronţăit în faţa
sa, pentru 15 secunde, printr-o bară retractabilă.
4. În fiecare zi în tub au fost plasaţi 6 şobolani injectaţi cu un drog, în timp ce ceilalţi
au fost injectaţi intraperitoneal cu 2,0 mg/Kg cu apmorfină, 20 de minute înainte
de a fi puşi în tub.
39
5.Datele au fost prelucrate prin testul t, după formula În fiecare oră a fost înregistrat
numărul de întoarceri ale capului, pentru fiecare subiect în parte.
6.: Datele au fost prelucrate prin testul t, după formula:
x x
A B
t
SS SS
A B 1 1
n 1 n 1 n
A nB
A B
40
laborator; unele elemente originale ale situaţiei reale se pierd, pentru a apărea altele generate
de noua situaţie; numai anumite variabile pot fi selectate din situaţia reală; experimentatorul
poate sugera involuntar ce aşteaptă de la subiecţi, care îşi modifică reacţiile în sensul aşteptat;
subiecţii, prin tendinţele de faţadă sau prin conformismul social, prezintă reacţiile care promit
recompensa aşteptată.
Perfecţionarea experimentului de laborator se face pe direcţia creării unor situaţii
experimentale cât mai apropiate de viaţa reală, dar, oricum, validitatea externă rămâne
problema lui ce mai mare. În fond artificialitatea situaţiei de laborator este punctul forte, dar şi
cel vulnerabil al metodei: pe de o parte printr-un mai bun control al variabilelor externe şi prin
posibilitatea explorării variabilelor complexe, el pune fără ambiguitate în evidenţă
cauzalitatea; pe de altă parte abstragerea variabilelor din contextul lor natural de acţionare,
combinarea lor după „reţeta” experimentală, constituie o denaturare a acţiunii lor. De aceea,
în timp ce unii văd în această metodă experimentul „pur”, „adevărat” sau „ştiinţific”, alţii
(Chapanis, apud Roşca, 1973, p. 12) „... observă că experimentele de laborator sunt numai
modele aproximative ale situaţiilor vieţii reale”.
Prezenţa experimentului poate induce aşa numitul efect Rosenthal în rândul
subiecţilor. Mai mult, el poate introduce (intenţionat sau nu) distorsiuni în înregistrarea
datelor, mai ales prin omiterea acelora ce contravin ipotezelor formulate. Unele erori pot fi
sistematice, involuntare (bias, în engleză), altele nesistematice (transcrierea greşită a unor
rezultate, înregistrări neatente etc.) Pentru a-l cita din nou pe Roşca, „fără îndoială că
aducerea subiectului în condiţii de laborator ridică numeroase obiecţii şi dificultăţi, dar ele nu
sunt de natură, nici pe departe, să invalideze experimentul” (op. cit., p. 12).
41
generalizări mai valide. Din această cauză, experimentul natural, de teren, îşi găseşte o largă
zonă de aplicare în şcoală, în educaţie: introducerea unui procedeu nou de predare, urmărirea
efectelor evaluării şi examinării elevilor, modificarea programului de lucru, schimbarea
regulamentului de ordine interioară fac din această metodă o cale de studiere, dar şi de
ameliorare a procesului instructuv-educativ.
Şi totuşi câştigurile într-o direcţie (cadrul natural de desfăşurare, realism, validitate
externă) se fac cu preţul unor dezavantaje: intervin o serie întreagă de factori (externi sau
interni) care pot modifica conduita; controlul riguros al variabilelor este mult mai dificil; de
multe ori situaţia naturală ia pe nepregătite experimentatorul; multe din situaţiile naturale sunt
ireversibile, aşa că posibilitatea provocării şi repetării sunt foarte mici; complexitatea situaţiei
reale face dificilă selectarea şi punerea în legătură a variabilelor explanatorii, după o schemă
cauzală riguroasă.
Maurice Duverger (apud Celchea, S., 1982, p. 112) distinge experimentul de teren
pasiv şi activ (în primul cercetătorul nu manipulează variabilele, el anunţă o schimbare şi
caută înlănţuirea de fapte care a produs-o, în timp ce în al doilea caz el intervine direct sau
indirect în introducerea factorilor experimentali). După durata lor în timp, experimentul de
teren poate fi instantaneu sau de durată (extins pe luni sau ani de zile), iar după gradul de
cuprindere poate fi restrâns (clasă, echipă de muncă) sau foarte extins (o zonă întreagă sau o
mare colectivitate).
42
didactic, comparaţia clasei la care s-a predat tradiţional cu cea pe care s-a experimentat,
tragem concluzii valide asupra procedeului, aceasta fiind o cale de ameliorare a tehnologiei
didactice. Deşi nici o reformă din educaţie nu poate face abstracţie de investigaţii
experimentale prealabile, experimentarea în şcoală vizează câteva domenii cheie:
studiul programelor de învăţământ sub raportul organizării volumului, gradului de
dificultate, succesiunii, ritmului, numărului de exerciţii necesare;
ameliorarea tehnologiei didactice prin cercetări privitoare la metodele şi procedeele
didactice utilizate în predare, eficienţa predării;
studiul personalităţii elevului în raport cu activitatea de învăţare (variabilele
psihologice şi psihosociale cu relevanţă în randamentul şcolar);
cercetări privitoare la personalitatea profesorului, cu repercusiuni asupra activităţii de
predare-învăţare (stiluri de predare, variabile de personalitate implicate);
investigarea randamentului şcolar prin ameliorarea tehnicilor de apreciere şi evaluare a
muncii şcolare (vezi Drăgan şi Nicola, 1993, p. 44).
43
Abilitatea de a determina relaţii cauzale este limitată în acest tip de cercetare, numită
studiu de teren ex post facto, deoarece un eveniment a apărut simultan cu altele şi, neputând
manipula variabila independentă, nu putem face inferenţa cauzală. Investigatorul construieşte
totuşi o ipoteză, defineşte o posibilă variabilă independentă şi identifică variabilă dependentă
actuală , încercând să tragă o concluzie asupra relaţiei dintre ele. Astfel, studiind persoanele
care nu au avut cancer, cele care trăiesc şi au cancer şi cele care au murit de cancer se poate
face o legătură strânsă între numărul de ţigări fumate şi maladia canceroasă, fără a putea însă
vorbi de cauzalitate în sens strict: experimentul ex post facto este o cale indirectă de a testa
ipotezele.
Şi totuşi acest tip de experiment are o mare răspândire pentru că nu costă prea mult,
poate apela la metode gen creion-hârtie, permite includerea unui număr mare de subiecţi, deci
o economie de timp însemnată. Limitările metodei pleacă de la lipsa de control a variabilelor
(deoarece variabila independentă nu poate fi manipulată) ceea ce poate genera o probabilitate
crescută de interpretare incorectă a datelor şi posibilitatea foarte redusă de a folosi procedee
statistice avansate pentru analiza acestora. În psihologie, C. Cox (1926) a dat o replică ex post
facto studiului experimental al lui Terman despre supradotaţi, calculând retroactiv QI-ul
pentru 510 persoane din istorie, considerate a fi fost eminente sau genii (vezi Copiii capabili
de performanţe superioare, 1981, p. 147).
Studiile de laborator ex post facto sunt o altă modalitate a acestei metode putând fi
definite ca investigaţii ştiinţifice de laborator în care variabila independentă nu este strict
controlată, deoarece ea a apărut deja, era prezentă. Investigatorul trebuie să explice o ipoteză,
să analizeze toate datele legate de eveniment pentru a putea trage concluzii. După
desfăşurarea unui anumit studiu experimental, cercetătorul intuieşte că există o relaţie între
unele variabile necontrolate şi fluctuaţiile variabilei dependente. De aceea ele vor fi selectate
şi vor deveni variabile independente într-un experiment controlat.
În unele cazuri, acest tip de experiment analizează variabile evazive, care s-au dovedit
a avea influenţă perturbatoare, într-un experiment iniţial, asupra variabilei dependente. Deci
ele sunt o cale de a scuti timp şi bani, prin identificarea surselor ce dau peste cap experimente
controlate. Fiind mai degrabă legate de disfuncţiile altor experimente, studiile de laborator ex
post facto au multe limitări, pentru că ele nu manipulează variabila independentă, variabila
secundară nu este controlată, informaţia dată de ele este strâns legată de experimentul propriu-
zis şi de aceea sunt considerate a nu fi o adevărată investigaţie, pentru că nu se autosusţin.
Rezultatele lor se vor publica, în consecinţă, odată cu studiul principal în care au apărut.
44
3.6.5. Alte tipuri de experimente
Sydenstriker făcea diferenţa între experimentul simultan şi succesiv, superpozabilă
experimentului transversal (controlul grupului experimental cu grupul de control) şi
longitudinal (comparaţia grupului experimental cu sine însuşi, la momente diferite de timp).
Putem apoi distinge între experimentul explanator (care nu are o ipoteză prealabilă şi
se montează pentru a vedea ce se întâmplă) cu cel de confirmare (de verificare a unei ipoteze
principale, explicit formulată). Există de asemenea experimentul pilot (un fel de repetiţie, pe
lot mic de subiecţi, a unui experiment, pentru a verifica corectitudinea designului
experimental), şi experimentul crucial (verifică ipoteza de bază, fundamentală, a unei teorii,
sau forţează alegerea între două ipoteze reciproc exclusive).
Toate aceste experimente pot fi înţelese prin opoziţie la experimentul „adevărat”, de
confirmare (sau provocat), în care fenomenele sunt provocate în condiţii controlate, pentru a
verifica ipoteza de cercetare, prin manipularea variabilei independente. Alţi autori (Zlate,
2000, pp. 128-129) vorbesc şi despre autoexperiment, experimentul cu un singur subiect şi
experimentul mintal ce şi-au găsit utilitatea în diverse domenii ale psihologiei (socială,
cognitivă etc.).
Autoevaluare
1. Analizaţi într-un mic eseu (una, două pagini) sursele de probleme pe care le are la
dispoziţie psihologul consilier şcolar pentru a conduce investigaţii de tip experimental.
2. Luaţi din literatura de specialitate un experiment şi analizaţi calităţile ipotezelor specifice.
3. Detaliaţi problemele care se pun în legătură cu alegerea subiecţilor unui experiment, sub
raportul preciziei şi al reprezentativităţii.
4. Definiţi principalele planuri experimentale.
5. Evaluaţi valoarea şi limitele cvasiexperimentului.
6. Construiţi o fişă de programare a unei cercetări experimentale imaginare, desfăşurate în
şcoală, după modelul propus în curs.
7. Comparaţi experimentul de laborator cu cel natural (sau de teren) în privinţa avantajelor şi
a dezavantajelor fiecăruia.
8. Evaluaţi locul şi rolul experimentului psihopedagogic în şcoală.
9. Arătaţi care sunt tipurile de experimente ex post facto, indicând pe scurt valoarea şi
deficienţele fiecărui tip.
10. Analizaţi specificul şi valoarea metodei experimentale în evoluţia psihologiei ca ştiinţă.
45
Bibliografie
1. Campbell, D.T., Stanley, J.C. (1963). Experimental and cvasi-experimental designs
for research and teaching. Chicago: Rand McNally.
2. Chelcea, S. (1982). Experimentul în psihosociologie. Bucureşti: Editura Ştiinţifică şi
Enciclopedică.
3. Cook, T.D., Campbell, D.T. (1979). Quasi-experimentation. Design and analys issues
for field settings. Chicago: Rand MacNally.
4. Hohn, M., Vârgă, D. (2000). Ghid practic de psihologie experimentală. Timişoara:
Tipografia Universităţii de Vest.
5. Houser, R. (1998). Counseling and Educational Research. Evaluation and
Application. Thousand Oaks, London, New Delhi: Sage Publications.
6. Van Dalen & Meyer (1996). Understanding Educational Research. New York:
McGraw Hill.
46
REZUMAT
Planuri experimentale de bază
R O1 X O2
R O1 O2
Design 1. Un singur grup cu pretest şi posttest
O1 X O2
47
Design 6. Design contrabalansat
Replicări Xa Xb Xc Xd
1 A B C D
2 B D A C
3 C A D B
4 D C B A
Media scoruri coloane
Design-urile cvasi-experimentale
a. Designul cu grup de comparaţie static
Grup experimental X O2
Grup de control O2
b. Design cu grup de control neechivalent
O1 X O2
O1 O2
48
CAPITOLUL 4
DEZVOLTAREA SCALELOR
4.1. Introducere
O bună parte din activitatea practică a psihologului se sprijină pe diagnoza unor
aspecte cantitative ale aptitudinilor şi dimensiunilor definitorii pentru personalitate. În acest
scop el utilizează instrumente ale căror calităţi psihometrice trebuie construite şi evaluate în
cunoştinţă de cauză. În plus, pentru unele dimensiuni psihologice, pedagogice sau sociologice
specialistul trebuie să dezvolte singur scale destinate măsurării constructelor respective. Mai
mult, literatura domeniului face adesea referiri la aceste caracteristici, considerându-se
implicit valabil că psihologul este avizat în legătură cu aspectele tehnice implicate de
construcţia şi dezvoltarea scalelor psihodiagnostice.
Pe de altă parte, deşi se recunoaşte tacit că statistica este printre cele mai importante
instrumente al profesiunii de psiholog, ea determină încă o reacţie de rezistenţă, sau chiar de
respingere din partea studenţilor sau a novicilor, din cauza caracterului ei abstract şi
formalizat, sau a evoluţiei sale foarte rapide, prin care demersul matematic devine tot mai
sofisticat, parcă anume rezervat unei elite capabile să ţină pasul cu ceea ce s-a numit
„imperialismul metodologic” al ştiinţei. Capitolul pe care îl deschidem prin aceste rânduri
indică la modul clar cum o cunoaştere psihologică abstractă, de tip statistico-matematic,
devine extrem de utilă în contextul psihologic foarte concret al construcţiei de scale. El este
destinat a oferi reperele pe care psihologul, pedagogul sau sociologul trebuie să le aibă în
dezvoltarea scalelor de măsură a unor constructe specifice domeniului de activitate propriu.
49
desfăşura o analiză factorială exploratorie pentru a determina care itemi bat în direcţia
constructului presupus a fi măsurat şi care în alte direcţii, de a-i selecta şi reuni pe cei mai
reprezentativi într-o scală uni- sau multidimensională, de a determina gradul de consistenţă
internă (de omogenitate) al fiecărei subscale, stabilitatea ei în timp sau legătura cu constructul
măsurat prin corelare cu alte scale presupuse a măsura aceeaşi dimensiune. Un astfel de
demers – tipic pentru dezvoltarea unei scale – presupune un mare consum de energie şi el ar
putea să nu fie răsplătit cu rezultate corespunzătoare. Aceasta deoarece specialistul trebuie să
aibă o cunoaştere şi o conceptualizare prealabilă a domeniului care urmează să fie investigat,
fie din parcurgerea literaturii şi a teoriilor în legătură cu problema/ dimensiunea respectivă, fie
dintr-o experienţă prealabilă, fie – şi este cazul cel mai fericit – din amândouă direcţiile. Prin
aceasta dorim să afirmăm că aspectele tehnice care vor fi invocate în paginile care urmează nu
trebuie supraestimate în detrimentul înţelegerii naturii reale a conceptului sau faptului
psihologic care urmează a fi măsurat.
Recursul la teoriile cele mai consistente referitoare la acest construct este
fundamentală pentru că aceasta ne ajută şi ne ghidează în selectarea elementelor sale
esenţiale, care vor fi ulterior transformate în itemii scalei sau ai chestionarului. Multe dintre
dimensiunile şi constructele care definesc aspecte psihice, comportamentale sau sociale sunt
subtile, ambigue şi nu îşi găsesc o expresie directă sau deplină în experienţa de practician. De
aceea este foarte important să ne facem o idee cât mai clară despre ceea ce urmează a fi
măsurat. În acest sens teoria este de cel mai mare ajutor, pentru că ea ne ajută să ne facem o
idee clară asupra aspectului ce va fi abordat psihometric. Coroborând mai multe puncte de
vedere teoretice despre o problemă se degajă elementele sale esenţiale, dar şi neclarităţile sau
ambiguităţile, fapt care ajută specialistul să decidă dacă este necesară o nouă direcţie de
abordare şi să construiască o primă schiţă a acesteia.
De exemplu, suntem preocupaţi de o problemă practică, cum ar fi cea a tulburărilor de
citit-scris, şi observăm că această este mult mai frecventă la băieţi decât la fete. Am remarcat
de asemenea faptul că printre disgrafici şi dislexici proporţia stângacilor este de câteva ori mai
mare decât în restul populaţiei, ceea ce ne îndreptăţeşte să credem că aceste tulburări sunt
asociate cu probleme de lateralizare (manuală şi/sau corticală) a unor funcţii importante. De
aceea am dori să creăm un instrument care să fie utilizat ca adjuvant în tulburările
instrumentale şi care să diagnosticheze gradul de lateralizare manuală.
Literatura domeniului dominanţei manuale ne atrage atenţia asupra câtorva aspecte
esenţiale:
50
stângăcia poate fi ereditară sau non-ereditară, adică produsă prin alte mecanisme, cum
ar fi excesul de testosteron din primele luni de sarcină, care inhibă dezvoltarea
emisferei stângi, cel mai adesea dominantă în populaţia de bază, sau stângăcia
accidentală, prin scoaterea din uz a mâinii dominante un interval mai lung de 8 luni;
mecanismul asimetriei cerebrale are o transmitere genetică, gena LRRTM1 având o
mare contribuţie la aceasta, ea fiind însă implicată şi în producerea schizofreniei;
există o genă (rs după expresia lui Annett, 197219) care controlează orientarea levogiră
sau dextrogiră a unei persoane;
lateralizarea manuală se asociază strâns cu lateralizarea corticală a limbajului şi cu
dominanţa cerebrală;
lateralizarea manuală este impusă şi de presiunile socio-culturale enorme pentru
utilizarea mâinii drepte, presiuni evidenţiabile la aproape toate popoarele, din toate
timpurile, în unele culturi ea având şi importante conotaţii religioase;
rata stângacilor este aproximativ constantă (10% din populaţie) de-a lungul timpurilor,
deşi de-a lungul vieţii nuei singure persoane ea pare a fi într-o descreştere accentuată
spre vârstele adulte, datorită mortalităţii mai accentuate a stângacilor, de unde şi
speranţa de viaţă mai redusă a acestora;
bolile autoimune, alergiile, tulburările de somn, depresiile şi tentativele de suicid,
alături de problemele de învăţat, balbism şi enurezis nocturn sunt mult mai frecvente
pentru stângaci;
problema lateralizării nu se pune doar pentru utilizarea preferenţială a unei mâini, ci şi
pentru picior, hemicorp sau pentru organele de simţ cele mai performante (ochi şi
urechi), putându-se vorbi de o lateralizare omogenă sau eterogenă (încrucişată);
problemele de citit-scris-vorbit apar mai frevent la anumite categorii de stângaci
(lateralizare încrucişată, nefamilială, patologică etc.);
s-a avansat ideea că modul de tratare cerebrală a informaţiei de către stângaci este mai
curând integrat-holistic şi nu analitic-discursiv ca la dreptaci, de unde şi plusul lor de
creativitate;
stângacii se întâlnesc mult mai frecvent printre cei care urmează meserii vizuale, şi
foarte rar în cele dependente de limbă;
19
Annett, M. (1992). Spatial ability in subgroups of left- and right-handers. In British Journal of Psyuchology,
83, pp. 493-515.
51
măsurarea gradului de lateralizare cunoaşte câteva metode20 de tip chestionar, dar pot
fi gândite şi metode bazate pe acţiune şi observare (Annett, 1972);
dincolo de stângăcia „tare” sau dreptăcia „tare”, există variantele lor mai moi, o
multitudine de probleme fiind asociate mai curând cu lipsa unei lateralizări ferme,
decât cu stângăcia în sine;
stângăcia pare să aibă efecte dezadaptative şcolar mult mai mari printre elevii de gen
masculin decât printre cei de gen feminin.
Din toată această masă de informaţii şi din altele de acelaşi tip trebuie extrasă cea de
interes pentru scopurile scalei ce va fi construită şi apoi conceptualizată. Operaţionalizarea
enormei mase de informaţii despre stângaşi şi stângăcie înseamnă traducerea acesteia într-o
formă care să poată fi măsurată, în cazul nostru sub forma itemilor unui chestionar sau a unor
probe practice care vor compune itemii unui test de lateralitate. Aşa cum se observă, unele
dintre informaţiile de mai sus par a fi mai importante decât altele, având rolul de a ghida
întregul demers de construcţie a scalei. Mergând de exemplu pe modelul genetic al lui Annett
vom putea determina opt categorii referitoare la lateralitatea manuală. Dacă avem în vedere
problema omogenităţii/eterogenităţii lateralizătii va trebui să generăm şi să includem în scală
itemi legaţi de preferinţa pentru membrele inferioare, pentru ochi, ureche, hemicorp. Dacă
luăm în calcul dimensiunea ereditară a stângăciei vom avea itemi legaţi de frecvenţa acestei
particularităţi printre rudele apropiate, iar dacă avem în vedere dimensiunea ei evolutivă pe
scala vârstelor vom avea itemi care să distingă între manifestările timpurii şi cele ulterioare
ale stângăciei.
20
Oldfield, 1971: Edinburgh Handedness Questionnaire; Annett, 1970: Laterality tests and interests.
52
un chirurg dreptaci sau stângaci (Holder, 1992, Hand Preference Questionnaire21); dacă scala
este destinată vârstei de peste 14 ani, ea poate fi una care doar întreabă oamenii despre mâna
cu care scriu, desenează, taie, aruncă, se perie, mătură, deschid o cutie etc. (Edinburgh
Handedness Inventory, EHI, Oldfield, 197122); dacă este destinată determinării obiective a
mâinii dominante, se vor folosi itemi acţionali, grupaţi într-o scală ca cea a lui Annett, unde se
folosesc în acţiune efectivă cocoloaşe de hârtie, foarfece, chibrituri, periuţă de dinţi, ciocan de
jucărie etc. Copiii pot fi examinaţi şi în clasă, cerându-li-se să se joace în perechi pentru a
exersa acţiunile care vor fi observate, fapt ce va face posibilă completarea grilei de observaţie
sau a chestionarului acţional de către observator.
Într-o abordare de tip obiectiv noi23 am propus determinarea unui indice de lateralitate
prin două probe de tip acţiune, cronometrate: tapping (puncte bătute rapid pe o foaie de hârtie
cu creionul, cu mâna dreaptă, apoi cu mâna stângă, câte 10 secunde pentru fiecare, singura
constrângere fiind numărul de puncte) şi trasaj (linii verticale, drepte, apropiate, executate
rapid, câte 6 secunde cu mâna dreaptă, apoi cu cea stângă, după o execuţie demonstrativă
prealabilă a examinatorului).
Gradele de specificitate şi de obiectivitate cele mai ridicate sunt în ultimul exemplu,
deoarece probele sunt simple, clare, uşor de testat, iar dispozitivul de înregistrare este unul
precis. Mai mult, se operaţionalizează bine problema lateralizării pentru sarcinile motrice
grosiere şi pentru cele de fineţe, ambele fiind agregate într-un concludent Indice motric.
De această cerinţă a specificităţii se leagă şi problema a ce includem în scală pentru a
fi măsurat. În cazul de mai sus distincţia este evidentă: itemii sunt de tip autoraportare (primul
exemplu), rezultaţi din observaţie (al doilea exemplu) sau rezultaţi din măsurarea efectivă a
unor comportamente induse (al treilea exemplu).
Dacă am alcătui o scală care amestecă cele trei maniere de obţinere a itemilor ar
rezulta probabil un instrument compozit, eterogen, mai puţin maniabil. Problema se referă
însă nu numai la cum sunt produşi itemii, ci şi la conţinutul lor. De exemplu, dacă concepem
anxietatea ca pe un fenomen psihic (o teamă difuză, fără obiect) nu are rost să amestecăm
elemente somatice într-o fenomenologie psiho-comportamentală. Dar dacă am relevat
conotaţiile psihosomatice ale acesteia, putem concepe şi operaţionaliza anxietatea mult mai
nuanţat, dintr-o parte afectivă, una cognitivă şi una somatică, cum a procedat Burns în
21
Holder, M.K. (1992). Hand Preference Questionnaire: One Gets What one Asks For. M. Phil thesis,
Department of Antropology, Rutgers University, New Jersey, USA.
22
Oldfield, R.C. (1971). The assessment and analysis of hanhdedness: The Edinburgh Inventory.
Neuropsychologia, 9, pp. 77-114.
23
Clinciu, A.I. (2003). Vizual şi auditiv în structura cognitivă umană. Teză de doctorat nepublicată.
Universitatea Bucureşti, Facultatea de Psihologie şi Ştiinţele Educaţiei.
53
chestionarul său. Acesta şi-a construit Inventarul de anxietate astfel încât indicele global
obţinut să fie o expresie a sentimentelor anxioase, a gândurilor anxioase şi a simptomelor
anxioase de ordin fiziologic. Această perspectivă asupra anxietăţii este mult mai nuanţată şi
mai utilă într-o cercetare despre stres decât una care ar evalua doar aspectele cognitive sau
afective ale acesteia.
Pe de altă parte, într-un chestionar de scheme cognitive anxioase ar trebui respectată
reţeta cognitivistă de abordare, fiind eliminate referirile somatice la anxietate, în favoarea
cogniţiilor patologice.
54
poate fi utilă, pentru că nu putem şti cu suguranţă care dintre formulări este mai diagnostică şi
mai bine acceptată de subiecţi. De exemplu „Nu am nici un fel de jenă în a aborda persoane
necunoscute” şi „Îmi vine uşor să intru în vorbă cu persoane necunoscute” sunt enunţuri
foarte similare, deoarece au în vedere dimensiunea inhibiţiei, definitorie pentru fobia socială.
Diferenţele nu sunt însă pe sensul principal al enunţurilor, ci pe conotaţiile rezultate din
modul de exprimare al ideii: în prima situaţie propoziţia începe negativ, în a doua afirmativ;
în prima cuvântul jenă are şi conotaţii etice („fără ruşine”), ceea ce nu este cazul în a doua; în
prima formulare a aborda este mai pretenţios decât mai familiarul a intra în vorbă. Nu ştim
însă care dintre cele două formulări este cea mai bună şi de aceea le putem include în forma
iniţială a scalei, urmând să amânăm decizia legată de selecţia celui mai bun item până la
prelucrarea datelor rezultate din aplicarea instrumentului.
O regulă spune că putem tolera o oarecare redundanţă şi în faza finală de construcţie a
unei scale, deşi teoretic este permisă mai multă redundanţă în faza iniţială decât în cea finală,
pentru a da ocazia constructorului scalei să-şi manifeste preferinţele şi să selecteze forma mai
bună a itemilor redundanţi.
Problema redundanţei angajează direct o problemă la fel de importantă, cea a
numărului de itemi care compun setul iniţial. Noi ştim că un atribut fundamental al scalei
este consistenţa sa internă şi că aceasta este dependentă de două lucruri: de gradul de corelare
al fiecărui item cu scorul final la constructul măsurat şi de numărul de itemi ai scalei. De
aceea putem afirma că, cu cât un set iniţial de itemi este mai larg, cu atât este mai bine,
deoarece avem de unde selecta. Trebuie ştiut însă foarte bine că un set de itemi prea extins,
dintre care mulţi se repetă, poate genera consumuri de timp suplimentare, sau chiar plictiseală,
putând compromite sinceritatea şi autenticitatea răspunsurilor. De aceea cercetătorul poate
elimina din start itemii neclari, cu relevanţă scăzută sau cu prea multă similaritate, pentru a
rămâne în final la un set iniţial rezonabil, pe care să-l aplice într-o singură şedinţă, pentru a nu
avea prea multă „moarte experimentală”.
Deşi nu există reguli fixe, paritatea dintre lotul iniţial de itemi şi cel final poate fi de
de 4/1 sau 3/1 (30-40 de itemi iniţiali pentru o scală de 10 itemi) sau, cel mai adesea de 2/1,
atunci când itemii sunt construiţi cu grijă şi cu o bună cunoaştere a constructului măsurat.
Deoarece forma iniţială depinde de cea finală, cât de lungă trebuie să fie o scală pentru a avea
calităţi psihometrice bune? Este un răspuns dificil de furnizat, deoarece fiecare item poate fi
considerat ca o singură scală şi există chiar scale alcătuite dintr-un singur item.24 În mod
24
Torque Test este o probă cu un singur item care îşi propune să determine simultan preferinţa manuală şi
dominanţa cerebrală. Subiectul îşi scrie numele cu o mână şi apoi îl încercuieşte, după care face acelaşi lucru cu
55
obişnuit, cu cât o scală are mai mulţi itemi, cu atât mai mult ea poate dispune de calităţi
psihometrice (fidelitate, validitate, sensibilitate) mai bune; 50-60 de itemi pentru o scală
unidimensională reprezintă limita de sus, iar 10-20 de itemi limita de jos. Scalele sub 10 itemi
pot fi utile instrumente de screening, dar nu diferenţiază decât grosier între subiecţi, pe când
scalele lungi dau diferenţieri de mai mare fineţe.
cealaltă mână. Mâna care produce cea mai frumoasă scriere este cea preferată; dacă ambele cercuri sunt orientate
în sensul acelor de ceasornic, dominanţa cerebrală este de dreapta; dacă ambele cercuri sunt orientate în sensul
invers acelor de ceasornic, dominanţa cerebrală este de stânga; dominanţa cerebrală este mixtă în situaţia în care
un cerc are o orientare şi celălalt orientarea inversă.
Testul pare seducător prin simplitate şi acurateţe, dar are multe inconveniente. Asfel, mai ales în cazul scrierii,
preferinţa manuală poate fi impusă prin educaţie, subiectul efectuând multe alte acţiuni cu cealaltă mână. La o
singură aplicare poate interveni cu o oarecare probabilitate hazardul; nu ştim nimic de faptul dacă preferinţa
pentru mână se extinde şi asupra piciorului etc. (Vezi Molly Kalafut, Left-handedness. Nature or Nurture,
Blessing or Course?).
56
acceptarea prietenilor partenerului, de multitudinea de proiecte şi interese comune, de jocurile
comune, de aspectele hedonice şi nonhedonice ale relaţiei etc.?
Deşi este foarte greu de fixat reguli, dăm mai jos câteva caracteristici ale itemilor
buni şi răi, indicând şi cele mai frecvente erori care pot apărea în scrierea acestora.
Deşi nu este indicat să sacrificăm înţelesul itemilor în favoarea scurtimii lor se
recomandă ca itemii să fie scurţi şi clari. Putem formula acelaşi item astfel: „La o
petrecere reţin cu uşurinţă chipurile şi numele musafirilor”; „Îmi trebuie destul de mult
timp şi am adesea mari probleme în a memora de la prima întâlnire numele sau
chipurile invitaţilor la o petrecere mai mare”. Al doilea enunţ este de evitat pentru că
este lung şi neclar, pentru că introduce termenii destul de mult şi mai mare care sunt
vagi.
Nivelul de dificultate al citirii la care sunt scrişi itemii este de asemenea important.
Iată doi itemi din Miller Marital Locus of Control: „Adesea găsesc comportamentul
soţului meu nepredictibil”; „Când suntem în conflict, soţul meu este acela care
reconciliază cel mai adesea situaţia”. Cuvintele nepredictibil şi reconciliază ţin de un
nivel mai ridicat de cultură, fiind pretenţioase în raport cu omul comun. Deşi există o
mulţime de metode de a determina vârsta lecturii, s-a căzut de acord că nivelul de
lectură al omului care citeşte ziarul este corespunzător clasei a şasea (12 -13 ani).
Multe chestionare de personalitate (MMPI, CPI) presupun o vârstă a lecturii tipică
acestui nivel, fenomen de care dacă nu ţinem seama, reducem spectrul de utilizare al
unui instrument doar la anumite categorii de persoane. O propoziţie de lungime medie
pentru clasa a şasea are între 14 - 18 cuvinte şi 24 de silabe; pentru clasa a şaptea ea
are 18 cuvinte şi 24 de silabe. Pentru majoritatea instrumentelor care aspiră spre o
utilizare extensivă în populaţie nivelul de lectură anticipat este între clasa a cincea şi a
şasea. Dificultatea citirii şi înţelegerii unui text provine nu numai din lungimea sa, ci şi
din caracteristicile sintactice şi semantice ale itemului.
Cele mai frecvente erori de evitat sunt negaţia, dubla negaţie şi enunţurile dublu
încapsulate (cu dublă determinare). De exemplu formularea „Nu-mi place să nu-mi fac
temele” trebuie evitată, pentru că răspunsul solicită un efort de analiză mare iar
rezultatul final este nesigur. De fapt şi negaţia simplă creează probleme de claritate: la
itemul „Nu-mi plac rromii” răspunsul Nu poate să semnifice simultan acordul (nu, nu-
mi plac) sau dezacordul (nu sunt de acord cu propoziţia respectivă). Dubla determinare
este mai greu de sesizat. „Mă enervează la culme invidia şi dorinţa de răzbunare a
oamenilor” pune respondentul în dificultate atunci când sursa enervării sale este ori
57
numai invidia, ori numai dorinţa de răzbunare. Scorul pozitiv la acest item nu distinge
dacă prima, a doua sau ambele determinări trebuie să fie prezente pentru a răspunde
afirmativ la itemul respectiv. Alt exemplu: „Sprijin drepturile rromilor pentru că
discriminarea este un păcat pedepsit de Dumnezeu”. Pot să sprijin drepturile rromilor
pentru că discriminarea este împotriva valorilor democraţiei, pe care eu le apăr, şi nu
pentru ea că este un păcat pedepsit de instanţa divină.
25
DeVellis, R.F., Callahan, L.F. (1993). A brief measure of helplesness: The helplesness subscale of
Rheumatology Attitude Index. Journal of Rheumatology, 20, pp. 866-869.
58
slabe decât cei cu orientare directă şi că dezavantajele includerii lor în scală atârnă mai
greu decât presupusele beneficii. Soluţia ar fi, mai ales pentru chestionarele mai lungi,
ca numărul acestor itemi să fie mai mic decât cei formulaţi pozitiv, dar să fie
diseminaţi printre aceştia.
26
Vogt, W.P. (1999). Dictionary of Statistics and Methodology. A Nontechnical Guide for the Social Sciences.
Sec. edition. Thousand Oaks, London, New Delhi: Sage Publications, p. 256.
59
ţine chiar de modalităţile de gradare a acordului/dezacordului din variantele de răspuns
propuse, fapt de care am vorbit deja.
O a doua modalitate ţine de tăria/slăbiciunea modului cum este exprimat itemul însuşi.
De exemplu, opinia despre politicienii români post-decembrişti ar putea fi exprimată la trei
niveluri de tărie („duritate”):
1. „Dezastrul moral şi economic din România post-revoluţionară este integral opera politicienilor
incompetenţi pe care i-am avut.”
2. „Deoarece nu am avut o clasă politică constituită în timp, liderii politici ai României post-
revoluţionare au întârziat evoluţia economico-socială a ţării din cauza greşelilor provocate de lipsa lor
de experienţă.”
3. „În pofida unor greşeli cauzate de lipsa de experienţă, politicienii români sunt pe cale să
construiască o democraţie reală în România post-revoluţionară.”
Cum tendinţa obişnuită a majorităţii oamenilor este aceea de nu fi – din bun simţ –
prea ofensiv-agresivi, prima afirmaţie ar putea discrimina doar printre cazurile extreme,
deoarece este una foarte tare. Ultima afirmaţie, care este cea mai moale şi mai împăciuitoristă
are un caracter mai agreabil, ar putea conveni majorităţii oamenilor, dar ar putea indica mai
mult lipsa opiniei, decât prezenţa ei. Ori o cercetare caută mai curând ceea ce este şi se
manifestă (prezenţa), decât ceea ce nu este (absenţa). Aşadar este o iluzie să credem că un
item poate baleia întreg spectrul unei opinii în unităţi de lungime egală. Avem doar
posibilitatea ca, din combinarea tăriei/slăbiciunii modului de formulare a itemilor şi din
tipurile de gradaţii de pe scala de răspuns folosită să „centrăm” itemul pentru zona
populaţională şi pe problema care ne interesează. Itemul trebuie să răspundă la întrebarea:
„Cum sunt dispuşi să răspundă oamenii la diferitele intensităţi sau tării ale constructului
măsurat prin acest item?”. Iată şi două exemple de itemi construiţi pe scala Likert:
Prin sistemul reformei de la Bologna, învăţământul românesc s-a integrat bine învăţământului
european.
1. Dezacord 2. Dezacord 3. Dezacord 4. Acord 5. Acord 6. Acord
puternic moderat uşor uşor moderat puternic
Combaterea consumului de ţigări este o prioritate naţională de vârf.
1. Complet 2. Mai curând 3. Aşa şi aşa 4. Mai curând 5. Complet
adevărat adevărat neadevărat neadevărat
60
b. Scalele Thurstone
Modalitate complexă, rafinată şi dificilă de a construi itemii unei scale, iniţiată de
Thurstone, acest tip de scală şi-a pierdut mult din relevanţă în favoarea scalelor Likert. În
principiu eleganţa şi dificultatea metodei vine din pre-calibrarea itemilor şi asamblarea lor
pentru a răspunde la diferite niveluri de prezenţă în item a atributului sau a constructului
măsurat. De regulă, în acest tip de scală răspunsurile nu mai au o multitudine de nuanţe,
deoarece gradarea intensităţii este pe verticală (mai mulţi itemi asamblaţi pe o aceeaşi coloană
în funcţie de mărimea progresivă a atributului măsurat), şi nu pe orizontală (modalităţi din ce
în ce mai accentuate ale intensităţii atributului la un singur item, tipic pentru scala Likert).
Astfel, pentru aceeaşi idee se generează mai mulţi itemi (care au formulări diferite) care să
reprezinte intervale egale de-a lungul unui continuum vertical, ceea ce conferă scalei
proprietăţi matematice remarcabile, pentru că se pretează la tratamente statistice tipice
scalelor de intervale. Nunaly (1978) susţine că este incomparabil mai uşor să explici principul
unei scale Thurstone decât să o construieşti. A găsi itemi care să „rezoneze” la intervale egale
cu constructul măsurat (ca un diapazon acordat pe o anumită frecvenţă) este destul de dificil.
Acest deziderat exprimat de scalele Thurstone şi-a găsit totuşi o manieră de rezolvare prin
Teoria răspunsului la itemi, unde calibrarea acestora urmăreşte totuşi un cu totul alt demers.
Exemplul 1.
61
Exemplul 2.
a. Faptul de a termina cu medie mare şcoala şi de a prinde un liceu bun este tot ce-mi doresc ca
răsplată de la copilul meu. Acord ........................ Dezacord ...................
b. Pentru mine ca părinte cea mai mare răsplată din partea copilului este să fie sănătos şi să meargă la
şcoală. Acord ........................ Dezacord ....................
c. Fericirea copilului meu nu are nimic de-a face cu ceea ce el dobândeşte prin educaţia şcolară sau cu
scopurile materiale. Acord ........................ Dezacord ....................
c. Scalele Guttman
Acestea sunt un tip de scală creat de Louis Guttman. Original ea a fost destinată să fie
utilizată după ce datele au fost colectate, pentru a vedea dacă ietemii dintr-un index pot fi
aranjaţi într-o scală în funcţie de tăria sau de puterea lor. De exemplu, într-o cercetare despre
avorturi itemii unui chestionar pot fi aranjaţi ierarhic ca intensitate astfel:
Aţi fi de acord ca femeile să facă avort dacă:
1. A nu face avort i-ar periclita viaţa proprie?
2. Fătul este malformat?
3. Este prea săracă pentru a se putea ocupa în mod adecvat de copil?
4. Ea nu mai doreşte să aibă copii?
Cine ar răspunde la această întrebare ar face-o într-o manieră scalară: persoanele care au
răspuns afirmativ la întrebarea 4 ar fi răspuns afirmativ şi la întrebările 1, 2, 3; cele care au
răspuns la întrebarea 3 ar fi răspuns şi la întrebările 1 şi 2, dar nu obligatoriu şi la 4, şi aşa mai
departe. Dacă scala nu ar fi de tip Guttman, nu ar exista un astfel de pattern şi răspunsul
afirmativ la numărul 4 nu ar implica răspunsurile afirmative şi la celelalte 3 întrebări.
27
Vezi Laurens, S., Moscovici, S. (2007). Construirea scalelor. In S. Moscovici, F. Bruschini (coord.),
Metodologia ştiinţelor socioumane. Iaşi: Polirom, pp. 482-414.
62
Scalele Guttman sunt foarte utile şi indicate pentru informaţiile obiective sau în
situaţiile în care este logic necesar ca, dacă ai răspuns afirmativ la un anumit nivel dintr-o
ierahie, aceasta înseamnă să faci acelaşi lucru şi pentru nivelurile inferioare ale ierarhiei. De
exemplu, la întrebarea dacă fumaţi, variantele de răspuns pot fi organizate ierarhic astfel: nu
fumez deloc; fumez sub 10 ţigări pe zi; fumez sub 20 de ţigări pe zi; fumez sub 30 de ţigări pe
zi; fumez mai mult de 30 de ţigări pe zi. Variantele de răspuns sunt aranjate astfel că nivelul la
care este prezent atributul este indicat de cel mai de sus item la care subiectul a dat un răspuns
afirmativ, cei de sub el fiind şi ei implicit afirmativi (deoarece reprezintă niveluri mai scăzute
ale atributului). Deci această scală presupune o gradaţie şi decelarea punctului critic în care
răspunsul afirmativ devine negativ.
Dacă pentru informaţiile obiective scala Guttman este foarte indicată, pentru alte
categorii de fenomene este dificil de ordonat răspunsurile într-o manieră uniformă pentru toţi
indivizii, fapt care limitează utilizarea acestui tip de scală. Pentru situaţiile în care ordonarea
itemilor este importantă, modelele bazate pe teoria răspunsului la itemi par a oferi soluţii mai
adecvate. Prezentă mai jos doi dintre itemii scalei de depresie Beck, asamblaţi pe o scală
Guttman:
A. TRISTEŢE
1. Nu mă simt trist.
2. Mă simt trist.
3. Sunt trist tot timpul şi nu pot scăpa de tristeţe.
4. Sunt atât de trist şi de nefericit încât nu mai pot suporta.
B. PESIMISM
1. Viitorul nu mă descurajează.
2. Mă simt descurajat când mă gândesc la viitor.
3. Simt că nu am ce aştepta de la viitor.
4. Simt că viitorul este fără speranţă şi nimic nu se mai poate îndrepta.
63
religioase. Scala Bogardus poate fi considerată în acelaşi timp şi o scală de proximitate
deoarece indică cea mai mică proximitate acceptabilă pentru un individ faţă de grupul luat în
considerare. Individul este chestionat dacă ar fi dispus, de exemplu, să trăiască în aceeaşi ţară
cu rromi; să trăiască în aceeaşi localitate cu aceştia; să aibă vecini rromi; să locuiască în
aceeaşi casă cu rromi; să aibă prieteni de etnie rromă; să aibă rude rromi; să aibă un copil care
se căsătoreşte cu o persoană de etnie rromă.
Populaţiile pot fi comparate simultan trecând pe verticală categoriile de proximitate iar
pe orizontală populaţiile ce vor fi comparate: negri, latino, europeni, asiatici, sau turci, evrei,
polonezi, spanioli etc., pentru America. Sau români, maghiari, saşi, ţigani, ruteni etc. perntru
România. Evident, distanţele studiate sunt unele sociale şi nu fizice, dar exprimarea în termeni
fizici a acestora este judicioasă. Acest tip de scală permite compararea atitudinilor grupurilor
faţă de alte grupuri deoarece enunţurile despre obiectul social studiat pot să fie astfel clasate
pentru a indica fie proximitatea, fie distanţa. „Scalele construite în acest fel dau rezultate în
acelaşi timp interesante şi valide” apreciază Laurens şi Moscovici (op. cit., p. 391).
64
posibilitatea de a diferenţia realmente între valorile de scor apropiate descreşte. În practică
rareori se folosesc mai mult de 7-11 clase de scor şi foarte frecvent între 3 şi 7.
Opţiunea binară de scorare este frecvent utilizată, căci, deşi au cea mai mică
variabilitate a scorurilor per item, scalele de acest tip se completează extrem de facil şi rapid,
lăsând deschisă posibilitatea de a introduce un număr mai mare de itemi pentru a creşte
variabilitatea de ansamblu a scalei sau pentru a vedea cum noi categorii de fapte coroborează
cu constructul măsurat. Această manieră de scorare este tipică – dar nu exclusivă! – scalelor
Thurstone şi Guttman datorită complexităţii de construcţie a itemului, care agregă pe verticală
mai multe enunţuri gradate ierarhic. De asemenea, acest tip de itemi este numit şi cu alegere
forţată28. Datorita uşurinţei cu care se lucrează, opţiunea binară este extrem de utilă în
completarea listelor de adjective prin care se investighează trăsăturile de personalitate
(modelele Big Five).
Dacă la un pol sunt opţiunile binare, la celalălalt pol este numărul mare sau foarte
mare de clase de scor care pot aduce, cum am arătat anterior, o falsă precizie, adică o falsă
variabilitate. Din statistică ştim că variabilitatea poate fi descompusă într-o parte bună, numită
şi sistematică, deoarece este strâns legată de oscilaţiile reale ale prezenţei constructului
măsurat în item, şi dintr-o parte rea, de eroare. Deoarece creştarea variabilităţii pe scalele cu
număr mare de variante de răspuns se face în contul erorii, şi nu al variabilităţii sistematice,
nu este indicat să avem prea multe valori de scor. Numărul acestora este impus finalmente de
abilitatea respondenţilor de a discrimina semnificativ între variantele de scor propuse pentru
fiecare item. Această capacitate depinde şi de aranjarea în pagină a variantelor de răspuns
asfel încât acestea să sugereze un continuum. Astfel secvenţa:
sugerează bine un continuu temporal, divizat în unităţi discrete de tipul frecvenţei de apariţie.
O problemă importantă este dacă optăm pentru un număr impar de categorii de
răspuns, ceea ce în principiu este bine, pentru că se creează o anumită simetrie în jurul unui
punct zero natural. Acest fapt oferă însă de multe ori indecişilor posibilitatea refugierii în
răspunsul evaziv din mijloc. Numărul par sau impar de opţiuni este mai puţin important decât
modul cum sunt aranjate variantele de răspuns astfel ca distanţele dintre ele să fie aproximativ
egale pentru a exprima gradul de acord sau de dezacord. Aceasta pentru că datele vor fi
codificate numeric prin cifre (1, 2, 3, 4, 5 pentru cinci variante de răspuns, de la foarte puţin
28
Atenţie, itemii cu alegere forţată nu sunt numai cei binari, de tipul Adevărat/Fals sau Da/Nu, ci şi unii itemi
pari pentru care, neexistând varianta ehivocă din mijloc („aşa şi aşa”), subiectul trebuie să opteze clar într-o
direcţie sau în alta.
65
sau deloc, la foarte mult sau în întregime, ori invers 7, 6, 5, 4, 3, 2, 1 pentru o scală care
începe de exemplu cu totdeauna şi se termină cu niciodată). Se poate construi astfel un
continuum divizat într-un număr de trepte (3-7 trepte), de la dezacordul total, la acordul
deplin sau invers.
În legătură cu punctul de simetrie din mijloc, el poate avea semnificaţii diferite. Astfel
nici acord, nici dezacord indică mai curând o atitudine apatică, pe când la fel de mult acord şi
dezacord sugerează o atracţie egală faţă de ambele variante de răspuns. Deci în cazul
numărului impar de variante de răspuns trebuie să controlăm ca subiectul să nu selecteze
varianta neutră doar pentru a evita o alegere, oferind astfel un răspuns echivoc, cu o valoare
discutabilă. În majoritatea situaţiilor cercetătorul încearcă să evite echivocul punctului central
şi să forţeze o alegere clară, dar trebuie spus că opţiunea pentru variante pare/impare de
răspuns este funcţie de întrebare, de răspus şi de scopul investigaţiei. Într-o cercetare cu două
variante extreme de răspuns (ce situaţii preferi: pe cele plicticoase?; pe cele primejdioase?)
introducerea variantei de răspuns între cele două poate fi pe deplin justificată, subiecţii
neputând alege întotdeauna între situaţii atât de tranşant delimitate.
Ca tip de format al răspunsurilor amintim şi diferenţialul semantic al lui Osgood şi
Tannenbaum (1955). Utilizat în studierea atitudinilor de grup, acest mod de scalare presupune
identificarea unui grup ce este studiat (să zicem avocaţi) şi a unei liste de perechi de adjective.
Onest __ __ __ __ __ __ __ __ __ Neonest
Competent __ __ __ __ __ __ __ __ __ Incompetent
Vorbăreţ __ __ __ __ __ __ __ __ __ Taciturn
Liniuţele (de regulă 7 sau 9) reconstituie un continuu între polii definiţi de cele două
adjective, subiectul marcând cu un X punctul de pe acest continuu pe care el crede că se află
membrii categoriei respective, după care trece la ratingul următoarei perechi de adjective,
până la epuizarea întregii liste. Prin prelucrarea separată pe fiecare pereche de adjective se
poate obţine un portret robot al grupului respectiv. Deoarece acest tip de scală are foarte multe
din caracteristicile necesare unor prelucrări matematice riguroase, finalmente itemii valoroşi
care au fost selectaţi pot fi asamblaţi într-o scală omogenă (de onestitate, de competenţă, de
moralitate etc.).
66
exact în locul unde crede că s-ar plasa opinia, credinţa sau experienţa sa. Ceea ce se
înregistrează şi se prelucrează este distanţa măsurată faţă de unul dintre poli (se porneşte de
regulă de la cel care înseamnă absenţa).
Deşi pare seducător, acest tip de scală are destul de multe dezavantaje. De multe ori
precizia sa este o falsă precizie, marcarea punctului pe linie implicând şi o doză de hazard sau
de circumstanţialitate. Un subiect va distinge cu greu între o frică de 6,7 cm de una de 6,5 cm.
Mai mult, asignarea valorilor scalei poate fi una idiosincratică, adică distanţele marcate să
aibă semnificaţii diferite de la un subiect la altul sau la acelaşi subiect la perioade de timp
diferite.
Şi totuşi, aceasta poate fi un tip de măsurătoare foarte utilă atunci când cercetările se
fac pe acelaşi subiect pentru a măsura diferenţele pe care tratamentul experimental le poate
aduce în tratarea fobiilor, în creşterea nivelului de motivaţie sau în alte direcţii. Astfel, dacă
scala Likert împarte un continuu într-un număr finit şi mic de categorii, fiind foarte maniabilă,
dar mai puţin sensibilă, scala analogului vizual poate fi sensibilă la diferenţe mici: dacă
răspunsurile la post-manipulare se depărtează semnificativ şi în aceeaşi direcţie în raport cu
faza de pre-manipulare, se pot detecta diferenţele mici pe care le-a adus tratamentul
experimental. Scala poate fi folosită şi ca una alcătuită dintr-un singur item, caz în care nu se
mai poate distinge cu claritate între instabilitatea măsurătorii şi instabilitatea fenomenului
măsurat. Prin urmare, cea mai bună strategie ar fi aceea de a dezvolta mai multe măsurătorii
de tipul analogului vizual pentru acelaşi fenomen, de a le asambla într-o scală şi de a-i
determina consistenţa internă (stabilitatea).
O ultimă problemă este cea legată de cadrul temporal la care pot face sau nu referire
itemii unei scale. Preluând distincţia pe care a făcut-o Cattell în legătură cu unele dispoziţii de
personalitate care au un caracter situaţional, în timp ce altele reprezintă structuri stabile de
personalitate numite trăsături, Spielberger a dezvoltat scala STAI, în fapt o măsură a anxietăţii
ca stare (conjuncturală) şi ca trăsătură de personalitate (stabilă). Se ştie de asemenea că multe
componente ale personalităţii au mai multă sau mai puţină stabilitate pe axa timpului:
fenomenologia afectivă de exemplu (emoţie, anxietate, depresie) este mai fluctuantă decât cea
cognitivă (inteligenţă, memorie).
O scală trebuie să facă referinţe şi la dimensiunea temporală? Răspunsul este
nuanţat: dacă constructul măsurat are o variabilitate temporală mare răspunsul este Da, dacă el
67
este stabil în timp (cazul trăsăturilor de personalitate) răspunsul este Nu. Astfel, chestionarul
de depresie Burns se aplică periodic pacienţilor depresivi pentru a monitoriza evoluţia
depresiei lor în timp. Multe chestionare care urmăresc aspecte fluctuante menţionează în
instructaj formule de tipul în ultima lună, în ultima săptămână, în ultimele zile, în ultimul timp
etc. Unele chestionare includ itemi destinaţi detectării modificărilor de dispoziţie apărute
recent (un eveniment stresant) sau pe perioade mai lungi de timp (reforma post-revoluţie,
intrarea ţării în NATO etc.). Chiar formatul de răspuns al itemilor poate avea în vedere
decuparea continuumului temporal în unităţi mai mici (uneori, din când în când, des, în
ultimul timp etc.).
68
evidenţierea fenomenelor sau a caracteristicilor importante asociate cu constructul ce
va fi măsurat care nu s-au materializat în itemi corespunzători, setul iniţial trebuind
deci augmentat cu noi itemi.
Prin revizuirea multitudinii de demersuri prin care vrem să surprindem constructul ce
ne interesează şi prin examenul critic al itemilor destinaţi acestui scop experţii ne pot ajuta la
maximizarea validităţii de construct şi de conţinut a scalei. Trebuie însă precizat că cel care ia
deciziile finale este cel care construieşte efectiv scala, şi nu experţii. Este posibil ca faza
pregătitoare pe care constructorul de scală a parcurs-o să-i fi dat un grad de cuprindere şi de
înţelegere a problemei mai bun decât al fiecărui expert în parte, aşadar solicitarea lor de a fi
eliminaţi anumiţi itemi trebuie examinată cu atenţie pentru a vedea dacă ea are sau nu temei.
În al doilea rând, cel mai adesea experţii vor tinde să elimine itemii redundanţi, eliminând
astfel posibilitatea constructorului de scală de a alege şi de a păstra dintre cele două formulări
aparent echivalente ale unor itemi, pe cea care se impune din analiza datelor rezultate din
aplicarea instrumentului.
69
sau expresii le au într-o anumită categorie populaţională, generînd sensuri care nu au fost
avute în vedere intenţionat de către constructorul scalei sau care nu se regăsesc ca atare şi în
populaţia ţintă mai largă.
70
vechea variabilă este înlocuită cu cea rezultată după scorarea inversă. Avantajul este acela că
se poate face transformarea simultană, în bloc, a tuturor variabilelor de acelaşi format (cu
acelaşi număr de categorii de răspuns, definite în acelaşi fel).
Pentru că nu suntem întotdeauna siguri dacă rezultatul obţinut prin scorare inversă este
mai bun decât cel precedent, este bine să lucrăm pe o copie a fişierului sursă, copie numită de
exemplu „Itemi inversaţi”. Nu întotdeauna inversarea scorării, urmată de refacerea matricii de
intercorelaţii, rezolvă problema unui item. Este posibil ca el să fie corelat pozitiv cu unii
dintre itemi şi negativ cu alţii, deoarece el poate fi expresie a unui alt construct. În acest caz
soluţia potrivită este eliminarea itemului respectiv, pentru a nu periclita omogenitatea de
ansamblu a scalei.
b. Corelaţia item-scală
În SPSS procedeul de lucru pentru acest tip de analiză este relativ simplu, deoarece se
urmează următoarea secvenţă: Analyse→Scale→Reliability→Alpha→Statistics, de unde se
activează Item, Scale; Scale if item deleted (scala, dacă itemul ar fi înlăturat). Dacă dorim să
obţinem şi o matrice de intercorelaţii sau o matrice de covarianţe, în dreapta-sus avem panoul
Inter-Item, de unde selectăm Correlations sau Covariances (vezi imaginea de mai jos).
Finalmente dăm Continue pentru fereastra Reliability Analysis: Statistics şi apoi OK din
fereastra Reliability Analysis, după ce vom fi introdus în panoul de lucru din dreapta-sus
(Items:) toţi itemii care vor fi supuşi analizei.
71
R E L I A B I L I T Y A N A L Y S I S - S C A L E (A L P H A)
72
Fiecare dintre fragmentele de output de mai sus trebuie examinate cu mare atenţie.
Primul element investigat este varianţa itemilor, pentru că de aceasta depinde finalmente
variabilitatea întregii scale. Dacă toţi indivizii investigaţi ar răspunde doar într-un singur fel la
un item, varianţa (variabilitatea) sa ar fi zero, el nefiind de nici un folos în surprinderea
constructului de măsurat. Cum unii subiecţi răspund într-un fel, iar alţii în altul, fiecare item
are variabilităţi mai mari sau mai mici: cei mai dezirabili sunt cei cu variabilitate mare. În
cazul de mai sus, itemii cu cea mai mare variabilitate sunt în ordine 6, 9, 4, 7 şi 8, care au o
abatere standard în jur de 0,50.
Experienţa statistică ne arată că este mai bine să nu examinăm abaterea standard
separat, făcând abstracţie de medie. În principiu, cu cât aceasta este mai apropiată de centrul
intervalului de răspuns, cu atât este mai bine, pentru că ea va face posibilă mai multă
variabilitate a itemului. În condiţiile în care la stânga au fost plasaţi descriptorii pentru
dezacord şi la dreapta pentru acord, dacă media este asimetrică spre dreapta (negativ)
înseamnă că majoritatea respondenţilor au ţinut să fie de acord cu conţinutul itemului
respectiv, deci el a fost formulat „moale”; dacă asimetria este spre stânga (pozitivă) înseamnă
că majoritatea şi-a exprimat dezacordul cu conţinutul itemului (formulare sa a fost cam
„tare”).
În cazurile de asimetrie se ştie de asemenea faptul că puterea discriminativă a itemului
este mai mare pe „coada” (creoda) curbei gaussiene şi mai mică pe ramura sa mai scurtă. Cum
o distribuţie simetrică (cu media pe centrul seriei de variaţie) are două cozi lungi, înseamnă că
puterea discriminativă a unui item de acest fel este maximă, el putând distinge la fel de bine în
ambele direcţii.
În cazul nostru, deoarece numărul itemilor destinaţi depistării dezordinilor alimentare
a fost foarte mare – 112 – am folosit scorarea dihotomică, deci valoarea medie optimă ar
trebui să cadă la jumătatea intervalului 0 – 1, adică în jurul lui 0,50, ceea ce se întâmplă doar
pentru itemii 6 şi 9.29 Verificarea simultană a mediei şi abaterii standard este o condiţie
prealabilă obligatorie pentru o tentativă de selecţie a itemilor care se bazează în principal pe
corelaţie. Din această analiză reiese că, la prima vedere, itemii 7 şi 9 au simultan cele mai
bune varianţe şi valori medii.
Decizia finală se ia însă după ce se analizează atent datele din panoul Item-total
Statistics care are următoarea structură: primele două coloane dau valorile medii şi abaterile
29
Trebuie menţionat că ipoteza răspândirii gaussiene a simptomelor tulburărilor alimentare în populaţia de bază
este una care nu poate fi susţinută, deoarece o mulţime de itemi care determină anorexia şi bulimia sunt relativ
rar întâlniţi la persoanele obişnuite. Aceştia itemi vor avea probabil o altă distribuţie pentru populaţiile speciale
pe care scala va fi validată.
73
standard pentru valorile totale ale scalei, în situaţia în care itemul nu participă la scorul total.
Pentru scalele cu număr mare de itemi corecţia adusă la parametrii scalei prin absenţa unei
singure valori de scor este neglijabilă, dar ea devine cu atât mai importantă cu cât numărul
itemilor scalei este mai mic, fiind importantă de exemplu pentru scala de 10 itemi. Coloana
Corrected Item-Total Correlation este de maximă importanţă în luarea deciziei de selecţie
deoarece ea indică gradul de asociere a fiecărui item cu scorul total, adică saturaţia sa în
variabila latentă măsurată. În cazul nostru itemul 10 are o corelaţie excelentă cu scala (.48), în
timp ce itemii 3, 4 şi mai ales 6 au corelaţii slabe (itemul 6 chiar negativă) cu scorul total.
Dacă scala noastră ar fi unidimensională (adică ar măsura doar un singur construct şi
nu mai multe) o valoare a corelaţiei item-scală în jur de .30 ar fi suficientă pentru includerea
itemului în scală, iar una de .40 aproape că ne forţează să facem acest lucru. Aici este cazul să
spunem că nu ne vom concentra atenţia doar pe numerele de cod ale itemilor, fapt care ne
împiedică să ştim care este conţinutul lor. Cu foaia de test în mână, după ce am identificat
itemii cu formulări foarte asemănătoare (redundanţi), luăm în cunoştinţă de cauză decizia de
a-i păstra pe cei cu calităţile psihometrice cele mai bune şi de a-i elimina pe cei mai slabi.
Ultima coloană are de asemenea un rol important în luarea deciziei relative la selecţia
itemilor deoarece ne indică cât ar fi fost coeficientul de consistenţă internă alpha dacă itemul
analizat ar fi fost eliminat. Prin compararea cu scorul de referinţă al acestui coeficient (.88
pentru toată scala iniţială, adică foarte mare) putem vedea dacă absenţa itemului ameliorează
valoarea lui alpha (caz în care el trebuie eliminat) sau dimpotrivă, o scade (semn că este unul
util). În cazul nostru itemul 6 este sigur unul condamnat, deoarece el dă o corelaţie uşor
negativă cu scala şi nu este consistent cu aceasta (absenţa lui din scală îl măreşte pe alpha).
Şi totuşi nu suntem încă în măsură să luăm decizia finală pentru că nu am răspuns clar
la întrebarea fundamentală dacă itemii testului măsoară sau bat în direcţia unei singure
variabile (scală unidimensională) sau a mai multora (scală multidimensională, neomogenă).
Supoziţia implicită pentru indicele de consistenţă internă alpha al lui Cronbach este aceea că
toţi itemii măsoară o singură variabilă latentă, fapt ce nu este dat prin definiţie, ci trebuie atent
verificat.
74
Am solicitat din start un număr cel puţin mediu de subiecţi (250-300) pentru a efectua o
analiză factorială corectă deoarece când este desfăşurată pe prea puţine cazuri, ea poate să dea
valori instabile, ce compromit uneori iremediabil întregul proces de construcţie a scalei. Să
reţinem deci că, în această fază de construcţie a scalei, determinarea prin analiză factorială a
variabilei latente care stă în spatele unui set de itemi este un fapt crucial.
Mergând mai departe cu exerciţiul nostru prezentăm secvenţa de lucru pentru a efectua
analiza factorială exploratorie: Analyse→DataReduction→Factor, care produce deschiderea
următoarei fereastre de lucru, în care vom introduce (prima fereastră, panoul din dreapta-sus)
toate datele de analizat, adică toţi itemii chestionarului nostru.
Pentru un număr aşa de mare de itemi nu vom efectua nici o rotaţie (butonul din
mijloc de la figura din stânga de mai sus), dar de la Options putem să selectăm Supress
absolute values less than: (suprimarea valorilor mai mici decât:) pentru a pune valoarea de
.30 în ferestruica respectivă, care are din setare valoarea .10, dar neactivată (vezi fereastra din
dreapta-jos). În felul acesta valorile ce indică saturaţii mici şi nesemnificative în factorii
descoperiţi nu vor mai fi afişaţi, fapt ce uşurează inspecţia vizuală, selecţia şi luarea deciziilor.
Trebuie precizat că metoda componentelor principale – care este opţiunea de bază a
programului – este utilă mai ales pentru a vedea dacă există un factor general (cu o varianţă
mai mare de 50%) ce defineşte variabilă latentă, sau dacă nu cumva există mai mulţi factori
de magnitudine mai mică, ce acoperă întreaga varianţă a scorurilor scalei studiate. Vom putea
vedea deci dacă avem de-a face cu o scală uni- sau multi-dimensională.
Atragem de asemenea atenţia asupra faptului că dacă o singură variabilă inclusă în
panoul de lucru are varianţa zero, analiza factorială nu mai poate fi efectuată. Deoarece acesta
este şi cazul chestionarului nostru, identificăm variabila sau variabilele cu varianţă zero prin
75
Frequencies ori Descriptives. În cazul nostru itemul 66 trebuie eliminat din analiză (şi din
scală deoarece, având varianţa zero, el nu are nici o utilitate), după care reluăm analiza
factorială. Aceasta va produce mai multe output-uri, din care două sunt esenţiale.
Outputul de mai sus indică faptul că itemii iniţiali nu produc un singur factor general,
ci câteva zeci (fapt curent în construcţia de scale cu număr mare de itemi), din care primul
acoperă doar 13,36% din varianţă (deci este foarte departe de a fi un factor general), al doilea
8,21%, al treilea 4,96% etc. Chiar şi al şaisprezecelea factor produce o valoare eigen peste 2
(2,08%), ceea ce poate părea un adevărat coşmar statistic. Lucrurile nu stau însă chiar aşa.
Dacă analizăm cu atenţie outputul al doilea din figura 1.4, observăm că acesta devine o
adevărată grilă de selecţie pentru factorii mai importanţi care vor fi reţinuţi. Astfel, itemii vor
fi alocaţi la acei factori pentru care ei au cele mai mari corelaţii (saturaţii în factorul
respectiv). Atunci când se poate, itemii cu saturaţii negative se alocă la factorul cu care
corelează pozitiv mai semnificativ, pentru a nu schimba maniera de scorare; la valori foarte
apropiate ale saturaţiilor, un item se alocă scalei mai scurte pentru a o fortifica, deoarece ştim
că puterea unei scale depinde şi de numărul itemilor care o compun.
Observăm că, după ce încep să fie alocaţi la primii trei factori, mai rămân foarte puţini
itemi sau deloc pentru factorii următori, şi această deoarece mulţi itemi îşi împart varianţa
între mai mulţi factori (nu sunt foarte specifici). Alocând itemii factorului pentru care ei au
cea mai mare saturaţie, celorlalţi factori le rămân tot mai puţini itemi, aceasta deoarece primii
factori dau corelaţii mai mari cu itemii, având deci prioritate în selecţia acestora. De fapt
76
afişarea în tabel a factorilor de la stânga la dreapta se face în ordinea magnitudii lor, dată de
mărimea corelaţiilor cu itemii, dar şi de numărul acestor corelaţii. Itemii care nu se
repartizează în primele 3-4 categorii vor putea defini şi ei nişte factori de magnitudine mai
redusă, dar reunindu-i în scale şi studiind alpha pentru acestea vom observa că consistenţa
internă este din ce în ce mai mică pentru factorii extraşi ultimii.
77
Finalmente, scala desemnând factorul 1 arată ca în figura de mai jos.
R E L I A B I L I T Y A N A L Y S I S - S C A L E (A L P H A)
Mean Std Dev Cases
1. CEDA005 .2000 .4031 65.0
2. CEDA007 .3231 .4713 65.0
3. CEDA008 .3231 .4713 65.0
4. CEDA010 .1538 .3636 65.0
5. CEDA013 .4154 .4966 65.0
6. CEDA016 .5385 .5024 65.0
7. CEDA017 .4154 .4966 65.0
8. CEDA020 .1231 .3311 65.0
9. CEDA021 .4462 .5010 65.0
10. CEDA022 .3385 .4769 65.0
Statistics for Mean Variance Std Dev N of Variables
scale 11.9846 86.4841 9.2997 50
Item-total Statistics
Scale Scale Corrected
Mean Variance Item- Alpha
if Item if Item Total if Item
Deleted Deleted Correlation Deleted
CEDA005 11.7846 84.0154 .3121 .9203
CEDA007 11.6615 83.3212 .3418 .9202
CEDA008 11.6615 83.4462 .3270 .9204
CEDA010 11.8308 83.3928 .4456 .9192
CEDA013 11.5692 81.3115 .5500 .9180
CEDA016 11.4462 82.5635 .4018 .9197
CEDA017 11.5692 81.7178 .5034 .9185
CEDA020 11.8615 83.4337 .4862 .9190
CEDA021 11.5385 83.8149 .3636 .9202
CEDA022 11.6462 83.1385 .3586 .9201
....................................................................................................................................................................
Reliability Coefficients
N of Cases = 165.0 N of Items = 50
78
d. Scurt raport despre scală
Se pare că scala 1 obţinută de noi este una foarte bună deoarece la ea contribuie 50 de
itemi ce-i dau o consistenţă internă extrem de mare (alpha = 0,92). Fiecare item dă corelaţii de
peste 0,30 cu scala, dar şi mai mari. Scorul mediu la această scală este de 11,98, cu o abatere
standard de 9,30. Totuşi valorile medii ale itemilor nu sunt centrate majoritar pe valoarea
mijlocie de scor (0,50), ci sunt mai mici, fapt ce indică o asimetrie rezultată din cauza
caracterului mai curând clinic al testului. Aceşti itemi discriminează bine printre subiecţii care
au valori mai mari ale scorurilor, dar mai slab pentru cei cu valori submedii. Scala urmează a
fi verificată şi validată contra criteriul extern pe populaţii clinice care prezintă realmente
dezordinile alimentare diagnosticate.
Studiind itemii care îl compun, primul factor a fost numit Stimă de sine negativă
legată de aspectul fizic (50 de itemi), al doilea Propensiune anorexică (12 itemi) şi al treilea
Propensiune bulimică (12 itemi). Deoarece cei trei factori sunt mediu-slab corelaţi între ei,
scorurile lor separate pot fi agregate într-un scor global, adică într-un Index al tulburărilor
alimentare, definit de preocuparea pentru aspectul fizic şi pentru pierderea controlului asupra
ingestiei de alimente.
Numărul relativ mic de subiecţi pe care s-a desfăşurat analiza factorială (N = 165)
ridică totuşi semne de întrebare în legătură cu stabilitatea soluţiilor găsite, care trebuie
verificate şi definitivate pe populaţii mai largi.
79
scurtimea ei. În cazul de faţă există o satisfacţie legată de calitatea primei scale. Pentru cea de
a doua şi de a treia ar putea reîncepe travaliul de a genera itemi suplimentari, care să surprindă
mai specific bulimia şi anorexia şi care vor trebui aplicaţi unor populaţii clinice identificate a
avea aceste afecţiuni.
În rezumat, pentru a clarifica criteriile după care păstrăm unii itemi în scală şi-i
eliminăm pe alţii, furnizăm în sinteză cele mai importante repere orientative:
sunt preferabili itemii care au valori medii apropiate de valoarea centrală, au varianţă
mare, se corelează bine cu ceilalţi itemi şi – mai ales – corelează la un nivel ridicat
(peste .30, sau chiar peste .40) cu scorul total la scală;
vor fi primii eliminaţi itemii care dau varianţa zero, corelaţii slabe sau negative cu
scala (chiar după scorarea inversă);
itemii care corelează slab cu scala vor fi de asemenea printre primii eliminaţi;
vor fi eliminaţi şi itemii a căror prezenţă în scală nu numai că nu ameliorează
consistenţa sa internă, ci chiar o coboară;
itemii care corelează slab cu dimensiunea/dimensiunile latente măsurate, dar corelează
bine cu alţi factori secundari, vor fi şi ei eliminaţi din scală, dar vor fi analizaţi pentru
a dezvolta eventual noi scale, dacă ei par să sugereze existenţa altor constructe valide;
dintre itemii foarte similari ca şi formulare şi conţinut se păstrează doar aceia care dau
cea mai bună corelaţie cu scorul total la scală.
Nu putem omite o întrebare legitimă: cât de mic trebuie să fie pragul corelaţiei item-
scală pentru a reţine un item în scală? Răspunsul depinde şi de intenţiile autorului: doreşte el o
scală scurtă şi relativ puternică, sau o scală mai lungă, dar care dă mai multe nuanţe, fiind mai
stabilă şi mai fidelă? În primul caz pragul de selecţie este mai ridicat (în principiu peste r =
.40), în al doilea ceva mai scăzut (dar rareori sub r = .30).
Efectul eliminării sau includerii unor itemi în scală trebuie şi el bine ştiut. Dacă
cunoaştem corelaţia medie a scalei rezultate putem aplica o formulă care ne ajută să anticipăm
care va fi efectul adăugării sau eliminării unui item. Această formulă este:
N r
alpha
1 ( N 1) r
în care N este numărul de itemi şi r corelaţia medie inter-itemi. Putem astfel determina ce se
întâmplă dacă la o scală cu corelaţia iter-itemi de .30 adăugăm sau scoatem un item: alpha =
[10·.30]/[1+9·.30] = .81 pentru 10 itemi; alpha = [11·.30]/[1+10·.30] = .83 pentru 11 itemi;
80
alpha = [9·.30]/[1+8·.30] = .79 pentru 9 itemi. Vedem că diferenţa de doar doi itemi ridică
consistenţa internă de la .79 la. 83, ceea ce este important. În general, dacă corelaţia inter-
itemi a unui item este egală sau cu puţin sub corelaţia inter-itemi medie, păstrarea itemului în
scală are un efect de creştere a lui alpha; când această corelaţie este mult sub medie, ea poate
să ducă la descreşterea lui alpha şi deci itemul rău trebuie eliminat.
O soluţie interesantă pentru a verifica stabilitatea caracteristicilor unei scale este
propusă de DeVellis (2003, pp. 99-100), ea constând în splitarea lotului. Când lotul este unul
suficient de mare el poate fi împărţit în jumătăţi. Când lotul nu este suficient de mare,
împărţirea se poate face în părţi inegale, partea cea mai mare fiind rezervată pentru
determinările principale, pe când cea de a doua pentru verificarea constanţei rezultatelor
găsite. Deci prima parte din lot foloseşte la evaluarea şi selecţia itemilor, la construcţia
scalelor şi la determinarea lui alpha pentru fiecare subscală; cea de a doua parte este utilă
pentru replicarea datelor şi pentru a verifica dacă ele se regăsesc pe un lot foarte similar.
Avantajele acestei metode – care obligă din start la abordarea unui număr mare de
subiecţi, de peste 500-600 de persoane – sunt însemnate. În primul rând împărţirea se poate
face aleatoriu, ceea ce asigură echivalenţa grupurilor, randomizarea generând două eşantioane
echivalente. Dacă acestea ar fi abordate în două momente temporale diferite există
probabilitatea ca factorul timp să aducă modificări (fie şi discrete) la cel de al doilea grup, sau
ca el să difere prin alte caracteristici de primul grup. Apoi, un nou grup presupune expunerea
subiecţilor la alt personal de cercetare, în altă perioadă a anului, cu instrumente care pot diferi
uşor de primele (forma iniţială şi forma definitivă a scalei), ceea ce poate introduce alte
distorsiuni nedorite. Dar cel mai însemnat avantaj al splitării grupului original este acela că la
ambele subgrupuri vom avea forma originală a instrumentului, ceea ce permite revenirea la
decizia eliminării unor itemi dacă grupul de control indică necesitatea schimbării acestei
decizii. Dacă pentru primul grup, cel pe care s-a făcut selecţia itemilor, există posibilitatea ca
factori de şansă să fie confundaţi cu covariaţia itemilor, la al doilea – unde itemii sunt deja
selectaţi – o asemenea posibilitate nu mai există. Finalmente, prin reunirea celor două grupuri
în unul singur se obţin caracteristici psihometrice mai sigure şi mai aproape de realitate decât
pentru fiecare grup luat separat.
81
spune totuşi dacă scala nou creată surprinde sau nu cu adevărat estenţa constructului căutat,
pentru aceasta trebuind desfăşurate nenumărate studii de validare, pentru oricare nouă
extensie legată de utilizarea scalei. Chiar fidelitatea presupune determinarea prin test-retest a
stabilităţii în timp a rezultatelor obţinute, corelaţia dintre o formă a testului şi forma sa
paralelă etc. Cum fidelitatea este cea mai importantă precondiţie a validităţii, trebuie spus că
programul SPSS oferă alături de alpha şi posibilitatea determinării fidelităţii prin metoda
jumătăţirii (split-half).
Demersurile necesare acestui tip de analiză sunt foarte asemănăroare cu cele presupuse
de determinarea lui alpha (Analyse→Scale→Reliability→Split-half→Statistics), doar că de
la Statistics acum se dezactivează Descriptives for (Item, Scale, Scale if item deleted), deja
determinate anterior.
Output-ul acestei serii de comenzi este un indicator al consistenţei interne care ia în calcul o
jumătate a testului comparată cu cealaltă, prin două metode: cea a lui Spearman-Brown şi cea
a lui Guttman. Echivalenţa jumătăţilor se stabileşte şi prin compararea coeficientului alpha
pentru fiecare jumătate în parte. Cele două jumătăţi comparate sunt luate de computer ca
atare, dar dacă vrem să determinăm split-half pentru numerele pare şi cele impare, introducem
în panoul de lucru întâi itemii pari, apoi pe cei pari, dăm OK şi vom obţine analiza dorită.
R E L I A B I L I T Y A N A L Y S I S - S C A L E (S P L I T)
Reliability Coefficients
N of Cases = 165 N of Items = 112
Correlation between forms = .80 Equal-length Spearman-Brown = .89
Guttman Split-half = .89 Unequal-length Spearman-Brown = .89
56 Items in part 1 56 Items in part 2
Alpha for part 1 = .85 Alpha for part 2 = .87
Figura 4.8. Rezultatele outputului pentru Split-half.
82
Corelaţiile obţinute prin splitare sunt identice prin cele două metode (.89) iar valorile
alpha pentru prima parte (.85) şi pentru cea de a doua (.87) sunt extrem de asemănătoare, de
unde deducem că există o foarte bună consistenţă internă pentru fiecare jumătate a testului.30
Procesul de construcţiei a unei scale nu se opreşte aici. Destinul acesteia depinde doar
parţial de calităţile psihometrice identificarte preliminar şi mai mult de utilitatea ei reală, de
posibilitatea implicării ei într-o multitudine de aplicaţii practice sau de cercetări. Cel mai
adesea validitatea este cea care impune în timp o scală şi aceasta poate fi probată într-o
multitudine de maniere. Prezentăm mai jos o matrice de intercorelaţii dintre cei trei factori
rezultaţi pentru Scala de tulburări alimentare şi cele trei categorii de mecanisme de apărare
decelate de DSQ (The Defense Style Questionnaire) creat de Andrews, Singh şi Bond.
FACTOR1 FACTOR2 FACTOR3 DSQ Mec. DSQ Mec.
mature nevrotice
FACTOR1 -
FACTOR2 .38** -
FACTOR3 .32** .28** -
DSQ Mec. mature -.09 .16 .01 -
DSQ Mec. nevrotice .23* .10 .18 .19* -
DSQ Mec. imature .51** .31** .29** .21* .53**
Notă: ** Correlaţia este semnificativă la pragul de 0,01 (bidirecţional).
* Correlaţia este semnificativă la pragul de 0,05 (bidirecţional.
Figura 4.9. Matrice de intercorelaţii dintre cei trei factori identificaţi şi DSQ.
Din tabelul de mai sus rezultă că factorul 1 se validează la un nivel foarte ridicat prin
corelare cu mecanismele de apărare imature (r = .53) şi la un nivel mai scăzut cu cele
nevrotice (r = .23). Aceasta atrage atenţia asupra faptului că factorul 1 are un conţinut negativ
şi că ar trebui să se numească Stimă de sine negativă legată de aspectul fizic. Factorii 2 şi 3 se
validează şi ei concurent cu mecanismele de apărare imature, dar la niveluri mai scăzute (r =
.31, respectiv r = .29). Evident că această primă confirmare are nevoie de o mulţime de alte
studii, dar aceasta presupune ca instrumentul să fie publicat şi lansat pentru a-şi îndeplini
rolurile pentru care el a fost proiectat.
30
Notă: Aceste determinări au fost făcute pe tot setul de itemi doar ca exerciţiu, înainte de selecţia şi sortarea pe
scale a itemilor, ele trebuind reluate pentru subscalele obţinute în finalul procesului de construcţie, ca şi pentru
scala globală care le include pe toate trei. Dublarea numărului de subiecţi pentru a obţine o soluţie factorială
stabilă relansează practic întreg procesul de reconstrucţie al scalelor.
83
CAPITOLUL 5S
2. Metode: pentru această secţiune este nevoie să fi etichetat corect cele cinci
subsecţiuni.
Participanţi este prima dintre acestea. În această subsecţiune veţi descrie eşantionul
utilizat, clarificând ce populaţie reprezintă aceştia şi câţi au participat efectiv. Arătaţi cum au
fost ei recrutaţi şi cum au fost bonificaţi pentru timpul pe care l-au alocat cercetării. Asiguraţi-
vă că aţi inclus fiecare aspect relevant în legătură cu eşantionul. Pentru a avea un model
despre ce este relevant, consultaţi articolul lui Predebon (2000), sau orice alt articol pe care l-
aţi citit, pentru a observa ce detalii legate de populaţie au fost incluse acolo.
84
detalii ca cele legate de lungimea liniilor (10 cm axul şi 3 cm extensiile), mărimea unghiurilor
dintre ax şi extensii (30° la cele ascuţite şi 150° la cele oblice). Pentru a avea o idee mai clară
puteţi utiliza articolele din Referinţe, dar nu uitaţi să folosiţi cuvintele proprii şi să precizaţi
de ce s-a folosit formatul creion-hârtie, şi nu cel computerizat. Nu intraţi în detalii
nesemnificative, fără repercusiuni asupra rezultatelor, cum ar fi tipul de creion/pix utilizat
pentru a marca jumătatea axului de către fiecare participant. Este bine de precizat cum s-a
controlat ca perceperea stimulilor să fie în acelaşi fel pentru fiecare participant.
85
scurt rezultatele, în sensul de a sublinia cât de similare/disimilare sunt figurile cu unghiuri
ascuţite comparativ cu cele care au unghiuri drepte.
Următoarea parte a secţiunii Rezultate va conţine un sumar al statisticilor inferenţiale
utilizate, adică a celor şase Teste t pentru un singur eşantion (One Sample t-test) aplicate
pentru a proba ipoteza potrivit căreia media pentru fiecare dintre cele şase condiţii este
semnificativ diferită de zero (care reprezintă punctul de mijloc al liniei). Când comentaţi
rezultatele statisticilor inferenţiale, clarificaţi într-un paragraf ce test aţi aplicat, ce rezultat
statistic aţi obţinut şi care este nivelul său de semnificaţie, respectând standardele APA din
curs. O propoziţie scurtă va indica ce înseamnă fiecare dintre rezultatele astfel obţinute.
Există în Power Point-ul cursului 6 solicitarea de a testa şi alte ipoteze statistice, cum
ar fi cele bazate pe diferenţa dintre primele trei condiţii însumate (unghiuri ascuţite/oblice) şi
celelalte trei (unghiuri drepte), pentru a vedea dacă iluzia este la fel de puternică în ambele
categorii de condiţii. De asemenea pot fi comparate extensiile externe (1 şi 4) cu cele interne
(2 şi 5) şi ambele categorii de extensii simple (1+4; 2+5) cu extensiile duble (3+6). Ca
mijloace de testare a ipotezelor puteţi folosi atât diferenţa cât şi corelaţia, după ce veţi verifica
dacă sunt întrunite condiţiile aplicării testelor parametrice respective. În cazul că le veţi folosi,
este bine ca toate aceste forme de testare să verifice ipoteze de cercetare deja prezente în
secţiunea introductivă. Ca mijloace statistice suplimentare este indicat să utilizaţi histograme,
boxploturi şi scattere, pe care le veţi introduce în text doar dacă sunt relevante, astfel editate
încât unităţile de măsură de pe axe să fie adecvate, iar titrarea lor să fie în limba română.
86
rezultatelor. Priviţi de jur-împrejur în orizontul problemei pentru a avea o perspectivă care să
vă permită să determinaţi în ce măsură această cercetare a mişcat înainte problema specifică
investigată şi ce ar fi bine de făcut în viitor din perspectivă ştiinţifică. Pont: nu este deloc util
să afirmaţi că veţi relua studiul cu mai mulţi participanţi! Încredinţaţi-vă că aţi utilizat corect
acest mini-ghid de lab-report şi că aţi făcut corect trimiterile.
Referinţele: se adiţionează la final, după regulile cunoscute, astfel că ceea ce aţi citat
în text să se regăsească la referinţe şi reciproc.
87
88