Documente Academic
Documente Profesional
Documente Cultură
Descrierea cursului
Cursul de Psihologie Experimentală şi Analiza Datelor I face parte din pachetul de
discipline fundamentale ale specializării psihologie, nivel licenţă, din cadrul Facultăţii de
Psihologie şi Ştiinţe ale Educaţiei a Universităţii „Babeş-Bolyai” din Cluj-Napoca. Disciplina
oferă cunoştinţe conceptuale şi procedurale legate de problematica cercetării în psihologie, astfel
fundamentând şi facilitând accesibilitatea studenţilor la o serie de discipline teoretice sau
aplicative ale aceluiaşi an academic (Psihologie Cognitivă şi Introducere în Psihologie) sau ale
anilor superiori (Psihodiagnostic, Psihologia Dezvoltării, Psihologie Socială, Psihologia Muncii,
Psihologie Clinică sau Psihologie Şcolară). Tematicile abordate în cadrul cursului reprezintă un
preambul esenţial pentru toate cursurile menţionate mai sus.
Afirmarea psihologiei ca şi ramură ştiinţifică a fost condiţionată de elaborarea unei
metodologii de cercetare riguroase care să permită verificarea empirică a teoriilor şi ipotezelor
formulate. Actual, independent de domeniul în care îşi desfăşoară activitatea (clinic, şcolar,
organizaţional, academic sau cercetare) psihologul este (sau trebuie să fie) un consumator însetat
al literaturii de specialitate. Înţelegerea corectă a studiilor empirice publicate în reviste de
specialitate presupune însă cunoştinţe de metodologie a cercetării şi analiza datelor.
Această disciplină intervine tocmai în acest punct, oferind posibilitatea studenţilor să:
conştientizeze importanţa cercetării experimentale în validarea unor demersuri de intervenţie
(clinică, şcolară sau organizaţională) şi să deprindă demersurile metodologice necesare pentru
elaborarea şi derularea acestor cercetări; să înveţe criteriile metodologice de evaluare validate
empiric (grile de observaţie sau probe experimentale) în colectarea unor date de calitate
superioară; şi să-şi însuşească şi să aplice principiile statistice în analiza datelor şi elaborarea unui
proiect decercetare.
Calendar al cursului
Pe parcursul semestrului I, în care se studiază disciplina de faţă, sunt programate 2
întâlniri, consultaţii online cu toţi studenţii; ele sunt destinate soluţionării, a oricăror nelămuriri
de conţinut sau a celor privind sarcinile individuale. Pentru prima întâlnire vă recomandăm
lectura atentă a primelor patru module; la cea de-a doua se vor discuta ultimele două module şi se
va realiza o secvenţă recapitulativă pentru pregătirea examenului final. De asemenea în cadrul
celor două întâlniri aveţi posibilitatea de a solicita titularului şi/sau tutorilor sprijin pentru
rezolvarea anumitor lucrări de verificare sau a proiectului de semestru, în cazul în care nu aţi
reuşit singuri. Pentru a valorifica maximal timpul alocat celor două întâlniri studenţii sunt
atenţionaţi asupra necesităţii suplimentării lecturii din suportul de curs cu parcurgerea capitolelor
aferente bibliografiei obligatorii. În acelaşi calendar se regăsesc şi termenele la care trebuie
transmise/depuse lucrările de verificare aferente fiecărui modul precum şi data limită pentru
depunerea proiectului de semestru.
Calendar activităţi
Consultaţii I 15.11.2020 intervalul 10-12 (online MS Teams)
urmează a fi fixat de secretariatul facultății
Consultaţii II
(online MS Teams)
Examen parţial Examen online MS Teams
Proiecte de semestru Vezi FIȘA DISCIPLINEI
(urmează a fi fixat de către secretariatul facultății)
Examen final
(online MS Teams)
Vă rugăm să puneţi întrebări! Curiozitatea şi întrebările oneste sunt esenţiale pentru învăţare.
Modulul 11
Metode de cercetare în psihologie
Vom prezenta mai întâi reperele istorice relevante în trasformarea psihologiei într-o ştiinţă
fundamentată empiric, conceptele cheie fiind cel de contrusct ipotetic, operaţionalizare şi
validare empirică. În acest capitol vom analiza principalele componente ale demersului de
cercetare ştiinţifică în contextul psihologiei.
1
Textul iniţial al acestui Support de Curs a fost elaborat de Prof.univ.dr. Ioana Radu, revizuirea şi completarea
ulterioară fiind efectuată cu acordul autorului de către Asist.univ.dr. Robert Balazsi şi Asist.univ.drd. Adrian
Bivolaru.
Temă de reflecţie nr. 1
Comparaţi tabelar trăsăturile cunoştinţelor ştiinţifice cu cele ale
cunoştinţelor pseudoştiinţifice! Pentru aprofundarea subiectului vezi în
READER documentele:
Bibliografie 1.pdf - Lakatos (1973) Science and Pseudoscience
Bibliografie 2.pdf - Wynn (2001) Quantum leaps – cap.1
s = k logI + c
În anul 1879, la Leipzig (Germania), ia fiinţă primul institut de psihologie din lume- creat de W.
Wundt - care îşi propune să studieze cu mijloace precise fenomene psihice mai simple: senzaţia,
percepţia, asociaţia, memoria etc. În acest institut s-au format pionierii psihologiei experimentale
pe diferite meridiane ale globului, inclusiv România.
Să amintim că termenul de psihologie apăruse mai demult, şi anume într-un fragment din
opera lui Leibniz, puţin ulterior anului 1696. Noul termen (“psihologie”) va oferi titlul a două
lucrări ale lui Chr. Wolff- Psychologia empirica şi Psychologia rationalis- prima apărută în 1732,
iar a doua în 1734, care au contribuit la răspândirea noii denumiri şi a preocupărilor despre
“suflet”. Autorul, elev al lui Leibniz, admitea posibilitatea unei psihologii propriu-zise şi
avansează chiar ideea de măsurare a fenomenelor psihice.
Punctul de plecare al multor cercetări de psihologie este prefigurat în datele simţului
comun. H. Kelley (1992) ne propune să acceptăm pentru simţul comun un anumit nivel al
cunoaşterii psihologice. Este vorba de observaţii şi concluzii asupra comportamentului direct
observabil, care se dezvăluie mai ales în relaţiile interpersonale, în activităţile îndreptate spre
scop ale individului. Acesta este nivelul comportamentului moral, desfăşurat în secvenţe
temporale de ordinul minutelor până la al zilelor, comportament care devine vizibil în relaţiile de
faţă în faţă - în perimetrul grupului mic – şi care prezintă antecedente şi consecinţe concret
reperabile. În schimb, fenomenele care se desfăşoară la macro şi micro-nivel nu pot intra în raza
de competenţă a simţului comun. În primul caz este vorba de fenomene psihice care implică mai
mulţi oameni în intervale mai mari de timp ( de ex. tendinţe pe parcursul unei vieţi, schimbări
sociale etc.). La micronivel este vorba de evenimente psihice care se desfăsoară rapid (în secunde
sau milisecunde), la scară mică de mărime (sacade oculare sau mici contracţii ale muşchilor feţei
etc); ele pot fi detectate, de pildă, cu mijloacele electrofiziologiei. Nivelul mediu – al
comportamentului manifest – ar constitui nişa cognitivă a simţului comun (p. 6-7).
Din datele invocate de H. Kelley în sprijinul tezelor sale reţinem rezultatele unor testări
asupra oamenilor de pe stradă. Un autor (J. Houston) a întocmit un chestionar referitor la
memorie şi învăţare. Itemii (în număr de 21) au fost formulaţi în limbajul curent, oferind
răspunsuri la alegere. Chestionarul a fost propus unui lot de 50 de studenţi din anul I înaintea
cursului de Introducere în psihologie. Presupunând că subiectul nu dispune de cunoştinţe într-un
domeniu este de aşteptat ca răspunsurile sale la întrebările chestionarului să se distribuie în mod
aleator. La 15 itemi din 21, subiecţii interogaţi au răspuns însă corect, în proporţii superioare
hazardului. Pe un lot de alte 50 de persoane, selecţionate aleatoriu dintr-un parc public, s-a
obţinut – de asemenea – proporţii de răspunsuri excte superioare hazardului la 16 itemi (din 21).
De aici concluzia care atribuie simţului comun un nivel al cunoaşterii psihologice. Pe de altă
parte, eforturile oricărui cercetător de a operaţionaliza conceptele duce adesea la o scufundare a
lor în simţul comun, ca poziţie de plecare. Psihologia cuprinsă în simţul comun oferă o bază utilă
pentru dezvoltarea cunoaşterii. Este imposibil să eviţi efectele simţului comun – încheie Kelley –
dar este uşor să nu fii conştient de ele. Problema este a atitudinii lucide şi echilibrate.
În perioada în care psihologia începea să se afirme ca disciplină independentă, în
jumătatea a doua a secolului XIX, modelele de investigaţie, “paradigmele” ştiinţelor naturale erau
deja cristalizate. O trăsătură caracteristică subliniată de L. Blaga (1969) în dezvoltarea ştiinţei
moderne este aceea de a alcătui “cupluri metodologice”, în care matematica figura de fiecare dată
ca unul dintre factorii constitutivi (p.88). O asemenea îmbinare de metode funcţiona ca o opţiune
tacită în comunitatea oamenilor de ştiinţă. Experimentul, în cuplul metodologic cu matematica, a
făcut carieră remarcabilă de-a lungul istoriei ştiinţei, impunându-se în definiţia însăşi a spiritului
ştiinţific modern.
Temă de reflecţie nr. 2
Stabiliţi rolul şi limitele statisticii matematice în inferenţa ştiinţifică. Pentru
aprofundarea subiectului vezi în READER documentul: Bibliografie 3.pdf
- Anderson (2001) Empirical Direction in Design and Analysis – cap. 1.
Caracterul empiric al unei teorii rezultă din suportul factual al acesteia, reprezentat de toate
datele ştiinţifice (observaţii, măsurători) care stau la baza teoriei. Orice teorie ştiinţifică este
elaborată pornind de la date obiective măsurate privind fenomenele sau procesele studiate. Datele
sunt obţinute în condiţii experimentale controlate şi trebuie să fie verificabile (adică exprimate
într-o formă ce permite verificarea lor de către alţi cercetători). De exemplu, rezultatul unei
observaţii subiective nu este direct accesibil unui alt cercetător; înregistrarea datelor în timpul
observaţiei poate fi reanalizată însă de persoane care nu au fost prezente în cursul observaţiei.
În plus, datele ştiinţifice trebuie să fie replicabile. Cu alte cuvinte, repetarea condiţiilor în
care datele unui studiu experimental au fost obţinute trebuie să conducă la rezultate similare cu
cele ale studiului iniţial. Cele două condiţii, verificabilitatea şi replicabilitatea datelor conferă
obiectivitate faptelor ştiinţifice.
Caracterul raţional al unei teorii este conferit de suportul logicii formale prin care este
verificată orice afirmaţie ştiinţifică. Orice teorie reprezintă o serie de enunţuri deduse pe cale
logică din faptele ştiinţifice şi cunoştinţele considerate valide. Modul de prezentarea a
raţionamentului care a dus la construcţia teoriei trebuie să fie suficient de clar şi complet, pentru a
putea fi verificat de comunitatea ştiinţifică.
adică 14%. Prin urmare avem aproximativ o şansă din şapte să întârziem dacă plecăm la
730.
Ce putem constata la sfârşitul acestui demers? Am reuşit să obţinem un răspuns la
problema noastră, în ciuda faptului că am neglijat multe din elementele ei. Mai mult, am evitat să
studiem cauzele (motivele) pentru care autobuzul respectiv profesorul intârzie; pentru soluţia
găsită, nu era necesar să ştim acest lucru. De fapt, am înlocuit aceste cunoştinţe cu două
probabilităţi, cere ne oferă o imagine suficient de acurată despre comportamentul autobuzului şi a
profesorului, fără să fie necesar a o explica. Cele două probabilităţi sunt de fapt modele statistice,
simplificări ale variabilelor “comportamentul autobuzului” şi “comportamentul profesorului” dar
care ne oferă o soluţie utilizabilă pentru a putea să decidem.
Rezolvarea prin simplificare este de fapt principalul instrument de găsire a soluţiilor în
cazul tuturor ştiinţelor empirice. Dată fiind complexitatea extrem de mare a lumii reale, singura
metodă eficientă de a găsi soluţii rămâne simplificarea situaţiilor reale prin recurgerea la modele.
Evident soluţiile astfel găsite nu sunt perfecte, dar este tot ceea ce putem face pe moment.
Revenind însă la problema noastră, putem considera soluţia găsită de noi ca fiind ştiinţifică?
Amintiţi-vă că exemplul a fost dat pentru a discuta caracteristicile cercetării ştiinţifice. Intuitiv,
putem răspunde uşor la acestă întrebare, pentru că încă nu ştim dacă soluţia găsită de noi
funcţionează.
Răspunsul corect este deci: nu este o soluţie ştiinţifică pentru că nu a fost testată. Adică,
nu ştim dacă este sau nu corectă. Am descris astfel primul principiu fundamental al ştiinţei, care
poate fi rezumat astfel:
1. Orice afirmaţie trebuie supusă unei verificări critice. Nu se acceptă ca argument
decisiv părerea nici unei autorităţi (expert) fără ca ea să fie testată.
În completare, principiul al doilea este formulat:
2. Dacă o afirmaţie este contrazisă de un rezultat empiric, e considerată greşită.
Din cele expuse mai sus putem înţelege uşor motivele pentru care cercetarea ştiinţifică respectă
acest principiu: complexitatea situaţiilor reale fac dificilă sau imposibilă abordarea problemei în
altă formă decât simplificată, simplificare care poate duce la soluţii eronate. Conform deci
principiului enunţat, soluţia noastră nu este încă ştiinţifică, pentru că nu am verificat-o. Ce
înseamnă de fapt verificare critică ? Presupune analiza întregului demers folosit pentru obţinerea
soluţiei, adică analiza raţionamentelor folosite, a modului în care s-au obţinut datele empirice, a
interpretărilor date rezultatelor etc. Testul final al orcărei teorii ştiinţifice sau soluţii teoretice este
confruntarea cu realitatea, prin compararea datelor empirice cu predicţiile teoretice.
Să analizăm acum soluţia noastră şi să vedem de ce nu o putem accepta fără verificare. Ea
se bazează pe un calcul de probabilitate a două evenimente independente (probabilitatea de a
întârzia a autobuzului şi probabilitatea de a nu întârzia a profesorului); iar metoda de a calcula
rezultatul (probabilitatea de producere simultană a două evenimente independente) este
demonstrată de mult. Şi atunci?
Motivul este că noi am simplificat problema atunci când am selectat doar doi parametri
pentru a o descrie; demersul folosit în soluţie nu verifică şi presupunerea că aceşti doi parametri
descriu perfect situaţia; deci nu întreaga noastră soluţie e verificată.
Verificarea soluţiilor e comună oricărei cercetări empirice. Datorită simplificării la care
am recurs nu avem cum să fim siguri dacă soluţia găsită este corectă (există de exemplu şansa ca
un element important al situaţiei să fie omis).
Prin urmare, următoarea etapă fa consta în verificarea soluţiei găsite. Rolul verificării este
să ne convingem de eficienţa soluţiei pentru toate cazurile cuprinse în problemă. În cazul nostru,
asta presupune ca ea să fie corectă indiferent de ce comportament au la un moment dat profesorul
şi şoferul. Nu este de exemplu suficient să plecăm la şcoală o dată la 730 şi să constatăm că nu am
întârziat; s-ar putea ca la o repetare a încercării să întârziem. Deci o singură verificare nu e prea
sigură; metodele de verificare trebuie să fie obiective, altfel rezultatele lor ar fi uşor de contrazis.
La o analiză sumară, constatăm că de fapt nu vom putea verifica complet soluţia: ar trebui să
includem în verificare toate cazurile, adică să urmărim tot semestrul dacă întârziem sau nu.
Evident, în urma unei astfel de verificări rezolvarea găsită nu mai are sens (dacă constatăm de
exemplu că am greşit, nu mai putem reveni în timp la începutul semestrului şi să căutăm altă
soluţie).
Pentru a fi totuşi mai obiectivi, putem să plecăm de mai multe ori la 730 şi să vedem de
câte ori întârziem. Să presupunem că facem asta de 5 ori şi am reuşit să întârziem de trei ori.
Rezultatul nu e prea fericit. Dacă comparăm probabilitatea de a întârzia prezisă de soluţia noastră
(14%) cu cea reală (60%) este destul de evident că cele două valori sunt diferite. Acum putem
înţelege de ce este nevoie să verificăm soluţia. Ea s-a dovedit greşită. Să ne amintim principiu
doilea al ştiinţei, reformulat pentru cazul cercetărilor aplicate: în cazul în care datele empirice
contrazic predicţia dată de soluţie, soluţia e respinsă. Altfel spus, verificăm soluţia teoretică cu
realitatea. Dacă ea nu corespunde realităţii, renunţăm la ea, urmând să căutăm alta. Rezultă
imediat importanţa pe care trebuie să o acordăm modului în care facem verificarea; dacă facem
erori mari în cursul verificării, putem lua o decizie greşită la compararea datelor cu teoria.
Această grijă pentru modul în care se face verificarea este conţinută în afirmaţia: datele empirice
trebuie să fie obiective. Acest lucru este mult mai dificil decât pare; e suficient să ne gândim la
faptul că orice măsurătoare pe care o realizăm conţine şi erori de măsurare, pe care nu le putem
elimina în întregime. De aceea, discrepanţa dintre predicţie şi rezultatele empirice normală; ea
apare în majoritatea cazurilor de cercetare ştiinţifică. Diferenţa în sine nu reprezintă un motiv de
îngrijorare (puteam obţine de exemplu 14,86%), ci mărimea ei şi implicaţiile posibile. Dacă
diferenţa e mică, o putem atribui erorilor de măsurare. Dacă însă e mare, o astfel de interpretare
nu mai e realistă.
În cazul nostru, diferenţa este prea mare, mai ales dacă luăm în considerare utilitatea
rezultatului: ne putem eventual permite să întărziem o data sau de 2 ori pe semestru, dacă asta
înseamnă 30 de minute de somn în plus; dar nu mai este deloc acceptabil dacă vom întărzia la mai
mult de jumătate din cursuri. Cele două rezultate (teoretic şi empiric) ne conduc la decizii
diferite. Deci le putem considera diferite în raport cu problema noastră. Ce ne rămâne de făcut
este să analizăm cauzele posibile care au dus la această discrepanţă mare între soluţia găsită şi
realitate. Este pasul firesc al unei cercetări ştiinţifice: dacă ne-am convins că soluţia teoretică e
greşită, cel mai bun lucru e să găsim cât mai rapid greşeala făcută.
Ce s-ar fi întâmplat dacă soluţia ar fi fost corectă (dacă am fi obţinut de exemplu acel
14,86% amintit mai sus) ? Evident că cele 5 cazuri ale verificării nu ne-ar putea convinge
definitiv de corectitudinea soluţiei. Ceea ce am concluziona este că ea e mai probabil să fie
corectă decât înainte de verificare. În schimb, dacă verificarea soluţiei contrazice predicţia,
putem spune cu certitudine că soluţia e greşită (evident, în condiţiile în care verificarea e
obiectivă).
Cauzele erorii soluţiei noastre pot fi foarte multe, mai ales că, dacă ne aducem aminte, noi
am simplificat cât de mult se putea situaţia reală atunci cănd am construit modelul problemei.
Deci orice element care a fost exclus poate la fel de bine să fie cauza rezultatului din verificare.
Pe urmă, comportamentul profesorului şi al şoferului a fost poate estimat greşit sau acestea s-au
modificat între timp. Se pare deci că nu avem altceva de făcut decât să analizăm toate aceste surse
de eroare posibile pentru a explica diferenţa constatată.
Problema e că o analiză a tuturor surselor de eroare nu are sens pentru simplul motiv că
sursele de eroare posibile sunt prea numeroase (le putem considera infinit de multe) şi timpul
necesar pentru analizarea lor ar fi mare; iar pe noi nu ne interesează o soluţie obţinută după
terminarea anului şcolar. Vom folosi aici un principiu numit briciul lui Occam care într-o formă
simplificată afirmă: “ipotezele nu trebuie multiplicate inutil”. În cazul nostru, pentru a restrânge
ipotezele cu privire la cauzele erorii, vom începe cu variabilele incluse de noi în model. Dacă
constatăm la nivelul lor erori, şi acestea pot explica cea mai mare parte din eroare, este suficient
pentru condiţiile practice. În caz contrar suntem nevoiţi să căutăm şi alte surse de eroare.
La o privire sumară vom constata că avem o problemă majoră la variabilele incluse în
model. Probabilitatea de a întârzia obţinută (60%) este mai mare decât cea de întârziere a
autobuzului (20%); asta ar însemna că noi am întârziat mai des decât ar fi trebuit să întârzie
autobuzul! Evident e absurd (cu excepţia faptului, puţin probabil, în care v-aţi decis să nu intraţi
la ore imediat - să beţi o cafea, de exemplu...). Deci, mai mult ca sigur nu am măsurat corect
probabilitatea de a întârzia a autobuzului. Ea este în mod cert mai mare. Deci am făcut o eroare
de măsurare (mai exact de estimare) a unuia din parametri.
O altă problemă posibilă este fireşte numărul mic de verificări făcute (doar 5); e posibil că
dacă am lungi perioada de verificări, probabilitatea de a întârzia a autobuzului să scadă. Aici
avem de-a face cu o incertitudine a rezultatului determinată de metodele de testare. În sfărşit, e
posibil să constatăm că de exemplu autobuzul întărzie de obicei mult (10-15 minute) şi profesorul
puţin (2-3 minute), ceea ce necestită corectarea modelului folosit de noi. În aceste condiţii, e mai
util să neglijăm probabilitatea de a întârzia a profesorului pentru că autobuzul întârzie mult mai
mult decât profesorul; deci, ori de câte ori autobuzul va întârzia, vom întârzia şi noi. Ca urmare,
modelul nou ar fi format doar din probabilitatea de a întârzia a autobuzului, şi pe care este nevoie
să o reevaluăm.
Dacă în urma acestor corecţii am obţinut un rezultat apropiat de cel empiric, putem
conchide că am descoperit majoritatea surselor de eroare. Dacă nu, probabil va trebui să luăm în
calcul variabilele omise de noi din descrierea situaţiei.
Identificarea problemei
Soluţia
Analiza erorilor
Figura 1. Etapele unei cercetari ştiinţifice aplicative
Fireşte, modelul de mai sus este simplificat. De exemplu, el nu abordează situaţia în care soluţia
este greşită. În acest caz, demersul se reia în funcţie de erorile găsite. În problema folosită ca
exemplu am schiţat şi un astfel de caz. Şi anume, situaţia în care modelul descriptiv este incorect,
urmând corectarea acestuia şi reformularea soluţiei.
Rezumat
Putem extrage din exemplul de mai sus câteva concluzii importante despre modul în care se
realizează o cercetare:
Una din problemele cu care se confruntă o cercetare este complexitatea situaţiilor reale. Noi
putem aborda această problemă prin simplificarea situaţiei astfel încât să găsim o soluţie
utilizabilă. Demersul adoptat e simplu: ce ne interesează e să găsim o soluţie la problemă, nu să
abordăm situaţia în toată complexitatea ei (ceea ce este evident imposibil). Datorită simplificării,
soluţia găsită nu e perfectă; mai mult, poate fi greşită sau nesatisfăcătoare. Din aceste motive
suntem obligaţi să o testăm, comparând-o cu realitatea. Testarea soluţiei ridică problema obiectivităţii
datelor empirice. Dacă acestea sunt incorecte, vom eşua în tentativa noastră de a verifica soluţia.
Caracterul ştiinţific al cercetării este dat de testarea soluţiei teoretice. Însă o cercetare ştiinţifică nu se
reduce la testarea de ipoteze.
Exemplu:
Un proces de investigare ce ia forma observaţiei pune, de regulă, în joc o grilă de
observaţie, care oferă cadrul de clasificare a datelor, rubricile tabelului de înregistrare a faptelor
urmărite.
Pentru a surprinde, de pildă, anumite trăsături de temperament în comportarea
preşcolarului sau a şcolarului mic se organizează un joc – denumit convenţional "transportul
cuburilor" – căruia i se impun anumite cerinţe. Copilul trebuie să transporte cu lopăţica pe un
traseu dat (dus şi întors) un număr crescând de cuburi (3, 4, 5, ... 10), purtând coloana acestora cu
mâna dreaptă fără să o sprijine cu cealaltă mână. În caz de eşec (pierderea vreunui cub,
răsturnarea coloanei etc.) proba se reia de la început. Se înregistrează succesiunea probelor,
reacţiile verbale şi motorii care însoţesc îndeplinirea sarcinii, conţinutul sau felul acestor reacţii în
funcţie de succes/insucces, reluarea probei etc. Tabelul 2.1., adaptat după I. A. Samarin (1954),
redă un fragment dintr-un asemenea protocol. Rubricile tabelului alcătuiesc grila de observare a
comportamentului.
Tabelul 2.1.
Suc- Cu- Pre- Caracterul reacţiilor verbale Pre- Caracterul reacţiilor motrice Alte
ce- buri zenţa zenţa Obser-vaţii
siu- trans- reac- Auto- Se Re- Alte reac- pre- Refuz Distra- Reac-
nea por- ţiilor stimu- plân- fuz re- ţiilor cipi- pasiv geri ţii
pro- tate ver- lare ge de acţii mo- tare mo- vege-
belor bale greu- ver- trice ener- trice tative
tatea bale vare
sar-
cinii
1 3 +! + - - - + - - + -
2 4 + +! - - - - - - - -
3 5 +!! + + - - + - - - +
.
.
● Scale nominale sau calitative – definesc primul nivel al măsurării, de fapt al pre-
măsurării. Acesta este nivelul curent în observaţie şi anchete.
A utiliza o scală nominală înseamnă a clasifica sau repartiza datele (rezultatele), după o
serie de nume sau categorii diferite (disjuncte), astfel încât fiecare element (răspuns, observaţie
etc.) să-şi găsească locul într-o categorie şi numai într-una singură. Orice tipologie constituie în
acest sens o scală nominală. În locul denumirii categoriilor se utilizează de regulă un cod numeric
(01, 02, ... ) care nu formează propriu-zis obiectivul calculelor, ci serveşte la individualizarea
acestor grupări, la repetarea lor în cursul prelucrării statistice. Aşadar, nivelul nominal al
măsurării comportă atribuire de numere doar pentru a denumi clase de echivalenţă. Desigur,
calculele obişnuite au loc, dar ele se fac asupra efectivelor sau frecvenţelor ce se stabilesc în
cadrul diverselor categorii (clase), individualizate prin cod numeric.
Exemplu:
Se dă un chestionar referitor la orientarea profesională la o colectivitate de şcolari. Elevii
sunt solicitaţi să răspundă în scris asupra profesiunii spre care doresc să se îndrepte. Se obţine un
ansamblu de răspunsuri care vor fi grupate, repartizate în diferite categorii după o listă sau
repertoriu de profesiuni care va constitui cadrul de clasificare. Aşadar, efectuând ancheta,
mulţimea de răspunsuri obţinute se va repartiza într-un număr de clase disjuncte, indicate prin
denumirea profesiei ori un simbol ales în mod convenţional (cod numeric) care, evident, nu face
obiectul calculului. Fiecare răspuns în parte consemnat în chestionar va fi repartizat în una din
aceste categorii sau profesii. În ancheta concretă, opţiunile exprimate nu acoperă în mod necesar
întreg repertoriul de profesiuni existent la un moment dat într-o societate; acest repertoriu este de
regulă mai larg decât protocolul obţinut. În final se numără răspunsurile din fiecare categorie sau
rubrică întâlnită şi se stabilesc frecvenţele corespunzătoare sau efectivele. Datele astfel obţinute se
pretează în continuare la o tratare numerică, utilizându-se mai ales indicii din teoria informaţiei.
Exemplu:
Ordonarea subiecţilor cu privire la atitudinile pe care le adoptă într-un domeniu sau altul
presupune o ordonare a întrebărilor ce le sunt adresate. De aici ideea de a întocmi şi prezenta
anumite grupaje sau baterii de întrebări care se referă la aceeaşi temă, la acelaşi domeniu, pe
scurt, la aceeaşi variabilă. Un asemenea grupaj, numit test sau scală de atitudini trebuie să
constituie el însuşi o scală ordinală. Răspunsurile posibile se grupează şi ele într-o ierarhie.
Exemplu:
Prezentăm unui grup de şcolari un lot de probleme de gândire, în total 20, dispuse în
ordinea greutăţii lor crescânde, formând deci cum se spune o scală de dificultate. Într-o asemenea
probă, se presupune, dacă testul este omogen, că toţi subiecţii care au rezolvat o întrebare de
dificultate p, rezolvă de asemenea toate întrebările de dificultate inferioară lui p. Acordăm un
timp limitat pentru rezolvare, aceeaşi pentru fiecare subiect în parte. Din ansamblul de rezultate
individuale să reţinem patru performanţe; să zicem: A rezolvă 10 probleme, B rezolvă 8
probleme, C rezolvă 16 probleme şi D rezolvă 6 probleme. Punctajul întrunit de fiecare – pe care
îl vom nota cu litere mici corespunzătoare (a=10; b=8; c=16; d=6) – este diferit şi ia, după cum se
vede, o formă numerică. Variabila brută ia naştere prin însumarea punctelor.
Operând în continuare asupra numerelor atribuite am fi tentaţi să spune c=2b (întrucât
16=2 x 8), că d=c - a (întrucât 6=16 - 10), că a + d=c (pentru că 10 + 6=16) ş.a.m.d. Asemenea
operaţii ar fi din punct de vedere psihologic incorecte, deşi aritmetic ele sunt corecte. Cine ar
accepta, de pildă – vorbind în limbajul notelor şcolare – că "un răspuns de 10" s-ar putea
compune din "două răspunsuri de 5", deşi 10=5 + 5. Fenomenele psihologice nu sunt aditive.
Ceea ce putem spune în exemplul dat este că C este superior lui A sub aspectul cercetat, că A este
superior lui B, iar acesta se află înaintea lui D (pe scurt: C>A>B>D). În plus, putem adăuga în
mod intuitiv intervalul sau distanţa care le separă: astfel, intervalul sau distanţa care-l separă pe C
de D este mai mare decât distanţa CB, că intervalul CA<CB ş.a.m.d. Stabilim, cu alte cuvinte, o
relaţie de ordine, o ierarhie a elementelor şi a intervalelor care le separă, relaţie care subzistă
statistic la a doua, a treia examinare, eventual la a n-a examinare, în condiţii identice.
X=T+E
X reprezintă în acest caz rezultatul măsurării, T este rezultatul ideal iar E eroarea de
măsurare. În cazul unei măsurători simple (de exemplu o dimensiune fizică: lungimea unui
obiect, de exemplu) eroarea de măsurare se datorează erorii instrumentului folosit şi a actului de
măsurare. Eroarea totală este deci rezultanta celor două erori. Problema inerentă oricărei măsurări
este că aceste două componente nu pot fi separate. Noi nu putem evalua decât eroarea totală; cât
din această eroare se datorează instrumentului şi cât măsurării în sine nu ştim.
Orice acţiune de măsurare atrage deci după sine şi o eroare de măsurare. Nu putem face
măsurători fără eroare; putem doar reduce eroarea de măsurare până când aceasta să fie
neglijabilă în raport cu relevanţa măsurătorii. Pentru a reduce eroarea de măsurare este însă
necesar să identificăm cauzele ei. Însă identificarea cauzelor nu este uşoară; eroarea de măsurare
nu ne poate ajuta în acest sens.
2
Această constatare este valabilă instrumentelor de măsură fizice (de exemplu, cronometre pentru măsurarea
timpului de reacţie) sau pentru sarcini simple. În cazul instrumentelor psihologice complexe (teste psihologice)
eroarea nu mai este o constantă.
Extrapolarea este o aplicaţie a teoremei limitei centrale, care prevede că distribuţia mediilor
tuturor eşantioanelor ce pot fi extrase aleator dintr-o populaţie este de formă gaussiană. Forma
distribuţiei mediilor eşantioanelor nu depinde de cea a distribuţiei valorilor individuale. Pentru
cazurile reale, distribuţia se apropie cu atât mai mult de cea gaussiană cu cât numărul subiecţilor
dintr-un eşantion este mai mare. Pentru n = 30 obţinem deja o bună aproximaţie a curbei
gaussiene.
În scopul de a înţelege mai bine afirmaţiile de mai sus, vom continua cu un exemplu
simplu, şi anume comportarea unei monezi. Dacă moneda este corectă (nu are o faţă mai grea
decât cealaltă) nu putem prezice pe care din feţe va cădea la o aruncare (stema sau banul).
Moneda are deci o comportare aleatoare. Bunul simţ ne spune că şansa ca moneda să cadă pe
oricare din cele 2 feţe este egală, adică 50%. Însă această constatare nu ne ajută prea mult la
prezicerea unei aruncări. Totuşi, dacă facem un număr mare de aruncări, rezultatul (numărul de
steme obţinute, de exemplu) se va apropia mult de valoarea prezisă de 50%. În baza acestor
constatări, să urmărim ce se întâmplă dacă facem 30 de aruncări consecutive, şi numărăm de câte
ori am obţinut stema. Să presupunem că am obţinut 11 steme (din 30 de aruncări). Pe baza
calculului anterior, ne aşteptam să obţinem 15 steme. Putem conchide că moneda e mai grea pe
faţa cu banul? Greu de afirmat. Să mai repetăm seria de 30 de aruncări. Obţinem tot 11 steme. La
o nouă repetare obţinem 16 steme. Ce am obţinut este forma firească a unui comportament
aleator. Să continuăm până obţinem 90 de serii a câte 30 de aruncări (deci în total 2700 de
aruncări). Datele sunt prezentate în tabelul de mai jos.
Dacă reprezentăm grafic distribuţia de frecvenţă a celor 90 de serii, obţinem histograma
din figura nr. 3. După cum observăm, distribuţia rezultată seamană foarte mult cu cea gaussiană.
Valoarea cea mai frecventă obţinută este 16 (de 16 ori) şi nu 15, aşa cum ne-am aştepta. Dacă
numărăm însă totalul stemelor rezultate din cele 2700 de aruncări, obţinem 1354, o valoare foarte
apropiată de cea prezisă de 1350 (50% din 2700). Valorile obţinute în cele 90 de serii sunt deci
fluctuaţii în jurul valorii de 15.
Acum vom face un pas important, pentru a ajunge intuitiv la concluziile teoremei limitei
centrale. Ce reprezintă de fapt seriile de câte 30 de aruncări din totalul de 2700? Le putem
considera ca fiind eşantioane de câte 30 de aruncări extrase aleator din cele 2700. Caracterul
aleator al “extragerii” este evident – am obţinut seriile din încercări succesive, rezultatele obţinute
fiind pur aleatoare – şi astfel am îndeplinit criteriul teoremei limitei centrale. Rezultatele seriilor
fluctuează aleator în jurul valorii teoretice de 15 steme. Rezultatul este cel prezis, şi anume o
distribuţie gaussiană. Evident, dacă am fi continuat aruncările, distribuţia ar fi fost din ce în ce
mai apropiată de o distribuţie normală.
Cum putem folosi acest demers în cazul unei populaţii pe care dorim să o evaluăm? E
simplu: să ne imaginăm că am forma eşantioane extrăgând aleator subiecţii din populaţie, până
am epuiza toţi subiecţii. Evident, prin această metodă nu schimbăm cu nimic comportamentul
individual al subiecţilor (ei rămânând aceeaşi). Însă valorile medii ale eşantioanelor se vor
comporta similar cu seriile de monede, şi anume vor diferi aleator faţă de media populaţiei,
similar cu figura de mai sus. Consecinţa este foarte importantă. Este deci suficient să împărţim
populaţia în eşantioane aleatoare ca să obţimem distribuţia gaussiană pentru mediile acestora. Şi
asta fără să ne intereseze distribuţia valorilor individuale (care poate fi foarte diferită de
distribuţia normală).
În plus, în cazul unei distribuţii aleatoare, cunoscând funcţia matematică, putem calcula
mai mulţi parametri, de exemplu “lăţimea” distribuţiei. În cazul monedelor, valoarea teoretică
este:
Valoarea reală (23 -9 = 14) este destul de apropiată de cea teoretică (evident, dacă seriile
ar fi fost mai mari – de 100, de exemplu – valoarea reală ar fi fost mai aproape de cea teoretică).
Cel mai important rezultat pe care îl putem obţine prin metoda eşantionării este să
aproximăm cât mai bine comportamentul întregii populaţii (mai exact a mediei sau a tendinţei
centrale) doar măsurând un mic eşantion din aceasta. Pentru a înţelege intuitiv acest lucru, voi
folosi un exemplu simplu de măsurare. Exemplul este ideal, pentru că ne vom imagina o situaţie
pentru care ştim cum se comportă întreaga populaţie, şi vom vedea cât de mult ne putem apropia
de media ei calculând media unui singur eşantion.
Să presupunem că aplicăm un test de cunoştinţe format din 3 probleme similare la o
întreagă populaţie (să zicem toţi copii de 12 ani). Vom puncta cu 1 punct fiecare rezolvare
corectă şi cu 0 puncte fiecare rezolvare greşită. Deci rezultatele posibile sunt 0p, 1p, 2p sau 3p.
Să presupunem acum că 25% din populaţie obţine 0p, 25% 1p, 25% 2p şi 25% 3p. Media pentru
întreaga populaţie este deci 1,5p.
Să presupunem acum că alegem la întâmplare un eşantion de 2 subiecţi din populaţie? Ce
medie poate avea acest eşantion? În acest caz particular, putem să cunoaştem ce eşantioane se pot
extrage, şi ce medii putem obţine. Datele sunt prezentate în tabelul 2:
Ceea ce se poate remarca imediat este că, din cele 16 situaţii posibile (sunt atâtea pentru
că putem avea oricare din rezultate şi pentru subiectul 1 şi pentru subiectul 2; verificaţi!) avem
doar un eşantion cu media de 0p şi doar unul cu media de 3p; în schimb, avem 4 eşantioane cu
media de 1,5p (figura 2).
4.5
3.5
2.5
1.5
.5
0
0 .5 1.0 1.5 2.0 2.5 3.0
Esa ntioane de 2
Adică avem de 4 ori mai mari şanse de “nimeri” un eşantion egal cu media populaţiei
decât de valori extreme (0 sau 3).
Mai mult, sunt 10 eşantioane (din cele 16 posibile) cu medii cuprinse între 1 şi 2; deci
vom avea de aproape 2 ori mai mari şanse să greşim cel mult 0,5p când vom încerca să apreciem
media populaţiei cu ajutorul doar a 2 subiecţi, decât să greşim 1p sau mai mult de 1p.
14
12
10
.333
.667
1.000
1.333
1.667
2.000
2.333
2.667
3.000
Esa ntioane de 3
45
40
35
30
25
20
15
10
0
0
.2500
.5000
.7500
1.0000
1.2500
1.5000
1.7500
2.0000
2.2500
2.5000
2.7500
3.0000
Esa ntioane de 4
De exemplu, sunt 186 de eşantioane diferite posibile de câte 4 subiecţI între 1 şi 2 şi doar
70 între 0 şi 1, respectiv 2 şi 3. Adică avem de peste 2,5 ori mai mari şanse de să greşim
maximum 0,5p decât mai mult atunci când aproximăm media populaţiei cu media unui eşantion
de 4 subiecţi.
Dacă folosim eşantioane extrase aleator mai mari (de 30 sau 100 de subiecţi) putem fi de
cele mai multe ori foarte aproape de media reală. Şi asta doar cu un singur eşantion. Dar numai în
cazul extragerii lui perfect aleatoare.
Consecinţele acestui fapt sunt foarte importante în cercetare. În primul rând, pentru că
măsurătorile pe care le putem face nu sunt foarte precise, putem să ne apropiem atât de mult cu
un eşantion aleator de media reală a populaţiei, încât să nu putem măsura diferenţa. Există însă
două mici “probleme” care ne reduc entuziasmul. Prima este faptul că avem doar o şansă foarte
mare să fim aproape de media reală, dar nu certitudinea. Putem fi ghinionişti şi să nimerim foarte
departe, cu toate că probabilitatea este în general extrem de mică, dar nu zero.
A doua problemă este că nu putem în realitate să extragem eşantioanele perfect aleator (ar
trebui să avem adresa fiecărui subiect din populaţie într-o urnă, ceea ce este imposibil). Problema
este că vom greşi cu atât mai mult cu cât suntem mai departe de eşantionarea aleatoare; mai grav
e că nu putem nici aprecia cât de departe suntem de eşantionarea perfectă. De aceea, este de
preferat să descriem în lucrare cât mai exact metoda de eşantionare folosită, pentru a permite
cititorilor să aprecieze ei cât de departe suntem de eşantionarea aleatoare.
În continuare, voi prezenta pe scurt erorile posibile ale metodelor de măsurare folosite în
psihologie, şi căile prin care le putem corecta.
Orice metodă de măsurare am folosi pentru a evalua comportamentul uman, ea presupune
interacţiunea evaluatorului cu subiectul într-o situaţie concretă. Ca urmare, aceste 3 elemente
(deci în afara instrumentului de măsură în sine) pot produce la rândul lor erori de măsurare.
Evaluatorul poate produce erori prin prezentarea eronată a instrucţiunilor de rezolvare (în
cazul unui test psihologic sau a unei sarcini experimentale, ceea ce poate duce la rezolvări greşite
datorită neânţelegerii sarcinii); o altă sursă de eroare este dată de posibilitatea influenţării subtile
a rezultatului evaluării în direcţia expectanţelor evaluatorului (de exemplu prin aprobarea cu voce
tare sau gesturi a răspunsului înainte de a fi sigur dacă este corect, respectiv interpretarea
predominant favorabilă sau nefavorabilă a răspunsurilor ambigue).
Subiectul poate provoca erori de măsurare prin eludarea constrângerilor sarcinii (de
exemplu răspunsuri nesincere dar dezirabile la testele de personalitate, sau “ghicirea” răspunsului
corect la teste de inteligenţă sau de cunoştinţe) sau prin comportamente neexpectate de evaluator
sau autorul instrumentului (de exemplu refuzul de a rezolva un test de inteligenţă nu înseamnă
deloc incapacitatea de a-l rezolva corect).
Situaţia în care se produce evaluarea este şi ea sursă de erori, cele mai importante fiind
legate de uniformitatea situaţiei şi reacţiile individuale la situaţia de măsurare. Situaţia în care se
realizează măsurătoarea este doar aproximativ identică pentru fiecare subiect în parte; diferenţele
de la un subiect la altul pot provoca erori (imaginaţi-vă doar situaţia unui examen oral; condiţia
de evaluare este diferită pentru subiectul care răspunde la 8 dimineaţa de cel care răspunde la 8
seara).
Reacţia subiectilor la situaţia de măsurare este diferită; spre exemplu, în cazul unui
interviu de selecţie, o diferenţă importantă în rezultat se poate datora familiarităţii cu situaţia de
selecţie (ne putem aştepta la diferenţe între un subiect pentru care este primul interviu din viaţa
lui şi un subiect pentru care este al 10-lea şi datorită experienţei anterioare diferite).
Principala problemă în cazul în care folosim pentru prima dată o metodă de măsurare este
faptul că nu cunoaştem ponderea acestor erori posibile în rezultatul obţinut. Să ne amintim că noi
obţinem doar un scor, care conţine toate aceste erori; deci nu le putem separa. Soluţia este să
începem cu o evaluare calitativă a erorilor posibile. De cele mai multe ori o astfel de primă
evaluare calitativă e uşor de obţinut prin aplicarea de câteva ori a instrumentului de măsurare pe
un număr mic de subiecţi. Pentru exemplificare, pe CD am inserat 4 astfel de cazuri înregistrate
video (2 subiecţi diferiţi evaluaţi fiecare cu aceleaşi sarcini).
O astfel de primă evaluare calitativă consumă puţin timp şi permite depistarea celor mai
importante dintre erorile care pot afecta rezultatele măsurătorilor. Odată identificate erorile,
putem studia cauzele lor şi să cautăm soluţii de eliminare sursei erorii sau reducere a mărimii
efectului lor.
Evident, pentru a răspunde corect, subiectul trebuie să desprindă anumite relaţii sau
criterii care stau la baza organizării interioare a matricii (pe linii şi coloane) şi să aleagă figura ce
întregeşte în mod logic desenul. Cu alte cuvinte, subiectul trebuie să analizeze materialul, să
compare, să combine, uneori să generalizeze, adică să facă efort de gândire. Rezolvarea unei
probe elementare este foarte uşoară, în timp ce soluţionarea altora este un fenomen rar.
Compoziţia testului a fost inspirată de analiza teoretică a inteligenţei.
În sfârşit, o remarcă finală: testele psihologice au creditul de a fi mijloace de măsură. Or,
în psihologie, putem vorbi de măsurare numai într-un sens foarte larg. Experienţa psihologică nu
ne furnizează decât relaţii de ordine (J.Piaget). În psihometrie, convertim aceste relaţii de ordine
în distanţe sau intervale având conştiinţa că realizăm doar o aproximare ce poate fi practic
suficientă în numeroase situaţii. Altfel, cine ar putea admite, de exemplu că “un elev de zece” s-ar
putea compune din “doi elevi de cinci,”deşi 5 + 5 = 10. Fenomenele psihice nu sunt aditive, în
psihologie nu există unităţi de măsură ca în fizică. În lipsa unităţilor obiective de măsură se alege
o metrică arbitrară, care poate satisface din punct de vedere practic. Când psihologul francez
A.Binet lansa prima “Scară metrică a inteligenţei”, el observa cu mult bun simţ: “…calităţile
intelectuale nu se măsoară ca lungimile, ele nu sunt superpozabile”; scara metrică permite “un
clasament ierarhic între inteligenţe diferite; şi pentru nevoile practicii acest clasament echivalează
cu măsurare”.
Rezumat
Apariţia psihologiei experimentale este asociată cu înfiinţarea de către Wilhelm Wundt în
anul 1879 a primului institut de psihologie la Leipzig. Aici s-au format promotorii acestui
domeniu pe plan mondial. Observaţia ca metodă permite o clasificare a informaţiei Astfel se pot
prefigura relaţii cauzale a căror investigare este posibilă ulterior pe bază de experiment.
Alcătuirea unei grile de observaţie constituie un proces sistematic în care se realizează iniţial
delimitarea categoriilor, urmată de aplicare şi determinarea fidelităţii (pe baza coeficientului
Cohen).
Investigaţia experimentală constituie un demers sistematic ce implică o serie de etape:
observaţia sau analiza de caz, stabilirea ipotezelor, proiectarea design-ului experimental, selecţia
subiecţilor, experimentarea propriu-zisă şi analiza-interpretarea datelor. În funcţie de numărul
variabilelor independente implicate, design-ul experimental poate fi: de bază (este implicată o
singură variabilă independentă) sau factorial (sunt implicate mai multe variabile independente). O
formă particulară a design-ului factorial este design-ul mixt în care cel puţin una dintre variabile
este clasificatorie. Testul constituie un experiment standardizat. Spre deosebire de metoda
experimentală în care se evidenţiază o serie de legităţi, testul este utilizat în vederea evaluării
diferenţelor interindividuale.
Rezumat
Rezumând, din cele prezentate putem înţelege importanţa pe care identificarea şi corectarea
erorilor de măsurare o are în cercetare. Principalele căi de acţiune sunt: separarea erorilor
sistematice de cele aleatoare, urmată de identificarea cauzelor şi eliminarea efectelor erorilor
sistematice, respectiv reducerea amplitudinii erorilor nesistematice.
Bibliografie facultativă
Henri Poincaré (1986) Ştiinţă şi ipoteză, Editura Ştiinţifică şi Enciclopedică, Bucureşti.
G. King, R. Keohane, S. Verba (2000) Fundamentele cercetării sociale, Editura Polirom,
Bucureşti.
David Klahr (2000) Exploring Science., MA: MIT Press, Cambridge.
Miles, M. B., Huberman, A. M. (1984) Analyzing qualitative data. A source book for new
methods, Beverly Hills, C. A. Sage.
Modulul 3
Designuri de cercetare descriptivă
Exemplu:
Unui lot de cadre didactice( în număr de 164) i s-a cerut să facă descrierea concisă a elevilor
din clasele cu care lucrează. Pentru a uşura sarcina, li s-au oferit şi mijloace de expresie strict
necesare -atribute sau propoziţii descriptive scurte, având ataşate scale cu gradaţii - care să se
refere la inteligenţă, memorie, mod de exprimare, sârguinţă, dexteritate, etc., precum şi la
trăsături de caracter, de personalitate. S-au obţinut în acest fel peste 1500 de caracterizări sau
profile ale elevilor, material care a fost supus apoi analizei ( M.Gilly,1972 ).
Constatarea: atributele care diferenţiază elevii, în profilele întocmite de profesori - sunt cele
legate nemijlocit de reuşita şcolară: inteligenţă, memoria, atenţia, sârguinţa, vocabularul, stilul de
lucru. Dincolo de aceste aspecte, contururile personalităţii elevului se şterg; el rămâne parcă un
“necunoscut”; portretele încep să se asemene destul de mult între ele, trăsăturile fiind prea puţin
diferenţiate. Copilul este privit adesea prin prisma statutului său şcolar, în esenţă, prin prisma
unei optici profesionale care face ca datele să fie selectate şi filtrate în lumina exigenţelor
profesiunii didactice. Spre exemplu, un copil este disciplinat dacă stă cuminte în bancă, dacă nu
dă de lucru profesorului. Dar conceptul de disciplină nu are doar un “conţinut negativ”; în primul
plan trebuie să fie ceea ce face, deci activitatea elevului, şi nu doar inhibiţia sau reţinerea ei. Pe
de altă parte, conformismul şi docilitatea sunt preţuite de profesor, dar repudiate de elev.
Alături de observaţia curentă, ocazională, practicată de profesor în clasă, de inginer în
intreprindere, de ziarist în viaţa socială etc., distingem observaţia sistematică, străină de clişee
obişnuite, care urmăreşte înregistrarea obiectivă a faptelor, înscriindu-se într-un program explicit,
ce restrânge câmpul studiat şi impune selectarea datelor relevante.
Strict vorbind, observaţia este percepţia unui eveniment, a unei conduite, a unui document
(Fraisse, 1982). Dar ea nu se reduce practic la simpla “lectură” a faptului brut, ci se prelungeşte
într-un act de clasificare, de încadrare a informaţiei în anumite concepte şi de anticipare a unor
relaţii.
Acelaşi autor atrăgea atenţia asupra dualităţii modului de percepţie asupra propriei
personalităţi. Omul este capabil – în opinia autorului – de o dublă cunoaştere: una, prin care el
sesizează propriile gânduri, sentimente, senzaţii etc, şi a doua, prin care se vede pe sine trăind şi
acţionând aşa cum îi vede trăind şi acţionând pe ceilalţi şi, sub acest unghi, el se cunoaşte pe sine
în acelaşi chip în care îi cunoaşte pe alţii.
Autoobservaţia este observaţia aplicată asupra propriei persoane, ceea ce înseamnă nu
numai (introspecţia) cunoaşterea gândurilor, sentimentelor şi aspiraţiilor intime, ci şi cunoaştera
prin activiatea proprie, din succese şi eşecuri, din actele relaţiilor cu semenii, din încercările vieţii
etc. Introspecţia este numai o latură a autoobservaţiei.
Autoobservaţia poate fi valorificată în forma unor itemi de chestionar. După cum se poate
vedea din exemplul de mai jos, în acest caz subiectul este solicitat să aprecieze gradul de acord cu
o serie de afirmaţii, răspunsul său fiind cuantificat cu ajutorul unei scale numerice. Răspunsul său
va presupune accesul la datele autoobservaţiei.
Exemple:
1o.Bakeman & Brownlee (1980) au studiat comportamentul de joc la preşcolari. Pe baza
unui studiu prealabil, ei au determinat cinci categorii de joc, ce au constituit cadrul de clasificare
pentru observaţia efectuată. Astfel, reacţiile subiecţilor au fost încadrate în una dintre următoarele
tipuri:
Neocupat: copilul nu face nimic, sau îi priveşte pe ceilalţi;
A fi împreună: copilul se află laolaltă cu alţi copii fără a fi ocupat cu vreo activitate;
Joc solitar: copilul se joacă singur dar nu este interesat sau afectat de activităţile celorlalţi
copii;
Joc paralel: copilul se joacă alături de alţi copii, dar nu se joacă cu ei;
Joc colectiv: copilul se joacă cu ceilalţi, şi participă la activităţile de joc organizat, ca
membru al grupului.
Observaţia era structurată atât în funcţie de timp cât şi de vârsta subiecţilor. (tabelul 1.1)
În cadrul cercetării, autorii au fost în mod particular interesaţi de secvenţa sau ordinea în
care copiii s-au angajat în diferite comportamente. Ei au constatat, de exemplu că rareori copiii au
trecut de la comportamentul “neocupat”, la cel de “joc paralel”. De asemenea, odată cu avansarea
în vârstă, ei au trecut frecvent de la jocul paralel la cel colectiv, ceea ce indică faptul că jocul
paralel reprezintă o stare tranzitorie în cadrul dezvoltării. Grila de observaţie expusă poate fi
utilizată atăt în plan sincronic (transversal), cât şi diacronic (longitudinal).
2o. Pentru a identifica un tip temperamental sau altul căruia îi aparţine o persoană vom
putea găsi în activitatea şi în viaţa cotidiană situaţii relevante. De exemplu, o situaţie tipică de
aşteptare, o situaţie competiţională, o activitate cuprinzând un element imprevizibil şi de
dificultate (de pildă, un traseu mai greu de excursie), o sarcină de reprezentare a colectivului într-
o confruntare (de opinii) sau în faţa autorităţii etc, toate acestea constituie situaţii-test pentru că
pun în evidenţă particularităţi sau diferenţe individuale uşor de clasificat.
Asemenea situaţii cuprind indicii de temperament pe care-i putem sistematiza prin
condensarea experienţei într-o grilă de observare a comportamentului (Tabelul 1.2), arătând în
dreptul faptelor de conduită ipotezele plauzibile cu privire la categoria prezumtivă de
temperament. Se notează cu “XX” clasificarea, respectiv ipoteza cea mai plauzibilă, şi cu “X”
încadrarea doar plauzibilă în studierea unui caz sau altul. Un asemenea document este susceptibil
de îmbunătăţire continuă. Prin însumări pe coloane decidem asupra apartenenţei la un anumit tip
sau altul. Preocuparea de cuantificare este aici minimă.
Observatorul 1 Observatorul 2
nr. obs. Secur izant Insecur izant nr. obs. Secur izant Insecur izant
1 I 1 I
2 I 2 I
3 I 3 I
4 I 4 I
5 I 5 I
6 I 6 I
7 I 7 I
8 I 8 I
9 I 9 I
10 I 10 I
11 I 11 I
12 I 12 I
13 I 13 I
14 I 14 I
15 I 15 I
16 I 16 I
17 I 17 I
18 I 18 I
19 I 19 I
20 I 20 I
Fiecare observaţie s-a realizat simultan de către cei doi observatori, pentru aceeaşi
pereche mamă –copil. Rolul observatorilor a constat în a atribui, pe baza definiţiilor grilei,
categoria “securizant” sau “insecurizant” pentru comportamentul mamei. Se poate remarca faptul
că observatorii nu pot atribui decât o singură categorie unei perechi mamă–copil la un moment
dat (cele două categorii sunt disjuncte). Se trece la calculul coeficientului K utilizând formula:
Po - Pe
K=
1 - Pe
unde Po reprezintă proporţia concordanţelor observate dintre categoriile celor doi observatori
(din numărul total de observaţii) şi Pe proporţia concordanţelor care ar putea apărea întâmplător
în cazul rezultatelor date. Pentru a înţelege Pe să ne imaginăm că cei doi observatori ar obţine
aceleaşi date, dar nu ar folosi grila de observaţie, ci ar decide la întâmplare (fară să observe
comportamentul mamei).
Pentru calculul valorilor Po şi Pe se condensează frecvenţa concordanţelor şi
discordanţelor dintre cei doi observatori în matricea de mai jos, numită matrice de concordanţe.
Prin definiţie, observaţiile se consideră concordante atunci când cei doi observatori atribuie
aceeaşi categorie unei perechi mamă – copil (adică securizant – securizant sau insecurizant –
insecurizant), şi discordanţe atunci când observatorii atribuie categorii diferite (securizant –
insecurizant sau insecurizant – securizant).
Observatorul 1
securiz. insecuriz.
Observatorul 2 securiz.
16 0
insecuriz. 1 3
0,95 - 0,71
K= = 0,83
1 - 0,71
Interpretarea coeficientului K este similară unui coeficient de corelaţie (cu valori între -1
şi +1). Este evident că din punct de vedere practic vom fi interesaţi doar de valorile pozitive ale K
(cele negative indicând o “concordanţă” inferioară celei întâmplătoare).
Calculul semnificaţiei valorilor K fiind laborios, Cohen propune valoarea – prag de 0.7
pentru coeficienţi semnificativi. Deci orice valoare K egală sau mai mare decât 0,7 este
semnificativă. În cazul nostru, valoarea calculată este 0,83, mai mare deci decât valoarea prag.
Grila de observaţie are deci o bună fidelitate.
Până acum am discutat despre populație și modul în care putem accesa această populație, eludând
faptul că în realitate noi nu implicăm în studiu niciodată toată populația. Grupul de participanți
selectați pentru participare la studiu este eșantionul. Nevoia de esantionare are explicatii
practice: i) populațiile definite sunt extinse, nu avem posibilitatea de a include toți indivizii
populației în studiu; ii) nu este doar mare ca volum, dar așa cum am văzut populația este în
continuă schimbare, dacă am tot aștepta ca populatia “sa se așeze” nu am derula niciun studiu.
Din punct de vedere al corectitudinii concluziilor, într-un studiu de ”tip survey” este esențial ca
eșantionul selectat să fie reprezentativ, adică să includă toate ”tipologiile” de indivizi care
compun populația, în procentul în care acestea sunt prezente în populație. Dacă populația țintă
este compusă 80% femei și 20% bărbați, atunci și eșantionul nostru ar trebui să respecte acest
procent. În cazul în care eșantionul nostru nu respectă acest procent (ex. cadrul de eșantionare nu
a fost corect ales, metodologia de colectare de date nu este potrivită, etc) eșantionul va fi unul
distorsionat, adică nu ne va livra informații corecte despre populația țintă. Ca urmare, dacă ne
interesează să investigăm printr-un studiu de ”tip survey” fenomenul deciziilor manageriale, iar
populația țintă include mai mulți bărbați decât femei, pentru a putea generaliza rezultatele
obținute la populația țintă, eșantionul trebuie astfel selectat încât să fie reprezentativ din acest
punt de vedere (adică să replice procentele existente în populație). De obicei, în studiile de ”tip
survey” există mai multe criterii de reprezentativitate precum, sex, vârsta, etnia, sau nivel de
școlarizare fiind doar câteva dintre cele mai frecvent utilizate. Criteriile de reprezentativitate
menționate caracterizează majoritatea studiilor sociologice, politologice sau de marketing, însă în
cazul psihologiei dincolo de aceste criterii frecvent suntem interesați de reprezentativitate și din
punct de vedere al altor variabile, precum inteligența (sau alte trăsături psihologice precum
îngrijorare sau anxietate). Deosebirea dintre variabila inteligență și alte variabile precum sex sau
vârstă, este că în timp ce știm (sau putem afla relativ simplu) cum arată populația din punct de
vedere al celor din urmă, ne este mai greu să aflăm cum arată populația din punct de vedere al
inteligenței. Dacă ne uităm la datele ultimului recensământ, ne va fi ușor să vedem dacă un
eșantion este distorsionat din punct de vedere al genului, comparând raportul bărbați/femei din
eșantion cu același raport din populație. Întrebarea este, oare cum putem să ne asigurăm dacă din
punct devedere al inteligenței eșantionul nostru este sau nu reprezentativ, din moment ce nu
dispunem de date similare recensământului care să ne ofere aceste informații? Din acest punct de
vedere, de multe ori singurul indiciu al reprezentativității eșantionului rămâne metoda de selecție
utilizată. Ca urmare, întrebarea este prin ce metodă de selecție putem garanta reprezentativitatea
unui eșantion pentru o anumită populație. Răspunsul la această întrebare este foarte clară, nu
există garanție că un eșnation va fi reprezentativ pentru o anumită populație, ceea ce putem face
este să urmăm o metodologie care crește șansa ca eșantionul să fie reprezentativ. În principiu
există două categorii de selecție, selecție probabilistică și selecție non-probabilistică. În cazul
selecției probabilisitice criteriile de selecție al unui individ sunt fundamentate pe calcul (mai
precis estimări) probabilistic, adică estimări ale probabilității ca un individ să fie selectat. În cazul
selecțiilor non-probabilisitice, criteriul probabilisitic nu există, cercetătorul selectează subiecți pe
baza altor criterii, decât cele probabilistice (ex. selectăm subiecți din rândul prietenilor, deoarec la
ei avem acces – eșantion de conveniență). Diferența majoră dintre cele două tipuri de selecție este
că în timp ce în cazul eșantioanelor probabilisitice putem estima probabilitatea de a fi
reprezentativ din punct de vedere al unei variabile, în timp ce în cazul unui eșantion non-
probabilistic acesta este mult mai dificil (sau chiar imposibil).
Oricare ar fi criteriul selecției, planul de eșantionare se aplică unor unități, denumite
unități ale eșantionării, care nu întotdeauna este individul. În cazul unor cercetări din domeniul
psihologiei sănătății, putem să investigăm comportamente care mențin sănătatea fizică și mentală
la școlari, având ca și unitate de selecție a eșantionului școala sau clasa și nu individul. Cazul în
care o clasă a fost selectată pentru participare la studiu, toți elevii clasei vor fi invitați să
participe.
Revenind la metodele de selecție, cea mai cunoscută este eșantionarea randomizată
simplă. Este o metodă de selecție probabilistică, care se realizează prin asignarea unor
probabilități egale fiecărei unități de selecție. Să ne închipuim că introducem denumirea tuturor
unităților de selecție (indivizi, școli, clinici sau organizații) într-un bol și extragem întâmplător un
anumit număr de unități. Dacă luăm un zar obișnuit, cu șase fețe și ne propunem să aruncăm acest
zar de 1000 de ori, foarte probabil frecvențele de apariție a diferitelor fețe vor fi egale (sau foarte
apropiate). Dar dacă stabilim să o aruncăm doar de 6 ori, oare fiecare față va apărea o singură
dată? Cei care am derulat astfel de experimente (chiar și în contextul unui joc) știm că rareori
(probabilitatea poate fi calculată) se întâmplă ca din șase aruncări să obținem fiecare număr de la
1 la 6. La fel se întâmplă și în cazul eșantionării randomizate simple, dacă eșantionul este
suficient de mare, avem șansa ca fiecare categorie a populației să fie reprezentată (chiar și
categorii cu frecvență redusă) în timp ce pentru eșantioane mici probabilitatea ca în eșantion să
apară toate categoriile populației este mai redusă. Adică, șansa ca eșantioanele mici să fie
distorsionate este mare, dar va fi și mai mare pentru categoriile al căror frecvență este redusă în
populație. Motiv pentru care în practica cercetării utilizăm o variatate al eșantionării randomizate
simple, eșantionarea randomizată stratificată. Potrivit acestei strategii populația este
stratificată în baza unor criterii de stratificare, de ex. gen și vârstă (bărbați-1-15 ani, bărbați -16-
25 ani, bărbați 26-35 ani, femei-1-15 ani, femei -16-25 ani și femei 26-35 ani). Din fiecare strat
se va extrage pe principiul randomizării simple un anumit procent de unități astfel încât procentul
unui strat din eșantion să fie identică cu procentul aceluiași strat din populație. De ex., dacă
categoriile identificate în populație au următoarea frecvență: 15%, 18%, 21%, 13%, 24% și 9%
atunci la un eșantion de 100 de subiecți frecvența categoriilor va fi: 15%, 18%, 21%, 13%, 24%
și 9%.
Din punct de vedere al planului cercetării, studiile de ”tip survey” se împart în trei
categorii principale: studiu transversal, studiu cu eșantioane independente succesive și studiu
longitudinal. Categoriile sunt definite în baza criteriul timp, adică al modului în care diferitele
tipuri de studii abordează evoluția în timp al unui fenomen, de ex. dezvoltarea limbajului. Studiul
transversal presupune analiza dezvoltării limbajului prin selectarea unor eșantioane aparținând
diferitelor categorii de vârstă (ex. studiul limbajului la 6, 7 și 8 ani). În realitatea în studiu avem
trei eșantioane, indivizii dintr-o categorie de vârstă sunt independenți de participanții de cei din
restul categoriilor. În cazul studiului longitudinal același fenomen este studiat pe un singur
eșantion, aceeași participanți fiind evaluați la vârsta de 6, 7 și 8 ani. În cazul studiului cu
eșantioane independente succesive în primul an al studiului este selectat un eșantion (care
include copii de 6, 7 și 8 ani), anul următor un al doilea eșantion similar și în al treilea an, un al
treilea eșantion similar. Participanții incluși în diferitele eșantioane sunt independenți, alegerea
unui participant într-un eșantion nu influențează alegerea altor participanți în alt eșantion.
Indiferent de planul de cercetare utilizat colectarea datelor se poate derula în diferite
feluri. Putem colecta date prin: chestionare transmise prin e-mail, chestionare prin interviu direct,
chestionare prin telefon și chestionare prin intermediul internetului.
Bibliografie minimală pentru acest modul
READER Curs Psihologie Experimentală și Metode de Analiză a Datelor
Bibliografie facultativă
Anderson H. Norman (2001) Empirical Direction in Design and Analysis. Routledge, USA
Chalmers Alan (1999) What is this thing called science? Hackett Publishing Company, Inc.
Indianapolis.
Derry Gregory (1999) What Science Is and How It Works. Princeton Univerity Press, New
Jersey.
Lakatos Imre (1973) Science and Pseudoscience.
http://www.lse.ac.uk/collections/lakatos/scienceAndPseudoscience.htm
Radu, I. şi colab. (1993) Metodologie psihologica si analiza datelor, Cluj-Napoca, Ed. Sincron.
Stanovich Keith (2001) How to think straight about psychology. Allyn & Bacon, Boston
Wynn M. Charles and Wiggins W. Arthur (2001) Quantum leaps: Where Real Science Ends ...
and Pseudoscience Begins. Joseph Henry Press Washington, D.C.
Modulul 4
STUDII DESCRIPTIVE ŞI MODALITĂȚI DE ORGANIZARE A COLECŢIEI DE DATE
Exemplu:
Cu ajutorul unui aparat flicker se determină în laborator frecvenţa critică de fuziune a luminii
intermitente. O suită de măsurări asupra aceluiaşi subiect ne oferă un indice asupra eficienţei
vizuale. Pentru discuţie să reţinem rezultatele obţinute de doi subiecţi:
N.V. C.M.
47 48 50 52
47 47 50 51
48 46 52 52
49 48 48 50
Prima remarcă este că variabila rezultă direct din lectura aparatului şi că acelaşi subiect se
caracterizează prin valori care oscilează destul de puţin în jurul unei cifre – reper, motiv pentru
care volumul colecţiei de date recoltate poate fi mai restrâns.
Se pune întrebarea: care este în populaţie registrul de variaţie, al pragului de fuziune? –
ceea ce presupune extinderea determinărilor pe o colectivitate mai largă, numită colectivitate sau
grup de referinţă. Se constată că în condiţii de repaus întinderea variaţiei este cuprinsă între 40 şi
70 Hz. Scăderea cu 3 – 4 Hz a pragului după un efort psihofiziologic este un indiciu concret al
apariţiei oboselii vizuale.
Să observăm că proba ca atare constituie într-un fel o “fereastră deschisă” spre mai multe
faţete ale fenomenului considerat. Remarca este valabilă şi pentru alte probe psihologige. Ne
poate interesa în exemplul de mai sus o măsură a stării de oboseală, un indice asupra eficienţei
vizuale la diferiţi subiecţi, fluctuaţii datorate stimulării concrete a altor analizatori. De asemenea,
poate fi vorba de studiul lateralitaţii, pornind de la difernţa dintre pragul de fuziune al ochiului
conducător în raport cu celălalt. Volumul de date, ca şi organizarea lor internă vor depinde de
problema pusă spre rezolvare şi de gradul de împrăştiere sau variabilitate a datelor. De pildă,
determinarea pragului discriminării tactile – cu ajutorul unui esteziometru – duce la o colecţie de
date având o variabilitate de–a dreptul deconcertantă. În consecinţă, volumul colecţiei de date –
având o variabilitate sau o dispersie mare, - va trebui să fie mult mai mare. Se poate estima acest
lucru pe baza unor formule stabilite.
În psihologia aplicată cum este şi cazul exemplelor de mai sus – sunt frecvente situaţiile
în care ne interesează poziţia relativă a unui individ, respectiv a unui rezultat specific, în cadrul
unui grup mai larg. Este situaţia tipică a testării psihologice. Spre exemplu, într-o examinare
psihologică problema care se pune este situarea individului în raport cu grupul de referinţă, a
cărui investigaţie furnizează un tabel de norme sau o tipologie. Un rezultat, o cotă individuală,
luată singură reprezintă un bit de informaţie care nu ne spune mare lucru. Trebuie să ştim ceva
despre rezultatele celorlalţi subiecţi. Interpretarea unei măsuri, a unei cote depinde de cunoaşterea
poziţiei ei relative într-un grup de referinţă, ceea ce presupune strângerea prealabilă (sau
simultană) de date asupra acestei colectivităţi şi întocmirea unui tabel de norme sau unei tipologii
pe această colectivitate. Investigarea grupului, respectiv a individului devin astfel
complementare.
Exemplu:
Se pune întrebarea dacă o stare de tensiune psihică de încordare produce modificări în
rezultatele obţinute la un test de inteligenţă. Pentru a răspunde la această întrebare se constituie
două grupe dintr-un lot mai mare de subiecţi cuprinşi într-o testare anterioară a inteligenţei făcută
cu alt scop. În noua experienţă, fiecare subiect este supus din nou, în mod individul, la unele
probe din bateria iniţială de teste, primul grup este retestat în condiţii de testare psihică graţie
motivării date repetării examenului: s-a explicat, de pildă, fiecărui subiect că rezultatul (CI)
obţinut de el la prima testare a fost neaşteptat de slab şi că i se oferă ocazia de a-şi îmbunătăţi
scorul. Componenţii celui de-al doilea grup sunt trataţi altfel şi anume într-o atmosferă
emoţională neutră, motivându-se că experimentatorul este interesat pur şi simplu de rezultatele
unei retestări cu probe identice.
Într-o experienţă efectivă, din subtestele aplicate, cercetătorul a reţinut datele referitoare la
volumul memoriei de numere, probă care s-a dovedit mai sensibilă la factorul implicat: tensiunea
psihică. Aceste date iau forma numerică (după Spencer şi colab., 1968). Variabila se constituie
prin însumare de puncte, de răspunsuri exacte. Cu s1, s2,…, sn, se notează subiecţii cuprinşi în
experienţă (Tab. 4.2.).
Tabel 4.2.
Grupul neutru (N) Grupul anxios (A)
(s1) 11 (s9) 11 (s17) 9 (s25) 13
(s2) 10 (s10) 11 (s18) 10 (s26) 4
(s3) 16 (s11) 14 (s19) 16 (s27) 10
(s4) 13 (s12) 16 (s20) 10 (s28) 11
(s5) 11 (s13) 13 (s21) 10 (s29) 13
(s6) 9 (s14) 10 (s22) 10 (s30) 11
(s7) 13 (s15) 13 (s23) 17 (s31) 13
(s8) 17 (s16) 17 (s24) 14 (s32) 11
În protocolul brut apar aşadar subiecţii (indivizii) reperaţi printr-un indicator (s1, s2, …) şi
rezultatele corespunzătoare fiecăruia. Transcrierea acestui protocol pe un suport informatic va
duce la constituirea unui fişier de date.
În continuare se pune întrebarea: cum să extragem informaţie din datele brute? Trebuie să
scoatem la lumină aspecte sau relaţii ascunse în colecţia de date. Asemenea aspecte ar putea fi:
dacă, în medie grupul N diferă de grupul A;
dacă diversitatea s-au dispersia datelor creşte în condiţia A;
ce rol joacă diferenţele individuale?
● dacă diferenţele constatate pot fi generalizate?
După cum s-a arătat, în urma unui experiment, a unei observaţii sistematice sau a unei
anchete, se obţine de regulă o colecţie de date, care nu pot fi cuprinse şi examinate printr-o
simplă “inspecţie” vizuală. Trebuie să intervină o operaţie de clasificare, ordonare şi condensare a
datelor brute, care să permită relevarea unor legităţi sau dependenţe cât mai precise.
În fiecare tabel distingem coloane şi linii sau rânduri. Fiecare linie şi fiecare coloană are
un titlu, o explicaţie prescurtată, precizându-se totodată unităţile de măsură. Tabelul însuşi poartă
un titlu - notat deasupra -, care redă concis conţinutul său. De regulă, variabilele independente
sunt acelea care servesc la gruparea populaţiei, iar datele cifrice din tabel reflectă variabila
dependentă.
Pentru a nu fi prea încărcate, în tabele reducem uneori numărul claselor sau categoriilor
stabilite, contopind intervale sau categorii învecinate. Precizarea numărului de subiecţi care
compun grupele studiate este obligatorie pentru orice tabel. Când N este mic nu se recurge la
exprimarea procentuală, pentru că aceasta ar exagera proporţiile.
Plecând de la datele sistematizate în tabel, urmează să preciză forma distribuţiei servindu-
ne de reprezentarea grafică a ansamblului de date.
Graficul de bază este - aşa cum s-a spus - histograma.
Exemplu:
În tabelul 2.5, sunt prezentate rezultatele unei probe de memorie efectuată pe un eşantion de 51
subiecţi (N=51).Variabila prezintă valori între 3 şi 26. Deci întinderea varianţei este: (Xmax- Xmin )
+1, (26-3)+1=24. Datele se vor condensa în grupuri de câte trei:
3,4,5,
6,7,8
.......
deci intervalul (I), este 3. Valorile aflate la mijlocul fiecărui interval se notează cu xk.
Pe axa abciselor (Ox) marcăm opt intervale continue egale, deoarece avem opt clase de
efective. Fiecărui interval îi corespunde o clasă, care se notează în dreptul său (3 - 5, 6 - 8 etc). Pe
ordonată( Oy) formăm 16 diviziuni corespunzător efectivului celui mai mare. Pe fiecare din
intervalele marcate pe abcisă se construiesc apoi dreptunghiuri având înălţimi proporţionale cu
efectivele distribuţiei (Fig. 2.1.). Întreaga procedură se poate executa pe calculator. Dacă unim
acum mijlocul bazelor superioare ale dreptunghiurilor histogramei prin segmente de dreaptă, se
obţine poligonul efectivelor / frecvenţelor (Fig. 2.2.).
Pe această bază, putem formula o ipoteză cu privire la forma distribuţiei caracteristicii
studiate în sânul populaţiei sau a colectivităţii mai largi, ceea ce constituie un bit de informaţie
valoros despre distribuţie. O asemenea ipoteză se poate enunţa şi pe baza unor studii anterioare,
deci a informaţiei acumulate în domeniul respectiv (de exemplu, despre distribuţia CI).
În practică dispunem însă de un volum limitat de date, iar histograma obţinută este mai
mult sau mai puţin simetrică. Redând forma de organizare a datelor concrete, histograma ne
sugerează însă aspectul sau forma distribuţiei teoretice. După cum am văzut, un grafic în formă
aproximativă de clopot şi cu o tendinţă netă de simetrie sugerează o lege normală de repartiţie.
Proprietăţile distribuţiei normale sunt precizate din punct de vedere matematic şi ne bazăm pe ele
în inferenţa statistică.
În cazul distribuţiilor asimetrice redate în formă stilizată prin graficele din Fig. 2.4,
majoritatea efectivelor se polarizează în mod evident de o singură parte, fie în partea dreaptă, fie
în partea stângă a clasei centrale.
Când rezultatele sunt grupate doar în câteva categorii sau procente, se folosesc diagramele
de comparaţie, care constau adeseori în coloane (dreptunghiuri) paralele având aceeaşi bază sau
lăţime. Un exemplu în acest sens oferă figura 2.7. Coloanele, proporţionale ca înălţimea cu
efectivele sau procentele pe care le reprezentăm, pot fi aşezate vertical sau orizontal, având
alăturată o scară cu diviziuni marcate.
Tipurile de grafice menţionate cuprind situaţii consemnate la un moment dat. Alături de
acestea, există grafice care redau evoluţia în timp a unor procese, punând în evidenţă anumite
tendinţe, schimbări de alură, "denivelări", evoluţia spre platouri etc. De exemplu, desfăşurarea
unui proces de învăţare este urmărită cu ajutorul unor asemenea grafice.
Rezumat
Măsurarea reprezintă operaţia prin care se atribuie valori numerice datelor discrete sau
continue ce urmează a fi evaluate. Se pot diferenţia patru niveluri ale măsurării ce corespund
celor patru tipuri de scale: nominale, ordinale, de interval , respectiv de proporţii. În vederea
interpretării rezultatelor obţinute într-o cercetare, datele brute sunt supuse unei organizări
(determinarea intervalelor de grupare, respective determinarea frecvenţelor). Pe baza acestei
etape se poate realiza reprezentarea grafică sub forma histogramelor respectiv a poligoanelor de
frecvenţă.
Bibliografie minimală pentru acest modul
READER Curs Psihologie Experimentală și Metode de Analiză a Datelor
Bibliografie facultativă
Cohen, B. (2001) Explaining Psychological Statistics. Second Edition. New York: Wiley.
Faverge, J.M. (1965). Méthodes statistiques en psychologie appliquée. t.III, Paris, P.U.F.
Heiman, G., W., (2001) Understanding Research Methods and Statistics: an integrated approach.
Houghton Mifflin Company, Boston.
Jaccard J & Becker, M. (1997). Statistics for the behavioral sciences (third edition), Brooks, Cole
Publishing Company, Pacific Grove.
Radu, I. şi colab. (1993) Metodologie psihologica si analiza datelor, Cluj-Napoca, Ed. Sincron.
Rouanet, H., Le Roux, B., Best, C. (1987). Statistique en sciences humaines: procedures
naturelles, Paris, Bordas.
Spence, J., Underwood, B.J., Duncan, C.P., Cotton, J.W. (1968). Elementary statistics, New
York, Appleton.
Stevens, S.S. (1951). Matematics, measurement, and psychopsysics. În Handbook of
experimental psychology, ( ed. S.S. Stevens), New York, Wiley.
Modulul 5
INDICI STATISTICI DE START
În acest capitol vom analiza principalele caracteristici ale distribuţiilor de frecvenţe, mai
precis tendinţa centrală, variabilitatea şi forma acestora. Vom prezenta mai întâi principalii
indicatori statistici utilizaţi pentru descrierea unei distribuţii, conceptele cheie fiind cel de medie,
varianţă şi cote standard. Vom prezenta aspectele conceptuale cât şi aspecte computaţionale.
În cele din urmă vom prezenta aspectele importante ale demersului de transformare a
catelor brute în cote standard z şi importanţa acestor cote din punct de vedere al demersului
statistic ulterior.
În exemplul analizat în Modulul 2 (Fig. 2.2. şi Tab. 2.5.) s-a putut constata cum datele
tind să se concentreze parcă în jurul unei valori centrale; efectivele cele mai mari (16 şi 10,
respectiv 9) corespund în acest caz claselor situate la mijlocul şirului.
Acest aspect îl întâlnim destul de frecvent în experimentele psihologice. În anumite
situaţii, majoritatea rezultatelor pot să graviteze fie în partea dreaptă, fie în partea stângă a seriei
de variaţie. Se vorbeşte atunci de distribuţii asimetrice. Şi în aceste cazuri datele tind să graviteze
în jurul unor valori. Indicii prin care se determină în mod curent "tendinţa centrală" a rezultatelor
sunt media, mediana şi modul.
Media, pe care o notăm cu m, nu este altceva decât suma valorilor, a datelor numerice,
împărţită la numărul acestora. Formula ei de definiţie este m=∑x/N, în care ∑ înseamnă "sumă
de", x reprezintă valorile sau rezultatele individuale, iar N constituie efectivul grupei studiate. În
capitolele ce urmează va fi vorba de formule de definiţie, necesare pentru înţelegerea unui indice
statistic şi de formule de calcul, care indică procedurile statistice aplicabile pentru determinarea
unui indice (media, abaterea standard, varianţa etc). Psihologul care beneficiază de serviciile unui
calculator, dotat cu programe informatice pentru prelucrarea statistică a datelor, se poate dispensa
de cunoaşterea şi stăpânirea formulelor de calcul. Calculatorul oferă la cerere, rezultatul
calculului, indiferent de procedura aplicată. Ca exerciţiu preliminar, parcurgerea acestor tehnici
este utilă pentru a ne da seama de transformarea ce se produce asupra datelor brute. De asemenea,
în absenţa serviciilor unui calculator sau a programelor informatice necesare, stăpânirea
formulelor de calcul devine necesară, eventual în vederea improvizării unui program.
Revenind la formula de definiţie a mediei, întrucât N este totdeauna dat, urmează să
stabilim procedee de calcul pentru ∑x (suma valorilor numerice), pe care o notăm cu T (iniţiala
cuvântului "total").
Când volumul datelor noastre este destul de restrâns, pentru a-l determina pe T facem o
simplă adunare fără să mai grupăm valorile.
Metoda da calcul presupune distribuţie statistică dată, ca aceea din tabelul 3.1. Precizăm
că, pentru a păstra notaţia acreditată de lucrări clasice în domeniu, cu f am notat efectivele şi nu
frecvenţa relativă (proporţiile), raportată la întreg.
Vom avea trei coloane: valorile lui x grupate în clase, valorile centrale xk, şi efectivele
corespunzătoare f. Pentru calcularea lui T adăugăm o coloană în plus cu produsele fxxk. Aşadar
înmulţim fiecare valoare centrală xk cu efectivul corespunzător clasei respective, iar produsele
înscrise în coloana fxxk le adunăm şi obţinem totalul T.
Ştiind că m = T/N, vom efectua împărţirea şi vom obţine media.
În exemplu nostru: m = 672/51 = 13,17.
x xk f fxxk
3-5 4 3 12
6-8 7 5 35
9-11 10 9 90
12-14 13 16 208
15-17 16 10 160
18-20 19 4 76
21-23 22 3 66
24-26 25 1 25
N = 51 T = 672
Aşa cum s-a precizat, media pune în evidenţă tendinţa centrală a rezultatelor constate într-
o experienţă. Prin calcularea mediei obţinem o măsură a nivelului mediu relativ la un eşantion
studiat, fapt care permite apoi comparaţii între grupe.
Mediana este un alt indice al tendinţei centrale, care se utilizează mai ales când avem de-a
face cu distribuţii asimetrice. De exemplu, în cronometrări se înregistrează succesiv timpul de
execuţie a unei operaţii de producţie la un muncitor; distribuţia empirică obţinută este, de regulă,
asimetrică şi atunci se reţine mediana ca măsură a timpului de lucru.
Pentru a găsi mediana - pe care o notăm cu med - trebuie să aranjăm, în cazuri mai simple,
toate datele (valorile) în ordine crescândă sau descrescândă.
Mediana este acea valoare care împarte şirul ordonat în două grupe egale ca număr. Cu
alte cuvinte, mediana se găseşte la mijlocul şirului: jumătate din valori se află deasupra, iar
cealaltă jumătate dedesubt. Locul sau rangul pe care îl ocupă mediana în şirul ordonat se
detrmină cu ajutorul formulei (N+1)/2 (care nu este formula de definiţie pentru med).
Când valorile constituie un număr fără soţ, mediana va corespunde determinantei din
mijloc. Astfel, în seria valorilor: 4, 4, 5, 6, 6, 7, 7, 7, 7, 8, 9, med = 7 pentru că 7 este valoarea
care împarte şirul ordonat exact în două. Formula (N + 1)/2 ne indică locul pe care se găseşte
mediana. În cazul nostru med este valoarea situată pe locul al 6- lea în şirul ordonat [(11 + 1)/2 =
6].
Tabelul 5.2. Calculul medianei în cazul datelor grupate
Interval xk f fc
24-26 25 1 51
21-23 22 3 50
18-20 19 4 47
15-17 16 10 43
12-14 13 16 33
9-11 10 9 17
6-8 7 5 8
3-5 4 3 3
i=3 N = 51
Dacă valorile ordonate sunt în număr cu soţ, mediana se va găsi la mijlocul şirului, între
două valori consecutive.
Fie datele ordonate: 3, 4, 4, 5, 6, 7, 7, 8, 8, 9; deci 10 valori. Mediana se va găsi pe locul
5,5 deoarece (N + 1)/2 este în cazul acesta (10 + 1/2) adică 5,5. Căutând în şirul dat valoarea
situată pe locul 5,5 constatăm că ea se găseşte între două valori consecutive:6 şi 7. În consecinţă
vom face media celor două valori: med va fi egală cu 6,5.
Când datele sunt grupate ca în tabelul 3.2 localizăm mai întâi intervalul în care se găseşte
mediana luând ca reper N/2. În exemplul citat N/2 = 51/2 = 25,5 deci mediana se află în intervalul
(12 - 14) ale cărui limite exacte sunt 11,5 şi 14,5 (variabila fiind considerată continuă). Formula
care ne dă valoarea medianei este următoarea:
N
− Fs
med = l + 2 i
fi
în care:
l este limita inferioară a intervalului reperat,
Fs este totalul frecvenţelor situate sub l (în exemplul dat 3 + 5 + 9 = 17),
fi= frecvenţa corespunzătoare intervalului localizat, iar N şi i sunt notaţii cunoscute
În exemplul ales vom avea:
25,5 − 17
med = 11,5 + 3 = 13,09
16
Spre deosebire de medie, mediana prezintă avantajul de a nu fi afectată de variaţiile
extreme ale seriei, fapt care o face potrivită pentru studiul distribuţiilor asimetrice.
Modul este valorea care se repetă mai des într-un şir de rezultate, adică valoarea care
prezintă frecvenţa cea mai mare.
De exemplu, în seria de date 4, 5, 6, 6, 7, 7, 7, 7, 8, 9, modul este 7, deoarece 7 este
valoarea cu frecvenţa cea mai mare.
Când datele sunt grupate, modul este clasa care reuneşte cei mai mulţi din subiecţi, mai
precis - valoarea centarală a acestei clase. De exemplu, în tabelul 3.2., clasa care întruneşte
frecvenţa maximă este 12 – 14, a cărei valoare centrală este 13.
După cum se vede, modul poate fi determinat prin simpla examinare a valorilor, fără să fie
necesare operaţii de calcul. Ca indice al tendinţei centrale, modul este foarte aproximativ şi se ia
în considerare mai ales la prima inspecţie a datelor. În cazul distribuţiilor normale modul,
mediana şi media coincid sau prezintă valori foarte apropiate.
Figura 5.1.
Se pune deci problema de a găsi indicatori prin intermediul cărora se poate măsura
variaţia sau împrăştierea datelor în jurul mediei. Aceşti indicatori sunt: dispersia sau varianţa, şi
abaterea standard.Cu ajutorul lor se obţin informaţii asupra variabilităţii grupului studiat.
Dispersia şi abaterea standard
Dispersia sau varianţa se notează cu σ2 sau cu s2 şi are ca formulă de definiiţie:
2 = s2 =
( x − m) 2
N −1
în care (x-m) reprezintă abaterea fiecărei valori de la media calculată, iar N este efectivul grupei
de măsurări.
Abaterea standard sau abaterea tip - care se notează cu σ sau cu s - nu este altceva decât
rădăcina pătrată din valoarea dispersiei: = 2 Aşadar, pentru a determina abaterea standard
trebuie oricum să aflăm mai întâi dispersia σ2.
Indicele de dispersie cel mai exact şi mai des utilizat este de fapt abaterea standard, având
avantajul de a fi exprimat în aceleaşi unităţi ca şi datele iniţiale pe care le prelucrăm. De exemplu,
dacă studiul se bazează pe note, abaterea standard este exprimată tot în note, permiţând să se
analizeze mai corect gradul de variabilitate al grupului.
Abaterea tip se foloseşte, de asemenea, în discutarea distribuţiilor normale. Dispersia are
avantajul de a nu cuprinde radicalul în expresia ei algebrică şi astfel se pretează mai uşor la
calcule teoretice.
Dacă analizăm formula de definiţie a dispersiei ne dăm seama că numai expresia de la
numărător, adică suma pătratelor abaterilor de la medie, ridică probleme mai dificile pentru
calcul. Vom numi pe scurt această expresie suma pătratelor.
Determinarea sumei pătratelor nu se face utilizând expresia de definiţie Σ(x-m)2 deoarece
comportă operaţii laborioase şi de cele mai multe ori cu numere zecimale. Transformând expresia
de definiţie, se obţine o formulă convenabilă de calcul:
T2
( x − m) 2 = x 2 − N
în care notaţiile sunt deja cunoscute. Σx2 reprezintă totalul pătratelor celor N rezultate (valori)
care compun grupul iniţial de date.
Formula de calcul a dispersiei devine astfel:
T2
x2 − N
2 =
N −1
De notat că T2 şi Σx2 sunt valori cu totul diferite, ceea ce se poate verifica în tabelul 3.3.
În ceea ce priveşte determinarea disprsiei, având datele grupate, ne referim din nou la cele
două metode utilizate pentru calculul mediei.
Metoda de calcul ilustrată prin tabelul 3.3, ne-a condus la determinarea lui T prin
însumarea produselor fxx, ştiind că Σfxx'T. Ridicând acum la pătrat pe T şi împărţind apoi cu N
(efectivul grupei), avem stabilit T2/N din formula de calcul a sumei pătratelor stabilită mai sus.
Ne rămâne să calculăm doar Σx2. Pentru aceasta la tabelul care a condus la determinarea lui T mai
adăugăm o coloană fxx2 în care vom înscrie produsele (fxx) x x (adică produsele fxx notate în
coloana precedentă se mai înmulţesc o dată cu valorile x).
Pentru ilustrare să urmărim exemplul din tabelul 5.3.
Tabelul 5.3.
Note, x f fxx (fxx)xx
3 2 6 18
4 2 8 32
5 3 15 75
6 7 42 252
7 10 70 490
8 8 64 512
9 4 36 324
10 2 20 200
N = 38 T = 261 ∑x = 1903
2
Cote z
O distanţă, un interval dat în cote brute poate fi exprimat în unităţi , împărţind distanţa
respectivă (x- m ) cu . În felul acesta avem un punct de referinţă zero. Luând drept unitate
trecem de la cotele brute x la cote transformate z. Această nouă variabilă z se numeşte variabilă
standardizată.
Cota z: o valoare care ne arată cât se distanţează, în unităţi , o cotă brută de media
distribuţiei respective.
Formula de trecere de la variabila brută x la variabila normată sau standardizată z este
următoarea:
x−m
z=
Într-o distribuţie tipic normală, în care există trei abateri standard deasupra mediei şi trei
dedesubt, cea mai mare cotă z pe care o putem obţine este + 3, iar cea mai mică - 3. Amplitudinea
cotelor z este între + 3 şi - 3 trecând evident prin zero.
Exemplu:
Avem un test de inteligenţă şi altul de aptitudine mecanică. Rezultatul final condensat
este:
Tabelul 5.5.
m
Aptitudinea mecanică 100 10
Inteligenţă 60 6
Transpunerea cotelor brute x în cote z permite compararea lor directă. Cu ajutorul cotelor
z avem abaterea unei valori de la medie în termeni de unităţi . Odată cu acestea, variabile
diferite sunt aduse la un numitor comun, fiind exprimate în aceleaşi unităţi, devin deci
comparabile.
Media şi abaterea standard servesc la interpretarea datelor; semnificaţia lor se stabileşte în
cadrul unor raţionamente bine precizate.
5.4. FRECVENŢA
Alături de medie şi abaterea standard, un indice statistic adesea utilizat este frecvenţa.
Într-o colecţie de date, fiecare element fie că prezintă o caracteristică A, fie că nu. Notăm cu N
efectivul total al unui grup şi cu n numărul de elemente care prezintă caracteristica A. Frecvenţa
caracteristicii A în lotul studiat este n din N sau n/N, care se mai numeşte şi frecvenţă relativă.
Se vorbeşte, de pildă, de frecvenţa accidentelor de circulaţie, clasificându-le după diferite
criterii, sau de frecvenţa muncitorilor accidentaţi într-o uzină ş.a.m.d. De asemenea, când se
aplică un test se vorbeşte de frecvenţa persoanelor care au obţinut un anumit rezultat, o cotă
determinată.
Procentajele se obţin plecând de la frecvenţe conform formului:
n/N x 100.
Exemplu (după Faverge):
Într-o statistică asupra erorilor de la casierie, s-au observat 134 erori în plus şi 289 erori în
minus. Frecvenţa f a erorilor în plus este:
f = 134/423 = 0,32; (423 = 134 + 289).
De reţinut: distincţia dintre frecvenţe absolute sau efective - notate, de regulă, cu n - şi
frecvenţe relative sau proporţii, notate cu f. În exemplul de mai sus se poate urmări modul de
trecere de la frecvenţa absolută la cea relativă.
Rezumat
Caracterizarea datelor cuantificate prin scale de interval se realizează prin intermediul
unui set de indici descriptivi încadraţi în două categorii: indicii tendinţei centrale, respectiv ai
variabilităţii. În prima categorie sunt incluşi: media, mediana, respectiv modul. În a doua
categorie se pot menţiona: dispersia (varianţa) şi abaterea standard. Cotele z permit exprimarea
datelor în funcţie de medie şi abaterea standard şi asigură cuantificarea în unităţi standard. În
cazul scalelor nominale sau ordinale se utilizează ca indice descriptiv frecvenţa.
Recomandări şi comentarii cu privire la temele de reflecţie
Tema 3: Media va fi cea mai afectată de prezenţa valorilor extreme, la mijloc se va situa mediana
şi în partea opusă modul.
Tema 4: Ne gândim la faptul că abaterea stabdard se calculează ca şi abatere de la medie.
Tema 6: Forma nu se va schimba, media va fi 0 şi abaterea standard va fi 1.
Prelucrarea statistică, aşa cum am văzut, reduce datele brute la câteva valori caracteristice:
frecvenţe sau procente, medii, abateri standard etc. Se pune întrebarea: în ce măsură datele
obţinute sunt relevante pentru populaţie. Această operaţie se numeşte inferenţă statistică.
Datele obţinute asupra eşantionului se apropie de indicii adevăraţi ai populaţiei, această
apropiere sau aproximaţie fiind cu atât mai mare cu cât volumul eşantionului N este mai mare.
Practic, nu reuşim să determinăm exact indicii caracteristici ai populaţiei. Indicii
eşantionului constituie estimări ale parametrilor populaţiei. În exemplul ales mai sus, volumul
mediu m – stabilit pe baza studierii grupului de copii – reprezintă o estimare a mediei adevărate a
colectivităţii generale. Întrucât nu se pot cerceta toţi copiii de 5 ani ne bazăm în afirmaţiile
noastre pe datele asupra eşantionului cercetat. Luând ca bază indicii eşantionului, extrapolându-i
deci la populaţie, comitem o anumită eroare, a cărei valoare probabilă trebuie să fie, evident, cât
mai mică.
În felul acesta, în legătură cu indicii stabiliţi asupra eşantionului – medii sau frecvenţe –
se pune problema erorii probabile pe care o comitem bazându-ne pe ei în extrapolarea la
populaţie.
Raţionamentul se întemeiază pe proprietăţile distribuţiei normale, schiţate deja în capitolul
precedent în legătură cu semnificaţia abaterii standard. În psihologie, ca şi în alte domenii,
modelul distribuţiei normale este un model privilegiat, pentru că îl regăsim în numeroase situaţii.
S-a stabilit că ±2σ, mai exact ±1,96σ, în raport cu media acoperă 95% din rezultate
(elemente). Cu alte cuvinte, 95% din elemente cad în intervalul m ± 1,96σ, iar 5% cad în afara
acestui interval. Procentul de 5% se compune din 2,5%, respectiv 2,5% de o parte şi de alta a
mediei spre extremităţile distribuţiei. De asemena, s-a stabilit că 99% din rezultate (elemente)
sunt cuprinse în intervalul m ± 2,58σ , în timp ce 1% (0,5% + 0,5%) din elemente sunt exterioare
acestui interval. (Fig. 4.1.).
Fig. 6.2.
Cu alte cuvinte, există 5 şanse din 100 ca unui element considerat la întâmplare din mulţime să-i
corespundă o valoare | z | > 1,96, după cum există o şansă din 100 ca | z | să fie mai mare decât
2,58. De aceste două repere, frecvent utilizate, se leagă deci şanse sau probabilităţi precizate: 5%,
respectiv 1%.
Rezumând: într-o distribuţie normală standard avem 95% din valorile z cuprinse între –
1,96 şi + 1,96; de asemenea avem 99% din valorile z cuprinse între –2,58 şi +2,58.
De aici se poate face pasul spre o distribuţie normală oarecare având media m şi abaterea standard
σ. Întrucât variabila standardizată z s-a obţinut – plecând de la variabila iniţială x – graţie
formulei:
x−m
z= ,
reiese că: a spune că z este cuprins între –1,96 şi +1,96 înseamnă a spune că
-1,96 < (x-m)/σ < 1,96
sau
(m – 1,96σ) < x < (m + 1,96σ),
ceea ce s-a enunţat la început.
Cu alte cuvinte, există 95% din valorile x interioare intervalului :
[m – 1,96σ; m +1,96σ],
după cum există 99% din valorile x interioare intervalului:
[m – 2,58σ; m + 2,58σ].
Afirmaţiile făcute anterior au devenit astfel propoziţii motivate.
oferă un etalon pentru a evalua eroarea ce o comitem luând drept bază media eşantionului m în
locul mediei adevărate m a colectivităţii generale (pe care practic nu reuşim de cele mai multe ori
să o determinăm).
În relaţia de mai sus σ reprezintă abaterea standard a colectivităţii generale, care rămâne
aproape întotdeauna necunoscută, fiind înlocuită în calcule cu determinată pe baza datelor
eşantionului (când N este destul de mare).
Reluând tabelul din tabelul 3.4, avem:
N=51; m = 13,17 ; = 4,74 ;
Făcând înlocuirile:
4,74
E= = 0,66 .
51
În mod curent nu ne putem aştepta să determinăm valori punctuale pentru parametrii
populaţiei. În acest sens se stabilesc intervale. Pe baza erorii standard a mediei E se stabilesc
limitele între care se găseşte, cu o probabilitate dată adevărata valoare m a colectivităţii generale.
Aceste limite se numesc limite de încredere, iar intervalul delimitat de ele este intervalul de
încredere. Întrucât mediile prezintă distribuţie normală, se stabilesc drept limite de siguranţă : m -
1,96E şi m +1,96E.
În exemplul menţionat vom avea: L1 = 13,17 - (1,96 x 0,66) şi L2 = 13,17 + (1,96 x 0,66).
Efectuând înmulţirile obţinem: 13,17 +/- 1,29, adică 11,88 şi 14,46. Acestea sunt limitele între
care se găseşte aproape sigur (cu o probabilitate de 95%) adevărata medie m a colectivităţii
generale.Afirmând că media adevărată se va găsi între 11,88 şi 14,46 riscăm totuşi să greşim în
5% din cazuri.
Se obişnuieşte să se noteze şi riscul pe care ni-l asumăm de a greşi făcând o aserţiume sau
alta. Aceasta a căpătat denumirea de prag sau nivel de semnificaţie. Astfel, intervalul ( m -1,96E;
m +1,96E) se numeşte interval de încredere la pragul de p = 0,05, ceea ce înseamnă că în 5% din
cazuri adevărata medie se află în afara intervalului ales. În practică, se ia adeseori pragul p =
0,01, ceea ce indică riscul de a greşi în 1% din cazuri. Limitele de încredere vor fi atunci L1= m -
2,58E şi L2= m +2,58E.
pq
E=
N
şi că limitele de încredere, la pragul de p = 0,05vor fi:
pq pq
( f − 1,96 ; f + 1,96 . )
N N
Practic, N fiind mai mare (>100), vom comite o eroare foarte mică înlocuind în calculul
limitelor de încredere pe p prin f , şi pe q prin 1- f. După înlocuire vom avea:
f (1 − f ) f (1 − f )
( f − 1,96 , f + 1,96 ).
N N
Exemplu (după Faverge)
Să considerăm un exemplu.
Într-o statistică a erorilor de la casierie s-au observat 134 de erori în plus şi 289 de erori
în minus. Frecvenţa f a erorilor în plus este:
134
f = = 0,32 (423 = 134 + 289).
423
Vom avea:
f (1 − f ) 0,32(1 − 0,32)
E= = = 0,020 .
N 423
La pragul de semnificaţie de p = 0,05, limitele de încredere se obţin calculând:
1,96 x 0,020 = 0,04.
Ele sunt:
0,32 + 0,04 = 0,36,
0,32 - 0,04 = 0,28.
Cu alte cuvinte, admiţând că eşantionul nostru face parte din cele 95% pentru care
parametrii se situează în intervalul de încredere, putem afirma că procentajul erorilor în plus va fi
cuprins între 36% şi 28%.
Exemplu:
Vrem să studiem dacă există vreo legătură între CI al copiilor şi al părinţilor. Pentru
aceasta considerăm un lot de 10 copii, determinăm coeficientul lor de inteligenţă (CI) cu un test
acreditat şi, paralel, CI al mamelor (Tab. 4.1.):
Tabelul 6.1.
C.I. – copii (x) C.I. – mame (y)
S1 97 90
S2 104 96
S3 86 111
S4 120 150
S5 101 98
S6 115 110
S7 112 110
S8 136 124
S9 90 82
S10 99 107
Pentru a avea o idee sumară asupra legăturii dintre cele 2 variabile (CI-copil,
CI-mame) am putea reprezenta fiecare subiect prin câte un punct în plan în cadrul unui sistem de
coordonate. În diagrama de corelaţie (Fig. 4.3.) avem 10 puncte corespunzător celor 10 subiecţi.
Coordonatele fiecărui punct sunt valorile-perechi corespunzătoare, notate x şi y. Norul de puncte
rezultat are tendinţa de a se orienta – cu mici excepţii – de-a lungul unei drepte. Se spune că avem
de-a face cu o relaţie liniară, că cele două variabile au tendinţa de a se modifica paralel, în acelaşi
sens.
CI - mame (y)
160
* *
150
140
130 *
120 * *
110
100 * *
90 * *
00
*
00 90 100 110 120 130 140
CI - copil (x)
y X y
X X X X
X X X
X X
X X X
X X X X
X X
X
X X X X
X
X
X
X
în care x şi y sunt rezultatele obţinute în cele două probe sau înregistrări, iar m şi m1 reprezintă
mediile celor două distribuţii. Cantitatea de la numărător ( x − m )( y − m1 ) se numeşte suma
produselor. La numitor avem sume ale pătratelor abaterilor, care ne sunt cunoscute de la
calcularea dispersiei.
Să precizăm că având o distribuţie normală teoretică de 2 variabile x şi y, aceasta este
caracterizată prin valorile a 5 parametri: mediile şi varianţele distribuţiilor marginale şi
coeficientul de corelaţie r. Coeficientul de corelaţie Bravais - Pearson este cea mai bună estimare
a parametrului r.
Alături de formula de definiţie se propun formule de calcul care au inspirat deja programe
informatice. Posesorul unui calculator, respectiv al unor programe de prelucrare statistică datelor
poate recurge la serviciile ordinatorului care-l dispensează de operaţii laborioase de rutină.
Când asistenţa tehnică lipseşte este indicat să stăpânim tehnica de calcul. Acelaşi lucru
este necesar când dispunem doar de un calculator uzual cu cele 4 operaţii aritmetice, la care se
asigură ridicarea la pătrat, extragerea rădăcinii pătrate etc. În orice caz trebuie cunoscută
varietatea situaţiilor întâlnite în practica investigaţiilor psihologice pentru a decide ce coeficient
urmează să fie determinat în funcţie de natura datelor, de forma distribuţiei etc; de asemenea,
trebuie bine stăpânit modul de interpretare.
Pentru sumele de pătrate care figurează la numitor sunt cunoscute formulele de calcul:
T2
( x − m) = x 2 −
2
;
N
TT1
( y − m1 ) = y 2 −
2
N
Pentru suma produselor care figurează la numărător se stabileşte de asemenea, o formulă
de calcul:
TT1
( x − m )( y − m1 ) = xy −
N
Formula de calcul pentru coeficientul de corelaţie devine:
TT1
xy −
r= N
2 T 2 T12
2
x − y −
N N
După cum rezultă din această formulă, pentru determinarea valorii r trebuie să avem: x, y,
x2, y2, şi xy. În consecinţă se va întocmi un tabel având coloanele arătate.
Exemplu:
S-au înregistrat în paralel notele obţinute la matematici şi la fizică de către elevii unei
clase din învăţământul special cu un efectiv de 14 copii.
Pentru determinarea corelaţiei dintre cele două serii de note se întocmeşte tabelul de
calcul ( Tab.5. 2.)
Tabelul 6.2.
Subiecţi Nota la Nota la x2 y2 xy
matematică fizică y
x
A.G. 7 7 49 49 49
B.I. 9 8 81 64 72
C.D. 10 9 100 81 90
C.V. 6 7 36 49 42
D.A. 9 10 81 100 90
E.V. 8 7 64 49 56
F.I. 5 6 25 36 30
I.G. 3 4 9 16 12
I.M. 7 6 49 36 42
L.V. 8 7 64 49 56
M.I. 6 7 36 49 42
N.P. 7 7 49 49 49
O.G. 6 6 36 36 36
R.T. 5 6 25 36 30
N = 14 T = 96 T1 = 97 Σx = 704
2
Σy = 699
2
Σxy=696
Coeficientul de corelaţie găsit este destul de mare, ceea ce, în exemplul ales, este un fapt
cu totul firesc.
Valorile lui r pot fi situate între -1 şi +1, trecând prin zero care indică absenţa corelaţiei.
Dacă r este pozitiv, atunci vorbim de o corelaţie directă, pozitivă. În cazul acesta, dacă una din
variabile x creşte, atunci şi cealaltă variabilă y va avea tendinţa de a creşte în medie, ca în
exemplul de mai sus.
Când coeficientul de corelaţie este nul, se spune doar că variabilele x şi y ale distribuţiei
sunt necorelate, eventual independente.
Dacă r este negativ, atunci y va avea tendinţa de a varia în medie în sens invers lui x. În
acest caz corelaţia este negativă, inversă.
Dacă r = +1, atunci este vorba de o legătură funcţională liniară în sensul obişnuit al
cuvântului, y fiind exact determinat prin valoarea lui x.
Indicele de corelaţie în versiunea prezentată se utilizează când avem de-a face cu două
variabile continue, având registrul de variaţie suficient de nuanţat (diferenţiat).
Exemplu:
Înaintea unui examen de admitere la un curs de instruire profesională candidaţii au fost
supuşi unei testări psihologice. Cotele, obţinute la aceste probe, merg de la 0 la 10. Pe de altă
parte, la încheierea examenului de admitere rezultatele finale apar în formă dihotomică: o parte
din candidaţi au fost declaraţi admişi iar ceilalţi respinşi.
Notăm cotele la test cu x iar variabila-criteriu cu y. Se observă că variabila-test ia valori
între 0 şi 10 în timp ce variabila-criteriu este dihotomizată: admis/respins. Datele obţinute sunt
sintetizate în tabelul 5.3. (după J.M. Faverge). De notat că reuşita, respectiv eşecul nu permit o
nuanţare sau gradare mai fină.
Tabelul 4.3.
Cote 0 1 2 3 4 5 6 7 8 9 10 Total
la test
Rezultate
la examen
Admişi 0 1 0 3 5 10 16 11 6 3 1 59
Respinşi 1 2 4 7 13 12 9 4 2 - - 54
Total 1 3 4 10 18 22 25 18 8 3 1 113
Când într-un studiu variabila y ne apare sub forma unei clasificări trihotomice - de
exemplu, buni, mijlocii şi slabi - în timp ce datele testării psihologice (x) se prezintă într-o formă
mai nuanţată- ca în exemplul precedent - atunci se utilizează pentru calculul corelaţiei o formulă
propusă de C. Burt:
m ' − m" 1
rtris = ,
y'
y"
+
p ' p"
în care, m' şi m" reprezintă mediile la test (x) pentru cei buni şi cei slabi: p' şi p" proporţia de
"buni", respectivi de "slabi"
(p' + p" < 1);
y' şi y" sunt ordonatele curbei normale reduse potrivit împărţirii în 3 categorii; σ abaterea
standard a distribuţiei complete a datelor la test (x).
y
Valorile rapoartelor sunt date într-un tabel special pentru calculul coeficientului de
p
corelaţie triserial luând ca reper p sau q. Figura 4.6. ilustrează sensul notaţiilor utilizate. Se
observă că grupul celor mijlocii nu intră în calcule.
Fig. 6.5.
6.3.2. Estimarea Coeficienţilor Corelaţie Neparametrici
Indicii de corelaţie examinaţi presupun ca o condiţie normalitatea distribuţiei în colectivitatea din
care s-a extras eşantionul. O asemenea cerinţă nu poate fi satisfăcută totdeauna. De aici,
necesitatea unor indici de corelaţie neparametrici.
sau
2
=
N
Tabelul 4.4.
y 0 1
1 01 11
(c) (a)
0 00 10
0 1
(b)
59
b= T=144
144
Avem:
80 59 50
a= = 0,55; b = = 0,40; c = = 0,34.
144 144 144
Înlocuind în formula lui φ vom avea:
0,34 − 0,55 0,40
=
0,55(1 − 0,55) 0,40(1 − 0,40)
Efectuând calculele obţinem:φ = 0,5.
Interpretarea lui φ se face ca şi cea a lui r, deoarece φ este în esenţă o variantăa lui r.
Tabelul 6.5.
Clasificarea după
Subiecţi frecv. Control (x) Calitate (y) d d2
A. L. 1 4 -3 9
U. C. 2 2 0 0
M. G. 3 10 -7 49
B. D. 4 5 -1 1
C. I. 5,5 1 4,5 20,25
P. L. 5,5 3 2,5 6,25
M. I. 7 8,5 -1,5 2,25
F. M. 8 8,5 -0,5 0,25
O. I. 9 7 2 4
R. V. 10 6 4 16
N = 10 Σd2 = 108,00
În prima coloană se enumeră subiecţii, eventual în ordinea indicată de prima clasificare; în
coloana a doua şi a treia se trec rangurile obţinute de fiecare subiect în cele două clasificări; în
coloana a patra se notează diferenţele, iar în coloana a cincea se calculează pătratele acestor
diferenţe.
Tabelul 6.6
Ρ r
0,00 0,000
0,10 0,105
0,20 0,209
0,30 0,313
0,40 0,416
0,50 0,518
0,60 0,618
0,70 0,717
0,80 0,813
0,90 0,908
0,95 0,954
1,00 1,000
( )
În practică se stabilesc coeficienţi de corelaţie r , ..... plecând de la datele unor
eşantioane. Se pune întrebarea, în ce măsură coeficienţii stabiliţi în acest fel se apropie de
coeficientul de corelaţie r sau ρ ce caracterizează colectivitatea generală din care s-a extras
eşantionul sau grupul dat?
Stabilirea unui interval de siguranţă nu prezintă aici nici un interes deosebit şi se
utilizează un alt procedeu.
Întrebarea care se pune este următoarea: un coeficient de corelaţie găsit în mod
experimental permite oare să enunţăm existenţa unei corelaţii reale sau nu? Alternativa este
ipoteza nulă: r = 0. În acest scop, se introduce coeficientul de corelaţie critic, care reprezintă
valoarea minimă ce trebuie să o ia un coeficient de corelaţie experimental pentru a fi socotit
semnificativ.
S-a întocmit în acest sens un tabel special care stabileşte coeficienţii de corelaţie critici
pentru diferitele praguri de semnificaţie şi pentru diferite valori ale lui n = N - 2. Întrucât
coeficienţii de corelaţie pot fi negativi, tabelul dă valorile absolute ale coeficientului critic.
Să luăm ca exemplu coeficienţii de corelaţie: r = 0,88, r = 0,71 şi r = 0,21 . În primul caz,
efectivul grupului (N) a fost 14, în al doilea 51, iar în al treilea caz 12.
Se pune întrebarea dacă aceşti coeficienţi indică o corelaţie reală sau nu; cu alte cuvinte,
dacă pot fi consideraţi semnificativi sau nu? Ipoteza alternativă este ρ = 0.
Pentru a vedea acest lucru, citim în tabelul valorilor semnificative pentru│r│. Prima
coloană cuprinde diferite valori ale lui n = N-2. Celelalte coloane indică coeficienţii de corelaţie
minimi la diferite praguri de semnificaţie (p = 0,10, p = 0,05, p = 0,01) corespunzător
valorilor lui n.
Temă de reflecţie nr. 6
Care sunt factorii care influenţează semnificativitatea unui coefficient de corelaţie?
Tabelul 4.7.
n p = 0,10 p = 0,05 p = 0,02 p = 0,01
Observăm că la pragul de semnificaţie cel mai riguros p = 0,01 se indică drept coeficient
de corelaţie critic 0,66. Or, coeficientul găsit de noi este mult mai mare, ceea ce înseamnă că este
semnificativă.
Rezumat
În cercetarea psihologică modelul consacrat este cel al investigării la nivelul eşantioanelor
urmat de extrapolarea la nivelul populaţiei, proces denumit inferenţă. În cadrul inferenţei
statistice se disting două tipuri de probleme: probleme de estimare, respectiv probleme de
comparaţie. Problemele de estimare, permit pe baza unui indice obţinut la nivelul eşantionului
estimarea cu o anumită probabilitate a intervalului în care se află parametrul pentru populaţie.
Demersul de estimare se poate extinde şi la distribuţiile bivariate, pentru a estima parametrii
acestor distribuţii.
Bibliografie minimală pentru acest modul
READER Curs Psihologie Experimentală și Metode de Analiză a Datelor
Bibliografie facultativă
Abdi H. (1987). Introduction ou traitemant statistique des données expérimentale, Grenoble:
Presses Universitaire de Grenoble.
Cohen, B. (2001) Explaining Psychological Statistics. Second Edition. New York: Wiley.
Faverge, J.M. (1965). Méthodes statistiques en psychologie appliquée. t.III, Paris, P.U.F.
Jaccard J & Becker, M. (1997). Statistics for the behavioral sciences (third edition), Brooks, Cole
Publishing Company, Pacific Grove.
Radu, I. şi colab. (1993) Metodologie psihologica si analiza datelor, Cluj-Napoca, Ed. Sincron.
Rouanet, H., Le Roux, B., Best, C. (1987). Statistique en sciences humaines: procedures
naturelles, Paris, Bordas.
Spence, J., Underwood, B.J., Duncan, C.P., Cotton, J.W. (1968). Elementary statistics, New
York, Appleton
ANEXE
3 Titularul cursului îşi rezervă dreptul ca pe parcusului semestrului să mai adage noi surse bibiografice în
funcție de accesul la/ şi apariția noilor materiale de specialiate.
3.1.Glosar
Conf. univ. dr. Robert Balazsi este cadru didactic al Departamentul de Psihologie din
cadrul Universitatii Babes Bolyai. Domeniile sale de competenţă sunt: metodologia cercetării şi
analiza datelor (nivel de bază şi avansat). A publicat ca autor sau coautor studii stiintifice in
reviste de specialitate, indexate ISI, recenzate in baze de date internaţionale şi/sau recunoscute
CNCSIS; în domeniul cercetării psihologie cognitive (memoria de lucru şi funcţii executive) şi
psihologiei sănătăţii (activitate fizică şi timp liber, etc). A publicat cărţi în calitate de couator în
domeniul metodologiei cercetării, psihologiei cognitive, psihologiei sănătăţii, politici de cercetare
(vezi www.psychology.ro).