Sunteți pe pagina 1din 116

Universitatea Babeş-Bolyai, Cluj Napoca

PSIHOLOGIA EXPERIMENTALĂ ŞI ANALIZA DATELOR I


Informaţii generale

Date de contact ale titularului de curs: Date de identificare ale cursului

Nume: Conf.univ.dr. Róbert BALÁZSI Numele cursului - Psihologie Experimentală şi


Birou: Birou 6 sediul Fac. de Psihologie şi Analiza Datelor I
Ştiinţele Educaţiei, str. Republicii 37 Codul cursului - PSY1031
Telefon: 0264-590967 Anul, Semestrul – AN 1, SEM 1
Fax: 0264-590967 Tipul cursului - Obligatoriu
E-mail: robertbalazsi@psychology.ro
Acces Tutori –
experimentalatutor@psychology.ro

Condiţionări şi cunoştinţe prerechizite


Înscrierea la acest curs nu este condiţionată de parcurgerea şi promovarea în prealabil a
unor discipline universitare. Cunoştinţele generale legate de cercetarea ştiinţifică dobândite prin
parcurgerea disciplinelor liceale (psihologie, sociologie, biologie, fizică sau chimie), respectiv
cunoştinţele de algebră elementară sporesc considerabil accesibilitatea temelor pe care vi le
propunem. În totalitatea lor, aceste prerechizite vor fi foarte utile în rezolvarea lucrărilor de
evaluare ce încheie fiecare modul cât şi în promovarea examenului de evaluare finală.

Descrierea cursului
Cursul de Psihologie Experimentală şi Analiza Datelor I face parte din pachetul de
discipline fundamentale ale specializării psihologie, nivel licenţă, din cadrul Facultăţii de
Psihologie şi Ştiinţe ale Educaţiei a Universităţii „Babeş-Bolyai” din Cluj-Napoca. Disciplina
oferă cunoştinţe conceptuale şi procedurale legate de problematica cercetării în psihologie, astfel
fundamentând şi facilitând accesibilitatea studenţilor la o serie de discipline teoretice sau
aplicative ale aceluiaşi an academic (Psihologie Cognitivă şi Introducere în Psihologie) sau ale
anilor superiori (Psihodiagnostic, Psihologia Dezvoltării, Psihologie Socială, Psihologia Muncii,
Psihologie Clinică sau Psihologie Şcolară). Tematicile abordate în cadrul cursului reprezintă un
preambul esenţial pentru toate cursurile menţionate mai sus.
Afirmarea psihologiei ca şi ramură ştiinţifică a fost condiţionată de elaborarea unei
metodologii de cercetare riguroase care să permită verificarea empirică a teoriilor şi ipotezelor
formulate. Actual, independent de domeniul în care îşi desfăşoară activitatea (clinic, şcolar,
organizaţional, academic sau cercetare) psihologul este (sau trebuie să fie) un consumator însetat
al literaturii de specialitate. Înţelegerea corectă a studiilor empirice publicate în reviste de
specialitate presupune însă cunoştinţe de metodologie a cercetării şi analiza datelor.
Această disciplină intervine tocmai în acest punct, oferind posibilitatea studenţilor să:
conştientizeze importanţa cercetării experimentale în validarea unor demersuri de intervenţie
(clinică, şcolară sau organizaţională) şi să deprindă demersurile metodologice necesare pentru
elaborarea şi derularea acestor cercetări; să înveţe criteriile metodologice de evaluare validate
empiric (grile de observaţie sau probe experimentale) în colectarea unor date de calitate
superioară; şi să-şi însuşească şi să aplice principiile statistice în analiza datelor şi elaborarea unui
proiect decercetare.

Organizarea temelor în cadrul cursului


Cursul este structurat pe șase module de învăţare, corespunzător structurii funcţionale a
unei cercetări, fiecare modul fiind subîmpărţit în următoarele tematici:
➢ cadru general al cercetării şi noţiuni introductive (modul I+bibliografia aferentă cursului 2
din Fișa disciplinei),
➢ problematica măsurării în psihologie (modulul II+ bibliografia aferentă cursului 3 din Fișa
disciplinei)
➢ studiu descriptiv observaţional și de ”tip survey” (modulul III+ bibliografia aferentă
cursurilor 4 și 5 din Fișa disciplinei),
➢ evaluare, colectare și organizarea colecţiei de date și statistică descriptivă (modul IV+
bibliografia aferentă cursurilor 6 și 7 din Fișa disciplinei),
➢ statistică descriptivă bivariată (modul V+ bibliografia aferentă cursurilor 8, 9 și 11 din
Fișa disciplinei),
➢ statistică inferenţială – estimarea parametrilor populaţiei (modul VI+ bibliografia aferentă
cursurilor 12 și 13 din Fișa disciplinei).

Tematicile specificate reprezintă elemente esenţiale ale oricărui manual de introducere în


metodologia cercetării şi analizei datelor, care-şi propune discuţia şi prezentarea principiilor care
guvernează cercetarea psihologică.
Sursele bibliografice recomandate reprezintă o extensie/completare a prezentului Suport
de Curs, parcurgerea lor în paralel cu modulele suportului, asigură o bază de cunoștință, care să
permită promovarea examenului. Rezolvarea tuturor lucrărilor de verificare (examen parțial și
proiect de semestru) impune, parcurgerea referinţelor obligatorii, menţionate la finele fiecărui
modul.

Formatul şi tipul activităţilor implicate de curs


Parcurgerea celor șase module+materialele bibliografice aferente incluse în curs va
presupune multă muncă individuală, discuţii prin email cât şi întâlniri faţă în faţă (consultaţii
online). Consultaţiile, la care prezenţa este facultativă, reprezintă un sprijin direct acordat
dumneavoastră din partea titularului şi a tutorilor. Pe durata acestora vom recurge la prezentări
sintetice a informaţiilor esenţiale aferente fiecărui modul dar mai cu seamă vă vom oferi,
explicaţii şi răspunsuri directe la întrebările pe care ni le veţi adresa. Activitatea şi discuţiile
derulate pe platforma MS Teams vă vor permite urmarea unui ritm de învăţare echilibrat şi optim,
în acelaşi timp discuţiile cu colegii şi moderatorii cursului vă vor permite şi verificarea
cunoştinţelor asimilate şi extinderea lor. În ceea ce priveşte activitatea individuală, ea se va
concretiza în parcurgerea tuturor materialelor bibliografice obligatorii, rezolvarea lucrărilor de
verificare şi a proiectului de semestru. Reperele de timp şi implicit perioadele în care veţi rezolva
fiecare activitate (lucrări de verificare, proiect etc.) sunt monitorizate de către noi prin
intermediul calendarului disciplinei (vezi Fișa disciplinei). Modalitatea de notare si respectiv,
ponderea acestor activităţi obligatorii în nota finală vă sunt prezentate în secţiunea: politica de
evaluare şi notare precum din Fișa Disciplinei.
Pe scurt, având în vedere particularităţile învăţământului la distanţă dar şi reglementările
interne ale CFCID al UBB, parcurgerea şi promovarea acestei discipline presupune antrenarea
studenţilor în următoarele tipuri de activităţi:

a. consultaţii – pe parcursul semestrului vor fi organizate două întâlniri de consultaţii online;


prezenţa la aceste întâlniri este facultativă;
b. răspuns săptămânal la întrebările formulate – activitate facultatiă ce urmează a fi derulată
ăe ășatforma MS Teams;
c. realizarea unui proiect de semestru cu o temă şi un set de sarcini anunţate cu cel 14 de zile
înaintea datei de depunere a acestora.
d. o lucrare de evaluare parțială susținută în scris a cărei dată urmează a fi specificată în
funcție de calendarul întâlnirilor.
e. activitate extracurriculară (puncte BONUS) – participare în caltate de participant la
studiile anunțate de către titularul disciplinei, inițierea unor cercetări proprii, etc.

Materiale bibliografice obligatorii


In suportul de curs, în cadrul fiecărui modul sunt precizate referinţele bibliografice
obligatorii care permit asimilarea corectă a informaţiilor, iar la sfârşitul modulului apar cele
facultative, care să permită aprofundarea cunoştinţelor. Sursele bibliografice au fost astfel
stabilite încât să ofere posibilitatea adâncirii nivelului de analiză si implicit, înţelegerea mai bună
a fiecărei componente a cercetării. Culegerea de Capitole (READER) anexat suportului de curs,
este referinţa obligatorie principală pentru acest curs. Caracteristica sa definitorie o constituie
prezentarea iterantă a demersului de cercetare, de la fazele sale timpurii (formularea unei
probleme de cercetare) şi până la finalizarea cercetării (analiza statistică a datelor şi interpretarea
rezultatelor). READER-ul poate fi accesat direct de pe CD-ul care conţine cursurile aferente
anului I.

Materiale şi instrumente necesare pentru curs


Optimizarea secvenţelor de formare reclamă accesul studenţilor la următoarele resurse:
- calculator conectat la internet (pentru a putea accesa bazele de date şi resursele electronice
suplimentare dar şi pentru a putea participa la secvenţele de formare interactivă online)
- acces la resursele bibliografice (ex: online MS Teams)

Calendar al cursului
Pe parcursul semestrului I, în care se studiază disciplina de faţă, sunt programate 2
întâlniri, consultaţii online cu toţi studenţii; ele sunt destinate soluţionării, a oricăror nelămuriri
de conţinut sau a celor privind sarcinile individuale. Pentru prima întâlnire vă recomandăm
lectura atentă a primelor patru module; la cea de-a doua se vor discuta ultimele două module şi se
va realiza o secvenţă recapitulativă pentru pregătirea examenului final. De asemenea în cadrul
celor două întâlniri aveţi posibilitatea de a solicita titularului şi/sau tutorilor sprijin pentru
rezolvarea anumitor lucrări de verificare sau a proiectului de semestru, în cazul în care nu aţi
reuşit singuri. Pentru a valorifica maximal timpul alocat celor două întâlniri studenţii sunt
atenţionaţi asupra necesităţii suplimentării lecturii din suportul de curs cu parcurgerea capitolelor
aferente bibliografiei obligatorii. În acelaşi calendar se regăsesc şi termenele la care trebuie
transmise/depuse lucrările de verificare aferente fiecărui modul precum şi data limită pentru
depunerea proiectului de semestru.
Calendar activităţi
Consultaţii I 15.11.2020 intervalul 10-12 (online MS Teams)
urmează a fi fixat de secretariatul facultății
Consultaţii II
(online MS Teams)
Examen parţial Examen online MS Teams
Proiecte de semestru Vezi FIȘA DISCIPLINEI
(urmează a fi fixat de către secretariatul facultății)
Examen final
(online MS Teams)

Strategii de studiu recomandate


Date fiind caracteristicile învăţământului la distanţă, se recomandă studenţilor o
planificare foarte riguroasă a secvenţelor de studiu individual, coroborată cu secvenţe de dialog
pe forum, cu tutorii si respectiv titularul de disciplină. Lectura fiecărui modul şi rezolvarea la
timp a lucrărilor de evaluare garantează nivele înalte de înţelegere a conţinutului tematic şi
totodată sporesc şansele promovării cu succes a acestei discipline.
Planificaţi-vă să alocaţi cel puţin la fel de mult timp pentru studiul fiecărei teme online a
cursului pe cât aţi aloca dacă aţi studia tema respectivă în varianta clasică a cursurilor faţă în faţă.
Planificaţi-vă un interval orar în timpul zilei pe care îl veţi rezerva studiului. La fel cum
dobândirea măiestriei în utilizarea unui instrument muzical sau să devii fluent într-o limbă străină
sau să excelezi într-un sport necesită determinare şi mult exerciţiu, la fel este şi cu studiul
psihologie experimentale şi a anlizei datelor.
Începeţi prin a vă realiza un calendar săptămânal cu toate cursurile dumneavoastră, timpul
alocat pentru activităţile ce ţin de locul de muncă sau alte obligaţii. Rezervaţi-vă 2-3 ore zilnic
pentru studiu şi marcaţi-le în calendarul săptămânii. Asiguraţi-vă că aţi ales un interval orar când
vă puteţi concentra cel mai bine asupra acestei activităţi.
Încercaţi să rezolvaţi toate sarcinile oferite în suportul de curs. Dacă întâmpinaţi dificultăţi
notaţi-vă punctul unde aţi ajuns şi cereţi ajutor pentru a trece mai departe.

Vă rugăm să puneţi întrebări! Curiozitatea şi întrebările oneste sunt esenţiale pentru învăţare.
Modulul 11
Metode de cercetare în psihologie

Scopul modulului: Familiarizarea studentului cu conceptele de bază ale metodologiei cercetării


în psihologie.

Obiectivele modulului: La finalul acestui modul, vor fi capabili:

• să identifice principalele componente ale demersului de


cercetare ştiinţifică
1.1 Introducere
• să definească principalele carcateristici ale psihologiei ca
ştiinţă
• să descrie caracteristicile metodei observaţiei şi modul de
elaborare a unui studiu cu grile de observaţie
• să descrie caracteristicile metodei experimentale şi modul
de realizare concretă a unui studiu experimental
• să facă disctincţie între testul psihologic şi proba
experimentală

Vom prezenta mai întâi reperele istorice relevante în trasformarea psihologiei într-o ştiinţă
fundamentată empiric, conceptele cheie fiind cel de contrusct ipotetic, operaţionalizare şi
validare empirică. În acest capitol vom analiza principalele componente ale demersului de
cercetare ştiinţifică în contextul psihologiei.

1.1 SCURTĂ INCURSIUNE ÎN ISTORIA DEMERSULUI ŞTIINŢIFIC ÎN


CERCETAREA PSIHOLOGICĂ
O psihologie naivă, în forma cunoaşterii de altul şi de sine, a apărut probabil o dată cu
dezvoltarea contactelor interumane, cu omul social. Activităţile comune au plasat indivizii în
relaţii “faţă în faţă” impunându-le o ajustare continuă în raport cu reacţiile celorlaţi. Observaţiile
ocazionate de existenţa cotidiană s-au fixat în replici, proverbe, zicale – deci în folclor – iar mai
târziu în scrieri literare, încercări de portretizare, judecăţi de valoare etc. În chip firesc, oamenii
nu au aşteptat constituirea unei ştiinţe psihologice pentru a-şi pune întrebări referitoare la viaţa
psihică, la modul de comportare al semenilor, la însuşirile personale. Simţul comun a devenit
depozitarul acestei psihologii naive, pe care individul a împrumutat-o odată cu limba, obiceiurile
de viaţă etc. Se spune astfel despre psihologie că are un trecut lung, dar o istorie scurtă.

1
Textul iniţial al acestui Support de Curs a fost elaborat de Prof.univ.dr. Ioana Radu, revizuirea şi completarea
ulterioară fiind efectuată cu acordul autorului de către Asist.univ.dr. Robert Balazsi şi Asist.univ.drd. Adrian
Bivolaru.
Temă de reflecţie nr. 1
Comparaţi tabelar trăsăturile cunoştinţelor ştiinţifice cu cele ale
cunoştinţelor pseudoştiinţifice! Pentru aprofundarea subiectului vezi în
READER documentele:
Bibliografie 1.pdf - Lakatos (1973) Science and Pseudoscience
Bibliografie 2.pdf - Wynn (2001) Quantum leaps – cap.1

În jumătatea a doua a secolului trecut, psihologia devine o ramură de sine stătătoarea a


ştiinţei. Prima lucrare cu caracter ştiinţific în acest domeniu – ceea ce a însemnat studierea unor
fapte psihice cu mijloace precise- a apărut în 1860 şi aparţine lui Th. Fechner, care a fost mai
întâi medic, apoi fizician. Lucrarea se intitulează “Elemente de psihofizică” (Elemente der
Psychophysik) şi studiază, în principal, raportul dintre modificările stimulului fizic şi variaţiile
corespunzătoare în planul senzaţiei. Aceste prime experienţe au fost sistematizate într-o lege
matematică, numită legea psihofizică, în care se stabileşte raportul dintre modificările senzaţiei
(s) în funcţie de mărimea stimulului extern (I), sub forma expresiei cunoscute:

s = k logI + c

În anul 1879, la Leipzig (Germania), ia fiinţă primul institut de psihologie din lume- creat de W.
Wundt - care îşi propune să studieze cu mijloace precise fenomene psihice mai simple: senzaţia,
percepţia, asociaţia, memoria etc. În acest institut s-au format pionierii psihologiei experimentale
pe diferite meridiane ale globului, inclusiv România.
Să amintim că termenul de psihologie apăruse mai demult, şi anume într-un fragment din
opera lui Leibniz, puţin ulterior anului 1696. Noul termen (“psihologie”) va oferi titlul a două
lucrări ale lui Chr. Wolff- Psychologia empirica şi Psychologia rationalis- prima apărută în 1732,
iar a doua în 1734, care au contribuit la răspândirea noii denumiri şi a preocupărilor despre
“suflet”. Autorul, elev al lui Leibniz, admitea posibilitatea unei psihologii propriu-zise şi
avansează chiar ideea de măsurare a fenomenelor psihice.
Punctul de plecare al multor cercetări de psihologie este prefigurat în datele simţului
comun. H. Kelley (1992) ne propune să acceptăm pentru simţul comun un anumit nivel al
cunoaşterii psihologice. Este vorba de observaţii şi concluzii asupra comportamentului direct
observabil, care se dezvăluie mai ales în relaţiile interpersonale, în activităţile îndreptate spre
scop ale individului. Acesta este nivelul comportamentului moral, desfăşurat în secvenţe
temporale de ordinul minutelor până la al zilelor, comportament care devine vizibil în relaţiile de
faţă în faţă - în perimetrul grupului mic – şi care prezintă antecedente şi consecinţe concret
reperabile. În schimb, fenomenele care se desfăşoară la macro şi micro-nivel nu pot intra în raza
de competenţă a simţului comun. În primul caz este vorba de fenomene psihice care implică mai
mulţi oameni în intervale mai mari de timp ( de ex. tendinţe pe parcursul unei vieţi, schimbări
sociale etc.). La micronivel este vorba de evenimente psihice care se desfăsoară rapid (în secunde
sau milisecunde), la scară mică de mărime (sacade oculare sau mici contracţii ale muşchilor feţei
etc); ele pot fi detectate, de pildă, cu mijloacele electrofiziologiei. Nivelul mediu – al
comportamentului manifest – ar constitui nişa cognitivă a simţului comun (p. 6-7).
Din datele invocate de H. Kelley în sprijinul tezelor sale reţinem rezultatele unor testări
asupra oamenilor de pe stradă. Un autor (J. Houston) a întocmit un chestionar referitor la
memorie şi învăţare. Itemii (în număr de 21) au fost formulaţi în limbajul curent, oferind
răspunsuri la alegere. Chestionarul a fost propus unui lot de 50 de studenţi din anul I înaintea
cursului de Introducere în psihologie. Presupunând că subiectul nu dispune de cunoştinţe într-un
domeniu este de aşteptat ca răspunsurile sale la întrebările chestionarului să se distribuie în mod
aleator. La 15 itemi din 21, subiecţii interogaţi au răspuns însă corect, în proporţii superioare
hazardului. Pe un lot de alte 50 de persoane, selecţionate aleatoriu dintr-un parc public, s-a
obţinut – de asemenea – proporţii de răspunsuri excte superioare hazardului la 16 itemi (din 21).
De aici concluzia care atribuie simţului comun un nivel al cunoaşterii psihologice. Pe de altă
parte, eforturile oricărui cercetător de a operaţionaliza conceptele duce adesea la o scufundare a
lor în simţul comun, ca poziţie de plecare. Psihologia cuprinsă în simţul comun oferă o bază utilă
pentru dezvoltarea cunoaşterii. Este imposibil să eviţi efectele simţului comun – încheie Kelley –
dar este uşor să nu fii conştient de ele. Problema este a atitudinii lucide şi echilibrate.
În perioada în care psihologia începea să se afirme ca disciplină independentă, în
jumătatea a doua a secolului XIX, modelele de investigaţie, “paradigmele” ştiinţelor naturale erau
deja cristalizate. O trăsătură caracteristică subliniată de L. Blaga (1969) în dezvoltarea ştiinţei
moderne este aceea de a alcătui “cupluri metodologice”, în care matematica figura de fiecare dată
ca unul dintre factorii constitutivi (p.88). O asemenea îmbinare de metode funcţiona ca o opţiune
tacită în comunitatea oamenilor de ştiinţă. Experimentul, în cuplul metodologic cu matematica, a
făcut carieră remarcabilă de-a lungul istoriei ştiinţei, impunându-se în definiţia însăşi a spiritului
ştiinţific modern.
Temă de reflecţie nr. 2
Stabiliţi rolul şi limitele statisticii matematice în inferenţa ştiinţifică. Pentru
aprofundarea subiectului vezi în READER documentul: Bibliografie 3.pdf
- Anderson (2001) Empirical Direction in Design and Analysis – cap. 1.

Constituirea demersului investigativ în psihologie a avut loc aşadar sub influenţa


paradigmei înfăţişate mai sus. De pildă, când Fl. Ştefănescu- Goangă înfiinţează în 1922 primul
institut de psihologie din ţara noastră, el militează pentru un program de lucru care să îmbine
sistematic în activitatea de cercetare- experimentul şi metoda statistică, termenul de experiment
fiind luat în accepţia largă.
Prin lucrările sale, “ Elemente de psihometrie” şi “Analiza factorilor psihici”, N.
Mărgineanu oferea termenii concreţi ai unei asemenea abordări a fenomenului psihic. Desigur,
acest început era marcat de o doză exagerată de optimism, pe care deceniile următoare au retuşat-
o în mod sensibil. Rămâne valabilă ideea de bază: asocierea între observaţie / experiment şi
metoda statistică.
Conform programului pozitivist al oricărei ştiinţe, psihologia pleacă de la fapte- fapte de
conştiinţă şi de conduită. Datele autoobservaţiei au şi ele statut de fapte. Conduita nu se reduce la
actul fizic, la reacţia externă ( mişcare, gest, faptă,…). Conduita poate să nu capete uneori
expresie externă, motorie; ea poate consta tocmai în suspendarea sau amânarea reacţiei. De
asemenea, faptele ce le consemnăm în studii experimentale sau anchete pot fi date
comportamentale propriu-zise sau date hârtie-creion cum este cazul multor probe psihologice. În
consecinţă, noţiunea de fapt psihic are un sens larg. B. F. Skinner vorbeşte de “conduite
interiorizate” în înţelesul de operaţii sau acte mintale în genere. Relatarea introspectivă se
utilizează în combinaţie cu alte date, mai ales cu înregistrări obiective. De exemplu, raportul
introspectiv al subiectului se asociază adesea cu date electrofiziologice (EEG) pentru a studia
stări afective, activităţi intelectuale etc.
Latura externă a conduitei, luată în ea însăşi, nu califică în mod univoc conţinutul
psihologic intern; aceleaşi acte de comportare pot avea motivaţii diferite. De aceea nu ne putem
mărgini- în cunoaşterea psihologică- numai la consemnarea formei externe a acţiunii, aşa cum
procedează behaviorismul clasic; trebuie surprins şi conţinutul psihologic intern, sensul său,
luminat de întreg contextul de viaţă în care se manifestă. Acelaşi context - contextul vieţii şi
activităţii omului - include atât datele comportării, cât şi trăirile subiective într-o conexiune
indisolubilă. Cunoaşterea psihologică se desfăşoară în principiu ca orice cunoaştere ştiinţifică: ea
se ridică de la date la ipoteză pentru a verifica acestea din urmă pe baza unor noi date de control;
ea trece de la fapte care cuprind întotdeauna o parte de interpretare, de inferenţă, spre a verifica
apoi aceste inferenţe cu ajutorul unor noi fapte. În psihologie, ca şi în alte domenii, fenomenul şi
esenţa nu coincid ( S. L. Rubinstein).
Ştiinţa porneşte de la fapte, dar nu se reduce la colectarea de fapte disparate. Faptele o
dată identificate servesc şi ca pretexte pentru o cunoaştere explicativă…” Aspiraţiile cognitive ale
omului trec dincolo de “fapte” ca atare, în vederea unei cunoaşteri de adâncime. “Faptul” devine
cu aceasta o “problemă”, ceea ce impune căutarea unui răspuns, a unei “soluţii”; inteligenţa
propune un model, o teorie, care este într-un sens o “plăsmuire teoretică” (L. Blaga, p. 180).
Pe măsură ce obiectul unei ştiinţe se conturează, ea îşi crează un univers de semnificaţii
(noţiuni, ipoteze).
Se pune întrebarea: ce constituie “fapt ştiinţific”? Cl. Bernard sublinia: un fapt nu este
nimic în el însuşi, el nu valorează decât prin ideea care i se ataşează sau prin proba pe care o
furnizează. Un fapt intră în câmpul atenţiei graţie problemei care este pusă sau se pune.
J. Piaget (1970) propune în această privinţă trei caracteristici:
● un fapt ştiinţific este un răspuns la o întrebare, ceea ce presupune o întreagă elaborare,
solidară cu sistemul de informaţii care au dus la acea întrebare;
● un fapt este apoi o constatare sau o ”lectură” a experienţei, care nu se reduce la simpla
“citire” a datelor, ci comportă o întreagă structurare;
●“un fapt nu există niciodată în stare pură …; el este întotdeauna solidar cu o interpretare”.
Această caracteristică subliniază importanţa orizontului de informaţie, a cadrului interpretativ,
atât în punerea întrebării, cât şi în “lectura experienţei.” Există o deosebire între faptul brut,
neanalizat – fruct al unei percepţii globale – şi faptul ştiinţific, plasat în contextul unei idei şi a
unei observaţii analitice.

1.2 PRINCIPIILE CERCETĂRII ŞTIINŢIFICE. DEMERSUL DE CERCETARE


ȘTIINȚIFICĂ. ANALIZA STRUCTURALĂ AL DEMERSULUI DE CERCETARE.

1.2.1 Caracteristicile unei teorii ştiinţifice


Majoritatea cunoştinţelor noastre despre realitate este conţinută în teoriile ştiinţifice. În
cele ce urmează, vom face o scurtă prezentare a caracteristicilor unei teorii ştiinţifice. Ele decurg
din principiile cercetării ştiinţifice şi reprezintă “scheletul” demersului prin care se propun teorii
noi sau se modifică cele existente.
Conant defineşte cunoaşterea ştiinţifică ca “o serie interconectată de concepte şi scheme
conceptuale care au fost dezvoltate ca rezultat al experimentării şi observaţiei şi sunt utile în
elaborarea de noi experimente şi observaţii”. Această definiţie surprinde calitatea de continuu a
progresului cunoaşterii ştiinţifice; nici o teorie nu este definitivă, ci un punct de vedere provizoriu
obţinut prin interpretarea faptelor ştiinţifice la care avem acces la un moment dat. Ea serveşte ca
punct de plecare pentru acumularea de alte fapte obiective, care vor genera noi teorii.
O teorie ştiinţifică este o construcţie complexă, ce nu se rezumă la o simplă însumare de
fapte observate; structura unei teorii reprezintă relaţia dintre datele şi cunoştinţele ştiinţifice,
stabilită pe respectarea regulilor de raţionament logic. Principalul rol al teoriilor ştiinţifice este
explicativ; puterea explicativă a unei teorii se restrânge la un anumit domeniu al fenomenelor
lumii fizice (domeniul de aplicabilitate al teoriei). O teorie ştiinţifică validă oferă o explicaţie
unică pentru orice fenomen ce aparţine domeniului ei de aplicabilitate.
Teoriile ştiinţifice valide respectă o serie de principii care le conferă obiectivitate, ceea ce
este crucial din punct de vedere ştiinţific.

Caracterul empiric al unei teorii rezultă din suportul factual al acesteia, reprezentat de toate
datele ştiinţifice (observaţii, măsurători) care stau la baza teoriei. Orice teorie ştiinţifică este
elaborată pornind de la date obiective măsurate privind fenomenele sau procesele studiate. Datele
sunt obţinute în condiţii experimentale controlate şi trebuie să fie verificabile (adică exprimate
într-o formă ce permite verificarea lor de către alţi cercetători). De exemplu, rezultatul unei
observaţii subiective nu este direct accesibil unui alt cercetător; înregistrarea datelor în timpul
observaţiei poate fi reanalizată însă de persoane care nu au fost prezente în cursul observaţiei.
În plus, datele ştiinţifice trebuie să fie replicabile. Cu alte cuvinte, repetarea condiţiilor în
care datele unui studiu experimental au fost obţinute trebuie să conducă la rezultate similare cu
cele ale studiului iniţial. Cele două condiţii, verificabilitatea şi replicabilitatea datelor conferă
obiectivitate faptelor ştiinţifice.

Caracterul raţional al unei teorii este conferit de suportul logicii formale prin care este
verificată orice afirmaţie ştiinţifică. Orice teorie reprezintă o serie de enunţuri deduse pe cale
logică din faptele ştiinţifice şi cunoştinţele considerate valide. Modul de prezentarea a
raţionamentului care a dus la construcţia teoriei trebuie să fie suficient de clar şi complet, pentru a
putea fi verificat de comunitatea ştiinţifică.

Falsificabilitatea unei teorii reprezintă posibilitatea de a verifica experimental predicţiile acesteia


și dacă se impune a le declara non-conforme cu realitatea. O teorie ştiinţifică este considerată
validă atunci când predicţiile ei cu privire la fenomene aparţinând domeniului de aplicativitate
pot fi enunţate într-o formă măsurabilă experimental şi verificate prin compararea cu date
empirice. Falsificabilitatea unei teorii presupune constrângerea de a formula teoria în aşa fel încât
dacă ea nu e adevărată să putem dovedi acest lucru prin studii experimentale.
Testarea teoriilor presupune două condiţii: (a) alegerea unui caz particular din domeniul
de aplicabilitate al teoriei ce permite realizarea unei măsurători experimentale în condiţii strict
controlate; (b) măsurătorile ştiinţifice necesare verificării să poată fi realizate cu suficientă
precizie pentru a putea fi comparate cu predicţia. De exemplu, diferenţa dintre predicţia teoriei
relativităţii şi a celei newtoniene cu privire la masa corpurilor nu poate fi verificată decât în cazul
obiectelor cu viteză apropiată de cea a luminii; pentru obiectele ce se deplasează cu viteză mică,
precizia măsurării masei sale nu este suficient de mare pentru a pune în evidenţă diferenţa dintre
cele două predicţii.
Caracteristica de testabilitate a teoriilor trebuie însă abordată mai flexibil. Dacă o teorie
este plauzibilă şi extrem de importantă pentru progresul ştiinţei, dar încă nu se poate testa, nu e
abandonată. Dimpotrivă, se depun eforturi mari pentru ca ea să poată fi testată. Un exemplu este
teoria relativităţii generale a lui Einstein, care a fost luată în considerare, deşi nu a putut fi
verificată imediat. Uneori dificultatea e dată de precizia rezultatului verificării empirice care este
decisiv pentru validarea teoriei (un exemplu recent îl reprezintă verificarea experimentală reuşită
în 1998 a teoriei decoerenţei cuantice propusă încă din 1982 de Wojciech Zurek; au fost necesari
16 ani de eforturi pentru atingerea preciziei de măsurare necesare verificării experimentale).

Generalitatea este o caracteristică legată de mărimea domeniului de aplicabilitate a unei teorii. O


teorie mai generală este de preferat uneia specifice pentru că exprimă doar relaţiile general
valabile dintre datele ştiinţifice, neglijând aspectele particulare. O teorie generală presupune însă
şi modele descriptive mai generale, care sunt dificil de obţinut. Ca urmare, în practică se începe
prin teorii particulare, care ulterior sunt înlocuite prin teorii generale. Un exemplu în acest sens
este teoria atracţiei generale formulată de Newton pe baza unor teorii şi legi particulare (legile lui
Kepler şi Galilei).

Simplitatea (parcimonitatea) este o condiţie importantă în procesul de evaluarea a teoriilor.


Dintre mai multe teorii cu acelaşi domeniu de aplicabilitate şi aceleaşi predicţii este preferată
teoria cea mai simplă (care oferă explicaţii mai simple).
Aperent, simplitatea vine în contradicţie cu ceea ce am constatat în capitolul precedent. Şi
anume, realitatea este foarte complexă. Prin urmare, ne aşteptăm ca o teorie mai bună să fie şi ea
mai complexă. Rezultă deci că teoriile ştiinţifice nu devin din ce în ce mai simple; dimpotrivă, ele
devin mai generale şi mai complexe. O teorie nu este suficient să fie doar simplă pentru a fi
validă.
O interpretare eficientă a principiului parcimonităţii este dată de Poincaré: el este valabil
în cazul teoriilor de acelaşi nivel. Adică, dacă avem mai multe teorii concurente de aceeaşi
valoare şi tratând aceeaşi problemă, este de preferat teoria mai simplă. Putem evita astfel
complicarea inutilă în construcţia teoriilor.
Simpla enumerare a caracteristicilor unei teorii ştiinţifice ne sugerează cât de complex
este în realitate procesul de elaborare şi testare a unei teorii ştiinţifice. El nu poate fi redus la
verificarea unei ipoteze de cercetare. În stadiul actual al dezvoltării oricărui domeniu al ştiinţei,
teoriile alcătuiesc o reţea complexă; teoriile sunt interconectate.
O eroare la nivelul unei teorii afectează acele teorii care se bazează pe ea; la rândul lor,
acestea din urmă afectează alte teorii, procesul propagându-se în întreg corpul de teorii al
disciplinei. În cazul în care din corpul de cunoştinţe o teorie se dovedeşte a fi eronată, trebuiesc
reanalizate toate teoriile ce decurg din ea; un proces destul de dificil şi de lungă durată. În
consecinţă, validarea unei teorii este o procedură cu consecinţe mult mai extinse decât teoria în
cauză.
Pe de altă parte, o structură de cunoştinţe organizată în teorii interconectate oferă un punct
de plecare pentru o viitoare cercetare fundamentală. Obiectivul unei cercetări viitoare este
determinat de ceea ce cunoaştem, respectiv nu cunoaştem despre problema în cauză; aceste
cunoştinţe sunt organizate în teorii. Este nerealistă ideea de a începe o cercetare pornind de la
observaţie sau ipoteză neglijând cunoştinţele (corpul de teorii) existente. Există şi situaţii care ne
pot uneori determina să recurgem la o astfel de procedură, şi anume atunci când nu avem date
empirice sau teorii cu privire la problema cercetată. Însă şi în acest caz începem prin a defini
problema cere ne interesează; nu acţionăm “orbeşte”.
Cu toate acestea, majoritatea tratatelor şi cursurilor de metode de cercetare din ştiinţele
socio-umane nu acceptă încă acest punct de vedere. Idea de a iniţia cercetarea pornind de la
observaţie a funcţionat în special în faza iniţială de dezvoltare a ştiinţei, moment în care teoriile
ştiinţifice lipseau sau erau vagi. Acesta a fost stadiul conoştinţelor în fizică în secolul XVII, sau
în psihologie în secolul XIX. În momentul de faţă, procedura nu mai este eficientă. Pentru a putea
înţelege aceste afirmaţii, vom prezenta schematic structura unei teorii ştiinţifice.

1.2.2 Cercetarea științifică ca și demers de construcție și verificare a teoriilor


Pentru început vom prezenta o problemă simplă, care prezintă multe din caracteristicile
unei cercetări psihologice. Să presupunem situaţia: aveţi un curs de la ora 8 dimineaţa, şi mergeţi
la facultate cu autobuzul. Acesta pleacă la intervale 30 de minute, însă uneori întârzie. Mai ştiţi că
şi profesorul obişnuieşte să întârzie. În aceste condiţii, aveţi de ales dintre două posibilităţi: să
plecaţi de acasă la 730, cu riscul să întârziaţi, sau la 7; evident, cea de-a doua alternativă
presupune eventual să vă treziţi la 6 cel puţin, ceea ce nu e deloc convenabil. Problema este deci:
când este convenabil să plecaţi: la 730 sau la 7 ?
Problema e banală, dar ceea ce ne interesează pe noi este că seamănă în multe aspecte cu
cele cu care un psiholog se confruntă. Şi anume: sunt implicate atât comportamente şi intenţii
individuale (profesorul, soferul) cât şi condiţii externe (traficul la acea oră, starea drumurilor, a
maşinii, condiţiile meteo, evenimente rutiere, etc.). Deci, suficient de complexă pentru a fi dificil
de abordat. Pentru noi este pur şi simplu imposibil să găsim o soluţie la problemă luând în calcul
toate aceste condiţii.
Şi totuşi, noi rezolvăm deseori în mod satisfăcător multe probleme similare, în ciuda
complexităţii acestora, aparent de neabordat. Probleme similare întâmpină cercetătorii din toate
domeniile ştiinţei, pentru că problemele abordate sunt prea complexe pentru a putea fi înţelese
sau studiate în întregime.
Demersul folosit în aceste cazuri este de simplificare a problemei, prin luarea în
considerare doar a acelor elemente care pot fi abordate şi care pot oferi o soluţie utilă. De
exemplu, în cazul nostru, nu putem prevedea condiţiile meteo sau reacţiile fiecărui şofer în parte.
Acele elemente definitorii ale problemei care sunt luate în calcul pentru soluţie constituie modelul
problemei. Deci, înainte de a căuta o soluţie a problemei, vom începe prin a construi un model
simplificat al ei. Factorii pe care îi vom include în model sunt aleşi în principal în funcţie de două
criterii: să fie suficient de importanţi pentru a afecta rezultatele, şi să poată fi evaluaţi sau
măsuraţi. De exemplu, condiţiile meteo ar putea influenţa serios problema (putem întârzia dacă e
polei, furtună sau ninge), dar nu putem prezice vremea; deci pentru început vom exclude acest
factor din model.
Diferenţa dintre model şi situaţia modelată poate fi mare, însă pe noi ne interesează în
principal soluţionarea problemei; dacă, în ciuda simplificării, soluţia este eficientă în majoritatea
cazurilor, putem considera că am obţinut o rezolvare a problemei.
Astfel, dacă considerăm relevante pentru problemă probabilitatea de a întârzia a
profesorului respectiv a autobuzului, avem un model al problemei reprezentat de aceste două
variabile; în acest caz, soluţia depinde, evident, de cât de des întârzie autobuzul, respectiv
profesorul. De exemplu, dacă autobuzul întârzie rar şi profesorul des, merită să plecaţi la 730;
dacă însă autobuzul întărzie des, şi profesorul rar, nu. Prin urmare, soluţia depinde de aceşti doi
parametri. Nu ne rămâne, pentru a obţine soluţia corectă, decât de a stabili aceste două
probabilităţi. Acest lucru se poate face practic, prin estimări directe (vom urmări profesorul şi
autobuzul câteva zile). Să presupunem că autobuzul întârzie în 20% din cazuri şi profesorul în
30% din cazuri. Pe noi ne interesează ce se întâmplă dacă autobuzul întârzie şi profesorul nu (este
evident: atunci vom întârzia); mai exact, care este şansa ca acest lucru să se întâmple. Dacă
presupunem cele 2 probabilităţi independente (nu ştim unde stă profesorul, nici cum ajunge la
curs, deci e mai simplu să le considerăm independente), pentru a afla răspunsul înmulţim
probabilitatea de a întârzia a autobuzului cu cea de a nu întârzia a profesorului (deci 100% - 30%
= 70%). Rezultatul este:

20/100 x 70/100 = 14/100

adică 14%. Prin urmare avem aproximativ o şansă din şapte să întârziem dacă plecăm la
730.
Ce putem constata la sfârşitul acestui demers? Am reuşit să obţinem un răspuns la
problema noastră, în ciuda faptului că am neglijat multe din elementele ei. Mai mult, am evitat să
studiem cauzele (motivele) pentru care autobuzul respectiv profesorul intârzie; pentru soluţia
găsită, nu era necesar să ştim acest lucru. De fapt, am înlocuit aceste cunoştinţe cu două
probabilităţi, cere ne oferă o imagine suficient de acurată despre comportamentul autobuzului şi a
profesorului, fără să fie necesar a o explica. Cele două probabilităţi sunt de fapt modele statistice,
simplificări ale variabilelor “comportamentul autobuzului” şi “comportamentul profesorului” dar
care ne oferă o soluţie utilizabilă pentru a putea să decidem.
Rezolvarea prin simplificare este de fapt principalul instrument de găsire a soluţiilor în
cazul tuturor ştiinţelor empirice. Dată fiind complexitatea extrem de mare a lumii reale, singura
metodă eficientă de a găsi soluţii rămâne simplificarea situaţiilor reale prin recurgerea la modele.
Evident soluţiile astfel găsite nu sunt perfecte, dar este tot ceea ce putem face pe moment.
Revenind însă la problema noastră, putem considera soluţia găsită de noi ca fiind ştiinţifică?
Amintiţi-vă că exemplul a fost dat pentru a discuta caracteristicile cercetării ştiinţifice. Intuitiv,
putem răspunde uşor la acestă întrebare, pentru că încă nu ştim dacă soluţia găsită de noi
funcţionează.
Răspunsul corect este deci: nu este o soluţie ştiinţifică pentru că nu a fost testată. Adică,
nu ştim dacă este sau nu corectă. Am descris astfel primul principiu fundamental al ştiinţei, care
poate fi rezumat astfel:
1. Orice afirmaţie trebuie supusă unei verificări critice. Nu se acceptă ca argument
decisiv părerea nici unei autorităţi (expert) fără ca ea să fie testată.
În completare, principiul al doilea este formulat:
2. Dacă o afirmaţie este contrazisă de un rezultat empiric, e considerată greşită.
Din cele expuse mai sus putem înţelege uşor motivele pentru care cercetarea ştiinţifică respectă
acest principiu: complexitatea situaţiilor reale fac dificilă sau imposibilă abordarea problemei în
altă formă decât simplificată, simplificare care poate duce la soluţii eronate. Conform deci
principiului enunţat, soluţia noastră nu este încă ştiinţifică, pentru că nu am verificat-o. Ce
înseamnă de fapt verificare critică ? Presupune analiza întregului demers folosit pentru obţinerea
soluţiei, adică analiza raţionamentelor folosite, a modului în care s-au obţinut datele empirice, a
interpretărilor date rezultatelor etc. Testul final al orcărei teorii ştiinţifice sau soluţii teoretice este
confruntarea cu realitatea, prin compararea datelor empirice cu predicţiile teoretice.
Să analizăm acum soluţia noastră şi să vedem de ce nu o putem accepta fără verificare. Ea
se bazează pe un calcul de probabilitate a două evenimente independente (probabilitatea de a
întârzia a autobuzului şi probabilitatea de a nu întârzia a profesorului); iar metoda de a calcula
rezultatul (probabilitatea de producere simultană a două evenimente independente) este
demonstrată de mult. Şi atunci?
Motivul este că noi am simplificat problema atunci când am selectat doar doi parametri
pentru a o descrie; demersul folosit în soluţie nu verifică şi presupunerea că aceşti doi parametri
descriu perfect situaţia; deci nu întreaga noastră soluţie e verificată.
Verificarea soluţiilor e comună oricărei cercetări empirice. Datorită simplificării la care
am recurs nu avem cum să fim siguri dacă soluţia găsită este corectă (există de exemplu şansa ca
un element important al situaţiei să fie omis).
Prin urmare, următoarea etapă fa consta în verificarea soluţiei găsite. Rolul verificării este
să ne convingem de eficienţa soluţiei pentru toate cazurile cuprinse în problemă. În cazul nostru,
asta presupune ca ea să fie corectă indiferent de ce comportament au la un moment dat profesorul
şi şoferul. Nu este de exemplu suficient să plecăm la şcoală o dată la 730 şi să constatăm că nu am
întârziat; s-ar putea ca la o repetare a încercării să întârziem. Deci o singură verificare nu e prea
sigură; metodele de verificare trebuie să fie obiective, altfel rezultatele lor ar fi uşor de contrazis.
La o analiză sumară, constatăm că de fapt nu vom putea verifica complet soluţia: ar trebui să
includem în verificare toate cazurile, adică să urmărim tot semestrul dacă întârziem sau nu.
Evident, în urma unei astfel de verificări rezolvarea găsită nu mai are sens (dacă constatăm de
exemplu că am greşit, nu mai putem reveni în timp la începutul semestrului şi să căutăm altă
soluţie).
Pentru a fi totuşi mai obiectivi, putem să plecăm de mai multe ori la 730 şi să vedem de
câte ori întârziem. Să presupunem că facem asta de 5 ori şi am reuşit să întârziem de trei ori.
Rezultatul nu e prea fericit. Dacă comparăm probabilitatea de a întârzia prezisă de soluţia noastră
(14%) cu cea reală (60%) este destul de evident că cele două valori sunt diferite. Acum putem
înţelege de ce este nevoie să verificăm soluţia. Ea s-a dovedit greşită. Să ne amintim principiu
doilea al ştiinţei, reformulat pentru cazul cercetărilor aplicate: în cazul în care datele empirice
contrazic predicţia dată de soluţie, soluţia e respinsă. Altfel spus, verificăm soluţia teoretică cu
realitatea. Dacă ea nu corespunde realităţii, renunţăm la ea, urmând să căutăm alta. Rezultă
imediat importanţa pe care trebuie să o acordăm modului în care facem verificarea; dacă facem
erori mari în cursul verificării, putem lua o decizie greşită la compararea datelor cu teoria.
Această grijă pentru modul în care se face verificarea este conţinută în afirmaţia: datele empirice
trebuie să fie obiective. Acest lucru este mult mai dificil decât pare; e suficient să ne gândim la
faptul că orice măsurătoare pe care o realizăm conţine şi erori de măsurare, pe care nu le putem
elimina în întregime. De aceea, discrepanţa dintre predicţie şi rezultatele empirice normală; ea
apare în majoritatea cazurilor de cercetare ştiinţifică. Diferenţa în sine nu reprezintă un motiv de
îngrijorare (puteam obţine de exemplu 14,86%), ci mărimea ei şi implicaţiile posibile. Dacă
diferenţa e mică, o putem atribui erorilor de măsurare. Dacă însă e mare, o astfel de interpretare
nu mai e realistă.
În cazul nostru, diferenţa este prea mare, mai ales dacă luăm în considerare utilitatea
rezultatului: ne putem eventual permite să întărziem o data sau de 2 ori pe semestru, dacă asta
înseamnă 30 de minute de somn în plus; dar nu mai este deloc acceptabil dacă vom întărzia la mai
mult de jumătate din cursuri. Cele două rezultate (teoretic şi empiric) ne conduc la decizii
diferite. Deci le putem considera diferite în raport cu problema noastră. Ce ne rămâne de făcut
este să analizăm cauzele posibile care au dus la această discrepanţă mare între soluţia găsită şi
realitate. Este pasul firesc al unei cercetări ştiinţifice: dacă ne-am convins că soluţia teoretică e
greşită, cel mai bun lucru e să găsim cât mai rapid greşeala făcută.

Temă de reflecţie nr. 3


Rolul modelelor ştiinţifice în cercetare şi modul de elaborare a acestora! Pentru
aprofundarea subiectului vezi în READER documentele:
Bibliografie 4.pdf - Derry (1999) What Science Is and How It Works – cap. 6
Bibliografie 5.pdf - Chalmers (1999) What is this thing called science - cap. 4.

Ce s-ar fi întâmplat dacă soluţia ar fi fost corectă (dacă am fi obţinut de exemplu acel
14,86% amintit mai sus) ? Evident că cele 5 cazuri ale verificării nu ne-ar putea convinge
definitiv de corectitudinea soluţiei. Ceea ce am concluziona este că ea e mai probabil să fie
corectă decât înainte de verificare. În schimb, dacă verificarea soluţiei contrazice predicţia,
putem spune cu certitudine că soluţia e greşită (evident, în condiţiile în care verificarea e
obiectivă).
Cauzele erorii soluţiei noastre pot fi foarte multe, mai ales că, dacă ne aducem aminte, noi
am simplificat cât de mult se putea situaţia reală atunci cănd am construit modelul problemei.
Deci orice element care a fost exclus poate la fel de bine să fie cauza rezultatului din verificare.
Pe urmă, comportamentul profesorului şi al şoferului a fost poate estimat greşit sau acestea s-au
modificat între timp. Se pare deci că nu avem altceva de făcut decât să analizăm toate aceste surse
de eroare posibile pentru a explica diferenţa constatată.

Temă de reflecţie nr. 4


Identificaţi pentru exemplul prezentat în curs şi alte cauze posibile care pot
duce la rezultatul empiric descris.

Problema e că o analiză a tuturor surselor de eroare nu are sens pentru simplul motiv că
sursele de eroare posibile sunt prea numeroase (le putem considera infinit de multe) şi timpul
necesar pentru analizarea lor ar fi mare; iar pe noi nu ne interesează o soluţie obţinută după
terminarea anului şcolar. Vom folosi aici un principiu numit briciul lui Occam care într-o formă
simplificată afirmă: “ipotezele nu trebuie multiplicate inutil”. În cazul nostru, pentru a restrânge
ipotezele cu privire la cauzele erorii, vom începe cu variabilele incluse de noi în model. Dacă
constatăm la nivelul lor erori, şi acestea pot explica cea mai mare parte din eroare, este suficient
pentru condiţiile practice. În caz contrar suntem nevoiţi să căutăm şi alte surse de eroare.
La o privire sumară vom constata că avem o problemă majoră la variabilele incluse în
model. Probabilitatea de a întârzia obţinută (60%) este mai mare decât cea de întârziere a
autobuzului (20%); asta ar însemna că noi am întârziat mai des decât ar fi trebuit să întârzie
autobuzul! Evident e absurd (cu excepţia faptului, puţin probabil, în care v-aţi decis să nu intraţi
la ore imediat - să beţi o cafea, de exemplu...). Deci, mai mult ca sigur nu am măsurat corect
probabilitatea de a întârzia a autobuzului. Ea este în mod cert mai mare. Deci am făcut o eroare
de măsurare (mai exact de estimare) a unuia din parametri.
O altă problemă posibilă este fireşte numărul mic de verificări făcute (doar 5); e posibil că
dacă am lungi perioada de verificări, probabilitatea de a întârzia a autobuzului să scadă. Aici
avem de-a face cu o incertitudine a rezultatului determinată de metodele de testare. În sfărşit, e
posibil să constatăm că de exemplu autobuzul întărzie de obicei mult (10-15 minute) şi profesorul
puţin (2-3 minute), ceea ce necestită corectarea modelului folosit de noi. În aceste condiţii, e mai
util să neglijăm probabilitatea de a întârzia a profesorului pentru că autobuzul întârzie mult mai
mult decât profesorul; deci, ori de câte ori autobuzul va întârzia, vom întârzia şi noi. Ca urmare,
modelul nou ar fi format doar din probabilitatea de a întârzia a autobuzului, şi pe care este nevoie
să o reevaluăm.
Dacă în urma acestor corecţii am obţinut un rezultat apropiat de cel empiric, putem
conchide că am descoperit majoritatea surselor de eroare. Dacă nu, probabil va trebui să luăm în
calcul variabilele omise de noi din descrierea situaţiei.

Temă de reflecţie nr. 5


În ce măsură metoda de verificare propusă este validă pentru a testa soluţia
teoretică a problemei din exemplu? Propuneţi o metodă de verificare mai
acurată.

Exemplul de mai sus ne permite să înţelegem diferenţa fundamentală dintre cunoştinţele


ştiinţifice şi cele neştiinţifice. Cunoştinţele ştiinţifice sunt obligatoriu verificate critic, verificare
ce presupune confruntarea lor cu realitatea. Acest demers permite eliminarea sau corectarea
soluţiilor respectiv a teoriilor incorecte sau inexacte, ceea ce în cazul cunoştinţelor neştiinţifice nu
este posibil.
Am prezentat acest exemplu în ideea de a fi destul de simplu dar care să conţină în mod
necesar cât mai multe din elementele unei cercetări reale. În baza acestui exemplu simplificat am
putut pune în evidenţă multe din caracteristicile unei cercetări ştiinţifice.
În primul rând, o cercetare ştiinţifică porneşte de la identificarea unei probleme. Problema
poate fi una practică (cum a fost cea folosită în exemplu) sau una teoretică; de fapt, putem
considera la limită diferenţa dintre o problemă practică şi una teoretică ca fiind una de
generalitate; o problemă teoretică caută soluţii la mai multe probleme înrudite (în cazul de mai
sus, problema “teoretică” ar fi : cum am pleca de acasă în general pentru a nu întârzia de la
cursuri, deci nu de la un curs anume sau în cazul unui profesor).
În al doilea rând, orice problemă presupune o situaţie reală extrem de complexă, care nu
poate fi descrisă sau analizată în întregime; acest lucru este cu atât mai evident în psihologie.
Singurul demers rezonabil este de a gasi o simplificare a situaţiei prin identificarea unor
parametri pe baza cărora construim un model descriptiv al situaţiei. Urmează să găsim o soluţie a
problemei în limitele modelului descriptiv. Dar, deoarece nu avem argumente care să ne asigure
că această soluţie e corectă, o vom testa empiric. În cazul unei cercetări aplicative (care
presupune rezolvarea unei probleme concrete) testarea decurge asemănător cu demersul prezentat
în exemplu. În cazul unei teorii însă, problema testării acesteia este mai complicată, şi va fi
descrisă mai târziu.

Temă de reflecţie nr. 6


Care ar fi fost consecinţele practice în cazul renunţării la testarea soluţiei
din exemplu?

Putem în acest moment construi un model simplificat al procesului de cercetare (figura1). La o


analiză sumară a acestui model, constatăm că de fapt, caracterul ştiinţific al cercetării ştiinţifice
este dat doar de componenta de testare a soluţiei. În rest, demersul este similar cu cel rezolutiv
(rezolvare de probleme).
Acest fapt ne permite să înţelegem rolul metodelor de testare ştiinţifică în cadrul unei cercetări.
Ele ne permit să verificăm o soluţie odată formulată, dar nu ne sunt de ajutor prea mare la
identificarea problemei şi găsirea soluţiei (respectiv elaborarea teoriri în cazul cercetărilor
teoretice). Or, eficienţa unei cercetări depinde fundamental de importanţa problemei abordate şi
de utilitatea soluţiei. Şi deoarece cursul introductiv de anul I s-a axat în principal pe descrierea
metodelor de testare ştiinţifică, abordarea celorlalte elemente ale procesului de cercetare este
necesară.

Identificarea problemei

Construcţia modelului descriptiv

Soluţia

Testarea soluţiei găsite


Interpretarea rezultatelor empririce

Analiza erorilor
Figura 1. Etapele unei cercetari ştiinţifice aplicative

Fireşte, modelul de mai sus este simplificat. De exemplu, el nu abordează situaţia în care soluţia
este greşită. În acest caz, demersul se reia în funcţie de erorile găsite. În problema folosită ca
exemplu am schiţat şi un astfel de caz. Şi anume, situaţia în care modelul descriptiv este incorect,
urmând corectarea acestuia şi reformularea soluţiei.

1.2.4 ANALIZA STRUCTURALĂ A UNEI CERCETĂRI PSIHOLOGICE


Etapele procesului de cercetare, descrise în capitolul anterior reprezintă, evoluția în timp al
fenomenului, cum anume identificarea unei probleme duce la identificarea unei soluții și ulterior
testarea acestuia. O soluție identificată ca fiind viabilă (nu a fost infirmată în urma testării) nu
înseamnă neapărat că modelul construit reflectă realitatea (sau o parte a acesteia). Poate da, poate
nu! E clar că testarea unor modele/teorii duc la o creștere al încrederii noastre în modelul/teoria
respectivă, dar nu ne oferă nicidecum garanția unui adevăr ultim.
Modul în care a fost decris procesul de cercetare reflectă evoluție pe orizontală (în timp),
a acesteia. Însă potrivit lui Anderson (an) (vezi bibliografia onligatorie!) procesul de dezvoltare
poate fi reprezentat și printr-o construcție în plan vertical. În continuare vom încerca să
suprapunem modelul prezentat în capitolul anterior și modelul piramidal al inferenței științifice
propus de Anderson (2001).
Potrivit modelului piramidal, la baza inferenței științifice (vorbim despre o afirmație
științifică, sau un set de afirmații organizate într-un model/teorie) se situează Cadrul conceptual.
Reprezintă totalitatea cunoștințelor, credințelor și conceptelor metodologice care caracterizează la
un momet dat cercetătorul și prin intermediul cărora acesta interpretează realitatea înconjurătoare.
Deseori, cadrul conceptual este tratat ca fiind sinonim al termenului paradigmă științifică. Cele
două concepte nu pot fi în întregime suprapuse, cu atât mai mult încât în limbajul cercetării
actuale, paradigma a devenit una foarte specifică, denumind câteodată o modalitate precisă de
evaluare al unei funcții cognitive (ex. paradigma Stroop).
Acest cadru conceptual, există în fiecare dintre noi (din moment ce fiecare dintre noi
deținem cunoștințe despre realitatea care ne înconjoară) funcționează ca o pereche de ochelari,
prin intermediul cărorar cercetătorul privește realitatea. Dacă lentilele ochelarilor sunt de culoare
portocalie, realitatea apare într-un anumit fel iar dacă sunt de culoare maron închis, atunci foarte
probabil nuanțele realității vor apărea diferit. Privind prin acești ochelari, cercetătorul percepe
realitatea înconjurătoare, respectiv anumite elemente ale realității care îi sunt accesibile. Ochelarii
purtați, selectează informațiile realității! Să ne închipuim că doi indivizi (un biolog și un
psiholog) privesc aceeași realitate, de ex. o pădure tăiată. În acest context, este puțin probabil ca
un psiholog să surprindă aceleași probleme pe care le suprinde un biolog. De ce? Pentru că,
cadrul conceptual, ”ochelarii” prin intermediul cărora cei doi privesc realitatea, diferă.
Regândind etapa de identificare a problemei (descris în capitolul anterior) observăm că
aceasta depinde de cadrul conceptual, adică de cunoștințele care ne stau la dispoziție. Dincolo de
rigoarea metodologică al unei cercetări importanța cercetării este determinată de natura problemei
identificate. Dacă aceasta este una banală (deja cunoscută sau cu impact minor asupra vieții
individuale), formulată în lipsa unor cunoștințe aprofundate al fenomenului (dedusă în baza unor
observații superficiale, accidentale), soluția oferită, respectiv modelul construit pentru a
descrie/explica fenomenului, va fi unul banal. Acest lucru va fi adevărat chiar și în cazul în care
cercetarea este fundamentată pe o metodologie de cercetare și analiză riguroasă. Natura
problemei identificate, determină valoarea cercetării. Dacă identificăm o problemă deja rezolvată
(doar că noi nu ne dăm seama deoarece am omis să parcurgem literatura aferentă), e clar că
cercetarea nu va avea valoare, din moment ce problema deja este soluționată (doar că noi nu am
știut). Dacă însă, cunoaștem soluțiile existente pentru o anumită problemă, iar noi propunem o
nouă soluție, atunci da, cercetare devine valoroasă, mai ales în contextul în care reușim să oferim
argumente care susțin superioritatea soluției proprii față de cele existente. Astfel, cunoașterea
teoriilor, al literaturii de specialiate aferente fenomenului este esențială în evitarea acestor
capcane.
Din punct de vedere al fundamentării conceptuale al cercetării trebuie să fim foarte
reținuți în a alege probleme care ”nu au fost încă cercetate”. Pe de o parte, se poate întâmpla că
un anumit detaliu într-adevăr a trecut fără să fie observat de cineva, și în acest caz poate suntem
pe cale de a investiga ceva inedit. Însă la fel de bine, se poate întâmpla ca abordarea propusă să fi
fost una deja demult infirmată (este important să ne documentăm în profunzime pentru a nu
”descoperi” căi despre care de mult știm că nu sunt practicabile), sau una al cărei legitimitate nu
este susținută de cunoștințele existente (în interiorului cadrului conceptual problema formulată nu
are sens).
Paradigma sau cadrul coneptual determină alegerea fenomenului investigat, respectiv
problema formulată legat de acest fenonem. Fenomenul reprezintă al doilea nivel al piramidei lui
Anderson (2001). În domeniul psihologiei exemple de fenomene studiate sunt: inteligența,
memoria, angajamentul organizațional, obedianța, complianța la tratament, anxietatea, etc. Luând
ca și exemplu, una din fenomenele menționate mia sus, de ex. obediența, oare aceasta se
manifestă la fel la toată lumea? Mecanismele cognitive și emoționale care caractrizează la nivel
individual obedianța sunt identice de la un individ la altul, sau de la o situație la alta în cazul
aceluiași individ? Observând obedianța (sau orice alt fenomen psihologic) vom observa că
fenomenul în realitate este mult mai complex, din moment ce există o multitudine de factori care
moderează (facilitează sau chiar inhibă) manifestarea acestuia. Dacă cineva ne-ar ruga să
enumerăm toți factorii care influențează performanța sportivă a unui sportiv (un alt fenomen din
domeniul psihologiei sportului), oare care ar fi numărul factorilor enumerați? De ordinul zecilor
sau sutelor? Nu ne este greu să observăm că fenomenele realității sunt complexe, câteodată mult
prea complexe pentru a putea fi abordate. Ceea ce putem face, și ceea ce facem în cercetare este
să construim modele ale realității. Adică dintre multitudinea factorilor care este parte a
fenomenului, extragem doar acel elemente care au o pondere crescută, adică sunt importante din
punct de vedere al fenomenului. În cazul performanței sportive, nivelul de anxietate joacă un rol
major în determinarea performanței sportive, însă numărul păsărilor care zboară deasupra
stadionului este un fcator care nu afectează (sau greu de închipuit că ar putea afecta) performanța
individuală. Ca urmare, în modelarea fenomenului vom include primul factor, ca fiind relevant și
îl vom ignora pe al doilea, ca urmare a faptului că este neimportant.
În modelarea fenomenelor trebuie să evităm două lucruri: i) să nu omitem din model
factori care sunt relevanți din punct de vedere al determinării fenomenului studiat (se numește
subspecificarea modelului); și, ii) să nu includem factori care sunt irelevanți din punct de vedere
al fenomenului studiat (supraspecificarea modelului). Din punct de vedere practic, modelele
formulate prezintă un anumit grad de subspecificare, deoarece nicio o cercetare nu include toate
variabilele relevante, însă ceea ce trebuie să evităm cu orice preț este supraspecificarea
modelului.
Următorul nivel al piramidei îl reprezintă Comportamentul. O simplă inspecție al listei
oferite mai sus, scoate în evidență un fapt ușor de observat; termenii menționați nu reflectă
fenomene direct observabile. Să ne gândim cum arată inteligența cuiva, sau când am văzut-o
ultima dată? Mult mai probabil este să fi văzut manifestări ale inteligenței, sau mai precis
formulat, comportamente pe care le categorizăm ca fiind inteligente. Inteligența însăși este un
concept teoretic, un construct psihologic, utilizat în scopul categorizării unui set de
comportamente. În procesul de cercetare are loc o coversie al constructelor ce alcătuiesc un
model într-un set de comportament observabile, ce permit măsurarea acelor constructe și implicit
testarea relației lor în cadrul modelului. Acest proces de definire comportamentală al
constructului se numește operaționalizare. Performanța sportivă într-un meci de baschet poate fi
operaționalizată prin număr de coșuri marcate. Un alt comportament, care permite
operaționalizarea aceluiași construct, este numărul de mingi recuperate sau numărul blocajelor
reglementare. Observăm, că performanța sportivă ca și calificativ obținut la sfârșitulul unui meci
(”a avut o performanță bună”) este rezultatul unui proces inferențial, care se bazează pe o
însumare al frecvenței tuturor comportamentelor esențiale din punct de vedere al constructului.
Faptul că jucătorul a zâmbit după executarea aruncărilor libere, este un comportament direct
observabil însă irelevant pentru constructul investigat. Același comportament este devine însă
relevant dacă constructul investigat este, de ex. motivația pentru joc. Validitatea măsurării este
un concept strict legat de procesul de operaționalizare. Se referă la faptul că observăm și
măsurăm comportamente care sunt într-adevăr relaționate cu constructul investigat. În
psihometria clasică validitatea măsurării se definește prin faptul că testul măsoară ceea ce își
propune să măsoare. Aceasta devine posibilă, doar dacă, așa cum am spus mai sus, vom observa
comportamente relevante din punct de vedere al constructului.
Măsurarea este următorul nivel al piramidei inferenței științifice. Comportamentele
identificate ca fiind relevante din punct de vedere al unui construt trebuie măsurate (sau făcute
măsurabile). Pentru măsurarea comportamentelor utilizăm diverse instrument de
măsurare/evaluare psihologică, care fiecare se bazează pe utilizarea a unui anumit tip de scală de
măsurare. Potrivit lui Stevenson (1946) măsurarea în psihologie poate fi efectuată pe 4 tipuri de
scale: i) nominală (presupune categorizare pe criterii calitative, ex. memorie vizuală sau memorie
verbală); ii) ordinală (presupune ordonarea indivizilor pe baza unui criteriu cantitativ, de ex.
frecvența consumului de dulciuri în cazul studiului obezității); iii) numeric (include interval și
rapoarte). Scala interval presupune existența unor unități de măsură, în timp ce scala de rapoarte
presupune existența unui punct zero real, adică un punct unde scorul zero obținut indică lipsa
completă a constructului (ex. dacă obțin zero la un test de inteligență, înseamnă că nivelul meu de
inteligența este zero?). În general, în măsurarea constructelor psihologice este dificil scale care să
permită masurarea real numerică, de cele mai multe ori reușim să construim scale care
aproximează acest nivel (cel mai frecvent măsurători ordinale).
Un concept important al acestui nivel este fidelitatea măsurării. Fidelitatea măsurării se
referă la faptul că instrumentul măsoară corect ceea ce își propune să măsoare. Această calitate
psihometrică se verifică de obicei prin repetarea măsurătorii, sau alte demersuri bazate pe acest
principiu. Dacă am un instrument care măsoară înălțimea și dimineața indică 170 cm, mă aștept
ca repetarea măsurării seara să rezulte un scor similar (poat nu chiar identic). Dacă cele două
scoruri diferă foarte mult, dimineața am 170 cm și seara 178 cm, sau 165 cm îmi mă întreb cât de
multă încredere pot avea în acest instrument de măsurare (despre un astfel de instrument spunem
că are fidelitate redusă).
Următorul nivel al piramidei îl reprezintă designul de cercetare. Măsurarea întotdeauna
se decurge într-un anumit context, mai mult sau mai puțin controlat de către cercetător. Dacă
trimit un chestionar prin email, nu voi știi exact care sunt condițiile în care a fost completat
chestionarul. Poate că unii respondenți au completat-o la birou în pauza dintre mese, alții seara în
timp ce copiii se jucau prin preajmă, iar alții într-un mediu liniștit fără presiune de timp.
Întrebarea este în ce măsură constextul a afectat calitatea răspunsurilor? De cele mai multe ori,
răspunsul la această întrebare este una afirmativă, diferite context afectează în mod diferit
răspunsurile chestionaților. Acest fapt ridică problema comparabilității datelor provenite de la
diferiți participanți. Controlul de cercetare se manifestă prin posibilitatea cercetătorului de a
uniformaza condițiile de participare la studiu a participanților, astfel încât scorurile obținute să fie
comparabile. Prin natura controlului manifestat unele studii permit un control redus (de ex.
ancheta socială) în timp ce altele permit un control ridicat (de ex. experimentul de laborator). Un
nivel ridicat al controlului conferă studiului validitate internă. Validitatea internă se referă la
faptul că eventuale diferențe observate (ex. numărul de stimuli reactualizați) între diferitele
categorii de participanți (de ex. cei care au fost pedepsiți față de cei care au fost motivați prin
întăriri) se datorează într-adevăr variabilelor incluse în studiu și nu altor variabile externe
acestuia.
Următorul nivel al piramidei îl reprezintă Inferența statistică. Datele colectate într-un
context mai mult sau mai puțin controlat la cercetării sunt supuse unei analize, care permite
sumarizarea acestora (statistică descriptivă) și permite formularea la un răspuns esențial al
cercetării, diferențele/asocierile observate sunt sau nu sunt întâmplătoare? Dacă o
diferență/asociere observată poate fi și întâmplătoare, atunci nu mai trebuie să căutăm explicații,
din moment ce avem deja una, întâmplarea. Însă în momentul în care observăm rezultate puțin
probabil să se datoreze întâmplării atunci are sens să căutăm explicații, din moment ce aleatorul
nu este o explicație plauzibilă. Acest rol, de a disocia ceea ce poate fi întâmplător de ceea ce este
(foarte probabil) sistematic, revine statisticii inferențiale.
Inferența științifică reprezintă ultimul nivel al piramidei, în esență constă într-o
concluzie sau afirmație verificată prin intermediul metodei științifice (ex. există o asociere între
frecvența fumatului și cancerul pulmonar). Inferența științifică este o rezultantă a proceselor
derulate la nivelele inferioare al piramidei, ca urmare este determinată de acestea. Dacă
cercetătorul comite erori la nivelurile inferioare al piramidei (ex. operaționalizarea greșită a
constructelor, fidelitate redusă a măsurării, lipsa controlului în cercetare, etc) acestea se vor
propaga, având ca rezultat concluzii eronate (ex. cercetătorul afirmă că există relație între
inteligența și performanță academică, în contextul în care acest rezultat se datorează unei selecții
defectuoase a participanților în studiu).

1.2.5 SISTEMATIZAREA CERCETARILOR ÎN DOMENIUL


PSIHOLOGIEI
În diferite manuale și tratate de metodologie a cercetării sunt prezentate numeroase modalități de
a sistematiza cercetarea. Cele mai frecvent întâlnite criteri sunt:
i) gradul de aplicabilitate al cunoștințelor asimilate: în funcție de acest criteriu diferențiem
cercetări aplicative (își propun scop manifest rezolvarea directă a unor probleme existente, de
ex. validarea unui demers terapeutic sau al unui program de training organizațional) și cercetări
fundamentale (cercetări al căror scop este doar cunoașterea, dobândirea unor noi informații legat
de un anumit domeniul al psihologiei, fără a avea o aplicabilitate imediată). Cercetările rareori
sunt pure, din punct de vedere al criteriilor menționate, de cele mai multe ori orice cerectare se
situează undeva între cele două extreme al unui continuu, fundamental-aplicativ.
ii) relativ mai recentă este dihotomia cantitativ vs. calitativ, stabilită în funcție de crezul și
orientarea cercetătorului (metateoriile) în ceea ce privește natura fenomenelor studiate. Din acest
punct de vedere diferențiem cercetarea cantitativă (se bazează pe o perspectivă pozitivistă
asupra realității, perspectivă al cărei esență este redată de citatul “If anything exists,
it exists in some amount. If it exists in some amount, it can be measured” - Thorndike, 1926,
p.38) de cercetarea calitativă (care propune o perpectivă constructivistă asupra fenomenelor
psihologice, acestea fiind un produs emergent al demersului de cunoaștere. De ex. scorul de
inteligență este o măsură a unui fenomen, care fenomen este construit – și reconstruit, în mod
particular de fiecare participant, sau de cercetător cu ocazia fiecărei testări, în funcție de
semnificațiile atribuite acestui concept). Asemenea primului criteriu, nici în acest caz nu putem
afirma că cercetările sunt pure, cercetările cantitative include elemente de cercetare calitativă, și
frecvent și reversul este adevărat.
iii) dincolo de aceste jaloane majore, existe numeroase alte criterii care permit
sistematizarea diferitelor și descrierea diferitelor tipuri de cercetare. Criteriile pe care le
propunem este unul mai degrabă didactic, și reflectă modul în care diferitrele tipuri de cercetări
urmează a fi discutate în cadrul acestui curs. Criteriul utilizat este scopul cercetării. În funcție de
ceea ce își propune un cercetător, cercetarea poate fi împărțită în patru mari categorii: descriptivă,
predictivă, explicativă și aplicativă.
Studiile descriptive, precum sugerează și denumirea acestora, își propun surprinderea și
descrierea în termeni cantitativi al unui fenomen. De ex. Care este rata fumatului la vârsta de 13
ani? Care este rata tulburărilor de anxietate în populația studenților? Aparent simpliste (însă din
punct de vedere metodologic, la fel de riguroase ca și oricare alt tip de cercetare), aceste cercetări
sunt esențiale în etapele inițiale ale incursiunii științifice, în care fenomenul abordat este puțin
cunoscut. De cele mai multe ori, în această etapă nici nu este clar pentru cercetător, dacă
fenomenul abordat este unul important sau nu, unul cu impact social major sau nu. Mai mult
decât atât, cercetările descriptive (bivariate și multivariate) pot oferi o descriere bivariată sau
multivariată a fenomenului studiat, oferind posibilitatea de a stabili relații între fenomenul
invistigat și alte variabile conexe acestuia. Astfel de cercetări ne pot oferi informații cu privire la
măsura în care rata fumatului este sau nu relaționată cu structura familiei (biparentală sau
monoparentală)?
Strâns legat de scopul, este scopul predicției. Studiile predictive sunt intim legate de
studiile descriptive, de cele mai multe ori studiile descriptive includ elemente de predicție,
predicții formulate în baza relațiilor stabilite între fenomenul studiat și diferitele variabile legate
de acesta. Scopul acestor studii este predicția unui comportament viitor, de ex. Care va fi
performanța ulterioară al uniu nou angajat într-o organizație? Care va fi performanța academică
ulterioară al unui candidat declarat admis în baza unui examen? De obicei suntem tentați să
credem că doar cunoașterea mecanismelor cauzale permite predicție. Este cert, cunoașterea
acestor mecanisme permite predicții acurate, însă chiar și în lipsa cunoașterii acestor mecanisme,
putem construi modele de predicție suficient de acurate, bazându-ne pe informațiilor cu privire la
relația existentă între fenomenul studiat și alte variabile (adică folosindu-ne de informațiile oferite
de studiile descriptive bi- și multivariate).
Cercetare explicativă își propune să treacă dincolo de simpla descriere a unui fenomen,
încercând să identifice relațiile cauzale care duc la apariția unui fenomen. Pe baza studiilor
descriptive nu reușim să ne dăm seama cum funcționează un fenome (de ex. prejudecățile),
trebuie să pătrundem în profunzime și să încercăm să gândim analitic, ca un bun reparator de
ceasuri, să desfacem ”obiectul” în componente și să încercăm să ne dăm seama cum anume sunt
diferitele componente relaționate, cum alcătuiesc un mecanism care produce un anumit efect.
Cunoașterea mecanismului cauzal, al relațiilor de determinare existente între diferite
variabile permite elaborarea unor protocoale de diagnostic și intervenție, al căror validitate este
testată în cadrul unor cercetări aplicative.

Rezumat
Putem extrage din exemplul de mai sus câteva concluzii importante despre modul în care se
realizează o cercetare:
Una din problemele cu care se confruntă o cercetare este complexitatea situaţiilor reale. Noi
putem aborda această problemă prin simplificarea situaţiei astfel încât să găsim o soluţie
utilizabilă. Demersul adoptat e simplu: ce ne interesează e să găsim o soluţie la problemă, nu să
abordăm situaţia în toată complexitatea ei (ceea ce este evident imposibil). Datorită simplificării,
soluţia găsită nu e perfectă; mai mult, poate fi greşită sau nesatisfăcătoare. Din aceste motive
suntem obligaţi să o testăm, comparând-o cu realitatea. Testarea soluţiei ridică problema obiectivităţii
datelor empirice. Dacă acestea sunt incorecte, vom eşua în tentativa noastră de a verifica soluţia.
Caracterul ştiinţific al cercetării este dat de testarea soluţiei teoretice. Însă o cercetare ştiinţifică nu se
reduce la testarea de ipoteze.

Bibliografie minimală pentru acest modul


READER Curs Psihologie Experimentală și Metode de Analiză a Datelor
Bibliografie facultativă
Radu, I., Miclea. M., Albu, M. Nemes, S. Moldovan, O., Szamoskozi, S. (1993) Metodologie
Psihologica si analiza datelor. Editura Sincron, Cluj Napoca.
Heiman, G., W., (2001) Understanding Research Methods and Statistics: an integrated approach.
Houghton Mifflin Company, Boston.
Dane, F. (1990) Research methods. Brooks Company, California.
Richard Feynman (1998) The Meaning Of It All. Reading, Mass.: Addison-Wesley.
Modulul 2
VALIDITATEA ŞI FIDELITATEA MĂSURĂTORILOR. TEORIA ERORILOR
DE MĂSURARE

Scopul modulului: familiarizarea studentului cu conceptele de bază a metodelor de măsurare.

Obiectivele modulului: la finalul acestui modul, studenţii vor fi capabili:

• să înţeleagă tipurile de erori de măsurare şi a modului de


clasificare a acestora;
• să surprindă avantajele şi deficienţele metodei eşantionării
aleatoare pentru a micşora erorile de măsurare.
• să identifice erorile posibile ale unei măsurări

Măsurarea reprezintă procesul prin care un set de carcateristici psihologice, de obicei


exprimate sub forma unor comportament sunt transformate într-un set de numere. Legătura
existentă între aceste numere, în esenţă entităţi abstracte, şi atributele psihologice evaluate
depinde de calitatea procedurilor de măsurare. Unele erori sunt inerente procesului de măsurare,
altele în schimb pot fi evitate.

2.1 EVALUAREA ŞI MĂSURAREA ÎN PSIHOLOGIE


Datele obţinute prin diferite forme de investigaţie psihologică se prezintă adesea în formă
numerică sau sunt aduse, graţie unei operaţii de codare, la o formă numerică, astfel încât se
pretează la o prelucrare matematică, în particular, statistică. Spre exemplu, într-o experienţă de
laborator se înregistrează frecvenţa, durata ori amplitudinea unei reacţii în funcţie de stimulii
aplicaţi; într-o activitate sau o probă practică se numără răspunsurile exacte, ca şi erorile; altădată,
se notează timpul de execuţie a unei mişcări sau acţiuni, timpul de reacţie pentru răspuns, timpul
de evocare a unui material din memorie ori de asociere a unor cuvinte etc. De asemenea, în probe
de învăţare se marchează numărul de repetiţii sau încercări necesare până la obţinerea curbei cu
platou, precum şi volumul materialului reţinut în diferite unităţi de timp ş.a.m.d.
Când este vorba de influenţa unor factori fizici (stimuli vizuali, acustici, tactili) se
măsoară – pe baza aparatelor cunoscute – anumiţi parametri fizici: intensitate, frecvenţă, greutate
ş.a. De notat că variabilele brute, adică şirul de numere cu care operează psihologul rezultă fie în
mod direct din citirea aparatelor – cum este cazul indicilor de timp sau al parametrilor fizici –, fie
din însumarea de puncte, cum este cazul testelor creion – hârtie sau alte probe. Alteori, datele
apar din totalizări pe rubrici ordonate ale unui tabel sau protocol de observaţie, cum va reieşi din
exemplul ce urmează.

Exemplu:
Un proces de investigare ce ia forma observaţiei pune, de regulă, în joc o grilă de
observaţie, care oferă cadrul de clasificare a datelor, rubricile tabelului de înregistrare a faptelor
urmărite.
Pentru a surprinde, de pildă, anumite trăsături de temperament în comportarea
preşcolarului sau a şcolarului mic se organizează un joc – denumit convenţional "transportul
cuburilor" – căruia i se impun anumite cerinţe. Copilul trebuie să transporte cu lopăţica pe un
traseu dat (dus şi întors) un număr crescând de cuburi (3, 4, 5, ... 10), purtând coloana acestora cu
mâna dreaptă fără să o sprijine cu cealaltă mână. În caz de eşec (pierderea vreunui cub,
răsturnarea coloanei etc.) proba se reia de la început. Se înregistrează succesiunea probelor,
reacţiile verbale şi motorii care însoţesc îndeplinirea sarcinii, conţinutul sau felul acestor reacţii în
funcţie de succes/insucces, reluarea probei etc. Tabelul 2.1., adaptat după I. A. Samarin (1954),
redă un fragment dintr-un asemenea protocol. Rubricile tabelului alcătuiesc grila de observare a
comportamentului.

Tabelul 2.1.
Suc- Cu- Pre- Caracterul reacţiilor verbale Pre- Caracterul reacţiilor motrice Alte
ce- buri zenţa zenţa Obser-vaţii
siu- trans- reac- Auto- Se Re- Alte reac- pre- Refuz Distra- Reac-
nea por- ţiilor stimu- plân- fuz re- ţiilor cipi- pasiv geri ţii
pro- tate ver- lare ge de acţii mo- tare mo- vege-
belor bale greu- ver- trice ener- trice tative
tatea bale vare
sar-
cinii
1 3 +! + - - - + - - + -
2 4 + +! - - - - - - - -
3 5 +!! + + - - + - - - +
.
.

( Adaptat după I. A. Samarin, 1954)


După cum se vede, este vorba de strângerea unei informaţii mai mult calitative: s-a notat
prezenţa sau absenţa reacţiilor verbale şi motorii (cu "+", respectiv "-"), apoi felul sau conţinutul
acestora, manifestarea cu insistenţă a unei trăsături (marcată cu semnul exclamării). Documentul
care consemnează datele obţinute şi modul de recoltare se numeşte protocol. Efectuând totalizări
pe coloane în tabelul de date, se obţin frecvenţe diferite pentru anumite tipuri de reacţii, care se
pun în corelaţie cu tipul temperamental al subiectului. Datele observaţiei ne apar condensate sub
formă de efective sau frecvenţe, corespunzător unor tipuri de răspuns.
Sub presiunea unor cerinţe de ordin practic, nevoia de măsurare s-a extins, după cum se
vede, de la măsurarea fizică la cea psihologică. Trebuie însă precizat că psihologia nu dispune de
unităţi de măsură aşa cum se întâlnesc ele în fizică. Spre exemplu, un copil reţine dintr-o probă de
memorie 8 cuvinte din 15 sau patru trasee dintr-un labirint. Rezultatul testelor se exprimă
numeric prin însumarea elementelor memorate. Nu este precizat însă dacă traseele respective sau
cuvintele sunt echivalente între ele pentru a fi doar numărate, totalizate în cota atribuită
subiectului. De asemenea, nu este precizat modul de comparare între memoria cuvintelor şi aceea
a traseelor pentru a le "compune" într-un indice cantitativ unic. Aşadar, nu sunt conturate aici
unităţi de măsură (cf. J. Piaget, 1972).
Conceptul de măsurare este luat în psihologie în conţinutul său cel mai larg şi anume, în
sensul de operaţie prin care se atribuie numere datelor discrete sau continue ce urmează a fi
evaluate. Un exemplu familiar în această privinţă ar fi evaluarea şi notarea şcolară, care
reprezintă în final un mod de codare numerică (de la 1 la 10) a rezultatelor la învăţătură. Numai
că notele finale presupun un act de apreciere care comportă oricum un grad de subiectivitate. În
schimb investigaţiile psihologice tind şi reuşesc în numeroase situaţii să obţină date obiective,
independente de persoana care face cercetarea. Montajele de laborator, tehnica de notare a
probelor psihologice, analiza produselor activităţii, ca şi observarea sistematică permit – cum s-a
arătat mai sus – înregistrarea unor fapte precise, colectarea în cele din urmă a unei informaţii
numerice. Exprimând anumite date în formă numerică, suntem tentaţi să facem în continuare
operaţii aritmetice cunoscute: adunarea, înmulţirea, împărţirea etc. Or, fenomenele psihice – cum
vom vedea – impun anumite restricţii în această privinţă; trebuie să existe un paralelism
(izomorfism) între tratarea numerică şi proprietăţile faptelor studiate.
Măsurarea psihologică, luată în sensul larg de aplicare a numărului la datele obţinute,
prezintă o anumită gradaţie, definită de tipurile de scale întâlnite în investigaţiile concrete.
Folosind terminologia lucrărilor de metodologie psihologică (Stevens, 1951; Suppes şi Zinnes,
1963; Coombs, 1963; Faverge, 1965; Reuchlin, 1963; Rouanet, 1987 ş.a.) vorbim de diferite
tipuri de scale: scale nominale, scale ordinale, scale de intervale ş.a. Între acestea se găsesc şi
tipuri intermediare, de exemplu scale hiperordinale (între scale ordinale şi scale de interval).
Felurile amintite de scări sau scale denumesc trepte succesive de măsurare într-un domeniu dat.

● Scale nominale sau calitative – definesc primul nivel al măsurării, de fapt al pre-
măsurării. Acesta este nivelul curent în observaţie şi anchete.
A utiliza o scală nominală înseamnă a clasifica sau repartiza datele (rezultatele), după o
serie de nume sau categorii diferite (disjuncte), astfel încât fiecare element (răspuns, observaţie
etc.) să-şi găsească locul într-o categorie şi numai într-una singură. Orice tipologie constituie în
acest sens o scală nominală. În locul denumirii categoriilor se utilizează de regulă un cod numeric
(01, 02, ... ) care nu formează propriu-zis obiectivul calculelor, ci serveşte la individualizarea
acestor grupări, la repetarea lor în cursul prelucrării statistice. Aşadar, nivelul nominal al
măsurării comportă atribuire de numere doar pentru a denumi clase de echivalenţă. Desigur,
calculele obişnuite au loc, dar ele se fac asupra efectivelor sau frecvenţelor ce se stabilesc în
cadrul diverselor categorii (clase), individualizate prin cod numeric.

Exemplu:
Se dă un chestionar referitor la orientarea profesională la o colectivitate de şcolari. Elevii
sunt solicitaţi să răspundă în scris asupra profesiunii spre care doresc să se îndrepte. Se obţine un
ansamblu de răspunsuri care vor fi grupate, repartizate în diferite categorii după o listă sau
repertoriu de profesiuni care va constitui cadrul de clasificare. Aşadar, efectuând ancheta,
mulţimea de răspunsuri obţinute se va repartiza într-un număr de clase disjuncte, indicate prin
denumirea profesiei ori un simbol ales în mod convenţional (cod numeric) care, evident, nu face
obiectul calculului. Fiecare răspuns în parte consemnat în chestionar va fi repartizat în una din
aceste categorii sau profesii. În ancheta concretă, opţiunile exprimate nu acoperă în mod necesar
întreg repertoriul de profesiuni existent la un moment dat într-o societate; acest repertoriu este de
regulă mai larg decât protocolul obţinut. În final se numără răspunsurile din fiecare categorie sau
rubrică întâlnită şi se stabilesc frecvenţele corespunzătoare sau efectivele. Datele astfel obţinute se
pretează în continuare la o tratare numerică, utilizându-se mai ales indicii din teoria informaţiei.

Temă de reflecţie nr. 1


Oferiţi două exemple de variabile psihologice evaluate pe o scală categorială
utilizată în domeniul educaţional, respective clinic. Pentru aprofundarea
subiectului vezi în READER documentul:
Bibliografie 10.pdf - Cohen_2001_Explaining Psychological Statistics - cap. 1.
● Nivelul cel mai răspândit al măsurării în cercetarea psihologică este acela al scalelor ordinale
sau, pe scurt, nivelul ordinal. Variabilele psihologice – notează Faverge (1965) – sunt în
majoritatea lor variabile, având valori simplu ordonate. Caracteristică acestui nivel – pe lângă
propietăţile treptei anterioare – este posibilitatea de a stabili relaţii de ordine totală între lucruri
(date); fiind date elementele A, B, C, ... semnul ">" aşezat între ele poate însemna:
A superior lui B, B superior lui C etc., sau A este preferat lui B, B preferat lui C ş.a.m.d.
Notând în general Pxxy vom citi "x superior lui y", "x preferat lui y" sau "x înaintea lui y" etc.
Probele sau criteriile de care ne servim conduc la clasamente ierarhice: scări de capacitate, scări
de preferinţe, scări de produse, scări de atitudini ş.a.m.d.
Când Alferd Binet lansa în 1905 cunoscuta sa "scală metrică a inteligenţei", el pornea de
la următoarele consideraţii: "... calităţile intelectuale nu se măsoară ca lungimile, ele nu sunt
superpozabile" (în limbajul nostru, ele nu satisfac cerinţa aditivităţii); scala metrică permite –
spunea Binet – "un clasament ierarhic între inteligenţe diferite; şi pentru nevoile practicii acest
clasament echivalează cu o măsurare" (p.194-195).

Exemplu:
Ordonarea subiecţilor cu privire la atitudinile pe care le adoptă într-un domeniu sau altul
presupune o ordonare a întrebărilor ce le sunt adresate. De aici ideea de a întocmi şi prezenta
anumite grupaje sau baterii de întrebări care se referă la aceeaşi temă, la acelaşi domeniu, pe
scurt, la aceeaşi variabilă. Un asemenea grupaj, numit test sau scală de atitudini trebuie să
constituie el însuşi o scală ordinală. Răspunsurile posibile se grupează şi ele într-o ierarhie.

● Cel de-al treilea nivel al măsurării este definit de scalele de intervale.


Acest nivel nu constituie practic nivelul curent în psihologie. Relaţiei de ordine i se
adaugă, în acest caz, mărimea exactă a intervalelor sau a distanţei care separă toate elementele
situate pe scală, ceea ce presupune o unitate de măsură comună şi constantă (L. Coombs,1963).
O procedură experimentală care să traducă practic exigenţa amintită nu este uşor de realizat. Ea
se întâlneşte în domeniul psihofiziologiei senzoriale, în experienţe de laborator în care se
înregistrează timpul de reacţie, numărul de erori, forţa sau amplitudinea reacţiei motrice etc. De
asemenea, în anumite probleme de psihologie aplicată, cum sunt cele legate de producţie – când
interesează exclusiv performanţele comparabile, făcându-se abstracţie de orice alte considerente,
utilizarea scalelor de intervale este posibilă. În cadrul scalei de interval se conturează şi elementul
compus.
● Scalele "hiperordinale", sunt caracterizate nu numai printr-o relaţie de ordine între date
(elemente), ci şi între intervalele care le separă. Aceste intervale însă nu sunt reductibile la
compuneri de unităţi (echivalente între ele), dar pot fi evaluate cu o anumită precizie. Distanţa
poate fi relevată nu în termeni numerici, ci în formă intuitivă.

Exemplu:
Prezentăm unui grup de şcolari un lot de probleme de gândire, în total 20, dispuse în
ordinea greutăţii lor crescânde, formând deci cum se spune o scală de dificultate. Într-o asemenea
probă, se presupune, dacă testul este omogen, că toţi subiecţii care au rezolvat o întrebare de
dificultate p, rezolvă de asemenea toate întrebările de dificultate inferioară lui p. Acordăm un
timp limitat pentru rezolvare, aceeaşi pentru fiecare subiect în parte. Din ansamblul de rezultate
individuale să reţinem patru performanţe; să zicem: A rezolvă 10 probleme, B rezolvă 8
probleme, C rezolvă 16 probleme şi D rezolvă 6 probleme. Punctajul întrunit de fiecare – pe care
îl vom nota cu litere mici corespunzătoare (a=10; b=8; c=16; d=6) – este diferit şi ia, după cum se
vede, o formă numerică. Variabila brută ia naştere prin însumarea punctelor.
Operând în continuare asupra numerelor atribuite am fi tentaţi să spune c=2b (întrucât
16=2 x 8), că d=c - a (întrucât 6=16 - 10), că a + d=c (pentru că 10 + 6=16) ş.a.m.d. Asemenea
operaţii ar fi din punct de vedere psihologic incorecte, deşi aritmetic ele sunt corecte. Cine ar
accepta, de pildă – vorbind în limbajul notelor şcolare – că "un răspuns de 10" s-ar putea
compune din "două răspunsuri de 5", deşi 10=5 + 5. Fenomenele psihologice nu sunt aditive.
Ceea ce putem spune în exemplul dat este că C este superior lui A sub aspectul cercetat, că A este
superior lui B, iar acesta se află înaintea lui D (pe scurt: C>A>B>D). În plus, putem adăuga în
mod intuitiv intervalul sau distanţa care le separă: astfel, intervalul sau distanţa care-l separă pe C
de D este mai mare decât distanţa CB, că intervalul CA<CB ş.a.m.d. Stabilim, cu alte cuvinte, o
relaţie de ordine, o ierarhie a elementelor şi a intervalelor care le separă, relaţie care subzistă
statistic la a doua, a treia examinare, eventual la a n-a examinare, în condiţii identice.

Temă de reflecţie nr. 2


Oferiţi un exemplu concret de măsurare în care acelaşi construct să fie evaluat prin
toate tipurile de scale. Pentru aprofundarea subiectului vezi în READER
documentul:
Bibliografie – 10.pdf - Cohen_2001_Explaining Psychological Statistics - cap. 1.
Corespunzător tipurilor de scale vom avea de-a face cu variabile nominale, variabile
ordinale, variabile numerice etc. Când vorbim de variabile avem în vedere pe de o parte,
domeniul de variaţie, adică registrul de valori posibile, şi, pe de altă parte, domeniul de definiţie,
adică mulţimea de indivizi susceptibili de a prezenta aceste modalităţi. De exemplu, o atitudine
considerată ca variabilă presupune că putem preciza o mulţime de modalităţi posibile ale acesteia
şi, totodată, o populaţie care să prezinte aceste modalităţi. Putem face ca fiecărui individ din
domeniul de definiţie să-i corespundă o modalitate şi una singură, din domeniul de variaţie.
Un protocol este o particularitate a variabilei, pentru care domeniul de definiţie este
mulţimea de indivizi I şi domeniul de variaţie o mulţime de observabile U. Noţiunea de variabilă
este mai generală: un protocol este mulţimea de observaţii (date) efective, în timp ce o variabilă
poate fi o mulţime de observaţii potenţiale (H. Rouanet, 1987, p. 50). Prin urmare putem distinge
între mulţimea de date sau observaţii efectiv înregistrate şi mulţimea de observabile, de date
ipotetice (prezumtive). Tipurile de scale descrise mai sus reprezintă structuri pe mulţimea de date
observabile.
Rezumând: în majoritatea situaţiilor, variabilele întâlnite în psihologie sunt variabile
având valori simplu ordonate (Experienţa psihologică – notează Piaget – nu ne furnizează decât
relaţii de ordine). Valorile numerice constituie repere menite să pună în evidenţă o relaţie de
ordine totală. Se introduce însă, în mai multe cazuri, o distanţă între valorile unei variabile. În
prelucrarea datelor, în funcţie de cerinţele studiului şi pentru a ne înscrie într-o schemă statistică,
noi introducem astfel o metrică, adică tratăm datele ca şi cum s-ar situa la nivelul scalei de
interval. Suprapunem deci – nu fără artificiu – scalei hiperordinale o scală de intervale şi utilizăm
operaţiile de calcul cunoscute. Se comite astfel o eroare, care practic este adesea neglijabilă. S-a
constatat că paralelismul între modul de prelucrare a datelor ordinale şi tratarea aceloraşi date în
scala de intervale a fost de ordinul lui 0,90, adesea mai mare ca 0,90, ceea ce face acceptabilă
transformarea respectivă. Decisiv din punct de vedere practic, este faptul dacă o asemenea tratare
dă loc la predicţii valide, fapt deja verificat în psihologia aplicată.

2. PROCESUL DE MĂSURARE. ERORI DE MĂSURARE SISTEMATICE ŞI


NESISTEMATICE
După cum am constatat în capitolele precedente, cercetarea ştiinţifică presupune obţinerea de date
empirice, obţinute prin măsurători. Principalele criterii pe care măsurătorile trebuie să le satisfacă
pentru a avea valoare ştiinţifică sunt validitatea şi fidelitatea. Validitatea unor date empirice
relativ la un comportament reprezintă măsura în care datele reflectă elementele relevante ale
acelui comportament.
Pe de altă parte, fidelitatea reprezintă consistenţa (repetabilitatea) măsurării. Adică,
măsurând succesiv acelaşi comportament al unui subiect, trebuie să obţinem valori apropiate.
Motivul pentru care nu ne aşteptăm să obţinem valori identice este datorită erorilor de măsurare.
De exemplu, dacă dorim să măsurăm timpul de reacţie la un stimul simplu, constatăm că,
repetând măsurarea pe acelaşi subiect, vom obţine date diferite, dar apropiate. Putem reprezenta
relaţia dintre rezultatul măsurării şi eroarea de măsurare astfel:

X=T+E

X reprezintă în acest caz rezultatul măsurării, T este rezultatul ideal iar E eroarea de
măsurare. În cazul unei măsurători simple (de exemplu o dimensiune fizică: lungimea unui
obiect, de exemplu) eroarea de măsurare se datorează erorii instrumentului folosit şi a actului de
măsurare. Eroarea totală este deci rezultanta celor două erori. Problema inerentă oricărei măsurări
este că aceste două componente nu pot fi separate. Noi nu putem evalua decât eroarea totală; cât
din această eroare se datorează instrumentului şi cât măsurării în sine nu ştim.
Orice acţiune de măsurare atrage deci după sine şi o eroare de măsurare. Nu putem face
măsurători fără eroare; putem doar reduce eroarea de măsurare până când aceasta să fie
neglijabilă în raport cu relevanţa măsurătorii. Pentru a reduce eroarea de măsurare este însă
necesar să identificăm cauzele ei. Însă identificarea cauzelor nu este uşoară; eroarea de măsurare
nu ne poate ajuta în acest sens.

Temă de reflecţie nr. 3


Enumeraţi câteva posibile surse de eroare care pot distorsiona o banală
măsurare a greutăţii.

Soluţia este identificarea tipului de eroare, folosindu-ne de modelele teoriei erorilor de


măsurare. Teoria erorilor de măsurare clasifică tipurile de eroare după provenienţa lor în două
clase: erori sistematice şi erori aleatoare. Erorile sistematice sunt produse de o cauză precisă şi au
de fiecare dată aceeaşi mărime. În schimb, erorile aleatoare nu au cauze decelabile şi iau valori
întâmplătoare. De exemplu, în cazul măsurării timpului de reacţie simplu la un stimul vizual,
timpul de latenţă al sistemului de înregistrare a răspunsului (cheia de răspuns şi cronometrul)
reprezintă o eroare sistematică, fiind identic la fiecare măsurare. Erorile sistematice pot fi
identificate; mărimea lor poate fi stabilită experimental, odată identificată cauza ei. Timpul de
reacţie motor (TR) variază întâmplător de la o măsurătoare la alta; el reprezintă o eroare
accidentală. Nu putem preciza nici cauzele acesteia şi nici nu putem prevedea mărimea ei pentru
următoarea măsurare. Reprezentând însă rezultatul unui număr foarte mare de măsurători pe
acelaşi subiect vom obţine o distribuţie caracteristică a valorilor TR, în formă de clopot.
Distribuţia în formă de clopot (distribuţia normală) este caracteristică tuturor erorilor
aleatoare, fiind numită legea erorilor (sau legea lui Gauss ). Legea lui Gauss poate fi formalizată
matematic dacă considerăm eroarea accidentală rezultatul unui număr mare de erori parţiale;
fiecare eroare parţială are o amplitudine mică ce variază întâmplător, conform unei legi
probabiliste.
Istoria stabilirii legii lui Gauss este destul de interesantă şi merită prezentată.
Reprezentarea distribuţiei normale a fost determinată de matematicianul Abraham DeMoivre
pentru funcţia continuă a binomului (a + b)n. Utilitatea practică a fost însă dată de Gauss, care a
obţinut reprezentarea normală pentru variaţiile măsurătorilor astronomice, ceea ce i-a permis să
presupună un caracter aleator pentru aceste erori. Acum putem înţelege motivul pentru care
variaţiile de măsurare care iau forma distribuţiei normale sunt considerate aleatoare: forma
distribuţiei este identică cu cea a unei funcţii probabilistice.
Conform teoriei erorilor putem reduce eroarea generală de măsurare prin identificarea
cauzelor şi mărimii erorilor sistematice şi prin reducerea efectului erorilor aleatoare. Media
valorilor în cazul unei distribuţii gaussiene reprezintă valoarea cea mai frecventă în distribuţie şi
cu eroarea cea mai mică. Avem deci posibilitatea de a reduce mărimea erorii aleatoare prin
înlocuirea valorii individuale (rezultatul unei singure măsurători) cu valoarea medie a distribuţiei
unui număr mare de măsurători identice. Pentru erorile sistematice, nu avem altă cale decât
identificarea sursei; de exemplu, dacă eroarea sistematică este dată de instrument, folosirea de
instrumente diferite (cu erori sistematice diferite) poate duce la distribuţii ale căror medii diferă.
Diferenţa dintre medii nu poate fi cauzată de o eroare aleatoare, a cărei mărime influenţează doar
abaterea standard a distribuţiei. Putem deci conchide că instrumentele induc o eroare sistematică,
de o mărime diferită.
Procedura de mai sus este tipică pentru experimentele din ştiinţele fizice, erorile de
măsurare fiind în cea mai mare măsură induse de instrumentul şi acţiunea de măsurare. În cazul
ştiinţelor socio-umane sursele de eroare nu sunt cauzate numai de instrumentul respectiv acţiunea
de măsurare; comportamentul uman este în sine o sursă de eroare pentru orice evaluare. O
persoană îşi poate modifica comportamentul după o lege aleatoare (ca şi în cazul TR) sau
neîntâmplătoare (de exemplu o schimbare conştientă şi voluntară de comportament). Mai mult,
comportamentul uman diferă de la o persoană la alta; aceste diferenţe pot fi, la rândul lor,
aleatoare sau nu. Prin urmare, nu putem extrapola direct rezultatul unei investigaţii de la o
persoană la alta. Mai mult, cele două tipuri de diferenţe coexistă în cazul comportamentului
uman: orice comportament uman poate fi descris printr-o componentă sistematică (de exemplu,
putem rezolva o problemă de fiecare dată prin aceeaşi metodă) şi o componentă aleatoare (timpul
de rezolvare va diferi de fiecare dată pentru aceeaşi problemă, şi nu îl vom putea prezice exact).
Aceasta este o diferenţă esenţială între comportamentul sistemelor socio-umane şi al
sistemelor fizice. Un sistem fizic nu va prezenta un comportament diferit atunci când se
realizează două măsurătoari în condiţii identice. Rezultatele replicării unui studiu în fizică vor fi
întotdeauna aceleaşi; micile diferenţe dintre cele două măsurători reprezintă erori de măsurare.
Totuşi, situaţia nu este chiar disperată. Putem folosi aceeaşi procedură de identificare a
erorilor ca şi în cazul măsurătorilor fizice. De exemplu, dacă obţinem la măsurarea timpului de
reacţie simplu la un subiect o distribuţie normală, putem deduce că ori nu avem erori sistematice,
ori acestea sunt mici. Dacă însă obţinem o distribuţie deplasată spre valori mici sau mari (sau
chiar una în formă de i sau j) acesta este semnul unor prezenţei erori sistematice. Sursa acestora
este mai probabil comportamentală; după cum am văzut, erorile sistematice determinate de
instrumente2 deplasează în general doar media distribuţiei. Urmează să identificăm cauzele
erorilor sistematice.

Temă de reflecţie nr. 4


Cum va afecta prezenţa erorilor nesistematice mari indicatorii statistici ai
dispersiei?

De fapt pentru formularea teoriilor pe noi ne interesează în special componenta


sistematică a unui comportament uman. Explicaţia e simplă: ea poate fi prezisă, în timp ce
componenta nesistematică se comportă aleator şi deci nu poate fi prezisă.
Pentru a putea face evaluări precise ale unor comportamente umane general valabile
(pentru generalizări) ar trebui să luăm în considerare măsurarea întregii populaţii. Acest lucru este
imposibil în practică, în afară de cazurile în care populaţia este restrânsă şi accesibilă. Soluţia
unanim acceptată prin care evaluările comportamentelor umane pot fi generalizate este
extrapolarea la întreaga populaţie a rezultatului obţinut prin măsurarea unui eşantion redus al ei.

2
Această constatare este valabilă instrumentelor de măsură fizice (de exemplu, cronometre pentru măsurarea
timpului de reacţie) sau pentru sarcini simple. În cazul instrumentelor psihologice complexe (teste psihologice)
eroarea nu mai este o constantă.
Extrapolarea este o aplicaţie a teoremei limitei centrale, care prevede că distribuţia mediilor
tuturor eşantioanelor ce pot fi extrase aleator dintr-o populaţie este de formă gaussiană. Forma
distribuţiei mediilor eşantioanelor nu depinde de cea a distribuţiei valorilor individuale. Pentru
cazurile reale, distribuţia se apropie cu atât mai mult de cea gaussiană cu cât numărul subiecţilor
dintr-un eşantion este mai mare. Pentru n = 30 obţinem deja o bună aproximaţie a curbei
gaussiene.
În scopul de a înţelege mai bine afirmaţiile de mai sus, vom continua cu un exemplu
simplu, şi anume comportarea unei monezi. Dacă moneda este corectă (nu are o faţă mai grea
decât cealaltă) nu putem prezice pe care din feţe va cădea la o aruncare (stema sau banul).
Moneda are deci o comportare aleatoare. Bunul simţ ne spune că şansa ca moneda să cadă pe
oricare din cele 2 feţe este egală, adică 50%. Însă această constatare nu ne ajută prea mult la
prezicerea unei aruncări. Totuşi, dacă facem un număr mare de aruncări, rezultatul (numărul de
steme obţinute, de exemplu) se va apropia mult de valoarea prezisă de 50%. În baza acestor
constatări, să urmărim ce se întâmplă dacă facem 30 de aruncări consecutive, şi numărăm de câte
ori am obţinut stema. Să presupunem că am obţinut 11 steme (din 30 de aruncări). Pe baza
calculului anterior, ne aşteptam să obţinem 15 steme. Putem conchide că moneda e mai grea pe
faţa cu banul? Greu de afirmat. Să mai repetăm seria de 30 de aruncări. Obţinem tot 11 steme. La
o nouă repetare obţinem 16 steme. Ce am obţinut este forma firească a unui comportament
aleator. Să continuăm până obţinem 90 de serii a câte 30 de aruncări (deci în total 2700 de
aruncări). Datele sunt prezentate în tabelul de mai jos.
Dacă reprezentăm grafic distribuţia de frecvenţă a celor 90 de serii, obţinem histograma
din figura nr. 3. După cum observăm, distribuţia rezultată seamană foarte mult cu cea gaussiană.
Valoarea cea mai frecventă obţinută este 16 (de 16 ori) şi nu 15, aşa cum ne-am aştepta. Dacă
numărăm însă totalul stemelor rezultate din cele 2700 de aruncări, obţinem 1354, o valoare foarte
apropiată de cea prezisă de 1350 (50% din 2700). Valorile obţinute în cele 90 de serii sunt deci
fluctuaţii în jurul valorii de 15.

Tabelul nr. 2.2


Seria Nr. steme Seria Nr. steme Seria Nr. steme Seria Nr. steme Seria Nr. steme
1 11 19 17 37 17 55 19 73 15
2 11 20 17 38 20 56 11 74 17
3 16 21 15 39 18 57 13 75 14
4 16 22 11 40 15 58 12 76 16
5 16 23 15 41 14 59 15 77 13
6 14 24 13 42 15 60 21 78 12
7 16 25 16 43 17 61 11 79 17
8 19 26 14 44 18 62 14 80 11
9 17 27 12 45 14 63 9 81 16
10 16 28 15 46 16 64 18 82 13
11 17 29 12 47 23 65 16 83 14
12 12 30 10 48 17 66 15 84 15
13 12 31 22 49 20 67 15 85 12
14 10 32 13 50 16 68 16 86 18
15 14 33 16 51 19 69 14 87 15
16 11 34 14 52 14 70 16 88 16
17 15 35 12 53 15 71 21 89 16
18 17 36 13 54 17 72 13 90 13

Acum vom face un pas important, pentru a ajunge intuitiv la concluziile teoremei limitei
centrale. Ce reprezintă de fapt seriile de câte 30 de aruncări din totalul de 2700? Le putem
considera ca fiind eşantioane de câte 30 de aruncări extrase aleator din cele 2700. Caracterul
aleator al “extragerii” este evident – am obţinut seriile din încercări succesive, rezultatele obţinute
fiind pur aleatoare – şi astfel am îndeplinit criteriul teoremei limitei centrale. Rezultatele seriilor
fluctuează aleator în jurul valorii teoretice de 15 steme. Rezultatul este cel prezis, şi anume o
distribuţie gaussiană. Evident, dacă am fi continuat aruncările, distribuţia ar fi fost din ce în ce
mai apropiată de o distribuţie normală.

Figura nr. 1. Distribuţia de frecvenţă a 90 de serii de câte 30 de aruncări

Cum putem folosi acest demers în cazul unei populaţii pe care dorim să o evaluăm? E
simplu: să ne imaginăm că am forma eşantioane extrăgând aleator subiecţii din populaţie, până
am epuiza toţi subiecţii. Evident, prin această metodă nu schimbăm cu nimic comportamentul
individual al subiecţilor (ei rămânând aceeaşi). Însă valorile medii ale eşantioanelor se vor
comporta similar cu seriile de monede, şi anume vor diferi aleator faţă de media populaţiei,
similar cu figura de mai sus. Consecinţa este foarte importantă. Este deci suficient să împărţim
populaţia în eşantioane aleatoare ca să obţimem distribuţia gaussiană pentru mediile acestora. Şi
asta fără să ne intereseze distribuţia valorilor individuale (care poate fi foarte diferită de
distribuţia normală).
În plus, în cazul unei distribuţii aleatoare, cunoscând funcţia matematică, putem calcula
mai mulţi parametri, de exemplu “lăţimea” distribuţiei. În cazul monedelor, valoarea teoretică
este:

Valoarea reală (23 -9 = 14) este destul de apropiată de cea teoretică (evident, dacă seriile
ar fi fost mai mari – de 100, de exemplu – valoarea reală ar fi fost mai aproape de cea teoretică).
Cel mai important rezultat pe care îl putem obţine prin metoda eşantionării este să
aproximăm cât mai bine comportamentul întregii populaţii (mai exact a mediei sau a tendinţei
centrale) doar măsurând un mic eşantion din aceasta. Pentru a înţelege intuitiv acest lucru, voi
folosi un exemplu simplu de măsurare. Exemplul este ideal, pentru că ne vom imagina o situaţie
pentru care ştim cum se comportă întreaga populaţie, şi vom vedea cât de mult ne putem apropia
de media ei calculând media unui singur eşantion.
Să presupunem că aplicăm un test de cunoştinţe format din 3 probleme similare la o
întreagă populaţie (să zicem toţi copii de 12 ani). Vom puncta cu 1 punct fiecare rezolvare
corectă şi cu 0 puncte fiecare rezolvare greşită. Deci rezultatele posibile sunt 0p, 1p, 2p sau 3p.
Să presupunem acum că 25% din populaţie obţine 0p, 25% 1p, 25% 2p şi 25% 3p. Media pentru
întreaga populaţie este deci 1,5p.
Să presupunem acum că alegem la întâmplare un eşantion de 2 subiecţi din populaţie? Ce
medie poate avea acest eşantion? În acest caz particular, putem să cunoaştem ce eşantioane se pot
extrage, şi ce medii putem obţine. Datele sunt prezentate în tabelul 2:

Tabelul 2.3 Eşantioanele de 2 subiecţi posibile şi mediile lor


Subiectul 1 Subiectul 2 Media
0 0 0
0 1 0.5
0 2 1
0 3 1.5
1 0 0.5
1 1 1
1 2 1.5
1 3 2
2 0 1
2 1 1.5
2 2 2
2 3 2.5
3 0 1.5
3 1 2
3 2 2.5
3 3 3

Ceea ce se poate remarca imediat este că, din cele 16 situaţii posibile (sunt atâtea pentru
că putem avea oricare din rezultate şi pentru subiectul 1 şi pentru subiectul 2; verificaţi!) avem
doar un eşantion cu media de 0p şi doar unul cu media de 3p; în schimb, avem 4 eşantioane cu
media de 1,5p (figura 2).

4.5

3.5

2.5

1.5

.5

0
0 .5 1.0 1.5 2.0 2.5 3.0
Esa ntioane de 2

Figura 2. Histograma mediilor eşantioanelor de 2 subiecţi

Adică avem de 4 ori mai mari şanse de “nimeri” un eşantion egal cu media populaţiei
decât de valori extreme (0 sau 3).
Mai mult, sunt 10 eşantioane (din cele 16 posibile) cu medii cuprinse între 1 şi 2; deci
vom avea de aproape 2 ori mai mari şanse să greşim cel mult 0,5p când vom încerca să apreciem
media populaţiei cu ajutorul doar a 2 subiecţi, decât să greşim 1p sau mai mult de 1p.
14

12

10

.333

.667

1.000

1.333

1.667

2.000

2.333

2.667

3.000
Esa ntioane de 3

Figura 3. Histograma mediilor eşantioanelor de 3 subiecţi

Ce se va întâmpla dacă extragem aleator eşantioane mai mari? Probabilitatea să obţinem


eşantioane cuprinse între 1 şi 2 va creşte din ce în ce mai mult (figurile 3 şi 4).

45

40

35

30

25

20

15

10

0
0

.2500

.5000

.7500

1.0000

1.2500

1.5000

1.7500

2.0000

2.2500

2.5000

2.7500

3.0000

Esa ntioane de 4

Figura 4. Histograma mediilor eşantioanelor de 4 subiecţi

De exemplu, sunt 186 de eşantioane diferite posibile de câte 4 subiecţI între 1 şi 2 şi doar
70 între 0 şi 1, respectiv 2 şi 3. Adică avem de peste 2,5 ori mai mari şanse de să greşim
maximum 0,5p decât mai mult atunci când aproximăm media populaţiei cu media unui eşantion
de 4 subiecţi.
Dacă folosim eşantioane extrase aleator mai mari (de 30 sau 100 de subiecţi) putem fi de
cele mai multe ori foarte aproape de media reală. Şi asta doar cu un singur eşantion. Dar numai în
cazul extragerii lui perfect aleatoare.
Consecinţele acestui fapt sunt foarte importante în cercetare. În primul rând, pentru că
măsurătorile pe care le putem face nu sunt foarte precise, putem să ne apropiem atât de mult cu
un eşantion aleator de media reală a populaţiei, încât să nu putem măsura diferenţa. Există însă
două mici “probleme” care ne reduc entuziasmul. Prima este faptul că avem doar o şansă foarte
mare să fim aproape de media reală, dar nu certitudinea. Putem fi ghinionişti şi să nimerim foarte
departe, cu toate că probabilitatea este în general extrem de mică, dar nu zero.

Temă de reflecţie nr. 5


Decizia statistică este una probabilistică. Cum se integrează acest tip de
raţionament în cel cauzal determinist?

A doua problemă este că nu putem în realitate să extragem eşantioanele perfect aleator (ar
trebui să avem adresa fiecărui subiect din populaţie într-o urnă, ceea ce este imposibil). Problema
este că vom greşi cu atât mai mult cu cât suntem mai departe de eşantionarea aleatoare; mai grav
e că nu putem nici aprecia cât de departe suntem de eşantionarea perfectă. De aceea, este de
preferat să descriem în lucrare cât mai exact metoda de eşantionare folosită, pentru a permite
cititorilor să aprecieze ei cât de departe suntem de eşantionarea aleatoare.
În continuare, voi prezenta pe scurt erorile posibile ale metodelor de măsurare folosite în
psihologie, şi căile prin care le putem corecta.
Orice metodă de măsurare am folosi pentru a evalua comportamentul uman, ea presupune
interacţiunea evaluatorului cu subiectul într-o situaţie concretă. Ca urmare, aceste 3 elemente
(deci în afara instrumentului de măsură în sine) pot produce la rândul lor erori de măsurare.
Evaluatorul poate produce erori prin prezentarea eronată a instrucţiunilor de rezolvare (în
cazul unui test psihologic sau a unei sarcini experimentale, ceea ce poate duce la rezolvări greşite
datorită neânţelegerii sarcinii); o altă sursă de eroare este dată de posibilitatea influenţării subtile
a rezultatului evaluării în direcţia expectanţelor evaluatorului (de exemplu prin aprobarea cu voce
tare sau gesturi a răspunsului înainte de a fi sigur dacă este corect, respectiv interpretarea
predominant favorabilă sau nefavorabilă a răspunsurilor ambigue).
Subiectul poate provoca erori de măsurare prin eludarea constrângerilor sarcinii (de
exemplu răspunsuri nesincere dar dezirabile la testele de personalitate, sau “ghicirea” răspunsului
corect la teste de inteligenţă sau de cunoştinţe) sau prin comportamente neexpectate de evaluator
sau autorul instrumentului (de exemplu refuzul de a rezolva un test de inteligenţă nu înseamnă
deloc incapacitatea de a-l rezolva corect).
Situaţia în care se produce evaluarea este şi ea sursă de erori, cele mai importante fiind
legate de uniformitatea situaţiei şi reacţiile individuale la situaţia de măsurare. Situaţia în care se
realizează măsurătoarea este doar aproximativ identică pentru fiecare subiect în parte; diferenţele
de la un subiect la altul pot provoca erori (imaginaţi-vă doar situaţia unui examen oral; condiţia
de evaluare este diferită pentru subiectul care răspunde la 8 dimineaţa de cel care răspunde la 8
seara).
Reacţia subiectilor la situaţia de măsurare este diferită; spre exemplu, în cazul unui
interviu de selecţie, o diferenţă importantă în rezultat se poate datora familiarităţii cu situaţia de
selecţie (ne putem aştepta la diferenţe între un subiect pentru care este primul interviu din viaţa
lui şi un subiect pentru care este al 10-lea şi datorită experienţei anterioare diferite).
Principala problemă în cazul în care folosim pentru prima dată o metodă de măsurare este
faptul că nu cunoaştem ponderea acestor erori posibile în rezultatul obţinut. Să ne amintim că noi
obţinem doar un scor, care conţine toate aceste erori; deci nu le putem separa. Soluţia este să
începem cu o evaluare calitativă a erorilor posibile. De cele mai multe ori o astfel de primă
evaluare calitativă e uşor de obţinut prin aplicarea de câteva ori a instrumentului de măsurare pe
un număr mic de subiecţi. Pentru exemplificare, pe CD am inserat 4 astfel de cazuri înregistrate
video (2 subiecţi diferiţi evaluaţi fiecare cu aceleaşi sarcini).
O astfel de primă evaluare calitativă consumă puţin timp şi permite depistarea celor mai
importante dintre erorile care pot afecta rezultatele măsurătorilor. Odată identificate erorile,
putem studia cauzele lor şi să cautăm soluţii de eliminare sursei erorii sau reducere a mărimii
efectului lor.

3. TESTUL CA ȘI EXEMPLU A MĂSURĂRII


În prima aproximaţie, testul este un gen de experiment standardizat . Noţiunea de test psihologic
ar putea fi sumar ilustrată recurgând din nou la exemplul unei situaţii de aşteptare puse sub
semnul unei tensiuni nervoase. În esenţă, o situaţie de aşteptare în forma sa acută împinge la
limită conflictul dintre excitaţie şi inhibiţie, punând în relief diferenţe individuale de comportare.
Un test este un mijloc de evaluare a persoanei în raport cu anumite repere de comparaţie. O
situaţie obiectivă capătă caracteristicile unui test psihologic, atunci când pune în evidenţă în chip
concludent diferenţe individuale între oameni şi permite evaluarea acestor diferenţe. Dacă
studiem, de pildă, un grup numeros de persoane într-o situţie tipică de aşteptare, putem ajunge la
o clasificare a persoanelor, la o tipologie având la bază echilibul proceselor nervoase.O asemenea
tipologie oferă un cadru de clasificare, pe baza căruia putem situa ulterior o persoană sau alta la
rubricile stabilite, pornind de la indici de comportament înregistraţi în condiţii identice.În cadrul
testului situaţia, odată precizată, trebuie menţinută constantă.
Tot aşa, dacă alcătuim un grupaj de probleme de judecată, prezentate în formă grafică sau
verbală şi le aşezăm într-o ordine de dificultate crescândă, putem obţine un test de gândire pe
baza unor tatonări practice. Este vorba de aplicarea acestui lot de probleme bine alese la un grup
reprezentativ de persoane având aceeaşi vârstă şi formaţie şcolară. Pe baza punctajelor constatate
se vor preciza anumite repere pe o scală ordinală, care să indice nivele diferite de capacitate
intelectuală în domeniul respectiv.O asemenea scală de repere numerice, stabilite pe un grup de
referinţă, devine un fel de etalon la care raportăm rezultatele individuale obţinute ulterior de o
persoană sau alta.
Testul psihologic reprezintă – după P. Pichot – “o situaţie experimentală standardizată,
servind drept stimul unui comportament. Acest comportament este evaluat printr-o comparaţie
statistică cu acela al unor indivizi plasaţi în aceeaşi situaţie, ceea ce permite clasificarea
subiectului examinat fie cantitativ, fie tipologic”. Prin conţinutul său , testul acoperă practic
numai un fragment din situaţiile reale; el constituie întotdeauna numai un decupaj din activitatea
generală a subiectului. În termeni mai precişi :”Un test psihologic este, în esenţă, o măsură
obiectivă şi standardizată a unui eşantion de comportament”.Această caracterizare enunţă
totodată o constatare, dar şi o cerinţă. Dacă se urmăreşte, spre exemplu, să se determine
vocabularul unui copil la o anumită vârstă, se va utiliza în acest scop o listă de cuvinte, alese la
întâmplare din dicţionar sau alese după anumite criterii, astfel încât să constituie un eşantion
reprezentativ. Rezultatul la acest test trebuie să oglindească vocabularul general al copilului
pentru a putea considera nota sau cota obţinută drept un indicator real.
În această ordine de idei, cu greu s-ar mai putea numi, de pildă, “problemă de imaginaţie”
o activitate mecanică de compunere de cuvinte din 3 – 4 litere date, aşa cum
s-a propus cândva. Simplificarea situaţiei şi a activităţii în probele psihologice nu trebuie să
depăşească o limită,dincolo de care se pierd notele definitorii ale fenomenului psihic examinat.
Orice test psihologic concretizează cunoştinţele dobândite în cercetarea psihologică
referitoare la domeniul respectiv (inteligenţă, creativitate, aptitudini tehnice etc.). Cum aceste
cunoştinţe se îmbogăţesc necontenit, înseamnă că şi probele psihologice urmează să fie mereu
amendate, încorporând achiziţiile cercetării ştiinţifice. Utilizarea unui test, pe lângă tehnicitatea
aplicării, presupune cunoaşterea datelor psihologice care fundamentează proba şi permite
interpretarea corectă a rezultatelor. Cum este şi firesc, aplicarea testelor impune o competenţă
precisă, care îmbină o anumită tehnicitate cu fineţea observaţiei.
O precizare este esenţială: testul, ca mijloc de evaluare a prestaţiei sau conduitei umane,
se elaborează pe bază statistică. Rezultatul obţinut de o persoană la o probă standardizată, capătă
semnificaţie prin raportarea sa la rezultatele obţinute de un grup mai larg – grupul de referinţă –
prin examinarea căruia în condiţii identice se stabileşte un tabel de norme sau o tipologie. Aşadar,
un test psihologic este inseparabil de tabelul de norme sau cadrul de clasificare oferit de o
tipologie. Situarea persoanei examinate în acest cadru de clasificare – expresie a grupului de
referinţă – constituie scopul final al testării.
Pentru a exemplifica aspectele prezentate ne oprim la un test verificat în practică, numit
“Matrici progresive”, care a fost propus de J. C. Raven . Testul se compune din 60 de probe
simple grupate în cinci serii de dificultate crescândă. Fiecare probă elementară – numită şi item –
constă dintr-un desen sau “matrice”, care aminteşte noţiunea algebrică de matrice. Este vorba de
un grupaj de figuri, dispuse pe linii şi coloane, în interiorul căruia anumite relaţii sau criterii de
organizare a elementelor pot fi desprinse. Fiecare matrice comportă o lacună, un termen de
completat. În figură este redat un model de acest gen. Subiectului i se cere să examineze matricea
de bază şi să decidă care din figurile ataşate (în partea de jos a planşei) se potriveşte pentru a
completa desenul. Cota globală a testului rezultă din totalizarea răspunsurilor exacte.

Figura 2.2. Item din testul “ Matrici Progresive Standard “

Evident, pentru a răspunde corect, subiectul trebuie să desprindă anumite relaţii sau
criterii care stau la baza organizării interioare a matricii (pe linii şi coloane) şi să aleagă figura ce
întregeşte în mod logic desenul. Cu alte cuvinte, subiectul trebuie să analizeze materialul, să
compare, să combine, uneori să generalizeze, adică să facă efort de gândire. Rezolvarea unei
probe elementare este foarte uşoară, în timp ce soluţionarea altora este un fenomen rar.
Compoziţia testului a fost inspirată de analiza teoretică a inteligenţei.
În sfârşit, o remarcă finală: testele psihologice au creditul de a fi mijloace de măsură. Or,
în psihologie, putem vorbi de măsurare numai într-un sens foarte larg. Experienţa psihologică nu
ne furnizează decât relaţii de ordine (J.Piaget). În psihometrie, convertim aceste relaţii de ordine
în distanţe sau intervale având conştiinţa că realizăm doar o aproximare ce poate fi practic
suficientă în numeroase situaţii. Altfel, cine ar putea admite, de exemplu că “un elev de zece” s-ar
putea compune din “doi elevi de cinci,”deşi 5 + 5 = 10. Fenomenele psihice nu sunt aditive, în
psihologie nu există unităţi de măsură ca în fizică. În lipsa unităţilor obiective de măsură se alege
o metrică arbitrară, care poate satisface din punct de vedere practic. Când psihologul francez
A.Binet lansa prima “Scară metrică a inteligenţei”, el observa cu mult bun simţ: “…calităţile
intelectuale nu se măsoară ca lungimile, ele nu sunt superpozabile”; scara metrică permite “un
clasament ierarhic între inteligenţe diferite; şi pentru nevoile practicii acest clasament echivalează
cu măsurare”.

Rezumat
Apariţia psihologiei experimentale este asociată cu înfiinţarea de către Wilhelm Wundt în
anul 1879 a primului institut de psihologie la Leipzig. Aici s-au format promotorii acestui
domeniu pe plan mondial. Observaţia ca metodă permite o clasificare a informaţiei Astfel se pot
prefigura relaţii cauzale a căror investigare este posibilă ulterior pe bază de experiment.
Alcătuirea unei grile de observaţie constituie un proces sistematic în care se realizează iniţial
delimitarea categoriilor, urmată de aplicare şi determinarea fidelităţii (pe baza coeficientului
Cohen).
Investigaţia experimentală constituie un demers sistematic ce implică o serie de etape:
observaţia sau analiza de caz, stabilirea ipotezelor, proiectarea design-ului experimental, selecţia
subiecţilor, experimentarea propriu-zisă şi analiza-interpretarea datelor. În funcţie de numărul
variabilelor independente implicate, design-ul experimental poate fi: de bază (este implicată o
singură variabilă independentă) sau factorial (sunt implicate mai multe variabile independente). O
formă particulară a design-ului factorial este design-ul mixt în care cel puţin una dintre variabile
este clasificatorie. Testul constituie un experiment standardizat. Spre deosebire de metoda
experimentală în care se evidenţiază o serie de legităţi, testul este utilizat în vederea evaluării
diferenţelor interindividuale.
Rezumat
Rezumând, din cele prezentate putem înţelege importanţa pe care identificarea şi corectarea
erorilor de măsurare o are în cercetare. Principalele căi de acţiune sunt: separarea erorilor
sistematice de cele aleatoare, urmată de identificarea cauzelor şi eliminarea efectelor erorilor
sistematice, respectiv reducerea amplitudinii erorilor nesistematice.

Bibliografie minimală pentru acest modul


READER Curs Psihologie Experimentală și Metode de Analiză a Datelor

Bibliografie facultativă
Henri Poincaré (1986) Ştiinţă şi ipoteză, Editura Ştiinţifică şi Enciclopedică, Bucureşti.
G. King, R. Keohane, S. Verba (2000) Fundamentele cercetării sociale, Editura Polirom,
Bucureşti.
David Klahr (2000) Exploring Science., MA: MIT Press, Cambridge.
Miles, M. B., Huberman, A. M. (1984) Analyzing qualitative data. A source book for new
methods, Beverly Hills, C. A. Sage.
Modulul 3
Designuri de cercetare descriptivă

Scopul modulului: Familiarizarea studentului cu conceptele de bază ale metodologiei cercetării


descriptive în psihologie.

Obiectivele modulului: La finalul acestui modul, vor fi capabili:

• să identifice principalele componente ale demersului de


cercetare descriptivă
1.1 Introducere
• să definească principalele carcateristici ale designurilor de
cercetare observațională și de ”tip survey”
• să descrie caracteristicile metodei observaţiei şi modul de
elaborare a unui studiu cu grile de observaţie
• să identifice diferitele metode de eșantionare probabilistice
și non-probabilistice
• să definească diferitele tipuri de planuri de cercetare pentru
studiile de ”tip survey”

3.1 STUDIUL OBSERVAȚIONAL


O cercetare concretă îşi are originea – de regulă- într-un proces de observaţie. După cum
spune Piaget într-un interviu: “Pleci de la observaţie, descoperi un fapt interesant; urmează să
reproduci apoi situaţia respectivă facând să varieze factorii implicaţi… Aici începe
experimentarea”.
Observatorul are şansa de a descoperi un fapt inedit sau demn de atenţie numai dacă
inspectează realul, fiind înzestrat cu un fond larg de cunoştinţe, fond de ipoteze latente, în măsură
să înlesnească formularea unei ipoteze locale, care să fie supusă experimentării şi verificării.
(Fraisse,1982).
Demersul experimental, comportă, în genere, o suită de momente sau faze: observaţia,
stabilirea ipotezelor, experimentarea propriu-zisă şi analiza/interpretarea datelor. Fireşte nu orice
cercetare psihologică urmează acest ciclu complet; unele se limitează la observaţie şi la analiza
datelor, altele constau din experiment şi interpretarea materialului obţinut ş.a.m.d. Aşadar,
anumite momente sau faze pot dobândi o semnificaţie autonomă.
Ca metodă de investigaţie, observaţia nu este reductibilă la simpla impresie asupra unui
fapt sau a unei persoane. În observaţia curentă, adeseori, reprezentări colective sau clişee însuşite
de individ din grupul de apartenenţă devin într-un fel filtru sau ecran în abordarea faptelor, a
persoanelor din ambianţă. Datorită acestora, individul ia act din câmpul perceptiv, din contactele
cu alţii, numai de anumiţi indici sau însuşiri, ignorând alte aspecte; însăşi percepţia devine
selectivă, ca să nu mai amintim de interpretarea datelor observaţiei pe linia acestor reprezentări,
uneori clişee.

Exemplu:
Unui lot de cadre didactice( în număr de 164) i s-a cerut să facă descrierea concisă a elevilor
din clasele cu care lucrează. Pentru a uşura sarcina, li s-au oferit şi mijloace de expresie strict
necesare -atribute sau propoziţii descriptive scurte, având ataşate scale cu gradaţii - care să se
refere la inteligenţă, memorie, mod de exprimare, sârguinţă, dexteritate, etc., precum şi la
trăsături de caracter, de personalitate. S-au obţinut în acest fel peste 1500 de caracterizări sau
profile ale elevilor, material care a fost supus apoi analizei ( M.Gilly,1972 ).
Constatarea: atributele care diferenţiază elevii, în profilele întocmite de profesori - sunt cele
legate nemijlocit de reuşita şcolară: inteligenţă, memoria, atenţia, sârguinţa, vocabularul, stilul de
lucru. Dincolo de aceste aspecte, contururile personalităţii elevului se şterg; el rămâne parcă un
“necunoscut”; portretele încep să se asemene destul de mult între ele, trăsăturile fiind prea puţin
diferenţiate. Copilul este privit adesea prin prisma statutului său şcolar, în esenţă, prin prisma
unei optici profesionale care face ca datele să fie selectate şi filtrate în lumina exigenţelor
profesiunii didactice. Spre exemplu, un copil este disciplinat dacă stă cuminte în bancă, dacă nu
dă de lucru profesorului. Dar conceptul de disciplină nu are doar un “conţinut negativ”; în primul
plan trebuie să fie ceea ce face, deci activitatea elevului, şi nu doar inhibiţia sau reţinerea ei. Pe
de altă parte, conformismul şi docilitatea sunt preţuite de profesor, dar repudiate de elev.
Alături de observaţia curentă, ocazională, practicată de profesor în clasă, de inginer în
intreprindere, de ziarist în viaţa socială etc., distingem observaţia sistematică, străină de clişee
obişnuite, care urmăreşte înregistrarea obiectivă a faptelor, înscriindu-se într-un program explicit,
ce restrânge câmpul studiat şi impune selectarea datelor relevante.
Strict vorbind, observaţia este percepţia unui eveniment, a unei conduite, a unui document
(Fraisse, 1982). Dar ea nu se reduce practic la simpla “lectură” a faptului brut, ci se prelungeşte
într-un act de clasificare, de încadrare a informaţiei în anumite concepte şi de anticipare a unor
relaţii.
Acelaşi autor atrăgea atenţia asupra dualităţii modului de percepţie asupra propriei
personalităţi. Omul este capabil – în opinia autorului – de o dublă cunoaştere: una, prin care el
sesizează propriile gânduri, sentimente, senzaţii etc, şi a doua, prin care se vede pe sine trăind şi
acţionând aşa cum îi vede trăind şi acţionând pe ceilalţi şi, sub acest unghi, el se cunoaşte pe sine
în acelaşi chip în care îi cunoaşte pe alţii.
Autoobservaţia este observaţia aplicată asupra propriei persoane, ceea ce înseamnă nu
numai (introspecţia) cunoaşterea gândurilor, sentimentelor şi aspiraţiilor intime, ci şi cunoaştera
prin activiatea proprie, din succese şi eşecuri, din actele relaţiilor cu semenii, din încercările vieţii
etc. Introspecţia este numai o latură a autoobservaţiei.
Autoobservaţia poate fi valorificată în forma unor itemi de chestionar. După cum se poate
vedea din exemplul de mai jos, în acest caz subiectul este solicitat să aprecieze gradul de acord cu
o serie de afirmaţii, răspunsul său fiind cuantificat cu ajutorul unei scale numerice. Răspunsul său
va presupune accesul la datele autoobservaţiei.

Aproape Uneori Adesea Aproape


niciodata totdeauna
Sunt înclinat sa iau lucrurile prea în serios. 1 2 3 4
Sunt o persoana ferma, constanta. 1 2 3 4
Sunt calm, impasibil si su “sânge rece”. 11 2 2 3 3 5 4

Fig. 3.1. Exemplu de itemi din cadrul unui chestionar de anxietate:

3.1.1 Instrumente de observaţie. Pe baza documentării prealabile şi a unei anchete preliminare


se schiţează o grilă de observaţie, adică o listă de rubrici care să ofere cadrul de clasificare a
datelor brute. O grilă de observaţie nu este indicat să cuprindă, în medie, mai mult de 10
categorii, deoarece nu se poate opera simultan cu mai multe rubrici de clasificare. Aceste
categorii trebuie să fie disjuncte şi să epuizeze aspectele principale ale fenomenului. Lista lor se
stabileşte pe baza unui material empiric strâns în faza preliminară şi condensat în concepte.
Avantajul acesteia este de a oferi acelaşi cadru de referinţă unor observaţii diferite.

Exemple:
1o.Bakeman & Brownlee (1980) au studiat comportamentul de joc la preşcolari. Pe baza
unui studiu prealabil, ei au determinat cinci categorii de joc, ce au constituit cadrul de clasificare
pentru observaţia efectuată. Astfel, reacţiile subiecţilor au fost încadrate în una dintre următoarele
tipuri:
Neocupat: copilul nu face nimic, sau îi priveşte pe ceilalţi;
A fi împreună: copilul se află laolaltă cu alţi copii fără a fi ocupat cu vreo activitate;
Joc solitar: copilul se joacă singur dar nu este interesat sau afectat de activităţile celorlalţi
copii;
Joc paralel: copilul se joacă alături de alţi copii, dar nu se joacă cu ei;
Joc colectiv: copilul se joacă cu ceilalţi, şi participă la activităţile de joc organizat, ca
membru al grupului.
Observaţia era structurată atât în funcţie de timp cât şi de vârsta subiecţilor. (tabelul 1.1)
În cadrul cercetării, autorii au fost în mod particular interesaţi de secvenţa sau ordinea în
care copiii s-au angajat în diferite comportamente. Ei au constatat, de exemplu că rareori copiii au
trecut de la comportamentul “neocupat”, la cel de “joc paralel”. De asemenea, odată cu avansarea
în vârstă, ei au trecut frecvent de la jocul paralel la cel colectiv, ceea ce indică faptul că jocul
paralel reprezintă o stare tranzitorie în cadrul dezvoltării. Grila de observaţie expusă poate fi
utilizată atăt în plan sincronic (transversal), cât şi diacronic (longitudinal).

Tabel 3.1 Grila de observaţie a jocului la preşcolari


COMPORTAMENTE
Vârsta Durata Neocupa A fi Joc Joc paralel Joc
observaţi t împreună solitar colectiv
ei
1 min
2 min
3 min
Subiect 4 min
1 --------
(4 ani) 10 min
1 min
S 2 min
ubiect 2 3 min
(5 ani) 4 min
-----------
10 min
--------- -----------

2o. Pentru a identifica un tip temperamental sau altul căruia îi aparţine o persoană vom
putea găsi în activitatea şi în viaţa cotidiană situaţii relevante. De exemplu, o situaţie tipică de
aşteptare, o situaţie competiţională, o activitate cuprinzând un element imprevizibil şi de
dificultate (de pildă, un traseu mai greu de excursie), o sarcină de reprezentare a colectivului într-
o confruntare (de opinii) sau în faţa autorităţii etc, toate acestea constituie situaţii-test pentru că
pun în evidenţă particularităţi sau diferenţe individuale uşor de clasificat.
Asemenea situaţii cuprind indicii de temperament pe care-i putem sistematiza prin
condensarea experienţei într-o grilă de observare a comportamentului (Tabelul 1.2), arătând în
dreptul faptelor de conduită ipotezele plauzibile cu privire la categoria prezumtivă de
temperament. Se notează cu “XX” clasificarea, respectiv ipoteza cea mai plauzibilă, şi cu “X”
încadrarea doar plauzibilă în studierea unui caz sau altul. Un asemenea document este susceptibil
de îmbunătăţire continuă. Prin însumări pe coloane decidem asupra apartenenţei la un anumit tip
sau altul. Preocuparea de cuantificare este aici minimă.

Tabel 3.2. Grilă de observare a comportamentului *


TEMPERAMENT
FAPTE DE CONDUITĂ
Cole Sang Fleg Melan-
-ric vinic - colic
mati
c
Doreşte să fie primul care încearcă, îi place parcă să X XX
înfrunte necunoscutul
Se decide greu pentru acţiune, are gesturi şovăielnice X XX
Îşi pierde răbdarea aşteptând să-i vină rândul, se agită XX X
Este vădit emoţionat înainte de probe X XX
Precipitat în acţiune, se corectează cu viteza actului reflex, XX
execuţia lipsită de acurateţe îndeosebi spre sfârşit
Execută activitatea în ritm lent, dar cu destulă acurateţe XX X
Reacţii verbale abundente, se îndeamnă pe sine (“haide!”, X XX
“nu te lăsa!”, “acuma-i acum!”)
Reacţii motorii abundente, devine nervos când greşeşte, XX
apar violenţe verbale, plusul de energie se descarcă cu
fiecare act
Execută activitatea/proba în tăcere, gesturile şi cuvintele XX XX
sunt aproape absente
Execută proba cu încordare nervoasă, mobilizarea excesivă XX
în raport cu sarcina; tensiunea, plusul de energie se
descarcă la încheierea acţiunii
Tendinţa de supraevaluare proprie şi subestimare a sarcinii XX X
Tendinţa de supraestimare a sarcinii, dar de subapreciere XX
personală
În caz de eşec nu se dă bătut, persistă, reia proba/activitatea XX X
de la capăt încurajându-se; duce la bun sfârşit sarcina
În caz de eşec se pierde, are nevoie de încurajare pentru a XX
relua lucrul
Cu fiecare succes exclamă de bucurie, bate din palme X XX
Rămâne indiferent la reuşită, schiţează doar un zâmbet XX X
Abandonează la primul eşec, se închide în sine şi “se XX
blochează” total
Abandonează când eşecurile se acumulează XX X
Tăcut în momentele critice (dificile) prezintă reacţii XX
vegetative, dă semne de oboseală
Derută emoţională sub presiunea timpului X XX
După terminarea lucrului relatează colorat cele petrecute X XX
Eşecul produce un “halo afectiv” de durată XX

După un exerciţiu simplu de aplicare a acestei grile de observaţie, se poate evidenţia


acordul semnificativ între evaluatori. Acest exemplu ne orientează asupra noţiunii de fidelitate
definită prin gradul de consens dintre evaluatorii ce utilizează acelaşi instrument. În cazul
utilizării observaţiei ca metodă de cercetare autonomă, fidelitatea ei se va verifica pe baza
coeficientului de concordanţă Cohen (K).

Temă de reflecţie nr. 4


Prezentaţi comparativ asemănările şi diferenţele instrumentelor de evaluare
psihologică (grilă de observaţie) şi instrumentele tehnologice de evaluare şi
observaţie utilizate în alte ştiinţe. Pentru aprofundarea subiectului vezi în
READER documentul:
Bibliografie 6.pdf - Derry (1999) What Science Is and How It Works – cap. 3.
3.1.2 Coeficientul de concordanţă K (Cohen)

Coeficientul de concordanţă interevaluatori a fost propus de Cohen pentru a verifica


fidelitatea evaluării unor comportamente prin grile de observaţie. Se utilizează în situaţia în care
grila de observaţie folosită are la bază o scală nominală. În cazul în care grila de observaţie are la
bază o scală de măsură ordinală sau hiperordinală, fidelitatea ei se verifică prin coeficientul de
concordanţă a rangurilor (Kendall) sau prin coeficientul de corelaţie parametric (Pearson).
Exemplu:
Belsky & Rovine (1988) au investigat relaţia dintre timpul petrecut de copil în creşă şi
modul de dezvoltare a ataşamentului copil–părinte. Ei au folosit în acest sens o grilă de observaţie
a comportamentului matern (securizant - în sensul întăririi ataşamentului, sau insecurizant). Doi
observatori au verificat grila, observând independent, într-un mod sistematic (la intervale de 10
minute) o pereche mamă-copil. S-au realizat în total 20 de observaţii rezultatele obţinute fiind
notate mai jos sub forma celor două grile de observaţie.

Observatorul 1 Observatorul 2
nr. obs. Secur izant Insecur izant nr. obs. Secur izant Insecur izant
1 I 1 I
2 I 2 I
3 I 3 I
4 I 4 I
5 I 5 I
6 I 6 I
7 I 7 I
8 I 8 I
9 I 9 I
10 I 10 I
11 I 11 I
12 I 12 I
13 I 13 I
14 I 14 I
15 I 15 I
16 I 16 I
17 I 17 I
18 I 18 I
19 I 19 I
20 I 20 I

Fiecare observaţie s-a realizat simultan de către cei doi observatori, pentru aceeaşi
pereche mamă –copil. Rolul observatorilor a constat în a atribui, pe baza definiţiilor grilei,
categoria “securizant” sau “insecurizant” pentru comportamentul mamei. Se poate remarca faptul
că observatorii nu pot atribui decât o singură categorie unei perechi mamă–copil la un moment
dat (cele două categorii sunt disjuncte). Se trece la calculul coeficientului K utilizând formula:

Po - Pe
K=
1 - Pe

unde Po reprezintă proporţia concordanţelor observate dintre categoriile celor doi observatori
(din numărul total de observaţii) şi Pe proporţia concordanţelor care ar putea apărea întâmplător
în cazul rezultatelor date. Pentru a înţelege Pe să ne imaginăm că cei doi observatori ar obţine
aceleaşi date, dar nu ar folosi grila de observaţie, ci ar decide la întâmplare (fară să observe
comportamentul mamei).
Pentru calculul valorilor Po şi Pe se condensează frecvenţa concordanţelor şi
discordanţelor dintre cei doi observatori în matricea de mai jos, numită matrice de concordanţe.
Prin definiţie, observaţiile se consideră concordante atunci când cei doi observatori atribuie
aceeaşi categorie unei perechi mamă – copil (adică securizant – securizant sau insecurizant –
insecurizant), şi discordanţe atunci când observatorii atribuie categorii diferite (securizant –
insecurizant sau insecurizant – securizant).

Observatorul 1
securiz. insecuriz.
Observatorul 2 securiz.
16 0
insecuriz. 1 3

Valoarea Po va fi dată de raportul dintre numărul total de concordanţe (securizant şi


insecurizant) şi numărul total de observaţii realizate:

Indicele Pe se calculează prin determinarea probabilităţii de concordanţă întâmplătoare a


alegerilor celor doi observatori. De exemplu, în acest exemplu, observatorul 1 a ales de 17 ori
opţiunea “securizant” din 20 de observaţii. Deci probabilitatea ca această opţiune să fie dată de
observatorul 1 este 17/20. Observatorul 2 a ales opţiunea “securizant” de 16 ori; probabilitatea ca
el să dea această opţiune este 16/20.
Ca urmare, probabilitatea pentru ca opţiunea “securizant” să coincidă din întâmplare este:
17 x 16
P=
20 20

Similar se calculează probabilitatea de coincidenţă pentru opţiunea “insecurizant”:

Valoarea Pe se obţine însumând cele două probabilităţi:


17 16 3 4
Pe= x + x = 0,71
20 20 20 20

Valoarea coeficientului K este deci:

0,95 - 0,71
K= = 0,83
1 - 0,71

Interpretarea coeficientului K este similară unui coeficient de corelaţie (cu valori între -1
şi +1). Este evident că din punct de vedere practic vom fi interesaţi doar de valorile pozitive ale K
(cele negative indicând o “concordanţă” inferioară celei întâmplătoare).
Calculul semnificaţiei valorilor K fiind laborios, Cohen propune valoarea – prag de 0.7
pentru coeficienţi semnificativi. Deci orice valoare K egală sau mai mare decât 0,7 este
semnificativă. În cazul nostru, valoarea calculată este 0,83, mai mare deci decât valoarea prag.
Grila de observaţie are deci o bună fidelitate.

3.2. STUDIUL DE TIP SURVEY (ANCHETA SOCIALĂ)


Un alt tip de cercetare descriptiv îl reprezintă studiul de tip ”survey” (pentru eventuale conotații
negative vom evita termenul din limba română, ancheta socială). Potrivit scopului, ca și orice altă
categorie de studiu descriptiv scopul acestui studiu este explorator, este de a descrie o situți de
fapt, de a descrie un fenomen. În domeniul cercetărilor medicale astfel de studii descriptive sunt
denumite studii epidemiologice. Scopul explicit al acestor studii este de a estima prevalența unor
boli sau afecțiuni medicale (ex. care este prevalența tuberculozi în țările subdezvoltate
economic?). În mod similar, în domeniul socio-econommic, cercetătorii își propun să
investigheze atitudini, opinii față de un anumit produs sau opțiuni politice. În cazul cercetării
psihologice metodologia este similară cercetărilor medicale sau socio-economice, ceea ce se
schimbă este fenomenul studiat, întrebarea nu mai este ”dacă alegerile parlamentare ar fi
săptămâna viitoare, cu ce partid ați vota?”, cercetătorii din domeniul psihologiei sunt interesați de
cartarea tipurilor de personalitate, a fcatorilor psihologici care predispun la afecțiuni mentale sau
de sănătate, etc. Sumarizând, putem afirma că studiul de tip survey este un studiu descriptiv care
ăși propune să ofere informații la starea actuală sau evoluția unui fenomen psihologic, într-o
anumită populație.
Prima întrebare la care trebuie să ofere un răspuns cercetătorul este, ce înseamnă populația
și cum să o definim în cadrul studiului. În limbajul uzual termenul de populație este sinonim
cetățeniei, cel mia frecvent asociem acest termen cu populația unei țări. În termenii biologiei,
populația dobândește și alte semnificații, oarecum totuși legată de limite geografice sau
geopolitice (de ex. populația de zimbrii din România sau din Carpații Meridionali). În termenii
cercetării conceptul de populație reprezintă totalitatea indivizilor la care se aplică concluzia
formulată în baza cercetării. Ca urmare pentru orice cercetare de tip survey, primul pas esențial al
cercetării este stabilirea populației. Aceasta de obicei reprezintă specificarea uneid efiniții, în
baza căreia oricine poate decide cine este și cine nu este parte a populației, respectiv cui se aplică
și cui nu se aplică concluzia formulată.
În același timp modul în care definim populația va avea impact asupra gradului de
generalitate al concluziei formulate. Pentru a oferi un exemplu, să presupunem că vrem să
investigăm fenomenul anxietății competiționale la sportivi. Să presupunem că deocamdată nu
cunoaștem aploarea fenomenului la sportivi și nici corelatele acestuia. Primul pas este să oferim o
definiție a populației, adică să stabilim un set de criterii în baza căreia să putem decide cine este
sportiv sau nu? Cine este sportiv? De ex. o persoană se antrenează în mod regulat, să zicem de
cinci ori pe săptămână, poate fi numit sportiv? Sau a fi sportiv înseamnă să fi legitimat la un club
sportiv și să fi angrenat în viața competițională? Sau dacă ești doar legitimat fără a participa la
competiții înregistrate, mai poți fi inclus în categoria ”sportiv”? Chiar și la o problematizare
superficială se observă că specificarea unei definiții, care să delimiteze o populație nu este o
sarcină ușoară. O posibilă definiție ar putea fi: totalitatea indivizilor legitimați la un club sportiv,
care și-au început activitatea competițională de cel puțin un an. Observăm că această definiție
poate include sportivi de diferite vârste, de 13 sau 25 de ani (sau chiar 40 de ani) în funcție de
specificul sportului. Bine înțeles putem modifica definiția inițială, am putea include criteriul
vârstei, de ex. sportivi care au împlinit 18 ani. În urma acestei adăugiri definiția devine mai
specifică, iar populația devine mai restrânsă (mulțimea sportivilor legitimați care au împlinit 18
ani este mai redusă decât toți sportivii legitimați cu activitate competițională). Putem reduce și
mai departe populația noastră adăugând noi criterii, de ex. de sex masculin, înscriși la o facultate
cu profil sportiv (educație fizică și kinetoterapie). Ceea ce trebuie să conștientizăm este că modul
în care definim populația (stabilind criterii de includere și excludere) limitează gradul de
generalitate al concluziilor formulate în urma studiului. Dacă populația noastră țintă este cea
definită prin prima definiție, concluzia formulată va avea un grad mai mare de generalitate
comparativ cu studiul efectuat pe populația difinită prin ultima definiție.
Un aspect important al populației definite este caracterul dinamic al acesteia. O populație
o dată definită nu rămâne stabilă, în sensul că membrii lui sunt în continuă schimbare, unii dintre
sportivi își întrerup viața sportivă (adică nu mai sunt legitimați), în timp ce alți indivizi obțin
legitimații la cluburi sportive sau își încep activitatea competițională. Această mișcare este
continuă, noi vorbim de o anumită populație, însă trebuie să fim conștienți că în funcție de
specificul criteriilor stabilite, această entitate se schimbă, mai repede sau mai lent. Din acest
punct de vedere populația țintă apare ca o entitate mai abstractă, prin studiul nostru noi nu facem
altceva decât să segmentăm această ”mișcare” și să developăm niște imagini statice, de parcă am
urmării cadru cu cadru mișcările unui sportiv înregistrat pe o bandă de film.
Un alt aspect important este diferența existentă între populația țintă și cadrul de
eșantionare. În momentul în care vrem să abordăm populația vom avea nevoie de niște pârghii
care să ne permită acest acces. Dacă ne gândim la definiția inițială (totalitatea indivizilor
legitimați la un club sportiv, care și-au început activitatea competițională de cel puțin un an)
vom observa că aceasta nu include ca și criteriu limite geopolitice. Ca urmare, populația țintă
(populația teoretică) include toți sportivii de pe glob. Întrebarea este, care este șansa să includem
în studiu sportivi din Mongolia sau Mexic? Teoretic este posibil să dispunem de resurse
suficiente pentru extinde studiul (de ex. studii transculturale își propun acest scop), dar cel mai,
frecvent studiile sunt limitate de căile de acces spre populația țintă. Întrebare esențială este, cât de
departe se situează populația țintă de populația la care am acces. Oare există segmente ale
populației țintă, indivizi al căror șansă este mai mică de a fi incluși în studiu? Dacă discrepanța
dintre cele două populații este mult prea mare, atunci concluziile formulate vor avea din nou, un
grad de generalitate mai redus. În mod eronat vom extinde concluziile la întreaga populație țintă,
în condițiile în care noi am avut acces doar la un segment (mai redus sau mai extins) al acestei
populații.
În practica cercetărilor de ”tip survey” astfel de cadre de eșantionare sunt: lista abonaților
la telefon, lista plătitorilor de facturi electrice, etc. Oricare ar fi cadrul de eșanionare pe care îl
alegem, întotdeauna va trebui să ne punem întrebarea, în ce măsură cadrul de eșanionare existent
(cel pe care îl avem) oferă șanse egale tuturor membrilor populației de a fi implicați în studiul
nostru? Nu putem afirma ceva despre toți sportivii legitimați la un club sportiv, care și-au început
activitatea competițională de cel puțin un an, în contextul în care noi investigăm un anumit
număr de sportivi din Cluj Napoca. În acest caz, o astfel de exindere al gradului de generalitate al
concluziilor devine fezabilă (dar și în acest caz, frecvent doar ca ipoteză care solicită verificare
ulterioară) doar în contextul în care, în baza cunoștințelor existente putem susține că Populația
sportivilor din Cluj Napoca nu diferă de cea a sportivilor din alte zone ale țării sau ale lumii. În
cazul în care această diferență există, de ex. Cluj Napoca ar fi un pol de excelență sportivă din
țară (așa cum Kenya este un pol de excelență al alergării de fond) concluziile noastre efectuate pe
un grup de participanți din acest segment al populației nu mai poate fi generalizată nici măcar la
populația sportivilor din întreaga țară.

Temă de reflecţie nr. 5


Definiți o populație teoretică și identificați un cadru de eșantionare care să vă
permită acces la această populație. Identificați acele segmente ale populației
inițiale care, ținând cont de cadrul de acces, vor avea șanse mai reduse de a
participa la studiu.

Până acum am discutat despre populație și modul în care putem accesa această populație, eludând
faptul că în realitate noi nu implicăm în studiu niciodată toată populația. Grupul de participanți
selectați pentru participare la studiu este eșantionul. Nevoia de esantionare are explicatii
practice: i) populațiile definite sunt extinse, nu avem posibilitatea de a include toți indivizii
populației în studiu; ii) nu este doar mare ca volum, dar așa cum am văzut populația este în
continuă schimbare, dacă am tot aștepta ca populatia “sa se așeze” nu am derula niciun studiu.
Din punct de vedere al corectitudinii concluziilor, într-un studiu de ”tip survey” este esențial ca
eșantionul selectat să fie reprezentativ, adică să includă toate ”tipologiile” de indivizi care
compun populația, în procentul în care acestea sunt prezente în populație. Dacă populația țintă
este compusă 80% femei și 20% bărbați, atunci și eșantionul nostru ar trebui să respecte acest
procent. În cazul în care eșantionul nostru nu respectă acest procent (ex. cadrul de eșantionare nu
a fost corect ales, metodologia de colectare de date nu este potrivită, etc) eșantionul va fi unul
distorsionat, adică nu ne va livra informații corecte despre populația țintă. Ca urmare, dacă ne
interesează să investigăm printr-un studiu de ”tip survey” fenomenul deciziilor manageriale, iar
populația țintă include mai mulți bărbați decât femei, pentru a putea generaliza rezultatele
obținute la populația țintă, eșantionul trebuie astfel selectat încât să fie reprezentativ din acest
punt de vedere (adică să replice procentele existente în populație). De obicei, în studiile de ”tip
survey” există mai multe criterii de reprezentativitate precum, sex, vârsta, etnia, sau nivel de
școlarizare fiind doar câteva dintre cele mai frecvent utilizate. Criteriile de reprezentativitate
menționate caracterizează majoritatea studiilor sociologice, politologice sau de marketing, însă în
cazul psihologiei dincolo de aceste criterii frecvent suntem interesați de reprezentativitate și din
punct de vedere al altor variabile, precum inteligența (sau alte trăsături psihologice precum
îngrijorare sau anxietate). Deosebirea dintre variabila inteligență și alte variabile precum sex sau
vârstă, este că în timp ce știm (sau putem afla relativ simplu) cum arată populația din punct de
vedere al celor din urmă, ne este mai greu să aflăm cum arată populația din punct de vedere al
inteligenței. Dacă ne uităm la datele ultimului recensământ, ne va fi ușor să vedem dacă un
eșantion este distorsionat din punct de vedere al genului, comparând raportul bărbați/femei din
eșantion cu același raport din populație. Întrebarea este, oare cum putem să ne asigurăm dacă din
punct devedere al inteligenței eșantionul nostru este sau nu reprezentativ, din moment ce nu
dispunem de date similare recensământului care să ne ofere aceste informații? Din acest punct de
vedere, de multe ori singurul indiciu al reprezentativității eșantionului rămâne metoda de selecție
utilizată. Ca urmare, întrebarea este prin ce metodă de selecție putem garanta reprezentativitatea
unui eșantion pentru o anumită populație. Răspunsul la această întrebare este foarte clară, nu
există garanție că un eșnation va fi reprezentativ pentru o anumită populație, ceea ce putem face
este să urmăm o metodologie care crește șansa ca eșantionul să fie reprezentativ. În principiu
există două categorii de selecție, selecție probabilistică și selecție non-probabilistică. În cazul
selecției probabilisitice criteriile de selecție al unui individ sunt fundamentate pe calcul (mai
precis estimări) probabilistic, adică estimări ale probabilității ca un individ să fie selectat. În cazul
selecțiilor non-probabilisitice, criteriul probabilisitic nu există, cercetătorul selectează subiecți pe
baza altor criterii, decât cele probabilistice (ex. selectăm subiecți din rândul prietenilor, deoarec la
ei avem acces – eșantion de conveniență). Diferența majoră dintre cele două tipuri de selecție este
că în timp ce în cazul eșantioanelor probabilisitice putem estima probabilitatea de a fi
reprezentativ din punct de vedere al unei variabile, în timp ce în cazul unui eșantion non-
probabilistic acesta este mult mai dificil (sau chiar imposibil).
Oricare ar fi criteriul selecției, planul de eșantionare se aplică unor unități, denumite
unități ale eșantionării, care nu întotdeauna este individul. În cazul unor cercetări din domeniul
psihologiei sănătății, putem să investigăm comportamente care mențin sănătatea fizică și mentală
la școlari, având ca și unitate de selecție a eșantionului școala sau clasa și nu individul. Cazul în
care o clasă a fost selectată pentru participare la studiu, toți elevii clasei vor fi invitați să
participe.
Revenind la metodele de selecție, cea mai cunoscută este eșantionarea randomizată
simplă. Este o metodă de selecție probabilistică, care se realizează prin asignarea unor
probabilități egale fiecărei unități de selecție. Să ne închipuim că introducem denumirea tuturor
unităților de selecție (indivizi, școli, clinici sau organizații) într-un bol și extragem întâmplător un
anumit număr de unități. Dacă luăm un zar obișnuit, cu șase fețe și ne propunem să aruncăm acest
zar de 1000 de ori, foarte probabil frecvențele de apariție a diferitelor fețe vor fi egale (sau foarte
apropiate). Dar dacă stabilim să o aruncăm doar de 6 ori, oare fiecare față va apărea o singură
dată? Cei care am derulat astfel de experimente (chiar și în contextul unui joc) știm că rareori
(probabilitatea poate fi calculată) se întâmplă ca din șase aruncări să obținem fiecare număr de la
1 la 6. La fel se întâmplă și în cazul eșantionării randomizate simple, dacă eșantionul este
suficient de mare, avem șansa ca fiecare categorie a populației să fie reprezentată (chiar și
categorii cu frecvență redusă) în timp ce pentru eșantioane mici probabilitatea ca în eșantion să
apară toate categoriile populației este mai redusă. Adică, șansa ca eșantioanele mici să fie
distorsionate este mare, dar va fi și mai mare pentru categoriile al căror frecvență este redusă în
populație. Motiv pentru care în practica cercetării utilizăm o variatate al eșantionării randomizate
simple, eșantionarea randomizată stratificată. Potrivit acestei strategii populația este
stratificată în baza unor criterii de stratificare, de ex. gen și vârstă (bărbați-1-15 ani, bărbați -16-
25 ani, bărbați 26-35 ani, femei-1-15 ani, femei -16-25 ani și femei 26-35 ani). Din fiecare strat
se va extrage pe principiul randomizării simple un anumit procent de unități astfel încât procentul
unui strat din eșantion să fie identică cu procentul aceluiași strat din populație. De ex., dacă
categoriile identificate în populație au următoarea frecvență: 15%, 18%, 21%, 13%, 24% și 9%
atunci la un eșantion de 100 de subiecți frecvența categoriilor va fi: 15%, 18%, 21%, 13%, 24%
și 9%.
Din punct de vedere al planului cercetării, studiile de ”tip survey” se împart în trei
categorii principale: studiu transversal, studiu cu eșantioane independente succesive și studiu
longitudinal. Categoriile sunt definite în baza criteriul timp, adică al modului în care diferitele
tipuri de studii abordează evoluția în timp al unui fenomen, de ex. dezvoltarea limbajului. Studiul
transversal presupune analiza dezvoltării limbajului prin selectarea unor eșantioane aparținând
diferitelor categorii de vârstă (ex. studiul limbajului la 6, 7 și 8 ani). În realitatea în studiu avem
trei eșantioane, indivizii dintr-o categorie de vârstă sunt independenți de participanții de cei din
restul categoriilor. În cazul studiului longitudinal același fenomen este studiat pe un singur
eșantion, aceeași participanți fiind evaluați la vârsta de 6, 7 și 8 ani. În cazul studiului cu
eșantioane independente succesive în primul an al studiului este selectat un eșantion (care
include copii de 6, 7 și 8 ani), anul următor un al doilea eșantion similar și în al treilea an, un al
treilea eșantion similar. Participanții incluși în diferitele eșantioane sunt independenți, alegerea
unui participant într-un eșantion nu influențează alegerea altor participanți în alt eșantion.
Indiferent de planul de cercetare utilizat colectarea datelor se poate derula în diferite
feluri. Putem colecta date prin: chestionare transmise prin e-mail, chestionare prin interviu direct,
chestionare prin telefon și chestionare prin intermediul internetului.
Bibliografie minimală pentru acest modul
READER Curs Psihologie Experimentală și Metode de Analiză a Datelor

Bibliografie facultativă
Anderson H. Norman (2001) Empirical Direction in Design and Analysis. Routledge, USA
Chalmers Alan (1999) What is this thing called science? Hackett Publishing Company, Inc.
Indianapolis.
Derry Gregory (1999) What Science Is and How It Works. Princeton Univerity Press, New
Jersey.
Lakatos Imre (1973) Science and Pseudoscience.
http://www.lse.ac.uk/collections/lakatos/scienceAndPseudoscience.htm
Radu, I. şi colab. (1993) Metodologie psihologica si analiza datelor, Cluj-Napoca, Ed. Sincron.
Stanovich Keith (2001) How to think straight about psychology. Allyn & Bacon, Boston
Wynn M. Charles and Wiggins W. Arthur (2001) Quantum leaps: Where Real Science Ends ...
and Pseudoscience Begins. Joseph Henry Press Washington, D.C.
Modulul 4
STUDII DESCRIPTIVE ŞI MODALITĂȚI DE ORGANIZARE A COLECŢIEI DE DATE

Scopul modului: Familiarizarea studentului cu principalele scale de evaluare utilizate în


psihologie şi modalităţile uzuale de organizare a datelor.

Obiectivele modulului: După parcurgerea acestui modul, veţi fi capabili:


• să definiţi şi să recunoaşteţi principalele scale de măsurare utilizate
în cercetarea psihologică.
• să sistematizaţi o colecţie de date.
• să organizaţi în tabele şi grafice o colecţie de date.

În acest capitol vom analiza principalele caracteristici ale demersului de evaluare şi


măsurare ştiinţifică în contextul psihologiei. Vom prezenta mai întâi principalele tipuri de scale
de măsurare, conceptele cheie fiind cel de categorizare şi cunatificare. Pentru a înţelege mai bine
vom prezenta aceste concepte utilizând multiple exemple luate din psihologie cât şi din domenii
învecinate.
În cele din urmă vom prezenta aspectele importante ale demersului de colectare şi
organizare a datelor de cercetare. În acest demers vom discuta avantajele utilizării distribuţiilor de
frecvenţe cât şi particularităţile esenţiale ale acestora.

4.2. COLECŢIA DE DATE BRUTE

De regulă, un experiment, o testare psihologică, o suită de observatii, o anchetă psiho – socială


etc. pornesc de la o întrebare chiar şi mai puţin însemnată, îşi propun deci să rezolve o problemă.

Exemplu:
Cu ajutorul unui aparat flicker se determină în laborator frecvenţa critică de fuziune a luminii
intermitente. O suită de măsurări asupra aceluiaşi subiect ne oferă un indice asupra eficienţei
vizuale. Pentru discuţie să reţinem rezultatele obţinute de doi subiecţi:

N.V. C.M.
47 48 50 52
47 47 50 51
48 46 52 52
49 48 48 50

Prima remarcă este că variabila rezultă direct din lectura aparatului şi că acelaşi subiect se
caracterizează prin valori care oscilează destul de puţin în jurul unei cifre – reper, motiv pentru
care volumul colecţiei de date recoltate poate fi mai restrâns.
Se pune întrebarea: care este în populaţie registrul de variaţie, al pragului de fuziune? –
ceea ce presupune extinderea determinărilor pe o colectivitate mai largă, numită colectivitate sau
grup de referinţă. Se constată că în condiţii de repaus întinderea variaţiei este cuprinsă între 40 şi
70 Hz. Scăderea cu 3 – 4 Hz a pragului după un efort psihofiziologic este un indiciu concret al
apariţiei oboselii vizuale.
Să observăm că proba ca atare constituie într-un fel o “fereastră deschisă” spre mai multe
faţete ale fenomenului considerat. Remarca este valabilă şi pentru alte probe psihologige. Ne
poate interesa în exemplul de mai sus o măsură a stării de oboseală, un indice asupra eficienţei
vizuale la diferiţi subiecţi, fluctuaţii datorate stimulării concrete a altor analizatori. De asemenea,
poate fi vorba de studiul lateralitaţii, pornind de la difernţa dintre pragul de fuziune al ochiului
conducător în raport cu celălalt. Volumul de date, ca şi organizarea lor internă vor depinde de
problema pusă spre rezolvare şi de gradul de împrăştiere sau variabilitate a datelor. De pildă,
determinarea pragului discriminării tactile – cu ajutorul unui esteziometru – duce la o colecţie de
date având o variabilitate de–a dreptul deconcertantă. În consecinţă, volumul colecţiei de date –
având o variabilitate sau o dispersie mare, - va trebui să fie mult mai mare. Se poate estima acest
lucru pe baza unor formule stabilite.
În psihologia aplicată cum este şi cazul exemplelor de mai sus – sunt frecvente situaţiile
în care ne interesează poziţia relativă a unui individ, respectiv a unui rezultat specific, în cadrul
unui grup mai larg. Este situaţia tipică a testării psihologice. Spre exemplu, într-o examinare
psihologică problema care se pune este situarea individului în raport cu grupul de referinţă, a
cărui investigaţie furnizează un tabel de norme sau o tipologie. Un rezultat, o cotă individuală,
luată singură reprezintă un bit de informaţie care nu ne spune mare lucru. Trebuie să ştim ceva
despre rezultatele celorlalţi subiecţi. Interpretarea unei măsuri, a unei cote depinde de cunoaşterea
poziţiei ei relative într-un grup de referinţă, ceea ce presupune strângerea prealabilă (sau
simultană) de date asupra acestei colectivităţi şi întocmirea unui tabel de norme sau unei tipologii
pe această colectivitate. Investigarea grupului, respectiv a individului devin astfel
complementare.

Exemplu:
Se pune întrebarea dacă o stare de tensiune psihică de încordare produce modificări în
rezultatele obţinute la un test de inteligenţă. Pentru a răspunde la această întrebare se constituie
două grupe dintr-un lot mai mare de subiecţi cuprinşi într-o testare anterioară a inteligenţei făcută
cu alt scop. În noua experienţă, fiecare subiect este supus din nou, în mod individul, la unele
probe din bateria iniţială de teste, primul grup este retestat în condiţii de testare psihică graţie
motivării date repetării examenului: s-a explicat, de pildă, fiecărui subiect că rezultatul (CI)
obţinut de el la prima testare a fost neaşteptat de slab şi că i se oferă ocazia de a-şi îmbunătăţi
scorul. Componenţii celui de-al doilea grup sunt trataţi altfel şi anume într-o atmosferă
emoţională neutră, motivându-se că experimentatorul este interesat pur şi simplu de rezultatele
unei retestări cu probe identice.
Într-o experienţă efectivă, din subtestele aplicate, cercetătorul a reţinut datele referitoare la
volumul memoriei de numere, probă care s-a dovedit mai sensibilă la factorul implicat: tensiunea
psihică. Aceste date iau forma numerică (după Spencer şi colab., 1968). Variabila se constituie
prin însumare de puncte, de răspunsuri exacte. Cu s1, s2,…, sn, se notează subiecţii cuprinşi în
experienţă (Tab. 4.2.).
Tabel 4.2.
Grupul neutru (N) Grupul anxios (A)
(s1) 11 (s9) 11 (s17) 9 (s25) 13
(s2) 10 (s10) 11 (s18) 10 (s26) 4
(s3) 16 (s11) 14 (s19) 16 (s27) 10
(s4) 13 (s12) 16 (s20) 10 (s28) 11
(s5) 11 (s13) 13 (s21) 10 (s29) 13
(s6) 9 (s14) 10 (s22) 10 (s30) 11
(s7) 13 (s15) 13 (s23) 17 (s31) 13
(s8) 17 (s16) 17 (s24) 14 (s32) 11

În protocolul brut apar aşadar subiecţii (indivizii) reperaţi printr-un indicator (s1, s2, …) şi
rezultatele corespunzătoare fiecăruia. Transcrierea acestui protocol pe un suport informatic va
duce la constituirea unui fişier de date.
În continuare se pune întrebarea: cum să extragem informaţie din datele brute? Trebuie să
scoatem la lumină aspecte sau relaţii ascunse în colecţia de date. Asemenea aspecte ar putea fi:
dacă, în medie grupul N diferă de grupul A;
dacă diversitatea s-au dispersia datelor creşte în condiţia A;
ce rol joacă diferenţele individuale?
● dacă diferenţele constatate pot fi generalizate?

Iată suma de întrebări pe care urmeaza să le rezolve prelucrarea statistică.


Dintr-un unghi de vedere, cercetarea este practic încheiată o dată cu consemnarea datelor
experimentale; într-un alt sens, ea abia acum începe. Analiza datelor va extrage informaţia
psihologică pentru a răspunde la întrebarea pusă. Statistica oferă mijloace pentru a desprinde
informaţia relativă cuprinsă în colecţia de date; concluziile acestei prelucrări se situează de fapt
între frontiere largi, care pendulează între cunoaşterea exactă şi empirismul pur.
.
4.3. ORDONAREA ŞI GRUPAREA DATELOR

După cum s-a arătat, în urma unui experiment, a unei observaţii sistematice sau a unei
anchete, se obţine de regulă o colecţie de date, care nu pot fi cuprinse şi examinate printr-o
simplă “inspecţie” vizuală. Trebuie să intervină o operaţie de clasificare, ordonare şi condensare a
datelor brute, care să permită relevarea unor legităţi sau dependenţe cât mai precise.

Exemplu (după I. Radu):


Într-o experienţă efectuată cu 24 de elevi s-au consemnat răspunsurile exacte date de aceştia în
rezolvarea unei probe de verificare în cadrul unei discipline şcolare. Rezultatele brute, redate în
tabelul 2.3. indică numărul de răspunsuri corecte constatat la fiecare elev. Transcris pe un suport
informatic, acesta devine fişier de date.
Se poate observa cum datele brute, care sunt valorile unei variabile x – în cazul nostru
numărul de răspunsuri exacte – se înşiruie la întâmplare, iar din examinarea lor imediată nu
rezultă nimic precis. Se impune ordonarea şi gruparea valorilor, prezentarea materialului într-o
formă clară şi condensată. Ca prim pas este necesar să întrevedem modul de organizare a datelor,
distribuţia lor.
Dacă aruncăm o privire asupra şirului de date putem uşor constata că anumite valori se
repetă şi astfel – renunţînd la identificatori – putem sistematiza materialul scriind într-o coloană
valorile diferite în ordine crescândă (2, 3, 4, …, 8) şi notând în dreptul fiecăreia – prin puncte,
bare transversale sau steluţe – de câte ori se repetă acesta în şirul iniţial. S-au determinat astfel –
numărând punctele sau barele trasate – efectivele corespunzătoare fiecărei valori din ansamblul
rezultatelor, stabilindu-se o situaţie mai clară a datelor obţinute, practic o distribuţie de efective.
(Tab. 2.4.).
Tabelul 4.3. Tabelul 4.4
(s1) 5 (s9) 6 (s17) 7 .
(s2) 2 (s10) 4 (s18) 4
(s3) 5 (s11) 3 (s19) 5 N=2
4
(s4) 3 (s12) 7 (s20) 6
(s5) 6 (s13) 5 (s21) 6
(s6) 8 (s14) 5 (s22) 4
(s7) 5 (s15) 6 (s23) 8
(s8) 7 (s16) 4 (s24) 5 x 1 2 3 4 5 6 7 8

Ne aflăm în faţa unui protocol sistematizat, clasificat: diagrama de steluţe. Sistematizarea,


clasificarea unui protocol şi constituirea colecţiei de date, a grupului de observaţii reprezintă
proceduri statistice liminare, în sensul că se situează în pragul analizei statistice, pregătind
aplicarea tehnicilor ulterioare de prelucrare.
După cum s-a văzut, constituirea colecţiei de date, a grupei de observaţii este însoţită de
suprimarea indicatorilor şi totdeauna fără pierdere de informaţie.
Datele primare odată grupate pot fi centralizate în anumite tabele, sau pot fi prezentate
sub diferite forme grafice (diagrama în dreptunghiri, în steluţe etc).
Este necesar să reamintim că cercetările experimentale au loc pe loturi sau grupe de
indivizi extrase dintr-o populaţie. Tot aşa, observaţia şi metodele de anchetă cuprind în aria
investigaţiilor colectivităţi mai restrânse dintr-o populaţie mai largă. Pe de altă parte, analiza
produselor activităţii supune aprcierii o mulţime de produse, lucrări piese etc. Alteori se
efectuează un lot de măsurări asupra aceleaşi persoane, practicându-se un număr de înregistrări
succesive. În toate situaţiile amintite, se obţine o colecţie de date care constituie un fragment
reprezentativ, un eşantion din multimea datelor sau măsurătorilor posibile. Se impune astfel
distincţia între eşantion şi populaţie sau colectivitatea mai largă. Termenul de populaţie ori
colectivitate nu are aici un sens sociologic sau demografic, ci indică pur şi simplu ansamblul
statistic vizat prin cercetare. Evident, o investigaţie ştiinţifică recoltează efectiv o colecţie
reprezentativă sau un eşantion de date, dar extinde concluziile sale asupra populaţiei. Pentru ca o
asemenea generalizare sau inferenţă să fie justificată, se cere ca lotul sau grupul să fie constituit
după regulile selecţiei aleatoare, precizate în îndreptarele curente de statistică.
Temă de reflecţie nr. 1
Definiţi două populaţii şi denumiţi două eşantioane care fac parte din populaţiile
definite. Pentru aprofundarea subiectului vezi în READER documentul:
Bibliografie 10.pdf - Cohen_2001_Explaining Psychological Statistics - cap. 1.

4.4. CONDENSAREA DATELOR ÎN TABELE ŞI GRAFICE

În fiecare tabel distingem coloane şi linii sau rânduri. Fiecare linie şi fiecare coloană are
un titlu, o explicaţie prescurtată, precizându-se totodată unităţile de măsură. Tabelul însuşi poartă
un titlu - notat deasupra -, care redă concis conţinutul său. De regulă, variabilele independente
sunt acelea care servesc la gruparea populaţiei, iar datele cifrice din tabel reflectă variabila
dependentă.
Pentru a nu fi prea încărcate, în tabele reducem uneori numărul claselor sau categoriilor
stabilite, contopind intervale sau categorii învecinate. Precizarea numărului de subiecţi care
compun grupele studiate este obligatorie pentru orice tabel. Când N este mic nu se recurge la
exprimarea procentuală, pentru că aceasta ar exagera proporţiile.
Plecând de la datele sistematizate în tabel, urmează să preciză forma distribuţiei servindu-
ne de reprezentarea grafică a ansamblului de date.
Graficul de bază este - aşa cum s-a spus - histograma.

Exemplu:
În tabelul 2.5, sunt prezentate rezultatele unei probe de memorie efectuată pe un eşantion de 51
subiecţi (N=51).Variabila prezintă valori între 3 şi 26. Deci întinderea varianţei este: (Xmax- Xmin )
+1, (26-3)+1=24. Datele se vor condensa în grupuri de câte trei:
3,4,5,
6,7,8
.......
deci intervalul (I), este 3. Valorile aflate la mijlocul fiecărui interval se notează cu xk.

Tabelul 4.5. Rezultatele obţinute de studenţi în cadrul probei de memorie


X Xk Determinarea efectivelor n
3–5 4 III 3
6–8 7 IIIII 5
9 – 11 10 IIIII IIII 9
12 – 14 13 IIIII IIIII IIIII I 16
15 – 17 16 IIIII IIIII 10
18 – 20 19 IIII 4
21 – 23 22 III 3
24 - 26 25 I 1
N = 51

Pe axa abciselor (Ox) marcăm opt intervale continue egale, deoarece avem opt clase de
efective. Fiecărui interval îi corespunde o clasă, care se notează în dreptul său (3 - 5, 6 - 8 etc). Pe
ordonată( Oy) formăm 16 diviziuni corespunzător efectivului celui mai mare. Pe fiecare din
intervalele marcate pe abcisă se construiesc apoi dreptunghiuri având înălţimi proporţionale cu
efectivele distribuţiei (Fig. 2.1.). Întreaga procedură se poate executa pe calculator. Dacă unim
acum mijlocul bazelor superioare ale dreptunghiurilor histogramei prin segmente de dreaptă, se
obţine poligonul efectivelor / frecvenţelor (Fig. 2.2.).
Pe această bază, putem formula o ipoteză cu privire la forma distribuţiei caracteristicii
studiate în sânul populaţiei sau a colectivităţii mai largi, ceea ce constituie un bit de informaţie
valoros despre distribuţie. O asemenea ipoteză se poate enunţa şi pe baza unor studii anterioare,
deci a informaţiei acumulate în domeniul respectiv (de exemplu, despre distribuţia CI).

Fig.4.2. Poligonul frecvenţelor.


În investigaţiile psihologice se întâlnesc mai frecvent trei tipuri de forme ale unei
distribuţii sau histograme experimentale şi anume: distribuţii simetrice sau normale, distribuţii
asimetrice şi distribuţii în formă de i.
Distribuţiile simetrice, numite şi normale, se caracterizează prin aceea că valorile
efectivelor situate de o parte şi de alta a clasei cu efectivul maxim sunt egale sau diferă destul de
puţin între ele. Un exemplu de acest gest îl oferă datele din tabelul 2.5 reprezentate grafic în
histograma din figura 2.1. Se poate observa că intervalul cu efectivul maxim este 12 - 14, iar de o
parte şi de alta efectivele, respectiv frecvenţele descresc în aceeaşi manieră (diferă puţin între
ele). Dacă s-ar mări volunul de date, uşoara asimetrie a poligonului de efective s-ar retuşa treptat.
La limită, s-ar putea trasa o curbă în formă de clopot (Fig. 2.3), numită curbă normală, a cărei
expresie matematică (ecuaţie) este:
( x− m )2
y= 1 e −
2 2
 2
în care  şi e sunt două numere a căror valoare este cunoscută, iar m şi  reprezintă media
respectiv abaterea standard la nivelul eşantionului studiat.

Fig. 4.3. Distribuţia normală Fig. 4.4. Distribuţii asimetrice

Fig. 4.5. Distribuţie în formă de I Fig. 4.6. Distribuţie bimodală


Fig. 4.7. Diagramă de comparaţie

În practică dispunem însă de un volum limitat de date, iar histograma obţinută este mai
mult sau mai puţin simetrică. Redând forma de organizare a datelor concrete, histograma ne
sugerează însă aspectul sau forma distribuţiei teoretice. După cum am văzut, un grafic în formă
aproximativă de clopot şi cu o tendinţă netă de simetrie sugerează o lege normală de repartiţie.
Proprietăţile distribuţiei normale sunt precizate din punct de vedere matematic şi ne bazăm pe ele
în inferenţa statistică.
În cazul distribuţiilor asimetrice redate în formă stilizată prin graficele din Fig. 2.4,
majoritatea efectivelor se polarizează în mod evident de o singură parte, fie în partea dreaptă, fie
în partea stângă a clasei centrale.

Temă de reflecţie nr. 2


Descrieţi două situaţii de colectare a datelor care să producă distribuţii asimetrice,
alungite fie la dreapta, fie la stânga. Pentru aprofundarea subiectului vezi în
READER documentul
Bibliografie 11.pdf - Cohen_2001_Explaining Psychological Statistics - cap. 2.

`Aşa se întâmplă, de exemplu, când se înregistrează timpul de reacţie simplă a unui


subiect sau timpul de execţie a unei lucrări (operaţii de muncă). În aceste cazuri se obţin de cele
mai multe ori histograme asimetrice, clasele cu efective mai mari corespunzând timpilor inferiori
mediei. Este posibil să se ajungă în anumite situaţii la distribuţii normale dacă se modifică proba
prin care se obţin datele sau se schimbă condiţiile de administrare (de exemplu, se elimină
elementele grele, se prelungeşte timpul de examinare etc). Alteori se pot înlocui datele brute prin
logaritmul lor (de exemplu în cronometrări) şi se retuşează asimetria. Există situaţii în care
disimetria este caracteristică fenomenului studiat; "corectarea" iregularităţilor ar însemna aici
distorsionarea datelor. Metodele de prelucrare statistică vor fi diferite.
La distribuţiile în formă de i curba este constant descrescătoare. De pildă, curba erorilor în
seria exerciţiilor de formare a deprinderii este constant descrescătoare (Fig. 2.5). La fel, timpul de
execuţie al unei acţiuni în procesul exerciţiului prezintă aceeaşi alură de variaţie.
În anumite cazuri particulare putem întâlni şi distribuţii având efectivele polarizate în două grupe:
clasele cu efective mari se împart în două grupe despărţite de clase cu efective mici. Este vorba
atunci de o distribuţie bimodală, care sugerează ipoteza existenţei a doi factori diferiţi sau grupe
diferite (Fig.2.6).

Temă de reflecţie nr. 3


Descrieţi o situaţie de colectare a datelor care să producă distribuţie bimodală.
Pentru aprofundarea subiectului vezi în READER documentul:
Bibliografie 11.pdf - Cohen_2001_Explaining Psychological Statistics - cap. 2.

Când rezultatele sunt grupate doar în câteva categorii sau procente, se folosesc diagramele
de comparaţie, care constau adeseori în coloane (dreptunghiuri) paralele având aceeaşi bază sau
lăţime. Un exemplu în acest sens oferă figura 2.7. Coloanele, proporţionale ca înălţimea cu
efectivele sau procentele pe care le reprezentăm, pot fi aşezate vertical sau orizontal, având
alăturată o scară cu diviziuni marcate.
Tipurile de grafice menţionate cuprind situaţii consemnate la un moment dat. Alături de
acestea, există grafice care redau evoluţia în timp a unor procese, punând în evidenţă anumite
tendinţe, schimbări de alură, "denivelări", evoluţia spre platouri etc. De exemplu, desfăşurarea
unui proces de învăţare este urmărită cu ajutorul unor asemenea grafice.

Rezumat
Măsurarea reprezintă operaţia prin care se atribuie valori numerice datelor discrete sau
continue ce urmează a fi evaluate. Se pot diferenţia patru niveluri ale măsurării ce corespund
celor patru tipuri de scale: nominale, ordinale, de interval , respectiv de proporţii. În vederea
interpretării rezultatelor obţinute într-o cercetare, datele brute sunt supuse unei organizări
(determinarea intervalelor de grupare, respective determinarea frecvenţelor). Pe baza acestei
etape se poate realiza reprezentarea grafică sub forma histogramelor respectiv a poligoanelor de
frecvenţă.
Bibliografie minimală pentru acest modul
READER Curs Psihologie Experimentală și Metode de Analiză a Datelor

Bibliografie facultativă
Cohen, B. (2001) Explaining Psychological Statistics. Second Edition. New York: Wiley.
Faverge, J.M. (1965). Méthodes statistiques en psychologie appliquée. t.III, Paris, P.U.F.
Heiman, G., W., (2001) Understanding Research Methods and Statistics: an integrated approach.
Houghton Mifflin Company, Boston.
Jaccard J & Becker, M. (1997). Statistics for the behavioral sciences (third edition), Brooks, Cole
Publishing Company, Pacific Grove.
Radu, I. şi colab. (1993) Metodologie psihologica si analiza datelor, Cluj-Napoca, Ed. Sincron.
Rouanet, H., Le Roux, B., Best, C. (1987). Statistique en sciences humaines: procedures
naturelles, Paris, Bordas.
Spence, J., Underwood, B.J., Duncan, C.P., Cotton, J.W. (1968). Elementary statistics, New
York, Appleton.
Stevens, S.S. (1951). Matematics, measurement, and psychopsysics. În Handbook of
experimental psychology, ( ed. S.S. Stevens), New York, Wiley.
Modulul 5
INDICI STATISTICI DE START

Scopul modului: Familiarizarea studentului cu principalii indicatori ai unei distribuţii de


frecvenţe.

Obiectivele modulului: După parcurgerea acestui modul, veţi fi capabili:


• să calculaţi şi să interpretaţi indicii statistici de determinare a
tendinţei centrale (media, mediana, modul)
• să calculaţi şi să interpretaţi indicii statistici ai variabilităţii -
varianţa (dispersia) şi abaterea standard
• să interpretaţi semnificaţia abaterii standard
• să înţeleageţi funcţia cotelor standardizate z
• să recunoasteţi condiţiile de utilizare a frecvenţei ca indice statistic

În acest capitol vom analiza principalele caracteristici ale distribuţiilor de frecvenţe, mai
precis tendinţa centrală, variabilitatea şi forma acestora. Vom prezenta mai întâi principalii
indicatori statistici utilizaţi pentru descrierea unei distribuţii, conceptele cheie fiind cel de medie,
varianţă şi cote standard. Vom prezenta aspectele conceptuale cât şi aspecte computaţionale.
În cele din urmă vom prezenta aspectele importante ale demersului de transformare a
catelor brute în cote standard z şi importanţa acestor cote din punct de vedere al demersului
statistic ulterior.

5.1. DETERMINAREA "VALORII CENTRALE" SAU A "TENDINŢEI CENTRALE"

În exemplul analizat în Modulul 2 (Fig. 2.2. şi Tab. 2.5.) s-a putut constata cum datele
tind să se concentreze parcă în jurul unei valori centrale; efectivele cele mai mari (16 şi 10,
respectiv 9) corespund în acest caz claselor situate la mijlocul şirului.
Acest aspect îl întâlnim destul de frecvent în experimentele psihologice. În anumite
situaţii, majoritatea rezultatelor pot să graviteze fie în partea dreaptă, fie în partea stângă a seriei
de variaţie. Se vorbeşte atunci de distribuţii asimetrice. Şi în aceste cazuri datele tind să graviteze
în jurul unor valori. Indicii prin care se determină în mod curent "tendinţa centrală" a rezultatelor
sunt media, mediana şi modul.
Media, pe care o notăm cu m, nu este altceva decât suma valorilor, a datelor numerice,
împărţită la numărul acestora. Formula ei de definiţie este m=∑x/N, în care ∑ înseamnă "sumă
de", x reprezintă valorile sau rezultatele individuale, iar N constituie efectivul grupei studiate. În
capitolele ce urmează va fi vorba de formule de definiţie, necesare pentru înţelegerea unui indice
statistic şi de formule de calcul, care indică procedurile statistice aplicabile pentru determinarea
unui indice (media, abaterea standard, varianţa etc). Psihologul care beneficiază de serviciile unui
calculator, dotat cu programe informatice pentru prelucrarea statistică a datelor, se poate dispensa
de cunoaşterea şi stăpânirea formulelor de calcul. Calculatorul oferă la cerere, rezultatul
calculului, indiferent de procedura aplicată. Ca exerciţiu preliminar, parcurgerea acestor tehnici
este utilă pentru a ne da seama de transformarea ce se produce asupra datelor brute. De asemenea,
în absenţa serviciilor unui calculator sau a programelor informatice necesare, stăpânirea
formulelor de calcul devine necesară, eventual în vederea improvizării unui program.
Revenind la formula de definiţie a mediei, întrucât N este totdeauna dat, urmează să
stabilim procedee de calcul pentru ∑x (suma valorilor numerice), pe care o notăm cu T (iniţiala
cuvântului "total").
Când volumul datelor noastre este destul de restrâns, pentru a-l determina pe T facem o
simplă adunare fără să mai grupăm valorile.
Metoda da calcul presupune distribuţie statistică dată, ca aceea din tabelul 3.1. Precizăm
că, pentru a păstra notaţia acreditată de lucrări clasice în domeniu, cu f am notat efectivele şi nu
frecvenţa relativă (proporţiile), raportată la întreg.
Vom avea trei coloane: valorile lui x grupate în clase, valorile centrale xk, şi efectivele
corespunzătoare f. Pentru calcularea lui T adăugăm o coloană în plus cu produsele fxxk. Aşadar
înmulţim fiecare valoare centrală xk cu efectivul corespunzător clasei respective, iar produsele
înscrise în coloana fxxk le adunăm şi obţinem totalul T.
Ştiind că m = T/N, vom efectua împărţirea şi vom obţine media.
În exemplu nostru: m = 672/51 = 13,17.

Tabelul 5.1 Calcularea mediei

x xk f fxxk

3-5 4 3 12
6-8 7 5 35
9-11 10 9 90

12-14 13 16 208

15-17 16 10 160
18-20 19 4 76
21-23 22 3 66
24-26 25 1 25

N = 51 T = 672
Aşa cum s-a precizat, media pune în evidenţă tendinţa centrală a rezultatelor constate într-
o experienţă. Prin calcularea mediei obţinem o măsură a nivelului mediu relativ la un eşantion
studiat, fapt care permite apoi comparaţii între grupe.

Temă de reflecţie nr. 1


Luând ca şi punct de plecare formula de definiţie a mediei descrieţi proprietăţile
statisticile ale mediei. Pentru aprofundarea subiectului vezi în READER
documentul:
Bibliografie 12.pdf - Cohen_2001_Explaining Psychological Statistics - cap. 3.

Mediana este un alt indice al tendinţei centrale, care se utilizează mai ales când avem de-a
face cu distribuţii asimetrice. De exemplu, în cronometrări se înregistrează succesiv timpul de
execuţie a unei operaţii de producţie la un muncitor; distribuţia empirică obţinută este, de regulă,
asimetrică şi atunci se reţine mediana ca măsură a timpului de lucru.
Pentru a găsi mediana - pe care o notăm cu med - trebuie să aranjăm, în cazuri mai simple,
toate datele (valorile) în ordine crescândă sau descrescândă.
Mediana este acea valoare care împarte şirul ordonat în două grupe egale ca număr. Cu
alte cuvinte, mediana se găseşte la mijlocul şirului: jumătate din valori se află deasupra, iar
cealaltă jumătate dedesubt. Locul sau rangul pe care îl ocupă mediana în şirul ordonat se
detrmină cu ajutorul formulei (N+1)/2 (care nu este formula de definiţie pentru med).
Când valorile constituie un număr fără soţ, mediana va corespunde determinantei din
mijloc. Astfel, în seria valorilor: 4, 4, 5, 6, 6, 7, 7, 7, 7, 8, 9, med = 7 pentru că 7 este valoarea
care împarte şirul ordonat exact în două. Formula (N + 1)/2 ne indică locul pe care se găseşte
mediana. În cazul nostru med este valoarea situată pe locul al 6- lea în şirul ordonat [(11 + 1)/2 =
6].
Tabelul 5.2. Calculul medianei în cazul datelor grupate
Interval xk f fc
24-26 25 1 51
21-23 22 3 50
18-20 19 4 47
15-17 16 10 43
12-14 13 16 33
9-11 10 9 17
6-8 7 5 8
3-5 4 3 3
i=3 N = 51
Dacă valorile ordonate sunt în număr cu soţ, mediana se va găsi la mijlocul şirului, între
două valori consecutive.
Fie datele ordonate: 3, 4, 4, 5, 6, 7, 7, 8, 8, 9; deci 10 valori. Mediana se va găsi pe locul
5,5 deoarece (N + 1)/2 este în cazul acesta (10 + 1/2) adică 5,5. Căutând în şirul dat valoarea
situată pe locul 5,5 constatăm că ea se găseşte între două valori consecutive:6 şi 7. În consecinţă
vom face media celor două valori: med va fi egală cu 6,5.
Când datele sunt grupate ca în tabelul 3.2 localizăm mai întâi intervalul în care se găseşte
mediana luând ca reper N/2. În exemplul citat N/2 = 51/2 = 25,5 deci mediana se află în intervalul
(12 - 14) ale cărui limite exacte sunt 11,5 şi 14,5 (variabila fiind considerată continuă). Formula
care ne dă valoarea medianei este următoarea:
N
− Fs
med = l + 2 i
fi
în care:
l este limita inferioară a intervalului reperat,
Fs este totalul frecvenţelor situate sub l (în exemplul dat 3 + 5 + 9 = 17),
fi= frecvenţa corespunzătoare intervalului localizat, iar N şi i sunt notaţii cunoscute
În exemplul ales vom avea:
25,5 − 17
med = 11,5 +  3 = 13,09
16
Spre deosebire de medie, mediana prezintă avantajul de a nu fi afectată de variaţiile
extreme ale seriei, fapt care o face potrivită pentru studiul distribuţiilor asimetrice.

Temă de reflecţie nr. 2


Luând ca şi punct de plecare formula de definiţie a mediei descreţi proprietăţile
statisticile ale mediei. Pentru aprofundarea subiectului vezi în READER
documentul:
Bibliografie 12 - Cohen_2001_Explaining Psychological Statistics - cap. 3.

Modul este valorea care se repetă mai des într-un şir de rezultate, adică valoarea care
prezintă frecvenţa cea mai mare.
De exemplu, în seria de date 4, 5, 6, 6, 7, 7, 7, 7, 8, 9, modul este 7, deoarece 7 este
valoarea cu frecvenţa cea mai mare.
Când datele sunt grupate, modul este clasa care reuneşte cei mai mulţi din subiecţi, mai
precis - valoarea centarală a acestei clase. De exemplu, în tabelul 3.2., clasa care întruneşte
frecvenţa maximă este 12 – 14, a cărei valoare centrală este 13.
După cum se vede, modul poate fi determinat prin simpla examinare a valorilor, fără să fie
necesare operaţii de calcul. Ca indice al tendinţei centrale, modul este foarte aproximativ şi se ia
în considerare mai ales la prima inspecţie a datelor. În cazul distribuţiilor normale modul,
mediana şi media coincid sau prezintă valori foarte apropiate.

Temă de reflecţie nr. 3


Luând ca şi punct de plecare formula de definiţie a mediei descreţi proprietăţile
statisticile ale mediei. Pentru aprofundarea subiectului vezi în READER
documentul:
Bibliografie 12 Cohen_2001_Explaining Psychological Statistics - cap. 3.

5.2. DETERMINAREA INDICILOR DE DISPERSIE

Media, mediana şi modul caracterizează un singur aspect al distribuţiei statistice: tendinţa


generală a datelor. Este necesar să cunoaştem şi modul în care se repartizează diferite rezultate în
jurul "valorii centrale", adică organizarea interioară a distribuţiei. De exemplu, două distribuţii
statistice - cum sunt cele redate în figura 3.1. - pot avea aceeaşi medie, dar ele să fie totuşi foarte
diferite sub aspectul variabilităţii, respectiv al omogenităţii.

Figura 5.1.

Se pune deci problema de a găsi indicatori prin intermediul cărora se poate măsura
variaţia sau împrăştierea datelor în jurul mediei. Aceşti indicatori sunt: dispersia sau varianţa, şi
abaterea standard.Cu ajutorul lor se obţin informaţii asupra variabilităţii grupului studiat.
Dispersia şi abaterea standard
Dispersia sau varianţa se notează cu σ2 sau cu s2 şi are ca formulă de definiiţie:
 2 = s2 =
 ( x − m) 2

N −1
în care (x-m) reprezintă abaterea fiecărei valori de la media calculată, iar N este efectivul grupei
de măsurări.
Abaterea standard sau abaterea tip - care se notează cu σ sau cu s - nu este altceva decât

rădăcina pătrată din valoarea dispersiei:  =  2 Aşadar, pentru a determina abaterea standard
trebuie oricum să aflăm mai întâi dispersia σ2.
Indicele de dispersie cel mai exact şi mai des utilizat este de fapt abaterea standard, având
avantajul de a fi exprimat în aceleaşi unităţi ca şi datele iniţiale pe care le prelucrăm. De exemplu,
dacă studiul se bazează pe note, abaterea standard este exprimată tot în note, permiţând să se
analizeze mai corect gradul de variabilitate al grupului.
Abaterea tip se foloseşte, de asemenea, în discutarea distribuţiilor normale. Dispersia are
avantajul de a nu cuprinde radicalul în expresia ei algebrică şi astfel se pretează mai uşor la
calcule teoretice.
Dacă analizăm formula de definiţie a dispersiei ne dăm seama că numai expresia de la
numărător, adică suma pătratelor abaterilor de la medie, ridică probleme mai dificile pentru
calcul. Vom numi pe scurt această expresie suma pătratelor.
Determinarea sumei pătratelor nu se face utilizând expresia de definiţie Σ(x-m)2 deoarece
comportă operaţii laborioase şi de cele mai multe ori cu numere zecimale. Transformând expresia
de definiţie, se obţine o formulă convenabilă de calcul:
T2
 ( x − m) 2 =  x 2 − N
în care notaţiile sunt deja cunoscute. Σx2 reprezintă totalul pătratelor celor N rezultate (valori)
care compun grupul iniţial de date.
Formula de calcul a dispersiei devine astfel:
T2
 x2 − N
2 =
N −1
De notat că T2 şi Σx2 sunt valori cu totul diferite, ceea ce se poate verifica în tabelul 3.3.
În ceea ce priveşte determinarea disprsiei, având datele grupate, ne referim din nou la cele
două metode utilizate pentru calculul mediei.
Metoda de calcul ilustrată prin tabelul 3.3, ne-a condus la determinarea lui T prin
însumarea produselor fxx, ştiind că Σfxx'T. Ridicând acum la pătrat pe T şi împărţind apoi cu N
(efectivul grupei), avem stabilit T2/N din formula de calcul a sumei pătratelor stabilită mai sus.
Ne rămâne să calculăm doar Σx2. Pentru aceasta la tabelul care a condus la determinarea lui T mai
adăugăm o coloană fxx2 în care vom înscrie produsele (fxx) x x (adică produsele fxx notate în
coloana precedentă se mai înmulţesc o dată cu valorile x).
Pentru ilustrare să urmărim exemplul din tabelul 5.3.

Tabelul 5.3.
Note, x f fxx (fxx)xx

3 2 6 18
4 2 8 32
5 3 15 75
6 7 42 252
7 10 70 490
8 8 64 512
9 4 36 324
10 2 20 200
N = 38 T = 261 ∑x = 1903
2

Însumând produsele înscrise în coloana (f x x) x x sau, pe scurt fxx2, se obţine Σx2 şi în


felul acesta avem asigurate toate elementele necesare pentru determinare sumei pătratelor potrivit
formulei.
Exemplul ales constituie oarecum un caz particular, având ca interval de grupare i = 1.
Valorile centrale xk coincid cu valorile lui x. Aceasta este situaţia seriilor de variaţie mai mici,
când distanţa dintre valorile extreme nu este mai mare şi permite o grupare mai simplă a datelor
(de pildă, în cazul notelor şcolare).
Când intervalul de grupare este mai mare decât 1 şi lucrăm cu valori centrale xk, produsele
vor fi fxxxxxk, adică fxxk2.
Făcând înlocuirile necesare în exemplul dat vom avea:
68121
 ( x − m) 2
= 1903 −
38
= 110,4

Pentru a determina dispersia sau varianţa, împărţim rezultatul obţinut la N - 1.


110,4
2 = =3
37
În continuare extragem rădăcina pătrată din σ2 sau s2 şi obţinem abaterea tip:  = 3 = 1,7
Se poate observa că pentru determinarea dispersiei în tabelul de calcul utilizat la medie se
adaugă doar încă o coloană fxx2. Pentru uşurarea caculelor trebuie utilizate tabele matematice
uzuale, care ne dau n2 şi n pentru orice numere până la 10.000.
În încheiere sunt necesare două precizări esenţiale:
● În prezent, determinarea indicilor statistici se face cu ajutorul calculatorului, care preia
munca de rutină a cercetătorului. Acesta din urmă decide însă ce indici va calcula, ce tabele şi
grafice sunt necesare în funcţie de natura datelor, va întrevedea forma distribuţiei şi obiectivele
cercetării. Programele informatice aplicate vor sugera modul în care trebuie pregătit şi organizat
materialul brut pentru prelucrarea statistică; psihologul - cercetător stăpâneşte datele de intrare şi
"citeşte" datele de ieşire pe care le interpretează.
● Datele numerice sunt culese pe loturi sau grupuri extrase dintr-o colectivitate mai
largă numită populaţie. Elementele unui lot sau grup trebuie alese după regulile selecţiei aleatoare
pentru a putea formula concluzii valabile. Notăm indicii obţinuţi pe eşantion cu m şi respectiv cu

Temă de reflecţie nr. 4
Cum va afecta prezenţa valorilor extreme valoarea abaterii standard? Luând ca şi
punct de plecare formula de definiţie a mediei descrieţi proprietăţile statisticile ale
mediei. Pentru aprofundarea subiectului vezi în READER documentul:
Bibliografie 12.pdf - Cohen_2001_Explaining Psychological Statistics - cap. 3.

5.3. SEMNIFICAŢIA ABATERII STANDARD

Distingem: σ abaterea standard în populaţie;  abaterea standard obţinută pe o colecţie de


date (eşantion dintr-o populaţie).
Distingem, de asemenea, variabilitatea inter-individuală (între indivizi) şi variabilitatea
intraindividuală (pentru acelaşi individ). De exemplu, distribuţia CI pe o colectivitate reflectă
varianţa inter iar distribuţia timpilor de reacţie la un singur individ arată varianţa intra.
Fenomenul variabilităţii inter şi intra este atât de obişnuit şi nu ne mai întrebăm asupra cauzei sau
sursei deoarece se îmbină aici mai multe surse.
Abaterea standard poate fi luată ca unitate de măsură pe abscisa unui poligon sau a unei
curbe de frecvenţă, în cazul unei histograme experimentale simetrice
Dorim deci, să luăm abscisa în unităţi  . Pentru aceasta pornim de la medie în dreapta şi
în stânga. Adăugăm 1  =5 la m =25 şi obţinem 30. Distanţa dintre 25 şi 30 este de 1  , ea are o
întindere de 5 unităţi brute. La fel este situat 35 la distanţa de +2  deasupra mediei şi-i
corespunde o întindere în unităţi brute de 10. Mai adăugăm 1  la 35 şi obţinem 40; observăm că
distanţa totală între m şi 40 este de +3  Într-o distribuţie simetrică ideală, aproximativ 3 
acoperă distanţa între m şi cota cea mai mare a distribuţiei.
În acelaşi fel procedăm în partea stângă, adică sub medie. Scădem succesiv 5 din 25, şi
apoi 5 din 20, şi 5 din 15, adică întâi -1  apoi -2  şi -3  . Deci într-o distribuţie simetrică
tipică există numai aproximativ 3  deasupra mediei şi -3  sub medie, ceea ce putem scrie
3  . Înseamnă că amplitudinea sau întinderea variaţiei - notată cu V - este de aproximativ 6 
sau că abaterea standard este a şasea parte din V. Abaterea standard devine o unitate de măsură
pentru întinderea variaţiei. Relaţia arătată se verifică pe măsură ce N creşte (de exemplu la N =
50, raportul V/  este de cca 4,5, la N = 90, raportul devine 5 etc).
Să reţinem două idei:
•  măsoară distanţa la care se află o cotă oarecare în raport cu m ,
•  devine unitate de măsură pentru V.
În practică, este necesară utilizarea unor registre diferite de variaţie. De exemplu în cazul
inteligenţei se operează în mod curent cu registrul 70-140, într-o probă de memorie se obţin
valori între 2-12, în cazul măsurării timpului de reacţie se înregistrează fracţiuni de secundă. Se
pune problema comparării şi combinării acestor date heterogene. Soluţia este oferită de cotele z.

Temă de reflecţie nr. 5


Creaţi seturi de date în care media să aibă aceeaşi valoare dar abaterea standard să
difere. Luând ca şi punct de plecare formula de definiţie a mediei descrieţi
proprietăţile statistice ale mediei. Pentru aprofundarea subiectului vezi în
READER documentul:
Bibliografie 12.pdf - Cohen_2001_Explaining Psychological Statistics - cap. 3.

Cote z
O distanţă, un interval dat în cote brute poate fi exprimat în unităţi  , împărţind distanţa

respectivă (x- m ) cu  . În felul acesta avem un punct de referinţă zero. Luând  drept unitate
trecem de la cotele brute x la cote transformate z. Această nouă variabilă z se numeşte variabilă
standardizată.
Cota z: o valoare care ne arată cât se distanţează, în unităţi  , o cotă brută de media
distribuţiei respective.
Formula de trecere de la variabila brută x la variabila normată sau standardizată z este
următoarea:
x−m
z=

Într-o distribuţie tipic normală, în care există trei abateri standard deasupra mediei şi trei
dedesubt, cea mai mare cotă z pe care o putem obţine este + 3, iar cea mai mică - 3. Amplitudinea
cotelor z este între + 3 şi - 3 trecând evident prin zero.

Exemplu:
Avem un test de inteligenţă şi altul de aptitudine mecanică. Rezultatul final condensat
este:
Tabelul 5.5.

m 
Aptitudinea mecanică 100 10
Inteligenţă 60 6

Transpunerea cotelor brute x în cote z permite compararea lor directă. Cu ajutorul cotelor
z avem abaterea unei valori de la medie în termeni de unităţi  . Odată cu acestea, variabile
diferite sunt aduse la un numitor comun, fiind exprimate în aceleaşi unităţi, devin deci
comparabile.
Media şi abaterea standard servesc la interpretarea datelor; semnificaţia lor se stabileşte în
cadrul unor raţionamente bine precizate.

Temă de reflecţie nr. 6


Luaţi un set de date, calculaţi media şi abaterea standard a distribuţiei. Utilizând
aceste informaţii transformaţi fiecare valoare brută în cote standard z. Ce puteţi
spune despre noua distribuţie? Dar despre media şi abaterea standard a noi
distribuţii? Luând ca şi punct de plecare formula de definiţie a mediei descrieţi
proprietăţile statistice ale mediei. Pentru aprofundarea subiectului vezi în
READER documentul:
Bibliografie13.pdf - Cohen_2001_Explaining Psychological Statistics - cap. 4.

În încheiere trebuie să precizăm că valorile caracteristice studiate (m, med, ) nu se


determină pentru orice distribuţie statistică. Dacă distribuţia rezultatelor este normală sau aproape
normală, se deterină media, dispersia şi abaterea standard; dacă distribuţia este asimetrică, se
determină mediana. În cazul distribuţiilor particulare, în formă de i sau j de exemplu, este bine să
ne mulţumim cu un grafic (Fraisse, 1963) şi să determinăm modul, respectiv frecvenţa.

5.4. FRECVENŢA

Alături de medie şi abaterea standard, un indice statistic adesea utilizat este frecvenţa.
Într-o colecţie de date, fiecare element fie că prezintă o caracteristică A, fie că nu. Notăm cu N
efectivul total al unui grup şi cu n numărul de elemente care prezintă caracteristica A. Frecvenţa
caracteristicii A în lotul studiat este n din N sau n/N, care se mai numeşte şi frecvenţă relativă.
Se vorbeşte, de pildă, de frecvenţa accidentelor de circulaţie, clasificându-le după diferite
criterii, sau de frecvenţa muncitorilor accidentaţi într-o uzină ş.a.m.d. De asemenea, când se
aplică un test se vorbeşte de frecvenţa persoanelor care au obţinut un anumit rezultat, o cotă
determinată.
Procentajele se obţin plecând de la frecvenţe conform formului:
n/N x 100.
Exemplu (după Faverge):
Într-o statistică asupra erorilor de la casierie, s-au observat 134 erori în plus şi 289 erori în
minus. Frecvenţa f a erorilor în plus este:
f = 134/423 = 0,32; (423 = 134 + 289).
De reţinut: distincţia dintre frecvenţe absolute sau efective - notate, de regulă, cu n - şi
frecvenţe relative sau proporţii, notate cu f. În exemplul de mai sus se poate urmări modul de
trecere de la frecvenţa absolută la cea relativă.

Rezumat
Caracterizarea datelor cuantificate prin scale de interval se realizează prin intermediul
unui set de indici descriptivi încadraţi în două categorii: indicii tendinţei centrale, respectiv ai
variabilităţii. În prima categorie sunt incluşi: media, mediana, respectiv modul. În a doua
categorie se pot menţiona: dispersia (varianţa) şi abaterea standard. Cotele z permit exprimarea
datelor în funcţie de medie şi abaterea standard şi asigură cuantificarea în unităţi standard. În
cazul scalelor nominale sau ordinale se utilizează ca indice descriptiv frecvenţa.
Recomandări şi comentarii cu privire la temele de reflecţie
Tema 3: Media va fi cea mai afectată de prezenţa valorilor extreme, la mijloc se va situa mediana
şi în partea opusă modul.
Tema 4: Ne gândim la faptul că abaterea stabdard se calculează ca şi abatere de la medie.
Tema 6: Forma nu se va schimba, media va fi 0 şi abaterea standard va fi 1.

Bibliografie minimală pentru acest modul


READER Curs Psihologie Experimentală și Metode de Analiză a Datelor

Bibliografie minimală pentru acest modul


Cohen, B. (2001) Explaining Psychological Statistics. Second Edition. New York: Wiley.
Faverge, J.M. (1965). Méthodes statistiques en psychologie appliquée. t.I Paris, P.U.F.
Jaccard J & Becker, M. (1997). Statistics for the behavioral sciences (third edition), Brooks, Cole
Publishing Company, Pacific Grove.
Radu, I. şi colab. (1993) Metodologie psihologica si analiza datelor, Cluj-Napoca, Ed. Sincron.
Rouanet, H., Le Roux, B., Best, C. (1987). Statistique en sciences humaines: procedures
naturelles, Paris, Bordas.
Spence, J., Underwood, B.J., Duncan, C.P., Cotton, J.W. (1968). Elementary statistics, New
York, Appleton.
Modulul 6
INFERENŢA STATISTICĂ – PROBLEME DE ESTIMARE

Scopul modului: Familiarizarea studentului cu demersul de inferenţă statistică în contextul a


două tipuri de designuri de cercetare (descriptiv şi corelaţional).

Obiectivele modulului: După parcurgerea acestui modul, veţi fi capabili:


• să enumeraţi proprietăţile distribuţiei normale
• să utilizeze distribuţiile teoretice în procesul de estimare a
parametrilor
• să estimaţi parametrii populaţiei pentru o distribuţie univariată
• să estimaţi parametrii populaţiei pentru o distribuţie bivariată

În acest capitol vom analiza principiile inferenţei statistice şi aplicaţiile acestora în


demersul de cercetare psihologică. Vom prezenta mai întâi principalele „ingredinte” ale
demersului inferenţial, conceptele cheie fiind cele de distribuţie normală, distribuţia mediilor şi
test statistic. Vom prezenta aspectele conceptuale cât şi aspecte de calcul.
În cele din urmă vom extinde raţionamentul utilizat pentru compararea a două medii şi la
situaţiile în care măsurarea a fost efectuată pe o scală nominală, adică la situaţi în care vrem să
estimăm frecvenţe în populaţie, având ca punct de plecare frecvenţele eşantionului.

6.1. PROPRIETĂŢILE DISTRIBUŢIEI NORMALE


După cum s-a arătat, datele obţinute în cursul unui experiment, a unei observaţii
sistematice sau anchete, constituie un eşantion pe care îl considerăm extras dintr-o “colectivitate”
mai largă sau populaţie. În final, extrapolăm de la eşantion la populaţie, extindem concluziile
asupra întregii colectivităţi vizate prin cercetare.

Să luăm câteva exemple:


1o. Ne propunem să determinăm, pe baza unor metode precizate, volumul vocabularului la
copiii de 5 ani. Prin enunţul ei, sarcina sau problema stabileşte populaţia pe care o avem în
vedere: copiii de 5 ani. Ancheta noastră nu poate cuprinde în mod practic decât o subcolectivitate
limitată, un eşantion de populaţie, în care un număr de N copii sunt aleşi la întâmplare.
Înregistrările făcute pe acest lot stabilesc un volum al vocabularului să zicem de 2024 de cuvinte.
Un alt cercetător, propunându-şi aceeaşi problemă, ajunge la o cifră uşor diferită, să zicem 1936
de cuvinte. Repetând procedura, un al treilea cercetător găseşte 2000 de cuvinte.
2o. Cerinţe de ordin practic ne impun determinarea procentului tulburărilor de vorbire în
clasele I-II, pentru a aproxima schema de organizare a reţelei logopedice.
Determinările efectuate pe câteva eşantioane ne evidenţiază un procent de circa 12-13 %.
Se ridică întrebarea dacă această frecvenţă caracterizează populaţia şcolară din clasele
menţionate.
3o. Pentru organizarea reţelei de învăţământ special se ridică problema estimării
proporţiei de deficienţi mintali pentru palierul de vârstă 6-7 ani. Determinările arată un procent de
circa 2%, dacă se consideră ca prag psihometric al debilităţii mintale IQ = 70. Dacă se fixează un
prag mai sever, evident procentul va fi mai mare.
Aceste diferenţe de la un eşantion la altul se datoresc hazardului şi se numesc fluctuaţii de
eşantionare. Situaţia este identică şi în alte condiţii. Compoziţia eşantioanelor prezintă variaţii,
diferenţe întâmplătoare în diferite studii pe aceeaşi populaţie. Dacă vom lua de pildă, şase clase
paralele de elevi dintr-o şcoală şi le vom supune aceleiaşi probe vom constata diferenţe sau
fluctuaţii în rezultatele obţinute de la o clasă la alta. Este vorba despre fluctuţii de eşantionaj
datorate factorilor aleatori. Un grup natural intact, luat în compoziţia sa dată, constituie un
eşantion la întâmplare, dacă nu au intervenit factori de selecţie controlaţi de noi.

Temă de reflecţie nr. 1


Să presupunem că într-o populaţie avem patru valori 1, 2, 3 şi 4. Cum va arăta
distribuţia mediilor dacă eşantioanele selectate vor avea N=2; dar dacă N=3?
Luând ca şi punct de plecare formula de definiţie a mediei descrieţi proprietăţile
statistice ale mediei. Pentru aprofundarea subiectului vezi în READER
documentul:
Bibliografie 13.pdf - Cohen_2001_Explaining Psychological Statistics - cap. 4.

Prelucrarea statistică, aşa cum am văzut, reduce datele brute la câteva valori caracteristice:
frecvenţe sau procente, medii, abateri standard etc. Se pune întrebarea: în ce măsură datele
obţinute sunt relevante pentru populaţie. Această operaţie se numeşte inferenţă statistică.
Datele obţinute asupra eşantionului se apropie de indicii adevăraţi ai populaţiei, această
apropiere sau aproximaţie fiind cu atât mai mare cu cât volumul eşantionului N este mai mare.
Practic, nu reuşim să determinăm exact indicii caracteristici ai populaţiei. Indicii
eşantionului constituie estimări ale parametrilor populaţiei. În exemplul ales mai sus, volumul
mediu m – stabilit pe baza studierii grupului de copii – reprezintă o estimare a mediei adevărate a
colectivităţii generale. Întrucât nu se pot cerceta toţi copiii de 5 ani ne bazăm în afirmaţiile
noastre pe datele asupra eşantionului cercetat. Luând ca bază indicii eşantionului, extrapolându-i
deci la populaţie, comitem o anumită eroare, a cărei valoare probabilă trebuie să fie, evident, cât
mai mică.
În felul acesta, în legătură cu indicii stabiliţi asupra eşantionului – medii sau frecvenţe –
se pune problema erorii probabile pe care o comitem bazându-ne pe ei în extrapolarea la
populaţie.
Raţionamentul se întemeiază pe proprietăţile distribuţiei normale, schiţate deja în capitolul
precedent în legătură cu semnificaţia abaterii standard. În psihologie, ca şi în alte domenii,
modelul distribuţiei normale este un model privilegiat, pentru că îl regăsim în numeroase situaţii.
S-a stabilit că ±2σ, mai exact ±1,96σ, în raport cu media acoperă 95% din rezultate
(elemente). Cu alte cuvinte, 95% din elemente cad în intervalul m ± 1,96σ, iar 5% cad în afara
acestui interval. Procentul de 5% se compune din 2,5%, respectiv 2,5% de o parte şi de alta a
mediei spre extremităţile distribuţiei. De asemena, s-a stabilit că 99% din rezultate (elemente)
sunt cuprinse în intervalul m ± 2,58σ , în timp ce 1% (0,5% + 0,5%) din elemente sunt exterioare
acestui interval. (Fig. 4.1.).

Figura 6.1. Proprietăţile distribuţiei normale

Pentru a evita o anumită variabilitate a situaţiilor se introduce o distribuţie – standard.


Variabila brută x se înlocuieşte cu variabila normată z pe baza formulei de transformare deja
amintite:
x−m
z= ,

prin care se împarte fiecare abatere de la medie (x – m) cu abaterea standard σ. Graţie
transformării amintite, orice distribuţie normală, are media egală cu zero şi varianţa egală cu 1.
Pentru această ultimă distribuţie s-a întocmit un tabel, care permite să avem proporţia de
elemente pentru care variabila este exterioară unui interval oarecare centrat pe medie.
Este vorba de tabelul legii normale reduse , care ne permite să vorbim în cele din urmă în
limbajul şanselor, al probabilităţilor. Variabila redusă | z | prezintă de regulă valori între 0 şi 3,00
(cu două zecimale). Figura 4.2 redă un exemplu pentru | z | = 1,00. Variabila iniţială x este
înlocuită cu variabila standardizată z, având m = 0. Din punctele z, respectiv - z, ridicăm
ordonatele corespunzătoare, care indică punctele de inflexiune ale curbei şi haşurăm spre cele
două extremităţi suprafaţa exterioară benzii cuprinse între cele două ordonate (Fig. 4.2).
Pentru | z | = 1,00 corespunde o valoare de 0,317, ceea ce înseamnă că pentru un element
extras la întâmplare din mulţime există 317 şanse dintr-o mie ca acesta să cadă în una din
suprafeţele haşurate – într-o parte sau alta- deci să-i corespundă o valoare | z | >1,00. Reţinem în
continuare două repere: pentru | z | =1,96 corespunde 0,05 , iar pentru | z | = 2,58 , valoarea
0,01.

Fig. 6.2.
Cu alte cuvinte, există 5 şanse din 100 ca unui element considerat la întâmplare din mulţime să-i
corespundă o valoare | z | > 1,96, după cum există o şansă din 100 ca | z | să fie mai mare decât
2,58. De aceste două repere, frecvent utilizate, se leagă deci şanse sau probabilităţi precizate: 5%,
respectiv 1%.
Rezumând: într-o distribuţie normală standard avem 95% din valorile z cuprinse între –
1,96 şi + 1,96; de asemenea avem 99% din valorile z cuprinse între –2,58 şi +2,58.
De aici se poate face pasul spre o distribuţie normală oarecare având media m şi abaterea standard
σ. Întrucât variabila standardizată z s-a obţinut – plecând de la variabila iniţială x – graţie
formulei:
x−m
z= ,

reiese că: a spune că z este cuprins între –1,96 şi +1,96 înseamnă a spune că
-1,96 < (x-m)/σ < 1,96
sau
(m – 1,96σ) < x < (m + 1,96σ),
ceea ce s-a enunţat la început.
Cu alte cuvinte, există 95% din valorile x interioare intervalului :
[m – 1,96σ; m +1,96σ],
după cum există 99% din valorile x interioare intervalului:
[m – 2,58σ; m + 2,58σ].
Afirmaţiile făcute anterior au devenit astfel propoziţii motivate.

Temă de reflecţie nr. 2


Care este relaţia dintre distribuţia mediilor selectate aleator şi distribuţia normală?
Luând ca şi punct de plecare formula de definiţie a mediei descrieţi proprietăţile
statisticile ale mediei. Pentru aprofundarea subiectului vezi în READER
documentul:
Bibliografie 13.pdf - Cohen_2001_Explaining Psychological Statistics - cap. 4.

6.2. PROBLEME DE ESTIMARE UNIVARIATĂ


Aşa cum s-a arătat, marcăm indicii eşantionului cu o bară aşazată deasupra m , f ,  , iar
parametrii populaţiei îi notăm în mod obişnuit: m, f, σ. Pornind de la indicii eşantionului stabilim
cu o anumită probabilitate valoarea parametrilor. În mod obişnuit nu putem determina exact
valoarea parametrului, ci stabilim un interval în care se găseşte cu certitudine practică parametrul
respectiv. Cu cât acest interval este mai mic, cu atât informaţia noastră asupra adevăratei valori în
populaţie este mai precisă . Se cere deci o concentrare a masei de probabilitate într-o regiune
restrânsă. Intervalul menţionat se numeşte interval de încredere.

6.2.1. Estimarea mediei populaţiei


Semnificaţia unei medii depinde pe de o parte de volumul eşantionului studiat (N), iar pe
de altă parte, de variabilitatea populaţiei (σ) din care s-a extras grupul dat. Cu cât volumul datelor
creşte, cu atât media devine mai stabilă şi deci mai reprezentativă.
S-a numit eroarea standard a mediei cantitatea σ/ N care se notează cu E. Aceasta ne

oferă un etalon pentru a evalua eroarea ce o comitem luând drept bază media eşantionului m în
locul mediei adevărate m a colectivităţii generale (pe care practic nu reuşim de cele mai multe ori
să o determinăm).
În relaţia de mai sus σ reprezintă abaterea standard a colectivităţii generale, care rămâne
aproape întotdeauna necunoscută, fiind înlocuită în calcule cu  determinată pe baza datelor
eşantionului (când N este destul de mare).
Reluând tabelul din tabelul 3.4, avem:
N=51; m = 13,17 ;  = 4,74 ;
Făcând înlocuirile:

4,74
E= = 0,66 .
51
În mod curent nu ne putem aştepta să determinăm valori punctuale pentru parametrii
populaţiei. În acest sens se stabilesc intervale. Pe baza erorii standard a mediei E se stabilesc
limitele între care se găseşte, cu o probabilitate dată adevărata valoare m a colectivităţii generale.
Aceste limite se numesc limite de încredere, iar intervalul delimitat de ele este intervalul de
încredere. Întrucât mediile prezintă distribuţie normală, se stabilesc drept limite de siguranţă : m -
1,96E şi m +1,96E.
În exemplul menţionat vom avea: L1 = 13,17 - (1,96 x 0,66) şi L2 = 13,17 + (1,96 x 0,66).
Efectuând înmulţirile obţinem: 13,17 +/- 1,29, adică 11,88 şi 14,46. Acestea sunt limitele între
care se găseşte aproape sigur (cu o probabilitate de 95%) adevărata medie m a colectivităţii
generale.Afirmând că media adevărată se va găsi între 11,88 şi 14,46 riscăm totuşi să greşim în
5% din cazuri.
Se obişnuieşte să se noteze şi riscul pe care ni-l asumăm de a greşi făcând o aserţiume sau
alta. Aceasta a căpătat denumirea de prag sau nivel de semnificaţie. Astfel, intervalul ( m -1,96E;
m +1,96E) se numeşte interval de încredere la pragul de p = 0,05, ceea ce înseamnă că în 5% din
cazuri adevărata medie se află în afara intervalului ales. În practică, se ia adeseori pragul p =
0,01, ceea ce indică riscul de a greşi în 1% din cazuri. Limitele de încredere vor fi atunci L1= m -
2,58E şi L2= m +2,58E.

Temă de reflecţie nr. 3


Care este relaţia dintre volumul eşantionului şi mărimea intervalului de încredere
estimate? Pentru aprofundarea subiectului vezi în READER documentul:
Bibliografie 15.pdf - Cohen_2001_Explaining Psychological Statistics - cap. 6.

6.2.2. Estimarea frecvenţelor la nivelul populaţiei


Transpunând noţiunile prezentate anterior, putem spune că eroarea - tip a frecvenţei este:

pq
E=
N
şi că limitele de încredere, la pragul de p = 0,05vor fi:

pq pq
( f − 1,96 ; f + 1,96 . )
N N
Practic, N fiind mai mare (>100), vom comite o eroare foarte mică înlocuind în calculul
limitelor de încredere pe p prin f , şi pe q prin 1- f. După înlocuire vom avea:

f  (1 − f ) f  (1 − f )
( f − 1,96 , f + 1,96 ).
N N
Exemplu (după Faverge)
Să considerăm un exemplu.
Într-o statistică a erorilor de la casierie s-au observat 134 de erori în plus şi 289 de erori
în minus. Frecvenţa f a erorilor în plus este:
134
f = = 0,32 (423 = 134 + 289).
423

Vom avea:
f (1 − f ) 0,32(1 − 0,32)
E= = = 0,020 .
N 423
La pragul de semnificaţie de p = 0,05, limitele de încredere se obţin calculând:
1,96 x 0,020 = 0,04.

Ele sunt:
0,32 + 0,04 = 0,36,
0,32 - 0,04 = 0,28.
Cu alte cuvinte, admiţând că eşantionul nostru face parte din cele 95% pentru care
parametrii se situează în intervalul de încredere, putem afirma că procentajul erorilor în plus va fi
cuprins între 36% şi 28%.

6.3. PROBLEME DE ESTIMARE BIVARIATĂ


În capitolele precedente s-a lucrat cu distribuţii având o singură variabilă. În cele ce
urmează ne referim la distribuţii bivariate. În legătură cu acestea, apare problema studierii
relaţiilor, a modului de asociere între procese şi atribute psihice. De pildă, sunt urmărite paralel
notele obţinute de elevi la matematică şi la fizică şi se constată că acestea prezintă de regulă
valori apropiate la aceiaşi elevi. Pe această bază se fac ipoteze cu privire la relaţia dintre
aptitudinile la matematici şi la fizică. Sau se aplică o serie de probe experimentale la aceeaşi
grupă de subiecţi şi se pune întrebarea dacă există vreo relaţie sau legătură între rezultatele
obţinute. Analiza acestor legături nu poate rămâne, desigur, la impresia generală. Se pune
problema de a evalua gradul de legătură dintre aceste variabile (rezultate), de a-l exprima
numeric. În acest scop se utilizează coeficienţi de corelaţie, pe care-i notăm cu r.
În studierea relaţiei dintre anumite înşuşiri plecăm de la variaţia simultană sau covarianţa
datelor şi căutăm să desprindem legătura sau modul lor de asociere pe baza unei analize
aprofundate. Corelaţia exprimă deci covarianţa a două sau mai multe variabile. Spre deosebire de
experiment, care dezvăluie relaţii cauză-efect, studiul de corelaţie nu ne oferă nemijlocit o măsură
a cauzalităţii, ci, pur şi simplu, una a modului de asociere, covarianţa unor însuşiri, urmând să se
dezvăluie prin aprofundare natura relaţiei. În timp ce într-un studiu experimental relaţia este
unidirecţională (x determină y), într-un studiu de corelaţie variabilele sunt date, nu manipulate, iar
relaţia nu este vectorizată. Variaţia simultană sau covarianţa notelor la matematici şi la fizică duc
la ideea unei aptitudini comune, în timp ce covariaţia rezultatelor la învăţătură şi în activităţile
aplicative la aceiaşi elevi ne face să ne gândim la însuşiri de caracter, cum ar fi sârguinţa,
disciplina, conştiinciozitatea, care s-ar afla în spatele acestui paralelism.
Determinarea corelaţiei se face luând în considerare de fiecare dată câte două variabile.
Spre exemplu, dacă avem trei variabile x, y şi z, vom calcula succesiv rxy, rxz, şi ryz.. Rezultatele
pot fi exprimate în date cantitative – pe care le putem numi "note" – ori sub formă de ranguri sau
poziţii într-o clasificare.
Protocolul brut sau tabelul de corespondenţă de la care plecăm cuprinde indivizii
(subiecţii) pe linii şi însuşirile sau variabilele pe coloane. În fişierul de date trebuie să avem bine
reperaţi subiecţii, pentru că se iau în calcule perechi de valori ale aceloraşi subiecţi.

Exemplu:
Vrem să studiem dacă există vreo legătură între CI al copiilor şi al părinţilor. Pentru
aceasta considerăm un lot de 10 copii, determinăm coeficientul lor de inteligenţă (CI) cu un test
acreditat şi, paralel, CI al mamelor (Tab. 4.1.):

Tabelul 6.1.
C.I. – copii (x) C.I. – mame (y)
S1 97 90
S2 104 96
S3 86 111
S4 120 150
S5 101 98
S6 115 110
S7 112 110
S8 136 124
S9 90 82
S10 99 107

Pentru a avea o idee sumară asupra legăturii dintre cele 2 variabile (CI-copil,
CI-mame) am putea reprezenta fiecare subiect prin câte un punct în plan în cadrul unui sistem de
coordonate. În diagrama de corelaţie (Fig. 4.3.) avem 10 puncte corespunzător celor 10 subiecţi.
Coordonatele fiecărui punct sunt valorile-perechi corespunzătoare, notate x şi y. Norul de puncte
rezultat are tendinţa de a se orienta – cu mici excepţii – de-a lungul unei drepte. Se spune că avem
de-a face cu o relaţie liniară, că cele două variabile au tendinţa de a se modifica paralel, în acelaşi
sens.

CI - mame (y)
160
* *
150
140
130 *
120 * *
110
100 * *
90 * *
00
*
00 90 100 110 120 130 140
CI - copil (x)

Fig. 6.3. Diagramă de corelaţie

Aşadar, având o distribuţie de două variabile, în legătură cu care ne punem problema


legăturii sau relaţiei dintre aceste variabile, începem prin a întocmi diagrama de corelaţie şi de a
aproxima pe baza acesteia aspectul norului de puncte rezultat.

y X y
X X X X
X X X
X X
X X X
X X X X
X X
X
X X X X
X
X
X
X

Fig.6.4 x Fig. 6.5. x


Dacă putem ajusta norul de puncte printr-o dreaptă, vorbim de o relaţie liniară. În particular,
acesta este tipul de relaţie mai frecvent postulat. Coeficientul de corelaţie poate lua valori între -1
şi +1 trecând prin zero. Când norul de puncte este orientat ca în figura 4.3. vorbim de o corelaţie
directă, pozitivă (r > 0), când norul de puncte este orientat invers (ca în figura 4.4.) vorbim de o
corelaţie negativă, inversă iar când aspectul norului de puncte nu sugerează nici o formă (se
orientează fără nici o ordine) vorbim de corelaţie nulă, eventual de intedependenţă (Fig. 4.5.).
Inspecţia vizuală a norului de puncte ne spune ceva despre forma relaţiei: rectiliniară,
curbiliniară, neliniară etc.Coeficienţii r mai des utilizaţi se întemeiază pe modelul relaţiei liniare.

Temă de reflecţie nr. 4


Un cercetător descoperă o relaţie curbiliniară între două variabile numerice, dar
decide să calculeze un coeficient de corelaţie linear. Cum va afecta aceaastă
decizie procesul de estimare a gradului de asociere?

Se cunosc două categorii de indici de corelaţie: coeficienţii de corelaţie parametrici şi


coeficienţii de corelaţie neparametrici.

6.3.1. Estimarea Coeficienţilor Corelaţie Parametrici

6.3.1.1 Coeficientul de Corelaţie Pearson


Expresia tipică a coeficientului de corelaţie este cea dată de Bravais - Pearson:
( x − m )( y − m1 )
r= ,
( x − m ) ( y − m1 )
2
2

în care x şi y sunt rezultatele obţinute în cele două probe sau înregistrări, iar m şi m1 reprezintă
mediile celor două distribuţii. Cantitatea de la numărător ( x − m )( y − m1 ) se numeşte suma
produselor. La numitor avem sume ale pătratelor abaterilor, care ne sunt cunoscute de la
calcularea dispersiei.
Să precizăm că având o distribuţie normală teoretică de 2 variabile x şi y, aceasta este
caracterizată prin valorile a 5 parametri: mediile şi varianţele distribuţiilor marginale şi
coeficientul de corelaţie r. Coeficientul de corelaţie Bravais - Pearson este cea mai bună estimare
a parametrului r.
Alături de formula de definiţie se propun formule de calcul care au inspirat deja programe
informatice. Posesorul unui calculator, respectiv al unor programe de prelucrare statistică datelor
poate recurge la serviciile ordinatorului care-l dispensează de operaţii laborioase de rutină.
Când asistenţa tehnică lipseşte este indicat să stăpânim tehnica de calcul. Acelaşi lucru
este necesar când dispunem doar de un calculator uzual cu cele 4 operaţii aritmetice, la care se
asigură ridicarea la pătrat, extragerea rădăcinii pătrate etc. În orice caz trebuie cunoscută
varietatea situaţiilor întâlnite în practica investigaţiilor psihologice pentru a decide ce coeficient
urmează să fie determinat în funcţie de natura datelor, de forma distribuţiei etc; de asemenea,
trebuie bine stăpânit modul de interpretare.
Pentru sumele de pătrate care figurează la numitor sunt cunoscute formulele de calcul:
T2
( x − m) = x 2 −
2
;
N
TT1
( y − m1 ) = y 2 −
2

N
Pentru suma produselor care figurează la numărător se stabileşte de asemenea, o formulă
de calcul:
TT1
( x − m )( y − m1 ) = xy −
N
Formula de calcul pentru coeficientul de corelaţie devine:
TT1
xy −
r= N
 2 T  2 T12 
2
 x −  y − 
 N  N 

După cum rezultă din această formulă, pentru determinarea valorii r trebuie să avem: x, y,
x2, y2, şi xy. În consecinţă se va întocmi un tabel având coloanele arătate.

Exemplu:
S-au înregistrat în paralel notele obţinute la matematici şi la fizică de către elevii unei
clase din învăţământul special cu un efectiv de 14 copii.
Pentru determinarea corelaţiei dintre cele două serii de note se întocmeşte tabelul de
calcul ( Tab.5. 2.)

Tabelul 6.2.
Subiecţi Nota la Nota la x2 y2 xy
matematică fizică y
x
A.G. 7 7 49 49 49
B.I. 9 8 81 64 72
C.D. 10 9 100 81 90
C.V. 6 7 36 49 42
D.A. 9 10 81 100 90
E.V. 8 7 64 49 56
F.I. 5 6 25 36 30
I.G. 3 4 9 16 12
I.M. 7 6 49 36 42
L.V. 8 7 64 49 56
M.I. 6 7 36 49 42
N.P. 7 7 49 49 49
O.G. 6 6 36 36 36
R.T. 5 6 25 36 30
N = 14 T = 96 T1 = 97 Σx = 704
2
Σy = 699
2
Σxy=696

Facem înlocuirile necesare în formulă (după datele din tabel):


96  97
696 −
r= 14 .
 96 
2
97 2 
 704 −  699 − 
 14  14 
Pentru ridicarea la pătrat a diferitelor numere şi pentru extragerea rădăcinii pătrate ne vom
servi de tabele matematice uzuale.
Efectuând calculele necesare, vom avea:
9312
696 −
r= 14 =
 9216  9409 
 704 −  699 − 
 14  14 
696 − 665,1
r= =
(704 − 658,3)(699 − 672 )
30,9 30,9
r= = = 0,88.
1233,9 35,1

Coeficientul de corelaţie găsit este destul de mare, ceea ce, în exemplul ales, este un fapt
cu totul firesc.
Valorile lui r pot fi situate între -1 şi +1, trecând prin zero care indică absenţa corelaţiei.
Dacă r este pozitiv, atunci vorbim de o corelaţie directă, pozitivă. În cazul acesta, dacă una din
variabile x creşte, atunci şi cealaltă variabilă y va avea tendinţa de a creşte în medie, ca în
exemplul de mai sus.
Când coeficientul de corelaţie este nul, se spune doar că variabilele x şi y ale distribuţiei
sunt necorelate, eventual independente.
Dacă r este negativ, atunci y va avea tendinţa de a varia în medie în sens invers lui x. În
acest caz corelaţia este negativă, inversă.
Dacă r = +1, atunci este vorba de o legătură funcţională liniară în sensul obişnuit al
cuvântului, y fiind exact determinat prin valoarea lui x.
Indicele de corelaţie în versiunea prezentată se utilizează când avem de-a face cu două
variabile continue, având registrul de variaţie suficient de nuanţat (diferenţiat).

Temă de reflecţie nr. 5


Care este valoarea corelaţiei care permite prezicerea exactă a valorii X cunoscând
valoarea lui Y?

6.3.1.2 Coeficientul de Corelaţie Biserial


Se pot ivi situaţii în care este vorba de o variabilă continuă pusă în paralel cu o variabilă
discontinuă, în particular dihotomică. În cazul acesta se utilizează un coeficient de corelaţie
biserial (rbis), care cere ca N să fie mai mare ca 50.
De pildă, în situaţiile referitoare la validitatea unui test se întâlnesc adesea situaţii în care
variabila-criteriu se prezintă numai sub două variante sau valori: admis/respins, bun/slab etc, în
timp ce variabila-test este continuă. Situaţii analoage se pot ivi şi în alte domenii.

Exemplu:
Înaintea unui examen de admitere la un curs de instruire profesională candidaţii au fost
supuşi unei testări psihologice. Cotele, obţinute la aceste probe, merg de la 0 la 10. Pe de altă
parte, la încheierea examenului de admitere rezultatele finale apar în formă dihotomică: o parte
din candidaţi au fost declaraţi admişi iar ceilalţi respinşi.
Notăm cotele la test cu x iar variabila-criteriu cu y. Se observă că variabila-test ia valori
între 0 şi 10 în timp ce variabila-criteriu este dihotomizată: admis/respins. Datele obţinute sunt
sintetizate în tabelul 5.3. (după J.M. Faverge). De notat că reuşita, respectiv eşecul nu permit o
nuanţare sau gradare mai fină.
Tabelul 4.3.
Cote 0 1 2 3 4 5 6 7 8 9 10 Total
la test

Rezultate
la examen
Admişi 0 1 0 3 5 10 16 11 6 3 1 59
Respinşi 1 2 4 7 13 12 9 4 2 - - 54
Total 1 3 4 10 18 22 25 18 8 3 1 113

Se poate stabili proporţia celor admişi în urma examenului:


59
p= = 0,52.
113

De asemenea, proporţia celor respinşi:


54
q= = 0,48.
113
Se observă imediat cum q = 1 – p.
Din acelaşi tabel se poate urmări ce rezultate au obţinut în cadrul testării psihologice
canditaţii declaraţi admişi, se face o medie a acestora rezultate, notată cu mp. De asemenea, se
poate face acelaşi lucru pentru categoria celor respinşi, notând media la test cu mq.
Formula de calcul este următoarea:
mp − mq pq
rbis = 
 y
În genere se notează cu mp media valorilor x pentru elementele clasei superioare (y > y0)
şi cu mq media valorilor x pentru elementele clasei inferioare (y < y0), y0 fiind punctul de tăietură
al variabilei. În formulă, y este ordonata corespunzătoare punctului de separaţie (unii autori o
notează cu z). Se menţionează în plus că σ este abaterea standard a rezultatelor (cotelor) obţinute
pq
în cadrul testării psihologice a întregului lot de candidaţi. De asemenea raportul se citeşte
y
dintr-un tabel special, luând ca reper fie p, fie q, pentru calcularea rbis şi rtris.
În exemplu dat:
359
mp = = 6,08;
media celor admişi: 59
241
mq = = 4,46;
media celor respinşi : 54
abaterea standard pe ansamblu:
σ = 1,88
pq
Valoarea = 0,6264 ( la q = 0,48).
y
Înlocuind în formulă vom avea:
6,08 − 4,46
rbis =  0,63 = 0,86  0,63 = 0,54
1,88

Când într-un studiu variabila y ne apare sub forma unei clasificări trihotomice - de
exemplu, buni, mijlocii şi slabi - în timp ce datele testării psihologice (x) se prezintă într-o formă
mai nuanţată- ca în exemplul precedent - atunci se utilizează pentru calculul corelaţiei o formulă
propusă de C. Burt:
m ' − m" 1
rtris =  ,
 y'
y"
+
p ' p"
în care, m' şi m" reprezintă mediile la test (x) pentru cei buni şi cei slabi: p' şi p" proporţia de
"buni", respectivi de "slabi"
(p' + p" < 1);
y' şi y" sunt ordonatele curbei normale reduse potrivit împărţirii în 3 categorii; σ abaterea
standard a distribuţiei complete a datelor la test (x).
y
Valorile rapoartelor sunt date într-un tabel special pentru calculul coeficientului de
p
corelaţie triserial luând ca reper p sau q. Figura 4.6. ilustrează sensul notaţiilor utilizate. Se
observă că grupul celor mijlocii nu intră în calcule.

Fig. 6.5.
6.3.2. Estimarea Coeficienţilor Corelaţie Neparametrici
Indicii de corelaţie examinaţi presupun ca o condiţie normalitatea distribuţiei în colectivitatea din
care s-a extras eşantionul. O asemenea cerinţă nu poate fi satisfăcută totdeauna. De aici,
necesitatea unor indici de corelaţie neparametrici.

6.3.2.1 Coeficientul de corelaţie φ


Se întâmplă uneori ca două distribuţii să fie dihotomice, nu datorită unei regrupări
(efectuate pentru simplificarea calcului), ci prin însăşi natura variabilei, adică prin operaţiile de
măsurare care o definesc.
În acest caz, coeficientul de corelaţie se notează cu φ şi necesită o anumită aşezare
caracteristică a datelor. Variabilele se pot nota cu -, + sau 0,1 (având semnificaţia de absenţă sau
prezenţă a caracteristicii respective).
Pe diagonală, conţinutul este de acelaşi sens (+ +,- -) sau (00,11). Deci, căsuţele de pe
diagonală sunt izotrope. Vom avea atunci, un tabel cu patru căsuţe ( Tab. 4.4.).
Totalul liniei respective notat cu litera (a) şi totalul coloanei notat cu litera (b).
Îl vom calcula pe φ după formula:
c − ab
=
a(1 − a)b(1 − b)

sau

2
=
N

Tabelul 4.4.
y 0 1

1 01 11
(c) (a)

0 00 10

0 1
(b)

Pentru calcularea lui φ ne interesează căsuţa (11) notatăcu litera (c);


De notat că se lucrează cu frecvenţe relative sau proporţii.
Exemplu (după Faverge):
Să presupunem că dorim să stabilim relaţia dintre iniţiativă şi rapiditatea adaptării la
situaţie. Vom nota pentru variabila rapiditate cu 1 prezenţa rapidităţii şi cu 0 absenţa ei; iar pentru
variabila iniţiativă vom nota cu 1 subiecţii cu iniţiativă şi cu 0 pe cei fără iniţiativă. Pe un lot de
144 de subiecţi (asupra cărora s-a făcut cercetarea) vom avea următoarea aşezare a datelor (Tab.
6.5.)
Tabelul 6.5.
Iniţiativă
0 1
30 50
Rapiditate 1 (c)
80
a=
0 55 9 144

59
b= T=144
144

Ne interesează semnificaţia proporţiei sau a procentului. Vom lucra cu frecvenţa relativă.

Avem:
80 59 50
a= = 0,55; b = = 0,40; c = = 0,34.
144 144 144
Înlocuind în formula lui φ vom avea:
0,34 − 0,55  0,40
=
0,55(1 − 0,55) 0,40(1 − 0,40)
Efectuând calculele obţinem:φ = 0,5.
Interpretarea lui φ se face ca şi cea a lui r, deoarece φ este în esenţă o variantăa lui r.

6.3.2.2 Coeficientul de corelaţie a rangurilor (ρ)


Corelaţia rangurilor (Spearman) ne interesează atunci când volumul eşantionului este
destul de mic (mai mic decât 30) sau când datele le avem sub formă de clasificări prin rang ale
subiecţilor. De pildă, într-o experienţă nu putem da o apreciere numerică rezultatelor obţinute de
diferiţi subiecţi, dar putem stabili care este primul, al doilea, al treilea etc, adică putem face o
clasificare prin rang. De pildă, dacă cerem unui profesor să-şi evalueze mai întâi elevii prin note,
apoi prin ranguri (care este primul, al doilea ... ), reluând operaţia de mai multe ori vom constata
că notele diferă în anumite limite de la o evaluare la alta, în timp ce rangurile atribuite în
ierarhizări succesive sunt mult mai statornice.
Când efectivul grupei (N) este mai mic decât 30, înlocuim notele prin ranguri, aşezând
subiecţii în ordinea rezultatelor. Dacă doi subiecţi au aceeaşi notă, se atribuie fiecăruia un rang
intermediar (de exemplu, dacă doi elevi se situează după notă pe locul 2, li se atribuie rangul 2,5,
intermediar între 2 şi 3). Trebuie să existe puţine cazuri de acest gen pentru a fi valabilă operaţia
de calcul.
Când rezultatele sunt exprimate nu prin note ci prin ranguri, atunci ne bazăm pe
clasificărule întocmite sub cele două aspecte. Fiecare subiect are două ranguri, unul pentru fiecare
aspect sau probă din cele considerate. Diferenţele între rangurile obţinute în cele două clasificări
ne pot furniza o indicaţie asupra corelaţiei (legăturii) dintre cele două aspecte (variabile).
Calculele au loc asupra diferenţei între cele două ranguri, mai precis asupra pătratului acestor
diferenţe. Formula ce se aplică pentru determinarea coeficientului respectiv - notat cu ρ (ro) - este
următoarea:
6d 2
 = 1−
(
N N 2 −1 )

unde s-a notat cu d diferenţa de rang.


Cu cât diferenţele sunt mai mari (în valoare absolută), cu atât este vorba de o
discordanţă mai mare între rezultatele obţinute sub cele două aspecte, iar ipoteza unei legături
între cele două variabile este mai puţin plauzibilă.
Pentru determinarea coeficientului de corelaţie ρ se întocmeşte un tabel cu 5 coloane (Tab.
6.5.)

Tabelul 6.5.
Clasificarea după
Subiecţi frecv. Control (x) Calitate (y) d d2
A. L. 1 4 -3 9
U. C. 2 2 0 0
M. G. 3 10 -7 49
B. D. 4 5 -1 1
C. I. 5,5 1 4,5 20,25
P. L. 5,5 3 2,5 6,25
M. I. 7 8,5 -1,5 2,25
F. M. 8 8,5 -0,5 0,25
O. I. 9 7 2 4
R. V. 10 6 4 16
N = 10 Σd2 = 108,00
În prima coloană se enumeră subiecţii, eventual în ordinea indicată de prima clasificare; în
coloana a doua şi a treia se trec rangurile obţinute de fiecare subiect în cele două clasificări; în
coloana a patra se notează diferenţele, iar în coloana a cincea se calculează pătratele acestor
diferenţe.

Exemplu (după I. Radu):


S-a urmărit, în cadrul activităţilor practice, în ce măsură frecvenţa ridicată a operaţiilor de
control se răsfrânge pozitiv asupra calităţii produsului finit. În acest scop s-a întocmit o
clasificare a elevilor după frecvenţa controlului produsului obţinut. Rezultatele sunt cuprinse în
tabelul 5.6.
După cum ne indică formula de calcul, însumarea se face numai pentru coloana d2. În
cazul dat Σd2 = 108.
În continuare se fac înlocuirile necesare.
Se înmulţeşte mai întâi Σd2 cu 6 iar produsul obţinut se împarte la N(N2 - 1), unde
N reprezintă numărul subiecţilor. Când lucrăm cu tabele matematice este mai uşor să calculăm N3
- N, care nu este altceva decât N(N2 - 1).
În exemplul dat efectuăm:
6d 2 6  108 648
1− =1− 3 = 1− = 1 − 0,64 = 0,36.
N −N
3
10 − 10 990
Coeficientul de corelaţie obţinut este 0,36, fapt explicabil prin discordanţa destul de mare
a rangurilor în cele două clasificări. Ipoteza produsului nu a fost confirmată. De fapt, grupul de
studiu este mic, astfel încât problema comportă investigaţii suplimentare.
Ca şi r, coeficientul de corelaţie ρ poate avea valori între -1 şi +1. Valorile foarte mici ale
lui ρ, apropiate de zero, nu sugerează ipoteze determinate. În anumite cazuri este indicată mărirea
efectivului grupei (N) pentru a obţine corelaţii semnificative. Există tabele de echivalare între ρ şi
r, care permit interpretarea corectă a valorilor r (Tab. 4.6.).
De notat: valorile r şi ρ aparţin variabilelor ordinale. Nu se calculează deci media lor, ci se
ia mediana dintr-o colecţie de valori r referitoare la aceeaşi temă.

Tabelul 6.6
Ρ r
0,00 0,000
0,10 0,105
0,20 0,209
0,30 0,313
0,40 0,416
0,50 0,518
0,60 0,618
0,70 0,717
0,80 0,813
0,90 0,908
0,95 0,954
1,00 1,000

6.4. INTERPRETAREA UNUI COEFICIENT DE CORELAŢIE

( )
În practică se stabilesc coeficienţi de corelaţie r ,  ..... plecând de la datele unor
eşantioane. Se pune întrebarea, în ce măsură coeficienţii stabiliţi în acest fel se apropie de
coeficientul de corelaţie r sau ρ ce caracterizează colectivitatea generală din care s-a extras
eşantionul sau grupul dat?
Stabilirea unui interval de siguranţă nu prezintă aici nici un interes deosebit şi se
utilizează un alt procedeu.
Întrebarea care se pune este următoarea: un coeficient de corelaţie găsit în mod
experimental permite oare să enunţăm existenţa unei corelaţii reale sau nu? Alternativa este
ipoteza nulă: r = 0. În acest scop, se introduce coeficientul de corelaţie critic, care reprezintă
valoarea minimă ce trebuie să o ia un coeficient de corelaţie experimental pentru a fi socotit
semnificativ.
S-a întocmit în acest sens un tabel special care stabileşte coeficienţii de corelaţie critici
pentru diferitele praguri de semnificaţie şi pentru diferite valori ale lui n = N - 2. Întrucât
coeficienţii de corelaţie pot fi negativi, tabelul dă valorile absolute ale coeficientului critic.
Să luăm ca exemplu coeficienţii de corelaţie: r = 0,88, r = 0,71 şi r = 0,21 . În primul caz,
efectivul grupului (N) a fost 14, în al doilea 51, iar în al treilea caz 12.
Se pune întrebarea dacă aceşti coeficienţi indică o corelaţie reală sau nu; cu alte cuvinte,
dacă pot fi consideraţi semnificativi sau nu? Ipoteza alternativă este ρ = 0.
Pentru a vedea acest lucru, citim în tabelul valorilor semnificative pentru│r│. Prima
coloană cuprinde diferite valori ale lui n = N-2. Celelalte coloane indică coeficienţii de corelaţie
minimi la diferite praguri de semnificaţie (p = 0,10, p = 0,05, p = 0,01) corespunzător
valorilor lui n.
Temă de reflecţie nr. 6
Care sunt factorii care influenţează semnificativitatea unui coefficient de corelaţie?

În primul exemplu N = 14, deci n = N – 2 = 14 – 2 = 12. Citim în tabel, în dreptul lui n =


12 valorile semnificative a lui│r│ şi ne oprim la cifra cea mai apropiată de coeficientul găsit de
noi (0,88). Pentru a urmări mai bine operaţia, facem un extras din Anexa (Tab 4.7. ).

Tabelul 4.7.
n p = 0,10 p = 0,05 p = 0,02 p = 0,01

12 0,46 0,53 0,61 0,66

Observăm că la pragul de semnificaţie cel mai riguros p = 0,01 se indică drept coeficient
de corelaţie critic 0,66. Or, coeficientul găsit de noi este mult mai mare, ceea ce înseamnă că este
semnificativă.

Rezumat
În cercetarea psihologică modelul consacrat este cel al investigării la nivelul eşantioanelor
urmat de extrapolarea la nivelul populaţiei, proces denumit inferenţă. În cadrul inferenţei
statistice se disting două tipuri de probleme: probleme de estimare, respectiv probleme de
comparaţie. Problemele de estimare, permit pe baza unui indice obţinut la nivelul eşantionului
estimarea cu o anumită probabilitate a intervalului în care se află parametrul pentru populaţie.
Demersul de estimare se poate extinde şi la distribuţiile bivariate, pentru a estima parametrii
acestor distribuţii.
Bibliografie minimală pentru acest modul
READER Curs Psihologie Experimentală și Metode de Analiză a Datelor

Bibliografie facultativă
Abdi H. (1987). Introduction ou traitemant statistique des données expérimentale, Grenoble:
Presses Universitaire de Grenoble.
Cohen, B. (2001) Explaining Psychological Statistics. Second Edition. New York: Wiley.
Faverge, J.M. (1965). Méthodes statistiques en psychologie appliquée. t.III, Paris, P.U.F.
Jaccard J & Becker, M. (1997). Statistics for the behavioral sciences (third edition), Brooks, Cole
Publishing Company, Pacific Grove.
Radu, I. şi colab. (1993) Metodologie psihologica si analiza datelor, Cluj-Napoca, Ed. Sincron.
Rouanet, H., Le Roux, B., Best, C. (1987). Statistique en sciences humaines: procedures
naturelles, Paris, Bordas.
Spence, J., Underwood, B.J., Duncan, C.P., Cotton, J.W. (1968). Elementary statistics, New
York, Appleton
ANEXE

Bibliografia completă a cursului3

Abdi H. (1987). Introduction ou traitemant statistique des données expérimentale, Grenoble:


Anderson H. Norman (2001) Empirical Direction in Design and Analysis. Routledge, USA
Chalmers Alan (1999) What is this thing called science? Hackett Publishing Company, Inc.
Indianapolis.
Cohen, B. (2001) Explaining Psychological Statistics. Second Edition. New York: Wiley.
Derry Gregory (1999) What Science Is and How It Works. Princeton Univerity Press, New Jersey.
Faverge, J.M. (1965). Méthodes statistiques en psychologie appliquée. t.III, Paris, P.U.F.
Heiman, G., W., (2001) Understanding Research Methods and Statistics: an integrated
approach. Houghton Mifflin Company, Boston.
The Stanford Encyclopedia of Philosophy (2008) Science and Pseudo-Science.
http://www.lse.ac.uk/collections/lakatos/scienceAndPseudoscience.htm
Jaccard J & Becker, M. (1997). Statistics for the behavioral sciences (third edition), Brooks, Cole
Publishing Company, Pacific Grove.
Lakatos Imre (1973) Science and Pseudoscience. Presses Universitaire de Grenoble.
Radu, I. şi colab. (1993) Metodologie psihologica si analiza datelor, Cluj-Napoca, Ed. Sincron.
Rouanet, H., Le Roux, B., Best, C. (1987). Statistique en sciences humaines: procedures
naturelles, Paris, Bordas.
Spence, J., Underwood, B.J., Duncan, C.P., Cotton, J.W. (1968). Elementary statistics, New
York, Appleton
Stanovich Keith (2001) How to think straight about psychology. Allyn & Bacon, Boston
Stevens, S.S. (1951). Matematics, measurement, and psychopsysics. În Handbook of
experimental psychology, ( ed. S.S. Stevens), New York, Wiley.
Wynn M. Charles and Wiggins W. Arthur (2001) Quantum leaps: Where Real Science Ends ...
and Pseudoscience Begins. Joseph Henry Press Washington, D.C.

3 Titularul cursului îşi rezervă dreptul ca pe parcusului semestrului să mai adage noi surse bibiografice în
funcție de accesul la/ şi apariția noilor materiale de specialiate.
3.1.Glosar

"Moartea experimentală" - "pierderea" unor subiecţi pe parcursul deşfăşurării experimentului,


datorită oboselii, lipsei de motivaţie etc.
Abatere standard – măsură a dispersiei unei colecţii de valori
Analiza datelor - procesul de căutare şi sumarizare a datelor cu scopul de a extrage informaţia
relevantă şi de a elabora concluzii pe baza acesteia
Analiza de varianţă (ANOVA) – colecţie de modele statistice şi procedurile asociate acestora, în
care varianţa observată este divizată în componente corespunzătoare diferitelor variabile
explicatorii. Scopul analizei de varianţă (ANOVA) este de a testa semnificativitatea
diferenţelor între medii prin compararea (analiza) varianţelor
Amplitudine – diferenţa dintre scorul cel mai mare şi scorul cel mai mic
Autoobservaţia – observaţia aplicată asupra propriei persoane, ceea ce înseamnă nu numai
(introspecţia) cunoaşterea gândurilor, sentimentelor şi aspiraţiilor intime, ci şi cunoaşterea prin
activitatea proprie, din succese şi eşecuri, din actele relaţiilor cu semenii, din încercările vieţii
etc.
Cercetare – activitate umană intelectuală bazată pe investigarea într-un anumit domeniu.
Principalele scopuri ale cerecetării aplicate sunt descoperirea, interpretarea şi dezvoltarea unor
metode şi sisteme menite să genereze cunoaştere într-o varietate de domenii ştiinţifice.
Cercetarea poate utiliza metoda ştiinţifică, dar nu în mod obligatoriu. Aceasta oferă informaţii
ştiinţifice şi teorii explicative ale universului care ne înconjoară.
Chestionar – instrument de cercetare alcătuit dintr-o serie de întrebări şi alte componente menite să
culeagă informaţii de la respondenţi
Coeficient de corelaţie – indică puterea şi direcţia unei relaţii liniare între două variabile aleatoare
Coeficientul de concordanţă K (Cohen) – verifică fidelitatea evaluării unor comportamente
realizate prin intermediul unei grile de observaţie
Colecţie de date - un fragment reprezentativ din mulţimea datelor sau măsurătorilor posibile.
Cote standard z – scorul standard indică cu câte abateri standard o observaţie este deasupra sau sub
medie
Covarianţă – măsură care indică cât de mult două variabile se modifică împreună
Curba normală – reprezentarea grafică a unei distribuţii normale, având media 0 şi varianţa 1
Date – măsurătorile răspunsurilor la anumite nivele date ale factorilor de interes
Degradarea instrumentelor de măsură - între două sau mai multe măsurări repetate, validitatea
instrumentului de măsurare scade
Design experimental – design-ul colectării tuturor informaţiilor unde varianţa este prezentă,
indiferent de controlul total sau parţial al experimentatorului
Distribuţia normală - valorile efectivelor situate de o parte şi de alta a clasei cu efectivul maxim
sunt egale sau diferă destul de puţin între ele
Distribuţia simetrică - sinonim al distribuţiei normale
Efectul compensării - efortul compensatoriu pe care îl pot manifesta membrii grupului de control
simţindu-se frustraţi că nu fac parte din grupul experimental.
Efectul de maturare - diferenţele dintre două măsurări repetate ale aceloraşi subiecţi se pot datora
maturării ce a avut loc pe parcursul experimentului, nu manipulării experimentale.
Efectul difuziunii - răspândirea efectului manipulării de la grupul experimental la cel de control.
Efectul resemnării - subiecţii din grupul de control pot obţine rezultate mai slabe datorită
demotivării ce o resimt ca urmare a excluderii lor din grupul experimental.
Efectul testării repetate - diferenţele de scoruri dintre mai multe măsurări succesive se pot datora
administrării repetate a aceluiaşi test
Eroarea standard a mediei – reprezintă abaterea standard teoretică a tuturor mediilor eşantioanelor
de mărime n extrase dintr-o populaţie şi depinde de varianţa populaţiei (sigma), cât şi de
mărimea eşantionului (n)
Experiment – studiu manipulativ care implică aplicarea uneia sau a mai multor intervenţii în
condiţii controlate. Unde este posibil, intervenţia este atribuită aleator eşantioanelor, iar
efectele observate sunt comparate cu cele ale grupelor de control
Grade de libertate – numărul de piese de informaţie independente necesare măsurării componenţei
varianţei, extrasă din totalul numărului de piese care contribuie la această varianţă
Grilă de observaţie - o listă de rubrici care să ofere cadrul de clasificare a datelor brute.
Indicii tendinţei centrale – se referă la măsura valorii de mijloc a setului de date
Ipoteza nulă (H0) – ipoteza testabilă statistic care asumă că nu există un patern în datele testate, iar
diferenţe obţinute se datorează aleatorului . Ipoteza nulă este testată în statistică pentru a
determina în ce măsură datele justifică investigarea unei ipoteze alternative.
Ipoteză specifică (Hs) – Ipoteza care descrie modelul statistic ce urmează a fi testat
Măsurare - operaţie prin care se atribuie numere datelor discrete sau continue ce urmează a fi
evaluate.
Media – reprezintă suma scorurilor impărţită la numărul acestora
Mediana – reprezintă numărul care separă jumătatea superioară a eşantionului, a populaţiei sau a
unei distribuţii probabilistice, de jumătatea inferioară
Modul – valoarea care apare cel mai frecvent într-un set de date sau într-o distribuţie probabilistică
Observaţia curentă - ocazională, practicată de profesor în clasă, de inginer în întreprindere, de
ziarist în viaţa socială etc.
Observaţia sistematică - urmăreşte înregistrarea obiectivă a faptelor, înscriindu-se într-un program
explicit, ce restrânge câmpul studiat şi impune selectarea datelor relevant
Regresia statistică - tendinţa de regresie spre medie a scorurilor extreme odată cu repetarea unei
măsurări.
Scală de interval – numerele indică amplitudinea diferenţei dintre itemi, dar scala nu conţine
punctul „zero absolut”
Scală de măsurare – procesul de măsurare sau ordonare a entităţilor in funcţie de atributele
cantitative sau alte caracteristici
Scală de proporţii – numerele indică amplitudinea diferenţelor şi scala are fixat un punct „zero
absolut”. Proporţiile pot fi calculate.
Scală nominală - clasificarea sau repartizarea datele (rezultatele), după o serie de nume sau
categorii diferite (disjuncte), astfel încât fiecare element (răspuns, observaţie etc.) să-şi
găsească locul într-o categorie şi numai într-una singură.
Scală ordinală – numerele indică poziţia relativă a itemilor, dar nu amplitudinea diferenţelor
Semnificativitate statistică - indică faptul că există dovezi statistice care susţin o anumită diferenţă.
Nu înseamnă neapărat că diferenţele trebuie să fie mari sau de importanţă ridicată şi nici nu
este echivalentul expresiei folosite în limbajul comun
Statistică – ştiinţă matematică care se ocupă cu colectarea, analizarea, interpretarea explicarea sau
prezentarea datelor, precum şi cu predicţia bazată pe aceste date
Statistică descriptivă – utilizată pentru descrierea trăsăturilor de bază ale datelor culese dintr-un
studiu experimental. Împreună cu analiza simplă a graficelor, formează baza tuturor analizelor
cantitative de date
Teorie – un model testabil al modului de interacţiune a unui set de fenomene naturale, capabil să
prezică acţiuni viitoare, cu posibilitatea de a fi testat prin intermediul experimentului sau de a
fi verificat prin observaţii empirice
Testul psihologic - o situaţie experimentală standardizată, servind drept stimul unui comportament.
Valoare critică – este valoarea corespunzătoare unui prag de semnificaţie. Această valoare
determină într-un test statistic limita dintre acele eşantioane care duc la respingerea ipotezei
nule şi acele eşantioane care duc la nerespingerea ipotezei nule.
Variabilă dependentă (VD) – este acea variabilă care se modifică ca răspuns la variabila
independentă
Variabilă independentă (VI) - orice stimul care poate avea o influenţă relevantă (cauzală) asupra
unor prestaţii sau comportamente, care devin variabile dependente (VD).
Varianţă – dispersia datelor măsurată ca şi media abaterilor la pătrat de la valoarea expectată
(media)
3.2. Scurtă biografie a titularului de curs

Conf. univ. dr. Robert Balazsi este cadru didactic al Departamentul de Psihologie din
cadrul Universitatii Babes Bolyai. Domeniile sale de competenţă sunt: metodologia cercetării şi
analiza datelor (nivel de bază şi avansat). A publicat ca autor sau coautor studii stiintifice in
reviste de specialitate, indexate ISI, recenzate in baze de date internaţionale şi/sau recunoscute
CNCSIS; în domeniul cercetării psihologie cognitive (memoria de lucru şi funcţii executive) şi
psihologiei sănătăţii (activitate fizică şi timp liber, etc). A publicat cărţi în calitate de couator în
domeniul metodologiei cercetării, psihologiei cognitive, psihologiei sănătăţii, politici de cercetare
(vezi www.psychology.ro).

S-ar putea să vă placă și