Marian Popa
Ajuni la sfritul tematicii care face obiectul acestei introduceri n statistica psihologic aplicat, se
cuvine s aruncm o privire de ansamblu asupra semnificaiei generale a utilizrii metodei statistice. Acest
lucru ne va fi util pentru exploata n mod corect i eficient fora probatorie a testelor statistice, fr a ne lsa
subjugai de iluzia infailibilitii lor.
Dou sunt aspectele care merit o atenie special din acest punct de vedere:
A. alegerea testului statistic n raport cu datele disponibile i ipoteza cercetrii
B. integrarea analizei statistice n documentul de cercetare
Se recolteaz datele cercetrii, avnd grij s fie respectate toate condiiile i criteriile care s
asigure corectitudinea acestora. Orice eroare n aceast faz (n special cu privire la constituirea
eantionului dar i legat de motivarea subiecilor, corectitudinea nregistrrilor, etc.) se vor
traduce n dificulti insurmontabile n faza de prelucrare i analiz a datelor. n cazul nostru, se
va acorda constituirii grupurilor de studiu, avnd grija ca acestea s nu difere sub aspectul unor
aspecte care pot influena efectul relaxrii (vrst, nivel de instruire, sex, severitate a bolii, etc.).
4. Se sintetizeaz datele cercetrii i se trece la prelucrarea acestora. Fazele obligatorii ale acestor
prelucrri sunt urmtoarele:
Din cele prezentate, rezult faptul c alegerea testului statistic este ultima i nu prima dintre
problemele pe care trebuie s i le pun cercettorul. Dac toate celelalte faze au fost urmate n succesiunea
lor fireasc, alegerea testului statistic devine o problema relativ simpl. Principalele componente ale
algoritmului de selectare sunt urmtoarele:
1) Se identific variabila independent
2) Se identific variabila dependent
a) daca este de tip nominal/ordinal, se aplic un test neparametric
b) dac este de tip interval/raport
i) dac respect condiiile i dac, mai ales, eantionul este mare, se recomand alegerea
unui test parametric
ii) dac nu respect condiiile i, mai ales, eantionul este mic, se recomand alegerea
unui test neparametric (n acest caz valorile vor fi transformate pe o scal nminal sau
ordinal, n funcie de caracteristicile lor i opiunea cercettorului)
3) Se precizeaz obiectivul cercetrii care poate fi, cel mai adesea:
a) Diferena dintre grupuri dependente sau independente (ca n exemplul nostru). Acest
model este mai potrivit n urmtoarele situaii:
i) atunci cnd variabila independent, prin natura ei, se exprim n categorii naturale
(de ex., categorii de vrst, familii divorate/nedivorate, sexul, etc.)
ii) atunci cnd variabila independent exprim valori care nu evolueaz ntr-o manier
liniar (de ex., prezen/absen, diagnostice psihiatrice, tipuri temperamentale)
iii) atunci cnd variabila independent este manipulat
n acelai timp, este de reinut c nu este recomandabil s se transforme o variabil de
interval/raport, care are o distribuie acceptabil, ntr-o variabil categorial, deoarece se
pierde din puterea statistic a testelor.
b) Gradul de asociere. Acest model de cercetare este recomandabil atunci cnd avem de a
face cu variabile msurate simultan sau succesiv pe aceiai subieci (modele de tip
nainte-dup, intrasubiect), sau pe subieci aparinnd unor eantioane perechi.
Cteva recomandri utile pentru acest aspect:
Atunci cnd, att v. independent ct i v. dependent sunt de acelai tip (cantitative sau
calitative), obiectivul obinuit este gradul de asociere
Atunci cnd v. independent este de tip categorial (nominal sau ordinal), iar v. dependent
este de tip cantitativ, obiectivul obinuit este diferena dintre grupuri (categorii)
4) Se alege testul statistic adecvat
Ce este de preferat, test parametric sau test neparametric?
Dac variabila dependent este msurat pe scal nominal sau ordinal, problema alegerii nu se
pune, singurele teste aplicabile fiind cele neparametrice. Atunci cnd variabila dependent este exprimat pe
o scal cantitativ (interval/raport), dac ntrunete condiiile impuse de statistica parametric, este
recomandabil s se utilizeze teste parametrice. n acest caz ns trebuie avute n vedere dou aspecte:
- Situaia n care variabila dependent cantitativ nu respect condiiile testelor parametrice, n
raport cu care exist dou soluii:
se vor efectua verificri pentru eventuala corecie de valori, tratarea valorilor lips,
transformri parametrice, urmate de utilizarea testelor parametrice
o se transform variabila dependent pe o scal de tip nominal sau ordinal, urmat de
aplicarea unor teste neparametrice adecvate
Luarea n considerare a mrimii eantionului. Teorema limitei centrale ne asigur cu privire la
normalitatea distribuiei de eantionare pentru eantioane care depesc N=30. Pentru eantioane
de volum mediu (apropiat de 30 de valori), testele parametrice sunt mai sensibile la respectarea
condiiilor impuse i, de aceea, utilizarea testelor neparametrice pare a fi o soluie mai bun. n
practic, se va avea n vedere faptul c testele statistice, att cele parametrice ct i cele
neparametrice, efectuate pe eantioane reduse, sub N=20, nu ofer rezultate robuste iar
credibilitatea lor este ndoielnic. Eantioanele mici nu conin suficient informaie care s
permit fundamentarea unei inferene statistice suficient de sigure i cu putere de generalizare.
Studiile pe eantioane de acest gen pot avea o valoare de studii pilot n vederea deciziei de a
lansa sau nu studii de amploare pe o anumit tem.
o
Scala de
msurare
nominal
ordinal
I/R
nominal
ordinal
I/R
Msura variabilitii
nominal
ordinal
I/R
Condiie
Simetric
Asimetric
Simetric
Asimetric
Soluie
tabela de frecvene
grafic de tip bar
distribuie de frecvene
grafic de tip bar
distribuie de frecvene
Histogram
Poligon
Mod
Median
Medie
Median
numr categorii
Amplitudinea
abaterea standard
Amplitudinea
Mai jos prezentm mai jos un algoritm sintetic ale crui pai sunt: obiectivul cercetrii i scalele de
msurare pentru variabila independent i variabila dependent (n cazul n care avem cte o singur
variabil din fiecare tip).
Am cuprins n tabel, cu o singur excepie, doar testele statistice tratate n acest volum. Desigur,
numrul testelor statistice este mult mai mare, fapt care poate face necesar dezvoltarea algoritmului de
alegere a testelor.
Obiectivul
cercetrii
Variabila
independent
una
Variabila
dependent
-
independente
Diferena
dintre
grupuri
dou
Categorial
(nr. categ.)
dependente
independente
trei+
dependente
Asocierea
variabilelor
Interaval/Raport
Ordinal
Categorial (Nominal sau Ordinal)
Testul statistic
aplicabil
I/R
z/t pentru un eantion
Nominal z pentru o proporie
I/R
t pt. eant. independente
Nominal z pentru dou proporii
Ordinal
Mann-Whitney U
I/R
t pt. eant. dependente
Nominal testul semnului
Ordinal
Wilcoxon
I/R
ANOVA unifactorial
Ordinal
Kruskal-Wallis
ANOVA pt. msurri
I/R
repetate (netratat aici)
Ordinal
Friedman
I/R
r Pearson
Ordinal
rs Spearman
Categorial Chi-ptrat
(N/O)
Testul exact Fischer
Populaia. Interpretarea rezultatelor unui studiu depinde de caracteristicile populaiei pentru care se
intenioneaz analiza. Populaia trebuie definit cu claritate, n sensul elementelor care o compun. Nu trebuie
uitat sensul statistic al conceptului de populaie, care se refer nu att la indivizi umani, ct la totalitatea
valorilor unei caracteristici care i definete i care face obiectul analizei. Cu alte cuvinte, populaia nu
trebuie privit ca o clas de obiecte ci ca o colecie de date care descriu o anumit caracteristic a
respectivelor obiecte. Desigur, n cele din urm rezultatele statistice se vor extrapola la nivelul unei populaii
constituit din indivizii pentru care respectiva caracteristic a fost msurat.
Eantionul. Se va descrie modul de constituire a eantionului, insistndu-se pe criteriile de includere
i, eventual, de excludere a unor indivizi (sau valori). Dac eantionul este stratificat (dup provenien, sex,
etc.), se vor descrie criteriile de stratificare i volumul de subieci pentru fiecare subgrup.
Prezentarea metodei i a condiiilor investigaiei, precum i a lotului de subieci
Variabilele. Variabilele analizate vor fi descrise n mod explicit, indicndu-se denumirea i
semnificaia fiecreia, modul n care au fost msurate i unitatea de msur. Atunci cnd declarm o
variabil, precizm implicit i domeniul valorilor valide. Dac, de exemplu, definim o variabil care poate
lua valori pe o scal de la 1 la 7 (pe o scal cu rspunsuri predefinite), orice valoare dincolo de domeniul
respectiv va fi eronat. Modul de denumire al variabilelor este important. Astfel, n loc de inteligen este
de preferat denumirea de rezultat la testul de inteligen. Aceasta, pentru c inteligena este o realitate
oricum mai complex dect ceea ce msurm printr-o anumit variabil. Cu alte cuvinte, excesiva
generalizare a variabilelor trebuie evitat.
Instrumentele de msurare. Este recomandabil s fie prezentate cu o descriere (cel puin) sumar,
inclusiv cu caracteristicile lor psihometrice (validitate, consisten intern). Dac este vorba de un aparat sau
de un program de calculator, se vor indica tipul si, eventual, sursa, pentru a putea fi cutate i de ali
cercettori care vor dori s efectueze o replicare a respectivului studiu.
Procedura. Prezentarea modului n care a decurs procedura de investigare, descrierea condiiilor, a
duratei, locului, i a personalului care a contribuit la aceasta.
Prelucrarea datelor
Se va ncepe cu eventualele complicaii care au survenit pe parcursul studiului. Aici se includ datele
lipsa (care nu au putut fi recoltate, din diverse motive), modul de rezolvare a valorilor excesive din cadrul
distribuiilor, dificultile de organizare care au putut influena calitatea informaiilor recoltate, etc. n
general, orice aspect relevant care se refer la abaterea de la condiiile prevzute pentru desfurarea
studiului trebuie prezentate.
Analiza primar. Analiza statistic va ncepe ntotdeauna cu o inspecie a valorilor obinute. Aceasta
nseamn analiza distribuiilor sub aspectul formei, indicatorilor tendinei centrale, valorilor excesive, etc.
Ignorarea acestui aspect poate conduce la grave erori de interpretare, sau la un volum mai mare de munc,
ulterior, dac se constat prea trziu imperfeciuni care trebuiau fi eliminate de la bun nceput. Reprezentarea
grafic a datelor (histograma) poate fi o metod foarte eficient de identificare a distribuiilor anormale sau
valori improprii.
Scopul acestei analizei primare a variabilelor este dublu:
Obinerea unei imagini de ansamblu a variabilelor de interes (frecvene, tendina central,
mprtierea, grafice)
Fundamentarea alegerii testelor statistice adecvate datelor pe care le analizm
Desigur, n documentul de cercetare nu se vor include toate rezultate analizei primare, ci numai
acelea strict necesare pentru descrierea variabilelor analizate. De exemplu, nu este necesar ca raportul s fie
mpnat cu histogramele fiecrei variabile cantitative, fapt care ncarc nejustificat textul cu imagini puin
vedere al editrii i al tehnoredactrii textelor. n orice caz, se vor evita figurile prea complexe. Este
recomandabil ca fiecare grafic s prezinte o singur idee, pe care s o susin ct mai simplu i mai explicit.
Discutarea i interpretarea rezultatelor.
Adevrata ncercare ntr-un demers de cercetare nu este, aa cum s-ar putea crede, prelucrarea
efectiv a datelor. Dac sunt corect recoltate i nregistrate, prelucrarea lor se face destul de uor cu ajutorul
programelor computerizate existente astzi. Interpretarea, ns, este o prob pentru oricine se afl n faza de
finalizare a unei cercetri.
Premisa fundamental a unei interpretri consistente este suportul teoretic, claritatea i consistena
ipotezei sau ipotezelor cercetrii. Este imposibil s tragi concluzii dac nu eti contient de obiectivele
urmrite. Adesea se cade prad iluziei c, indiferent de ce date dispunem, se poate susine un demers de
cercetare doar cu ajutorul unui program de calcul statistic sofisticat i a unui set de date oarecare. Din pcate,
se ntmpl destul de des ca un student s vin i s spun: am aceste date, ce teste statistice pot face cu
ele?. Obiectivul cercetrii trebuie s fie clar precizat de la bun nceput n timp ce alegerea procedurii
statistice ine de natura scalei de msurare, caracteristicile variabilelor i ipotezei pe care trebuie s o testm.
Dac fiecare dintre aceste aspecte sunt clare n mintea cercettorului, atunci rspunsul la ntrebarea demai
sus este foarte uor de dat.
Se va urmri, pe de o parte, coerena dintre concluzii i datele pe care se sprijin, iar pe de alt parte,
dintre concluzii i condiiile specifice cercetrii (eantion, model de investigare). Cu alte cuvinte, fiecare
aspect al concluziilor trebuie s aib un suport robust n datele i rezultatele obinute prin prelucrarea lor. Se
va evita generalizarea necritic. Transpunerea anumitor rezultate dincolo de limitele populaiei cercetrii este
adesea hazardat. Rezultatele obinute nu sunt mai puin importante dac pstrm pruden n generalizarea
lor. Studii ulterioare pot confirma sau nu datele obinute i, pe aceast baz, se poate extinde generalizarea
semnificaiilor.
n alt ordine de idei, relevana rezultatelor nu depinde doar de atingerea nivelului de semnificaie
statistic ci i de mrimea eantionului. n principiu, aceste dou mrimi contribuie mpreun la
fundamentarea concluziilor, astfel:
rezultat semnificativ
statistic
Da
Da
Nu
Nu
eantion
mic
mare
mic
mare
concluzia cercetrii
rezultat important
importana practic posibil dar incert
rezultat neconcludent
ipoteza cercetrii este, probabil, fals
Un alt aspect important este interpretarea semnificaiei statistice. Obiectivul legitim al testelor
statistice este atingerea pragului de semnificaie. De aceea, valoarea lui p este prima care trebuie s ne atrag
atenia la captul prelucrrilor, simimindu-ne rspltii pentru eforturile fcute, dac se afl sub pragul de
0.05. Cu toate acestea, nu trebuie s uitm nici un moment c statistic semnificativ nu este echivalent cu
tiinific important. Dincolo de valoarea lui p se impune luarea n considerare i mrimea n sine a
diferenei sau legturii puse n eviden de respectivul test statistic. Desigur, o valoare ridicat a testului, fr
atingerea pragului de semnificaie, nu este relevant. Dar nici valoare prea mic, chiar dac este
semnificativ statistic. Ct de mic sau ct de mare trebuie s fie valoarea testului, pentru a o considera
important sau relevant? Din pcate, pentru aceast ntrebare nu exist un rspuns riguros. Se
recomand apelul la spiritul tiinific i la simul comun, concomitent cu raportarea la natura specific a
fiecrei situaii n parte. Cu alte cuvinte, rspunsul depinde de contextul fiecrei cercetri n parte.
O alt problem de discutat este n legtur cu valoarea n sine a lui p. Dup cum tim, nivelul
minim pentru acceptarea semnificaiei statistice este 0.05, corespunztor valorii convenionale minim
acceptabile pentru pragul alfa. Vorbind n sens strict, un p=0.049 este considerat semnificativ, n timp ce un
p=0.051 trebuie sa fie considerat nesemnificativ. Avnd n vedere c pragul alfa=0.05 este unul arbitrar, nu se
poate evita un astfel de raionament rigid. Cu toate acestea, exist cercettori care raporteaz rezultate ale lui
p uor mai mari dect 0.05 ca fiind marginal semnificative sau aproape semnificative. S menionm,
totui, c o astfel de atitudine este destul de rar ntlnit i poate determina reacii negative, justificate, din
partea cercettorilor mai riguroi, aflai n majoritate.
n mod intuitiv, suntem tentai s interpretm nivelul de semnificaie n funcie de valoarea calculat a
lui p. Astfel, un p=0.001 ni se pare mai semnificativ dect un p=0.05, de exemplu. Dac utilizm definiia
strict a termenului de semnificaie din raionamentul deciziei statistice, o astfel de atitudine nu este
justificat. O dat ce a fost fixat un anumit nivel al lui alfa, orice p mai mic sau egal cu acesta este
semnificativ, iar orice p mai mare este nesemnificativ. Cei mai muli statisticieni mprtesc aceast opinie.
Cu toate acestea, exist i cercettori mai puin rigizi care sunt dispui s asocieze valorii lui p anumite
adjective, astfel:
>0.05
0.01 0.05
0.001 0.01
<0.001
nesemnificativ
semnificativ
foarte semnificativ
extrem de semnificativ
Fr a fi greite, astfel de formulri nu aduc, totui, o interpretare relevant pentru decizia statistic.
Este util sa adugm c programele de prelucrri statistice afieaz 0.000 pentru valori ale lui p mai mici
de 0.001, Acest fapt nu va fi interpretat n nici un caz ca exprimnd probabilitate zero, ci doar n sensul c
valoarea lui p este mai mic de 0.001. De altfel, la raportarea semnificaiei, se poate opta fie pentru nscrierea
valorii exacte a lui p, aa cum este calculat de program, fie doar pentru menionarea plasrii valorii testului
sub nivelul alfa stabilit.
Formularea concluziilor
Studiul trebuie s se ncheie cu concluzii adecvate cu rezultatele obinute, formulate sintetic i
explicit. Nu se vor evita aspectele mai puin reuite ale cercetrii, eventualele nereuite, chiar. Rostul
acestora este acela de a ajuta la evitarea repetarea unor greeli de ctre cei care vor dori s reia acelai tip de
investigaie, mai trziu. Se pot face chiar recomandri explicite n acest sens. Orict de semnificative ar fi
rezultatele unui anumit studiu, ele nu vor schimba modul de a gndi o anumit realitate psihologic. Acest
efect nu l pot avea dect rezultate obinute de mai multe studii concordante pe aceeai tem.
Nu se va uita niciodat faptul c semnificaia statistic nu ine loc i de semnificaie teoretic, cu
sensul de consisten a unui anumit model teoretic explicativ. Procedurile statistice nu sunt altceva dect
instrumente de evaluare probabilist ipotezelor. Profunzimea teoretic a unui studiu nu poate rezulta dect
din calitatea modelului de investigaie (ipoteze, proceduri de evaluare, subtilitatea analizei rezultatelor, etc.)
i nu din datele statistice ca atare.
Statistica trebuie s fie o modalitate de organizare i disciplinare a gndirii tiinifice, n nici un caz, ns, nu
se poate substitui acesteia. Dar nu se poate ajunge la aceast performan dect dac statistica este neleas
att sub aspecte ei tari ct i cu limitele ei.
n trecut, la nceputurile utilizrii statisticii n psihologie, prezena acesteia ntr-o lucrare avea un
caracter de prestigiu, cu att mai mare cu ct era mai bogat reprezentat. n prezent, omniprezena
calculatoarelor i a programelor specializate au fcut ca prelucrrile statistice s devin o operaiune relativ
facil. Tocmai din acest motiv, apare riscul abuzului de statistic, a utilizrii necritice i superficiale a
acesteia n elaborarea lucrrilor de cercetare.
n fine, ca o concluzie a celor spuse, se cuvine sa insistm pe respectarea exigenelor procedurale
impuse de metoda statistic. Simpla populare a unei lucrri cu date statistice, tabele, grafice, sau cu valori
ale unor teste de semnificaie, nu asigur n mod necesar acelui document valoarea tiinific la care aspir.
Asigurarea calitii datelor supuse prelucrrii, respectarea condiiilor de alegere a testelor de semnificaie,
interpretarea lor adecvat i publicarea rezultatelor n formatul adecvat, sunt condiii indispensabile pentru
calitatea tiinific a unui studiu bazat pe metoda statistic.
Greeli frecvente n redactarea analizelor statistice
Lectura celor mai multe dintre lucrrile efectuate de studeni scoate n eviden nerespectarea
recomandrilor prezentate mai sus. Efectul const n consemnarea unor greeli, dintre care cele mai frecvente
i mai suprtoare ni se par a fi urmtoarele:
Formulare improprie a ipotezelor sau concluziilor cercetrilor, prin utilizarea unor termeni care
sugereaz relaia de cauzalitate (influeneaz, determin). Se ignor faptul c testele statistice nu
susin existena unei relaii de cauzalitate dect dac datele sunt recoltate n condiii de experiment
psihologic.
Includerea n lucrare a ipotezelor de nul, n paralel cu cele ale cercetrii. Acestea din urm sunt
singurele necesare i suficiente.
Exces de ostentaie n prezentarea rezultatelor prelucrrilor statistice. Cifrele tind s fie mai multe
dect explicaiile i analizele. Aceast manier creeaz impresia neplcut de parad de statistic.
Statistica trebuie sa ramina o prezenta discreta, al carui rost este doar acela de a sustine concluziile
cercetrii.
Intrarea n detalii de analiz a datelor, inclusiv n descrierea didacticist a respectrii condiiilor
pentru aplicarea diverselor teste statistice. Se vor evoca, ns, eventuale aspecte deosebite, cum ar fi
valori excesive legitime sau operaii de transformare a unor variabile, cu scopul normalizrii
distribuiei.
Includerea integral a rezultatelor calculate de programe pentru diverse proceduri. Unele dintre
acestea conduc la un mare volum de rezultate numerice. Nu toate trebuie reproduse ci numai acelea
care susin n mod direct i explicit concluziile cercetrii.
Raportarea incompleta sau absenta a rezultatelor la testele statistice (enuntarea deciziei statistice si a
concluziei cercetrii nu este suficienta, ea va fi insotita intotdeauna de valorile testului si de valorile
adiacente acestuia).
Exces de zecimale n prezentarea rezultatelor la prelucrri. De regul, valoarea testelor statistice se
raporteaz cu dou zecimale.
Reproducerea rezultatelor din programele statistice cu pstrarea elementelor de text n limba englez
(atunci cnd lucrarea este scris n limba romn).
Explicaii inconsistente la tabele i grafice. Orict de explicite ar fi acestea, cititorul nu va fi lsat s
i le explice singur.
Grafice sau tabele fr titlu.
Absena coeficienilor de consisten intern pentru testele care nu fac parte din metodologia
profesional general, sau, nc i mai grav, pentru cele create de autor, i pe care se bazeaz
respectiva cercetare.
Instrumente de lucru (teste) prezentate integral n textul lucrrii. Acestea se descriu la modul general,
fiind prezentate integral, eventual, doar la sfritul lucrrii, n caz c se dorete difuzarea lor.