M Popa Statistica

UNIVERSITATEA DIN BUCURETI
FACULTATEA DE PSIHOLOGIE I
TIINELE EDUCAIEI
DEPARTAMENTUL DE
NVMNT LA DISTAN

CURSUL

STATISTIC PSIHOLOGIC I PRELUCRAREA
COMPUTERIZAT A DATELOR

MODULUL 3
TESTE STATISTICE NEPARAMETRICE
STRATGIA ANALIZEI STATISTICE

Titular curs:
Conf. univ. dr. Marian POPA
Email: popamarian@gmail.com

Universitatea din Bucureti
Editura CREDIS
2009
Marian POPA
Copyright DEPARTAMENT ID 2009

Acest material este destinat uzulului studenilor Universitii
din Bucureti, forma de nvmnt la distan.
Coninutul cursului este proprietatea intelectual a
autorului/autorilor; designul, machetarea i transpunerea n
format electronic aparin Departamentului de nvmnt la
Distan al Universitii din Bucureti.

Universitatea din Bucureti
Editura CREDIS
Bd. Mihail Koglniceanu, Nr. 36-46, Corp C, Etaj I, Sector 5
Tel: (021) 315 80 95; (021) 311 09 37, 031 405 79 40, 0723 27 33 47
Fax: (021) 315 80 96
Email: credis@credis.ro
Http://www.credis.ro
Marian POPA
2/41
Cuprins
MODULUL3......................................................................................................................................3
TesteneparametricecuSPSS .......................................................................................................3
A.Testeneparametricepentrudatenominale........................................................................3
B.Testeneparametricepentrudateordinale....................................................................... 15
B.2TestulWilcoxonpentrudoueantioaneperechi ......................................................... 17
B.5Corelaiadatelorordinale(Spearman,Kendall)............................................................. 22
Strategiaanalizeistatisticeadatelor ........................................................................................ 25
A.Alegereatestuluistatistic.................................................................................................. 25
B.Integrareaanalizeistatisticendocumentuldecercetare................................................ 32

Marian POPA
3/41
MODULUL3

Teste neparametrice cu SPSS

Testele neparametrice se utilizeaz n urmtoarele situaii:
- atunci cnd variabila dependent este msurat pe scal nominal sau
ordinal;
- atunci cnd variabila dependent este de tip categorial, indiferent de scala
de msurare;
- atunci cnd, dei variabila dependent este msurat pe scal cantitativ
(interval sau raport), nu ntrunete condiiile impuse de testele parametrice:
distribuie care se abate grav de la forma normal asimetrie sau boltire
mari, valori excesive:
- volumul eantionului este foarte mic.

Tipurile de teste care vor fi tratate n continuare sunt urmtoarele:

Teste neparametrice pentru date nominale:
- testul z pentru proporia unui singur eantion;
- testul z pentru diferena dintre proporiile a dou eantioane;
- testul semnului;
- testul chi-ptrat al asocierii (independenei);
- testul chi-ptrat pentru gradul de coresponden (goodness of fit).

Teste neparametrice pentru date ordinale:
- testul Mann-Whitney (U) pentru dou eantioane independente;
- testul Wilcoxon pentru dou eantioane perechi ;
- testul Kruskal-Wallis pentru mai mult de dou eantioane independente ;
- testul Friedman pentru msurri repetate;
- teste de corelaie pentru date ordinale (Spearman, Kendall).

A. Teste neparametrice pentru date nominale

A. 1 Testul z al proporiei pentru un singur eantion

Utilizare

Testul z pentru proporii pentru un eantion, este utilizat n cazul variabilelor dihotomice,
pentru a testa diferena dintre proporiile valorilor n eantion prin comparaie cu proporia la
nivelul populaiei.
Exemplu: La ntrebarea cine se uit la telenovele? rspund DA 7 subieci, dintre care 5
femei i 2 brbai. ntrebarea cercetrii este dac femeile se uit ntr-o proporie mai mare dect
brbaii la telenovele.

Marian POPA
4/41
Condiii

Cunoaterea proporiei la nivelul populaiei pentru valorile variabilei testate. n cazul
nostru, raportul femei/brbai este cunoscut din studiile demografice (51%-49%)

Aranjarea datelor

Se creeaz variabila dihotomic cu valori numerice. Variabilele de tip string nu sunt
acceptate de procedura SPSS. n cazul nostru, valorile sunt 1 pentru feminin i 2 pentru masculin.

Procedura: Statistics-Non Parametric Tests-Binomial...

Variabila testat este trecut n lista Test Variable List:
n zona Define Dichotomy se alege Get from data, dac variabila este dihotomic,
sau Cut point, dac variabila este continu, prin fixarea unei valori care mparte
distribuia n dou categorii.
n zona Test proportion se introduce proporia primei categorii.
Butonul Options permite solicitarea statisticii descriptive pentru variabila testat.

Rezultate

Rezultatul n cazul exemplului dat cuprinde frecvena pe categorii, procentul i
semnificaia testului n raport cu proporia la nivelul populaiei (p=0.243).
Marian POPA
5/41

n acest caz, se accept ipoteza de nul i se respinge ipoteza cercetrii. Proporia femeilor
care se uit la telenovele nu difer semnificativ de proporia brbailor, prin raportare la proporia
lor n populaia general.

A. 2 Testul z al diferenei dintre dou proporii independente

Utilizare

Acest test se utilizeaz atunci cnd se dorete compararea a dou proporii obinute pentru
o variabil dihotomic.
Exemplu: n urma unui studiu cu privire la interesul fa de fenomenele paranormale,
efectuat n rndul studenilor de la Universitate, comparativ cu studenii de la Politehnic, se
nregistreaz urmtoarele rezultate
1
:
La psihologie: 25 studeni nu cred n fenomenele paranormale, iar 175 cred
La politehnic: 124 nu cred n fenomenele paranormale, iar 32 cred
Problema cercetrii este dac diferena dintre cei cred n fenomenele paranormale din
cele dou categorii de studeni este semnificativ.

Aranjarea datelor

Datele pot fi introduse fie caz cu caz, existnd o variabil pentru opinia fa de
fenomenele paranormale i una pentru tipul de instituie de nvmnt, fie ca n imaginea de mai
jos, care presupune o prealabil sintetizare a datelor:

o variabil (paranorm) pentru codificare credinei n fenomenele paranormale;
o variabil (stud_la) pentru apartenena la una din cele dou instituii de
nvmnt superior;
o variabil (frecv) pentru frecvena cazurilor.

Este important de reinut faptul c toate variabilele trebuie s fie numerice. n baza de
date de mai sus, variabila paranorm ia valoarea 1 pentru cred i valoarea 2 pentru nu
cred, iar variabila stud_la are valoarea 1 pentru Universitate i 2 pentru Politehnic.
Valorile variabilelor au fost etichetate corespunztor, iar afiarea etichetelor n locul
valorilor, n celulele tabelului de date, a fost obinut cu setarea View-Value labels din

1
Datele nu sunt reale
Marian POPA
6/41
meniul SPSS Data Editor. De reinut c, dei afieaz etichetele, SPSS va opera n calcule
cu valorile.

Procedura: SPSS nu dispune de o procedur specific pentru calcularea direct a
diferenei dintre dou procente. n acest scop se utilizeaz procedura Crosstabs i testul chi-ptrat.
n prealabil, se execut procedura Weight pentru variabilele categoriale
(paranorm i stud_la) n funcie de variabila frecv, care contorizeaz numrul
cazurilor.

Operaia asociaz valorile variabilelor categoriale (paranorm i stud_la) cu valorile
variabile frecv. Efectul ei este unul invizibil pe ecran, dar se va reflecta n analizele statistice
ulterioare.

Efectul de ponderare (weight) a unei variabile rmne activ atta timp ct nu se
pondereaz o alt variabil sau nu se anuleaz ponderarea efectuat. La salvarea fiierului
se salveaz i variabila ponderat. Includerea variabilei ponderate n diverse proceduri de
analiz are efecte specifice.
Dac datele ar fi fost introduse n baza de date caz cu caz, operaia Wheight nu ar mai fi
fost necesar.

Se execut procedura Statistics-Summarize-Crosstabs... pentru variabilele
paranorm i stud_la, cu selectarea Chi-Square din caseta Statistics. (nu mai
prezentm imaginile, acestea fiind identice cu cele de la testul chi-ptrat).

Rezultate

SPSS Viewer prezint mai nti tabelul de coresponden dintre variabilele categoriale, cu
valorile variabilei ponderate prin procedura Wheight.

Din tabelul Chi-Square Tests citim valoarea Pearson Chi-Square (161.598).

Marian POPA
7/41

Testul z pentru diferena proporiilor se calculeaz prin extragerea radicalului din valoarea
lui chi-ptrat:
71 . 12 598 . 161 = = z

Semnul lui z se afl din diferena proporiilor testate, astfel:

67 . 0 205 . 0 875 . 0
156
32
200
175
+ = = =
b a
p p

Decizia statistic se ia prin raportarea valorii calculate a lui z la valorile critice ale
acestuia de pe curba normal, pentru test unilateral sau bilateral. n cazul nostru, pentru test
bilateral, cu alfa=0.05, z calculat (12.71) este mai mare dect z critic (1.96), fapt care permite
respingerea ipotezei de nul i confirmarea ipotezei c studenii de la Universitate cred ntr-o
msur semnificativ mai mare n fenomenele paranormale dect studenii de la Politehnic.

A. 3 Testul semnului

Utilizare

Testul semnelor este utilizat pentru a testa diferena dintre valori, utilizndu-se semnul
diferenei i nu valoarea acesteia, atunci cnd ambele valori sunt msurate pentru aceiai subieci.
Dac nu ar exista nici o diferen ntre valorile perechi, atunci numrul diferenelor pozitive ar
trebui s fie egal cu cel al diferenelor negative. Cu ct numrul diferenelor de un anumit semn
este mai mare, comparativ cu cel al diferenelor de semn opus, cu att crete probabilitatea ca
diferena dintre variabile s fie statistic semnificativ.
Exemplu: ntr-un experiment cu privire la efectul motivrii asupra memorrii, subiecilor
(N=8) li se cere s memoreze cuvinte dintr-o list, nainte si dup introducerea unui factor
motivant. Dat fiind faptul c numrul subiecilor este prea mic pentru asumarea normalitii
distribuiei de eantionare, se alege testul semnului n locul testului t pentru eantioane
dependente.

Condiii

Variabilele vor fi de tip numeric, iar valorile exprimate n aceeai unitate de msur,
pentru a se putea face diferena lor.

Aranjarea datelor

Imaginea de mai jos conine variabilele inainte i dupa, care vor fi analizate.
Marian POPA
8/41

Variabila dif conine rezultatul diferenei dupa-inainte.
Variabila semn, conine semnul diferenei. Ambele sunt prezentate numai pentru a face
mai evident baza de calcul a testului deoarece, n fapt, nu sunt relevante sub aspectul procedurii
SPSS.
Dac nu se dispune de valorile variabilelor, ci numai de semnul diferenei, testul semnului
va fi calculat manual, pe baza formulei 4.7.

Procedura: Statistics-Nonparametric Tests-2 Related Samples...

n prima faz, cele dou variabile sunt
selectate, pe rnd, prin clic de mouse pe
fiecare, constituindu-se n pereche. Acest fapt
se observ n partea de jos a casetei, n zona
Current Selections.
Se bifeaz Sign n zona Test Type.
Apoi, perechea de variabile este trecut n
lista Test Pair(s) List: prin acionarea
butonului .
Dac este necesar, se pot testa simultan mai
multe perechi de variabile.

Marian POPA
9/41

Rezultate

Tabelul Sign Test cuprinde numrul diferenelor pozitive, respectiv negative, pentru
cazurile din baza de date. n cazul nostru, exist 7 diferene pozitive i nici o diferen negativ.

Tabelul Test Statistics, prezint semnificaia testului (p=0.016). Ipoteza de nul se respinge
dac valoarea lui p este mai mic dect pragul fixat i care, implicit, este 0.05. n exemplul dat,
ipoteza de nul se respinge, acceptndu-se ipoteza cercetrii (motivarea stimuleaz memorarea).

A.4 Testul Chi-ptrat al asocierii (independeei)

Utilizare

Testul chi-ptrat este utilizat pentru evidenierea gradului de asociere ntre dou variabile
categoriale.
Exemplu: S presupunem c am evaluat numrul femeilor i al brbailor, pasageri ntr-
un avion care a suferit un accident la aterizare, fr victime, diagnosticai cu sindrom de stres
posttraumatic (PTSD). Datele sunt cele din urmtorul tabel de coresponden:

Problema cercetrii este dac incidena PTSD este n legtur cu caracteristica de sex.

Femei Brbai
PTSD 20 10
Non-PTSD 30 40
Marian POPA
10/41
Condiii
Variabile categoriale, care pot fi exprimate, fie prin valori numerice, fie prin
valori de tip string (caracter tipribil)
Cele dou variabile nu trebuie s se intersecteze (s nu existe subieci care s
fie inclui n mai mult de o celul de tabel).
Este recomandabil ca frecvena ateptat s nu ia valori mai mici de 5 (sau, cel
puin, n nu mai mult de 20% din celule).
Nici o celul nu trebuie s aib frecvena ateptat 0..

Aranjarea datelor

Datele pot fi incluse n Data Editor n dou moduri:
a. Sub forma unor nregistrri distincte pentru fiecare caz

Acest mod poate fi extrem de dezavantajos atunci cnd sunt multe cazuri sau cnd exist
deja o statistic global a fenomenului PTSD n raport cu sexul.

b. Sub forma unor nregistrri distincte pentru valorile caracteristicii de sex:

n aceast situaie, se introduc frecvenele PTSD pentru toate combinaiile valorilor celor
dou variabile analizate i frecvenele asociate fiecreia. Pentru a se realiza corespondena dintre
variabilele sex i PTSD cu variabila frecv, se apeleaz la procedura Data-Wheight Cases...:

Marian POPA
11/41
Facem precizarea c n tabelele de date din imaginile de mai sus variabilele au fost
codificate numeric cu 1 respectiv 2, att pentru sex ct i pentru PTSD, valorile fiind etichetate.
Faptul c n celule apar etichetele i nu valorile, se obine prin setarea Data-Value Labels.

Procedura chi-ptrat accept i variabile de tip caracter (string), dar reamintim
recomandarea de principiu ca toate variabilele s fie declarate de tip numeric.

Procedura: Statistics-Summarize-Crosstabs...

Casetele de configurare sunt urmtoarele:

n caseta principal Crosstabs se trec variabilele analizate n lista Row(s), respectiv
Columns(s). Pot fi analizate mai multe perechi de variabile simultan. Rezultatul analizei
nu depinde de modul de plasare a variabilelor pe linie sau pe coloan. Dac de dorete
crearea unui grafic al corespondenei dintre variabile, se va bifa i Display clustered bar
charts.
n caseta Statistics se bifeaz Chi-Square.
n caseta Cell Display se bifeaz Counts-Observed; Percentages-Row, Column, Total i
Residuals-Unstandardized (bifarea opiunilor este n funcie de informaiile pe care le
dorete analistul).

Rezultate

Imaginea prezint tabelul de coresponden, avnd pe linii valorile caracteristicii de sex
iar pe coloane valorile aferente variabilei PTSD. n celulele tabelului se afl valorile solicitate
prin configurarea casetelor. Vom exemplifica pentru celula feminin/da:

Marian POPA
12/41
Count 40 indic numrul femeilor cu PTSD
%within Sex 80.0% indic procentul femeilor care au manifestat PTSD din totalul
femeilor
%within PTSD 66.7% indic procentul femeilor cu PTSD din totalul celor care au
manifestat PTSD
% of Total 40% indic procentul femeilor cu PTSD din totalul subiecilor
Residual 10% indic diferena dintre numrul de femei cu PTSD (frecvena observat) i
frecvena ateptat (n cazul nostru, +10)

n tabelul Chi-Square Tests citim valoarea testului Pearson Chi-Square (16.66) i, n
special, pragul de semnificaie al acestuia (p=0.000 care va fi citit ca p<0.001). n cazul particular
al acestui exemplu, unde tabelul de coresponden este format din dou linii i dou coloane,
valoarea lui chi-ptrat poate fi luat de pe linia Continuitiy Correction (15.04) cu valoarea
aferent a pragului de semnificaie: p<0.0005.
Valoarea lui p pentru testului chi-ptrat fiind mai mic dect nivelul alfa 0.05, se respinge
ipoteza de nul i se confirm ipoteza cercetrii: exist o inciden mai mare a reaciei de stres
posttraumatic la femei dect la brbai.

n raportarea statisticii chi-ptrat va fi inclus valoarea gradelor de libertate (df) i
numrul cazurilor
Valoarea lui chi-ptrat se raporteaz cu dou zecimale

Graficul de tip bar permite vizualizarea relaiei dintre variabile:

Marian POPA
13/41
A.5 Testul chi-ptrat pentru gradul de coresponden (goodness of fit)

Utilizare

Testul chi-ptrat pentru gradul de coresponden se utilizeaz atunci cnd dorim s
comparm frecvenele observate ale unei singure variabile categoriale, cu frecvenele ateptate ale
acesteia, dinainte cunoscute.
Exemplul 1: Avem evaluarea nivelului de inteligen pe cinci categorii valorice, de la
foarte slab, la foarte bun i dorim s tim dac distribuia acestor calificative se supune curbei
normale, procentele aferente pe curba normal fiind cunoscute (2.5%, 14%, 67%, 14%, 2.5%).
Exemplul 2: Am solicitat unui grup de tineri s i exprime genul muzical preferat i am
obinut frecvene diferite pentru mai multe genuri de muzic. Problema cercetrii este dac
diferenele dintre aceste frecvene sunt semnificative. Ipoteza de nul n acest caz este c
preferinele se distribuie egal ntre genurile muzicale (adic, dac ar fi trei genuri, fiecare ar trebui
s ntruneasc un procent de 33.33%).

Aranjarea datelor

Vom exemplifica pe o situaie corespunztoare celui de-al doilea exemplu. Baza de date
se poate constitui fie prin nregistrarea fiecrui caz n parte (avnd o variabil pentru genul
muzical i o alta pentru exprimarea preferinei fa de acesta), fie, ca n exemplul anterior, prin
nregistrarea rezultatelor sintetice i ponderarea variabilei gen_muz cu variabila frecv prin
operaia Data-Weight cases...:

Procedura: Statstics-NonParametric-Tests-Chi-Square...

n caseta Chi-Square Test se trece variabila analizat n zona Test Variable List.
Se bifeaz All categories equal, acesta fiind modelul n raport cu care dorim s
testm frecvenele variabilei analizate
Marian POPA
14/41
Dac am fi dorit s le testm n raport cu alte frecvene cunoscute, am fi bifat
Values i, apoi, am fi introdus pe rnd acele frecvene (scriindu-le n dreptul lui
Values i nregistrndu-le prin butonul Add)

Rezultate

Cele dou tabele cu rezultate din Viewer prezint:
Frecvenele observate, frecvenele ateptate i valorile reziduale (diferena dintre
frecvene) pentru cele trei genuri muzicale
Valoarea testului chi-ptrat al corespondenei (12.17), df(2) i p=0.002

Acest rezultat justific respingerea ipotezei de nul i acceptarea concluziei c subiecii
diferenele dintre preferinele pentru cele trei genuri muzicale sunt semnificative i nu se
datoreaz variaiei ntmpltoare de eantionare.

Marian POPA
15/41
B. Teste neparametrice pentru date ordinale

B. 1 Testul Mann-Whitney (U) pentru dou eantioane independente

Utilizare

Testul Mann-Whitney este utilizat pentru testarea diferenei dintre grupuri independente
pentru care variabila dependent este exprimat n valori ordinale (de rang) sau atunci cnd, chiar
dac este de tip cantitativ, nu suport un test parametric (testul t).
Exemplu: La ieirea dintr-un club de noapte, un psiholog interesat de efectul depresiv al
drogurilor a efectuat interviuri n legtur cu acest aspect i a identificat un numr de 10 tineri
care au consumat cte o pastil de Ecstasy i un numr de 10 tineri care au consumat doar alcool.
Apoi i-a convins s ia parte la un experiment i le-a administrat un chestionar de evaluare a
depresiei. Acelai chestionar a fost aplicat din nou, peste trei zile. Obiectivele studiului sunt:
a. verificarea ipotezei c cele dou tipuri de drog (Ecstasy i alcool) au efecte
depresante diferite ntre ele;
b. Ecstazi are un efect depresant pe termen lung, mai mare dect alcoolul.
n acest scop vor trebui comparate valorile la depresie ale celor dou grupuri. Aceast
analiz va fi efectuat att pentru valorile depresiei de la prima msurare ct i pentru cele de la a
doua evaluare a depresiei (dup trei zile).

Aranjarea datelor

Variabilele din baza de date sunt urmtoarele:
cod_sub, un cod numeric de identificare a fiecrui subiect (dei exemplele anterioare
nu au cuprins aceast variabil, ea nu trebuie s lipseasc din nici o baza de date)
drog, pentru tipul de drog utilizat (sunt afiate etichetele, iar valorile sunt 1=Ecstasy,
2=Alcool)
depr_1, scorul la depresie la prima evaluare
depr_2, scorul la depresie la a doua evaluare
Marian POPA
16/41

Variabilele dependente din exemplul nostru au valori msurate pe scal cantitativ.
Testarea lor cu un test ordinal nu presupune o prealabil transformare de rang, programul
efectund automat aceast transformare. Procedura se aplic n acelai mod i direct pe
valori ordinale de rang.

Procedura: Statistics-Non Parametric Tests-2 Independent Samples...

Se cuvine s precizm c, n mod normal, datele de acest tip ar conduce la utilizarea
testului t pentru eantioane independente. Cu toate acestea, avnd n vedere volumul foarte mic al
eantionului, utilizarea unui test neparametric este de preferat.

n caseta Two-Independent Samples Tests variabilele analizate sunt trecute n lista Test
Variable List.

Rezultate

Tabelul Ranks ofer informaii sintetice despre cele dou variabile: volumul grupurilor,
media rangurilor i suma rangurilor.

Tabelul Test Statistics include valorile testului Mann-Whitney pentru cele dou variabile
testate simultan, depresia imediat i remanent. Valorile de interes din tabel sunt cele ale lui Z i
nivelul de ncredere p. n cazul nostru, se observ c depresia imediat nu difer semnificativ n
funcie de tipul de drog utilizat, n timp ce depresia remanent este semnificativ diferit, mai mare
la utilizatorii de Ecstasy dect la utilizatorii de alcool (conform datelor din tabelul anterior).

Marian POPA
17/41

B. 2 Testul Wilcoxon pentru dou eantioane perechi

Utilizare

n exemplul anterior, pentru testul Mann-Whitney, psihologul a testat diferena
intensitii depresiei ntre consumatorii de Ecstasy i alcool, imediat i dup trei zile. Rezultatul a
fost acela c efectul depresiv nu este diferit pe termen imediat, dar este semnificativ diferit dup
trei zile. Datele pot fi analizate ns i separat, pe fiecare grup de consumatori (Ecstasy, respectiv
alcool) n cele dou momente diferite (imediat i dup trei zile).
Dac testul Mann-Whitney a verificat ipoteza diferenei dintre categorii de consumatori
(eantioane independente), testul Wilcoxon va permite testarea ipotezei c depresia este diferit
de la un moment la altul n cadrul fiecrei categorii de consumatori n parte (eantioane
dependente).
Facem precizarea c aceste dou teste nu trebuie ntotdeauna utilizate mpreun, succesiv,
ca n exemplul acestui studiu. Dac facem aici acest lucru, este numai pentru c ne-am propus
dou obiective distincte, fiecare fiind testat cu o procedur diferit, n funcie de natura
eantioanelor comparate.

Aranjarea datelor

Este identic cu cea prezentat pentru testul Mann-Whitney.
n acest caz, deoarece analiza trebuie efectuat separat pe grupurile de consum
Ecstasy/Alcool, exist dou soluii. Prima ar fi selectarea (cu Data-Select Cases) a primului grup
i efectuarea testului, apoi selectarea celui de-al doilea grup i efectuarea testului. O soluie mai
elegant este ns aceea de a declara mprirea bazei de date n funcie de grupurile definite prin
tipul de drog. n acest scop se va utiliza procedura Data-Split File...

Marian POPA
18/41
n locul setrii implicite Analyze all cases, do not create groups, se bifeaz opiunea
Compare groups i se declar variabila ale crei valori vor servi drept criteriu de mprire a bazei
de date n grupuri de analiz separat (n cazul nostru, tipul de drog) prin trecerea ei n zona
Groups Based on:. Efectul acestei aciuni este acela c toate prelucrrile care vor fi efectuate din
acest moment se vor aplica, separat, pe fiecare grup identificat prin valorile variabilei.

Operaiunea de mprire a bazei de date nu are semne vizibile pe ecran, fapt care poate
face s fie uitat i, astfel, atunci cnd se revine la prelucrri care ar trebui s implice
toat baza de date rezultatele vor fi incorecte. De aceea, se va avea n vedere revenirea la
setarea Analyze all cases, do not create groups atunci prelucrarea pe grupuri a bazei de
date nu mai este becesar.

Procedura: Statistics-Non Parametric Tests-2 Related Samples...

Setarea procedurii n caseta Two-Related-Samples tests se face n doi timpi:
1. Se selecteaz prin clic de mouse fiecare
variabil, constituindu-se perechea supus
analizei
2. Se acioneaz butonul pentru a se
transfera perechea de variabile n zona Test
Pair(s) list.

Se bifeaz opiunea pentru testul Wilcoxon (care este, de fapt, cea implicit)

Rezultate

Tabelul Ranks ofer informaii sintetice despre rangurile pozitive i negative pentru cele
dou grupuri, numrul subiecilor, media rangurilor i suma lor.

Tabelul Test Statistics prezint valorile comparative ale depresiei pentru cele dou
grupuri. Aa cum se observ, diferena este semnificativ (p=0.007) n cazul consumatorilor de
Ecstasy i nesemnificativ (p=0.053), n cazul consumatorilor de alcool. Concluzia general a
studiului este aceea c Ecstasy, comparativ cu alcoolul, are un efect depresiv mai mare (testul
Mann-Whitney) i mai accentuat cu trecerea timpului (testul Wilcoxon).

Marian POPA
19/41

Aducem aminte c testul Wilcoxon presupune calcularea a dou valori, T(+) pentru
diferena pozitiv a rangurilor i T(-) pentru diferena negativ a rangurilor, cea mai mic dintre
ele fiind considerat valoarea testului. n exemplul nostru, testul Wilcoxon pentru Ecstazy a fost
calculat "pe baza rangurilor negative" (vezi nota a. de sub tabel), ceea ce nseamn c acestea au
fost mai puine, iar cele pozitive au fost mai multe. Ori, diferentele pozitive de rang exprima
valori ale depresiei mai mari dup trei zile dect dup o zi. Asta, deoarece SPSS atribuie rangul 1
valorii celei mai mici, i rangul cel mai mare valorii celei mai mari din distribuie. Ca urmare,
este corect s concluzionm c rezultatul testului indic o valoare semnificativ mai mare a
depresiei dup trei zile dect dup o zi.

B. 3 Testul Kruskal-Wallis pentru mai mult de dou eantioane independente

Utilizare

Testul Kruskal-Wallis este utilizat atunci cnd avem o
variabil dependent ordinal, msurat pentru mai mult de dou
grupuri independente (formate din subieci diferii), i dorim s
testm diferena dintre acestea. Acest test pentru date ordinale
este analog testului ANOVA pentru date cantitative.
Exemplu: A fost studiat relaia dintre condiiile
familiale (familie armonioas, mam singur, familie
conflictual) i frecvena reaciilor emoionale pozitive la copiii
de vrst precolar, pe durata unei sptmni. Problema
cercetrii este dac diferenele sunt semnificative iar mediul
familial are legtur conduita emoional a copiilor.

Aranjarea datelor se face ca n imaginea alturat:

n baza de date, variabila familie a fost codificat i etichetat astfel: 1=familie
armonioas, 2=mam singur, 3=familie conflictual. Etichetele sunt afiate ca urmare a opiunii
Data-Value Labels. Rezultatele vor fi identice dac variabila dependent este exprimat i direct
n valori de rang.

Procedura: Statistics-Non Parametric tests- k Independent Samples...

Marian POPA
20/41
n caseta principal se trece
variabila testat n zona Test
Variable List: iar variabila
independent n zona Gouping
Variable. Se activeaz
comanda Define Range...
Se definete domeniul
valorilor variabilei
independente, n cazul nostru:
minim 1, maxim 3.
Forma final a casetei este
aceasta.
Testul Kruskal-Wallis este
bifat implicit.

Rezultate

Primul tabel include informaii descriptive cu privire la variabila testat: numrul
subiecilor din fiecare grup i media rangurilor pentru fiecare grup. De precizat c programul
acord rangul 1valorii celei mai mici. Datele din tabel indic descreterea mediei rangurilor
(expresii emoionale pozitive numeroase) de la familia armonioas la cea conflictual.

Rezultatul testului, afiat n tabelul Test Statistics se exprim printr-o valoare chi-ptrat
(6.33) cu dou grade de libertate i p=0.042. Ca urmare, ipoteza de nul poate fi respins. Datele
confirm ipoteza c mediul familial (exprimat prin cele trei tipuri de familie) i pune amprenta
asupra expresivitii emoionale a copiilor de vrst precolar.

Marian POPA
21/41
B. 4 Testul Friedman pentru msurri repetate

Utilizare

Testul Friedman se utilizeaz pentru testarea diferenei de rang n cazul unei variabile
msurate repetat, de mai mult de dou ori, pe acelai grup de subieci. El este echivalentul testului
ANOVA pentru msurri repetate, pentru date parametrice. Dac este utilizat pentru doar dou
msurri repetate, rezultatul su este echivalent cu al testului Wilcoxon.
Exemplu: Efectele altitudinii asupra memoriei sunt testate pe un grup de alpiniti.
Capacitatea de memorare de cuvinte este msurat la trei nlimi diferite: 1000m, 3000m i
6000m. Problema cercetrii este dac diferena de performan de memorare corespunztoare
celor trei nlimi este semnificativ. Dat fiind volumul extrem de mic am eantionului (N=5),
efectuarea unui test parametric (ANOVA RM) ar fi nesigur iar apelul le testul Friedman este pe
deplin justificat.

Aranjarea datelor

Variabilele mem_1000, mem_3000 i mem_6000 conin numrul cuvintelor memorate
pentru fiecare dintre cei 5 alpiniti. Nu este necesar transformarea lor n valori de rang, deoarece
acest lucru va fi efectuat automat de program. Dac datele primare sunt sub form de ranguri, ele
vor fi introduse ca atare, rezultatul fiind identic.

Procedura: Statistics-Non Parametric Tests-K related Samples...

Se seteaz opiunea Friedman, iar variabilele testate sunt trecute n lista Test Variables:

Rezultate

Marian POPA
22/41
Primul tabel prezint media rangurilor pe nlimi (rangul 1 este atribuit valorii celei mai
mici). n al doilea tabel gsim valoarea testului Friedman exprimat n valori chi-ptrat (8.40),
avnd un nivel de semnificaie p=0.015. Acest rezultat permite respingerea ipotezei de nul i
confirm ipoteza c memoria cuvintelor este n legtur cu nlimea (pe cele trei niveluri avute n
vedere).

B. 5 Corelaia datelor ordinale (Spearman, Kendall)

Utilizare

Testul de corelaie a rangurilor (Spearman) este echivalentul pentru date ordinale
testului de corelaie Pearson. Rezultatul su variaz pe aceeai plaj de valori (-1/+1) i se
interpreteaz n mod similar cu rezultatul testului Pearson.
Exemplu: S lum n considerare studiul aceluiai grup de alpiniti, care au efectuat,
la aceleai nlimi descrise mai sus, i un test de vitez de decizie (msurat n zecimi de
secund). Problema cercetrii este dac ntre performana de memorare i timpul de decizie este o
relaie (variaie concomitent) semnificativ.

Aranjarea datelor

Alturi de variabilele memorie pentru cele trei nlimi, avem acum i variabilele
pentru timpul de decizie.
Procedura: Statistics-Corelation-Bivariate

Variabilele supuse testului de corelaie se trec n lista Variables:
Se anuleaz setarea pentru testul Pearson i se bifeaz Spearman (aici am ales i testul
Kendal tau-b, care este echivalent lui Spearman, doar pentru a le putea compara. n practic, se
va utiliza doar unul dintre acestea dou).
Aceast configurare a casetei de dialog produce o matrice de corelaii cu ase linii i ase
coloane pentru fiecare dintre cele dou teste alese. n fiecare celul a matricii se vor afla, aa cum
vom vedea, mai multe numere. Din acest motiv citirea ei nu este tocmai comod. Pentru a obine
un format mai convenabil de prezentare a rezultatelor, recomandm o procedur suplimentar,
prezentat anterior la corelaia Pearson: Se acioneaz butonul Paste care deschide fereastra
Marian POPA
23/41
Syntax, unde gsim comenzile procedurii. Aici se introduce clauza WITH ntre primul grup de
variabile (memorie) i al doilea grup de variabile (decizie):

Mai departe, procedura de corelaie se lanseaz cu butonul de pe bara de comenzi a
ferestrei Syntax.
Aceast variant de lucru nu este obligatorie. Se poate efectua corelaia i direct din
caseta principal, dar, aa cum am spus, rezultatele vor fi prezentate ntr-o form mai puin
ergonomic la citire.

Rezultate

Tabelul cu rezultate cuprinde pe linii variabilele memorie i pe coloane, variabilele
decizie. Deoarece am cerut calcularea simultan a ambilor coeficieni de corelaie, datele sunt
dublate. Este de la sine neles c n practic nu vom utiliza dect unul dintre aceti coeficieni de
corelaie a rangurilor.
Din celulele tabelului de mai sus nu ne intereseaz dect cele care cuprind corelaia dintre
memorie i decizie la acelai palier de nlime. Pentru a fi mai vizibile, am ngroat valorile utile
analizei. n jumtatea de sus a tabelului, avem corelaiile pentru testul Kendall iar n jumtatea de
jos pe cele ale testului Spearman.

Testul Kendall al corelaiei dintre memorie i decizie la 1000 de metri are valoarea
-0.94, semnificativ la p=0.023. La interpretarea coeficienilor de corelaie este extrem de
important s se ia n considerare, simultan, semnul i semnificaia variaiei valorilor. n cazul
nostru, valori mari ale memoriei, nseamn o capacitate de memorare mai bun iar valori mari ale
timpului de decizie nseamn capacitate de decizie mai proast (sub aspectul vitezei, desigur). n
consecin, un coeficient de corelaie negativ ntre aceste variabile indic, de fapt, o variaie
concomitent pozitiv a memoriei i vitezei deciziei (cnd capacitatea de memorare scade, i
decizia este mai lent, timpul de decizie fiind mai mare).
Analiza coeficienilor din tabelul de mai sus arat existena unei corelaii de rang
semnificative (p<0.05) ntre memorie i decizie la toate palierele de nlime.
Marian POPA
24/41
Dac facem comparaia dintre coeficienii Spearman i Kendal, vom vedea c, dei ei
difer valoric, semnificaiile se afl, n toate cazurile, de aceeai parte a deciziei statistice
(respingerea ipotezei de nul). Utilizarea unuia sau altuia dintre cei doi coeficieni rmne la
latitudinea cercettorului.

Marian POPA
25/41
Strategia analizei statistice a datelor

Adesea, chiar i cineva care s-a aplecat cu mult contiinciozitate i interes asupra
studiului statisticii, se afl, la finalul efortului su academic, n faa unor ntrebri aparent simple:
cum aleg testul statistic potrivit datelor cercetrii? cum inserez analiza statistic ntr-o lucrare de
cercetare? O sintez a rspunsurilor posibile la aceste ntrebri ne propunem s facem n cele ce
urmeaz, cu scopul de a da o orientare strategic privind abordarea analizei statistice a datelor n
cercetrile psihologice.

A. Alegerea testului statistic

n statistic, cel mai simplu lucru este s aplici formula i s calculezi rezultatul.
Dificultatea const n a alege formula (a se citi: procedura statistic adecvat scopului propus i
datelor disponibile) i a interpreta rezultatul. Alegerea testului statistic potrivit este adesea una
dintre ncercrile cele mai mari prin care trece un tnr cercettor. Nu de puine ori, aceasta este
chiar prima problem pe care i-o pune, fr s i dea seama c face, de fapt, prima mare
greeal. Alegerea testului statistic nu este prima, ci ultima problema pe care trebuie s o rezolve!
Este adevrat c, pentru a rezolva aceast problem sunt necesare cunotine de psihologie
experimental, dar i o experien destul de ndelungat n prelucrarea datelor. Totui, situaia
poate fi mult uurat dac se urmeaz o serie de raionamente i reguli de baz, pe care le vom
prezenta n continuare.

1. Punctul de pornire este formularea ipotezei. Aceasta deriv din problema cercetrii i se
exprim sub form rspunsului pe care, n mod legitim, cercettorul se ateapt s l
confirme cu ajutorul datelor statistice.
Exemplu:
- Problema cercetrii: ntr-un centru de dializ se observ c pacienii sufer de
tulburri anxioase severe.
- Modelul cercetrii: Un program de reducere a anxietii bazat pe exerciii de relaxare,
prezentate pe casete video este realizat pe un grup de pacieni. Se aplic un chestionar
de evaluare a anxietii grupului studiat i unui grup de control, care nu a urmat
programul de relaxare.
- Ipoteza cercetrii: Exerciiile de relaxare reduc nivelul anxietii

2. Se identific variabilele cercetrii. Pentru exemplul de mai sus:
- Variabila independent este apartenena la grupurile cercetrii. Aceasta poate primi
dou valori convenionale: 1 pentru subiecii care au urmat edine de relaxare;
2pentru subiecii din grupul de control.
- Variabila dependent este nivelul anxietii, msurat pe o scal de interval/raport

3. Se recolteaz datele cercetrii, avnd grij s fie respectate toate condiiile i criteriile
care s asigure corectitudinea acestora. Orice eroare n aceast faz (n special cu privire
la constituirea eantionului, dar i legat de motivarea subiecilor, corectitudinea
nregistrrilor etc.) se vor traduce n dificulti insurmontabile n faza de prelucrare i
analiz a datelor. n cazul nostru, se va acorda constituirii grupurilor de studiu, avnd
grija ca acestea s nu difere sub aspectul unor aspecte care pot influena efectul relaxrii
(vrst, nivel de instruire, sex, severitate a bolii etc.).
Marian POPA
26/41
4. Se sintetizeaz datele cercetrii i se trece la prelucrarea acestora. Fazele obligatorii ale
acestor prelucrri sunt urmtoarele:
- analiza preliminar a variabilelor, cu ajutorul procedurilor statistice descriptive,
avnd drept principale scopuri
verificarea corectitudinii datelor,
evidenierea caracteristicilor distribuiei fiecrei variabile, n vederea alegerii
ulterioare a testului statistic adecvat;
- corectarea eventualelor erori de nregistrare, rezolvarea situaiilor n care exist date lips,
transformarea variabilelor, dac acest lucru se impune (de reinut faptul c nu este
recomandabil s se transforme o variabil de interval/raport, a crei distribuii nu se abate de
la forma normal, ntr-o variabil categorial, deoarece se pierde din puterea statistic a
testelor).

Dup parcurgerea acestor etape, n succesiunea lor fireasc, alegerea testului statistic
devine o problema relativ simpl. De fapt, pentru a fi i mai explicii, fr parcurgerea acestor
etape identificarea testului statistic potrivit nici nu este posibil. Principalele componente ale
algoritmului de selectare sunt urmtoarele:
1) Se identific variabila independent
2) Se identific variabila dependent
a. daca este de tip nominal/ordinal, se aplic un test neparametric;
b. dac este de tip interval/raport i:
i) dac respect condiiile i dac, mai ales, eantionul este mare, se recomand
alegerea unui test parametric
ii) dac nu respect condiiile i, mai ales, dac eantionul este foarte mic, se
recomand alegerea unui test neparametric (n acest caz valorile vor fi
transformate pe o scal ordinal sau nominal, n funcie de caracteristicile
lor i opiunea cercettorului)
3) Se precizeaz obiectivul cercetrii, care poate fi, cel mai adesea:
a. diferena dintre grupuri dependente sau independente (ca n exemplul nostru).
Acest model este mai potrivit n urmtoarele situaii:
i) atunci cnd variabila independent, prin natura ei, se exprim n categorii
naturale (de ex., categorii de vrst, familii divorate/nedivorate, sexul etc.)
ii) atunci cnd variabila independent exprim valori care nu evolueaz ntr-o
manier liniar (de ex., prezen/absen, diagnostice psihiatrice, tipuri
temperamentale)
iii) atunci cnd variabila independent este manipulat

b. Gradul de asociere. Acest model de cercetare este recomandabil atunci cnd
avem de a face cu variabile msurate simultan sau succesiv pe aceiai subieci
(modele de tip nainte-dup, intrasubiect), sau pe subieci aparinnd unor
eantioane perechi. n acest sens se vor lua n considerare urmtoarele dou
recomandri:
atunci cnd, att v. independent ct i v. dependent sunt de acelai tip
(cantitative sau calitative), obiectivul obinuit este gradul de asociere
atunci cnd v. independent este de tip categorial (nominal sau
ordinal), iar v. dependent este de tip cantitativ, obiectivul obinuit este
diferena dintre grupuri (categorii)
4) Se alege testul statistic adecvat, dar, nainte de aceasta, s dm rspuns unei ntrebri
preliminare: ce este de preferat, test parametric sau neparametric?

Marian POPA
27/41
a. Dac variabila dependent este msurat pe scal nominal sau ordinal,
problema alegerii nu se pune, singurele teste aplicabile fiind cele
neparametrice. Atunci cnd variabila dependent este exprimat pe o scal
cantitativ (interval/raport), dac ntrunete condiiile impuse de statistica
parametric, este recomandabil s se utilizeze teste parametrice. n acest caz
ns trebuie avute n vedere dou aspecte:
i. Situaia n care variabila dependent cantitativ nu respect condiiile
testelor parametrice, n raport cu care exist dou soluii:
se vor efectua verificri pentru eventuala corecie de valori, tratarea
valorilor lips, transformri parametrice, urmate de utilizarea testelor
parametrice
se transform variabila dependent pe o scal de tip nominal sau
ordinal, urmat de aplicarea unor teste neparametrice adecvate
b. Luarea n considerare a mrimii eantionului. Teorema limitei centrale ne
asigur cu privire la normalitatea distribuiei de eantionare pentru eantioane
care depesc N=30. Pentru eantioane de volum mediu (apropiat de 30 de
valori), testele parametrice sunt mai sensibile la respectarea condiiilor
impuse i, de aceea, utilizarea testelor neparametrice pare a fi o soluie mai
bun. n practic, se va avea n vedere faptul c testele statistice, att cele
parametrice ct i cele neparametrice, efectuate pe eantioane reduse, sub
N=20, nu ofer rezultate robuste iar credibilitatea lor este ndoielnic.
Eantioanele mici nu conin suficient informaie care s permit
fundamentarea unei inferene statistice suficient de sigure i cu putere de
generalizare. Studiile pe eantioane de acest gen pot avea o valoare de studii
pilot n vederea deciziei de a lansa sau nu studii de amploare pe o anumit
tem. n legtur cu mrimea eantioanelor de cercetare se vor revedea
recomandrile discutate n legtur cu puterea testelor statistice.

Algoritmul de alegere a procedurii statistice

n principiu, orice analiz statistic dintr-un proiect de cercetare cuprinde dou categorii
de proceduri statistice, efectuate n etape succesive: (1) analiza statistic descriptiv i (2) analiza
de semnificaie, prin aplicarea unui test statistic.

1. Analiza statistic descriptiv

Tabelul urmtor prezint n mod sintetic algoritmul de alegere a procedurii descriptive
adecvate, n funcie de obiectivul analizei i de tipul de variabil:

Obiectivul descrierii
Scala de
msurare
Condiie Soluie
- tabela de frecvene
nominal
- graficul de tip bar
- distribuia de frecvene
ordinal
- graficul de tip bar
- distribuia de frecvene
- histograma
reprezentarea ntregii distribuii
I/R
- poligonul de frecvene
Msura tendinei centrale nominal - modul
Marian POPA
28/41
ordinal - mediana
simetric media
I/R
asimetric mediana
nominal - numr categorii
ordinal - amplitudinea
simetric abaterea standard
Msura variabilitii
I/R
asimetric amplitudinea

2. Testarea ipotezelor

n faza urmtoare analizei statistice descriptive se va proceda la iniierea testrii
ipotezelor cu ajutorul unui test statistic adecvat. Pentru a uura alegerea testului statistic, exist
diverse modele ajuttoare, de tip algoritmic sub form tabelar sau grafic. n acest sens exist
numeroase posibiliti de informare. Dintre acestea, sugerm utilizarea opiunii Statistic Coach,
pus la dispoziie de programul SPSS (din meniul Help). De asemenea, se poate apela la pagina
de internet Selecting Satistics a Universitii Cornell
(http://trochim.human.cornell.edu/selstat/ssstart.htm).
Mai jos prezentm mai jos un algoritm sintetic care vizeaz alegerea testului statistic
pentru cercetri care pun n relaie doar o singur variabil independent i o singur variabil
dependent. Am cuprins n tabel, cu o singur excepie (*), testele statistice care fac obiectul
cursurilor de introducere n statistica inferenial. Desigur, numrul testelor statistice este mult
mai mare, fapt care poate face necesar dezvoltarea algoritmului de alegere a testelor.

Obiectivul
cercetrii
Variabila
independent
Variabila
dependent
Testul statistic
aplicabil
I/R z/t pentru un eantion
una -
Nominal z pentru o proporie
I/R
t pt. eant.
independente
Nominal z pentru dou proporii
independente
Ordinal Mann-Whitney U
I/R t pt. eant. dependente
Nominal testul semnului

dou
dependente
Ordinal Wilcoxon
I/R ANOVA unifactorial
independente
Ordinal Kruskal-Wallis
I/R
ANOVA pt. msurri
repetate (*)
Diferena
dintre
grupuri
Categorial
(nr. categ.)
trei+
dependente
Ordinal Friedman
Interaval/Raport I/R r Pearson
Ordinal Ordinal r
s
Spearman Asocierea
variabilelor
Categorial (Nominal sau Ordinal)
Categorial
(N/O)
Chi-ptrat
Testul exact Fischer

Marian POPA
29/41
Redm mai jos i un tabel orientativ pentru alegerea testului statistic care
cuprinde, pe lng situaii de cercetare cu dou variabile, situaii n care sunt analizate
simultan mai mult de dou variabile. O parte dintre testele evocate fac obiectul cursurilor
avansate de statistic, dar unele dintre ele se regsesc i n programa cursurilor de baz.

Variabila(e) dependente
Categoriale Interval raport
2 categorii 2+categorii 1 VD 2+ VD
2 categorii

Testul t
MANOVA
One-way
2+ categorii
ANOVA
One-way
1
VI
cu
covariant
ANCOVA
one-way
MANCOVA
one-way
fr
covariant
Regresia
logistic
ANOVA
two-way
MANOVA
two-way
N
o
m
i
n
a
l
e
-
c
a
t
e
g
o
r
i
a
l
e

2+
VI
cu covariant
ANCOVA
one-way
MANCOVA
two-way
Corelaia
bivariat

O singur VI Regresia
liniar
simpl

Regresia
multipl
V
a
r
i
a
b
i
l
a
(
e
)

i
n
d
e
p
e
n
d
e
n
t
e

I
n
t
e
r
v
a
l
-
r
a
p
o
r
t

Mai multe VI
Analiza
Path
Analiza Path
Not explicativ:
VI = variabil independent;
VD = variabil dependent;
Variabil covariant = variabil care variaz concomitent cu variabilele testate i al
crei efect este eliminat statistic

Reguli de fixare a mrimii eantioanelor de cercetare
2

Reputatul statistician i psihometrician Jacob Cohen, ntr-un articol intitulat Things I
Have Learnd (So Far) (1990) i aduce aminte cum a nvat, n facultate c pentru a compara
dou grupuri trebuie utilizate eantioane de 30 de subieci, orice eantion mai mic de 30 fiind
considerat eantion mic. Mai trziu, cnd a descoperit analiza de putere, a constatat c atunci
cnd se compar a dou grupuri de cte 30 de subieci fiecare, pentru un prag alfa=0.05,
probabilitatea ca o diferen avnd o mrime medie a efectului s ating pragul de semnificaie
este de 0.47! Cu alte cuvinte, din 100 de cercetri, abia n 47 de situaii (mai puin dect dac
decizia ar fi luat aleator) s-ar obine un rezultat care s nu fie doar semnificativ, dar s i aib o
mrime a efectului cel puin medie. Iar dac volumul eantionului este de numai 20 de subieci,
atunci probabilitatea respectiv se reduce la 0.33!

2
Alte recomandri utile, pe ling cele prezentate aici, se gsesc n EFPA review model for the description
and evaluation of psychological tests (Version 3.41: August 2005) [Electronic Version]. Retrieved 29 Oct.
2006 from http://www.efpa.be/.

Marian POPA
30/41
n mod evident, numrul subiecilor are un impact direct asupra puterii testului, adic
asupra capacitii acestuia de a detecta diferene reale. Mrimea efectului, la rndul ei, se refer
la intensitatea asocierii (diferenei) dintre variabilele cercetrii (Kraemer & Thiemann, 1987).
Ceea ce rezult de aici este faptul c alegerea mrimii eantionului, n contextul
diferitelor modele de cercetare, este un subiect care trebuie tratat cu atenie, dac dorim s
asigurm cercetrilor noastre consisten sub aspectul puterii i al mrimii efectului. Desigur, ar fi
de preferat ca aceste dou aspecte s fac obiectul unor evaluri cantitative dar, din pcate,
majoritatea pachetelor de programe statistice nu ofer astfel de proceduri. n practic, o
modalitate mulumitoare de rezolvare a acestei probleme este dimensionarea corespunztoare a
eantioanelor, cu copul de a asigura atingerea unor valori acceptabile pentru puterea testelor
statistice. n acest sens, o incursiune n literatura statistic (Kraemer & Thiemann; 1987;
Wilkinson, 1999; Wolins, 1982) ne ofer o serie de recomandri utile.

Volumul celulelor (grupurilor) pentru testele utilizate n detectarea diferenelor dintre
medii

Toate testele statistice care detecteaz diferenele dintre grupuri se bazeaz pe o anume
distribuie de eantionare. Ca urmare, numrul subiecilor din fiecare eantion are o legtur
direct cu mprtierea distribuiei de eantionare (eroarea standard). Cu ct mai muli subieci n
eantion, cu att mprtierea distribuiei de eantionare este mai mic i ansa de a descoperi o
diferen semnificativ este mai mare (ceea ce nseamn i o putere a testului mai mare). Dar
puterea nu este legat numai de mrimea eantionului, ci i de mrimea efectului. Pe msur ce
mrimea efectului crete, crete i puterea testului. De exemplu, dac dorim s testm efectul unei
psihoterapii dup dou edine, cnd efectul este mic, testul statistic va avea putere mic, adic
va avea anse mai reduse s releve un efect semnificativ dect, s zicem, dup 12 edine, cnd
efectul terapeutic va fi mai pronunat.
Testul t pentru eantioane independente, pentru eantioane dependente, analiza de
varian (ANOVA one-way sau factorial), la fel ca i analiza de varian multivariat
(MANOVA), sunt concepute pentru testa semnificaia diferenelor dintre mediile unor grupuri.
Pentru a menine un nivel acceptabil pentru puterea testului, fiecare dintre grupurile comparate
trebuie s aib un volum minimal, pentru a avea suficient putere n detectarea diferenelor i, n
acelai timp, o nivel mediu-ridicat al mrimii efectului (VanVoorhis & Morgan, 2001). n acest
scop, se consider c 30 de subieci n fiecare celul (definit prin categoriile variabilei
independente) sunt suficieni pentru a garanta o putere de 0.8, ceea ce este un nivel minim pentru
un studiu obinuit (J. Cohen, 1988)(Cohen, 1988).
Concret, pentru a ne putea baza pe o putere acceptabil a testului:
- Pentru o cercetare n care sunt comparate mediile a dou grupuri independente, se vor
utiliza cel puin 60 de subieci (minim 30 pentru fiecare grup). Se observ c, n cazul
unei cercetri bazate pe un model intra-subiect, n care acelai grup este msurat n
dou (sau mai multe) situaii diferite, este suficient un eantion de minim 30 de
subieci pentru asigurarea unei puteri acceptabile. Acesta este unul dintre avantajele
modelului intra-subiect.
- Pentru o cercetare n care este utilizat testul ANOVA pentru o variabil independent
cu trei valori, eantionul cercetrii trebuie s fie compus din cel puin 3x30=90 de
subieci. Dac numrul de subieci din fiecare grup se reduce la 7, iar numrul
grupurilor este de cel puin trei, atunci puterea testului scade la 0.5, iar mrimea
efectului este tot de 0.5. n cazul n care avem 14 subieci n fiecare grup comparat,
pentru cel puin trei grupuri i o mrime a efectului de 0.5, ne putem baza pe o putere
a testului de 0.8.

Marian POPA
31/41
n legtur cu testele de comparaie a mediilor se atrage atenia, n primul rnd, c atunci
cnd sunt comparate mai puine grupuri este mai important s existe mai muli subieci n fiecare
grup. n al doilea rnd, cu ct mrimea efectului la care ne putem atepta este mai mic, cu att
numrul subiecilor trebuie s creasc, pentru garantarea unei valori corespunztoare a puterii
testului (Aron & Aron, 1999).

Mrimea eantionului atunci cnd se studiaz relaia (asocierea variabilelor)

Dei acest lucru face obiectul unor formule complexe, regula empiric general este de a
nu utiliza eantioane mai mici de 50 de subieci n cazul analizei de corelaie sau de regresie
simpl. n cazul corelaiei i regresiei multiple, n care sunt mai multe variabile independente
(criteriu), Green (1991) sugereaz ca volumul eantionului cercetrii s fie N>50+8m, unde m
este numrul variabilelor independente, pentru corelaii multiple i N > 104+m, pentru regresia
multipl. Concret, pentru o analiz de corelaie multipl cu patru variabile se vor utiliza
50+8x4=82 subieci, iar pentru o regresie cu 4 variabile criteriu, se va asigura un eantion de
minim 104+4=108 subieci. Atunci cnd se urmrete att testarea corelaiei ct i a regresiei se
recomand eantioane mai mari dect acestea.
n acelai context sunt recomandate i alte reguli empirice, astfel:
- Pentru 5 sau mai muli predictori (sau variabile multiplu corelate) numrul
participanilor va depi numrul predictorilor cu cel puin 50. Altfel spus, totalul
participanilor trebuie s fie mai mare numrul predictorilor cu cel puin 50 (Harris,
1985);
- Pentru ecuaiile de regresie cu ase sau mai muli predictori se impune un minim de
10 participani pentru fiecare predictor, dar dac situaia o permite, i mai bine este ca
s existe n jur de 30 de subieci pentru fiecare variabil. Cohen i Cohen (1975)
demonstreaz c n cazul unei regresii cu un singur predictor care are o corelaie cu
variabila predictor de 0.30, sunt necesari 124 subieci pentru a menine o putere de
0.80. Cu cinci predictori i o corelaie multipl de 0.30, aceeai putere este atins pe
un eantion de 187 subieci.

O atenie special se va acorda simetriei variabilei dependente, deoarece n cazul
existenei unei asimetrii, mrimea ateptat a efectului este mic i, implicit, puterea testului este
mai mic i ea (Tabachnick & Fidell, 1996).

Volumul eantionului pentru testul chi-ptrat pentru o valoare acceptabil a puterii

O regul de siguran este ca n nici una din celulele tabelului de coresponden frecvena
teoretic s nu fie mai mic de 5, iar volumul total al eantionului s nu fie mai mic de 20. n
cazul testului chi-ptrat, spre deosebire de alte teste statistice, creterea numrului subiecilor nu
are un impact asupra valorii critice de respingere a ipotezei de nul. Totui, volumul eantionului
are un efect asupra puterii testului. Existena unor frecvene teoretice (ateptate) ntr-una sau mai
multe celule ale tabelului de coresponden limiteaz considerabil puterea testului. De asemenea,
valori reduse ale frecvenelor ateptate crete nivelul erorii de tip I. Acesta este i motivul pentru
care se recomand un eantion de cel puin 20 de subieci (Howell, 1997).
Testul chi-ptrat este utilizat pentru testarea gradului de independen (asociere) dintre
variabile categoriale. Ca urmare, nici un subiect nu trebuie s contribuie cu mai mult de o singur
valoare. La rndul lor, gradele de libertate au un anumit impact asupra puterii testului. Cu ct
numrul celulelor tabelului de coresponden crete (care conduce la creterea gradelor de
libertate), se reduc frecvenele teoretice din celulele tabelului de coresponden i, implicit, are
loc o reducere a puterii (Cohen, 1988). i totui, atunci cnd se ateapt o mrime important a
Marian POPA
32/41
efectului, se consider c poate fi tolerat i o valoare mai mic pentru puterea testului, implicit
un volum mai redus al eantionului (minim 8).

Concluzii

Discuia n jurul erorilor statistice, puterii testului i mrimii efectului vine s completeze
raionamentul statistic asociat cercetrilor psihologice. n ultimii ani, din ce n ce mai mult se
atrage atenia asupra faptului c limitarea rezultatelor la raportarea semnificaiei statistice nu este
de natur s ofere o informaie suficient asupra relevanei acestor rezultate. n acest scop,
American Psychological Association a elaborat un set de recomandri speciale, care solicit
cercettorilor publicarea, alturi de semnificaia statistic a mrimii efectului testelor utilizate
(APA, 2001). Ca urmare, din ce n ce mai multe reviste de specialitate care se respect pretind
includerea acestui indice n completarea semnificaiei statistice.

B. Integrarea analizei statistice n documentul de cercetare

n cele ce urmeaz, vom trece n revist principalele capitole ale unui raport de
cercetare (studiu, articol) i modul n care elementele analizei statistice trebuie s fie abordate n
cadrul fiecreia dintre ele. Respectarea aceste recomandri, uzuale n mediul tiinific, are rolul de
a asigura un anumit nivel de standardizare a redactrii, pe de o parte, iar pe de alt parte, acela de
a facilita controlul calitii cercetrii i comparabilitatea rezultatelor obinute de cercettori
diferii (Wilkinson, 1999).
Aa cum a reieit pe parcursul tematicii abordate, metodologia statistic este subordonat
unui anumit demers tiinific. Materializarea sa ntr-un document de analiz i concluzii (care
poate fi un raport de cercetare, un articol tiinific sau o comunicare etc.) se face dup un model
care are, n linii generale, o anumit structur. n cele ce urmeaz, vom trece n revist o serie de
recomandri generale cu privire la modul n care trebuie abordat analiza statistic n cuprinsul
unui material de cercetare, pentru fiecare seciune n parte:

Prezentarea cadrului general al cercetrii

Ipotezele. Se va urmri exprimarea cu claritate a tipului de studiu statistic care a fost
efectuat, i a scopurilor care au fost urmrite. n cazul n care acestea sunt mai multe, vor trebui
prezentate toate, de la bun nceput, inclusiv ordinea de prioritate a fiecruia. Prezentarea paralel
a ipotezelor de nul, dei pare logic, ngreuiaz lectura i produce confuzie. Ca urmare, se va
emite numai ipoteza cercetrii, ipoteza de nul fiind considerat, implicit, opusul ei, fr a mai fi
necesar enunarea acesteia. Se face referire explicit la ipoteza de nul n momentul deciziei
statistice, cnd se afirm acceptarea sau respingerea acesteia.
Testarea ipotezelor nu este ns obligatorie n toate situaiile de cercetare. Dac o anumit
cercetare abordeaz un subiect nou, neinvestigat anterior, metodele statistice exploratorii sunt mai
potrivite dect cele de testare a ipotezelor. Dac tema respectiv a fost intens studiat anterior,
atunci este mai recomandabil un studiu de meta-analiz dect o nou testare a ipotezei.
Uneori, autorii se limiteaz la prezentarea explicit a obiectivelor renunnd la
enunarea specific a unor ipoteze. Acest lucru este justificat fie prin faptul c nu au un
fundament solid pentru emiterea ipotezelor, fie pentru c apreciaz c emiterea ipotezelor
nainte de colectarea datelor poate introduce un element de orientare a acestui proces n
direcia rezultatului ateptat (bias).
Marian POPA
33/41

Populaia. Interpretarea rezultatelor unui studiu depinde de caracteristicile populaiei
pentru care se intenioneaz analiza. Populaia trebuie definit cu claritate, n sensul elementelor
care o compun. Nu trebuie uitat sensul statistic al conceptului de populaie, care se refer nu att
la indivizi umani, ct la totalitatea valorilor unei caracteristici care i definete i care face
obiectul analizei. Cu alte cuvinte, populaia nu trebuie privit ca o clas de obiecte ci ca o colecie
de date care descriu o anumit caracteristic a respectivelor obiecte. Desigur, n cele din urm
rezultatele statistice se vor extrapola la nivelul unei populaii constituit din indivizii pentru care
respectiva caracteristic a fost msurat.

Eantionul. Se va descrie modul de constituire a eantionului, insistndu-se pe criteriile
de includere i, eventual, de excludere a unor indivizi (sau valori). Dac eantionul este stratificat
(dup provenien, sex etc.), se vor descrie criteriile de stratificare i volumul de subieci pentru
fiecare subgrup.

Prezentarea metodei i a condiiilor investigaiei, precum i a lotului de subieci

Variabilele. Variabilele analizate vor fi descrise n mod explicit, indicndu-se denumirea
i semnificaia fiecreia, modul n care au fost msurate i unitatea de msur. Atunci cnd
declarm o variabil, precizm implicit i domeniul valorilor valide. Dac, de exemplu, definim o
variabil care poate lua valori pe o scal de la 1 la 7 (pe o scal cu rspunsuri predefinite), orice
valoare dincolo de domeniul respectiv va fi eronat. Modul de denumire al variabilelor este
important. Astfel, n loc de inteligen este de preferat denumirea de rezultat la testul de
inteligen. Aceasta, pentru c inteligena este o realitate oricum mai complex dect ceea ce
msurm printr-o anumit variabil. Cu alte cuvinte, excesiva generalizare a variabilelor trebuie
evitat.

Instrumentele de msurare. Este recomandabil s fie prezentate cu o descriere (cel puin)
sumar, inclusiv cu caracteristicile lor psihometrice (validitate, consisten intern). Dac este
vorba de un aparat sau de un program de calculator, se vor indica tipul si, eventual, sursa, pentru a
putea fi cutate i de ali cercettori care vor dori s efectueze o replicare a respectivului studiu.
Procedura. Prezentarea modului n care a decurs procedura de investigare, descrierea
condiiilor, a duratei, locului, i a personalului care a contribuit la aceasta. Se va acorda atenie
modalitilor de control al surselor de eroare (limitarea efectului variabilelor covariante,
eliminarea erorilor de msurare).

Prelucrarea datelor

Se va ncepe cu eventualele complicaii care au survenit pe parcursul studiului. Aici se
includ datele lipsa (care nu au putut fi recoltate, din diverse motive), modul de rezolvare a
valorilor excesive din cadrul distribuiilor, dificultile de organizare care au putut influena
calitatea informaiilor recoltate etc. n general, orice aspect relevant care se refer la abaterea de
la condiiile prevzute pentru desfurarea studiului trebuie prezentate.

Analiza primar. Analiza statistic va ncepe ntotdeauna cu o inspecie a valorilor
obinute. Aceasta nseamn analiza distribuiilor sub aspectul formei, indicatorilor tendinei
centrale, valorilor excesive etc. Ignorarea acestui aspect poate conduce la grave erori de
interpretare, sau la un volum mai mare de munc, ulterior, dac se constat prea trziu
imperfeciuni care trebuiau fi eliminate de la bun nceput. Reprezentarea grafic a datelor
Marian POPA
34/41
(histograma) poate fi o metod foarte eficient de identificare a distribuiilor anormale sau valori
improprii.
Scopul acestei analizei primare a variabilelor este dublu:
- obinerea unei imagini de ansamblu a variabilelor de interes (frecvene, tendina
central, mprtierea, grafice);
- fundamentarea alegerii testelor statistice adecvate datelor pe care le analizm;

Desigur, n documentul de cercetare nu se vor include toate rezultate analizei primare, ci
numai acelea strict necesare pentru descrierea variabilelor analizate. De exemplu, nu este necesar
ca raportul s fie mpnat cu histogramele fiecrei variabile cantitative, fapt care ncarc
nejustificat textul cu imagini puin relevante pentru cititor. De asemenea, nu se va descrie i nu se
va justifica alegerea testului statistic, n funcie de natura variabilelor. Acest lucru se consider
implicit.

Verificarea ipotezelor statistice. Acesta este momentul cel mai important al unei cercetri,
acela n care se concretizeaz ntregul efort depus. Primul lucru care trebuie neles este acela c
rezultatele care se vor obine depind n mod decisiv de calitatea i minuiozitatea cu care au fost
parcurse etapele anterior descrise. Un studiu bine fundamentat teoretic, bazat pe ipoteze
consistente, utiliznd instrumente adecvate i beneficiind de o procedur sigur de recoltare a
datelor, va conduce ntotdeauna la rezultate utile. Aceasta nu nseamn neaprat c ele trebuie s
confirme ipotezele. Uneori, chiar i infirmarea unei ipoteze poate fi semnificativ.
Un aspect important aici este alegerea aparatului statistic (teste de semnificaie). Apariia
numeroaselor programe de prelucrare statistic computerizat a condus la orientarea multor
cercettori, mai ales tineri sau nceptori, spre proceduri sofisticate i complicate. Cea mai bun
soluie este alegerea procedurilor statistice minim necesare pentru evidenierea ideilor urmrite.
Abundena de calcule i de teste statistice nu contribuie la o mai bun nelegere ci arat, mai
degrab, nesigurana cercettorului. Una dintre prejudecile rspndite, mai ales printre studeni,
este aceea c exist teste statistice importante (de ex., analiza factorial, analiza de clusteri etc.,
despre care nu a fost vorba n acest manual introductiv n statistic) i altele mai puin
importante (testul diferenelor ntre medii etc.). Complet fals! Alegerea unei proceduri statistice
mai sofisticate putea face o anumit impresie n epoca de dinaintea programelor de calcul
statistic. n prezent, orice procedur, orict de complicat, nu mai reprezint o problem sub
aspectul calculelor, pentru nimeni. Singurul lucru care conteaz cu adevrat este alegerea
procedurii potrivite cu natura datelor i cu obiectivele cercetrii, precum i interpretarea ei
corect. Dac o procedur simpl servete exact ideea care trebuie scoas n eviden, aceasta
trebuie folosit i nu alta, cu un nume mai sonor. S ne gndim i la faptul c avem mai multe
anse ca procedurile simple, uzuale, s fie nelese mai uor, i de ctre mai muli cititori.
n ceea ce privete testarea ipotezelor, nu este suficient expresia acceptm sau
respingem ipoteza. ntotdeauna se va indica i valoarea exact obinut pentru nivelul de
semnificaie (de ex., "p=0.037", i nu doar decizia de acceptare sau respingere, de ex., "p < .05"
or "p > .05"). De reinut c, inclusiv atunci cnd rezultatul obinut nu ndreptete respingerea
ipotezei de nul, ipoteza cercetrii va fi considerat doar neconfirmat i nu respins. Aceast
atitudine este mai potrivit, pe de o parte, cu modelul probabilistic de testare statistic a ipotezelor
i, pe de alt parte, cu faptul c nimic nu ne mpiedic s pstrm ipoteza i s ncercm
confirmarea ei ntr-un alt studiu.
Problema variabilelor multiple. Dac n exemplele din manualele de statistic sunt luate
n discuie, de regul, situaii simple, cu minimum de variabile posibile, cel mai adesea, dou. n
realitate, cel mai adesea, studiile de psihologie trebuie s fac fa unei avalane de variabile a
cror relaie trebuie testat nu doar una cte una ci i n interdependena lor. Acest fapt ridic, pe
de o parte, probleme de procedur statistic i, pe de alt parte, probleme de prezentare a
Marian POPA
35/41
rezultatelor. Alegerea procedurii astfel nct s surprind exact relaiile care intereseaz, cu
excluderea influenelor colaterale, este, din pcate, greu de explicitat la nivelul unui manual
introductiv. n legtur cu forma de prezentare, trebuie avut n vedere necesitatea de a fi, n egal
msur, sintetici i explicii. Sintetici, pentru a nu ngreuna textul cu o abunden excesiv de
tabele de date, explicii, pentru c nu pot fi eludate informaiile eseniale care sunt necesare pentru
interpretarea rezultatelor.

Reinere fa de declararea relaiei cauzale. Aprecierea pe baza unui test de semnificaie
statistic a unei relaii de cauzalitate ntre variabile este cel puin hazardat. Acest lucru poate fi
susinut numai dac se respect anumite condiii experimentale, care s ne asigure c ntre cele
dou variabile este o relaie cauz-efect. Nu se vor emite concluzii de tip cauzal n afara situaiilor
n care recoltarea datelor decurge dintr-un demers de tip experimental. Chiar i procedurile
statistice care sunt destinate determinrii relaiilor cauzale (ecuaiile de modelare structural,
analiza de cale) nu sunt pe deplin sigure n detectarea relaiei cauz/efect (Huck, 2004).

Tabele i figuri. Tabelele sunt cel mai des utilizate pentru includerea n textul rapoartelor
de cercetare a rezultatelor obinute. Ele prezint avantajul indicrii cu exactitate a valorilor i
susinerii cu precizie a concluziilor. Figurile au ns avantajul de a prezenta informaia ntr-o
form intuitiv i accesibil, atrgnd atenia cititorului. Nu se poate face o recomandare de
preferin pentru una sau alta dintre cele dou forme. Oricum, este de reinut c figurile ocup
mult spaiu tipografic i sunt mai pretenioase din punctul de vedere al editrii i al
tehnoredactrii textelor. n orice caz, se vor evita figurile prea complexe. Este recomandabil ca
fiecare grafic s prezinte o singur idee, pe care s o susin ct mai simplu i mai explicit. Atunci
cnd se utilizeaz tehnici de ilustrare grafic se vor prefera formele mai noi (box-plot, stem and
leaf). Graficele si tabelele vor fi numerotate distinct si vor avea un titlul explicit.

Discutarea i interpretarea rezultatelor

Adevrata ncercare ntr-un demers de cercetare nu este, aa cum s-ar putea crede,
prelucrarea efectiv a datelor. Dac sunt corect recoltate i nregistrate, prelucrarea lor se face
destul de uor cu ajutorul programelor computerizate existente astzi. Interpretarea, ns, este o
prob pentru oricine se afl n faza de finalizare a unei cercetri.
Premisa fundamental a unei interpretri consistente este suportul teoretic, claritatea i
consistena ipotezei sau ipotezelor cercetrii. Este imposibil s tragi concluzii dac nu eti
contient de obiectivele urmrite. Adesea se cade prad iluziei c, indiferent de ce date dispunem,
se poate susine un demers de cercetare doar cu ajutorul unui program de calcul statistic sofisticat
i a unui set de date oarecare. Din pcate, se ntmpl destul de des ca un student s vin i s
spun: am aceste date, ce teste statistice pot face cu ele?. Obiectivul cercetrii trebuie s fie clar
precizat de la bun nceput, n timp ce alegerea procedurii statistice ine de natura scalei de
msurare, caracteristicile variabilelor i ipotezei pe care trebuie s o testm. Dac fiecare dintre
aceste aspecte sunt clare n mintea cercettorului, atunci rspunsul la ntrebarea de mai sus este
foarte uor de dat.
Se va urmri, pe de o parte, coerena dintre concluzii i datele pe care se sprijin, iar pe
de alt parte, dintre concluzii i condiiile specifice cercetrii (eantion, model de investigare). Cu
alte cuvinte, fiecare aspect al concluziilor trebuie s aib un suport robust n datele i rezultatele
obinute prin prelucrarea lor. Se va evita generalizarea necritic. Transpunerea anumitor rezultate
dincolo de limitele populaiei cercetrii este adesea hazardat. Rezultatele obinute nu sunt mai
puin importante dac pstrm pruden n generalizarea lor. Studii ulterioare pot confirma sau nu
datele obinute i, pe aceast baz, se poate extinde generalizarea semnificaiilor.
Marian POPA
36/41
n alt ordine de idei, relevana rezultatelor nu depinde doar de atingerea nivelului de
semnificaie statistic ci i de mrimea eantionului. n principiu, aceste dou mrimi contribuie
mpreun la fundamentarea concluziilor, astfel:

rezultat semnificativ
statistic?
eantion concluzia cercetrii
Da mic rezultat important
Da mare importana practic posibil, dar incert
Nu mic rezultat neconcludent
Nu mare ipoteza cercetrii este, probabil, fals

Un alt aspect important este interpretarea semnificaiei statistice. Obiectivul legitim al
testelor statistice este atingerea pragului de semnificaie. De aceea, valoarea lui p este prima care
trebuie s ne atrag atenia la captul prelucrrilor, simindu-ne rspltii pentru eforturile fcute,
dac se afl sub pragul de 0.05. Cu toate acestea, nu trebuie s uitm nici un moment c statistic
semnificativ nu este echivalent cu tiinific important. Dincolo de valoarea lui p se impune
luarea n considerare i mrimea n sine a diferenei sau legturii puse n eviden de respectivul
test statistic. Desigur, o valoare ridicat a testului, fr atingerea pragului de semnificaie, nu este
relevant. Dar nici valoare prea mic, chiar dac este semnificativ statistic. Ct de mic sau ct
de mare trebuie s fie valoarea testului, pentru a o considera important sau relevant? Din
pcate, pentru aceast ntrebare nu exist un rspuns riguros. Se recomand apelul la spiritul
tiinific i la simul comun, concomitent cu raportarea la natura specific a fiecrei situaii n
parte. Cu alte cuvinte, rspunsul depinde de contextul fiecrei cercetri n parte. Din acest motiv,
raportarea mrimii efectului este una dintre soluiile recomandate cu insisten n ultimii ani.
O alt problem de discutat este n legtur cu valoarea n sine a lui p. Dup cum tim,
nivelul minim pentru acceptarea semnificaiei statistice este 0.05, corespunztor valorii
convenionale minim acceptabile pentru pragul alfa. Vorbind n sens strict, un p=0.049 este
considerat semnificativ, n timp ce un p=0.051 trebuie sa fie considerat nesemnificativ. Avnd n
vedere c pragul alfa=0.05 este unul arbitrar, nu se poate evita un astfel de raionament rigid. Cu
toate acestea, exist cercettori care raporteaz rezultate ale lui p uor mai mari dect 0.05 ca
fiind marginal semnificative sau aproape semnificative. S menionm, totui, c o astfel de
atitudine este destul de rar ntlnit i poate determina reacii negative, justificate, din partea
cercettorilor mai riguroi, aflai n majoritate.
n mod intuitiv, suntem tentai s interpretm nivelul de semnificaie n funcie de
valoarea calculat a lui p. Astfel, un p=0.001 ni se pare mai semnificativ dect un p=0.05, de
exemplu. Dac utilizm definiia strict a termenului de semnificaie din raionamentul deciziei
statistice, o astfel de atitudine nu este justificat. O dat ce a fost fixat un anumit nivel al lui alfa,
orice p mai mic sau egal cu acesta este semnificativ, iar orice p mai mare este nesemnificativ. Cei
mai muli statisticieni mprtesc aceast opinie. Cu toate acestea, exist i cercettori mai puin
rigizi care sunt dispui s asocieze valorii lui p anumite calificative, astfel:

>0.05 nesemnificativ
0.01 0.05 semnificativ
0.001 0.01 foarte semnificativ
<0.001 extrem de semnificativ

Fr a fi greite, astfel de formulri nu aduc, totui, o interpretare relevant pentru decizia
statistic. Este util sa adugm c programele de prelucrri statistice afieaz 0.000 pentru
valori ale lui p mai mici de 0.0005, Acest fapt nu va fi interpretat n nici un caz ca exprimnd
Marian POPA
37/41
probabilitate zero, ci doar n sensul c valoarea lui p este mai mic de 0.0005. De altfel, la
raportarea semnificaiei se poate opta, fie pentru nscrierea valorii exacte a lui p, aa cum este
calculat de program, fie doar pentru menionarea plasrii valorii testului sub nivelul alfa stabilit.

Formularea concluziilor

Studiul trebuie s se ncheie cu concluzii adecvate cu rezultatele obinute, formulate
sintetic i explicit. Nu se vor evita aspectele mai puin reuite ale cercetrii, eventualele nereuite,
chiar. Rostul acestora este acela de a ajuta la evitarea repetarea unor greeli de ctre cei care vor
dori s reia acelai tip de investigaie, mai trziu. Se pot face chiar recomandri explicite n acest
sens. Orict de semnificative ar fi rezultatele unui anumit studiu, ele nu vor schimba modul de a
gndi o anumit realitate psihologic. Acest efect nu l pot avea dect rezultate obinute de mai
multe studii concordante pe aceeai tem.
Nu se va uita niciodat faptul c semnificaia statistic nu ine loc i de semnificaie
teoretic, cu sensul de consisten a unui anumit model teoretic explicativ. Procedurile statistice
nu sunt altceva dect instrumente de evaluare probabilist ipotezelor. Profunzimea teoretic a
unui studiu nu poate rezulta dect din calitatea modelului de investigaie (ipoteze, proceduri de
evaluare, subtilitatea analizei rezultatelor etc.) i nu din datele statistice ca atare.
Statistica trebuie s fie o modalitate de organizare i disciplinare a gndirii tiinifice, n nici un
caz, ns, nu se poate substitui acesteia. Dar nu se poate ajunge la aceast performan dect dac
statistica este neleas att sub aspecte ei tari ct i cu limitele ei.
n trecut, la nceputurile utilizrii statisticii n psihologie, prezena acesteia ntr-o lucrare
avea un caracter de prestigiu, cu att mai mare cu ct era mai bogat reprezentat. n prezent,
omniprezena calculatoarelor i a programelor specializate au fcut ca prelucrrile statistice s
devin o operaiune relativ facil. Tocmai din acest motiv, apare riscul abuzului de statistic, a
utilizrii necritice i superficiale a acesteia n elaborarea lucrrilor de cercetare.
n fine, ca o concluzie a celor spuse, se cuvine s insistm pe respectarea exigenelor
procedurale impuse de metoda statistic. Simpla populare a unei lucrri cu date statistice,
tabele, grafice, sau cu valori ale unor teste de semnificaie, nu asigur n mod necesar acelui
document valoarea tiinific la care aspir. Asigurarea calitii datelor supuse prelucrrii,
respectarea condiiilor de alegere a testelor de semnificaie, interpretarea lor adecvat i
publicarea rezultatelor n formatul adecvat, sunt condiii indispensabile pentru calitatea tiinific
a unui studiu bazat pe metoda statistic.

Greeli frecvente n redactarea analizelor statistice

Lectura celor mai multe dintre lucrrile efectuate de studeni scoate n eviden
nerespectarea recomandrilor prezentate mai sus. Efectul const n consemnarea unor greeli,
dintre care cele mai frecvente i mai suprtoare ni se par a fi urmtoarele:

Formulare improprie a ipotezelor sau concluziilor cercetrilor, prin utilizarea unor
termeni care sugereaz relaia de cauzalitate (influeneaz, determin). Se ignor
faptul c testele statistice nu susin existena unei relaii de cauzalitate dect dac datele
sunt recoltate n condiii de experiment psihologic.
Includerea n lucrare a ipotezelor de nul, n paralel cu cele ale cercetrii. Acestea din
urm sunt singurele necesare i suficiente.
Ostentaie n prezentarea rezultatelor prelucrrilor statistice. Cifrele tind s fie mai multe
dect explicaiile i analizele. Aceast manier creeaz impresia neplcut de parad de
statistic. Statistica trebuie sa rmn o prezen discret, al crui rost este doar acela de
a susine concluziile cercetrii.
Marian POPA
38/41
Intrarea n detalii de analiz a datelor, inclusiv n descrierea didacticist a respectrii
condiiilor pentru aplicarea diverselor teste statistice. Este corect ns, s fie evocate
eventualele aspecte deosebite, cum ar fi valori excesive legitime sau operaii de
transformare a unor variabile, cu scopul normalizrii distribuiei.
Includerea integral a rezultatelor calculate de programe pentru diverse proceduri. Unele
dintre acestea conduc la un mare volum de rezultate numerice. Nu toate trebuie reproduse
ci numai acelea care susin n mod direct i explicit concluziile cercetrii.
Raportarea incompleta sau absenta a rezultatelor la testele statistice (enunarea deciziei
statistice i a concluziei cercetrii nu este suficient, ea va fi nsoit ntotdeauna de
valorile testului i de valorile adiacente acestuia).
Exces de zecimale n prezentarea rezultatelor la prelucrri. De regul, valoarea testelor
statistice se raporteaz cu dou zecimale iar probabilitile aferente ipotezei de nul, cu trei
zecimale.
Reproducerea rezultatelor din programele statistice cu pstrarea elementelor de text n
limba englez (atunci cnd lucrarea este scris n limba romn).
Explicaii inconsistente la tabele i grafice. Orict de explicite ar fi acestea, cititorul nu va
fi lsat s i le explice singur.
Grafice sau tabele fr titlu.
Absena coeficienilor de consisten intern pentru testele care nu fac parte din
metodologia profesional general, sau, nc i mai grav, pentru cele create de autor, i pe
care se bazeaz respectiva cercetare.
Instrumente de lucru (teste) prezentate integral n textul lucrrii. Acestea se descriu la
modul general, fiind prezentate integral, eventual, doar la sfritul lucrrii, n caz c se
dorete difuzarea lor.
Transformarea valorilor primare (brute) ale datelor de cercetare, obinute prin aplicarea
unor teste, n valori etalonate. n acest caz se ignor un adevr elementar: etalonarea este
o modalitate de interpretare a rezultatului la un test cu scopul diagnosticului individual.
Altfel spus, etalonarea este necesar n practica psihologic. n ce privete cazul cercetrii
statistice, scorurile (primare) brute sunt perfect utilizabile pentru testarea ipotezelor,
deoarece obiectivul oricrei cercetri este, de regul, relaia dintre variabile. De
asemenea, este neproductiv s transformm valori de tip cantitativ, exprimate pe scal de
interval sau de raport, n variabile calitative, exprimate pe scale ordinale, cum este cazul
etaloanelor n percentile, decile, stanine etc. n fine, prin transformare n valori etalon
variabilitatea valorilor se reduce, ceea ce conduce, alturi de diminuarea nivelului de
msurare, la reducerea puterii statistice a testului.

Marian POPA
39/41
Anexa 1

Marian POPA
40/41
Anexa 2

Marian POPA
41/41
Anexa 3

EXERCIII DE APLICARE A ALGORITMULUI DE ALEGERE A PROCEDURII
STATISTICE:
Citii contextul experimental i alegei procedura adecvat pentru atingerea obiectivului
propus. Atenie, pentru rezolvarea exerciiilor variabilele vor fi luate n considerare sub forma
prezentat, fr a fi transformate pe o alt scal de msurare!

1. Un eantion de elevi piloi este testat sub aspectul capacitii de rezolvare a unei sarcini
de reprezentare spaial (exprimat prin numrul rspunsurilor corecte i viteza de rezolvare), cu
scopul de a vedea n ce msur aceasta este influenat de numrul orelor de zbor acumulate n
carier (exprimate ca atare).

2. Un eantion de dreptaci, unul de stngaci i unul de ambidextri au fost testai sub
aspectul capacitii de recunoatere tactil. fiecare subiect este testat pentru ambele mini, ca
urmare, se pot face diferenele de performan obinute cu cele dou mini. Cercettorul msoar
numrul obiectelor corect identificate cu fiecare mn.

3. Un profesor ine sub observaie copii din trei categorii de familii: cu un singur printe,
care lucreaz; cu doi prini, ambii prini avnd serviciu, cu doi prini, din care numai unul are
serviciu. Pentru fiecare copil este msurat numrul de intervenii fr a fi ntrebat. Pe ansamblu,
rezultatele arat c cei mai muli copii care obin scorul 0, un numr mare obin 1 sau doi, i
civa obin scoruri mari.

4. ntr-un studiu privind relaia dintre fumat i vrst, se iau n considerare numrul de
igri fumate zilnic, grupate pe categorii (sub 5, 6-10, 11-15, 16-20, peste 20) i vrsta exprimat
n clase de cinci ani.

Marian POPA

M Popa Statistica

Încărcat de

Informații document

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

M Popa Statistica

Încărcat de

Drepturi de autor:

Formate disponibile

UNIVERSITATEA DIN BUCURETI

S-ar putea să vă placă și