Sunteți pe pagina 1din 20

M.

Popa – AplicaŃii SPSS (teste neparametrice)

Teste neparametrice cu SPSS

Testele neparametrice se utilizează în următoarele situaŃii:


- atunci când variabila dependentă este măsurată pe scală nominală sau
ordinală;
- atunci când variabila dependentă este de tip categorial, indiferent de
scala de măsurare;
- atunci când, deşi variabila dependentă este măsurată pe scală
cantitativă (interval sau raport), nu întruneşte condiŃiile impuse de
testele parametrice: distribuŃie care se abate grav de la forma normală –
asimetrie sau boltire mari, valori excesive:
- volumul eşantionului este foarte mic.

Tipurile de teste care vor fi tratate în continuare sunt următoarele:

Teste neparametrice pentru date nominale:


- testul z pentru proporŃia unui singur eşantion;
- testul z pentru diferenŃa dintre proporŃiile a două eşantioane;
- testul semnului;
- testul chi-pătrat al asocierii (independenŃei);
- testul chi-pătrat pentru gradul de corespondenŃă (goodness of fit).

Teste neparametrice pentru date ordinale:


- testul Mann-Whitney (U) pentru două eşantioane independente;
- testul Wilcoxon pentru două eşantioane perechi ;
- testul Kruskal-Wallis pentru mai mult de două eşantioane independente ;
- testul Friedman pentru măsurări repetate;
- teste de corelaŃie pentru date ordinale (Spearman, Kendall).

A. Teste neparametrice pentru date nominale

A. 1 Testul z al proporŃiei pentru un singur eşantion

Utilizare

Testul z pentru proporŃii pentru un eşantion, este utilizat în cazul variabilelor


dihotomice, pentru a testa diferenŃa dintre proporŃiile valorilor în eşantion prin comparaŃie cu
proporŃia la nivelul populaŃiei.
Exemplu: La întrebarea „cine se uită la telenovele?” răspund DA 7 subiecŃi, dintre
care 5 femei şi 2 bărbaŃi. Întrebarea cercetării este dacă femeile se uită într-o proporŃie mai
mare decât bărbaŃii la telenovele.

CondiŃii

Cunoaşterea proporŃiei la nivelul populaŃiei pentru valorile variabilei testate. În cazul


nostru, raportul femei/bărbaŃi este cunoscut din studiile demografice (51%-49%)

Aranjarea datelor

Se creează variabila dihotomică cu valori numerice. Variabilele de tip „string” nu


sunt acceptate de procedura SPSS. În cazul nostru, valorile sunt 1 pentru feminin şi 2 pentru
masculin.

1/20
Actualizat la: 08.11.2006/12:13:21
M. Popa – AplicaŃii SPSS (teste neparametrice)

Procedura: Statistics-Non Parametric Tests-Binomial...

• Variabila testată este trecută în lista Test Variable List:


• În zona Define Dichotomy se alege Get from data, dacă variabila este
dihotomică, sau Cut point, dacă variabila este continuă, prin fixarea unei
valori care împarte distribuŃia în două categorii.
• În zona Test proportion se introduce proporŃia primei categorii.
• Butonul Options permite solicitarea statisticii descriptive pentru variabila
testată.

Rezultate

Rezultatul în cazul exemplului dat cuprinde frecvenŃa pe categorii, procentul şi


semnificaŃia testului în raport cu proporŃia la nivelul populaŃiei (p=0.243).

În acest caz, se acceptă ipoteza de nul şi se respinge ipoteza cercetării. ProporŃia


femeilor care se uită la telenovele nu diferă semnificativ de proporŃia bărbaŃilor, prin raportare
la proporŃia lor în populaŃia generală.

2/20
Actualizat la: 08.11.2006/12:13:21
M. Popa – AplicaŃii SPSS (teste neparametrice)

A. 2 Testul z al diferenŃei dintre două proporŃii independente

Utilizare

Acest test se utilizează atunci când se doreşte compararea a două proporŃii obŃinute
pentru o variabilă dihotomică.
Exemplu: În urma unui studiu cu privire la interesul faŃă de fenomenele paranormale,
efectuat în rândul studenŃilor de la Universitate, comparativ cu studenŃii de la Politehnică, se
înregistrează următoarele rezultate1:
• La psihologie: 25 studenŃi „nu cred” în fenomenele paranormale, iar 175
„cred”
• La politehnică: 124 „nu cred” în fenomenele paranormale, iar 32 „cred”
Problema cercetării este dacă diferenŃa dintre cei „cred” în fenomenele paranormale
din cele două categorii de studenŃi este semnificativă.

Aranjarea datelor

Datele pot fi introduse fie caz cu caz, existând o variabilă pentru opinia faŃă de
fenomenele paranormale şi una pentru tipul de instituŃie de învăŃământ, fie ca în imaginea de
mai jos, care presupune o prealabilă sintetizare a datelor:

• o variabilă (paranorm) pentru codificare „credinŃei” în fenomenele


paranormale;
• o variabilă (stud_la) pentru apartenenŃa la una din cele două instituŃii de
învăŃământ superior;
• o variabilă (frecv) pentru frecvenŃa cazurilor.

 Este important de reŃinut faptul că toate variabilele trebuie să fie numerice. În baza de
date de mai sus, variabila paranorm ia valoarea 1 pentru „cred” şi valoarea 2 pentru
„nu cred”, iar variabila stud_la are valoarea 1 pentru Universitate şi 2 pentru
Politehnică.
 Valorile variabilelor au fost etichetate corespunzător, iar afişarea etichetelor în locul
valorilor, în celulele tabelului de date, a fost obŃinută cu setarea View-Value labels
din meniul SPSS Data Editor. De reŃinut că, deşi afişează etichetele, SPSS va opera în
calcule cu valorile.

Procedura: SPSS nu dispune de o procedură specifică pentru calcularea directă a


diferenŃei dintre două procente. În acest scop se utilizează procedura Crosstabs şi testul chi-
pătrat.
 În prealabil, se execută procedura Weight pentru variabilele categoriale
(paranorm şi stud_la) în funcŃie de variabila frecv, care contorizează numărul
cazurilor.

1
Datele nu sunt reale

3/20
Actualizat la: 08.11.2006/12:13:21
M. Popa – AplicaŃii SPSS (teste neparametrice)

OperaŃia asociază valorile variabilelor categoriale (paranorm şi stud_la) cu valorile


variabile frecv. Efectul ei este unul „invizibil” pe ecran, dar se va reflecta în analizele
statistice ulterioare.

 Efectul de ponderare (weight) a unei variabile rămâne activ atâta timp cât nu se
ponderează o altă variabilă sau nu se anulează ponderarea efectuată. La salvarea
fişierului se salvează şi variabila ponderată. Includerea variabilei ponderate în diverse
proceduri de analiză are efecte specifice.
 Dacă datele ar fi fost introduse în baza de date caz cu caz, operaŃia Wheight nu ar mai
fi fost necesară.

 Se execută procedura Statistics-Summarize-Crosstabs... pentru variabilele


paranorm şi stud_la, cu selectarea Chi-Square din caseta Statistics. (nu mai
prezentăm imaginile, acestea fiind identice cu cele de la testul chi-pătrat).

Rezultate

SPSS Viewer prezintă mai întâi tabelul de corespondenŃă dintre variabilele


categoriale, cu valorile variabilei ponderate prin procedura Wheight.

Din tabelul Chi-Square Tests citim valoarea Pearson Chi-Square (161.598).

Testul z pentru diferenŃa proporŃiilor se calculează prin extragerea radicalului din


valoarea lui chi-pătrat:
z = 161.598 = 12.71

Semnul lui z se află din diferenŃa proporŃiilor testate, astfel:

4/20
Actualizat la: 08.11.2006/12:13:21
M. Popa – AplicaŃii SPSS (teste neparametrice)

175 32
pa − pb = − = 0.875 − 0.205 = +0.67
200 156

Decizia statistică se ia prin raportarea valorii calculate a lui z la valorile critice ale
acestuia de pe curba normală, pentru test unilateral sau bilateral. În cazul nostru, pentru test
bilateral, cu alfa=0.05, z calculat (12.71) este mai mare decât z critic (1.96), fapt care permite
respingerea ipotezei de nul şi confirmarea ipotezei că studenŃii de la Universitate „cred” într-o
măsură semnificativ mai mare în fenomenele paranormale decât studenŃii de la Politehnică.

A. 3 Testul semnului

Utilizare

Testul semnelor este utilizat pentru a testa diferenŃa dintre valori, utilizându-se
semnul diferenŃei şi nu valoarea acesteia, atunci când ambele valori sunt măsurate pentru
aceiaşi subiecŃi. Dacă nu ar exista nici o diferenŃă între valorile perechi, atunci numărul
diferenŃelor pozitive ar trebui să fie egal cu cel al diferenŃelor negative. Cu cât numărul
diferenŃelor de un anumit semn este mai mare, comparativ cu cel al diferenŃelor de semn opus,
cu atât creşte probabilitatea ca diferenŃa dintre variabile să fie statistic semnificativă.
Exemplu: Într-un experiment cu privire la efectul motivării asupra memorării,
subiecŃilor (N=8) li se cere să memoreze cuvinte dintr-o listă, înainte si după introducerea
unui factor motivant. Dat fiind faptul că numărul subiecŃilor este prea mic pentru asumarea
normalităŃii distribuŃiei de eşantionare, se alege testul semnului în locul testului t pentru
eşantioane dependente.

CondiŃii

Variabilele vor fi de tip numeric, iar valorile exprimate în aceeaşi unitate de măsură,
pentru a se putea face diferenŃa lor.

Aranjarea datelor

Imaginea de mai jos conŃine variabilele „inainte” şi „dupa”, care vor fi analizate.

Variabila „dif” conŃine rezultatul diferenŃei „dupa-inainte”.


Variabila „semn”, conŃine semnul diferenŃei. Ambele sunt prezentate numai pentru a
face mai evident baza de calcul a testului deoarece, în fapt, nu sunt relevante sub aspectul
procedurii SPSS.
Dacă nu se dispune de valorile variabilelor, ci numai de semnul diferenŃei, testul
semnului va fi calculat manual, pe baza formulei 4.7.

5/20
Actualizat la: 08.11.2006/12:13:21
M. Popa – AplicaŃii SPSS (teste neparametrice)

Procedura: Statistics-Nonparametric Tests-2 Related Samples...

În prima fază, cele două variabile sunt


Apoi, perechea de variabile este trecută în
selectate, pe rând, prin clic de mouse pe
lista Test Pair(s) List: prin acŃionarea
fiecare, constituindu-se în pereche. Acest fapt
butonului ►.
se observă în partea de jos a casetei, în zona
Dacă este necesar, se pot testa simultan mai
Current Selections.
multe perechi de variabile.
Se bifează Sign în zona Test Type.

Rezultate

Tabelul Sign Test cuprinde numărul diferenŃelor pozitive, respectiv negative, pentru
cazurile din baza de date. În cazul nostru, există 7 diferenŃe pozitive şi nici o diferenŃă
negativă.

Tabelul Test Statistics, prezintă semnificaŃia testului (p=0.016). Ipoteza de nul se


respinge dacă valoarea lui p este mai mică decât pragul fixat şi care, implicit, este 0.05. În
exemplul dat, ipoteza de nul se respinge, acceptându-se ipoteza cercetării (motivarea
stimulează memorarea).

6/20
Actualizat la: 08.11.2006/12:13:21
M. Popa – AplicaŃii SPSS (teste neparametrice)

A.4 Testul Chi-pătrat al asocierii (independeŃei)

Utilizare

Testul chi-pătrat este utilizat pentru evidenŃierea gradului de asociere între două
variabile categoriale.
Exemplu: Să presupunem că am evaluat numărul femeilor şi al bărbaŃilor, pasageri
într-un avion care a suferit un accident la aterizare, fără victime, diagnosticaŃi cu sindrom de
stres posttraumatic (PTSD). FrecvenŃele absolute sunt cele din următorul tabel de
corespondenŃă:
Femei BărbaŃi
PTSD 40 20
Non-PTSD 10 30

Problema cercetării este dacă incidenŃa PTSD este în legătură cu caracteristica de sex.

CondiŃii
• Variabile categoriale, care pot fi exprimate, fie prin valori numerice, fie prin
valori de tip string (caracter tipăribil)
• Cele două variabile nu trebuie să se „intersecteze” (să nu existe subiecŃi care
să fie incluşi în mai mult de o celulă de tabel).
• Este recomandabil ca frecvenŃa aşteptată să nu ia valori mai mici de 5 (sau,
cel puŃin, în nu mai mult de 20% din celule).
• Nici o celulă nu trebuie să aibă frecvenŃa aşteptată 0..

Aranjarea datelor

Datele pot fi incluse în Data Editor în două moduri:


a. Sub forma unor înregistrări distincte pentru fiecare caz

Acest mod poate fi extrem de dezavantajos atunci când sunt multe cazuri sau când
există deja o statistică globală a fenomenului PTSD în raport cu sexul.

b. Sub forma unor înregistrări distincte pentru valorile caracteristicii de sex:

7/20
Actualizat la: 08.11.2006/12:13:21
M. Popa – AplicaŃii SPSS (teste neparametrice)

În această situaŃie, se introduc frecvenŃele PTSD pentru toate combinaŃiile valorilor


celor două variabile analizate şi frecvenŃele asociate fiecăreia. Pentru a se realiza
corespondenŃa dintre variabilele sex şi PTSD cu variabila frecv, se apelează la procedura
Data-Wheight Cases...:

Facem precizarea că în tabelele de date din imaginile de mai sus variabilele au fost
codificate numeric cu 1 respectiv 2, atât pentru sex cât şi pentru PTSD, valorile fiind
etichetate. Faptul că în celule apar etichetele şi nu valorile, se obŃine prin setarea Data-Value
Labels.

 Procedura chi-pătrat acceptă şi variabile de tip caracter (string), dar reamintim


recomandarea de principiu ca toate variabilele să fie declarate de tip numeric.

Procedura: Statistics-Summarize-Crosstabs...

Casetele de configurare sunt următoarele:

• În caseta principală Crosstabs se trec variabilele analizate în lista Row(s), respectiv


Columns(s). Pot fi analizate mai multe perechi de variabile simultan. Rezultatul
analizei nu depinde de modul de plasare a variabilelor pe linie sau pe coloană. Dacă
de doreşte crearea unui grafic al corespondenŃei dintre variabile, se va bifa şi Display
clustered bar charts.
• În caseta Statistics se bifează Chi-Square.
• În caseta Cell Display se bifează Counts-Observed; Percentages-Row, Column, Total
şi Residuals-Unstandardized (bifarea opŃiunilor este în funcŃie de informaŃiile pe care
le doreşte analistul).

Rezultate

Imaginea prezintă tabelul de corespondenŃă, având pe linii valorile caracteristicii de


sex iar pe coloane valorile aferente variabilei PTSD. În celulele tabelului se află valorile
solicitate prin configurarea casetelor. Vom exemplifica pentru celula „feminin/da”:

8/20
Actualizat la: 08.11.2006/12:13:21
M. Popa – AplicaŃii SPSS (teste neparametrice)

• Count 40 indică numărul femeilor cu PTSD


• %within Sex 80.0% indică procentul femeilor care au manifestat PTSD din totalul
femeilor
• %within PTSD 66.7% indică procentul femeilor cu PTSD din totalul celor care au
manifestat PTSD
• % of Total 40% indică procentul femeilor cu PTSD din totalul subiecŃilor
• Residual 10% indică diferenŃa dintre numărul de femei cu PTSD (frecvenŃa
observată) şi frecvenŃa aşteptată (în cazul nostru, +10)

În tabelul Chi-Square Tests citim valoarea testului Pearson Chi-Square (16.66) şi, în
special, pragul de semnificaŃie al acestuia (p=0.000 care va fi citit ca p<0.001). În cazul
particular al acestui exemplu, unde tabelul de corespondenŃă este format din două linii şi două
coloane, valoarea lui chi-pătrat poate fi luată de pe linia Continuitiy Correction (15.04) cu
valoarea aferentă a pragului de semnificaŃie: p<0.0005.
Valoarea lui p pentru testului chi-pătrat fiind mai mică decât nivelul alfa 0.05, se
respinge ipoteza de nul şi se confirmă ipoteza cercetării: există o incidenŃă mai mare a reacŃiei
de stres posttraumatic la femei decât la bărbaŃi.

 În raportarea statisticii chi-pătrat va fi inclusă valoarea gradelor de libertate (df) şi


numărul cazurilor
 Valoarea lui chi-pătrat se raportează cu două zecimale

9/20
Actualizat la: 08.11.2006/12:13:21
M. Popa – AplicaŃii SPSS (teste neparametrice)

Graficul de tip bară permite vizualizarea relaŃiei dintre variabile:

A.5 Testul chi-pătrat pentru gradul de corespondenŃă (goodness of fit)

Utilizare

Testul chi-pătrat pentru gradul de corespondenŃă se utilizează atunci când dorim să


comparăm frecvenŃele observate ale unei singure variabile categoriale, cu frecvenŃele
aşteptate ale acesteia, dinainte cunoscute.
Exemplul 1: Avem evaluarea nivelului de inteligenŃă pe cinci categorii valorice, de la
foarte slab, la foarte bun şi dorim să ştim dacă distribuŃia acestor calificative se supune curbei
normale, procentele aferente pe curba normală fiind cunoscute (2.5%, 14%, 67%, 14%,
2.5%).
Exemplul 2: Am solicitat unui grup de tineri să îşi exprime genul muzical preferat şi
am obŃinut frecvenŃe diferite pentru mai multe genuri de muzică. Problema cercetării este
dacă diferenŃele dintre aceste frecvenŃe sunt semnificative. Ipoteza de nul în acest caz este că
preferinŃele se distribuie egal între genurile muzicale (adică, dacă ar fi trei genuri, fiecare ar
trebui să întrunească un procent de 33.33%).

Aranjarea datelor

Vom exemplifica pe o situaŃie corespunzătoare celui de-al doilea exemplu. Baza de


date se poate constitui fie prin înregistrarea fiecărui caz în parte (având o variabilă pentru
genul muzical şi o alta pentru exprimarea preferinŃei faŃă de acesta), fie, ca în exemplul
anterior, prin înregistrarea rezultatelor sintetice şi ponderarea variabilei gen_muz cu variabila
frecv prin operaŃia Data-Weight cases...:

10/20
Actualizat la: 08.11.2006/12:13:21
M. Popa – AplicaŃii SPSS (teste neparametrice)

Procedura: Statstics-NonParametric-Tests-Chi-Square...

• În caseta Chi-Square Test se trece variabila analizată în zona Test Variable


List.
• Se bifează All categories equal, acesta fiind modelul în raport cu care dorim
să testăm frecvenŃele variabilei analizate
• Dacă am fi dorit să le testăm în raport cu alte frecvenŃe cunoscute, am fi bifat
Values şi, apoi, am fi introdus pe rând acele frecvenŃe (scriindu-le în dreptul
lui Values şi înregistrându-le prin butonul Add)

Rezultate

Cele două tabele cu rezultate din Viewer prezintă:


• FrecvenŃele observate, frecvenŃele aşteptate şi valorile reziduale (diferenŃa
dintre frecvenŃe) pentru cele trei genuri muzicale
• Valoarea testului chi-pătrat al corespondenŃei (12.17), df(2) şi p=0.002

Acest rezultat justifică respingerea ipotezei de nul şi acceptarea concluziei că


diferenŃele dintre preferinŃele pentru cele trei genuri muzicale sunt semnificative şi nu se
datorează variaŃiei întâmplătoare de eşantionare.

B. Teste neparametrice pentru date ordinale

B. 1 Testul Mann-Whitney (U) pentru două eşantioane independente

Utilizare

Testul Mann-Whitney este utilizat pentru testarea diferenŃei dintre grupuri


independente pentru care variabila dependentă este exprimată în valori ordinale (de rang) sau
atunci când, chiar dacă este de tip cantitativ, nu suportă un test parametric (testul t).
Exemplu: La ieşirea dintr-un club de noapte, un psiholog interesat de efectul depresiv
al drogurilor a efectuat interviuri în legătură cu acest aspect şi a identificat un număr de 10
tineri care au consumat câte o pastilă de Ecstasy şi un număr de 10 tineri care au consumat
doar alcool. Apoi i-a convins să ia parte la un experiment şi le-a administrat un chestionar de

11/20
Actualizat la: 08.11.2006/12:13:21
M. Popa – AplicaŃii SPSS (teste neparametrice)

evaluare a depresiei. Acelaşi chestionar a fost aplicat din nou, peste trei zile. Obiectivele
studiului sunt:
a. verificarea ipotezei că cele două tipuri de drog (Ecstasy şi alcool) au efecte
depresante diferite între ele;
b. Ecstazi are un efect depresant pe termen lung, mai mare decât alcoolul.
În acest scop vor trebui comparate valorile la depresie ale celor două grupuri. Această
analiză va fi efectuată atât pentru valorile depresiei de la prima măsurare cât şi pentru cele de
la a doua evaluare a depresiei (după trei zile).

Aranjarea datelor

Variabilele din baza de date sunt următoarele:


• cod_sub, un cod numeric de identificare a fiecărui subiect (deşi exemplele
anterioare nu au cuprins această variabilă, ea nu trebuie să lipsească din nici o
baza de date)
• drog, pentru tipul de drog utilizat (sunt afişate etichetele, iar valorile sunt
1=Ecstasy, 2=Alcool)
• depr_1, scorul la depresie la prima evaluare
• depr_2, scorul la depresie la a doua evaluare

 Variabilele dependente din exemplul nostru au valori măsurate pe scală cantitativă.


Testarea lor cu un test ordinal nu presupune o prealabilă transformare de rang,
programul efectuând automat această transformare. Procedura se aplică în acelaşi
mod şi direct pe valori ordinale de rang.

Procedura: Statistics-Non Parametric Tests-2 Independent Samples...

Se cuvine să precizăm că, în mod normal, datele de acest tip ar conduce la utilizarea
testului t pentru eşantioane independente. Cu toate acestea, având în vedere volumul foarte
mic al eşantionului, utilizarea unui test neparametric este de preferat.

12/20
Actualizat la: 08.11.2006/12:13:21
M. Popa – AplicaŃii SPSS (teste neparametrice)

În caseta Two-Independent Samples Tests variabilele analizate sunt trecute în lista


Test Variable List.

Rezultate

Tabelul Ranks oferă informaŃii sintetice despre cele două variabile: volumul
grupurilor, media rangurilor şi suma rangurilor.

Tabelul Test Statistics include valorile testului Mann-Whitney pentru cele două
variabile testate simultan, depresia imediată şi remanentă. Valorile de interes din tabel sunt
cele ale lui Z şi nivelul de încredere p. În cazul nostru, se observă că depresia imediată nu
diferă semnificativ în funcŃie de tipul de drog utilizat, în timp ce depresia remanentă este
semnificativ diferită, mai mare la utilizatorii de Ecstasy decât la utilizatorii de alcool
(conform datelor din tabelul anterior).

B. 2 Testul Wilcoxon pentru două eşantioane perechi

Utilizare

În exemplul anterior, pentru testul Mann-Whitney, psihologul a testat diferenŃa


intensităŃii depresiei între consumatorii de Ecstasy şi alcool, imediat şi după trei zile.
Rezultatul a fost acela că efectul depresiv nu este diferit pe termen imediat, dar este
semnificativ diferit după trei zile. Datele pot fi analizate însă şi separat, pe fiecare grup de

13/20
Actualizat la: 08.11.2006/12:13:21
M. Popa – AplicaŃii SPSS (teste neparametrice)

consumatori (Ecstasy, respectiv alcool) în cele două momente diferite (imediat şi după trei
zile).
Dacă testul Mann-Whitney a verificat ipoteza diferenŃei dintre categorii de
consumatori (eşantioane independente), testul Wilcoxon va permite testarea ipotezei că
depresia este diferită de la un moment la altul în cadrul fiecărei categorii de consumatori în
parte (eşantioane dependente).
Facem precizarea că aceste două teste nu trebuie întotdeauna utilizate împreună,
succesiv, ca în exemplul acestui studiu. Dacă facem aici acest lucru, este numai pentru că ne-
am propus două obiective distincte, fiecare fiind testat cu o procedură diferită, în funcŃie de
natura eşantioanelor comparate.

Aranjarea datelor

Este identică cu cea prezentată pentru testul Mann-Whitney.


În acest caz, deoarece analiza trebuie efectuată separat pe grupurile de consum
Ecstasy/Alcool, există două soluŃii. Prima ar fi selectarea (cu Data-Select Cases) a primului
grup şi efectuarea testului, apoi selectarea celui de-al doilea grup şi efectuarea testului. O
soluŃie mai elegantă este însă aceea de a declara împărŃirea bazei de date în funcŃie de
grupurile definite prin tipul de drog. În acest scop se va utiliza procedura Data-Split File...

În locul setării implicite Analyze all cases, do not create groups, se bifează opŃiunea
Compare groups şi se declară variabila ale cărei valori vor servi drept criteriu de împărŃire a
bazei de date în grupuri de analiză separată (în cazul nostru, tipul de drog) prin trecerea ei în
zona Groups Based on:. Efectul acestei acŃiuni este acela că toate prelucrările care vor fi
efectuate din acest moment se vor aplica, separat, pe fiecare grup identificat prin valorile
variabilei.

 OperaŃiunea de împărŃire a bazei de date nu are semne vizibile pe ecran, fapt care
poate face să fie uitată şi, astfel, atunci când se revine la prelucrări care ar trebui să
implice toată baza de date rezultatele vor fi incorecte. De aceea, se va avea în vedere
revenirea la setarea Analyze all cases, do not create groups atunci prelucrarea pe
grupuri a bazei de date nu mai este becesară.

14/20
Actualizat la: 08.11.2006/12:13:21
M. Popa – AplicaŃii SPSS (teste neparametrice)

Procedura: Statistics-Non Parametric Tests-2 Related Samples...

Setarea procedurii în caseta Two-Related-Samples tests se face în doi timpi:


1. Se selectează prin clic de mouse fiecare 2. Se acŃionează butonul ► pentru a se
variabilă, constituindu-se perechea supusă transfera perechea de variabile în zona Test
analizei Pair(s) list.

Se bifează opŃiunea pentru testul Wilcoxon (care este, de fapt, cea implicită)

Rezultate

Tabelul Ranks oferă informaŃii sintetice despre rangurile pozitive şi negative pentru
cele două grupuri, numărul subiecŃilor, media rangurilor şi suma lor.

Tabelul Test Statistics prezintă valorile comparative ale depresiei pentru cele două
grupuri. Aşa cum se observă, diferenŃa este semnificativă (p=0.007) în cazul consumatorilor
de Ecstasy şi nesemnificativă (p=0.053), în cazul consumatorilor de alcool. Concluzia
generală a studiului este aceea că Ecstasy, comparativ cu alcoolul, are un efect depresiv mai
mare (testul Mann-Whitney) şi mai accentuat cu trecerea timpului (testul Wilcoxon).

Aducem aminte că testul Wilcoxon presupune calcularea a două valori, T(+) pentru
diferenŃa pozitivă a rangurilor şi T(-) pentru diferenŃa negativă a rangurilor, cea mai mică
dintre ele fiind considerată valoarea testului. În exemplul nostru, testul Wilcoxon pentru
Ecstazy a fost calculat "pe baza rangurilor negative" (vezi nota a. de sub tabel), ceea ce
înseamnă că acestea au fost mai puŃine, iar cele pozitive au fost mai multe. Ori, diferentele
pozitive de rang exprima valori ale depresiei mai mari după trei zile decât după o zi. Asta,
deoarece SPSS atribuie rangul 1 valorii celei mai mici, şi rangul cel mai mare valorii celei

15/20
Actualizat la: 08.11.2006/12:13:21
M. Popa – AplicaŃii SPSS (teste neparametrice)

mai mari din distribuŃie. Ca urmare, este corect să concluzionăm că rezultatul testului indică o
valoare semnificativ mai mare a depresiei după trei zile decât după o zi.

B. 3 Testul Kruskal-Wallis pentru mai mult de două eşantioane independente

Utilizare

Testul Kruskal-Wallis este utilizat atunci când avem o


variabilă dependentă ordinală, măsurată pentru mai mult de două
grupuri independente (formate din subiecŃi diferiŃi), şi dorim să
testăm diferenŃa dintre acestea. Acest test pentru date ordinale
este analog testului ANOVA pentru date cantitative.
Exemplu: A fost studiată relaŃia dintre condiŃiile
familiale (familie armonioasă, mamă singură, familie
conflictuală) şi frecvenŃa reacŃiilor emoŃionale pozitive la copiii
de vârstă preşcolară, pe durata unei săptămâni. Problema
cercetării este dacă diferenŃele sunt semnificative iar mediul
familial are legătură conduita emoŃională a copiilor.

Aranjarea datelor se face ca în imaginea alăturată:

În baza de date, variabila familie a fost codificată şi etichetată astfel: 1=familie


armonioasă, 2=mamă singură, 3=familie conflictuală. Etichetele sunt afişate ca urmare a
opŃiunii Data-Value Labels. Rezultatele vor fi identice dacă variabila dependentă este
exprimată şi direct în valori de rang.

Procedura: Statistics-Non Parametric tests- k Independent Samples...

În caseta principală se trece


variabila testată în zona Test
Se defineşte domeniul Forma finală a casetei este
Variable List: iar variabila
valorilor variabilei aceasta.
independentă în zona
independente, în cazul nostru: Testul Kruskal-Wallis este
Gouping Variable. Se
minim 1, maxim 3. bifat implicit.
activează comanda Define
Range...

16/20
Actualizat la: 08.11.2006/12:13:21
M. Popa – AplicaŃii SPSS (teste neparametrice)

Rezultate

Primul tabel include informaŃii descriptive cu privire la variabila testată: numărul


subiecŃilor din fiecare grup şi media rangurilor pentru fiecare grup. De precizat că programul
acordă rangul 1valorii celei mai mici. Datele din tabel indică descreşterea mediei rangurilor
(expresii emoŃionale pozitive numeroase) de la familia armonioasă la cea conflictuală.

Rezultatul testului, afişat în tabelul Test Statistics se exprimă printr-o valoare chi-
pătrat (6.33) cu două grade de libertate şi p=0.042. Ca urmare, ipoteza de nul poate fi
respinsă. Datele confirmă ipoteza că mediul familial (exprimat prin cele trei tipuri de familie)
îşi pune amprenta asupra expresivităŃii emoŃionale a copiilor de vârstă preşcolară.

B. 4 Testul Friedman pentru măsurări repetate

Utilizare

Testul Friedman se utilizează pentru testarea diferenŃei de rang în cazul unei variabile
măsurate repetat, de mai mult de două ori, pe acelaşi grup de subiecŃi. El este echivalentul
testului ANOVA pentru măsurări repetate, pentru date parametrice. Dacă este utilizat pentru
doar două măsurări repetate, rezultatul său este echivalent cu al testului Wilcoxon.
Exemplu: Efectele altitudinii asupra memoriei sunt testate pe un grup de alpinişti.
Capacitatea de memorare de cuvinte este măsurată la trei înălŃimi diferite: 1000m, 3000m şi
6000m. Problema cercetării este dacă diferenŃa de performanŃă de memorare corespunzătoare
celor trei înălŃimi este semnificativă. Dat fiind volumul extrem de mic am eşantionului (N=5),
efectuarea unui test parametric (ANOVA RM) ar fi nesigură iar apelul le testul Friedman este
pe deplin justificat.

Aranjarea datelor

17/20
Actualizat la: 08.11.2006/12:13:21
M. Popa – AplicaŃii SPSS (teste neparametrice)

Variabilele mem_1000, mem_3000 şi mem_6000 conŃin numărul cuvintelor memorate


pentru fiecare dintre cei 5 alpinişti. Nu este necesară transformarea lor în valori de rang,
deoarece acest lucru va fi efectuat automat de program. Dacă datele primare sunt sub formă
de ranguri, ele vor fi introduse ca atare, rezultatul fiind identic.

Procedura: Statistics-Non Parametric Tests-K related Samples...

Se setează opŃiunea Friedman, iar variabilele testate sunt trecute în lista Test
Variables:

Rezultate

Primul tabel prezintă media rangurilor pe înălŃimi (rangul 1 este atribuit valorii celei
mai mici). În al doilea tabel găsim valoarea testului Friedman exprimată în valori chi-pătrat
(8.40), având un nivel de semnificaŃie p=0.015. Acest rezultat permite respingerea ipotezei
de nul şi confirmă ipoteza că memoria cuvintelor este în legătură cu înălŃimea (pe cele trei
niveluri avute în vedere).

B. 5 CorelaŃia datelor ordinale (Spearman, Kendall)

Utilizare

Testul de corelaŃie a rangurilor (Spearman) este echivalentul pentru date ordinale


testului de corelaŃie Pearson. Rezultatul său variază pe aceeaşi plajă de valori (-1/+1) şi se
interpretează în mod similar cu rezultatul testului Pearson.
Exemplu: Să luăm în considerare studiul aceluiaşi grup de alpinişti, care au
efectuat, la aceleaşi înălŃimi descrise mai sus, şi un test de viteză de decizie (măsurată în
zecimi de secundă). Problema cercetării este dacă între performanŃa de memorare şi timpul de
decizie este o relaŃie (variaŃie concomitentă) semnificativă.

Aranjarea datelor

Alături de variabilele „memorie” pentru cele trei înălŃimi, avem acum şi


variabilele pentru timpul de decizie.

18/20
Actualizat la: 08.11.2006/12:13:21
M. Popa – AplicaŃii SPSS (teste neparametrice)

Procedura: Statistics-Corelation-Bivariate

Variabilele supuse testului de corelaŃie se trec în lista Variables:


Se anulează setarea pentru testul Pearson şi se bifează Spearman (aici am ales şi
testul Kendal tau-b, care este echivalent lui Spearman, doar pentru a le putea compara. În
practică, se va utiliza doar unul dintre acestea două).
Această configurare a casetei de dialog produce o matrice de corelaŃii cu şase linii şi
şase coloane pentru fiecare dintre cele două teste alese. În fiecare celulă a matricii se vor afla,
aşa cum vom vedea, mai multe numere. Din acest motiv citirea ei nu este tocmai comodă.
Pentru a obŃine un format mai convenabil de prezentare a rezultatelor, recomandăm o
procedură suplimentară, prezentată anterior la corelaŃia Pearson: Se acŃionează butonul Paste
care deschide fereastra Syntax, unde găsim comenzile procedurii. Aici se introduce clauza
WITH între primul grup de variabile (memorie) şi al doilea grup de variabile (decizie):

Mai departe, procedura de corelaŃie se lansează cu butonul ► de pe bara de


comenzi a ferestrei Syntax.
Această variantă de lucru nu este obligatorie. Se poate efectua corelaŃia şi direct
din caseta principală, dar, aşa cum am spus, rezultatele vor fi prezentate într-o formă mai
puŃin „ergonomică” la citire.

Rezultate

Tabelul cu rezultate cuprinde pe linii variabilele „memorie” şi pe coloane, variabilele


„decizie”. Deoarece am cerut calcularea simultană a ambilor coeficienŃi de corelaŃie, datele

19/20
Actualizat la: 08.11.2006/12:13:21
M. Popa – AplicaŃii SPSS (teste neparametrice)

sunt dublate. Este de la sine înŃeles că în practică nu vom utiliza decât unul dintre aceşti
coeficienŃi de corelaŃie a rangurilor.
Din celulele tabelului de mai sus nu ne interesează decât cele care cuprind corelaŃia
dintre memorie şi decizie la acelaşi palier de înălŃime. Pentru a fi mai vizibile, am îngroşat
valorile utile analizei. În jumătatea de sus a tabelului, avem corelaŃiile pentru testul Kendall
iar în jumătatea de jos pe cele ale testului Spearman.

Testul Kendall al corelaŃiei dintre memorie şi decizie la 1000 de metri are valoarea
-0.94, semnificativ la p=0.023. La interpretarea coeficienŃilor de corelaŃie este extrem de
important să se ia în considerare, simultan, semnul şi semnificaŃia variaŃiei valorilor. În cazul
nostru, valori mari ale memoriei, înseamnă o capacitate de memorare mai bună iar valori mari
ale timpului de decizie înseamnă capacitate de decizie mai proastă (sub aspectul vitezei,
desigur). În consecinŃă, un coeficient de corelaŃie negativ între aceste variabile indică, de fapt,
o variaŃie concomitentă pozitivă a memoriei şi vitezei deciziei (când capacitatea de memorare
scade, şi decizia este mai lentă, timpul de decizie fiind mai mare).
Analiza coeficienŃilor din tabelul de mai sus arată existenŃa unei corelaŃii de rang
semnificative (p<0.05) între memorie şi decizie la toate palierele de înălŃime.
Dacă facem comparaŃia dintre coeficienŃii Spearman şi Kendal, vom vedea că, deşi ei
diferă valoric, semnificaŃiile se află, în toate cazurile, de aceeaşi parte a deciziei statistice
(respingerea ipotezei de nul). Utilizarea unuia sau altuia dintre cei doi coeficienŃi rămâne la
latitudinea cercetătorului.

20/20
Actualizat la: 08.11.2006/12:13:21

S-ar putea să vă placă și