Sunteți pe pagina 1din 4

33

6. Teste neparametrice

Testele pe care le-am prezentat până acum în curs priveau variabilele de natură
cantitativă, pentru care se puteau calcula parametrii distribuţiei (media, dispersia). De
aceea, ele se mai numesc teste parametrice.

Adesea însă suntem puşi în situaţia de a analiza date calitative, categoriale, cum ar fi
sexul, mediul de viaţă (urban/rural), preferinţa pentru un candidat le preşedinţie etc. În
acest caz, testele parametrice precum z, t sau F nu ne mai ajută. De aceea va trebui să
apelăm la testele neparametrice.

Pentru a exemplifica aplicarea testelor statistice în SPSS, vom folosi baza de date
voter.sav, care conţine date reale înregistrate pe un eşantion de 1847 de alegători
americani, privitoare la alegerile prezidenţiale din 1992 din SUA. Această bază de
date conţine o serie de variabile categoriale potrivite scopului nostru.

Testul binomial

Acest test este folosit în cazul variabilelor categoriale care pot lua doar două valori
(cum ar fi, de exemplu, sexul). Rolul lui este de a compara proporţia celor două valori
în eşantion cu proportia din populaţia totală sau cu o altă proporţie teoretică dată.

Să presupunem că dorim să verificăm dacă proporţia bărbaţi/femei în acest eşantion


de alegători americani corespunde cu cea (aproximativă) întâlnită în populaţia totală
(50/50). Vom utiliza comanda:

Analyze > Nonparametric Tests > Binomial

În fereastra “Test Variable List” vom introduce variabila sex. În câmpul “Test
Proportion” se află trecută deja valoarea 0.50, reprezentând distribuţia teoretică
(50/50) cu care vom compara distribuţia din eşantion. Dacă distribuţia teoretică este
alta, vom schimba desigur variabila din acest câmp.

În parte din stânga jos a casetei de dialog se observă un cadran intitulat “Define
Dichotomy” cu două opţiuni: “Get From Data” şi Cut Point”. Dacă variabila cu care
lucrăm este una categorială, va rămâne selectată prima opţiune (cea implicită). Dacă
variabila este cantitativă, o putem transforma într-una categorială alegând opţiunea a
doua şi indicând valoarea unde se face diviziunea dintre cele două categorii. De
exemplu, dacă s-ar pune problema să testăm proportia alegătorilor în vârstă de peste
40 de ani, am alege opţiunea “Cut Point” şi am introduce în câmpul respectiv
valoarea 40.

Odată ce apăsăm butonul OK, SPSS-ul ne dă rezultatul analizei:


34

Binomial Test
Category N Observed Test Prop. Asymp.
Prop. Sig. (2-
tailed)
RESPONDE Group 1 male 804 .44 .50 .000
NTS SEX
Group 2 female 1043 .56
Total 1847 1.00
a Based on Z Approximation.

Se poate observa că din 1847 de alegători din eşantion, 804 (44%) sunt bărbaţi, iar
1043 (56%) sunt femei. Valoarea lui “Sig.” este calculată aproximând distribuţia
binomială cu una normală. Regula de decizie este cea cunoscută: dacă valoarea lui
“Sig.” este mai mică decât nivelul de semnificaţie ales (0.05), atunci putem spune că
există o diferenţă semnificativă între cele două proporţii. Este şi cazul nostru de faţă:
nu putem afirma că proporţia bărbaţi femei din eşantion o reproduce pe cea din
populaţia totală – femeile predomină într-o proporţie semnificativă.

Testul hi pătrat (χ2)

Atunci când avem de-a face cu variabile calitative care au mai mult de două categorii,
vom folosi testul hi pătrat pentru a compara două distribuţii. Distribuţia unui eşantion
o putem compara fie cu o echirepartiţie (adică o distribuţie în care toate categoriile
deţin ponderi egale), fie cu oricare altă distribuţie teoretică dorită de cercetător.

Să analizăm acum distribuţia intenţiilor de vot pentru Clinton, Bush sau Perot
(variabila pres92). Apelăm comanda:

Analyze > Nonparametric Tests > Chi-Square

În fereastra “Test Variable List” introducem variabile pres92. Observăm apoi că în


cadranul “Expected Values” ni se dă posibilitatea să definim distribuţia teoretică cu
care vom face comparaţia. Dacă dorim ca ea să fie o echirepartiţie, vom selecta
opţiunea “All Categories Equal” (aceasta corespunde cazului teoretic în care
intenţiile de vot s-ar împărţi egal între cei trei candidaţi). În caz contrar, vom
introduce pe rând valorile distribuţiei teoretice folosind opţiunea “Values”.

Apăsând butonul OK obţinem:

VOTE FOR CLINTON, BUSH, PEROT


Observed Expected Residual
N N
Bush 661 615.7 45.3
Perot 278 615.7 -337.7
Clinton 908 615.7 292.3
Total 1847
35

Test Statistics
VOTE FOR CLINTON,
BUSH, PEROT
Chi-Square 327.341
df 2
Asymp. .000
Sig.
a 0 cells (.0%) have expected frequencies less than 5. The minimum expected cell
frequency is 615.7.

În primul tabel observăm valorile distribuţiei reale (coloana a doua), cele ale
distribuţiei teoretice, care sunt egale (coloana a treia), precum şi diferenţele dintre ele.

În tabelul al doilea avem datele analizei. Valoarea lui hi pătrat este 327.341, iar
numărul de grade de libertate este 2 (numarul categoriilor variabilei minus unu).
Întrucât “Sig.” este mai mic decât 0.05, putem spune că între cele două distribuţii
există diferenţe semnificative. Cu alte cuvinte, intenţiile de vot nu tind a se împărţi
egal între candidaţi; părerea lor este deja formată, iar majoritatea opţiunilor merg spre
Clinton, după cum se poate observa din primul tabel.

Testul Mann-Whitney (U): compararea a două eşantioane


independente

Acest test este echivalentul testului t pe eşantioane independente pentru variabilele


calitative. El se utilizează atunci cân avem de-a face cu variabile ordinale şi are la
bază comparaţiile rangurilor diverselor variabile. Să vedem în continuare dacă
bărbaţii şi femeile din eşantion diferă în mod semnificativ între ei sub aspectul
studiilor. Pentru aceasta vom folosi variabila degree, care este una ordinală (0
corespunde sudiilor medii, iar 4 studiilor superioare). Vom apela comanda:

Analyze > Nonparametric Tests > 2 Independent Samples

În fereastra “Test Variable List” introducem variabile degree, iar în câmpul


“grouping Variable” variabila sex. Apoi apăsăm butonul Define Groups şi definim
cele două grupuri exact cum am făcut pentru testul t bivariat pentru eşantioane
independente (vezi capitolul 3). În cadranul “Test Type” este deja selectat testul
Mann-Whitney (U), aşa încât apăsăm butonul OK şi obţinem:

Test Statistics
RS HIGHEST DEGREE
Mann-Whitney U 409502.000
Wilcoxon W 953948.000
Z -.932
Asymp. Sig. (2-tailed) .351
a Grouping Variable: RESPONDENTS SEX

Acest tabel este cel mai important pentru analiză, deoarece ne dă semnificaţia testului.
Regula de decizie este cea cu care ne-am obisnuit deja: trebuie să comparăm valoarea
lui “Sig.” cu cea a nivelului de semnificaţie ales de noi (0.05). Întrucât aici avem
0.351>0.05, vom tage concluzia că bărbaţii si femeile nu diferă între ei în ceea ce
priveşte nivelul de educaţie. Dacă diferenţa ar fi fost semnificativă, atunci sensul ei ar
fi fost dat de semnul notei Z de pe rândul patru al tabelului.
36

S-ar putea să vă placă și