Documente Academic
Documente Profesional
Documente Cultură
6. Teste neparametrice
Testele pe care le-am prezentat până acum în curs priveau variabilele de natură
cantitativă, pentru care se puteau calcula parametrii distribuţiei (media, dispersia). De
aceea, ele se mai numesc teste parametrice.
Adesea însă suntem puşi în situaţia de a analiza date calitative, categoriale, cum ar fi
sexul, mediul de viaţă (urban/rural), preferinţa pentru un candidat le preşedinţie etc. În
acest caz, testele parametrice precum z, t sau F nu ne mai ajută. De aceea va trebui să
apelăm la testele neparametrice.
Pentru a exemplifica aplicarea testelor statistice în SPSS, vom folosi baza de date
voter.sav, care conţine date reale înregistrate pe un eşantion de 1847 de alegători
americani, privitoare la alegerile prezidenţiale din 1992 din SUA. Această bază de
date conţine o serie de variabile categoriale potrivite scopului nostru.
Testul binomial
Acest test este folosit în cazul variabilelor categoriale care pot lua doar două valori
(cum ar fi, de exemplu, sexul). Rolul lui este de a compara proporţia celor două valori
în eşantion cu proportia din populaţia totală sau cu o altă proporţie teoretică dată.
În fereastra “Test Variable List” vom introduce variabila sex. În câmpul “Test
Proportion” se află trecută deja valoarea 0.50, reprezentând distribuţia teoretică
(50/50) cu care vom compara distribuţia din eşantion. Dacă distribuţia teoretică este
alta, vom schimba desigur variabila din acest câmp.
În parte din stânga jos a casetei de dialog se observă un cadran intitulat “Define
Dichotomy” cu două opţiuni: “Get From Data” şi Cut Point”. Dacă variabila cu care
lucrăm este una categorială, va rămâne selectată prima opţiune (cea implicită). Dacă
variabila este cantitativă, o putem transforma într-una categorială alegând opţiunea a
doua şi indicând valoarea unde se face diviziunea dintre cele două categorii. De
exemplu, dacă s-ar pune problema să testăm proportia alegătorilor în vârstă de peste
40 de ani, am alege opţiunea “Cut Point” şi am introduce în câmpul respectiv
valoarea 40.
Binomial Test
Category N Observed Test Prop. Asymp.
Prop. Sig. (2-
tailed)
RESPONDE Group 1 male 804 .44 .50 .000
NTS SEX
Group 2 female 1043 .56
Total 1847 1.00
a Based on Z Approximation.
Se poate observa că din 1847 de alegători din eşantion, 804 (44%) sunt bărbaţi, iar
1043 (56%) sunt femei. Valoarea lui “Sig.” este calculată aproximând distribuţia
binomială cu una normală. Regula de decizie este cea cunoscută: dacă valoarea lui
“Sig.” este mai mică decât nivelul de semnificaţie ales (0.05), atunci putem spune că
există o diferenţă semnificativă între cele două proporţii. Este şi cazul nostru de faţă:
nu putem afirma că proporţia bărbaţi femei din eşantion o reproduce pe cea din
populaţia totală – femeile predomină într-o proporţie semnificativă.
Atunci când avem de-a face cu variabile calitative care au mai mult de două categorii,
vom folosi testul hi pătrat pentru a compara două distribuţii. Distribuţia unui eşantion
o putem compara fie cu o echirepartiţie (adică o distribuţie în care toate categoriile
deţin ponderi egale), fie cu oricare altă distribuţie teoretică dorită de cercetător.
Să analizăm acum distribuţia intenţiilor de vot pentru Clinton, Bush sau Perot
(variabila pres92). Apelăm comanda:
Test Statistics
VOTE FOR CLINTON,
BUSH, PEROT
Chi-Square 327.341
df 2
Asymp. .000
Sig.
a 0 cells (.0%) have expected frequencies less than 5. The minimum expected cell
frequency is 615.7.
În primul tabel observăm valorile distribuţiei reale (coloana a doua), cele ale
distribuţiei teoretice, care sunt egale (coloana a treia), precum şi diferenţele dintre ele.
În tabelul al doilea avem datele analizei. Valoarea lui hi pătrat este 327.341, iar
numărul de grade de libertate este 2 (numarul categoriilor variabilei minus unu).
Întrucât “Sig.” este mai mic decât 0.05, putem spune că între cele două distribuţii
există diferenţe semnificative. Cu alte cuvinte, intenţiile de vot nu tind a se împărţi
egal între candidaţi; părerea lor este deja formată, iar majoritatea opţiunilor merg spre
Clinton, după cum se poate observa din primul tabel.
Test Statistics
RS HIGHEST DEGREE
Mann-Whitney U 409502.000
Wilcoxon W 953948.000
Z -.932
Asymp. Sig. (2-tailed) .351
a Grouping Variable: RESPONDENTS SEX
Acest tabel este cel mai important pentru analiză, deoarece ne dă semnificaţia testului.
Regula de decizie este cea cu care ne-am obisnuit deja: trebuie să comparăm valoarea
lui “Sig.” cu cea a nivelului de semnificaţie ales de noi (0.05). Întrucât aici avem
0.351>0.05, vom tage concluzia că bărbaţii si femeile nu diferă între ei în ceea ce
priveşte nivelul de educaţie. Dacă diferenţa ar fi fost semnificativă, atunci sensul ei ar
fi fost dat de semnul notei Z de pe rândul patru al tabelului.
36