Documente Academic
Documente Profesional
Documente Cultură
Capitolul 17
TESTE NEPARAMETRICE
T
estele statistice abordate anterior sunt cunoscute ca teste parametrice.
Acestea implic ipoteze i/sau presupuneri referitoare la parametrii i
distribuiile populaiilor. Din fericire aceste teste sunt destul de
robuste. O abatere real de la presupunerile menionate nu poate invalida testul
atta timp ct volumul eantionului este mare. Totui, o problem serioas apare
atunci cnd presupunerile fcute pe marginea distribuiilor sunt profund afectate i
mrimea eantioanelor este mic. Pentru a compensa aceste neajunsuri statistica
face apel la testele neparametrice. Aceste teste au calitatea de a fi mai puin
restrictive n sensul nuanat mai sus (distribuie normal + volum mare de
date). Ele se dovedesc mai puin senzitive dect testele parametrice dac
distribuiile de frecvene sunt relativ normale iar volumul de date este mare.
Prezentm mai jos trei dintre cele mai utilizate teste neparametrice (testul
Mann-Whitney, testul Kruskal-Wallis i testul semnului).
173
Statistic i aplicaii n tiinele sociale
R 1 2 3 4 ... 10 55
1
R 2 11 12 13 .. 18 19 20 155
Aa cum se poate constata, scorurile grupului 1 sunt mai mici dect cele
ale grupului 2 ceea ce explic i diferena dintre sumele rangurilor
R 2 R1 1 0 0 .
174
Statistic i aplicaii n tiinele sociale
R 1 88
R 2 122
R 1 105
R 2 105
175
Statistic i aplicaii n tiinele sociale
R 1 0,5n1 n1 n2 1
z
n1 n2 n1 n2 1
12
176
Statistic i aplicaii n tiinele sociale
Exemplu
Presupunem c dou grupuri de subieci hiperemotivi sunt supuse la dou
tipuri de tratamente de psihoterapie, rezultatele post-terapii fiind cele indicate
prin scorurile de mai jos (scorurile mari indic hiperemotivitate ridicat, scorurile
mici hiperemotivitate apropiat de nivelurile liminale ale emotivitii).
Subiect 1 2 3 4 5 6 7 8 9 10 11
Grup 1 5 7 7 9 10 19 22 22 30 30 31
Grup 2 8 10 19 23 26 27 27 28 28 29 30
Subiect 1 2 3 4 5 6 7 8 9 10 11
Grup 1 1 2,5 2,5 5 6,5 8,5 10,5 10,5 20 20 22
Grup 2 4 6,5 8,5 12 13 14,5 14,5 16,5 16,5 18 20
R 1 109
R 2 144
177
Statistic i aplicaii n tiinele sociale
12 R1 2 R2 2 Rk 2
H ... 3ntotal 1
ntotal ntotal 1 n1 n2 nk
cu R k
suma rangurilor grupului k;
nk numrul de cazuri n grupul k;
ntotal numr total de cazuri.
Exemplu
15 studeni de la 3 specializri diferite sunt solicitai s rezolve o problem de
atenie distributiv. Rezultatele sunt prezentate n tabelul de mai jos.
178
Statistic i aplicaii n tiinele sociale
Exemplu
Un grup de subieci incapabili de ncredere n forele proprii sunt evaluai
pe o scala de ncredere cu note de la 1 la 7. Dup evaluare, acetia beneficiaz
de terapie de specialitate la sfritul creia sunt supui din nou evalurii.
Rezultatele sunt cele prezentate n tabelul de mai jos.
179
Statistic i aplicaii n tiinele sociale
f f
2
9 5 1 5 16 16 32 6,4
2 2
2
0 ateptate
fateptate 5 5 5 5 5
Dar 3 , 84 pentru un grad de libertate (2 grupuri 1) i cum
2
. 05
2
calculat , se respinge ipoteza nul. ntruct Pobservat(+) = 0,9 > 0,5,
2
0 , 05
Probleme propuse:
180
Statistic i aplicaii n tiinele sociale
181
Statistic i aplicaii n tiinele sociale
Scoruri Rang
27
28
28
29
29
29
30
31
32
32
34
35
36
37
38
39
39
39
39
40
40
41
43
45
45
46
48
3. Se cunosc urmtoarele date statistice referitoare la dou grupuri de
persoane
Grupul 1 14 15 16 18 21 24 25
Grupul 2 16 19 21 23 24 27 30 31 32
182
Statistic i aplicaii n tiinele sociale
Capitolul 18
SELECIA STATISTIC
I
ncapacitatea studierii populaiilor statistice impune analiza unui numr
limitat de elemente ale acestora. De exemplu, stabilirea procentului de
animale bolnave presupune studierea tuturor animalelor din unitatea
teritorial stabilit. Din motive uor de neles, acest lucru este ns imposibil
de realizat. Pe de alt parte, intuiia i experiena celui care recurge la analiza
elementelor selecionate pot influena rezultatele cercetrii. Ceea ce trebuie
reinut este faptul c odat cu creterea volumului de date colectate, crete i
ansa de a obine rezultate ct mai exacte legate de ntreaga populaie-int.
Selecia statistic ofer posibilitatea gsirii unor valori tipice (estimaii ale
acestora), specifice ntregii populaii ntre care menionm media, dispersia,
asimetria, corelaiile totale sau pariale etc.
Selecia i propune urmtoarele scopuri:
s estimeze parametrii ntregii populaii int;
s determine gradul de verosimilitate al estimaiilor obinute.
Nivelul verosimilitii depinde de modul n care au fost obinute
estimaiile ca i de modul de obinere al eantionului. Fiecare estimaie trebuie
s fie supus unui filtru de semnificaie.
183
Statistic i aplicaii n tiinele sociale
Exemplul 1
Utiliznd tabelul prezentat, s extragem un eantion de 20 de subieci
dintr-o populaie existent de 10000. Celor 20 de persoane extrase li se pot
ataa numerele de mai sus. Astfel, vom selecta din cele 10000 de persoane doar pe
acelea care au ca numere, numerele de ordine ataate din tabelul lui Tippet.
S presupunem c viteza de reacie la stimuli vizuali (n secunde)
nregistrat pentru fiecare din persoanele astfel selectate este:
0,4 0,3 0,2 0,1 0,5 0,6 0,7 0,8 0,2 0,1 0,3 0,7 0,3 0,7
0,23 0,56 0,67 0,36 0,17 0,56
184
Statistic i aplicaii n tiinele sociale
Exemplul 2
S se extrag un eantion de 10 uniti din populaia subiecilor care
consum calmante (vezi tabelul de mai jos).
Tip subieci Frecven
Subieci cu psihic n limite normale 250
Subieci cu tendine nevrotice 300
Subieci cu emotivitate accentuat 450
Subieci cu depresii 800
Total 1800
185
Statistic i aplicaii n tiinele sociale
186
Statistic i aplicaii n tiinele sociale
este practic imposibil. De aceea, teoria admite c selecia este reprezentativ dac
greutatea fiecrei grupe nu difer mai mult de 5 % n raport cu structura
colectivitii de baz.
n acest context putem vorbi de erori de reprezentativitate care pot fi
sistematice i ntmpltoare. Erorile sistematice apar ca efect al subiectivismului
manifestat n procesul de realizare a seleciei i care n esen const n
obturarea posibilitii fiecrei uniti de a fi incluse n eantion cu aceeai
probabilitate.
Spre deosebire de erorile sistematice, erorile ntmpltoare nu pot fi
eliminate. Cu alte cuvinte, responsabile de nerealizarea unei estimri absolut
corecte a mediei colectivitii generale sunt erorile ntmpltoare. Din cele
menionate rezult c verificarea reprezentativitii unui eantion se poate
realiza analiznd erorile efective de reprezentativitate. Aceste erori trebuie
raportate la o baz de comparaie care n practica statistic este cunoscut sub
denumirea de selecie teoretic.
Specific seleciei teoretice este faptul c structura ei este identic cu cea a
colectivitii generale. Un eantion este cu att mai reprezentativ, cu ct
reproduce mai exact structura seleciei teoretice.
Prezentm n continuare un exemplu de calcul al erorilor de
reprezentativitate.
Exemplu
Nivelul
Selecia teoretic Eantionul I Eantion II Eantion III
studiilor
Frecvena
Frecvena
Frecvena
Frecvena
Frecvena
Abaterea
Abaterea
Abaterea
absolut
absolut
absolut
absolut
absolut
absolut
absolut
relativ
(ani de
studii)
8 12 12/181 13 1 40 28 10 2
10 30 30/181 37 7 50 20 20 10
12 42 42/181 25 17 20 22 25 17
14 43 43/181 46 3 10 33 60 17
16 36 36/181 40 4 20 16 56 20
>18 18 18/181 20 2 41 23 10 8
Total 181 100 181 34 181 142 181 74
187
Statistic i aplicaii n tiinele sociale
K realizare
d 100
n
Pentru cele 3 eantioane, valorile coeficientului sunt:
K realizare I
d 100
34
100 19%
n 181
K realizare II
d 100
142
100 78%
n 181
K realizare III
d 100
74
100 41%
n 181
Primul eantion reproduce cel mai bine structura seleciei teoretice,
nregistrnd abateri de 19 %, cel de-al doilea eantion nregistreaz abateri de
78 % iar cel de-al treilea abateri de 41 %.
Eroarea efectiv de reprezentativitate se determin din relaia:
d x xi x0
iar gradul de reprezentativitate al eantionului din:
x x0
Gd x
x0
Pentru acest exemplu, cele 4 medii nregistreaz urmtoarele valori:
2402
x0 13, 27
181
2418
xI 13,36
181
2258
xII 12, 48
181
2496
xIII 13.8
181
188
Statistic i aplicaii n tiinele sociale
189
Statistic i aplicaii n tiinele sociale
Pentru fiecare din cele 64 de selecii se poate obine o valoare medie care
urmeaz s fie folosit pentru estimarea mediei ntregii colectiviti. Pe lng
mediile obinuite, vom evalua erorile i dispersiile de selecie ce vor fi utilizate
ulterior. Rezultatele sunt prezentate n tabelul de mai jos (media colectivitii
generale = (10 + 20 + 30 + 40)/4 = 25).
190
Statistic i aplicaii n tiinele sociale
191
Statistic i aplicaii n tiinele sociale
192
Statistic i aplicaii n tiinele sociale
Mediile Frecvena
Nr. Eroarea de Probabilitile
de selecie mediilor de
crt. selecie de apariie
posibile selecie
1 10 1 15 1/64
2 13,3 3 11,7 3/64
3 16,7 5 8,3 5/64
4 20 10 5 10/64
5 23,3 12 1,7 12/64
6 26,7 13 1,7 13/64
7 30 10 5 10/64
8 33,3 6 8,3 6/64
9 36,7 3 11,7 3/64
10 40 1 15 1/64
Total 64 1
n figura de mai jos este reprezentat grafic seria de distribuie a erorilor
de selecie astfel obinute.
0
0 5 10 15
20
Frecvena
x x
2
fi
i 0
,
f i
193
Statistic i aplicaii n tiinele sociale
x x
2
fi
i 0
6, 442
f i
194
Statistic i aplicaii n tiinele sociale
02
2 nerepetat ,
n
02 2
,
n n
unde 2 exprim media dispersiilor din eantioanele cercetate;
cazul seleciei nerepetate
02 N n 2 N n
n N 1 n N 1
Pentru selecia de serii, eroarea medie de selecie se calculeaz aplicnd
relaiile:
cazul seleciei repetate
2
r
195
Statistic i aplicaii n tiinele sociale
2 Rr
r R 1
unde r este numrul de serii iar R este numrul de serii pe ntreaga colectivitate;
cazul seleciei nerepetate cnd se lucreaz cu dispersia de selecie
2 Rr
r 1 R 1
196
Statistic i aplicaii n tiinele sociale
Exemplu
Cercetarea selectiv desfurat la dou universiti, totaliznd 3000 de
studeni, n scopul evalurii numrului mediu al celor care fac fa programelor
universitare i a proporiei nregistrate de ceilali studeni a condus la obinerea
datelor din tabelul de mai jos. Selecia a cuprins un procent de 10 % din
numrul de studeni corespunztor fiecrei universiti.
a numrului de studeni
care fac fa programei
programei universitare
Colectivitatea general
Proporia studenilor
Dispersia de selecie
Dispersia de selecie
Media de selecie
universitare xi
universitare p
Universiti
p(1 p)
Ni
ni
x
xn i i
80 100 90 200
86, 66
n i 300
197
Statistic i aplicaii n tiinele sociale
2 n i
2
i
8 100 9 200
8, 66
n i 300
Eroarea medie de selecie
2 n 8, 66 300
1 1 0,1612
n N 300 3000
La o probabilitate de 0,99999 pentru care t tabelat (anexa G) este egal cu
5, eroarea limit de selecie este:
t 5 0,1612 0, 806
Pentru calculul proporiei numrului de studeni care nu fac fa
programelor universitare, media corespunztoare la nivelul ntregului eantion
se determin astfel:
p
pn i i
0,12 100 0,17 200
0,1533
n i 300
p 1 p n
i i i
0,1056 100 0,1411 200
0,1293
n i 300
0,1293 300
1 0, 02
300 3000
Eroarea limit calculat cu o probabilitate de 99,999 % este de 0,1.
5 0, 02 0,1
198
Statistic i aplicaii n tiinele sociale
N
La selecia stratificat, principala particularitate este legat de repartizarea
volumului de selecie pe grupe. Sunt posibile urmtoarele cazuri:
Selecia este stratificat proporional. n acest caz greutatea specific
fiecrei grupe trebuie s coincid att n eantion, ct i n
colectivitatea de baz.
Selecia este stratificat optim, situaie n care este necesar stabilirea
volumului de selecie pe grupe, innd seama att de proporia de
selecie ct i de gradul de variaie din fiecare grup.
Exemplu
Se consider o colectivitate general mprit n 2 grupe. Datele de care
dispunem sunt prezentate n tabelul de mai jos.
199
Statistic i aplicaii n tiinele sociale
Volumul Abaterile
Dispersiile
colectivi- medii ptrate
Grupe pe grupe iNi i2Ni
tii pe grupe
i2
Ni i
1 1000 15 225 15000 225000
2 2000 30 900 60000 1800000
Total 3000 75000 2025000
2
N i
2
i
2025000
675
N
0
i 3000
Presupunnd c rezultatele seleciei se obin cu o probabilitate de 0,99999
pentru t = 5 (anexa G), volumul de selecie se calculeaz astfel:
52 675
n 6
3000
Acest volum trebuie repartizat pe grupe. Pentru selecia proporional,
repartizarea se face aplicnd relaia de calcul:
Ni
ni n ,
Ni
deci
1000
n1 6 2
3000
2000
n2 6 4
3000
Dac selecia este optim repartizat, volumul de selecie ce revine fiecrei
grupe se calculeaz din relaia:
n i N i
ni ,
i Ni
200
Statistic i aplicaii n tiinele sociale
deci
6 15000
n1 1
75000
6 60000
n2 5
75000
n cazul seleciei simple, fiecrei grupe i vor reveni 6/2 = 3 uniti.
201