Sunteți pe pagina 1din 29

Statistic i aplicaii n tiinele sociale

Capitolul 17

TESTE NEPARAMETRICE

17.1 Teste parametrice versus teste neparametrice

T
estele statistice abordate anterior sunt cunoscute ca teste parametrice.
Acestea implic ipoteze i/sau presupuneri referitoare la parametrii i
distribuiile populaiilor. Din fericire aceste teste sunt destul de
robuste. O abatere real de la presupunerile menionate nu poate invalida testul
atta timp ct volumul eantionului este mare. Totui, o problem serioas apare
atunci cnd presupunerile fcute pe marginea distribuiilor sunt profund afectate i
mrimea eantioanelor este mic. Pentru a compensa aceste neajunsuri statistica
face apel la testele neparametrice. Aceste teste au calitatea de a fi mai puin
restrictive n sensul nuanat mai sus (distribuie normal + volum mare de
date). Ele se dovedesc mai puin senzitive dect testele parametrice dac
distribuiile de frecvene sunt relativ normale iar volumul de date este mare.
Prezentm mai jos trei dintre cele mai utilizate teste neparametrice (testul
Mann-Whitney, testul Kruskal-Wallis i testul semnului).

17.1.1 Transformarea scorurilor n ranguri

Anumite teste solicit transformarea scorurilor n ranguri. Utilizarea


rangurilor nu necesit niciun fel de condiii referitoare la forma distribuiei
populaiei, cu toate c cele mai multe (distribuii) pornesc de la ipoteza c
variabila este continu. Altfel, ne plasm n domeniul variabilei discrete.
n acest ultim caz apar situaii de scoruri identice ceea ce ridic problema stabilirii
rangurilor. Cea mai simpl procedur de determinare a rangurilor const n
atribuirea pentru fiecare scor identic a unui rang mediu, calculat ca medie a
rangurilor care ar fi fost nregistrate dac acestea ar fi fost diferite.
Subiect Scor Rang
1 1 1
2 2 2,5
3 2 2,5
4 3 5,5

173
Statistic i aplicaii n tiinele sociale

Subiect Scor Rang


5 3 5,5
6 3 5,5
7 3 5,5
8 4 8
9 5 9
nn 1
Suma rangurilor astfel fixate trebuie s fie egal cu . Folosind
2
datele exemplului prezentat rezult c suma rangurilor este egal cu 9 10/2 = 45.
ntr-adevr 1 + 2,5 + 2,5 + 5,5 + 5,5 + 5,5 + 5,5 + 8 + 9 = 45.

17.2 Testul Mann-Whitney

Testul Mann-Whitney este o alternativ la testul t pentru eantioane


independente. Se aplic n situaiile n care eantioanele sunt mici, distribuiile
datelor nu sunt normale iar datele pot fi prezentate sub form de clasament.
Logica testului este simpl.
S presupunem c se dispune de dou grupuri de cte 10 subieci fiecare,
pentru care distribuiile scorurilor sunt cele indicate n tabelul de mai jos.
Grup Scor Rang Grup Scor Rang
1 5 1 2 16 11
1 6 2 2 17 12
1 7 3 2 18 13
1 8 4 2 19 14
1 9 5 2 20 15
1 10 6 2 21 16
1 11 7 2 22 17
1 12 8 2 23 18
1 13 9 2 24 19
1 14 10 2 25 20

R 1 2 3 4 ... 10 55
1

R 2 11 12 13 .. 18 19 20 155

Aa cum se poate constata, scorurile grupului 1 sunt mai mici dect cele
ale grupului 2 ceea ce explic i diferena dintre sumele rangurilor
R 2 R1 1 0 0 .

174
Statistic i aplicaii n tiinele sociale

Refcnd componena grupurilor prin trecerea unor subieci din grupul 2


n grupul 1 i invers, distribuia scorurilor, evident se modific ca de altfel i
diferena dintre sumele rangurilor (vezi tabelul de mai jos).
Grup Scor Rang Grup Scor Rang
1 5 1 2 12 8
1 6 2 1 16 11
1 7 3 1 13 9
1 8 4 2 9 5
2 10 6 2 18 13
2 11 7 2 28 18
1 14 10 1 21 15
2 17 12 1 26 17
2 19 14 2 30 19
1 24 16 2 32 20

R 1 88

R 2 122

n ciuda acestor intercalri, R 1 rmne mai mic dect R2 .


O alt rearanjare, ca n tabelul de mai jos, ne conduce la o echilibrare perfect
a celor dou sume ale rangurilor:
Grup Scor Rang Grup Scor Rang
1 5 1 2 16 11
2 6 2 1 17 12
2 7 3 2 18 13
1 8 4 1 19 14
1 9 5 2 4 15
2 10 6 1 24 16
2 11 7 1 26 17
1 12 8 1 28 18
2 13 9 2 30 19
1 14 10 2 32 20

R 1 105

R 2 105

175
Statistic i aplicaii n tiinele sociale

Aceste exemple ilustreaz semnificativ efectul ntmplrii n dinamica


rangurilor.
Testul Mann-Whitney este utilizat pentru a evalua discrepana dintre
sumele rangurilor a dou eantioane. Practic se urmrete s se vad dac
discrepana este suficient de mare pentru a nu mai putea fi explicat prin
efectul ntmplrii.
Paii urmrii pentru aplicarea testului Mann-Whitney sunt:
1. Stabilirea celor dou grupuri. Dac cele dou grupuri nu sunt egale n
volum, atunci grupul cel mai mic va fi considerat grupul 1.
2. Combinarea tuturor scorurilor ntr-o distribuie de volum n1 + n2.
n situaia identificrii unor scoruri identice, pentru stabilirea
rangurilor se aplic procedura de mai sus.
3. Se calculeaz suma rangurilor tuturor scorurilor n grupul 1. n anexa
E sunt date valorile critice pentru R 1 , corespunznd testului
unilateral la pragurile de: 0,005; 0,1; 0,025 i 0,05.
4. Localizarea liniei din anexa E corespunztoare lui n2 i luarea
deciziei n funcie de urmtoarele situaii:
a) H1: grup1 grup2. Dac ipoteza alternativ este bidirecional, se
gsete intervalul pentru R 1 corespunztor pragului de
semnificaie egal cu . Ipoteza nul (n situaia n care nu exist
2
diferene ntre cele dou populaii) este respins dac R 1
este
egal sau mai mic dect limita inferioar n anex sau dac este
egal sau mai mare dect limita superioar.
b) H1: grup1 < grup2. n cazul acestei ipoteze alternative unidirecionale
se gsete intervalul pentru R1 corespunztor pragului de
semnificaie egal cu . Ipoteza nul se respinge dac R 1 este
egal sau mai mic dect limita inferioar indicat n anex.
c) H1: grup1 > grup2. Se aplic acelai raionament de mai sus cu
deosebirea c ipoteza nul se respinge dac R 1 limita
superioar indicat.
Pentru testul Mann-Whitney statistica utilizat, dac se urmresc situaiile
a), b) sau c), este:

R 1 0,5n1 n1 n2 1
z
n1 n2 n1 n2 1
12

176
Statistic i aplicaii n tiinele sociale

Se accept ipoteza nul dac z calculat z critic .

Exemplu
Presupunem c dou grupuri de subieci hiperemotivi sunt supuse la dou
tipuri de tratamente de psihoterapie, rezultatele post-terapii fiind cele indicate
prin scorurile de mai jos (scorurile mari indic hiperemotivitate ridicat, scorurile
mici hiperemotivitate apropiat de nivelurile liminale ale emotivitii).

Subiect 1 2 3 4 5 6 7 8 9 10 11
Grup 1 5 7 7 9 10 19 22 22 30 30 31
Grup 2 8 10 19 23 26 27 27 28 28 29 30

Se solicit un punct de vedere argumentat statistic referitor la cele dou


grupuri, urmrindu-se eficacitatea terapiilor.

Calculm rangurile pentru scorurile celor dou grupuri.

Subiect 1 2 3 4 5 6 7 8 9 10 11
Grup 1 1 2,5 2,5 5 6,5 8,5 10,5 10,5 20 20 22
Grup 2 4 6,5 8,5 12 13 14,5 14,5 16,5 16,5 18 20

R 1 109

R 2 144

n anexa E pentru n1 = 11, n2 = 11 i /2 = 0,005, valoarea critic


corespunztoare este cuprins ntre 87 i 166. ntruct R1 109 , se reine
ipoteza nul iar concluzia care se trage este c cele dou terapii au fost relativ
de aceeai eficacitate.
La acelai rezultat se poate ajunge calculnd statistica z.
109 0, 5 11 11 11 1 109 126, 5
z 1,15
11 11 11 11 1 15, 22
12
Valoarea critic a statisticii z la un prag de semnificaie /2 = 0,005 este
z critic ( 0 , 005 ) 2 ,58 . Cum zcalculat zcritic se accept ipoteza nul.

177
Statistic i aplicaii n tiinele sociale

17.3 Testul Kruskal-Wallis

Testul Kruskal-Wallis este o alternativ la analiza de varian pentru cazul


unifactorial. Logica de baz a testului Kruskal-Wallis este similar cu cea a
testului Mann-Whitney.
Presupunnd c urmm procedura de combinare a scorurilor de la k
grupuri, scorurile fiind marcate cu ranguri de la 1 la n1 + nk, n situaia n
care eantioanele provin de la populaii similare ne ateptm ca sumele
rangurilor pentru toate grupurile s fie relativ egale, eventualele diferene
datorndu-se ntmplrii. Dac ns grupurile provin de la populaii diferite, ne
ateptm ca sumele rangurilor s difere semnificativ. Testul Kruskal-Wallis
este destinat s msoare aceste discrepane. Statistica necesar aplicrii acestui
test se determin din relaia:

12 R1 2 R2 2 Rk 2
H ... 3ntotal 1
ntotal ntotal 1 n1 n2 nk

cu R k
suma rangurilor grupului k;
nk numrul de cazuri n grupul k;
ntotal numr total de cazuri.

Distribuia de selecie teoretic a lui H aproximeaz distribuia 2. Pentru


a aplica testul Kruskal-Wallis este nevoie s dispunem de cel puin trei grupuri,
fiecare avnd un volum 5. n testarea ipotezei nule H0: grup1 = grup2 = grupk
se compar valoarea calculat a lui H cu valorile critice 2 pentru k 1 grade
de libertate.

Exemplu
15 studeni de la 3 specializri diferite sunt solicitai s rezolve o problem de
atenie distributiv. Rezultatele sunt prezentate n tabelul de mai jos.

Studeni la inginerie Studeni la arte plastice Studeni la matematic


timpi de rezolvare (min.) timpi de rezolvare (min.) timpi de rezolvare (min.)
1,10 0,6 0,7
1,12 0,5 0,8
1,14 1,17 1,16
1,23 1,27 1,15
1,18 1,21 1,19

178
Statistic i aplicaii n tiinele sociale

Se solicit un punct de vedere statistic referitor la gradul n care cele trei


specializri cultiv studenilor capaciti de atenie distributiv.
Se construiete distribuia tuturor scorurilor obinute. Fiecrui scor i se
atribuie un rang de la 1 la 15.

Timpii de soluionare a sarcinii de atenie distributiv (min.)


i rangurile corespunztoare
Studeni la inginerie Studeni la arte plastice Studeni la matematic
Scor rang scor rang scor rang
1,10 5 0,6 2 0,7 3
1,12 6 0,5 1 0,8 4
1,14 7 1,17 10 1,16 9
1,23 14 1,27 15 1,15 8
1,18 11 1,21 13 1,19 12
R 1 43 R 2 41 R 36
3

12 432 412 362 12


H 315 1 369,8 336,2 259,2 48
1516 5 5 5 240
12
965,2 48 0,26
240

Numrul gradelor de libertate este 3 1 = 2, iar 02, 05 5 ,99 . Cum


H 02, 05 se accept ipoteza nul, ceea ce nseamn c la nivelul celor
trei specializri studenii dispun de capaciti sensibil egale de atenie
distributiv.

17.4 Testul semnului

Testul semnului este o alternativ la testul t pentru eantioane dependente.


Este utilizat pentru a compara calitatea a dou distribuii n condiii de
dependen a eantioanelor.

Exemplu
Un grup de subieci incapabili de ncredere n forele proprii sunt evaluai
pe o scala de ncredere cu note de la 1 la 7. Dup evaluare, acetia beneficiaz
de terapie de specialitate la sfritul creia sunt supui din nou evalurii.
Rezultatele sunt cele prezentate n tabelul de mai jos.

179
Statistic i aplicaii n tiinele sociale

ncrederea subiecilor ante- i postterapie


Subiect Ante- Post- Diferen
1 1 4 +3
2 1 4 +3
3 2 6 +4
4 2 6 +4
5 1 7 +6
6 3 2 1
7 1 4 +3
8 3 4 +1
9 2 3 +1
10 2 3 +1

Se cere s se aprecieze eficacitatea terapiei aplicate.

Pentru fiecare subiect se evalueaz diferena dintre strile post- i


anteterapie. Se calculeaz numrul diferenelor pozitive i negative. Ipoteza
nul se formuleaz astfel: Proporia diferenelor pozitive este egal cu
proporia diferenelor negative (H0: Pd+ Pd = 0,5). n cazul exemplului
prezentat, diferena pozitiv semnaleaz eficacitatea terapiei iar cea negativ,
ineficacitatea. Folosirea testului 2 solicit evaluarea valorile ateptate pentru
numrul diferenelor pozitive i negative. Acestea vor fi fateptate(+) = fateptate()
= 5, numrul de subieci chestionai fiind de 10. Valorile observate sunt fo(+) =
9 i fo() = 1. Calculnd statistica 2, obinem:


f f

2
9 5 1 5 16 16 32 6,4
2 2
2
0 ateptate
fateptate 5 5 5 5 5

Dar 3 , 84 pentru un grad de libertate (2 grupuri 1) i cum
2
. 05

2
calculat , se respinge ipoteza nul. ntruct Pobservat(+) = 0,9 > 0,5,
2
0 , 05

rezult c eficacitatea terapiei aplicate este dovedit.

Probleme propuse:

1. 30 de voluntari particip la un experiment de testare a memoriei.


Se nregistreaz numrul de itemi reprodui de fiecare participant
nainte i dup prezentarea unor strategii de memorare. Rezultatele
sunt prezentate mai jos:

180
Statistic i aplicaii n tiinele sociale

Persoana Ante- Post-


1 12 15
2 11 14
3 11 13
4 10 15
5 9 15
6 11 16
7 12 13
8 9 14
9 9 15
10 9 13
11 10 14
12 12 14
13 12 14
14 12 13
15 12 15
16 13 15
17 12 13
18 11 14
19 10 13
20 10 13
21 10 14
22 12 14
23 12 15
24 11 14
25 11 14
26 10 16
27 9 16
28 10 16
29 11 15
30 12 14
a) Enunai ipoteza nul i ipoteza alternativ
b) Calculai valoarea lui 2 i enunai decizia statistic de
acceptare/respingere a ipotezei nule
2. Calculai rangurile urmtoarelor scoruri:
Scoruri Rang
23
25

181
Statistic i aplicaii n tiinele sociale

Scoruri Rang
27
28
28
29
29
29
30
31
32
32
34
35
36
37
38
39
39
39
39
40
40
41
43
45
45
46
48
3. Se cunosc urmtoarele date statistice referitoare la dou grupuri de
persoane
Grupul 1 14 15 16 18 21 24 25
Grupul 2 16 19 21 23 24 27 30 31 32

a) Calculai rangurile scorurilor R 1 i R2


b) Calculai statistica Mann-Whitney
c) Formulai decizia de acceptare a ipotezei nule

182
Statistic i aplicaii n tiinele sociale

Capitolul 18

SELECIA STATISTIC

18.1 Punerea problemei

I
ncapacitatea studierii populaiilor statistice impune analiza unui numr
limitat de elemente ale acestora. De exemplu, stabilirea procentului de
animale bolnave presupune studierea tuturor animalelor din unitatea
teritorial stabilit. Din motive uor de neles, acest lucru este ns imposibil
de realizat. Pe de alt parte, intuiia i experiena celui care recurge la analiza
elementelor selecionate pot influena rezultatele cercetrii. Ceea ce trebuie
reinut este faptul c odat cu creterea volumului de date colectate, crete i
ansa de a obine rezultate ct mai exacte legate de ntreaga populaie-int.
Selecia statistic ofer posibilitatea gsirii unor valori tipice (estimaii ale
acestora), specifice ntregii populaii ntre care menionm media, dispersia,
asimetria, corelaiile totale sau pariale etc.
Selecia i propune urmtoarele scopuri:
s estimeze parametrii ntregii populaii int;
s determine gradul de verosimilitate al estimaiilor obinute.
Nivelul verosimilitii depinde de modul n care au fost obinute
estimaiile ca i de modul de obinere al eantionului. Fiecare estimaie trebuie
s fie supus unui filtru de semnificaie.

18.2 Procedee de selecie utilizate n formarea eantioanelor


statistice

n practica statistic sunt folosite cu precdere trei modaliti de obinere


a eantioanelor, i anume:
alegerea elementelor la ntmplare;
alegerea elementelor n baza unei proceduri stabilite;
constituirea eantionului apelnd la cele 2 modaliti menionate mai sus.
Alegerea elementelor la ntmplare este cunoscut sub numele de selecie
aleatoare. Formarea eantionului n baza unui principiu stabilit constituie ceea ce
numim selecie dirijat. n cazul n care colectivitatea este supus partiionrii
iar ulterior se eantioneaz o parte din fiecare partiie, atunci avem de-a face cu

183
Statistic i aplicaii n tiinele sociale

o selecie stratificat. Selecia stratificat este aplicat n situaiile n care


colectivitatea nu este omogen. Grupele omogene constituite n urma seleciei
stratificate pot fi supuse ulterior seleciei simple.
Cercetarea selectiv aplicat n viaa social este adesea confruntat cu o
serie de particulariti. Prezena lor este datorat de regul formelor de
organizare existente la scar social, concretizate n uniti complexe (echipe,
secii, ntreprinderi etc.). n aceste condiii, aplicarea seleciei ntmpltoare
simple risc s nu ia n considerare o serie de particulariti existente la nivelul
unitilor complexe, motiv pentru care este recomandabil recurgerea la
extragerea de uniti simple din aceste uniti complexe numite serii. Acest tip
de selecie este cunoscut n literatura de specialitate ca selecie de serii.

18.2.1 Selecia aleatoare

Selecia aleatoare presupune ca fiecare element din populaia original s


aib aceeai ans de a fi extras. Acest tip de selecie face apel la o serie de
tehnici. Spunem c elementele dintr-o populaie au aceeai ans de a fi alese
dac metoda de selecie este independent de caracteristicile populaiei cercetate.
Pentru constituirea unui eantion de tip aleator se poate recurge la selecia de
tip loterie, care este aplicabil doar n cazul populaiilor finite. Procedura
const n asocierea fiecrui element cu un numr, scrierea numerelor astfel
obinute pe bucele de hrtie care se amestec i, ulterior, extragerea acestora
dintr-o urn. Utilizarea bucelelor de hrtie numerotate poate fi nlocuit cu
metode numerice (tabelarea funciei logaritm zecimal, a funciei exponeniale etc.)
sau cu utilizarea tabelelor de numere aleatoare. L.H.C. Tippet a construit un
astfel de tabel care cuprinde 10.400 de numere de cte 4 cifre fiecare. Mai jos
sunt prezentate primele 20 de numere aleatoare ale tabelului lui Tippet.
2952 6641 3992 9792 7979 5911 3170 5624 4167 9524 1545 1396
7203 5356 1300 2693 2370 7483 3408 2762

Exemplul 1
Utiliznd tabelul prezentat, s extragem un eantion de 20 de subieci
dintr-o populaie existent de 10000. Celor 20 de persoane extrase li se pot
ataa numerele de mai sus. Astfel, vom selecta din cele 10000 de persoane doar pe
acelea care au ca numere, numerele de ordine ataate din tabelul lui Tippet.
S presupunem c viteza de reacie la stimuli vizuali (n secunde)
nregistrat pentru fiecare din persoanele astfel selectate este:
0,4 0,3 0,2 0,1 0,5 0,6 0,7 0,8 0,2 0,1 0,3 0,7 0,3 0,7
0,23 0,56 0,67 0,36 0,17 0,56

184
Statistic i aplicaii n tiinele sociale

Media aritmetic a acestor valori care corespunde unei aproximaii a


mediei ntregii populaii de 10000 de subieci este de 0,4225 secunde.

Exemplul 2
S se extrag un eantion de 10 uniti din populaia subiecilor care
consum calmante (vezi tabelul de mai jos).
Tip subieci Frecven
Subieci cu psihic n limite normale 250
Subieci cu tendine nevrotice 300
Subieci cu emotivitate accentuat 450
Subieci cu depresii 800
Total 1800

Admitem c pentru realizarea seleciei, dispunem de 10.000 de numere


naturale. Avem urmtoarele posibiliti. Fie lum n considerare primele 1800
de numere naturale, ignorndu-le pe celelalte 8200, fie lum n considerare un
numr mai mare de numere naturale din toate cele 10000, recurgnd la urmtoarea
procedur. mprind numrul de numere disponibile la 1800, obinem ctul
5 i restul 1000. Deci fiecrui individ i se pot asocia 5 numere. Ca urmare,
subiecilor dispunnd de un psihic n limite normale le putem asocia primele 1250
numere (250 x 5). Pentru subiecii cu tendine nevrotice vom avea urmtoarele
1500 de numere (300 x 5), pentru cei cu emotivitate accentuat urmtoarele 2250
numere (450 x 5) i, n sfrit, pentru cei cu depresii restul de 4000 numere
(800 x 5). Deci, se vor aloca n total 9000 de numere naturale. n continuare
vom lua primele 10 numere ale tabelului lui Tippet, ignornd numerele mai
mari de 9000. Rezultatele sunt prezentate n tabelul de mai jos.
Numr aleator Tip de subiect selectat
2952 Subiect cu emotivitate accentuat
6641 Subiect cu depresii
3992 Subiect cu emotivitate accentuat
9792
7979 Subiect cu depresii
5911 Subiect cu depresii
3170 Subiect cu emotivitate accentuat
5624 Subiect cu depresii
4167 Subiect cu depresii
9524
1545 Subiect cu tendine nevrotice
1396 Subiect cu tendine nevrotice

185
Statistic i aplicaii n tiinele sociale

Repartiia subiecilor n urma eantionrii este:


Subieci cu psihic n limite normale = 0.
Subieci cu tendine nevrotice = 2.
Subieci cu emotivitate accentuat = 3.
Subieci cu depresii = 5.
Total subieci = 10.

18.2.2 Selecia dirijat

Pericolul denaturrii rezultatelor unei selecii crete proporional cu


subiectivismul celui implicat n realizarea seleciei (selecia dirijat). Totui,
apar situaii n care selecia dirijat este preferat seleciei aleatoare.
Exemplu
S presupunem c suntem conectai la sarcina evalurii nivelului mediu
de cunotine al unui numr mare de subieci dintr-un anumit domeniu. Am putea
realiza acest lucru fie investignd fiecare subiect, fie investignd un eantion
de subieci. n acest ultim caz, un neavizat ar putea alege doar subiecii care
prezint anumite caracteristici, ignornd altele eseniale care probeaz nivelul
de cunotine. O alt situaie ar putea fi aceea a alegerii unor elite n materie de
cunotine care s nu fie reprezentative pentru ntreaga populaie. ns un
subiect familiarizat cu tehnicile de selecie, n mod sigur va fi capabil s
extrag, pe baza unor indicii pertinente, un eantion reprezentativ.
Folosind selecia aleatoare, eantionul extras ar putea s se abat semnificativ
de la medie. Acest lucru se manifest din ce n ce mai pregnant pe msur ce
volumul eantionului scade. ns pe msur ce volumul eantionului crete,
rezultatele seleciei aleatoare tind s devin superioare rezultatelor seleciei
dirijate. n acelai timp, la eantioanele de volum mic selecia dirijat poate
furniza informaii plauzibile legate de valoarea medie a populaiei, dar nu i de
abaterile nregistrate fa de medie.
Avem prin urmare de ales ntre incertitudinea hazardului oferit de
selecia aleatoare, incertitudinea datorat subiectivismului celui care recurge la
operaia de selecie (selecia dirijat) i combinarea celor 2 metode, urmrind
minimizarea efectelor negative generate de fiecare din ele.

18.3 Reprezentativitatea colectivitii selectate

Pentru ca eroarea de estimare a valorii tipice a ntregii colectiviti s fie


minim este absolut necesar ca eantionul extras s ndeplineasc condiia de
reprezentativitate. Realizarea reprezentativitii are n vedere obinerea de
trsturi eseniale n colectivitatea selectat, existente i la nivelul colectivitii
generale. O reproducere exact a acelorai trsturi ntr-o colectivitate construit

186
Statistic i aplicaii n tiinele sociale

este practic imposibil. De aceea, teoria admite c selecia este reprezentativ dac
greutatea fiecrei grupe nu difer mai mult de 5 % n raport cu structura
colectivitii de baz.
n acest context putem vorbi de erori de reprezentativitate care pot fi
sistematice i ntmpltoare. Erorile sistematice apar ca efect al subiectivismului
manifestat n procesul de realizare a seleciei i care n esen const n
obturarea posibilitii fiecrei uniti de a fi incluse n eantion cu aceeai
probabilitate.
Spre deosebire de erorile sistematice, erorile ntmpltoare nu pot fi
eliminate. Cu alte cuvinte, responsabile de nerealizarea unei estimri absolut
corecte a mediei colectivitii generale sunt erorile ntmpltoare. Din cele
menionate rezult c verificarea reprezentativitii unui eantion se poate
realiza analiznd erorile efective de reprezentativitate. Aceste erori trebuie
raportate la o baz de comparaie care n practica statistic este cunoscut sub
denumirea de selecie teoretic.
Specific seleciei teoretice este faptul c structura ei este identic cu cea a
colectivitii generale. Un eantion este cu att mai reprezentativ, cu ct
reproduce mai exact structura seleciei teoretice.
Prezentm n continuare un exemplu de calcul al erorilor de
reprezentativitate.
Exemplu
Nivelul
Selecia teoretic Eantionul I Eantion II Eantion III
studiilor
Frecvena

Frecvena

Frecvena

Frecvena

Frecvena
Abaterea

Abaterea

Abaterea
absolut

absolut

absolut

absolut

absolut

absolut

absolut
relativ

(ani de
studii)

8 12 12/181 13 1 40 28 10 2
10 30 30/181 37 7 50 20 20 10
12 42 42/181 25 17 20 22 25 17
14 43 43/181 46 3 10 33 60 17
16 36 36/181 40 4 20 16 56 20
>18 18 18/181 20 2 41 23 10 8
Total 181 100 181 34 181 142 181 74

Pentru calculul erorilor de reprezentativitate nregistrate de cele


3 eantioane este necesar s se determine abaterile de structur de la colectivitatea
general reprezentat n cazul de fa prin selecia teoretic. n acest sens se
calculeaz coeficientul de realizare a structurii seleciei teoretice, astfel:

187
Statistic i aplicaii n tiinele sociale

K realizare
d 100
n
Pentru cele 3 eantioane, valorile coeficientului sunt:

K realizare I
d 100
34
100 19%
n 181

K realizare II
d 100
142
100 78%
n 181

K realizare III
d 100
74
100 41%
n 181
Primul eantion reproduce cel mai bine structura seleciei teoretice,
nregistrnd abateri de 19 %, cel de-al doilea eantion nregistreaz abateri de
78 % iar cel de-al treilea abateri de 41 %.
Eroarea efectiv de reprezentativitate se determin din relaia:

d x xi x0
iar gradul de reprezentativitate al eantionului din:
x x0
Gd x
x0
Pentru acest exemplu, cele 4 medii nregistreaz urmtoarele valori:
2402
x0 13, 27
181
2418
xI 13,36
181
2258
xII 12, 48
181
2496
xIII 13.8
181

188
Statistic i aplicaii n tiinele sociale

n mod corespunztor, erorile efective de reprezentativitate vor fi:


d xI xI x0 13, 36 13, 21 0,15
d xII xII x0 12, 48 13, 21 0, 73

d xIII xIII x0 13, 8 13, 21 0, 59


Cu ct eroarea efectiv de reprezentativitate este mai mic (n valoare
absolut), cu att eantionul sau datele din eantion sunt mai bine reprezentate.
De regul, datele cu privire la colectivitatea general nu sunt cunoscute.
n acest caz, este recomandabil ca pentru verificarea stabilitii mediei i
dispersiei s se realizeze selecii succesive. Eroarea de reprezentativitate se va
calcula astfel:
dx x x ,
unde x este media mediilor de selecie.

18.3.1 Eroarea medie probabil de reprezentativitate

Cu ct volumul de selecie este mai mare, cu att i distribuia elementelor


tinde s urmeze legea distribuiei din colectivitatea general. n funcie de
volumul colectivitii totale, putem forma mai multe eantioane de aceeai
mrime iar pentru fiecare din ele putem calcula media de selecie. Datele
cuprinse n eantioanele astfel formate pot conduce fie la medii de selecie
diferite, fie la apariia unei medii sau a unor medii de mai multe ori. Prin
urmare, un proces de selecie va conduce, n sensul celor menionate, la
obinerea unei serii cu distribuie de frecvene pentru mediile de selecie.
Toate paragrafele care vor urma vor fi subordonate scopului de a vedea n
ce msur rezultatele unui proces de selecie pot fi extinse la ntreaga
colectivitate. De altfel, acesta este i scopul seleciei statistice, de a identifica
pe baza unui eantion sau a mai multor eantioane extrase trsturile
colectivitii totale.
Exemplu
S admitem c volumul colectivitii generale este de 4 uniti din care se
vor forma eantioane posibile de cte 3. Nivelul unitilor din colectivitate
este: A = 10; B = 20; C = 30; D = 40. Datele problemei vor fi notate astfel:
volumul colectivitii generale va fi notat cu M, deci M = 4 iar volumul
eantioanelor formate cu n, deci n = 3.
Folosind procedeul seleciei repetate (unitile extrase sunt reintroduse n
vederea unei noi extrageri), se obin urmtoarele eantioane posibile:

189
Statistic i aplicaii n tiinele sociale

A+A+A B+A+A C+A+A D+A+A


A+A+B B+A+B C+A+B D+A+B
A+A+C B+A+C C+A+C D+A+C
A+A+D B+A+D C+A+D D+A+D
A+B+A B+B+A C+B+A D+B+A
A+B+B B+B+B C+B+B D+B+B
A+B+C B+B+C C+B+C D+B+C
A+B+D B+B+D C+B+D D+B+D
A+C+A B+C+A C+C+A D+C+A
A+C+B B+C+B C+C+B D+C+B
A+C+C B+C+C C+C+C D+C+C
A+C+D B+C+D C+C+D D+C+D
A+D+A B+D+A C+D+A D+D+A
A+D+B B+D+B C+D+B D+D+B
A+D+C B+D+C C+D+C D+D+C
A+D+D B+D+D C+D+D D+D+D

Procedeul seleciei repetate conduce la un numr de eantioane egal cu


Nn, respectiv 43 eantioane.
n situaia n care unitile selectate nu se mai reintroduc n vederea unor
noi selectri (procedeul seleciei nerepetate), numrul de combinaii posibile
va fi de:
M! 4!
C43 4
n! M- N ! 3! 4 3 !
Cele 4 posibiliti identificate sunt:
A+B+C B+C+D
A+B+D A+C+D

Pentru fiecare din cele 64 de selecii se poate obine o valoare medie care
urmeaz s fie folosit pentru estimarea mediei ntregii colectiviti. Pe lng
mediile obinuite, vom evalua erorile i dispersiile de selecie ce vor fi utilizate
ulterior. Rezultatele sunt prezentate n tabelul de mai jos (media colectivitii
generale = (10 + 20 + 30 + 40)/4 = 25).

190
Statistic i aplicaii n tiinele sociale

Mrimea Media de Eroarea de Dispersia de


caracteristicii selecie selecie selecie
Unitatea
n eantion
x xx i2
xi
A+A+A 30 10 15 225
A+A+B 40 13,3 11,7 158,33
A+A+C 50 16,7 8,3 158,33
A+A+D 60 20 5 225
A+B+A 40 13,3 11,7 158,33
A+B+B 50 16,7 8,3 91,66
A+B+C 60 20 5 91,66
A+B+D 70 23,3 1,7 158,33
A+C+A 50 26,7 8,3 158,33
A+C+B 60 20 5 91,66
A+C+C 70 23,3 1,7 91,66
A+C+D 80 26,7 1,7 158,33
A+D+A 60 20 5 225
A+D+B 70 23,3 1,7 158,33
A+D+C 80 26,7 1,7 158,33
A+D+D 90 30 5 225
B+A+A 40 13,3 11,7 158,33
B+A+B 50 16,7 8,3 91,66
B+A+C 60 20 5 91,66
B+A+D 70 23,3 1,7 158,33
B+B+A 50 16,7 8,3 91,66
B+B+B 60 20 5 25
B+B+C 70 23,3 1,7 91,66
B+B+D 80 26,7 1,7 91,66
B+C+A 60 20 5 91,66
B+C+B 70 23,3 1,7 25
B+C+C 80 26,7 1,7 25
B+C+D 90 30 5 91,66
B+D+A 70 23,3 1,7 91,66
B+D+B 80 26,7 1,7 91,66
B+D+C 90 30 5 91,66
B+D+D 100 33,3 8,3 158,33
C+A+A 50 16,7 8,3 158,33
C+A+B 60 20 5 91,66
C+A+C 70 23,3 1,7 91,66

191
Statistic i aplicaii n tiinele sociale

Mrimea Media de Eroarea de Dispersia de


caracteristicii selecie selecie selecie
Unitatea
n eantion
x xx i2
xi
C+A+D 80 26,7 1,6 158,33
C+B+A 60 20 5 91,66
C+B+B 70 23,3 1,7 25
C+B+C 80 26,7 1,7 25
C+B+D 90 30 5 91,66
C+C+A 70 23,3 1,7 91,66
C+C+B 80 26,7 1,7 25
C+C+C 90 30 5 25
C+C+D 100 33,3 8,3 91,66
C+D+A 80 26,7 1,7 158,33
C+D+B 90 30 5 91,66
C+D+C 100 33,3 8,3 91,66
C+D+D 110 36,7 11,7 29,66
D+A+A 60 20 5 225
D+A+B 70 23,3 1,7 158,33
D+A+C 80 26,7 1,7 158,33
D+A+D 90 30 5 225
D+B+A 70 23,3 1,7 158,33
D+B+B 80 26,7 1,7 91,66
D+B+C 90 30 5 91,66
D+B+D 100 33,3 8,3 158,33
D+C+A 80 26,7 1,7 158,33
D+C+B 90 30 5 91,66
D+C+C 100 33,3 8,3 91,66
D+C+D 110 36,7 1,7 158,33
D+D+A 90 30 5 225
D+D+B 100 33,3 8,3 158,33
D+D+C 110 36,7 11,7 158,33
D+D+D 120 40 15 225

Pe baza acestui tabel se pot obine distribuiile de frecvene pentru mediile


de selecie, eroarea de reprezentativitate i dispersia. Rezultatele pentru
mediile de selecie sunt:

192
Statistic i aplicaii n tiinele sociale

Mediile Frecvena
Nr. Eroarea de Probabilitile
de selecie mediilor de
crt. selecie de apariie
posibile selecie
1 10 1 15 1/64
2 13,3 3 11,7 3/64
3 16,7 5 8,3 5/64
4 20 10 5 10/64
5 23,3 12 1,7 12/64
6 26,7 13 1,7 13/64
7 30 10 5 10/64
8 33,3 6 8,3 6/64
9 36,7 3 11,7 3/64
10 40 1 15 1/64
Total 64 1
n figura de mai jos este reprezentat grafic seria de distribuie a erorilor
de selecie astfel obinute.

Distribuia erorilor de selecie


20
Erori

0
0 5 10 15
20
Frecvena

Cea mai probabil valoare se nregistreaz pentru media de selecie egal


cu 26,7. Eroarea de selecie corespunztoare este 1,7.
Aa cum se poate observa, reprezentarea grafic ne indic faptul c repartiia
cu care se distribuie erorile de selecie urmeaz o lege normal uor asimetric.
Pentru abaterea medie ptratic a mediilor de selecie se utilizeaz relaia:

x x
2
fi
i 0
,
f i

unde fi frecvena de apariie a fiecrei medii.

193
Statistic i aplicaii n tiinele sociale

n practic este foarte dificil de evaluat diferena x i x 0 datorit


frecventelor cazuri n care nu se cunoate media colectivitii generale. Pentru
aceast spe se impune calcularea mediei mediilor de selecie.
Pentru un numr mare de selecii se apreciaz ca media mediilor de
selecie este egal cu media colectivitii generale. n exemplul de mai sus,
media mediilor de selecie este:
10113,3 3 16,7 5 2010 23,212 26,7 13 3010 33,3 6 36,7 3 401
x
64
25,16
deci

x x
2
fi
i 0
6, 442
f i

Eroarea de reprezentativitate pentru cele 64 de eantioane posibile este n


medie de 6,442 n jurul mediei mediilor de selecie.
Pentru selecia ntmpltoare, eroarea medie de reprezentativitate se
determin astfel:
cazul seleciei repetate
cnd dispersia colectivitii generale este cunoscut
02
2 ,
n
de unde
02

n
cnd dispersia colectivitii generale nu este cunoscut (se
folosete dispersia de selecie)
2
2 ,
n 1
de unde
2

n 1
n cazul seleciei nerepetate, dispersia mediilor de selecie de la media
colectivitii generale satisface relaia:

194
Statistic i aplicaii n tiinele sociale

02
2 nerepetat ,
n

unde 02 este dispersia colectivitii generale.


Diferena dintre selecia repetat i cea nerepetat este dat de un factor
de corectare egal cu M n (M i n au semnificaiile specificate la aplicaia
M 1
de mai sus).
Vom explica n continuare proveniena acestui factor. Astfel, n cazul
1
seleciei nerepetate probabilitile de selecie cresc de la M la prima extragere
1
la la ultima extragere, astfel nct volumul rmas neextras va fi de
M n 1
M n. Pentru selecia repetat, particularitatea reintroducerii elementelor
extrase n cursa viitoarei extrageri face ca volumul rmas neextras s fie M 1.
Aadar, n cazul seleciei nerepetate
M n
nerepetat repetat
M 1
Pentru selecia stratificat, formulele de calcul ale erorii medii de
reprezentativitate sunt:
cazul seleciei repetate

02 2
,
n n
unde 2 exprim media dispersiilor din eantioanele cercetate;
cazul seleciei nerepetate

02 N n 2 N n

n N 1 n N 1
Pentru selecia de serii, eroarea medie de selecie se calculeaz aplicnd
relaiile:
cazul seleciei repetate
2

r

195
Statistic i aplicaii n tiinele sociale

cazul seleciei nerepetate

2 Rr

r R 1
unde r este numrul de serii iar R este numrul de serii pe ntreaga colectivitate;
cazul seleciei nerepetate cnd se lucreaz cu dispersia de selecie

2 Rr

r 1 R 1

18.3.2 Eroarea limit de reprezentativitate

O selecie este reprezentativ dac nu prezint erori mai mari de 5 %


fa de selecia teoretic. ntre aceast condiie de reprezentativitate i
intervalul de variaie al mediei de selecie exist o strns legtur dup cum
vom vedea n cele ce urmeaz.
Graficul de mai jos ne relev o distribuie uor asimetric a erorilor n
raport cu media colectivitii generale.

Pentru o eroare limit de 10 n jurul mediei colectivitii generale (egal


cu 25), probabilitatea ca media s fie cuprins ntre 25 i 40 va fi dat de suma
probabilitilor din acest interval, adic de 13/64 + 10/64 + 6/64 + 3/64 + 1/64
(= 51,56 %). Concluzia este c la 10000 de selecii n 5156 de situaii, media

196
Statistic i aplicaii n tiinele sociale

se va gsi cuprins ntre 25 i 40 cu condiia ca eroarea de selecie s nu


depeasc 10.
Dac apar situaii n care nu dispunem de toate probabilitile de apariie,
atunci eroarea limit de reprezentativitate va fi dat de relaia:
n cazul seleciei repetate
t repetat
n cazul seleciei nerepetate
t nerepetat
unde mrimea t se gsete tabelat n anexa G.
Prezentm n continuare un exemplu de calcul al erorii limit de
reprezentativitate pentru selecia stratificat.

Exemplu
Cercetarea selectiv desfurat la dou universiti, totaliznd 3000 de
studeni, n scopul evalurii numrului mediu al celor care fac fa programelor
universitare i a proporiei nregistrate de ceilali studeni a condus la obinerea
datelor din tabelul de mai jos. Selecia a cuprins un procent de 10 % din
numrul de studeni corespunztor fiecrei universiti.

a studenilor care nu fac fa


programei universitare i2
a studenilor care fac fa
Colectivitatea de selecie

a numrului de studeni
care fac fa programei

care fac fa programei

programei universitare
Colectivitatea general

Proporia studenilor

Dispersia de selecie

Dispersia de selecie
Media de selecie

universitare xi

universitare p
Universiti

p(1 p)
Ni

ni

1 1000 100 80 0,12 8 0,1056


2 2000 200 90 0,17 9 0,1411
Total 3000 300 86,66 0,1533 8,66 0,1293

Pentru calculul erorii limit au fost determinate:


Media mediilor de selecie

x
xn i i

80 100 90 200
86, 66
n i 300

197
Statistic i aplicaii n tiinele sociale

Media dispersiilor pariale

2 n i
2
i

8 100 9 200
8, 66
n i 300
Eroarea medie de selecie

2 n 8, 66 300
1 1 0,1612
n N 300 3000
La o probabilitate de 0,99999 pentru care t tabelat (anexa G) este egal cu
5, eroarea limit de selecie este:
t 5 0,1612 0, 806
Pentru calculul proporiei numrului de studeni care nu fac fa
programelor universitare, media corespunztoare la nivelul ntregului eantion
se determin astfel:

p
pn i i

0,12 100 0,17 200
0,1533
n i 300

Dispersia medie de selecie este:

p 1 p n
i i i

0,1056 100 0,1411 200
0,1293
n i 300

Eroarea medie de selecie

0,1293 300
1 0, 02
300 3000
Eroarea limit calculat cu o probabilitate de 99,999 % este de 0,1.
5 0, 02 0,1

198
Statistic i aplicaii n tiinele sociale

18.4 Determinarea volumului de selecie

Stabilirea volumului de selecie depinde de precizia cu care se estimeaz


parametrii colectivitii generale, de procedeul de selecie folosit i de eroarea
limit de reprezentativitate. Volumul de selecie se obine din relaiile de calcul
ale erorii limit de reprezentativitate.
Pentru selecia ntmpltoare simpl
Selecia repetat
t 2 02
n
2
Selecia nerepetat
Nt 2 02
n
N 2 t 2 02
Pentru selecia stratificat
Selecia repetat
t 2 02
n
2
Selecia nerepetat
t 2 02
n
t 2 02

2

N
La selecia stratificat, principala particularitate este legat de repartizarea
volumului de selecie pe grupe. Sunt posibile urmtoarele cazuri:
Selecia este stratificat proporional. n acest caz greutatea specific
fiecrei grupe trebuie s coincid att n eantion, ct i n
colectivitatea de baz.
Selecia este stratificat optim, situaie n care este necesar stabilirea
volumului de selecie pe grupe, innd seama att de proporia de
selecie ct i de gradul de variaie din fiecare grup.

Exemplu
Se consider o colectivitate general mprit n 2 grupe. Datele de care
dispunem sunt prezentate n tabelul de mai jos.

199
Statistic i aplicaii n tiinele sociale

Volumul Abaterile
Dispersiile
colectivi- medii ptrate
Grupe pe grupe iNi i2Ni
tii pe grupe
i2
Ni i
1 1000 15 225 15000 225000
2 2000 30 900 60000 1800000
Total 3000 75000 2025000

Din relaia de calcul


t 2 02
n 2

Dispersia colectivitii generale se determin ca medie ponderat a
dispersiilor de grup, astfel:

2

N i
2
i

2025000
675
N
0
i 3000
Presupunnd c rezultatele seleciei se obin cu o probabilitate de 0,99999
pentru t = 5 (anexa G), volumul de selecie se calculeaz astfel:

52 675
n 6
3000
Acest volum trebuie repartizat pe grupe. Pentru selecia proporional,
repartizarea se face aplicnd relaia de calcul:
Ni
ni n ,
Ni
deci
1000
n1 6 2
3000
2000
n2 6 4
3000
Dac selecia este optim repartizat, volumul de selecie ce revine fiecrei
grupe se calculeaz din relaia:
n i N i
ni ,
i Ni
200
Statistic i aplicaii n tiinele sociale

deci
6 15000
n1 1
75000
6 60000
n2 5
75000
n cazul seleciei simple, fiecrei grupe i vor reveni 6/2 = 3 uniti.

201

S-ar putea să vă placă și