Documente Academic
Documente Profesional
Documente Cultură
un
eantion al acesteia i extrapolnd rezultatele pe eantion obinute la acea populaie (de ex.,
chestionm 1500 de persoane i tragem concluzii privind comportamentul electoral al
romnilor).
Populaia este ansamblul oamenilor, grupurilor, unitilor sociale n raport cu tema de
cercetare sociologic (de exemplu, populaia Romniei, populatia studenilor, populatia
omerilor etc.).
Eantionul este o parte a acestei
eantionare.
Variabila discriminant este criteriul ce permite mprirea populaiei n straturi, grupuri etc.
Caracteristicile unei populaii nu sunt toate de acelai nivel. Anumite caracteristici, cum
ar fi: vrsta, sexul, locul de reziden, nivelul de instruire, categoria socioprofesional,
statutul matrimonial, sunt considerate variabile independente. Altele: opiniile,
atitudinile, comportamentele diferite sunt variabile dependente.
Cercettorul degajeaz un numr de caracteristici n relaie cu tema pe care o are de cercetat
i construiete eantionul urmrind reprezentativitatea acestuia.
Dac populaia este omogen, eantionul poate fi de talie mic. Dac populaia este
eterogen, se pleac de la teorii mai nuanate ale stratificrii sociale i se aleg eantioane
reprezentative pe straturi.
Aadar, se investigheaz un numr redus de persoane dintr-o populaie i concluziile rezultate
n urma prelucrrii datelor se extrapoleaz la acea populaie. Este permis, se justific acest
fapt?
Gnoseologia (mereologia, tiina raporturilor, a relaiilor parte ntreg ) arat c partea
reflect ntr-o anumit msur ntregul. i praxiologia arat c este posibil i necesar s
1
maximizm gradul n care partea reflect ntregul i c, procednd astfel, economisim timp,
energie, bani, avnd aceleai avantaje pe planul cunoaterii.
Cercetrile selective n raport cu cele exhaustive au avantaje:
100
Reprezentativitate
N
Mrimea eantionului
Dac avem un eantion cu 0 indivizi i unul cu toi indivizii populaiei, curba care leag
punctele va crete rapid la valorile mici ale lui n (volumul eantionului) i va ajunge rapid n
apropierea plafonului reprezentativitii, atinse atunci cnd n (eantionul) coincide cu N
(volumul populaiei). J. Stoetzel a artat c pe msur ce se cumuleaz datele pe sute de
indivizi, variaiile de rspuns devin tot mai mici, iar o cretere suplimentar a numrului de
indivizi n eantion nu mai aduce spor de reprezentativitate...
Date succesive
Procente de Da
1
2
3
4
5
6
7
8
9
10
11
12
13
14
68
55
62
66
64
61
74
75
69
69
77
68
69
67
Procente
cumulate
68,0
61,5
61,6
62,8
63,0
62,7
64,3
65,0
66,0
66,3
67,2
67,3
67,4
67,4
reprezentativ la nivelul populaiei, dar populaia nefiind omogen, straturile ei pot s nu fie
reprezentate corespunztor).
Aadar, avem de realizat o cercetare pentru a estima o anumit valoare v din populaie (o
medie, o proporie, o frecven, un coeficient de corelaie, de ex.: media de vrst, proporia
celor care exprim o anumit opiune politic, frecvena cu care ntlnim o anumit practic
religioas, cum se coreleaz nivelul de pregtire colar cu aflarea unui post n domeniul
aferent etc.). Putem extrage din respectiva populaie mai multe eantioane reprezentative. De
obicei, extragem un eantion construit dup toate canoanele metodologiei; n el vom afla o
valoare V* (o opinie, o nevoie a comunitii etc.) diferit de V din populaia din care am
extras eantionul. Cu ct eantionul este mai reprezentativ, cu att V* se apropie mai mult de
V din populaie.
Dar noi nu-l tim pe V... Cu alte cuvinte, pentru un eantion ales la ntmplare, vom putea
afirma cu o anumit probabilitate c mrimea V* din eantion se apropie de cea adevrat
din populaie, de care difer cu o mrime calculabil.
Vom nota cu d - eroarea maxim admis (care exprim diferena acceptat ntre V i V*), cu
P - nivelul de probabilitate sau nivelul de ncredere (care exprim ansele ca eroarea real
comis atunci cnd aproximm pe V prin V* s nu depeasc d). Cu alte cuvinte,
determinnd o valoare V* pe eantion, cu ajutorul erorii maxime, d, vom construi un interval
(v*-d, v*+d) n interiorul cruia se va situa valoarea cutat, V, din populaie).
Reprezentativitatea unui eantion este dat
Pentru a prescurta exprimarea, vom folosi adesea paranteza care cuprinde particula ce arata i contrarul
afirmaiei; de exemplu, (ne)reprezentativ arat c este vorba de reprezentativ i/sau nereprezentativ.
4
Coloane
1
8735
2552
8717
0504
8116
5485
2
6744
2967
8331
4035
0921
7888
3
5149
3599
2559
7295
9171
5791
......................................
10
5492
1100
4431
6498
1091
7895
Ca n idee, ca n minte (de exemplu, cazuri ideale sunt: fiecare locuitor al unei comuniti i cunoate pe toi
ceilali locuitori i nici un locuitor nu cunoate nici unul dintre locuitorii comunitii; ntre aceste cazuri ideale
se afl cele normale: locuitorii se cunosc ntre ei n diverse grade.
3
Sondajul simplu aleator are drept caracteristic faptul c fiecare unitate din populaie are anse egale, nenule, de a fi
selectat n eantion. Unitile sunt alese independent una de alta. Sondajul simplu aleator este de dou feluri: repetat (cu
revenire) fiecare unitate este reintrodus n populaie, i nerepetat (fr revenire) unitile nu sunt reintroduse n
populaia din care selectm. Extragerea ntmpltoare se poate face prin urmtoarele procedee de selecie: procedeul urnei /
loteriei (const n numerotarea tuturor subiecilor i extragerea lor ntmpltoare; la fiecare extragere ansa de a fi ales este 1/
N eantioanele posibile sunt Nn).
4
Pentru exemple de extragere, a se vedea i http://www.cleo.ulg.ac.be/tp/tp3resultat.xls
trebui s lum din fiecare localitate un numr semnificativ de locuitori, un numr de persoane
pentru eantionul cu un volum pe care ni l-am propus. Operatorii de teren ar avea de strbtut
distane enorme, cu cheltuieli mari etc. Exist posibilitatea de a evita aceste neajunsuri, cu
mari avantaje pe planul costurilor, timpului, promptitudinii realizrii cercetrii. Care este
ideea? Populaia rii este grupat n judee; deci, ntr-un prim stadiu am alege un eantion
reprezentativ de judee. Un jude are un numr de localiti, deci un alt stadiu ar consta n
alegerea unui eation reprezentativ de localiti. O localitate se compune din mai multe
cartiere, strzi, ulie etc.; vom alege eantioane reprezentative. Ajungem la gospodrii (case,
apartamente la bloc etc.) din care alegem eantioane reprezentative i la membrii acestor
gospodrii, din care vom lua cte una sau mai multe persoane. Trebuie s fim ateni la
riscurile de a comite erori de eantionare; dac, de pild, vrem s aflm opiunile electoratului
romn i ntr-un prim stadiu vom alege 5 judee din 42, toate din Moldova, estimarea va putea
fi sortit eecului (putem consulta mai nti hri electorale anterioare pentru a vedea tradiia
opiunilor politice etc. i apoi vom alege judeele, localitile cuprinse n aceste arii de
opiuni).
n realitate, din populaia mare se pot extrage multe eantioane, de ex. n acest caz Nn
eantioane. Aceste eantioane, prin mediile lor, pot forma o nou serie statistic numit i
distribuie de eantioane. Statisticienii au demonstrat c media acestei serii este x sau
media mediilor tuturor eantioanelor posibile este egal cu media populaiei.
Ex. x2,5,8; n2. Eantioanele posibile sunt: (2,2), (2,5), (2,8), (5,2), (5,5), (5,8), (8,2), (8,5),
(8,8);
Eantion
(2,2)
(2,5)
x.(2,8)
(5,2)
2
(5,5)
3,5
(5,8)
5
(8,2)
6,5
(8,5)
8
(8,8)
Total
Media
2
3,5
5
3,5
5
6,5
5
6,5
8
fi
1
2
3
2
1
9
xi fi
2
7
15
13
8
45
x45/95
x
x (xi fi)/ fi
Satisticienii au demonstrat i c x / n
Abaterea medie ptratic din mulimea tuturor eantioanelor posibile este de n ori mai mic
fa de abaterea din populaia mare. Vom avea dificulti n a calcula
i x deoarece x
depinde de care la rndul lui este necunoscut. ns x poate fi aproximat prin valoarea din
7
eantionul extras. Dac n eantion avem, de exemplu, valoarea s a abaterii medii ptratice,
notm cu s x estimatorul pentru x i s s/n. Estimarea ncearc s fac apropierea dintre
valorile eantionului i cele ale populaiei mari. n general, media populaiei mari se
estimeaz c poate fi egal cu x x, adic poate diferi de media din eantion cu cel
mult o abatere maxim admis n plus sau n minus. x nu este dect produsul dintre abaterea
medie din populaia de eantionare i t (probabilitatea cu care este garantat rezultatul). x
x t t (/n).
Exemple
1. S se stabileasc eroarea limit admis i intervalul de ncredere pentru tiind c media
eantionului x 80, n 400, s 0,85 la o probabilitate de 95%.
Eroarea limit admis x t (/n) x 1,96 (0.85/ 400); x 0,083
Se calculeaz intervalul de ncredere x x; x x 7,917;8,083
2. S se determine intervalul de ncredere garantat cu o probabilitate de 99% pentru , dac
eantionul are 36 de uniti media de 800 iar abaterea medie ptratic de 60.
t 2,58
x t (/n)
n 36
x 800
774,2; 825,8
s 60
Toate mrimile de pn acum includ pe n volumul eantionului de unde rezult c n
anumite cazuri putem calcula mrimea acestuia.
x t (/n)
x2 t 2/n
n (t2 2) /x2
3. S se determine volumul eantionului necesar pentru a estima media unei colectiviti cu
o eroare limit admis de 0,2 i o probabilitate de garantare a rezultatelor de 95%, tiind c
dintr-o cercetare anterioar s2 6,1.
n (1,962 6,1)/0,22 586.
Consumul pe lun
Xi-X
1
3
0,5
2
1,2
-1,3
3
2,9
0,4
50
2,5
(Xi-X)2
0,25
1,69
0,16
Aflm c media este 2,5; acesta a fost un eantion n care media a fost x1, dar putem lua i
altele n care mediile vor fi: x2, x3, x4, ., xn ; diferena x-x va nsemna eroarea pe care o
comitem atunci cnd investigm un eantion n i nu ntreaga populaie, N. Deci, n general,
pentru estimarea valorilor medii este important s ne asigurm c putem extrage mai multe
eantioane din populaia investigat pe care le-am putea supune pe rnd cercetrii pe tema
noastr, obinnd un ir de valori medii ale caracteristicii urmrite (de fiecare dat cnd am
alctuit eantionul, unii indivizi din populaie pot apare n eantioane diferite ): x1, x2, x3,
.., xk. Aceste valori medii de eantioanare vor forma o valoare medie x, distribuia
de eantionare; media caracteristicii din eantion coincide, se va suprapune peste cea din
9
populaie (sau mai exact spus, media mediilor tuturor eantioanelor pe care le putem extrage
din populaie, va cdea peste media din populaie); abaterea standard a variabilei x este de
n ori mai mic dect abaterea standard a variabilei x din populaia N; notm cu e abaterea
standard a variabilei x din eantion i o numim eroare standard:
e = x n ; distribuia valorilor variabilei x poate urma o curb normal (curba lui Gauss);
de obicei spunem c abaterea standard a variabilei din populaie este suficient de bine
aproximat de abaterea standard a aceleiai variabile din eantionul construit prin
procedeul aleator, probabilistic (aproximarea suficient nu nseamn ns nici o ans de a ne
nela; de fapt, rezultatele cercetrii pe eantioane pot fi comparate cu sgeile trase n
direcia unei inte: unele o nimeresc n centru, altele pe laturi, iar pe baza dispunerii
punctelor pe int putem contura centrul acesteia. Ce nseamn c indicatorul de dispersie
este invers proporional cu n? nseamn c, mrind eantionul, sau mrind numrul de
eantioane n care aflm pe x, mrim concentrarea valorilor x, n jurul lui x. Facem apel la
imaginea intuitiv a curbei lui Gauss pentru a reine c valorile apar plasate n jurul mediei, i
cu frecven din ce n ce mai mic pe msur ce ne ndeprtm de valoarea central, dar i
pentru a reine o proprietate a distribuiei normale: dac se consider un interval simetric n
jurul mediei, a crui lungime se msoar n abateri standard ale variabilei normale
respective, atunci frecvena indivizilor care intr n acest interval este aceeai pentru toate
distribuiile normale; adic, lund la ntmplare un individ dintr-o serie statistic normal,
probabilitatea P ca acest individ s se afle pe un interval (u t x , u + t x ) depinde de
lungimea intervalului, simetric fa de media u, i care este msurat n abateri standard.
Valorile funciei P(t) se afl n toate manualele de statistic; sociologii se intereseaz de
cteva care asigur o probabilitate ridicat. Aa cum am mai spus, din experiena cercetrilor
sociologice, cel mai folosit nivel de ncredere (prag de ncredere, nivel de probabilitate)
este de 0,95 (spunem: trebuie s existe cel puin 95% anse ca, alegnd un eantion
oarecare, valoarea medie obinut s cad pe intervalul respectiv ); dac vrem s fie mai
mici, putem lua alte valori ale lui P, mai ridicate: P = 0,99 sau chiar P = 0,999. Ne uitm n
tabelele statistice i constatm corespondenele:
P=0,95
P=0,99
P=0,999
10
(spunem: exist 95% anse ca o valoare medie determinat prin cercetarea unui eantion, s
se abat cu mai puin de 2e de la valoarea medie existent n populaie.)
Cum calculm abaterea standard? n formula de mai sus am pus abaterea din populaie, dar
nu o cunoatem; folosim abaterea aflat n eantionul investigat () i vom avea:
e = x n
Vom calcula apoi pe d (eroarea maxim admis ):
d = t x e.
De exemplu: avem un eantion de 900 persoane dintr-o populaie oarecare; vrem s tim
vrsta medie i abaterea n populaie; calculm vrsta medie n eantion (de exemplu, 35 ani);
calculm abaterea medie (de exemplu, 12 ani); conform formulei:
e = 12 : 30 = 0,4;
dac lum P = 0,95 i t = 2, atunci vom putea spune, cu un risc de 5%, c valoarea adevrat a
mediei de vrst din populaie se va situa ntre: (35-2 x 0,4) i (35+2 x 0,4), adic ntre 34,2 i
35,8 ani.
S se calculeze volumul eantionului pentru o populaie de 1550 studeni, tiind c la
psihologie sunt 375, la sociologie 475, la pedagogie 360 iar la asisten social 340, pentru o
eroare limit admis de 4%.
n (t2D2)/x2 (t2D2/n)
n (1,9622500)/42 (1,9622500/1550) 384
Pedagogie
Sociologie
Psihologie
Total
Populaie
Asisten
social
340
360
475
375
1550
Populaie %
21,93
23,22
30,65
24,20
100
Eantion
iniial
84
89
118
93
Eantion %
21,88
23,17
30,73
24,22
100
Eantion
real
85
90
117
92
384
G
n
k1 (1 q ) 2 k 2 (0 q ) 2
k1 (1 q ) 2 k 2 q 2
N
q (1 q )
q (1 q )
n
n cazul nostru:
0,2 0,8
1600
0.16
0,4
4
0,01
40
40 100
(sau 1%)
Deci: dac alegem P = 0,95 (creia i corespunde o eroare maxim de 2e), vom spune
c: sunt 95% anse ca partidul pentru care au optat 20% din eantion s aib - n populaia din
care am extras eantionul - un procent de susintori ntre (q-2e) i (q+2e), adic: ntre 18
22%.
12