Documente Academic
Documente Profesional
Documente Cultură
TIINELE SOCIO-UMANE
Noiuni de baz - Statistici univariate
Cristian Opariuc-Dan
2
Cristian Opariuc-Dan
Cuprins
Cuprins ......................................................................................................... 3
Prefa .......................................................................................................... 7
Cuvntul autorului ...................................................................................... 11
I. Natura msurrii n tiinele socio-umane ............................................ 15
I.1 Variabile....................................................................................... 18
I.1.1 Variabile discrete................................................................... 20
I.1.2 Variabile continui .................................................................. 21
I.2 Scale (nivele) de msurare ............................................................ 22
I.2.1 Scale neparametrice ............................................................... 23
I.2.2 Scale parametrice .................................................................. 26
I.3 Prezentare general SPSS for Windows ........................................ 30
I.3.1 Bazele de date creare, salvare, deschidere ........................... 35
II. Organizarea datelor ............................................................................. 58
II.1 Sistematizarea datelor ................................................................... 60
II.2 Reprezentarea grafic a datelor ..................................................... 67
III. Statistici descriptive Tendina central .......................................... 70
III.1 Populaie i eantion ................................................................. 71
III.1.1 Eantionarea simplu randomizat........................................... 73
III.1.2 Randomizarea pe cote............................................................ 74
III.1.3 Eantionarea stratificat ......................................................... 75
III.1.4 Eantionarea pe cluster .......................................................... 76
III.2 Indicatori ai tendinei centrale ................................................... 76
III.2.1 Media .................................................................................... 78
III.2.2 Mediana i rangurile .............................................................. 83
3
Statistic aplicat n tiinele socio-umane
III.2.3 Modul.................................................................................... 87
III.2.4 Precizia indicatorilor tendinei centrale .................................. 88
III.2.5 Obinerea indicatorilor tendinei centrale n SPSS .................. 92
IV. Media populaiei. Reprezentri grafice ale tendinei centrale .......... 100
IV.1 Reprezentri grafice ................................................................ 101
IV.2 Analiza grafic a tendinei centrale.......................................... 111
IV.2.1 Graficul tulpin i frunze .................................................. 112
IV.2.2 Graficul cutie (box-plot)................................................... 115
IV.3 Tratarea scorurilor extreme ..................................................... 118
IV.3.1 Obinerea graficelor pentru tendina central n SPSS .......... 121
V. Statistici descriptive mprtierea ................................................... 126
V.1 Indicatori elementari ai mprtierii ............................................ 128
V.1.1 Amplitudinea de variaie...................................................... 128
V.1.2 Abaterea cuartil sau abaterea intercuartil .......................... 129
V.2 Indicatori sintetici ai mprtierii ................................................ 133
V.2.1 Diferena medie Gini ........................................................... 133
V.2.2 Oscilaia .............................................................................. 134
V.2.3 Abaterea medie.................................................................... 137
V.2.4 Abaterea median ................................................................ 139
V.2.5 Dispersia ............................................................................. 139
V.2.6 Abaterea standard ................................................................ 142
V.2.7 Coeficientul de variaie ........................................................ 145
V.3 Obinerea indicatorilor mprtierii n SPSS................................ 146
VI. Distribuia normal ........................................................................ 149
VI.1 Modalitatea ............................................................................. 151
VI.2 Simetria .................................................................................. 152
VI.2.1 Coeficientul Yule ................................................................ 153
4
Cristian Opariuc-Dan
5
Statistic aplicat n tiinele socio-umane
6
Cristian Opariuc-Dan
Prefa
Apariia unei noi cri de statistic n domeniul tiinelor sociale este
un fapt tiinific remarcabil n zona intelectual de resort din Romnia. De-
numirea alternativ pentru aceast preocupare academic este Metode canti-
tative n domeniul tiinelor sociale, avnd n vedere faptul c statistica este
un vast ansamblu de metode folosite pentru culegerea, gruparea, prelucrarea,
interpretarea i prezentarea datelor culese din sectorul cercetrii sau al prac-
ticii profesionale. Din acest ansamblu de metode, psihologii i ali specialiti
n domeniul socio-uman nu ntrebuineaz dect o parte. Statistica este o pre-
ocupare teoretic i practic, ale crei acumulri a dat roade care se revars
ntr-un vast ansamblu de domenii tiinifice i preocupri empirice, domeniul
economic fiind cel mai cunoscut marelui public. Oamenii sunt din ce n ce
mai bombardai pe canalele media cu informaii statistice, care se constituie,
n frecvente cazuri, n surse de manipulare. Orice persoan care dorete s
decodeze corect noianul de date statistice cotidiene trebuie s cunoasc sen-
sul i corecta folosire a unor noiuni i a unor raportri din acest areal de pre-
ocupri. Dup cum spune un statistician englez, m refer la Milton Smith,
nenorocirea nu const n faptul c statisticile mint, ci n faptul c mincinoii
se folosesc de statistici. Referinele domnului Cristian Opariuc se fac mai ales
la domeniul psihologiei, domeniu n care autorul a avut o rodnic activitate
profesional, n calitate de psiholog practician. Se poate spune c expozeul
domniei sale din lucrarea de fa reprezint o statistic trit, adic aplicat
prin experien profesional ntr-o mulime de situaii de cercetare tiinific
i aplicaii empirice.
Contribuia domniei sale la rspndirea teoriei i a aplicaiei statistice
n domeniul socio-uman, n general, i n cel psihologic, n special, este nota-
bil, avnd n vedere precizrile anterioare referitoare la contactul nemijlocit
cu situaii care cereau competen i pertinen n interpretare. Pentru cei ti-
neri i neexperimentai, amintesc faptul c domeniul interpretrii cantitative
7
Statistic aplicat n tiinele socio-umane
8
Cristian Opariuc-Dan
9
Statistic aplicat n tiinele socio-umane
10
Cristian Opariuc-Dan
Cuvntul autorului
Bun venit la cursul de statistic aplicat n tiinele socio-umane. Da-
c ai cumprat aceast carte, probabil c suntei student sau absolvent al unei
faculti pe care ai urmat-o tocmai din dorina de a scpa de matematic, de
calcule, probabil c v plac mai mult cuvintele, v place s vorbii cu oame-
nii, s-i nelegei i s-i ajutai, s ptrundei fenomenele i evenimentele
sociale. mi imaginez surprinderea i ngrijorarea dumneavoastr n momen-
tul n care, abia pind pe bncile facultii, ai aflat cu stupoare c trebuia s
studiai statistic. Mai mult, c statistica v-a urmat n toi anii de facultate,
inclusiv la licen. tiu! i eu, la rndul meu, am trit aceleai sentimente i
nu m pot luda c am obinut, de la nceput, performane deosebite n acest
domeniu. Asta pentru c statistica nu se las uor dezvluit. Totui, statistica
reprezint fundamentul tiinific al unor discipline precum psihologia, socio-
logia, antropologia i multe altele. Fr sprijinul su, nu am reui s vorbim
astzi de inteligen, trsturi de personalitate, tipuri de memorie, nu am avea
teste care s le msoare la nivelul la care reuesc acum s le msoare.
Statistica nu este att de grea. Nu este nevoie s tim concepte avansa-
te de matematic superioar pentru a nelege i aplica principii statistice.
Dac tii s adunai, s scdei, s nmulii i s mprii, sunt sigur c vei
putea nva foarte bine i statistica. Nu trebuie s v sperie formulele com-
plexe i neinteligibile. De cele mai multe ori, aceste formule nu sunt altceva
dect algoritmi, pai simpli, proceduri de calcul elementar, care v introduc
n lumea fascinant a probabilitilor. Chiar dac uneori apar termeni precum
logaritmi, integrale, derivate i limite, stai linitii. Nimeni nu v pune s le
calculai. Unele calcule pot presupune utilizarea unui calculator tiinific i
cam att.
Am ncercat s fac din acest volum un material special i am evitat de
fiecare dat s utilizez concepte matematice laborioase. Fiecare formul pe
care o prezint aici va fi explicat, descompus. Uneori abundena de exemple
11
Statistic aplicat n tiinele socio-umane
i repetiiile sunt destinate fixrii unor concepte mai dificile sau mai impor-
tante. Sigur c statistica presupune nc de la nceput stpnirea unor concep-
te noi. Nu putem avansa dac nu nelegem sensul termenului a msura sau
dac nu tim ceea ce este o variabil, un nivel de msur sau un indicator
statistic. Muli dintre dumneavoastr abia acum iau contact cu aceti termeni
i, desigur, lucrul acesta i sperie. Fii fr grij. O mare parte din terminolo-
gia statistic o folosii deja i ai folosit-o de mii de ori. Doar c nu tiai c se
numete aa i nici de unde provine. mpreun vom face lumin.
Acest volum este unul practic. Fiecare capitol i propune obiective
precise i abund de exemple i exerciii concrete. n definitiv, m interesea-
z s stpnii practica statisticii, s o utilizai n activitatea dumneavoastr de
zi cu zi i nu s facem speculaii teoretice pe aceast tem. Majoritatea capi-
tolelor sunt formate din dou pri: un fundament teoretic i conceptual nso-
it de algoritmii (paii) clasici ai unui procedeu statistic i o aplicaie folosind
un pachet de programe de prelucrri statistice, SPSS for Windows. n aceast
carte am utilizat mai multe versiuni SPSS, ultima fiind versiunea 15. Sunt
sigur c principiile prezentate aici vor putea fi aplicate i n versiunile urm-
toare. La momentul scrierii acestei cri, ultima versiune de SPSS este versi-
unea 16. n general, fiecare capitol se finalizeaz cu un set de ntrebri i
exerciii pe care v invit s le parcurgei singuri, deoarece sunt menite s sta-
bilizeze cunotinele dobndite.
Totui, de ce este important s studiem statistica? Desigur, argumen-
tele sunt nenumrate, ns m voi rezuma doar la cteva. Cel ce nu cunoate
statistic nu poate nelege articolele de specialitate. Toate cercetrile care se
fac n acest domeniu folosesc metode statistice mai mult sau mai puin elabo-
rate. Un specialist n domeniu care nu cunoate statistic, nu poate citi i ne-
lege n profunzime coninutul unui material de specialitate, corectitudinea sau
incorectitudinea datelor expuse. n alt ordine de idei, necunoscnd statistic,
nu se poate face cercetare experimental, nu pot fi nelese principiile con-
structive ale unui instrument sau ale unei metode de msurare a unor caliti
12
Cristian Opariuc-Dan
13
Statistic aplicat n tiinele socio-umane
14
Cristian Opariuc-Dan
15
Statistic aplicat n tiinele socio-umane
16
Cristian Opariuc-Dan
17
Statistic aplicat n tiinele socio-umane
ciza nici cu ct, nici de cte ori. Aceasta este ns, din nou, o problem a ni-
velului de msurare, pe care o vom aborda ulterior.
I.1 Variabile
Am stabilit deja faptul c obiectele pot fi cunoscute prin msurarea
indicatorilor proprietilor sale. Aadar, obiectele devin msurabile prin stabi-
lirea caracteristicilor lor. Caracteristica este, prin urmare, o particularita-
te, o nsuire a unui obiect sau fenomen, care constituie obiectul msur-
rii. De exemplu, o mas poate fi caracterizat prin lungime, lime, nlime,
greutate, form, culoare etc. Toate acestea constituie caracteristici prin care
ncercm s descriem ct mai exact obiectul msurat. Cu ct avem mai multe
asemenea caracteristici, cu att obiectul se contureaz mai precis.
Caracteristicile prin care obiectul este descris, poart numele de vari-
abile. O variabil reprezint un concept-cheie n statistic i nu este altceva
dect un nume pentru un element a crui principal proprietate este ace-
ea c variaz, i modific valorile. Prin aceast proprietate principal, vari-
abilele se disting de constante, elemente care au valori fixe. De exemplu,
ntr-un studiu efectuat pe o populaie general, genul biologic poate fi o vari-
abil dac lotul de cercetare cuprinde att brbai, ct i femei. Dac, ns,
intenionm s desfurm o cercetare numai pe femei, atunci genul biologic
devine o constant, deoarece nu prezint proprietatea principal a variabile-
lor, aceea de a-i modifica valorile.
Modalitatea de realizare a unei variabile (modul n care i sunt atribui-
te valorile) constituie un eveniment ntmpltor (probabilistic), de aceea vari-
abila se mai numete i variabil aleatoare sau variabil stocastic. De
exemplu, nlimea unor elevi dintr-o clas este o variabil care poate lua
aleatoriu diferite valori pe care le pot avea elevii la aceast caracteristic.
Desigur, valorile pe care le poate lua variabila se grupeaz ntr-un anumit
interval de valori. Nu putem vorbi de elevi de 5 centimetri, dup cum nu pu-
tem gsi elevi de 5 metri. De aceea, putem considera c nlimea elevilor din
18
Cristian Opariuc-Dan
clasa a X-a este o variabil stocastic ce poate lua aleatoriu valori din dome-
niul de definiie 150 190 centimetri.
Aadar, elementele de baz care compun domeniul de definiie al unei
variabile aleatorii poart numele de valori sau scoruri. n momentul n care
aceste elemente sunt numere, variabila se mai numete i variabil alea-
numeric.
O variabil aleatorie exprim, aadar, variaia unei caracteristici.
Dup cum am spus, nlimea elevilor este o variabil alea-numeric; la fel
greutatea acestora, capacitatea toracic, temperatura corpului sau numrul de
la pantofi. Nu toate variabilele sunt ns alea-numerice. Culoarea ochilor,
culoarea prului, genul biologic, tipul temperamental etc. sunt variabile ale
cror valori nu pot fi exprimate prin numere, dei sunt i ele variabile aleato-
rii. Asemenea variabile nu sunt considerate variabile alea-numerice.
Toate aceste caracteristici pot fi msurate, nregistrate i catalogate i,
de asemenea, difer de la o persoan la alta sau de la o situaie la alta. De
aceea, toate aceste concepte le vom include sub denumirea generic de vari-
abile.
De ce suntem ns att de interesai de aceste variabile, de ce sunt im-
portante i la ce ne folosesc? Rspunsul este acela c nu putem fi mulumii
doar cu ideea c variabilele variaz. Ne intereseaz, n principiu, s nele-
gem de ce variaz, cnd i n ce condiii variaz, care este efectul acestor va-
riaii ale lor. Pentru aceasta, variabilele vor trebui mai nti definite, apoi n-
registrate i, n final, supuse analizei, crend premisele extragerii unor con-
cluzii i, implicit, ale generalizrii.
Realizarea unei variabile prin intermediul scorurilor creeaz posibili-
tatea abordrii conceptului statistic de frecven. Frecvena reprezint rs-
punsul la ntrebarea ci indivizi, cte cazuri populeaz fiecare categorie a
19
Statistic aplicat n tiinele socio-umane
1
Exist mai multe clasificri ale variabilelor. Le vom aborda atunci cnd situaia o va impu-
ne, pentru a nu complica inutil, la acest nivel, expunerea noastr.
20
Cristian Opariuc-Dan
21
Statistic aplicat n tiinele socio-umane
22
Cristian Opariuc-Dan
23
Statistic aplicat n tiinele socio-umane
24
Cristian Opariuc-Dan
25
Statistic aplicat n tiinele socio-umane
26
Cristian Opariuc-Dan
media, abaterea standard sau ali indicatori care fac parte din statisticile nu-
mite i statistici tari.
27
Statistic aplicat n tiinele socio-umane
28
Cristian Opariuc-Dan
29
Statistic aplicat n tiinele socio-umane
2
Pe parcursul acestei prezentri, unele imagini sunt din SPSS 12.0 for Windows. Acest lucru
nu incomodeaz n utilizarea altor versiuni. Toate imaginile utilizate reprezint marc nre-
gistrat SPSS Inc.
30
Cristian Opariuc-Dan
3
Desigur, n situaia n care SPSS for Windows este deja instalat pe calculatorul dumnea-
voastr. Dac nu avei instalat SPSS for Windows, putei descrca o versiune demonstrativ
de 30 de zile de pe site-ul http://www.spss.com Asigurai-v c avei o conexiune suficient
de rapid i de stabil la Internet, deoarece fiierul este destul de mare (aproximativ 160 MB)
31
Statistic aplicat n tiinele socio-umane
32
Cristian Opariuc-Dan
33
Statistic aplicat n tiinele socio-umane
34
Cristian Opariuc-Dan
35
Statistic aplicat n tiinele socio-umane
36
Cristian Opariuc-Dan
37
Statistic aplicat n tiinele socio-umane
38
Cristian Opariuc-Dan
39
Statistic aplicat n tiinele socio-umane
Exerciiu practic:
n exerciiul care urmeaz vom traduce pur i simplu n romnete
structura acestei baze de date i vom salva baza de date sub un nou nume,
Masini (atenie, nu folosii diacriticele romneti n scrierea literelor, prin
urmare, n acest caz, nu folosii litera , ci s. Deci nu vom salva cu Maini,
ci Masini), ntr-un director nou creat avnd calea C:\Exercitii SPSS
(aceeai meniune referitoare la diacritice).
n cazul primei variabile, numele va rmne acelai, iar noi vom mo-
difica doar descrierea. Vom da clic n seciunea Label, acolo unde se afl
afiat textul Miles per Gallon i vom scrie textul Mile per galon.
40
Cristian Opariuc-Dan
41
Statistic aplicat n tiinele socio-umane
42
Cristian Opariuc-Dan
43
Statistic aplicat n tiinele socio-umane
tastele rapide) duce la apariia ferestrei Save as, deoarece fiind o baz de date
nou, acesteia nu i-a fost atribuit nc un nume printr-o operaie de salvare.
Putei cu uurin identifica dac o baz de date are un nume (a fost salvat)
sau nu, urmrind bara de titlu. Bazele de date noi sunt identificate prin mesa-
jul Untitled SPSS Data Editor, n timp ce bazele de date salvate au afiat
numele acestora n bara de titlu. Ai observat c, la lansarea programului
SPSS, acesta creeaz automat o baz de date nou i nedefinit i ateapt din
partea noastr definirea variabilelor i salvarea acesteia. Odat salvat baza
de date, orice modificri efectum n ea, la salvare ele vor fi scrise automat n
fiierul al crui nume este afiat n bara de titlu, fr a mai aprea fereastra de
salvare de mai sus. Singura modalitate prin care putem da un alt nume bazei
de date sau prin care o putem salva ntr-un alt loc este folosirea opiunii Save
as.
Crearea unei noi baze de date se poate face folosind meniul File,
submeniul New i opiunea Data, combinaiile de taste Ctrl+N sau Alt+F,
Alt+N, Alt+A. n oricare dintre aceste situaii, SPSS va crea o baz de date
goal i nedefinit, la fel ca n cazul lansrii programului.
44
Cristian Opariuc-Dan
45
Statistic aplicat n tiinele socio-umane
46
Cristian Opariuc-Dan
47
Statistic aplicat n tiinele socio-umane
48
Cristian Opariuc-Dan
mai uor datele i pentru a putea efectua prelucrri statistice la nivel de varia-
bile nominale.
Caracteristica Missing permite defi-
nirea modului n care vor fi tratate valorile
lips din cadrul unei variabile. Uneori, este
important s cunoatem de ce lipsesc valori
dintr-o variabil. Datele lips se pot datora,
spre exemplu, faptului c subiectul refuz
s rspund la o anumit ntrebare sau fap-
Figura 1.15 Tratarea valorilor lips tului c ntrebarea nu este adresat acelui
subiect. Iat dou situaii care ar necesita un
tratament separat al valorilor lips. Datele pe care le vei trata n mod explicit
ca date lips pot fi supuse apoi unei analize statistice separate, fiind iniial
excluse din cele mai multe calcule. Un alt exemplu, frecvent ntlnit n ches-
tionarele sociologice, se refer la codificarea rspunsurilor de tip Nu tiu/Nu
rspund. Majoritatea cercettorilor codeaz aceste variante cu 9 sau 99. Evi-
dent, variantele incerte nu vor face obiectul prelucrrii iniiale a datelor. Fo-
losind aceast seciune se pot include aceste valori (9 sau 99) ca valori lips,
SPSS eliminndu-le din analiz. Definirea valorilor lips poate accepta trei
situaii. Situaia No missing values, cnd comunicm programului c nu
dorim un tratament special pentru valorile lips, acestea fiind tratate ca atare
n cursul fiecrei prelucrri de date pe care o realizm, situaia Discrete
missing values, cnd putem defini pn la trei valori care vor fi tratate ca
valori lips n cursul prelucrrilor statistice ulterioare (de exemplu, la un
chestionar cu 3 variante de rspuns, dorim ca doar rspunsurile 1 i 3 s fie
luate n calcul, rspunsul 2 fiind tratat ca non-rspuns. Pentru aceasta, vom
include cifra 2 n prima dintre cele trei casete ale acestei seciuni.) i situaia
Range plus one optional discrete missing value, n care putem stabili un
interval pentru care valorile vor fi tratate ca valori lips (spre exemplu, coefi-
cienii de inteligen cuprini ntre 10 i 75), n plus existnd posibilitatea de
49
Statistic aplicat n tiinele socio-umane
50
Cristian Opariuc-Dan
4
Ca observaie, n SPSS, nivelurile de msur de interval i de raport au fost reunite sub
denumirea generic de nivel de msur scalar. Proiectanii acestei aplicaii au renunat la
distingerea celor dou, reunindu-le sub denumirea de nivel scalar.
51
Statistic aplicat n tiinele socio-umane
52
Cristian Opariuc-Dan
53
Statistic aplicat n tiinele socio-umane
54
Cristian Opariuc-Dan
Variable Informati on
Measurement
Variable Position Label Lev el Column Width Alignment Print Format Writ e Format
nume Numele
1 Nominal 14 Lef t A20 A20
subiectului
v arst a Varst a
2 Scale 8 Right F2 F2
subiectilor
sexul Genul
3 biologic al Scale 8 Right F1 F1
subiectilor
iq Coef icientu
4 l de Scale 8 Right F3 F3
inteligenta
Variables in the working f ile
55
Statistic aplicat n tiinele socio-umane
Variable Values
Value Label
sexul 1 Masculin
2 Feminin
n concluzie:
Msurarea n tiinele socio-umane are un caracter subiectiv, deoarece nu putem
observa direct indicatorii funciilor psihice sau ai funciilor sociale;
Msurtorile sunt aproximri ale realitii, deoarece sunt supuse n permanen
surselor de eroare, iar realitatea social are un caracter fluctuant;
Dup S. S. Stevens, n sensul su larg, a msura nseamn a atribui numere obiec-
telor sau evenimentelor potrivit unor reguli.
Regula de atribuire trebuie s fie:
o Suficient de clar pentru a permite atribuirea univoc, la un moment dat, a
unui numr unui obiect i numai a unui singur numr;
o Suficient de simpl pentru a fi utilizat;
O variabil este un nume pentru un element a crui caracteristic este aceea c va-
riaz, i modific valorile;
O variabil este aleatorie i poate lua valori numerice (alea-numeric) sau ne-
numerice;
O variabil se caracterizeaz printr-un domeniu de definiie, o mulime de valori pe
care aceasta le poate lua. n funcie de acest domeniu de definiie, variabilele pot fi
discrete sau continui;
56
Cristian Opariuc-Dan
57
Statistic aplicat n tiinele socio-umane
58
Cristian Opariuc-Dan
59
Statistic aplicat n tiinele socio-umane
60
Cristian Opariuc-Dan
61
Statistic aplicat n tiinele socio-umane
62
Cristian Opariuc-Dan
193171 22
n cazul nostru formula devenind = = = 3,67 4
6 6
63
Statistic aplicat n tiinele socio-umane
64
Cristian Opariuc-Dan
65
Statistic aplicat n tiinele socio-umane
primul caz, evident, n prima clas. n al doilea caz ns, poate fi inclus i n
prima i n a doua clas. De aceea, niciodat precizia claselor nu va depi
precizia msurtorilor efectuate.
Gruparea n Tabelul 2.4 Distribuia statistic pe clase
clase fiind ncheiat, Distribu-
Clasa
ia n linii
fa fc fc %
obinem aa-numita 171 174 ||||||||| 9 9 30 30,00 300,00
distribuie statistic 175 178 ||||| 5 14 21 16,66 166,66
179 182 |||||| 6 20 16 20,00 200,00
ce formeaz baza 183 186 |||| 4 24 10 13,33 133,33
prelucrrilor de date 187 190 ||| 3 27 6 10,00 100,00
ulterioare. n exem- 191 -193 ||| 3 30 3 10,00 100,00
30
plul nostru vom avea
urmtoarea distribuie statistic:
nsumnd efectivele (frecvenele) tuturor intervalelor, va rezulta, evi-
dent, numrul total de msurtori (n). Este, de asemenea, posibil s calculm
frecvenele cumulate, fie ascendent, fie descendent, ca expresie a adunrii
frecvenei intervalului curent la frecvena cumulat a intervalului anterior.
Astfel, pentru primul interval, att frecvena, ct i frecvena cumulat ascen-
dent au valoarea 9. Pentru al doilea interval, frecvena absolut este 5, iar
frecvena cumulat ascendent devine 9+5=14. Al treilea interval are frecven-
a absolut 6, iar frecvena cumulat ascendent 14+6=20 i aa mai departe.
Procedura de calcul este analoag i n cazul frecvenelor cumulate descen-
dent, cu singura deosebire c adunarea se face ncepnd de la ultimul interval.
Rolul frecvenelor cumulate este acela de a ordona cresctor sau
descresctor datele grupate n intervale i de a indica numrul de cazuri, ci
subieci se afl pn la o anumit valoare (frecvenele cumulate ascendente)
sau ci subieci au depit o anumit valoare (frecvenele cumulate descen-
dente). Dac discutm de ordonare, este evident c variabila trebuie s se afle
cel puin la un nivel ordinal de msur, calculul frecvenelor cumulate n ca-
zul variabilelor nominale fiind un nonsens.
66
Cristian Opariuc-Dan
67
Statistic aplicat n tiinele socio-umane
rea prin grafice cu bare a nlimii subiecilor sub form de valori. Un tip par-
ticular de reprezentare a graficelor cu bare este histograma. O histogram se
deosebete de un grafic cu bare prin aceea c, n locul liniilor, sunt ridicate
dreptunghiuri cu baza egal cu intervalul
folosit. Pentru a putea folosi histogramele,
datele trebuie s fie grupate, aadar, pe
intervale egale.
Dac unim prin linii vrfurile gra-
ficelor cu bare sau mijlocul bazei de sus a
histogramelor obinem un alt tip de grafic,
i anume poligonul frecvenelor absolute
Figura 2.2 Histograma pentru nli-
mea subiecilor
68
Cristian Opariuc-Dan
Uneori este mai convenabil s reprezentm, mai ales atunci cnd lu-
crm cu procente, compoziia msurtorilor printr-o structur radial. Un
asemenea grafic se numete plcint (pie) i este util atunci cnd ne intere-
seaz s urmrim proporia cu care fieca-
re clas particip la construcia ntregu-
lui.
Pentru o variabil continu, deoa-
rece avem o densitate de probabilitate pe
intervalul de valori, reprezentarea grafic
se face sub forma unei curbe numit cur-
b de distribuie, ns acest aspect va
Figura 2.5 Reprezentarea prin diagram face obiectul unui capitol viitor.
de structur (plcint)
n concluzie:
O colecie de date are o valoare informativ extrem de redus. n vederea
extragerii unor informaii preliminare, este necesar ordonarea i grupa-
rea datelor;
La o amplitudine de variaie mic, pot fi ordonate valorile i numrate
efectivele fiecrei valori, realizndu-se astfel un protocol sistematizat;
La o amplitudine de variaie mare i la msurtori numeroase, se va reali-
za gruparea datelor n clase, pe baza unui interval de grupare. Att num-
rul claselor, ct i intervalul de grupare pot fi calculate n baza unor for-
mule sau a unor tabele de referin;
O distribuie statistic reprezint un protocol de date sistematizat i orga-
nizat care conine clasele, diagramele n linii (puncte, stelue etc.) i frec-
venele absolute. Alte informaii care mai pot fi incluse sunt frecvenele re-
lative (procentuale), frecvenele cumulate absolute i relative;
Distribuiile statistice pot fi reprezentate i grafic, folosindu-se graficele cu
bare, histogramele, poligoanele de frecvene sau graficele plcint.
69
Statistic aplicat n tiinele socio-umane
70
Cristian Opariuc-Dan
71
Statistic aplicat n tiinele socio-umane
72
Cristian Opariuc-Dan
mentul n care voi dori s tiu dac sunt fierte boabele, voi extrage un eanti-
on de boabe de fasole i nu unul de boabe de mazre din oala alturat. Posi-
bilitatea de a generaliza la nivelul ntregii populaii a cunotinelor dobndite
la nivelul eantionului este vital n cercetarea experimental. De aceea, asi-
gurarea reprezentativitii unui eantion este de maxim importan.
Metoda prin care selectm un eantion dintr-o populaie are implicaii
asupra validitii i generalizrii concluziilor dobndite n urma studiului
eantionului. Metodele de eantionare se mpart n dou mari categorii: me-
tode prin care eantionul este extras aleatoriu dintr-o populaie i metode prin
care eantionul nu este extras aleatoriu.
ntr-un eantion care nu este extras aleatoriu, probabilitatea ca un su-
biect s fac parte din eantion nu poate fi calculat. Este exemplul clasic n
care subiecii sunt selectai pe baz de voluntariat sau dintre cei care retur-
neaz chestionarele completate prin pot.
ntr-un eantion extras aleatoriu, fiecare individ are o probabilitate
calculabil de a fi inclus n eantion, iar aceast probabilitate va urmri s fie
egal pentru fiecare subiect. Este cazul extragerii unui eantion dintr-o baz
de date care conine, aleatoriu, ntreaga populaie.
Orice eantion se stabilete n baza unei scheme de eantionare. O
schem de eantionare reprezint un set de tehnici i reguli, n baza crora din
populaie se extrage eantionul necesar, iar compoziia acestuia este aleatoriu
derivat n funcie de definiiile probabilistice ale schemei de eantionare.
73
Statistic aplicat n tiinele socio-umane
re individ din acea list are asociat un numr. Se folosesc apoi tabelele de
numere aleatoare sau numerele aleatoare se genereaz de un computer. Prac-
tic, numrul aleatoriu generat reprezint numrul de ordine al individului de
pe list. Procedura continu pn cnd s-a extras ntregul eantion. Metoda
randomizrii este o metod foarte simpl, ns dificultatea const n posibili-
tatea obinerii unei liste exhaustive pe criteriile dorite.
74
Cristian Opariuc-Dan
75
Statistic aplicat n tiinele socio-umane
76
Cristian Opariuc-Dan
77
Statistic aplicat n tiinele socio-umane
III.2.1 Media
Considerm c termenul de medie mai precis media aritmetic es-
te conceptul cel mai uor de neles din ntreaga statistic. Au fost nenumra-
te situaiile n care ai ntlnit media: media la matematic pe trimestru sau
semestru prin care putei ti dac ai rmas corigent sau ai luat premiu, media
de la bacalaureat care v ridic sau v coboar ansele de admitere la faculta-
te, la fel i media anilor de studiu, media de vrst din familia dumneavoastr
sau media cheltuielilor zilnice care v ajut s v planificai mai bine bugetul.
Deci ce este media? Media nu este altceva dect suma valorilor unei
variabile, raportat la numrul msurtorilor, fiind, poate, cel mai simplu
model statistic. Aceasta este media aritmetic, deoarece n statistic mai
discutm i despre media geometric, media caracteristicilor alternative, me-
dia ptratic, media rangurilor etc. Aceste concepte le ntlnim ns mai rar n
domeniul tiinelor socio-umane i, prin urmare, nu vom face dect s le
amintim.
Probabil c vi se va prea ciudat afirmaia anterioar. Cum adic
media este un model statistic? Ei bine, aa este, deoarece nu reprezint alt-
ceva dect o valoare ipotetic ce poate fi obinut din orice set de date msu-
rate la un nivel parametric. Dac, de exemplu, am nregistra numrul de frai
pe care-i au cinci dintre prietenii mei, am obine urmtoarele valori: primul
78
Cristian Opariuc-Dan
79
Statistic aplicat n tiinele socio-umane
tate, atunci cnd vorbim de o populaie vom nota media cu (miu), iar cnd
de referim la un eantion o vom nota cu m sau .
Iat, avem un numr de 10 msurtori ale unor scoruri brute la un
chestionar de anxietate, dup cum urmeaz: 10, 22, 31, 9, 24, 27, 29, 9, 23,
12. Media aritmetic va fi suma acestora mprit la numrul lor, n cazul
nostru 10. Prin urmare, efectund calculele, obinem media de 19,6. Este
greu, nu?
10 + 22 + 31 + 9 + 24 + 27 + 29 + 9 + 23 + 12 196
= = = 19,6
10 10
Vom reconsidera acum exemplul din capitolul al doilea i vom ncer-
ca s-l utilizm pentru a efectua calculele n vederea stabilirii celor trei indi-
catori ai tendinei centrale. Vi-l reamintesc:
Exemplu: Presupunem c msurm nlimea unor subieci n centi-
metri i obinem urmtoarele rezultate: 182, 175, 174, 189, 177, 177, 180,
173, 188, 171, 184, 192, 180, 172, 177, 193, 184, 192, 172, 177, 174, 171,
172, 179, 185, 179, 183, 172, 179, 188.
Pentru a calcula media, va trebui s adunm toate aceste 30 de valori
i s mprim suma rezultat la 30 care reprezint numrul msurtorilor.
ncepei s adunai.. Suma tuturor acestor valori este 5391. Dac mprim
aceast sum la 30, vom obine valoarea 179,7, care nu reprezint altceva
dect media nlimii celor 30 de subieci.
Ai observat probabil c v-a luat destul de mult timp s calculai
aceast medie folosind adunarea valorilor. Nu ai avut dect 30 de valori de
adunat. Acum imaginai-v c avei 3000 sau 5000 de valori. V putei da cu
uurin seama c, n asemenea condiii, calculul mediei devine extrem de
dificil i foarte susceptibil la erorile ce pot s apar. Cnd volumul datelor
este destul de mic, putem calcula media prin nsumarea valorilor i prin ra-
portarea acestei sume la numrul de msurtori. Dac volumul de date este
80
Cristian Opariuc-Dan
ns mare, iar datele sunt grupate, vom prefera o alt metod de calcul, folo-
sind aceste date grupate. Iat o prim aplicaie a datelor grupate. V mai adu-
cei aminte de distribuia statistic folosit n capitolul doi? O vom reproduce
i apoi vom modifica acest tabel astfel nct s ne permit calculul mediei.
tim c intervalul de grupare este i=4, iar acest interval a fost stabilit prin
aproximare.
Tabelul 3.3 Distribuia statistic Urmeaz s stabi-
Distribuia lim valoarea central xk
Clasa f fc % %c
n linii
171 174 ||||||||| 9 9 30,00 30,00 ,care nu reprezint altceva
175 178 ||||| 5 14 16,66 46,66 dect mijlocul intervalului
179 182 |||||| 6 20 20,00 66,66
183 186 |||| 4 24 13,33 80,00
curent. Astfel, pentru pri-
187 190 ||| 3 27 10,00 90,00 mul interval avem valorile
191 -193 ||| 3 30 10,00 100,0 171, 172, 173, 174. Valoa-
n=30 100%
rea central a intervalului
va fi, aadar, ntre 172 i 173, mai precis 172,5. Pentru al doilea interval,
avem 175, 176, 177, 178 i, deci, valoarea central devine n acest caz 176,5
i aa mai departe. Ultimul interval conine ns doar trei elemente i anume
191, 192, 193. Aici valoarea central va fi, deci, 192.
Urmeaz apoi, stabilirea valorii fxxk care reprezint nmulirea, pentru
fiecare clas, a valorii xk cu frecven-
Tabel 3.4 Calculul mediei aritmetice
Clasa xk f fxxk a absolut f. Pentru primul interval
171 174 172,5 9 1552,5 vom avea, aadar, 172,5 x 9 =
175 178 176,5 5 882,5
179 182 180,5 6 1083 1552,5. Al doilea interval va avea ca
183 186 184,5 4 738 rezultat produsul 176,5 x 5 = 882,5
187 190 188,5 3 565,5 i aa mai departe pn la ultimul
191 -193 192 3 576
n=30 = 5397,5 interval.
Adunm apoi toate aceste produse obinute n coloana fxxk , pentru a
stabili suma produselor, . n cazul nostru, 1552,5 + 882,5 + 1083 + 738 +
565,5 + 576 = 5397,5. Constatm c valoarea este foarte apropiat de valoa-
81
Statistic aplicat n tiinele socio-umane
rea exact obinut prin nsumarea tuturor valorilor (5391). Acum, dac m-
prim totalul 5397,5 la numrul de msurtori n vom obine valoarea mediei
179,91. Aceast nou valoare difer foarte puin de media real obinut prin
nsumarea valorilor. Acest lucru se ntmpl, deoarece media pune n eviden-
tendina central a rezultatelor constatate ntr-o cercetare, iar gruparea da-
telor introduce o eroare n calculul mediei pentru c se face ipoteza c ele-
mentele fiecrei clase sunt concentrate la mijlocul intervalului, ceea ce nu
este aa. Cei zece subieci din primul interval, tim bine, nu au nlimi con-
centrate n jurul valorii de 172,5 i cu att mai puin subiecii din celelalte
intervale. Cu ct intervalul de grupare este mai mare, cu att aceast eroare de
grupare va avea o valoare mai mare. Statisticienii consider ns c, la volu-
me mari de date, eroarea este neglijabil comparativ cu timpul alocat nsum-
rii valorilor.
Iat c, din cele expuse mai sus, putem deduce o nou formul pentru
medie, valabil n cazul datelor grupate:
=1
= (formula 3.2)
82
Cristian Opariuc-Dan
5 6 + 1 8 + 2 9 + (3 7) 30 + 8 + 18 + 21 77
= = = =7
11 11 11
Avnd n vedere algoritmul de mai sus, putem scrie n continuare
formula mediei ponderate, dup cum urmeaz:
=1
= (formula 3.3)
=1
83
Statistic aplicat n tiinele socio-umane
irul de date va avea valori mai mici dect mediana, n timp ce cealalt
jumtate va avea valori mai mari dect mediana. S considerm urmto-
rul ir de date:
Scoruri: 12, 14, 10, 11, 15, 14, 12, 20, 19, 20, 13, 11, 14, 8
Scoruri: 8, 10, 11, 11, 12, 12, 13, 14, 14, 14, 15, 19, 20, 20
Dup definiia medianei, n cazul nostru avem 14 valori. Prin urmare,
mediana va fi valoarea care mparte acest ir ordonat n dou pri egale. Fi-
ind 14 valori, mediana este situat la limita primelor apte valori. Deoarece
irul este un ir par, mediana se situeaz, n cazul nostru, ntre valoarea 13 i
valoarea 14, mai precis la valoarea 13,5. n cazul unui ir impar, mediana
este valoarea de la mijlocul unui ir. Dac relum exemplul anterior, i mai
adugm un scor, obinem:
Scoruri: 12, 14, 10, 11, 15, 14, 12, 20, 19, 20, 13, 11, 14, 8, 9
Scoruri: 8, 9, 10, 11, 11, 12, 12, 13, 14, 14, 14, 15, 19, 20, 20
De data aceasta, la mijlocul acestui ir, gsim valoarea 13, valoarea
medianei.
Ordonnd un ir, putem preciza poziia fiecrui element n cadrul ace-
lui ir. Astfel, dac lum irul ordonat de 15 valori din exemplul de mai sus,
obinem:
Scoruri: 8, 9, 10, 11, 11, 12, 12, 13, 14, 14, 14, 15, 19, 20, 20
Poziia: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15
84
Cristian Opariuc-Dan
Altfel spus, mediana nu este altceva dect poziia rangului din mijloc
n irul ordonat de date. ntr-o serie de la 1 la 15, poziia din mijlocul irului
este evident, poziia 8. Acesta este de altfel i locul n care gsim mediana.
Am accentuat asupra poziiei n ir i nu am discutat despre rang. n cazul n
care avem dou sau mai multe scoruri identice (n exemplul nostru fiind vor-
ba despre 11, 12, 14 i 20), poziia n cadrul irului exprim poziia fizic a
acelui element. Observm c scorul 12 ocup poziia 6 i 7 n cadrul irului,
elementul 14 poziia 9, 10 i 11 i aa mai departe. Cnd vorbim de rangul
unui scor i avem mai multe scoruri care se repet, rangul acestora va fi
media aritmetic a poziiilor pe care scorurile le ocup n cadrul irului.
Astfel, dac relum exemplul nostru, l putem completa i cu rangul scoruri-
lor, astfel:
Scoruri:8, 9, 10, 11, 11, 12, 12, 13, 14, 14, 14, 15, 19, 20, 20
Poziia:1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15
Rang: 1, 2, 3, 4.5, 4.5, 6.5, 6.5, 8, 10, 10, 10, 12, 13, 14.5, 14.5
Iat, deci, c scorul 11 apare pe poziia 4 i 5 de dou ori. Prin urma-
re, rangul acestor scoruri este media dintre 4 i 5, adic 4,5. La fel, scorul 12
apare pe poziiile 6 i 7, rangul acestora fiind 6,5. Scorul 14 apare pe poziiile
9, 10 i 11, rangul acestora fiind 10 i aa mai departe.
Mediana poate fi calculat i atunci cnd avem datele grupate 6. n
acest sens, am reluat exemplul anterior de calcul al mediei. Ceea ce trebuie s
tim sunt frecvenele cumulate i numrul total de cazuri. n exemplul nostru,
numrul total de cazuri este 30. Mediana fiind valoarea care mparte grupul
de subieci n dou pri egale, ea poate fi calculat dup formula alturat,
unde l este limita inferioar a intervalului care conine mediana, i este inter-
valul de clas care conine mediana, PozMe poziia medianei, fc reprezint
6
Asemenea mediei, calculul medianei prin acest procedeu reprezint o aproximare a aces-
teia i nu valoarea ei exact.
85
Statistic aplicat n tiinele socio-umane
86
Cristian Opariuc-Dan
III.2.3 Modul
Doamnele, domnioarele ne pot spune cel mai bine ce este mdul, c-
ruia i se mai spune mod, mod sau valoare modal, n niciun caz modl cum
am auzit deseori. Un modul poate fi ataat unei staii cosmice eventual, ns
nu poate identifica indicatorul tendinei centrale despre care vrem s discu-
tm. Deci, doamnelor, ce este n definitiv moda? Ce nelegem cnd spunem
c ceva este la mod? Desigur, ceva este la mod atunci cnd o mare parte
dintre oameni poart, utilizeaz acel lucru. Spunem c cizmele roz sunt la
mod, adic foarte multe fete poart cizme roz. Iat un alt cuvnt din limbajul
uzual, provenind din acelai cmp etimologic al statisticii. Prin urmare,
modul nu este altceva dect categoria cu frecvena cea mai mare. Foarte
complicat, ntr-adevr Dac avem irul de date:
7
Asemenea mediei i a medianei, calculul modului prin acest procedeu reprezint o apro-
ximare a acestuia i nu valoarea sa exact.
87
Statistic aplicat n tiinele socio-umane
n acest caz, media este 5,5, iar mediana tot 5,5. S modificm puin
ultima cifr din setul nostru de date:
1, 2, 3, 4, 5, 6, 7, 8, 9, 20
Iat c, media devine acum 6,5, n timp ce mediana rmne 5,5. Hai-
dei s modificm mai mult ultima cifr:
88
Cristian Opariuc-Dan
1, 2, 3, 4, 5, 6, 7, 8, 9, 100
Acum media va fi 14,5, n timp ce mediana rmne tot 5,5. Putei in-
tui care indicator caracterizeaz cel mai bine tendina central n ultimul set
de date? Mediana, vei spune i avei dreptate. Iat c, atunci cnd avem
scoruri extreme, foarte mari sau foarte mici n comparaie cu setul de
date, mediana este un indicator mai bun dect media. Despre modul n
care depistm scorurile extreme, vom discuta ntr-un alt capitol. Pentru a n-
elege mai bine, lum ca exemplu veniturile zilnice ale unor persoane, dup
cum urmeaz, n RON:
100, 105, 110, 115, 120, 125, 130, 135, 140
n cazul nostru, media este 120, iar mediana este tot 120. Putem con-
cluziona ca aceti oameni sunt relativ sraci, ctig doar 120 de RON pe zi.
Dar haidei s modificm ultima valoare, n loc de 140 vom stabili 1400. i-
rul devine:
100, 105, 110, 115, 120, 125, 130, 135, 1400
n acest caz, media devine 260, n timp ce mediana rmne tot 120.
Putem, oare, afirma c aceti nou oameni ctig n medie 260 RON zilnic?
Categoric nu; observm c, n afar de ultima persoan, eventual un mare
latifundiar i implicat n tranzacii sportive, niciuna dintre cele opt persoane
rmase nu ctig nici mcar 150 RON, darmite 260. Dac ne-am lua dup
medie, am putea spune c oamenii acetia sunt relativ bogai, ceea ce este
complet fals. Prin urmare, acest scor extrem face media nereprezentativ pen-
tru setul de date. Cel mai bun indicator rmne tot mediana. Desigur, media-
na nu este un indicator att de sensibil ca i media, ns n momentul n care
nu putem folosi media datorit valorilor extreme, folosim mediana ca indica-
tor al tendinei centrale.
89
Statistic aplicat n tiinele socio-umane
90
Cristian Opariuc-Dan
91
Statistic aplicat n tiinele socio-umane
92
Cristian Opariuc-Dan
93
Statistic aplicat n tiinele socio-umane
94
Cristian Opariuc-Dan
95
Statistic aplicat n tiinele socio-umane
trei puncte de suspensie deschid acum o nou fereastr. Fereastra are mult
mai multe opiuni. Pentru moment, ne vom rezuma la cele care ne interesea-
z. Observm c, n partea dreapt a acestei noi ferestre, gsim seciunea
Central Tendency, adic exact ceea ce urmrim s punem n eviden. n
aceast seciune, observm casetele de bifare Mean (media), Median
(mediana) i Mode (modul). Acestea sunt elementele pe care dorim s le
calculm. Vom bifa deci, una cte una, aceste casete, prin efectuarea unui clic
simplu pe ele, astfel nct formularul s arate ca n figura de mai sus. Mai
exist i caseta de bifare Sum (suma), prin bifarea creia obinem suma
valorilor din variabila respectiv. Variabila noastr este vrsta subiecilor i
nu ne intereseaz s nsumm vrstele celor 30 de subieci. Ar fi un indicator
fr nici o relevan pentru noi.
Dup ce am bifat cele trei casete, apsm butonul Continue (conti-
nuare), pentru a prsi aceast fereastr i a ne ntoarce n cea iniial. Acum
am comunicat programului SPSS ce indicatori statistici s extrag.
Butonul Chart i Format permite afiarea unor grafice,
respectiv configurarea modali-
tii n care vor fi afiate re-
zultatele. Despre aceste bu-
toane vom discuta cu alt oca-
zie.
Cam asta ar fi tot.
Practic, am spus programului
SPSS s calculeze media, me-
diana i modul pentru variabi-
la Varsta subiectilor cu afi-
area tabelului de frecvene.
Figura 3.7 Fereastra de afiare a rezultatelor
Nu ne rmne acum dect s
apsm butonul OK i s
96
Cristian Opariuc-Dan
vedem ce se ntmpl.
Iat c a aprut fereastra de rezultate sau fereastra Output. Nu vom
intra acum n detalii explicative ale acestei ferestre, pentru c s-ar putea s v
speriai de prea multe informaii i s trecei la Solitaire. Ne vom concentra
asupra celor dou tabele pe care le-a generat SPSS n partea din dreapta a
ferestrei de rezultate (partea cea mare), care nu reprezint altceva dect cele
dou tabele pe care le-am solicitat. Primul tabel conine indicatorii tendinei
centrale pe care i-am configurat n etapa anterioar.
Tabelul se numete Statistics i conine n partea de sus numele va-
riabilei, Varsta subiectilor, pentru a putea identifica variabila cu care ope-
rm. Apoi ne d numrul de cazuri, N, i ne spune c sunt 30 de date vali-
de (Valid) i zero date lips (Missing). Cu alte cuvinte, toi cei 30 de
subieci au nregistrat vrsta lor. Nu exist nici un subiect la care s fi uitat
s introducem aceast valoare. n continuare, ne spune c media de vrst
este 29,33 (Mean), mediana este 29 (Median), iar modul. avem o
problem. SPSS ne infor- Tabel 3.7 Indicatorii tendinei centrale
Statistics
meaz n josul tabelului c
sunt mai multe valori cu Varst a subiectilor
N Valid 30
frecvena cea mai mare i Missing 0
c o va afia pe cea mai Mean 29,33
Median 29,00
mic, 24 (Multiple mod-
Mode 24a
es exist. The smallest a. Mult iple modes exist. The smallest v alue is shown
value is shown). Acesta
este, deci, un singur mod real, cel inferior, i urmeaz s vedem care este i
cealalt valoare modal, deoarece avem o distribuie cu mai multe moduri
(multimodal).
97
Statistic aplicat n tiinele socio-umane
n concluzie:
Populaia reprezint totalitatea unor elemente dintr-un anumit spaiu la un anumit
moment dat;
n mod curent, nu putem studia populaia i de aceea lucrm cu eantioane extrase
din populaie, care s fie reprezentative, adic s respecte caracteristicile populai-
ei pe anumite criterii;
Cele mai utilizate metode de eantionare sunt:
o Eantionarea simplu randomizat;
98
Cristian Opariuc-Dan
o Eantionarea pe cote;
o Eantionarea pe straturi;
o Eantionarea pe clusteri.
Indicatorii tendinei centrale sunt media, mediana i modul;
Media este cel mai precis indicator, urmat fiind de median i de mod;
Pentru date categoriale, singurul indicator ce poate fi utilizat este modul;
Pentru date ordinale, se poate utiliza modul sau mediana;
Pentru date parametrice se folosete modul, mediana sau media;
Media nu se folosete atunci cnd avem scoruri extreme, foarte mici sau foarte mari
n distribuia noastr;
Modul se folosete la date parametrice atunci cnd frecvena unei valori este foarte
mare n comparaie cu frecvena celorlalte valori;
Media nu poate fi folosit la date neparametrice.
99
Statistic aplicat n tiinele socio-umane
100
Cristian Opariuc-Dan
niciuna. Vom putea ns face media acestor dou eantioane. Adunm 178 cu
165 i mprim la doi. Obinem 171,5 centimetri, un indicator mai precis
pentru media populaiei. Iat c media eantioanelor este un indicator care
aproximeaz mai bine media unei populaii. Cu ct avem mai multe eantioa-
ne, cu att putem stabili mai precis media populaiei. Aceast caracteristic a
mediei eantioanelor de a tinde ctre media populaiei poart n statistic nu-
mele de teorema limitei centrale. Asupra acestui aspect vom reveni i
vom avea ocazia s-l tratm amnunit ntr-un alt capitol.
8
n SPSS versiunea 15, modalitatea de construcie a graficelor difer radical, fiind mult mai
simpl i mai inteligent. Vom aborda aspectele grafice ale aplicaiei SPSS 15, la sfritul
acestui volum i n volumele viitoare
101
Statistic aplicat n tiinele socio-umane
102
Cristian Opariuc-Dan
Case Number
103
Statistic aplicat n tiinele socio-umane
Feminin
115
Sexul subiectilor
figura alturat, un grafic cu bare, 105
100
Masculin
115
100
Exerciiu:
Reprezentai, folosind un grafic cu bare, valorile variabilei Varsta
subiectilor.
n primul capitol discutam, de asemenea, despre poligonul frecvene-
lor absolute (al valorilor individuale), al frecvenelor relative i al frecvene-
lor cumulate absolute sau relative. Folosind SPSS, vom putea desena poligo-
nul valorilor individuale prin folosirea unui grafic cu linii. Pentru aceasta,
vom accesa, tot meniul Graphs i apoi, submeniul Line. La fel ca n
104
Cristian Opariuc-Dan
105
Statistic aplicat n tiinele socio-umane
Case Number
106
Cristian Opariuc-Dan
opiunea Cum. N, deoarece dorim 100 101 103 104 105 107 108 109 110 111 120 121 124
Coeficient de inteligenta
s reprezentm frecvenele cumulate
Figura 4.13 Poligonul frecvenelor
absolute. Avem de stabilit i variabi- cumulate
la pentru care vom desena poligonul
frecvenelor cumulate absolute, pe care trebuie s o introducem n cmpul
Category Axis:, folosind butonul de transfer din faa acestui cmp. Acum,
107
Statistic aplicat n tiinele socio-umane
108
Cristian Opariuc-Dan
109
Statistic aplicat n tiinele socio-umane
prezentat i pe care le vom mai prezenta fac parte din analiza de date explo-
ratorie, deoarece scopul acesteia este acela de a explora, de a cunoate struc-
tura datelor analizate.
V mai amintii, desigur,
fereastra studiat n capitolul ante-
rior, prin care am calculat indica-
torii tendinei centrale. Iat-o, v-o
reamintesc, iar dumneavoastr va
trebui s gsii comenzile prin
care s ajungei la ea, deoarece
reprezentarea grafic a datelor se
Figura 4.18 Selectarea variabilei ce ur-
meaz s fie reprezentat
poate face i n acest mod. S in-
troducem, la fel ca n capitolul
anterior, variabila Coeficient de inteligen, pentru a extrage indicatorii
tendinei centrale. Sper c v amintii cum se face. Dac nu, v dau un indi-
ciu: folosii butonul Statistics. Iat c, lng acest buton, se afl un alt
buton, butonul Charts pe care vom
apsa. Se deschide o nou fereastr, n
care putem stabili ce grafic s desenm
pentru variabila introdus n analiz.
Opiunea None nu deseneaz niciun
fel de grafic i ignor setrile grafice.
Opiunea Bar charts deseneaz un
grafic cu bare, opiunea Pie charts
deseneaz grafice plcint i, iat, opiu-
nea Histograms: ne permite desena-
rea unei histograme. Aceast opiune o Figura 4.19 Modul de reprezentare
grafic din analiza frecvenelor
ntlnim aici, alturi de caseta de bifare
With normal curve ce permite dese-
narea curbei normale care caracterizeaz datele din variabila noastr. Nu vom
110
Cristian Opariuc-Dan
bifa acum aceast caset, deoarece despre curba normal vom discuta ntr-un
alt capitol. Ne rezumm s alegem doar graficul sub form de histogram.
Anumite grafice pot fi reprezentate sub form de frecvene absolute
(opiunea Frequencies) sau sub form de frecvene relative (opiunea
Percentages), prin selectarea uneia dintre cele dou opiuni din seciunea
Chart Values. Folosind
Histogram aceast fereastr, avem de
configurat mult mai puine
5
Coeficient de inteligenta
apoi butonul OK pentru a
Figura 4.20 Histograma pentru coeficientul lansa analiza.
de inteligen
Dup cteva momen-
te, SPSS va extrage indicatorii tendinei centrale sub forma celor dou tabele
discutate n capitolul anterior, ns ne va oferi i histograma variabilei Coe-
ficient de inteligen, alturi de o serie de date din inventarul statistic de
baz, pe care le vom discuta ntr-un alt capitol.
111
Statistic aplicat n tiinele socio-umane
rile de date de mai sus, ne putem face o imagine intuitiv asupra acestor sco-
ruri extreme. Exist oare o metod mai precis de a le depista? Rspunsul
este pozitiv i vom prezenta n continuare dou tipuri de grafice deosebite,
dar care pot caracteriza mai precis scorurile extreme.
112
Cristian Opariuc-Dan
113
Statistic aplicat n tiinele socio-umane
114
Cristian Opariuc-Dan
Test 1 Test 2
9999999977777777777775555555555555553333333332222222200000 0 11222555
888333330000000 1 2222444455588
3 2 44444455555558888888
3 22333344444455555
4 222334
5
4 6
Datorit uurinei n realizare i a avantajelor pe care le ofer, acest
tip de grafic se utilizeaz tot mai frecvent n tiinele socio-umane.
115
Statistic aplicat n tiinele socio-umane
116
Cristian Opariuc-Dan
117
Statistic aplicat n tiinele socio-umane
2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5,
5, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 10, 10, 10, 10, 10, 10,
10, 13, 13, 13, 13, 13, 18, 18, 18, 23, 64, atunci graficul nostru se va prezenta
ca n figura de mai jos.
70,00
Iat c observm existena a
dou scoruri extreme ns. acestea
77
60,00
30,00
76
nu uitm c acest grafic se bazeaz
20,00
pe poziia unui scor n irul ordonat
10,00 de date. Prin urmare, 77 i 76 nu
0,00 reprezint scorurile propriu- zise, ci
Exemplu poziia acestora n irul ordonat de
Figura 4.23 Graficul box-plot n SPSS. Se obser- date. Deci poziia 77 se refer la
v scorul extrem, al 77-lea element ultimul scor, adic la valoarea 64,
iar poziia 76 la penultimul scor,
adic la valoarea 23. Avem, aadar, dou scoruri extreme n irul nostru de
date i anume scorul 23 i 64. Desigur, n acest caz, indicatorul care exprim
cel mai bine tendina central este mediana. Programul SPSS ofer i o mo-
dalitate de a marca scorurile extreme. Observm c alturi de poziia 77 (co-
respunztoare scorului 64) apare o stelu. Aceast stelu are rol de avertis-
ment, n sensul c valoarea 64 este foarte ndeprtat de limita superioar a
irului de date. De asemenea, alturi de poziia 76 (corespunztoare scorului
23) apare un cercule. Acest cercule ne spune c, dei 23 este i el un scor
extrem, nu este, totui, att de deprtat de limita superioar a irului de date.
118
Cristian Opariuc-Dan
119
Statistic aplicat n tiinele socio-umane
120
Cristian Opariuc-Dan
121
Statistic aplicat n tiinele socio-umane
122
Cristian Opariuc-Dan
Cases
oricare dintre primele dou opiuni am alege-o, obinem acelai efect. Prsi-
rea acestei casete va fi fcut tot prin apsarea butonului Continue. Nu ne
rmne acum dect s apsm butonul OK pentru a lansa procedurile de
analiz. n fereastra de rezultate avem acum mai multe tabele i grafice.
n tabelul Case
Tabel 4.2 Descriptives
Statistici descriptive
St at ist ic St d. Error Processing Summary ne sunt
Varst a subiectilor Mean 29,33 1,008
95% Conf idence
Interv al f or Mean
Lower Bound
Upper Bound
27,27 prezentate numrul de cazuri.
31,40
123
Statistic aplicat n tiinele socio-umane
3,00 2 . 001
,00 2 .
5,00 2 . 44444
3,00 2 . 666
6,00 2 . 899999
4,00 3 . 0111
1,00 3 . 2
3,00 3 . 455
2,00 3 . 77
3,00 3 . 889
Stem width: 10
Each leaf: 1 case(s)
21
Varsta subiectilor
124
Cristian Opariuc-Dan
n concluzie:
Media unei populaii la un parametru poate fi aproximat prin media eantioanelor
extrase din populaie;
Analiza scorurilor extreme se poate face n baza a dou tipuri principale de grafi-
ce: graficul tulpin i frunze i graficul tip cutie;
Prezena scorurilor extreme scade puterea statistic a analizei. Prin urmare, trebu-
ie s efectum analize statistice preliminare asupra setului de date i, eventual, s
procedm la tehnici de transformare a datelor naintea analizei statistice efective.
125
Statistic aplicat n tiinele socio-umane
126
Cristian Opariuc-Dan
zultase o medie de 2,6 frai, cu alte cuvinte doi frai ntregi i unul fr un
picior. Fiind un model statistic, media estimeaz o realitate. S vedem acum
dac aceast medie estimeaz corect sau nu realitatea frailor prietenilor mei.
+1,4
+0,4 +0,4
m=2,6
-0,6
-1,6
127
Statistic aplicat n tiinele socio-umane
scorurile mai mari dect media. Totui, cum putem obine mrimea erorii?
Cum putem estima dac modelul statistic este o imagine suficient de bun
pentru a reprezenta realitatea? Vom vedea imediat. Pentru nceput, s ne con-
centrm asupra unor indicatori elementari ai mprtierii.
n cazul nostru, % = , = %. Acest indicator poart
numele de amplitudine relativ de variaie. n exemplul nostru, avem 10
128
Cristian Opariuc-Dan
valori, iar media acestora este 19,6. Amplitudinea relativ de variaie este, n
cazul nostru, 102%. Amplitudinea relativ de variaie o putem utiliza n con-
diiile n care cunoatem domeniul teoretic ntre limitele cruia se ncadreaz
distribuia. Putem astfel s comparm amplitudinea real de variaie a datelor
cu amplitudinea de variaie teoretic.
Indicatorii amplitudinii de variaie pot fi utilizai atunci cnd cunoa-
tem plaja de variaie normal a unui fenomen, deoarece apariia unor valori
extreme duce la amplitudini de variaie aberante. n exemplul nostru, dac
introducem o singur valoare n plus, 120, atunci minimul rmne 9, iar ma-
ximul devine 120. Amplitudinea de variaie va fi 120 9 = 111, desigur o
valoare suspect pentru irul nostru de date.
Analiznd figura alturat, obser-
vm c cele dou distribuii au aceeai am-
plitudine de variaie. Totui, forma lor dife-
r foarte mult. n timp ce distribuia A
Figura 5.2 Dou distribuii cu
este puternic eterogen, distribuia B este aceeai amplitudine
mult mai omogen.
129
Statistic aplicat n tiinele socio-umane
mici dect al doilea cuartil (Q2 iat c, de fapt, Q2 nu este altceva dect me-
diana), iar trei sferturi din valori (75%) sunt mai mici dect al treilea cuartil
(Q3). Abaterea cuartil nu este altceva dect diferena dintre cuartilul 3
i cuartilul 1.
130
Cristian Opariuc-Dan
de 25% din populaie pot exista cel mult 18,5 valori diferite. Iat c doar 18,5
puncte fac diferena dintre persoanele considerate slabe sau cu scoruri infe-
rioare i persoanele considerate bune, cu scoruri superioare. Observai c
acest indicator este mai precis n comparaie cu amplitudinea. Dac vei in-
clude acum acel scor de 120, vei constata c nu influeneaz deloc valoarea
abaterii cuartile. Abaterea semi-intercuartil va fi, prin urmare,
RSQ=RQ:2=18,5:2=9,25. Acest lucru nseamn c, teoretic, 9,25 valori ar tre-
bui s fie mai mici dect mediana i tot attea valori mai mari dect mediana.
Din grupul oamenilor medii, 9,25 valori i difereniaz pe cei mediu-slabi
i 9,25 valori pe cei mediu-buni.
Similar medianei, cuartilele pot fi calculate folosind i date grupate.
Dac vom considera distribuia statisti-
c din tabelul alturat: Tabelul 5.1 Calculul cuartilelor
Distribuia
Cuartilul inferior (Q1) va fi situ- Clasa f fc
n linii
+1 45 <= 4 || 2 2
at n poziia = = 11,25, iar 59 |||||| 6 8
4 4
quartilul superior (Q3) n poziia 10 14 |||||||| 8 16
15 19 |||||||||||| 12 28
3Q1=3x11,25=33,75. Aadar, primul 20 29 |||||||||| 10 38
cuartil se va afla undeva n intervalul n 30 39 |||| 4 42
care se gsete a 11-a msurtoare iar al >= 40 || 2 44
n=44
treilea cuartil n intervalul n care se
gsete a 33-a msurtoare.
n cazul nostru, Q1 se va gsi n intervalul 10-14, iar Q3 n intervalul
20-29. Sper c v mai aducei aminte formula de calcul a medianei pentru
date grupate.
1
= +
131
Statistic aplicat n tiinele socio-umane
+1
Dac ne reamintim, poziia medianei a fost reprezentat prin n
2
cazul unui ir de date par sau prin pentru irul impar de date. Dar cum me-
2
diana nu era altceva dect Q2, valoarea preciza, de fapt, poziia cuartilului al
doilea. Deci, singura modificare n formul ar fi nlocuirea poziiei medianei
cu poziia cuartilului care ne intereseaz. Formula generalizat devine cea
alturat, unde PQn nseamn poziia cuartilului n (1, 2 sau 3), iar fcQn-1 frec-
vena cumulat a intervalului pre-cuartil de ordin n.
1
= + (formula 5.5)
+1
Am specificat mai sus c poziia lui Q1 este 1 = , poziia lui Q2
4
+1 +1
este 2 = 2 , iar poziia lui Q3 este 3 = 3 . Aplicnd n formu-
4 4
le, obinem valorile corespunztoare cuartilului 1 i cuartilului 3, astfel:
1 11 11,258 3,25
1 = + = 10 + 5 = 10 + 5 = 12,03
8 8
3 31 33,7528 5,75
3 = + = 20 + 10 = 20 + 10 = 25,75
10 10
132
Cristian Opariuc-Dan
iile n care setul de date este unul ordonat. Mediana este valoarea la care se
situeaz 50% din eantion, cuartilele sunt valorile la care se situeaz 25%,
50%, 75% din eantion i aa mai departe. n termeni generali, putem afla
orice valoare la care se situeaz un anumit procent din eantion. Astfel, dac
vom dori s aflm valorile la care se afl procente de 20% din eantion, vom
avea cinci categorii cvintile. Procentele de 33,33% reprezint valorile
trecile i aa mai departe. Generic, valoarea la care se afl un anumit procent
din populaie poart numele de percentil. nelegerea conceptului de
percentile are o importan deosebit n problematica realizrii etaloanelor, a
normelor, prin metoda cuantilrii, metod folosit de obicei ntr-o distribuie
care nu este normal. Despre aceste lucruri vom discuta, ns, atunci cnd
vom aborda sistemele de etalonare.
133
Statistic aplicat n tiinele socio-umane
Dac avem, spre exemplu, urmtoarele 4 msurtori: 25, 23, 21, 27,
atunci, cu aceste valori putem forma un numr de 42 ,adic 16 perechi de di-
ferene dup cum urmeaz:
2525; 2523; 2521; 2527; 2325; 2323; 2321; 2327; 2125;
2123; 2121; 2127; 2725; 2723; 2721; 2727.
Fcnd apoi diferenele, obinem:
0; 2; 4; -2; -2; 0; 2; -4; -4; -2; 0; -6; 2; 4; 6; 0
Analiznd aceste diferene, observm c nu reprezint altceva dect
modul n care se abat valorile unele fa de altele. Fcnd apoi suma acestor
valori, luate fr semn, obinem:
0+2+4+2+2+0+2+4+4+2+0+6+2+4+6+0 = 40
Indicatorul diferenelor medii al lui Gini nu este altceva dect media
diferenelor luate n valori absolute. Aceast sum va fi, aadar, mprit la
numrul de perechi rezultate (16). Obinem, aadar, 40:16 = 2,5, care repre-
zint valoarea acestui indicator. Mai condensat, am putea scrie acest lucru
astfel:
=1 =1
= (formula 5.6)
V.2.2 Oscilaia
Calculul oscilaiei reprezint tot o medie a diferenelor dintre perechi,
ns, de aceast dat, ordinea de efectuare a msurtorilor conteaz. n mod
134
Cristian Opariuc-Dan
135
Statistic aplicat n tiinele socio-umane
136
Cristian Opariuc-Dan
137
Statistic aplicat n tiinele socio-umane
Dac avem urmtoarele date 10, 22, 31, 9, 24, 27, 29, 9, 23, 12, pentru
care media este 19,6, iar numrul de msurtori este 10, avem:
138
Cristian Opariuc-Dan
Exerciiu:
Calculai abaterea median pentru datele discrete i datele grupate,
utiliznd exemplele de mai sus.
V.2.5 Dispersia
Atunci cnd putem utiliza media, un indicator frecvent este indicato-
rul dispersiei sau indicatorul varianei (atenie, nu variaie, ci varian) notat
cu 2 pentru populaie sau s2 n cazul unui eantion. Variana reprezint me-
dia ptratic a diferenelor valorilor individuale fa de media aritmetic i
are o relaie direct cu cel mai important indicator al gradului de mprtiere
a rezultatelor, abaterea standard.
n loc s folosim valorile absolute (n modul) pentru a realiza suma di-
ferenelor, preferm s ridicm la ptrat aceste diferene. tim foarte bine c
139
Statistic aplicat n tiinele socio-umane
140
Cristian Opariuc-Dan
141
Statistic aplicat n tiinele socio-umane
=1 2
2 = (figura 5.14)
1
142
Cristian Opariuc-Dan
2
=1
= = 2 (formula 5.16)
1
143
Statistic aplicat n tiinele socio-umane
144
Cristian Opariuc-Dan
145
Statistic aplicat n tiinele socio-umane
146
Cristian Opariuc-Dan
147
Statistic aplicat n tiinele socio-umane
n concluzie:
Dincolo de tendina central, este necesar s studiem i modul n care rezultatele se
mprtie n jurul tendinei centrale prin calculul indicatorilor dispersiei;
Indicatorii dispersiei pot ine seama doar de anumite date i se numesc indicatori
elementari ai mprtierii sau de toate datele, cazul indicatorilor sintetici;
Indicatorii elementari ai mprtierii sunt:
o Amplitudinea de variaie absolut i relativ;
o Intervalul cuartil i abaterea cuartil;
Indicatorii sintetici ai mprtierii sunt:
o Diferena medie Gini;
o Oscilaia absolut i relativ;
o Abaterea medie;
o Abaterea median;
o Dispersia sau variana;
o Abaterea standard;
o Coeficientul de variaie.
Media i abaterea standard sunt indicatorii pe baza crora se caracterizeaz o dis-
tribuie normal;
Indicatorii dispersiei bazai pe medie pot fi calculai numai dac nivelul de msura-
re al variabilei este cel puin unul de interval i nu exist scoruri extreme n distri-
buie.
148
Cristian Opariuc-Dan
149
Statistic aplicat n tiinele socio-umane
150
Cristian Opariuc-Dan
VI.1 Modalitatea
O distribuie normal este o distribuie unimodal, adic exist doar o
singur categorie cu frecvena maxim. Prezena a dou sau mai multe valori
modale determin distribuii
bimodale, trimodale, n general
polimodale (multimodale), distri-
buii ce nu pot fi considerate ca
fiind distribuii normale.
O distribuie ca aceea din
figura 6.1 este o distribuie norma-
Figura 6.2 Distribuie bimodal l. O distribuie similar distribu-
151
Statistic aplicat n tiinele socio-umane
iei din figura 6.2 este o distribuie bimodal, deoarece observm existena a
dou categorii cu frecvena egal i maxim.
Normalitatea distribuiei, sub aspectul modalitii, se verific prin cal-
cularea valorii mod. Dac exist o singur valoare cu frecvena maxim,
atunci distribuia poate fi considerat normal sub acest aspect. n condiiile
n care sunt dou sau mai multe valori cu frecvena maxim i, evident, egal,
distribuia este polimodal (multimodal) i nu poate fi considerat ca fiind
normal.
VI.2 Simetria
O distribuie este simetric, dac valorile sunt egal (simetric) rspn-
dite n jurul tendinei centrale. Atunci cnd rezultatele tind ctre valori mici,
sunt aglomerate n partea stng a
distribuiei, avem de a face cu o
distribuie asimetric spre dreapta
(sau distribuie skewness pozitiv).
Cnd rezultatele tind ctre valori
mari, se aglomereaz n partea
dreapt a distribuiei, vorbim des-
pre o distribuie asimetric la
stnga (skewness negativ). Iat c
Figura 6.3 Distribuie simetric (B), asimetric
la dreapta (A) i asimetric la stnga (C) asimetria este dat de panta distri-
buiei i nu de vrful acesteia, aa
cum trateaz i consider unii.
n figura 6.3, distribuia B este o distribuie simetric. Distribuia
A este o distribuie asimetric la dreapta (skewness pozitiv), unde predo-
min scorurile sczute, n timp ce distribuia C este o distribuie asimetric
la stnga (skewness negativ), n care predomin scorurile mari.
152
Cristian Opariuc-Dan
153
Statistic aplicat n tiinele socio-umane
154
Cristian Opariuc-Dan
Exerciiu:
155
Statistic aplicat n tiinele socio-umane
156
Cristian Opariuc-Dan
ei indicatorilor tendinei
centrale, c, ntr-o serie de date n care ntlnim scoruri extre-
me mici, media tinde s le pun n valoare. Iat c acest fapt
este ilustrat grafic n figura de mai sus. Observai relaia exis-
tent ntr-o asemenea distribuie: Mo>Me>m. Aceast relaie
este relaia caracteristic a unei distribuii asimetrice negativ.
n baza acestor relaii stabilite ntre medie i median, dar lund n
considerare i abaterea standard, o variant a coeficientului skewness poate fi
157
Statistic aplicat n tiinele socio-umane
3
calculat dup formula: = , unde x barat reprezint media, Me
reprezint mediana, iar abaterea standard. Valorile sale se interpreteaz la
fel ca orice coeficient de asimetrie. Avnd n vedere simplitatea acestei for-
mule, exersarea ei pe unul dintre exemplele de mai sus v-o lsm ca exerci-
iu.
Simetria este al doilea aspect important al unei distribuii normale. O
distribuie normal este o distribuie simetric.
158
Cristian Opariuc-Dan
159
Statistic aplicat n tiinele socio-umane
4 =1 4
2 = = 3 (formula 6.4)
22 4
160
Cristian Opariuc-Dan
medii anuale ntre 7,9 i 8,1. Iat c, doar dou zecimi diferen-
iaz ntre elevii aproape a ntregului efectiv al clasei. Nu
avem nicio problem cu repartizarea celorlali trei elevi. Pe
aceia i vom considera ori foarte buni, ori foarte slabi, n func-
ie de media obinut sub 7,9 sau peste 8,1. Ce ne facem ns
cu cei 27 de subieci? Suntem, iat, n imposibilitatea de a-i ie-
rarhiza n vreun fel. Dac presupunem c cei trei subieci au
note mai mari de 8,1, atunci cine va lua, dintre cei 27 de elevi,
premiul I, cine va lua premiul II i cine va lua premiul III. De-
cizia ar fi, dup cum se poate vedea, extrem de dificil, dac
nu chiar imposibil. Singura variant n acest caz, ar putea fi
creterea preciziei. Nu calculm media cu o singur zecimal,
ci cu 2, 3 sau 4 zecimale. Totui, sunt situaii n care un ase-
menea nivel de precizie este ridicol. O evaluare n care distri-
buia rezultatelor este leptocurtic va fi o evaluare ce nu poate
diferenia ntre subiecii de nivel mediu, iar o curb
leptocurtic nu este o distribuie normal.
O distribuie platicurtic, plat este o distribuie n care rezul-
tatele sunt foarte mprtiate fa de medie i care indic un
grad ridicat de eterogenitate a scorurilor. Problema general a
acestei distribuii, n opoziie cu distribuia leptocurtic, este
aceea c difereniaz greu la extreme i destul de bine n zona
mediei. Va fi greu, utiliznd o asemenea distribuie, s facem
diferenieri ntre elevii slabi i elevii buni, dei putem diferen-
ia relativ uor elevii medii. Datorit acestui fapt, o distribuie
platicurtic nu este nici ea o distribuie normal.
O distribuie normal este o distribuie mezocurtic.
Analiza unei distribuii sub aspectul normalitii este primul pas pe
care-l facem n orice prelucrare de date. Deoarece, n funcie de rezultatul
161
Statistic aplicat n tiinele socio-umane
162
Cristian Opariuc-Dan
163
Statistic aplicat n tiinele socio-umane
164
Cristian Opariuc-Dan
poate fi uor de ndeplinit atunci cnd avem n vedere conceptul de note stan-
dardizate. La baza acestui concept stau notele z. Notele z reprezint
diferena dintre scorul observat i medie, n termeni de abatere stan-
dard. Cu alte cuvinte, notele z nu sunt altceva dect distanele la care se
situeaz scorurile particula-
re n raport cu media grupu-
lui, iar aceast distan este
exprimat standardizat.
Teoretic, notele z
sunt note obinute pe o
curb cu media 0 i abate-
rea standard 1. n acest caz,
o distribuie normal are
practic notele z cuprinse
ntre -3 i +3, ntre aceste
note regsindu-se peste 99%
din populaie, dup cum
observai n figura de al-
Figura 6.9 Diferite sisteme de note standard
turi.
Transformarea note-
lor obinute de ctre un subiect n note z este foarte simpl i se face dup
formula:
= (formula 6.5)
165
Statistic aplicat n tiinele socio-umane
Performana sa la mate-
matic este, prin urmare, o performan medie, situndu-se ntre medie i o
abatere standard la dreapta, deci n zona scorurilor medii.
Spre deosebire de Georgel, Costel are media la matematic de 4,08.
Este oare Costel un elev slab, un elev mediu sau un elev foarte slab? Nota z
a lui Costel este 0,55. i aceast not se situeaz ntre medie i o abatere
standard la stnga de aceast dat. Iat c, n ciuda aparenelor, raportat la
166
Cristian Opariuc-Dan
performana elevilor din clas, dei are media sub cinci, Costel este un elev
mediu la aceast disciplin.
Cred c intuii deja ce se ntmpl. n domeniul socio-uman, noi nu
putem niciodat s msurm ceva cu exactitate. Putem doar s comparm
rezultatul unui subiect cu rezultatul unui grup de referin. Comparaia aceas-
ta se poate realiza numai dac cunoatem media i abaterea standard a grupu-
lui de referin, n cazul n care, distribuia caracteristicii msurate n cadrul
grupului de referin este o distribuie normal.
Pentru a v clarifica mai bine acest concept, s lum un nou exemplu.
Avem un test de inteligen cu 20 de probleme. Dac subiectul rezolv corect
o problem, primete un punct. Dac nu o rezolv corect, primete zero punc-
te. Deci, scorul unui subiect poate varia de la zero puncte, atunci cnd nu
rezolv corect nici o problem, i pn la 20 de puncte, atunci cnd le rezolv
corect pe toate.
Avem dou persoane: Vasile, obine un scor la acest test de 10 puncte,
iar Viorel, un scor de 12 puncte. ntrebare: putei spune care dintre cei doi
subieci este mai bun? Care are un nivel intelectual mai ridicat?
Cei mai muli dintre dumneavoastr vor zmbi acum complice i mi
vor spune: Evident c Viorel, deoarece a rezolvat mai multe probleme.
Poate avei dreptate. ns, iat c v mai dau un amnunt. Vasile este cioban,
iar ciobanii rezolv corect, n medie, 7 probleme. Lucrurile se schimb acum.
Vasile poate obine linitit funcia de baci, deoarece nivelul su intelectual
este mai ridicat n comparaie cu nivelul ciobanilor. Viorel este profesor, iar
profesorii rezolv corect, n medie, 18 probleme. Fa de grupul profesorilor,
Viorel este cioban.
Dei exagerat, scopul acestui exemplu este acela de a v convinge c
notele brute, scorurile, nu ne spun nimic prin ele nsele. Notele brute dobn-
desc semnificaie numai n urma comparrii cu o populaie de referin. Pu-
167
Statistic aplicat n tiinele socio-umane
tem afirma despre cineva c este bun sau slab numai n raport cu un reper, cu
un grup de referin. Probabil c eu sunt bun la statistic n comparaie cu
studenii crora le predau aceast disciplin i slab n raport cu unii profesori
de ai mei sau cu Spearman ori Pearson. Termenul de bun sau slab dobndete
semnificaie numai raportat la un reper.
Toate aceste informaii servesc drept suport procesului de etalonare.
Un etalon nu este altceva dect un sistem de norme, la care se raporteaz per-
formana unui individ, la o anumit sarcin. Evident, un etalon este fcut pe o
anumit populaie, iar raportnd un rezultat al unui subiect la un etalon, nu
facem altceva dect s comparm performanele acelui subiect cu performan-
ele grupului pe care a fost construit etalonul. Despre etaloane vom discuta
ns imediat.
Notele z au i ele o serie de proprieti cu aplicabilitate practic de-
osebit, dintre care menionm (Popa, 2006):
Media unei distribuii z este egal cu zero, afirmaie care
rezult din proprietatea acestui indicator de a se diminua
atunci cnd scdem o constant din fiecare scor particular.
Deoarece din formul rezult aceast diferen (se scade fieca-
re scor particular din medie), n final media va ajunge la valoa-
rea zero.
Abaterea standard a unei distribuii z este ntotdeauna 1. i
aceast afirmaie rezult din proprietile abaterii standard.
tim c, dac mprim abaterea standard la o constant, va-
loarea acesteia se divide corespunztor. Din formul, obser-
vm c acea constant la care mprim este chiar abaterea
standard, iar mprirea a dou numere egale are ca rezultat 1.
Notele z sunt note direct calculabile, utilizndu-se media i abaterea
standard i reprezint temelia oricrui proces de standardizare. Totui,
168
Cristian Opariuc-Dan
169
Statistic aplicat n tiinele socio-umane
Aadar, scorul sten al lui Georgel este de 5,5+0,22, adic 5,72. Obser-
vm c poziia acestui scor nu modific punctul n care se afl Georgel pe
distribuia normal, ns scorul devine mult mai intuitiv. Media 5,75 la ma-
tematic ne spune mult mai multe dect 0,22. Scorul n stanine al lui Georgel
se calculeaz similar. Pe o scal de la 1 la 9, media este evident 5. Prin urma-
re, deplasm scala cu 5 de aceast dat i obinem 5 + 0,22 = 5,22. Obinem,
de fapt, exact acelai lucru, ns pe o scal de la 1 la 9 i nu de la 1 la 10 ca n
exemplul anterior.
Pentru notele T, avem de a face att cu o deplasare, ct i cu o ex-
tindere a intervalelor. Afirmam c scala T este o scal cu media 50 i aba-
terea standard 10, iar n acest caz, formula de calcul a notelor T va deveni:
= 50 + 10 = 50 + 10. (formula 6.7)
n cazul nostru, rezultatul devine 100 + 15x0,22, adic 100 + 3,3, ceea
ce nseamn 103,3. Remarcm c, nici n acest caz, nu se modific poziia
subiectului pe curba de distribuie.
Iat ct de uor putem raporta att performanele subiectului la per-
formanele grupului din care acesta face parte, ct i care sunt semnificaiile
acestei raportri, indiferent de sistemul de scale standard utilizat. Calculul
notelor standardizate derivate ale lui Costel vi-l lsm dumneavoastr ca
exerciiu.
170
Cristian Opariuc-Dan
171
Statistic aplicat n tiinele socio-umane
172
Cristian Opariuc-Dan
173
Statistic aplicat n tiinele socio-umane
Cele dou figuri de mai sus indic o asimetrie pozitiv, respectiv ne-
gativ moderat. n primul caz, extragerea rdcinii ptrate din fiecare scor
individual va conduce la normalizarea acestei distribuii. n al doilea caz,
radicalul se extrage din reflexia scorurilor. Prin operaia de reflectare, trans-
formm o asimetrie negativ ntr-o asimetrie pozitiv, dup care putem ex-
trage rdcina ptrat.
Operaia de reflectare este una extrem de uoar i presupune practic
inversarea valorilor. Dac, de exemplu, avem urmtorul ir de date:
primul pas pe care trebuie s l facem este acela de a identifica valoarea ma-
xim din irul de date. n cazul nostru, valoarea cea mai mare din ir este 19.
Adugm apoi 1 la valoarea maxim i obinem valoarea 20.
La al doilea pas, vom scdea din valoarea obinut (20) fiecare scor i
vom obine irul reflectat. Constatm c aceast operaiune este similar unei
reflexii n oglind, n care stnga devine dreapta i dreapta stnga. Procedura
este necesar n cazul distribuiilor asimetric negative n vederea extragerii
radicalului, n vederea logaritmrii sau pentru inversare.
174
Cristian Opariuc-Dan
175
Statistic aplicat n tiinele socio-umane
176
Cristian Opariuc-Dan
177
Statistic aplicat n tiinele socio-umane
178
Cristian Opariuc-Dan
179
Statistic aplicat n tiinele socio-umane
180
Cristian Opariuc-Dan
181
Statistic aplicat n tiinele socio-umane
182
Cristian Opariuc-Dan
Dac ai fost ateni, ai observat deja o serie de limitri ale acestui eta-
lon. n primul rnd, intervalele inegale. Dac, teoretic, nlimea minim a
unui om poate fi, s spunem, 150 de centimetri, iar nlimea maxim 220 de
centimetri, atunci remarcm numrul diferit de valori din fiecare clas. n
prima clas, putem include subiecii de la 150 de centimetri pn la 173 de
centimetri, deci 23 de valori diferite. n a doua clas, includem subiecii cu
nlimea cuprins ntre 173 i 175, deci doar 3 valori. n clasa a treia, gsim
5 valori posibile, n clasa a patra, 7 valori, iar n ultima clas, 33 de valori.
Iat c un asemenea etalon difereniaz inegal subiecii, aceasta fiind i prin-
cipala sa limit.
n al doilea rnd, dac avem o distribuie foarte omogen, nu mai pu-
tem diferenia aproape deloc utiliznd un asemenea etalon, deoarece interva-
lele de clase vor avea valori apropiate. Iat doar dou motive pentru care pre-
ferm utilizarea claselor normalizate, deoarece, la nivelul acestora, intervalele
sunt aparent egale.
Exerciiu:
Realizai, folosind acelai sistem de etalonare, un etalon n decile (10
clase) i precizai problemele ntmpinate. Explicai situaia aprut.
183
Statistic aplicat n tiinele socio-umane
184
Cristian Opariuc-Dan
doua clase. Prin urmare, 29,33 5,52 = 23,81 ani, rotunjit 24 de ani. A doua
clas va include subiecii cu vrsta cuprins ntre 19 i 24 de ani, subiecii
tineri. Clasa a treia, clasa medie, cuprinde 2x34,13% din populaie, adic
68,26% din populaie i are ca limite o abatere standard n stnga mediei i o
abatere standard n dreapta mediei. Prin urmare, a treia clas va avea ca limite
de interval 25 de ani i 29,33 + 5,52 = 34,85, rotunjit 35 de ani. Clasa a patra,
care cuprinde 13,59% din populaie, are ca limit inferioar 36 de ani i ca
limit superioar dou abateri standard n dreapta mediei, 29,33 + 11,04, adi-
c 40,37, rotunjit 40 de ani. Constatm c deja am ieit din amplitudinea dis-
tribuiei noastre, ceea ce ne face s suspectm o uoar asimetrie. n realitate,
numrul redus de subieci a determinat aceast situaie. n sfrit, clasa a
cincia cuprinde subiecii peste 40 de ani i conine 2,14% din populaie.
Etalonul poate fi scris n acelai Tabel 6.5 Etalon n 5 clase
mod ca i etalonul n cvintile i are aceeai Scoruri Clasa Semnificaia
< 19 I Foarte tineri
semnificaie. Evident c la distribuia
19 24 II Tineri
acestui etalon va trebui s furnizm date 25 35 III Medie
legate de structura eantionului normativ, 36 40 IV Maturi
> 40 V Foarte maturi
distribuia variabilei i sistemul de etalo-
nare folosit, n cazul nostru n cinci clase n uniti sigma.
Exerciiu:
Realizai un etalon n trei clase normalizate n uniti sigma. Pentru
trei clase normalizate se folosete o abatere standard n dreapta i n stnga
mediei.
Etaloanele n clase normalizate nu sunt altceva dect derivaii ale
etaloanelor n uniti sigma i se bazeaz pe transformarea notelor z n alte
categorii de note. Algoritmul de calcul este oarecum similar celui utilizat n
realizarea etaloanelor n uniti sigma i se bazeaz pe fraciuni de uniti
sigma.
185
Statistic aplicat n tiinele socio-umane
186
Cristian Opariuc-Dan
187
Statistic aplicat n tiinele socio-umane
188
Cristian Opariuc-Dan
189
Statistic aplicat n tiinele socio-umane
190
Cristian Opariuc-Dan
arat frumos.
n figura 6.16, am ales modul de reprezentare al unui grafic cu bare,
iar n figura 6.17, am optat pentru reprezentarea prin histogram. Vom anali-
za ulterior ambele tipuri de grafice i vom nva cteva metode de cosmeti-
191
Statistic aplicat n tiinele socio-umane
192
Cristian Opariuc-Dan
Cumulativ e
buiei sub aspectul modalitii i
Valid 20
Frequency
2
Percent
6,7
Valid Percent
6,7
Percent
6,7
a vedea toate valorile mod, vom
21
24
1
5
3,3
16,7
3,3
16,7
10,0
26,7
cuta n distribuia statistic (al
26 3 10,0 10,0 36,7
28 1 3,3 3,3 40,0
doilea tabel din fereastra de re-
29
30
5
1
16,7
3,3
16,7
3,3
56,7
60,0
zultate) valoarea 24. n cazul
31
32
3
1
10,0
3,3
10,0
3,3
70,0
73,3
nostru, observm c valoarea 24
34
35
1
2
3,3
6,7
3,3
6,7
76,7
83,3
se regsete n cinci cazuri (co-
37
38
2
2
6,7
6,7
6,7
6,7
90,0
96,7
loana Frequency). Nu trebuie
39
Total
1
30
3,3
100,0
3,3
100,0
100,0 acum dect s vedem ce valori,
mai mari de 24, au aceeai frec-
ven. Observm c valoarea 29 de ani are aceeai frecven i c nu exist o
alt valoare cu aceast frecven maxim. Aadar, distribuia vrstei subieci-
lor este o distribuie bimodal, cu modul de 24 i 29 de ani. Strict vorbind, o
distribuie multimodal nu este o distribuie normal. Analiza noastr ar tre-
bui s se opreasc aici i s folosim tehnici de eliminare a acestei anomalii (n
cazul nostru, renunnd la un subiect care are vrsta de 24 sau 29 de ani).
Totui, distribuia scorurilor subiecilor la variabila coeficient de inte-
ligen este o distribuie unimodal. n acest caz, vom trece la urmtoarea
etap i anume analiza simetriei.
Simetria sau oblicitatea este dat de valoarea indicatorului
Skewness. La modul teoretic, acest indicator are valoarea zero pentru o dis-
193
Statistic aplicat n tiinele socio-umane
194
Cristian Opariuc-Dan
195
Statistic aplicat n tiinele socio-umane
196
Cristian Opariuc-Dan
intr ntr-al doilea interval (cu precizie mai mic) ns nu i n primul interval
(de mare precizie). Deci, n situaia n care eterogenitatea sau omogenitatea
scorurilor n jurul mediei este un element important, vom considera distribu-
ia noastr ca fiind o distribuie platicurtic, deoarece nu intr n intervalul cu
precizie mare. n situaia n care excesul nu este un element att de important,
putem considera distribuia ca fiind mezocurtic.
Oricum, n tiinele sociale nivelul de precizie acceptat este de peste
95%, astfel nct distribuia noastr poate fi considerat o distribuie
mezocurtic.
Valorile coeficientului de boltire Kurtosis negative i care ies din in-
tervalul de ncredere sunt reprezentative pentru o distribuie platicurtic. Da-
c avem de a face cu valori pozitive care ies din intervalul de ncredere, dis-
tribuia este leptocurtic.
Demonstrnd faptul c distribuia scorurilor celor 30 de subieci la va-
riabila coeficient de inteligen este o distribuie unimodal, simetric i
mezocurtic am demonstrat de fapt c distribuia respect toate caracteristici-
le unei distribuii gaussiene i poate fi considerat o distribuie normal.
Analiza distribuiei trebuie s precead orice analiz ulterioar
de date, deoarece, n funcie de normalitatea distribuiei, pot fi alese sta-
tisticile parametrice sau nonparametrice utilizabile pe parcursul demer-
sului de cercetare, dup asumpiile teoretice ale fiecrei metode n parte.
Pentru a concluziona, v voi oferi un model complet de analiz a dis-
tribuiei scorurilor n funcie de variabila coeficient de inteligen. ntotdeau-
na furnizai, n analiz, ct mai multe informaii legate de variabila dumnea-
voastr. V rog s avei n vedere ataarea exact a inventarului statistic de
baz din SPSS i a eventualelor grafice care v pot susine demonstraia.
ntr-o analiz de date, va trebui s precizai: denumirea variabilei ana-
lizate, numrul de cazuri, indicatorii tendinei centrale i ai mprtierii, indi-
197
Statistic aplicat n tiinele socio-umane
198
Cristian Opariuc-Dan
199
Statistic aplicat n tiinele socio-umane
lea buton este butonul pivot, care permite schimbarea rndurilor i a co-
loanelor n tabel.
dul de editare.
Figura 6.21 Inventarul statistic dup editare
n final, tabelul dumneavoastr
trebuie s arate la fel ca cel din figura de mai sus.
Iat modalitatea prin care putei traduce, dac dorii, orice element al
formularului de rezultate ntr-o alt limb.
Din nefericire, la fel cum pot fi traduse cuvintele, pot fi modificate i
cifrele, ceea ce v poate determina uneori s schimbai datele oferite de SPSS
cu alte date mai convenabile vou. Nu uitai c, n general, trebuie s punei
la dispoziie i baza de date n momentul n care publicai un studiu i de cele
mai multe ori analizele sunt refcute de comisia de publicare a articolului.
Tot folosind modul de editare, putei ajusta limea coloanelor pentru
ca tabelul dumneavoastr s prezinte un aspect elegant.
Deplasai cursorul mausului deasupra unei linii, ca n figura alturat,
pn cnd se transform ntr-o sgeat orizontal. Apoi inei apsat butonul
din stnga al mausului i tragei micnd mausul la dreapta sau la stnga,
201
Statistic aplicat n tiinele socio-umane
202
Cristian Opariuc-Dan
tives
Figura 6.23 Meniul
statistici descriptive Cunoatei deja fereastra care se deschide, de-
oarece am analizat-o pe parcursul acestei lucrri, drept pentru care nu vom
insista dect asupra unui singur element. Este
vorba despre caseta de bifare Save standar-
dized values as variables. Rolul acestei casete,
pe care o vom bifa, este acela de a crea o nou
variabil care va stoca scorurile z ale fiecrui Figura 6.24 Fereastra de
caz din baza de date. Evident, va fi lansat fe- configurare a analizei
reastra de afiare a rezultatelor care conine un
203
Statistic aplicat n tiinele socio-umane
tabel pe care l-am discutat deja. Totui, unde sunt notele z att de cutate
de noi?
S ne amintim ce am bifat. Am bifat o op-
iune, dup ce am introdus variabila Coeficient
de inteligen n lista variabilelor ce trebuie ana-
lizate, prin care notele standardizate vor fi salvate
ca variabile. Trebuie, deci, s ne ntoarcem la baza
de date, unde vom regsi o nou variabil creat
automat. Este vorba despre variabila Ziq, ultima
din baza de date, care nu conine altceva dect
notele z ale fiecrui subiect.
Figura 6.25 Noua variabil Observm c primul subiect se afl la
ce conine scorurile z
1,33 abateri standard n stnga mediei, adic n
zona rezultatelor medii, al doilea la 1,01 abateri standard n dreapta mediei,
tot n zona scorurilor medii i aa mai departe.
Cum facem totui pentru a obine note standardi-
zate rezultate din notele z, scoruri sten spre exemplu.
V mai amintii probabil c scorurile sten se obin adu-
Figura 6.26 Meniul de nnd valoarea 5,5 la valoarea notei z. Dac avem
transformare SPSS notele z, restul este simplu. Cum facem ns acest
lucru n SPSS?
Vom folosi serviciile unui alt meniu, i anume meniul Transform, de
unde vom selecta opiunea Compute sau Compute variable, n funcie de
versiunea SPSS pe care o posedai.
Rezultatul acestei aciuni se concretizeaz
ntr-o fereastr similar celei alturate, care conine
urmtoarele elemente:
Target variable reprezint seciunea n care
Figura 6.27 Fereastra
de calcul a variabilelor
204
Cristian Opariuc-Dan
vom introduce numele variabilei destinaie, variabil n care se vor salva noi-
le rezultate. n cazul nostru, suntem interesai s calculm scorurile sten pen-
tru variabila iq i vom introduce un nume, ca spre exemplu StenIQ.
Sub aceast caset de text se afl un buton inti-
tulat Type & Label, pe care, dac apsm, vom pu-
tea configura proprietile noii variabile create.
Astfel, avem posibilitatea s adugm o etiche-
Figura 6.28 Proprie-
ti ale variabilei
t variabilei nou create, folosind cele dou opiuni din
seciunea Label. Putem decide dac introducem un
text ca etichet (ca n cazul figurii alturate) ori vom folosi drept etichet
formula de calcul, situaie n care va trebui s alegem opiunea Use expres-
sion as label. Seciunea Type permite alegerea tipului de variabil. Putem
decide ntre un tip numeric implicit i un ir de caractere, caz n care va trebui
s includem i dimensiunea acestui ir, numrul de caractere pe care l permi-
te variabila.
Sub butonul Type & Label se afl binecunoscuta list a variabilelor
din baza de date. n partea dreapt, apare caseta de text Numeric Expres-
sion, cu ajutorul creia putem scrie formula de calcul prin care va fi obinut
noua variabil. n acest sens, putem utiliza calculatorul de sub caset sau
putem tasta pur i simplu valorile sau formula n caseta de text. Pentru a v
uura accesul la formule, SPSS v pune la dispoziie dou liste: lista Func-
tion group care conine funciile sistemului grupate pe categorii i lista
Functions and Special Variables care se refer la funciile din categoria
selectat anterior. Dac, de exemplu, n prima list, efectum clic pe elemen-
tul Arithmetic, atunci, n cea de-a doua list, vor fi afiate funciile referitoa-
re la operaiile aritmetice uzuale.
Butonul If permite efectuarea condiional a calculelor, adic cal-
cularea doar a datelor care ndeplinesc o condiie.
205
Statistic aplicat n tiinele socio-umane
206
Cristian Opariuc-Dan
n concluzie:
Media i abaterea standard caracterizeaz pe deplin o distribuie i, de aceea,
aceti doi indicatori poart numele de parametri ai repartiiei normale;
O distribuie normal trebuie s ndeplineasc simultan urmtoarele trei condiii:
o S fie unimodal;
o S fie simetric;
o S fie mezocurtic;
Unimodalitatea reprezint existena unei singure categorii cu frecvena absolut
maxim i se analizeaz prin inspectarea valorii modale;
O distribuie normal este o distribuie unimodal;
Simetria reprezint echilibrarea distribuiei pe axa orizontal i se poate calcula
prin:
o Coeficientul Yule;
o Coeficientul Fisher;
o Relaia dintre medie, median i abaterea standard;
Referitor la simetrie, exist un sistem de relaii ntre indicatorii tendinei centrale
(medie, median i mod), distribuiile putnd fi simetrice, asimetrice la stnga i
asimetrice la dreapta.
O distribuie normal este o distribuie simetric
Boltirea reprezint o asimetrie vertical a distribuiei i se poate calcula prin:
o Coeficientul de boltire Pearson;
O distribuie normal este o distribuie mezocurtic;
ntr-o distribuie normal, exist un numr de ase abateri standard; trei la stnga
mediei i trei la dreapta mediei;
n funcie de abaterile standard, o distribuie normal prezint patru zone: zona
scorurilor normale, zona scorurilor accentuate, zona scorurilor atipice i zona sco-
rurilor aberante;
Notele z reprezint distana dintre un scor particular i medie, exprimat n ter-
meni de abateri standard;
207
Statistic aplicat n tiinele socio-umane
208
Cristian Opariuc-Dan
209
Statistic aplicat n tiinele socio-umane
adic, exprimat n termeni cifrici, =0,5. Dac avem un zar, care este proba-
bilitatea s dm un ase? De data aceasta cte posibiliti sunt? Poate s cad
1, 2, 3, 4, 5 sau 6, deci avem 6 posibiliti. Dac dm cu zarul, exist o singu-
r ans raportat la 6 anse de a nimeri, dintr-o singur ncercare, zarul cu
ase. Exprimat din nou cifric, avem o probabilitate de 1/6=0,166 s scpm de
mar. Dac ns, pentru a scpa de mar, ne trebuie un 6 sau un 4, care este
probabilitatea de a iei cu fa curat? De data aceasta, exist dou alternative
raportate la un total de ase, prin urmare 2/6=0,33.
Nu cred c toate aceste lucruri sunt elemente noi. n general, atunci
cnd vorbim de probabiliti, acestea se exprim sub form cifric, cu valori
de la 0 la 1, n care 0 reprezint probabilitatea nul, niciodat evenimentul nu
se va ntmpla, iar 1 reprezint probabilitatea maxim, evenimentul se ntm-
pl ntotdeauna. De foarte multe ori, este mai intuitiv s reprezentm procen-
tual probabilitile prin nmulirea probabilitii cu 100. Astfel, exist 50%
anse s cad stema la aruncarea unei monede (0,5x100) sau 16,6% anse s
scap de mar, dac nimeresc un ase i 33% dac nimeresc un ase sau un
patru. Muli prefer aceast exprimare, deoarece suntem obinuii s gndim
sub form de pri ale unui ntreg. n definitiv, fie c folosim exprimarea
0,33, fie c avem n vedere o form procentual, 33%, de fapt spunem ace-
lai lucru.
Toate aceste exemple reprezint cazuri de probabilitate necondiio-
nat, deoarece nu exist niciun factor, niciun element care s influeneze
desfurarea lor. Dac nu exist vreun magnet n zar sau vreun grunte de
plumb care s influeneze obinerea lui ase, atunci suntem n faa unui caz de
probabilitate necondiionat.
Probabil c la ora actual exist o sut de cri de statistic care tra-
teaz problemele pe care le-am expus aici, unele n mod cert mai complete i
mai academic scrise. Care ar fi, aadar, probabilitatea ca dumneavoastr s
citii acum cartea scris de mine? Este simplu de calculat 1/100=0,01 sau, ex-
210
Cristian Opariuc-Dan
primat procentual, 1%. Cam mici anse, nu-i aa? n mod sigur, nu cred c-
am s m mbogesc din vnzarea acestei cri Care ar fi probabilitatea ca
prietenul sau prietena dumneavoastr s citeasc aceast carte? Tot 1% dac
nu i-o recomandai dumneavoastr. Dac i-o recomandai, probabilitatea va
crete n funcie de numrul de recomandri efectuate i, iat cum, cu ajutorul
dumneavoastr, mi voi lua o vil pe plaj. Acest exemplu, n care probabili-
tatea de apariie a unui eveniment este influenat de prezena sau absena
unui alt eveniment, se numete probabilitate condiionat. Exist aadar
alte aspecte care influeneaz probabilitatea de apariie a unui eveniment.
Probabilitatea de a muri de cancer la plmni n urma fumatului este foarte
mare, n condiiile n care nu cunosc faptul c fumatul mi poate declana un
cancer. Dac tiu acest lucru, crete probabilitatea s reduc igrile i chiar s
abandonez fumatul, ceea ce va determina i reducerea probabilitii de a
muri. n prima situaie, ne aflm n faa unui exemplu de probabilitate necon-
diionat. n al doilea caz, avem de a face cu o probabilitate condiionat.
De ce, totui, am abordat aceste probleme pe care le tii att de bine?
Nu am fcut-o ca s va jignesc inteligena, ci pentru a ne asigura c avem
bazele nelegerii importanei probabilitilor n statistica social.
nelegerea acestor aspecte asigur, mai apoi, nelegerea conceptelor
de inferen statistic, de relaii ntre variabile, praguri de semnificaie i
semnificaie statistic.
Dup cum am afirmat, scopul unei cercetri este acela ca, pornind de
la rezultatele obinute la nivelul unui eantion de populaie, s tragem conclu-
zii valabile pentru o ntreag populaie. Dac voi studia cantitatea de bere
consumat de studenii de la psihologie i voi face afirmaia c n general
studenii de la psihologie consum mai mult bere n comparaie cu ceilali
studeni, la ce nivel de precizie m voi situa? Care este probabilitatea ca
afirmaia mea s fie exact? Pentru a calcula aceast probabilitate, avem ne-
voie s nelegem foarte clar ce nseamn probabilitate de apariie a unui eve-
211
Statistic aplicat n tiinele socio-umane
212
Cristian Opariuc-Dan
213
Statistic aplicat n tiinele socio-umane
() 1 1
de aritmetic de baz i vom spune c ansa de succes este =89=
() 9 9
9 1
= 8. Nu am folosit dect cunotine elementare de aritmetic. Demonstraia
8
formulei a doua este evident, deoarece probabilitatea de eec va fi 1 pro-
babilitatea de succes. Dac nlocuii i efectuai calculele, rezultatul va fi ace-
lai: o ans s ctig doi lei i opt anse s pierd 50 de bani.
De ce folosim totui termenul de ans de succes i nu cel de probabi-
liti de succes i de eec. Foarte simplu. Pentru a sintetiza ntr-o singur ex-
primare att succesul, ct i eecul. O ans s ctig doi lei i opt anse s
pierd 50 de bani se prezint mai concis i mai elegant n comparaie cu o
probabilitate de unu pe nou s ctig doi lei i o probabilitate de opt pe nou
s pierd 50 de bani. Desigur, sunt i alte motive pe care le vom discuta la
momentul potrivit.
214
Cristian Opariuc-Dan
Zar 1: 1 2 3 4 5 6
Zar 2: 6 5 4 3 2 1
Total: 7 7 7 7 7 7
n acest caz, funcioneaz o alt regul, derivat din regula probabili-
tilor simple a evenimentelor egale, numit regula aditiv pentru eveni-
mente mutual exclusive. Nu v speriai, c nu este cine tie ce demonstraie
matematic complex. Care este numrul total de rezultate al celor dou eve-
nimente? Primul zar are un total de ase rezultate, iar al doilea zar un numr
total de ase rezultate. Numrul total al rezultatelor celor dou evenimente
este de 6x6=36 de rezultate. Care este numrul de rezultate de succes, adic
numrul de rezultate care, prin nsumare, duc la cifra apte? Numrai rezul-
tatele din tabelul de mai sus. Sunt ase rezultate. Nu avem acum dect s n-
locuim n formula de mai sus pentru a calcula probabilitatea de succes
6 1
() = = 36 = 6 = 0,16. Cunoscnd probabilitatea de succes, este uor s
calculm ansa de succes. Aplicai doar formula specificat n capitolul ante-
rior i vei afla ansa de succes. Nu mi se pare deloc complicat. M vei n-
treba acum de ce vorbesc de o alt regul, cnd ,de fapt, este exact prima re-
gul studiat. Pentru c aceast regul spune c probabilitatea de succes a
unui numr de k evenimente mutual exclusive reprezint suma probabiliti-
lor de succes a fiecrui eveniment. Dac avem k evenimente (n cazul nostru
k are valoarea ase, deoarece sunt ase evenimente), atunci probabilitatea de
succes va fi P(s)=P(e1) + P(e2) + P(e3) + . P(ek)
Acest lucru se verific i n cazul nostru, dac ar fi s scriem formula
desfurat:
1 1 1 1 1 1 6 1
() = + + + + + = =
36 36 36 36 36 36 36 6
Iat c v-am lmurit i motivul pentru care aceast regul se numete
regula aditiv pentru evenimentele mutual exclusive.
215
Statistic aplicat n tiinele socio-umane
216
Cristian Opariuc-Dan
217
Statistic aplicat n tiinele socio-umane
extrage oricare dintre cele 52 de cri din pachet. Deci totalitatea rezultatelor
este de 52. Totui, dintre aceste 52 de cri, doar 8 cri sunt speciale i negre.
Prin urmare, probabilitatea de a extrage o carte special i de culoare neagr
8 2
este de = 52 = 13 = 0,15. Dac n cazul evenimentelor mutual exclusive
am avut o regul aditiv, n acest caz, ne confruntm cu o regul multiplica-
tiv a evenimentelor independente. Conform acestei reguli, probabilitatea
de succes a unui numr de k evenimente independente reprezint produsul
probabilitilor de succes ale fiecrui eveniment. Dac avem k evenimente (n
cazul nostru k are valoarea doi, deoarece primul eveniment se refer la extra-
gerea unei cri de culoare neagr i al doilea eveniment - la extragerea unei
cri speciale), atunci probabilitatea de succes va fi P(s)=P(e1) x P(e2) x P(e3) x
26 16 1 4 4 2
. P(ek). n situaia de fa, = = = = = =
52 52 2 13 26 13
0,15. Am obinut, dup cum ai constatat, exact acelai rezultat.
218
Cristian Opariuc-Dan
rezultat.
219
Statistic aplicat n tiinele socio-umane
220
Cristian Opariuc-Dan
221
Statistic aplicat n tiinele socio-umane
222
Cristian Opariuc-Dan
223
Statistic aplicat n tiinele socio-umane
ns, dac am face media acestor eantioane, ne-am apropia cel mai bine de
valoarea exact a acestui parametru.
Dar, dup cum am
spus, media eantioanelor are
proprietatea de a se distribui
normal. Folosind acest ele-
ment i proprietile distribu-
iei normale, putem calcula ?
224
Cristian Opariuc-Dan
225
Statistic aplicat n tiinele socio-umane
bun aproximare a erorii standard a mediei este dat de raportul dintre abate-
rea standard a rezultatelor obinute de ctre subiecii din eantion i rdcina
ptrat din volumul eantionului.
Aadar, eroarea standard a mediei poate fi calculat prin intermediul
formulei:
= (formula 7.1)
226
Cristian Opariuc-Dan
227
Statistic aplicat n tiinele socio-umane
6. Formularea concluziilor.
Dei nu intenionez abordarea n detaliu a tuturor etapelor, a dori s
menionez faptul c, n principal, metoda statistic intervine n etapa a cincia,
etapa interpretrii datelor. Deoarece o interpretare a datelor presupune, ns,
i o colectare corect a lor, cunotine de statistic sunt necesare att n etapa
a doua formularea ipotezelor , ct i n etapa proiectrii experimentului
sau n aceea a sondajului. Numai n acest mod ne putem asigura de prezena
unui set valid de date, care va face posibil interpretarea acestora i transferul
ctre etapa a asea etapa formulrii concluziilor. Iat motivul pentru care
fiecare dintre aceste ase etape vor fi analizate separat.
228
Cristian Opariuc-Dan
229
Statistic aplicat n tiinele socio-umane
230
Cristian Opariuc-Dan
231
Statistic aplicat n tiinele socio-umane
232
Cristian Opariuc-Dan
233
Statistic aplicat n tiinele socio-umane
unui eantion. Chiar dac observm o relaie ntre cele dou variabile, ntot-
deauna exist o probabilitate mai mare sau mai mic ca rezultatul s fie
obinut pe baza unei erori de eantionare. Ipoteza nul ne indic, de fapt, pro-
babilitatea de a obine aceste date n condiiile n care ar fi adevrat, adic n
condiiile n care datele se obin n urma unei erori de eantionare. Practic, n
momentul n care calculm relaia dintre cele dou variabile, calculm proba-
bilitatea de obinere a acestei relaii ca rezultat al unei erori de eantionare.
Oricnd exist posibilitatea ca relaia constatat la nivelul eantionului s nu
se regseasc ntr-adevr la nivelul populaiei, deoarece datele colectate la
nivelul eantionului sunt rezultate n urma unei erori de eantionare.
n exemplul nostru, s presupunem c gsim o relaie ntre anxietate i
depresie, n sensul c persoanele anxioase prezint i simptome depresive.
Am lucrat, totui, pe un eantion i nu cu ntreaga populaie. nainte de a face
aceast afirmaie valabil pentru ntreaga populaie, ne putem pune problema
care ar fi probabilitatea ca relaia pe care am descoperit-o s nu existe de fapt
(ipoteza nul), adic relaia s fie rezultatul unor erori de eantionare este,
evident, o probabilitate condiionat. Dac aceast probabilitate este suficient
de mic, s spunem 5%, atunci putem concluziona c relaia descoperit nu
este rodul unor erori de eantionare, ci o putem regsi la nivelul populaiei.
Acest procent de 5% nu nseamn altceva dect c, la doar 5 subieci dintr-o
sut de subieci, relaia s-ar putea s nu se verifice. n acest caz, probabilita-
tea ca ipoteza nul s fie adevrat este foarte mic i o putem respinge. Res-
pingnd ipoteza nul, putem sprijini ipoteza alternativ. Nu am spus c o con-
firmm sau c o acceptm. n realitate, ipoteza alternativ nu poate fi confir-
mat sau acceptat, deoarece n permanen apare excepia (cele 5 persoane
dintr-o sut) pentru care ipoteza alternativ nu este adevrat.
Sperm c, n baza exemplului de mai sus, ai reuit clarificarea mo-
dului n care are loc testarea ipotezelor ntr-o cercetare tiinific. Dac ar fi
s concluzionm, am putea spune c logica testrii ipotezelor cuprinde patru
etape (Dancey, i alii, 2002):
234
Cristian Opariuc-Dan
Formularea ipotezei;
Msurarea variabilelor implicate i stabilirea relaiilor dintre
variabile;
Calcularea probabilitii de obinere a acestor relaii n condii-
ile n care relaiile de fapt nu exist la nivelul populaiei;
Dac probabilitatea calculat n etapa anterioar este destul de
mic, atunci exist o probabilitate foarte mare ca relaia des-
coperit s se regseasc la nivelul populaiei.
O ultim meniune referitoare la ipoteza nul. n general, cercettorii
consider ipoteza nul o ipotez a absenei. (Sava, 2004). Aceast abordare
este o abordare eronat. Ipoteza nul nu nseamn lipsa unei corelaii sau
lipsa unei diferene dintre medii, ci probabilitatea ca diferena sau corelaia s
fie obinut ca rezultat al unei erori de eantionare. O legtur ntre dou
variabile, chiar foarte sczut, exist totui, doar c probabilitatea ca aceast
relaie s fie rezultatul unor erori de eantionare este foarte mare i nu trebuie
ignorat. Prin urmare, ipoteza nul nu afirm de fapt c nu exist o legtur,
ci trebuie privit mai degrab ca o ipoteza ce urmeaz s fie anulat i nu ca
ipoteza absenei.
235
Statistic aplicat n tiinele socio-umane
236
Cristian Opariuc-Dan
237
Statistic aplicat n tiinele socio-umane
tic pot fi ndeplinite, este posibil apariia a dou tipuri de erori: putem res-
pinge ipoteza nul, iar n realitate ea s nu ndeplineasc condiiile de respin-
gere la nivelul populaiei, sau putem s nu respingem ipoteza nul, n situaia
n care ar trebui respins.
Cnd credeai i dumneavoastr c ai scpat de lucrurile astea care
presupun logica probabilitilor, iat un nou concept care are darul s v ame-
easc. Personal, m mir c nu ai trecut nc la lectura unui volum de po-
veti. i dac tot veni vorba de poveti, s v relatez o poveste pe care mi-a
spus-o pe vremuri Ovidiu Lungu i care v va lmuri cu privire la natura
acestor erori.
A fost odat un mprat care avea obiceiul s poarte multe rzboaie.
nainte de a merge la rzboi, mpratul nostru l chema pe vrjitorul curii i l
punea s-i prezic soarta btliei. De fiecare dat, bietul vrjitor era n mare
impas, deoarece, dac greea previziunea, risca s-i piard capul, cum o p-
iser muli alii naintea lui. Totui, vrjitorul avea muli ani de cnd i ps-
tra capul pe umeri, iar prediciile acestuia, uneori, se dovedeau a fi adevrate.
ntrebarea mea este cum proceda? n primul rnd, vrjitor fiind, el citise
aceast carte i celelalte dou care urmeaz s apar. n al doilea rnd, avea
ceva noiuni legate de probabiliti i de verificarea ipotezelor i, naintea
btliei, i formula ipotezele, apoi construia un tabel similar tabelului de mai
jos:
H1: Prevd c mria sa va ctiga btlia
H0: Prevd c mria sa nu va ctiga btlia
Ce se ntmpl n urma btliei
Ctig Pierde
OK Eroare tip I
Ctig p= 1- p=
Ce a prevzut Caracteristica testului Pragul de semnificaie
c se ntmpl OK
Eroare tip II
Pierde p=1-
p=
Puterea testului
238
Cristian Opariuc-Dan
239
Statistic aplicat n tiinele socio-umane
240
Cristian Opariuc-Dan
241
Statistic aplicat n tiinele socio-umane
tim deja c
distribuia normal
prezint dou capete, Probabilitate foarte mic de a obine Probabilitate foarte mic de a obine
dou extreme care se scoruri n zona extremelor scoruri n zona extremelor
apropie de frecvena
zero, pe care nu o
ating ns niciodat i Figura 7.8 Probabilitatea de a obine
am studiat deja pro- scoruri n zona central a distribuiei n
comparaie cu extremele
babilitatea de a obine
scoruri la capetele distribuiei n comparaie cu probabilitatea de a obine sco-
ruri n zona central. Care ar fi probabilitatea de a ntlni o persoan cu nl-
imea de 178 de centimetri? Ne aducem aminte c aceast valoare reprezint
o nlime comun, cu probabilitate de apariie mare, o persoan cu aceast
nlime regsindu-se undeva n zona din mijloc a distribuiei. O persoan cu
nlimea de 250 de centimetri are o probabilitate de apariie foarte mic, si-
tuat undeva la captul din dreapta al distribuiei, n timp ce o persoan cu
nlimea de 120 de centimetri are, de asemenea, o probabilitate mic de apa-
riie, undeva la captul din stnga al distribuiei. La fel procedm i n cazul
n care discutm de o alt variabil, s spunem coeficientul de inteligen. Un
IQ de 110 este unul comun, pe care l putem ntlni n zona de probabilitate
mare. Un IQ de 180 este unul foarte mare, cu o probabilitate de apariie mic,
similar nlimii de 250 de centimetri. La fel, un IQ de 60 are o probabilitate
mic de apariie i se situeaz spre extrema stng a distribuiei.
242
Cristian Opariuc-Dan
mea o msurm n
Scoruri z obinute n cazul n care
centimetri, iar coe- creterea unei variabile determin
micorarea celeilalte variabile Scoruri z obinute n cazul n care
ficientul de inteli- creterea unei variabile determin
gen n uniti IQ. creterea celeilalte variabile
Din ncurctur ne
scoate capitolul
anterior. Ne amin- Figura 7.9 Reprezentarea relaiei dintre
dou variabile
243
Statistic aplicat n tiinele socio-umane
tim c exist un sistem de note standardizate, numit note z, care are propri-
etatea de a aduce la un numitor comun cele dou variabile. Mai mult, notele
z sunt note aditive i multiplicative. Dac am transforma att nlimea, ct
i coeficientul de inteligen n note z, am putea calcula un scor total i am
putea sa-l reprezentm pe o distribuie normal. Acest lucru l putem observa
cu uurin n figura 7.9, prezentat mai sus.
tim, de asemenea, de la semnificaia statistic, faptul c testele de
semnificaie explic probabilitatea de obinere a unor diferene sau a unor
relaii dintre dou variabile, ca rezultat al unei erori de eantionare, indicnd
probabilitatea ca aceast relaie sau diferen s nu existe de fapt la nivelul
populaiei (Dancey, i alii, 2002). Un prag de semnificaie de 0,05 nseamn
c, pentru a fi respins ipoteza nul, trebuie s existe mai puin de 5% anse
ca scorurile de mai sus s fie obinute printr-o eroare de eantionare. S con-
siderm acum o ipotez formulat n urmtorii termeni:
Exist o legtur semnificativ ntre nlimea subiecilor i coefici-
entul lor de inteligen.
Am formulat o ipotez bilateral, fr a preciza sensul acestei legturi.
Ipoteza nul (Nu exist nici o legtur semnificativ ntre nlimea subieci-
lor i coeficientul lor de inteligen)
poate fi respins la un prag de semnifi-
caie de 0,05 att pentru situaia n care
creterea nlimii subiecilor determin 2,5% 2,5%
244
Cristian Opariuc-Dan
Dac scorurile z ale subiecilor investigai vor fi situate n aceste zone, pu-
tem stabili legtura ntre nlimea i coeficientul de inteligen ca fiind o
legtur semnificativ, la un nivel mai mic de 5% ca datele s fie obinute
printr-o eroare de eantionare.
S considerm acum cel de-al doilea caz, n care formulm ipoteza
astfel:
Exist o legtur semnificativ pozitiv ntre nlimea subiecilor i
coeficientul lor de inteligen.
Iat o ipotez unidirecional care ne spune foarte clar c la creterea
nlimii apare creterea coeficientului de inteligen i, similar, scderea
nlimii determin scderea coeficientului de inteligen. Ipoteza nul poate
fi respins n acest caz numai la un prag
de semnificaie mai mic de 0,05 situat n
zona dreapt a distribuiei, la aproxima-
5%
tiv 1,5 abateri standard la dreapta medi-
ei, aa cum putei observa n figura al-
turat.
Nu suntem interesai ce se n- Figura 7.11 Reprezentarea zonelor de
respingere a ipotezei nule pentru ipotezele
tmpl dac creterea nlimii implic unidirecionale
scderea coeficientului de inteligen.
Putem respinge ipoteza nul numai n cazul unei legturi pozitive ntre cele
dou variabile. n mod analog, se poate arta zona de respingere a ipotezei
nule pentru legturile negative (creterea unei variabile implic micorarea
celeilalte), aceasta fiind situat aproximativ la 1,5 abateri standard n stnga
mediei.
Observm c probabilitatea de a respinge ipoteza nul este mult mai
mare n cazul ipotezelor unidirecionale n comparaie cu ipotezele bidireci-
onale. Exist anse mult mai mari s gsim scoruri n zona marcat din figura
245
Statistic aplicat n tiinele socio-umane
246
Cristian Opariuc-Dan
247
Statistic aplicat n tiinele socio-umane
248
Cristian Opariuc-Dan
249
Statistic aplicat n tiinele socio-umane
n concluzie:
Exist patru reguli de probabilitate: probabilitatea simpl pentru evenimente egale,
evenimente mutual exclusive, evenimente independente, probabilitatea condiiona-
t;
Extinderea concluziilor de la studiul unui eantion la nivelul populaiei implic
existena erorilor sistematice de eantionare;
Indicatorii de sondaj aproximeaz parametrii populaiei n zona unui interval de
ncredere;
Abaterea standard a mediilor eantioanelor poart numele de eroare standard de
eantionare;
Metoda tiinific n tiinele socio-umane presupune parcurgerea unui numr de
ase etape:
o Enunarea problemei;
o Formularea ipotezelor;
o Proiectarea cercetrii;
o Efectuarea observaiilor;
o Interpretarea datelor;
o Formularea concluziilor;
Enunarea problemei presupune formularea obiectivelor generale i specifice, n
general n urma unui demers metaanalitic;
Specificarea ipotezelor face referire la ipoteza alternativ i la ipoteza nul;
Ipotezele pot fi unidirecionale sau bidirecionale;
Acceptarea sau respingerea ipotezei nule se face prin referire la pragul de semnifi-
caie statistic;
Aplicarea testelor parametrice se face n baza unor axiome;
Orice concluzie i decizie luat n urma aplicrii metodei statistice este o decizie
probabilistic i nu cert.
250
Cristian Opariuc-Dan
251
Statistic aplicat n tiinele socio-umane
VIII.1 Populaia
Definiia din capitolul al treilea afirma c populaia reprezint totalita-
tea obiectelor, de un anumit tip, existente ntr-un spaiu sau teritoriu, la un
moment dat. O definiie mai larg susine c o populaie reprezint o colec-
ie natural, geografic sau politic de persoane, animale, plante sau obi-
ecte (Dowdy, i alii, 2004). Definiia subliniaz c o populaie reprezint, de
fapt, o colecie fizic. Fiind o colecie fizic, orice populaie se caracterizeaz
prin anumite proprieti pe care le denumim generic parametri. Termenul de
populaie este, de fapt, o abstraciune. Nu putem concepe populaia fr s
facem apel la aceste proprieti prin care se definete. Dac ne referim la po-
pulaia brbailor, implicit am definit un parametru al acesteia i anume se-
xul. Dac vorbim de populaia nlimii brbailor, avem n vedere doi para-
metri i anume nlimea i sexul. Similar, nlimea brbailor din Romnia
presupune trei parametri: locaia, sexul i nlimea. Toi aceti parametri se
numesc variabile de interes ale cercetrii i permit nregistrarea unor valori
la nivelul acestora.
ntr-o cercetare, odat stabilite variabilele (parametrii) de interes, tre-
buie s acordm mult atenie n momentul n care dorim s extindem con-
cluziile la nivelul populaiei. Vom reine faptul c o populaie se caracteri-
zeaz prin aceste variabilele de interes. Nu putem face o afirmaie de genul
nlimea brbailor este de 178 de centimetri, n condiiile n care am efec-
tuat un studiu pe populaia din Romnia. Nu am desfurat o cercetare prin
care s investigm nlimea brbailor din lume. O formul adecvat ar fi
nlimea brbailor din Romnia este de 178 de centimetri.
Populaia odat definit, apare necesitatea nregistrrii valorilor pentru
variabilele de interes. O metod exhaustiv care-i propune investigarea
tuturor elementelor dintr-o populaie este recensmntul.
Recensmntul este o metod de observare total, cu caracter perio-
dic, care surprinde un fenomen n mod static. Este una dintre cele mai vechi
252
Cristian Opariuc-Dan
253
Statistic aplicat n tiinele socio-umane
VIII.3 Eantionul
Exceptnd recensmntul, toate celelalte metode implic utilizarea
unei mici pri dintr-o populaie n vederea colectrii datelor. O asemenea
colectivitate statistic poart numele de eantion i reprezint un subset de
elemente din populaie, care, ns, pstreaz caracteristicile populaiei
din care provine. O cercetare efectuat pe un eantion induce, dup cum am
artat, o serie de erori care afecteaz rezultatele finale. Aceste erori apar ca
urmare a faptului c nu culegem informaii de la ntreaga populaie statistic,
ci doar de la elementele cuprinse n eantion. O cercetare efectuat pe un
eantion poart numele de cercetare selectiv, spre deosebire de recens-
mnt care se refer la cercetri exhaustive.
V mai amintii exemplul cu oala de fasole? Atunci am extras o lingu-
r de boabe de fasole i am decis c boabele sunt fierte. Exact acesta este
principul eantionrii. Dac am fi luat o singur boab de fasole am fi putut
face aceast afirmaie? Eu cred c nu, deoarece ar fi existat prea multe anse
s aruncm apoi oala. Dar dac am fi mncat ntreaga oal? Atunci am fi tiut
sigur, ns nu am mai fi avut cu ce s facem mncarea. n plus, gndii-v ce
costuri ai fi suportat cu sistemul digestiv Dac n oal ai fi amestecat fa-
sole de 10 ani i fasole de 1 an? Probabil c decizia ar fi fost corect, ns ai
254
Cristian Opariuc-Dan
avea multe anse s v rupei uneori dinii. Dac ai fi gustat din oala de ma-
zre? Desigur c nu, pentru c v-ai fi referit la cu totul alt populaie.
Iat c un eantion trebuie s respecte caracteristicile populaiei din
care face parte. Aceasta este calitatea esenial a unui eantion i poart nu-
mele de reprezentativitate. Reprezentativitatea este, aadar, capacitatea
eantionului de a reproduce ct mai fidel structurile i caracteristicile
populaiei din care a fost extras (Rotariu, i alii, 2006). Dac valorile pro-
prietilor la nivelul populaiei poart numele de parametri, la nivelul eanti-
oanelor, ele se numesc indicatori sau statistici. n mod normal, noi nu cu-
noatem valorile parametrilor, valoarea exact pe care o are caracteristica
respectiv la nivelul populaiei, ci ncercm s-o estimm prin intermediul
valorii obinute la nivelul eantionului. Legat de acest aspect, trebuie ns s
reinei dou lucruri importante:
ntre valoarea unui indicator i valoarea unui parametru exist
ntotdeauna o diferen, numit eroare sau eroare statistic.
Sensul termenului de eroare nu este acela comun, de greeal.
Dac am msura toi brbaii din Romnia i am obine 179
centimetri pentru parametrul nlime medie, n timp ce un alt
studiu, efectuat pe 200 de brbai obine nlimea medie de
178,7 centimetri, diferena de 0,3 centimetri reprezint tocmai
eroarea statistic;
Pentru ca un studiu s fie valid, trebuie ca eroarea (diferena
dintre valoarea parametrului i cea a indicatorului) s nu dep-
easc un anumit prag. Acest prag poart numele de nivel de
ncredere i reprezint ansa ca eroarea real comis s nu de-
peasc limita erorii statistice. Cu alte cuvinte, ansa ca valo-
rile obinute s nu se datoreze unei erori de eantionare.
Aceste lucruri le-am abordat pe larg n capitolul anterior i nu le vom
discuta aici, deoarece consider c au fost bine nelese. Totui, vom prelua o
255
Statistic aplicat n tiinele socio-umane
256
Cristian Opariuc-Dan
257
Statistic aplicat n tiinele socio-umane
258
Cristian Opariuc-Dan
Precizie
mare?
Nu Da
Nu Da Nu Da
Eantion peste
50 elemente
259
Statistic aplicat n tiinele socio-umane
care-i trateaz ori cazul cercetrilor efectuate pe studenii din cadrul unei uni-
versiti. Nu putem vorbi aici de reprezentativitate, iar rezultatele obinute nu
pot fi extrapolate la nivelul ntregii populaii. Un asemenea studiu, datorit
voluntariatului, este puternic biasat, iar rezultatele vor fi privite cu mare scep-
ticism. Avantajul l reprezint posibilitatea de colectare facil i rapid a da-
telor, iar cu ct grupul este mai mare, cu att rezultatele vor fi mai importan-
te. ntr-o cercetare n care se folosesc asemenea subieci, n general, elemen-
tele se raporteaz ca lot de cercetare sau lot de studiu i nu ca eantion, toc-
mai pentru a specifica lipsa oricror tehnici de eantionare.
260
Cristian Opariuc-Dan
261
Statistic aplicat n tiinele socio-umane
262
Cristian Opariuc-Dan
263
Statistic aplicat n tiinele socio-umane
Brbai Femei
Rural Urban Rural Urban
120.215 80.360 113.456 136.394
(26,69%) (17,84%) (25,19%) (30,28%)
200575 (44,53%) 249805 (55,47%)
450.380 (100%)
264
Cristian Opariuc-Dan
265
Statistic aplicat n tiinele socio-umane
Brbai Femei
Rural Urban Rural Urban
80 (26,69%) 54 (17,84%) 76 (25,19%) 91 (30,28%)
134 (44,53%) 167 (55,47%)
301 (100%)
266
Cristian Opariuc-Dan
Exerciiu:
Calculai cte boabe de fasole de 10 ani i cte boabe de fasole de 1
an trebuie s avei n lingur, cunoscnd c n oal se afl 854 de boabe de
fasole de 1 an i 362 de boabe de fasole de 10 ani.
Dei, aparent, caracterul aleatoriu nu se pstreaz datorit crerii pon-
derilor pe straturi, aceast alegere a subeantioanelor asigur tuturor indivizi-
lor o probabilitate egal de a intra n eantion. O problem poate s apar n
situaia n care ponderea unui strat este foarte mic n populaie. Dac vom
considera variabila de eantionare nivelul de inteligen, exist posibilitatea
ca grupa geniilor sau a idioilor s aib foarte puine cazuri n populaie (s
spunem 10). n aceast situaie, n eantion ar trebui s includem 0,003 (un
exemplu, cifra nu a rezultat din calcul) persoane, ceea ce este imposibil.
Asemenea situaii impun o supra-reprezentare (adic includerea mai multor
cazuri n eantion dect proporia din populaie) urmat apoi, n decursul ana-
lizei indicatorilor statistici, fie de ponderarea valorilor pariale la nivelul stra-
tului respectiv, fie de includerea acelui strat ntr-un alt strat supraordonat sau
subordonat (de exemplu, includerea geniilor n categoria celor cu un intelect
superior i redenumirea stratului inteligen superioar-genialitate).
267
Statistic aplicat n tiinele socio-umane
268
Cristian Opariuc-Dan
269
Statistic aplicat n tiinele socio-umane
270
Cristian Opariuc-Dan
271
Statistic aplicat n tiinele socio-umane
272
Cristian Opariuc-Dan
273
Statistic aplicat n tiinele socio-umane
274
Cristian Opariuc-Dan
tion mai muli bucureteni este mult mai mare. Folosind aceast tehnic, pro-
babilitile se egaleaz. Eantioanele cu probabilitate proporional cu mri-
mea sunt utilizate, n special, n domeniul organizaional, n cercetri la nive-
lul crora se intenioneaz investigarea personalului. Deoarece cadrele de
conducere sunt mai puin numeroase n comparaie cu cadrele de execuie,
metoda permite egalarea anselor celor dou categorii de a fi incluse n ean-
tion.
Relund exemplul anterior, ne propunem s desfurm o cercetare
oarecare n judeul Y, care are un numr de 29 de localiti. Dup cum obser-
vai n tabelul 8.3, localitile sunt difereniate sub aspectul populaiei. n
timp ce localitatea 26 are un numr de 197 de locuitori, localitatea 21 are un
numr de 1590 de locuitori. Evident c ansele de a extrage mai muli locui-
tori din localitatea 21 sunt mai mari n comparaie cu localitatea 26, de unde,
cel mai probabil, nu va participa nimeni la cercetare. Prin acest procedeu de
eantionare putem egala situaia, astfel nct subiecii din fiecare localitate s
aib o ans calculabil de a fi inclui n eantion.
Etapele de realizare a unui asemenea eantion sunt urmtoarele:
Inventarierea unitilor de eantionare i a dimensiunii
acestora. n aceast etap, se listeaz toate unitile de eanti-
onare din teritoriu, precum i volumul corespunztor de popu-
laie. n cazul nostru, vom nregistra toate cele 29 de localiti
ordinea nu conteaz mpreun cu volumul populaiei pen-
tru fiecare unitate (coloanele Localitate i Populaie din tabelul
8.3). La acest nivel, se poate lucra fie cu lista complet, fie cu
uniti de eantionare grupate n interval (de exemplu, vrsta
ntre 0 i 10 ani, ntre 11 i 21 de ani etc.)
275
Statistic aplicat n tiinele socio-umane
276
Cristian Opariuc-Dan
277
Statistic aplicat n tiinele socio-umane
278
Cristian Opariuc-Dan
279
Statistic aplicat n tiinele socio-umane
280
Cristian Opariuc-Dan
281
Statistic aplicat n tiinele socio-umane
zie este mai mare, cu att crete i volumul eantionului. Marja de eroare de
2% se scrie n form zecimal 0,02.
Cunoscnd acum toate aceste elemente, s ne imaginm c desfu-
rm un studiu utiliznd un chestionar, la care subiecii rspund prin Da sau
Nu, nu avem idee care ar fi proporia rspunsurilor Da sau care ar fi pro-
poria rspunsurilor Nu, dorim un nivel de ncredere de 95% i un nivel de
precizie de 2%. Ce volum trebuie s aib eantionul?
2 1 1,962 0,5 10,5 3,840,50,5 0,96
= = = = = 2400
2 0,02 2 0,0004 0,0004
Exerciiu:
Folosind acelai tip de studiu, calculai volumul unui eantion la un
nivel de ncredere de 95% i cu o precizie de 3%, estimnd c subiecii vor
rspunde 75% Da i 25% Nu.
2 1
= (formula 8.2)
282
Cristian Opariuc-Dan
0,004 = 0,06 = 6%
O precizie de 6% mi se pare extrem de mic pentru un asemenea
sondaj. Cu alte cuvinte, preferinele pentru Icsulescu variaz ntre 59% i
71%. Cam mare marja de eroare, nu credei?
Atunci cnd variabila msurat are un caracter continuu (cum ar fi, de
exemplu, nlimea), se utilizeaz o alt formul pentru determinarea mrimii
eantionului, formul ce ine cont de variana caracteristicii msurate la nive-
lul populaiei. Deoarece aceast varian de multe ori nu poate fi anticipat,
existnd prea puine anse s cunoatem n mod real variana parametrului la
nivelul populaiei, majoritatea studiilor de acest tip prefer transformarea
variabilelor continui sau polihotomice n variabile dihotomice pentru aplica-
rea calculului de proporii. Acest lucru se poate efectua prin combinarea rs-
punsurilor n dou categorii (de exemplu, subieci nali i subieci scunzi) i
apoi aplicarea metodei de estimare prin proporii, aceast tehnic fiind accep-
tat cvasi-universal.
Dac nu dorim totui s facem acest lucru, o alt metod prin care pu-
tem determina volumul unui eantion n cazul variabilelor continui este aceea
prin care nlocuim variana populaiei cu variana eantionului. Deoarece aba-
terea standard la nivelul unui eantion aproximeaz bine abaterea standard a
populaiei, ne putem permite s realizm un studiu pilot pe un numr de 30-
40 de subieci, calculm apoi abaterea standard pe care o folosim la determi-
narea mrimii eantionului dup formula:
2
= (formula 8.3)
2
283
Statistic aplicat n tiinele socio-umane
284
Cristian Opariuc-Dan
= (formula 8.5)
1+ 2
285
Statistic aplicat n tiinele socio-umane
Figura 8.5 Primul pas al crerii unui eantion. Salvarea fiierului plan
286
Cristian Opariuc-Dan
287
Statistic aplicat n tiinele socio-umane
288
Cristian Opariuc-Dan
289
Statistic aplicat n tiinele socio-umane
290
Cristian Opariuc-Dan
291
Statistic aplicat n tiinele socio-umane
292
Cristian Opariuc-Dan
293
Statistic aplicat n tiinele socio-umane
294
Cristian Opariuc-Dan
295
Statistic aplicat n tiinele socio-umane
296
Cristian Opariuc-Dan
le pot fi generate doar n ordine. Prin urmare, nu putem crea stadiul 3 n con-
diiile n care nu au fost executate stadiile 1 i 2.
Seciunea What type of seed value do you want to use? permite
stabilirea valorii de iniializare pentru generatorul de numere aleatoare. Pu-
tem alege ntre un numr oarecare, generat automat de computer (selectnd
A randomly-chosen number) sau putem include o valoare n caseta de
text Custom value, n situaia n care se dorete reproducerea caracteristi-
cilor eantionului.
Cele dou casete de bifare permit tratarea cazurilor n care lipsesc in-
formaii la nivelul unor elemente i accelerarea procesului de generare a ean-
tionului. Bifarea primei casete are ca efect includerea ntr-o categorie separa-
t a unitilor cu date lips, iar debifarea acesteia ignor unitile care au date
lips.
Bifarea celei de-a doua casete are ca efect accelerarea procesului de
generare a eantionului, n condiiile n care datele sunt deja sortate dup va-
lorile unei variabile de stratificare. Altminteri, SPSS va proceda la o nou
resortare, operaiune consumatoare de timp.
Urmtoarea etap permite precizarea locului n care va fi salvat ean-
tionul i variabilele pe care acesta le genereaz. Putem opta ntre baza de date
curent (Active dataset), caz n care SPSS va selecta din baza de eantio-
nare unitile incluse n eantion i va calcula variabilele necesare doar pentru
acestea, putem alege o nou baz de date (New dataset), caz n care SPSS
va crea o nou baz de date, nesalvat, n care va include doar unitile selec-
tate n eantion sau putem crea o nou baz de date cu salvare (External
file), caz similar celui anterior, singura deosebire fiind aceea c SPSS va
crea un nou fiier pe disc i va salva eantionul. n cele dou situaii, va tre-
bui s precizm numele bazei de date, respectiv numele i calea ctre fiierul
de date.
297
Statistic aplicat n tiinele socio-umane
298
Cristian Opariuc-Dan
299
Statistic aplicat n tiinele socio-umane
Summary
Stage 1
Sample Inf ormation Selection Method Simple random sampling
without replacement
Number of Units Sampled
930
Variables Created or Stagewise Inclusion
InclusionProbability _1_
Modif ied (Selection) Probability
Stagewise Cumulativ e SampleWeight
Sample Weight Cumulativ e_1_
Stagewise Population
PopulationSize_1_
Size
Stagewise Sample Size SampleSize_1_
Stagewise Sampling
SamplingRate_1_
Rate
Stagewise Sample
SampleWeight_1_
Weight
Analy sis Inf ormation Estimator Assumption Equal probability
sampling without
replacement
Inclusion Probability Obtained from v ariable
InclusionProbability _1_
Plan File: C:\Test.csplan
Weight Variable: SampleWeight_Final_
300
Cristian Opariuc-Dan
301
Statistic aplicat n tiinele socio-umane
302
Cristian Opariuc-Dan
calea complet sau putei folosi butonul Browse, prin intermediul cruia
vei alege locaia acestui fiier. Evident, va trebui s furnizai i un nume. n
cazul nostru, fiierul plan de analiz se numete Analiza.csaplan i a fost
salvat direct n directorul C:\.
Observai diferena de extensie. Dac planurile de eantionare aveau
extensia .csplan, planul de analiz are extensia .csaplan.
303
Statistic aplicat n tiinele socio-umane
aceast variabil poate lua diferite forme, n planul de analiz vom include,
de obicei, forma final a acesteia, forma n care SPSS pondereaz de fapt
toate stadiile. V recomand introducerea n seciunea Sample Weight a
variabilei de tipul Final Sample Weight, variabil care, de obicei, caracte-
rizeaz cel mai bine eantionul. n cazul planurilor complexe, s-ar putea in-
clude i alte variabile pariale de acest tip, dac se dorete investigarea la ni-
velul stadiilor, a straturilor ori a clusterilor.
304
Cristian Opariuc-Dan
305
Statistic aplicat n tiinele socio-umane
306
Cristian Opariuc-Dan
307
Statistic aplicat n tiinele socio-umane
308
Cristian Opariuc-Dan
309
Statistic aplicat n tiinele socio-umane
310
Cristian Opariuc-Dan
311
Statistic aplicat n tiinele socio-umane
Exist destul de multe opiuni n cadrul acestei noi ferestre, unele din-
tre ele fiindu-v necunoscute, deoarece nu avei nc informaiile necesare
referitoare la anumite teste statistice. Noi le vom prezenta pe toate, studiind
aici, n detaliu, doar cteva, celelalte urmnd s le analizm n volumele ulte-
rioare.
Seciunea Cells permite afiarea informaiilor legate de populaia
int din care a fost extras eantionul. Vor fi afiate date referitoare la dimen-
siunea populaiei sub form de frecvene absolute, prin bifarea casetei Pop-
ulation size i sub form de frecvene relative (procente), bifnd caseta
Table percent.
Seciunea Statistics permite configurarea indicatorilor statistici
asociai dimensiunii populaiei sau a procentului din populaie, astfel:
Prin bifarea casetei Standard error, vom calcula eroarea
standard a estimrii;
Caseta Confidence interval permite stabilirea intervalului
de ncredere a estimrii n baza nivelului specificat. n mod
normal, intervalul de ncredere l vom stabili la 95%, dup
cum observai c am procedat i n exemplul nostru (caseta de
text Level%);
Caseta Coefficient of variation comunic programului cal-
culul coeficientului de variaie a estimrii, sub form de pro-
porii;
Caseta Unweighted count permite afiarea numrului de
elemente folosit n realizarea estimrii. Cu alte cuvinte, di-
mensiunea eantionului extras;
Caseta Design effect permite calculul varianei estimrii.
Indicatorul exprim proporia de varian a eantionului com-
parat cu variana unui eantion simplu randomizat. Coeficien-
312
Cristian Opariuc-Dan
313
Statistic aplicat n tiinele socio-umane
314
Cristian Opariuc-Dan
Respondent's Sex
95% Confidence
Standard Interv al Unweighted
Estimate Error Lower Upper Design Eff ect Count
Population Size Male 662,260 15,355 632,126 692,395 1,000 406
Female 854,740 15,355 824,605 884,874 1,000 524
Total 1517,000 ,000 1517,000 1517,000 . 930
% of Total Male 43,7% 1,0% 41,7% 45,7% 1,000 406
Female 56,3% 1,0% 54,3% 58,3% 1,000 524
Total 100,0% ,0% 100,0% 100,0% . 930
315
Statistic aplicat n tiinele socio-umane
tionul nostru estimeaz o populaie compus din 43,7% brbai i 56,3% fe-
mei.
Urmtoarea coloan (Standard Error) se refer la eroarea standard a
estimrii, exprimat att n form brut, ct i n form procentual. Eantio-
nul nostru estimeaz populaia int cu o eroare standard de 15,35 brbai i
15,35 femei (aproximativ 15 subieci pentru fiecare categorie, cifrele repre-
zentnd din nou o abstraciune). Acest indicator devine mai clar dac urm-
rim forma procentual. Iat c eroarea estimrii este de 1% att n cazul br-
bailor, ct i n cazul femeilor, care, la un nivel de ncredere de 95%, ne poa-
te determina s afirmm c avem un eantion reprezentativ sub aspectul sexu-
lui.
Urmeaz dou coloane ale intervalului de ncredere. n baza erorii
standard, eantionul estimeaz practic o populaie int format dintr-un nu-
mr de 632,12 pn la 692,39 brbai i de la 824,60 pn la 884,87 femei.
Cu alte cuvinte, compoziia populaiei int estimat de eantion este format
din 41,7% pn la 45,7% brbai i 54,3% pn la 58,3% femei. Undeva ntre
aceste limite putem gsi populaia int real estimat de eantion.
Coloana Design Effect are evident valoarea 1, deoarece am lucrat cu
un eantion simplu randomizat, fapt tratat mai sus.
Ultima coloan indic dimensiunea i compoziia eantionului (Un-
weighted Count). Dup cum tiam deja, eantionul are un numr de 930 de
cazuri, iar din punctul de vedere al sexului avem 406 brbai i 524 femei.
Iat c acest eantion estimeaz reprezentativ populaia int la o eroare de
doar 1% i la un nivel de ncredere de 95%. Suntem n faa unui eantion re-
prezentativ, acest lucru fiind demonstrat prin analiza efectuat.
Am analizat o variabil de interes situat la nivel nominal (sexul).
Cum procedm ns, dac avem o variabil de interes la un nivel scalar, de
exemplu vrsta? Analiza frecvenelor nu ne ajut prea mult. Este timpul s
316
Cristian Opariuc-Dan
abordm cea de-a doua metod propus i anume analiza descriptiv. Paii
sunt identici, astfel nct nu vom insista asupra lor. Exist ns o serie de me-
tode statistice uor diferite, pe care vom ncerca s le lmurim.
318
Cristian Opariuc-Dan
n concluzie:
Populaia reprezint o colecie natural, geografic sau politic de persoane, ani-
male, plante sau obiecte;
Proprietile unei populaii poart numele de parametri. Din parametri pot deriva
variabilele de interes ale cercetrii;
Recensmntul reprezint o metod exhaustiv de investigare a populaiei. O for-
m particular a recensmntului este referendumul;
Sursele de date utilizate n cercetare pot fi:
o Surse principale de date;
o Surse secundare de date;
Eantionul este un subset de elemente din populaie care pstreaz caracteristicile
populaiei din care a fost extras;
Cercetrile bazate pe eantion se numesc cercetri selective, spre deosebire de cele
bazate pe populaie care poart numele de cercetri exhaustive;
Reprezentativitatea este caracteristica principal a unui eantion i reprezint ca-
pacitatea eantionului de a reproduce ct mai fidel structurile i caracteristicile
populaiei din care a fost extras;
Valorile proprietilor la nivelul unui eantion poart numele de indicatori sau sta-
tistici;
Eroarea statistic se refer la diferena dintre valoarea unui parametru i valoarea
unui indicator;
Reprezentativitatea unui eantion depinde de caracteristicile populaiei, de mri-
mea eantionului i de procedura de eantionare folosit i, n general, nu depinde
de mrimea populaiei dect n anumite condiii specifice;
Procedeele de eantionare se pot mpri n procedee de eantionare aleatoare i
procedee de eantionare nealeatoare;
Dintre procedeele de eantionare, putem meniona:
o Eantionarea prin convenie;
o Eantionarea prin analiz;
o Bulgrele de zpad;
o Eantionarea simpl aleatoare;
o Eantionarea stratificat;
o Eantionarea multistadial;
o Eantionarea pe clusteri;
o Eantionarea sistematic;
o Eantionarea pe cote;
o Eantionarea cu probabilitate proporional cu mrimea;
Mrimea unui eantion se determin n funcie de:
o Eroarea statistic;
o Variabilitatea populaiei;
o Nivelul de ncredere;
319
Statistic aplicat n tiinele socio-umane
320
Cristian Opariuc-Dan
Bibliografie
1. Clocotici, Vasile i Stan, Aurel. (2000). Statistic aplicat n
psihologie. Iai : Polirom.
2. Curwin, Jon i Slater, Roger. (1996). Quantitative methods for
Business Decisions. Fourth Edition. London : International Thomson
Business Press.
3. Dancey, Christine i Reidy, John. (2002). Statistics without math for
psychology. Second Edition. Harlow : Prentice Hall.
4. Dowdy, Shirley, Weardon, Stanley i Chilko, Daniel. 2004.
Statistics for research. Third Edition. New Jersey : John Wiley and
Sons, 2004.
5. Field, A. 2000. Discovering statistics using SPSS for Windows.
London : Sage, 2000.
6. Field, Andy. 2005. Discovering Statistics using SPSS, Second
Edition. London : Sage Publications Ltd., 2005. 100-7619-4451-6.
7. Jaisingh, Lloyd. 2000. Statistics for the Utterly Confused. New
York : McGraw Hill, 2000.
8. Leech, Nancy L, Barrett, Karen C i Morgan, George A. 2005.
SPSS for intermediate statistics. Use and interpretation. Second
Edition. New Jersey : Lawrence Erlbaum Associates, 2005.
9. Lungu, Ovidiu. 2001. Ghid introductiv pentru SPSS 10.0. Iai :
Erota, 2001.
10. Marques de Sa, Joaquim P. 2007. Applied Statistics using SPSS,
Statistica, Mathlab and R. New York : Springer, 2007.
11. Pitariu, Horia Dumitru. 2003. Psihodiagnostic - note de curs.
Bucureti : s.n., 2003.
12. Popa, Marian. 2003. Statistic - note de curs. Bucureti : s.n., 2003.
13. Radu, Ioan, i alii. 1993. Metodologie psihologic i analiza
datelor. Cluj-Napoca : Sincron, 1993.
14. Rotariu, T, i alii. 2006. Metode statistice aplicate n tiinele
sociale. Iai : Polirom, 2006.
15. Sava, Florin Alin. 2004. Analiza datelor n cercetarea psihologic.
Metode statistice complementare. Cluj-Napoca : ASCR, 2004.
16. . 2000. Pagina de statistic social. Pagina de statistic social.
[Interactiv] 2000. http://statisticasociala.tripod.com.
321
Statistic aplicat n tiinele socio-umane
322
Cristian Opariuc-Dan
n loc de ncheiere
Sper c acest domeniu a ajus s v intereseze. Dup parcurgerea cr-
ii, ai observat c statistica poate fi chiar plcut, iar concluziile pe care le
putem desprinde din analiza datelor ne conduc ctre idei pe care, n absena
acestei tiine, nu le-am putea avea i, mai ales, nu le-am putea verifica. Bine-
neles, statistica este nti de toate o disciplin matematic. Nimeni ns nu
v cere s fii un matematician pentru a o putea folosi. Aa cum mi spunea
odat colegul i prietenul meu, Ticu Constantin, nu e nevoie s tiu s con-
struiesc o main pentru a o putea conduce i cu care, la momentul respec-
tiv, nu am fost de acord; acum trebuie s recunosc c a avut dreptate. Rolul
matematicienilor este acela de a construi maina; rolul nostru este de a o
conduce. Acum, dac unii oferi sunt mai buni dect alii asta e. Nu la fel
se ntlnim i n viaa real, pe osele? Nu este ntmpltor faptul c pionierii
psihologiei tiinifice care au folosit metode statistice (Cattell, Spearman,
Thorndike s.a.) au fost iniial formai n tiine reale, precum matematica,
fizica, chimia.
n acest volum, m-am oprit la studiul eantioanelor. Din raiuni con-
crete, nu am dorit s merg mai departe, deoarece a fi fost nevoit s scot o
lucrare de 600 pn la 1000 de pagini, care cu siguran v-ar fi speriat. Nu
intenionez ns s m opresc aici. n volumul al doilea, care va aprea dup
ce voi obine impresiile dumneavoastr, a vrea s abordez problematica stu-
diilor corelaionale i a prediciei n tiinele socio-umane prin metode statis-
tice i nu clarvizioniste, adic metode de regresie liniar i logistic, analiza
factorial sau modaliti de a vedea dac datele noastre au ceva n comun,
analiza de fidelitate sau ct de stabile pot fi scorurile n timp ori cum putem
s facem s nu mai ateptm un timp pentru a vedea acest lucru, precum i
metode prin care putem sesiza dac exist diferene ntre grupuri, cu alte cu-
vinte statistici infereniale prin teste parametrice i neparametrice. De aseme-
nea, mi-a dori s abordez un capitol extrem de interesant, i anume acela al
323
Statistic aplicat n tiinele socio-umane
analizei de varian sub diferitele sale aspecte, n care s putem vedea cum
una sau mai multe dimensiuni exercit efecte asupra altor dimensiuni.
n al treilea volum, a vrea s abordez problematica scalrii multidi-
mensionale, problematica analizei de cluster, analiza Q Sort, metaanaliza,
analizele de itemi, analize calitative i analizele folosind reelele neuronale.
Demersul este, dup cum ai observat, de la simplu la complex. A fi
foarte bucuros dac a vedea c ridicai probleme, propunei soluii, oferii
sugestii sau, de ce nu, criticai anumite aspecte pe care le prezint. Asta ar fi
dovada c munca mea nu a fost n zadar. Nu am pretenia unui expert absolut.
Ceea ce doresc este s mprtesc din experiena mea i s cunosc experien-
ele altora, astfel s avem cu toii de ctigat,. Pentru a realiza acest obiectiv,
va trebui s ne detam de orgolii i de impresii personale, s contientizm
c toi avem nc de nvat, s avem o minte deschis i s dm ceea ce este
mai bun n noi. Este foarte posibil ca uneori, n ceea ce expun, s nu am drep-
tate. Este posibil s m nel n anumite afirmaii pe care le fac pe parcursul
acestor pagini. Singura modalitate pe care o avem de a ne da seama de acest
lucru este s comunicm. Atept, prin urmare, reacia dumneavoastr, ca
unici judectori ai cuvintelor mele.
V mulumesc pentru rbdarea pe care ai avut-o studiind acest vo-
lum. Informaiile prezentate aici nu sunt originale i nici nu ar avea cum s
fie. Ele se bazeaz pe afirmaiile unor autoriti n domeniu care au avut in-
spiraia s le descopere, iar eu nu am fcut dect s le prezint. Original este,
ns, cred, modalitatea de prezentare. Am ncercat s mbin umorul cu infor-
maia tiinific, astfel nct cele prezentate aici s fie uor digerabile. Am
folosit unele exemple proprii sau preluate din alte lecturi. n general, am citat
sursele pe care le-am folosit. C anumite elemente ntlnite aici vi se par fa-
miliare, c le-ai gsit i n alt parte, este foarte posibil. Statistica nu e att de
variat precum o creaie literar sau muzical, iar punctele de vedere pot s
coincid pn la un anumit nivel. De asemenea, am urmrit s folosesc ct
324
Cristian Opariuc-Dan
mai multe exemple practice pentru a iei puin din lumea abstract a formule-
lor matematice. Totul a fost gndit n ideea c nu m adresez unor matemati-
cieni sau unor persoane familiarizate cu tiinele reale. Cei care doresc s
aprofundeze aceste elemente, pot gsi excelente informaii n bibliografia
propus. Totui, i poezia i muzica au o matematic proprie. Dorina mea
a fost s elimin angoasa statistic, angoas pe care cei mai muli dintre stu-
denii sau absolvenii de tiine socio-umane o prezint. Dac am reuit sau
nu acest lucru, dumneavoastr s-mi spunei. V-a rmne recunosctor pen-
tru sugestiile dumneavoastr. E posibil ca uneori s fi fost mai abstract, alte-
ori s fac exces de didacticism. Este de asemenea posibil s fi fcut erori de
prezentare sau s fi folosit o exprimare pe care nu o agreai. Ceea ce am ur-
mrit a fost s redactez o carte special, prin intermediul creia s nvai
lecturnd-o. Uneori devine necesar s folosii hrtia i creionul pentru a relua
exemplele i calculele, pentru a sistematiza informaiile.
Sper, n final, c cel puin nu vi se mai face ru dup primul fum
tras din statistic. Dac sperana mea s-a adeverit, atunci suntei pe calea de-
pendenei i v invit s parcurgei urmtorul volum.
325