Sunteți pe pagina 1din 320

S

ST TA AT TI IS ST TI IC C A AP PL LI IC CA AT T N N
T TI II IN N E EL LE ES SO OC CI IO O

U UM MA AN NE E
Noiunidebaz Statisticiunivariate

CristianOpariucDan







Constana, iulie 2008

Statistic aplicat n tiinele socio-umane



Fiicei mele, Luana-tefana
Statistica, este precum fumatul

La prima igar, i-e ru. Dac continui, ncepe
s-i plac i n final termini prin a fi dependent.

Diferena dintre statistic i fumat este c,
statistica nu duneaz grav sntii.
2
Cristian Opariuc-Dan
Cuprins

Cuprins ............................................................................................................. 3
Cuvntul autorului ........................................................................................... 7
I. Natura msurrii n tiinele socio-umane ............................................. 11
I.1 Variabile .......................................................................................... 14
I.1.1 Variabile discrete ..................................................................... 16
I.1.2 Variabile continui .................................................................... 17
I.2 Scale (nivele) de msurare .............................................................. 18
I.2.1 Scale neparametrice ................................................................. 19
I.2.2 Scale parametrice ..................................................................... 22
I.3 Prezentare general SPSS for Windows ......................................... 26
I.3.1 Bazele de date creare, salvare, deschidere ............................ 31
II. Organizarea datelor ................................................................................ 54
II.1 Sistematizarea datelor ..................................................................... 56
II.2 Reprezentarea grafic a datelor ....................................................... 63
III. Statistici descriptive Tendina central ............................................ 67
III.1 Populaie i eantion .................................................................... 68
III.1.1 Eantionarea simplu randomizat ............................................ 70
III.1.2 Randomizarea pe cote .............................................................. 71
III.1.3 Eantionarea stratificat ........................................................... 72
III.1.4 Eantionarea pe cluster ............................................................ 73
III.2 Indicatori ai tendinei centrale ..................................................... 73
III.2.1 Media ....................................................................................... 75
III.2.2 Mediana ................................................................................... 80
III.2.3 Modul ....................................................................................... 83
3
Statistic aplicat n tiinele socio-umane
III.2.4 Precizia indicatorilor tendinei centrale ................................... 85
III.2.5 Obinerea indicatorilor tendinei centrale n SPSS .................. 88
IV. Media populaiei. Reprezentri grafice ale tendinei centrale ............ 96
IV.1 Reprezentri grafice .................................................................... 97
IV.2 Analiza grafic a tendinei centrale ........................................... 107
IV.2.1 Graficul tulpin i frunze ................................................... 108
IV.2.2 Graficul cutie (box-plot) .................................................... 111
IV.3 Tratarea scorurilor extreme ....................................................... 115
IV.3.1 Obinerea graficelor pentru tendina central n SPSS .......... 117
V. Statistici descriptive mprtierea ..................................................... 122
V.1 Indicatori elementari ai mprtierii .............................................. 124
V.1.1 Amplitudinea de variaie ........................................................ 124
V.1.2 Abaterea cuartil sau abaterea intercuartil ........................... 125
V.2 Indicatori sintetici ai mprtierii .................................................. 129
V.2.1 Diferena medie Gini ............................................................. 129
V.2.2 Oscilaia ................................................................................. 130
V.2.3 Abaterea medie ...................................................................... 133
V.2.4 Abaterea median .................................................................. 135
V.2.5 Dispersia ................................................................................ 135
V.2.6 Abaterea standard .................................................................. 138
V.2.7 Coeficientul de variaie .......................................................... 141
V.3 Obinerea indicatorilor mprtierii n SPSS ................................. 142
VI. Distribuia normal ........................................................................... 146
VI.1 Modalitatea ................................................................................ 148
VI.2 Simetria ..................................................................................... 149
VI.2.1 Coeficientul Yule ................................................................... 150
VI.2.2 Coeficientul de asimetrie Fisher ............................................ 150
4
Cristian Opariuc-Dan
VI.3 Boltirea sau excesul ................................................................... 155
VI.4 Caracterizarea distribuiei normale ........................................... 159
VI.4.1 Notele z i note standard derivate ...................................... 161
VI.5 Transformarea datelor brute ...................................................... 168
VI.6 Sisteme de etalonare .................................................................. 172
VI.6.1 Etaloane n cuantile ................................................................ 177
VI.6.2 Etaloane normalizate ............................................................. 180
VI.7 Analiza distribuiei i realizarea etaloanelor n SPSS ............... 186
VI.7.1 Calculul notelor z n SPSS ................................................. 200
VII. Probabiliti i semnificaie statistic ............................................... 206
VII.1 Patru reguli de probabilitate ...................................................... 209
VII.1.1 Probabilitatea simpl pentru evenimente egale .................. 209
VII.1.2 Evenimentele mutual exclusive ......................................... 211
VII.1.3 Evenimentele independente ............................................... 213
VII.1.4 Probabilitatea condiionat ................................................. 215
VII.2 Eroare standard i intervale de ncredere .................................. 216
VII.3 Metoda tiinific n tiinele socio-umane ............................... 224
VII.3.1 Enunarea problemei .......................................................... 225
VII.3.2 Formularea ipotezelor ........................................................ 227
VII.3.3 Proiectarea cercetrii .......................................................... 243
VII.3.4 Efectuarea observaiilor ..................................................... 244
VII.3.5 Interpretarea datelor ........................................................... 244
VII.3.6 Formularea concluziilor ..................................................... 246
VIII. Eantionare i reprezentativitate ................................................... 249
VIII.1 Populaia .................................................................................... 250
VIII.2 Surse de date .............................................................................. 251
VIII.2.1 Sursele principale de date .................................................. 251
5
Statistic aplicat n tiinele socio-umane
VIII.2.2 Sursele secundare de date .................................................. 252
VIII.3 Eantionul .................................................................................. 252
VIII.3.1 Mrimea eantionului ......................................................... 255
VIII.3.2 Caracteristicile populaiei .................................................. 256
VIII.3.3 Procedee de eantionare ..................................................... 256
VIII.3.4 Stabilirea eantionului prin analiz .................................... 258
VIII.3.5 Determinarea mrimii eantionului .................................... 276
VIII.4 Construcia eantioanelor n SPSS ............................................ 283
VIII.4.1 Crearea unui eantion n SPSS ........................................... 284
VIII.4.2 Analiza eantionului ........................................................... 300
VIII.4.3 Investigarea proprietilor eantionului ............................. 306
Bibliografie .................................................................................................. 317
n loc de ncheiere ........................................................................................ 319


6
Cristian Opariuc-Dan
Cuvntul autorului
Bun venit la cursul de statistic aplicat n tiinele socio-umane. Da-
c ai cumprat aceast carte, probabil c suntei student sau absolvent al unei
faculti pe care ai urmat-o tocmai din dorina de a scpa de matematic, de
calcule, probabil c v plac mai mult cuvintele, v place s vorbii cu oame-
nii, s-i nelegei i s-i ajutai, s ptrundei fenomenele i evenimentele
sociale. mi imaginez surprinderea i ngrijorarea dumneavoastr n momen-
tul n care, abia pind pe bncile facultii, ai aflat cu stupoare c trebuia s
studiai statistic. Mai mult, c statistica v-a urmat n toi anii de facultate,
inclusiv la licen. tiu! i eu la rndul meu am trit aceleai sentimente i nu
m pot luda c am obinut, de la nceput, performane deosebite n acest
domeniu. Asta pentru c statistica nu se las uor dezvluit. Totui, statistica
reprezint fundamentul tiinific al unor discipline precum psihologia, socio-
logia, antropologia i multe altele. Fr sprijinul su, nu am reui s vorbim
astzi de inteligen, trsturi de personalitate, tipuri de memorie, nu am avea
teste care s le msoare la nivelul la care reuesc acum s le msoare.
Statistica nu este att de grea. Nu este nevoie s tim concepte avansa-
te de matematic superioar pentru a nelege i aplica principii statistice.
Dac tii s adunai, s scdei, s nmulii i s mprii, sunt sigur c vei
putea nva foarte bine i statistica. Nu trebuie s v sperie formulele com-
plexe i neinteligibile. De cele mai multe ori, aceste formule nu sunt altceva
dect algoritmi, pai simpli, proceduri de calcul elementar, care v introduc
n lumea fascinant a probabilitilor. Chiar dac uneori apar termeni precum
logaritmi, integrale, derivate i limite, stai linitii. Nimeni nu v pune s le
calculai. Unele calcule pot presupune utilizarea unui calculator tiinific i
cam att.
Am ncercat s fac din acest volum un material special i am evitat de
fiecare dat s utilizez concepte matematice laborioase. Fiecare formul pe
care o prezint aici va fi explicat, descompus. Uneori abundena de exemple
7
Statistic aplicat n tiinele socio-umane
i repetiiile sunt destinate fixrii unor concepte mai dificile sau mai impor-
tante. Sigur c statistica presupune nc de la nceput stpnirea unor concep-
te noi. Nu putem avansa dac nu nelegem sensul termenului de a msura sau
dac nu tim ceea ce este o variabil, un nivel de msur sau un indicator
statistic. Muli dintre dumneavoastr abia acum iau contact cu aceti termeni
i, desigur, lucrul acesta i sperie. Fii fr grij. O mare parte din terminolo-
gia statistic o folosii deja i ai folosit-o de mii de ori. Doar c nu tiai c se
numete aa i nici de unde provine. mpreun vom face lumin.
Acest volum este unul practic. Fiecare capitol i propune obiective
precise i abund de exemple i exerciii concrete. n definitiv, m interesea-
z s stpnii practica statisticii, s o utilizai n activitatea dumneavoastr de
zi cu zi i nu s facem speculaii teoretice pe aceast tem. Majoritatea capi-
tolelor sunt formate din dou pri: un fundament teoretic i conceptual nso-
it de algoritmii (paii) clasici ai unui procedeu statistic i o aplicaie folosind
un pachet de programe de prelucrri statistice, SPSS for Windows. n aceast
carte am utilizat mai multe versiuni SPSS, ultima fiind versiunea 15. Sunt
sigur c principiile prezentate aici vor putea fi aplicate i n versiunile urm-
toare. La momentul scrierii acestei cri, ultima versiune de SPSS este versi-
unea 16. n general, fiecare capitol se finalizeaz cu un set de ntrebri i
exerciii pe care v invit s le parcurgei singuri, deoarece sunt menite s sta-
bilizeze cunotinele dobndite.
Totui, de ce este important s studiem statistica? Desigur, argumen-
tele sunt nenumrate, ns m voi rezuma doar la cteva. Cel ce nu cunoate
statistic nu poate nelege articolele de specialitate. Toate cercetrile care se
fac n acest domeniu folosesc metode statistice mai mult sau mai puin elabo-
rate. Un specialist n domeniu care nu cunoate statistic, nu poate citi i ne-
lege n profunzime coninutul unui material de specialitate, corectitudinea sau
incorectitudinea datelor expuse. n alt ordine de idei, necunoscnd statistic,
nu se poate face cercetare experimental, nu pot fi nelese principiile con-
structive ale unui instrument sau metod de msurare a unor caliti psiholo-
8
Cristian Opariuc-Dan
gice sau a unor fapte sociale i, prin urmare, un asemenea instrument nu va
putea fi utilizat corect.
Materialele pe care le-am folosit pentru a scrie aceast carte sunt, n
marea lor majoritate, prezentate n bibliografia final. De asemenea, am utili-
zat multiple surse de pe Internet, precum i experiena mea ca practician i
dascl n ale statisticii. Nu pot s nu-i menionez pe cei care mi-au fost primii
ndrumtori n aceast aventur i de la care am avut i nc mai am de nv-
at foarte mult. Astfel, i sunt recunosctor profesorului doctor Cornel
Havrneanu, mentorul i prietenul meu care mi-a ghidat formarea i m-a sus-
inut permanent, prietenului meu asistent doctor Ovidiu Lungu, un statistician
nnscut, care m-a determinat s neleg c acesta ar fi domeniul ce mi s-ar
potrivi cel mai bine i care mi-a sprijinit nceputurile, lector doctor Loredana
Ruxandra Gherasim, cu care de nenumrate ori am nvat s aplic practic
ceea ce tiam teoretic sau s mi fundamentez teoria plecnd de la practic,
profesor universitar doctor Aurel Stan, care a avut bunvoina i rbdarea,
alturi de cei menionai mai sus, s mi citeasc lucrarea i s mi fac ob-
servaii pertinente pe seama ei i prin intermediul cruia am luat cunotin
de statistic prima dat, n anii studeniei, care ulterior mi-a furnizat informa-
ii valoroase, ce mi-au permis s m perfecionez. Fr contribuia lor, n mod
sigur nu a fi ajuns niciodat s scriu aceste rnduri i lor le datorez recuno-
tina mea.
Nu pot, de asemenea, s nu mulumesc unei situaii, situaia care m-
a determinat s vin din Iai la Constana. Am nvat c statistic un eec
personal creeaz premisele unei relansri. Dac aceast situaie, dac proprii-
le mele eecuri nu ar fi existat, probabil c aceast carte nu ar fi existat nici
ea. ntotdeauna, chiar atunci cnd ceva pare sigur imposibil, s tii c soluia
e chiar la ndemna dumneavoastr. Referitor la acest fapt, nu pot s nu mul-
umesc fiicei mele, Luana-tefana, care mi-a fost sprijin i speran n toate
momentele dificile i care n ciuda vrstei nu a ncetat s m sprijine i s m
ncurajeze. i mulumesc i i dedic prima mea lucrare.
9
Statistic aplicat n tiinele socio-umane
Aceast carte nu ar fi vzut tiparul fr susinerea profesorului univer-
sitar doctor Mircea Miclea, care m-a ncurajat, m-a neles i a sprijinit apari-
ia acestui volum. i mulumesc i mi exprim recunotina i pe aceast cale.
Nu pot, de asemenea, s nu i amintesc pe prinii mei i pe toi prietenii mei,
mai mult sau mai puin apropiai, datorit crora am avut energia s ncep
aceast lucrare i crora le mulumesc pentru c m-au ajutat s trec peste
momentele dificile din ultimii ani i fa de care nu pot s nu mi exprim re-
cunotina.
Ct a ncerca, nu reuesc s mi scot din minte vorbele i imaginea
primului meu profesor adevrat de matematic, domnul Crezant Ghenghea,
din cadrul liceului industrial (pe atunci), actualmente Colegiu Naional Nicu
Gane din Flticeni, care a reuit s-mi induc, cum nu a fcut nimeni, dra-
gostea fa de aceast disciplin. Chiar dac nu l nelegeam n acel moment
al adolescenei mele, el a fost primul (i singurul) care m-a vzut cu aptitu-
dini n acest domeniu, aptitudini pe care eu nsumi mi le repudiam. Au trebuit
s treac muli ani ca s ajung la vorbele sale: Eti pentru tiine exacte. Nu
poi scpa de ceea ce eti. Ai s-mi dai dreptate mai trziu. i i-am dat
dreptate. Mi-a dori s fie acum mndru de ce-am realizat i voi folosi aceas-
t ocazie pentru a-i mulumi.
Nu n ultimul rnd, v mulumesc dumneavoastr, care ai cumprat
aceast carte i v invit s m urmai prin cltoria n lumea statisticii, s v
convingei c lucrurile sunt mai simple dect credei. Eu nu pot dect s v
garantez c v voi scoate la liman. Observaiile dumneavoastr sunt foarte
importante pentru mine i m pot orienta n viitoarele lucrri sau reeditri ale
acestui volum. Dac unele informaii nu vi se par clare, dac dorii i altceva,
nu v rmne dect s-mi scriei pe adresa copariuc@gmail.com i s-mi
comunicai opinia dumneavoastr. V mulumesc i v doresc succes!
Constana, duminic, 13 iulie 2008
10
Cristian Opariuc-Dan
I. I. NATURA MSURRII N TIINELE SOCIO-UMANE N - ATURA MSURRII N TIINELE SOCIO UMANE
n acest capitol se va discuta despre:
Sensul i semnificaia termenului de msurare;
Variabile discrete i continui;
Niveluri de msurare;
Descrierea programului SPSS;
Crearea unei baze de date SPSS;
Operaii elementare n SPSS.
Dup parcurgerea capitolului, cititorii vor fi capabili s:
neleag conceptul de msurare n tiinele
socio-umane;
Disting ntre variabilele continui i variabilele
discrete;
Diferenieze nivelurile de msurare;
Se familiarizeze cu aplicaia SPSS;
Creeze o baz de date SPSS i s defineasc corect
variabilele.

Statistica se refer la msurare i probabiliti. Cuvntul statistic,
provine din latinescul statista i desemna, pe vremuri, persoanele care se
ocupau cu afacerile statului, care numrau populaia sau realizau alte aciuni
ce ajutau statul s gestioneze mai bine politica de taxe i costurile rzboaie-
lor. n perioada medieval, prin statistic, armatorii i calculau costurile
echiprii corbiilor, incluznd n calculele lor i probabilitatea ca acestea s
fie atacate de pirai sau de a naufragia (Lungu, 2001).
Foarte multe dintre conceptele statistice, au avut rdcini n alte disci-
pline, unele complet diferite de matematic. Astfel, corelaiile provin din
biologie, din analiza asemnri dintre copii i prinii lor. Analiza de varian
provine din fabricile de bere i se folosea la alegerea tipului potrivit de orz i
a timpului optim de fermentare, astfel nct berea s aib un anumit gust. Mai
interesant este faptul c nsi teoria msurrii i are originea n psihologie,
mai precis n studiul inteligenei i al personalitii umane iar testele nepara-
11
Statistic aplicat n tiinele socio-umane
metrice provin din sociologie. Unii statisticieni ncercau chiar s demonstreze
existena lui Dumnezeu cu ajutorul numerelor iar astzi, statistica joac un rol
important n viaa noastr, fie c ne referim la psihologie, sociologie, tiine
economice sau alte discipline.
n viziunea lui T. Rotariu, statistica se axeaz n principal pe tratarea
informaiilor numerice obinute la nivelul unor mulimi de entiti, informaii
prelevate de la fiecare entitate n parte (sau de la o submulime) i care con-
duc la rezultate cu referin la ansamblu, i nu la entitile componente luate
individual. (Rotariu, i alii, 2006)
Operaiile statistice presupun, prin urmare, un proces de msurare. La
o analiz atent, sintagma a msura un obiect nu nseamn altceva dect a
msura proprietile unui obiect. Noi nu putem msura obiectele, ci, pentru a
le cunoate, msurm anumii indicatori ai proprietilor acestora. Este ade-
vrat c, n anumite tiine (fizica, chimia etc.), msurarea dobndete un
caracter mai concret, deoarece obiectele i proprietile acestora sunt mai
accesibile observrii directe. Putem msura cu uurin lungimea i limea
unei mese (deci indicatori ai proprietilor lungime i lime a obiectului ma-
s), deoarece aceste dou proprieti sunt direct accesibile observaiei noas-
tre. ns, n momentul n care discutm de anxietate, depresie, inteligen,
atenie, responsabilitate, nivel de trai etc. constatm c aceste proprieti nu
pot fi direct observate. Prin urmare, va trebui s deducem aceste caracteristici
din observarea unor indicatori presupui ai proprietilor. Aadar, msura-
rea n tiinele socio-umane are un caracter subtil, care scap observrii
directe. (Vasilescu, 1992)
n tiinele socio-umane noi nu cunoatem i uneori nu putem cunoa-
te n mod precis semnificaia mrimilor pe care le determinm, iar cifrele pe
care le obinem sunt aproximri mai mult sau mai puin exacte ale realitii.
Acest lucru se ntmpl datorit apariiei erorilor de msurare i datorit fap-
tului c realitatea social nu are un caracter fix, ci unul fluctuant, variabil.
12
Cristian Opariuc-Dan
Cantitatea n care un obiect este saturat ntr-o caracteristic, nu este reprezen-
tat printr-un punct, ci printr-un nor de puncte, care oscileaz ntr-un anumit
interval, n jurul unei valori. (Vasilescu, 1992)
Discutnd despre sensul termenului de a msura, acceptm definiia
dat de S. S. Stevens (1959) prin care, n sensul su larg, msurarea n-
seamn atribuirea de numere obiectelor sau evenimentelor, potrivit unor
reguli. Msurarea este deci, o funcie, prin care unui obiect i corespunde un
numr i numai unul, la o anumit msurare. Aceast funcie de atribuire va
trebui s fie suficient de clar, pentru a permite ca unui obiect s i se atribuie
un numr i numai unul i s permit s decidem concret i corect, ce numr
va fi atribuit fiecrui obiect, dar i suficient de simpl pentru a putea fi apli-
cat. (Vasilescu, 1992)
Spre exemplu, codificarea genului biologic al subiecilor, este o msu-
rare; dac persoana este brbat, i se acord valoarea 1 iar dac persoana este
femeie, i se acord valoarea 2. Observm c regula de atribuire nu permite
confuzii brbatul este notat cu 1 iar femeia cu 2 ofer o selecie exhausti-
v de categorizare a oricrui element care apare n mulimea gen biologic i
este suficient de simpl pentru a fi utilizat. Acesta este un proces de msura-
re conform definiiei lui Stevens, dei putem constata cu uurin lipsa posibi-
litii de ierarhizare. Nu putem construi, la acest nivel, o ierarhie a subieci-
lor, deoarece nivelul de msurare este unul categorial. Despre nivelurile i
scalele de msurare, vom discuta ns mai trziu.
Un alt exemplu de msurare l reprezint codificarea gradelor didacti-
ce: notm cu 0 preparatorul, cu 1 asistentul, 2 lectorul, 3 confereniarul, 4
profesorul. Observm, din nou, univocitatea i simplitatea regulii; ntr-o
universitate, fiecare cadru didactic poate s fac parte dintr-o categorie i
numai din una iar fiecare persoan se afl, la un moment dat, ntr-o asemenea
categorie. n plus, observm existena unei ierarhii; confereniarul este inferi-
or n grad profesorului i superior n grad lectorului, fr ns a se putea pre-
13
Statistic aplicat n tiinele socio-umane
ciza nici cu ct nici de cte ori. Aceasta este ns, din nou, o problem a nive-
lului de msurare, pe care o vom aborda ulterior.
I.1 Variabile
Am stabilit deja faptul c obiectele pot fi cunoscute prin msurarea
indicatorilor proprietilor sale. Aadar, obiectele devin msurabile prin stabi-
lirea caracteristicilor lor. Caracteristica este, prin urmare, o particularita-
te, o nsuire a unui obiect sau fenomen, care constituie obiectul msur-
rii. De exemplu, o mas poate fi caracterizat prin lungime, lime, nlime,
greutate, form, culoare etc. Toate acestea constituie caracteristici prin care
ncercm s descriem ct mai exact obiectul msurat. Cu ct avem mai multe
asemenea caracteristici, cu att obiectul se contureaz mai precis.
Caracteristicile prin care obiectul este descris, poart numele de vari-
abile. O variabil reprezint un concept cheie n statistic i nu este altceva
dect un nume pentru un element a crui principal proprietate este ace-
ea c variaz, i modific valorile. Prin aceast proprietate principal, vari-
abilele se disting de constante, elemente care au valori fixe. De exemplu,
ntr-un studiu efectuat pe o populaie general, genul biologic poate fi o vari-
abil dac lotul de cercetare cuprinde att brbai ct i femei. Dac ns in-
tenionm s desfurm o cercetare numai pe femei, atunci genul biologic
devine o constant, deoarece nu prezint proprietatea principal a variabile-
lor, aceea de a-i modifica valorile.
Modalitatea de realizare a unei variabile (modul n care i sunt atribui-
te valorile) constituie un eveniment ntmpltor (probabilistic), de aceea vari-
abila se mai numete i variabil aleatoare sau variabil stocastic. De
exemplu, nlimea unor elevi dintr-o clas este o variabil care poate lua
aleatoriu diferite valori pe care le pot avea elevii la aceast caracteristic.
Desigur, valorile pe care le poate lua variabila se grupeaz ntr-un anumit
interval de valori. Nu putem vorbi de elevi de 5 centimetri, dup cum nu pu-
tem gsi elevi de 5 metri. De aceea, putem considera c nlimea elevilor din
14
Cristian Opariuc-Dan
clasa a X-a este o variabil stocastic ce poate lua aleatoriu valori din dome-
niul de definiie 150 190 centimetri.
Aadar, elementele de baz care compun domeniul de definiie al unei
variabile aleatorii poart numele de valori sau scoruri. n momentul n care
aceste elemente sunt numere, variabila se mai numete i variabil alea-
numeric.
O variabil aleatorie exprim, aadar, variaia unei caracteristici.
Dup cum am spus, nlimea elevilor este o variabil alea-numeric; la fel
greutatea acestora, capacitatea toracic, temperatura corpului sau numrul de
la pantofi. Nu toate variabilele sunt ns alea-numerice. Culoarea ochilor,
culoarea prului, genul biologic, tipul temperamental etc. sunt variabile ale
cror valori nu pot fi exprimate prin numere, dei sunt i ele variabile aleato-
rii. Asemenea variabile nu sunt considerate variabile alea-numerice.
Toate aceste caracteristici pot fi msurate, nregistrate i catalogate i
de asemenea difer de la o persoan la alta sau de la o situaie la alta. De ace-
ea, toate aceste concepte le vom include sub denumirea generic de variabi-
le.
De ce suntem ns att de interesai de aceste variabile, de ce sunt im-
portante i la ce ne folosesc? Rspunsul este acela c, nu putem fi mulumii
doar cu ideea c variabilele variaz. Ne intereseaz, n principiu, s nele-
gem de ce variaz, cnd i n ce condiii variaz, care este efectul acestor va-
riaii ale lor. Pentru aceasta, variabilele vor trebui mai nti definite, apoi n-
registrate i n final supuse analizei, crend premisele extragerii unor conclu-
zii i, implicit, a generalizrii.
Realizarea unei variabile prin intermediul scorurilor creeaz posibili-
tatea abordrii conceptului statistic de frecven. Frecvena reprezint rs-
punsul la ntrebarea ci indivizi, cte cazuri populeaz fiecare categorie a
15
Statistic aplicat n tiinele socio-umane
variabilei sau, aa cum exprim T. Rotariu, numrul de indivizi statistici
care populeaz fiecare clas a caracteristicii (Rotariu, i alii, 2006).
Dac ne propunem s nregistrm persoanele dintr-o sal de curs sub
aspectul culorii ochilor vom avea, spre exemplu, 20 de persoane cu ochi al-
batri, 13 persoane cu ochi verzi, 15 persoane cu ochi negri i 50 de persoane
cu ochi cprui. Valorile care nsoesc categoriile variabilei culoarea ochilor
reprezint tocmai frecvenele mai exact frecvenele absolute deoarece mai
pot exista frecvene exprimate procentual (frecvene relative) i frecvene
cumulate, despre care vom discuta n urmtorul capitol.
O variabil aleatoare poate fi discret sau continu, dup cum mul-
imea de definiie a valorilor sale poate fi numrabil (discontinu) sau ne-
numrabil (continu)
1
.
I.1.1 Variabile discrete
n cazul variabilelor discrete (care, n funcie de nivelul de msurare
pot fi categoriale sau ordinale vom vedea imediat ce nseamn acest lucru)
mulimea de definiie a valorilor sale este o mulime discontinu (elemen-
tele sale pot fi numrate) iar ntre dou valori nu poate fi interpus, n perma-
nen, o valoare intermediar.
Spre exemplu, variabila culoarea ochilor este o variabil discret; ea
poate lua valorile: negru, cprui, verde, albastru i putem clasifica subiecii
ntr-una din aceste patru categorii. Iat c, mulimea de definiie a valorilor
aceste variabile este una numrabil (are doar patru valori) i nu avem posibi-
litatea ca ntre dou valori s includem, n permanen, o a treia valoare in-
termediar. Nu putem vorbi despre ochi verde-albastru i apoi verde-verde-
albastru i aa mai departe, la infinit.

1
Exist mai multe clasificri ale variabilelor. Le vom aborda atunci cnd situaia o va impu-
ne pentru a nu complica inutil, la acest nivel, expunerea noastr.
16
Cristian Opariuc-Dan
Un asemenea exemplu de variabil este o variabil discret nomina-
l sau variabil discret categorial, deoarece permite doar clasificri, fr
a putea vorbi de o relaie de ordine sau ierarhie ntre valorile pe care le poate
lua respectiva variabil.
Un alt exemplu de variabil discret este variabila grad didactic. Ea
poate lua valorile: preparator, asistent, lector, confereniar, profesor. Sigur c,
i n acest caz putem clasifica subiecii n funcie de gradul lor didactic. Nu
putem ns vorbi, nici acum, de o nou categorie intermediar, de exemplu
asistent-lector i apoi asistent-lector-lector i aa mai departe, lucru care i
confer caracterul discret. De data aceasta ns, putem pune o relaie de ordi-
ne ntre valorile variabilei. Putem vorbi de faptul c asistentul este inferior n
grad lectorului sau profesorul este superior n grad confereniarului. O ase-
menea variabil se numete variabil discret ordinal, sau variabil dis-
cret de rang.
I.1.2 Variabile continui
n cazul variabilei continui, mulimea de definiie a valorilor sale este
una continu, ne-numrabil. Aceste variabile se mai numesc i variabile
scalare (de interval sau de raport). n aceast situaie, ntre dou valori ale
variabilei continui putem gsi, oricnd, o valoare intermediar. Cu alte cuvin-
te, o caracteristic continu poate lua orice valoare ntre anumite limite.
Spre exemplu, variabila nlimea subiecilor este o variabil de tip
scalar (continuu). ntre un subiect de 178 centimetri i un subiect de 180 cen-
timetri, putem gsi, oricnd, un subiect de 179 centimetri, apoi ntre unul de
178 i unul de 179 putem gsi un subiect de 178,5 centimetri i aa mai de-
parte, la infinit.
O asemenea variabil se caracterizeaz prin faptul c, tipul de date
msurat de aceasta este format din uniti de dimensiune egal. Ca exemplu
de variabile continui putem da greutatea subiectului, intervalul de tip petrecut
17
Statistic aplicat n tiinele socio-umane
pentru a juca jocuri agresive pe computer etc. Astfel, nlimea subiecilor o
putem msura n centimetri, greutatea n kilograme, timpul n minute sau ore,
toate acestea fcnd referire la un nalt nivel de precizie, cu valori zero abso-
lute i posibiliti de construire a scalelor de raport putem spune, de exem-
plu, c un subiect este de dou ori mai greu dect altul sau de dou ori mai
nalt.
I.2 Scale (nivele) de msurare
n capitolul anterior am vzut c variabilele discrete pot fi categoriale
sau de rang; cele continui de interval sau de raport. Dac acceptm definiia
lui Stevens, atunci putem intui c msurarea poate fi realizat la diferite nive-
luri de msurare, organizate ca n figura de mai jos.
Nivelul nominal de msurare (clasificare) i nivelul ordinal (de rang
sau ierarhic) se grupeaz n
scala neparametric (non-
metric) de msurare.
Nivelul de interval (in-
tervale egale) i nivelul de
raport (proporii) formeaz
scala parametric (metric)
de msurare.
Observm c termenul
de cuantificare dobndete sens ncepnd cu scala ordinal, deoarece abia la
acest nivel ne permitem realizarea unor ierarhii. Scala nominal nu accept
cuantificare ci doar clasificare.
Se cuvine s facem meniunea c, proprietile scalelor sunt incremen-
tale, adic proprietile unui nivel inferior de msurare sunt valide i la un
nivel superior de msurare, ns nu i reciproc.
Nominal
Ordinal
Interval
Raport
Parametric
Neparametric
Cuantificare
Figura 1.1 Reprezentarea schematic a nivelurilor de
msurare
18
Cristian Opariuc-Dan
I.2.1 Scale neparametrice
Grupeaz scala nominal i scala ordinal, scale la nivelul crora pu-
tem pune, cel mult, o relaie de ordine ntre nivelurile variabilei. Nu putem
vorbi de parametri i nici de statistici metrice. Nu are sens calculul mediei
sau al altor indicatori din sfera metric, deoarece nu putem stabili un interval
(cu ct) fa de care o valoare este mai mare n comparaie cu alta.
I.2.1.1 Scala nominal (de clasificare)
Reprezint primul nivel de msurare i const n clasificarea obiecte-
lor n funcie de existena sau inexistena unei caracteristici. Aceast clasifi-
care presupune existena unor categorii disjuncte, astfel nct fiecare obiect
s-i gseasc locul ntr-o categorie i numai n una (Vasilescu, 1992).
Pentru ca scala s aib sens, trebuie s existe cel puin dou categorii.
O variabil nominal cu dou categorii poart numele de dihotomie sau cla-
sificare dihotomic. Dac exist mai multe categorii, vorbim despre
polihotomii sau clasificri multiple (polihotomice). mprirea subiecilor
n brbai i femei reprezint o clasificare dihotomic. mprirea n funcie
de profesie, culoarea ochilor sau a prului, grupa sanguin etc. sunt tot attea
exemple de polihotomii.
n mod curent folosim aceast scal n vederea categorizrii subieci-
lor n funcie de unul sau mai multe criterii (de obicei n cercetarea psihologi-
c sau sociologic) sau atunci cnd culegem date n urma anchetei sau obser-
vaiei.
Proprieti ale scalei:
Transformrile permise la nivelul acestei scale sunt (Vasilescu,
1992):
o Redenumirea atribuirea unor noi nume (n loc de mascu-
lin/feminin putem spune brbat/femeie);
19
Statistic aplicat n tiinele socio-umane
o Permutarea schimbarea ordinii elementelor, deoarece nu
se poate stabili o ierarhe ntre valorile unei variabile pe
aceast scal. Aceast proprietate este caracteristic doar
scalei nominale.
Operaii statistice permise n principal operaiile de baz, deriva-
te din numrare, astfel:
o Frecvena absolut i relativ (procentul), cte observaii
au fost incuse n fiecare categorie (de exemplu 25 de br-
bai i 40 de femei sau 30% brbai i 78% femei);
o Valoarea modal (modul), categoria cu frecvena cea mai
mare (de exemplu din 200 de subieci, 150 au ochi albatri,
aceasta fiind categoria cu frecvena cea mai mare mo-
dul);
o Verificarea statistic prin
2
procedeu de comparare a
frecvenelor i de verificare dac diferenele dintre ele sunt
ntmpltoare sau, din contra, semnificative, nentmpl-
toare;
o Coeficieni de corelaie ntre dou variabile cu dou valori
fiecare, coeficientul , coeficientul tetragoric, coeficientul
de contingen, toate bazndu-se pe lucrul cu frecvene ab-
solute sau relative.
I.2.1.2 Scala ordinal (de rang sau topologic)
Reprezint al doilea nivel de msurare i const n ierarhizare, n
funcie de mrimea unei caracteristici, fr ns a se putea preciza cu ct un
nivel ierarhic este superior sau inferior altuia i nici de cte ori.
Spre deosebire de scala nominal (ale crei proprieti le include),
scala ordinal permite stabilirea unei relaii de ordine ntre date.
20
Cristian Opariuc-Dan
Strict vorbind, acesta este nivelul la care ne situm n tiinele socio-
umane n general i n psihologie n particular. Din perspectiva statisticii, ca
disciplin matematic, nu putem vorbi de medie, abatere standard sau ali
indicatori care presupun un nivel de msur cel puin de interval, deoarece o
asemenea scal nu exist n domeniul socio-uman la o rigoare (nc) demon-
strabil matematic. Scorurile testelor de inteligen, aptitudini, personalitate
sunt variabile avnd valori simplu ordonate la un nivel ordinal de msur. Un
test de inteligen nu ne arat, de fapt, cantitatea de inteligen a subiecilor,
ci ierarhizarea acestora, poziia, rangul pe care l ocup fiecare ntr-o popula-
ie.
Lansarea, n 1905, a scalei metrice a inteligenei de ctre Alfred Binet,
se fcea cu urmtoarea meniune din partea autorului: calitile intelectuale
nu se msoar precum lungimile, nu satisfac cerina aditivitii; scala permi-
te un clasament ierarhic ntre inteligene diferite i, din raiuni practice,
acest clasament echivaleaz cu o msurare. (Radu, i alii, 1993). Autorul a
sesizat foarte bine limitele msurrii n tiinele socio-umane nc din acea
perioad, limite pe care muli psihologi actuali astzi le ignor. Nu ne mir
faptul c, matematicienii consider aplicarea statisticii n psihologie ca fiind
defectuoas.
Datorit faptului c, dac ne-am limita doar la o msurare pe scala or-
dinal, metodologia psihologic i psihosociologic ar fi srcit de aportul
statisticilor parametrice (tari), pentru anumite msurtori se accept utiliza-
rea scalei de interval prima care permite calculul mediei i a abaterii stan-
dard ns, acest lucru se face printr-un important compromis statistico-
matematic (Clocotici, i alii, 2000).
Variabile precum gradul didactic, gradul militar, nivelul de educaie
se gsesc la acest nivel de msurare, deoarece pe lng posibilitatea clasific-
rii, a includerii unui individ ntr-o categorie, avem i posibilitatea ordonrii
categoriilor, putnd afirma c o categorie este superioar sau inferioar alteia.
21
Statistic aplicat n tiinele socio-umane
Dac lum, de exemplu, gradele militare, putem spune c ntr-o unita-
te se afl 30 de locoteneni, 10 maiori i 60 de cpitani sau 15% locoteneni,
5% maiori i 30% cpitani (ne aflm la un nivel nominal de msur) dar i c
maiorii sunt superiori n grad cpitanilor sau locotenenii sunt inferiori n
grad cpitanilor (nivelul ordinal de msur). Nu putem preciza ns cu ct i
nici de cte ori o categorie este superioar sau inferioar alteia. Nu putem
afirma c doi locoteneni fac ct un cpitan. De asemenea, este absurd s
vorbim despre medie. Care este media dintre un locotenent i un cpitan??!!!
Proprieti ale scalei:
Aa cum am admis anterior, proprietile specifice scalei ordinale le
includ pe cele ale scalei nominale, astfel nct la cele ale scalei anterioare se
adaug (Vasilescu, 1992):
Transformrile permise la nivelul acestei scale sunt cele care nu
afecteaz ordinea iniial. Astfel de operaii sunt ridicarea la pute-
re sau, inversa ei, extragerea de radicali. Din aceste operaii, deri-
v:
Operaiile statistice permise:
o Frecvena sumelor n valori cumulate i procentuale, valo-
rile categoriale i categoriale procentuale, valori categoria-
le centile, valori de mprtiere;
o Procedee bazate pe date categoriale: testul semnului,
Mann-Whitney, Wilcoxon, Kolmogorov-Smirnov, analiza
de varian Kruskal i Wallis;
o Coeficieni de corelaie de rang: Spearman, Kendall.
I.2.2 Scale parametrice
Cuprind scalele de interval i de raport. ncepnd de la acest nivel, pu-
tem vorbi de statistici parametrice sau metrice. Are sens de acum s calculm
22
Cristian Opariuc-Dan
media, abaterea standard sau ali indicatori care fac parte din statisticile nu-
mite i statistici tari.
I.2.2.1 Scale de interval (intervale egale)
Reprezint al treilea nivel de msurare i deriv din scala ordinal, la
care se adaug proprietatea c intervalele dintre un nivel de valori i altul
sunt egale. Este un tip de msurare n care distanele dintre treptele scrii sunt
distane egale sub aspectul cantitii caracteristicii de msurat.
n psihologie practic nu ntlnim aceast scal dect n domeniul psi-
hofiziologiei, n care nregistrm timpi de reacie, numr de erori, fora unei
reacii etc. Acest nivel de msurare ne permite s rspundem la ntrebarea cu
ct este mai mare dar nu i la ntrebarea de cte ori, deoarece la nivelul
acestei scale nu ntlnim un punct zero absolut, ci unul arbitrar ales.
Un exemplu clasic de scal de interval este scala de temperatur Cel-
sius. Dup cum tim, punctul de zero grade Celsius este un punct arbitrar
ales, definit ca punctul de nghe al apei la presiunea atmosferic de la nivelul
mrii. Intervalele acestei scale sunt egale, ceea ce ne permite s spunem c
apa dintr-o gleat este mai cald cu 10 grade Celsius dect apa dintr-o alt
gleat, dar nu i c apa este de dou ori mai cald, deoarece punctul zero nu
este un zero absolut.
Prin analogie, ne putem referi i la scorurile unui test de inteligen
dac admitem compromisul menionat n subcapitolul anterior. Putem spune
c, ntre un subiect cu un IQ de 60 i unul cu un IQ de 120 exist o diferen
de 60 de puncte, dar nu c cel cu un IQ de 120 este de dou ori mai inteligent
dect cel cu un IQ de 60. n definitiv, nu avem o inteligen zero. La o privire
mai atent observm i compromisul efectuat. Performana la un test de inte-
ligen depinde de mai muli factori, nu numai de cei legai de inteligen.
Astfel, intervin motivaia, memoria, atenia, condiiile de examen etc. Este
cert c cel de al doilea subiect este mai inteligent dect primul (ne situm
23
Statistic aplicat n tiinele socio-umane
acum la nivel ordinal), ns a afirma, chiar i c este mai inteligent cu 60 de
uniti pe scala IQ, consider c este hazardat (la nivel de interval). n defini-
tiv, la o reexaminare a celor doi subieci cu acelai test exist o probabilitate
foarte mare ca aceast distan, de 60 de puncte, s nu se pstreze. Iat o m-
surare care, dei la prima vedere pare la nivel de interval, totui, mai exact, o
putem situa la nivel ordinal. Diferena dintre scala inteligenei i scala tempe-
ratorilor Celsius este totui foarte mare. Mai mult, intervalele pe o scal IQ
sunt doar aparent egale. Diferena de 5 puncte IQ dintre un subiect cu un
IQ de 60 i unul cu un IQ de 65 are cu totul alt sens n comparaie cu diferen-
a dintre un subiect cu un IQ de 120 i altul cu un IQ de 125 i, de asemenea,
se deosebete de diferena dintre doi subieci cu IQ 100 i 105. Cele 5 punc-
te IQ nu sunt, n aceste cazuri, egal distanate.
Proprieti ale scalei:
Transformrile permise la acest nivel sunt cele de tip liniar, carac-
teristice ecuaiei y=ax+b unde a>0 iar y este valoarea transforma-
t, x valoarea care urmeaz a fi transformat, a constanta de
extindere i b constanta de deplasare (Vasilescu, 1992).
o Deplasri prin mrirea punctului zero relativ la o alt
valoare (modificarea constantei b);
o Extinderi amplificarea sau diminuarea intervalelor scalei
cu acelai factor (modificarea constantei a), fr s deteri-
orm rezultatul msurtorilor (de exemplu transformarea
din note z n stanine sau sten).
Operaii statistice permise:
o Calculul mediei aritmetice, abaterii standard, boltirii i si-
metriei;
o Statistici parametrice: testul t Student, F Fisher, ana-
liza de varian;
24
Cristian Opariuc-Dan
o Toate tipurile de corelaii: r Pearson, raport de corelaie
(R), coeficientul de regresie (b)
Anumite operaii statistice, dei presupun scala de interval, necesit i
ndeplinirea altor condiii i anume respectarea unei legi de distribuie, n
general legea distribuiei normale (gaussiene). Prin urmare, n analiza datelor,
pe lng cerina nivelului de interval se impune i analiza distribuiei datelor
nregistrate. Transformrile permise la nivelul acestei scale au o importan
practic deosebit atunci cnd procedm la normalizarea unei distribuii sta-
tistice de date.
I.2.2.2 Scala de raport (proporii)
Ultimul nivel de msurare i cel mai precis este reprezentat de
scala de raport care are toate caracteristicile unei scale de interval la care se
adaug existena unui zero absolut. n sfrit, aceast scal permite s rs-
pundem la ntrebarea de cte ori, deoarece existena unui zero absolut face
posibil compararea proporiilor.
De exemplu, dac un subiect are greutatea de 60 de kilograme iar un
altul 120 kilograme, putem spune c al doilea subiect este cu 60 de kilograme
mai greu dect primul, dar i c al doilea subiect este de dou ori mai greu
dect primul, ambele afirmaii avnd sens.
Din nefericire, un asemenea nivel de precizie nu poate fi atins n tiin-
ele socio-umane, deoarece este imposibil s gsim o variabil care s admit
un zero absolut. Este absurd s vorbim de o inteligen zero, de o emotivitate
zero, de depresie sau anxietate zero.
Proprieti ale scalei (Vasilescu, 1992):
Transformrile permise la acest nivel sunt cele de tip multiplica-
tiv, caracteristice ecuaiei y=ax unde a>0, iar y este valoarea
transformat, x valoarea ce va fi transformat iar a constanta
de extindere. Observm dispariia constantei b, constanta de de-
25
Statistic aplicat n tiinele socio-umane
plasare, deoarece punctul zero este un punct de referin absolut i
nu unul arbitrar ales. La fel ca i n cazul scalei de interval, putem
amplifica sau diminua intervalul (prin modificarea constantei a)
ns nu putem opera deplasri, deoarece acest lucru ar determina
scderea preciziei ctre o scal de interval (am stabili un punct ze-
ro arbitrar i nu absolut)
Sunt permise toate operaiile statistice, inclusiv calculul mediei
geometrice i al coeficientului de variaie.
I.3 Prezentare general SPSS
for Windows
2

SPSS sub Windows reprezint un
pachet de programe interactiv, de utilitate
general, destinat analizelor de date i in-
clude multiple faciliti i tehnici de natur
statistic. Pachetul de programe SPSS sub
Windows reprezint o aplicaie care folose-
te ntreaga funcionalitate a sistemului de
operare Windows, regsind n structura sa utilizarea mausului, ferestrele re-
dimensionabile i scalabile, meniuri derulante,
casete de dialog etc. Dei majoritatea utiliza-
torilor vor fi complet satisfcui utiliznd doar
interfaa grafic pe care SPSS o pune la dispo-
ziie, totui pachetul de programe dispune i
de un puternic limbaj de comenzi prin care se
pot realiza activiti automate (scripturi) ce
determin eficientizarea aciunilor utilizate n
Figura 1.2 Lansarea programului
SPSS for Windows
Figura 1.3 Fereastra logo
SPSS for Windows

2
Pe parcursul acestei prezentri, unele imagini sunt din SPSS 12.0 for Windows. Acest lucru
nu incomodeaz n utilizarea altor versiuni. Toate imaginile utilizate reprezint marc nre-
gistrat SPSS Inc.
26
Cristian Opariuc-Dan
mod frecvent sau efectuarea unor aciuni complexe, indisponibile n interfaa
grafic (SPSS, 2001).
Programul SPSS, la fel ca orice alt aplicaie sub sistemul de operare
Windows, indiferent de versiunea acestuia, la instalare i creeaz un grup de
pictograme (iconuri) n seciunea Programs a meniului Start din sistemul de
operare Windows. Pentru a putea lansa n execuie aplicaia, va trebui ca mai
nti s efectuai clic cu maus-ul pe butonul start al desktop-ului Windows,
buton situat de obicei n partea din stnga jos a ecranului. Apoi mergei la
seciunea Programs i se va deschide o nou list care conine toate progra-
mele instalate n calculatorul dumneavoastr (ei bine, cel puin programele la
care avei acces dumneavoastr). n aceast list cutai grupul de programe
SPSS for Windows, grup n care vei gsi pictogramele de lansare ale aplica-
iei SPSS. Probabil c ai identificat deja n acest grup de programe picto-
grama numit SPSS for Windows. Aceasta este imaginea pe care va trebui
s facei clic pentru a porni aplicaia.
3

SPSS este un program extrem de complex.
Lansarea acestuia debuteaz cu prezentarea unei
ferestre introductive, denumit i fereastr logo.
Ea cuprinde informaii despre versiunea programu-
lui (n cazul nostru SPSS 12.0 Standard) deoarece
exist i versiuni server, mai complexe, versiuni
demonstrative (ca aceea pe care o putei descrca
gratuit de la http://www.spss.com) sau student
pentru nvare, etc. precum i despre posesorul
licenei de utilizare a acestui produs informatic. Se
cunoate faptul c, n conformitate cu legea dreptu-
Figura 1.4 Fereastra introductiv

3
Desigur, n condiia n care SPSS for Windows este deja instalat pe calculatorul dumnea-
voastr. Dac nu avei instalat SPSS for Windows, putei descrca o versiune demonstrativ
de 30 de zile de pe site-ul http://www.spss.com Asigurai-v c avei o conexiune suficient
de rapid i de stabil la Internet deoarece fiierul este destul de mare (aproximativ 160 MB)
27
Statistic aplicat n tiinele socio-umane
lui de autor i protecia creaiilor intelectuale, un produs software poate fi
utilizat doar n cazul n care se posed o licen de utilizare pentru acesta,
altfel riscndu-se pedepse severe, contravenionale sau de natur penal.
Dup cteva secunde, fereastra de prezentare se dezactiveaz iar apli-
caia prezint o interfa prietenoas prin care ne invit s trecem la treab.
Putem n aceast etap s lansm n execuie un program tutorial care ne va
forma abilitile de baz n vederea utilizrii acestui pachet informatic com-
plex; de asemenea putem trece direct la introducerea datelor sau putem rula o
cerere predefinit, se poate crea o nou cerere de date sau se poate deschide o
baz de date existent, situaie n care va trebui s precizm locaia acesteia.
Nu n ultimul rnd, putem deschide o baz de date ntr-un alt format, de
exemplu Excel, Statistica sau SAS, iar SPSS va ti s converteasc aceste
date pentru a le face disponibile.
Exist, de asemenea, n partea de jos a acestui formular introductiv, o
caset denumit Dont show this dialog in the future Dac o vei bifa,
avei posibilitatea ca la viitoarea lansare a produsului s nu se mai afieze
acest formular iar programul
va trece direct n fereastra
principal SPSS.
Desigur, alegerea unei
opiuni dintre cele prezentate
mai sus nu nseamn i execu-
tarea acesteia de ctre SPSS.
Pentru a lansa n execuie op-
iunea aleas, va trebui apsat,
obligatoriu, butonul OK. Ap-
sarea butonului Cancel indic
Figura 1.5 Fereastra principal SPSS
28
Cristian Opariuc-Dan
programului c trebuie s prseasc formularul introductiv i s lanseze fe-
reastra principal SPSS n modul de lucru configurat pentru o nou baz de
date.
n acest moment, nu ne intereseaz niciuna dintre opiunile predefini-
te, astfel nct vom apsa butonul Cancel. Iat c formularul prezentat mai
sus a disprut, fcnd loc ferestrei principale SPSS. S privim cu atenie
aceast nou interfa cu utilizatorul.
Ca orice alt aplicaie Windows, SPSS posed o bar de titlu bara
albastr din partea de sus a ferestrei n partea stng a acesteia afindu-se
mesajul Untitled SPSS Data Editor. Acest mesaj ne informeaz c ne
aflm n fereastra de date (editare a datelor) din SPSS iar baza de date nu a
fost nc salvat (n momentul salvrii, textul Untitled este nlocuit cu nu-
mele fiierului salvat pe disc). n partea dreapt a barei de titlu avem cele trei
butoane clasice ale oricrei ferestre Windows: butonul de minimizare sau de
transfer a aplicaiei n bara de sarcini, butonul de maximizare extindere a
aplicaiei pe ntregul ecran sau de restaurare a aplicaiei la dimensiunile inii-
ale i butonul de nchidere a aplicaiei, acel buton n form de X. Sub bara
de titlu se afl meniurile, serii de etichete purtnd fiecare un nume (n limba
englez), prin intermediul crora putem comanda SPSS i putem efectua ope-
raiile i prelucrrile de care acesta este capabil. Nu vom insista acum asupra
explicrii tuturor meniurilor, acest lucru l vom face pe parcursul prezentului
curs. Bara de meniuri este urmat de bara de instrumente mici butoane cu
aspectul unor pictograme care n general dubleaz anumite funcii din meni-
uri, funcii mai des folosite. SPSS prezint o bar de instrumente dinamic,
adic aspectul butoanelor i desigur funcionalitatea acestora se modific re-
laionat contextului n care ne aflm. De exemplu, vom avea anumite butoane
n modul de introducere a datelor i alte butoane n modul de definire a varia-
bilelor ori la afiarea rezultatelor analizelor de date.
29
Statistic aplicat n tiinele socio-umane
Dup bara de instrumente, apare
seciunea de editare a datelor. Aceasta
este format dintr-o parte needitabil, in-
formativ, partea din stnga, n care se
afieaz n permanen poziia celulei
active (celul pe care am selectat-o). Formatul acestui identificator este un
numr urmat de dou puncte i apoi numele variabilei (spre exemplu, 8:time
nseamn c suntem poziionai pe rndul 8 a opta nregistrare a variabilei
timp). Partea editabil arat ntotdeauna valoarea acestei variabile n poziia
specificat (n cazul nostru, la rndul 8 al variabilei timp se afl valoarea 34).
Cea mai mare parte a ferestrei principale SPSS este dedicat seciunii
de date. Observm c datele, n SPSS, sunt organizate tabelar, pe linii i co-
loane, analog altor aplicaii mai cunoscute cum ar fi foile de calcul tabelar
(Excel) sau bazele de date (FoxPro sau Access). Liniile (nregistrrile) sunt
identificate prin numere iar coloanele reprezint variabilele. ntr-o baz de
date goal toate variabilele sunt denumite implicit var iar aceast denu-
mire este scris cu culoarea gri, reprezentnd faptul c acestea nu au fost nc
definite. Navigarea prin baza de date se poate face cu cele dou casete de
derulare (numite i lifturi sau controale de derulare) situate n partea dreapt,
respectiv n partea de jos a ferestrei de date, la fel ca n orice program Win-
dows.
Seciunea de date conine, n partea din stnga-
jos, doi marcatori de seciune foarte importani: Data
View i Variable View. Aceste elemente permit co-
mutarea ntre modul de vizualizare a datelor dintr-o
baz de date (seciunea Data View) i modul de defini-
re al variabilelor (seciunea Variable View).
Figura 1.6 Seciunea de
editare a datelor
Figura 1.7 Marcato-
rii de seciune
n partea de jos a programului SPSS se afl bara de status cu dou
seciuni: seciunea de informaii, n partea stng, unde se afieaz scurte
30
Cristian Opariuc-Dan
instruciuni despre diferitele funcii ale meniurilor sau ale barei de instrumen-
te i seciunea de stare a procesorului SPSS unde se afieaz informaii referi-
toare la rularea unor sarcini mari consumatoare de timp. n general, nceperea
unei prelucrri statistice se poate face doar n condiiile n care vedei mesajul
SPSS Processor is ready n aceast seciune.
Prsirea programului SPSS se poate face fie apsnd butonul de n-
chidere al aplicaiei X din colul din dreapta sus al ferestrei principale, fie
folosind meniul File i apoi Exit. Dac ai fcut prelucrri de date sau modi-
ficri n baza de date, programul v va solicita mai nti salvarea documentu-
lui, ca msur de protecie mpotriva pierderii de informaie. Despre salvare
ns discutm n subcapitolul urmtor.
I.3.1 Bazele de date creare, salvare, deschidere
Dup ce ne-am familiarizat cu interfaa programului SPSS, este mo-
mentul s vedem cum putem deschide o baz de date existent i care sunt
elementele componente ale acesteia. SPSS vine nsoit de o serie de baze de
date demonstrative n scopul facilitrii procesului de nvare. Pe parcursul
acestor exerciii vom folosi, din raiuni de
compatibilitate, aceste exemple de baze de
date oferite de ctre productorii programului
SPSS.
Deschiderea unei baze de date n sco-
pul efecturii prelucrrilor statistice se poate
face prin mai multe metode, rmnnd la lati-
tudinea i la experiena dumneavoastr s ale-
gei metoda care v convine mai mult.
Prima metod este aceea prin care ape-
lm la meniul File (Fiier) i apoi poziionm
cursorul maus-ului pe submeniul Open (Des-
Figura 1.8 Deschiderea
unei baze de date
31
Statistic aplicat n tiinele socio-umane
chide). Apare o list de unde putem deschide o baz de date (Data), o proce-
dur de sintax (Syntax) o foaie de rezultate (Output), un set de comenzi
(Script) sau un alt tip de fiier (Other). Pentru a deschide o baz de date, va
trebui selectat opiunea Data. Observai c fiecare dintre aceste opiuni este
urmat de puncte de suspensie (). ntotdeauna cnd vei ntlni aceste
puncte de suspensie alturi de o comand Windows (nu doar n SPSS ci n
orice program Windows) va trebui s tii c acea comand v invit la dia-
log. Adic se va deschide o nou fereastr de unde va trebui s alegei ceva
sau s furnizai anumite informaii programului pentru a putea executa co-
manda respectiv.
O alt metod prin care putei deschide o baz de date este folosirea
aa numitelor taste rapide. De obicei, meniurile sunt nsoite de combinaii
de taste prin care putei efectua direct o anumit sarcin. n loc s apelm la
meniul File apoi Open i apoi Data, putem pur i simplu s inem apsat
tasta Ctrl n timp ce apsm tasta O (de la Open). O astfel de combinaie se
noteaz prin Ctrl+O, notaie pe care o vom folosi pe ntreg parcursul acestui
curs. Vom observa c aceast combinaie are acelai efect ca i parcurgerea
primei metode, avantajul fiind acela c este mult mai rapid.
A treia metod apeleaz la numitele taste fierbini (hot-keys). O
tast fierbinte este o tast folosit n combinaie cu tasta Alt. Dac vei
privi cu atenie meniurile, vei putea observa c unele litere sunt subliniate
de exemplu n meniul File este subliniat litera F. innd apsat tasta Alt i
apsnd apoi tasta F vom obine deschiderea meniului File, ca i cnd am
efectua clic pe acesta. n mod analog, notarea acestei combinaii se face folo-
sind convenia Alt+F. Deci, pentru a deschide o baz de date putem folosi
combinaiile Alt+F deschiderea meniului File i apoi Alt+O deschiderea
submeniului Open iar n final Alt+A accesarea opiunii Data. Este, dac
dorii, o navigare prin meniuri fr maus.
32
Cristian Opariuc-Dan
Ultima metod se refer la folosirea barei de instrumente pentru a
deschide o baz de date. Pur i simplu apsai pe primul buton de pe bara de
instrumente, acela care are aspectul unui dosar deschis.
Indiferent de metoda folosit, efectul va fi acelai: deschiderea unei
casete de dialog din care putei alege baza de date pe care o vei ncrca (v
mai amintii nota referitoare la punctele de suspensie?)
S analizm puin aceast nou fe-
reastr. n partea de sus avem o list deru-
lant intitulat Look in: Apsnd sgeata
orientat n jos partea dreapt a acestei
casete vom putea alege directorul n care
este localizat baza noastr de date. Ob-
servm c directorul curent este directorul
aplicaiei (SPSS) iar n seciunea de sub
aceast caset este afiat coninutul acestui
dosar. Putei astfel selecta orice director n
care avei fiiere recunoscute de SPSS pentru a le putea afia i/sau deschide.
Alturi de caseta Look in se afl o serie de butoane care controleaz naviga-
rea prin structura de directoare de pe discul dumneavoastr. Primul buton, cel
de forma unei sgei orientate n partea stng, permite navigarea la ultima
aciune efectuat. Dac, de exemplu, din directorul SPSS v-ai poziionat pe
directorul Windows, apsnd acest buton vei reveni din nou n directorul
SPSS. La prima deschidere a acestei casete de dialog, butonul este inactiv
deoarece nu ai efectuat nc nici o aciune care s fie nregistrat. Al doilea
buton, de forma unui dosar cu o sgeat orientat n sus, permite navigarea
ascendent prin arborele de directoare. La o prim apsare v vei deplasa n
directorul Program Files, la urmtoarea v vei situa n directorul rdcin C:
i aa mai departe. Cel de-al treilea buton permite crearea unui nou director
n directorul curent. Apsnd pe el vei putea crea un nou director, numit
New Folder, denumire pe care o vei putea modifica dup dorin. n sfrit,
Figura 1.9 Fereastra de selectare a
fiierului n vederea deschiderii
33
Statistic aplicat n tiinele socio-umane
ultimul buton controleaz modul n care se afieaz pictogramele n caseta
central. Putei alege vizualizarea pictogramelor n format mare, mic, sub
form de list sau list detaliat.
Fereastra central afieaz, dup cum am menionat, structura de sub-
directoare i fiiere a directorului curent. Putei efectua dublu clic pe numele
unui director pentru a afia coninutul acestuia sau pe numele unui fiier pen-
tru a-l deschide n mod direct (fr a mai apsa butonul Open). Dac efectuai
doar un simplu clic, numele fiierului selectat va fi afiat n caseta File name
i va trebui s folosii apoi butonul Open pentru a-l deschide. Caseta derulan-
t Files of type reprezint un filtru pentru fiierele afiate. Dac o vom des-
chide, efectund clic pe sgeata orientat n jos din partea dreapt a acesteia,
vom putea alege ce anume tip de fiiere s se afieze n seciunea central.
Observm c, dei directorul SPSS conine mai multe fiiere, sunt afiate
doar fiierele cu extensia .sav, adic fiierele ce conin baze de date SPSS,
deoarece n aceast caset de filtrare s-a ales extensia .sav. Putem alege alte
extensii de fiiere ce sunt afiate, de exemplu formatul Excel (.xls) sau dBase
(.dbf) iar SPSS va afia doar fiierele ce au aceast extensie.
Deschiderea propriu-zis a unui fiier se face fie efectund clic pe
acesta i apsnd butonul Open fie efectund dublu clic pe numele fiierului.
Spre exemplu, vom ncrca baza de date Cars din directorul implicit SPSS,
baz de date ce reprezint un inventar al diferitelor tipuri de maini i a carac-
teristicilor acestora.
Dup deschidere observm c s-a modificat aspectul ferestrei princi-
pale SPSS. n primul rnd, n bara de titlu a aprut mesajul Cars SPSS Da-
ta Editor, mesaj ce ne informeaz c am deschis baza de date Cars i este
pregtit pentru analiz. De asemenea, constatm c structura acesteia este
compus din opt variabile, fiecare dintre ele reprezentnd o anumit caracte-
ristic a mainilor. Ultima variabil, variabila Filter_$ este o variabil in-
tern folosit de programul SPSS pentru o filtrare anterioar a datelor, varia-
34
Cristian Opariuc-Dan
bil pe care ne propunem s o tergem. Cum? Efectund clic pe numele aces-
teia. Observm c ntregul coninut al coloanei Filter_$ s-a selectat. n con-
tinuare, apsm tasta Delete, situat pe tastatur, n partea dreapt a grupului
principal de taste, iar variabila a fost eliminat mpreun cu toate datele aces-
teia. Felicitri. Iat i prima dumneavoastr intervenie real n SPSS. Dup
cum bine tim, orice prim intervenie ntr-un program nseamn o tergere
a ceva. Nici noi nu puteam face excepie!
Baza de date deschis de ctre dumneavoastr a fost afiat n seciu-
nea Data view fapt care ne atrage atenia c n acest mod putem afia i ur-
mri coninutul datelor din baza de date. Dac vom efectua clic pe seciunea
Variable view vom intra n modul de definire al datelor. Dup cum ne spune
i numele seciunii, aici putem vizualiza i edita denumirea, tipul i alte in-
formaii referitoare la variabile. Ca s folosim un limbaj mai tehnic, dac n
Data view ne aflm n seciunea datelor propriu zise, n Variable view ne
aflm n seciunea meta-datelor, adic n seciunea informaiilor despre date
unde putem interveni asupra structurii lor interne. Vom clarifica imediat, prin
cteva exemple, aceste aspecte.
Astfel, prima variabil, denumit mpg este o variabil numeric, ce
accept maximum 4 caractere (adic cifre ntre 0 i 9999) i fr zecimale.
Numele mpg nu este ns un nume intuitiv i nu ne putem da seama cu pre-
cizie la ce se refer aceast variabil. Din pcate, doar versiunile de SPSS de

Figura 1.10 Seciunea de definire a variabilelor
35
Statistic aplicat n tiinele socio-umane
la 13.0 n sus accept nume de variabile cu mai mult de 8 caractere, ns nu
se permite includerea spaiilor sau a altor semne de punctuaie n denumirea
acestora i de aceea va trebui s fim foarte restrictivi n momentul n care le
crem. Pentru a nelege mai uor la ce anume se refer o anumit variabil,
avem posibilitatea de a o eticheta, adic de a include un text descriptiv asoci-
at numelui ei. n cazul nostru, eticheta variabilei ne informeaz c mpg se
refer la Miles per Gallon adic la consumul automobilului exprimat n
distana pe care acesta o poate parcurge cu un galon de combustibil.
Urmtoarea seciune prezint valorile pe care le putem defini pentru
respectiva variabil. Iat, n cazul variabilei origin care se refer la ara de
producie a mainilor observm c s-a asociat valoarea 1 pentru mainile de
producie american, valoarea 2 pentru cele de producie european i valoa-
rea 3 pentru cele japoneze.
n spaiul destinat definirii variabilelor avem de asemenea posibilita-
tea de a controla modul de tratare al cazurilor lips, alinierea datelor n cadrul
celulelor i definirea tipului de variabil nominal, ordinal i scalar.
Efectund clic pe aceste seciuni ai observat c uneori apare n partea
dreapt a acestora fie un buton cu punctele de suspensie care va deschide o
caset de dialog unde se pot controla parametrii valorilor acceptate, fie un
buton de incrementare/decrementare cu ajutorul cruia putei mri respectiv
micora o anumit valoare, fie o caset de selecie sgeata orientat n jos
prin care putei deschide o list, de unde s selectai anumite valori.
Exerciiu practic:
n exerciiul ce urmeaz vom traduce pur i simplu n romnete
structura acestei baze de date i vom salva baza de date sub un nou nume,
Masini (atenie, nu folosii diacritica romneasc ci s. Deci nu vom salva
cu Maini ci Masini) ntr-un director nou creat avnd calea
C:\Exercitii SPSS (aceeai meniune referitoare la diacritice).
36
Cristian Opariuc-Dan
n cazul primei variabile, numele va rmne acelai, iar noi vom mo-
difica doar descrierea. Vom da clic n seciunea Label acolo unde se afl afi-
at textul Miles per Gallon i vom scrie textul Mile per galon.
A doua variabil se numete engine. Vom schimba numele acesteia
n cilindree (ne-am ncadrat n 8 caractere), fcnd clic n coloana Name i
scriind noul nume. Eticheta va deveni, pentru a doua variabil, Capacitate
cilindric, pe care o vei modifica dup exemplul primei variabile.
Procedm la fel n cazul variabilelor 2, 3, 4, 5 i 6, lsnd traducerea
din englez n romn la latitudinea dumneavoastr. Atenie ns la acel ma-
ximum de 8 caractere cnd redenumii o variabil.
Variabila numrul 7 se refer la
ara de origine a mainilor. O vom rede-
numi origine i vom modifica, desigur,
eticheta. Exist ns, la acest nivel, un
element n plus i anume coloana
Values. V mai amintii probabil de ma-
inile americane, europene i japoneze.
Dac vom da clic pe celula corespunz-
toare coloanei Values pentru aceast
variabil constatm apariia unui mic buton cu puncte de suspensie n partea
dreapt a celulei. Apsnd acest buton se deschide o nou fereastr, fereastra
de configurare a valorilor asociate. Vorbeam anterior despre maini de pro-
ducie american, european i japonez. n aceast caset vedem lista aces-
tor asocieri n partea de jos. n stnga listei exist 3 butoane: Add cu ajutorul
cruia putem crea o nou asociere, Change prin care putem modifica o aso-
ciere selectat i Remove care terge, elimin asocierea selectat. Noi ne-am
propus s traducem aceast structur de date n limba romn. Vom efectua
clic pe prima asociere 1 = American. Constatm c, automat, n caseta
Value a aprut cifra 1 iar n caseta Value Label textul American. Putem
Figura 1.11 Etichetarea variabilelor de
nivel nominal i ordinal
37
Statistic aplicat n tiinele socio-umane
deduce cu uurin c valorii 1 i s-a asociat textul American(apropo, la ce
nivel de msurare ne aflm aici i ce fel de variabil este aceasta?). De ase-
menea s-a activat butonul Remove, SPSS presupunnd c dorim s eliminm
aceast asociere din moment ce am selectat-o. Pentru a modifica textul, efec-
tum clic n interiorul casetei Value Label i scriem n loc de American,
America (mai bine spus, tergem un n). De data aceasta de activeaz i
butonul Change, SPSS depistnd modificarea efectuat i presupunnd c
vom dori s o i aplicm efectiv. Dac vei apsa acest buton (Change) vei
constata c eticheta s-a modificat din 1 = American n 1 = America. Felici-
tri. Ai realizat prima traducere. Acum procedai la fel pentru Europa i
Japonia. Desigur, oricnd putei include o nou asociere. Tastai cifra 4 n
caseta Value (deoarece ar urma 4 n ordine logic) i textul Romnia n
caseta Value Label apoi apsai butonul Add care ai observat c a devenit
activ. Astfel ai asociat valoarea 4 mainilor de producie romneasc. n
momentul n care ai terminat de efectuat toate asocierile, apsai butonul OK
pentru a le memora i a prsi formularul. Reinei c apsarea butonului
Cancel duce la prsirea formularului fr memorarea asocierilor.
Apare totui o ntrebare. De ce s folosim aceste asocieri n loc de a
scrie pur i simplu n baza de date America, Europa i Japonia? n
primul rnd pentru c este mai uor. Imaginai-v c avei de introdus un
umr de 3000 de date n baza dumneavoastr de date. n loc s scriei de fie-
care dat un text format din 6-8 caractere, vei tasta pur i simplu 1 atunci
cnd v referii la America, 2 cnd v referii la Europa i 3 cnd v referii la
Japonia. SPSS va ti, de fiecare dat, n urma asocierilor realizate n etapa
anterioar la ce anume se refer 1, 2 i 3. n al doilea rnd, dei 1, 2 i 3 sunt
doar nite etichete pentru America, Europa i Japonia, se preteaz mult mai
bine prelucrrilor statistice ulterioare, fiind date cifrice.
Procedai la fel i cu ultima variabil, referitoare la numrul de ci-
lindri ai motorului, pentru ca n final s obinei structura complet a bazei de
date.
38
Cristian Opariuc-Dan
Prin acest exerciiu ne-am deprins cu unele elemente ale configurrii
structurii bazei de date. n continuare vom salva baza de date modificat sub
denumirea de Masini. Directorul folosit va fi C:\Exercitii SPSS (atenie
la diacritice).
Putei alege meniul File i opiunea Save sau Save as, putei apsa
combinaia de taste Ctrl+S sau Alt+F, Alt+S sau putei apsa butonul de
salvare de pe bara de instrumente (acela care are o dischet drept pictogra-
m). Dar atenie! Diferena dintre opiunea Save i Save as este aceea c,
folosind Save se vor salva modificrile efectuate tot n baza de date iniial,
n cazul nostru baza de date Cars. Noi ne-am propus s salvm baza de date
sub un alt nume i ntr-un alt loc, deci nu vom putea folosi dect opiunea
Save as (Salveaz ca). Se va deschide
caseta de salvare a unei baze de date
care are acelai aspect ca i caseta de
deschidere a unei baze de date, cu ex-
cepia butonului Open, n acest caz
denumirea acestuia fiind Save. Folosind
cunotinele dobndite anterior, va tre-
bui s v poziionai cu ajutorul casetei
Save in (echivalenta casetei Look in
din fereastra de deschidere a bazei de
date) n directorul rdcin C:\ s creai un nou director folosind butonul de
creare a unui director din acest formular pe care s-l denumii Exerciii
SPSS, s efectuai dublu clic pe acesta pentru a-l deschide i s introducei
numele bazei de date Masini n caseta File name. Apsai apoi butonul Save
pentru a salva efectiv fiierul pe disc. Ai reuit, nu-i aa?
n urma acestor operaiuni, n bara de titlu SPSS va aprea mesajul
Masini SPSS Data Editor care ne informeaz c programul a salvat cu
succes baza de date pe disc i a activat-o.
Figura 1.12 Fereastra de salvare a
unei baze de date
39
Statistic aplicat n tiinele socio-umane
Reamintim faptul c, la crearea unei noi baze de date, folosirea oric-
ror opiuni de salvare (meniul File, butonul de pe bara de instrumente sau
tastele rapide) duce la apariia ferestrei Save as deoarece fiind o baz de date
nou, acesteia nu i-a fost atribuit nc un nume printr-o operaie de salvare.
Putei cu uurin identifica dac o baz de date are un nume (a fost salvat)
sau nu, urmrind bara de titlu. Bazele de date noi sunt identificate prin mesa-
jul Untitled SPSS Data Editor n timp ce bazele de date salvate au afiat
numele acestora n bara de titlu. Ai observat c, la lansarea programului
SPSS, acesta creeaz automat o baz de date nou i nedefinit i ateapt din
partea noastr definirea variabilelor i salvarea acesteia. Odat salvat, orice
modificri efectum n baza de date, la salvare ele vor fi scrise automat n
fiierul al crui nume este afiat n bara de titlu fr a mai aprea fereastra de
salvare de mai sus. Singura modalitate prin care putem da un alt nume bazei
de date sau prin care o putem salva ntr-un alt loc este folosirea opiunii Save
as.
Crearea unei noi baze de date se poate face folosind meniul File,
submeniul New i opiunea Data, combinaiile de taste Ctrl+N sau Alt+F,
Alt+N, Alt+A. n oricare dintre aceste situaii, SPSS va crea o baz de date
goal i nedefinit, la fel ca n cazul lansri programului.
Ca exerciiu, folosind cunotinele dobndite, v propunem crearea
unei noi baze de date avnd urmtoarea structur i salvarea acesteia sub
numele de IQ n directorul C:\Exercitii SPSS:
Variabila nume va fi de tip ir de caractere (string) i va stoca nu-
mele subiecilor, toate celelalte variabile fiind numerice. Exist dou definiii
40
Cristian Opariuc-Dan
de asocieri i anume variabila sexul (1-Masculin 2-Feminin) i scoala
(1-Primare 2-Gimnaziu 3-Liceul 4-Postliceala 5-Facultate)
Dup construirea structurii de date procedai la salvarea fiierului n
locul precizat.
Folosind cunotinele teoretice acumulate, precizai tipul fiecrei va-
riabile creat n acest exerciiu.
Ne propunem n continuare aprofundarea definirii variabilelor n
SPSS. Pentru aceasta ne vom folosi de baza de date IQ creat i salvat n
exerciiul anterior. n seciunea Data View am remarcat deja prezena a zece
caracteristici prin care se poate defini o variabil n SPSS. Prima dintre aces-
tea se refer la numele variabilei (Name), caracteristic ce nu presupune prea
multe explicaii. Numele variabilei reprezint modul n care aceasta va fi ape-
lat n toate prelucrrile efectuate folosind baza de date. Nu putem ns s nu
precizm c SPSS impune o serie de restricii n denumirea variabilelor (ver-
siunile mai mici de versiunea 13): n primul rnd numele acestora s nu dep-
easc 8 caractere, variabilele cu nume mai lungi de 8 caractere nefiind ac-
ceptate. Apoi nu pot fi folosite spaii sau semne de punctuaie n denumirea
variabilelor, putnd fi ns folosit linia de subliniere pentru cazurile n care
dorim s abreviem o variabil format din dou cuvinte. De exemplu, dac
avem o variabil ce se refer la anul naterii, o vom putea abrevia denumind-
o an_naste. Astfel, lungimea ei este de 8 caractere, fiind acceptat de SPSS
iar cele dou cuvinte componente le-am separat printr-o linie de subliniere,
fapt de asemenea acceptat de SPSS. Nu conteaz dac scriem numele variabi-
lelor cu litere mari sau cu litere mici deoarece n final SPSS le convertete
automat n litere mici. Din punct de vedere al primei caracteristici, baza noas-
tr de date IQ nu creeaz probleme, fiind definite cinci nume de variabile:
numele, varsta, sexul, scoala i iq.
A doua caracteristic se refer la tipul de date ce va fi stocat n aceste
variabile (Type), caracteristic pe care nu am abordat-o n detaliu n timpul
41
Statistic aplicat n tiinele socio-umane
prezentrii noastre de pn acum. Aceast seciune conine un buton cu trei
puncte de suspensie pe care l putem apsa pentru a deschide fereastra de
configurare a tipului de date. Aceasta conine o serie de butoane de opiuni
dintre care putem selecta tipul de date pe care variabila noastr l va stoca,
dup cum urmeaz:
Tipul de date Numeric
se refer la numere. Valorile
acceptate vor fi deci numere, n
format standard. Alegnd acest tip
de date, putem stabili i dimensiu-
nea acestora valoarea maxim pe
care SPSS o poate accepta prin
precizarea numrului de caractere
n cmpul Width i numrul de
caractere dup virgul n cmpul Decimal Places. De exemplu, numrul ma-
xim de caractere 3 i 2 caractere zecimale nseamn c acea variabil poate
stoca valori numerice de la 0 pn la 999,99. Acest tip de date va scrie valori-
le numerice fr nici o separaie ntre sute i mii i folosind ca separator ze-
cimal separatorul configurat al sistemului. Un exemplu de numr scris n
acest format ar fi 78457845.57
Tipul de date Comma se refer de asemenea la numere i pot fi
definite la fel ca i tipul anterior, numai c acestea vor fi afiate folosindu-se
virgula ca separator ntre valoarea sutelor i valoarea miilor i punctul ca se-
parator al valorilor zecimale. De exemplu, o valoare numeric n acest format
ar arta astfel: 9,999.89 Este practic formatul numeric clasic american.
Tipul de date Dot identic cu tipul de date anterior, doar c se in-
verseaz rolul punctului i al virgulei. Relund acelai exemplu, numrul de
mai sus va f scris astfel: 9.999,89 n acest caz recunoatem formatul rom-
nesc.
Figura 1.13 Stabilirea tipului de date
a unei variabile
42
Cristian Opariuc-Dan
Tipul de date Scientific notation se refer la modul tiinific de
afiare a cifrelor, folosind litera E pentru a reprezenta puterile lui 10. Modul
de configurare al dimensiunii variabilei este acelai iar un exemplu de numr
folosind aceast reprezentare poate fi 1.23E2 ceea ce semnific de fapt
123.00
Tipul de date Date se refer
la date calendaristice. Alegnd aceast
opiune va trebui s configurai, selec-
tnd din lista ce se va deschide, modul de
afiare al datei calendaristice dintr-o
mulime de formate care vi se ofer.
Tipul de date Dollar se refe-
r la valori monetare avndu-se n vedere
moneda american. Putei alege i particulariza valoarea maxim pe care o
poate accepta variabila din lista ce se afieaz sau putei particulariza aceast
valoare, la fel ca i n cazul valorilor numerice.
Tipul de date Custom currency permite definirea unor valori
monetare particularizate, valabile pentru alte ri n afara Statelor Unite. Se
poate defini forma de prezentare a variabilei i valoarea maxim acceptat, la
fel ca i la tipul anterior.
Tipul de date String stocheaz doar iruri de caractere, cu alte
cuvinte texte, fr nici o posibilitate de prelucrare statistic. Poate fi definit
i aici dimensiunea maxim pe care o poate avea variabila din punctul de
vedere al numrului de caractere acceptate. n cazul nostru, variabila nume
este un exemplu excelent de variabil de tip string.
Caracteristica a treia i caracteristica a patra a unei variabile, respectiv
Width i Decimals se refer exact la valorile maxime pe care le pot accepta
variabilele i la numrul de zecimale, elemente pe care le-am discutat anterior
Figura 1.14 Tipul de date
calendaristic
43
Statistic aplicat n tiinele socio-umane
iar aceste dou caracteristici nu fac dect s creeze o alt posibilitate de defi-
nire a variabilelor sub acest aspect.
n cazul exemplului nostru, constatm c avem o singur variabil de
tip string, variabila nume care poate accepta maxim 20 de caractere, toate
celelalte variabile fiind de tip numeric; variabilele sexul i coala pot
accepta doar o singur cifr fr zecimale iar variabilele varsta i iq pot
accepta 3 cifre fr zecimale. Aceast definiie permite stocarea subiecilor cu
numele format din maxim 20 de litere, vrsta poate lua valori de pn la 999,
suficient deci pentru scopurile noastre, acelai lucru fiind valabil i pentru
coeficientul de inteligen. Sexul i nivelul de colarizare accept doar o sin-
gur cifr, deoarece am convenit s asociem valoarea 1 cu sexul masculin i 2
cu sexul feminin, n mod analog procednd i cu nivelul de colarizare. Date-
le au fost definite ca numerice pentru a crea posibilitatea interpretrii lor ulte-
rioare, cunoscndu-se faptul c datele de tip string nu pot fi interpretate sta-
tistic.
Urmtoarea caracteristic, caracteristica Label, permite includerea
unei denumiri mai intuitive a variabilei, prin care s poat fi mai uor identi-
ficat i recunoscut. Astfel, variabilei nume i putem da eticheta Numele
subiecilor, variabila iq o putem eticheta ca i Coeficientul de inteligen-
i aa mai departe. Putem include orice etichet descriptiv dorim pentru
numele unei variabile, cu condiia ca lungimea acesteia s nu depeasc 255
de caractere. Deci atenie la scrierea romanelor n descrierea variabilelor!!!
Aceast caracteristic mai are ns o funcie important; SPSS include etiche-
ta variabilelor n rapoartele finale rezultate n urma prelucrrii datelor. Dac
creai un tabel de frecven, SPSS nu va afia numai numele variabilei, de
exemplu iq ci va include i descrierea acesteia, Coeficientul de inteligen-
, fcnd astfel mult mai estetice i mai inteligibile foile de raport.
Caracteristica Values am discutat-o pe larg n seciunile anterioare i
nu vom mai reveni asupra ei. Menionm doar c ea permite clasificri (deci
44
Cristian Opariuc-Dan
variabile categoriale) i asocieri de valori. Spre exemplu, putem asocia valoa-
rea 1 sexului masculin i valoarea 2 sexului feminin pentru a putea introduce
mai uor datele i pentru a putea efectua prelucrri statistice la nivel de varia-
bile nominale.
Caracteristica Missing permite defi-
nirea modului n care vor fi tratate valorile
lips din cadrul unei variabile. Uneori este
important s cunoatem de ce lipsesc valori
dintr-o variabil. Datele lips se pot datora,
spre exemplu, faptului c subiectul refuz
s rspund la o anumit ntrebare sau fap-
tului c ntrebarea nu este adresat acelui
subiect. Iat dou situaii care ar necesita un
tratament separat al valorilor lips. Datele pe care le vei trata n mod explicit
ca date lips pot fi supuse apoi unei analize statistice separate, fiind iniial
excluse din cele mai multe calcule. Un alt exemplu, frecvent ntlnit n ches-
tionarele sociologice se refer la codificarea rspunsurilor de tip Nu tiu/Nu
rspund. Majoritatea cercettorilor codeaz aceste variante cu 9 sau 99. Evi-
dent, variantele incerte nu vor face obiectul prelucrrii iniiale a datelor. Fo-
losind aceast seciune se pot include aceste valori (9 sau 99) ca valori lips,
SPSS eliminndu-le din analiz. Definirea valorilor lips poate accepta trei
situaii. Situaia No missing values, cnd comunicm programului c nu
dorim un tratament special pentru valorile lips, acestea fiind tratate ca atare
n cursul fiecrei prelucrri de date pe care o realizm, situaia Discrete
missing values cnd putem defini pn la trei valori ce vor fi tratate ca va-
lori lips n cursul prelucrrilor statistice ulterioare (de exemplu, la un chesti-
onar cu 3 variante de rspuns, dorim ca doar rspunsurile 1 i 3 s fie luate n
calcul, rspunsul 2 fiind tratat ca non-rspuns. Pentru aceasta vom include
cifra 2 n prima dintre cele trei casete ale acestei seciuni.) i situaia Range
plus one optional discrete missing value n care putem stabili un interval
Figura 1.15 Tratarea valorilor lips
45
Statistic aplicat n tiinele socio-umane
pentru care valorile vor fi tratate ca valori lips (spre exemplu, coeficienii de
inteligen cuprini ntre 10 i 75) n plus existnd posibilitatea de a include
i o valoare particular (discret) ca i n situaia anterioar. n exemplul nos-
tru de baz de date, nu avem nici un motiv de a trata n vreun fel valorile lip-
s, deci nu vom configura aceast caracteristic.
Caracteristica Columns permite specificarea limii coloanei n care
se vor afia valorilor variabilelor n modul Data View. Implicit, coloanele au
o lime egal cu 8 caractere. Putem include aici o alt valoare sau putem
redimensiona limea coloanelor n modul Data View prin tragerea cu aju-
torul maus-ului a liniei de separaie dintre dou coloane. Introducerea diferi-
telor valori pentru aceast caracteristic permite ajustarea i redimensionarea
precis a limii coloanelor. n cazul nostru, pentru variabila nume, dimen-
siunea implicit de 8 caractere va fi insuficient pentru prezentarea unui su-
biect cu numele Popescu Valentin, afindu-se doar primele 8 caractere i
anume Popescu Pentru a vedea ntregul nume, fie introducei valoarea 16
pentru caracteristica Columns a variabilei nume, fie tragei cu ajutorul ma-
us-ului linia de demarcaie dintre coloana nume i coloana varsta pentru
a mri limea coloanei de afiare a numelui subiecilor. Aceast caracteristi-
c, ca i urmtoarea, nu influeneaz n nici un fel modul de prelucrare al
datelor ci doar aspectul tabelului de date din Data View.
Caracteristica Align controleaz modul n care sunt aliniate valorile
variabilelor n tabelul de date. Putei opta pentru o aliniere la stnga, centrare
sau aliniere la dreapta a valorii variabilelor n cadrul coloanelor din Data
View, fr a influena n vreun fel modul de prelucrare al variabilelor. Ca
regul general, variabilele de tip string se aliniaz la stnga iar variabilele de
tip numeric sau dat calendaristic se aliniaz la dreapta pentru o mai bun
lizibilitate n cadrul tabelelor de date.
Ultima caracteristic, Measure, este n acelai timp i una foarte im-
portant, permind alegerea nivelului de msurare al variabilei. Se poate
46
Cristian Opariuc-Dan
opta pentru dou sau trei niveluri de msurare n funcie de tipul de variabil.
Astfel, pentru variabila nume, care este o variabil de tip string, sunt dis-
ponibile doar nivelurile nominal i ordinal de msurare. Stocarea numelui i
prenumelui are o valoare pur informativ i nu permite nici mcar o clasifica-
re a acestora. Nivelul de msur va fi deci nivelul nominal. Variabila varsta
este o variabil numeric care stocheaz vrsta subiecilor. Aceast variabil
are intervale egale, zero absolut i permite rapoarte n cadrul scalei, deci poa-
te fi considerat la un nivel de msurare scalar
4
. Variabila sexul nu este
altceva dect tot o variabil nominal care nu permite dect o clasificare a
persoanelor n funcie de genul lor biologic. Variabila scoala poate fi privi-
t ca o variabil nominal dac intenionm doar s clasificm subiecii n
funcie de studiile absolvite sau se poate accepta un nivel ordinal de msurare
la nivelul acesteia dac ierarhizm subiecii n funcie de gradul lor de cola-
rizare. Vom lua n considerare a doua situaie i o vom accepta ca variabil
ordinal. n sfrit, variabila iq este fr discuie o variabil de tip ordinal.
Iat c, parcurgnd aceste etape, am reuit n cele din urm s constru-
im structura unei baze de date simple n acord cu principiile i domeniile de
definiie ale variabilelor i cu nivelul lor de msurare.
Un aspect important pe care merit s-l menionm se refer la proce-
sul de codare al variabilelor (proces pe care l-am ntlnit la codarea variabile-
lor sex i nivel de colarizare). n general, cercettorii cu experien cunosc
intuitiv modalitatea de codare optim a unei variabile. Pentru a veni n spriji-
nul debutanilor, Newton i Rudestam (1999) propune, n lucrarea Your sta-
tistical consultant un set de reguli folosite n acest proces (Field, 2005).
Toate datele trebuie codate numeric. Pentru a coda, de exemplu,
sexul, am putea folosi i M pentru masculin respectiv F pen-

4
Ca observaie, n SPSS nivelurile de msur de interval i de raport au fost reunite sub
denumirea generic de nivel de msur scalar. Proiectanii acestei aplicaii au renunat la
distincia separat a celor dou reunindu-le sub denumirea de nivel scalar.
47
Statistic aplicat n tiinele socio-umane
tru feminin. Un asemenea proces de codare ar fi complet eronat,
deoarece ar limita radical posibilitile de prelucrare statistic a
datelor. Recomandarea este aceea c, atunci cnd suntem n astfel
de situaii este de preferat s folosim, de exemplu, 1 pentru Mas-
culin i 2 pentru Feminin. Aceste cifre nu au dect o valoare de
etichet i nu reprezint un proces de ierarhizare (nu spunem c
masculinul este mai jos dect femininul deoarece are valoarea
1). La fel de bine putem s scriem 2 masculin i 1 feminin sau 5
masculin i 7 feminin. Acest proces de codare poart numele de
codare dummy. Tot ceea ce trebuie s facei este s reinei codu-
rile atribuite.
Fiecare variabil trebuie s ocupe o coloan distinct n baza
de date i fiecare subiect va ocupa o singur nregistrare. Este
foarte important ca datele unui subiect s ocupe un singur rnd n
baza de date SPSS, iar fiecare coloan s se refere doar la o singu-
r variabil. n cazul n care o variabil este msurat de mai mul-
te ori (tipic pentru experimente de tip testare iniial testare fina-
l), se vor aloca dou coloane pentru acea variabil, una care s se
refere la testarea iniial i una viznd testarea final. De exemplu,
dac avem un experiment prin care n urma unei tehnici oarecare
presupunem c mbuntim memoria, va trebui s testm memo-
ria subiecilor nainte de aplicarea tehnicii, s aplicm tehnica i
apoi s testm din nou memoria subiecilor, pentru a vedea dac
au aprut modificri. n acest caz, putem defini cele dou variabile
prin mem_ini ce reprezint testul iniial de memorie i mem_fin
care se refer la testul final. Astfel, nu nclcm aceast regul, iar
datele vor fi consistente.
Toate codurile pentru o variabil trebuie s fie mutual exclu-
sive. Cu alte cuvinte, nu trebuie s existe dect un singur numr ce
48
Cristian Opariuc-Dan
poate fi stocat ntr-o variabil. n anumite chestionare pot exista
itemi care permit alegeri multiple (de exemplu la ntrebarea: Bi-
fai din urmtoarea list partidele cu care n mod sigur nu vei vo-
ta la urmtoarele alegeri: pot fi variantele de rspuns PSD,
PD, UDMR, PNG etc. n acest caz, subiectul poate alege un
singur partid, dou partide sau le poate alege pe toate). O aseme-
nea situaie impune crearea unui numr de variabile egal cu vari-
antele de rspuns (de exemplu nu_PDS, nu_PD, nu_UDMR,
nu_PNG) cu categorii dihotomice de genul 0 Neselectat, 1 Se-
lectat care vor fi analizate ulterior. De obicei, asemenea itemi au
i o categorie de genul Altul. Care_______ prin intermediul creia
subiectul poate s-i exprime liber opiunea. n mod normal,
aceast categorie se analizeaz prin alte metode i nu folosind
SPSS, deoarece variabilitatea rspunsurilor confer o valoare sta-
tistic foarte redus.
Fiecare variabil trebuie codat astfel nct s se obin ma-
ximum de informaii. Categoriile sau valorile variabilei nu trebu-
ie sintetizate n prima variant, ci trebuie incluse exact aa cum
apar pe formularele de colectare a datelor. Sintetizarea valorilor i
cumularea categoriilor poate fi fcut mai trziu, utiliznd funcii-
le specifice SPSS. De exemplu, se prefer introducerea exact a
valorii pentru vrsta subiectului, n ani, i nu ncadrarea subiectu-
lui n categorii de vrst (sub 14 ani, ntre 14 i 20 de ani, peste 20
de ani etc.). Iniial se va proiecta o variabil, varsta, care va stoca
vrsta exact a subiecilor. Ulterior, dac se va dori transformarea
acestei variabile scalare ntr-o variabil discret, ordinal, numit
grup_varsta, se pot folosi tehnici specifice de conversie. Ca idee
general, ntotdeauna cnd este posibil, se vor folosi variabile con-
tinui la un nivel de msur ct mai aproape de scala de raport. Este
uor s transformm o variabil continu ntr-una discret, ns
49
Statistic aplicat n tiinele socio-umane
imposibil s trecem de la o variabil discret la una continu. Du-
p cum tii deja, valoarea informativ cea mai ridicat o au totui
variabilele continui, astfel nct profitai de ele.
Fiecare subiect trebuie s aib o valoare pentru fiecare varia-
bil. Uneori nu este posibil s includem valori n fiecare coloan,
fie deoarece subiectul nu a rspuns, fie pentru c itemul respectiv
nu i se adreseaz. n acest caz se recomand s lsai acea celul
liber, deoarece SPSS este astfel proiectat nct s trateze celulele
goale ca i cazuri lips. Introducerea altor valori pentru cazurile
lips poate crea confuzii. Respectai ntotdeauna regula ceea ce e
cel mai simplu este i cel mai bun.
Regulile de codare se vor aplica tuturor subiecilor. Acest lucru
nseamn c nu putei aplica reguli valabile doar pentru anumii
participani. De exemplu, dac dorii ca anumite valori s fie trata-
te ca valori lips pentru un anumit subiect, nu putei face acest lu-
cru. Valorile lips vor fi tratate similar pentru toi subiecii.
Folosii coduri n concordan cu sensul scalei. Unele chestio-
nare presupun tipuri de scale ordinale (de exemplu 1 niciodat, 2
rareori, 3 uneori, 4 deseori, 5 ntotdeauna). Dei scalele pot
fi codate i invers (1 ntotdeauna, 2 deseori, 3 uneori, 4 ra-
reori, 5 niciodat) se recomand pstrarea sensului natural al
scalei pentru evitarea problemelor ulterioare referitoare la inter-
pretare. Mai uor asociem niciodat cu 1 dect niciodat cu 5.
Oricum, chiar dac ulterior exist suficiente posibiliti de recoda-
re a valorilor astfel nct analiza s fie consistent, proiectarea
adecvat a cercetrii i codrii v poate scuti ulterior de bti de
cap i munc inutil.
Dup proiectarea bazei de date se recomand listarea structurii aceste-
ia (meta-informaiilor) n vederea consultrii ulterioare. Dac nu vei lucra
50
Cristian Opariuc-Dan
cteva luni cu baza de date, probabil c nu vei reine
la ce se refer mem_ini sau mpg i nici de ce tip
este. SPSS prezint o modalitate uoar de a afia
structura bazei de date cu informaii complete. Nu
trebuie dect s accesai meniul File i apoi opiunea
Display Data File Information. Se va deschide o
nou seciune care v invit s alegei ntre a afia
informaiile bazei de date curente (Working File)
sau a unei alte baze de date de pe disc (External
File). Noi suntem interesai de afiarea structurii
bazei noastre de date (IQ.sav) i vom alege aadar
prima opiune.
Figura 1.16 Afiarea infor-
maiilor despre baza de date
n fereastra de rezultate (Output) vor aprea o serie de tabele cores-
punztoare definiiilor variabilelor din baza de date, astfel:
Tabelul 1.1 Tabelul de structur a bazei de date

Variable Information
1
Numele
subiectului
Nominal 14 Left A20 A20
2
Varsta
subiectilor
Scale 8 Right F2 F2
3
Genul
biologic al
subiectilor
Scale 8 Right F1 F1
4
Coeficientu
l de
inteligenta
Scale 8 Right F3 F3
Variable
nume
varsta
sexul
iq
Position Label
Measurement
Level Column Width Alignment Print Format Write Format
Variables in the working file

Variable Values
Masculin
Feminin
Value
1
2
sexul
Label
51
Statistic aplicat n tiinele socio-umane
Tabelul Variable Information conine informaii despre variabile.
Prima coloan conine numele variabilelor, urmeaz apoi poziia acestora n
structura de date, eticheta, nivelul de msur, limea coloanei i alinierea.
Ultimele dou coloane se refer la tipul variabilei. Astfel, prima vari-
abil poate stoca 20 de caractere, a doua 2 caractere, a treia un caracter i a
patra 3 caractere.
Urmtorul tabel conine variabilele codate. n cazul nostru singura va-
riabil codat este sexul i conine valorile 1 Masculin i 2 Feminin.
V recomand ca dup ce proiectai baza de date s imprimai structura
acesteia i s o stocai pentru a o putea consulta ori ce cte ori avei nevoie.

n concluzie:
Msurarea n tiinele socio-umane are un caracter subiectiv, deoarece nu putem
observa direct indicatorii funciilor psihice;
Msurtorile sunt aproximri ale realitii deoarece sunt supuse n permanen
surselor de eroare iar realitatea social are un caracter fluctuant;
Dup S. S. Stevens, n sensul su larg, a msura nseamn a atribui numere obiec-
telor sau evenimentelor potrivit unor reguli.
Regula de atribuire trebuie s fie:
o Suficient de clar pentru a permite atribuirea univoc, la un moment dat, a
unui numr unui obiect i numai a unui singur numr;
o Suficient de simpl pentru a fi utilizat;
O variabil este un nume pentru un element a crui caracteristic este aceea c va-
riaz, i modific valorile;
O variabil este aleatorie i poate lua valori numerice (alea-numeric) sau ne-
numerice;
O variabil se caracterizeaz printr-un domeniu de definiie, o mulime de valori pe
care aceasta le poate lua. n funcie de acest domeniu de definiie, variabilele pot fi
discrete sau continui;
o O variabil discret nu permite existena unor valori intermediare ntre
valorile pe care le poate lua variabila. Ea este definit pe o mulime nu-
mrabil de valori n baza unei funcii de probabilitate;
o O variabil continu permite existena unor valori intermediare ntre dou
valori ale acesteia iar acest lucru poate continua la infinit. Ea este definit
52
Cristian Opariuc-Dan
pe un interval de valori, mulimea fiind infinit iar legea de distribuie este
o densitate de probabilitate;
Scalele de msurare se grupeaz n scale neparametrice (nominal i ordinal) i
scale parametrice (de interval i de raport);
Termenul de cuantificare are sens ncepnd cu scala ordinal;
Scala nominal prezint doar posibilitatea unor clasificri, grupri ale datelor n
categorii;
Scala ordinal permite, n plus, ierarhizarea datelor n funcie de apartenena lor la
o categorie. Strict, aceasta este scala utilizat n psihologie;
Scala de interval este o scal ordinal n care intervalele sunt egale. Ea permite s
rspundem cu ct o cantitate este mai mare dect o alta ns nu i de cte ori;
Scala de raport este o scal de interval la care exist un zero absolut. Ea permite s
rspundem la ntrebarea de cte ori o cantitate este mai mare dect cealalt

ntrebri i exerciii:
n bara de titlu a aplicaiei SPSS se afl afiat mesajul Untitled SPSS Data Edi-
tor. Ce se va ntmpla cnd vom apsa butonul de salvare a datelor de pe bara de
instrumente dup ce am proiectat structura unei baze de date?
Am primit de la un alt colaborator o baz de date cuprinznd rezultatele unor pro-
be psihologice, realizat ns n Excel. tiu c SPSS poate prelucra i foi de calcul
Excel, deci introduc discheta n calculator, folosesc procedura de deschidere a unei
baze de date din SPSS, m poziionez pe unitatea de dischet (discul A:) ns nu re-
uesc s vd fiierul Excel. Unde am greit?
Am creat baza de date IQ. De ce atunci cnd doresc s introduc numele subiectului
Alexandrescu Delia Ioana Alexandra, la un moment dat SPSS nu m mai las s
tastez?
Precizai de ce tip sunt urmtoarele variabile i la ce nivel de msurare se afl:
viteza vntului, gradele didactice dintr-o universitate, anxietatea total,
fabricanii de maini, echipele de fotbal, numrul de tablouri dintr-o galerie
de art
Dei subiectul Popescu Vasile are mai puin de 20 de caractere, totui n momen-
tul n care l introduc n SPSS se afieaz doar Popes. Cum pot s fac pentru a
vedea ntregul nume al subiectului meu?
Am peste 400 de subieci n baza mea de date IQ i doresc s efectuez o analiz n
care toi coeficienii de inteligen mai mici de 70 s fie tratai ca i cazuri lips.
Cum procedez?
53
Statistic aplicat n tiinele socio-umane
I II. ORGANIZAREA DATELOR I. ORGANIZAREA DATELOR
n acest capitol se va discuta despre:
Colecii de date brute;
Amplitudinea de variaie;
Diagrame de date;
Clase i intervale de grupare;
Efective, frecvene absolute i relative;
Reprezentri grafice.
Dup parcurgerea capitolului, cursanii vor fi capabili s:
neleag elementele de baz ale unei distribuii
statistice;
Calculeze numrul de clase i intervalele de gru-
pare;
Grupeze elementele n clase;
Construiasc o distribuie statistic;
Reprezinte grafic o distribuie statistic.

Orice experiment, evaluare psihologic, observaie sau convorbire
pornete de la o ntrebare care-i propune s rezolve o anumit problem. De
cele mai multe ori, problema n tiinele socio-umane nu transpare imediat
ntr-o form cuantificabil. Avem nevoie de o serie de etape intermediare
pentru a stabili ce dimensiuni msurabile sunt n relaie cu problema sau tema
studiat. Procesul prin care transformm o dimensiune general, necuantifi-
cabil, n indicatori msurabili i apoi construim itemi pentru acei indicatori
poart numele de operaionalizare a conceptelor. Dac, de exemplu, dorim
s studiem nivelul de trai a populaiei dintr-un ora, o asemenea abordare este
mult prea general. Ce nseamn n definitiv nivel de trai? Dimensiunea nu
poate fi cunoscut direct, astfel nct apelm la anumii indicatori care au
legtur cu nivelul de trai (bugetul alocat pentru achiziionarea de produse
electronice, bugetul pentru concediu etc.) Urmeaz apoi s construim itemi,
ntrebri referitoare la indicatorii stabilii (Unde v petrecei concediile?,
Ce produse electronice ai cumprat n ultimele trei luni? i aa mai depar-
54
Cristian Opariuc-Dan
te). Studiind rspunsurile la aceste ntrebri putem avea o imagine general
asupra nivelului de trai. Aceti indicatori nu reprezint altceva dect variabile
rezultate n urma operaionalizrii conceptului general de nivel de trai i care
pot fi populate cu datele rezultate din rspunsurile subiecilor la ntrebrile
stabilite.
n urma procesului de operaionalizare a conceptelor rezult una sau
mai multe variabile, reprezentative pentru studiul propus, variabile ce vor
trebui populate cu date n vederea verificrii ipotezelor i a gsirii rspun-
sului la ntrebarea formulat iniial. Datele cu care urmeaz a fi populat
respectiva variabil pot proveni din (Radu, i alii, 1993):
Lectura unor aparate;
Msurtori antropometrice i/sau bio-fiziologice;
Notele brute (rspunsurile subiecilor) la anumite teste psiho-
logice sau chestionare;
Protocolul de observaie sau interviu;
Analiza de coninut sau analiza produselor activiti, etc.
n practic putem fi interesai despre modul n care se grupeaz datele
n jurul unor valori, de variabilitatea acestora sau de stabilirea poziiei relati-
ve a unui individ sau a unui rezultat n cadrul unui grup mai mare de indivizi
sau rezultate.
Fie c desfurm o evaluare psihologic, un studiu sau o cercetare
experimental, fie c iniiem un proces de colectare a datelor prin observaie,
rezultatul const ntr-o colecie (set) de date brute. La acest nivel nu avem
nici o modalitate prin care putem trage concluzii asupra semnificaiei datelor
pe care le avem la dispoziie. Putem doar constata c unele valori se repet i
cam att. De aceea, prima etap n iniierea unei proceduri statistice de
analiz a datelor const n clasificarea, ordonarea, condensarea acestora n
55
Statistic aplicat n tiinele socio-umane
vederea conturrii unei imagini ct mai precise. Valorile msurate trebuie
aezate ntr-o anumit ordine (cresctoare sau descresctoare) care s permit
i o eventual reprezentare grafic a acestora.
Exemplu: Presupunem c msurm nlimea unor subieci n centi-
metri i obinem urmtoarele rezultate: 182, 175, 174, 189, 177, 177, 180,
173, 188, 171, 184, 192, 180, 172, 177, 193, 184, 192, 172, 177, 174, 171,
172, 179, 185, 179, 183, 172, 179, 188.
ntrebare: Ce tip de variabil este variabila menionat mai sus i la
ce nivel de msurare se afl?
Dac privim irul de date de mai sus, observm c nu putem extrage
nici o informaie util. Unele valori se repet, e adevrat, ns nu putem spu-
ne n lipsa unei organizri nici care este cel mai nalt subiect, nici care este
cel mai scund, nici ce nlime au cei mai muli subieci. Acest lucru va de-
veni posibil abia n urma unui proces de organizare a acestor date.
La volume mici de date acest proces nu pune probleme deosebite.
Operaiunea devine ns greoaie i mare consumatoare de timp pentru volume
mari de date i de aceea se recomand utilizarea unui program computer care
poate efectua aproape instantaneu aceste operaii.
II.1 Sistematizarea datelor
Primul pas n sistematizarea datelor l reprezint stabilirea valorilor
extreme. Prin inspecie vizual, verificm cea mai mic valoare din irul de
date (X
min
) i cea mai mare valoare din irul de date (X
max
) pentru a putea cal-
cula poate cel mai simplu indicator statistic i anume amplitudinea de varia-
ie. Numim amplitudine de variaie (Range) diferena dintre valoarea ma-
xim i valoarea minim a distribuiei de date. (A = X
max
X
min
). n exemplul
nostru, subiectul cel mai scund (cu nlimea cea mai mic) are 171 centi-
metri iar subiectul cel mai nalt are 193 centimetri. Prin urmare, X
min
= 171
56
Cristian Opariuc-Dan
centimetri, X
max
= 193 centimetri iar amplitudinea de variaie devine A = 193
171 = 22 centimetri.
Dac amplitudinea de variaie este mic
comparativ cu numrul de valori din irul de
date, atunci irul de date poate fi uor reprezen-
tat fr necesitatea gruprii valorilor. n cazul
nostru, putem sistematiza datele scriind ntr-o
coloan valorile n ordine cresctoare i notnd
n dreptul fiecreia, prin linii verticale, de cte
ori se repet n irul iniial. Dac reconsiderm
exemplul anterior, obinem datele grupate n
tabelul alturat:
De data aceasta obinem un protocol sis-
tematizat numit diagrama n linii. Putem acum
observa c toi cei 30 de subieci (n=30) au fost
repartizai cresctor n funcie de nlimea lor
i putem afirma c cei mai scunzi subieci au
171 cm iar cel mai nalt 193 cm. De asemenea,
cei mai muli subieci au 172 cm i 177 cm. Iat
aadar c aceast diagram de aduce un plus de
informaie n raport cu irul nesistematizat pre-
zentat anterior.
Aceast sistematizare a unui protocol
reprezint o procedur statistic liminar
deoarece se afl la limita analizei statistice pregtind aplicarea tehnicilor ulte-
rioare de prelucrare a datelor.
Tabel 2.1 Diagrama n linii
i efectivul
Valoare
Diagrama
n linii
Efectiv
171 || 2
172 |||| 4
173 | 1
174 || 2
175 | 1
176 0
177 |||| 4
178 0
179 ||| 3
180 || 2
181 0
182 | 1
183 | 1
184 || 2
185 | 1
186 0
187 0
188 || 2
189 | 1
190 0
191 0
192 || 2
193 | 1
Diagrama n linii reprezint o metod intuitiv de reprezentare grafic
a datelor. Urmtorul pas este acela prin care vom numra liniile trasate n
vederea stabilirii efectivului (frecvena absolut) fiecrei valori din ansam-
57
Statistic aplicat n tiinele socio-umane
blul rezultatelor. Observm c efectivul valorii 171 cm este 2 subieci, adic
doi subieci au nlimea de 171 cm, efectivul valorii 172 cm este 4 subieci,
patru subieci au nlimea 172 cm i aa mai departe. Stabilirea efectivelor
prin acest procedeu este posibil n momentul n care amplitudinea de varia-
ie este relativ mic (de exemplu pentru notele colare, de la 1 la 10). La o
amplitudine mai mare acest procedeu este extrem de laborios i inutil deoare-
ce variabilitatea distribuiei devine mare i se pierde viziunea de ansamblu.
Deja, n exemplul nostru, constatm o serie de tendine, dar care sunt ns
abia conturate. n plus, gsim multe valori pentru care efectivul este zero.
Prin urmare, ar fi mai util s facem distribuia mai compact prin gruparea
valorilor n clase, astfel nct s putem releva regularitatea ansamblului de
date. Vom alege, spre exemplu, gruparea datelor din patru n patru astfel:
171, 172, 173, 174 sau 171 174
175, 176, 177, 178 sau 175 178
179, 180, 181, 182 sau 179 182
183, 184, 185, 186 sau 183 186
187, 188, 189, 190 sau 187 190
191, 192, 193 sau 191 193
Au rezultat un numr de ase clase care cuprind, fiecare, patru valori,
ultima clas fiind format din trei valori. Distribuia de mai sus va deveni:
Iat c acum lucrurile sunt ceva
mai clare. Observm c cei mai muli
subieci au nlimea cuprins ntre 171
cm i 174 cm n timp ce destul de puini
subieci pot fi considerai ca fiind nali.
Este mai uor de sesizat acum imaginea
de ansamblu, modalitatea n care se orga-
Tabel 2.2 Diagrama n linii i efectivul
pentru date grupate n clase
Clasa
Diagrama
n linii
Efectiv
171 174 ||||||||| 9
175 178 ||||| 5
179 182 |||||| 6
183 186 |||| 4
187 190 ||| 3
191 -193 ||| 3
58
Cristian Opariuc-Dan
nizeaz datele. Un asemenea procedeu pune n eviden, compact, regularita-
tea de ansamblu a datelor.
La acest nivel va trebui s facem o serie de precizri deoarece au ap-
rut dou concepte noi: conceptul de clas i conceptul de interval de grupare.
n cazul nostru, numrul de clase a fost stabilit la ase. Intervalul de grupa-
re (i) se refer la numrul de valori pe care le poate conine o clas, cu alte
cuvinte lrgimea unei clase. Practic, intervalul de grupare se exprim ca ra-
port dintre amplitudinea de variaie i numrul claselor. Dac notm interva-
lul de grupare cu i i n ul d lase cu k, avem formula: umr e c
i =
X
mcx
-X
min
k
rmula 2.1) (fo
n cazul nostru formula devenind i =
193-171
6
=
22
6
= S,67 4
n exemplul anterior am rotunjit intervalul de grupare i la valoarea
4. Datorit faptului c nlimea este o variabil continu, ar fi corect s re-
prezentm clasele i astfel:
171,00 174,67 (171,00 + 3,67 = 174,67)
174,68 178,35 (174,68 + 3,67 = 178,35)
178,36 182,03 (178,36 + 3,67 = 182,03)
182,04 185,71 (182,04 + 3,67 = 185,71)
185,72 189,39 (185,72 + 3,67 = 189,39)
189,40 193,07 (189,40 + 3,67 = 193,07)
Totui, de ce ne-am rezumat la ase clase i de ce nu am folosit opt
clase sau 3 clase? Care a fost argumentul pe baza cruia am decis utilizarea
unui numr de 6 clase? Exist vreo metod prin care putem stabili numrul
de clase necesare sau le alegem noi arbitrar?
59
Statistic aplicat n tiinele socio-umane
Atunci cnd numrul de msurtori (n) nu este prea mare, numrul
claselor (k) poate fi calculat pe baza formulei Hahn-Shapiro (Vasilescu,
1992):
k = INI [
n
5
(formula 2.2)
unde INT nseamn partea ntreag.
n cazul nostru, numrul subiecilor (n) este 30. Dac mprim 30 la 5
obinem valoarea 6. Evident c partea ntreag a lui 6 este tot 6, pe baza aces-
tei formule stabilindu-se numrul optim de clase n care pot fi grupate valori-
le. Cunoscnd numrul claselor am stabilit, dup cum s-a precizat mai sus,
intervalul de grupare.
Dac volumul msurtorilor este mare se utilizeaz specificaiile lui
Kolker referitoare la numrul de clase:
Tabelul 2.3 Specificaiile lui Kolker referitoare la alegerea numrului de clase
n 25-40 41-60 61-99 100 101-160 161-250 251-400 401-630 631-1000 > 1000
k 6 7 8 10 11 12 13 14 15 16-20

Din considerente practice, numrul claselor nu va depi valoarea 20.
O alte metod prin care putem stabili intervalul de distribuie dar i
numrul claselor cunoscnd amplitudinea de variaie i numrul de msur-
tori o reprezint utilizare mule i Sturges (Vasilescu, 1992): a for i lu
| =
X
max
-X
m|n
1+3,322|g(n)
(formula 2.3)
n situaia noastr, logaritmul zecimal din 30 este 1,47. n mod curent
putem gsi logaritmul zecimal n tabelele de logaritmi sau utiliznd un calcu-
lator tiinific. Cu nd t loar i v buie devine: nosc aceas va e, nter alul de distri
i =
19S -171
1 +S,S22 1,47
=
22
S,88
= S,74 4
60
Cristian Opariuc-Dan
Observm c valoarea obinut aici se apropie foarte mult de valoarea
stabilit prin formula anterioar. Aceast formul poate fi folosit pentru va-
lori destul de mari ale lui n respectnd ns limita de 20 de clase.
Referitor la numrul claselor i la intervalele de grupare se impun ur-
mtoarele observaii:
1. Dac alegem intervale de grupare prea mici, gruparea date-
lor scoate n eviden lucruri de amnunt ce estompeaz
tendina de ansamblu a datelor i deci a procesului pe care l
studiem;
2. Intervalele de grupare prea mari pot estompa iregularitile
distribuiei i atenueaz specificul fenomenului studiat,
pierzndu-se precizia cu care identificm o valoare indivi-
dual;
3. n mod obinuit, vom utiliza, dac msurtoarea s-a fcut
folosind numere ntregi, limite de interval exprimate tot n
numere ntregi. Limita inferioar a intervalului superior va
trebui s fie mai mare cu o unitate dect limita superioar a
intervalului inferior. De exemplu:
171 174 i nu 171 174
175 178 174 178
deoarece nu vom ti unde s ncadrm valoarea 174
La fel, 171,00 174,67 i nu 171,00 174,67
174,68 178,35 174,67 178,35
Dup cum putem ns observa, msurtorile iniiale s-au efectuat n
numere ntregi. Un exces de precizie la acest nivel este exagerat i poate pro-
duce confuzii. Un subiect cu nlimea de 174 unde va fi inclus? n primul
61
Statistic aplicat n tiinele socio-umane
caz, evident, n prima clas. n al doilea caz ns, poate fi inclus i n prima i
n a doua clas. De aceea niciodat precizia claselor nu va depi precizia
msurtorilor efectuate.
Gruparea n
clase fiind ncheiat,
obinem aa-numita
distribuie statistic
ce formeaz baza
prelucrrilor de date
ulterioare. n exem-
plul nostru vom avea
urmtoarea distribuie statistic:
Tabelul 2.4 Distribuia statistic pe clase
Clasa
Distribu-
ia n linii
f
a
f
c
f
c
%

171 174 ||||||||| 9 9 30 30,00 300,00
175 178 ||||| 5 14 21 16,66 166,66
179 182 |||||| 6 20 16 20,00 200,00
183 186 |||| 4 24 10 13,33 133,33
187 190 ||| 3 27 6 10,00 100,00
191 -193 ||| 3 30 3 10,00 100,00

30

nsumnd efectivele (frecvenele) tuturor intervalelor, va rezulta, evi-
dent, numrul total de msurtori (n). Este de asemenea posibil s calculm
frecvenele cumulate, fie ascendent, fie descendent, ca expresie a adunri
frecvenei intervalului curent la frecvena cumulat a intervalului anterior.
Astfel, pentru primul interval, att frecvena ct i frecvena cumulat ascen-
dent au valoarea 9. Pentru al doilea interval frecvena absolut este 5 iar
frecvena cumulat ascendent devine 9+5=14. Al treilea interval are frecven-
a absolut 6 iar frecvena cumulat ascendent 14+6=20 i aa mai departe.
Procedura de calcul este analoag i n cazul frecvenelor cumulate descen-
dent, cu singura deosebire c adunarea se face ncepnd de la ultimul interval.
Rolul frecvenelor cumulate este acela de a ordona cresctor sau
descresctor datele grupate n intervale i de a indica numrul de cazuri, ci
subieci se afl pn la o anumit valoare (frecvenele cumulate ascendente)
sau ci subieci au depit o anumit valoare (frecvenele cumulate descen-
dente). Dac discutm de ordonare, este evident c variabila trebuie s se afle
cel puin la un nivel ordinal de msur, calcului frecvenelor cumulate n ca-
zul variabilelor nominale fiind un nonsens.
62
Cristian Opariuc-Dan
Putem exprima, de asemenea, frecvenele relative, ca proporie a sco-
rurilor dintr-o clas. Cele mai utilizate frecvene relative sunt procentele (%)
i promilele (). Ca modalitate de calcul al procentelor sau promilelor vom
folosi regula de trei simpl, astfel:
Pentru prima clas vom avea urmtoarea valoare:
dac 30 reprezint 100%
atunci 9 reprezint x
Jc unJc x =
9 1uu
Su
=
9uu
Su
= Su%
II.2 Reprezentarea grafic a datelor
Sintagma o imagine face mai mult dect o mie de cuvinte este vala-
bil i n statistic. Uneori este mai convenabil s reprezentm grafic datele
pentru a ne forma intuitiv o reprezentare a acestora. Nu trebuie s uitm ns
faptul c n statistic afirmaiile pe care le facem trebuie demonstrate iar de-
monstraia se poate face doar cifric.
Exist multe moduri prin care putem reprezenta grafic datele pe care
le vom discuta n momentul n care tematica le va impune. Pentru moment ne
tograma, poligonul frecvenelor, poligo-
nul frecvenelor cumulate i plcinta.
Reprezentarea prin grafice
vom rezuma la graficele cu bare, his
le
cu bar
F i
e const n ridicarea unei per-
pendiculare de lungime egal cu frec-
vena pentru fiecare valoare sau clas
aezat pe axa O
x
. Cu ajutorul barelor
putem reprezenta att datele negrupate
ct i datele grupate. Astfel, pentru
exemplul nostru, prezentm reprezenta-
igura 2.1 Graficul cu bare al nlimi
subiecilor
63
Statistic aplicat n tiinele socio-umane
rea prin grafice cu bare a nlimii subiecilor sub form de valori. Un tip par-
ticular de reprezentare a graficelor cu bare este histograma. O histogram se
deosebete de un grafic cu bare prin aceea c, n locul liniilor, sunt ridicate
dreptunghiuri cu baza egal cu intervalul
folosit. Pentru a putea folosi histogramele,
datele trebuie s fie grupate aadar pe in-
tervale egale.
Dac unim prin linii vrfurile gra-
ficelor cu bare sau mijlocul bazei de sus a
histogramelor obinem un alt tip de grafic
i anume poligonul frecvenelor absolute
absolute se refer la exprimarea cifri-
c direct a efectivelor n timp ce
poligonul frecvenelor relative coni-
ne exprimarea procentual a acestora.
Figura 2.2 Histograma pentru nli-
mea subiecilor
sau relative. Poligonul frecvenelor
funciei de reparti . La fel
relativ.
De asemenea este posibil
construirea poligonului frecvenelor
cumulate ca reprezentare grafic a
ca i n cazul graficului cu bare, n drep-
tul fiecrei valori se nal o perpendicu-
lar de mrime egal cu frecvena cumu-
lat. Unind vrfurile acestor perpendicu-
lare se obine poligonul frecvenelor cu-
mulate care poate fi exprimat absolut sau
Figura 2.3 Poligonul frecvenelor
absolute
ie cumulativ
Figura 2.4 Poligonul frecvenelor
cumulate
64
Cristian Opariuc-Dan
Uneori este mai convenabil s reprezentm, mai ales atunci cnd lu-
crm c
Pentru o variabil continu, deoa-
n concluzie:
e date are o valoare informativ extrem de redus. n vederea
extragerii unor informaii preliminare este necesar ordonarea i grupa-
rei valori realizndu-se astfel un protocol sistematizat;
iza
rul
amele n linii (puncte, stelue etc.) i frec-
nt.
trebri i exerciii:
igen subiecii au obinut urmtoarele scoruri: 16, 20,
20, 9, 17, 6, 11, 5, 15, 10, 5, 16, 16, 11, 11, 13, 14, 13, 10, 13, 13, 13, 15,
u procente, compoziia msurtorilor printr-o structur radial. Un
asemenea grafic se numete plcint (pie) i este util atunci cnd ne intere-
seaz s urmrim proporia cu care fieca-
re clas particip la construcia ntregu-
lui.
rece avem o densitate de probabilitate pe
intervalul de valori, reprezentarea grafic
se face sub forma unei curbe numit cur-
b de distribuie, ns acest aspect va
face obiectul unui capitol ulterior.

O colecie d
Figura 2.5 Reprezentarea prin diagram
de structur (plcint)
rea datelor;
La o amplitudine de variaie mic pot fi ordonate valorile i numrate
efectivele fiec
La o amplitudine de variaie mare i la msurtori numeroase se va real
gruparea datelor n clase, pe baza unui interval de grupare. Att num
claselor ct i intervalul de grupare pot fi calculate n baza unor formule
sau a unor tabele de referin;
O distribuie statistic reprezint un protocol de date sistematizat i orga-
nizat care conine clasele, diagr
venele absolute. Alte informaii care mai pot fi incluse sunt frecvenele re-
lative (procentuale), frecvenele cumulate absolute i relative;
Distribuiile statistice pot fi reprezentate i grafic folosindu-se graficele cu
bare, histogramele, poligoanele de frecvene sau graficele plci

n
La un test de intel
65
Statistic aplicat n tiinele socio-umane
12, 21, 7, 14, 24, 13, 19, 15, 17, 14, 8, 8, 17, 15, 9, 4, 22, 12, 23, 10, 18, 8,
13, 12, 14, 11, 13, 14. Realizai distribuia statistic preciznd toi indica-
torii studiai i reprezentai grafic.
Ce diferene sunt ntre frecvena absolut i frecvena relativ?
Ce rol au frecvenele cumulate?

m de n=32.458 de cazuri?
anizat pe
Cnd poate fi folosit un grafic de tip plcint?
n cte clase reprezentai un volu
Ce este o distribuie statistic?
Precizai avantajele i dezavantajele distribuiei statistice org
clase.
66
Cristian Opariuc-Dan
I III. STATISTICI DESCRIPTIVE TENDINA CENTRAL II.S T TATISTICI DESCRIPTIVE ENDINA CENTRAL
n acest capitol se va discuta despre:
Conceptul de statistici descriptive;
Definirea noiunilor de populaie i eantion;
Indicatori ai tendinei centrale media, mediana
i modul;
Obinerea indicatorilor tendinei centrale n
SPSS;
Dup parcurgerea capitolului, cursanii vor fi capabili s:
neleag semnificaia statisticilor descriptive;
Fac distincia ntre populaie i eantion;
Disting ntre diferitele modaliti de eantiona-
re;
Calculeze indicatorii tendinei centrale;
Utilizeze corect indicatorii tendinei centrale n
funcie de modul de distribuie al datelor;
S extrag indicatorii tendinei centrale utili-
znd programul SPSS.

Statistica descriptiv se refer la totalitatea metodelor care per-
mit descrierea i gruparea n diferite moduri a datelor rezultate din cer-
cetri. Orice procedeu de analiz a datelor presupune efectuarea unor opera-
iuni preliminare de statistic descriptiv. Statisticile descriptive nu au ca
scop efectuarea unor predicii ci doar sumarizarea i prezentarea datelor. Pro-
cedeele utilizate n statisticile descriptive se refer la gruparea i prezentarea
datelor n tabele i grafice, calculul indicatorilor tendinei centrale i ai varia-
bilitii, indicatori ai asocierii i legturii dintre variabile (studii corelaionale
simple).
nc de la nceput s-a stabilit c, prin statistic, putem descrie, compa-
ra i relaiona variabile. Totodat, modul de realizare al unei variabile se face
prin atribuirea de valori rezultate din diferite surse de date. Totui, cum cule-
gem aceste date? Cum facem ca pornind de la un numr relativ redus de su-
67
Statistic aplicat n tiinele socio-umane
bieci s extindem cunotinele noastre la nivelul ntregii populaii? i n de-
finitiv ce nseamn populaie i ce nseamn eantion?
III.1 Populaie i eantion
Cnd discutm de populaie, nu este obligatoriu s ne referim la popu-
laia unei ri sau a unui ora; n general, ne referim la un grup distinct de
persoane sau obiecte. De exemplu, vorbim de populaia fumtorilor, popula-
ia deficienilor mintali, populaia consumatorilor de Coca-Cola sau populaia
mainilor Lamborghini. Acest lucru se refer la totalitatea obiectelor, de un
anumit tip, existente ntr-un spaiu sau teritoriu, la un moment dat. O
prim observaie se refer la faptul c populaia este relativ la un criteriu (de
exemplu cel teritorial) sau la mai multe criterii (de exemplu automobile i
Romnia). Prin urmare, cnd vorbim de populaie relevant, avem n vedere
totalitatea obiectelor care satisfac unul sau mai multe criterii.
De exemplu, dac desfurm un studiu n care dorim s demonstrm
eficiena unui medicament ce va accelera abandonul fumatului n Romnia,
ne intereseaz criteriul teritorial (Romnia) dar i calitatea de fumtor, pre-
zent sau trecut.
Populaia este definit deci, ca fiind totalitatea unitilor de in-
formaie care constituie obiectivul de interes al unei investigaii. ntot-
deauna, la nceputul unei cercetri, trebuie menionat populaia cercetrii n
vederea specificrii domeniului la care vom extinde rezultatele, concluziile
obinute.
De cele mai multe ori nu putem studia ntreaga populaie din cauza
numeroaselor limitri pe care le-ar impune un asemenea demers (costuri,
timp, accesibilitate, dinamica populaiei etc.). De aceea majoritatea cercetri-
lor se efectueaz pe un grup de subieci extrai din populaie, care s prezinte
caracteristicile acesteia, grup mult redus ns din punct de vedere numeric.
Un asemenea grup poart numele de eantion. Un eantion este deci o selec-
68
Cristian Opariuc-Dan
ie a indivizilor dintr-o populaie. Cercettorii utilizeaz eantioane, deoarece
lucrul cu acestea este mai ieftin, mai rapid i mai uor n comparaie cu cerce-
tarea ntregii populaii iar rezultatele pot fi extinse la nivelul ntregii popula-
ii.
Eantionul reprezint unitile de informaie selecionate pentru a fi
efectiv studiate. Ideea pe care se bazeaz cercetrile orientate pe eantioane,
este aceea c se pot face aprecieri asupra unei ntregi populaii, n anumite
condiii, doar pe baza caracteristicilor msurate pe o parte a acesteia.
Totui, pentru ca rezultatele obinute prin studiul eantionului s poat
fi extinse la nivelul ntregii populaii, acel eantion trebuie s fie reprezenta-
tiv, adic s ntruneasc caracteristicile de baz ale populaiei din care a fost
extras.
S presupunem, de exemplu, c fierbem o oal de fasole. Cum verifi-
cm dac fasolele au fost fierte? n primul rnd, amestecm fasolele n oal.
Dac nu am amesteca fasolele, am putea risca s le lum pe cele de la supra-
fa (care sunt mai puin fierte) nu i pe cele de la fund (care probabil sunt
mai fierte). Dup aceea, lum o lingur de fasole i gustm. n funcie de re-
zultat, decidem dac acestea sunt sau nu sunt fierte. Nu trebuie se mncm
toat oala de fasole ca s decidem dac sunt sau nu fierte. Este suficient s
verificm un eantion de fasole pentru ca mai apoi s extindem cunotina la
nivelul ntregii oale. Iat deci c exact acesta este i principiul eantionrii.
Prin amestecarea n oala de fasole am creat posibilitatea ca fiecare boab de
fasole s aib ansa de a fi aleas. Apoi, am extras aleatoriu un eantion de
boabe de fasole pe care l-am verificat. Dac am decis c sunt fierte, nu voi
mai continua cercetarea. ansele s m nel sunt prea mici
5
.
Afirmam anterior c un eantion trebuie s fie reprezentativ, adic s
ndeplineasc caracteristicile populaiei din care face parte. Evident, n mo-

5
Exemplul a fost preluat i adaptat dup Lungu Ovidiu Ghid introductiv pentru SPSS 10.0
pentru Windows
69
Statistic aplicat n tiinele socio-umane
mentul n care voi dori s tiu dac sunt fierte fasolele, voi extrage un eanti-
on de boabe de fasole i nu unul de boabe de mazre din oala alturat. Posi-
bilitatea de a generaliza cunotinele dobndite la nivelul eantionului ctre
ntreaga populaie este vital n cercetarea experimental. De aceea, asigura-
rea reprezentativitii unui eantion este de maxim importan.
Metoda prin care selectm un eantion dintr-o populaie are implicaii
asupra validitii i generalizrii concluziilor dobndite n urma studiului
eantionului. Metodele de eantionare se mpart n dou mari categorii: me-
tode prin care eantionul este extras aleatoriu dintr-o populaie i metode prin
care eantionul nu este extras aleatoriu.
ntr-un eantion care nu este extras aleatoriu, probabilitatea ca un su-
biect s fac parte din eantion nu poate fi calculat. Este exemplul clasic n
care subiecii sunt selectai pe baz de voluntariat sau cei care returneaz
chestionarele completate prin pot.
ntr-un eantion extras aleatoriu, fiecare individ are o probabilitate
calculabil de a fi inclus n eantion iar aceast probabilitate va trebui s fie
egal pentru fiecare subiect. Este cazul extragerii unui eantion dintr-o baz
de date care conine, aleatoriu, ntreaga populaie.
Orice eantion se stabilete n baza unei scheme de eantionare. O
schem de eantionare reprezint un set de tehnici i reguli n baza crora din
populaie se extrage eantionul necesar iar compoziia acestuia este aleatoriu
derivat n funcie de definiiile probabilistice ale schemei de eantionare.
III.1.1 Eantionarea simplu randomizat
Randomizare nu nseamn hazard absolut ci este o metod prin care
fiecare individ are o ans calculabil de a fi ales n eantion. Prin randomiza-
re simpl, fiecare individ are anse egale s fie selectat. Pentru a efectua o
asemenea eantionare, avem nevoie de o baz de eantionare, o list a ntre-
gii populaii (de exemplu, lista exhaustiv a fumtorilor din Romnia). Fieca-
70
Cristian Opariuc-Dan
re individ din acea list are asociat un numr. Se folosesc apoi tabelele de
numere aleatoare sau numerele aleatoare se genereaz de un computer. Prac-
tic, numrul aleatoriu generat reprezint numrul de ordine al individului de
pe list. Procedura continu pn cnd s-a extras ntregul eantion. Metoda
randomizrii este o metod foarte simpl ns dificultatea const n posibilita-
tea obinerii unei liste exhaustive pe criteriile dorite.
III.1.2 Randomizarea pe cote
Este o metod pseudo-randomizat de selectare a unui eantion n care
se iau n considerare anumite caracteristici ale populaiei cum ar fi sexul, vr-
sta, profesia etc. n eantion se intenioneaz respectarea proporiei n care
aceste caracteristici se regsesc n populaie. Dup ce se identific proporia
fiecrei caracteristici ce va fi inclus n eantion, fiecrui evaluator i revine
sarcina s evalueze un anumit numr de persoane ce prezint acea caracteris-
tic, alegerea persoanelor rmnnd la latitudinea acestuia. Este important ca
acea caracteristic s poat fi identificat cu uurin i fr ambiguitate de
ctre evaluator, altminteri putnd aprea seri-
oase probleme la nivelul reprezentativitii.
De exemplu, dac avem urmtoarea structur
a populaiei din Romnia dup dou criterii
vrst i sex:
Tabel 3.1 Structura populaiei
Vrsta (ani) Brbai Femei
15-20 10000 9000
21-30 12000 13000
31-50 12000 14000
peste 50 12000 18000
O eantionare pe cote presupune res-
pectarea proporiei n care se gsete popula-
ia general, la aceste dou criterii i n ean-
tion. Astfel, dac extragem un eantion de
1000 de persoane, proporia subiecilor din
acest eantion va respecta proporia subiecilor din populaia general. Prin
urmare, vom obine:
Tabel 3.2 Proporii eantion
Vrsta (ani) Brbai Femei
15-20 10% 9%
21-30 12% 13%
31-50 12% 14%
peste 50 12% 18%
Acesta este principiul eantionrii pe cote. Un evaluator va administra
instrumentele de evaluare unui numr de, s spunem, 120 de brbai cu vrsta
71
Statistic aplicat n tiinele socio-umane
cuprins ntre 31 i 50 de ani, avnd libertatea de a alege singur persoanele,
atta timp ct respect aceste dou criterii.
O problem apare n momentul n care unul dintre criterii are o ponde-
re extrem de mic n populaie (de exemplu, cnd studiul se refer la persoa-
ne cu un IQ sub 70). n acest caz, numrul persoanelor selectate n eantion s-
ar putea s fie prea mic pentru a permite generalizarea. ntr-o asemenea situa-
ie se procedeaz la supra-eantionare adic la mrirea acestui numr. Se
consider c pentru anumite caracteristici foarte rare, acest fapt nu afecteaz
reprezentativitatea eantionului.
III.1.3 Eantionarea stratificat
n condiiile n care putem identifica o serie de straturi dup care este
mprit populaia n funcie de unul sau mai multe criterii, vom putea pro-
ceda la o eantionare randomizat pentru fiecare strat. Acest lucru ne permite
s ne asigurm c fiecare grup este reprezentat n eantionul final. Numrul
fiecrui grup este proporional cu mrimea stratului, ns dac acel grup este
foarte mic, se procedeaz, la fel ca n cazul anterior, la mrirea numrului de
subieci n eantion pentru asigurarea reprezentativitii. De exemplu, putem
depista stratul fumtorilor, stratul nefumtorilor i stratul celor care au renun-
at la fumat. Aflm care este ponderea fiecrui strat n populaia general i
apoi, din fiecare strat, extragem aleatoriu eantionul nostru. Metoda se asea-
mn cu cea prezentat anterior, diferena fiind aceea c n eantionarea pe
cote evaluatorul poate alege liber subiecii dintr-un grup, n timp ce aici su-
biecii din grup sunt alei dinainte n baza eantionrii randomizate simple.
Dac discutm de eantionare randomizat simpl, evident c se ridic din
nou problema bazei de eantionare. Dei este mai precis n comparaie cu
eantionarea pe cote, eantionarea stratificat se lovete de aceeai problem,
dificultatea obinerii bazei de eantionare.
72
Cristian Opariuc-Dan
III.1.4 Eantionarea pe cluster
Un cluster reprezint o unitate care prin ea nsi se prezint ca un in-
divid dintr-o populaie. Spre exemplu, dac populaia o considerm ca fiind
cea a liceelor din Romnia, un cluster este liceul C Negruzzi din Iai, un alt
cluster liceul Mircea cel Btrn din Constana i aa mai departe. n acest
caz, eantionarea se face pe uniti de eantionare iar evaluarea se face exha-
ustiv la nivelul clusterului. Aadar, eantionul este stabilit pe uniti de ean-
tionare i nu pe indivizi iar la nivelul unei uniti de eantionare se evalueaz
exhaustiv toate persoanele. Spre exemplu, dac baza de eantionare o consti-
tuie liceele din Romnia care sunt, s presupunem, n numr de 3000, atunci
vom extrage aleatoriu un eantion de 30 de licee pe care le vom investiga
exhaustiv. Un asemenea liceu joac rolul unui individ dintr-o eantionare
randomizat i poart numele de unitate de eantionare.
Exist i alte modaliti de eantionare, ns acestea sunt cele mai im-
portante pentru cercetarea n tiinele socio-umane. Rmne ns problema
ct de mare s fie eantionul pentru a asigura generalizarea concluziilor la
nivelul ntregii populaii. Pentru a trata acest aspect, va trebui s tim cteva
lucruri despre distribuia datelor ntr-o populaie, mai precis despre curba de
distribuie normal. De aceea, asupra acestei probleme vom reveni i o vom
trata n amnunt ntr-un alt capitol.
III.2 Indicatori ai tendinei centrale
Calitatea datelor colectate este fundamental pentru scopul cercetrii.
Am aflat n capitolul al doilea cum putem organiza setul de date brute astfel
nct informaiile s devin inteligibile. Urmeaz s ne asigurm c metoda
prin care am colectat datele este adecvat i c datele ne pot informa ntr-o
manier tiinific. Am spus, de asemenea, c pentru volume mari de date,
acest proces de organizare poate fi unul extrem de laborios i mare consuma-
tor de timp. De asemenea, probabil c ai fost surprini c n capitolul al doi-
lea nu avem nici o aplicaie n SPSS. Motivul pentru care nu am inclus nici o
73
Statistic aplicat n tiinele socio-umane
aplicaie practic a fost acela c, n realitate, n momentul n care lansm o
procedur de analiz de date, SPSS face automat aceast organizare. Indife-
rent ct de sofisticate ar fi analizele de date pe care le efectum, nu putem
obine la ieire dect ceea ce am introdus la intrare. Iat deci c nainte
de a intra n procedee statistice mai elaborate am discutat cteva elemente
referitoare la eantionare. Ceea ce trebuie s reinei, este faptul c o cercetare
greit proiectat duce n mod sigur la rezultate eronate.
Organizarea i sistematizarea datelor i reprezentarea grafic a acesto-
ra nu sunt suficiente n cele mai multe cazuri. Avem nevoie de mai mult de-
ct de desene i grafice frumoase pentru a da un sens acelor date i pentru a
extrage concluzii utile. Uneori avem nevoie s stabilim relaiile dintre dou
sau mai multe variabile sau s vedem cum scorul la o anumit variabil este
influenat de scorurile altor variabile. Alteori trebuie s comparm variabile-
le, s vedem dac sunt diferene ntre ele i care este sensul acestor diferene.
Toate aceste aspecte sunt reunite sub denumirea generic de analiz a date-
lor.
n al doilea capitol am vzut deja cum datele se concentreaz n jurul
unor valori i am constatat c n raport cu dimensiunea eantionului, subiecii
pot fi considerai mai degrab scunzi dect nali. Iat c prin acest procedeu
putem intui c datele noastre tind spre anumite valori considerate ca fiind
centrale. Aadar, putem vorbi despre o tendin central a rezultatelor.
Prima i cea mai comun form de descriere a datelor o reprezint
analiza tendinei centrale. Msura tendinei centrale ne d o indicaie asupra
scorurilor tipice din colecia de date. Cu alte cuvinte, ne indic modul n care
se grupeaz datele n jurul unei valori. Cei mai importani indicatori ai ten-
dinei centrale sunt media, mediana i modul.
Procedeele statistice urmresc, n aproape toate cazurile, modelarea
lumii reale. Un model statistic reprezint o reprezentare probabilistic a unei
realiti care nu poate fi cunoscut nemijlocit. Ar fi foarte greu s cunoatem
74
Cristian Opariuc-Dan
structura geologic a unui munte. Nu putem aduce muntele n laborator s-l
studiem i nici nu putem trimite mii de geologi care s investigheze fiecare
roc din compoziia muntelui. Totui, tim c muntele este calcaros sau gra-
nitic, putem aprecia vechimea acestuia i era geologic de formare. Acest
lucru devine posibil prin studiul unor eantioane prelevate din munte pe baza
crora s-a construit un model probabilistic al muntelui.
III.2.1 Media
Considerm c termenul de medie mai precis media aritmetic es-
te conceptul cel mai uor de neles din ntreaga statistic. Au fost nenumra-
te situaiile n care ai ntlnit media: media la matematic pe trimestru sau
semestru s vedei dac ai rmas corigent sau ai luat premiu, media de la
bacalaureat care v ridic sau v coboar ansele de admitere la facultate, la
fel ca i media anilor de studiu, media de vrst din familia dumneavoastr
sau media cheltuielilor zilnice care v ajut s v planificai mai bine bugetul.
Deci ce este media? Media nu este altceva dect suma valorilor unei
variabile raportat la numrul msurtorilor, fiind poate cel mai simplu mo-
del statistic. Aceasta este media aritmetic, deoarece n statistic mai discu-
tm i de media geometric, media caracteristicilor alternative, media ptrati-
c, media rangurilor etc. Aceste concepte le ntlnim ns mai rar n domeniul
tiinelor socio-umane i prin urmare nu vom face dect s le amintim.
Probabil c vi se va prea ciudat afirmaia anterioar. Cum adic
media este un model statistic? Ei bine, aa este, deoarece nu reprezint alt-
ceva dect o valoare ipotetic ce poate fi obinut din orice set de date msu-
rate la un nivel parametric. Dac, de exemplu, nregistrm numrul de frai pe
care i au cinci prieteni de-ai mei, am obine urmtoarele valori: primul prie-
ten are un frate, al doilea 2 frai, al treilea i al patrulea 3 frai i al cincilea 4
frai. Ci frai au n medie cei cinci prieteni ai mei? Dac adunai cele cinci
valori i mprii la cinci, obinem o medie de 2,6 frai. Ci frai??? Repet
ci frai? Media spune clar: 2,6 frai. Ce nseamn 2,6 frai? Probabil doi
75
Statistic aplicat n tiinele socio-umane
frai ntregi i unul cruia i lipsete o mn sau un picior. Iat de ce media nu
este altceva dect un model ipotetic, un model statistic care reprezint tendin-
a, direcia spre care converg datele.
Cnd vorbim de medie, trebuie s nelegem i condiiile n care o pu-
tem folosi, deoarece utilizarea ei n condiii inadecvate este inutil i primej-
dioas, putnd duce la multe confuzii i erori de interpretare. Am spus deja c
putem folosi media doar n cazul n care datele se afl cel puin la un nivel de
msurare de interval, altminteri nu are sens s discutm despre medie. Nu
putem face, v amintii, media ntre un colonel i un cpitan. Ce-ar rezul-
ta??!! n nici un caz un maior. De asemenea, media poate fi folosit doar n
cazurile n care valorile individuale se grupeaz n jurul acesteia, iar valorile
care se abat de la medie se anuleaz reciproc. Cu alte cuvinte, suma valorilor
individuale mai mari dect media i suma valorilor mai mici dect media tind
s se anuleze. Vom vedea, n acest capitol, care sunt limitele mediei i cum le
putem evita i atunci vei n e e mai bine aceste concepte. el g
x =
x
i
k
i=1
n
(formula 3.1)
Iat i prima formul care are darul s v sperie. n realitate aceast
formul este formula mediei aritmetice menionat mai sus. S-ar traduce prin
suma tuturor valorilor de la i la k mprit la numrul valorilor n. Semnul
sigma este un semn folosit pentru a exprima suma. Observm c pentru a
avea sens, trebuie s existe cel puin un element. Pn acum nimic avansat.
Media aritmetic se mai noteaz cu m sau folosind x ca n formula noastr.
De fapt, dac respectm strict conveniile de notare din literatura de speciali-
tate, atunci cnd vorbim de o populaie, vom nota media cu (miu) iar cnd
de referim la un eantion o vom nota cu m sau x.
Iat, avem un numr de 10 msurtori ale unor scoruri brute la un
chestionar de anxietate, dup cum urmeaz: 10, 22, 31, 9, 24, 27, 29, 9, 23,
76
Cristian Opariuc-Dan
12. Media aritmetic va fi suma acestora mprit la numrul lor, n cazul
nos I 1 g ? tru 10. at c efectund calculele obinem media de 9,6. Este reu, nu
x =
1u +22 +S1 +9 +24 +27 +29 +9 +2S +12
1u
=
196
1u
= 19,6
Vom reconsidera acum exemplul din capitolul al doilea i vom ncer-
ca s-l utilizm pentru a efectua calculele n vederea stabilirii celor trei indi-
catori ai tendinei centrale. Vi-l reamintesc:
Exemplu: Presupunem c msurm nlimea unor subieci n centi-
metri i obinem urmtoarele rezultate: 182, 175, 174, 189, 177, 177, 180,
173, 188, 171, 184, 192, 180, 172, 177, 193, 184, 192, 172, 177, 174, 171,
172, 179, 185, 179, 183, 172, 179, 188.
Pentru a calcula media, va trebui s adunm toate aceste 30 de valori
i s mprim suma rezultat la 30 care reprezint numrul msurtorilor.
ncepei s adunai.. Suma tuturor acestor valori este 5391. Dac mprim
aceast sum la 30 vom obine valoarea 179,7 care nu reprezint altceva de-
ct media nlimii celor 30 de subieci.
Ai observat probabil c v-a luat destul de mult timp s calculai
aceast medie folosind adunarea valorilor. Nu ai avut dect 30 de valori de
adunat. Acum imaginai-v c avei 3000 sau 5000 de valori. V putei da cu
uurin seama c n asemenea condiii calculul mediei devine extrem de di-
ficil i foarte susceptibil la erorile ce pot s apar. Cnd volumul datelor este
destul de mic, putem calcula media prin nsumarea valorilor i raportarea
acestei sume la numrul de msurtori. Dac volumul de date este ns mare
iar datele sunt grupate, vom prefera o alt metod de calcul folosind aceste
date grupate. Iat o prim aplicaie a datelor grupate. V mai aducei aminte
de distribuia statistic folosit n capitolul doi? O vom reproduce i apoi vom
modifica acest tabel astfel nct s ne permit calculul mediei. tim c inter-
valul de grupare este i=4 iar acest interval a fost stabilit prin aproximare.
77
Statistic aplicat n tiinele socio-umane

Urmeaz s stabi-
lim valoarea central x
k
ce
nu reprezint altceva dect
mijlocul intervalului cu-
rent. Astfel, pentru primul
interval avem valorile 171,
172, 173, 174. Valoarea
central a intervalului va fi
aadar ntre 172 i 173, mai precis 172,5. Pentru al doilea interval avem 175,
176, 177, 178 i deci valoarea central devine n acest caz 176,5 i aa mai
departe. Ultimul interval conine ns doar trei elemente i anume 191, 192,
193. Aici valoarea central va fi deci 192.
Tabelul 3.3 Distribuia statistic
Clasa
Distribuia
n linii
f f
c
% %
c

171 174 ||||||||| 9 9 30,00 30,00
175 178 ||||| 5 14 16,66 46,66
179 182 |||||| 6 20 20,00 66,66
183 186 |||| 4 24 13,33 80,00
187 190 ||| 3 27 10,00 90,00
191 -193 ||| 3 30 10,00 100,0
n=30 100%
Urmeaz apoi, stabilirea valorii fxx
k
care reprezint nmulirea, pentru
fiecare clas, a valorii x
k
cu frecvena absolut f. Pentru primul interval vom
avea, aadar, 172,5 x 9 = 1552,5. Al doilea interval va avea ca rezultat produ-
sul 176,5 x 5 = 882,5 i aa mai departe pn la ultimul interval.
Adunm apoi toate aceste produse obinute n coloana fxx
k
pentru a
stabili suma produselor, . n cazul nostru, 1552,5 + 882,5 + 1083 + 738 +
565,5 + 576 = 5397,5. Constatm c
valoarea este foarte apropiat de
valoarea exact obinut prin nsu-
marea tuturor valorilor (5391).
Acum, dac mprim totalul 5397,5
la numrul de msurtori n vom ob-
ine valoarea mediei 179,91. Aceast
nou valoare difer foarte puin de
media real obinut prin nsumarea valorilor. Acest lucru se ntmpl deoa-
rece media pune n eviden tendina central a rezultatelor constatate ntr-o
Tabel 3.4 Calculul mediei aritmetice
Clasa x
k
F fxx
k

171 174 172,5 9 1552,5
175 178 176,5 5 882,5
179 182 180,5 6 1083
183 186 184,5 4 738
187 190 188,5 3 565,5
191 -193 192 3 576
n=30 = 5397,5
78
Cristian Opariuc-Dan
cercetare iar gruparea datelor introduce o eroare n calculul mediei pentru c
se face ipoteza c elementele fiecrei clase sunt concentrate la mijlocul inter-
valului, ceea ce nu este aa. Cei zece subieci din primul interval, tim bine,
nu au nlimi concentrate n jurul valorii de 172,5 i cu att mai puin subiec-
ii din celelalte intervale. Cu ct intervalul de grupare este mai mare cu att
aceast eroare de grupare va avea o valoare mai mare. Statisticienii consider
ns c la volume mari de date eroarea este neglijabil comparativ cu timpul
alocat nsumrii valorilor.
Iat c, din cele expuse mai sus, putem deduce o nou formul pentru
medie, valabil n cazul date r rupate: lo g
x =
]
k
x
k
k
i=1
n
(formula 3.2)
unde f
k
reprezint frecvena absolut a unei clase k, x
k
reprezint mij-
locul clasei k iar n reprezint numrul total de subieci
Calculnd media se obine o msur a nivelului mediu relativ la un
eantion studiat, fapt ce permite apoi comparaii ntre grupe.
Media aritmetic prezint o serie de proprieti importante, foarte
utile nelegerii condiiilor de utilizare ale acestui indicator statistic.
Adugnd sau scznd o constant la fiecare valoare (scor) in-
dividual, media se mrete sau se micoreaz cu valoarea ace-
lei constante;
nmulind sau mprind fiecare scor individual cu o constant,
media se multiplic sau se divide cu valoarea acelei constante;
Suma scorurilor cu valori mai mici dect media este egal cu
suma scorurilor mai mari dect media, astfel nct scorurile
mai mici de medie anuleaz scorurile mai mari dect media;
79
Statistic aplicat n tiinele socio-umane
O variant a mediei, utilizat destul de des n cercetrile socio-umane,
se refer la media ponderat. n cazul mediei aritmetice simple, fiecare scor
particular are aceeai pondere n calculul acestui indicator, situaie care se
schimb atunci cnd ne referim la media ponderat. n acest caz, ponderea
scorurilor este diferit. S presupunem c administrm unui subiect un numr
de 4 teste de inteligen, notate testul 1, testul 2, testul 3 i testul 4
la care subiectul obine urmtoarele scoruri (pe o scal de la 1 la 10): 6, 8, 9,
7. Media aritmetic se calculeaz foarte simplu, adunnd aceste valori i apoi
mprind suma rezultat la patru. Obinem un scor mediu de 7,5. Pentru cal-
cului mediei ponderate trebuie ca fiecare dintre cele patru teste s aib o pon-
dere n scorul final. Primul test, fiind mai greu, va avea o pondere mai mare,
s spunem 5. Al doilea test va avea ponderea 1, al treilea test 2 i al patrulea
test 3. Totalul ponderilor va fi, aadar, 5+1+2+3=11. Cunoscnd aceste ele-
e e m nte, putem calcula m dia ponderat, astfel:
x
i
=
(S 6) +(1 8) +(2 9) +(S 7)
11
=
Su +8 +18 +21
11
=
77
11
= 7
Avnd n vedere algoritmul de mai sus, putem scrie n continuare
formula mediei ponderate, dup um urmeaz: c
x
i
=
p
i
x
i
k
i=1
p
i
k
i=1
(formula 3.3)
unde p
i
reprezint ponderea scorului, iar x
i
reprezint scorul
III.2.2 Mediana
Mediana este o alt msur a tendinei centrale i reprezint valoa-
rea care mparte irul de msurtori n dou pari egale; jumtate din
irul de date vor avea valori mai mici dect mediana n timp ce cealalt
jumtate vor avea valori mai mari dect mediana. S considerm urmto-
rul ir de date:
Scoruri: 12, 14, 10, 11, 15, 14, 12, 20, 19, 20, 13, 11, 14, 8
80
Cristian Opariuc-Dan
Pentru a calcula mediana, primul pas este acela de a ordona cresctor
sau descresctor aceste date. Ordonnd cresctor irul de mai sus, obinem:
Scoruri: 8, 10, 11, 11, 12, 12, 13, 14, 14, 14, 15, 19, 20, 20
Dup definiia medianei, n cazul nostru avem 14 valori. Prin urmare,
mediana va fi valoarea care mparte acest ir ordonat n dou pri egale. Fi-
ind 14 valori, mediana este situat la limita primelor apte valori. Deoarece
irul este un ir par, mediana se situeaz, n cazul nostru, ntre valoarea 13 i
valoarea 14, mai precis la valoarea 13,5. n cazul unui ir impar, mediana
este valoarea de la mijlocul unui ir. Dac relum exemplul anterior, i mai
adugm un scor, obinem:
Scoruri: 12, 14, 10, 11, 15, 14, 12, 20, 19, 20, 13, 11, 14, 8, 9
irul are acum 15 valori. Ordonnd irul, obinem:
Scoruri: 8, 9, 10, 11, 11, 12, 12, 13, 14, 14, 14, 15, 19, 20, 20
De data aceasta, la mijlocul acestui ir gsim valoarea 13, valoarea
medianei.
Ordonnd un ir, putem preciza poziia fiecrui element n cadrul ace-
lui ir. Astfel, dac lum irul ordonat de 15 valori din exemplul de mai sus,
obinem:
Scoruri: 8, 9, 10, 11, 11, 12, 12, 13, 14, 14, 14, 15, 19, 20, 20
Poziia: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15
Altfel spus, mediana nu este altceva dect poziia rangului din mijloc
n irul ordonat de date. ntr-o serie de la 1 la 15, poziia din mijlocul irului
este evident, poziia 8. Acesta este de altfel i locul n care gsim mediana.
Am accentuat asupra poziiei n ir i nu am discutat despre rang. n cazul n
care avem dou sau mai multe scoruri identice (n exemplul nostru fiind vor-
ba despre 11, 12, 14 i 20), poziia n cadrul irului exprim poziia fizic a
81
Statistic aplicat n tiinele socio-umane
acelui element. Observm c scorul 12 ocup poziia 6 i 7 n cadrul irului,
elementul 14 poziia 9, 10 i 11 i aa mai departe. Cnd vorbim de rangul
unui scor i avem mai multe scoruri care se repet, rangul acestora va fi
media aritmetic a poziiilor pe care scorurile le ocup n cadrul irului.
Astfel, dac relum exemplul nostru, l putem completa i cu rangul scoruri-
lor, astfel:
Scoruri:8, 9, 10, 11, 11, 12, 12, 13, 14, 14, 14, 15, 19, 20, 20
Poziia:1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15
Rang: 1, 2, 3, 4.5, 4.5, 6.5, 6.5, 8, 10, 10, 10, 12, 13, 14.5, 14.5
Iat deci c scorul 11 apare pe poziia 4 i 5 de dou ori. Prin urmare,
rangul acestor scoruri este media dintre 4 i 5, adic 4,5. La fel, scorul 12
apare pe poziiile 6 i 7, rangul acestora fiind 6,5. Scorul 14 apare pe poziiile
9, 10 i 11, rangul acestora fiind 10 i aa mai departe.
Mediana poate fi calculat i atunci cnd avem datele grupate
6
. Iat,
am reluat exemplul anterior de calcul al mediei. Ceea ce trebuie s tim, sunt
frecvenele cumulate i numrul total de cazuri. n exemplul nostru, numrul
total de cazuri este 30. Mediana fiind valoarea ce mparte grupul de subieci
n dou pri egale, poate fi calculat dup formula alturat, unde l este limi-
ta inferioar a intervalului care conine mediana, i este intervalul de clas care
conine mediana, Poz
Me
poziia medianei, f
c
reprezint frecvena cumulat a
intervalului pre-median (totalul frecvenelor situate nainte de median iar f
reprezint frecvena a a intervalulu edianei. bsolut i m
Hc = l +i [
Poz
Mc
-]c
Mc-1
]
(formula 3.4)


6
Asemenea mediei, calculul medianei prin acest procedeu reprezint o aproximare a aces-
teia i nu valoarea ei exact
82
Cristian Opariuc-Dan
n cazul nostru, avnd 30 de msurtori, mediana va fi undeva ntre
poziia 15 i poziia 16, mai precis la 15,5
aa cum am prezentat anterior. Practic,
msurtoarea care reprezint poziia me-
dianei este determinat de formula
Poz
Mc
=
n+1
2
dac numrul de cazuri n
este un numr par. Dac n este un numr
impar, poziia medianei este dat de for-
mula Poz
Mc
=
n
2
. n cazul nostru, poziia
medianei va fi la a
30+1
2
= 1S,S-a msurtoare. Dac privim n tabelul de mai
sus, la frecvene cumulate, observm c aceast poziie corespunde intervalu-
lui 179-182, intervalul imediat superior celei de a 14-a msurtori. Limita
inferioar a acestui interval (l) este 179, intervalul de clas (i) este 4 (179,
180, 181, 182), frecvena cumulat a intervalului pre-median (f
c
) este 14 iar
frecvena absolut (f) este 6. Avem acum toate datele necesare pentru a le
nlocui n formul i obinem valoarea 180. Iat i valoarea medianei, pe care
o pute i l n care valorile sunt grupat .
Tabel 3.5 Distribuia statistic calcul
median
Clasa
Distribu-
ia n linii
f f
c

171 174 |||||||||| 9 9
175 178 ||||| 5 14
179 182 |||||| 6 20
183 186 |||| 4 24
187 190 ||| 3 27
191 -193 ||| 3 30
n=30
m ob ne n cazu e n clase
Hc = 179 +4 _
30+1
2
-14
6
_ = 179 +4
15,5-14
6
= 179 +4
1,5
6
= 18u
Mediana i rangurile sunt intens folosite atunci cnd lucrm cu date
neparametrice sau atunci cnd media nu este un indicator fidel al tendinei
centrale.
III.2.3 Modul
Doamnele, domnioarele, ne pot spune cel mai bine ce este modul, c-
ruia i se mai spune mod, mod sau valoare modal. Deci, doamnelor, ce este
n definitiv moda? Ce nelegem cnd spunem c ceva este la mod? Desigur,
ceva este la mod atunci cnd o mare parte dintre oameni poart, utilizeaz
acel lucru. Spunem c cizmele roz sunt la mod, adic, foarte multe fete poar-
83
Statistic aplicat n tiinele socio-umane
t acele cizme roz. Iat un nou cuvnt comun derivat din statistic. Prin ur-
mare, modul nu este altceva dect categoria cu frecvena cea mai mare.
Foarte complicat, ntr-adevr Dac avem irul de date:
2, 15, 16, 18, 18, 21, 21, 21, 21, 25, 26
n acest caz observm c exist un singur 2, un singur 15, un singur
16, doi de 18, patru de 21, un 25 i un 26. Care e categoria cu frecvena cea
mai mare? Evident 21. Deci, modul este 21.
Modul poate fi calculat i n cazul n care datele sunt grupate n
clase
7
. Formula de calcul, n acest caz, este prezentat mai jos, n care l re-
prezint limita inferioar a intervalului modal (intervalul cu frecvena absolu-
t cea mai mare), f
m
reprezint frecvena absolut a intervalului modal, f
m-1

frecvena absolut a intervalului pre-modal (intervalul aflat naintea interva-
lului modal), f
m+1
frecvena absolut a intervalului post-modal (intervalul
aflat dup intervalul m l de clas al clasei modale. odal) iar i este intervalu
Ho = l +i
]
m
-]
m-1
2]
m
-]
m-1
-]
m+1
(formula 3.5)
n cazul nostru, intervalul modal este intervalul cu frecvena absolut
cea mai mare, adic primul interval, 171-174 care are frecvena absolut 9.
Intervalul pre-modal nu exist,
deci frecvena lui este 0 iar inter-
valul post-modal este intervalul
175-178 care are frecvena abso-
lut 5. Evident, intervalul de clas
(i) este din nou 4 (171, 172, 173,
174). Aplicm acum formula i
obinem 174.
Tabel 3.6 Distribuia statistic calcul mod
Clasa
Distribuia n
linii
f
171 174 |||||||||| 9
175 178 ||||| 5
179 182 |||||| 6
183 186 |||| 4
187 190 ||| 3
191 -193 ||| 3
n=30

7
Asemenea mediei i medianei, calculul modului prin acest procedeu reprezint o aproxi-
mare a acestuia i nu valoarea sa exact
84
Cristian Opariuc-Dan
Ho = 171 +4
9 - u
2 9 -u -S
= 171 +4
9
1S
= 171 +
4u
1S
= 174
III.2.4 Precizia indicatorilor tendinei centrale
Am ntlnit, iat, trei indicatori ai tendinei centrale. Care dintre cei
trei indicatori caracterizeaz mai bine setul nostru de date? Care este mai
precis? Media vei spune toi i poate aa i este. Dar haidei s ne mai gn-
dim ce nseamn totui tendina central? Evident un indicator al scorurilor
tipice din setul nostru de date, un model statistic al unei realiti. Cu alte cu-
vinte, un indicator care descrie ct mai exact setul de date i care ne poate
spune cum se prezint majoritatea datelor. Haidei s considerm urmtorul
set de date:
1, 2, 3, 4, 5, 6, 7, 8, 9, 10
n acest caz, media este 5,5, iar mediana tot 5,5. S modificm puin
ultima cifr din setul nostru de date:
1, 2, 3, 4, 5, 6, 7, 8, 9, 20
Iat c, media devine acum 6,5 n timp ce mediana rmne 5,5. Hai-
dei s modificm mai mult ultima cifr:
1, 2, 3, 4, 5, 6, 7, 8, 9, 100
Acum media va fi 14,5 n timp ce mediana rmne tot 5,5. Putei intui
care indicator caracterizeaz cel mai bine tendina central n ultimul set de
date? Mediana vei spune i avei dreptate. Iat c, atunci cnd avem sco-
ruri extreme, foarte mari sau foarte mici n comparaie cu setul de date,
mediana este un indicator mai bun dect media. Despre modul n care
depistm scorurile extreme vom discuta ntr-un alt capitol. Pentru a nelege
mai bine, lum ca exemplu veniturile unor persoane, dup cum urmeaz, n
RON:
100, 105, 110, 115, 120, 125, 130, 135, 140
85
Statistic aplicat n tiinele socio-umane
n cazul nostru, media este 120, iar mediana este tot 120. Putem con-
cluziona ca aceti oameni sunt relativ sraci. Dar haidei s modificm ultima
valoare, n loc de 140 vom stabili 1400. irul devine:
100, 105, 110, 115, 120, 125, 130, 135, 1400
n acest caz media devine 260 n timp ce mediana rmne tot 120. Pu-
tem oare afirma c aceti nou oameni ctig n medie 260 RON? Categoric,
nu, observm c n afar de ultima persoan, nici una dintre cele opt rmase
nu ctig nici mcar 150 RON, darmite 260. Dac ne-am lua dup medie,
am putea spune c oamenii acetia sunt relativ bogai, ceea ce este complet
fals. Iat c acest scor extrem face media nereprezentativ pentru setul de
date. Cel mai bun indicator rmne tot mediana. Desigur, mediana nu este un
indicator att de sensibil ca i media, ns n momentul n care nu putem fo-
losi media datorit valorilor extreme, folosim mediana ca indicator al tendin-
ei centrale.
O alt observaie o facem n situaia datelor neparametrice aflate la un
nivel nominal de msurare. Spre exemplu, urmrim culoarea ochilor unor
elevi dintr-o clas i obinem:
Albatri = 5, Verzi = 6, Cprui = 15, Negri = 10
n acest caz nu putem folosi media ca indicator al tendinei centrale
pentru c nu are sens (care e media? Un soi de albastro-verzuio-cprui-
negri????) dar nici mediana pentru c nu putem ierarhiza categoriile. Nu pu-
tem spune care culoare de ochi e superioar creia. Singurul indicator al ten-
dinei centrale rmne modul. Bazndu-se pe o simpl numrare de frecvene,
are sens s vorbim aici de mod i s afirmm c modul este cprui, aceasta
fiind categoria cu frecvena cea mai mare.
Iat deci c pentru date neparametrice aflate la un nivel nominal
de msurare, singurul indicator al tendinei centrale ce poate fi calculat
este modul.
86
Cristian Opariuc-Dan
Modul poate fi de asemenea un bun indicator al tendinei centrale i n
cazul datelor parametrice. S considerm urmtorul exemplu:
1, 2, 2, 2, 2, 2, 2, 2, 3, 4, 5, 6, 7, 8
1, 2, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12
n primul caz observm c avem o frecven foarte mare a categoriei
2 comparativ cu al doilea caz. Deci, n primul caz modul ar fi cel mai bun
indicator al tendinei centrale (al scorurilor tipice din serie) i n al doilea caz
modul este tot doi, ns observm c apare doar o singur dat n plus n
comparaie cu celelalte valori spre deosebire de primul caz n care apare de
ase ori n plus. Iat c n al doilea caz modul nu este un bun indicator al ten-
dinei centrale i se prefer media, n timp ce n primul caz se prefer modul,
acesta indicnd cel mai bine scorurile tipice.
n situaia n care frecvena unei categorii este mult mai mare n
comparaie cu frecvena celorlalte categorii, cel mai bun indicator al
tendinei centrale este modul.
Cel mai sensibil indicator este media deoarece se bazeaz pe scoruri,
ns media induce erori dac avem scoruri extreme, mult mai mari sau mult
mai mici n comparaie cu celelalte scoruri. Mediana se bazeaz pe ranguri i
de aceea este mai puin precis dect media ns i insensibil la aceste sco-
ruri extreme. Modul se bazeaz pe frecvena de apariie i este cel mai impre-
cis indicator al tendinei centrale dar i cel mai flexibil. l putem folosi n
cazul datelor categoriale sau n cazul n care o categorie are o frecven mult
mai mare n comparaie cu celelalte categorii. De asemenea, pentru date cate-
goriale (neparametrice la nivel nominal de msurare), putem folosi doar mo-
dul ca indicator al tendinei centrale. Pentru date ordinale, unde putem stabili
ierarhii, putem folosi modul sau mediana iar pentru date parametrice (scalare)
putem folosi modul, mediana sau media n funcie de tipul datelor.
87
Statistic aplicat n tiinele socio-umane
III.2.5 Obinerea indicatorilor tendinei centrale n SPSS
V mai amintii, cred, de baza de date creat n SPSS n capitolul unu
i pe care am numit-o IQ. Haidei s o deschidem. Dac nu reuii, revedei
primul capitol.
Acum vom introduce cteva date n SPSS. Trecem deci n modul
Data V bulatorului din partea din stnga jos a progra-
mului SPSS.
iew prin apsarea ta
Se afieaz o foaie
de lucru, un tabel similar
tabelului din Excel, n
care pe prima coloan,
cea de culoare gri (capul
de tabel), ntlnim numele
variabilelor definite ante-
rior.
Modul de lucru es-
te similar celui din Excel.
Se scriu pur i simplu
datele n celule. Atenie!
Avem dou variabile pen-
tru care am asociat valori:
variabila sexul i varia-
bila scoala. Aici nu
vom scrie cuvntul Mas-
culin sau Feminin ci
vom tasta 1 pentru Mas-
culin i 2 pentru Femi-
nin. La fel i n cazul
Figura 3.1 Baza de date populat cu date afiarea asocia-
iilor sub form de coduri
88
Cristian Opariuc-Dan
variabilei scoala vom tasta 1 pentru Primare, 2 pentru Gimnaziu i aa
mai departe.
Baza dumneavoastr de date trebuie s arate n final ca n figura de
mai jos. O mic precizare. Pe bara de instrumente, penultimul buton se nu-
mete Value Labels i arat ca n imaginea alturat. La o apsare a
acestuia, butonul se activeaz iar
n baza de date se afieaz etiche-
tele asociailor fcute, ca n figura
alturat. La o nou apsare eti-
chetele asociaiilor nu se mai afi-
eaz ci se afieaz valorile asoci-
aiilor ca n figura mare de mai
sus.
Dup ce am introdus cele 30 de date, vom salva baza de date i vom
iniia procedura de extragere a indicatorilor tendinei centrale. Indicatorii
tendinei centrale ne sunt furnizai prin interme-
diul numeroaselor proceduri statistice. Cele mai
simple comenzi, pentru a nu complica inutil ex-
punerea, le gsim n meniul Analyze i apoi
meniul Descriptive Statistics. n traducere,
analize statistici descriptive. Primele trei co-
menzi din acest submeniu care se deschide, pot
extrage indicatorii tendinei centrale. Vom analiza doar prima comand, co-
manda Frequencies urmnd ca celelalte dou s le discutm cu alte
ocazii deoarece presupun i alte informaii.
Comanda Frequencies sau frecvene prezint cele trei puncte,
fapt care va duce la deschiderea unei noi casete de dialog. Dai clic pe aceast
comand i vei obine o caset ca cea din imaginea de mai jos.
Figura 3.2 Baza de date cu afiarea etichetelor
asocierilor
Figura 3.3 Lansarea proce-
durilor de analiz descriptiv
pe frecvene
89
Statistic aplicat n tiinele socio-umane
n partea stng se afl o list cu
toate variabilele din baza dumneavoastr
de date. Alturi de aceast list se afl un
buton de transfer (acel buton cu o sgeat
pe el). Urmeaz apoi lista Variable(s)
care nseamn variabilele pe care le intro-
ducem spre analiz. Pentru a introduce o
variabil spre analiz trebuie s o selec-
tm, printr-un clic simplu pe numele aces-
teia, din lista de variabile din partea stng. O variabil selectat are fundalul
albastru (sau o alt culoare n funcie de schema de culori a calculatorului
dumneavoastr). Dup ce o selectai, apsai butonul de transfer (care va avea
sgeata orientat spre lista
Variable(s) pentru a transfera varia-
bila dumneavoastr n lista variabilelor
ce urmeaz a fi analizate. n figura de
mai sus, transferm variabila Varsta
subiectilor din lista variabilelor din
baza de date n lista variabilelor supuse
analizei. n final va trebui s obinei o
imagine ca cea de mai sus. Observai c
dac am transferat variabila Varsta
subiectilor n lista variabilelor supuse analizei, butonul de transfer i-a
schimbat sensul. Acum dac apsm pe el scoatem variabila noastr din
lista variabilelor supuse analizei (dup ce n prealabil, evident, o selectm) i
o introducem n lista variabilelor totale din baza de date. Oricum, acest buton
de transfer ne va nsoi permanent n analizele noastre deoarece va trebui s
spunem programului ce variabile s analizeze i pe care s nu le analizeze.
Figura 3.4 Caseta de analize descrip-
tive utilizndu-se frecvenele
Figura 3.5 Includerea variabilelor spre
analiz
90
Cristian Opariuc-Dan
Vom trece n revist acum toate comenzile din aceast fereastr cu
precizarea c unele dintre ele vor fi abordate n detaliu n cadrul altor capito-
le.
Caseta de bifare Display frequency tables informeaz aplicaia
SPSS dac s afieze tabelul frecvenelor (n condiiile n care aceast caset
o bifai) sau s nu-l afieze (n condiiile n care nu o bifai). Tabelul frecven-
elor este acel tabel general, studiat la capitolul despre organizarea datelor,
nainte de a grupa valorile n clase. Iat c acum am ales ca acest tabel al
frecvenelor s fie afiat.
n partea dreapt a acestui formular se afl un numr de cinci butoane
de acionare.
Butonul OK este butonul pe care vom apsa pentru a lansa analiza,
dup ce am configurat modul n care dorim ca analiza s fie efectuat.
Butonul Paste este un buton pe care nu l vom folosi deloc. El per-
mite lipirea codului care efectueaz analiza curent ntr-o fereastr de sin-
tax de comenzi. El se adreseaz utilizatorilor care doresc s fac programare
n SPSS utiliznd limbajul propriu de programare al acestei aplicaii.
Butonul Reset permite reiniializarea ferestrei la starea ei original.
Cu alte cuvinte, toate variabilele din lista de analiz sunt eliminate, toate con-
figurrile de analiz pe care le-am fcut sunt iniializate la valoarea lor impli-
cit. Este un buton pe care l vom folosi destul de frecvent.
Butonul Cancel este butonul prin care renunm la analiz i nchi-
dem aceast fereastr fr a mai efectua analiza.
Butonul Help este butonul cu ajutorul cruia obinem asisten i
informaii (n limba englez) referitoare la funcionarea acestei proceduri.
Dac tii englez, nu ezitai s-l utilizai. SPSS are un tutorial excelent pe
care l putei parcurge i nelege cu succes.
91
Statistic aplicat n tiinele socio-umane
n partea de jos a formularului se afl trei butoane care permit confi-
gurarea statisticilor pe care le vom calcula.
Butonul Statistics este butonul pe care vom i apsa acum pentru
a calcula indicatorii tendinei centrale.
Dup cum i spune i numele, cu ajutorul
acestui buton putem stabili ce statistici
descriptive vom analiza. Iat c cele trei
puncte de suspensie deschid acum o no-
u fereastr. Fereastra are mult mai mul-
te opiuni. Pentru moment ne vom rezu-
ma la cele care ne intereseaz. Observm
c n partea dreapt a acestei noi ferestre
gsim seciunea Central Tendency
adic exact ce ne intereseaz pe noi. n aceast seciune observm casetele de
bifare Mean (media), Median (mediana) i Mode (modul). Iat ele-
mentele pe care dorim s le calculm. Vom bifa deci, una cte una, aceste
casete prin efectuarea unui clic simplu pe ele astfel nct formularul s arate
ca n figura de mai sus. Mai exist i caseta de bifare Sum (suma) prin
bifarea creia obinem suma valorilor din variabila respectiv. Variabila
noastr este vrsta subiecilor i nu ne intereseaz s nsumm vrstele ce-
lor 30 de subieci. Ar fi un indicator fr nici o relevan pentru noi.
Figura 3.6 Fereastra de alegere a
indicatorilor tendinei centrale
Dup ce am bifat cele trei casete, apsm butonul Continue (conti-
nuare)

respect
s programului SPSS s calculeze
media, mediana i modul pentru variabila Varsta subiectilor cu afiarea
pentru a prsi aceast fereastr i a ne ntoarce n cea iniial. Acum
am comunicat programului SPSS ce indicatori statistici s extrag.
Butonul Chart i Format permite afiarea unor grafice,
iv configurarea modaliti n care vor fi afiate rezultatele. Despre
aceste butoane vom discuta cu alt ocazie.
Cam asta ar fi tot. Practic am spu
92
Cristian Opariuc-Dan
tabelul
tra de rezultate sau fereastra
de O
ct cele dou itat. P
tendinei centrale pe care i-am configurat s fie
partea
ips (Missing) Cu alte cuvinte toi cei 30 de
or. Nu exist nici un subiect la care s fi uitat
ui de frecvene. Nu ne rmne acum dect s apsm butonul OK i
s vedem ce se ntmpl.
Iat c a aprut fereas-
utput Nu vom intra
acum n detalii explicative ale
acestei ferestre pentru c s-ar
putea s v speriai de prea
multe informaii i s trecei la
Solitaire. Ne vom concentra
asupra celor dou tabele pe
care le-a generat SPSS n par-
tea din dreapta a ferestrei de
rezultate (partea cea mare)
care nu reprezint altceva de-
rimul tabel conine indicatorii
calculai n etapa anterioar.
Tabelul se numete
Statistics i conine n
tabele pe care le-am solic
de sus numele variabi-
lei, Varsta subiectilor, pen-
tru a putea identifica variabi-
la cu care operm. Apoi ne
d numrul de cazuri, N i
ne spune c sunt 30 de date
valide (Valid) i zero date l
subieci au nregistrat vrsta l
s introducem aceast valoare. n continuare ne spune c media de vrst este
29,33 (Mean), mediana este 29 (Median) iar modul. avem o proble-
m. SPSS ne informeaz n josul tabelului c sunt mai multe valori cu frec-
Statistics
Varsta subiectilor
30
0
29,33
29,00
24
a
Valid
Missing
N
Mean
Median
Mode
Multiple modes exist. The smallest value is shown
a.
Figura 3.7 Fereastra de afiare a rezultatelor
Tabel 3.7 Indicatorii tendinei centrale
93
Statistic aplicat n tiinele socio-umane
vena cea mai mare i o va afia pe cea mai mic, 24 (Multiple modes exist.
The smallest value is shown) Acesta este deci un singur mod real, cel infe-
rior i urmeaz s vedem care este i cealalt valoare modal deoarece avem
o distribuie cu mai multe moduri (multimodal).
Urmtorul tabel este tabelul de frecvene. i aici se afieaz numele
variabilei. Probabil c acest tabel v pare extrem de cunoscut. Desigur, nu
avem d
primul mod este 24 iar acesta este modulul
frecvene i vedem c valoarea 24 are frecv
rale. nchidem acum fereastra de rezultate prin
efectua

iagrama n linii ns tabelul seamn frapant cu cel descris de noi la
capitolul despre sistematizarea datelor. Iat c acum toate valorile sunt ordo-
nate cresctor i avem frecvena
absolut (Frequency) pentru
fiecare valoare, frecvena relati-
v (Percent) i frecvena rela-
tiv cumulat (Cumulative
percent). Mai apare o coloan,
frecvena relativ valid (Valid
percent) care este identic cu
frecvena relativ deoarece nu
sunt valori lips n irul nostru
de date. Iat c acum putem s
gsim i cellalt mod. tim c
inferior. Ne uitm n tabelul de
ena 5. Cutm acum o valoare
mai mare de 24 cu aceeai frecven i observm c este 29. Iat c cele dou
valori modale sunt 25 i 29.
Aceasta este metoda cea mai simpl i cea mai complet de extragere
a indicatorilor tendinei cent
rea unui clic pe butonul X din colul din dreapta sus al acesteia.

Varsta subiectilor
2 6,7 6,7 6,7
1 3,3 3,3 10,0
5 16,7 16,7 26,7
3 10,0 10,0 36,7
1 3,3 3,3 40,0
5 16,7 16,7 56,7
1 3,3 3,3 60,0
3 10,0 10,0 70,0
1 3,3 3,3 73,3
1 3,3 3,3 76,7
2 6,7 6,7 83,3
2 6,7 6,7 90,0
2 6,7 6,7 96,7
1 3,3 3,3 100,0
30 100,0 100,0
20
21
24
26
28
29
30
31
32
34
35
37
38
39
Total
Valid
Frequency Percent Valid Percent
Cumulative
Percent
Tabel 3.8 Distribuia statistic
94
Cristian Opariuc-Dan
Concluzii:
opulaia reprezint totalitatea unor elemente dintr-un anumit spaiu la un anumit
moment dat;
nu putem studia populaia i de aceea lucrm cu eantioane extrase
din populaie care s fie reprezentative, adic s respecte caracteristicile populaiei
zate metode de eantionare sunt:
a pe straturi;
ana i modul;
urmat fiind de median i de mod;
icator ce poate fi utilizat este modul;
e mari
a unei valori este foarte
alculai media urmtoarei distribuii statistice preciznd etapele de rezolvare:
Calculai mediana i rangurile distribuiei statistice a
mplul din capitolul doi.
Precizai care este modul distribuiei statistice a nlimii
relor
, 16, 12, 5, 4
ai adecvat indicator al tendinei centrale pentru intre u -
2, 2, 2, 3 ,3 ,4, 5
6, 111, 108, 109, 200
Clasa f
P
n mod curent
pe anumite criterii;
Cele mai utili
o Eantionarea simplu randomizat;
o Eantionarea pe cote;
o Eantionare
o Eantionarea pe clusteri
Indicatorii tendinei centrale sunt media, medi
Media este cel mai precis indicator,
Pentru date categoriale singurul ind
Pen a modul sau mediana;
Pentru date parametrice se folosete modul, mediana sau medi
tru date ordinale se poate utiliz
a;
Media nu se folosete atunci cnd avem scoruri extreme, foarte mici sau foart
n distribuia noastr;
Modul se folosete la date parametrice atunci cnd frecven
mare n comparaie cu frecvena celorlalte valori;
Media nu poate fi folosit la date neparametrice

ntrebri i exerciii:
C
nlimii subiecilor din exe
3 5 3
6 8 5
subiecilor din exemplul din capitolul anterior? Sunt
9 11 9
12 14
cumva mai multe valori?
Calculai media, mediana i modul n cazul urmtoa
16
1 5 17 10
seturi de date:
o 12, 23, 9, 6, 14, 14, 12, 25, 9, 12
o 1, 4, 5, 6, 19, 1, 5, 3
1 8 20 4
21 23 3
24 26 1
o 32, 56, 91, 16,32, 5, 14,62,19, 12
Care este cel m fiecare d rm
toarele seturi de date:
o 1, 23, 25, 26, 27, 23, 29, 30
o 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2,
o 1, 1, 2, 3, 4, 1, 2, 6, 5, 8, 3, 4, 5, 6, 7
o 1, 101, 104, 10
95
Statistic aplicat n tiinele socio-umane
I IV V. . MEDIA POPULAIEI. REPREZ MEDIA POPULAIEI. REPREZE ENTRI G NTRI GR RA AF FI IC CE E A AL LE E
T TENDINEI CENTRALE ENDINEI CENTRALE
n acest capitol se va discuta despre:
Teorema limitei centrale;
Reprezentri grafice ale datelor;
Interpretri ale reprezentrilor grafice de date;
Dup parcurgerea capitolului, cursanii vor fi capabili s:
neleag termenul de medie a eantioanelor;
Reprezinte grafic datele utiliznd SPSS;
Interpreteze semnificaia reprezentrilor grafice.

Atunci cnd lucrm cu un eantion, deci cu un numr relativ redus de
subieci, calculul mediei nu este o operaiune att de dificil. Indiferent dac
folosim formula de definiie a mediei sau o alt modalitate de calcul, n final
vom reui obinerea acestui indicator al tendinei centrale. Ce ne facem ns
atunci cnd avem de stabilit un asemenea indicator la nivelul populaiei? Da-
c ne propunem s aflm media nlimii populaiei din Romnia, cum am
putea oare proceda? Teoretic ar trebui s msurm nlimea fiecrui om din
Romnia i apoi s mprim suma acestor nlimi la populaia total a rii.
Practic acest lucru este imposibil. Avem oare vreo variant prin care s pu-
tem afla totui acest indicator? Vei afirma c putem extrage un eantion din
populaie i avei dreptate. Vom extrage un eantion, ns exist posibilitatea
s selectm n acest eantion oameni mai curnd nali. Dac, de exemplu,
obinem o medie a nlimii persoanelor din eantion de 178 centimetri putem
afirma c aceasta este media populaiei din Romnia? Nu cred c putem face
aceast supoziie. Putem ns s mai extragem un eantion i obinem o me-
die a nlimii populaiei de 165 centimetri. Aceast nou valoare este evident
diferit de prima evaluare i putem suspecta c am ales n eantion persoane
mai curnd scunde. Prin urmare, care dintre cele dou medii se apropie mai
mult de media nlimii populaiei din Romnia? Rspunsul este c nici una.
96
Cristian Opariuc-Dan
ns, vom face media acestor dou eantioane. Deci, adunm 178 cu 165 i
u
edia eantioanelor este un indicator care
t avem mai multe eantioa-
ne ulaiei. Aceast caracteristic
a m

IV.1
Am studiat n primul capitol o serie de repre-
mprim la doi. Obinem 171,5 centimetri, un indicator mai precis pentr
media populaiei. Iat deci c m
aproximeaz mai bine media unei populaii. Cu c
cu att putem aproxima mai precis media pop
ediei eantioanelor de a tinde ctre media populaiei poart numele n
ni statistic de teorema limitei centrale. Asupra acestui aspect vom reve
ns i vom ve a a ocazia s l tratm amnunit ntr-un capitol ulterior.
Reprezentri grafice
zentri grafice uzuale. Vom vedea cum putem repre-
zenta grafic datele folosind SPSS i ce semnificaie
au aceste reprezentri. Aadar, vom deschide baza de
date creat de noi anterior, baza de date IQ, i ne
propunem s reprezentm datele noastre printr-un
grafic cu bare.
Vom folosi pentru
aceasta meniul Graphs i
apoi opiunea Bar n general, n meniul
Graphs gsim toate posibilitile de reprezentare
grafic a datelor pe care SPSS le pune la dispoziie
8
.
n momentul n care am accesat opiunea
Bar... apare o nou fereastr n care va trebui s
alegem tipul de grafic cu bare pe care dorim s-l re-
prezentm. Avem la dispoziie trei variante: Sim-
ple (simplu), Clustered (pe clusteri) i

8
n SPSS versiunea 15, modalitatea de construcie a graficelor difer radical, fiind mult mai
simpl i mai inteligent. Vom aborda aspectele grafice ale aplicaiei SPSS 15 la sfritul
acestui volum i n volumele viitoare
Figura 4.1 Meniul
pentru graficul cu bare
Figura 4.2 Alegerea
tipului de grafic cu bare
97
Statistic aplicat n tiinele socio-umane
Stacked (aditiv). Graficul simplu ne permite reprezentarea cu bare doar a
variabilei noastre (n cazul nostru vom folosi reprezentarea cu bare a coefici-
entului de inteligen, iq) Graficul pe clusteri l folosim dac dorim s in-
cludem o variabil categorial (de exemplu dac dorim s prezentm compa-
rativ coeficientul de inteligen al brbailor i al femeilor) iar graficul aditiv
prezint valorile una deasupra alteia i se folosete atunci cnd urmrim s
vedem cu ct crete o variabil n timp sau care este rezultatul cumulrii mai
multor variabile. n cazul nostru vom folosi graficul cu bare simplu. Aadar
vom efectua clic pe imaginea graficului Simple pentru a-l selecta.

a
a i opiunea care ne intereseaz pe noi.
iune d ul Define pentru a
tr de
prin bare. Variabila pe care dorim s o
Exist, dup cum putei observa, un numr de trei opiuni pe care le
ne, Summaries for group of cases arat c SPSS
unei singure variabile i va afia, pentru fiecare bar,
re. A doua opiune, Summaries of separate va-
sau mai multe variabile vor fi parcurse iar barele vor
riabile. n sfrit, opiunea Values of individual
S va lucra cu o singur variabil iar barele vor repre-
sta este de fapt
vei folosi: prima opiu
va parcurge categoriile
categoria corespunzto
riables arat c dou
arta fiecare dintre va
cases ne spune c SPS
zen ce
A op
defini variabilele ce vor
ta valorile sale. A
legem deci aceast up care apsm buton
fi reprezentate.
Apare o nou fereastr cu mai
multe elemente. Recunoatem n partea
stng lista variabilelor din baza noas-
date. n partea dreapt, primul
element l reprezint caseta Bars
Represent care se refer la ceea ce
vor reprezenta barele noastre. Cu alte
cuvinte, ce variabil va fi reprezentat
reprezentm este Coeficient de inteli-
Figura 4.3 Opiunile de reprezentare ale
graficului simplu cu bare
98
Cristian Opariuc-Dan
gen. O vom selecta i apoi vom apsa butonul de transfer pentru a o inclu-
de n caseta Bars Represent ca n figura de mai sus. Pentru moment att
avem de fcut n vederea trasrii graficului cu bare. Exist aici i alte opiuni
pe care le putem folosi. Seciunea
Category Labels ne permite s
alegem dac pe axa categoriilor
(axa O
X
) va fi afiat numrul fiec-
rui caz (opiunea Case number)
sau valorile unei alte variabile ca-
si pentru a desena graficul nostru bi
i apoi apsnd butonul Fi-
le c
tegoriale pe care va trebui s o spe-
cificm (opiunea Variable:)
Seciunea Panel by permite gru-
parea barelor n funcie de o alt
variabil categorial. Gruparea
poate fi efectuat fie pe linii, fie pe
coloane, cazuri n care va trebui s
specificm i variabilele categoriale n funcie de care se va face gruparea,
introducndu-le n listele Rows: sau Columns:. Dac avem vreun a-
blon de grafic preferat, descrcat de pe Internet sau construit de noi, l putem
folo
from:
fnd caseta Use chart specification
are se activeaz i ne invit s
ncrcm acel fiier. Putem de aseme-
nea da un titlu graficului nostru ap-
snd butonul Titles. Utilizarea
acestui buton v-o lsm dumneavoas-
tr ca exerciiu. Dup ce am terminat
de stabilit variabila pentru care dorim
s trasm graficul, apsm butonul
OK care se activeaz. SPSS va ge-
Figura 4.4 Reprezentarea prin grafic cu bare
a QI pe nivele se colarizare i n funcie de sex
125
30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1
Case Number
120
115
110
105
100
V
a
l
u
e

C
o
e
f
i
c
i
e
n
t

d
e

i
n
t
e
l
i
g
e
n
t
a
Figura 4.5 Graficul cu bare simplu al
oeficientului de inteligen c
99
Statistic aplicat n tiinele socio-umane
nera graficul n fereastra de rezultate (Output) rezultnd un grafic ca n figura
de mai sus. Iat aadar reprezentarea cu bare care ne intereseaz.
Pentru a exemplifica i ce-
e inteligen al brbailor iar n cel
de sus al femeilor. Dac privim cu atenie pe axa O
X
, observm c pentru
fiecare bar este indicat i nivelul de colarizare al subiectului respectiv. Du-
p ce vei stpni la un nivel suficient de ridicat lucrul n SPSS, vei putea
face combinaii ntre variabile pentru a realiza grafice intuitive cu care s v
susinei demonstraiile statistice.
Exerciiu:
lelalte faciliti ale acestei repre-
zentri grafice, iat, n figura altu-
rat, un grafic cu bare n care am
folosit ca variabil etichet Nive-
lul de colarizare iar graficul este
mprit pe linii dup variabila
Sexul subiecilor. Lansnd pro-
cedura de desenare prin apsarea
butonului OK, obinem urmto-
rul grafic cu bare:
cel de jos fiind reprezentat coeficientul d
125
Observm dou grafice, n
Reprezentai, folosind un grafic cu bare, valorile variabilei Varsta
subiectilor
n primul capitol discutam de as
solute, al valorilor individuale, al frecv
mulate absolute sau relative. Folosind SP
lorilor individuale folosind un grafic cu
meniul Graphs i apoi submeniul
emenea de poligonul frecvenelor ab-
enelor relative i al frecvenelor cu-
SS vom putea desena poligonul va-
linii. Vom accesa, pentru acesta, tot
Line u La fel ca i n graficul c
Fa
cu
lta
te
Fa
cu
lta
te
Po
stl
ic
ea
la
Li
ce
u
Li
ce
u
Li
ce
u
Po
stl
ic
ea
la
Po
stl
ic
ea
la
Po
stl
ic
ea
la
Po
stl
ic
ea
la
Li
ce
u
Li
ce
u
Li
ce
u
Li
ce
u
Gi
m
na
zi
u
Pr
im
ar
e
Pr
im
ar
e
Fa
cu
lta
te
Fa
cu
lta
te
Fa
cu
lta
te
Fa
cu
lta
te
Fa
cu
lta
te
Po
stl
ic
ea
la
Po
stl
ic
ea
la
Li
ce
u
Li
ce
u
Gi
m
na
zi
u
Li
ce
u
Li
ce
u
Li
ce
u
Nivelul de scolarizare
125
120
115
110
105
100
120
115
110
105
100
M
a
s
c
u
l
i
n
F
e
m
i
n
i
n
S
e
x
u
l

s
u
b
i
e
c
t
i
l
o
r
V
a
l
u
e

C
o
e
f
i
c
i
e
n
t

d
e

i
n
t
e
l
i
g
e
n
t
a
F ic
a
igura 4.6 - Reprezentarea prin graf cu bare
QI pe nivele se colarizare i n funcie de sex
100
Cristian Opariuc-Dan
bare, se afieaz o nou fereastr care ne invit s alegem tipul graficului pe
care l dorim. Avem de ales ntre un grafic simplu
(Simple) care ne intereseaz i pe noi, ntre un grafic
cu linii multiple (
definire a grafic
butonul .
deoarece ele au fost discutate la grafi-
cul cu bare. Vom transfera doar vari-
lista variabilelor n lista Line
Represents pentru a indica progra-
Multiple) ce permite trasarea a dou
variabile pe acelai grafic i un grafic de
p-line) cu ajutorul cruia putem repre-
u mai multe categorii de date. Pentru
, vom alege graficul de tip simplu. La fel
raficului cu bare,
le trei opiuni cu
mnificaie. Vom
Values of
reprezentm un
. Pe
ului,
sau mai multe
tip pivot (Dro
zenta dou sa
exemplul nostru
ca i n cazul g
i aici avem ce
exact aceeai se
alege, ca i n exemplul anterior, opiunea
individual cases deoarece dorim s
poligon al frecvenelor individuale
lansa procedeul de
Define
ntru a putea
putem apsa
Observm apariia unei ferestre identice cu fe-
reastra pe care am ntlnit-o la graficul cu bare i care
are exact aceeai funcionalitate. Nu
vom intra din nou n detalii asupra
elementelor pe care le gsim aici,
abila Coeficient de inteligen din
mului SPSS variabila pe care urmeaz
s o reprezinte prin linii. De fapt,
aceasta este singura diferen ntre
cele dou ferestre. n fereastra
Figura 4.7 Meniul
pentru graficul cu linii
Figura 4.8 Selecta-
rea tipului de grafic cu
linii
Figura 4.9 Definirea graficului simplu cu
linii
101
Statistic aplicat n tiinele socio-umane
anterioar acest element se numea Bar
era vorba de un gra-
i se numete Line
e suntem n faa unui
e rmne acum dect
OK care vedem c
lansa procedura de
i. Iat, n fereastra de
cteva momente i
or individuale pe care
Cum am putea totui
poligonul frecvenelor absolute
tim, din capitolul despre o
frecvenele cumulate se calcu
frecvenei unei valori la frecv
anterioare, irul valor
Represent deoarece
fic cu bare iar aic
Represents deoarec
grafic cu linii. Nu n
s apsm butonul
s-a activat, pentru a
desenare a graficulu
rezultate apare dup
el
l-am solicitat.
s reprezentm grafic
cumulate? Ne amin-
rganizarea datelor, c
leaz prin adugarea
ena cumulat a valorii
ilor fii

c
deoarece ne intereseaz s reprezentm
sau categorii de linii. Lansm apoi pr
apsarea butonului Define.
8 7 6 5 4 3 2 1 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11 10 9
Case Number
125
120
115
110
105
100
V
a
l
u
e

C
o
e
f
i
c
i
e
n
t

d
e

i
n
t
e
l
i
g
e
n
t
a
Figura 4
lor abs
poligonul frecven
.10 Poligonul frecvene-
olute pentru coeficientul de
inteligen
nd a
a unui g cu linii
a dispoziie mai multe
un ir ordonat. L
rafic fel, am vzut c la desenare
(sau cu bare) n SPSS, avem l
i nu am folosit dect opiunea Values
cases. De data aceasta vom merge tot
raphs, opiunea Line.. . Nu vom
um Values of individual cases ci
dic i vom comunica programului s
abile. Rmnem tot la graficul simplu
o singur linie i nu un grup de linii
ocedura de definire a graficului prin
opiuni iar no
of individual
n meniul G
mai alege a
Summaries for groups of cases, a
cumuleze ntr-un fel valorile unei vari
Figura 4.11 Configurarea
graficului pentru
frecvenele cumulate
102
Cristian Opariuc-Dan
n momentul n care am schim
iunea cu care vom defini datele n zona g
fic, evident, va aprea o alt fereastr
definiie a datelor, ca n figura alturat.
Exist multe elemente comune cu
reastra anterioar, ns i seciuni specifice
care vom ncerca s le descriem pe scurt. C
mai important seciune este L
Represents n care nu mai introducem pu
simplu variabila ci definim modul n care
fi cumulate datele. Putem opta pentru N o
cases prin care SP
bat
SS va numra apariiile fiecrei valori n irul de date ob-
innd un poligon al frecvenel
apariiile fiecrei valori n
exprimarea procentual a
te) % of cases i C
fic anumite statistici fol
nea Other statistics
care va trebui s include
pentru care vom extra
indicatori statistici i de
precizm ce indicatori s
lu
Sta trm
u care
vom desena poligonul frecvenelor cumulate absolute pe care trebuie s o
ra-
de
fe-
pe
ea
ine
r i
vor
f
Figura 4.12 Stabilirea parametri-
lor de configurare a frecvenelor
cumulate
or absolute pe date grupate, Cum. N adic
irul de date (frecvenele) dar prezentate cumulat i
acestora (sau frecvenele relative i relative cumula-
um. %. Exist i posibilitatea s reprezentm gra-
osind opiu-
situaie n
m variabila
ge anumii
asemenea s
e vor folosi
i Change
acum n de-
talii legate de aceast opiune. n
cazul nostru am ales opiunea Cum.
N deoarece dorim s reprezentm
frecvenele cumulate absolute. Avem
de stabilit i variabila pentr
prin activarea butonu
tistic. Nu in
124 121 120 111 110 109 108 107 105 104 103 101 100
Coeficient de inteligenta
30
25
20
15
10
5
0
C
u
m
u
l
a
t
i
v
e

F
r
e
q
u
e
n
c
y
Figura 4.13 Poligonul frecvenelor
cumulate
103
Statistic aplicat n tiinele socio-umane
introducem n cmpul
butonul de transfer din
trebuie dect s apsm
iat, poligonul f
Category Axis: folosind
faa acestui cmp. Acum, nu
butonul OK i obinem,
nelor absolute cumulate aa
ind celelalte trei opiuni pot fi
cvenelor absolute i ale frec-
lative cumulate, activiti pe
ciiu.
ocentual
nu e
recve
s
az s reprezentm grafic frecvenele
care apar subiecii cu studii primare,
ei cu gim
ceast reprezentare s aib un caracter
rocentual. Deci, alegnd aceast opiu-
cum ne-am dorit. Folo
desenate poligoanele fre
venelor relative i re
care vi le lsm ca exer
Reprezentarea pr
tegoriale cum ar fi ge
colarizare se poate face, cel mai bine, folo-
sind un grafic de tip plcint (pie), numit i
diagram de structur. Cu ajutorul programu-
lui SPSS vom ncerca s desenm graficul de
tip plcint pentru variabila nivel de colari-
zare. Pentru a reui acest lucru, vom apela tot
la meniul Graphs i vom ale
submeniul Pie....
ti
m
op
lec
for
se
cu
c
a
p
Figura 4.14 Meniul
pentru diagramele de
structur
a unor variabile ca-
l biologic sau nivelul d
Figura 4.15 Alegerea tipului de
ge apoi
De aceast dat nu mai avem ce
p de grafic plcint s selectm iar ur-
toarea fereastr prezint doar cele trei
iuni pe care le-am discutat. Vom se-
ta acum prima opiune, Summaries
groups of cases deoarece ne intere-
grafic
naziu, cu liceu, etc. i, n plus,
Figura 4.16 Configurarea reprezentrii
prin diagram de structur
104
Cristian Opariuc-Dan
ne, SPSS va aduna cazu
Pentru a defini
butonul Define. Se v
tr pe care o cunoatem
mulate. Singura deoseb
dus, ce reprezint felii
opiunea % of cases
zi ia
e
Desigur, trebuie
iveaz i butonul
OK pe care va trebui s apsm
pentru a lansa n execuie procedura
desenare a graficului. Dup cte
momente, obinem n fereastra de
zultate urmtorul grafic plcint:
Observm c acest grafic pr
formai asupra categoriilor variabile
majoritatea subiecilor sunt absolven
absolveni de postliceal i facultate.
i gimnaziale.
rile care au o aceeai valoare.
graficul, procedm ca i n exemplul anterior, apsm
a deschide fereastra de definire a graficului, o fereas-
deja de la reprezentarea poligonului frecvenelor cu-
ire const n seciunea Slices Represents sau, tra-
le plcintei. Evident, n aceast seciune am selectat
adic am comunicat programului SPSS s mi repre-
n care se gsete fiecare nive nte grafic propor
antionul total.
l al acestei variabile n
e prin transferarea variabilei
in baza de date n elementul
s precizm i variabila pentru care vor fi reprezenta-
te grafic procentele. Acest lucru n putem fac
Nivelul de colarizare din lista variabilelor d
Define Slices by: Selectai aadar
variabila n lista variabilelor din baza
de date i apsai butonul de transfer
din faa acestui element pentru a obine
o imagine ca n figura de mai sus. n
acest moment se act
de
va
re-
ezint i o legend prin care suntem in-
i analizate. Putem cu uurin observa c
i de liceu, apoi, n proporii relativ egale
Cei mai puini sunt cei cu studii primare
Facultate
Postliceala
Liceu
Gimnaziu
Primare
Nivelul de scolarizare
Figura 4.17 Diagrama de structur pentru
nivelul de studii
105
Statistic aplicat n tiinele socio-umane
Iat aadar cteva metode extrem de simple prin care putem desena
grafice
troducem, la fel ca n capitolul
n pentru a extrage indicatorii ten-
se face. Dac nu, v dau un indiciu:
ng acest buton se afl un alt buton,
.
-

a
de gra-
fic i ignor setrile grafice. Opiunea
Bar c
t opiune o ntlnim aici,
alturi de caseta de bifare With normal
intuitive utiliznd aplicaia SPSS. Toate aceste statistici pe care le-am
prezentat i pe care le vom mai prezenta fac parte din analiza de date explo-
ratorie deoarece scopul acesteia este acela de a explora, de a cunoate struc-
tura datelor analizate.
V mai amintii, desigur,
fereastra studiat n capitolul ante-
rior prin care am calculat indicato-
rii tendinei centrale. Iat-o, v-o
reprezentarea grafic a datelor se
poate face i n acest mod. S in-
reamintesc, iar dumneavoastr va
trebui s gsii comenzile prin
care s ajungei la ea deoarece
anterior, variabila Coeficient de intelige
dinei centrale. Sper c v amintii cum
folosii butonul Statistics. Iat c l
butonul Charts pe care vom apsa
Se deschide o nou fereastr n care pu
tem stabili ce grafic s desenm pentru
variabila introdus n analiz. Opiune
None nu deseneaz nici un fel
harts deseneaz un grafic cu
bare, opiunea Pie charts deseneaz
grafice plcint i, iat, opiunea Histo-
grams: ne permite desenarea unei his-
tograme. Aceas
Figura 4.18 Selectarea variabilei ce ur-
meaz s fie reprezentat
Figura 4.19 Modul de reprezentare
grafic din analiza frecvenelor
106
Cristian Opariuc-Dan
curve
Anumite grafice pot fi reprezentat e absolute
de fr
t
apoi butonul OK pentru a
lansa analiza.
Dup cteva momen-
entrale sub forma celor dou tabele
oferi i histograma variabilei Coe-
date din inventarul statistic de baz
centrale
torilor tendinei centrale c media
ns n-
nu mai aproximeaz bine tendina
ce permite desenarea curbei normale care caracterizeaz datele din
variabila noastr. Nu vom bifa acum aceast caset deoarece despre curba
normal vom discuta ntr-un alt capitol. Ne rezumm s alegem doar graficul
sub form de histogram.
e sub form de frecven
(opiunea Frequencies) sau sub form
Percentages) prin selectarea uneia din
ecvene relative (opiunea
re cele dou opiuni din seciunea
Chart Values. Folosind
aceast fereastr avem de
configurat mult mai puine
elemente. Deoarece am in-
trodus anterior variabila pe
care dorim s o analizm,
SPSS va lua singur decizia
modului n care va desena
graficul. Apsm butonul
Continue pentru a con-
firma aciunea noastr i
te, SPSS va extrage indicatorii tendinei c
discutate n capitolul anterior, ns ne va
ficient de inteligen alturi de o serie de
pe care le vom discuta ntr-un alt capitol.
IV.2 Analiza grafic a tendinei
Afirmam n capitolul dedicat indica
este cel mai fin, cel mai precis indicator
sibil la scoruri extreme i n acest caz
Histogram
ea are o problem este se
5
4
3
2
125 120 115 110 105 100
Coeficient de inteligenta
F
r
e
q
u
e
n
c
y
1
0
Mean =111,33
Std. Dev. =8,511
N =30
Figura 4.20 Histograma pentru coeficientul
de inteligen
107
Statistic aplicat n tiinele socio-umane
central a setului de date. Totui, cum ne dm seama de existena acestor sco-
ruri extreme? Tot analiza exploratorie ne vine n ajutor. Utiliznd reprezent-
rile de date de mai sus, ne putem face o imagine intuitiv asupra acestor sco-
ruri extreme. Exist oare o metod mai precis
este po
A fost conceput de ctre Tuckey (1977)
histogramele de frecvene, ns, spre deosebire d
le individuale. Un asemenea grafic se deseneaz
puterizat i ofer o imagine precis a distribuie
tarea numeric ofer i o imagine vizual a date
2002).
Dac avem, de exemplu, urmtorul ir o
19, 20, 20, 20, 25 i dorim s construim un gra
va arta dup cum urmeaz:
de a le depista? Rspunsul

i
l
Tulpina Frunzele
0 2

de la 20 la 29 i aa mai departe.
Frunzele reprezint frecvenele scorului observat. Astfel la tulpina 0 (scoruri
oruri ntre 10 i
19) ave
zitiv i vom prezenta n continuare dou tipuri de grafice deosebite,
dar care pot caracteriza mai precis scorurile extreme.
IV.2.1 Graficul tulpin i frunze
i se aseamn foarte mult cu
e acestea, afieaz i scoruri-
mai uor manual dect com-
deoarece alturi de reprezen-
or analizate (Dancey, i alii,
rdonat de date: 2, 12, 12, 19,
fic tulpin i frunze, acesta
1 2299
2 0005
Oare ce informaii noi ne aduce acest grafic i cum se interpreteaz?
Destul de simplu. Tulpina reprezint valorile zecilor iar frunzele valo-
rile unitilor. Deci, tulpina 0 cuprinde scorurile de la 0 la 9, tulpina 1 sco-
rurile de la 10 la 19, tulpina 2 scorurile
ntre 0 i 9) avem o singur apariie a lui 2. La tulpina 1 (sc
m frunza 2 de dou ori (adic dou apariii ale lui 12) i frunza 9 de
dou ori (dou apariii ale lui 19). La tulpina 2 (scoruri ntre 20 i 29) avem
frunza 0 cu trei apariii (trei scoruri de 20) i frunza 5 cu o singur apariie
108
Cristian Opariuc-Dan
(un singur scor de 25). Simplu, nu? Iat c, dei seamn cu o histogram,
acest grafic adaug n plus posibilitatea monitorizrii scorurilor individuale.
Pentru a nelege mai bine, s considerm un set mai voluminos de date: 1, 1,
2 ,2 ,2 , 5, 5, 5, 12, 12, 12, 12, 14, 14, 14, 14, 15, 15, 15, 18, 18, 24, 24, 24,
24, 24, 24, 25, 25, 25, 25, 25, 25, 25, 28, 28, 28, 28, 28, 28, 28, 32, 32, 33,
33, 33, 33, 34, 34, 34, 34, 34, 35, 35, 35, 35, 35, 42, 42, 42, 43, 43, 44. Pentru
acest set de date avem urmtorul grafic tulpin i frunze
0 11222555
1 2222444455588
2 44444455555558888888
3 22333344444455555
4 222334
Iat c prin aceast reprezentare avem o metod mai concis i mai
sintetic de explorare a unui volum mare de date. Putem observa c scorurile
de la tu ti lpina 2 (ntre 20 i 29) sunt cele mai frecvente iar datele sunt rela v
grupate
entm sub forma acestui grafic.
, 3, 3, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5,
, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 10, 10, 10, 10, 10, 10, 10, 13,
13, 18, 18, 18
raficul pentru acest ir de date ar fi:
, fr scoruri extreme. n acest caz am putea decide utilizarea mediei
ca indicator al tendinei centrale. Comparativ, s considerm un ir de date cu
scoruri extreme i s l reprez
0, 0, 0, 0, 0, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3
5, 5, 5, 5, 7 7, 7, 7, 7, 7,
13, 13, 13, , 23, 64
G
0 0000022222222333333333555555555555555777777777777799999999
1 000000033333888
2 3
6 4

Observm c graficul ne indic faptul c majoritatea scorurilor se si-
tueaz sub 20 ns avem i un scor extrem, scorul 64. Iat deci o situaie tipi-
c n care mediana va fi cel mai bun indicator al tendinei centrale. Totui,
acest grafic efectuat pe blocuri de 10 valori nu este foarte informativ. Nu
avem o reprezentare foarte clar a scorurilor sub 20 deoarece exist foarte
109
Statistic aplicat n tiinele socio-umane
multe. Prin urmare ar fi mai comod pentru noi s reprezentm grafic aceste
scoruri folosind nu blocuri de 10 ci blocuri de cinci (ntre 0 i 4, apoi ntre 5
i 9, ntre 10 i 14 i aa mai departe). Folosind un asemenea sistem, graficul
devine:
0. 0000022222222333333333
0* 555555555555555777777777777799999999
1. 000000033333
1* 888
2. 3
6. 4

Observm c am folosit punctul (.) pentru a desemna prima jumtate a
bloculu
entrale ce va fi
folosit.
e i apoi stabilim frecvenele absolute prin num-
rarea a l, am abordat i problema orga-
t
cznd mai mult pe valori individuale i se
pierde amblu. Analog, un numr mic de clase determin o
perspectiv sintetic, unde vedem clar tendina de ansamblu, ns de pierde
viziune
i (0-4) i stelua (*) pentru a desemna a doua jumtate a blocului (5-
9). De data aceasta lucrurile au devenit ceva mai clare. Exist acelai scor
extrem, 64, ns acum putem afirma precis c cei mai muli subieci au obi-
nut rezultate ntre 5 i 9 ceea ce reprezint un plus de informaie. Rolul aces-
tei reprezentri este mai ales acela de a identifica existena scorurilor extreme
ntr-un set de date n vederea stabilirii indicatorului tendinei c

Discutam, pe la nceputul lucrrii noastre, despre situaia n care or-
donm toate valorile posibil
pariiilor fiecrui scor individual. La fe
nizrii datelor n clase. Am vzut atunci c un numr mare de clase reprezin
o abordare analitic, accentul
tendina de ans
a individual. Unul dintre avantajele incontestabile ale acestui grafic
este acela c permite o viziune de ansamblu fr ns a se pierde repartiia
scorurilor individuale n distribuie.
Prin intermediul acestui tip de grafic se pot reprezenta, comparativ,
dou distribuii, n situaia n care dorim, spre exemplu, s comparm rezulta-
110
Cristian Opariuc-Dan
tele la dou probe psihologice. Utiliznd cele dou seturi de date de mai sus,
am putea s le reprezentm grafic dup cum urmeaz:
Test 1 Test 2
9999999977777777777775555555555555553333333332222222200000 0 11222555
888333330000000 1 2222444455588
3 2 44444455555558888888
22333344444455555
222334
5
4 6
ei n realizare i avantajelor pe care le ofer, acest tip
de grafic se utilizeaz tot mai frecvent n tiinele socio-umane.
IV.2.2
tie descrie modul n care sunt distribuite datele i ofer, n plus, o
metod
are de limita mustii superioare sau
mai mi
3
4
Datorit uurin
Graficul cutie (box-plot)
Dei graficul anterior sesizeaz scorurile extreme suficient de bine,
uneori devine destul de puin sensibil iar scorurile extreme sunt greu de ob-
servat. O metod mai precis o reprezint graficul cutie sau graficul cutiei
cu musti. Aceast tehnic, la fel ca i tehnica anterioar a fost descoperit
de ctre Turkey (1977) i reprezint unele dintre cele mai importante metode
de analiz exploratorie a datelor. La fel ca i graficul tulpin i frunze, gra-
ficul cu
precis de depistare a scorurilor extreme (Dancey, i alii, 2002).
Acest tip de reprezentare este format dintr-un dreptunghi cu baza in-
ferioar situat n dreptul percentilei 25 iar baza superioar n dreptul
percentilei 75, cuprinznd ntre aceste limite, 50% dintre rezultate (n fapt,
intervalul cuartil despre care vom vorbi n capitolul urmtor). n interiorul
acestui dreptunghi se afl marcat linia median, corespunztoare percentilei
50. Distana dintre cele dou baze (intervalul cuartil) poart numele de h-
spread sau pe scurt H. De la cele dou baze pornesc, n sus i n jos, dou
musti de lungime maxim 1,5 H. ntre limitele acestor dou musti se
afl zona normal. Orice scor mai m
c de limita mustii inferioare se consider a fi un scor extrem.
111
Statistic aplicat n tiinele socio-umane
Pentru realizarea acestui grafic vom parcurge urmtorii pai conside-
rnd irul ordonat de date 2, 12, 12, 19, 19, 20, 20, 20, 25
Pasul 1 Stabili dianei i a poziiei pe care aceasta o ocup n
cadrul re o
ocup este poziia a cincia.
rea me
irului de date. n cazul nostru mediana este 19 iar poziia pe ca
2, 12, 12, 19, 19, 20, 20, 20, 25
Pasul 2 Calculul pivoilor. Pivoii reprezint valorile care mpart
irul de date n sfertul inferior (primele 25% dintre scoruri, numit i cuartilul
inferior) i sfertul superior (ultimele 25% dintre scoruri, numit i cuartilul
re mparte irul ordonat de date n
dou p
superior). Dac mediana este valoarea ca
ri egale, cuartilul este valoarea ce mparte acelai ir n 4 pri egale,
dup cum vom vedea n capitolul ce urmeaz. Reconsidernd exemplul, obi-
nem poziia primului cuartil ntre a doua i a treia valoare, adic primul
cuartil va avea valoarea 12 (amintii-v exemplul de calcul al medianei). Si-
milar, al treilea cuartil va fi situat ntre poziia 7 i poziia 8 i va avea valoa-
rea 20.
2, 12, 12, 19, 19, 20, 20, 20, 25
Pivoii. n cazul exemplului de fa, vor avea valorile 12 i 20. Putem
acum trasa dreptunghiul care ne intereseaz (box).
Pasul 3 Obinerea valorii
expansiunii (factorul h-spread).
Acest factor nu reprezint dect
amplitudinea scorurilor dintre cei
doi pivoi (intervalul cuartil). n
cazul nostru, h-spread = 20 12 =
8
Pasul 4 Stabilirea sco

ruri-
lor extreme. Un scor extrem este un scor care depete o dat i jumtate
Pivot superior
valoarea 20
Pivot inferior
valoarea 12
Linia medianei
valoarea 19
Figura 4.21 Calculul pivoilor
112
Cristian Opariuc-Dan
valoare
= 12. Deci limitele
de bar
dep
i limitele de barier, mai
apropi
a factorului h-spread raportat la cei doi pivoi. Aceste puncte de refe-
rin se numesc limite de barier. n cazul nostru, 1,5 x 8
i
esc n sus limita de barier superioar.
Pasul 5 Scorurile care se afl ntre pivoi
a
er sunt 12 12 = 0 i 20 + 12 = 32. Scorurile mai mici de 0 vor fi
considerate extreme deoarece depesc limita de barier inferioar n jos iar
scorurile mai mari de 32 vor fi considerate de asemenea extreme deoarece
te de limitele de barier se numesc scoruri adiacente. n cazul nostru
scorurile adiacente sunt 2 i 25 deoarece 2 se afl ntre 0 i 12 iar 25 este si-
tuat ntre 20 i 32.
2, 12, 12, 19, 19, 20, 20, 20, 25
Liniile cuprinse ntre pi-
voi i bariere (zonele scorurilor
adiacente) poart numele de
musti iar dreptunghiul for-
mat de cei doi pivoi care conine
median
aici prov
grafic
t de fapt amplitudinea scorurilor
care prsesc zona aa
normal delimitat de cei doi
pivoi, ns rmn n limitele
barierelor. Orice scor care iese
din limita barierelor se numete
scor extrem.
Dac reconsiderm irul
a se numete cutie. De
ine i numele graficului,
cutie sau cutie cu mus-
ti. Zona mustilor reprezin-
numit
Figura 4.22 Graficul box-plot
anterior de date, 0, 0, 0, 0, 0, 2,
113
Statistic aplicat n tiinele socio-umane
2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5,
5, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 10, 10, 10, 10, 10, 10,
10, 13, 13, 13, 13, 13, 18, 18, 18, 23, 64, atunci graficul nostru se va prezenta
ca n figura de mai jos.
Iat c observm existena a
dou scoruri extreme ns. acestea
nu uitm c acest grafic se bazeaz
pe poziia unui scor n irul ordonat
de date. Prin urmare, 77 i 76 nu
reprezint scorurile propriu zise ci
poziia acestora n irul ordonat de
date. Deci poziia 77 se refer la
ultimul scor, adic la valoarea 64
ic la valoarea 23. Avem aadar dou sco-
e i anume scorul 23 i 64. Desigur, n acest
i bine tendina central este mediana. Pro-
e de a marca scorurile extreme. Observm
toare scorului 64) apare o stelu. Aceast
ensul c valoarea 64 este foarte ndeprtat
ate. De asemenea, alturi de poziia 76 (co-
n cercule. Acest cercule de spune c, dei
ste att de deprtat de limita superioar a
iar poziia 76 la penultimul scor, ad
ruri extreme n irul nostru de dat
caz indicatorul ce exprim cel ma
gramul SPSS ofer i o modalitat
c alturi de poziia 77 (corespunz
stelu are rol de avertisment, n s
de limita superioar a irului de d
respunztoare scorului 23) apare u
23 este i el un scor extrem, nu e
irului de date.
Exemplu
7
60,00
5
4
3
20,00
10,00
0,00
0,00
77
sunt notate cu 77 i 76. Am fi ncli-
nai s credem c aceste valori re-
prezint scorurile nsei. Totui s
0,00
0,00
0,00
76
ser- Figura 4.23 Graficul box-plot n SPSS. Se ob
v scorul extrem, al 77-lea element
114
Cristian Opariuc-Dan
IV.3 Tratarea scorurilor extreme
Nu ne putem mulumi s constatm doar existena acestor scoruri ex-
treme, mai ales n condiiile n care acestea ar afecta puternic analiza datelor.
date care nu mai respe Un scor extrem duce la o distribuie de ct criteriul
normalitii, face media un indicator irelevant p
plicit, determin imposibilitatea utilizri
unde pot s apar aceste scoruri extreme
prezena unor asemenea valori? (Popa, 20
Cea mai frecvent surs s
datelor. Dac introducem
pund la ntrebri pe o sca
tastm, din greeal, 55,
un scor extrem. Din ferici
simpl. Nu trebuie dect s
e a
o
a un elev s fie baschetbalist este destul de mare. Dac avem
ghinionul s l selectm tocmai pe acela, va aprea, evident,
i un caz extrem. De asemenea, dac una dintre clase este re-
prezentat de clasa de sport, cu elevi nali, printre care am g-
entru acel set de date i, im-
i statisticilor parametrice. Totui, de
? Ce surse exist care pot determina
03)
e refer la erorile de nregistrare a
un chestionar, la care subiecii rs-
l de la 1 la 5 i n loc s tastm 5,
evident c acesta va aprea ca fiind
re, remedierea acestei probleme este
analizm minimul i maximul dis-
ceste valori iese din domeniul de
r la baza de date i o vom corecta.
Dac sunt mai multe valori incorecte, putem sorta datele cres-
ctor sau descresctor i putem corecta mai uor erorile sau
putem apela la o operaiune de recodificare;
Erorile de eantion se refer la situaia n care eantionul es-
tras este prea mic iar posibilitatea de apariie a unui caz atipic
(extrem) va deveni foarte mare dar i la cazul n care eantio-
nul a fost extras dintr-o populaie asimetric. Putem, de exem-
plu, s studiem nlimea unor subieci dintr-un liceu iar pentru
aceasta extragem zece persoane din dou clase. Probabilitatea
c
tribuiei. Dac una dintr
definiie, putem reveni u
115
Statistic aplicat n tiinele socio-umane
sit i un elev cu nlime normal, acea nlime normal se va
port cu celelalte categorii
prin m inar a
datelo
dac a
rective
urilor
repar
lor bru
capito
i este
sunt car
comporta ca un caz extrem;
Erorile determinate de existena unor populaii diferite de
valori apar atunci cnd n eantionul studiat gsim, sub aspec-
tul variabilei msurate, mai multe grupe de subieci care difer
ntre ele. De exemplu, dac studiem veniturile angajailor unei
ntreprinderi, avem suficiente anse ca salariile conducerii s
se comporte ca scoruri extreme n ra
de angajai. n realitate, acestea nu sunt scoruri extreme ci
problema se refer tocmai la faptul c exist mai multe catego-
rii de salarizare n acea instituie;
Erorile de msurare se datoreaz unor msurtori incorecte
sau de apariia unor situaii anormale n condiiile experimen-
tale. La nregistrarea temperaturii unor persoane, se poate de-
fecta, la un moment dat, aparatul de nregistrare sau, msurnd
performanele unor sportivi, putem constata apariia unor va-
lori extreme ca efect al dopajului;
Indiferent de sursa de eroare, naintea realizrii prelucrrilor statistice
etode i tehnici specifice, este absolut necesar analiza prelim
r, prin intermediul creia s depistm caracteristicile distribuiei iar
cestea sunt inadecvate prelucrrilor necesare, s impunem msuri co-
. Din fericire, cu excepia situaiei defectrii unor aparate sau a design-
de cercetare defectuoase, exist suficiente mijloace prin care putem
a aceste disfuncionaliti. Deoarece tehnicile de transformare a date-
te presupun i alte cunotine, vom amna tratarea acestora pentru un
l viitor.
Orice prelucrare mai avansat de date ncepe cu statisticile descriptive
absolut necesar o asemenea analiz exploratorie pentru a vedea care
acteristicile irului nostru de date i ce indicatori putem folosi. Pro-
116
Cristian Opariuc-Dan
gramu
crora ra datelor cu care lucrm.
IV.3.1
ne aflm n analiza datelor,
la s
opiun
analizele d
noi n aceas
rnd, caseta
care se
ne spune c putem face imediat prelucrarea datelor. S nu ne
grbim
l SPSS ne pune la dispoziie, iat, o serie de metode prin intermediul
putem verifica rapid i precis structu
Obinerea graficelor pentru tendina central n SPSS
Vom rmne la baza noastr de date IQ i ne propunem s obinem
aceste grafice folosind programul
SPSS. Pentru a realiza acest lucru, ape-
lm la meniul Analyze, apoi la
submeniul Descriptive Statistics i
n final utilizm opiunea Explore
Iat o nou ancor mnemotehnic care
ne spune c
Figura 4.24 Meniul de analiz explora-
torie a datelor
tatistici descriptive i la analize exploratorii. Efectund clic pe aceast
e, se deschide o fereastr nou prin intermediul creia putem stabili
e date ce vor fi efectuate.
Avem mai multe elemente
t fereastr. n primul
Dependent List:
refer la variabilele ce vor
fi incluse spre analiz. n aceast
caset vom include variabila noas-
tr i anume Vrsta subiecilor
prin selectarea ei din lista variabi-
lelor din baza de date i apsarea
butonului de transfer. n acest
moment se activeaz i butonul
OK ceea ce
Figura 4.25 Configurarea variabilelor n analiza
descriptiv exploratorie
ns i s studiem mai atent aceast fereastr. ntr-un capitol anterior
discutam despre faptul c indicatorii tendinei centrale (i nu numai ei) pot fi
obinui prin mai multe metode. Atunci am analizat numai opiunea Fre-
117
Statistic aplicat n tiinele socio-umane
quencies i am promis c celelalte modaliti vor fi studiate cu alt ocazie.
Iat c a venit i momentul acesta. Caseta Factor List: se refer la
le categoriale ce pot fi utilizate n vederea gruprii analizei n funcie de
i
studiate
abil independent. n seciunea Dis

a
B
n
oi vom bifa
t
ectiv cele mai mici (extremele) iar
anumite criterii. Att aceast list ct i elementul Label Cases by: vor f
atunci cnd vom clarifica conceptele de variabil dependent i
play situat imediat sub lista variabile-
fel de rezultate s se afieze n fereastra
rea doar a rezultatelor prelucrrilor sta-
doar a gra-
oth). Noi
i de aceea
ul Statis-
tics permite afiarea statisticilor descriptive
ce vor fi calculate. La apsarea acestuia va ap-
rea urmtoarea fereastr:
lor din baza de date putem stabili ce
de rezultate. Putem opta pentru afi
tistice (Statistics), pentru afiarea
ficelor (Plots) sau a ambelor (
vom ate
am selectat opiunea Both. Buto
dori s afim toate aceste d
Sunt mai multe opiuni aici, n
doar opiunea de calcul a statisticilor descrip
Descriptives. Seciunea Confid
intervalul de ncredere la care va f
vom reveni ns ntr-un alt capitol. D
res
nor
es
dia
afieaz
resp
Percentiles permite calculul unor valori
percentile. Toate aceste lucruri ns vor fi
studiate cu alt ocazie. n vederea confirm-
Figura 4.26 Stabilirea indi-
catorilor statistici
tive,
ence interval for Mean: se refer la
i calculat media. Asupra acestui aspect
e asemenea, celelalte opiuni nu ne inte-
eaz deocamdat, astfel nct le vom ig-
a pe moment. Menionm doar c M-
imators reprezint o alternativ la me-

primele cinci v ai mari,
i mediana eantionului, Outliers
alori cele m
Figura 4.27 Configurarea graficelor
exploratorii
118
Cristian Opariuc-Dan
rii aciunii noastre, va trebui s apsm butonul Continue pentru a reveni
la fereastra anterioar.
Acionarea butonului Plots determin afiarea unei alte ferestre
ce va configura modul de prezentare grafic a datelor. i aici avem mai multe
informaii. Pentru nceput observm c este bifat caseta Stem-and-leaf
adic va fi afiat graficul tulpin i frunze.
De asemenea vom afia i histograma, bifnd caseta Histogram
Seciunea Boxplots, situat n partea stng-su
dului de calcul al graficului cutie cu musti dis
pentru combinarea nivelurilor variabilei categorial
fereastra anterioar) alegnd Factor levels tog
mai multe variabile incluse n lista variabilelor in
nea Dependents together. Desigur, putem ren
fic selectnd opiunea No
s permite configurarea mo-

l in ele dou
sunt prezentate numrul de
cazuri. Aflm c avem 30
de cazuri valide, adic 30 de sub
Vrsta subiecilor ceea ce re
avem nici un caz lips (Missing)
zin
cutat anterior. Putem opta
e (dac am inclus vreuna n
ether sau putem combina
dependente alegnd opiu-
una la afiarea acestui gra-
n cazul nostru, avnd doar o singur variabi-
op bi-
cut t uto-
psm butonul OK pen-
ne.
clus spre analiz, oricare dintre prim
n tabelul Case
Processing Summary ne
iuni le-am alege o
ot prin apsarea b nem acelai efect. Prsirea acestei casete va fi f
nului Continue. Nu ne rmne acum dect s a
tru a lansa procedurile de analiz. n fereastra de rezultate avem acum mai
multe tabele i grafice.
ieci ce au date completate pentru variabila
prezint un procent de 100%. Evident, nu
i, corespunztor, un procent de 0%. n total
t un procent de 100%.
Case Processing Summary
30 100,0% 0 ,0% 30 sta subiectilor
N Percent N Percent N
sunt deci 30 de cazuri ce repre
100,0%
Per
Var
cent
Valid Missing Total
Cases
Tabel 4.1 Sumarul cazurilor
119
Statistic aplicat n tiinele socio-umane
Urmtorul tabel este acela al statisticilor descriptive (Descriptives).
Remarcm cu uurin media (Mean) egal cu 29,33 ani i mediana (Medi-
an) ega
sete modul. ntr-adevr, folo-
sind aceast opiune nu putem
l cu 29 de ani. Sunt mult mai multe informaii aici, legate de eroarea
standard a mediei, intervalul de ncredere al acesteia precum i indicatori ai
dispersiei pe care-i vom studia n alt capitol. Observm c din acest tabel
lip
calcula modul.
Urmeaz apoi histograma
pentru variabila Vrsta subieci-
lor nsoit de o serie de date
statistice cum ar fi media, abate-
rea standard i numrul de cazuri
i, iat, graficul tulpin i frunze pe care l-am discutat anterior.
Varsta subiectilor Stem-and-Leaf Plot

Frequency Stem & Leaf

3,00 2 . 001
,00 2 .
5,00 2 . 44444
3,00 2 . 666
6,00 2 . 899999
4,00 3 . 0111
1,00 3 . 2
3,00 3 . 455
2,00 3 . 77
3,00 3 . 889

Stem width: 10
Each leaf: 1 case(s)
Observm c acest grafic a fost creat din doi n doi (20-21, 22-23, 24-
25, 26-27, 28-29 ani i aa mai departe) pentru a oferi o bun reprezentare a
datelor. Iat c, analiznd acest grafic, putem afirma c cei mai muli subieci
Descriptives
29,33 1,008
27,27
31,40
29,33
29,00
30,506
5,523
20
39
19
10
,116 ,427
-,878 ,833
Mean
Lower Bound
Upper Bound
95% Confidence
Interval for Mean
5% Trimmed Mean
Median
Variance
Std. Deviation
Minimum
Maximum
Range
Interquartile Range
Skewness
Kurtosis
Varsta subiectilor
Statistic Std. Error
Tabel 4.2 Statistici descriptive
120
Cristian Opariuc-Dan
au vrs
o distribuie destul de uniform a
acestor rezultate.
Putem afirma, deocamdat,
c aceste date permit utilizarea me-
diei ca indicator al tendinei centrale
pentru setul nostru.


roximat prin media eantioanelor
e face n baza a dou tipuri principale de grafi-
i graficul tip cutie
ade puterea statistic a analizei. Prin urmare trebuie
iminare asupra setului de date i eventual s pro-
a datelor naintea analizei statistice efective.
te de 28 i 29 de ani i nu exist scoruri extreme. Pentru a fi siguri de
acest lucru, privim urmtorul grafic, graficul cutie.
Privind i acest grafic con-
statm lipsa scorurilor extreme, me-
diana fiind situat la valoarea 29 i
Concluzii:
Varsta subiectilor
39
36
33
30
27
24
21
Figura 4.28 Graficul box-plot
Media unei populaii la un parametru poate fi ap
extrase din populaie;
Analiza scorurilor extreme se poat
ce: graficul tulpin i frunze
Prezena scorurilor extreme sc
s efectum analize statistice prel
are cedm la tehnici de transform
121
Statistic aplicat n tiinele socio-umane
V V. . S ST TA AT TI IS ST TI IC CI I D DE ES SC CR RI IP PT TI IV VE E M MP PR R T TI IE ER RE EA A
ol se va discuta despre: n acest capit
Conceptul de mprtiere;
Indicatori simpli i compleci ai abaterii de la
tendina central;
Calculul indicatorilor abaterii de la tendina
central;
Dup parcurgerea capitolului, cursanii vor fi capabili s:
neleag legtura dintre tendina central i
dispersie;
Calculeze indicatorii abaterii de la tendina cen-
tral;
Utilizeze SPSS in calculul indicatorilor abaterii
de la tendina central.

Indicatorii tendinei centrale caracterizeaz, dup cum am vzut, va-
loarea
g. Cei doi copii pot s aib 20
g

rti-
zeaz rezultatele n jurul acestei valori. Aceti indicatori, care msoar gradul
de mprtiere a rezultatelor n jurul tendinei centrale, poart numele de in-
dicatori ai mprtierii. Indicatorii mprtierii pot fi grupai n indicatori
elementari ai mprtierii i indicatori sintetici ai mprtierii.
Modelul statistic al mediei va trebui aadar completat cu ali indicatori
caracteristici gradului de mprtiere a rezultatelor n jurul tendinei centrale.
Dac relum exemplul cu prietenii mei i numrul de frai pe care fiecare
dintre ei i au, am stabilit c, primul prieten are un frate, al doilea are doi
frai, al treilea i al patrulea au cte trei frai i al cincilea are patru frai. Re-
n jurul creia se grupeaz datele. Ei au, desigur, o mare putere infor-
mativ, ns nu ne prezint o msur a compoziiei acestor date. De exemplu,
media greutii unui numr de 2 copii este 20 K
de Kg fiecare, unul 10 Kg i cellalt 30 Kg, sau unul 15 Kg iar cellalt 25 K
i aa mai departe. Iat deci c indicatorii tendinei centrale nu pot caracteriza
singuri o distribuie. Avem nevoie, pentru aceasta, de o msur a gradului de
rspndire, de mprtiere a datelor n jurul tendinei centrale, cum se repa
122
Cristian Opariuc-Dan
zultase o medie de 2,6 frai, cu alte cuvinte doi frai ntregi i unul fr un
vedem acum
tea frailor prietenilor mei.
nele la care se situeaz fiecare
scor particular fa de medie. Este aadar media un bun model pentru num-
rul de
picior. Fiind un model statistic, media estimeaz o realitate. S
dac aceast medie estimeaz corect sau nu realita

n figura 5.1 am reprezentat grafic dista
frai ai primului prieten? Primul meu prieten are un singur frate, iar
media postuleaz 2,6 frai. Iat c, n ceea ce-l privete pe primul prieten,
media supraestimeaz modelul real cu 1,6 frai. Pentru al doilea prieten,
media supraestimeaz realitatea cu doar 0,6 frai (probabil o mn i un pi-
cior dintr-un frate). Referitor la ceilali trei prieteni, media subestimeaz
realitatea cu 0,4 frai i 1,4 frai.
Mrimea acestor supraestimri, respectiv subestimri se obine foarte
simplu, scznd din medie scorul particular (x-m). Cum am putea folosi aces-
te informaii pentru a testa acurateea modelului? O variant ar fi s adunm
toate aceste abateri pentru a vedea suma, totalul abaterilor elementelor de la
modelul statistic al mediei.
(-1,6)+(-0,6)+(0,4)+(0,4)+(1,4)=0
Am obinut totalul erorilor, totalul abaterilor de la medie ca fiind zero.
Cu alte cuvinte, modelul nostru statistic reprezint perfect realitatea? Aa s
fie? Ei bine, nu, deoarece tocmai am demonstrat particularitatea esenial a
mediei, conform creia scorurile mai mici dect media balanseaz perfect
+1,4
+0,4 +0,4
m=2,6
-0,6
-1,6
Figura 5.1 Diferenele dintre scorul observat i medie
123
Statistic aplicat n tiinele socio-umane
scorurile mai mari dect media. Totui, cum putem obine mrimea erorii?
Cum putem estima dac modelul statistic este o imagine suficient de bun
pentru a reprezenta realitatea? Vom vedea imediat. Pentru nceput s ne con-
centrm asupra unor indicatori elementari ai mprtierii.
V.1 Indicatori elementari ai mprtierii
Indicatorii elementari ai mprtierii in cont doar de cteva valori iar
calculele sunt efectuate n baza acestora. Dei sunt foarte uor de obinut,
sunt sensibili modul de distribuie a rezultatelor n colecia de date.
V.1.1 Amplitudinea de variaie
Termenul englezesc pentru acest indicator este acela de Range iar
noi l-a
ie i medie.
m abordat deja n momentul n care am fcut sistematizarea datelor,
doar c nu tiai nc (dei probabil bnuiai) c reprezint un indicator al
mprtierii. Amplitudinea de variaie nu este altceva dect diferena dintre
valoarea maxim i valoarea minim din irul nostru de date. Prin urmare, A
= X
max
X
min
. Dac, avem, de exemplu, urmtoarele date: 10, 22, 31, 9, 24,
27, 29, 9, 23, 12 atunci constatm cu uurin c valoarea cea mai mare din
ir este 29 iar cea mai mic valoare este 9. n acest caz amplitudinea de varia-
ie devine A = 29 9 = 20.
tim, de asemenea, semnificaia acestei valori. ntre maxim i minim
pot exista cel mult 20 de valori diferite. Amplitudinea de variaie indic, n
mod absolut, domeniul de valori ntre care este cuprins distribuia. Amplitu-
dinea de variaie poate fi exprimat i procentual, ca expresie a raportului
dintre amplitudinea de varia
A% =
A
1 (formula 5.1)
x
n cazul nostru, A% =
2
19,
1 = 12%. Acest indicator poart
numele de amplitudine relativ de variaie. n exemplul nostru, avem 10
124
Cristian Opariuc-Dan
valori iar media acestora este 19,6. Amplitudinea relativ de variaie este, n
cazul nostru, 102%. Amplitudinea relativ de variaie o putem utiliza n con-
diiile n care cunoatem domeniul teoretic ntre limitele cruia se ncadreaz
distribuia. Putem astfel s comparm amplitudinea real de variaie a datelor
cu amplitudinea de variaie teoretic.
9 iar ma-
riaie va fi 120 9 = 111, desigur o
valoare
sau abaterea intercuartil
i de cuartil. tim c mediana este
valoarea care mparte se le; jumtate din-
tre valori sunt mai mici re valori sunt mai mari
dect m
mici dect primul cuarti
1
ori (jumtate) sunt mai
Indicatorii amplitudinii de variaie pot fi utilizai atunci cnd cunoa-
tem plaja de variaie normal a unui fenomen, deoarece apariia unor valori
extreme duce la amplitudini de variaie aberante. n exemplul nostru, dac
introducem o singur valoare n plus, 120, atunci minimul rmne
ximul devine 120. Amplitudinea de va
suspect pentru irul nostru de date.
Analiznd figura alturat, obser-
vm c cele dou distribuii au aceeai am-
plitudine de variaie. Totui, forma lor dife-
r foarte mult. n timp ce distribuia A
este puternic eterogen, distribuia B este
mult mai omogen.
V.1.2 Abaterea cuartil
Este un alt indicator elementar al mprtierii, independent de existen-
a unor valori extreme, fiind, prin urmare, mai stabil i mai precis n compa-
raie cu amplitudinea de variaie. Ce este ns un cuartil? Am mai adus discu-
ia despre acest subiect n capitolul anterior. Dac tii ce este mediana i da-
c v spunem c mediana nu este altceva dect al doilea cuartil, atunci cred
ca putei deduce semnif ia term u ica enul
tul ordonat de date n dou pri ega
d t ec mediana, jumtate dint
ediana. Ei bine, valorile cuartile sunt valorile care mpart acelai
set ordonat de date n patru pri egale. Un sfert din valori (25%) sunt mai
l (Q ), dou sferturi din val
Figura 5.2 Dou distribuii cu
aceeai amplitudine
125
Statistic aplicat n tiinele socio-umane
mici dect al doilea cuartil (Q
2
iat c, de fapt, Q
2
nu este altceva dect me-
diana) iar trei sferturi din valori (75%) sunt mai mici dect al treilea cuartil
(Q
3
). Abaterea cuartil nu este altceva dect diferena dintre cuartilul 3
i cuartilul 1.
Prin urmare, R
Q
=Q
3
Q
1
. (formula 5.2)
Abaterea cuartil poate fi absolut cazul prezentat sau relativ, ra-
portat la median (abaterea intercuartil relativ).
R
%
=
R
Q

2
=

3
-
1

2
(formula 5.3)
Dac mprim abaterea cuartil la valoarea 2, adic dac facem me-
dia dife rea semi-intercuartil. renei dintre Q
3
i Q
1
, obinem abate
R
SQ
= R
Q
:2 R
S
=
R
Q
2
=

3
-
1
2
(formula 5.4)
ntr-o distribuie de date perfect sime
va fi egal cu mediana. Aceasta reprezint un
considerat reprezenta
tric, abaterea semi-intercuartil
ind or
tiv n raport cu ntreaga distribuie.
, 9, 23, 12 i
icator al distanei unui sc
Dac, relum urmtoarele date 10, 22, 31, 9, 24, 27, 29
apoi le ordonm, obinem: 9, 9, 10, 12, 22, 23, 24, 27, 29, 31. Procedura de
calcul a cuartilelor este similar medianei. Primul cuartil va fi situat, evident,
n poziia 2,75
1
=
n+1
4

=
11
4
= 2,7S deoarece am mprit irul ordonat de
date n patru pri egale. Urmrind irul ordonat de date, poziia 2,75 se afl
ntre 9 i 10, adic la 9,5. Al doilea cuartil, mediana (Q
2
), se va afla la de do-
u ori poziia primului cuartil, adic 2x2,75 = 5,5. Ai observat probabil c ai
obinut exact poziia medianei. n cazul nostru, poziia 5,5 este cuprins ntre
22 i 23, adic 22,5. Similar, al treilea cuartil (Q
3
) este de trei ori poziia pri-
mului cuartil, adic 3x2,75=8,25. Iat c, valoarea lui Q
3
se afl ntre 27 i
29, adic 28. Abaterea cuartil devine aadar, R
Q
=Q
3
Q
1
=289,5=18,5. Cu
alte cuvinte, ntre valoarea obinut de 75% din populaie i valoarea obinut
126
Cristian Opariuc-Dan
de 25% din populaie pot exista cel mult 18,5 valori diferite. Iat c doar 18,5
puncte fac diferena dintre persoanele considerate slabe sau cu scoruri infe-
rioare i persoanele considerate bune, cu scoruri superioare. Observai c
acest indicator este mai precis n comparaie cu amplitudinea mprtierii.
Dac vei include acu influeneaz
deloc valoarea abaterii cuartile a-
re, R
SQ
alori mai mari dect medi-
ana. Din grupul oamenilor m ediu-
slabi i 9,25 valori pe c
c din tabelul alturat:
Cuartilul inferior
at n
m acel scor de 120, vei constata c nu
. Abaterea semi-intercuartil va fi, prin urm
=R
Q
:2=18,5:2=9,25. Acest lucru nseamn c, teoretic, 9,25 valori ar
trebui s fie mai mici dect m t attea v ediana i ot
edii, 9,25 valori i difereniaz pe cei m
ei mediu-buni.
Similar medianei, cuartilele pot fi calculate folosind i date grupate.
Dac vom considera distribuia statisti-
(Q
1
) va fi situ-
poziia
n+1
4
=
45
4
= 11,2S, iar
quartilul superior (Q
3
) n poziia
3Q =3x11,25=33,75. Aadar, primul
1
cuartil se va afla undeva n intervalul n
care se gsete a 11-a msurtoare iar al
treilea cuartil n intervalul n care se
gsete a 33-a msurtoare.
n cazul nostru, Q
1
se va gsi n intervalul 10-14 iar Q
3
n intervalul
20-29. Sper c v mai aducei aminte formula de calcul a medianei pentru
date grupate.
Hc = l +i _
Poz
Mc
-c
Mc-1

]
Tabelul 5.1 Calculul cuartilelor
Clasa
Distribuia
f f
n linii
c
<= 4 || 2 2
5 9 |||||| 6 8
10 14 |||||||| 8 16
15 19 |||||||||||| 12 28
20 29 |||||||||| 10 38
30 39 |||| 4 42
>= 40 || 2 44
n=44
127
Statistic aplicat n tiinele socio-umane
Dac ne reamintim, poziia medianei a fost reprezentat prin
n+1
2
n
cazul unui ir de date par sau prin
n
2
pentru irul impar de date. Dar cum me-
diana nu era altceva dect Q
2
, valoarea preciza, de fapt, poziia cuartilului al
doilea. Deci, singura modificare n formul ar fi nlocuirea poziiei medianei
cu poziia cuartilului care ne intereseaz. Formula generalizat devine cea
alturat, unde P
Qn
nseamn poziia cuartilului n (1, 2 sau 3) iar fc
Qn-1
frec-
vena cumulat a intervalului pre-cuartil de ordin n.
n = l +i [
Poz
Qn
-]c
Qn-1
]
(formula 5.5)
Am specificat mai sus c poziia lui Q
1
este P
1
=
n+1
4
, poziia lui Q
2
este P
2
= 2
n+1
4
iar poziia lui Q
3
este P
3
= S
n+1
4
. Aplicnd n formu-
esp lui 1 i cu astf le, obinem valorile cor unztoare cuartilu
1 = l +i [
Poz
Q1
-]c
Q1-1
]
artilului 3, el:
= 1u +S [
11,25-8
8
= +S
5
8
1u
3,2
= 12,uS
S = l +i [
Poz
Q3
-]c
Q3-1
]
= 2u +1u [
33,75-28
10
= 1u
5,75
10
2u + = 2S,7
3
- 5 12,03=13,72 r a
2=
r mai precis dect amplitudinea de
uia este puternic asimetric (dac, de exemplu,
foarte m
erii sem rtile, indicator care
ne d numrul de valor locul eantionului ns
nu explic modul n ca ul medianei.
Discutnd desp v t c acestea nu repre-
zint dect valori la care se situeaz un anum antion, n condi-
S
Abaterea cuartil va deveni R
Q
=Q
terea semi-interquartil R
SE
=R
Q
:2=13,72;
Abaterea cuartil este un indicato
variaie. Totui, dac distrib
Q
1
=25,7 ia ba-
6,86.
ulte valori se concentreaz n zona cuartilului superior), atunci acest
indicator nu furnizeaz o imagine real a dispersiei. Se prefer, n acest caz,
utilizarea abat i-intercuartile n locul abaterii cua
i diferite ce separ 50% din mij
re se grupeaz aceste valori n jur
re median i cuartile, am zu
it procent din e
128
Cristian Opariuc-Dan
iile n
lui de
percentile are o imp taloanelor,
normelor, prin metod ie
care nu
abor
, ca
n
co
pa
e efectuare a msurtorilor
iar valo
care setul de date este unul ordonat. Mediana este valoarea la care se
situeaz 50% din eantion, cuartilele sunt valorile la care se situeaz 25%,
50%, 75% din eantion i aa mai departe. n termeni generali, putem afla
orice valoare la care se situeaz un anumit procent din eantion. Astfel, dac
vom dori s aflm valorile la care se afl procente de 20% din eantion, vom
avea cinci categorii cvintile. Procentele de 33,33% reprezint valorile
trecile i aa mai departe. Generic, valoarea la care se afl un anumit procent
din populaie poart e nelegerea conceptu num le de percentil.
ortan deosebit n problematica realizrii e
a cuantilrii, metod folosit de obicei ntr-o distribu
este normal. Despre aceste lucruri vom discuta ns atunci cnd vom
da sistemele de etalonare.
V.2 Indicatori sintetici ai mprtierii
Indicatorii sintetici ai mprtierii nu in cont doar de cteva valori
u c r elementari, ci
i d
caz l elo iau n considerare toate msurtorile care apar n
lec a e date i de aceea au o valoare informativ mult mai mare n com-
raie cu indicatorii elementari.
V.2.1 Diferena medie Gini
Este un indicator independent de ordinea d
area acestuia nu depinde de medie. De aceea, diferena medie Gini se
folosete n distribuii n care media nu este un bun indicator al tendinei cen-
trale (v mai amintii probabil de distribuiile cu scoruri extreme). Indicatorul
nu exprim altceva dect modul n care valorile se mprtie, n interiorul
seriei, unele fa de altele. Practic nu este altceva dect o medie aritmetic a
diferenelor obinute prin asocierea n perechi, dou cte dou, a tuturor valo-
rilor din irul de date. Aceste diferene se vor lua n valori absolute.
129
Statistic aplicat n tiinele socio-umane
Dac avem, spre exemplu, urmtoarele 4 msurtori: 25, 23, 21, 27,
atunci, cu aceste valori putem forma un numr de 4
2
adic 16 perechi de dife-
rene dup cum urmeaz:
2525; 2523; 2521; 2527; 2325; 2323; 2321; 2327; 2125;
2123; 2121; 2127; 2725; 2723; 2721; 2727.
Fcnd apoi diferenele, obinem:
0; 2; 4; -2; -2; 0; 2; -4; -4; -2; 0; -6; 2; 4; 6; 0
Analiznd aceste diferene, observm c nu reprezint altceva dect
modul n care se abat valorile unele fa de altele. Fcnd apoi suma acestor
valori, luate fr semn, obinem:
0+2+4+2+2+0+2+4+4+2+0+6+2+4+6+0 = 40
este altceva dect media
diferen
|x
i
-x
]
|
n
]=1
Indicatorul diferenelor medii a lui Gini nu
elor luate n valori absolute. Aceast sum va fi, aadar mprit la
numrul de perechi rezultate (16). Obinem, aadar, 40:16 = 2,5 care repre-
zint valoarea acestui indicator. Mai condensat, am putea scrie acest lucru
astfel:
0 =

n
i=1
n
(formula 5.6)
Dei procedura de calcul a acestui indicator este extrem de simpl, la
un numr mare de valori calcularea manual a diferenei medii Gini devine
imposibil iar pentru obinerea indicatorului este absolut necesar utilizarea
unui program computer. Diferena medie Gini este un indicator slab al gra-
dului de mprtiere i arat cum se abat, n medie, scorurile unul fa de ce-
llalt.
V.2.2 Oscilaia
Calculul oscilaiei reprezint tot o medie a diferenelor dintre perechi,
ns, de aceast dat, ordinea de efectuare a msurtorilor conteaz. n mod
130
Cristian Opariuc-Dan
normal
nipularea unor variabile. Dac avem, de exemplu,
urmto
cardiac s-a accelerat i putem concluziona c imaginile au avut ca efect cre-
terea co t prin astfel de reacii. Dac ns
ordinea am observa c avem de
a face
iferene.
elor dintre o valoare i
ce ante
solute ale dife la urmtoare:
, sunt rare situaiile n care ne intereseaz ordinea de efectuare a msu-
rtorilor. Vizm acest fapt ndeosebi n experimente, atunci cnd ntre msu-
rtori intervenim prin ma
arele 4 msurtori ale ritmului cardiac al unui subiect la prezentarea
unor imagini 80, 85, 91, 96, constatm c de la o msurtoare la alta ritmul
nstant a tensiunii psihice manifesta
msurtorilor ar fi fost 80, 96, 91, 85, atunci
cu o cretere rapid a tensiunii psihice urmat de o diminuare progre-
siv a acesteia. Este cu totul altceva. Iat c, uneori, ordinea msurtorilor
poate avea o semnificaie important. n asemenea situaii se calculeaz osci-
laia ca indicator sensibil la aceste d
Oscilaia nu este altceva dect media diferen
rioar i se poate calcula n valori absolute sau relative iar numrul
acestor diferene este n-1.
Oscilaia absolut reprezint un indicator care furnizeaz volumul
oscilaiilor aprute de la o msurtoare la alta i se calculeaz utilizndu-se
valorile ab renelor dup formu
0
ubs
=
|x
i
-x
i-1
|
n
i=2
n-1
(formula 5.7)
Relund cele dou exemple anterioare, obinem pentru oscilaia abso-
lut a primului set de date, valoarea:
0
ubs
=
|8S -8u| +|91 -8S| +|96 -91|
S
= S,SS
Pentru al doilea set de date, obinem, dup efectuarea calculelor, ur-
mtoarea valoare:
0
ubs
=
|96 -8u| +|91 -96| +|8S -91|
S
= 9
131
Statistic aplicat n tiinele socio-umane
n mod evident cele dou valori difer deoarece ordinea de efectuare a
msurtorilor difer i ea. Prima valoare, mai mic, indic un volum mai mic
al oscilaiilor, o cretere constant, dei rapid a ritmului cardiac. Valoarea a
doua, mare, arat un volum mare al oscilaiilor, o fluctuaie a msurtorilor
efectuate.
Oscilaia relativ ine cont de semnul diferenelor, spre deosebire de
oscilaia absolut care lua diferenele n valori fr semn. De aceea, oscilaia
relativ, dei nu ofer o imagine a volumului oscilaiilor, ne informeaz ns
asupra direciei lor, n ce sens oscileaz msurtorile, aspect care nu poate fi
sesizat de oscilaia absolut. De aceea, aceti doi indicatori se calculeaz n
general mpreun. Oscilaia relativ are o formul de calcul asemntoare
celei absolute, ignorndu-se modulul:
0
ubs
=
(x
i
-x
i-1
)
n
i=2
n-1
(formula 5.8)
Pentru primul set de date, oscilaia relativ rmne 5,33, n timp ce
oscilai
subiect, sub influ-
ena imaginilor, ritmul s od constant pe msur ce-i sunt
prezentate noi informaii cretere inii-
al foa
ei.
Indic pra tendin-
ei tipice sau ltat impor-
tant atu
a relativ pentru al doilea set de date devine 1,66. tim c valoarea nu
este reprezentativ pentru volumul oscilaiilor, ns comparnd cele dou
valori putem trage concl ii im Iat c, la primul uz portante.
u cardiac crete n m
, n timp ce la al doilea subiect, dup o
rte mare (tim acest lucru din oscilaia absolut) urmeaz o scdere a
ritmului cardiac, ca u , rmare probabil, a instalrii obinuin
atorii oscilaiei ne furnizeaz informaii valoroase asu
atipice de evoluie a scorurilor, reprezentnd un rezu
nd urmrim s vedem evoluia unui fenomen n tim nci c p sau sub
influena unor modific n ri experime tale.
132
Cristian Opariuc-Dan
V.2.3
e abat, n valori absolute, rezultatele de la medie, acordnd ace-
eai po
al re:
te abate
a de medie cu
0,88 fra
J =
|x
i
-x
Abaterea medie
Se mai numete variaie medie, deviaie medie, abatere absolut me-
die sau abatere liniar medie i se poate calcula atunci cnd media este un
bun indicator al tendinei centrale. Acest indicator informeaz asupra modu-
lui n care s
ndere tuturor variabilelor. Abaterea medie se poate calcula pe date
grupate sau pe date discrete.
S ne amintim de exemplul cu prietenii. Am vzut c simpla adunare
a abaterilor fiecrui scor de la medie nu rezolv problema verificrii gradului
de potrivire a modelului statistic cu modelul real, suma lor fiind ntotdeauna
nul. Ce-ar fi ns dac am lua aceste valori n modul, adic nu am ine cont
de semn. Am obine, atun i, ur c mtoarea v oa
1,6+0,6+0,4+0,4+1,4=4,4
ai bun al er ii Rezult un indicator m or totale, care indic faptul c toa-
rile de la medie sunt n valoare de 4,4, adic numrul de frai cu care
se abat toi cei 5 prieteni ai mei de la media de 2,6 este de 4,4 frai. Ideea nu
este rea, ns aceast sum depinde de numrul de msurtori i crete pe
msur ce crete numrul de cazuri. Dac a avea 1000 de prieteni, suma ar
avea valori foarte mari. De aceea, se mparte aceast sum la numrul de ca-
zuri i se obine media cu care modelul statistic se abate de la modelul real.
Aceasta este i ideea abaterii medii. n cazul nostru, mprind 4,4 la 5 obi-
nem 0,88, adic numrul de frai ai prietenilor mei se abate f
i.
Calculul abaterii medii pe date discrete se realizeaz dup formula
urmtoare, n care x
i
reprezint valoarea msurtorii, x barat reprezint media
iar n reprezint numrul de msurtori.
|
n
i=1
n
(formula 5.9)
133
Statistic aplicat n tiinele socio-umane
Dac avem urmtoarele date 10, 22, 31, 9, 24, 27, 29, 9, 23, 12 pentru
care me
cestor valori absolute iar suma o mprim la
aceast valoare la numrul
de m binem 7,68, valoa-
rea aba
dia este 19,6 iar numrul de msurtori este 10, avem:
Practic, formula ne spune s scdem din fiecare
valoare valoarea mediei, adic s realizm diferena
dintre scor i medie. Aceast diferen o vom trata n
termeni de valori absolute (fr semn) dup care facem
suma a
numrul de msurtori. Rezultatul obinut reprezint
tocmai valoarea abaterii medii.
n cazul nostru, efectund calculele conform
tabelului alturat, am obinut suma diferenelor absolu-
te de 76,8. Dac mprim
surtori, 10 n cazul nostru, o
terii medii. Deci, pentru date discrete, d=7,68.
Pentru date grupate n intervale, vom utiliza n vederea calculrii aba-
terii medii urmtoarea formul, unde x
i
reprezint mijlocul intervalului de
distribuie, f
i
frecvena absolut a acestui interval, x barat media i n numrul
de msurtori.
J =
|x
i
-x|]
i
n
i=1
n
(formula 5.10)
S lum urmtorul
exemplu de distribuie n
clase. tim dintr-un capitol
Similar exemplului anterior
va trebui s calculm dife-
rena dintre mijlocul fiecru pe care o vom con-
sidera n valori absolute. Cu alte cuv orim s aflm n ce msur se aba-
anterior c media calculat a
acestei distribuii este 179,9.
i interval i medie, diferen
inte, d
Tabel 5.2 Calculul
abaterii medii
x
i
x
i-
m | x
i-
m|
10 -9,6 9,6
22 2,4 2,4
31 11,4 11,4
9 -10,6 10,6
24 4,4 4,4
27 7,4 7,4
29 9,4 9,4
9 -10,6 10,6
23 3,4 3,4
12 -7,6 7,6
76,8
Tabel 5.3 Calculul abaterii medii (clase)
Clasa x
i
f |x
i
-m| |x
i
-m|*f
171 174 172,5 9 7,4 66,6
175 178 176,5 5 3,4 17
179 182 180,5 6 0,6 3,6
183 186 184,5 4 4,6 18,4
187 190 188,5 3 8,6 25,8
191 -193 192 3 12,1 36,3
n=30 7,7 =16
134
Cristian Opariuc-Dan
te fieca
i s realizm
suma acestor rezultate. n caz
di 67,
o nem 9
i va cla
V .4 te m
ai e
zeaz uai car rit faptului c nivelul
de m l v ilei este u
distribu fapt ace
Modali de
sm dumneavoastr ca
exerci
re interval de la media general a eantionului. Urmeaz apoi s n-
mulim aceste abateri cu frecvena absolut a fiecrui interval
ul nostru, suma abaterilor intervalelor de la me-
7. mprind aceast valoare la numrul de msurtori,
reprezint altceva dect abaterea medie (d) calculat pe
edian
te i variaie median sau deviaie median i se utili-
e nu putem folosi media, fie dato
a general este 1
bi 5,5 care nu
nter le de se.
.2 Aba rea
Se m num
n sit a n
sur a ariab nul ordinal, fie c avem scoruri extreme ntr-o
media un indicator inadecvat.
calcul a abaterii mediane este similar celei de mai sus
(abaterea medie), sigura diferen fiind aceea c, n loc de valoarea mediei,
vom folosi valoarea medianei. Calculul acesteia vi-l l
ie, ce f
tatea
iu.
Exerciiu:
Calculai abaterea median i datele grupate n pentru datele discrete
intervale de clas utiliz mai sus. nd exemplele de
V.2.5 Dispersia
indi
r iei ic rul ei (aten ie,
c trat pentru popula u s
2
zul u
z p a en valo indiv
ti o r dire cu mai rtant
pr rezu lor, ater nda
Atunci cnd putem utiliza media, un

cator frecvent este indicato-


nu variaie ci varian) notat
nui eantion. Variana repre-
iduale fa de media aritme-
indicator al gradului de m-
n loc s folosim modul pentru a realiza suma diferenelor, preferm
s ridicm la ptrat aceste diferene. tim foarte bine c dac ridicm un nu-
ul dispers sau ind ato varian
u sigma p ie sa n ca
int media tratic difer elor rilor
c i are elaie ct cel impo
tiere a ltate ab ea sta rd.
135
Statistic aplicat n tiinele socio-umane
mr cu acelai semn la ptrat, rezultatul este ntotdeauna pozitiv. Iat o alt
modalitate prin care evitm anulrile reciproce determinate de semn.
Pentru fraii prietenilor mei, vom avea:
(-1,6)
2
+(-0,6)
2
+(0,4)
2
+(0,4)
2
+(1,4)
2

2,56+0,36+0,16+0,16+1.96 = 5,20
art numele de suma abaterilor ptratice i
vor fi explicate mai trziu. Iat c, 5,20:4 = 1,30, adevrata msur a varian-
ei.
surtori.
o
2
=
(x
i
-x
Aceast valoare, 5,20 po
reprezint un indicator mai bun dect suma abaterilor simple luate n modul.
La fel, aceast sum depinde de numrul de cazuri i de aceea, pentru a com-
pensa acest lucru, se mparte suma abaterilor ptratice la numrul de cazuri.
n situaia noastr, 5,20:5=1,04, exact valoarea varianei.
Ajuni aici, se impune totui o precizare. mprirea la numrul cazu-
rilor (n) se realizeaz atunci cnd vorbim de o populaie. Dac ne referim la
eantion, atunci nu mprim la numrul de cazuri ci la numrul de cazuri
minus unu (n-1). Aceasta este o ajustare statistic, iar motivele care o susin
Formula de calcul a dispersiei este urmtoarea, n care x
i
reprezint
valoarea msurat, x barat media iar n numrul de m
)
2 n
i=1
n
(formula 5.11)
n activitatea curent, deoarece lucrm cu eantioane i nu cu popula-
ii, se nlocuiete n cu n-1, astfel nct formula dispersiei pentru eantioane
devine:
s
2
=
(x
i
-x)
2 n
i=1
n-1
(formula 5.12)
i dispersia, se poate calcula pe date discrete sau pe date grupate n
intervale.
136
Cristian Opariuc-Dan
Relund exemplul anterior, ne amintim c avem urmtoarele date 10,
22, 31, 9, 24, 27, 29, 9, 23, 12 pentru care media este 19,6 iar numrul de
m utiliza un tabel similar cu
cel prezentat n exemplul de mai sus i vom analiza
c trebuie s fa-
i nu am obine nici
a ptratelor la numrul de msurtori (10), obinem valoarea 68,44 ca
valoare
0-1=9) rezul-
tnd valoarea corectat a dispersiei. Deci, pentru a
s
2
=70,04
int mijlocul acestui interval, restul elementelor fiind cunoscute.
msurtori este 10. Vo
formula.
Privind cu atenie, observm
cem, prima dat, diferena dintre scorul brut i me-
die (x
i
-m), la fel ca n procedura de calcul a abaterii
medii. Deoarece obinem valori negative i valori
pozitive, dac le-am nsuma n aceast etap, valori-
le contrare se vor anula reciproc
o informaie sintetic util. Pentru a preveni acest
lucru, vom ridica la ptrat fiecare diferen. n acest
fel compensm anularea reciproc ce poate s apar la nsumarea valorilor,
toate valorile rezultate fiind pozitive. Dup ridicarea la ptrat, putem face fr
s ne preocupe anularea valorilor, suma rezultatelor (suma abaterilor ptrati-
ce). n cazul nostru, suma abaterilor ptratice este 684,4. mprind acum
sum
a indicatorului varianei sau dispersiei. Deoarece lucram cu un ean-
tion i nu la nivelul popula ea o vom face la n-1 (1 iei, mprir
setul nostru de date, varian
Pentru date grupate n intervale de clas, formula de calcul a varianei
se modific puin, unde f
i
reprezint frecvena absolut a intervalului de clas,
x
i
reprez
o
2
=
]
i
(x
i
-x)
2 n
i=1
n
(figura 5.13)
s
2
=
]
i
(x
i
-x)
2 n
i=1
Tabe
dispersiei
x
i
x
i-
m (x
i-
m)
2

l 5.4 Calculul
10 -9,6 92,16
22 2,4 5,76
31 11,4 129,96
9 -10,6 112,36
24 4,4 19,36
27 7,4 54,76
29 9,4 88,36
9 -10,6 112,36
23 3,4 11,56
12 -7,6 57,76
684,4
n-1
(figura 5.14)
137
Statistic aplicat n tiinele socio-umane
Relund distribuia prezentat n seciunea anterioar, ne reamintim c
media acestor rezultate a fost de 179,91 iar numrul de cazuri 30.
are l vom face va fi s calculm diferena dintre mij-
e clas i medie. Din motivele expuse anterior, nu
Primul lucru pe c
locul f e l d
putem face n acest
frecvena absolut a fiec
o putem ntlni sub numele de abatere etalon, abatere tip, abatere
ptratic
Variana ne d ex e i observaii,
ns aceast valoare este ridicat la ptrat. Nu tiu dac
v este foarte util o exp frai ridicat la
ptrat cu care se abat fra edia de 2,6 frai este de 1,3
Tab lculul disp
las f
iecrui int rva
moment suma dife-
renelor obinute.
Va trebui s ridi-
cm la ptrat aceste
diferene dup care
s nmulim ptra-
tele obinute cu
rui interval. Dup aceast operaiune, putem calcula
suma abaterilor ptratice, care, n cazul nostru, va deveni 1298,55. mprind
aceast sum la numrul de msurtori (n=30) obinem valoarea varianei
42,28. Totui, numrul de msurtori fiind mic, acest rezultat n corectm
mprind nu la 30 ci la 29. Va rezulta astfel 44,77, valoarea corectat a vari-
anei.
V.2.6 Abaterea standard
Se noteaz cu s n cazul unui eantion sau cu sigma n cazul unei po-
pulaii i
ersiei (clase)
x
i
-m (x
i
-m)
2
f*(x
i
-m)
2

el 5.5 Ca
C a x
i

171 17 9 174 2,5 7,4 54,76 492,84
175 1 17 5 78 6,5 3,4 11,56 57,8
179 1 180 6 82 ,5 0,6 0,36 2,16
183 1 184 4 86 ,5 4,6 21,16 84,64
187 18 3 190 8,5 8,6 73,96 221,88
191 -1 19 3 93 2 12,1 146,41 439,23
n=30 =1298,55
medie. Acest indicator este cel mai precis i inteligibil pentru msu-
ra gradului de mprtiere al rezultatelor n jurul tendinei centrale i contri-
buie la definirea distribuiei normale. Poate fi calculat i dobndete semnifi-
caie numai atunci cnd p t dia. oa e fi calculat me
re a medie a abaterilor dintre medi
p m
p si
ex ri at sub form
resie de genul n medie, numrul de
ii prietenilor mei de la m
138
Cristian Opariuc-Dan
frai.
trat dife-
renele
obine valoarea 1,14, expresia abaterii standard. Putem
m m e fr ai n i se la
1
at tan d se cul up la ur
datele ne sunt deja cunoscute. Dac im c ie ac
s nu este altceva dect va
dup ce calculm va a, putem afla uor a an
Cred c mai degrab v poate crea confuzie. Acest lucru se ntmpl
deoarece, pentru a evita problemele legate de semn, am ridicat la p
. Cum scpm acum de aceast ridicare la ptrat? V mai amintii pro-
babil c inversul ridicrii la ptrat este extragerea rdcinii ptrate (a radica-
lului). Exact acest lucru l vom face i noi. Extrgnd radical din 1,3 vom
acum afirma c, n
valoarea de 2,6 cu
mtoare, unde toate
east formul, con-
riana. Prin urmare,
dard extrgnd radi-
calul de ordin doi din varian.
o =
_
]
i
(x
i
-x
edie, nu rul d ai priete ilor me abate de
,14.
Ab erea s dar cal eaz d formu
priv u aten
tatm c expresia de sub radical
rian baterea st
)
2
n
i=1
n
= o
2
(formula 5.15)
s =
_
]
i
(x
i
-x)
2
n
i=1
n-1
= s
2
(formula 5.16)
n primul exemplu, cel n care am
nut a fost s
2
=68,44. Deci, abat
folosit date discrete, variana obi-
erea standard va fi egal cu rdcina ptrat
din 68,
este reprezentativ pentru
observaii, n ce msur modelul statistic se potrivete cu modelul real. Aba-
terile s
44, adic 8,27. Similar, pentru datele grupate n intervale, variana a
fost 44,77 iar abaterea standard devine 6,69.
Abaterea standard msoar modul n care rezultatele se mprtie n
jurul mediei, valorile mari indicnd un grad mare de mprtiere. Este, dac
dorii, un indicator ce arat n ce msur media
tandard mici arat c valorile sunt puin distanate fa de medie, acest
indicator al tendinei centrale reprezentnd foarte bine datele. Valorile mari
ale abaterii standard arat c datele sunt distanate, mprtiate puternic n
139
Statistic aplicat n tiinele socio-umane
jurul mediei, aceasta nefiind un bun model statistic. Abaterea standard zero
indic faptul c avem aceleai valori (de exemplu o distribuie 5, 5, 5, 5, 5, 5,
5, 5, 5, 5, 5 are media 5 i abaterea standard 0).
Comparnd cele dou rezultate de mai sus, constatm c n primul
exemplu rezultatele sunt mai mprtiate n jurul mediei dect n al doilea
exemplu. Cu ct abaterea standard este mai mic, cu att datele sunt mai gru-
pate n jurul tendinei centrale.
Abaterea standard se exprim n aceleai uniti de msur ca i me-
Ridicarea la , introduce o oarecare distor-
siune n analiza mp se atribuie
o pondere mai mare re fa de medie.
Reinei c m ntru o va-
riabil teoretic sau e, n general, lucrm cu ean-
tioane
din distribuie, abaterea standard nu sufer modificri;
dia. Dac media nlimii unor subieci este de 179,91 centimetri, atunci aba-
terea standard de 6,69 va fi exprimat tot n centimetri. Convenim aadar s
descriem o distribuie de acest gen prin media nlimii subiecilor din eanti-
on egal cu 179,91 centimetri cu o abatere standard de 6,69 centimetri.
ptrat din formula dispersiei
rtierii datelor, deoarece prin aceast operaie
a l t ma valorilor flate a o dis an
prirea la numrul de cazuri n este valabil pe
n cazul populaiei. Deoarec
i nu cu populaii, vom folosi n formul mprirea la n-1, valabil
pentru variabila empiric. Aceast corecie se folosete n vederea evitrii
subestimrii gradului de mprtiere a rezultatelor n jurul mediei i poart
numele de grade de libertate.
Media i abaterea standard sunt cei doi indicatori importani n analiza
distribuiei normale. Utilizarea lor este condiionat de absena unor scoruri
extreme i de variabile situate cel puin la un nivel de msur de interval.
La fel ca i media, indicatorul principal al tendinei centrale, abaterea
standard are i ea o serie de proprieti utile n practic:
Dac adugm sau scdem o valoare constant la fiecare scor
140
Cristian Opariuc-Dan
Dac nmulim sau mprim fiecare scor din distribuie cu o
constant, abaterea standard se multiplic sau se divide cu va-
loarea acelei constante;
Distana ntre valoarea abaterii standard i medie este mai mi-
c n comparaie cu distana dintre abaterea standard i orice
alt scor. Cu alte cuvinte, media se distaneaz cel mai puin de
abaterea standard n comparaie cu orice alt scor.
aterii
median
V.2.7 Coeficientul de variaie
Prezint, mai intuitiv dect abaterea standard, gradul de mprtiere al
rezultatelor n jurul mediei, deoarece este o expresie procentual a mpririi
abaterii standard la medie. De asemenea, pentru datele ordinale, se poate cal-
cula coeficientul de variabilitate ca expresie procentual a mpririi ab
e la median. Formulele de calcul n acest caz sunt:
v
x
=
s
x
1uu, n cozul mcJici (formula 5.17)
v
Md
=
d
Md
Md
1uu, n cozul mcJionci (formula 5.18)
Prin nmulirea coeficientului de variaie cu 100 obinem exprimarea
procentual a acestui indicator, mai intuitiv n comparaie cu valoarea brut.
n exemplul nostru, = 7,04:19,6=0,35x100=35, adic o variaie de
35% n cazul datelor discrete i = 6,69:179,91=0,03x100=3, o variaie de
doar 3,
ient
nu dep
ul variabilitii, dou
distribu
00% pentru datele grupate n interval.
Cu ct valoarea acestui coeficient este mai mare, cu att media este un
indicator mai imprecis pentru tendina central. Valoarea acestui coefic
inde de unitatea de msur, ca n cazul abaterii standard i de aceea
poate fi folosit n situaii n care comparm, sub aspect
ii diferite.
141
Statistic aplicat n tiinele socio-umane
Exist anumite reguli ce permit aprecierea gradului de mprtiere a
jurul mediei utilizndu-se acest coeficient (Popa, 2006):
Un coeficient de variaie m
scorurilor n
ai mic de 15% indic un grad de
mediei este
spersiei n SPSS,
vom folosi baza
avem deja da le
rior. Folosim
Analyze,
Statist
reastr, pe care am
losi, ca exemplu, variabila
dreapt a formularului, aa cum se poa-
te observa n figura 5.4. Asupra modu-
mprtiere redus, media fiind un bun indicator al tendinei
centrale;
Un coeficient de variaie cuprins ntre 15% i 30% arat o m-
prtiere moderat, caz n care reprezentativitatea
satisfctoare;
Un coeficient de variaie de peste 30% arat o mprtiere ma-
re, media nemaifiind un bun indicator pentru tendina central.
V.3 Obinerea indicatorilor mprtierii n SPSS
Pentru a tu a dicatorii di s di modul n care aflm in
de date IQ.sav, n care
i r du
n
te nt o se n capitolul ante-
, pe tru aceasta, tot comanda
apoi submeniul Descriptive
ics i opiunea Frequencies.
Se va deschide binecunoscuta de acum fe-
studiat-o n momentul n
care am aflat cum putem calcula indicatorii
tendinei centrale. i de data aceasta
vom fo
Varsta subiectilor, variabil pe care o
vom transfera din lista variabilelor din
baza de date n lista variabilelor supuse
analizei (Variable(s)) din partea
Figura 5.3 Meniul de analiz a
frecvenelor
Figura 5.4 Includerea variabilei n
analiz
142
Cristian Opariuc-Dan
lui n c
v
indica amintii probabil c
snd butonul
at,
dinei
nea destinat torilor dispersiei
a, bifnd caseta
n
i-
i
S.E mean) ns asupra acestui
n
uiei, minimului i maximu-
zile noastre i ne ntoarcem n formul
ap
ced
SP
bel
tom
are se face acest transfer nu mai insistm, deoarece procedeul a fost
descris pe larg n capitolul destinat indicatorilor tendinei centrale. Dac nu
acest lucru l putem face ap-
putei aminti, revedei capitolul 3.
Dup transfer, va trebui s comunicm aplicaiei SPSS s ne calculeze
torii mprtierii. V
Statistics situat n partea de jos a acestui formular. Imedi-
se va deschide o nou fereastr, cunoscut de la calculul indicatorilor ten-
centrale. Observm, n partea din stnga-jos a acestei ferestre, seciu-
calculului indica
(sec
abater
deviation, varian
ajutoru
iunea Dispersion). Vom putea calcula
ea standard, prin bifarea casetei Std.
Variance sau amplitudinea de variaie cu
l casetei Range. De asemenea este
posibil afiarea valorii minime i maxime di
distribuia noastr prin bifarea casetelor M
nimum i Maximum. Seciunea permite
calcularea erorii standard a mediei (caseta
element vom reveni ceva mai trziu.
Vom alege, dup cum putei observa
abaterii standard, a varianei, amplitudinii distrib
lui. Apsm apoi butonul Continue pentru ca SPSS s memoreze comen-
arul anterior. Nu ne mai rmne dect s
sm butonul OK pentru a lansa pro-
eul de analiz.
Dup cteva fraciuni de secund
SS va afia n fereastra de rezultate ta-
ul cu rezultatele comandate de noi. Au-
at, SPSS include i numrul de cazuri
figura de mai sus, afiarea
Figura 5.5 Selectarea
indicatorilor mprtierii
Tabel 5.6 Indicatorii mprtierii
143
Statistic aplicat n tiinele socio-umane
(N). Aflm, din analiza acestui tabel, c avem un numr de 30 de subieci
(N=30) i toi subiecii au valori pentru variabila Varsta subiectilor (Va-
lid=30; Missing=0). Cu alte cuvinte, nici unul dintre aceti subieci nu are
necomp
singu cesar
prtie e
i sunt:
;
o Dispersia sau variana
o Abaterea standard;
o Coeficientul de variaie.
Media i abaterea standard sunt indicato
tribuie normal;
Indicatorii dispersiei bazai pe m
re al variabilei este cel puin un
buie;
letat valoarea pentru variabila vrst. Aflm, n continuare, c abate-
rea standard (Std. Deviation) este 5,523 iar variana (Variance) este 30,506.
Dac vei extrage rdcina ptrat din varian (30,506) vei obine exact va-
loarea abaterii standard (5,523), ceea ce confirm teoria expus mai sus. De
asemenea, amplitudinea de variaie (Range) este 19, cu alte cuvinte ntre
Minimum 20 i Maximum 39 pot exista cel m
mult mai simplu dect s efectum manual calc
acestui capitol. Iat de ce SPSS i merit cu pri
t productorul

Concluzii:
Indicatorii tendinei centrale nu pot caracteriza
s studiem i modul n care rezultatele se m
prin calculul indicatorilor dispersiei;
Indicatorii dispersiei pot ine seama doar de anumite date i se numesc indicatori
elementari ai mprtierii sau de toate datele, cazul indicatorilor sintetici;
Indicatorii elementari ai mprtieri
ult 19 valori posibile. Pare
ulele prezentate la nceputul
sosin banii pe care i solici-
ri o distribuie. Este ne
n jurul tendinei central
o Amplitudinea de variaie absolut i relativ;
o Intervalul cuartil i abaterea cuartil;
Indicatorii sintetici ai mprtierii sunt:
o Diferena medie Gini;
o Oscilaia absolut i relativ;
o Abaterea medie;
;
o Abaterea median
rii pe baza crora se caracterizeaz o dis-
edie pot fi calculai numai dac nivelul de msura-
ul de interval i nu exist scoruri extreme n distri-
144
Cristian Opariuc-Dan

ntrebri i exerciii:
Calculai abaterea standard i coeficientul de variaie al
urmtoarei distribuii statistice preciznd etapele de re-
zolvare:.
Calculai indicatorii dispersiei n cazul urmtoarelor se-
turi de date:
o 12, 23, 9, 6, 14, 14, 12, 25, 9, 12
o 1, 4, 5, 6, 19, 1, 5, 3, 16, 12, 5, 4
o 32, 56, 91, 16,32, 5, 14,62,19, 12
Extragei indicatorii tendinei centrale pentru variabila
iq folosind SPSS
Clasa f
3 5 3
6 8 5
9 11 9
12 14 16
15 17 10
18 20 4
21 23 3
24 26 1
145
Statistic aplicat n tiinele socio-umane
V VI I. . D DI IS ST TR RI IB BU U I IA A N NO OR RM MA AL L
n acest capitol se va discuta despre:
Distribuia normal;
Analiza distribuiei normale;
Note standardizate;
Inventarul statistic de baz
Etaloane i sisteme de etalonare.
Dup ii vor fi capabili s: parcurgerea capitolului, cursan
neleag caracteristicile unei distr nor - ibuii ma
le;
Analizeze o distribuie sub aspectul caracteristi-
cilor acesteia i s precizeze dac este sau nu
normal;
Realizeze i s interpreteze inventarul statistic
de baz utiliznd SPSS;
Transforme o not brut n note standardizate i
s precizeze poziia pe care o ocup scorul parti-
cular;
Decid ce sistem de etalonare poate fi utilizat n
funcie de distribuie i s realizeze un etalon.

Am menionat deseori acest concept al distribuiei normale i a venit
momentul s l abordm n detaliu. Vom ncepe, ca de obicei, cu un exemplu:
dac am avea posibilitatea s msurm nlimea tuturor brbailor din Ro-
mnia, am observa c exist
foarte puini pitici i foarte
puini gigani; ceva mai muli
oameni mici i, la fel, ceva
mai muli oameni foarte nali
iar cei mai muli oameni sunt
de statur medie. Care ar fi
aadar probabilitatea ca s
ntlnim n populaia masculi-
n un gigant? Foarte mic.
nlimea subiecilor
F
r
e
c
v
e
n

a

d
e

a
p
a
r
i

i
e

Figura 6.1 Distribuia nlimii tuturor brbailor
din Romnia
146
Cristian Opariuc-Dan
Ceva mai mare ar fi probabilitatea de a ntlni n populaie un om nalt i
nlimea de 178 centimetri,
-un grafic cu bare, nlimea
tuturo mntoare cu figura de
ma
ale subiecilor foar-
o.
Pe m
nou s
de apari
ma
nume
riza
indicat
reparti iei normale. Dac cunoatem media i abaterea standard, putem ori-
cnd ca
(1777-1855) i de aceea distribuia normal
gaussian. Deoarece la demonstrarea acestui c
lace (1749-1827), n literatura de specialitate s
tribuie gauss-laplace. Toi aceti termeni se re
normal.
Am vzut deja c media i abaterea sta
buie normal. n literatur, se folosete pentru
iar pentru abaterea standard simbolul s, atunc
foarte mare s ntlnim, de exemplu, un om cu
nlime medie. Dac am reprezenta grafic, printr
r brbailor din Romnia, am obine o figur ase
nct va atinge un m
i sus.
Privind cu atenie figura, observm c, la nlimi
te mici (piticii), frecvena de apariie este i ea foarte mic, apropiat de zer
sur ce nlimea crete, crete i frecvena de apariie a acesteia, astfel
aximum n zona tendinei centrale, dup care ncepe din
scad spre nlimi mari. La nlimi foarte mari (giganii), frecvena
ie se apropie din nou de zero.
Aceast distribuie este o distribuie normal i poate fi evaluat nu-
i n cazul unei variabile continue. De aceea, distribuia normal se mai
te i distribuie continu. O distribuie normal, este pe deplin caracte-
t de medie, ca indicator al tendinei centrale i de abaterea standard, ca
al dispersiei. Aceti doi indicatori poart numele de parametri ai or

lcula probabilitatea de apariie a unei valori particulare n aceast dis-


tribuie.
Distribuia normal, a fost descris prima dat de Ch. Fr. Gauss
se mai numete i distribuie
oncept a participat i P.S. Lap-
e va ntlni i termenul de dis-
fer la acelai lucru, distribuia
ndard descriu complet o distri-
medie simbolul m sau x barat
i cnd vorbim de un eantion.
147
Statistic aplicat n tiinele socio-umane
La nivel teoretic sau atunci cnd vorbim de populaii, folosim simbolul
pentru medie i simbolul pentru abaterea standard.
Pentru ca o distribuie s fie considerat normal, vor trebui ndeplini-
te simultan urmtoarele condiii:
S fie unimodal adic s existe un singur mod, o singur
categorie cu frecven maxim;
S fie simetric fa de medie adic s nu fie deplasat spre
stnga sau spre dreapta;
S fie normal boltit adic s nu fie nici ascuit (foarte
omogen) i nici turtit (

foarte eterogen);
buii ce nu pot fi considerate ca
l. O distribuie similar distribu-
De asemenea, limitele din stnga i din dreapta ale unei distribuii
normale tind spre valoarea zero, pe care ns nu o ntlnesc niciodat. O dis-
tribuie perfect normal are aceeai valoare pentru toi cei trei indicatori ai
tendinei centrale (media, mediana i modul), adic media = mediana = mod.
n practic, acest lucru se ntlnete extrem de rar i, de aceea, ne punem pro-
blema ntre ce limite putem considera o distribuie ca fiind normal.
VI.1 Modalitatea
O distribuie normal este o distribuie unimodal, adic exist doar o
singur categorie cu frecvena maxim. Prezena a dou sau mai multe valori
modale determin distribuii
bimodale, trimodale, n general
polimodale (multimodale), distri-
fiind distribuii normale.
O distribuie ca cea din fi-
gura 6.1, este o distribuie norma-
Figura 6.2 Distribuie bimodal
148
Cristian Opariuc-Dan
iei din figura 6.2, este o distribuie bimodal, deoarece observm existena a
dou categorii cu frecvena egal i maxim.
Normalitatea distribuiei, sub aspectul modaliti, se verific prin cal-
cularea valorii mod. Dac exist o singur
atunci distribu
n care sun
distribu
norm
VI.2
valoare cu frecvena maxim,
ca fiind
l (simetric) rspn-
dite n juru tre valori mici,
n partea
dreapt a distribuiei, vorbim des-
cum trateaz i consider unii.
n figura 6.3, distribuia B este
A este o distribuie asimetric la dreapta predomi-
n scorurile sczute, n timp ce distribuia C este o distribu
stnga (skewness negativ) n care predomin
ia poate fi considerat normal sub acest aspect. n condiiile
t dou sau mai multe valori cu frecvena maxim i, evident, egal,
ia este polimodal (multimodal) i nu poate fi considerat
al.
Simetria
O distribuie este simetric, dac valorile sunt ega
l tendinei centrale. Atunci cnd rezultatele tind c
sunt aglomerate n partea stng a
distribuiei, avem de a face cu o
distribuie asimetric spre dreapta
(sau distribuie skewness pozitiv).
Cnd rezultatele tind ctre valori
mari, se aglomereaz
pre o distribuie asimetric la
stnga (skewness negativ). Iat c,
asimetria este dat de panta distri-
buiei i nu de vrful acesteia, aa
o distribuie simetric. Distribuia
(skewness pozitiv) unde
ie asimetric la
scorurile mari.
Figura 6.3 Distribuie simetric (B), asimetric
la dreapta (A) i asimetric la stnga (C)
149
Statistic aplicat n tiinele socio-umane
Nu ne putem limita la o apreciere pur vizual a simetriei; acest lucru
necesit demonstrarea statistic a simetriei sau asimetriei distribuiei. n acest
scop, e
uartile, dup metoda prezentat ntr-unul dintre capitolele anterioa-
xist mai muli coeficieni care pot fi calculai.
VI.2.1 Coeficientul Yule
Coeficientul msoar gradul de asimetrie prin raportul dintre diferena
i suma abaterilor cuartile i se calculeaz dup formula alturat. Observm
c, pentru a calcula acest coeficient, este necesar s calculm pur i simplu
cele trei c
re.
C

=
(
3
-
2
)-(
2
-
1
)
(
3
-
2
)+(
2
-
1
)
(formula 6.1)
Coeficientul poate lua, n general,
mea asimetriei negative sau pozitive. Cu
cu att distribuia este mai simetric. Cu
devine tot mai asimetric spre stnga sau
Acest coeficient este foarte uor d
teva valori valorile cuartile i nu de to
i limiteaz precizia i se consider c e
simetriei.
lc
rior. Am stabilit atunci i nu vom mai intr

c

s
e
a
s
u
ea cuartil (Q
2
) este 16,16 iar al treilea cuartil
(Q
3
) avea valoarea 25,75. nlocu
Coeficientul de asimetrie al lui Fisher, nu se bazeaz pe cteva ele-
mente, precum coeficientul Yule, ci pe toate valorile din distribuie i se cal-
valori de la -1 la +1 i indic mri-
t valorile sunt mai apropiate de 0,
ct se apropie de -1 sau de +1, ea
pre dreapta.
calculat, ns ine cont doar de c-
te valorile din distribuie, fapt care
te doar un coeficient elementar al
l al cuartilelor, din capitolul ante-
a acum n detalii, c primul cuartil
(Q
1
) are valoarea 12,03, al doil
S ne reamintim exemplul de ca
ind n formula noastr, obinem valoarea
negativ -1,35, indicnd o asimetrie spre stnga, adic o tendin ctre scoruri
mari, fapt ce se poate observa cu uurin din distribuia statistic.
VI.2.2 Coeficientul de asimetrie Fisher
150
Cristian Opariuc-Dan
culeaz
erene la cub, obinem
momentul centrat de ordin 3 iar dac ridicm la puterea a patra, momentul
de la abaterea standard, c ridicarea la ptrat
amplifi

3
folosindu-se momentele centrate. Variana, de exemplu, este momen-
tul centrat de ordin doi, deoarece am ridicat la ptrat fiecare diferen dintre o
valoare particular i medie. Dac ridicm aceste dif
centrat de ordin patru. tim,
c ponderea pe care o au variabilele distanate puternic de la medie.
Aceast pondere este amplificat i mai mult prin ridicare la cub, ns, de
aceast dat, va fi luat n considerare i semnul cubului diferenelor.
[
1
=
c
3
=
i=1
nc
3
( )
3 n
x
i
-x
(formula 6.2)
Dac raportm mom ii standard, ob-
inem exact expresia coe r.
ct s calculeze un
fel de
te deloc mai complicat dect
calculu
entul de ordin trei la cubul abater
ficientului de asimetrie a lui Fishe
Iat o prim formul care, probabil, v va determina s aruncai cartea
din mn. Dac ai ajuns la aceast fraz, dac acum continuai s citii, n-
seamn c dumneavoastr chiar dorii s nvai serios aceste noiuni Ide-
ea este c, dei pare complex, formula nu face altceva de
varian, doar c nu mai ridi-
cm numai la ptrat fiecare diferen
ntre scorul obinut, ci i la cub. Proce-
deul nu es
Tabel 6.1 Calculul coeficientului de
asimetrie
x
i
x
i-
m (x
i-
m)
2
(x
i-
m)
3

l varianei, dup cum vom vedea
n urmtoarele exemple.
Relund exemplul cu date dis-
crete, ne amintim c avem urmtoarele
date 10, 22, 31, 9, 24, 27, 29, 9, 23, 12
pentru care media este 19,6 iar numrul
10 -9,6 92,16 -884,736
22 2,4 5,76 13,824
31 11,4 129,96 1481,544
9 -10,6 112,36 -1191,02
24 4,4 19,36 85,184
27 7,4 54,76 405,224
29 9,4 88,36 830,584
9 -10,6 112,36 -1191,02
23 3,4 11,56 39,304
12 -7,6 57,76 -438,976
684,4 -850,08
de msurtori este 10.
151
Statistic aplicat n tiinele socio-umane
De asemenea, am aranjat aceste date ntr-un tabel pentru a ne uura
procedeul de calcul. Tot la calculul dispersiei, v amintii, am fcut ptratul
diferenelor (x
i
-m)
2
, dup care suma ptratelor.
n formul trebuie s mai calculm cubul acestor diferene (pentru
momentul centrat de ordin trei). Vom mai aduga o coloan pe care o vom
denumi (x
i
-m)
3
i vom ridica la puterea a treia fiecare diferen x
i
-m. La final
vom face suma ptratelor i suma cuburilor. Suma cuburilor poate fi un nu-
mr pozitiv sau negativ, n f i a pe care o au abaterile unc e de pondere
sau nspre partea stng fa de med
t s nlocuim n formul. Suma ptratelor este 684,4,
scoruri-
lor nspre partea dreapt ie. n acest mo-
ment nu ne rmne dec
suma c
n figura altu-
rat. D
uburilor este -850,08 iar numrul de msurtori este 10. nlocuind,
obinem urmtoarele momente de ordin trei i doi, prezentate
up efectuarea calculelor obinem un coeficient de asimetrie de - 0,15,
coeficient care indic o distribuie simetric.
[
1
=
p
3
o
3
=
-8Su,u8
1u _
_
684,4
1u
_
3
=
-8Su,u8
S661,9S
= -u,1S
Similar se realizeaz calculele i
rivnd din formula de calcul a dispersiei
l lsm ca exerciiu.
Acest coeficient a
n c ul d r grupate n clase, de-
pe d rupate. Acest exemplu
re valoarea zero pe ru u t s
Valoril etrii la stnga iar valorile
o ns valo ca
al lor nt de
in a o etrie care s
in m iu, care sunt
considera totui o distribuie asimetric fiind norma-
l.
az atelo
ntru ate g
nt distrib ii perfec imetrice.
e negative sunt considerate ca asim
indic asimetrii la dreapta. O valoare zer
ntlni foarte rar n practic. n mod norm
ns orice valoare diferit de zero poate
semnificativ de la distribuia normal. Vom vedea, pu
limitele ntre care putem
pozitive
este o are pe re o vom
, va i u le s d e iferit z u ero. N
dic asim devieze
ai trz
152
Cristian Opariuc-Dan
Exerciiu:
Calculai coeficientul de asimetrie folosind distribuia n clase pre-
zentat la capitolul de calcul a dispersiei.
Atunci cnd discutm de asimetrie, trebuie s precizm o serie de re-
laii care apar ntre indicatorii tendinei centrale, medie, median i mod.
ntr-o distribuie perfect simetric, media mediana i modul
au exact aceleai valori. Caracteristica acestei distribuii o re-
prezint coincidena absolu-
t a celor trei indicatori ai
tendinei centrale. Dup
cum putei observa n figura
alturat, att media, ct i
m n i modul, se afl n edia a
acelai punct, la mijlocul
distribuiei. Grupa subieci-
lor cu scoruri mai mici de-
t me ia este perfect sime cu grupa s biecilor
Figura 6.4 O distribuie perfect simetric
c d tric u cu scoruri
i o distribuie care poate fi acceptat ca fiind o distribu-
la stnga n irul de date, iar
mai mari dect media. Acest aspect este menionat din raiuni
teoretice. n practic nu vom ntlni o distribuie perfect nor-
mal, c
ie normal.
ntr-o distribuie asimetric
la dreapta (distribuie
skewness pozitiv, vezi figura
alturat), predomin scoruri-
le mici. n acest caz, modul
este valoarea situat cel mai
Figura 6.5 O distribuie asimetric
la dreapta
153
Statistic aplicat n tiinele socio-umane
mediana este mai mic dect media. Evident, mediana fiind
t), predomin scorurile mari. n
a situat cel mai la dreapta n i-
mai mare dect media. Evident,
naliza precizi-
n care ntlnim scoruri extre-
n valoare. Iat c acest fapt
mai sus. Observai relaia exis-
Mo>Me>m. Aceast relaie
distribuii asimetrice negativ.
e
considerare i abaterea standard, o variant a coeficientului skewness poate fi
valoarea care mparte irul ordonat de date n dou pri egale,
iar dac n distribuie predomin scorurile mici, atunci
le mari sunt considerate ca scoruri extreme. tim, de la analiza
un
este relaia caracteristic a unei
la stnga (distribuie skewness
preciziei indicatorilor tendinei centrale, c ntr-o serie de date
n care ntlnim scoruri extreme mari, media tinde s le p
n valoare. Iat c acest fapt este ilustrat grafic n figura de mai
sus. Observai relaia existent ntr-o asemenea distribuie:
Mo<Me<m. Aceast relaie
distribuii asimetrice pozitiv.
ntr-o distribuie asimetric
negativ, vezi figura altura
acest caz, modul este valoare
rul de date, iar mediana este
mediana fiind valoarea ca-
re mparte irul ordonat de
date n dou pri egale, iar
dac n distribuie predo-
min scorurile mari, atunci
scorurile mici sunt consi-
derate ca scoruri extreme.
tim, de la a
Figura 6.6 O distribuie asimetric la
stnga
ei indicatorilor tendinei
centrale, c ntr-o serie de date
me mici, media tinde s le pun
este ilustrat grafic n figura de
tent ntr-o asemenea distribuie:
este relaia caracteristic a unei
n baza acestor relaii stabilite ntre m die i median, dar lund n
154
Cristian Opariuc-Dan
calculat dup formula: Sk =
3(x-Mc)
c
, unde x barat reprezint media, Me
mediana iar abaterea standard. Valorile sale se interpreteaz la
rice coeficient de asimetrie. Avnd n vedere simplitatea acestei for-
exersarea ei pe unul dintre exemplele de mai sus, v-o lsm ca exerci-
Simetria este al doilea aspect important al unei distribuii normale. O
ie normal este o distribuie simetric.
Boltirea sau excesul
reprezint
fel ca o
mule,
iu.
distribu
VI.3
Asimetria pe orizontal, presupune, dup
tendin
scoruri m
entru acest concept este termenul
kurtosis (din limba greac, kurtos
cocoat). Practic, boltirea se
fer la aspectul cocoaei distri-
iei rezultatelor. Cocoaa poate fi
cuit i atunci putem vorbi de o
tri
oate fi turtit, di ia turtit,
at sau platicurtic sau normal,
distribu
ie me
cuit. Distribu
este o distribuie normal sub aspectul boltirii, sau mezocurtic.
cum am vzut, o deplasare a
ei centrale spre stnga sau spre dreapta, ctre scoruri mici sau ctre
ari. Aceasta este singura asimetrie posibil? Ei bine, nu. Exist i
un fel de asimetrie vertical sau
boltire. Termenul folosit generic
p
de
=
re
bu
as
dis
p
pl
ie mezocurtic. O distribuie normal este ntotdeauna o distribu-
zocurtic.
n figura de mai sus, distribuia C este o distribuie leptocurtic, as-
ia B este o distribuie platicurtic, turtit iar distribuia A
buie ascuit sau leptocurtic,
stribu
Figura 6.7 Distribuie mezocurtic (A),
leptocurtic (C) i platicurtic (B)
155
Statistic aplicat n tiinele socio-umane
Ai observat deja c boltirea nu este altceva dect simetria pe axa ver-
tical (O
Y
), spre deosebire de simetria propriu zis, deplasarea valorilor pe
axa orizontal (O
X
). Dac la simetrie vorbeam de frecvene (care sunt cele
mai frecvente scoruri obinute, unde se concentreaz acestea? n eantionul
nostru avem mai degrab subieci mici sau subieci nali? Ori poate exist un
echilibru ntre subiecii scunzi i cei nali), la boltire discutm de valori, de
modul
te mprtiate.)
a nu poate fi apreciat pur ochiometric
n care aceste valori se grupeaz n jurul tendinei centrale (sunt mai
grupate valorile n jurul mediei sau, din contra, foar
La fel ca i simetria, boltire
ci avem nevoie i aici de anumii coeficieni rezultai din formule de calcul
specifice. Pearson a discutat despre boltire n termeni de momente, la fel ca i
simetria, rezultnd astfel coeficientul de boltire sau coeficientul kurtosis.
[
2
=

4

2
2
=
(x
i
-x)
4
4
n
i=1
nc
(formula 6.3)
Dac skewness reprezenta raport
trei i momentul centrat de ordin doi, coe
tul dintre momentul centrat de ordin patru
Formula nu ar trebui s v pun p
de calculare a coeficientului de asimetrie
terpr
afirm are un
comparaiile se fac n funcie de aceast v
ect 3,
cu att
formulei de
mai sus poate fi urmtoarea, care-i pstreaz aceeai valoare interpretativ:
ul dintre momentul centrat de ordin
ficientul de boltire reprezint rapor-
i momentul centrat de ordin doi.
robleme dac ai neles modalitatea
. Tehnica este asemntoare.
etative ale coeficientului de boltire,
coeficient de boltire egal cu 3, iar
aloare. Pe msur ce coeficientul de
boltire are valori mai mari de 3, distribuia este din ce n ce mai cocoat
(leptocurtic), iar cu ct acest coeficient scade de la valori mai mici d
Una dintre recomandrile in
c, o distribuie normal
distribuia este mai plat (platicurtic).
Deoarece n practica statistic suntem obinuii mai degrab cu coefi-
cieni care iau n considerare valori ntre -1 i +1, o variant a
156
Cristian Opariuc-Dan
[
2
=

4

2
2
=
(x
i
-x)
4 n
i=1
nc
4
-S (formula 6.4)
Sunt i alte modaliti de interpretare ale acestui coeficient, modaliti
pe care le vom discuta imediat, n subcapitolul destinat aplicaiilor practice.
Vom reconsidera exemplul folosit la aprecierea simetriei, n vederea
calculrii boltirii. De data aceasta, nu mai suntem interesai de ridicarea la
cub a diferenelor dintre valori i medie, ci de ridicarea la puterea a patra,
pentru a afla momentul centrat de ordin
patru. D
s aplicm formula de
obine valoarea coeficie
de 1,39
doua i scdem valoarea 3. Va rezulta
un coef
up efectuarea calculelor, suma
ptratelor diferenelor este 684,4 iar
suma ridicrii la puterea a patra a dife-
renelor va fi 65316,59. A u c m va trebui
calcul i vom
ntului kurtosis
, ceea ce determin o distribuie
uor platicurtic. Acest lucru devine
mai evident dac aplicam formula a
icient de boltire de -1,61, putnd suspecta aceast form a distribuiei.
p
[
2
=
4
p
2
2
=
1u _
_
684,4
1u
6SS16,S9
_
4
=
4684u,Su
6SS16,S9
= 1,S9
O distribuie leptocurtic, ascuit, arat c datele sunt foarte
grupate i apropiate de medie, lotul de subieci avnd un mare
grad de omogenitate a scorurilor. Aceast distribuie nu ridic
Tabel 6.2 Calculul coeficientului de boltire
nici un fel de probleme atunci cnd trebuie s difereniem su-
biecii care obin scoruri mici sau mari. Avem ns dificulti
atunci cnd trebuie s difereniem subiecii din zona medie a
distribuiei. De exemplu, ntr-o clas de 30 de elevi, 27 obin
x
i
x
i-
m (x
i-
m)
2
(x
i-
m)
4

10 -9,6 92,16
8493,466
22 2,40 5,76
33,1776
31 11,40 129,96
16889,6
9 -10,60 112,36
12624,77
24 4,40 19,36
374,8096
27 7,40 54,76
2998,658
29 9,40 88,36
7807,49
9 -10,60 112,36
12624,77
23 3,40 11,56
133,6336
12 -7,60 57,76
3336,218
Suma 684,4 65316,59
157
Statistic aplicat n tiinele socio-umane
medii i diferen-
iaz nici o
a
i c
a tre dif dac
ac z, a ea fi c
dia cu o singur l, ci
nt ua re me
v re re d ia rezu
e ua nu difere
u, o le
o di ie n care re-
general a
curtic, este
bine n zona
ie, s facem
care-l
anuale ntre 7,9 i 8,1. Iat c, doar dou zecim
ntre aproape ntreg efectivul de elevi. Nu avem
problem cu repartizarea celorlali trei elevi. Pe aceia i vom
considera ori foarte buni, ori foarte slabi, n funcie de medi
obinut sub 7,9 sau peste 8,1. Ce ne facem ns cu cei 27 de
subieci? Suntem, iat, n imposibilitatea de a-i ierarhiza n
vreun fel. Dac presupunem c cei trei subieci au note mai
mici de 7,9, atunci cine va lua, dintre cei 27 de elevi, premiul
I, cine va lua premiul II
fi, dup cum se poate vede
imposibil. Singura variant
preciziei. Nu calculm me
sau 4 zecimale. Totui, su
de precizie este ridicol. O e
lor este leptocurtic, este o
tre subiecii de nivel medi
distribuie normal;
O distribuie platicurtic, plat
rti e dic un grad
i va pre i II. De i ar ne lua m ul I c zia
, ex m de icil, nu chiar
n est ca r put reterea
zecima cu 2, 3
sit ii n ca un ase nea nivel
alua n ca istribu ltate-
val re ce poate nia n-
iar curb ptocurtic nu este o
, este stribu
zultatele sunt foarte mp at fa de medie i in
ridicat de eterogenitate al scorurilor. Problema
acestei distribuii, n opoziie cu distribuia lepto
aceea c difereniaz greu la extreme i destul de
mediei. Va fi greu, utiliznd o asemenea distribu
diferenieri ntre elevii slabi i ntre elevii buni, dei putem di-
ferenia relativ uor elevii medii. Datorit acestui fapt, o dis-
tribuie platicurtic nu este nici ea o distribuie normal.
O distribuie normal este o distribuie mezocurtic.
Analiza unei distribuii sub aspectul normalitii este primul pas pe
facem n orice prelucrare de date. Deoarece, n funcie de rezultatul
158
Cristian Opariuc-Dan
acestei an
putem
de cerc
putem
efectele
luat p
dar, al
discut
inform
VI.4
rizeaz
Teoretic, exist
abateri stan
medie dis-
tribu
abateri s
i trei la s
lumul
ra ace
poate
norma
eaz n d
n stng
ndard
alize, vom putea alege tehnicile i procedeele statistice pe care le
folosi, aceast etap o ntlnim, de obicei, la nceputul oricrui raport
etare, imediat dup descrierea eantionului.
Dei modalitatea, simetria i boltirea se pot analiza separat, n practic
avea surpriza ca cei doi indicatori ai simetriei i boltirii s-i cumuleze
i, cu toate c separat putem aprecia o distribuie ca fiind normal,
er ansamblu vom constata c distribuia nu este normal. Exist, aa-
te tehnici de verificare a distribuiei normale, tehnici pe care le vom
a n ultimul capitol al acestui volum deoarece mai avei nevoie de unele
aii suplimentare.
Caracterizarea distribuiei normale
Afirmam, n capitolul anterior, c media i abaterea standard caracte-
pe deplin o distribuie normal.
un numr infinit de
dard la dreapta i la stnga
i. Practic, considerm c o
ie normal are un numr de ase
tandard: trei la dreapta mediei
tnga mediei, deoarece vo-
de populaie care rmne n afa-
stor limite este nesemnificativ i
fi ignorat. La o distribuie perfect
l, jumtate din rezultate se situ-
reapta mediei (rezultatele mari) i jumtate din rezultate se situeaz
a mediei (rezultate mici).
Figura 6.8 Distribuia normal
ntre o abatere standard la stnga mediei i o abatere sta
la dreapta mediei, ntlnim aproximativ 68% din populaie
(mai precis 68,28%, cu 34,13% ntre medie i o abatere stan-
dard la stnga i tot 34,13% ntre medie i o abatere standard
159
Statistic aplicat n tiinele socio-umane
la dreapta). Aceasta este zona normal, zona n care rezultate-
le pot fi considerate tipice. Dac lum, ca exemplu, coeficien-
tul de inteligen, n aceast zon se afl persoanele considera-
i la dreapta, este zona rezultatelor ac-
3,59% din populaie. Ast-
te normale sub aspect intelectual;
ntre dou abateri standard la stnga mediei i dou abateri
standard la dreapta, ntlnim aproape 95% din populaie (mai
precis 95,44% cu 47,72% ntre medie i dou abateri standard
la stnga i 47,72% ntre medie i dou abateri standard la
dreapta.). Zona ntre o abatere standard i dou abateri stan-
dard, att la stnga ct
centuate i cuprinde, fiecare, cte 1
abateri standard
ele cu un intelect mai redus, intelect
abatere standard la dreapta i dou
a, se afl persoanele cu o inteligen
;
la stnga mediei i trei abateri stan-
tlnim aproximativ 99% din popula-
u 49,87 % ntre medie i trei abateri
87% ntre medie i trei abateri stan-
zon este zona rezultatelor atipice.
tandar tan-
deficienilor mintali, cu un intelect
, a
fel, ntre o abatere standard la stnga i dou
la stnga, de afl persoan
de limit. La fel, ntre o
abateri standard la dreapt
peste medie, cei detepi
ntre trei abateri standard
dard la dreapta mediei, n
ie (mai precis 99,74% c
standard la stnga i 49,
dard la dreapta). Aceast
Zona ntre dou abateri s
dard la stnga, este zona
extrem de redus. n aceast zon, ntlnim 2,15% din popula-
ie, acelai procent ca i n zona situat ntre dou i trei aba-
teri standard la dreapta, zona celor cu o inteligen deosebit
d la stnga i trei abateri s
persoanelor supradotate. Iat c, ntre deficienii mintali i su-
pradotai ntlnim aproape ntreaga populaie, peste 99%
160
Cristian Opariuc-Dan
Mai rmne, aproximativ 1% din populaie (mai exact 0,26%).
situat fie dup trei abateri standard la stnga (0,13%), fie du-
p trei abateri standard la dreapta (0,13%). Iat i zona rezul-
tatelor aberante, zon n care gsim mai puin de 1% din po-
calcula pro
dintre
ie perfect n
100. U
aproap
se situeaz
concept n s
raport v de persoane (eantion). Oare nu
cum
gie i anum
etaloa
de baz
VI.4.1
un mi
medie
a unei distribu
ticular s
acest l
pe car al ca
aceast poziie s poat fi prezentat ntr-o manier standardizat. Acest lucru
pulaie. Dup trei abateri standard la stnga, gsim idiotul
idioilor, iar dup trei abateri standard la dreapta l gsim pe
Einstein. Iat, aceast zon este zona idioiei sau a geniilor.
Spuneam c, dac noi cunoatem media i abaterea standard, putem
babilitatea cu care un rezultat particular se ncadreaz ntr-una
aceste zone. S considerm c, figura de mai sus, reprezint o distribu-
ormal a rezultatelor unui test, la care scorurile variaz de la 0 la
n subiect care obine nota brut 64, este situat n zona medie, foarte
e de rezultatele zonei superioare, n timp ce un subiect cu nota brut 27
n zona accentuat inferioar. Iat c, astfel, ajungem la un alt
tatistic i anume la conceptul poziie a unui scor particular n
cu rezultatele unui grup reprezentati
va acest lucru seamn foarte bine cu un alt termen vehiculat n psiholo-
e termenul de etalon? Ba da, ai presupus foarte bine, chiar despre
ne este vorba. ns, pn s le aprofundm, vom aborda un alt element
i anume conceptul de note z.
Notele z i note standard derivate
Cnd am discutat de abaterea standard, am vzut c aceasta reprezint
jloc de raportare a modului n care rezultatele se mprtie n jurul
i. De asemenea, am spus c, dac cunoatem media i abaterea standard
ii, putem foarte uor s precizm probabilitatea ca un scor par-
se situeze ntr-o anumit poziie. Pentru disciplinele socio-umane,
ucru este vital, deoarece atunci cnd msurm, practic precizm poziia
e o are un subiect n raport cu o populaie de referin. Este ide
161
Statistic aplicat n tiinele socio-umane
poate fi u
dardizate. L
diferen
dard. Cu al
te
Transformarea note-
simpl i se face dup
or de ndeplinit atunci cnd avem n vedere conceptul de note stan-
a baza acestui concept stau notele z. Notele z reprezint
a dintre scorul observat i medie, n termeni de abatere stan-
te cuvinte, notele z nu sunt altceva dect distanele la care se
situeaz scorurile particula-
re n raport cu media grupu-
lui iar aceast distan es
exprimat standardizat.
Teoretic, notele z
sunt note obinute pe o
curb cu media 0 i abate-
rea standard 1. n acest caz,
o distribuie normal are
practic notele z cuprinse
ntre -3 i +3, ntre aceste
note regsindu-se peste 99%
din populaie, dup cum
observai n figura de al-
turi.
Figura 6.9 Diferite sisteme de note standard
lor obinute de ctre un subiect n note z este foarte
formula:
z =
x-x
c
(formula 6.5)
n care x reprezint nota brut, scorul obinut de ctre subiect, x barat
reprezint media eantionului cu care comparm performana subiectului iar
sigma se refer la abaterea standard a acelui eantion.
162
Cristian Opariuc-Dan
De exemplu, ntr-o coal, media elevilor unei clase la matematic es-
te de 6,25 cu o abatere standard de 3,94. Georgel a obinut, la matematic,
media 7,15. Ne intereseaz s tim dac Georgel este un elev mediu la mate-
matic, un elev bun sau un elev slab. Intuitiv, am putea spune c este un elev
dia clasei. Nu putem ti ns
um se distribuie notele celor-
e abaterea standard. Cu alte
cup Georgel n cadrul
bun, deoarece media lui este mai mare dect me
cu precizie acest lucru, deoarece nu cunoatem c
lali elevi n jurul mediei. Acest lucru ni-l spun
cuvinte, va trebui s precizm poziia pe care o o
pului de referin din care face parte, adic raportat
Acest lucru devine posibil prin calculul notei z
spune la cte abateri standard se
afl scorul su n raport cu cla-
sa. Aplicnd formula de mai
sus, observm c nota z a lui
Georgel la matematic este de
7,15-6,25
3,94
gru-
la elevii din clasa sa.
a lui Georgel, not care ne
=
0,9
3,94
= u,22. Deci
Georgel se situeaz, din punctul
de ved
matematic, la 0,22 abateri
standard fa de medie, adic n
.
Performana sa la mate
matic este, prin urmare, o pe du-se ntre medie i o
abatere
v foarte slab? Nota z
a lui Costel este 0,55. i aceast not se situeaz ntre medie i o abatere
standard la stnga de aceast dat. Iat c, n ciuda aparenelor, raportat la
ere al performanei sale la
zona punctului rou marcat pe
figura 6.10
-
rforman medie, situn
standard la dreapta, deci n zona scorurilor medii.
Spre deosebire de Georgel, Costel are media la matematic de 4,08.
Este oare Costel un elev slab, un elev mediu sau un ele
Figura 6.10 Reprezentarea poziiei unui subiect n
funcie de nota z
163
Statistic aplicat n tiinele socio-umane
perform
de probleme. Dac subiectul rezolv corect
ezolv corect, n me
Vasile
Viorel este cioban.
ana elevilor din clas, dei are media sub cinci, Costel este un elev
mediu la aceast disciplin.
Cred c intuii deja ce se ntmpl. n domeniul socio-uman, noi nu
putem niciodat s msurm ceva cu exactitate. Putem doar s comparm
rezultatul unui subiect cu rezultatul unui grup de referin. Comparaia aceas-
ta se poate realiza numai dac cunoatem media i abaterea standard a grupu-
lui de referin, n cazul n care, distribuia caracteristicii msurate n cadrul
grupului de referin este o distribuie normal.
Pentru a v clarifica mai bine acest concept, s lum un nou exemplu.
Avem un test de inteligen cu 20
o problem, primete un punct. D
te. Deci, scorul unui subiect poat
rezolv corect nici o problem, i
corect pe toate.
Avem dou persoane: Vasile,
iar Viorel, un scor de 12 puncte
subieci este mai bun? Care are un
Cei mai muli dintre dumn
vor spune: Evident c Viorel,
Poate avei dreptate. ns, iat c v
iar ciobanii r
ac nu o rezolv corect, primete zero punc-
e varia de la zero puncte, atunci cnd nu
pn la 20 de puncte atunci cnd le rezolv
obine un scor la acest test de 10 puncte
. ntrebare: putei spune care dintre cei doi
nivel intelectual mai ridicat?
eavoastr vor zmbi acum complice i mi
deoarece a rezolvat mai multe probleme.

die, 7 problem .
ia de baci deoarece nivelul su intelectual
mai dau un amnunt. Vasile este cioban
e. Lucrurile se schimb acum
poate obine linitit func
este mai ridicat n comparaie cu nivelul ciobanilor. Viorel este profesor iar
profesorii rezolv corect, n medie, 18 probleme. Fa de grupul profesorilor,
Dei exagerat, scopul acestui exemplu este acela de a v convinge c
notele brute, scorurile, nu ne spun nimic prin ele nsele. Notele brute dobn-
desc semnificaie numai n urma comparrii cu o populaie de referin. Pu-
164
Cristian Opariuc-Dan
tem afirma despre cineva c este bun sau slab numai n raport cu un reper, cu
un grup de referin. Probabil c eu sunt bun la statistic n comparaie cu
studen
dent, un etalon este fcut pe o
anumit
re menionm (Popa, 2006):
lar. Deoarece
rirea a dou numere egale are ca rezultat 1
ii crora le predau aceast disciplin i slab n raport cu unii profesori
de ai mei sau cu Spearman ori Pearson. Termenul de bun sau slab dobndete
semnificaie numai raportat la un reper.
Toate aceste informaii servesc drept suport procesului de etalonare.
Un etalon nu este altceva dect un sistem de norme, la care se raporteaz per-
formana unui individ, la o anumit sarcin. Evi
populaie iar raportnd un rezultat al unui subiect la un etalon, nu
facem altceva dect s comparm performanele acelui subiect cu performan-
ele grupului pe care a fost construit etalonul. Despre etaloane, vom discuta
ns imediat.
Notele z au i ele o serie de proprieti cu aplicabilitate practic de-
osebit, dintre ca
Media unei distribuii z este egal cu zero, afirmaie ce re-
zult din proprietatea acestui indicator de a se diminua atunci
cnd scdem o constant din fiecare scor particu
din formul rezult aceast diferen (se scade fiecare scor
particular din medie), n final media va ajunge la valoarea zero
Abaterea standard a unei distribuii z este ntotdeauna 1. i
aceast afirmaie rezult din proprietile abaterii standard.
tim c dac mprim abaterea standard la o constant, valoa-
rea acesteia se divide corespunztor. Din formul, observm
c acea constant la care mprim este chiar abaterea standard
iar mp
Notele z sunt note direct calculabile, utilizndu-se media i abaterea
standard i reprezint temelia oricrui proces de standardizare. Totui,
principalul dezavantaj al notelor z este acela c sunt puin intuitive. Trebuie
165
Statistic aplicat n tiinele socio-umane
s tim bine ce nseamn distribuia normal pentru a nelege corect semnifi-
caia acestor note. n plus, au valori pozitive i negative, ceea ce le face, ia-
ri, greu de utilizat.
Ar fi mai uor pentru noi dac n loc s folosim o scal de la 3 la 3
pentru ncadra aproximativ 99% din populaie, am folosi o alt scal, de
exempl
putea s deplasm distribuia astfel nct s nu ne mai situ-
m n z

derivate din notele z, sunt staninele (numele provine din englezescul stan-
da
dard ten), n
buie cu m
rea sta
z ale lu
tesc c
de 3,9
lei sten
u de la 1 la 10, mult mai intuitiv, deoarece se asociaz rapid sistemu-
lui colar de evaluare sau o scal de la 1 la 5, de la 1 la 9 i aa mai departe.
Este oare posibil acest lucru? Dac ne amintim de proprietile scalei de in-
terval, prezentate la nceputul acestei lucrri, vom constata c una dintre aces-
te proprieti se referea la deplasare, prin modificarea constantei de deplasare.
Notele z au o constant de deplasare zero. Dac mrim aceast constant de
deplasare, vom
ona scorurilor standardizate negative. Obinem astfel un alt sistem de
note standardizate, mai intuitiv i mai practic. Asemenea scale standardizate,
rd nine), un sistem n nou clase normalizate, sten (din englezescul stan-
zece clase normalizate, notele T sistem raportat la o distri-
edia 50 i abaterea standard 10, abateri IQ media 100 i abate-
ndard 15, etc.
Relund exemplele anterioare, ne propunem s convertim scorurile
i Georgel i Costel n stanine, sten, note T i abateri IQ. V reamin-
media elevilor clasei la matematic este de 6,25 cu o abatere standard
4 iar Georgel a obinut, la matematic, media 7,15 i Costel 4,08.
Pentru a calcula scorurile sten, vom deplasa distribuia cu media sca-
care este, evident, 5,5 iar formula de calcul va deveni:
stcn = S,S +
x-x
c
= S,S +z. (formula 6.6)
Aadar, scorul sten al lui Georgel este de 5,5+0,22, adic 5,72. Obser-
vm c poziia acestui scor nu modific punctul n care se afl Georgel pe
166
Cristian Opariuc-Dan
distribuia normal, ns scorul devine mult mai intuitiv. Media 5,75 la ma-
tematic ne spune mult mai multe dect 0,22. Scorul n stanine al lui Georgel
se calculeaz similar. Pe o scal de la 1 la 9, media este evident 5. Prin urma-
re, deplasm scala cu 5 de aceast dat i obinem 5 + 0,22 = 5,22. Obinem,
de fapt, exact acelai lucru, ns pe o scal de la 1 la 9 i nu de la 1 la 10 ca n
exemplul anterior.
Pentru notele T, avem de a face att cu o deplasare, ct i cu o com-
primare a intervalelor. Afirmam c scala T este o scal cu media 50 i aba-
terea standard 10 iar n acest caz formula de calcul a notelor T va deveni:
I = Su +1u
x-x
c
= Su +1uz. (formula 6.7)
Nota T a lui Georgel, pe o scal de la 1 la 50 va fi aadar 50 +
10x0,22, adic 50 + 2,2 ceea ce nseamn 52,2. Surpriz. Din nou, nu se mo-
dific poziia acestui scor pe curba de distribuie. La fel putem proceda i n
cazul calculului abaterilor IQ. Formula, de aceast dat va fi similar celei
pentru note T:
Ab
I
= 1uu +1S
x-x
c
= 1uu +1Sz. (formula 6.8)
n cazul nostru, rezultatul devine 100 + 15x0,22 adic 100 + 3,3 ceea
ce nseamn 103,3. Remarcm c, nici n acest caz, nu se modific poziia
subiectului pe curba de distribuie.
Iat ct de uor putem raporta performanele subiectului la performan-
ele grupulu
a exerciiu.
O alt caract tandardizate
este aceea c, putem zultatele obinute de ctre
i din care acesta face parte i care sunt semnificaiile acestei ra-
portri, indiferent de sistemul de scale standard utilizat. Calculul notelor
standardizate derivat neavoastr c e ale lui Costel vi-l lsm dum
eristic extrem de important a scorurilor s
efectua comparaii ntre re
subieci la probe diferite care folosesc ele nsele scale diferite. De exemplu,
167
Statistic aplicat n tiinele socio-umane
dac comparm performanele unui subiect la un test de inteligen, care are
60 de probleme cu performanele obinute de acelai subiect la o prob de
comprehensiune semantic, ce are 30 de probleme iar subiectul obine o not
brut la testul de inteligen de 40 iar la cel de comprehensiune semantic de
28 atunci putem oare afirma c subiectul are o inteligen mai bun n com-
paraie cu capacitatea sa de comprehensiune semantic? Categoric nu! Chiar
i la p
2
m
direct aceste dou r umitor co-
mun. Acest numitor dardizate.
t s re acetia comparau
aspectul numrului de
itemi ct i sub c u kilo-
grame de mere c rdare este complet ero-
nat i
VI.5 T
ul
menionat mai sus
distribu
rima vedere, n condiiile n care ambele teste au acelai sistem de
scorare, constatm c primul are mai multe ntrebri dect al doilea. Sunt 20
de probleme nerezolvate de subiect la testul de inteligen n comparaie cu
nerezolvate la cel d ste imposibil s compar e comprehensiune semantic. E
ezultate, mai nti trebuie s le aducem la un n
comun l reprezint notele stan
Prin urmare, va trebui s calculm notele z (sau orice alte note stan-
dardizate) ale acestui subiect la cele dou teste i apoi vom putea s compa-
rm rezultatele obinute utilizndu-se aceste note standardizate. De nenum-
rate ori mi-a fost
rezultatele subie
da vd lucrri ale studenilor prin ca
cilor la dou teste diferite att sub
el al sistemului de cotare. E ca i cum a compara do
u 2 metri de sfoar. O asemenea abo
nu duce la nici un fel de rezultat. Trebuie gsit un numitor comun pe
care l regsim sub forma acestor note standardizate.
ransformarea datelor brute
Consider c v-am convins de avantajele utilizrii notelor standardiza-
te. Totui, folosirea lor este condiionat de o distribuie normal sau foarte
apropriat de cea normal. n absena criteriului normalitii, tot demers
nu se mai susine. Am vzut c sunt destule situaii n care
ia rezultatelor nu mai este normal, putnd aprea scoruri aberante ce
duc la o asimetrie pronunat sau un eantion extrem de omogen sau extrem
de eterogen ce poate influena radical boltirea. De asemenea, prezena mai
168
Cristian Opariuc-Dan
multor vrfuri n distribuie determin nclcarea criteriului modalitii. Ce
ne facem n aceste cazuri? Vestea bun este c avem la dispoziie metode
prin care putem normaliza aceast distribuie fcnd-o utilizabil.
Am vzut deja c, prin inspectarea datelor, putem vedea i corecta
scorurile extreme rezultate din erorile de introducere a datelor. Dac aparatele
de nregistrare sunt defecte ori designul de cercetare este defectuos, nu avem
prea multe posibiliti dect reproiectarea cercetrii sau repararea aparatelor.
Totui, ce facem dac nu sunt erori de introducere a datelor, aparatele sunt
bune iar designul este n regul, ns nu am obinut o distribuie normal?
Soluia este transformarea datelor brute prin anumite procedee de
rescalare a valorilor, pentru ca noile valori s respecte condiiile de aplicare a
unor teste statistice (Sava, 2004). Dac i n urma acestor transformri distri-
buia c
az din categoria modal
transformm o distribuie bimodal ntr-una unimodal. De exemplu dac
ci i constatm c avem dou
categor
ontinu s pun probleme, vom utiliza statistici nonparametrice, re-
nunnd la prelucrrile parametrice de date.
Exist multe procedee de modificare a valorilor care s nu afecteze
semnificaia datelor, iar dintre cele mai cunoscute sunt tehnicile de normali-
zare a distribuiei.
O distribuie multimodal poate fi corectat relativ uor inspectnd
valorile modale i renunnd la un singur scor. Deoarece modul este categoria
cu frecvena cea mai mare, renunnd la un singur c
msurm greutatea unui numr de 50 de subie
ii mod: subieci cu greutatea de 78 de kilograme 10 cazuri i su-
bieci cu greutatea de 84 de kilograme 10 cazuri, eliminnd din eantion un
singur subiect care are 78 de kilograme sau 84 de kilograme, determinm
transformarea ntr-o distribuie unimodal. Desigur, nu vom mai avea 50 de
cazuri ci 49, ns este mai bine s tai un deget dect s pierzi mna.
169
Statistic aplicat n tiinele socio-umane
O distribuie asimetric sau excesiv presupune utilizarea unor teh-
nici diferite, dintre care menionm:
Folosirea mediei 5% trim este o tehnic ce utilizeaz o
si-
inei centrale;
etrice severe.
medie ajustat n care nu se ine cont de 5% dintre scorurile
aflate la extremitile distribuiei. Metoda se folosete n cazul
n care avem scoruri extreme reale. Prin acest procedeu, ele
sunt eliminate din calculul acestui indicator;
Extragerea radicalului din toate valorile distribuiei este o
tehnic folosit n special atunci cnd avem o distribuie a
metric moderat. Radicalul strnge o distribuie puternic
platicurtic i corecteaz asimetria;
Ridicarea la ptrat sau la cub este o tehnic utilizat n cazul
distribuiilor leptocurtice deoarece prin acest procedeu se m-
prtie rezultatele n jurul tend
Logaritmarea valorilor individuale i inversarea valorilor
sunt alte procedee de normalizare utilizate n cazul unor distri-
buii asim
Dup aceste prelucrri de date este necesar, n mod obligatoriu, o re-
verificare a distribuiei pentru a vedea modul n care se respect criteriile
normalitii distribuiei pe date astfel normalizate. Toate aceste operaii sunt
permise fr a afecta semnificaia iniial a datelor, dac lum n considerare
proprietile scalei de interval discutate n primul capitol.
Pentru a clarifica aceste situaii, vom considera o serie de exemple in-
tuitive propuse de F. Sava (Sava, 2004) i pe care am apreciat c ar fi util s
le reproducem aici.
170
Cristian Opariuc-Dan

Cele dou figuri de mai sus indic o asimetrie pozitiv, respectiv ne-
gativ
individ
dicalu
form tiv, dup care putem ex-
trage r
inversa date:
moderat. n primul caz, extragerea rdcinii ptrate din fiecare scor
ual va conduce la normalizarea acestei distribuii. n al doilea caz ra-
l se extrage din reflexia scorurilor. Prin operaia de reflectare, trans-
m o asimetrie negativ ntr-o asimetrie pozi
dcina ptrat.
Operaia de reflectare este una extrem de uoar i presupune practic
rea valorilor. Dac, de exemplu, avem urmtorul ir de
irul normal: 5, 9, 13, 8, 7, 19
Primul pas pe care trebuie s l facem este acela de a identifica valoa-
xim din irul de date. n cazul nostru, v rea ma aloarea cea mai mare din ir
este 19
erii
radical
irul reflectat: 15, 11, 7, 12, 13, 1
. Adugm apoi 1 la valoarea maxim i obinem valoarea 20.
La al doilea pas, vom scdea din valoarea obinut (20) fiecare scor i
vom obine irul reflectat. Constatm c aceast operaiune este similar unei
reflexii n oglind, n care stnga devine dreapta i dreapta stnga. Procedura
este necesar n cazul distribuiilor asimetric negative n vederea extrag
ului, n vederea logaritmrii sau pentru inversare.
Figura 6.11 Distribuie asimetric moderat
171
Statistic aplicat n tiinele socio-umane

O asimetrie ca cea din figura de mai sus reprezint o asimetrie sever.
n acest caz, extragerea radicalului din fiecare valoare sau din valorile reflec-
tate nu rezolv satisfctor problema. Avem nevoie, similar situaiei de mai
sus, de logaritmul natural din fiecare valoare sau, n cazul asimetriei negative,
de logaritmul natural din fiecare valoare inversat.
inversare se realizeaz folosind valorile din irul nos-
tru de date dac
VI.6 Sisteme de etal
caliti
psihom
aadar, o unitate de msur, care se folosete n acelai mod n care utilizm
Figura 6.12 Distribuie asimetric sever
n cazul asimetriilor extreme curba are un aspect de curb n J, cu
asimetrie pozitiv sau negativ. n aceast situaie nici logaritmul natural nu
ne mai rezolv problema. Vom proceda la calcularea inversului fiecrei va-
lori pentru a normaliza distribuia. Inversul unei valori l putem obine mpr-
ind 1 la fiecare valoare din irul de date. Cu alte cuvinte, inversul valorii X
este dat de
1
/
X
. Aceast
asimetria este pozitiv sau valorile din irul inversat de date
dac asimetria este negativ.
onare
Muli psihologi consider c realizarea unui etalon nseamn, de fapt,
adaptarea unei probe psihologice la specificul unei populaii. Nimic mai fals.
Etalonarea reprezint ultima etap n procesul de adaptare a unui instrument
sau de construcie a unei probe noi i nu are nici o treab cu celelalte
etrice ale unui test. Un etalon reprezint un sistem de norme prin
care putem compara rezultatele unui subiect (caz individual) cu rezulta-
tele obinute de ctre un grup reprezentativ de subieci. Un etalon este,
172
Cristian Opariuc-Dan
orice aparat de msurare. Atunci cnd msurm greutatea unei persoane,
avem valoarea acestei variabile obinut prin folosirea unui cntar. ns sem-
nificaia acestei valori de are ne raportm.
Dac o persoan are 100 de kilogram ezi, cu o greutate
peste 120 de kilograme, atunci acea persoan va fi una slab. Dac ns ace-
lai individ l comparm cu persoane de 70-80 de kilograme, o putem consi-
dera o persoan grea.
Mai delicate sunt ns lucrurile n tiinele socio-umane. Dac atunci
cnd ne referim la greutate avem totui un zero absolut iar un kilogram n-
seamn un kilogram in iinele sociale lucruri-
le nu stau c
nu va trebui s reexami-
nm to
iul. Pentru distribuii care se abat de la norma-
unui etalon este cuantilarea, utilizndu-
pinde de sistemul de referin la c
e i se raporteaz la ob
diferent despre ce am vorbi, n t
hiar aa. tii deja de ce, astfel nct nu vom mai insista asupra
acestor aspecte. n domeniul nostru, msurarea nseamn de fapt ierarhizare.
Seciunea anterioar a lmurit modul n care comparm performana unui
subiect cu performana unui grup. Nu avem cum s facem n permanen
acest lucru. Dac lucrm ntr-o ntreprindere i trebuie s evalum un strun-
gar nou angajat, atunci, pentru evaluarea acestuia,
i strungarii din ntreprindere pentru ca s comparm performana
acestuia cu performana grupului din care face parte. Ar fi absurd. Vom con-
sidera c performana grupului rmne stabil un anumit interval de timp. n
aceste condiii, examinnd la un moment dat grupul de referin, putem reine
concluziile desprinse i apoi putem compara orice nou individ cu aceste con-
cluzii. Ne referim acum tocmai la conceptul de etalon.
Etaloanele se construiesc n funcie de aspectul distribuiei datelor po-
pulaiei pe care s-a fcut stud
litate, singura metod de realizare a
se valorile percentile. Deoarece se bazeaz pe poziia valorilor n irul ordo-
nat de date, similar medianei i cuartilelor, asemenea etaloane sunt considera-
te ca fiind etaloane slabe i au o serie de limitri pe care le vom discuta. O
distribuie normal, n care media este un indicator bun al tendinei centra-
le, permite construcia unor etaloane normalizate, n uniti sigma sau
173
Statistic aplicat n tiinele socio-umane
folosindu-se notele z, mult mai precise i mai utile n comparaie cu etaloa-
nele bazate pe percentile.
nainte de a intra n detalii tehnice referitoare la construcia unui eta-
lon, s menionm cteva criterii ce indic un etalon bun, precum i aspectele
pe care le urmrim atunci cnd ntr-o prob psihologic ni se ofer un aseme-
nea sistem de norme.
Un etalon bun este un etalon construit pe un numr suficient de
mare de persoane. Deoarece scopul unui etalon este acela de a
compara un caz individual cu o populaie de referin, aceast po-
pulaie de referin trebuie s includ un numr suficient de mare
, eantionul normativ
de subieci astfel nct s fie reprezentativ. Cunoatem deja pro-
blemele pe care le poate pune un eantion redus ca dimensiuni.
Din nefericire acestea nu sunt singurele. Exist i alte aspecte pe
care le vom discuta ulterior. Un numr mic de persoane selectate
n eantionul pe baza cruia se construiete etalonul numit i
eantion normativ duce la o reprezentativitate sczut a acestuia.
Comparnd apoi un subiect cu acest eantion, avem toate ansele
s ajungem la concluzii complet eronate. Un eantion prea mare
crete considerabil costul etalonrii fcnd cercetarea extrem de
scump. Trebuie astfel gsit un optim ntre numrul subiecilor in-
clui n eantionul normativ i reprezentativitatea acestuia. Un eta-
lon bun este un etalon construit pe un numr de 250-300 de su-
bieci. Se accept, n anumite situaii i etaloane construite pe mai
puin subieci dac acestea sunt specifice unui anumit grup (de
vrst, profesional, clinic etc.). Etaloanele testelor profesionale se
construiesc pe mii de subieci. De exemplu
pe care a fost etalonat chestionarul 16PF de ctre Pitariu i Iliescu
a cuprins cca. 3000 de subieci de pe ntreg teritoriul Romniei;
174
Cristian Opariuc-Dan
Un etalon bun este un etalon adaptat specificului probei psiho-
logice i a condiiilor de evaluare. Un etalon pe populaie gene-
ral are o valoare limitat ntr-un scop specific, spre exemplu ntr-
o uzin. De aceea se recomand efectuarea de etaloane specifice
atunci cnd situaia o impune;
Un etalon bun are un numr suficient de mare de clase care s
ase: buni, medii i slabi, doar c i n acest caz
psihologic
ata
de
ma
obliga
le-a
me
mi
for
poat diferenia subiecii. Un etalon cu dou clase, nu ne este prea
util. O mprire a subiecilor n buni i slabi este rigid i fr
o mare valoare informativ. Ceva mai bine ar sta lucrurile dac am
avea trei cl
vom avea o ncadrare oarecum forat a subiecilor n cele trei cla-
se. Putem discuta de un etalon cu o capacitate acceptabil de a di-
ferenia subiecii de la cinci clase n sus. La cinci clase vom avea
urmtoarele niveluri: foarte slab, slab, mediu, bun, foar-
te bun, niveluri ce permit ordonarea mai fin a subiecilor. Un
numr prea mare de clase ns poate crea confuzii iar o asemenea
precizie devine, din nou, exagerat. n psihologie se utilizeaz, n
general, etaloanele n cinci clase, n apte clase, n nou clase sau
n unsprezece clase.
De multe ori, atunci cnd un psiholog primete i utilizeaz o prob
, nu i pune probleme asupra etalonului furnizat i l accept ca
re. Mai mult, unele etaloane sunt pur i simplu scrise de mn pe o bucat
hrtie, circul ntre psihologi, iar acetia le accept necondiionat. Nimic
i eronat. Nu uitai c etalonul este unitatea noastr de msur. Avem
ia s obinem informaii legate de construcia etaloanelor, cine i cum
fcut, deoarece numai n acest fel vom putea avea ncredere n instru-
nt i vom trage concluzii diagnostice pertinente. De fiecare dat cnd pri-
i un etalon, acesta trebuie s conin, n mod obligatoriu, urmtoarele in-
maii:
175
Statistic aplicat n tiinele socio-umane
Structura eantionului pe care s-a realizat etalonul, sub as-
pectul variabilelor de eantionare. Etalonul este realizat pe po-
avem un etalon realizat pe copii ntre 10 i 14 ani, cum oare l
portan. Ne intereseaz s tim dac distri-
buia a fost normal sau dac s-au aplicat metode de normali-
pulaie general sau pe subieci care fac parte dintr-o anumit
categorie? Un etalon realizat pe studeni sau pe elevi de liceu
va avea o valoare mai mult dect discutabil ntr-o uzin chi-
mic. Care este vrsta i genul biologic al subiecilor? Care es-
te distribuia acestor variabile n structura eantionului? Dac
vom putea folosi n studiile asupra btrnilor? Nu exist o re-
gul asupra variabilelor de eantionare utilizate la construcia
unui etalon. n general se folosete vrsta, sexul, nivelul de
colarizare. Indiferent de variabilele folosite de ctre realizato-
rul etalonului, acesta trebuie s le prezinte. Nu ne putem mul-
umi doar cu sintagma etalonul a fost realizat pe populaie
general. Trebuie precizat i structura acestei populaii.
Numrul subiecilor din eantion va trebui de asemenea bine
precizat. Un etalon realizat pe 100 de subieci nseamn cu to-
tul altceva n comparaie cu un etalon realizat pe 1000 de su-
bieci.
Distribuia rspunsurilor subiecilor la funcia investigat
are o deosebit im
zare a distribuiei, caz n care trebuie prezentate ambele distri-
buii. Suntem interesai s aflm dac, de exemplu, n eantion
majoritatea persoanelor au rezolvat corect 18 sarcini din 20
sau, din contra, au realizat corect 6 sarcini din 20. Acest lucru
ne informeaz asupra nivelului populaiei cu care vom compa-
ra rezultatele cazurilor individuale;
176
Cristian Opariuc-Dan
Metoda de etalonare folosit se stabilete n funcie de dis-
tribuia rezultatelor. La o distribuie normal vor fi folosite, n
VI.6.1
lului m
unui
zate ns
abat d
or asemenea etaloane se realizeaz dup urmtorul al-
goritm
Se calculeaz scorul corespunztor procentului pentru fiecare
limit de clas.
general, unitile sigma sau clasele normalizate. n cazul unei
distribuii care se abate de la normalitate, se utilizeaz sistemul
de etaloane bazat pe valorile percentile;
Data la care a fost realizat etalonul ne furnizeaz informaii
despre momentul n care a fost construit. Datorit dinamicii
sociale i a noilor achiziii tehnologice, atitudinile, normele
sociale se modific rapid, astfel nct un etalon devine depit
ntr-un timp destul de scurt. Un adolescent de astzi, examinat,
de exemplu, cu Inventarul Multifazic de Personalitate Minne-
sota, ar intra cu uurin n normele patologice din anii 1950.
Un etalon, n general, se reactualizeaz dup 5-6 ani.
Etaloane n cuantile
Au la baz valorile percentile i se stabilesc ntr-un mod similar calcu-
edianei sau al cuartilelor. Bazndu-se pe poziia valorilor n cadrul
ir ordonat de date, aceste etaloane nu au precizia celor n clase normali-
au avantajul c pot fi construite foarte uor i pe distribuii care se
e la distribuia normal.
Construcia un
:
Se stabilete minimum i maximum dintr-o distribuie;
Se nscriu toate valorile situate ntre minimum i maximum;
Se stabilesc frecvenele absolute i cumulate;
Se alege numrul de clase al etalonului;
177
Statistic aplicat n tiinele socio-umane
S lum, spre exemplu, urmtorul ir de date, care reprezint nli-
nor subieci exprimat n centimetri: 182, 175 mea u , 174, 189, 177, 177, 180,
173, 188, 171, 184, 192, 180, 172, 177, 193, 184, 192, 172, 177, 174, 171,
172, 1
ili frecvenele absolu-
clas se
vor afla 20% dintre subieci, cu nlimea cea
re.
Atunci x nseamn 20%
ind 30 cu 20 i mprind la 100. Deci
c-
venelor cumulate, valoarea cea mai aproape de
6, limea cea mai
mi i 172. n prima clas
Tabel 6.3
Val
Diagrama
79, 185, 179, 173, 172, 179, 188
n acest exemplu, minimul este 171 iar maximul este 193. Acum, vom
ordona cresctor toate valorile situate ntre mi-
nim i maxim i vom stab
Realizarea unui etalon
n cuantile
te i cumulate.
Ne propunem s construim un etalon n
cinci clase (cvintile). tim c un asemenea eta-
lon mparte lotul de subieci n procente de cte
20%. n prima clas se vor afla 20% dintre su-
bieci, cei cu nlimea cea mai mic, urmai
fiind de ali 20% dintre subieci, cu nlime
mai mare i aa mai departe. n ultima
oare
n linii
f f
c

2 2 171 ||
mai ma
Pentru prima clas, vom aplica regula
de trei simpl, astfel:
Dac 30 nseamn 100%
Din cte tim, l putem afla pe x nmul-
x=(3020)/100=6.
Cutm acum n tabel, n coloana fre
valoare corespunztoare primilor 20% dintre subieci, cu n
c. Observm c valoarea 6 corespunde chiar cote
172 |||| 4 6
1 7 173 |
2 9 174 ||
175 | 1 10
0 10 176
4 14 177 ||||
0 14 178
179 ||| 3 17
180 || 2 19
181 0 19
182 | 1 20
183 | 1 21
184 || 2 23
185 | 1 24
186 0 24
187 0 24
188 || 2 26
189 | 1 27
190 0 27
91 0 27 1
92 || 2 29 1
193 | 1 30
178
Cristian Opariuc-Dan
vom
acest l 173. Acest lucru nseamn c n prima clas
ificare subiecilor cu valori ale carac-
teristic
u u
Pentru a doua clas,
t de 40% d
N a valoare e e
apropiat scor cu fre n cu
in le , 173 175.
e 18 pentru clasa a treia, corespun-
z
tor scorului 186. Avnd
reperele c etalo-
nul sub forma unui tabel ca cel de mai sus.
La distribuirea acestui etalon, nu vom uita s an-
tionului normativ, d ri ri
m i, medianei, m u
d onare folosit, c n
abe Etalon n cl
Clasa Semnifica
include subiecii cu nlimea cuprins ntre minim i 172. n general,
ucru se scrie i astfel <
vom include toi subiecii cu o nlime mai mic sau egal cu 172. n eanti-
onul normativ am avut minimul egal cu 171, aceasta fiind cea mai mic nl-
ime din eantion. n practic putem oricnd gsi un subiect cu o nlime de
169. Prin urmare, prima clas nu o vom scrie, n etalon, de forma 171 172
ci < 173, pentru a asigura un loc n clas
ii mai mici dect minimul distribuiei eantionului normativ. Aceast
ltima clas.
aplicm aceeai regul de trei simpl, de data
in eantion:
regul este valabil i pentr
aceasta pentru un procen
Dac 30 nseamn 100%
Atunci x nseamn 40%
12. n tabelul frecvenelor cumulate, cel mai
mulat 12 este 175. Clasa a doua va avea, ca
n mod similar procedm pentru
calcularea celorlalte repere i obinem
valoril
ia
ou d vin
cve a
terva de clas
tor scorului 179, i 24 pentru clasa a
patra, corespunz
laselor, putem acum scrie
includem structura e
ist buia scoru
edie od lui
e etal n azul
T l 6.4 5 ase
Scoruri
< I F te scunz 173 oar i
17 75 II S z 3 1 cun i
17 79 III M i 6 1 edi
18 86 IV n i 0 1 al
> 186 V F te li oar na
lor la variabila nlime cu precizarea
i abaterii standard i informaii despre sistemul
ostru n cvintile.
179
Statistic aplicat n tiinele socio-umane
Dac ai fost ateni, ai observat deja o serie de limitri ale acestui eta-
lon. n primul rnd, intervalele inegale. Dac, teoretic, nlimea minim a
unui om poate fi, s spunem, 150 de centimetri iar nlimea maxim 220 de
centimetri, atunci remarcm numrul diferit de valori din fiecare clas. n
prima clas putem include subiecii de la 150 de centimetri pn la 173 de
centimetri, deci 23 de valori diferite. n a doua clas includem subiecii cu
nlimea cuprins ntre 173 i 175, deci doar 3 valori. n clasa a treia gsim 5
valori posibile, n clasa a patra 7 valori iar n ultima clas 33 de valori. Iat
c, un asemenea etalon difereniaz inegal subiecii, aceasta fiind i principa-
la sa limit.
n al doilea rnd, dac avem o distribuie foarte omogen, nu mai pu-
tem diferenia aproape deloc utiliznd un asemenea etalon, deoarece interva-
lele de
la nivelul acestora intervalele
sunt aparent egale.
Exerciiu:
clase vor avea valori apropiate. Iat doar dou motive pentru care pre-
ferm utilizarea claselor normalizate, deoarece
Realizai, folosind acelai sistem de etalonare, un etalon n decile (10
clase) i precizai problemele ntmpinate. Explicai situaia aprut.
VI.6.2 Etaloane normalizate
realiza
i u es
realizm emenea
vom ea za s con
in teo istri
o aberaie.
Aceast metod de re a etaloanelor se bazeaz pe distribuia
pectarea criteriului normalitii. Dac vom
etalon utiliznd o distribuie care nu este
statm c anumite intervale depesc chiar
buie a variabilei noastre. De exemplu, n
cazul nlimii subiecilor, s-ar putea s ntlnim, n prima clas, subieci cu
nlimea cuprins ntre 30 i 5 centimetri ceea ce reprezint
normal pre up s ne, evident, r
ncerca s un as
normal, av surpri
i amplitud ea retic de d
180
Cristian Opariuc-Dan
Dac distribuia scorurilor la variabila studiat este o distribuie
gaussian (normal), atunci putem folosi un etalon n clase normalizate, dato-
rit ava
gura alturat). S consi-
derm,
litudinea de variaie a acestui set de date este situat ntre
un minim de 20 i un maxim de 39 de ani, media este de 29,33 ani iar abate-
rea standard este de 5,52 ani. Aceste scoruri se distribuie normal i putem
constru
le for-
mate de una i dou abateri standard n jurul mediei. Prima clas va ncepe de
la minim i se va finaliza la dou abateri standard n stnga mediei. Dou
abateri standard nseamn 2 x 5,52 = 11,04. Dac scdem din medie valoarea
11,04, obinem reperul pentru limita primei clase. Deci, 29,33 11,04 =
18,29 ani, rotunjit 18 ani. Prima clas, care cuprinde 2,14% din populaie,
este situat ntre 0 ani i 18 ani i reprezint subiecii cu vrst foarte mic. A
doua clas se situeaz ntre 2 abateri standard i 1 abatere standard n stnga
mediei i cuprinde 13,59% din populaie. Dac scdem din medie o abatere
standard, obinem limita superioar a celei de-a doua clase. Prin urmare,
ntajelor nete pe care le prezin-
t un asemenea sistem de etalonare.
Cel mai simplu etalon n clase
normalizate este reprezentat de unit-
ile sigma, n care folosim doar media
i abaterea standard. Cu ajutorul aces-
tor indicatori putem construi un eta-
lon n 3, 5 i 7 clase normalizate, lu-
nd n calcul 1, 2 sau 3 abateri stan-
dard (vezi fi
de exemplu, urmtoarele date,
reprezentnd vrsta unor subieci ex-
primat n ani: 35, 20, 21, 24, 29, 28,
29, 29, 24, 31, 26, 20, 38, 37, 38, 29, 24, 26, 29, 26, 24, 37, 30, 35, 24, 32,
31, 34, 39, 31. Amp
Figura 6.13 Distribuia normal
i un etalon n clase normalizate. Pentru a construi un etalon n cinci
clase normalizate folosind unitile sigma, va trebui s lum intervale
181
Statistic aplicat n tiinele socio-umane
29,33 5,52 = 23,81 ani, rotunjit 24 de ani. A doua clas va include subiecii
cu vrs
e
ani. Co
pulaie.
lai
eai
uia
date
ativ,
alo-
se n uniti sigma.
ta cuprins ntre 19 i 24 de ani, subiecii tineri. Clasa a treia, clasa
medie, cuprinde 2x34,13% din populaie, adic 68,26% din populaie i are
ca limite o abatere standard n stnga mediei i o abatere standard n dreapta
mediei. Prin urmare, a treia clas va avea ca limite de interval 25 de ani i
29,33 + 5,52 = 34,85, rotunjit 35 de ani. Clasa a patra, care cuprinde 13,59%
din populaie, are ca limit inferioar 36 de ani i ca limit superioar dou
abateri standard n dreapta mediei, 29,33 + 11,04, adic 40,37, rotunjit 40 d
nstatm c deja am ieit din amplitudinea distribuiei noastre, ceea ce
ne face s suspectm o uoar asimetrie. n realitate, numrul redus de su-
bieci a determinat aceast situaie. n sfrit, clasa a cincia cuprinde subiecii
peste 40 de ani i conine 2,14% din po
Etalonul poate fi scris n ace
mod ca i etalonul n cvintile i are ace
semnificaie. Evident c, la distrib
acestui etalon va trebui s furnizm
legate de structura eantionului norm
distribuia variabilei i sistemul de et
nare folosit, n cazul nostru n cinci cla
Exerciiu:
Realizai un etalon, n uniti si
Tabel 6.5 Etalon n 5 clase
Scoruri Clasa Semnificaia
< 19 I Foarte tineri
19 24 II Tineri
25 35 III Medie
36 40 IV Maturi
> 40 V Foarte maturi
gma, n trei clase normalizate n uni-
ti sigma. Pentru trei clase normalizate s f d n olosete o abatere standar
dreapta i n stnga mediei.
Etaloanele n clase normalizate nu sunt altceva dect derivaii ale
etaloanelor n uniti sigma i se bazeaz pe transformarea notelor z n alte
categorii de note. Algoritmul de calcul este oarecum similar celui utilizat n
realizarea etaloanelor n uniti sigma i se bazeaz pe fraciuni de uniti
sigma.
182
Cristian Opariuc-Dan
Astfel, un etalon n cinci clase normalizate are ca fraciune ale lui z
valoarea
z
/
2
iar clasele devin:
I Min -
3z
/
2
6,7% din populaie
II -
3z
/
2
-
z
/
2
24,2% din populaie
III -
z
/
2

z
/
2
38,2% din populaie
IV
z
/
2

3z
/
2
24,2% din populaie
V
3z
/
2
Max. 6,7% din populaie
Un etalon n apte clase normalizate are ca fraciuni ale lui z valoarea
z
/
3
iar clasele devin:
I Min -
5z
/
3
4,8% din populaie
II -
5z
/
3
-
3z
/
3
11,1% din populaie
III -
3z
/
3
-
z
/
3
21,2% din populaie
IV -
z
/
3

z
/
3
25,8% din populaie
V
z
/
3

3z
/
3
21,2% din populaie
VI
3z
/
3

5z
/
3
11,1% din populaie
VII
5z
/
4
Max. 4,8% din populaie
Un etalon n nou clase normalizate (stanine) are ca fraciuni ale lui z
valoarea
z
/
4
iar clasele devin:
I Min -
7z
/
4
4,0% din populaie
II -
7z
/
4
-
5z
/
4
6,6% din populaie
III -
5z
/
4
-
3z
/
4
12,1% din populaie
IV -
3z
/
4
-
z
/
4
17,5% din po
V -
z
/
z
/ 19,6% din po
pulaie
4 4
pulaie
n popula
n p
p
p
n lte cla no te lu-
le ma ate ste
, distribuie cu media 2 i abaterea stan-
5,5 rezultnd clase de la 1 la 10;
VI
z
/
4

3z
/
4
17,5% di
VII
3z
/
4

5z
/
4
12,1% di
VIII
5z
/
4

7z
/
4
6,6% din
IX
7z
/
4
Max. 4,0% din
n mod similar putem construi etaloa
nd ca referin notele z. Astfel, printre ce
normalizate putem meniona:
ie
opulaie
pulaie o
opulaie
e i n a se rmaliza
i uzit si me de clase
Sten (standard ten)
dard
183
Statistic aplicat n tiinele socio-umane
Stanford-Binet, distribuie cu media 100 i abaterea standard
16;
Notele T, distribuie cu media 10 i abaterea standard 50 re-
Army General Clasification,
ie cu media 500 i
ncercm construirea
182, 175, 174, 189, 177, 177, 180, 173, 188,
, 1 , 177, 193, 184, 192,
, 1 , 179, 185, 179, 173,
aminti c aceast dis-
bui centimetri cu o abatere
a etri.
unui asemenea etalon. Cea mai simpl metod
const n utilizarea valorilor procentuale cores-
punztoare fiecrei clase, ntr-un mod identic
cu cel descris la construirea etaloanelor n cuantile.
Vom relua alturat tabelul distribuiei nlimii celor 30 de subieci cu
precizarea frecvenelor absolute i cumulate. Prima clas, cea cu scorurile
zultnd clase de la 1 la 100;
Wechsler (abateri IQ), distri-
buie cu media 100 i abaterea standard 15;
Tabel 6.6 Etalon n clase norma-
lizate
Valoare
Diagrama
n linii
f f
c

distribuie cu media 100 i abaterea standard
50;
Scala de aptitudini generale
pentru colegiu, distribu
abaterea standard 100;
Haidei acum s
unui etalon n cinci clase normalizate folosind
datele corespunztoare nlimii subiecilor
17 84, 192, 180, 172 1
172 77, 174, 171, 172
172, 179, 188. Ne putem
tri e are media 183,2
stand rd de 5,23 centim
Exist mai multe metode de construire a
171 || 2 2
172 |||| 4 6
173 | 1 7
174 || 2 9
175 | 1 10
176 0 10
177 || 4 14 ||
0 14 178
179 ||| 3 17
180 || 2 19
181 0 19
182 | 1 20
183 | 1 21
184 || 2 23
185 | 1 24
0 24 186
0 24 187
188 2 26 ||
189 | 1 27
190 0 27
191 0 27
192 || 2 29
193 | 1 30
184
Cristian Opariuc-Dan
cele m regula de trei simpl,
dac 3 bieci nseamn 6,7%.
Vom avea astfel (6,730)/100=210/ um am procedat i la
etalonu belu ulate valoarea cea mai
apropia e 2 e es oare, nlimea de 171
de cent ii cu o nlime mai mi-
c sau egal cu 171 centimetri.
soane nseamn 100%, cte persoane nseamn
30
vena cum doua clas va cuprinde
subiec
tru a treia clas va fi situat la 30,9+38,2=69,1. Analog,
av
treia clas
Pentru a patra clas vom avea 69,1+24,2=93,3 iar reperul de clas va
tul frecvenei cumulate de (93,330)/100=27,99.
valoare este 191 de centimetri. Clasa a patra va cuprinde subiecii cu
n ea ntre 184 i 191 de centimetri.
Evident, pen a clas nu e nevoie s mai calculm nimic.
Aceast c va con e bieci cu nlimea mai mare de 191 de centimetri.
Etalonul se scrie la fel ca un etalon
n cuantile i are aceeai semnificaie. Nu
uitai s inei cont de regulile elaborrii
unui etalon n momentul n care intenio-
nai s-l folosii sau s-l distribuii.
abe .7 Etalon n cl
Clasa Semnificaia
ai mici conine primii 6,7% din eantion. Prin
0 de subieci nseamn ntregul eantion, ci su
100=2,1. La fel c
l n tile, cutm n t l frecvenelor cum cvin a
t d ,1. Aceast valoar te chiar prima val
imetri. Prima clas va cuprinde aadar subiec
Urmtoarea clas conine nc 24,2% din populaie. Reperul de clas
va fi situat aadar la 6,7+24,2=30,9%. n continuare aplicm din nou regula
de trei simpl. Dac 30 de per
,9%. Vom avea (30,930)/100=9,27. Valoarea cea mai apropiat de frec-
ulat 9,27 este 174 de centimetri. Cea de-a
ii cu nlimea cuprins ntre 172 i 174 de centimetri.
Reperul pen
em (69,130)/100=20,73 iar reperul de clas va fi 183 de centimetri. A
cuprinde subiecii cu nlimea ntre 175 i 183 de centimetri.
fi valoarea situat n drep
Aceast
lim
tru ultim
las in su
T l 6 5 ase
Scoruri
I F te nzi 171 oar scu
17 4 II Scunz 2 - 17 i
17 83 III M i 5 1 edi
18 91 IV n i 4 1 al
> 191 V F te li oar na
185
Statistic aplicat n tiinele socio-umane
V An liza dis i iei
Dup aborda ntul
ap rii practice a cun nelo
date efectuat n SPSS. Vom
la nceputul acestui volu date IQ.sav.
N propunem analizm m
te ei 0 de subie l
Etapele le ti e ze opiunea De-
scri
entru a comunica programului
(abaterea standard, amplitudinea distribuiei, minimul i maximul)
vom in
ebuie s le
execute.
Figura
I.7 a tr bu i realizarea etaloanelor n SPSS
retic a distribuiei normale, a venit mome rea teo
lic oti r dobndite prin analiza unei distribuii de
utiliza aceeai baz de date pe care am creat-o
aza de m, b
e s odul n care se distribuie scorurile obinu-
riabila iq (Coeficientul de inteligen).
Vom selecta din meniul Analy
de c 3 ci a va
i d ja.
ptive Statistics i apoi
Frequencies. Apare cunoscuta caset de
dialog, de unde vom include spre analiz
variabila iq.
Desigur, vom accesa apoi butonul
Statistics p
SPSS ce fel de statistici s calculeze.
Alturi de indicatorii tendinei cen-
trale (media, mediana i modul) i de cei ai
dispersiei
6.14 Includerea variabilei
spre analiz.
clude i cei doi indicatori ai distribuiei (Skewness i Kurtosis), pentru
a putea analiza forma acestei distribuii i
a decide dac distribuia poate fi conside-
rat sau nu o distribuie normal.
Dup selectarea adecvat a acestor
elemente, putem apsa butonul Continue
i revenim la fereastra iniial a selectrii
variabilelor. n acest moment, SPSS a
memorat operaiunile pe care tr
Figura 6.15 Configurarea inventarului
statistic de baz
186
Cristian Opariuc-Dan
Este uneori util s afim i un grafic al distribuiei datelor noastre.
Pentru aceasta putem accesa butonul Charts i se va deschide fereastra de
definire a graficelor pentru setul de date.
Aceast fereastr o cunoatem destul
de bine din capitolele anterioare. Motivul
pentru care am abordat-o din nou este acela
nt), ba mai mult, profesori univer-
reprezentarea variabilelor continui printr-un asemenea procedeu. O reprezen-
tare tur se face
ina nc s
lori car variabil
enu ol l subiec
% f luri iar
asupra datelor.
sind acest
cu bare p
c, pentru a reprezenta grafic anumite date,
trebuie s facem nite precizri suplimenta-
re.
De nenumrate ori mi-a fost dat s
vd studeni care reprezint o variabil con-
tinu printr-o diagram de structur (grafic
tip plci
Figura 6.16 Alegerea graficului
sitari de psihologie experimental, coordo-
natori de licen, care solicit studenilor
entru reprezentarea
datelor
prin diagram de struc n cazul unor date nominale sau cel
vedem compoziia datelor i cnd num-
a nu este prea mare. Este normal s repre-
ilor printr-o plcint, deoarece vorbim n
emei. Variabila are doar dou nive
mult ord le u at i cnd dorim
rul de va pe e le ia
zentm g l bi ogic a
acest caz de X% brbai i Y
aceast reprezentare ofer indicii clare asupra compoziiei unui eantion. Este
din nou normal s reprezentm prin plcint gradele didactice dintr-o univer-
sitate deoarece variabila are cinci grade de intensitate. Este ns absurd s
reprezentm grafic prin plcint vrsta unor subieci, variabil continu, cu o
infinitate de valori. Un asemenea grafic nu ne spune nimic, ci, din contra,
induce distorsiuni care ne creeaz o imagine fals
Foarte muli psihologi experimentaliti, care au rutin n analiza date-
lor, reprezint o variabil continu prin histogram, deoarece folo
187
Statistic aplicat n tiinele socio-umane
proced
Unii chiar s
acestei curb
dem
comp structur, ns probabil v
aminti
adev
s
avantajul estimrii vizuale a curbei de
n nici
bare iar
a
ulterior ambele tipuri de grafice i vom etiza-
re a gr s prezinte i un aspect elegant.
Indiferent de tipul de gra
din nou butonul Continue pen
moment, toate configurrile fiin
butonul OK pentru a comunica programului SPSS s efectueze analiza.
eu SPSS ofer o metod de estimare grafic a curbei de distribuie.
eta distribuia datelor dup aspectul grafic al
tistica este totui o disciplin matematic iar
cu imagini i poezii. Nu este att de grav n
n diagrame de
e rezum la a interpr
e s fim serioi, sta
onstraiile se fac cu cifre, nu
araie cu reprezentarea pri
i de faptul c histograma reprez
rat c SPSS efectueaz auto
care le alege singur. Acesta nu e
Prin urmare, pentru a rep
int datele grupate n intervale. Este
mat o grupare a acestor date n intervale pe
ste ns un motiv n condiiile n care dorim
avem o viziune analitic a scorurilor.
rezenta grafic o
variabil continu, atunci cnd discutm despre
distribuie, vom prefera graficul cu bare, care ne
ofer o viziune fin asupra modului n care
se distribuie sau graficul tip histogram
prezint datele ntr-un mod mai g
da
rosier, ns
tele
, care
are
distribuie.
ructu-
cestea
ezentare al unui grafic cu
ea
nva cteva m
Figura 6.17 Alegerea h
gramei pentru reprezentarea
datelo
un caz nu vom utiliza diagrame de st
r sau alte tipuri de diagrame, chiar dac a
arat frumos.
n figura 6.16 am ales modul de repr
n figura 6.17 am optat pentru reprezentar
isto-
r
prin histogram. Vom analiz
etode de cosm
aficelor astfel nct imaginile noastre
fic ales (cu bare sau histogram), vom apsa
tru a reveni la fereastra iniial. n acest
d realizate, nu ne rmne dect s apsm
188
Cristian Opariuc-Dan
n cteva secunde va fi afiat fereastra de rezultate (Output) n care
regsim prezentate informaiile solicitate.
n aceast fereastr cel
mai important tabel este tabelul
Statistics, numit i inventarul
statistic de baz sau indicatorii
statistici de start. Utiliznd
numai acest tabel putem decide
dac distribuia noastr este sau
nu este o distribuie normal.
Cred c v mai amintii condii-
ile pe care trebuie s le ndepli-
neasc o distribuie pentru a
putea fi considerat ca fiind normal. O distribuie normal este o distribuie
unimodal, simetric i mezocurtic.
Unimodalitatea este uor de observat. SPSS raporteaz un mesaj de
genul Multiple mod exist. The
smallest value is shown, afiat
la subs
ste bimodal, trimodal sau prezint
olul tabelului cu o not,
de obicei a n dreptul valorii mo-
dului. Acest mesaj ne comunic
faptul c programul a identificat
mai multe valori mod i o afiea-
z pe cea mai mic.
n inventarul statistic al-
turat, unde am analizat distribu-
ia acelorai 30 de subieci n
funcie de variabila vrst, avem un exemplu de distribuie multimodal. Nu
putem ti, deocamdat, dac distribuia e
Statistics
Coeficientul de inteligenta
30
0
111,33
108,50
124
8,511
,413
,427
-1,384
,833
24
100
124
Valid
Missing
N
Mean
Median
Mode
Std. Deviation
Skewness
Std. Error of Skewness
Kurtosis
Std. Error of Kurtosis
Range
Minimum
Maximum
Statistics
Varsta subiectilor
30
0
29,33
29,00
24
a
5,523
,116
,427
-,878
,833
19
20
39
Valid
Missing
N
Mean
Median
Mode
Std. Deviation
Skewness
Std. Error of Skewness
Kurtosis
Std. Error of Kurtosis
Range
Minimum
Maximum
Multiple modes exist. The smallest value is shown
a.
Tabel 6.8 Inventarul statistic de baz
Tabel 6.9 Inventarul statistic de baz
189
Statistic aplicat n tiinele socio-umane
mai mu
se reg

alt val
omalii (n
ilor la variabila coeficient de inte-
t caz vom trece la urmtoarea eta-
p i an
Simetria sau oblicitatea este da
Skewness. La modul teoretic, acest indicator
tribuie perfect simetric. O asemenea valoar
regsit n practic. ntotdeauna, acest indicato
fie n sens negativ distribuie asimetric n
mari, fie n sens pozitiv distribuie asimetri
ruri mici.
lte valori ale modului. Tot ceea ce tim est
mod, n cazul nostru, reprezint 24 de ani.
buiei
a vedea
cuta
doilea
zultat
nostru
e c cea mai mic valoare
Pentru a afla tipul distri-
sub aspectul modalitii i
toate valorile mod, vom
n distribuia statistic (al
tabel din fereastra de re-
e) l
ob 4
sete n cinci cazuri (co-
valoarea 24. n cazu
servm c valoarea 2
loana Frequency). Nu trebuie
acum dect s vedem ce valori,
mai mari de 24 au aceeai frec-
ven. Observm c valoarea 29 de ani are aceeai frecven i c nu exist o
oare cu aceast frecven maxim. Aadar, distribuia vrstei subieci-
lor este o distribuie bimodal, cu modul de 24 i 29 de ani. Strict vorbind, o
distribuie multimodal nu este o distribuie normal. Analiza noastr ar tre-
bui s se opreasc aici i s folosim tehnici de eliminare a acestei an
cazul nostru renunnd la un subiect care are vrsta de 24 sau 29 de ani).
Totui, distribuia scorurilor subiec
ligen este o distribuie unimodal. n aces
ume analiza simetriei.
t de valoarea indicatorului
are valoarea zero pentru o dis-
e este ns aproape imposibil de
r va avea valori diferite de zero,
egativ cu tendine ctre scoruri
c pozitiv cu tendine ctre sco-
Varsta subiectilor
2 6,7 6,7 6,7
1 3,3 3,3 10,0
5 16,7 16,7 26,7
3 10,0 10,0 36,7
1 3,3 3,3 40,0
5 16,7 16,7 56,7
1 3,3 3,3 60,0
3 10,0 10,0 70,0
1 3,3 3,3 73,3
1 3,3 3,3 76,7
2 6,7 6,7 83,3
2 6,7 6,7 90,0
2 6,7 6,7 96,7
1 3,3 3,3 100,0
30 100,0 100,0
20
21
24
26
28
29
30
31
32
34
35
37
38
39
Total
Valid
Frequency Percent Valid Percent
Cumulative
Percent
Tabel 6.10 Identificarea valorilor mod
190
Cristian Opariuc-Dan
Exist mai multe metode de verificare a asimetriei, prin intermediul
crora putem decide dac o distribuie poate sau nu poate fi considerat sime-
tric.
Una dinte metode, valabil pentru eantioane mari (peste 200 de su-
bieci) este reprezentat de reperul
rile pentru Skewness mai mici de
trie clar, negativ sau pozitiv.
0,41 iar eantionul este de doar 3
considera distribuia scorurilor ca
s-a respectat cerina unui eantion m
O alt metod (Sava, 200
mici, se bazeaz pe c
propu Valo-
-0,80 sau mai mari de 0,80 indic o asime-
n cazul nostru, valoarea Skewness este de
0 de persoane. Prin aceast metod putem
fiind o distribuie simetric, chiar dac nu
are.
4) valabil n cazul eantioanelor medii i
alcului cotei z a indicelui de oblicitate Skewness. Cu
alte cuv dicelui de oblicitate la valoarea erorii stan-
dou praguri ale lui z n funcie de valori-
antion mai mic de 30 de subieci, valoa-
bieci, pragul de semnificaie al lui z este de 1,96.
d

im
d
a
considera, la un nivel de precizie
t
s de Lewis-Beck (Sava, 2004).
inte, mprim valoarea in
dard a acestuia. n acest caz, exist
le obinute (Sava, 2004). Pentru un
rea pragului de semnificaie este de 1,58 iar pentru eantioane mai mari sau
egale cu 30 de subieci, acest prag are valoarea de 1,96. n cazul nostru, va-
loarea Skewness este de 0,41 iar eroarea standard Skewness este de 0,42.
Fcnd raportul 0,41:0,42=0,97. Cum eantionul nostru este de 30 de su-
e
Valoarea obinut de 0,97
era distribuia ca fiind simetric.
ii.
i pentru boltire, ia n considerare
etriei n baza erorii standard
e mrimea eantionului. Eroarea
re trebuie s se regseasc coefi-
ric. La acest nivel, exist dou
fiind mai mic dect pragul, putem consi
Aceast metod se folosete i n cazul boltir
A treia metod propus, aplicabil
stabilirea intervalului de ncredere al s
Skewness i poate fi utilizat indiferent
standard Skewness ne ofer limitele ntre c
cientul de oblicitate astfel nct s putem
suficient de mare distribuia ca fiind sime
tipuri de intervale:
191
Statistic aplicat n tiinele socio-umane
La un nivel de precizie de peste 99%, cu alte cuvinte n mai
puin de 1% din cazuri distribuia noastr poate s se comporte
ca o distribuie asimetric. Intervalul este determinat de o
eroare standard Skewness. Un asemenea interval este foarte
precis i se folosete atunci cnd simetria reprezint un ele-
ment critic pentru distribuia datelor;
La un nivel de precizie de peste 95%, cu alte cuvinte n mai
kewness. Un asemenea interval este mai puin
istribuia este asimetric pozitiv.
e la un nivel de precizie de 99% este cuprins ntre -0,42 +0,42 iar la
un nive
este o distribuie simetric. A tre-
ia metod, datorit viziunii extrem de precise pe care o ofer, v-o recomand
s o folosii ori de cte ori analizai simetria sau boltirea unei distribuii.
puin de 5% din cazuri distribuia noastr poate s se comporte
ca o distribuie asimetric. Intervalul este determinat de dou
erori standard S
precis n comparaie cu primul i se folosete cnd simetria nu
reprezint un element critic pentru distribuia datelor.
Dac valoarea coeficientului de oblicitate Skewness intr ntr-unul
dintre aceste intervale, distribuia poate fi considerat simetric. Dac valoa-
rea coeficientului de oblicitate iese din acest interval la limita negativ, avem
de-a face cu o distribuie asimetric negativ iar dac iese din interval la limita
pozitiv, d
n situaia noastr, valoarea coeficientului de oblicitate Skewness este
de 0,41 iar valoarea erorii standard Skewness este de 0,42. Intervalul de n-
creder
l de precizie de 95% este cuprins ntre -0,84 +0,84. Putem constata
cu uurin c valoarea coeficientului de oblicitate Skewness (0,41) intr att
n primul interval ct i n al doilea interval. Putem aadar afirma, cu anse
mai mici de 1% c distribuia noastr s se comporte asimetric, c avem de a
face cu o distribuie simetric.
Indiferent de metoda folosit, am decis c distribuia scorurilor celor
30 de subieci la coeficientul de inteligen
192
Cristian Opariuc-Dan
Am artat pn acum c distribuia scorurilor subiecilor la variabila
coeficient de inteligen este o distribuie unimodal i simetric. Mai rmne
s demonstrm c este o distribuie mezocurtic, pentru a decide faptul c
scorurile la coeficientul de inteligen se distribuie normal.
Boltirea sau excesul reprezint tendina rezultatelor de a se concentra
n jurul mediei (distribuia ascuit sau leptocurtic) sau, din contra, de a se
rspndi, disipa puternic n jurul mediei (distribuia platicurtic). Dup cum
tim, indicatorul care ne d mrimea acestei mprtieri este Kurtosis. Anali-
za boltirii se poate face prin a doua sau a treia metod expus anterior, pentru
care nu intrm n detalii.
Distribuia scorurilor celor 30 de subieci la variabila coeficient de in-
teligen prezint coeficientul de boltire Kurtosis de -1,34 i eroarea standard
a acestu
pentru
preciz
zie de
intr n
(de m nitatea sau omogenitatea
scorurilor n jurul mediei este un element important, vom considera distribu-
ia noastr
precizie m
putem
i coeficient de 0,83.
Utiliznd a doua metod, obinem nota z pentru Kurtosis de
1,34:0,83= 1,61. Pragul de semnificaie pentru eantionul nostru este, la fel ca
i n cazul simetriei, 1,96. Valoarea notei z pentru Kurtosis fiind mai mic
dect pragul de semnificaie, putem aprecia c suntem n faa unei distribuii
mezocurtice.
Haidei acum s analizm boltirea prin prisma celei de-a treia metode
a vedea diferena de precizie. Intervalul de ncredere la un nivel de
ie de 99% este cuprins ntre -0,83 +0,83 iar pentru un nivel de preci-
95% ntre -1,66 +1,66. Observm c valoarea Kurtosis de -1,34
tr-al doilea interval (cu precizie mai mic) ns nu i n primul interval
are precizie). Deci, n situaia n care eteroge
ca fiind o distribuie platicurtic, deoarece nu intr n intervalul cu
are. n situaia n care excesul nu este un element att de important,
considera distribuia ca fiind mezocurtic.
193
Statistic aplicat n tiinele socio-umane
Oricum, n tiinele sociale nivelul de precizie acceptat este de peste
astfel nct distribuia noastr poate fi considerat o di 95%, stribuie
mezocu
piile teoretice ale fiecrei metode n parte.
c de
baz di
ribuii asimetrice,
platicur
rtic.
Valorile coeficientului de boltire Kurtosis negative i care ies din in-
tervalul de ncredere sunt reprezentative pentru o distribuie platicurtic. Da-
c avem de a face cu valori pozitive care ies din intervalul de ncredere, dis-
tribuia este leptocurtic.
Demonstrnd faptul c distribuia scorurilor celor 30 de subieci la va-
riabila coeficient de inteligen este o distribuie unimodal, simetric i
mezocurtic am demonstrat de fapt c distribuia respect toate caracteristici-
le unei distribuii gaussiene i poate fi considerat o distribuie normal.
Analiza distribuiei trebuie s precead orice analiz ulterioar
de date, deoarece n funcie de normalitatea distribuiei pot fi alese sta-
tisticile parametrice sau nonparametrice utilizabile pe parcursul demer-
sului de cercetare, dup asum
Pentru a concluziona, v voi oferi un model complet de analiz a dis-
tribuiei scorurilor n funcie de variabila coeficient de inteligen. ntotdeau-
na furnizai, n analiz, ct mai multe informaii legate de variabila dumnea-
voastr. V rog s avei n vedere ataarea exact a inventarului statisti
n SPSS i a eventualelor grafice care v pot susine demonstraia.
ntr-o analiz de date, va trebui s precizai: denumirea variabilei ana-
lizate, numrul de cazuri, indicatorii tendinei centrale i ai mprtierii, indi-
catorii distribuiei i explicarea acestora n cazul unor dist
tice sau leptocurtice, tabelele valorice ale inventarului statistic de ba-
z, graficele sub forma graficului cu bare sau histogram.
194
Cristian Opariuc-Dan

Distribuia rezultatelor celor 30 de subieci la variabila Coeficient
de inteligen
Statistics
Coeficientul de inteligenta
este o distribuie unimodal (modulul=124 IQ), simetric
(Skewness=0,41; Eroarea standard Skewness=0,42) i mezocurtic
(Kurtosis=-1,38; Eroarea standard Kurtosis=0,83), cu media 111,33 IQ,
mediana 108,5 IQ i abaterea standard 8,51 IQ. Amplitudinea distribuiei
este de 24 scoruri IQ cuprins ntre un minim de 100 IQ i un maxim de 124
IQ.
Avnd n vedere aceste elemente, putem considera c scorurile obi-
nute de cei 30 de subieci se distribuie normal n cazul variabilei Coeficient
de inteligen, aceast variabil suportnd proceduri parametrice de anali-
z statistic.
Iat un exemplu complet i profesional prin care putei realiza o anali-
z a di
rul . figura numrul. i ce nseamn acel tabel i acea
figur. Asem
fice ela
un stil propriu i a fi ncntat dac ai nva din
stribuiei datelor, valid n orice comunicare tiinific naional sau
internaional. Muli vor spune c nu e chiar profesional, c trebuia s speci-
fic tabelul num
enea lucruri in de normele de redactare ale documentelor tiini-
borate APA i vi le las ca studiu, deoarece nu intenionez s le abor-
dez n prezenta lucrare. Oricum, m adresez unor oameni inteligeni iar aces-
te amnunte le tii sau le putei afla i singuri. Nici cartea de fa nu le res-
pect, ns prefer s am
30
0
111,33
108,50
124
8,511
,413
,427
-1,384
,833
24
100
124
Valid N
Missing
Mean
Median
Mode
Std. Deviation
Skewness
Std. Error of Skewness
Kurtosis
Std. Error of Kurtosis
Range
Minimum
Maximum
195
Statistic aplicat n tiinele socio-umane
aceste
e de
mine a
al treile
s-l
editai
reaz acest tabel a
devenit o margine haurat i de ase-
menea este posibil s se afieze o bar
de instrumente de editare, similar
celei din programul Microsoft Word.
Primul buton de pe aceast ba-
r de formatare permite anularea aci-
unilor efectuate (Undo). Cel de-al doi-
lea buton este butonul pivot ce permite schimbarea rndurilor i a co ane-
lor n ta
rnduri cum s facei efectiv analize de date mai mult dect cum s v
conformai unor norme.
Ca o parantez, desigur am s fiu acuzat c am copiat i lipit n docu-
ment tabele i grafice din SPSS fr s le traduc n romnete. Depart
ceast intenie. n primul rnd, pentru c SPSS le ofer n englez i
doresc s introduc coninutul original. n al doilea rnd, conform acelorai
norme APA, utilizarea elementelor furnizate de programe informatice n lu-
crri tiinifice se face prin includerea coninutului original i nemodificat. n
a rnd, pentru c vreau s v nv, imediat, cum s editai coninutul
elementelor din fereastra de rezultate.
Orice element din fereastra de rezultate SPSS este un element editabil.
Putei s facei aproape orice cu tabelele i graficele pe care SPSS le furni-
zeaz. Nu avei dect s dai un dublu clic pe elementul pe care dorii
i vei intra ntr-un alt mod pe care SPSS l suport, modul de editare.
Pentru nceput s dm dublu
clic pe tabelul inventarului statistic de
baz, tabelul Statistics. Observm c
marginea care ncad
Figura 6.18 Tabelul Statistics n mod
editare
lo
bel.
196
Cristian Opariuc-Dan
Figura 6.19 Bara de formatare SPSS

Urmeaz apoi o caset derulant de aplicare a unui stil tabelului for-
matat,
re s fie afiat fontul.
telor componente. Pentru nceput
zulta o figur similar celei altu-
caseta derulant de alegere a fontului i caseta derulant de alegere a
dimensiunii fontului pentru textele selectate. Urmtoarele trei butoane permit
scrierea ngroat, nclinat i sublinierea iar butonul al patrulea selecteaz
culoarea cu ca
Cele patru butoane care se succed permit alinierea textului selectat, la
stnga, dreapta, centrat sau automat.
Ultimele dou butoane lanseaz sistemul de asisten (help) sau mo-
dul de creare a graficelor pentru variabila selectat iat o alt modalitate de
a realiza grafice dac ai uitat s o facei n etapa de analiz. V recomand s
exersai aceste elemente, fr team c ai putea strica ceva (n definitiv avei
la dispoziie butonul de anulare - Undo). Nu vom intra n amnunte legate de
formatarea tabelelor deoarece ar trebui s includem, inutil, mai multe pagini.
Un tabel n modul de edi-
tare permite modificarea elemen-
ne propunem s traducem n ro-
mnete cuvintele Missing (Lip-
s), Mean (Media), Media (Me-
diana) i Mod (Modul).
Aflndu-v n modul de
editare, efectum din nou dublu
clic pe cuvntul Missing. Va re-
Figura 6.20 Editarea valorilor n tabel
197
Statistic aplicat n tiinele socio-umane
rate. O
i la
b
m
t
s
n

m

odalitatea prin care putei traduce dac dorii orice element al
formularului de rezultate ntr-o alt limb.
Din nefericire, la fel cum pot fi traduse cuvintele, pot fi modificate i
cifrele, ceea ce v poate determina uneori s schimbai datele oferite de SPSS
cu alte date mai convena ral trebuie s punei la
dispoziie i baza de date n momentul n care publicai un studiu i de cele
mai mu
deasupra unei linii, ca n figura alturat,
pn c
icnd mausul la dreapta sau la stnga
bservai c textul Missing este deja selectat acum; dac apsai orice
tast, coninutul selectat va fi nlocuit cu tasta apsat. Nu v rmne dect s
scriei n loc de Missing, Lips.
Cuvntul Missing este nlocuit
Inventar statistic de baza
cu textul introdus, Lips. Proceda
fel cu toate celelalte cuvinte din ta
pentru a putea traduce tabelul n li
romn. Putei folosi bara de forma
pentru a ngroa, schimba culoarea
alinia textele selectate. Cnd ai termi
dai clic oriunde pe suprafaa alb a
restrei de rezultate pentru a iei din
dul de editare.
n final, tabelul dumneavoastr
trebuie s arate la fel ca cel din figura
Coeficientul de inteligenta
30
0
111,33
108,50
124
8,511
,413
,427
-1,384
,833
24
100
124
Valid
Lipsa
N
Media
Mediana
Modulul
Abaterea standard
Skewness
Eroarea Skewness
Kurtosis
Eroarea Kurtosis
Amplitudinea
Minimum
Maximum
el,
ba
are
au
at,
fe-
o-
Figura 6.21 Inventarul statistic dup editare

de mai sus.
Iat m
bile vou. Nu uitai c n gene
lte ori analizele sunt refcute de comisia de publicare a articolului.
Tot folosind modul de editare, putei ajusta limea coloanelor pentru
ca tabelul dumneavoastr s prezinte un aspect elegant.
Deplasai cursorul mausului
nd se transform ntr-o sgeat orizontal. Apoi inei apsat butonul
din stnga al mausului i tragei m
198
Cristian Opariuc-Dan
pentru a ajusta dimensiunea coloanei
din tabel. La fel putei proceda i
pentru ajustarea dimensiunilor pe
vertical.
Referitor la formatarea tabe-
lelor, SPSS pune la dispoziie mai
multe men
liza
de
inf
SP
zentm.
Meniul Insert permite adugarea, n cadrul tab
selectat, a unui nou titlu, a unei noi etichet
lului sau a unei noi note se subsol ntr-un m
iunii pe care SPSS o face autom o
pisteaz
-
lului prin inversarea liniilor sau a
area ferestrei speciale prin care
ivotarea tabelului. Acest meniu
rtant n formatarea aspectului gra-
nalizei unui volum mare de date.
entul n care vom discuta despre
de utilitare prin intermediul crora
bel, a ntregului tabel, a fonturilor
iuri pe care nu le vom ana-
n detaliu aici din considerente
spaiu. Putei consulta, pentru
ormaii suplimentare, manualul
SS. Ne vom limita doar s le pre-
elului
e n subsolul tabe-
od similar opera-
mentul n care de-
Meniul Pivot permite marcarea tabelului cu-
rent n scopul unei regsiri rapide n fereastra de rezul
at n m
o distribuie multimodal.
tate, comutarea tabe
coloanelor sau lans
poate fi controlat p
este un meniu impo
fic al tabelului, cu aplicaii n condiiile a
Vom reveni asupra acestui meniu n mom
studiile corelaionale.
Meniul Format cuprinde un set
putem modifica aspectul celulelor din ta
Figura 6.22 Inventar statistic tradus
199
Statistic aplicat n tiinele socio-umane
200
sau a notelor de subsol. SPSS conine, asemntor progra-
mului M
tei modifica complet aspectul tabelelor din foaia de rezulta-
te.
Toate opiunile din acest meniu in doar de aspectul
grafic
l,
anterio
VI.7.1 Calculul notelor z n SPSS
Din acela
nea Descriptive
tives
Cunoatei deja f
oarece am analizat-o pe parcursul aces
insista dect asupra unui singur elem
vorba despre caseta de bifare Save
dized values as variables. Rolul acest
pe care o v a cre
variabil ce va stoca scorurile z ale fie
date. Evident, va fi lansat fereastra
de afiare a rezultatelor ce conine un tabel pe
icrosoft Word, mai multe abloane grafice ce pot fi
aplicate tabelelor. Alegnd un asemenea ablon grafic, pu-
al tabelelor i nu afecteaz n nici un fel coninutul
datelor dumneavoastr. Se pot stabili, alturi de cele expuse mai sus, numrul
de zecimale pe care SPSS s le afieze, ordonarea datelor, includerea sau
excluderea capului de tabel etc. V invit s parcurgei acest meniu i s exer-
sai facilitile pe care le ofer. Oricnd v putei ntoarce la starea iniia
ar unei aciuni, folosind butonul Undo.
Programul SPSS permite calcului notelor z pentru fiecare dintre ca-
zurile individuale prezente n distribuia de date, ntr-un mod foarte simplu i
elegant.
i meniu, Analyze, vei alege opiu-
Statistics i apoi opiunea Descrip-
ereastra care se deschide, de-
tei lucrri, drept pentru care nu vom
ent. Este
standar-
ei casete,
a o nou
crui caz
din baza de
Figura 6.23 Meniul
statistici descriptive
om bifa, este acela de
Figura 6.24 Fereastra de
configurare a analizei
Cristian Opariuc-Dan
care l-a tate de noi?
Am bifat o op-
Coeficient de
trebuie analiza-
are notele standardizate vor fi salvate ca
var
edii i aa mai departe.
en se obin adu-
z. Dac avem
acem ns acest
Vom folosi serviciile unui alt meniu i anume meniul Transform, de
unde v . n funcie de
care
vom introduce numele variabilei destinaie, variabil
m discutat deja. Totui, unde sunt notele z att de cu
S ne amintim ce am bifat.
iune dup ce am introdus variabila
inteligen n lista variabilelor ce
te, prin c
iabile. Trebuie deci s ne ntoarcem la baza de
date, unde vom regsi o nou variabil creat au-
tomat. Este vorba despre variabila Ziq, ultima
din baza de date, care nu conine altceva dect
notele z ale fiecrui subiect.
Observm c primul subiect se afl la
1,33 abateri standard n stnga mediei, adic n
zona rezultatelor medii, al doilea la 1,01 abateri standard n dreapta mediei,
tot n zona scorurilor m
Figura 6.25 Noua variabil
ce conine scorurile z
Cum facem totui pentru a obine note standardi-
zate rezultate din notele z, scoruri sten spre exemplu.
V mai amintii probabil c scorurile st
nnd valoarea 5,5 la valoarea notei
notele z, restul este simplu. Cum f
lucru n SPSS?
Figura 6.26 Meniul de
transformare SPSS
om selecta opiunea Compute sau Compute variable
versiunea SPSS pe care o posedai.
Rezultatul acestei aciuni se concretizeaz
ntr-o fereastr similar celei alturate, care conine
urmtoarele elemente:
Target variable reprezint seciunea n
Figura 6.27 Fereastra
de calcul a variabilelor
201
Statistic aplicat n tiinele socio-umane
n care se vor salva noile rezultate. n cazul nostru, suntem interesai s calcu-
lm sc
Sub aceast caset de text se afl un buton inti-
tulat Ty
tfel, avem posibilitatea s adugm o etiche-
t variabilei nou create folosind cele dou opiuni din
seciun
i vom folosi drept etichet
em opiunea Use expres-
ipului de variabil. Putem
e caractere, caz n care
mrul de caractere pe care
oscuta list a variabilelor
ula de calcul prin care va fi obinut noua
variabil. n acest sens putem utiliza calculatorul de sub caset sau putem
tasta pur i simplu valorile sau fo
accesul la formule, SPSS
group care conine funciil
and Special Variables car
rior. Dac, de exemplu, n
n cea de-a doua list vor f
uzuale.
Butonul If permi culelor, adic cal-
cularea doar a datelor care ndeplinesc o condiie.
orurile sten pentru variabila iq i vom introduce un nume, ca spre
exemplu StenIQ.
pe & Label pe care dac apsm vom putea
configura proprietile noii variabile create.
As
ea Label. Putem decide dac introducem un
text ca i etichet (ca n cazul figurii alturate) or
formula de calcul, situaie n care va trebui s aleg
sion as label. Seciunea Type permite alegerea t
decide ntre un tip numeric implicit sau ntre un ir d
va trebui s includem i dimensiunea acestui ir, nu
l permite variabila.
Sub butonul Type & Label se afl binecun
din baza de date. n partea dreapt apare caseta de text Numeric Expression
cu ajutorul creia putem scrie form
rmula n caseta de text. Pentru a v uura
v pune la dispoziie dou liste: lista Function
e sistemului grupate pe categorii i lista Functions
e se refer la funciile din categoria selectat ante-
prima list efectum clic pe elementul Arithmetic,
i afiate funciile referitoare la operaiile aritmetice
te efectuarea condiional a cal
Figura 6.28 Proprie-
ti ale variabilei
202
Cristian Opariuc-Dan
ntlnim aici posibilitatea de a include toate cazurile (Include all cas-
es) sau a include doar cazurile care satisfac o condiie (Include if cases satis-
fies condition). Dac, de exemplu, dorim s calculm scorurile sten doar
pentru brbai, vom alege ac
mule expresia sexu
pentru brbai, ignor
aici lis , u
ex plex
un calcul condiional, prin
rsi fereastra fr a efectua
nici o m
rile sten ale variabilei iq folosind
aceste i descrierea noii varia-
iable, aa cum a fost
exemplificat mai sus. Ne amintim c nota sten se
aloarea notei z. Nota
ior i o regsim n baza
( ul
plu. Nu v rmne dect s
scrie
Ziq), fie tastnd-o, fie
(Ziq) se poate tasta sa
variabila din lista varia
uie
tm sigu
east opiune iar apoi vom scrie n caseta de for-
l=1. n acest fel SPSS va calcula scorurile sten numai
nd femeile. ntlnim i
til pentru crearea unor
e. Deocamdat nu ne
intereseaz nici
urmare vom p
ta de funcii
presii mai com
odificare.
S vedem acum, concret, cum calcu-
lm scoru
elemente. n primul rnd, am introdus numele
bile n caseta Target Var
calculeaz adunnd 5,5 la v
z ns am calculat-o anter
de date sub denumirea Ziq
de inteligen).
Restul e sim
Zscore: Coeficient
i n caseta Numeric Expression formula (5,5 +
folosind calculatorul. Variabila care conine nota z
u se poate folosi butonul de transfer pentru a include
bilelor n formul.
Nu mai treb
pl. Apare, de
dect s apsai butonului OK i s vedem ce se n-
r, fereastra de rezultate care ne informeaz asupra fap-
tului c operaiunea a reuit. La fel ca la calculul notelor z, ne intereseaz
baza de date.
Figura 6.29 Calculul condiional
al datelor
Figura 6.30 Calculul
scorurilor sten
203
Statistic aplicat n tiinele socio-umane
Iat c a aprut noua variabil StenIQ care conine, exact aa cum
am specificat, scorurile sten ale subiecilor. Observm c de aceast dat no-
tele nu mai sunt cuprinse ntre -3 i +3 ci pe o scal de la 1 la 10, exact ca n
sistemul colar. Este mult mai intuitiv, nu-i aa?
Ca exerciiu, v propun calculul notelor z i a scorurilor sten pen-
tru variabila vrsta subiecilor.

Concluzii:
Media i abaterea standard caracterizeaz pe deplin o distribuie i de aceea aceti
doi indicatori poart numele de parametri ai repartiiei normale;
O distribuie normal trebuie s ndeplineasc simultan urmtoarele trei condiii:
o S fie unimodal;
o S fie simetric;
o S fie mezocurtic;
Unimodalitatea reprezint existena unei singure categorii cu frecvena absolut
maxim i se analizeaz prin inspectarea valorii modale;
O distribuie normal este o distribuie unimodal;
Simetria reprezint echilibrarea distribuiei pe axa orizontal i se poate calcula
tic;
ase abateri standard; trei la stnga
ormal prezint patru zone: zona
zona scorurilor atipice i zona sco-
rticular i medie exprimat n ter-
i standard;
prin:
o Coeficientul Yule;
o Coeficientul Fisher;
o Relaia dintre medie, median i abaterea standard;
Referitor la simetrie exist un sistem de relaii ntre indicatorii tendinei centrale
(medie, median i mod), distribuiile putnd fi simetrice, asimetrice la stnga i
asimetrice la dreapta.
O distribuie normal este o distribuie simetric
Boltirea reprezint o asimetrie vertical a distribuiei i se poate calcula prin:
o Coeficientul de boltire Pearson;
O distribuie normal este o distribuie mezocur
ntr-o distribuie normal exist un numr de
mediei i trei la dreapta mediei;
n funcie de abaterile standard, o distribuie n
scorurilor normale, zona scorurilor accentuate,
rurilor aberante;
Notele z reprezint distana dintre un scor pa
meni de abater
204
Cristian Opariuc-Dan

O distribuie care nu
specifice:
o Media 5% tri
o Extragerea ra
o Ridicarea la
o Logaritmarea
o Reflectarea.
Etaloanele sunt sisteme de norme ce permit compararea scorului unui subiect cu
performana obinut de u e subieci;
Etaloanele se construiesc n f ul distri
Notele z pot fi transformate, n baza proprietilor acestora, n alte sisteme de
note standardizate;
Prin intermediul notelor z, scorurile brute se aduc la un numitor comun, putnd
apoi face comparaii att ntre subieci ct i ntre rezultate la probe diferite;
este normal poate fi normalizat prin procedee statistice
m;
dicalului;
ptrat sau la cub;
pe valori normale sau inversate;
n grup reprezentativ d
uncie de aspect buiei rezultatelor, astfel:
o Pentru distribuii normale se pot folosi etaloanele n cuantile sau etaloane
n clase normalizate, preferndu-se cele din urm;
o Pentru distribuii care nu sunt normale i nu pot fi normalizate, singurul
sistem de etalonare care poate fi folosit este cel al etaloanelor n cuantile;
205
Statistic aplicat n tiinele socio-umane
V VI II. PROBABILITI I. PROBABILITI I I S SE EM MN NI IF FI IC CA A I IE E S ST TA AT TI IS ST TI IC C
n acest capitol se va discuta despre:
Conceptul de probabilitate;
Tipuri de probabiliti;
Eroare standard i intervale de ncredere;
Etapele metodei tiinifice;
Ipoteze i testarea ipotezelor;
Semnificaie statistic i erori n testarea ipo-
tezelor.
Dup parcurgerea capitolului, cursanii vor fi capabili s:
neleag regulile de probabilitate;
Disting ntre diferitele tipuri de probabiliti;
neleag i s calculeze eroarea standard i in-
tervalul de ncredere;
nsueasc etapele demersului tiinific;
Planifice o cercetare tiinific i s formuleze
ipotezele;
neleag logica testrii ipotezelor;
neleag conceptul de semnificaie statistic;
Recunoasc i s trateze tipurile de erori aprute
n procesul testrii ipotezelor.

Desigur, n activitatea dumneavoastr de zi cu zi, ai ntlnit frecvent
termenul de probabilitate. Care este probabilitatea s plou n momentul n
care ai decis s v petrecei o sptmn pe litoral sau care este probabilita-
tea s avei un cmin fericit n momentul n care v-ai cstorit? Dac arun-
ca babilitatea s cad cap sau stem? Unii
dintre dum la probabilitatea prin care s obi-
n rte.
caz
ca
este ns e dou posibiliti,
i o moned n sus, care este pro
neavoastr i doresc s poat af
un ase la zar pentru a scpa de mar i aa mai depa
Dac aruncm o moned n sus, atunci cnd cade, va putea s cad pe
faa cu capul sau pe faa cu stema. Exist doar dou posibiliti n acest
re acoper complet posibilitile de manifestare ale acestui fenomen. Care
probabilitatea s cad stema? Este una din cel
206
Cristian Opariuc-Dan
adic
litatea s
2, 3, 4, 5 sau 6, deci avem 6 posibiliti. Dac dm cu zarul, exist o singur
ans raportat la 6 anse de a nimeri, dintr-o singur ncercare, zarul cu ase.
Exprimat din nou cifric, avem o probabilitate de
1
/
6
=0,166 s scpm de mar.
Dac ns pentru a scpa de mar ne trebuie un 6 sau un 4, care este probabili-
tatea de a iei cu fa curat? De data aceasta exist dou alternative raportate
la un total de ase, prin urmare
2
/
6
=0,33.
Nu cred c toate aceste lucruri sunt elemente noi. n general, atunci
cnd vorbim de probabiliti, acestea se exprim sub form cifric, cu valori
de la 0 la 1, n care 0 reprezint probabilitatea nul, niciodat evenimentul nu
se va ntmpla iar 1 reprezint probabilitatea maxim, evenimentul se ntm-
pl ntotdeauna. De foarte multe ori este mai intuitiv s reprezentm procen-
tual probabilitile prin nmulirea probabilitii cu 100. Astfel, exist 50%
anse s cad stema la aruncarea unei monede (0,5x100) sau 16,6% anse s
scap de mar dac nimeresc un ase i 33% dac nimeresc un ase sau un pa-
tru. Muli prefer aceast exprimare deoarece suntem obinuii s gndim sub
form de pri ale unui ntreg. n definitiv, fie c folosim exprimarea 0,33 fie
c avem n vedere o form procentual 33% de fapt spunem acelai lucru.
Toate aceste exemple reprezint cazuri de probabilitate necondiio-
nat, deoarece nu exist nici un factor, nici un element care s influeneze
desfurarea lor. Dac nu exist vreun magnet n zar sau vreun grunte de
plumb care s influeneze obinerea lui ase, atunci suntem n faa unui caz de
probabilitate necondiionat.
Probabil c la ora actual exist o sut de cri de statistic care tra-
teaz problemele pe care le-am expus aici, unele n mod cert mai complete i
mai academic scrise. Care ar fi aadar probabilitatea ca dumneavoastr s
citii acum cartea scris de mine? Este simplu de calculat
1
/
100
=0,01 sau ex-
primat procentual 1%. Cam mici anse, nu-i aa? n mod sigur nu cred c-am
exprimat n termeni cifrici =0,5. Dac avem un zar, care este probabi-
dm un ase? De data aceasta cte posibiliti sunt? Poate s cad 1,
207
Statistic aplicat n tiinele socio-umane
s m mbogesc din vnzarea acestei cri Care ar fi probabilitatea ca
% dac
omandai, probabilitatea va
cre ate i, iat cum cu ajutorul
dum ilita-
tea na unui
alt evenim aadar alte as-
pe
n
.
Dac
donez fum
prim diionat.
n al do
i att de bine?
Nu a le
n
elegerea acestor aspecte asigur, mai apoi, nelegerea conceptelor
de infe
paraie cu ceilali
studen
prietenul sau prietena dumneavoastr s citeasc aceast carte? Tot 1
nu i-o recomandai dumneavoastr. Dac i-o rec
te n funcie de numrul de recomandri efectu
neavoastr mi voi lua o vil pe plaj. Acest exemplu, n care probab
prezena sau abse de apariie a unui eveniment este influenat de
ent se numete probabilitate condiionat. Exist
cte care influeneaz probabilitatea de apariie a unui eveniment. Probabili-
tatea de a muri de cancer la plmni n urma fumatului este foarte mare
condiiile lana un cancer n care nu cunosc faptul c fumatul mi poate dec
tiu acest lucru, crete probabilitatea s reduc igrile i chiar s aban-
atul, ceea ce va determina i reducerea probabilitii de a muri. n
a situaie ne aflm n faa unui exemplu de probabilitate necon
ilea caz, avem de a face cu o probabilitate condiionat.
De ce totui am abordat aceste probleme pe care le ti
m fcut-o ca s va jignesc inteligena, ci pentru a ne asigura de baze
elegerii importanei probabilitilor n statistica social.
n
ren statistic, de relaii ntre variabile, praguri de semnificaie i
semnificaie statistic.
Dup cum am afirmat, scopul unei cercetri este acela ca, pornind de
la rezultatele obinute la nivelul unui eantion de populaie s tragem conclu-
zii valabile pentru o ntreag populaie. Dac voi studia cantitatea de bere
consumat de studenii de la psihologie i voi face afirmaia c n general
studenii de la psihologie consum mai mult bere n com
i, la ce nivel de precizie m voi situa? Care este probabilitatea ca
afirmaia mea s fie exact? Pentru a calcula aceast probabilitate avem nevo-
ie s nelegem foarte clar ce nseamn probabilitate de apariie a unui eveni-
ment, fie ea condiionat sau necondiionat. Toate cercetrile n care se folo-
208
Cristian Opariuc-Dan
sesc procedee statistice urmresc, n principal, acelai scop. Din raiuni de
costuri i volum de munc, studiind un eantion, urmrim extinderea conclu-
ziilor obinute la nivelul ntregii populaii. Singura problem care se pune
este cea referitoare la ct de precise i adecvate sunt aceste concluzii.
Probabilitatea condiionat i simpl necondiionat reprezint dou
dintre cele mai importante reguli de probabilitate, alturi de evenimentele
mutual exclusive i evenimentele independente. n urmtoarele subcapitole
vom aprofunda aceste noiuni n vederea unei nelegeri complete.
VII.1Patru reguli de probabilitate
n exemplul anterior cu zarul, totalitatea rezultatelor care pot s fie
obinute (1, 2, 3, 4, 5 sau 6) poart numele de eveniment n teoria probabili-
tilor. Probabilitatea de scpa de mar dac dau un ase sau dac dau un ase
sau un patru, poart numele de probabilitate de succes. Generaliznd, proba-
bilitatea de succes n cazul unor asemenea evenimente poate fi calculat cu
ajutorul formulei P
(s)
=
n
s
n
, n care P
(S)
reprezint probabilitatea de succes, n
s

reprezint numrul rezultatelor de succes iar n reprezint numrul total al
rezultatelor.
Este exact ceea ce am stabilit anterior. Care este probabilitatea de a
scpa d
bilitatea de succes pentru dou eve-
niment
e mar (probabilitatea de succes)? S dau un ase. Deci un singur re-
zultat va fi de succes dintr-un total de cte rezultate? De ase rezultate posibi-
le (pot s dau un 1, 2, 3, 4, 5 sau 6). Aplicnd n formul, gsim c probabili-
tatea de succes este de
1
/
6
=0,166.
n mod similar pot calcula proba
e (ase sau patru), pentru trei evenimente i aa mai departe.
VII.1.1 Probabilitatea simpl pentru evenimente egale
Se refer exact la evenimente tip aruncarea unei monede sau la arun-
carea unui zar i reprezint cea mai simpl regul de probabilitate. Pentru a
209
Statistic aplicat n tiinele socio-umane
nelege mai bine acest lucru, s lum cazul unei rulete cu nou culori. Dum-
neavoastr va trebui s aruncai o moned de 50 de bani n timp ce ruleta se
rotete. Dac atunci cnd ruleta se oprete moneda dumneavoastr se afl pe
culoarea verde, ctigai doi lei; n caz contrar, pierdei moneda.
Cunoscnd formula de mai sus, care este probabilitatea de succes?
Evident, numrul total de rezultate posibile este nou; moneda poate s cad
pe oricare dintre cele nou culori. O singur culoare este ns ctigtoare i
anume culoarea verde, deci un singur rezultat va fi cel ctigtor. Probabilita-
tea de succes este aadar
1
/
9
=0,111 sau 11,1%. Pn aici toate sunt clare i
limpezi. Care este ns probabilitatea de eec? Evident toate celelalte culori
rmase, adic
8
/
9
=0,888 sau 88,8%. Din nou anse posibile, avei aadar o
singur ans s ctigai i opt anse s pierdei, adic
1
/
8
anse de ctig.
Acum v vei uita nedumerii la mine i m vei ntreba. Parc era
1
/
9
pro-
babilitatea de succes. Cum a devenit dintr-o dat
1
/
8
? Dac ai fost ateni, am
fcut d
probabilitatea de
succes
onso =
(s)
1-P
(s)
eja incursiunea ntr-un alt concept statistic i anume cel de ans, oa-
recum similar cu cel de probabilitate de succes i de eec, pe care de altfel se
bazeaz. ansa de succes poate fi scris ca raportul dintre
i probabilitatea de eec (
P(s)
/
P(e)
). Pentru a nu mai folosi probabilitatea
de eec, putem exprima ansa de succes doar n termeni de probabilitate de
succes, dup formula S
P
. Acest lucru devine evident dac nlo-
cuim n raportul iniial semnificaia probabilitii de eec. Atunci cnd vor-
bim n termeni de ans, putem spune c exist o ans s ctig doi lei i opt
anse s pierd 50 de bani, adic ansa mea de succes este de
1
/
8
; una de ctig
i opt de pierdere.
Haidei s vedem dac aa stau lucrurile. Probabilitatea de succes, n
cazul ruletei, este de
1
/
9
i cea de eec este de
8
/
9
. Vom face apel la cunotine
de aritmetic de baz i vom spune c ansa de succes este
P
(s)
P
(c)
=
1
9
,
8
9
,
=
1
9

9
8
=
1
8
. Nu am folosit dect cunotine elementare de aritmetic. Demonstraia
210
Cristian Opariuc-Dan
formulei a doua este evident deoarece probabilitatea de eec va fi 1 proba-
bilitatea de succes. Dac nlocuii i efectuai calculele, rezultatul va fi ace-
lai: o ans s ctig doi lei i opt anse s pierd 50 de bani.
De ce folosim totui termenul de ans de succes i nu cel de probabi-
liti de
pt pe nou
s pierd 50 de bani. Desigur, sunt i alte motive pe care le vom discuta la
nevoie de un ase sau un patru ci de un apte sau un zece, cum
S nu mi spunei c vei picta mai multe puncte
pe faa
ase. Cumulat, exist un numr de 36 de
posibil
succes i de eec. Foarte simplu. Pentru a sintetiza ntr-o singur ex-
primare att succesul ct i eecul. O ans s ctig doi lei i opt anse s
pierd 50 de bani se prezint mai concis i mai elegant n comparaie cu o
probabilitate de unu pe nou s ctig doi lei i o probabilitate de o
momentul potrivit.
VII.1.2 Evenimentele mutual exclusive
Toat discuia noastr s-a bazat pn acum pe un singur eveniment:
aruncarea unui singur zar, a unei singure monede sau jocul la o singur rule-
t. Ce se ntmpl ns dac avem dou evenimente? tii c la jocul de table
avem dou zaruri. Fiecare dintre cele dou zaruri poate lua, n mod indepen-
dent, valori de la unu la ase n urma unei aruncri. Dac pentru a scpa de
mar nu avem
vom calcula probabilitatea?
unui zar
Iat o situaie tipic de dou evenimente mutual exclusive. De ce mu-
tual exclusive? Pentru c punctele obinute pe un zar depind de punctele obi-
nute pe celalalt zar pentru a rezulta scorul total. Fiecare dintre cele dou za-
ruri poate lua valori de la unu la
iti de a se combina cele dou zaruri (6x6 posibiliti). Pentru a obine
un apte, putem avea una dintre urmtoarele situaii:
Zar 1: 1 2 3 4 5 6
Zar 2: 6 5 4 3 2 1
Total: 7 7 7 7 7 7
211
Statistic aplicat n tiinele socio-umane
n acest caz funcioneaz o alt regul, derivat din regula probabilit-
ilor simple a evenimentelor egale, numit regula aditiv pentru evenimente
mutual exclusive. Nu v speriai c nu este cine tie ce demonstraie mate-
matic complex. Care este numrul total de rezultate al celor dou eveni-
mente? Primul zar are un total de ase rezultate iar al doilea zar un numr
total de ase rezultate. Numrul total al rezultatelor celor dou evenimente
este de 6x6=36 de rezultate. Care este numrul de rezultate de succes, adic
numrul de rezultate care prin nsumare duc la cifra apte? Numrai rezulta-
tele din tabelul de mai sus. Sunt ase rezultate. Nu avem acum dect s nlo-
cuim n formula de mai sus pentru a calcula probabilitatea de succes P
(s)
=
n
s
n
=
6
36
=
1
6
= u,16. Cunoscnd probabilitatea de succes este uor s calcu-
lm ansa de succes. Aplicai doar formula specificat n capitolul anterior i
vei afla ansa de succes. Nu mi se pare deloc complicat. M vei ntreba
acum de ce vorbesc de o alt regul cnd de fapt este exact prima regul stu-
diat. Pentru c aceast regul spune c probabilitatea de succes a unui numr
de k evenimente mutual exclusive reprezint suma probabilitilor de succes a
fiecrui eveniment. Dac avem k evenimente (n cazul nostru k are valoarea
ase deoarece sunt ase evenimente) atunci probabilitatea de succes va fi
P
(s)
=P
(e1)
+ P
(e2)
+ P
(e3)
+ . P
(ek)

Acest lucru se verific i n cazul nostru, dac ar fi s scriem formula
desfurat:
P
(s)
=
1
S6
+
1
S6
+
1
S6
+
1
S6
+
1
S6
+
1
S6
=
6
S6
=
1
6

Iat c v-am lmurit i motivul pentru care aceast regul se numete
regula aditiv pentru evenimentele mutual exclusive.
Ca exerciiu, calculai probabilitatea de succes i ansa de succes
pentru a obine la table un 10 ca s scpai de mar.
212
Cristian Opariuc-Dan
Am abordat pn acum situaia n care evenimentele sunt egale (cele
dou evenimente au acelai numr de rezultate fiecare dintre cele dou za-
ruri poate genera un numr de ase rezultate). Cum procedm ns dac eve-
nimentele nu sunt egale?
S presupunem c suntei un juctor de poker electronic i v aflai n
faa unui asemenea aparat care funcioneaz cu monede. Programatorul apa-
ratului a implementat urmtorul algoritm de ctig (Dowdy, i alii, 2004):
Careu de ai se ctig 50 de monede probabilitate 0,001
Careu de popi se ctig 30 de monede probabilitate 0,010
Careu de dame se ctig 25 de monede probabilitate 0,040
Careu de valei se ctig 10 monede probabilitate 0,359
Pierderea monedei probabilitate 0,590

Probabilitatea de succes este practic probabilitatea de a ctiga ceva,
fie valeii, damele, popii sau aii. n acest caz probabilitatea de succes este
suma probabilitilor evenimentelor i anume 0,001+0,010+0,040+0,359 re-
zultnd 0,41.
Observm c probabilitatea de succes, aplicnd regula aditivitii eve-
nimentelor mutual exclusive, nu este altceva dect inversul probabilitii de
eec. n termeni probabilistici, opusul probabilitii de succes poat numele
de complement i se noteaz cu
( ) S
P . ntotdeauna suma dintre probabilitatea
de succes i complementul acesteia este unu. Dac revenim la formula ansei,
practic ansa de succes este raportul dintre probabilitatea de succes i com-
plementul acesteia.
VII.1.3 Evenimentele independente
Ai observat, din exemplul anterior cu jocul electronic, c probabilita-
tea de succes este destul de mare (0,41). Dac introduce mo n aparat,
avei practic o probabilitate de 41% s c i ceva i 59% s erde To-
tui de ce n i? Dac sun pti rilo no , n
i o ned
tiga pi i.
u ctiga tei un m mit al jocu r de roc
213
Statistic aplicat n tiinele socio-umane
mod si
8 16
36
T
n con i vom n-
cerca s gsim al de culoa-
re neag
i sunt speciale i negre.
Prin ur
ngur ai trecut prin situaia n care v spuneai: Am pierdut prea mult.
De acum ar trebui s mai i ctig. n realitate ns ai risipit toi banii fr
un ctig substanial. De ce? Rspunsul este foarte simplu. Deoarece eveni-
mentele sunt n realitate independente. Introducerea unei noi monede n apa-
rat nu are nici o legtur cu ceea ce ai jucat dumneavoastr anterior. Jocurile
anterioare nu influeneaz cu nimic probabilitatea de ctig pe care o avei. n
acest caz, evenimentele nu sunt mutual exclusive ci independente. Dac vei
introduce n aparat 100 de monede, probabil c vei ctiga de 41 de ori i
vei pierde de 59 de ori.
Atunci cnd discutm despre evenimente independente, trebuie s
avem n vedere probabilitatea comun ca dou sau mai multe evenimente s
se ntmple simultan. S considerm un alt exemplu n care presupunem c
avem la dispoziie un pachet de cri de joc. tii foarte bine c un pachet de
cri de joc conine un numr de 52 de cri aranjate de dou culori: negru i
rou. De asemenea exist, pentru fiecare culoare, un numr de 8 cri specia-
le: asul, popa, dama i valetul. Dac am sistematiza distribuia crilor de joc,
am obine o imagine similar tabelului de mai jos (Dowdy, i alii, 2004):
Carte special Negru Rou Total
Da 8
Nu 18 18
otal 26 26 52

tinuare, vom amesteca foarte bine crile din pachet
probabilitatea cu care putem extrage o carte speci
r, dintr-o singur extragere. Cred c intuii deja rspunsul. Putem
extrage oricare dintre cele 52 de cri din pachet. Deci totalitatea rezultatelor
este de 52. Totui, din aceste 52 de cri, doar 8 cr
mare, probabilitatea de a extrage o carte special i de culoare neagr
este de P
NS
=
8
52
=
2
13
= u,1S. Dac n cazul evenimentelor mutual exclusive
am avut o regul aditiv, n acest caz ne confruntm cu o regul multiplica-
214
Cristian Opariuc-Dan
tiv a
a doi deoarece primul eveniment se refer la extra-
gerea u
evenimentelor independente. Conform acestei reguli, probabilitatea
de succes a unui numr de k evenimente independente reprezint produsul
probabilitilor de succes a fiecrui eveniment. Dac avem k evenimente (n
cazul nostru k are valoare
nei cri de culoare neagr i al doilea eveniment la extragerea unei
cri speciale) atunci probabilitatea de succes va fi P
(s)
=P
(e1)
x P
(e2)
x P
(e3)
x
. P
(ek).
n situaia de fa, P
NS
= P
N
P
s
=
26
52

16
52
=
1
2

4
13
=
4
26
=
2
13
=
u,1S. Am ob t a elai r
VII.1.4
Atun
persoane cu tenul nchis la culoare, prul negru, eventual ondulat, buzele
groase. Dac
exemplu este un caz tipic de probabilitate condiionat. n
aceast
r
Nefumtor Fumtor Total
Pulmonar 5 20 25
75
inut, dup cum ai constatat, exac c ezultat.
Probabilitatea condiionat
ci cnd ne gndim la un african, ne vine n minte imaginea unei
ntlnim o asemenea persoan pe strad, putem afirma cu o pro-
babilitate foarte mare de succes, c respectiva persoan este un african. Poate
fi ns vorba ns i despre un arab sau chiar un european. Ne-am bazat afir-
maia pe o serie de indicii fizice care au condiionat probabilitatea de succes.
Un asemenea
situaie, unul sau mai multe evenimente influeneaz, condiioneaz
probabilitatea de apariie a unui alt eveniment.
S presupunem c facem un studiu pe 100 de persoane bolnave de
cancer pentru a vedea n ce msu fumatul contribuie la apariia cancerului
la plmni. Dup colectarea rezultatelor, le putem prezenta ntr-un tabel simi-
lar celui de mai jos (Dowdy, i alii, 2004):
Cancer
Alt tip de cancer 60 15
Total 65 35 100

Ne punem evident ntrebarea, avnd un numr de 25 de persoane cu
cancer pulmonar, care este probabilitatea ca un fumtor s contacteze un can-
215
Statistic aplicat n tiinele socio-umane
cer pulmonar. Rspunsul este din nou simplu dac privim cu atenie tabelul
de mai sus. Avem un numr total de 25 de bolnavi de cancer pulmonar, din
care 20 sunt fumtori. n acest caz probabilitatea ca un fumtor s prezinte
cancer pulmonar este de
20
/
25
= 0,80. Cam mare, nu-i aa?
n realitate, probabilitatea condiionat are i ea o regul proprie, nu-
mit regula probabilitii condiionate, care se scrie sub forma P
c2|c1
=
P
c1c2
P
c1
i semnific probabilitatea ca evenimentul al doilea s fie determinat de
primul eveniment.
n cazul nostru, care sunt evenimentele? Lotul nostru conine 100 de
persoane, toate bolnave de cancer. Primul eveniment l reprezint probabilita-
tea ca dintre toi bolnavii de cancer, unii s fie bolnavi de cancer la plmni.
Avem un numr de 25 de bolnavi de cancer la plmni dintr-un numr de 100
de bolnavi de cancer. Probabilitatea va fi aadar
25
/
100
. Al doilea eveniment
este reprezentat de bolnavii de cancer la plmni, fumtori. Avem un numr
de 20 de bolnavi de cancer la plmni care fumeaz. Probabilitatea pentru al
doilea eveniment va fi aadar
20
/
100
. Dac aplicm formula de mai sus, obi-
ne
P
C
m P
C
=
P
FC
|P
=
20
100
=
25
20
= u,
2S
100
8. Am obinut, prin urm i
rezulta
VII.2Eroare standard i intervale de ncredere
are, exact acela
t.
Incursiunea anterioar n domeniul probabilitilor, dei puin mai ari-
d fa de cum v-ai obinuit, nu a fost deloc ntmpltoare i este menit s
v familiarizeze cu demersul tiinific. n momentul n care utilizai statistica
ntr-un studiu tiinific, trebuie c reinei c aceast metod nu ofer nici pe
departe concluzii certe. Orice afirmaie pe care o facem i care deriv din
procedee statistice, are o anumit probabilitate de a fi adevrat, dup cum
exist i o probabilitate de a ne nela. Acest lucru se ntmpl deoarece n
demersul tiinific rareori lucrm cu ntreaga populaie. De obicei studiile se
216
Cristian Opariuc-Dan
fac pe un segment din populaie, numit eantion, iar concluziile se extind la
nivelul ntregii populaii. Devine evident faptul c indicatorii statistici obi-
nui prin studiul eantionului difer de parametrii populaiei generale din care
acest eantion a fost extras. Acest lucru induce anumite erori n momentul n
care extindem concluziile la nivelul populaiei, erori numite n literatura de
specialitate erori sistematice de eantionare. Scopul oricrui studiu este s
minimizeze aceste erori astfel nct datele obinute prin studiul eantionului
s se apropie ct mai mult de parametrii reali ai populaiei.
Dac vom dori, de exemplu, s
ia care exist ntre coefici-
trebui
test d gen-
i
elevii de gimna-
ziu din Romnia. Un asemenea studiu va fi extrem de greu de realizat i foar-
te costi
studiem rela
entul de inteligen i notele obinute la
matematic de ctre elevii de gimnaziu
din Romnia, vom ti c cele dou vari-
abile se distribuie normal la nivelul po-
pulaiei, ca n figura alturat.
Pentru a afla parametrii reali ai
populaiei (media
i abaterea
standard ) ar
Figura 7.1 Distribuia coeficientului de
inteligen i a notelor la matematic
pentru ntreaga populaie de elevi
s nregis-
trm notele la
matematic i
rezultatele unui
Eantion 90% din
populaie. Exist mari
anse s fie inclui att
subieci buni ct i
slabi
e inteli
pentru to
Figura 7.
lige
2 Distribuia c tului de
n i a notelor la matematic
oeficien
inte
pentru un eantion de 90%
sitor. Dac n loc s analizm toat populaia vom studia doar 90% din
populaie, media obinut se va apropia foarte mult de cea a populaiei gene-
rale. Acest lucru devine posibil deoarece probabilitatea de a selecta subieci
217
Statistic aplicat n tiinele socio-umane
care vor obine scoruri egal rspndite n jurul mediei populaiei este foarte
mare.
ns resursele nu sunt suficiente n vederea realizrii unui studiu de o
asemenea amploare i se va lucra cu un numr mai redus de subieci. se
ntmp
bilitate foa ma
s selectm trei
deter antionare, indicatorii obinui la nivelul
l o ce mai mult de parametrii populaiei.
itei centrale.
Acest c
Ce va
la dac n loc de a studia un eantion suficient de mare vom folosi doar
trei elevi? n acest
caz exist o proba-
rte re
elevi cu rezultate
foarte slabe sau cu
rezultate foarte
bune. n aceast
situaie, concluziile
pe care le tragem sunt eronate, deoarece eantionul ales nu este reprezentativ
pentru populaia investigat.
Pe msur ce cretem dimensiunea eantionului, crete i probabilita-
tea de a selecta subieci cu scoruri deasupra i sub media populaiei, fapt ce
min reducerea erorilor de e
eantionu ui apr piindu-se din ce n
Figura 7.3 Distribuia coeficientului de
inteligen i a notelor la matematic
ntr-un capitol anterior, am discutat despre teorema lim
oncept afirm c dac extragem mai multe eantioane dintr-o popula-
ie i calculm media acestor eantioane, media eantioanelor aproximeaz
cel mai bine media populaiei. n mod surprinztor, distribuia mediei eanti-
oanelor, n cazul unui numr mare de subieci (peste 30 de subieci) este o
distribuie normal, indiferent de modul n care variabila se distribuie la nive-
lul ntregii populaii. Pentru a nelege mai bine acest concept, s presupunem
c avem la dispoziie un zar. Dup cum tim, aruncnd un zar putem obine 1,
2, 3, 4, 5 sau 6. nsumnd aceste valori i mprind suma rezultat la ase,
pentru un eantion de 3 elevi
Putem selecta 3
elevi cu rezultate
foarte slabe
Putem selecta 3
elevi cu rezultate
foarte bune
218
Cristian Opariuc-Dan
rezult media teoretic a populaiei de 3,5. Acum s considerm un numr de
5 eantioane de cte 10 aruncri cu zarul. Poate nu v vine s credei, ns
chiar acum fac acest experiment pe care vi-l recomand i dumneavoastr. Iat
rezultatele pe care le obin:
Eantion 1: 1, 2, 1, 2, 6, 6, 4, 6, 4, 1 media = 3,6
Eantion 2: 2, 2, 1, 2, 6, 5, 6, 3, 3, 4 media = 3,4
Eantion 3: 4, 1, 2, 5, 6, 6, 3, 5, 5, 2 media = 3,9
Eantion 4: 4, 2, 2, 2, 5, 3, 1, 4, 3, 4 media = 3,0
Eantion 5: 5, 3, 4, 2, 6, 6, 1, 1, 4, 2 media = 3,4

Fiecare eantion are o medie d
un sens sau altul de la media popula
iferit de media teoretic, se abate ntr-
iei 3,5. Dac aplicm principiile teore-
ia acestor eantioane. Adunai toate cele
ei valoarea 3,46 care iat, aproximeaz
d similar, aceste principii se aplic
mei limitei centrale, vom realiza med
cinci medii i mprii la cinci. Obin
cel m o i n
caz
ondaj (m) obinut pe baza unui eantion reprezint un es-
eoarece tinde spre valoarea teoretic pe msura creterii
rvaii, nedeplasat, eficient, fiind estimatorul cu cea mai
media populaiei i suficient n sensul c nici o alt estima-
aii suplimentare cu privire la parametrul estimat.
99
sondaj aproximeaz bine media populaiei, gravitnd n
nu tim ct de bine o apro
100 de grame, s nu v atepta
00 de grame. Vei observa pe ambalaj o specificaie im-
acest interval, numit i interval de ncredere. Dac vom evalua o caracteris-
ai bine media populaiei. n m
ul cercetrilor tiinifice.
Media de s
timator consistent, d
numrului de obse
mic abatere de la
re nu ofer inform
(Vasilescu, 1 2).
Dei media de
jurul acesteia, noi
pung de cafea de
cntreasc exact 1
portant: 100 de grame 5 grame. Ce nseamn acest lucru? nseamn c
punga dumneavoastr conine minimum 95 de grame i maximum 105 grame
de cafea. Cantitatea exact de cafea se gsete undeva ntre aceste limite, n
ximeaz. Dac vei cumpra o
i ca punga respectiv s
219
Statistic aplicat n tiinele socio-umane
tic a populaiei prin mai multe eantioane, mediile fiecrui eantion vor re-
prezenta estimri punctuale ale parametrului populaiei, estimri situate, n
general
indicator ne ofer un interval de valori ntre limitele cru
dia real a populaiei studiate.
Nu ntmpltor am menionat anterior o proprieta
a repartiiei mediei eantioanelor care tinde spre o distrib
rent de modul n care se distribuie real variabila la nivelu
cnd acest lucru, ne amintim c distribuia normal este c
prin medie i abaterea s pte ne v
nm intervalul de
n figura numrul 7.4, am reprezentat distribuia
laiei este
i va r
Media
, n acest interval de ncredere. De aceea, putem spune c media de
sondaj este un estimator punctual al mediei populaiei n timp ce intervalul
de ncredere reprezint un estimator de interval al mediei populaiei. Acest
ia putem regsi me-
te foarte important
uie normal, indife-
l populaiei. Cunos-
omplet caracterizat
or ajuta s determi-
nlimii brbailor
din Romnia. Evident, media acestei
caracteristici la nivelul popu
tandard iar aceste conce
ncredere.
mne necunoscut. Dac vom
extrage cteva eantioane din popula-
ie, mediile obinute le vom putea re-
prezenta prin punctele de pe grafic.
fiecrui eantion se abate n
sens pozitiv i negativ de la media rea-
l, ns dac am face media acestor
eantioane ne-am apropia cel mai bine de valoarea exact a acestui parame-
tru.
Figura 7.4 Distribuia nlimii brbai-
lor din Romnia
?
220
Cristian Opariuc-Dan
Dar, dup cum am
spus, media eantioanelor are
proprietatea de a se distribui
normal. Folosind acest ele-
ment i proprieti
iei normale, pute
cu ct se abate m
eantion fa de m
tic care rmne n conti-
nuare necunoscut stabilind
astfel i
i standard, pentru o probabilitate de aproximativ
a populaiei conine media de sondaj, adic
le distribu-
m calcula
edia unui
edia teore-
ntervalul de ncredere.
n mod practic, mediile ean-
tioanelor se vor abate de la
media teoretic cu un numr de abateri standard sau, mai precis, vor do-
bndi, fiecare, o cot z. Indiferent de eantion, media acestui eantion se poa-
te situa ntre -3 i + 3 abater
Figura 7.5 Distribuia normal a nlimii brbai-
lor din Romnia
?
99,74%. Acest interval este ns prea mare i
permite mediei de sondaj s aib aproximativ
orice valoare din domeniul de variaie al nl-
imii brbailor din Romnia. n general, tre-
buie s ne asigurm, la un nivel de probabili-
tate de 95%, c zona din curba de distribuie
intervalul de ncredere al mediei are o preci-
zie de 95%, existnd mai puin de 5% anse
ca media populaiei s nu fie coninut n
acest interval. n termeni de abateri standard, zona corespunztoare unui
terval de ncredere de 95% se afl situat ntre 1,96 i + 1,96 abateri stan-
dard.
Figura 7.6 Zona distribuiei nor-
male corespunztoare unui interval
de ncredere de 95%
221
Statistic aplicat n tiinele socio-umane
Urmnd firul logic, dac scorul z al mediei eantionului se afl situat
ntre 1,96 i + 1,96 abateri standard, nseamn c aceast medie aproximea-
z suficient de bine media teoretic sau media populaiei la un nivel de n-
credere de 95%. Dac v amintii, o proce-
dur similar am utilizat atunci cnd am
analizat simetria i boltirea unei distribuii.
Abaterile mediilor de sondaj fa de
dard a mediei. Eroarea standard a mediei re-
media
n
prezint
abilirea real a intervalului de ncre-
ntion aproximeaz media real a po-
putea estima eroarea standard a me-
eantioane din populaie, de a calcula
ndard a acestora dup unul dintre
r -
n cercetarea m cu un
ndard a mediei este n legtur cu
n i abaterea standard a acestuia. Cu ct
eantionul este mai mare, cu att eroarea standard este mai mic i invers. O
bun aproximare a erorii standard a mediei este dat de raportul dintre abate-
rea standard a rezultatelor obinute de ctre subiecii din eantion i rdcina
ptrat din volumul eantionului.
teoretic seamn foarte mult cu un
alt indicator studiat anterior, ca msur a
mprtierii, i anume abaterea standard. De
fapt, abaterea standard a mediilor eantioa-
nelor reprezint un alt concept statistic care
poart numele de eroare sta
Figura 7.7 Media eantionului
ntr-un interval de ncredere de
95%
o msur n care media unui eantion deviaz de la media eantioa-
nelor, avnd o importan deosebit n st
dere i a msurii n care media unui ea
pulaiei.
Metoda tradiional prin care am
diei ar fi aceea de a extrage mai multe
media eantioanelor i apoi abaterea sta
procedeele descrise n capitolele anterioa
pl, deoarece, de cele mai multe ori,
singur eantion. Din fericire, eroarea sta
mrimea eantionului aa cum am artat anterior i poate fi calculat cu-
nosc
e. Totui, acest lucru nu se ntm
tiinific lucr
d doar mrimea eantionului
222
Cristian Opariuc-Dan
Eroarea standard a medi
formulei:
S
m
ei poate fi aadar calculat prin intermediul
=
c
n
(formula 7.1)
unde S
m
reprezint ero
standard a scorurilor la variabil
lui.
Vom considera valorile
n centimetri: 182, 175, 174, 1
180, 172, 177, 193, 184, 192,
172, 179, 188. tim c am ms
scorurile anterioare, distribuia
standard de 5,23 centimetri.
Dac aplicm acum formula, vom obine eroarea standard a mediei de
S
m
=
5,23
area standard
a analizat i
ce reprezint
89, 177, 177,
172,
ur
avnd media de 183,2 centimetri i abaterea
30
a mediei, reprezint abaterea
n reprezint volumul eantionu-
nlimea subiecilor exprimat
180, 173, 188, 171, 184, 192,
177, 174, 171, 172, 179, 185, 179, 173,
inut at un eantion de 30 de brbai i am ob
=
5,23
5,47
= u,9S. ntr-adevr, n acest caz eroarea standard a mediei
imnd bine media general a populaiei.
ard a mediei, putem acum estima limitele n-
() la un interval de ncredere de 95%. Dup
standard, pe o distribuie normal, intervalul
lului de 95% este situat ntre +/- 1,96 abateri
alul de ncredere al mediei teoretice poate fi
este destul de mic, media aprox
Cunoscnd eroarea stand
tre care gsim media populaiei
cum tim, n termeni de abateri
de ncredere corespunztor nive
standard. Particulariznd, interv
calc
6
c
n
ulat dup formula:
p = m +1,9 = m +1,96 S
m
(formula 7.2)
n cazul nostru, media nlimii celor 30 de subieci este de 183,5
centimetri iar eroarea standard a mediei este de 0,95 centimetri. Limita infe-
rioar a intervalului de ncredere va fi de 183,5 1,96x0,95 = 181,67 centi-
metri iar limita superioar a intervalului de ncredere va fi de 185,36 centi-
223
Statistic aplicat n tiinele socio-umane
metri. C
socio-umane
pn acum, ar fi momentul s
utilizm ori de cte ori suntem n
faa de tiinele socio-umane. Abordez
lte ori, n rndul cercettorilor
radoxale. Ce spunei, de exem-
entele, vedem ce iese i dup
i confruntat sau nu cu o aseme-
sul multor lu de licen i
izat, care se raporteaz la urmtoarele aspecte
(Dowd
etoda statistic intervine n etapa a cincia,
etapa interpretrii datelor. Deoarece o interpretare a datelor presupune ns i
u alte cuvinte, ntre 181,67 centimetri i 185,36 centimetri se va afla
media de nlime a populaiei masculine din Romnia.
VII.3Metoda tiinific n tiinele
Avnd n vedere informaiile prezentate
discutm despre metoda tiinific pe care o
sfurrii unui studiu serios i valid n
aceast problem pentru c, am vzut de mu
sau al cadrelor universitare, opinii cel puin pa
plu, de o replic de genul: Aplicai instrum
aceea formulm ipotezele. Nu tiu dac v-a
nea atitudine. Eu m-am confruntat pe parcur
chiar teze de doctorat i am rmas stupefiat de lipsa elementar de cunotine
n ceea ce privete metoda tiinific. Este la fel ca i cum am spune: Con-
struim acoperiul, vedem cum arat i dup aceea facem fundaia i pereii.
Un asemenea demers este unul diletantist, amatoricesc, care nu are nici o
legtur cu cercetarea tiinific. Demersul tiinific presupune, de fiecare
dat, un proces strict etap
crri
y, i alii, 2004):
1. Enunarea problemei;
2. Formularea ipotezelor;
3. Proiectarea cercetrii;
4. Efectuarea observaiilor;
5. Interpretarea datelor;
6. Formularea concluziilor.
Dei nu intenionez abordarea n detaliu a tuturor etapelor, a dori s
menionez faptul c, n principal, m
224
Cristian Opariuc-Dan
o colec
mularea ipotezelor ct n etapa proiectrii experimentului sau a
sondajului. Numai n acest
de date care va face posibil l ctre etapa a
asea
Enunarea problemei
oarece, la ora actual, problema este insolvabil.
nui
numr
mult timp de ctre Newton.
Referitor la a ertinente este de domeniul
metaanalizei, enun i pe
care l
tare corect a lor, cunotine de statistic sunt necesare att n etapa a
doua for i
mod ne putem asigura de prezena unui set valid
interpretarea acestora i transferu
etapa formulrii concluziilor. Iat motivul pentru care fiecare dintre
aceste ase etape vor fi analizate separat.
VII.3.1
Enunarea problemei vi se pare, probabil, cea mai simpl etap a de-
mersului tiinific. Trebuie s v informez, de la nceput, c acest stadiu nu
este deloc simplu i necesit un mare volum de cunotine, o bun intuiie
tiinific, un volum impresionant de observaii i, de asemenea, un potenial
creativ. Pot, spre exemplu, s enun problema cltoriei n timp. Demersul
tiinific va eua din start, de
O problem apare n urma unui mare numr de observaii. Pot constata, de
exemplu, c un element major al ineficienei instituionale l reprezint inca-
pacitatea de comunicare la diferitele structuri ierarhice din cadrul instituiei.
Aceast problem, pe care mi-o propun spre soluionare, rezult n urma u
semnificativ de observaii referitoare la analiza dinamicii i a climatu-
lui organizaional la nivelul multiplelor instituii. n acelai timp, trebuie s
ne asigurm de faptul c problema nu are nc o soluie pertinent. Degeaba
observ c stnd la umbra unui mr, mi cade un fruct n cap. Poate voi fi ca-
pabil s m ntreb de ce cade, s mi pun problema i apoi s gsesc explica-
ia. ns aceast problem a fost rezolvat acum
cest aspect, investigarea soluiilor p
demers ce ar trebui s precead etapa rii problemei
vom aborda n al treilea volum al prezentei lucrri.
Legturile omului de tiin cu domeniul investigat sunt, din nou, de
mare importan. Am depit epoca renascentist n care un om putea fi foar-
te bun n chimie, fizic, anatomie, arte, matematici i aa mai departe. Volu-
225
Statistic aplicat n tiinele socio-umane
mul de cunotine acumulat de omenire este att de mare, nct chiar ntr-un
subdomeniu limitat, fiina uman este depit. Vorbind de psihologie ca s
nu lum n discuie domeniul supraordonat al tiinelor socio-umane numai
e c un me-
dic est
tisfctor metoda statistic, n momentul n care
apare nec c ce presupune analiza datelor, n locul
unui efort pe termen scurt de abordare pe cont propriu al unui domeniu n
care com
nunarea problemei presupune formula-
rea explicii. n urma formulrii proble-
me iective exprimate n termeni de obiecti-
ve generale i specifice.
Obiectivele generale ghideaz cercetarea n ansamblul ei. Un studiu
tiinifi
un diletant poate pretinde c e psiholog. Este ca i cum a spun
e pur i simplu medic. Evident c e medic, ns n ce? n ortopedie,
pediatrie, neurologie, oftalmologie i aa mai departe. La fel, un psiholog
poate fi psihoterapeut, experimentalist, consilier colar, specialist n organi-
zaii, n psihologia social etc. Mie, de exemplu, mi place psihologia expe-
rimental i n special metoda statistic. Totui, la momentul n care scriu
aceste rnduri, consider c tiu cel mult 15-20% din metoda statistic i m
ntreb dac mi va ajunge viaa s dein un procent de 50-60%, dei studiul
acestei metode face parte din activitatea mea zilnic. n aceste condiii, cum
a putea oare s formulez o problem din domeniul psihoterapiei, ca s nu
mai vorbim de domeniul chimiei sau al astronomiei. Poate pare deplasat, ns
sunt adeptul strictei specializri i al lucrului n echipe multidisciplinare. Da-
c sunt psihoterapeut, desigur, am anumite cunotine de statistic psihologi-
c, ns nu m pot considera un expert n aceast problem. Este de preferat
lucrul ntr-o echip cu un specialist n psihologie experimental, care stp-
nete la un nivel perfect sa
e t sita ea unui studiu tiinifi
petenele sunt mediocre.
Dincolo de aceste meniuni, e
acesteia n scris, n termeni clari i
i, rezult obiectivele cercetrii, ob
c are unul, maxim dou obiective generale. Nu ne putem concentra
eforturile pe mai multe planuri ori planurile sunt ghidate exact de modul de
formulare al obiectivelor generale.
226
Cristian Opariuc-Dan
Obiectivele generale ale unei cercetri sunt formulate n urma unui
cumul de observaii i, eventual, n urma unui studiu metaanalitic. n ultima
situaie, este necesar prezentarea rezultatelor studiului metaanalitic care a
ghidat formularea obiectivului general i prin care se demonstreaz lipsa de
abordare sau abordarea nepertinet a problemei studiate. Spre exemplu, con-
statm c pe msur ce crete numrul de kilometri parcuri cu un automobil,
crete i riscul de apariie al unui accident i ne propunem s studiem tiini-
bui s ncepem prin a analiza cer-
cetrile
ipoteze
fic aceast problem. n mod normal, ar tre
existente n acest domeniu i s desfurm un studiu metaanalitic. n
urma acestui studiu, putem preciza obiectivul general al cercetrii, de forma:
Obiectivul general al cercetrii l reprezint stabilirea relaiei existente
ntre numrul de kilometri parcuri i probabilitatea de apariie a unui acci-
dent rutier. Observm c enunarea problemei ce urmeaz a fi studiat s-a
fcut extrem de clar i explicit, astfel nct se pot defini termenii i condiiile
proiectrii unui studiu experimental sau a unei cercetri bazate pe sondaj.
Obiectivele specifice reprezint aspecte detaliate ale investigaiei ti-
inifice, deriv din obiectivul general i creeaz baza formulrii ipotezelor de
cercetare (alternative). n funcie de dimensiunile cercetrii i de resursele pe
care le are la dispoziie cercettorul, se pot formula unul, dou, trei dou-
zeci de obiective specifice, aflate n legtur cu obiectivul general.
Concluzionnd, enunarea problemei reprezint prima etap a demer-
sului tiinific. Ea este nsoit de un studiu al cercetrilor n domeniu i de
prezentarea clar i precis, n termeni cuantificabili, a obiectivelor generale
i specifice.
VII.3.2 Formularea ipotezelor
A doua etap a demersului tiinific este reprezentat de formularea
lor cercetrii. O ipotez reprezint o prezumie clar, explicit i veri-
ficabil referitoare la relaiile sau diferenele existente ntre dou sau mai
multe variabile. Plecnd de la definiia menionat mai sus, rezult faptul c o
227
Statistic aplicat n tiinele socio-umane
ipotez de cercetare este legat, evident, de obiectivele cercetrii. Deoarece o
ipotez urmeaz s fie testat statistic, formularea acesteia trebuie fcut n
termeni de claritate maxim, fr ambiguiti, demersul testrii ipotezelor
fiind unul logic i demonstrabil prin procedee statistice specifice.
Deoarece formularea ipotezelor i nelegerea logicii testrii acestora
reprezint un element vital n cercetarea tiinific, vom analiza pe larg mo-
dalitatea prin care sunt elaborate i verificate ipotezele.
Ipotezele sunt formulate att n cazul studiilor care urmresc stabilirea
unor relaii dintre variabile (numite i studii corelaionale) ct i pentru cerce-
trile ce vizeaz existena unor diferene dintre variabile (studii factoriale). O
prim distincie se poate face ntre ipoteze unilaterale (unidirecionale) i
ipoteze bilaterale (bidirecionale) (Clocotici, i alii, 2000).
Ipotezele unilaterale se utilizeaz n momentul n care avem
o idee de sensul, direcia n care evolueaz variabilele. Aceste
ipoteze sunt mai precise i permit dezvoltarea unor studii per-
tinente, existnd anse mai mari s fie susinute de analiza da-
telor. O ipotez unilateral se recunoate dup modul de for-
mulare, deoarece n enunul acesteia regsim direcia de evolu-
ie a variabilelor. De exemplu, dac desfurm o cercetare ca-
re are ca scop analiza legturii dintre anxietate i depresie, am
putea formula o ipotez unidirecional de tipul: exist o le-
ii cu anxietate mare manifest i puternice
gtur pozitiv ntre nivelul anxietii i nivelul depresiei. n
aceast situaie, ipoteza va fi susinut numai n cazul n care
legtura dintre anxietate i depresie este pozitiv, adic n situ-
aia n care subiec
simptome depresive sau subiecii cu anxietate mic nu prezint
simptome depresive. Ipoteza nu se susine dac, de exemplu,
subiecii cu anxietate mic manifest puternice simptome de-
presive (cazul unei corelaii negative). Dei mult mai precis,
228
Cristian Opariuc-Dan
exist n permanen riscul s nu putem susine ipoteza n con-
diiile n care sensul formulat nu este reprezentat de datele cer-
cetrii, chiar dac n urma analizei pot rezulta i alte sensuri
specifice;
Ipotezele bilaterale nu impun direcia de evoluie a variabile-
lor. Dei mai puin precise n comparaie cu cele unilaterale,
ipotezele bilaterale ofer o mai mare libertate cercettorului. O
formulare de genul exist o legtur ntre nivelul de anxieta-
te i predominana simptomelor depresive poate fi susinut
att n cazul n care corelaia este pozitiv ct i n situaia unei
corelaii negative. Ipoteza nu este susinut doar n condiiile
n care, cu o mare probabilitate, se demonstreaz inexistena
unei asemenea relaii.
Chiar dac vi se poate prea puin ciudat, testarea unei ipoteze nu se
face prin formularea m
oate fi enunat astfel:
ntre nivelul de anxietate i ni-
velul de
enionat mai sus denumit i ipotez alternativ
ci printr-un fel de invers al acesteia pe care l numim n statistic ipoteza
nul sau ipoteza statistic. Testarea unei ipoteze nseamn, de fapt, testarea
ipotezei nule n vederea respingerii sau nerespingerii acesteia.
VII.3.2.1 Ipoteza nul i ipoteza alternativ
nainte de a aborta testarea ipotezelor, ar trebui s nelegem foarte
clar ce nseamn ipoteza nul i ipoteza alternativ.
Relund exemplul de mai sus, ipoteza alternativ se noteaz, de obi-
cei, cu H
1
i p
H
1
: Presupunem c exist o legtur
depresie.
Din punct de vedere statistic, nu putem verifica direct aceast ipotez.
Singura modalitate prin care putem sprijini ipoteza alternativ este s enun-
229
Statistic aplicat n tiinele socio-umane
m i apoi s testm ipoteza nul. De obicei, ipoteza nul notat cu H
0

este o negare logic a ipotezei alternative i poate fi formulat astfel:
H
0
: Nu exist nici o legtur ntre nivelul de anxietate i nivelul de
depresie.
ntr-o cercetare, exist o singur ipotez nul i una sau mai multe
ipoteze alternative. Ipoteza nul este cea care orienteaz planul (designul)
cercetrii. Dac n urma analizei datelor respingem ipoteza nul, nseamn c
datele
au s nu respin-
ge
place.
plu, logica test
tura d
punem de dou
msoar
s zicem
exist
tragerea un
unui e
deauna exist
obinut pe b
babilit
condi
mome
bilitatea de ob
noastre susin una dintre ipotezele alternative. Dac ipoteza nul nu
este respins, datele nu sprijin ipoteza alternativ.
Acesta este singura modalitate prin care se poate testa o ipotez. Rei-
nei c nu putem confirma sau infirma ipoteza alternativ i nici ipoteza nul.
Singurul lucru pe care l putem face este c respingem s
m ipoteza de nul. Nu v revoltai. Acesta este adevrul, chiar dac nu v
Pentru ca acest lucru s v devin clar, vom explica puin, prin exem-
rii ipotezei de mai sus. Cum ai proceda pentru a studia leg-
intre anxietate i depresie? Vom lua cazul cel mai simplu, n care dis-
chestionare, unul care msoar anxietatea i un al doilea care
depresia. Administrm apoi cele dou chestionare unui eantion de,
, 30 de subieci. Dup colectarea datelor, plecm de la ideea c nu
nici o legtur ntre nivelul de anxietate i nivelul depresiei.
Nu trebuie s uitm faptul c scopul acestei cercetri l reprezint ex-
ei concluzii valabil la nivelul ntregii populaii pe baza studiului
antion. Chiar dac observm o relaie ntre cele dou variabile, ntot-
o probabilitate mai mare sau mai mic ca rezultatul s fie
aza unei erori de eantionare. Ipoteza nul ne indic, de fapt, pro-
atea de a obine aceste date n condiiile n care ar fi adevrat, adic n
iile n care datele se obin n urma unei erori de eantionare. Practic, n
ntul n care calculm relaia dintre cele dou variabile, calculm proba-
inere a acestei relaii ca rezultat al unei erori de eantionare.
230
Cristian Opariuc-Dan
Oricnd ex
se reg
nivelul e
, s presupunem c gsim o relaie ntre anxietate i
de
Am lucrat totu
aceast
care a
(ipoteza nul
eviden
de mic
este ro
Acest ceva dect c, la doar 5 subieci dintr-o
sut de
t clarificarea modu-
lui n c
potezelor cuprinde patru
etape (D
bile;
ist posibilitatea ca relaia constatat la nivelul eantionului s nu
seasc ntr-adevr la nivelul populaiei, deoarece datele colectate la
antionului sunt rezultate n urma unei erori de eantionare.
n exemplul nostru
presie, n sensul c persoanele anxioase prezint i simptome depresive.
i pe un eantion i nu cu ntreaga populaie. nainte de a face
afirmaie valabil pentru ntreaga populaie, ne putem pune problema
r fi probabilitatea ca relaia pe care am descoperit-o s nu existe de fapt
), adic relaia s fie rezultatul unor erori de eantionare este,
t, o probabilitate condiionat. Dac aceast probabilitate este suficient
, s spunem 5%, atunci putem concluziona c relaia descoperit nu
dul unor erori de eantionare ci o putem regsi la nivelul populaiei.
procent de 5% nu nseamn alt
subieci relaia s-ar putea s nu se verifice. n acest caz, probabilitatea
ca ipoteza nul s fie adevrat este foarte mic i o putem respinge. Respin-
gnd ipoteza nul, putem sprijini ipoteza alternativ. Nu am spus c o con-
firmm sau c o acceptm. n realitate ipoteza alternativ nu poate fi confir-
mat sau acceptat, deoarece n permanen apare excepia (cele 5 persoane
dintr-o sut) pentru care ipoteza alternativ nu este adevrat.
Sperm c n baza exemplului de mai sus ai reui
are are loc testarea ipotezelor ntr-o cercetare tiinific. Dac ar fi s
concluzionm, am putea spune c logica testrii i
ancey, i alii, 2002):
Formularea ipotezei;
Msurarea variabilelor implicate i stabilirea relaiilor dintre
varia
Calcularea probabilitii de obinere a acestor relaii n condii-
ile n care relaiile de fapt nu exist la nivelul populaiei;
231
Statistic aplicat n tiinele socio-umane
Dac probabilitatea calculat n etapa anterioar este destul de
mic, atunci exist o probabilitate foarte mare ca relaia des-
tim meniune referitoare la ipoteza nul. n general, cercettorii
conside
probabilitatea ca aceast
relaie s fie rezultatul unor erori de eantionare este foarte mare i nu trebuie
ignorat
de cazuri)
iar al d
coperit s se regseasc la nivelul populaiei.
O ul
r ipoteza nul o ipotez a absenei. (Sava, 2004). Aceast abordare
este o abordare eronat. Ipoteza nul nu nseamn lipsa unei corelaii sau
lipsa unei diferene dintre medii ci probabilitatea ca diferena sau corelaia s
fie obinut ca rezultat al unei erori de eantionare. O legtur ntre dou
variabile, chiar foarte sczut, exist totui, doar c
. Prin urmare, ipoteza nul nu afirm de fapt c nu exist o legtur ci
trebuie privit mai degrab ca o ipoteza ce urmeaz s fie anulat i nu ca
ipoteza absenei.
VII.3.2.2 Semnificaie i eroare n testarea ipotezelor
Am afirmat c putem respinge ipoteza nul (ipoteza conform creia
relaia obinut este determinat de erorile de eantionare) dac probabilitatea
s fie adevrat este foarte mic. Bine, m vei ntreba, dar ct de mic? Care
este pragul la care putem respinge ipoteza nul? n cercetarea tiinific lu-
crm cu dou asemenea praguri de semnificaie. Primul prag a fost postulat
de Fisher i reprezint probabilitatea de 0,05 (5% sau 1 caz din 20
oilea prag de semnificaie reprezint probabilitatea de 0,01 (1% sau 1
caz din 100 de cazuri).
Pragul de semnificaie reprezint probabilitatea (de 5% sau 1%) ca
ipoteza nul s nu fie respins sau, cu alte cuvinte, la 1 din 20 de cazuri sau la
1 din 100 de cazuri relaia s nu existe ori s fie determinat de erorile de
eantionare.
Pragul de semnificaie se noteaz, n literatura de specialitate, cu p sau
cu i permite respingerea ipotezei nule n condiiile unor valori strict mai
232
Cristian Opariuc-Dan
mici dect p (atunci cnd p<0,05). De asemenea, un indicator statistic poate
fi semnificativ sau nesemnificativ n funcie de raportarea la acest prag.
Presupunnd c ipoteza nul este adevrat, dac probabilitatea ca re-
laia s
ei de nul. Un
metod este preferat, deoarece permite o
ii de respingere a ipotezei de nul.
stice, printre care i SPSS, raporteaz
s precizai un p=0,000, acest lucru nsemnnd o
a-
fie obinut prin intermediul erorilor de sondaj este mai mic de 0,05
(5%) atunci se poate respinge ipoteza nul iar indicatorul statistic este semni-
ficativ. n exemplul nostru, putem respinge ipoteza nul i putem afirma c
exist o legtur semnificativ ntre nivelul anxietii i nivelul depresiei. n
aceleai condiii, dac probabilitatea ca relaia s fie obinut prin intermediul
erorilor de sondaj este mai mare de 0,05, indicatorul nu este semnificativ iar
ipoteza nul nu poate fi respins. Vom putea atunci afirma c nu exist nici o
legtur semnificativ ntre nivelul anxietii i nivelul depresiei.
n orice lucrare tiinific, alturi de valoarea indicatorului statistic se
raporteaz i valoarea pragului de semnificaie. Exist dou modaliti prin
care putei raporta pragul de semnificaie:
prin raportarea inegalitii, de forma p<0,05 sau p<0,01.
Aceast modalitate, dei nc practicat, nu este extrem de
agreat n comunitatea tiinific deoarece permite o raportare
grosier a probabilitii de respingere a ipotez
p<0,05 poate nsemna att o probabilitate de 0,49 dar i o pro-
babilitate de 0,11;
prin raportarea exact a pragului de semnificaie, de forma
p=0,38. Aceast
evaluare exact a probabilit
Unele programe stati
uneori pragul de semnificaie de forma .000, adic 0,000. Este
o greeal
probabilitate nul de obinere a relaiei prin eroarea de eanti-
onare, ceea ce nu poate fi posibil. Deoarece SPSS rotunjete la
trei zecimale, probabil c pragul real de semnificaie este o v
233
Statistic aplicat n tiinele socio-umane
loare de genul 0,0000001457. n acest caz, se prefer prima
modalitate de raportare, de genul p<0,01.
Atunci cnd discutm de semnificaie, trebuie s avem n vedere fap-
tul c n
t. Aceast valoare nu indic probabilitatea de apariie a
de 0,05
tarea tiinific, dei condiiile de semnificaie statis-
tic pot f
e referim la o semnificaie statistic i nu la semnificaia psihologic,
social sau economic. Afirmaia conform creia exist o corelaie semnifica-
tiv ntre nivelul de anxietate i nivelul depresiei la un prag de semnificaie
mai mic de 0,05 nu nseamn altceva dect c, la nivelul populaiei, exist o
probabilitate mai mic de 5% ca s nu fie nici o relaie ntre anxietate i de-
presie. Att. Semnificaia statistic nu implic o interpretare psihologic a
acestei legturi.
Valoarea pragului de semnificaie reprezint o probabilitate condiio-
nat, probabilitatea de apariie a unui eveniment n condiiile n care ipoteza
nul este adevra
evenimentului la nivelul populaiei. Un prag de semnificaie mai mic
ne spune doar c sunt mai puin de 5% anse ca relaia dintre anxietate i de-
presie s fie rezultatul unei erori de eantionare. Acest lucru ns nu nseamn
c avem peste 95% anse s regsim relaia la nivelul populaiei. Dup cum
am mai afirmat, testarea ipotezelor presupune doar testarea ipotezei nule nu i
inferene referitoare la ipoteza alternativ.
Chiar dac pragul de semnificaie creeaz condiiile respingerii ipote-
zei nule, totui nu vom putea niciodat afirma cu certitudine c susinem ipo-
teza alternativ. n cerce
i ndeplinite, este posibil apariia a dou tipuri de erori: putem res-
pinge ipoteza nul iar n realitate ea s nu ndeplineasc condiiile de respin-
gere la nivelul populaiei sau putem s nu respingem ipoteza nul n situaia
n care ar trebui respins.
Cnd credeai i dumneavoastr c ai scpat de lucrurile astea ce pre-
supun logica probabilitilor, iat un nou concept care are darul s v ame-
easc. Personal m mir c nu ai trecut nc la lectura unui volum de poveti.
234
Cristian Opariuc-Dan
i dac tot veni vorba de poveti, s v relatez o poveste pe care mi-a spus-o
pe vremuri Ovidiu Lungu i care v va lmuri cu privire la natura acestor
erori.
ea ceva no-
iuni le

Ce a prev
c se nt
Eroare tip II
p=
p=1-
Puterea testului
de patru situa
A fost odat un mprat care avea obiceiul s poarte multe rzboaie.
nainte de a merge la rzboi, mpratul nostru chema vrjitorul curii i l pu-
nea s-i prezic soarta btliei. De fiecare dat, bietul vrjitor era n mare
impas deoarece dac greea previziunea risca s-i piard capul cum o pise-
r muli alii naintea lui. Totui, vrjitorul avea muli ani de cnd i pstra
capul pe umeri iar prediciile acestuia, uneori se dovedeau a fi adevrate. n-
trebarea mea este cum proceda? n primul rnd, vrjitor fiind, el citise aceast
carte i celelalte dou care urmeaz s apar. n al doilea rnd, av
gate de probabiliti i verificarea ipotezelor i naintea btliei i
formula ipotezele, apoi construia un tabel similar tabelului de mai jos:
H
1
: Prevd c mria sa va ctiga btlia
H
0
: Prevd c mria sa nu va ctiga btlia

Ce se ntmpl n urma btliei
Ctig Pierde
zut
mpl
Ctig
OK
p= 1-
Caracteristica testului
Eroare tip I
p=
Pragul de semnificaie
Pierde
OK

S analizm acum tabelul de mai sus. Observm c exist un numr
ii:
Vrjitorul a prezis c mpratul va ctiga btlia i mpratul
a ctigat-o. Aceasta este situaia descris pn acum. Vrjito-
rul respinge ipoteza nul i susine ipoteza alternativ deoarece
probabilitatea de a nu ctiga btlia era foarte mic. Cellalt
mprat avea probabil un numr mic de oameni i o tehnic de
235
Statistic aplicat n tiinele socio-umane
lupt net inferioar. Vrjitorul a obinut o nou avere i res-
pectul mpratului;
Vrjitorul a prezis ctigarea btliei i mpratul a pierdut-o.
S-a comis astfel o eroare de tip I, respingndu-se ipoteza nul
cnd de fapt ar fi trebuit acceptat. Pragul de semnificaie a
fost probabil apropiat de limit (0,05) ns vrjitorul a riscat.
i-a pierdut i averea i capul. Este cea mai grav eroare pe
care o poate face. Probabil c s-a bazat pe faptul c cellalt
mprat are puini oameni i o tehnic de lupt inferioar ns
l-au dezinformat spionii i a subapreciat fanatismul ostailor;
proba-
tip II i invers.
Vrjitorul a prezis pierderea btliei i mpratul a ctigat-o.
S-a comis acum o eroare de tip II, nerespingnd ipoteza nul
n condiiile n care ar fi trebuit respins. n bucuria victoriei,
mpratul s-ar putea s-i crue capul vrjitorului ns va pierde
respectul i o parte din avere. Vrjitorul nu a vrut s rite de-
oarece cunotea fanatismul lupttorilor celuilalt mprat;
Vrjitorul a prezis pierderea btliei i mpratul a pierdut-o.
Din fericire i-a pstrat i capul i averea deoarece a avut ne-
lepciunea c calculeze puterea unui test statistic, adic
bilitatea de a respinge ipoteza nul atunci cnd ea este fals.
Dup cum ai putut observa, eroarea de tip I este situaia n care un
cercettor respinge ipoteza nul n condiiile n care aceasta nu ar fi trebuit
respins iar eroarea de tip doi este situaia n care nu se respinge ipoteza nul
dei ar trebui respins. Cele dou tipuri de erori se afl ntr-un raport invers
proporional. Pe msur ce cresc ansele de apariie a erorii de tip I, scad an-
sele de apariie a erorii de
236
Cristian Opariuc-Dan
Din nefericire, cele mai multe cercetri risc apariia unei erori de tip
I, care am vzut c este i cea mai grav, neglijnd posibilitatea de apariie a
erorii de tip II.
pul pe
umeri atia ani? Intuii deja c a lucrat la un prag de semnificaie de 0,01, n
care cr s scade probabilitatea unei erori
de tip I
Rolul acestor erori este deos presu-
punem c o firm de medicamente descoper un nou produs evo-
l ui n fecte e priv r
o serie de produse toxice. Problema care se pune este la
ce nivel de risc po eptate efectel ice n raport cu beneficiile pe care
le poate aduce medicamentul. n urma unui studiu, pot exista dou
ti:
ma posibilitate este cea corespunztoare unei erori de tip I.
Eroarea de tip I corespunde pragului de semnificaie de 0,05 (5%).
Avem 5% anse s respingem ipoteza nul n condiiile n care s-ar dovedi
adevrat. O probabilitate cam mare atunci cnd e n joc capul vrjitorului.
Eroarea de tip doi corespunde unui prag de semnificaie de 0,01 (1%).
De data aceasta avem doar 1% s respingem ipoteza nul n condiiile n care
s-ar dovedi adevrat, ns mult mai multe anse s nu o respingem cnd ar
trebui respins i astfel s comitem o eroare de tip II. Oricum, consecinele ar
fi mult mai blnde.
Putei acum s-mi spunei cum de i-a pstrat vrjitorul ca
ete riscul apariiei erorii de tip II, n
.
ebit de important n cercetare. S
care oprete
uia cancerul
deoarece genereaz
s are e secundare n ceea c ete viaa pacienilo
t fi acc e tox
posibili-
Pri
Medicamentul s fie pus pe pia n condiiile n care pragul de
semnificaie este de 0,05. S-a respins ipoteza nul conform c-
reia medicamentul este toxic i s-a optat n favoarea beneficii-
lor pe care le aduce. La un asemenea prag de semnificaie s-ar
237
Statistic aplicat n tiinele socio-umane
putea ca la nivelul populaiei tratamentul s provoace mai
multe decese dect vindecri;
tea cea m -
rea
lul de
dat un fenom
tmpl
re certitudine c
VII.3.2.3 Ipoteze unilaterale i bilaterale
zri suplim
lit deja c
recia exact
puterni
apete ale distribuiei - bilaterale.
Aceast denumire o ntlnim i n cadrul programului SPSS i nu ar fi ru s
aflm logica ce st n spatele acestor nume.
A doua posibilitate este cea corespunztoare unei erori de tip
II. Medicamentul s nu fie pus pe pia deoarece pragul de
semnificaie a fost mai mare de 0,01. Dei medicamentul poate
opri evoluia cancerului, totui riscul efectelor toxice este mult
prea mare pentru a fi acceptat. Oricum, este o situaie mult mai
convenabil n raport cu primul caz.
Cunoscnd aceste tipuri de erori, cum le putem totui evita? Modalita-
ai bun de evitare a erorilor este replicarea cercetrii prin proiecta
unui alt studiu. Dac n urma unui alt studiu rezultatele se pstreaz, nive-
ncredere n concluziile extrase va crete. Dac observm o singur
en, exist un mare risc ca aceast observaie s se datoreze n-
rii. Dac l observm de dou, trei, patru ori, putem afirma cu mai ma-
reprezint un fenomen real, reproductibil i generalizabil.
Importana acestei clasificri a ipotezelor de cercetare implic preci-
entare, n afara celor menionate n seciunea anterioar. Am stabi-
putem formula unidirecional o ipotez, atunci cnd precizm di-
a relaiilor dintre dou variabile (Exist o corelaie pozitiv
c ntre anxietate i depresie) sau bidirecional, atunci cnd nu pu-
tem anticipa exact natura relaiilor dintre variabile (Exist o corelaie ntre
anxietate i depresie). n literatura de specialitate prima situaie poart nu-
mele de one-tailed hypothesis iar a doua situaie two-tailed hypothesis
sau, ntr-o variant romneasc aproximativ ipoteze la un capt la distribu-
iei - unilaterale i ipoteze la ambele c
238
Cristian Opariuc-Dan
tim deja c
distribuia normal
prezint dou c
Probabilitate foarte mare de a
obine scoruri n zona central
apete,
dou e
ating ns niciodat i
am stu
a de a obine scoruri n zona central. Care ar fi probabi-
litatea
distribuiei. O persoan cu nlimea de 250 de centimetri are o pro-
babilita
el, un IQ de 60 are o probabilitate mic de apariie i se situeaz
sp
le. Ce se
nlim
Pe msur ce crete nlimea, crete i coeficientul de inteli-
gen. Persoanele cu nlime mare vor avea un coeficient de
xtreme care se
apropie de frecvena
zero pe care nu o
Probabilitate foarte mic de a obine
scoruri n zona extremelor
Probabilitate foarte mic de a obine
scoruri n zona extremelor

diat deja pro-
babilitatea de a obine
scoruri la capetele
distribuiei n compa-
raie cu probabilitate
Figura 7.8 Probabilitatea de a obine
scoruri n zona central a distribuiei n
comparaie cu extremele
de a ntlni o persoan cu nlimea de 178 de centimetri? Ne aducem
aminte c aceast valoare reprezint o nlime comun, cu probabilitate de
apariie mare, o persoan cu aceast nlime regsindu-se undeva n zona din
mijloc a
te de apariie foarte mic, situat undeva la captul din dreapta a dis-
tribuiei n timp ce o persoan cu nlimea de 120 de centimetri are de ase-
menea o probabilitate mic de apariie, undeva la captul din stnga al distri-
buiei. La fel procedm i n cazul n care discutm de o alt variabil, s
spunem coeficientul de inteligen. Un IQ de 110 este unul comun, pe care l
putem ntlni n zona de probabilitate mare. Un IQ de 180 este unul foarte
mare, cu o probabilitate de apariie mic, similar nlimii de 250 de centi-
metri. La f
re extrema stng a distribuiei.
Haidei s ne punem acum problema relaiei dintre cele dou variabi-
poate ntmpla cu coeficientul de inteligen pe msura variaiei
ii subiecilor? Pot exista mai multe variante posibile:
239
Statistic aplicat n tiinele socio-umane
sczut. Spunem n acest caz
creterea scorurilor la o
c creterea scorurilor la o variabil determin creterea scoru-
rilor la cea de-a doua variabil;
Pe msur ce crete nlimea, scade coeficientul de inteligen-
. Persoanele cu nlime mare au un coeficient de inteligen
sczut n timp ce persoanele scunde au un coeficient de inteli-
gen ridicat. Spunem n acest caz c
variabil determin micorarea scorurilor la a doua variabil.
Nu exist nici o relaie dintre cele dou variabile. ntlnim
persoane nalte cu coeficieni de inteligen mari i mici, la fel
i n cazul persoanelor scunde sau cu o nlime medie. n
acest caz spunem c cele dou variabile nu sunt relaionate,
sunt independente.
Teoretic sun frumos, ns ce ne facem c nlimea o msurm n
Q. Din ncurctur ne centimetri iar coeficientul de inteligen n uniti I
scoate capitolul anterior. Ne amintim c exist un sistem de note standardiza-
te, numit note z, care are proprietatea de a aduce la un numitor comun cele
dou variabile. Mai
mult, notele z sunt
note aditive i multi-
plicative. Dac am
transforma att nl-
imea ct i coeficien-
tul de inteligen n
note z, am putea
calcula un scor total i
am putea sa-l repre-
zentm pe o distribu-
Zona de obinere a notelor z n
condiiile n care variabilele sunt
independente
Figura 7.9 Reprezentarea relaiei dintre
dou variabile
Scoruri z obinute n cazul n ca
creterea unei variabile determin
cre
re

terea celeilalte variabile
Scoruri z obinute n cazul n care
creterea unei variabile determin
micorarea celeilalte variabile
240
Cristian Opariuc-Dan
ie norm l putem observa c .9, prezentat
ea de la semnificaia statistic, faptul c testele de
obabilitatea de obinere a unor diferene sau relaii
o
iei. Observm c aceste praguri corespund
la apro
o legtur sem-
nificativ, la un nivel mai mic de 5% ca datele s fie obinute printr-o eroare
de e
al. Acest lucru
mai sus.
tim de asemen
semnificaie explic pr
dintre dou variabile ca
bilitatea ca aceast relaie sau diferen
iei (Dancey, i alii, 2
pentru a fi respins ip
scorurile de mai sus s fi
rm acum o ipotez form
Exist o legtur semnificativ ntre nlimea subiecilor i coefici-
entul lor de inteligen.
Am formulat o ipotez bilateral, fr a preciza sensul acestei legturi.
Ipoteza nul (Nu exist nici o legtur semnificativ ntre nlimea subieci-
lor i coeficientul lor de inteligen)
poate fi respins la un prag de semnifi-
caie de 0,05 att pentru situaia n care
creterea nlimii subiecilor determin
creterea coeficientul lor de inteligen,
dar i n situaia n care creterea nl-
imii duce la scderea coeficientului de
inteligen. Acest prag de 5% va fi aa-
dar egal distribuit la captul din stnga
i la captul din dreapta al distribu
u uurin n figura 7
rezultat al unei erori de eantionare, indicnd proba-
s nu existe de fapt la nivelul popula-
002). Un prag de semnificaie de 0,05 nseamn c
teza nul, trebuie s existe mai puin de 5% anse ca
e obinute printr-o eroare de eantionare. S conside-
ulat n urmtorii termeni:
Figura 7.10 Reprezentarea zonelor de
respingere a ipotezei nule pentru ipotezele
bidirecionale
2,5% 2,5%
ximativ dou abateri standard la stnga i la dreapta mediei. Dac sco-
rurile z ale subiecilor investigai vor fi situate n aceste zone, putem stabili
legtura ntre nlimea i coeficientul de inteligen ca fiind
antionare.
241
Statistic aplicat n tiinele socio-umane
S considerm acum cel de-al doilea caz, n care formulm ipoteza
Exist o legtur semnificativ pozitiv ntre nlimea subiecilor i
tul lor de inteligen.
astfel:
coeficien
nlim
nlim
fi respi
de sem
zo
tiv 1,5
ei, aa cum
turat.
se n-
tmpl
gative (creterea unei variabile implic micorarea
situat aproximativ rd n stnga
abilitatea de a respinge ipoteza nul este mult mai
r unidirecionale n comparaie cu ipotezele bidireci-
lt mai mari s gsim scoruri n zona marcat din figura
na marcat n figura 7.10. n general, dac ai obinut
cazul unei ipoteze bidirecionale i dorii s aflai
entru ipotez unidirecional, vei njumti valoarea
dac obinei valoarea 0,04 n cazul unei ipoteze bidi-
ntul su pentru valorile unidirecionale este de 0,02.
Iat o ipotez unidirecional care ne spune foarte clar c la creterea
ii apare creterea coeficientului de inteligen i, similar, scderea
ii determin scderea coeficientului de inteligen. Ipoteza nul poate
ns n acest caz numai la un prag
nificaie mai mic de 0,05 situat n
na dreapt a distribuiei, la aproxima-
abateri standard la dreapta medi-
putei observa n figura al-
Nu suntem interesai ce
Figura 7.11 Reprezentarea zonelor de
5%
dac creterea nlimii implic
scderea coeficientului de inteligen.
Putem respinge ipoteza nul numai n cazul unei legturi pozitive ntre cele
dou variabile. n mod analog se poate arta zona de respingere a ipotezei
nule pentru legturile ne
celeilalte), aceasta fiind
mediei.
Observm c prob
mare n cazul ipotezelo
onale. Exist anse mu
7.11 n comparaie cu zo
pragul de semnificaie n
pragul de semnificaie p
acesteia. De exemplu,
recionale, coresponde
respingere a ipotezei nule pentru ipotezele
unidirecionale
la 1,5 abateri standa
242
Cristian Opariuc-Dan
Prin dublarea valorii pragului de semnificaie se poate obine valoarea acestu-
ia dac ai lucrat cu ipoteze unidirecionale i dorii s aflai pragul de semni-
ficaie
analiz
ercetri necesit rspunsul la o serie de ntrebri,
dintre c
teres i cum vor fi acestea msurate;
r fi efectuate msurtorile;
ura cercetarea.
de ce -
riab
nurilor de cercetare va fi tratat n
pentru o ipotez bidirecional.
VII.3.3 Proiectarea cercetrii
Metodele statistice reprezint un instrument de cercetare. Etapa de
proiectare a cercetrii nu face obiectul prezentei lucrri, existnd pe pia
suficient bibliografie care trateaz aceast tem. Abordm totui, pe scurt,
subiectul, din considerentele relaiei care exist ntre proiectarea unei cerce-
tri i analiza ulterioar a datelor. Nu putem obine niciodat mai mult dect
am proiectat iniial. Erorile de proiectare a cercetrii induc invariabil erori de
i interpretare a datelor.
Proiectarea unei c
are cele mai importante sunt (Dowdy, i alii, 2004):
Ce tratamente sau condiii vor fi aplicate subiecilor n vederea
testrii ipotezelor;
Care sunt variabilele de in
La ce nivel de precizie vo
Care va fi lotul de subieci pe care se va desf
Orice cercetare necesit un plan
tare. n urma acestui plan se stabilesc va
rul de subieci necesar. Problematica pla
detaliu n volumul al doilea al lucrrii, n timp ce proiectarea eantionului sau
a lotului de subieci va face subiectul urmtorului capitol.
rcetare numit i design de cerce
ilele ce vor fi analizate i num-
243
Statistic aplicat n tiinele socio-umane
VII.3.4
Cel puin la nivel teoretic, un studiu nu trebuie s conin alte erori
except
asemenea erori determinate de in-
ntului) de influena cercettorului
a sugerrii rspunsurilor) de
de a fi influenat de evalurile ante-
ori de subiecii nii.
ediat dup efectuarea observaiilor se impune inspecia datelor n
vederea cons
ede
de corecie i ajustare a datelor nu
. n urma acestui studiu se decide norma-
litatea
Efectuarea observaiilor
nd erorile aleatorii de msurtoare determinate de erorile instrumente-
lor de msur.
n literatura de specialitate se vehiculeaz frecvent termenul de bias
vorbindu-se, chiar i la noi n ar, de studii biasate. Biasul reprezint tendin-
a de afectare a msurrii unei variabile de ctre anumii factori externi
(Dowdy, i alii, 2004). Exist surse de
strumente (erori de calibrare a instrume
(proiectarea unui interviu n care exist tendin
efectele de halo (tendina unei evaluator
rioare) sau chiar de condiiile atmosferice
Im
depistrii unor valori extreme, in
sistenele de acest tip vor fi analizate n v
minrii acestora n cazul n care metodele
determin rezultate satisfctoare. Detalii despre aceste procedee ntlnii n
capitolele anterioare.
VII.3.5 Interpretarea datelor
Procesul de interpretare a datelor debuteaz, dup cum am afirmat, cu
analiza inventarului statistic de baz
istente cu celelalte date. Incon-
rea corectrii datelor sau a eli-
sau lipsa de normalitate a unei distribuii, dup care se aleg testele sta-
tistice necesare analizei de date.
Aplicarea testelor statistice se face n vederea verificrii ipotezei nule,
proces prin care decidem dac datele experimentale sunt obinute n condiiile
n care ipoteza de nul este adevrat. Dac diferena dintre ipoteza nul i
datele experimentale nu se datoreaz ntmplrii (dac pragul de semnificaie
244
Cristian Opariuc-Dan
este mai mic de valoarea stabilit 0,05) putem respinge ipoteza nul, n caz
contrar ipoteza nul nu poate fi rejectat.
Trebuie s reinei faptul c procedeele statistice nu demonstreaz ni-
atea cu care un eveniment apare
ece caracteristicile populaiei poart numele
de para
lii, 2002) exist
un num
ii distribuiei. Distribuia scorurilor obi-
fi utilizate teste parametrice. Reamintim c utiliznd testele
ste normal vor fi
aplicate tehnici de normalizare a acesteia. Dac nici n acest
caz nu reuim obinerea unei distribuii normale vor fi utilizate
teste nonparametrice.
mic. Metodele statistice descriu probabilit
ntr-o populaie. Poate exista doar un singur caz din zece miliarde de cazuri
care s demonstreze acceptarea ipotezei nule. Prin metode statistice stabilim
doar la ce nivel de ncredere putem respinge ipoteza nul i nu putem demon-
stra niciodat falsitatea acesteia.
Dup Dancey i Reidy (Dancey, i alii, 2002), majoritatea testelor
statistice le utilizm pentru a face o inferen de la studiul pe un eantion spre
caracteristicile populaiei. Deoar
metri, testele utilizate poart denumirea de teste parametrice. Pentru
a putea ns utiliza testele parametrice, este necesar ndeplinirea simultan a
unor condiii axiomatice. Dup aceeai autori, (Dancey, i a
r de trei axiome necesare utilizrii testelor parametrice:
Axioma normalit
nute de ctre subieci la variabilele analizate trebuie s fie o
distribuie normal. n absena unei distribuii normale nu pot
parametrice facem asumpia c media i abaterea standard re-
prezint indicatori reprezentativi ai tendinei centrale, respec-
tiv mprtierii. Dac aceast asumpie este fals, ntreaga lo-
gic a aplicrii testelor statistice va fi i ea fals. Nu intrm
acum n detalii, deoarece au fost prezentate anterior, ci ne re-
zumm s amintim c dac distribuia nu e
245
Statistic aplicat n tiinele socio-umane
Axioma omogenitii varianelor. Reprezint o a doua
ti dac variana populaiei este aproximativ egal i
VII.3.6 Formularea concluziilor
etapa final a oricrei cercetri ti-
inifice
bui acceptat. n caz contrar putem respinge
ipoteza

asumpie important care postuleaz c variana populaiilor
trebuie s fie aproximativ egal. Ca i n cazul primei axiome,
nu putem
ne vom rezuma la studiul varianei eantionului sau lotului de
cercetare.
Axioma scorurilor extreme. Cea de-a treia axiom a fost de
asemenea tratat anterior i postuleaz inexistena scorurilor
extreme n distribuia statistic. Acest lucru este evident din
raiuni ce in de utilizarea mediei. Nu vom mai insista asupra
acestui lucru deoarece considerm c l-am discutat suficient pe
parcursul acestei lucrri.
Autorii suscitai nu menioneaz ns o cerin important i anume
cea a nivelului de msur. Evident, nu putem utiliza media i abaterea stan-
dard dect la variabile aflate la un nivel de msur cel puin de interval. Este
absurd s vorbim de distribuie normal n cadrul variabilelor nominale sau
ordinale.
Formularea concluziilor reprezint
i rezum ntregul demers tiinific prezentat mai sus. Decizia luat va
fi o decizie probabilistic i consistent cu datele experimentale. Dac pra-
gul de semnificaie este mai mare dect pragul acceptat, atunci probabil ipo-
teza nul este adevrat i va tre
nul. Ipoteza experimental nu poate fi respins sau acceptat. Singu-
ra decizie pe care o putem lua se refer la ipoteza de nul.


246
Cristian Opariuc-Dan
Concluzii:
Exist patru reguli de probabilitate: probabilitatea simpl pentru evenimente egale,
o-uma upune parcurgerea unui numr de
a nul;
Ipotezele pot fi unidirecionale sau bidirecionale;




o 0,13;
o 0,33;
evenimente mutual exclusive, evenimente independente, probabilitatea condiiona-
t;
Extinderea concluziilor de la studiul unui eantion la nivelul populaiei implic
existena erorilor sistematice ce eantionare;
Indicatorii de sondaj aproximeaz parametrii populaiei n zona unui interval de
ncredere;
Abaterea standard a mediilor eantioanelor poart numele de eroare standard de
eantionare;
Metoda tiinific n tiinele soci ne pres
ase etape:
o Enunarea problemei;
o Formularea ipotezelor;
o Proiectarea cercetrii;
o Efectuarea observaiilor;
o Interpretarea datelor;
o Formularea concluziilor;
Enunarea problemei presupune formularea obiectivelor generale i specifice, n
general n urma unui demers metaanalitic;
Specificarea ipotezelor face referire la ipoteza alternativ i la ipotez
Acceptarea sau respingerea ipotezei nule se face prin referire la pragul de semnifi-
caie statistic;
Aplicarea testelor parametrice se face n baza unor axiome;
Orice concluzie i decizie luat n urma aplicrii metodei statistice este o decizie
probabilistic i nu cert.

ntrebri i exerciii:
Care dintre urmtoarele evenimente au o probabilitate de apariie 0 i care 1 sau
apropiat de 1?
o Dup zi urmeaz noapte;
o Preedintele Romniei spune ntotdeauna adevrul;
o Vei gsi un milion de euro n paginile acestei cri;
o Cnd v este sete, bei ap;
o Stpnii bazele statisticii citind aceast carte;
Exprimai urmtoarele probabiliti sub form procentual:
o 0,25;
247
Statistic aplicat n tiinele socio-umane
o 1/9;
o 6/8;
Exprimai urmtoarele probabiliti sub form zecimal:
o 1/7;
o 3/15;
o 9/245;
o 84%;
o 39%;


248
Cristian Opariuc-Dan
V VI II II I. . E E A AN NT TI IO ON NA AR RE E I I R RE EP PR RE EZ ZE EN NT TA AT TI IV VI IT TA AT TE E
n acest capitol se va discuta despre:
Conceptele populaie i eantion;
Tipuri i surse de date;
Caracteristicile unui eantion;
Tipuri de eantioane;
Tehnici de construcie a unui eantion;
Dup parcurgerea capitolului, cursanii vor fi capabili s:
neleag conceptul de populaie;
Identifice sursele de colectare a datelor;
neleag principiul statistic al extragerii ean-
tionului dintr-o populaie;
Fac diferena ntre indicatori i parametri;
Aleag tipul de eantion adecvat cercetrii;
Stabileasc i s caracterizeze proprietile unui
eantion
Realizeze eantioane utiliznd SPSS for Windows

Pe parcursul acestui volum am abordat de multe ori problematica
arece foarte puine
stabilirii unui e ioneaz n mod direct valoarea
cercetr studii specifice eantionul nu primeaz, atunci
cnd vo or teste psihologice ori despre desfurarea cer-
noscute, referitoa-
re mnd s aprofundm att tipurile de
tora.
eantioanelor i am discutat sumar despre o serie de metode de eantionare. A
venit momentul s tratm n detaliu aceste elemente, deo
lucrri de statistic social le abordeaz la un nivel comun, iar importana
antion reprezentativ condi
ii. Dac la nivelul unor
rbim de elaborarea un
cetrilor a cror rezultate vor caracteriza populaia, procesul de eantionare
dobndete v o aloare special.
Vom relua, pentru nceput, o serie de lucruri deja cu
la populaie i eantion, ulterior ur
eantioane ct ces i metodele specifice de construcie ale a
249
Statistic aplicat n tiinele socio-umane
VIII.1
ia reprezint totalita-
tea ob n anumit tip, existente ntr-un spaiu sau teritoriu, la un
mom ie mai larg susine c o populaie reprezint o colec-
ie natura fic sau politic de persoane, animale, plante sau obi-
, 2004). Definiia subliniaz c o populaie reprezint, de
fapt, o colecie fizic. Fiind o colecie fizic, orice populaie se caracterizeaz
prin anumite proprieti pe care le denumim generic parametri. Termenul de
populaie este, de fapt, o abstraciune. Nu putem concepe populaia fr s
facem apel la aceste proprieti prin care se definete. Dac ne referim la po-
pulaia brbailor, implicit am definit un parametru al acesteia i anume se-
xul. Dac vorbim de populaia nlimii brbailor, avem n vedere doi para-
metri i anume nlimea i sexul. Similar, nlimea brbailor din Romnia
presupune trei parametri: locaia, sexul i nlimea. Toi aceti parametri se
numesc variabile de interes ale cercetrii i permit nregistrarea unor valori
la nivelul acestora.
ntr-o cercetare, odat stabilite variabilele (parametrii) de interes, tre-
buie s acordm mult atenie n momentul n care extindem concluziile la
nivelul populaiei. Vom reine faptul c o populaie se caracterizeaz prin
aceste variabilele de interes. Nu putem face o afirmaie de genul nlimea
brbailor este de 178 de centimetri, n condiiile n care am efectuat un stu-
diu pe populaia din Romnia. Nu am desfurat o cercetare prin care s in-
vestigm nlimea brbailor din lume. O formul adecvat ar fi nlimea
brbailor din Romnia este de 178 de centimetri.
Populaia odat definit, apare necesitatea nregistrrii valorilor pentru
variabilele de interes. O metod de investigaie exhaustiv care-i propune
investigarea tuturor elementelor dintr-o populaie este recensmntul.
Recensmntul este o metod de observare total, cu caracter perio-
dic, care surprinde un fenomen n mod static. Este una din cele mai vechi
Populaia
Definiia din capitolul al treilea afirma c popula
iectelor, de u
ent dat. O defini
l, geogra
ec e (Do t wdy, i alii
250
Cristian Opariuc-Dan
metode de observare i asigur o fotografiere, o surprindere a unui fenom
ar, recensm
en
ntul populaiei
atelor demografice,
econom tru toate persoanele
din orm particular a re-
cens ca demers similar de investigare a
ste extrem de costi-
sitoa
toate v
VIII.2
blem r-
win i Slater (Curwin, i alii, 1996), datele pot proveni din surse principale
i/sau d
plorare exhaustiv, ca n cazul recensmntu-
lui, sau
ntr-un anumit moment de timp. n mod particul
este un proces de culegere, prelucrare i publicare a d
valabile pen ice i sociale, la un timp specificat i
ara respectiv sau de pe un teritoriu delimitat. O f
mntului o reprezint referendumul,
opiniilor populaiei.
O asemenea metod de colectare a informaiilor e
re. De multe ori nu este practic (uneori chiar imposibil) s observm
alorile pe care le poate lua o variabil la nivelul populaiei.
Surse de date
Odat stabilite variabilele de interes i definit populaia, se pune pro-
a colectrii datelor necesare. Care sunt ns sursele de date? Dup Cu
in surse secundare.
VIII.2.1 Sursele principale de date
Reprezint surse care permit colectarea direct de observaii noi. Me-
todele prin care putem efectua un asemenea demers includ observaia, discu-
iile individuale sau de grup, experimentele, chestionarele, testele, utilizarea
unor aparate specifice etc. Colectarea datelor la acest nivel poate fi costisitoa-
re att din punct de vedere financiar ct i sub aspectul duratei, ns avem
certitudinea unor date reale i valide. La nivelul elementelor de populaie,
cercetarea poate presupune o ex
poate implica utilizarea eantioanelor. n mod curent, cercetrile folo-
sesc, de cele mai multe ori, surse principale de date.
251
Statistic aplicat n tiinele socio-umane
VIII.2.2 Sursele secundare de date
rcetare efectuat pe un eantion, induce, dup cum am
artat, o serie de erori care afecteaz
ab de fasole, am fi putut
face aceas
at fa-
sole de
Reprezint date provenite din cercetri deja efectuate. Costurile nece-
sare procurrii acestor date sunt semnificativ mai reduse, uneori informaiile
sunt de o nalt valoare tiinific, ns dezavantajul principal este acela c nu
putem avea controlul asupra veridicitii i validitii acestora. Astfel, datele
pot proveni din anuarele statistice ale unor ri sau teritorii, din rapoartele
unor organizaii sau instituii, din cercetri existente sau din baze de date pu-
blice ori private. Metaanaliza, ca metod tiinific, utilizeaz predominant
asemenea surse de date.
VIII.3 Eantionul
Exceptnd recensmntul, toate celelalte metode implic utilizarea
unei mici pri dintr-o populaie n vederea colectrii datelor. O asemenea
colectivitate statistic poart numele de eantion i reprezint un subset de
elemente din populaie, care ns pstreaz caracteristicile populaiei din
care provine. O ce
rezultatele finale. Aceste erori apar ca
urmare a faptului c noi nu culegem informaii de la ntreaga populaie statis-
tic, ci doar de la elementele cuprinse n eantion. O cercetare efectuat pe un
eantion poart numele de cercetare selectiv, spre deosebire de recens-
mnt care se refer la cercetri exhaustive.
V mai amintii exemplul cu oala de fasole? Atunci am extras o lingu-
r de boabe de fasole i am decis c fasolele sunt fierte. Exact acesta este
principul eantionrii. Dac am fi luat o singur bo
t afirmaie? Eu cred c nu, deoarece ar fi existat prea multe anse
s aruncm apoi oala. Dar dac am fi mncat ntreaga oal? Atunci am fi tiut
sigur, ns nu am mai fi avut cu ce s facem mncarea. n plus, gndii-v ce
costuri ai fi suportat cu sistemul digestiv Dac n oal ai fi amestec
10 ani i fasole de 1 an? Probabil c decizia ar fi fost corect, ns ai
252
Cristian Opariuc-Dan
avea multe anse s v rupei uneori dinii. Dac ai fi gustat din oala de ma-
zre? Desigur c nu, pentru c v-ai fi referit la cu totul alt populaie.
Iat c un eantion trebuie s respecte caracteristicile populaiei din
care face parte. Aceasta este calitatea esenial a unui eantion i poart nu-
mele de reprezentativitate. Reprezentativitatea este, aadar, capacitatea
eantionului de a reproduce ct mai fidel structurile i caracteristicile
populaiei din care a fost extras (Rotariu, i alii, 2006). Dac valorile pro-
prieti
acteristica
respectiv la nivelul populaiei, ci ncercm s-o estimm prin intermediul
antionului. Legat de acest aspect, trebuie ns s
reinei
e eroare nu este acela comun, de greeal.
Romnia i am obine 179
te, ansa ca valo-
rile obinute s nu se datoreze unei erori de eantionare.
Aceste lucruri le-am abordat pe larg n capitolul anterior i nu le vom
mai discuta aici deoarece consider c au fost bine nelese. Totui, vom prelua
lor la nivelul populaiei poart numele de parametri, la nivelul eanti-
oanelor ele se numesc indicatori sau statistici. n mod normal noi nu cu-
noatem valorile parametrilor, valoarea exact pe care o are car
valorii obinute la nivelul e
dou lucruri importante:
ntre valoarea unui indicator i valoarea unui parametru exist
ntotdeauna o diferen, numit eroare sau eroare statistic.
Sensul termenului d
Dac am msura toi brbaii din
centimetri pentru parametrul nlime medie, n timp ce un alt
studiu, efectuat pe 200 de brbai obine nlimea medie de
178,7 centimetri, diferena de 0,3 centimetri reprezint tocmai
eroarea statistic;
Pentru ca un studiu s fie valid, trebuie ca eroarea (diferena
dintre valoarea parametrului i cea a indicatorului) s nu dep-
easc un anumit prag. Acest prag poart numele de nivel de
ncredere i reprezint ansa ca eroarea real comis s nu de-
peasc limita erorii statistice. Cu alte cuvin
253
Statistic aplicat n tiinele socio-umane
o serie de principii ale reprezentativitii eantionului, aa cum le prezint T.
Rotariu
laia, este un termen abstract. Nu putem vorbi de re-
prezentativitate dect n raport cu o caracteristic dat (vrst,
gic, nlime, coeficient de inteligen etc.);
n figura alturat. Din populaia
n lucrarea sa (Rotariu, i alii, 2006):
Reprezentativitatea unui eantion trebuie ntotdeauna evaluat
prin eroarea statistic i nivelul de ncredere, deoarece n ab-
sena specificrii nivelului de ncredere nu putem fi siguri c
eroarea comis este mai mic dect eroarea statistic;
Reprezentativitatea unui eantion, ca i concept statistic, la fel
ca i popu
gen biolo
Exist diferite grade de reprezentativitate a unui eantion. Un
eantion poate fi mai reprezentativ dect altul, n condiiile n
care la un acelai nivel de ncredere eroarea este mai mic, sau
la aceeai eroare, nivelul de ncredere este mai ridicat;
Din cele expuse mai sus putem concluziona c reprezentativitatea
unui eantion depinde de caracteristicile populaiei ce va fi studiat, de m-
rimea eantionului i de procedura folosit (Rotariu, i alii, 2006).
Principul de baz al eantionrii este
expus succint
general se construiete populaia in n func-
ie de variabilele de interes necesare cercetrii.
n funcie de nivelul de precizie ales, se
determin mrimea eantionului, n baza popu-
laiei int, astfel nct s se poat stabili eroa-
rea maxim i nivelul de ncredere.
Desigur, problema se pune la nivelul
stabilirii mrimii eantionului, astfel nct acesta s fie reprezentativ.
Figura 8.1 Relaia dintre populaia
general, variabilele de interes i
eantion
254
Cristian Opariuc-Dan
VIII.3.1 Mrimea eantionului
V-ai pus n mod cert ntrebarea, n nenumrate rnduri, cum poate un
sondaj
crete odat cu creterea
figura alturat, putem ob-
serva c n cazul unui eantion format din zero persoane, reprezentativitatea
lui este
zentativita
reprezenta
mul acestu
este s
punct i. Un
volum
s vorbeasc n numele oamenilor. Sau cum pot cei care organizeaz
sondaje s ghiceasc cine va iei preedinte, evident dac sondajele sunt co-
recte. Dac nimeni nu m-a ntrebat nimic, cum poate cineva s fac o afirma-
ie valabil i pentru mine? Este o ntrebare pertinent, ns v dai seama ce
s-ar ntmpla i ce ar implica investigarea ntregii populaii la fiecare cerceta-
re? Nu numai c ar fi prohibitive costurile, ns nimeni nu ar putea da rezulta-
tele n timp util i, mai ales,
nu ar fi necesar.
n mod cert, repre-
zentativitatea unui eantion
Reprezentativitate
numrului de elemente i
atinge maximum la un vo-
lum egal cu cel al populaiei.
Totui, relaia dintre repre-
zentativitate i volumul
eantionului nu este una lini-
ar, ci una curbiliniar. n
Volum eantion
n n
Relaia dintre volumul eantionului i
reprezentativitate
Figura 8.2
i ea nul. Cu ct crete numrul de persoane, cu att crete i repre-
tea, ns pn la un punct situat ntre n i n. Dup acest nivel,
tivitatea eantionului crete foarte puin pe msur ce crete volu-
ia, astfel nct diferenele vor fi nesemnificative. Toat problema
determinm punctul pentru care reprezentativitatea este maxim,
situat ntre n i n care va determina mrimea (n) a eantionulu
al eantionului mai mic de n duce la un eantion nereprezentativ, iar
un volum al eantionului mai mare de n determin cheltuieli nejustificate.
255
Statistic aplicat n tiinele socio-umane
Un fapt importat pe care dorim s-l abordm, este acela c, reprezen-
tativitatea eantionului nu depinde de mrimea populaiei. Fie c desfu-
rm
de p r
VIII.3.2
asole de
10 ani?
tr est
Dei l
ea nu m
str
rite
raport
belor
subpopula
tem po
VIII.3.3 Procedee de
Metodele i tehnicile d
treilea al acestui volum. n cad
re tehnic, specificnd, atunci cnd
aflm totui cea mai bun metod de
un algoritm de decizie n vede
sti
e ne ,
orice procedeu de eantionare nealeato
e ean-
un studiu n Romnia, n India sau n Statele Unite, un eantion de 500
e soane va avea aceeai reprezentativitate.
Caracteristicile populaiei
Ce ne facem n situaia n care avem n oal fasole de 1 an i f
Iat c n termeni statistici, populaia de fasole din oala dumneavoas-
e format, de fapt, din dou subpopulaii: cea de 10 ani i cea de 1 an.
ingura de fasole pe care o gust este reprezentativ la nivelul populaiei,
ai este reprezentativ la nivelul subpopulaiilor. Sunt de fapt dou
-
aturi n populaia noastr, fiecare dintre aceste straturi avnd ponderi dife-
. Reprezentativitatea nu are de-a face cu aceast proporie a straturilor n
cu volumul populaiei, astfel nct, n aceast situaie, eantionul boa-
de fasole din lingura mea nu mai este reprezentativ la nivelul celor dou
ii de boabe de fasole. Ce este de fcut n acest caz? Dac cunoa
nderea straturilor, putem folosi o procedur specific de eantionare.
Dac nu, n general gustm mai multe linguri, adic mrim efectivul eantio-
nului.
eantionare
e eantionare au fost abordate i n capitolul al
rul acestei seciuni, vom studia n detaliu fieca-
este cazul, modalitatea de calcul. Cum
eantionare? n figura de mai jos avei
rea alegerii procedurii adecvate de eantionare.
ncia ntre procedeele de eantionare aleatoare
aleatoare. Din punct de vedere statistic ns
n practic, se face di
i procedeele de eantionar
riu nu poate fi tratat prin prisma teoriei
probabilitilor, fiind, prin urmare, eliminat din categoria metodelor d
256
Cristian Opariuc-Dan
tionare. Cnd discutm de reprezentativitate, vom aborda strict procedeele de
eantio

nare aleatorii. O procedur de eantionare este aleatoare n mo-
mentul n care fiecare individ din populaie are o ans calculabil de a fi
ales n eantion.

VIII.3.3.1 Stabilirea eantionului prin convenie
Este un procedeu nealeatoriu de stabilire a unui eantion, bazat pe vo-
luntariat sau pe cazuri specifice, analizate de cercettor. De exemplu, situaia
n care un psihoterapeut i construiete un studiu tiinific bazat pe clienii
Precizie
mare?
Nu Da
Exist sub-
populaii?
Exist sub-
populaii?
Nu Da Nu Da
Eantion sub
50 elemente
Eantion peste
50 elemente
E
5
antion peste
0 elemente
Eantion peste
50 elemente
Eantion peste
50 elemente
- Analiz;
- Convenie;
- Bulgre de
- Randomiza-
re simpl;
- Sistematic;
- Randomiza-
re simpl;
- Sistematic;
-
-
l
zpad - Cluster; - Cluster;
Stratificat;
Proporiona-
cu mri-
mea;
- Randomiza-
re simpl;
- Sistematic;
- Cote;
- Proporiona-
l cu mrimea
- Multistadiu;
- Cluster;
- Stratificat

Figura 8.2 Algoritmul de decizie n alegerea metodei de eantionare
257
Statistic aplicat n tiinele socio-umane
si, pe
t, iar rezultatele vor fi privite
cu mare scepticism. Avantajul l reprezint posibilitatea de colectare facil i
cu att rezultatele vor fi mai
importa
Cele dou metode prezentate mai sus presupun utilizarea unor loturi
b 50 de cazuri) i le ntlnim
n spec
care i trateaz, ori n cazul cercetrilor efectuate pe studeni, n cadrul
unei universiti. Nu putem vorbi aici de reprezentativitate, iar rezultatele
obinute nu pot fi extrapolate la nivelul ntregii populaii. Un asemenea stu-
diu, datorit voluntariatului, este puternic biasa
rapid a datelor, iar cu ct grupul este mai mare,
nte. ntr-o cercetare n care se folosesc asemenea subieci, n general,
elementele se raporteaz ca lot de cercetare sau lot de studiu i nu ca eanti-
on, tocmai pentru a specifica lipsa oricror tehnici de eantionare.
VIII.3.4 Stabilirea eantionului prin analiz
Reprezint un alt procedeu nealeatoriu de colectare a datelor, bazat pe
alegerea deliberat a cazurilor. Nici n aceast situaie nu putem vorbi de
eantion, preferndu-se termenul de lot de cercetare. Erorile statistice sunt i
n acest caz foarte mari i nu se pot extinde cunotinele la nivelul ntregii
populaii, iar cercetarea prezint probleme de credibilitate. Se folosete n
general pentru studiile de caz sau n condiiile unor populaii cu un compor-
tament bine cunoscut.
de cercetare de mici dimensiuni (n general su
frecvent n lucrri specifice domeniului psihologic. Din nefericire, concluziile
rezultate n urma unor asemenea studii au o valoare limitat la nivelul lotului
cercetat, orice posibilitate de generalizare fiind statistic exclus.
VIII.3.4.1 Metoda bulgrelui de zpad
Este o tehnic folosit destul de frecvent n cercetrile socio-umane,
ial n sociologie i se bazeaz pe metode multi-level. O persoan care
rspunde, recomand n acelai timp o alt persoan care va rspunde (un
prieten, o cunotin etc.). Aceasta, la rndul ei, recomand o alt persoan i
aa mai departe. Cercetrile de acest tip fixeaz, de obicei, o dat limit pn
258
Cristian Opariuc-Dan
la care se pot primi rspunsurile subiecilor. n mod cert, metoda de alegere a
subiecilor nu este una aleatorie i prezint limitrile prezentate mai sus.
Avantajul este acela al costurilor reduse i al creterii exponeniale a volumu-
lui de date. ntr-un timp scurt se pot colecta foarte multe date, ns cercetrile
nu prezint relevan, datorit caracterului nealeatoriu i a faptului c nu exis-
t un control al rspunsurilor. Fiecare respondent poate s-i exprime punctul
su real de vedere sau un punct de vedere fals.
VIII.3.4.2 Eantionarea simpl aleatoare
Reprezint clasicul procedeu al loteriei sau al tragerii la sori, fiind
considerat cea mai simpl metod de eantionare. Nu presupune alte opera-
iuni prealabile, iar prin aceast metod fiecare individ dintr-o populaie are
ansa de a fi ales n eantion. Cnd eram copil, obinuiam s joc fotbal n
echipa de cartier. Bineneles c problema era cine s fie portar, deoarece nici
unul dintre noi nu dorea. Deoarece ne strngeam cam 30-40 de copii, singura
soluie era s tragem la sori, astfel nct fceam un numr de bileele egal cu
numrul nostru, iar pe un singur bileel scriam portar. Amestecam apoi
bileelele ntr-o cciul i fiecare trgea cte unul. Ghinionistul sttea n poar-
t i, evident, au fost suficiente ocazii n care cu sufletul trist aveam aceast
onoare. Nu tiam atunci c aplic un procedeu statistic de eantionare, numit
eantionarea simpl aleatoare.
Nu cred c este cazul s mai menionez faptul c aceast metod este
o modalitate aleatorie de eantionare, prin care se poate estima un parametru
al populaiei, se poate calcula eroarea de eantionare, are un design simplu i
eficient, iar interpretarea este foarte uoar.
riu se folosesc Strict matematic, pentru a construi un eantion aleato
tabele de numere aleatoare, formate din iruri lungi de numere alese la n-
tmplare, att sub aspectul numerelor n sine ct i sub cel al poziiei n care
se afl n tabel. Metodele informatizate pot folosi, n acelai scop, generatoa-
259
Statistic aplicat n tiinele socio-umane
re de numere aleatorii. Stabilirea unui eantion pe baza eantionrii aleatorii
simple presupune urmtoarele etape:
Stabilirea populaiei int. Considerm c dorim s studiem
nlimea brbailor din Romnia. Populaia va fi format din
totalitatea brbailor din Romnia, persoane de sex masculin
cu vrsta de peste 18 ani. S presupunem c numrul acestora
este de 8 milioane (N=8000000);
Stabilirea bazei de eantionare. Prin baz de eantionare
nelegem o list exhaustiv a populaiei int. Avem nevoie,
Romnia pe care
ea mrimii eantionului. Prin procedee de calcul pe
l cu numere
prin urmare, de o list a tuturor brbailor din
o numerotm succesiv de la 1 la 8 milioane. Practic se obine
iniial o list ordonat alfabetic, se genereaz apoi, aleatoriu,
pentru fiecare nregistrare din list, un numr i se reordoneaz
lista dup numrul generat. Astfel, amestecm baza de eanti-
onare, eliminnd criteriul alfabetic. Pe noua list amestecat,
generm apoi numere succesive de la 1 la 8 milioane;
Stabilir
care le vom aborda n urmtorul subcapitol, stabilim dimensi-
unea eantionului. n situaia noastr, presupunem c alegem
un eantion de 1000 de persoane (n=1000);
Generarea numerelor aleatoare. Se genereaz pe computer
1000 de numere aleatoare sau se utilizeaz tabelu
aleatoare;
Extragerea eantionului. Se citete primul numr aleatoriu
generat sau primul numr din tabelul de numere aleatoare.
Acel numr reprezint numrul de ordine al subiectului din
baza de eantionare care va fi inclus n eantion. Se trece apoi
la al doilea numr aleatoriu, acesta reprezentnd numrul de
260
Cristian Opariuc-Dan
ordine al celui de-al doilea subiect i se continu astfel pn la
completarea efectivului (1000 de subieci) eantionului.
Dei extrem de simpl, metoda prezint o serie de limitri serioase.
Principala problem o constituie obinerea bazei de eantionare. Cum gsim
noi lista cu numele, prenumele i adresa tuturor brbailor din Romnia? Unii
cercettori folosesc crile de telefon i genereaz aleatoriu volumul eantio-
nului n baza numerelor de telefon. Se pune ns problema dac toat popula-
az n cartea de telefon
te considerat superioar eantionrii aleatorii
simple deoarece, n condiiile n care la nivelul populaiei int exist mai
multe s
e de volum egal, cel produs prin
stratificare v
prin ea
face dup o singur variabil (stratificare simpl) sau dup mai
ia are telefon. Cei care nu au telefon sau nu figure
sunt automat exclui din baza de eantionare, ceea ce duce la eliminarea ca-
racterului aleatoriu.
Pe de alt parte, presupunnd c am obinut baza de eantionare, toate
persoanele din eantion sunt accesibile? Dac unii sunt plecai n strintate,
au murit, s-au mutat ori nu pot fi contactai, ce se ntmpl? Se mai respect
reprezentativitatea eantionului? V las pe dumneavoastr s decidei acest
lucru. n general, cu ct volumul populaiei int este mai mare, cu att aceas-
t metod este mai dificil de implementat.
VIII.3.4.3 Eantionarea stratificat
Iat i metoda utilizat n verificarea fasolelor de 1 an i a celor de 10
ani. Eantionarea stratificat es
traturi (subpopulaii), se va putea reproduce ponderea fiecrui strat n
eantionul final.
Se consider c dintre dou eantioan
a avea o reprezentativitate mai bun n comparaie cu cel produs
ntionarea aleatorie simpl (Rotariu, i alii, 2006).
Procedura concret de lucru const n urmtoarele etape principale:
Stabilirea variabilelor de stratificare. Stratificarea se poate
261
Statistic aplicat n tiinele socio-umane
multe variabile (stratificare multipl). Spre exemplu, ne intere-
seaz consumul mediu zilnic de igri pentru populaia din
ie de scopul cercetrii i
igri din jude
Ne intere
en
zentat
Romnia. Care ar fi variabilele de stratificare? Femeile con-
sum oare mai multe igri n comparaie cu brbaii? Grupa
de vrst influeneaz consumul de igri? Cei din mediul rural
fumeaz mai mult sau mai puin n comparaie cu cei din me-
diul urban? Nu exist o regul de stabilire a variabilelor de
stratificare, acestea fiind alese n func
de rolul pe care l au n legtur cu tema cercetat. ntotdeauna
ns, suma cazurilor din fiecare strat trebuie s redea totalul
populaiei. Dac ne intereseaz numai straturile determinate de
sex, efectum o stratificare simpl. Dac ns lum n consi-
derare sexul i mediul de provenien, avem o stratificare
multipl.
S lum un exemplul, prin care dorim s studiem consumul mediu de
ul Blagosloveti, cu o populaie total de 450.380 de persoane.
seaz o stratificare n funcie de variabilele sex i mediu de proveni-
. Putem obine, n aceast etap, urmtoarea structur a populaiei, pre-
n tabelul de mai jos:
Tabel 8.1 Structura populaiei pentru cele dou variabile de strati-
ficare n judeul Blagosloveti
Brbai Femei
Rural Urban Rural Urban
120.215 80.360 113.456 136.394
(26,69%) (17,84%) (25,19%) (30,28%)
200575 (44,53%) 249805 (55,47%)
450.380 (100%)

262
Cristian Opariuc-Dan
Problema pe care ne-o punem se refer la proporia (procentul) din
ia int reprezentat de fiecare strat. Pentru a afla acest lucru, n popula u ne
rmne dect s aplicm regula de trei simpl:
Dac 450.380 nseamn 100%
Atunci 120.215 nseamn X%
X =
12u.21S 1uu
4Su.S8u
=
1.2u2.1Su
4Su.S8u
= 26,69%
n mod similar vom efectua calculele pentru toate cele patru seciuni.
Remarcm c totalul subiecilor din fiecare variabil de stratificare reprezint
ntreag
pe seci-
uni diferite, n funcie de variabilele de stratificare. n cazul
i ale bazei de eantionare i
prezenta ntr-un capitol ulterior. n cazul nostru am
ie o re-
ei
a populaie int.
Stabilirea bazei de eantionare. Se realizeaz la fel ca n ca-
zul eantionrii aleatorii simple. Avem nevoie de lista comple-
t a tuturor persoanelor din judeul Blagosloveti, prelucrat
dup modalitatea prezentat n subcapitolul anterior. Singura
diferen este c baza de eantionare va fi organizat
nostru, vom avea patru seciun
anume: brbai din mediul urban, femei din mediul urban, br-
bai din mediul rural i femei din mediul rural. (N=450.380);
Stabilirea mrimii eantionului. Se face n urma unor calcu-
le specifice, adecvate acestui tip de eantionare, calcule pe ca-
re le vom
ales un eantion de 300 de persoane (n=300);
Stabilirea compoziiei eantionului. Reprezint etapa prin in-
termediul creia ne asigurm c proporia din popula
gsim i n eantion. Vom folosi de asemenea regula de tr
simpl.
263
Statistic aplicat n tiinele socio-umane
Dac 300 nseamn 100%
Atunci X nseamn 26,69%
X =
26,69 Suu
1uu
=
8uu7
1uu
= 8u cozuri
Tabel 8.2 Structura eantionului pe cele dou variabile de stratifi-
care n judeul Blagosloveti
Brbai Femei
Rural Urban Rural Urban
80 (26,69%) 54 (17,84%) 76 (25,19%) 91 (30,28%)
134 (44,53%) 167 (55,47%)
301 (100%)

Observm c structura eantionului selectat reproduce fidel structura
popula
merelor aleatoare. Se realizeaz similar ean-

vor gene tru brbaii din mediul
rural, 54 de numere aleatoare pentru brbaii din mediul urban,
le iu i 91
de numere pentru fe mediul urb
Extrager nului. N atoare ge ta-
ii
din cele patru b e. Eantionul final va fi com-
pus din 301 persoane, aparinnd tuturor celor patru categorii.
iei din care a fost extras, pentru fiecare dintre cele dou variabile de
stratificare. Desigur, n loc de 300 de subieci au rezultat 301 subieci, datori-
t rotunjirilor aprute prin calcul. Vom pstra n cele din urm aceast valoa-
re obinut.
Generarea nu
tionrii aleatorii simple pentru fiecare baz de eantionare. Se
ra 80 de numere aleatoare pen
76 de numere aleatoare pentru femei din med l rural
aleatoare meile din
umerele ale
an;
nerate n e ea eantio
pa anterioar reprezint numerele de ordine pentru subiec
aze de eantionar
264
Cristian Opariuc-Dan
Dei mai laborioas dect eantionarea aleatorie simpl, eantionarea
stratificat are avantajul unei mai bune reprezentativiti.
Exerciiu:
Calculai ct e de 1 ole de 1 e boabe de fasol 0 ani i cte boabe de fas
an trebuie s a boabe de vei n lingur n oal e afl 8 , cunoscnd c s 54 de
fasole de 1 an i 362 de boabe de fasole de 10 ani.
Dei ap it crerii pon-
derilor
unui strat este foarte mic n populaie. Dac consi-
der
gru a
nem 1
exemp
Aseme
tor cazuri n
analiz
stratulu
sau su
redenum
VIII.3.4.4
aleatorie simpl rile sociologice
din ra
volum
trii sun
arent caracterul aleatoriu nu se pstreaz dator
pe straturi, aceast alegere a subeantioanelor asigur tuturor indivizi-
lor o probabilitate egal de a intra n eantion. O problem poate s apar n
situaia n care ponderea
m variabila de eantionare nivelul de inteligen, exist posibilitatea ca
p geniilor sau a idioilor s aib foarte puine cazuri n populaie (s spu-
0). n aceast situaie, n eantion ar trebui s includem 0,003 (un
lu, cifra nu a rezultat din calcul) persoane, ceea ce este imposibil.
nea situaii impun fie o supra-reprezentare (adic includerea mai mul-
eantion dect proporia din populaie) urmat apoi, n decursul
ei indicatorilor statistici, fie de ponderarea valorilor pariale la nivelul
i respectiv, fie de includerea acelui strat ntr-un alt strat supraordonat
bordonat (de exemplu, includerea idioilor n categoria imbecililor i
irea stratului idioi-imbecili).
Eantionarea multistadial
Dei cu o reprezentativitate mai redus n comparaie cu eantionarea
, aceast metod este intens utilizat n cercet
iuni de eficien practic i cost. Se folosete n special atunci cnd
ul populaiei este foarte mare (studii la nivel naional), costurile cerce-
t limitate i se urmrete obinerea rapid a unor date.
265
Statistic aplicat n tiinele socio-umane
Principiul de stei antio ii spa-
iale i al faptului c i p or gru-
puri. Eantionarea e:
Sta prin intermediul
.
de igri tionare aleatorie simpl
icat. Ce ne facem ns cu op are trebuie s
administre e chestiona persoane d ju-
ate sp -
n ea ltistad eferi, spre
exemplu, la organizarea teritorial. Romnia este organizat
Stabilirea eantionului de rangul I. Presupune extragerea
unui eantion din grupul de prim rang. n exemplul nostru,


Cluj 83 de localiti. n total, avem un numr de 392 de loca-
baz al ace e nri este acela al proximit
pe ca indivizi aparinnd un
toarelor etap
rsoanele pot f rivite
multistadial presupune parcurgerea urm
bilirea stadiilor (grupurilor). Este etapa
creia definim grupurile din care vor fi extrase eantioanele
Dac am dori s investigm, la nivel naional, consumul mediu
pe zi, am putea efectua o ean
sau stratif eratorii c
ze 100 d re unor in cteva
dee, pu
staniale. Pri
ternic dispers aial. Efortul i cos
ial ne putem r
turile ar fi sub
ntionarea mu
pe judee, la nivelul judeelor se afl municipii, orae, comune
i sate, municipiile sunt organizate pe cartiere etc. Grupurile
pe care le putem folosi ar fi judeele, oraele, comunele i sate-
le.

grupul de prim rang este reprezentat de judee. n Romnia
exist un numr de 42 de judee, din care, prin procedee alea-
torii, vom extrage, s spunem, un eantion de 5 judee (Con-
stana, Bacu, Timi, Satu Mare i Cluj). Aceste cinci judee
formeaz populaia int pentru urmtorul stadiu.
Stabilirea eantionului de rangul II. Presupune extragerea,
din judeele selectate n etapa anterioar, a unui numr de lo-
caliti. n cazul nostru, judeul Constana are un numr de 69
de localiti, judeul Bacu 88 de localiti, judeul Timi
92 de localiti, judeul Satu Mare 60 de localiti i judeul
266
Cristian Opariuc-Dan
liti, din care calculm un eantion de 17 localiti pe care le
extragem prin procedee aleatorii. Vor rezulta 3 localiti din
u (Ciui, Drmneti i Sascut), 5 localiti din Constan-
ir, Saraiu, Medgidia i Techirghiol), 2 lo-
ceste localiti vor repre-
n=200);
pe computer
ubiectului din
baza de eantionare care va fi inclus n eantion. Se trece apoi
la al doilea numr aleatoriu, acesta reprezentnd numrul de
Bac
a (Ostrov, Dobrom
caliti din Satu Mare (Vama i Carei), 4 localiti din Cluj
(Mihai Viteazu, Ciucea, Scuieu i Vad) i 3 localiti din Ti-
mi (Tometi, Cenad i Pichia). A
zenta baza de eantionare pentru urmtorul stadiu.
Stabilirea eantionului de rangul III. Putem continua cu
grupurile pn la nivel de individ sau putem include, n aceas-
t etap, un alt grup care va funciona ca i stadiu de eantio-
nare. M voi rezuma acum la a considera acest stadiu ca fiind
ultimul i vom proceda la extragerea eantionului final. Baza
de eantionare va fi constituit din totalul populaiei celor 17
localiti, sub forma binecunoscutei liste exhaustive de popula-
ie. Presupunem c n cele 17 localiti triesc 1.854.360 de
persoane (N=1.854.360)
Stabilirea mrimii eantionului. Prin procedee de calcul pe
care le vom aborda n urmtorul subcapitol, stabilim dimensi-
unea eantionului. n situaia noastr, presupunem c alegem
un eantion de 200 de persoane (
Generarea numerelor aleatoare. Se genereaz
200 de numere aleatoare sau se utilizeaz tabelul cu numere
aleatoare;
Extragerea eantionului. Se citete primul numr aleatoriu
generat sau primul numr din tabelul de numere aleatoare.
Acel numr reprezint numrul de ordine al s
267
Statistic aplicat n tiinele socio-umane
ordine al celui de-al doilea subiect i se continu astfel pn la
completarea efectivului de 200 de subieci solicitat de eanti-
on.
Dei aceast metod de eantionare permite construirea unor eanti-
late n proximitate spaial, reducnd costurile de cercetare i facili-
ia datelor, se poate ntmpla ca la nivelurile de rang nalt, elemen-
fie selectate numai dintr-o anumit zon (spre exemplu 3 judee din
i 2 din Ardeal). n acest caz, o mare parte a teritoriului rmne
, ceea ce determin probleme serioase de reprezentativitate. Pen-
ita acest lucru se combin eantionarea multistadial cu eantionarea
t.
O alt problem care se poate pune este cea a inegalitii grupurilor.
it nivel de eantionare, se creeaz, ntr-adevr, o probabilitate
e alegere a tuturor elementelor, ns ntre Covasna cu 45 de localiti
re cu 111 localiti exist o important diferen de mrime. Pentru a
oane af
tnd achizi
tele s
Moldova
neacoperit
tru a ev
stratifica
La un anum
egal d
i Mu
evita acest lucru, n general se pondereaz probabilitatea de extragere a unui
gru
De ob
la proi
VIII.3.4.5
sczute sunt
com
volum
Acest tip de e
comod m
despre popula
interviur
p, proporional cu mrimea acestuia.
Un alt dezavantaj al acestei metode l reprezint calculele laborioase.
icei resursele economisite prin colectarea datelor sunt pe deplin folosite
ectarea eantionului, n condiiile unei reprezentativiti satisfctoare.
Eantionarea pe clusteri
Reprezint o metod ieftin de eantionare, ns costurile
pensate pe deplin de erori de eantionare destul de mari. n plus, dac
ul clusterului este mare, cresc i cheltuielile de colectare a datelor.
antion este considerat a fi cel mai ieftin, cel mai rapid i mai
ijloc de eantionare, care nu necesit nici mcar informaii complete
ie. Se preteaz mai degrab la analize de tip calitativ, cum ar fi
ile sau focus-grupurile.
268
Cristian Opariuc-Dan
Un cluster reprezint o structur care se comport ca un individ
ulaie. Dac considerm populaia municipiilor din Romnia,
un cluster este reprezentat de Municipiul Constana, un alt cluster de
i i aa mai departe. Modalitatea de realizare a unui eantion
steri este urmtoarea:
Stabilirea bazei de eantionare. n acest caz, baza de eanti-
onare este reprezentat de totalitatea populaiei de clustere.
Dac suntem interesai de o cercetare pe nvm
ntr-o pop
atunci
Municipiul Ia
pe clu
ntul liceal,
leatoare. Se genereaz pe computer
e numere aleatoare.
l doilea liceu i se continu astfel pn la comple-
ntregului c
fesorii, to
baza de eantionare va conine lista exhaustiv a liceelor din
Romnia. S presupunem c avem 5423 de licee n Romnia
(N=5423);
Stabilirea mrimii eantionului. Prin procedee specifice de
calcul se determin mrimea eantionului pe care urmeaz s-l
selectm. n cazul nostru, considerm un numr de 12 licee
(n=12);
Generarea numerelor a
12 de numere aleatoare sau se utilizeaz tabelul cu numere
aleatoare;
Extragerea eantionului. Se citete primul numr aleatoriu
generat sau primul numr din tabelul d
Acel numr reprezint numrul de ordine al liceului din baza
de eantionare care va fi inclus n eantion. Se trece apoi la al
doilea numr aleatoriu, acesta reprezentnd numrul de ordine
al celui de-a
tarea efectivului (12 licee) eantionului.
Specific acestui tip de eantion este desfurarea cercetrii la nivelul
luster. ntr-un liceu selectat n eantion se investigheaz toi pro-
i elevii, personalul auxiliar.
269
Statistic aplicat n tiinele socio-umane
Aceast metod este destul de des utilizat n investigaii psihologice
iho-sociologice, predominante fiind totui cercetrile calitative. sau ps
Stabilirea bazei de eantionare. Baza de eantionare se stabi-
tion de 1000 de persoane (n=1000);
.
g valoarea pasului de eantionare
VIII.3.4.6 Eantionarea sistematic
Se numete i eantionare cu pas i reprezint o variant a eantion-
rii aleatorii simple, fiind chiar mai comod dect aceasta. Ca principale avan-
taje menionm uurina n utilizare i posibilitatea de calcul a erorii de ean-
tionare. Pe lng dezavantajele eantionrii aleatorii simple, metoda prezint
i dezavantajul periodicitii. Modalitatea de lucru n vederea construirii unui
eantion prin eantionare stratificat este urmtoarea:

lete prin acelai procedeu ca i n cazul eantionrii aleatorii


simple. Avem din nou nevoie de lista exhaustiv a brbailor
din Romnia, spre exemplu;
Se determin mrimea eantionului. Prin procedee de calcul
specifice, stabilim mrimea eantionului. Pentru exemplul nos-
tru, vom considera un ean
Se stabilete pasul de eantionare. Pasul de eantionare re-
prezint expresia raportului dintre volumul populaiei i volu-
mul eantionului: pos =
N
n
,
. n cazul nostru, pasul de eanti-
onare va fi
8uuuuuu
1uuu
, = 8uuu
Stabilirea punctului de start. Punctul de start reprezint lo-
cul de ncepere a eantionului. Se genereaz un numr aleato-
riu ntre 1 i 8000, numr care va reprezenta punctul de start.
S presupunem c acest numr este 5421. Subiectul cu acest
numr de ordine va fi prima persoan inclus n eantion.
Elaborarea eantionului. La numrul care indic punctul de
start, se adau
270
Cristian Opariuc-Dan
(5421+8000=13.421). Subiectul cu acest numr de ordine n
baza de eantionare va fi al doilea subiect inclus n eantion.
Al treilea subiect inclus n eantion va fi cel cu numrul de or-
dine 13.421+8000=21.421 i aa mai departe pn la comple-
tarea efectivului de 1000 de persoane.
VI
aleatoriu
nare n
lul popula
ns tehnici aleatorii. Printre avantajele acestei metode putem meniona rapi-
dita
eantio
eantio
referitoare la structura populaiei iar eroarea de eantionare i nivelul de n-
cre
Blagoslove
deu:
.
n eantion, n funcie de proporia n
II.3.4.7 Eantionarea pe cote
Se aseamn cu eantionarea stratificat, ns nu mai are un caracter
i de aceea metoda este inclus n categoria procedeelor de eantio-
ealeatorii. Principul este acelai. Se identific o serie de straturi la nive-
iei i se ncearc reproducerea acestora n eantion, fr a se folosi
tea obinerii eantionului, relativa economie de resurse i lipsa bazei de
nare. Totui, metoda nefiind aleatorie, riscul de obinere a erorilor de
nare este foarte mare. De asemenea, sunt necesare cunotine solide
dere sunt elemente ce nu pot fi calculate. Relund exemplul din judeul
ti, am putea construi un eantion pe cote prin urmtorul proce-
Stabilirea cotelor (variabilelor de stratificare) i a structu-
rii populaiei. Se face identic ca i n cazul eantionrii strati-
ficate. Vor rezulta cele patru grupe, cu procentele din popula-
ie asociate (vezi tabelul 8.1);
Stabilirea mrimii eantionului. Se face n urma unor calcu-
le specifice, adecvate acestui tip de eantionare, calcule pe ca-
re le vom prezenta ntr-un capitol ulterior
Stabilirea compoziiei eantionului. Este o etap n care se
opereaz ca i la eantionarea stratificat, stabilindu-se num-
rul de persoane cuprinse
271
Statistic aplicat n tiinele socio-umane
care se regsesc n populaie (vezi tabelul 8.2). Aceasta este i
etapa final a eantionrii pe cote, nefiind implicat vreo pro-
cedur aleatorie sau vreo baz de eantionare.

diul urban, 8 femei din
me
crete.
testelor ps ele rezultate fiind i ele la rndul
lor lim
VIII.3.4.8
mediul c
propor
care unitile de eantio-
nare difer
de eantiona
mici.
numr
tion m pro-
babilit
me
Opera orilor li num t se comunic doar rul subiecilor i categoria din
care fac parte, rmnnd la latitudinea lor alegerea concret a cazurilor. Acest
lucru induce erori de eantionare serioase, determinnd includerea acestei
metode n categoria procedeelor nealeatorii. De exemplu, dac avem un nu-
mr de 10 operatori pentru realizarea studiului de mai sus, acestora li se va
comunica doar necesitatea administrrii instrumentelor de cercetare pe un
numr de 8 brbai din mediul rural, 5 brbai din me
diul rural i 9 femei din mediul urban, fr vreo referire la persoane con-
Eantioanele pe cote se aplic destul de des n procesul de adaptare a
ihologice n Romnia, instrument
itate de problemele acestei metode.
Eantioane cu probabilitatea proporional cu
mrimea
Reprezint o metod derivat din eantionarea sistematic, prin inter-
reia probabilitatea de selectare a unei uniti de eantionare este
ional cu dimensiunea acesteia.
Tehnica este extrem de util n condiiile n
foarte mult sub aspectul dimensiunilor, determinnd ca unitile
re mari s aib aceeai probabilitate de a fi selectate ca i cele
ntre Bucureti i Pacani exist o mare diferen n ceea ce privete
ul de locuitori. n mod normal, probabilitatea de a selecta ntr-un ean-
ai muli bucureteni este mult mai mare. Folosind aceast tehnic,
ile se egaleaz. Eantioanele cu probabilitate proporional cu mri-
a sunt utilizate, n special, n domeniul organizaional, n cercetri la nive-
272
Cristian Opariuc-Dan
lul c
condu
metoda perm
tion.
urm o cercetare
n numr de 29 de localiti. Dup
ie. n cazul nostru, vom nregistra toate cele 29 de localiti
n interval (de exemplu vrsta
caie selectat
rora se intenioneaz investigarea personalului. Deoarece cadrele de
cere sunt mai puin numeroase n comparaie cu cadrele de execuie,
ite egalarea anselor celor dou categorii de a fi incluse n ean-
Relund exemplul anterior, ne propunem s desf
oarecare n judeul Trubadurul, care are u
cum observai n tabelul 8.3, localitile sunt difereniate sub aspectul popula-
iei. n timp ce localitatea 26 are un numr de 197 de locuitori, localitatea 21
are un numr de 1590 de locuitori. Evident c ansele de a extrage mai muli
locuitori din localitatea 21 sunt mai mari n comparaie cu localitatea 26, de
unde, cel mai probabil, nu va participa nimeni la cercetare. Prin acest proce-
deu de eantionare putem egala situaia, astfel nct subiecii din fiecare loca-
litate s aib o ans calculabil de a fi inclui n eantion.
Etapele de realizare a unui asemenea eantion sunt urmtoarele:
Inventarierea unitilor de eantionare i a dimensiunii
acestora. n aceast etap se listeaz toate unitile de eantio-
nare din teritoriu, precum i volumul corespunztor de popula-
ordinea nu conteaz mpreun cu volumul populaiei pentru
fiecare unitate (coloanele Localitate i Populaie din tabelul
8.3). La acest nivel se poate lucra fie cu lista complet, fie cu
uniti de eantionare grupate
ntre 0 i 10 ani, ntre 11 i 21 de ani etc.)
Tabel 8.3 Eantion cu probabilitate proporional cu mrimea
Localitate Populaie Populaie cumulat Lo
1 542 542 423
2 245 787
3 1032 1819
4 867 2686 1891
5 256 2942
6 352 3294
273
Statistic aplicat n tiinele socio-umane
7 835 4129 3359
8 645 4774
9 427 5201 4827
10 312 5513
11 1342 6855 6295
12 390 7245
13 604 7849 7763
14 465 8314
15 897 9211
16 476 9687 9231
17 365 10052
18 967 11019 10699
19 533 11552
20 215 11767
21 1590 13357 12167
22 423 13780 13635
23 645 14425
24 867 15292 15103
25 423 15715
26 197 15912
27 586 16498
28 365 16863 16571
29 756 17619
Calculul populaiei cumulate. Vom calcula apoi frecv
cumula
ena
t a ntregului volum de populaie int. Ultima unitate
m c prin calculul frecvenelor cumu-
judeului Trubadurul. n funcie de numrul total al unitilor
de eantionare va conine, evident, volumul total al populaiei.
n cazul nostru, n judeul Trubadurul triesc 17.619 persoane
(N=17.619). Ne reaminti
late, practic ordonm cresctor populaia noastr.
Stabilirea mrimii eantionului. Prin procedee specifice de
calcul se determin mrimea eantionului. n cazul nostru vom
considera c am ales un eantion de 120 de persoane, repre-
zentativ pentru judeul Trubadurul (n=120).
Determinarea numrului de locaii. Eantionul de 120 de
persoane va trebui ales din unele dintre cele 29 de localiti ale
274
Cristian Opariuc-Dan
de eantionare, se stabilesc localitile n care se va desfura
cercetarea. Pentru 120 de persoane, am ales un numr de 12
localiti din cele 29. n fiecare localitate vor fi intervievate 10
persoane.
oria ce conine al
ula-
ru a doua locaie se
velul
calit fl a 18 rso
1891 se a n localitatea 4, care cuprinde subiec la al
1820-lea 2686-lea). Un perator se va de lasa n
aceast localitate, i printr-un deu similar va vieva
Stabilirea pasului de eantionare. Se realizeaz la fel ca la
eantionarea sistematic, prin divizarea populaiei totale, de
data aceasta la numrul locaiilor i nu la volumul eantionu-
lui. Pentru exemplul nostru, avem un pas de eantionare de
17.619:12=1468,25 rotunjit 1468.
Stabilirea punctului de start. Se va alege aleatoriu un numr
ntre 1 i pasul de eantionare, acela fiind numrul locaiei de
start. S presupunem c numrul generat aleatoriu este 423. La
fel ca la stabilirea medianei, verificm categ
423-lea subiect, prin inspectarea coloanei Populaie cum
t. Observm c aceast valoare cumulat se regsete chiar
n prima locaie. Prin urmare, una dintre cele 12 locaii este lo-
calitatea 1. n acea localitate, folosindu-se ca baz de eantio-
nare lista exhaustiv a celor 542 de persoane, ori prin alt me-
tod aleatorie sau sistematic (de exemplu de la casa 10, fieca-
re a 54-a cas), vor fi intervievate 10 persoane.
Stabilirea eantionului. La punctul de start 423 se adaug va-
loarea pasului 1468 i se obine noua locaie
(423+1468=1891). Valoarea cumulat pent
afl n dreptul localitii 4 (V mai amintii, sper, c la ni
lo ii 3 se a 19-a persoan. Pe ana cu numrul
fl ii de
la al alt o p
proce inter
275
Statistic aplicat n tiinele socio-umane
10 persoane. Procesul continu la stabilirea tuturor celor
12 localit
A ezultat exact caliti, mai pre alitile 1 542 locuitori,
4 867 locuitori, 7 835 locuitori, 9 427 locuitori, 11 1342 locuitori, 13
604 locuitori, 16 476 locuitori, 18 967 locuitori, 21 1590 locuitori, 22
423 locuitori, 24 867 locuitori i 28 365 locuitori.
VIII.3.5 Determi ea mrimii e nului
n toate exemplele din subcapitolul a am stabilit va acte
pentru m mea unui e i, ntrebarea pe care cred c v-o punei
este cum terminm m antionului, astfel nct folosind o anumit
tehnic de eantionare, e ionul rezultat s rezentativ. C sim-
plu rspuns ar fi s cons pagina de inter e Survey Sys flat
la adres /sscalc.htm
pn
i.
u r 12 lo cis loc
nar antio
nterior lori ex
ri antion. Totu
de rimea e
ant fie rep el mai
ultai net Th tem, a
a: http://www.surveysystem.com unde gsii un excelent
calculato entru mrim antionului, mpr u explicaiile de rigoare.
Un asem a demers nu ar fi ns tiinific, de vom descope eun
procedeele necesare stabilirii mrimii eantion
factori:
unui ean-
iile unui eantion
de dimensiuni mai mari;
r p ea e eun c
ene aceea ri mpr
ului.
Determinarea mrimii unui eantion depinde, n principal, de cinci
Eroarea statistic ca expresie a diferenei dintre indicatorul
obinut la nivelul eantionului i valoarea parametrului la nive-
lul populaiei. Am mai spus acest lucru; prin studiul
tion noi nu putem dect s estimm un parametru al populaiei.
Niciodat nu obinem valoarea sa exact. n funcie de modul
n care proiectm cercetarea i de nivelul de precizie dorit, pu-
tem reduce eroarea statistic, ns n condi
Variabilitatea populaiei estimat de obicei prin intermedi-
ul abaterii standard. Se refer la amplitudinea pe care o au
276
Cristian Opariuc-Dan
opiniile populaiei, element care afecteaz de asemenea di-
mensiunea eantionului. Cu ct variabilitatea este mai mare, cu
att acurateea estimrii este mai mic i va fi nevoie de un
eantion de dimensiuni mai mari;
i mai mari. Majoritatea cer-
ituaia n care
soane sunt suficient de precise n domeniul socio-uman. Poate doar sociolo-
Nivelul de ncredere indic gradul de precizie cu care rezul-
tatele obinute prin studiul eantionului se vor regsi la nivelul
populaiei. Cu ct nivelul de ncredere este mai mare, cu att
pretenia c rezultatele obinute nu sunt atipice crete, fiind
nevoie de eantioane de dimensiun
cetrilor utilizeaz un nivel de ncredere de 95%;
Dimensiunea populaiei n mod normal, acest factor nu
afecteaz dimensiunea eantionului atta timp ct aceasta se
afl sub 5% din populaie. Dac dimensiunea eantionului este
mic n raport cu dimensiunea populaiei, factorul se poate ig-
nora. Dimensiunea populaiei devine important n condiiile
n care mrimea eantionului depete 5% din totalul popula-
iei (de exemplu, dac extragem un eantion de 40 de persoane
dintr-o populaie de 100 de persoane). n general, efectul este
acela de a se reduce uor dimensiunea eantionului.
Proporia din populaie se refer doar la s
eantionul este folosit pentru a msura un atribut din populaie
n locul unei variabile continue. Spre exemplu, opinia popula-
iei referitoare la realegerea preedintelui, ori la efectele noci-
ve ale fumatului. Subiecii se pot exprima prin Da sau Nu,
i atunci ne intereseaz proporia opiniilor pozitive i a celor
negative. Proporia estimat a acestor rspunsuri influeneaz
dimensiunea eantionului.
n mod curent, cercetrile tiinifice pe eantioane de 50 100 de per-
277
Statistic aplicat n tiinele socio-umane
gia pre
suficient un e e subieci, considerat ca fiind volumul minim de
date ce
supune eantioane mai mari, n cazul sondajelor de opinie. Uneori este
antion de 30 d
permite analize statistice, respectiv aplicarea legii numerelor mari i a
distribuiei gaussiene. Eantioanele cu dimensiuni sub 30 de cazuri fac parte
din domeniul studiilor de caz, rezultatele obinute neputnd fi extinse la nive-
lul populaiei.
VIII.3.5.1 Calculul mrimii eantionului
Mrimea eantionului de calculeaz n funcie tipul variabilei de inte-
res. Dac variabila de interes msoar un atribut, atunci stabilirea mrimii
eantionului se face prin intermediul proporiilor; dac este o variabil con-
tinu, mrimea eantionului se determin pe baza valorilor sau se convertete
variabila continu n atribut dihotomic.
Mrimea eantionului pentru o variabil care msoar un atribut (n-
trebri de tip Da i Nu de exemplu) se determin pe baza formulei lui
Cochran:
z
2
(p)(1-p)
n =
c
2
(formula 8.1)
unde: n reprezint mrimea eantionului, z scorul z asociat nive-
lul
i p reprezint
stante,
e 90%, nota z este 1,65
ui de ncredere dorit, e este precizia dorit (numit i marj de eroare)
ponderea rspunsurilor la nivelul populaiei.
Dup cum v-ai dat seama, valorile notei z sunt de fapt nite con-
alocate n funcie de nivelul de ncredere, astfel:
La un nivel de ncredere de 80%, nota z este 1,28
La un nivel de ncredere de 85%, nota z este 1,44
La un nivel de ncredere d
La un nivel de ncredere de 95%, nota z este 1,96
278
Cristian Opariuc-Dan
La un nivel de ncredere de 99%, nota z este 2,58
Dei scorurile pentru notele z au fost prezentate de la un nivel de
ere de 80%, tim foarte bine c nivelul de ncredere minim pentru o
are serioas este de 95%. De aceea, nu rec
ncred
cercet omand niciodat s utilizai
alte scoru
valorii a
la popula
mari. S
rea n Uniun efera-o, sun-
tem
0,95 n func
nului va fi m
pesimist
caz, sun
pulaie a
va fi acum
95%).
ptm s se
sit
eroare
studiul e
suri D
zie este m
2% se sc
rm un are subiecii rspund prin Da sau
Nu, n
ri z n afar de 1,96 i 2,58.
Ponderea rspunsurilor la nivelul populaiei reprezint un estimator a
teptate pe care o poate lua atributul respectiv atunci cnd ne referim
ia int. Situaia fericit este cnd anticipm diferene procentuale
pre exemplu, cnd putem bnui c 95% din populaie ar prefera intra-
ea European, n timp ce 5% din populaie nu ar pr
n faa unei soluii optimiste, cu o pondere a rspunsurilor de 0,05 sau de
ie de sensul n care ne orientm. n acest caz, volumul eantio-
ic (75 de persoane la un nivel de ncredere de 95%). Situaia
este aceea n care nu putem anticipa orientarea atributului. n acest
tem nevoii s presupunem o pondere de 0,5, adic jumtate din po-
r rspunde Da, iar cealalt jumtate Nu. Volumul eantionului
semnificativ mai mare (384 de subieci la un nivel de ncredere de

Precizia se refer la limitele marjei de eroare ntre care acce
ueze valoarea indicatorului, exprimat sub form zecimal. O marj de
2% la un procent de, s spunem, 53% rspunsuri Da, obinut prin
antionului, nseamn c, la nivelul populaiei, procentul de rspun-
a se situeaz undeva ntre 51% i 55%. Desigur, cu ct aceast preci-
ai mare, cu att crete i volumul eantionului. Marja de eroare de
rie n form zecimal 0,02.
Cunoscnd acum toate aceste elemente, s ne imaginm c desfu-
studiu utiliznd un chestionar, la c
u avem idee care ar fi proporia rspunsurilor Da sau care ar fi pro-
279
Statistic aplicat n tiinele socio-umane
poria rspunsurilor Nu, dorim un nivel de ncredere de 95% i un nivel de
precizie de 2%. Ce volum trebuie s aib eantionul?
n =
z
2
(p)(1-p)
c
2
=
1,96
2
(0,5)(1-0,5)
0,02
2
=
3,840,50,5
0,0004
=
0,96
0,0004
= 24uu
Vom avea un eantion de 2400 de persoane pentru a obine reprezen-
tativitatea la acest nivel. Suntem cam pretenioi, nu-i aa? Bine c nu am
ineam Dac dorii s ales nivelul de ncredere de 99%, c cine tie ce ob
aflai, nlocui n formula de mai sus 1,96 cu 2,58 i v i edei.
Exerciiu:
Folosind acelai tip de studiu, calculai volumul unui eantion la un
nivel de ncredere de 95% i cu o precizie de 3%, estimnd c subiecii vor
rspunde 75% Da i 25% Nu.
n practic se folosete o formul derivat din formula 8.1 n vederea
calculrii preciziei sau a marjei de eroare:
c =
_
z
2
(p)(1-p
n
)
(formula 8.2)
n presa scris, televiziune, la radio, auzii frecvent fraze de acest gen:
65% din populaie l prefer pe Icsulescu la alegerile prezideniale. Sondajul
are o marj de eroare de 2,5%. Cunoscnd marja de eroare i faptul c ni-
velul de
ne a fo
tionului? Dac vi se
com ost format
din prere s
aplic
ncredere nu se poate situa sub 95%, putei afla uor din cte persoa-
st format eantionul, aplicnd formula 8.1. Dar dac afirmaia de mai
sus nu prezint marja de eroare, ci doar volumul ean
unic rezultatele de mai sus, cu specificaia c eantionul a f
tr-un numr de 180 de persoane, cum aflai precizia? Eu a fi de
m formula 8.2
280
Cristian Opariuc-Dan
c =
_
z
2
(p)(1-p)
=
_
1,96
2
(0,65)(1-0,65)
= _
3,840,650,35
_
0,87
= =
180 180 180 n

u,uu4 = u,u6 = 6%
O precizie de 6% mi se pare extrem de mic pentru un asemenea
sondaj. Cu alte cuvinte, preferinele pentru Icsulescu variaz ntre 59% i
71%. C
Dac nu dorim totui s facem acest lucru, o alt metod prin care pu-
tem de
am mare marja de eroare, nu credei?
Atunci cnd variabila msurat are un caracter continuu (cum ar fi de
exemplu nlimea), se utilizeaz o alt formul pentru determinarea mrimii
eantionului, formul ce ine cont de variana caracteristicii msurate la nive-
lul populaiei. Deoarece aceast varian de multe ori nu poate fi anticipat,
existnd prea puine anse s cunoatem n mod real variana parametrului la
nivelul populaiei, majoritatea studiilor de acest tip prefer transformarea
variabilelor continui sau polihotomice n variabile dihotomice pentru aplica-
rea calculului de proporii. Acest lucru se poate efectua prin combinarea rs-
punsurilor n dou categorii (de exemplu subieci nali i subieci scunzi) i
apoi aplicarea metodei de estimare prin proporii, aceast tehnic fiind accep-
tat cvasi-universal.
termina volumul unui eantion n cazul variabilelor continui este aceea
prin care nlocuim variana populaiei cu variana eantionului. Deoarece aba-
terea standard la nivelul unui eantion aproximeaz bine abaterea standard a
populaiei, ne putem permite s realizm un studiu pilot pe un numr de 30-
40 de subieci, calculm apoi abaterea standard, pe care o folosim la determi-
narea mrimii eantionului dup formula:
z
2
c
n =
c
2
(formula 8.3)
Spre exemplu, dorim s efectum o cercetare n care s putem stabili
nlimea medie a brbailor din Romnia. Dac am ti abaterea standard a
parametrului nlime pentru ntreaga populaie, ar fi perfect. O asemenea
281
Statistic aplicat n tiinele socio-umane
valoare probabil c nu poate fi niciodat cunoscut. Totui avem nevoie s
stabilim volumul unui e antion reprezentativ de brbai, la un nivel de
95% i cu o marj de eroare de 0,2. Nu cunoatem ns valoare
ndard. Pentru a o afla, vom stabili un lot de 30 de brbai, alei n
ncre-
dere de a aba-
terii sta tm-
pltor,
n =
u,2
2
i vom msura nlimea acestora. Datele au fost deja analizate ntr-un
capitol anterior, de unde am reinut c abaterea standard avea valoarea 4,46.
Nu ne rmne acum dect s nlocuim n formul i obinem:
1,96
2
4,46
= 428
Formulele de mai sus sunt aplicabile numai n condiia n care volu-
mul eantionului nu depete 5% din volumul populaiei. n situaia n care
volumul eantionului trece de acest prag, se aplic o corecie care-i reduce
uor dimensiunea, dup formula:
n =
n
n-1
1+
N
(formula 8.4)
Dac ntr-o cerce 398 de ca-
zuri iar volumul popula 00 de cazuri, aplicnd formula vom
obine:
tare am stabilit volumul unui eantion la
iei (N) este de 20

n =
n
1 +
n -1
N
=
S98
1 +
S98 -1
2uuu
=
S98
1,19
= SS4
S-a constatat o uoar reducere a eantionului ctre pragul de 5%.
Aceast metod poart numele de corecie pentru populaii finite. Yamane
a stabilit o formul direct de calcul a eantionului pentru populaii de mici
dimensiuni, pe baza formulei:
n =
N
1+N(c)
2
(formula 8.5)
282
Cristian Opariuc-Dan
Dac vom aplica formula pe cazul anterior, vom obine la un nivel d
precizie de 5%:
n =
N
e
1 +N(c)
2
=
1 +2uuu u,uS
2
2uuu
=
6
2 u uu
= SSS
Observm c valoarea se apropie mult de cea obinut anterior prin
corecie.
VIII.4 Construcia eantioanelor n SPSS
SPSS prezint un instrument foarte puternic
de creare a eantioanelor n condiiile n care avei
la dispoziie baza de eantionare. Cu ajutorul pro-
gramului SPSS putei crea urmtoarele tipuri de
eantioane:
Eantioane simple aleatorii, cu sau
fr nlocuire;
Eantioane stratificate i pe clusteri;
Eantioane multistadiale;
Eantioane probabilistice proporio-
nal cu mrimea sau tipuri de eanti-
oane nealeatorii.
Structura eantioanelor n SPSS se prezint sub forma unor fiiere tip
plan. Exist un numr de dou nuri: pla
antionare conine specificaiile

Planul de e de definire a
eantionului.
Planul de analiz conine date necesare procedurilor de
analiz complex pentru a calcula variana eantionului. Planul
Figura 8.4 Meniul de creare
i analiz a eantioanelor
283
Statistic aplicat n tiinele socio-umane
include structura eantionului, metodele de estimare pentru fi-
ecare stadiu, referinele la variabilele de interes.
Debutul procedurii de creare a unui eantion se face prin deschiderea
bazei de eantionare. Vom folosi, n acest scop, o baz de date pus la dispo-
ziie de SPSS Inc. situat n directorul n care s-a instalat aplicaia. Baza de
date se numete 1991 U.S. General Social Survey.sav i conine un numr
de 1517 nregistrri repre sondaj efe zentnd rezultatele unui
de date este destul de mare, avnd
rafice, putem folosi acest
ctuat n Statele
Unite. Deoarece volumul i o serie de va-
riabile factuale i demog fiier ca exemplu pentru
baza no
eniul Complex Samples se alege opiu-
nea Select a Sample. C de un program
special (Wizard sau asistent) ce presupune mai muli pai.


astr de eantionare.
VIII.4.1 Crearea unui eantion n SPSS
Proiectarea unui nou plan de eantionare se realizeaz prin apelarea
meniului Analyze iar din subm
rearea unui eantion este asistat
Figura 8.5 Primul p i eantion. Salvarea fiierului plan as al crerii unu
284
Cristian Opariuc-Dan
Prima fereastr afiat ne solicit alegerea unui fiier n care va fi
stocat planu e l de ea imp este Design a s
folosi pentru a specifica locaia i numele planului de e
introduce direct calea ctre fiierul ce urmeaz a fi salv
butonul Browse pentru a alege locul pe hard-disc
antionar
antionare. Opiun licit ample pe
care o vom antionare.
Vom putea at sau vom
putea apsa unde va fi
salvat p
r. n cazul nostru, fiierul l-am denumit Test.csplan i a fost sal-
de tip plan de eanti-
stent, avei la dispoziie
ia vei putea reconfigura
multistadial creat ante-
t plan de eantionare va trebui iniial deschis prin tastarea
cii c se.
de eantionare fcut i dorii s creai un ean-
tion n b Draw a sample, dup care ale-
ge urmtoarea etap se face
prin interm i oricnd abandona operaia apsnd
pe butonul Cancel sau putei parcurge sistemul de asisten contextual
pri
ui de
tea stng orescent, sunt afiate opiunile acestui sta-
cru (opiunea Design variables).
Avem
nare. Folosind butoanele de transfer (butoanele s
aceste variabile n seciunea Stratify By dac dorim un eantion stratificat
dup
(aminti
lanul de e e. Evident, va trebui s furnizm i un nume pentru
acest fiie
vat direct pe discul C:\. Observai c extensia fiierelor
onare este .csplan.
Pentru a modifica un plan de eantionare exi
opiunea Edit a sample design. Cu ajutorul aceste
sau elimina stadii din cadrul unui plan de eantionare
rior. Evident, aces
tre fiierul de tip .csplan sau folosind butonul Brow
Dac avei deja un plan
aza acestuia, putei folosi opiunea
i fiierul plan dorit, la fel ca mai sus. Trecerea la
ediul butonului Next. Pute
n accesarea butonului Help.
A doua fereastra presupune definirea planul
, avnd o structur arb
eantionare. n par-
diu. Prima opiune implic precizarea variabilelor de eantionare n cazul
unor eantioane ce presupun acest lu
prezentate, n seciunea central, toate variabilele din baza de eantio-
geat) vom putea include
acea variabil. Se vor putea preciza astfel straturile sau subpopulaiile
i-v de fasolele de 1 an i de 10 ani). n urma acestei selecii se obin
285
Statistic aplicat n tiinele socio-umane
eantioane s
estim in punctul de
O variabil introdus n seciunea Clusters permite crearea unui
eantion pe clusteri n care se definesc grupuri de uniti de observaie. Pen-
tru a se evita pierderea preciziei i a compensa dezavantajele eantionrii pe
clusteri, ntre clusteri trebuie s existe o eterogenitate ct mai mare sub as-
pectul variabilei de interes.
Dac planul de eantionare este parte dintr-un plan de eantionare mai
complex, putei introduce o variabil numeric n seciunea Input Sample
Weight, variabil ce reprezint dimensiunea unui eantion construit ntr-un
stadiu anterior.
Pentru claritate, se poate introduce un scurt text care va descrie stadiul
n curs, olo
eparate pentru fiecare strat. Pentru a se putea mbunti precizia
rilor, unitile din fiecare strat vor fi ct mai omogene d
vedere al caracteristicii estimate.


Figura 8.6 Pasul 2: Definirea variabilelor cercetrii
sind caseta de text Stage Label. f
286
Cristian Opariuc-Dan
n acest exemplu vom dori s construim un eantion simplu randomi-
zat. Deocamdat nu ne intereseaz n mod deosebit opiunile prezentate.
Urmtoarea seciune, Method, permite stabilirea tehnicii de eanti-
onare pe care o folosim.


SPSS permite selectarea,
Figura 8.7 Pasul 2: Alegerea metodei de eantionare
n funcie de variabilele precizate n etapa
anterioar, a mai multor tipuri de eantioane. Deoarece nu am inclus nici o
variabil n etapa anterioar optnd pentru un eantion simplu randomizat
n caseta de selecie Type din cadrul seciunii Method vor fi disponibile
doar opiunile de acest tip. Observm existena doar a eantioanelor de tip
randomizat simplu, sistematic i secvenial i a eantioanelor de tip propor-
ional cu mrimea PPS simplu, sistematic i secvenial. Din aceast list
vom alege eantionul simplu randomizat (opiunea Simple Random Sam-
ple).
287
Statistic aplicat n tiinele socio-umane
La nivelul acestei etape exist posibilitatea de a efectua selecia fr
reintroducerea bilei n urn opiunea Without replacement (WOR)
sau cu reintroducerea bilei n urn opiunea With replacement (WR).
Cu alte cuvinte, o unitate selectat n eantion va fi eliminat de la urmtoare-
le posibile selecii n cazul WOR sau nu va fi eliminat, existnd posibili-
tatea unei noi selecii n cazul WR. n acest din urm caz, bifnd caseta
Use WR estimation for analysis comunicai programului SPSS s estime-
ze aceast probabilitate de reincludere a unui element n eantion. Implicit,
metoda de estimare este specificat n fiierul plan i este consistent cu tipul
de eantion selectat. Opiunea permite, de asemenea, forarea metodei cu in-
troducerea bilei n urn, chiar dac metoda de eantionare presupune o selec-
ie fr introducerea bilei n urn.
Pe scurt, tipurile de metode ce pot fi alese n aceast etap sunt:
Simple Random Sampling eantion aleatoriu simplu n care
unitile sunt selectate cu o probabilitate egal. Metoda poate
fi fo n;
Simple Systematic eantion sistematizat simplu (cu pas).
unitile sunt extrase secvenial cu pro-
xtrase aleatoriu cu o probabilitate proporional cu mrimea.
Orice unitate se selecteaz cu reintroducerea bilei n urn, ex-
losit cu sau fr reintroducerea bilei n ur
Unitile sunt selectate cu un pas fix de eantionare din baza
de eantionare. Se poate folosi i n cazul eantionrii stratifi-
cate dac s-au specificat anterior variabilele de stratificare. Se-
lecia se face fr introducerea bilei n urn;
Simple Sequential
babilitate egal i fr introducerea bilei n urn;
PPS eantion proporional cu mrimea n care unitile sunt
e
ceptnd configurarea anterioar a unui eantion pe clusteri;
288
Cristian Opariuc-Dan
PPS Systematic eantion proporional cu mrimea de tip
sistematic.
PPS Sequential eantion proporional cu mrimea de tip
secvenial;
PPS Brewer eantion proporional cu mrimea n care sunt
selectate dou clustere din fiecare strat cu o probabilitate pro-
porional cu mrimea clusterului, fr introducerea bilei n
urn. Necesit precizarea unei variabile de tip cluster;
PPS Murthy un eantion similar celui anterior. Difer doar
metoda statistic prin care sunt alese unitile;
PPS Sampford eantion proporional cu mrimea ce selec-
teaz mai mult de doi clusteri din fiecare strat cu o probabilita-
te proporional cu mrimea clusterului i fr introducerea bi-
lei n urn. Necesit, de asemenea, specificarea unui variabile
pentru cluster
Opiunea Measure of Size (MOS) se aplic eantioanelor de tip
PPS proporiona i dimensiuni de-
finitorii pentru mrimea fiecrei uniti. Aceste valori pot fi definite n mod
explici
zentativ.
le cu mrimea i implic precizarea une
t, extrase fiind dintr-o variabil (prin bifarea opiunii Read from va-
riable i introducerea variabilei din care vor fi extrase datele) sau pot fi cal-
culate automat selectnd Count data records. De asemenea se poate pre-
ciza amplitudinea acestor dimensiuni introducnd valorile minime i maxime
n casetele de text Minimum respectiv Maximum.
Determinarea mrimii eantionului reprezint ultima aciune din acest
stadiu. Pentru baza noastr de date, un eantion cu o marj de eroare de 2% i
un interval de ncredere de 95% implic un numr de 930 de subieci pentru a
fi repre
289
Statistic aplicat n tiinele socio-umane
Acest pas presupune specificarea numrului sau a proporiei n care
vor fi selectate unitile de eantionare. Dimensiunea eantionului poate fi
fix sau poate varia n funcie de straturi.

Figura 8.8 Pasul 2: Stabilirea dimensiunii eantionului
Caseta de selecie Units permite alegerea ntre un numr fix de uni-
lectate alegnd opiunea Counts sau a unei proporii de uniti n
n alegnd opiunea Proportions.
Opiunea Value permite aplicarea unei valori u
ti se
eantio
nice pentru toate
straturile. n m
nii ea
clude propor plu 0,10
pe
eantio
straturilor nu sunt egale.
odul numrului fix, va trebui s introducei valoarea dimensiu-
ntionului (n cazul nostru 930). Dac optm pentru proporii vom in-
ia din populaie pe care o regsim n eantion (de exem
ntru 10% din populaie).
Opiunea Unequal values for strata permite introducerea valorilor
nului pentru fiecare strat definit, n condiiile n care dimensiunile
290
Cristian Opariuc-Dan
Read values from variable permite selectarea unei variabile nu-
merice n care sunt stocate dimensiunile fiecrui strat.
fica lim perioare ale numrului de uniti ce vor fi selecta-
te (de exemplu nu m
Maxim
urmeaz
bile vor fi salvate n
baza de
pulaie la un anumit stadiu. n baza de date aceast variabil
va ncepe cu PopulationSize_;
La alegerea eantionului bazat pe proporii, putem de asemenea speci-
itele inferioare i su
ai puin de 50 Minimul i nu mai mult de 200
um)
Apsarea butonului Next determin afiarea ferestrei variabilelor ce
a fi calculate.


Pe parcursul acestei etape putem preciza ce varia
Figura 8.9 Pasul 3: Alegerea variabilelor eantionului
date n urma crerii eantionului, astfel:
Bifnd caseta Population size vom comunica aplicaiei cre-
area unei variabile ce va stoca numrul estimat de uniti din
po
291
Statistic aplicat n tiinele socio-umane
Bifnd caseta Sample size vom putea salva o variabil care
s conin numrul de uniti selectate la un anumit stadiu. n
baza de date aceast variabil va ncepe cu SampleSize_;
Bifnd caseta Sample proportion se va crea o variabil ce
va conine proporia eantionului selectat din populaie. Varia-
bila va ncepe cu SamplingRate_;
Bifnd caseta Sample weight comunicm programului
SPSS s creeze o variabil ce va stoca inversul probabilitilor
de includere a unui element n eantion. Numele variabilei va
ncepe n baza de date cu SampleWeightCumulative_ iar va-
riante ale acestei variabile au un rol important n procesul de
analiz a eantionului.
Alturi de aceste variabile, n baza de date vor fi create automat o se-
rie de noi variabile dup cum urmeaz:
Pro ilor selectate la
nivelul unui anumit stadiu, variabile identificat prin
riabil identificat prin
roducerea bilei n urn.
babilitatea de includere proporia unit
InclusionProbability_;
Mrimea cumulat mrimea cumulat a eantionului de la un
stadiu la altul, va
SampleWeightCumulative_;
Indexul permite specificarea unitilor selectate de mai multe
ori la nivelul unui stadiu, variabil identificat prin Index_.
Variabila este salvat doar n condiiile n care se folosete op-
iunea cu int
Ca regul general, n baza de date fiecare variabil nou creat va fi
urmat, dup linia de subliniere, de o cifr care indic stadiul. De exemplu,
292
Cristian Opariuc-Dan
probab
_1_.
nt dat s-a activat i butonul Finish. Acest lucru nseamn c
SPSS a
za toate etapele acestui instrument.
rent. Obinem scurte infor-
ma
una
i met
unui n age 2 now n cazul n care
ilitatea de includere a unei uniti n eantion pentru primul stadiu va
aprea n baza de date sub forma InclusionProbability
n exemplul nostru, am bifat salvarea tuturor variabilelor n baza de
date n vederea comentrii ulterioare a ctorva cazuri. Apsarea butonului
Next permite trecerea la urmtorul pas al crerii eantionului. Am observat
c la un mome
re deja suficiente informaii pentru a crea eantionul i putem sri pes-
te paii rmai. Noi vom parcurge totui ntregul proces pentru a putea anali-

Figura 8.10 Pasul 4: Sumarul stadiului
Noua etap afieaz sumarul stadiului cu
ii despre numrul stadiului, eticheta acestuia n cazul n care am definit
variabila de stratificare, variabila de cluster, dimensiunea eantionului
oda de eantionare folosit. La acest nivel avem posibilitatea crerii
ou stadiu selectnd opiunea Yes, add st
293
Statistic aplicat n tiinele socio-umane
ne inte
efectiv
este de fapt la
eta
simplu nct vom apsa butonul
Next
creare efectiv
acum e
eantionului, selectnd
rare a t
reseaz o eantionare multistadial sau iniierea etapelor de creare
a eantionului alegnd No, do not add another stage now care
i varianta implicit selectat. De asemenea, ne putem ntoarce
pele anterioare apsnd butonul Back.
Pentru moment, nu suntem interesai dect de crearea unui eantion
aleatoriu, fr alte stadii suplimentare, astfel
.


Figura 8.11 Pasul 5: Crearea eantionului. Opiuni de selecie
Noua fereastr prezint o serie de opiuni ce iniiaz modalitatea de
a eantionului. Sistemul ne ntreab dac dorim s crem
antionul (Do you want to draw a sample?). Putem alege crearea
Yes, situaie n care vom avea posibilitatea de gene-
uturor stadiilor, alegnd All din lista derulant sau crearea eantio-
nului doar pentru un anumit stadiu, prin selectarea numrului acestuia. Stadii-
294
Cristian Opariuc-Dan
le pot fi generate doar n ordine. Astfel, nu putem crea stadiul 3 n condiiile
n care nu au fost executate stadiile 1 i 2.
Seciunea What type of seed value do you want to use? permite
stabilirea valorii de iniializare pentru generatorul de numere aleatoare. Pu-
tem alege ntre un numr oarecare, generat automat de computer (selectnd
A randomly-chosen number) sau putem include o valoare n caseta de
text Custom value n situaia n care se dorete reproducerea caracteristici-
lor eantionului.
Cele dou casete de bifare permit tratarea cazurilor n care lipsesc in-
formaii la nivelul unor elemente i accelerarea procesului de generare a ean-
tionului. Bifarea primei casete are ca efect includerea ntr-o categorie separa-
t a unitilor cu date lips iar debifarea acesteia ignor unitile care au date
lips.
Bifarea celei de-a doua casete are ca efect accelerarea procesului de
generare a eantionului n condiiile n care datele sunt deja sortate dup valo-
rile unei variabile de stratificare. Altminteri, SPSS va proceda la o nou re-
sortare, operaiune consumatoare de timp.
Urmtoarea etap permite precizarea locului n care va fi salvat ean-
tionul i variabilele pe care acesta le genereaz. Putem opta ntre baza de date
curent (Active dataset), caz n care SPSS va selecta din baza de eantio-
nare unitile incluse n eantion i va calcula variabilele necesare do
acestea, putem alege o nou baz de date (New dataset), caz n care SPSS
va crea o nou baz de de doar unitile selec-
tate n eantion sau putem crea o nou baz de date cu salvare (External
file),
ar pentru
date, nesalvat, n care va inclu
caz similar celui anterior, singura deosebire fiind aceea c SPSS va
crea un nou fiier pe disc i va salva eantionul. n cele dou situaii va trebui
s precizm numele bazei de date, respectiv numele i calea ctre fiierul de
date.
295
Statistic aplicat n tiinele socio-umane



n aceast fereastr se mai afl un numr de dou elemente:
Fiierul n care vor fi salvate probabilitile cumulate (Joint
probabilities) n cazul n care se folosesc eantioane propor-
ionale cu mrimea i fr introducerea bilei n urn
Regulile de selecie ale cazurilor (Case selection rules) n
Figura 8.12 Pasul 5: Crearea eantionului. Opiuni de salvare
cazul n care se genereaz un singur stadiu la un moment dat i
se dorete salvarea regulilor de selecie a cazurilor ntr-un fii-
er separat. Opiunea este util la construirea sub-stadiilor.
n situaia noastr, am ales salvarea eantionului n aceeai baz de
date pentru a putea urmri mai uor procesul de selecie. Apsarea butonului
Next permite trecerea la ultima etap a crerii eantionului.
296
Cristian Opariuc-Dan
Ultima fereastr ne ntreab dac dorim s salvm designul realizat n
planul de eantionare i s crem efectiv eantionul (opiunea Save the de-
sign to
ie este simplu aleatorie fr reintroducerea bilei n urn iar eantionul coni-
a plan and draw the sample) sau dorim s copiem ntr-un fiier de
sintax comenzile SPSS generate n urma prelucrrilor noastre (opiunea
Paste de syntax generated by the Wizard into a syntax window).
Evident, vom alege prima opiune i vom apsa apoi butonul
Finish.



Dup cteva fraciuni de secund, SPSS procedeaz la crearea eanti-
onului i ne ofer o serie de informaii n fereastra de rezultate (Output).
Primul tabel din fereastra de rezultate se refer la informaii despre
planul de eantionare. Observm c avem un singur stadiu, metoda de selec-
Figura 8.13 Pasul 6: Crearea eantionului
297
Statistic aplicat n tiinele socio-umane
ne un numr de 930 de cazuri. n acest tabel regsim informaii despre noile
variabile create n baza de date i, de asemenea, ne este furnizat fiierul ce
conine planul de eantionare.
Tabelul planului de eantionare prezint i o serie de date utile n pro-
iectarea planului de analiz a eantionului pe care-l vom discuta n urmtorul
subcapitol.
O variabil foarte important la acest nivel este variabila
SampleWeight_Final_, folosit n general la proiectarea planului de anali-
z a eantionului ca variabil caracteristic a reprezentativitii cazurilor n
eantion.



nerat se refer
la sumarul stadiului. Pentru fiecare sta-
Summary
Simple random sampling
without replacement
930
Stage 1

Urmtorul tabel ge
InclusionProbability_1_
SampleWeight
Cumulative_1_
PopulationSize_1_
SampleSize_1_
SamplingRate_1_
SampleWeight_1_
Equal probability
sampling without
replacement
Obtained from variable
InclusionProbability_1_
Selection Method
Number of Units Sampled
Stagewise Inclusion
(Selection) Probability
Stagewise Cumulative
Sample Weight
Stagewise Population
Size
Stagewise Sample Size
Stagewise Sampling
Rate
Stagewise Sample
Weight
Sample Information
Variables Created or
Modified
Estimator Assumption Analysis Information
Inclusion Probability
Plan File: C:\Test.csplan
Weight Variable: SampleWeight_Final_
Figura 8.14 Planul de eantionare
Summary for Stage 1
930 930 61,3% 61,3%
Requested Actual Requested Actual
Number of Units
Sampled
Proportion of Units
Sampled
Plan File: C:\Test.csplan
Figura 8.15 Sumarul stadiului
298
Cristian Opariuc-Dan
diu al e
Actu-
al). Pro
Trecnd la baza de date, observm la sfritul acesteia variabilele nou
create. Vom constata i selecia eantionului fcut de SPSS. Programul a
ales n eantion primii apte subieci, pe urmtorii ase nu i-a selectat, a se-
lectat a i un subiect, ai departe.
und fiecare subiect n parte, observm o probabilitate de includere
egal d
are-
cum fre
antionrii va fi generat un asemenea tabel, n care regsim informaii
despre unitile i proporiile selectate.
Observm din nou numele i calea fiierului de tip plan de eantiona-
re. n cazul nostru am solicitat includerea unui numr de 930 de cazuri n
eantion (Requested) iar SPSS a reuit selectarea tuturor subiecilor (
centul solicitat a fost de 61,3%, procent atins n final de ctre SPSS.

Figura 8.16 Noile variabile incluse n baza de date
po urmtorul nefiind selectat i aa m
L
e 0,61, dintr-o populaie de 1517 la mrimea unui eantion de 930.
Variabila SampleWeight este generat automat i corespunde o
cvenei cu care fiecare caz selectat n eantion este reprezentat n po-
pulaia general. Suma acestor valori se apropie foarte mult de dimensiunea
populaiei. ntr-adevr, avem 930 de cazuri, fiecare avnd valoarea 1,63 la
299
Statistic aplicat n tiinele socio-umane
aceast variabil. Prin urmare, 930 1,63 = 1515,9 valoare apropiat de m-
rimea populaiei. Aceast variabil este foarte important n procesul de ana-
liz a eantionului.
Iat c, urmnd aceti pai, ai reuit crearea unui eantion. Realizarea
acestuia nu ofer ns informaii legate de caracteristicile pe care le poate
avea. Dup selectarea subiecilor n eantion urmeaz etapa de analiz a ean-
tionulu
n studiul proprietilor unui eanti-
on. Vom folosi din nou meniul Analyze, apoi
submeniul Complex Samples i n final vom
efectua click pe opiunea Prepare for Analy-
sis
Accesarea acestei comenzi determin
lansarea n execuie a unui nou asistent
(Wizard), specializat n proiectarea planului de
analiz, al doilea plan ca importan n studiul
eantionului.
Planul de analiz, similar planului de
eantionare, reprezint o succesiune de pai
prin intermediul crora se creeaz premisele
tudiului proprietilor unui eantion. Dup crearea unui eantion este impor-
tant analiza acestuia n vederea d ticilor sale.
Primul pas este reprezentat de specificarea fiierului n care va fi sal-
vat planul de analiz. Opiunea Create a p
cului i stabilirea numelui sub care v
i n vederea identificrii proprietilor sale statistice.
VIII.4.2 Analiza eantionului
Crearea unui plan de analiz reprezint
prima etap
Figura 8.17 Meniul planului de
analiz
s
eterminrii caracteris
lan file ne permite alegerea lo-
a fi salvat planul de analiz. Putei tasta
300
Cristian Opariuc-Dan
calea complet sau putei folosi butonul Browse prin intermediul cruia
vei alege locaia acestui fiier. Evident, va trebui s furnizai i un nume. n
cazul n

aiei unui
plan de
ostru, fiierul plan de analiz se numete Analiza.csaplan i a fost
salvat direct n directorul C:\
Observai diferena de extensie. Dac planurile de eantionare aveau
extensia .csplan, planul de analiz are extensia .csaplan.

Opiunea Edit a plan file v permite modificarea configur
Figura 8.18 Pasul 1. Salvarea planului de analiz
analiz salvat anterior. Apsarea butonului Next determin trecerea
la urmtoarea etap.
Noua fereastr conine mai multe elemente. n primul rnd va trebui
s specificm variabila caracteristic reprezentativitii eantionului. Am
accentuat deja asupra importanei variabilei Sample Weight tocmai n ide-
ea de a fi familiarizai cu aceasta. Dei n cazul unor eantioane complexe
301
Statistic aplicat n tiinele socio-umane
aceast variabil poate lua diferite forme, n planul de analiz vom include,
de obicei, forma final a acesteia, forma n care SPSS pondereaz de fapt
toate stadiile. V recomand introducerea n seciunea Sample Weight a
variabi

t f
) va fi inclus variabila
zurile par-
lei de tipul Final Sample Weight, variabil care de obicei caracteri-
zeaz cel mai bine eantionul. n cazul planurilor complexe, s-ar putea inclu-
de i alte variabile pariale de acest tip dac se dorete investigarea la nivelul
stadiilor, a straturilor ori a clusterilor.

Alte posibiliti cuprinse la acest nivel po
Variabilele de stratificare (Strata
de stratificare n condiiile unui eantion stratificat. Eantionul
total va fi reprezentat din ponderile pe care le au ca
Figura 8.19 Pasul 2. Stabilirea variabilelor
i reprezentate de:
ticulare din fiecare strat;
Variabilele cluster (Clusters) se include variabila ce defi-
nete clusterii, grupuri de uniti de observaie n cazul n care
se analizeaz un eantion pe clusteri;
302
Cristian Opariuc-Dan
Stage Label permite definirea unei etichete a stadiului de
analiz, similar procesului de creare a planului de eantionare.
Apsarea butonului Next determin trecerea la alegerea metodei de
estimar

Alegerea metodei de estimare permite specificarea doar a tipului de
selecie utilizat. n func
estor corecii se realizeaz prin bifarea casetei FPC care
se activ
e.

Figura 8.20 Pasul 2. Alegerea metodei de estimare

ie de modul de proiectare a eantionului putei opta
pentru metoda cu introducerea bilei n urn (WR) n care nu vor fi incluse
corecii pentru eantioane provenite din populaii finite la estimarea varianei.
Forarea includerii ac
eaz la alegerea acestei opiuni.
Metoda cu includerea bilei n urn (WOR) poate fi selectat n ca-
zul eantioanelor cu probabilitate egal de selecie i fr nlocuire. Aceast
metod include coreciile pentru populaii finite i pleac de la supoziia con-
form creia unitile au fost selectate cu o probabilitate egal.
303
Statistic aplicat n tiinele socio-umane
Metoda cu includerea bilei n urn (WOR) i cu probabilitate inega-
l folosete i ea coreciile de populaie finit dar pleac de la supoziia c
selecia unitilor din populaie s-a realizat cu o probabilitate inegal. n ge-
neral metoda se folosete n cazul unor eantioane nealeatorii.
Eantionul nostru a fost creat fr includerea bilei n urn i cu o
probabilitate egal, prin urmare vom alege opiunea a doua.

includ
uni po
doar dac cu probabiliti egale.
a popula
caz putem 1517, valoare ce repre-

Figura 8.21 Pasul 2. Alegerea dimensiunii

Apsarea butonului Next v permite s specificai probabilitile de
ere sau mrimea populaiei la nivelul stadiului curent. Aceste dimensi-
t fi fixe sau pot varia la nivelul straturilor. Aceast etap este valabil
anterior ai ales opiunea WOR
Folosind caseta de derulare Units putei preciza dimensiunea exact
iei sau probabilitatea cu care elementele au fost extrase. n primul
introduce n caseta de text Value cifra
304
Cristian Opariuc-Dan
zint
Am p
presupu
lt variant o reprezint opiunea Unequal values for strata ca-
re se activeaz numai n situaia definirii anterioare a unei variabile de strati-
ficare. Caseta ce se deschide la apsarea butonului Define permite stabi-
lirea valorilor pentru fiecare strat.
Ultima opiune, Read values from variable ne permite includerea
unei variabile numerice care conine valorile pentru fiecare strat.
urmtoarea fereastr prezint un su-
mar al
dimensiunea exact a populaiei sau 0,61, probabilitatea de includere.
referat, n exemplul nostru, prima variant. Utilizarea acestei seciuni
ne o singur valoare aplicat tuturor straturilor.
O a



Similar planului de eantionare,
Figura 8.22 Pasul 2. Sumarul planului
planului de analiz i ne permite construirea unor noi stadii. Nu vom
intra n detalii referitoare la aceast seciune deoarece am tratat complet pro-
blema n cadrul capitolului referitor la planul de eantionare.
305
Statistic aplicat n tiinele socio-umane
Ultimul ecran ne invit s salvm planul de analiz creat sau s copi-
em sintaxa ntr-o fereastr de comenzi SPSS, ntr-un mod identic cu planul de
eantionare.



Un plan de analiz salvat va putea fi utilizat n vederea investigrii
proprietilor eantionului. La apsarea butonului Finish, planul de analiz
va fi sa at iar n ferea ra acestuia.
VIII.4.3 Investigarea proprietilor eantionului
Figura 8.23 Pasul 3. Salvarea planului de analiz
lv stra de rezultate va fi redat structu
Odat stabilite planul de eantionare i
planul de analiz se poate trece la etapa final
a eantionrii i anume investigarea propriet-
ilor eantionului.
SPSS pune la dispoziie mai multe me-
tode de investigare a unui eantion. Deoarece
nu dispunem nc de toate informaiile necesa-
Figura 8.24 Analiza eantionului
306
Cristian Opariuc-Dan
re studiului exhaustiv al acestor proceduri, vom limita expunerea doar la dou
proceduri ce implic statistici univariate, dup cum urmeaz:
Meniul Frequencies determin constituirea tabelelor de
ile studiului unui eantion;
posibilitatea
analizei dup subgrupuri;
Accesarea primului meniu, Frequencies determin afiarea pri-
mului ecran necesar analizei prin care urmeaz s alegem planul de eantio-
nare dorit.
frecvene pentru variabilele selectate i afiarea statisticilor de
tip univariat. Procedura estimeaz frecvenele eantionului i
erorile standard, intervalele de ncredere, coeficienii de varia-
ie i ale statistici ut
Meniul Descriptives produce de asemenea statistici
univariate de tipul celor menionate existnd i



Figura 8.25 Alegerea planului de eantionare
307
Statistic aplicat n tiinele socio-umane
Toate operaiile din aceast etap impun anumite specificaii de anali-
z, specificaii coninute n planul de eantionare, dup cum am vzut n sub-
capitolul anterior. n seciunea Plan, caseta de text File vom putea tasta
calea ctre planul de eantionare sau vom putea utiliza butonul Browse
n vederea navigrii ctre locaia ce conine acest fiier.
n cazul n care probabilitile de includere ale elementelor n eantion
nu sunt egale, situaie des ntlnit n cadrul eantionrii stratificate sau a
eantionrii pe clusteri, va trebui s specificm fiierul n care s-au precizat
aceste probabiliti, utiliznd seciunea Joint Probabilitoes. Astfel, putem
alege aceste probabiliti dintr-o variabil din baza de date, dintr-o alt baz
de date sau dintr-un alt tip de fiier.
Trecerea la analiza efectiv se face prin apsarea butonului Conti-
nue.


Va aprea, iat, o ferea
ecran permite stabilirea variab

str pe care o cunoatei destul de bine. Acest
ilei pe care dorim s o analizm. Se impune o
Figura 8.26 interes Stabilirea variabilelor de
308
Cristian Opariuc-Dan
meniune la acest nivel: variabilele folosite pot fi doar variabile categoriale,
situate la un nivel de msur nominal sau ordinal. n partea stng a ferestrei
se afl
date. Lista
dorim
dorim
aspectu
n lista
riale n condi
este cazu analizm reprezentativitatea genului
t separat brbaii i femeile n funcie de mediul lor de provenien-
.
Un buton deosebit de important este butonul Statistics.... Apsarea
acestuia determin posibilitatea stabilirii indicatorilor statistici ce vor fi cal-
culai.


seciunea Variables, o list ce conine toate variabilele din baza de
Frequency Tables permite includerea variabilelor pentru care
s calculm tabele de frecven. Cu ale cuvinte, variabilele pe care
s le analizm. n exemplul nostru, vom dori analiza eantionului sub
l sexului (al genului biologic). Vom transfera aadar aceast variabil
Frequency Tables prin utilizarea butonului de transfer.
Lista Subpopulations permite includerea unei alte variabile catego-
iile n care am realizat, spre exemplu, un eantion stratificat. Nu
l nostru, ns dac am fi dorit s
biologic n funcie de mediul de provenien (rural vs. urban) am fi inclus
aceast ultim variabil n lista Subpopulations. n aceast situaie, SPSS
ar fi analiza

Figura 8.27 Stabilirea indicatorilor statistici
309
Statistic aplicat n tiinele socio-umane
Exist destul de multe opiuni n cadrul acestei noi ferestre, unele din-
tre ele fiindu-v necunoscute deoarece nu avei nc informaiile necesare
referitoare la anumite teste statistice. Noi le vom prezenta pe toate, studiind
aici n detaliu doar cteva, celelalte urmnd s le analizm n volumele ulte-
rioare.
Seciunea Cells permite afiarea informaiilor legate de populaia
int din care a fost extras eantionul. Vor fi afiate date referitoare la dimen-
siunea populaiei sub form de frecvene absolute prin bifarea casetei Popu-
lation size i sub form de frecvene relative (procente) bifnd caseta Ta-
ble percent.
Seciunea Statistics permite configurarea indicatorilor statistici
asocia
Prin bifarea casetei Standard error vom calcula eroarea
standard a estimrii;
Caseta Confidence interval permite stabilirea intervalului
de ncredere a estimrii n baza nivelului specificat. n mod
normal, intervalul de ncredere l vom stabili la 95%, dup
cum observai c am procedat i n exemplul nostru (caseta de
text Level%);
Caseta Coefficient of variation comunic programului cal-
cului coeficientului de variaie a estimrii, sub form de pro-
porii;
Caseta Unweighted count permite afiarea numrului de
elemente folosit n realizarea estim
mensiunea e
Caseta Design effect permite calcului varianei estimrii.
i dimensiunii populaiei sau a procentului din populaie, astfel:
rii. Cu alte cuvinte, di-
antionului extras;
Indicatorul exprim proporia de varian a eantionului com-
parat cu variana unui eantion simplu randomizat. Coeficien-
310
Cristian Opariuc-Dan
tul nu este folosit n cazul eantioanelor simplu randomizate
n acest caz fiind ntotdeauna 1 ci doar n cazul eantioanelor
mai complexe. Cu ct valoarea este mai deprtat de unu, cu
att efectul este mai mare i deci variana este mai mare;
Caseta Square root of design effect reprezint rdcina p-
trat din variana estimrii (un fel de abatere standard dac v
mai aducei aminte), fiind o msur standard a efectului i
avnd acelai mod de interpretare;
Caseta Cumulative values calculeaz frecvena cumulat a
populaiei int, avnd aceeai semnificaie ca orice frecven
cumulat.
Caseta Test of equal cell proportions permite calcului a
dou teste statistice pe care nu le-am studiat: testul
2
i testul
de probabilitate a proporiilor. Fr a intra n amnunte, men-
categoriilor variabilei (n cazul nostru dac frecvena brbai-
lor este semnificativ mai mare sau semnificativ mai mic n
comparaie cu frecvena femeilor)
Pentru exerciiul nostru am comunicat programului SPSS s afieze
frecvena absolut i relativ a populaiei int (casetele Population size i
Table percent), s calculeze eroarea standard a estimrii, intervalul de
ncredere i doar demonstrativ mrimea efectului i s afieze mrimea
eantionului (casetele Standard error, Confidence interval la un nivel
de 95%, Unweighted count i Design effect). Apsnd butonul Con-
tinue venim la fer
ionm c ambele teste pornesc de la ipoteza nul c toate ca-
tegoriile unei variabile au frecvene egale. Testele ne permit s
verificm dac exist diferene semnificative ntre frecvenele
re eastra iniial.
311
Statistic aplicat n tiinele socio-umane
Un alt buton prezent este butonul Missing Values prin apsarea c-
ruia vom putea stabili modul de tratare a cazurilor lips.


Figura 8.28 Tratarea cazurilor lips

n seciunea Tables putem stabili ce cazuri vor fi incluse n analiz.
Op
valorile v
riabila
aceste
Opiunea Use consistent case base este ns mult mai restrictiv.
Va
subiec
riabilele g c i mediu de provenien, un subiect va trebui s
aib
la gen
are date la m s din analiz.
bilelor ca
iunea implicit este Use all variable data n care vor fi analizate doar
alide la nivelul fiecrei variabile. Spre exemplu, dac analizm va-
gen biologic, SPSS va urmri s existe valori valide doar la nivelul
i variabile, fr a fi preocupat dac exist valori valide la alte variabile.
trebui s existe valori la nivelul tuturor variabilelor analizate pentru ca
tul respectiv s fie luat n considerare. De exemplu, dac analizm va-
en biologi
scoruri valide la ambele variabile, chiar dac este analizat doar variabi-
biologic. Un subiect care are un scor valid la gen biologic dar nu
ediul de provenien va fi exclu
Seciunea Categorical design variables determin, n cazul varia-
tegoriale, dac valorile lips vor fi tratate ca fiind sau nefiind valide.
312
Cristian Opariuc-Dan
Practic nu este nevoie s intervenim n aceast fereastr dect extrem
i n cazul unor planuri de eantionare complexe. Apsarea butonului
va determina i n acest caz ntoarcerea la fereastra iniial.
Lansarea efectiv a analizei datelor se face prin apsarea buto
de rar
Continue
nului
OK.
zultate

catorilo
int iar al d
fost m
mei.
compus din 43,7% brbai i 56,3% fe-
mei.
n cteva fraciuni de secund va fi afiat un tabel n fereastra de re-
, tabel ce conine exact datele solicitate.
Respondent's Sex


Capul de tabel conine numele variabilei de interes i denumirea indi-
r calculai. Primul rnd se refer la frecvenele absolute ale populaiei
oilea rnd la frecvenele relative. Observm c datele noastre au
prite pe cele dou categorii ale variabilei de interes brbai i fe-
A doua coloan (Estimate) exprim frecvenele absolute i relative
ale populaiei int estimat n baza eantionului. Aceste elemente nu repre-
zint date reale ci date estimate din eantion. Nu putem avea un numr de
662,26 brbai i 854,74 femei. Un brbat sau o femeie este un ntreg, nu are
zecimale. Observm ns c dimensiunea total a populaiei int estimate
(1517 subieci) este egal cu populaia int real. Exprimat procentual, ean-
tionul nostru estimeaz o populaie
662,260 15,355 632,126 692,395 1,000 406
854,740 15,355 824,605 884,874 1,000 524
1517,000 ,000 1517,000 1517,000 . 930
43,7% 1,0% 41,7% 45,7% 1,000 406
56,3% 1,0% 54,3% 58,3% 1,000 524
100,0% ,0% 100,0% 100,0% . 930
Male
Female
Total
Estimate
Standard
Error Lower Upper
95% Confidence
Interval
Design Effect
Unweighted
Count
Population Size
Male
Female
Total
% of Total
Figura 8.29 Rezultatele analizei eantionului
313
Statistic aplicat n tiinele socio-umane
Urmtoarea coloan (Standard Error) se refer la eroarea standard a
estimrii, exprimat att n form brut ct i n form procentual. Eantio-
nul nostru estimeaz populaia int cu o eroare standard de 15,35 brbai i
15,35 femei (aproximativ 15 subieci pentru fiecare categorie, cifrele repre-
zentnd din nou o abstraciune). Acest indicator devine mai clar dac urm-
rim forma procentual. Iat c eroarea estimrii este de 1% att n cazul br-
bailor ct i n cazul femeilor, care la un nivel de ncredere de 95% ne poate
determina s afirmm c avem un eantion reprezentativ sub aspectul sexului.
Urmeaz dou coloane ale intervalului de ncredere. n baza erorii
standard, eantionul estimeaz practic o populaie int format dintr-un nu-
mr de 632,12 pn la 692,39 brbai i de la 824,60 pn la 884,87 femei.
Cu alte cuvinte, compoziia populaiei int estimat de eantion este format
din 41,7 pn la 45,7 b ei. Undeva ntre aces-
te limite putem gsi populaia int real estimat de eantion.
c aces
escriptiv. Paii
sunt id
rbai i 54,3 pn la 58,3% fem
Coloana Design Effect are evident valoarea 1 deoarece am lucrat cu
un eantion simplu randomizat, fapt tratat mai sus.
Ultima coloan indic dimensiunea i compoziia eantionului (Un-
weighted Count). Dup cum tiam deja, eantionul are un numr de 930 de
cazuri iar din punct de vedere al sexului avem 406 brbai i 524 femei. Iat
t eantion estimeaz reprezentativ populaia int la o eroare de doar
1% i la un nivel de ncredere de 95%. Suntem n faa unui eantion reprezen-
tativ, acest lucru fiind demonstrat prin analiza efectuat.
Am analizat o variabil de interes situat la nivel nominal (sexul).
Cum procedm ns dac avem o variabil de interes la un nivel scalar, de
exemplu vrsta? Analiza frecvenelor nu ne ajut prea mult. Este timpul s
abordm cea de-a doua metod propus i anume analiza d
entici, astfel nct nu vom insista asupra lor. Exist ns o serie de me-
tode statistice uor diferite pe care vom ncerca s le lmurim.
314
Cristian Opariuc-Dan



up lansa a planului de eantio-
nare pr

D rea procedeului de analiz i alegere
in apelarea meniului Descriptives, va trebui s includem, similar
procesului anterior, variabila de interes. n cazul nostru am ales o variabil
scalar, vrsta subiecilor. Apsarea butonului Statistics determin apariia
unui ecran uor diferit n comparaie cu analiza frecvenelor
Figura 8.30 Analiza variabilei de interes de
tip scalar
Figura 8.31 Stabilirea indicatorilor statistici

315
Statistic aplicat n tiinele socio-umane
Diferena rezid n seciunea Summaries prin intermediul creia
putem estima mediile i sumele variabilelor int. n cazul n care media po-
pulaiei este cunoscut (uneori se folosete media teoretic) putem folosi tes-
tele t Student de comparaie ntre media populaiei i media unui eantion
pentru verificarea existenei unei diferene semnificative ntre medii. Despre
aceste teste vom discuta ns n volumul urmtor.
Celelalte opiuni ale acestei ferestre au fost discutate i nu este cazul
s le relum. Executarea procedurii de analiz determin afiarea n fereastra
de rezu
continu. Iat c
eantio
ui intervalul de n-
credere
ltate a unui alt tabel:



Univariate Statistics
46,33 ,369 45,60 47,05 ,008 1517,000 930 Age of Respondent Mean
Estimate
Standard
Error Lower Upper
95% Confidence
Interval
Coefficient
of Variation
Population
Size
Unweighted
Count
Figura 8.32 Rezultatele analizei eantionului
n acest caz nu mai avem de a face cu estimri ale frecvenelor ci cu
estimri ale mediilor, variabila analizat fiind o variabil
nul nostru estimeaz o medie a populaiei de 46,33 de ani cu o eroare
standard de 0,36 ani. Media real a populaiei se gsete undeva ntre 45,60 i
47,05 ani. Eantionul este foarte omogen sub aspectul vrstei, dup cum re-
zult din coeficientul de variaie de 0,008, eterogenitatea fiind n jurul valorii
de 0,8%. ntr-adevr, eantionul de 930 de persoane estimeaz populaia int
de 1517 persoane ns. cu o eroare standard mare. ns
de 1,45 ani (47,05 45,60) este edificator n acest sens. Este greu s
vorbim despre o reprezentativitate a acestui eantion sub aspectul vrstei su-
biecilor.

316
Cristian Opariuc-Dan
Bibliografie
1. Clocotici, Vasile i Stan, Aurel. 2000. Statistic aplicat n
psihologie. Iai : Polirom, 2000.
2. Curwin, Jon i Slater, Roger. 1996. Quantitative methods for
Business Decisions. Fourth Edition. London : International Thomson
Business Press, 1996.
3. Dancey, Christine i Reidy, John. 2002. Statistics without math for
psychology. Second Edition. Harlow : Prentice Hall, 2002.
4. Dowdy, Shirley, Weardon, Stanley i Chilko, Daniel. 2004.
Statistics for research. Third Edition. New Jersey : John Wiley and
Sons, 2004.
5. Field, A. 2000. Discovering statistics using SPSS for Windows.
London : Sage, 2000.
6. ield, Andy sing SPSS, Second
London : Sage Publications Ltd., 2005. 100-7619-4451-6.
7. aisingh, Lloyd. 2000. Statistics for the Utterly Confused. New
10. Marques de Sa, Joaquim P. 2007. Applied Statistics using SPSS,
Statistica, Mathlab and R. New York : Springer, 2007.
11. Pitariu, Horia Dumitru. 2003. Psihodiagnostic - note de curs.
Bucureti : s.n., 2003.
12. Popa, Marian. 2003. Statistic - note de curs. Bucureti : s.n., 2003.
13. Radu, Ioan, i alii. 1993. Metodologie psihologic i analiza
datelor. Cluj-Napoca : Sincron, 1993.
14. Rotariu, T, i alii. 2006. Metode statistice aplicate n tiinele
sociale. Iai : Polirom, 2006.
15. Sava, Florin Alin. 2004. Analiza datelor n cercetarea psihologic.
Metode statistice complementare. Cluj-Napoca : ASCR, 2004.
16. . 2000. P de statistic social.
[Interactiv] 2000. http://statisticasociala.tripod.com.
F . 2005. Discovering Statistics u
Edition.
J
York : McGraw Hill, 2000.
8. Leech, Nancy L, Barrett, Karen C i Morgan, George A. 2005.
SPSS for intermediate statistics. Use and interpretation. Second
Edition. New Jersey : Lawrence Erlbaum Associates, 2005.
9. Lungu, Ovidiu. 2001. Ghid introductiv pentru SPSS 10.0. Iai :
Erota, 2001.
agina de statistic social. Pagina
317
Statistic aplicat n tiinele socio-umane
17.
ormatizat pentru tiinele
SPSS, Inc. 2001. SPSS Base 11.0 User's Guide. Chicago : SPSS Inc,
2001.
18. . 2006. SPSS Complex Samples 15.0. Chicago : SPSS Inc, 2006.
19. System, The Survey. The Survey System: Sample Size Calculator.
The Survey System. [Interactiv]
http://www.surveysystem.com/sscalc.htm.
20. Vasilescu, Ilie Puiu. 1992. Statistic inf
despre om. Bucureti : Militar, 1992.

318
Cristian Opariuc-Dan
n lo
Sper c v-am interesat n acest domeniu. Dup parcurgerea crii, ai
vzut c statistica poate fi chiar plcut iar concluziile pe care le putem
c de ncheiere
des-
unea odat
iei
iei n tiinele
cuvinte statistici infereniale. De aseme-
prinde din analiza datelor, ne conduc ctre idei pe care, n absena acestei
tiine, nu le-am putea avea i, mai ales, nu le-am putea verifica. Bineneles, ,
statistica este, nti de toate, o disciplin matema c. Nimeni ns nu v cere
s fii un matematician pentru a o putea folosi. Aa cum mi sp
ti
colegul i prietenul meu, Ticu Constantin, nu e nevoie s tiu s construiesc
o main pentru a o putea conduce i cu care, la momentul respectiv, nu am
fost de acord; acum trebuie s recunosc c a avut dreptate. Rolul matematici-
enilor este acela de a construi maina; rolul nostru este de a o conduce.
Acum, dac unii oferi sunt mai buni dect alii asta e. Nu la fel se ntlnim
i n viaa real, pe osele? Nu este ntmpltor faptul c, pionierii psiholog
tiinifice care au folosit metode statistice (Cattell, Spearman, Thorndike s.a.)
au fost, iniial, formai n tiine reale precum matematica, fizica, chimia.
n acest volum, m-am oprit la studiul eantioanelor. Din raiuni con-
nu am dorit s merg mai departe, deoarece a fi fost nevoit s crete, scot un
volum de 600-700 de pagini, care, cu siguran v-ar fi speriat. Nu intenionez
ns s m opresc aici. n volumul al doilea, care va aprea dup ce voi obine
impresiile dumneavoastr, a vrea s abordez problema predic
socio-umane, prin metode statistice i nu clarvizioniste, adic metode de re-
liniar i logisti , core gresie laiile i analiza factorial sau modaliti de a c
vedea dac datele noastre au ceva n comun ntre ele, analiza de fidelitate sau
ct de stabile pot fi sc rurile n timp ori cum putem s facem s nu mai atep- o
tm un timp pentru a vedea acest lucru, metode prin care putem sesiza dac
exist diferene ntre grupuri, cu alte
nea, mi-a dori s abordez un capitol extrem de interesant i anume acela al
analizei de varian sub diferitele sale aspecte, n care s putem vedea cum
una sau mai multe dimensiuni exercit efecte asupra unor alte dimensiuni.
319
Statistic aplicat n tiinele socio-umane
320
atica analizei de cluster, analiza Q Sort, metaanaliza,
i soluii, oferii
dovada c ia unui expert absolut.
Ceea ce doresc, este s partajez experiena mea cu experiena altora, din care
s avem cu toii de ctigat. Pentru a realiza acest obiectiv, va trebuie s ne
detam de orgolii i de impresii personale, s contientizm c toi avem
nc de nvat, s avem o minte deschis i s dm ceea ce este mai bun n
noi. Este foarte posibil ca, uneori, n ceea ce expun, s nu am dreptate. Este
posibil s m nel n anumite afirmaii pe care le fac pe parcursul acestor
pagini. Singura modalitate pe care o avem de a ne da seama de acest lucru
este s comunicm. Atept, prin urmare, reacia dumneavoastr, ca unici ju-
dectori ai cuvintelor mele.
V mulumesc pentru rbdarea pe care ai avut-o studiind acest vo-
lum. Informaiile prezentate aici nu sunt originale i nici nu ar avea cum s
fie. Ele se bazeaz pe afirmaiile unor genii n domeniu, care au avut inspira-
ia s le descopere iar eu nu am fcut dect s le prezint. Original este ns,
cred, modalitatea de prezentare. Am ncercat s mbin umorul cu informaia
tiinific, astfel nct cele prezentate aici s fie uor digerabile. De aseme-
nea, am urmrit s folosesc ct mai multe exemple practice pentru a iei puin
din lumea abstract a formulelor matematice. Dac am reuit sau nu acest
lucru, dumneavoastr s-mi spunei
n al treilea volum, a vrea s abordez problematica scalrii multidi-
mensionale, problem
analizele de itemi, analize calitative i analizele folosind reelele neuronale.
Demersul este, dup cum ai observat, de la simplu la complex. A fi
foarte bucuros dac a vedea c ridicai probleme, propune
sugestii sau, de ce nu, criticai anumite aspecte pe care le prezint. Asta ar fi
munca mea nu a fost n zadar. Nu am preten

S-ar putea să vă placă și