Documente Academic
Documente Profesional
Documente Cultură
2
Pe parcursul acestei prezentri, unele imagini sunt din SPSS 12.0 for Windows. Acest lucru
nu incomodeaz n utilizarea altor versiuni. Toate imaginile utilizate reprezint marc nre-
gistrat SPSS Inc.
Cristian Opariuc-Dan
3
Desigur, n situaia n care SPSS for Windows este deja instalat pe calculatorul dumnea-
voastr. Dac nu avei instalat SPSS for Windows, putei descrca o versiune demonstrativ
de 30 de zile de pe site-ul http://www.spss.com Asigurai-v c avei o conexiune suficient
de rapid i de stabil la Internet, deoarece fiierul este destul de mare (aproximativ 160 MB)
31
Statistic aplicat n tiinele socio-umane
32
Cristian Opariuc-Dan
33
Statistic aplicat n tiinele socio-umane
34
Cristian Opariuc-Dan
35
Statistic aplicat n tiinele socio-umane
36
Cristian Opariuc-Dan
37
Statistic aplicat n tiinele socio-umane
38
Cristian Opariuc-Dan
39
Statistic aplicat n tiinele socio-umane
Exerciiu practic:
n exerciiul care urmeaz vom traduce pur i simplu n romnete
structura acestei baze de date i vom salva baza de date sub un nou nume,
Masini (atenie, nu folosii diacriticele romneti n scrierea literelor, prin
urmare, n acest caz, nu folosii litera , ci s. Deci nu vom salva cu Maini,
ci Masini), ntr-un director nou creat avnd calea C:\Exercitii SPSS
(aceeai meniune referitoare la diacritice).
n cazul primei variabile, numele va rmne acelai, iar noi vom mo-
difica doar descrierea. Vom da clic n seciunea Label, acolo unde se afl
afiat textul Miles per Gallon i vom scrie textul Mile per galon.
40
Cristian Opariuc-Dan
41
Statistic aplicat n tiinele socio-umane
42
Cristian Opariuc-Dan
43
Statistic aplicat n tiinele socio-umane
tastele rapide) duce la apariia ferestrei Save as, deoarece fiind o baz de date
nou, acesteia nu i-a fost atribuit nc un nume printr-o operaie de salvare.
Putei cu uurin identifica dac o baz de date are un nume (a fost salvat)
sau nu, urmrind bara de titlu. Bazele de date noi sunt identificate prin mesa-
jul Untitled SPSS Data Editor, n timp ce bazele de date salvate au afiat
numele acestora n bara de titlu. Ai observat c, la lansarea programului
SPSS, acesta creeaz automat o baz de date nou i nedefinit i ateapt din
partea noastr definirea variabilelor i salvarea acesteia. Odat salvat baza
de date, orice modificri efectum n ea, la salvare ele vor fi scrise automat n
fiierul al crui nume este afiat n bara de titlu, fr a mai aprea fereastra de
salvare de mai sus. Singura modalitate prin care putem da un alt nume bazei
de date sau prin care o putem salva ntr-un alt loc este folosirea opiunii Save
as.
Crearea unei noi baze de date se poate face folosind meniul File,
submeniul New i opiunea Data, combinaiile de taste Ctrl+N sau Alt+F,
Alt+N, Alt+A. n oricare dintre aceste situaii, SPSS va crea o baz de date
goal i nedefinit, la fel ca n cazul lansrii programului.
44
Cristian Opariuc-Dan
45
Statistic aplicat n tiinele socio-umane
46
Cristian Opariuc-Dan
47
Statistic aplicat n tiinele socio-umane
48
Cristian Opariuc-Dan
mai uor datele i pentru a putea efectua prelucrri statistice la nivel de varia-
bile nominale.
Caracteristica Missing permite defi-
nirea modului n care vor fi tratate valorile
lips din cadrul unei variabile. Uneori, este
important s cunoatem de ce lipsesc valori
dintr-o variabil. Datele lips se pot datora,
spre exemplu, faptului c subiectul refuz
s rspund la o anumit ntrebare sau fap-
Figura 1.15 Tratarea valorilor lips
tului c ntrebarea nu este adresat acelui
subiect. Iat dou situaii care ar necesita un
tratament separat al valorilor lips. Datele pe care le vei trata n mod explicit
ca date lips pot fi supuse apoi unei analize statistice separate, fiind iniial
excluse din cele mai multe calcule. Un alt exemplu, frecvent ntlnit n ches-
tionarele sociologice, se refer la codificarea rspunsurilor de tip Nu tiu/Nu
rspund. Majoritatea cercettorilor codeaz aceste variante cu 9 sau 99. Evi-
dent, variantele incerte nu vor face obiectul prelucrrii iniiale a datelor. Fo-
losind aceast seciune se pot include aceste valori (9 sau 99) ca valori lips,
SPSS eliminndu-le din analiz. Definirea valorilor lips poate accepta trei
situaii. Situaia No missing values, cnd comunicm programului c nu
dorim un tratament special pentru valorile lips, acestea fiind tratate ca atare
n cursul fiecrei prelucrri de date pe care o realizm, situaia Discrete
missing values, cnd putem defini pn la trei valori care vor fi tratate ca
valori lips n cursul prelucrrilor statistice ulterioare (de exemplu, la un
chestionar cu 3 variante de rspuns, dorim ca doar rspunsurile 1 i 3 s fie
luate n calcul, rspunsul 2 fiind tratat ca non-rspuns. Pentru aceasta, vom
include cifra 2 n prima dintre cele trei casete ale acestei seciuni.) i situaia
Range plus one optional discrete missing value, n care putem stabili un
interval pentru care valorile vor fi tratate ca valori lips (spre exemplu, coefi-
cienii de inteligen cuprini ntre 10 i 75), n plus existnd posibilitatea de
49
Statistic aplicat n tiinele socio-umane
50
Cristian Opariuc-Dan
4
Ca observaie, n SPSS, nivelurile de msur de interval i de raport au fost reunite sub
denumirea generic de nivel de msur scalar. Proiectanii acestei aplicaii au renunat la
distingerea celor dou, reunindu-le sub denumirea de nivel scalar.
51
Statistic aplicat n tiinele socio-umane
52
Cristian Opariuc-Dan
53
Statistic aplicat n tiinele socio-umane
54
Cristian Opariuc-Dan
Variable Information
Measurement
Variable Position Label Level Column Width Alignment Print Format Write Format
nume Numele
1 Nominal 14 Left A20 A20
subiectului
varsta Varsta
2 Scale 8 Right F2 F2
subiectilor
sexul Genul
3 biologic al Scale 8 Right F1 F1
subiectilor
iq Coeficientu
4 l de Scale 8 Right F3 F3
inteligenta
Variables in the working file
55
Statistic aplicat n tiinele socio-umane
92
Cristian Opariuc-Dan
93
Statistic aplicat n tiinele socio-umane
94
Cristian Opariuc-Dan
95
Statistic aplicat n tiinele socio-umane
trei puncte de suspensie deschid acum o nou fereastr. Fereastra are mult
mai multe opiuni. Pentru moment, ne vom rezuma la cele care ne interesea-
z. Observm c, n partea dreapt a acestei noi ferestre, gsim seciunea
Central Tendency, adic exact ceea ce urmrim s punem n eviden. n
aceast seciune, observm casetele de bifare Mean (media), Median
(mediana) i Mode (modul). Acestea sunt elementele pe care dorim s le
calculm. Vom bifa deci, una cte una, aceste casete, prin efectuarea unui clic
simplu pe ele, astfel nct formularul s arate ca n figura de mai sus. Mai
exist i caseta de bifare Sum (suma), prin bifarea creia obinem suma
valorilor din variabila respectiv. Variabila noastr este vrsta subiecilor i
nu ne intereseaz s nsumm vrstele celor 30 de subieci. Ar fi un indicator
fr nici o relevan pentru noi.
Dup ce am bifat cele trei casete, apsm butonul Continue (conti-
nuare), pentru a prsi aceast fereastr i a ne ntoarce n cea iniial. Acum
am comunicat programului SPSS ce indicatori statistici s extrag.
Butonul Chart i Format permite afiarea unor grafice,
respectiv configurarea modali-
tii n care vor fi afiate re-
zultatele. Despre aceste bu-
toane vom discuta cu alt oca-
zie.
Cam asta ar fi tot.
Practic, am spus programului
SPSS s calculeze media, me-
diana i modul pentru variabi-
la Varsta subiectilor cu afi-
area tabelului de frecvene.
Figura 3.7 Fereastra de afiare a rezultatelor
Nu ne rmne acum dect s
apsm butonul OK i s
96
Cristian Opariuc-Dan
vedem ce se ntmpl.
Iat c a aprut fereastra de rezultate sau fereastra Output. Nu vom
intra acum n detalii explicative ale acestei ferestre, pentru c s-ar putea s v
speriai de prea multe informaii i s trecei la Solitaire. Ne vom concentra
asupra celor dou tabele pe care le-a generat SPSS n partea din dreapta a
ferestrei de rezultate (partea cea mare), care nu reprezint altceva dect cele
dou tabele pe care le-am solicitat. Primul tabel conine indicatorii tendinei
centrale pe care i-am configurat n etapa anterioar.
Tabelul se numete Statistics i conine n partea de sus numele va-
riabilei, Varsta subiectilor, pentru a putea identifica variabila cu care ope-
rm. Apoi ne d numrul de cazuri, N, i ne spune c sunt 30 de date vali-
de (Valid) i zero date lips (Missing). Cu alte cuvinte, toi cei 30 de
subieci au nregistrat vrsta lor. Nu exist nici un subiect la care s fi uitat
s introducem aceast valoare. n continuare, ne spune c media de vrst
este 29,33 (Mean), mediana este 29 (Median), iar modul. avem o
problem. SPSS ne infor- Tabel 3.7 Indicatorii tendinei centrale
Statistics
meaz n josul tabelului c
sunt mai multe valori cu Varst a subiectilor
N Valid 30
frecvena cea mai mare i Missing 0
c o va afia pe cea mai Mean 29,33
Median 29,00
mic, 24 (Multiple
Mode 24a
modes exist. The smallest a. Mult iple modes exist. The smallest v alue is shown
value is shown). Acesta
este, deci, un singur mod real, cel inferior, i urmeaz s vedem care este i
cealalt valoare modal, deoarece avem o distribuie cu mai multe moduri
(multimodal).
97
Cristian Opariuc-Dan
niciuna. Vom putea ns face media acestor dou eantioane. Adunm 178 cu
165 i mprim la doi. Obinem 171,5 centimetri, un indicator mai precis
pentru media populaiei. Iat c media eantioanelor este un indicator care
aproximeaz mai bine media unei populaii. Cu ct avem mai multe eantioa-
ne, cu att putem stabili mai precis media populaiei. Aceast caracteristic a
mediei eantioanelor de a tinde ctre media populaiei poart n statistic nu-
mele de teorema limitei centrale. Asupra acestui aspect vom reveni i
vom avea ocazia s-l tratm amnunit ntr-un alt capitol.
8
n SPSS versiunea 15, modalitatea de construcie a graficelor difer radical, fiind mult mai
simpl i mai inteligent. Vom aborda aspectele grafice ale aplicaiei SPSS 15, la sfritul
acestui volum i n volumele viitoare
101
Statistic aplicat n tiinele socio-umane
102
Cristian Opariuc-Dan
103
Statistic aplicat n tiinele socio-umane
Feminin
115
Sexul subiectilor
figura alturat, un grafic cu bare, 105
100
Masculin
115
100
Exerciiu:
Reprezentai, folosind un grafic cu bare, valorile variabilei Varsta
subiectilor.
104
Cristian Opariuc-Dan
105
Statistic aplicat n tiinele socio-umane
Case Number
106
Cristian Opariuc-Dan
opiunea Cum. N, deoarece dorim 100 101 103 104 105 107 108 109 110 111 120 121 124
Coeficient de inteligenta
s reprezentm frecvenele cumulate
Figura 4.13 Poligonul frecvenelor
absolute. Avem de stabilit i variabi- cumulate
la pentru care vom desena poligonul
frecvenelor cumulate absolute, pe care trebuie s o introducem n cmpul
Category Axis:, folosind butonul de transfer din faa acestui cmp. Acum,
107
Statistic aplicat n tiinele socio-umane
108
Cristian Opariuc-Dan
109
Statistic aplicat n tiinele socio-umane
prezentat i pe care le vom mai prezenta fac parte din analiza de date explo-
ratorie, deoarece scopul acesteia este acela de a explora, de a cunoate struc-
tura datelor analizate.
V mai amintii, desigur,
fereastra studiat n capitolul ante-
rior, prin care am calculat indica-
torii tendinei centrale. Iat-o, v-o
reamintesc, iar dumneavoastr va
trebui s gsii comenzile prin
care s ajungei la ea, deoarece
reprezentarea grafic a datelor se
Figura 4.18 Selectarea variabilei ce ur-
meaz s fie reprezentat
poate face i n acest mod. S in-
troducem, la fel ca n capitolul
anterior, variabila Coeficient de inteligen, pentru a extrage indicatorii
tendinei centrale. Sper c v amintii cum se face. Dac nu, v dau un indi-
ciu: folosii butonul Statistics. Iat c, lng acest buton, se afl un alt
buton, butonul Charts pe care vom
apsa. Se deschide o nou fereastr, n
care putem stabili ce grafic s desenm
pentru variabila introdus n analiz.
Opiunea None nu deseneaz niciun
fel de grafic i ignor setrile grafice.
Opiunea Bar charts deseneaz un
grafic cu bare, opiunea Pie charts
deseneaz grafice plcint i, iat, opiu-
nea Histograms: ne permite desena-
rea unei histograme. Aceast opiune o Figura 4.19 Modul de reprezentare
grafic din analiza frecvenelor
ntlnim aici, alturi de caseta de bifare
With normal curve ce permite dese-
narea curbei normale care caracterizeaz datele din variabila noastr. Nu vom
110
Cristian Opariuc-Dan
bifa acum aceast caset, deoarece despre curba normal vom discuta ntr-un
alt capitol. Ne rezumm s alegem doar graficul sub form de histogram.
Anumite grafice pot fi reprezentate sub form de frecvene absolute
(opiunea Frequencies) sau sub form de frecvene relative (opiunea
Percentages), prin selectarea uneia dintre cele dou opiuni din seciunea
Chart Values. Folosind
Histogram aceast fereastr, avem de
configurat mult mai puine
5
Coeficient de inteligenta
apoi butonul OK pentru a
Figura 4.20 Histograma pentru coeficientul lansa analiza.
de inteligen
Dup cteva momen-
te, SPSS va extrage indicatorii tendinei centrale sub forma celor dou tabele
discutate n capitolul anterior, ns ne va oferi i histograma variabilei Coe-
ficient de inteligen, alturi de o serie de date din inventarul statistic de
baz, pe care le vom discuta ntr-un alt capitol.
111
Statistic aplicat n tiinele socio-umane
rile de date de mai sus, ne putem face o imagine intuitiv asupra acestor sco-
ruri extreme. Exist oare o metod mai precis de a le depista? Rspunsul
este pozitiv i vom prezenta n continuare dou tipuri de grafice deosebite,
dar care pot caracteriza mai precis scorurile extreme.
112
Cristian Opariuc-Dan
113
Statistic aplicat n tiinele socio-umane
114
Cristian Opariuc-Dan
Test 1 Test 2
9999999977777777777775555555555555553333333332222222200000 0 11222555
888333330000000 1 2222444455588
3 2 44444455555558888888
3 22333344444455555
4 222334
5
4 6
Datorit uurinei n realizare i a avantajelor pe care le ofer, acest
tip de grafic se utilizeaz tot mai frecvent n tiinele socio-umane.
115
Statistic aplicat n tiinele socio-umane
116
Cristian Opariuc-Dan
117
Statistic aplicat n tiinele socio-umane
2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5,
5, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 9, 9, 9, 9, 9, 9, 9, 9, 10, 10, 10, 10, 10, 10,
10, 13, 13, 13, 13, 13, 18, 18, 18, 23, 64, atunci graficul nostru se va prezenta
ca n figura de mai jos.
70,00
Iat c observm existena a
dou scoruri extreme ns. acestea
77
60,00
30,00
76
nu uitm c acest grafic se bazeaz
20,00
pe poziia unui scor n irul ordonat
10,00 de date. Prin urmare, 77 i 76 nu
0,00 reprezint scorurile propriu- zise, ci
Exemplu
poziia acestora n irul ordonat de
Figura 4.23 Graficul box-plot n SPSS. Se obser- date. Deci poziia 77 se refer la
v scorul extrem, al 77-lea element ultimul scor, adic la valoarea 64,
iar poziia 76 la penultimul scor,
adic la valoarea 23. Avem, aadar, dou scoruri extreme n irul nostru de
date i anume scorul 23 i 64. Desigur, n acest caz, indicatorul care exprim
cel mai bine tendina central este mediana. Programul SPSS ofer i o mo-
dalitate de a marca scorurile extreme. Observm c alturi de poziia 77 (co-
respunztoare scorului 64) apare o stelu. Aceast stelu are rol de avertis-
ment, n sensul c valoarea 64 este foarte ndeprtat de limita superioar a
irului de date. De asemenea, alturi de poziia 76 (corespunztoare scorului
23) apare un cercule. Acest cercule ne spune c, dei 23 este i el un scor
extrem, nu este, totui, att de deprtat de limita superioar a irului de date.
118
Cristian Opariuc-Dan
119
Statistic aplicat n tiinele socio-umane
120
Cristian Opariuc-Dan
121
Statistic aplicat n tiinele socio-umane
122
Cristian Opariuc-Dan
r.
Acionarea butonului Plots determin afiarea unei alte ferestre,
care va configura modul de prezentare grafic a datelor. i aici avem mai
multe informaii. Pentru nceput observm c este bifat caseta Stem-and-
leaf, adic va fi afiat graficul tulpin i frunze.
De asemenea, vom afia i histograma, bifnd caseta Histogram.
Seciunea Boxplots, situat n partea stng-sus, permite configurarea mo-
dului de calcul al graficului cutie cu musti discutat anterior. Putem opta
pentru combinarea nivelurilor variabilei categoriale (dac am inclus vreuna n
fereastra anterioar), alegnd Factor levels together sau putem combina
mai multe variabile incluse n lista variabilelor independente alegnd opiu-
nea Dependents together. Desigur, putem renuna la afiarea acestui gra-
fic, selectnd opiunea Tabel 4.1 Sumarul cazurilor
None. n cazul nostru,
Case Processing Summary
Cases
oricare dintre primele dou opiuni am alege-o, obinem acelai efect. Prsi-
rea acestei casete va fi fcut tot prin apsarea butonului Continue. Nu ne
rmne acum dect s apsm butonul OK pentru a lansa procedurile de
analiz. n fereastra de rezultate avem acum mai multe tabele i grafice.
n tabelul Case Pro-
Tabel 4.2 Descriptives
Statistici descriptive
St at ist ic St d. Error cessing Summary ne sunt pre-
Varst a subiectilor Mean 29,33 1,008
95% Conf idence
Interv al f or Mean
Lower Bound
Upper Bound
27,27 zentate numrul de cazuri. Aflm
31,40
123
Statistic aplicat n tiinele socio-umane
3,00 2 . 001
,00 2 .
5,00 2 . 44444
3,00 2 . 666
6,00 2 . 899999
4,00 3 . 0111
1,00 3 . 2
3,00 3 . 455
2,00 3 . 77
3,00 3 . 889
Stem width: 10
Each leaf: 1 case(s)
21
Varsta subiectilor
125
Statistic aplicat n tiinele socio-umane
146
Cristian Opariuc-Dan
147
Statistic aplicat n tiinele socio-umane
n concluzie:
Dincolo de tendina central, este necesar s studiem i modul n care rezultatele se
mprtie n jurul tendinei centrale prin calculul indicatorilor dispersiei;
Indicatorii dispersiei pot ine seama doar de anumite date i se numesc indicatori
elementari ai mprtierii sau de toate datele, cazul indicatorilor sintetici;
Indicatorii elementari ai mprtierii sunt:
o Amplitudinea de variaie absolut i relativ;
o Intervalul cuartil i abaterea cuartil;
Indicatorii sintetici ai mprtierii sunt:
o Diferena medie Gini;
o Oscilaia absolut i relativ;
o Abaterea medie;
o Abaterea median;
o Dispersia sau variana;
o Abaterea standard;
o Coeficientul de variaie.
Media i abaterea standard sunt indicatorii pe baza crora se caracterizeaz o dis-
tribuie normal;
Indicatorii dispersiei bazai pe medie pot fi calculai numai dac nivelul de msura-
re al variabilei este cel puin unul de interval i nu exist scoruri extreme n distri-
buie.
148
Cristian Opariuc-Dan
189
Statistic aplicat n tiinele socio-umane
190
Cristian Opariuc-Dan
arat frumos.
n figura 6.16, am ales modul de reprezentare al unui grafic cu bare,
iar n figura 6.17, am optat pentru reprezentarea prin histogram. Vom anali-
za ulterior ambele tipuri de grafice i vom nva cteva metode de cosmeti-
191
Statistic aplicat n tiinele socio-umane
192
Cristian Opariuc-Dan
Cumulat iv e
buiei sub aspectul modalitii i
Valid 20
Frequency
2
Percent
6,7
Valid Percent
6,7
Percent
6,7
a vedea toate valorile mod, vom
21
24
1
5
3,3
16,7
3,3
16,7
10,0
26,7
cuta n distribuia statistic (al
26 3 10,0 10,0 36,7
28 1 3,3 3,3 40,0
doilea tabel din fereastra de re-
29
30
5
1
16,7
3,3
16,7
3,3
56,7
60,0
zultate) valoarea 24. n cazul
31
32
3
1
10,0
3,3
10,0
3,3
70,0
73,3
nostru, observm c valoarea 24
34
35
1
2
3,3
6,7
3,3
6,7
76,7
83,3
se regsete n cinci cazuri (co-
37
38
2
2
6,7
6,7
6,7
6,7
90,0
96,7
loana Frequency). Nu trebuie
39
Total
1
30
3,3
100,0
3,3
100,0
100,0 acum dect s vedem ce valori,
mai mari de 24, au aceeai frec-
ven. Observm c valoarea 29 de ani are aceeai frecven i c nu exist o
alt valoare cu aceast frecven maxim. Aadar, distribuia vrstei subieci-
lor este o distribuie bimodal, cu modul de 24 i 29 de ani. Strict vorbind, o
distribuie multimodal nu este o distribuie normal. Analiza noastr ar tre-
bui s se opreasc aici i s folosim tehnici de eliminare a acestei anomalii (n
cazul nostru, renunnd la un subiect care are vrsta de 24 sau 29 de ani).
Totui, distribuia scorurilor subiecilor la variabila coeficient de inte-
ligen este o distribuie unimodal. n acest caz, vom trece la urmtoarea
etap i anume analiza simetriei.
Simetria sau oblicitatea este dat de valoarea indicatorului
Skewness. La modul teoretic, acest indicator are valoarea zero pentru o dis-
193
Statistic aplicat n tiinele socio-umane
194
Cristian Opariuc-Dan
195
Statistic aplicat n tiinele socio-umane
196
Cristian Opariuc-Dan
intr ntr-al doilea interval (cu precizie mai mic) ns nu i n primul interval
(de mare precizie). Deci, n situaia n care eterogenitatea sau omogenitatea
scorurilor n jurul mediei este un element important, vom considera distribu-
ia noastr ca fiind o distribuie platicurtic, deoarece nu intr n intervalul cu
precizie mare. n situaia n care excesul nu este un element att de important,
putem considera distribuia ca fiind mezocurtic.
Oricum, n tiinele sociale nivelul de precizie acceptat este de peste
95%, astfel nct distribuia noastr poate fi considerat o distribuie
mezocurtic.
Valorile coeficientului de boltire Kurtosis negative i care ies din in-
tervalul de ncredere sunt reprezentative pentru o distribuie platicurtic. Da-
c avem de a face cu valori pozitive care ies din intervalul de ncredere, dis-
tribuia este leptocurtic.
Demonstrnd faptul c distribuia scorurilor celor 30 de subieci la va-
riabila coeficient de inteligen este o distribuie unimodal, simetric i
mezocurtic am demonstrat de fapt c distribuia respect toate caracteristici-
le unei distribuii gaussiene i poate fi considerat o distribuie normal.
Analiza distribuiei trebuie s precead orice analiz ulterioar
de date, deoarece, n funcie de normalitatea distribuiei, pot fi alese sta-
tisticile parametrice sau nonparametrice utilizabile pe parcursul demer-
sului de cercetare, dup asumpiile teoretice ale fiecrei metode n parte.
Pentru a concluziona, v voi oferi un model complet de analiz a dis-
tribuiei scorurilor n funcie de variabila coeficient de inteligen. ntotdeau-
na furnizai, n analiz, ct mai multe informaii legate de variabila dumnea-
voastr. V rog s avei n vedere ataarea exact a inventarului statistic de
baz din SPSS i a eventualelor grafice care v pot susine demonstraia.
ntr-o analiz de date, va trebui s precizai: denumirea variabilei ana-
lizate, numrul de cazuri, indicatorii tendinei centrale i ai mprtierii, indi-
197
Statistic aplicat n tiinele socio-umane
198
Cristian Opariuc-Dan
199
Statistic aplicat n tiinele socio-umane
lea buton este butonul pivot, care permite schimbarea rndurilor i a co-
loanelor n tabel.
dul de editare.
Figura 6.21 Inventarul statistic dup editare
n final, tabelul dumneavoastr
trebuie s arate la fel ca cel din figura de mai sus.
Iat modalitatea prin care putei traduce, dac dorii, orice element al
formularului de rezultate ntr-o alt limb.
Din nefericire, la fel cum pot fi traduse cuvintele, pot fi modificate i
cifrele, ceea ce v poate determina uneori s schimbai datele oferite de SPSS
cu alte date mai convenabile vou. Nu uitai c, n general, trebuie s punei
la dispoziie i baza de date n momentul n care publicai un studiu i de cele
mai multe ori analizele sunt refcute de comisia de publicare a articolului.
Tot folosind modul de editare, putei ajusta limea coloanelor pentru
ca tabelul dumneavoastr s prezinte un aspect elegant.
Deplasai cursorul mausului deasupra unei linii, ca n figura alturat,
pn cnd se transform ntr-o sgeat orizontal. Apoi inei apsat butonul
din stnga al mausului i tragei micnd mausul la dreapta sau la stnga,
201
Statistic aplicat n tiinele socio-umane
202
Cristian Opariuc-Dan
tives
Figura 6.23 Meniul
statistici descriptive
Cunoatei deja fereastra care se deschide, de-
oarece am analizat-o pe parcursul acestei lucrri, drept pentru care nu vom
insista dect asupra unui singur element. Este
vorba despre caseta de bifare Save standard-
ized values as variables. Rolul acestei casete,
pe care o vom bifa, este acela de a crea o nou
variabil care va stoca scorurile z ale fiecrui Figura 6.24 Fereastra de
caz din baza de date. Evident, va fi lansat fe- configurare a analizei
reastra de afiare a rezultatelor care conine un
203
Statistic aplicat n tiinele socio-umane
tabel pe care l-am discutat deja. Totui, unde sunt notele z att de cutate
de noi?
S ne amintim ce am bifat. Am bifat o op-
iune, dup ce am introdus variabila Coeficient
de inteligen n lista variabilelor ce trebuie ana-
lizate, prin care notele standardizate vor fi salvate
ca variabile. Trebuie, deci, s ne ntoarcem la baza
de date, unde vom regsi o nou variabil creat
automat. Este vorba despre variabila Ziq, ultima
din baza de date, care nu conine altceva dect
notele z ale fiecrui subiect.
Figura 6.25 Noua variabil Observm c primul subiect se afl la
ce conine scorurile z
1,33 abateri standard n stnga mediei, adic n
zona rezultatelor medii, al doilea la 1,01 abateri standard n dreapta mediei,
tot n zona scorurilor medii i aa mai departe.
Cum facem totui pentru a obine note standardi-
zate rezultate din notele z, scoruri sten spre exemplu.
Figura 6.26 Meniul de V mai amintii probabil c scorurile sten se obin adu-
transformare SPSS adunnd valoarea 5,5 la valoarea notei z. Dac avem
notele z, restul este simplu. Cum facem ns acest lucru n SPSS?
Vom folosi serviciile unui alt meniu, i anume meniul Transform, de
unde vom selecta opiunea Compute sau Compute variable, n funcie de
versiunea SPSS pe care o posedai.
Rezultatul acestei aciuni se concretizeaz
ntr-o fereastr similar celei alturate, care conine
urmtoarele elemente:
Target variable reprezint seciunea n care
Figura 6.27 Fereastra
de calcul a variabilelor
204
Cristian Opariuc-Dan
vom introduce numele variabilei destinaie, variabil n care se vor salva noi-
le rezultate. n cazul nostru, suntem interesai s calculm scorurile sten pen-
tru variabila iq i vom introduce un nume, ca spre exemplu StenIQ.
Sub aceast caset de text se afl un buton inti-
tulat Type & Label, pe care, dac apsm, vom pu-
tea configura proprietile noii variabile create.
Astfel, avem posibilitatea s adugm o etiche-
Figura 6.28 Proprie-
ti ale variabilei t variabilei nou create, folosind cele dou opiuni din
seciunea Label. Putem decide dac introducem un
text ca etichet (ca n cazul figurii alturate) ori vom folosi drept etichet
formula de calcul, situaie n care va trebui s alegem opiunea Use expres-
sion as label. Seciunea Type permite alegerea tipului de variabil. Putem
decide ntre un tip numeric implicit i un ir de caractere, caz n care va trebui
s includem i dimensiunea acestui ir, numrul de caractere pe care l permi-
te variabila.
Sub butonul Type & Label se afl binecunoscuta list a variabilelor
din baza de date. n partea dreapt, apare caseta de text Numeric Expres-
sion, cu ajutorul creia putem scrie formula de calcul prin care va fi obinut
noua variabil. n acest sens, putem utiliza calculatorul de sub caset sau
putem tasta pur i simplu valorile sau formula n caseta de text. Pentru a v
uura accesul la formule, SPSS v pune la dispoziie dou liste: lista Func-
tion group care conine funciile sistemului grupate pe categorii i lista
Functions and Special Variables care se refer la funciile din categoria
selectat anterior. Dac, de exemplu, n prima list, efectum clic pe elemen-
tul Arithmetic, atunci, n cea de-a doua list, vor fi afiate funciile referitoa-
re la operaiile aritmetice uzuale.
Butonul If permite efectuarea condiional a calculelor, adic cal-
cularea doar a datelor care ndeplinesc o condiie.
205
Statistic aplicat n tiinele socio-umane
206
Cristian Opariuc-Dan
n concluzie:
Media i abaterea standard caracterizeaz pe deplin o distribuie i, de aceea,
aceti doi indicatori poart numele de parametri ai repartiiei normale;
O distribuie normal trebuie s ndeplineasc simultan urmtoarele trei condiii:
o S fie unimodal;
o S fie simetric;
o S fie mezocurtic;
Unimodalitatea reprezint existena unei singure categorii cu frecvena absolut
maxim i se analizeaz prin inspectarea valorii modale;
O distribuie normal este o distribuie unimodal;
Simetria reprezint echilibrarea distribuiei pe axa orizontal i se poate calcula
prin:
o Coeficientul Yule;
o Coeficientul Fisher;
o Relaia dintre medie, median i abaterea standard;
Referitor la simetrie, exist un sistem de relaii ntre indicatorii tendinei centrale
(medie, median i mod), distribuiile putnd fi simetrice, asimetrice la stnga i
asimetrice la dreapta.
O distribuie normal este o distribuie simetric
Boltirea reprezint o asimetrie vertical a distribuiei i se poate calcula prin:
o Coeficientul de boltire Pearson;
O distribuie normal este o distribuie mezocurtic;
ntr-o distribuie normal, exist un numr de ase abateri standard; trei la stnga
mediei i trei la dreapta mediei;
n funcie de abaterile standard, o distribuie normal prezint patru zone: zona
scorurilor normale, zona scorurilor accentuate, zona scorurilor atipice i zona sco-
rurilor aberante;
Notele z reprezint distana dintre un scor particular i medie, exprimat n ter-
meni de abateri standard;
207
Cristian Opariuc-Dan
113
Statistic aplicat n tiinele socio-umane
114
Cristian Opariuc-Dan
3
Datele sunt fictive i nu corespund unui studiu real. Ele au fost manipulate n aa fel nct
s corespund necesitilor didactice.
115
Statistic aplicat n tiinele socio-umane
116
Cristian Opariuc-Dan
ntrebare
Cum ai formula o ipotez direcional n acest design de cercetare?
Ce opiune ai alege n seciunea testelor de semnificaie?
117
Statistic aplicat n tiinele socio-umane
118
Cristian Opariuc-Dan
120
Cristian Opariuc-Dan
121
Statistic aplicat n tiinele socio-umane
remarca, pe al doilea rnd, ultimul cadran, graficul din figura 1.20. Aceasta
este o modalitate ideal de a vizualiza ansamblul legturilor dintre variabile.
Graficul 3-D Scatter este util n reprezen-
tarea tridimensional a corelaiilor ntre mai multe
perechi de variabile. Este o diagram de corelaie
mai dificil de analizat i presupune o oarecare expe-
rien n analiza datelor, folosindu-se frecvent n
analiza factorial i n corelaii pariale. n figura
Figura 1.25 Grafic tip 3-
D Scatter
1.25, reprezentnd tridimensional cele trei variabile,
putem observa uor lipsa efectului emoiilor din tim-
pul examenului. Norul de puncte este concentrat preponderent n zona varia-
bilelor nota examen i timp de studiu, cu orientare ctre scoruri mici ale
dimensiunii emoiei din timpul examenelor.
Graficul de tip Sim-
ple dot nu-l vom discuta.
Acesta nu reprezint un nor
de puncte propriu-zis ci o
variant a graficului cu bare,
prin care reprezentm obser-
vaiile individuale ale unei
singure variabile.
Acum s trecem la
treab. Am ales norul de
puncte simplu, am apsat
butonul Define pentru a
intra n modul de definiie al
graficului, acum privim la
noua fereastr care ne ocup
Figura 1.26 Formularul de definire a graficului de tip
ecranul. nor de puncte
122
Cristian Opariuc-Dan
123
Statistic aplicat n tiinele socio-umane
124
Cristian Opariuc-Dan
125
Statistic aplicat n tiinele socio-umane
Exerciii:
Studiai legtura care exist ntre performana la examen i timpul
alocat studiului, precum i ntre emoiile din timpul examenului i timpul
alocat studiului. Stabilii ipotezele, precizai tipul acestora, analizai cifric i
grafic coeficienii de corelaiei, elaborai raportul.
126
Cristian Opariuc-Dan
127
Statistic aplicat n tiinele socio-umane
128
Cristian Opariuc-Dan
129
Statistic aplicat n tiinele socio-umane
130
Cristian Opariuc-Dan
Sex Culoare Educatie Grad Inaltime Greutate Sex Culoare Educatie Grad Inaltime Greutate
1 3 4 4 172 87 2 3 2 2 193 94
2 1 4 3 184 79 1 4 2 2 177 92
2 3 4 3 176 86 1 4 2 2 170 69
1 1 3 3 173 85 2 2 2 2 188 81
1 3 3 3 187 77 2 2 2 2 172 76
1 4 3 4 178 80 1 2 2 1 170 93
2 1 3 4 170 82 1 4 2 1 171 74
1 1 3 3 171 71 2 3 2 1 186 77
1 3 3 3 172 79 2 1 2 1 187 92
1 3 3 3 170 89 1 1 2 1 191 99
1 4 3 3 185 90 1 4 2 1 178 72
2 4 3 3 172 94 2 4 2 1 181 85
1 1 3 3 187 75 2 3 2 1 187 72
1 4 3 3 184 83 1 3 2 1 189 86
2 4 3 3 175 80 2 3 2 1 170 77
1 3 3 3 187 84 1 3 2 2 182 90
1 4 3 3 169 71 1 2 2 2 186 90
2 3 3 2 171 93 1 2 2 2 193 97
131
Statistic aplicat n tiinele socio-umane
1 2 3 2 188 69 1 3 2 1 177 70
1 2 3 2 174 74 2 3 1 1 182 82
1 3 3 2 174 78 1 3 1 1 188 87
1 3 3 2 184 91 1 3 1 2 172 97
132
Cristian Opariuc-Dan
133
Statistic aplicat n tiinele socio-umane
134
Cristian Opariuc-Dan
135
Statistic aplicat n tiinele socio-umane
Celelalte elemente sunt, n marea lor majoritate, controale noi, astfel nct le
vom trata n detaliu.
Listele Row(s): i Column(s): se refer la variabilele ce vor fi
reprezentate pe liniile, respectiv pe coloanele tabelului de contingen. SPSS
permite att analiza tabelelor de contingen bidimensionale, ct i a celor
multidimensionale. Rezult c, putem include mai multe variabile n listele
Row(s) ori Column(s), n vederea construciei unor tabele multidimensi-
onale.
Seciunea Layer vizeaz includerea n analiz a uneia sau a mai
multor variabile de control, variabile care presupunem c ar putea influena
tabelul de contingen. De exemplu, dac am studia relaia dintre culoarea
ochilor i culoarea prului i am presupune c aceast relaie este influen-
at de genul biologic, atunci am include variabila gen biologic n lista
Layer, aceasta funcionnd ca variabil de control. Mai mult, SPSS ne
permite construcia de modele ierarhice folosind variabile de control, pentru a
vedea efectul exercitat de introducerea, succesiv, a acestora.
La includerea uneia sau a mai multor variabile n aceast list, pro-
gramul efectueaz analize separate pentru fiecare categorie a fiecrei variabi-
le de control introduse. Vom obine, aadar, o analiz a relaiei dintre culoa-
rea ochilor i culoarea prului pentru brbai i o alt analiz, separat, pentru
femei. Butoanele Previous i Next permit navigarea prin modelele de
variabile de control, n vederea adugrii sau n vederea modificrii acestora.
Dac bifai caseta Display clustered bar charts, comunicai pro-
gramului SPSS s construiasc un grafic cu bare, grupat dup o variabil,
fiecare grup coninnd categoriile celeilalte variabile. n cazul nostru, SPSS
ar construi dou grupuri de grafice cu bare pentru femei i pentru brbai
fiecare grup coninnd graficul cu bare pentru culoarea ochilor.
136
Cristian Opariuc-Dan
137
Statistic aplicat n tiinele socio-umane
138
Cristian Opariuc-Dan
139
Statistic aplicat n tiinele socio-umane
140
Cristian Opariuc-Dan
141
Statistic aplicat n tiinele socio-umane
142
Cristian Opariuc-Dan
143
Statistic aplicat n tiinele socio-umane
144
Cristian Opariuc-Dan
145
Statistic aplicat n tiinele socio-umane
146
Cristian Opariuc-Dan
Reprezentarea grafic
a datelor vine n sprijinul de-
monstraiei cifrice. Genul
persoanelor investigate nu are
nicio legtur cu culoarea
ochilor acestora. Graficul ara-
t doar o preponderen a
ochilor cprui, la ambele sexe
i o oarecare frecven mai
ridicat a ochilor negri la br-
bai. Culorile deschise au n
Figura 1.40 Reprezentarea grafic a relaiei dintre
culoarea ochilor i genul biologic. continuare o frecven sczu-
t, att la brbai ct i la fe-
mei. Iat c, prin procedee neparametrice, situate chiar la un nivel nominal, s-
a putut demonstra o ipotez de cercetare.
nainte de a ncheia, vom furniza cteva exemple, fr a intra n deta-
lii, pentru a v putea familiariza cu procedurile de lucru.
S presupunem c dorim s aflm relaia dintre culoarea ochilor i
gradul militar, adic s vedem dac, ntr-adevr, coloneii au ochi albatri.
Suntem n situaia analizei legturii ntre o variabil nominal (culoarea ochi-
lor) i o variabil ordinal (gradul militar). n acest caz avem dou posibili-
ti. Fie abordm analiza la nivel nominal, la fel cum am procedat anterior,
deoarece una dintre variabile se afl la acest nivel i aplicm principiul ana-
lizei bazate pe variabila cea mai slab, fie folosim coeficientul , coeficient
care relaioneaz o variabil nominal cu una ordinal sau scalar. Noi vom
aborda ambele situaii. Prin urmare, includem pe linii variabila culoarea
ochilor i pe coloane gradul militar. Bifm i caseta Display clustered bar
charts pentru a putea afia grafic variabilele, apoi alegem opiunile Chi-
147
Statistic aplicat n tiinele socio-umane
Toi cei trei coeficieni de asociere calculai arat, din nou, indepen-
dena celor dou variabile. Oricum, se poate observa creterea preciziei pra-
148
Cristian Opariuc-Dan
149
Statistic aplicat n tiinele socio-umane
Exerciii:
Analizai i interpretai legturile dintre: gen biologic i grad mi-
litar, culoarea ochilor i ultima coal absolvit, gen biologic i
greutate. Explicai i argumentai utilizarea coeficienilor.
150
Cristian Opariuc-Dan
151
Statistic aplicat n tiinele socio-umane
152
Cristian Opariuc-Dan
n concluzie:
Relaiile stabilite n urma analizei a dou variabile poart numele de analize biva-
riate, spre deosebire de analizele univariate care au n vedere doar o singur vari-
abil;
Gradul de asociere ntre dou variabile se bazeaz pe conceptul ce covarian. M-
sura standardizat a covarianei poart numele de corelaie;
Coeficienii de corelaie pot fi parametrici i neparametrici, dup cum cele dou
variabile ndeplinesc sau nu condiiile de aplicare ale statisticilor parametrice;
Coeficientul de corelaie al rangurilor Spearman se poate folosi, n general, pen-
tru variabile ordinale provenite din variabile continui sau pentru variabile continui
care nu ndeplinesc condiiile necesare aplicrii statisticilor parametrice;
Coeficientul de corelaie al rangurilor Kendall, are mai multe forme, se bazeaz
pe calculul inversiunilor i al proversiunilor i se folosete pentru variabile aflate
natural la un nivel de msur ordinal sau pentru variabile cantitative care nu nde-
plinesc condiiile de aplicare a statisticilor parametrice;
Coeficientul de contingen 2 are mai multe forme i se folosete n cazul variabile-
lor nominale, n calcule bazate pe tabele de contingen. Este un coeficient nedirec-
ional i nestandardizat;
Coeficientul de asociere este o form standardizat a coeficientului 2 i se utili-
zeaz, n general, pentru dou variabile dihotomice. n cazul n care una dintre va-
riabile nu mai este dihotomic, acest coeficient nu are relevan;
Coeficientul de contingen Pearson (cc) este o variant a coeficientului , care
poate fi utilizat pentru variabile cu mai multe categorii;
Coeficientul de contingen Tschuprow (t) se bazeaz tot pe coeficientul i ine
seama de acesta i de numrul de categorii din cadrul fiecrei variabile, fiind o
form ajustat a coeficientului ;
153
Cristian Opariuc-Dan
( )
(formula 8.5)
( )
Observm c valoarea se apropie mult de cea obinut anterior prin
corecie.
285
Statistic aplicat n tiinele socio-umane
Figura 8.5 Primul pas al crerii unui eantion. Salvarea fiierului plan
286
Cristian Opariuc-Dan
287
Statistic aplicat n tiinele socio-umane
288
Cristian Opariuc-Dan
289
Statistic aplicat n tiinele socio-umane
290
Cristian Opariuc-Dan
291
Statistic aplicat n tiinele socio-umane
292
Cristian Opariuc-Dan
293
Statistic aplicat n tiinele socio-umane
294
Cristian Opariuc-Dan
295
Statistic aplicat n tiinele socio-umane
296
Cristian Opariuc-Dan
le pot fi generate doar n ordine. Prin urmare, nu putem crea stadiul 3 n con-
diiile n care nu au fost executate stadiile 1 i 2.
Seciunea What type of seed value do you want to use? permite
stabilirea valorii de iniializare pentru generatorul de numere aleatoare. Pu-
tem alege ntre un numr oarecare, generat automat de computer (selectnd
A randomly-chosen number) sau putem include o valoare n caseta de
text Custom value, n situaia n care se dorete reproducerea caracteristi-
cilor eantionului.
Cele dou casete de bifare permit tratarea cazurilor n care lipsesc in-
formaii la nivelul unor elemente i accelerarea procesului de generare a ean-
tionului. Bifarea primei casete are ca efect includerea ntr-o categorie separa-
t a unitilor cu date lips, iar debifarea acesteia ignor unitile care au date
lips.
Bifarea celei de-a doua casete are ca efect accelerarea procesului de
generare a eantionului, n condiiile n care datele sunt deja sortate dup va-
lorile unei variabile de stratificare. Altminteri, SPSS va proceda la o nou
resortare, operaiune consumatoare de timp.
Urmtoarea etap permite precizarea locului n care va fi salvat ean-
tionul i variabilele pe care acesta le genereaz. Putem opta ntre baza de date
curent (Active dataset), caz n care SPSS va selecta din baza de eantio-
nare unitile incluse n eantion i va calcula variabilele necesare doar pentru
acestea, putem alege o nou baz de date (New dataset), caz n care SPSS
va crea o nou baz de date, nesalvat, n care va include doar unitile selec-
tate n eantion sau putem crea o nou baz de date cu salvare (External
file), caz similar celui anterior, singura deosebire fiind aceea c SPSS va
crea un nou fiier pe disc i va salva eantionul. n cele dou situaii, va tre-
bui s precizm numele bazei de date, respectiv numele i calea ctre fiierul
de date.
297
Statistic aplicat n tiinele socio-umane
298
Cristian Opariuc-Dan
299
Statistic aplicat n tiinele socio-umane
Summary
Stage 1
Sample Inf ormation Selection Method Simple random sampling
without replacement
Number of Units Sampled
930
Variables Created or Stagewise Inclusion
InclusionProbability _1_
Modif ied (Selection) Probability
Stagewise Cumulativ e SampleWeight
Sample Weight Cumulativ e_1_
Stagewise Population
PopulationSize_1_
Size
Stagewise Sample Size SampleSize_1_
Stagewise Sampling
SamplingRate_1_
Rate
Stagewise Sample
SampleWeight_1_
Weight
Analy sis Inf ormation Estimator Assumption Equal probability
sampling without
replacement
Inclusion Probability Obtained from v ariable
InclusionProbability _1_
Plan File: C:\Test.csplan
Weight Variable: SampleWeight_Final_
300
Cristian Opariuc-Dan
301
Statistic aplicat n tiinele socio-umane
302
Cristian Opariuc-Dan
calea complet sau putei folosi butonul Browse, prin intermediul cruia
vei alege locaia acestui fiier. Evident, va trebui s furnizai i un nume. n
cazul nostru, fiierul plan de analiz se numete Analiza.csaplan i a fost
salvat direct n directorul C:\.
Observai diferena de extensie. Dac planurile de eantionare aveau
extensia .csplan, planul de analiz are extensia .csaplan.
303
Statistic aplicat n tiinele socio-umane
aceast variabil poate lua diferite forme, n planul de analiz vom include,
de obicei, forma final a acesteia, forma n care SPSS pondereaz de fapt
toate stadiile. V recomand introducerea n seciunea Sample Weight a
variabilei de tipul Final Sample Weight, variabil care, de obicei, caracte-
rizeaz cel mai bine eantionul. n cazul planurilor complexe, s-ar putea in-
clude i alte variabile pariale de acest tip, dac se dorete investigarea la ni-
velul stadiilor, a straturilor ori a clusterilor.
304
Cristian Opariuc-Dan
305
Statistic aplicat n tiinele socio-umane
306
Cristian Opariuc-Dan
307
Statistic aplicat n tiinele socio-umane
308
Cristian Opariuc-Dan
309
Statistic aplicat n tiinele socio-umane
310
Cristian Opariuc-Dan
311
Statistic aplicat n tiinele socio-umane
Exist destul de multe opiuni n cadrul acestei noi ferestre, unele din-
tre ele fiindu-v necunoscute, deoarece nu avei nc informaiile necesare
referitoare la anumite teste statistice. Noi le vom prezenta pe toate, studiind
aici, n detaliu, doar cteva, celelalte urmnd s le analizm n volumele ulte-
rioare.
Seciunea Cells permite afiarea informaiilor legate de populaia
int din care a fost extras eantionul. Vor fi afiate date referitoare la dimen-
siunea populaiei sub form de frecvene absolute, prin bifarea casetei Pop-
ulation size i sub form de frecvene relative (procente), bifnd caseta
Table percent.
Seciunea Statistics permite configurarea indicatorilor statistici
asociai dimensiunii populaiei sau a procentului din populaie, astfel:
Prin bifarea casetei Standard error, vom calcula eroarea
standard a estimrii;
Caseta Confidence interval permite stabilirea intervalului
de ncredere a estimrii n baza nivelului specificat. n mod
normal, intervalul de ncredere l vom stabili la 95%, dup
cum observai c am procedat i n exemplul nostru (caseta de
text Level%);
Caseta Coefficient of variation comunic programului cal-
culul coeficientului de variaie a estimrii, sub form de pro-
porii;
Caseta Unweighted count permite afiarea numrului de
elemente folosit n realizarea estimrii. Cu alte cuvinte, di-
mensiunea eantionului extras;
Caseta Design effect permite calculul varianei estimrii.
Indicatorul exprim proporia de varian a eantionului com-
parat cu variana unui eantion simplu randomizat. Coeficien-
312
Cristian Opariuc-Dan
313
Statistic aplicat n tiinele socio-umane
314
Cristian Opariuc-Dan
Respondent's Sex
315
Statistic aplicat n tiinele socio-umane
tionul nostru estimeaz o populaie compus din 43,7% brbai i 56,3% fe-
mei.
Urmtoarea coloan (Standard Error) se refer la eroarea standard a
estimrii, exprimat att n form brut, ct i n form procentual. Eantio-
nul nostru estimeaz populaia int cu o eroare standard de 15,35 brbai i
15,35 femei (aproximativ 15 subieci pentru fiecare categorie, cifrele repre-
zentnd din nou o abstraciune). Acest indicator devine mai clar dac urm-
rim forma procentual. Iat c eroarea estimrii este de 1% att n cazul br-
bailor, ct i n cazul femeilor, care, la un nivel de ncredere de 95%, ne poa-
te determina s afirmm c avem un eantion reprezentativ sub aspectul sexu-
lui.
Urmeaz dou coloane ale intervalului de ncredere. n baza erorii
standard, eantionul estimeaz practic o populaie int format dintr-un nu-
mr de 632,12 pn la 692,39 brbai i de la 824,60 pn la 884,87 femei.
Cu alte cuvinte, compoziia populaiei int estimat de eantion este format
din 41,7% pn la 45,7% brbai i 54,3% pn la 58,3% femei. Undeva ntre
aceste limite putem gsi populaia int real estimat de eantion.
Coloana Design Effect are evident valoarea 1, deoarece am lucrat cu
un eantion simplu randomizat, fapt tratat mai sus.
Ultima coloan indic dimensiunea i compoziia eantionului (Un-
weighted Count). Dup cum tiam deja, eantionul are un numr de 930 de
cazuri, iar din punctul de vedere al sexului avem 406 brbai i 524 femei.
Iat c acest eantion estimeaz reprezentativ populaia int la o eroare de
doar 1% i la un nivel de ncredere de 95%. Suntem n faa unui eantion re-
prezentativ, acest lucru fiind demonstrat prin analiza efectuat.
Am analizat o variabil de interes situat la nivel nominal (sexul).
Cum procedm ns, dac avem o variabil de interes la un nivel scalar, de
exemplu vrsta? Analiza frecvenelor nu ne ajut prea mult. Este timpul s
316
Cristian Opariuc-Dan
abordm cea de-a doua metod propus i anume analiza descriptiv. Paii
sunt identici, astfel nct nu vom insista asupra lor. Exist ns o serie de me-
tode statistice uor diferite, pe care vom ncerca s le lmurim.
318