Documente Academic
Documente Profesional
Documente Cultură
STATISTIC
APLICAT
PARTEA NTI
- ELEMENTE DE STATISTIC -
Cuvnt nainte
Statistica a devenit elementul sine qua non al cunoaterii n condiii de
manifestare probabilistic a fenomenelor. Utilizarea statisticii permite att
descrierea fenomenelor i modelarea lor, ct i aplicarea practic a acestora,
accentul punndu-se att pe prezentarea raionamentului statistic ct i a
tehnicilor fundamentale de analiz a datelor experimentale.
Lucrarea de fa constituie o introducere concis i clar n statistica
aplicat n tiinele de factur social i economic, ca produs al faptului social.
Tehnicile statistice prezentate sunt vzute ca instrumente folosite pentru a
rspunde unor probleme de cercetare specifice. Cu alte cuvinte, acest material
nu se adreseaz statisticianului profesionist, ci psihologului, economistului, i
mai larg, oricrui debutant n studiul tiinelor omului, precum i altor persoane
ale cror profesii sunt legate ntr-un fel sau altul de aceste tiine.
Acest carte conine elemente practice. Fiecare capitol i propune
obiective precise i abund de exemple i exerciii. n definitiv, este important s
se stpneasc practica statisticii, s fie utilizat n activitatea de zi cu zi i nu s
se fac doar speculaii teoretice pe aceast tem.
Cartea este dedicat studenilor, n special celor din anul I (i nu numai) i
are ca scop iniierea acestora n demersul statistic i formarea gndirii statistice
necesare nelegerii fenomenelor de mas.
Prima parte conine pe VIII capitole, fiecare capitol divizndu-se n 4
seciuni. Prima seciune const n prezentarea coninutului tematic. A doua
seciune Alegei rspunsul corect permite s se verifice nsuirea corect a
subiectelor tratate i aprofundarea elementelor particular dificile. Seciunea a
treia Probleme permite deprinderea tehnicilor de calcul statistic i a modului
de interpretare statistic a fenomenelor.
3
I.
NOIUNI INTRODUCTIVE
_________________________________________________________________________________________________________________
I.1.
Stan,
totalitatea fenomenelor de aceeai natur (de aceeai esen calitativ, ale unui
fenomen sau proces economic), care au trsturi esenial comune i care sunt
supuse unui studiu statistic.
Exemple de populaii statistice:
1. Colectivitatea studenilor din primul an de facultate, din Centrul
universitar Constana;
2. Colectivitatea persoanelor cu vrst egal sau mai mare de 45 de ani,
din Romnia;
Colectivitatea statistic specific vieii economico-sociale are un caracter
obiectiv, concret i finit strict determinat n timp i spaiu.
Statistica abordeaz colectivitile fie static, fie dinamic. Colectivitile
statice exprim o stare i au o anumit ntindere n spaiu la un momonet dat, iar
7
4. Variabile statistice.
Definiie: Caracteristica (variabila) statistic reprezint trstura, proprietea,
nsuirea comun tuturor unitilor unei colectiviti i care variaz ca nivel,
variant sau valoarea de la o unitate a colectivitii la alta. (Vasilescu, Puiu,
1992.)
Variabilitatea se refer la proprietatea obiectului de studiu de a lua
valori diferite (Popa, 2008, p. 23).
Fiecare dintre criteriile de difereniere este o variabil, adic o entitate
care ia valori diferite pentru componenii colectivitii i este comun tuturor
elementelor colectivitii.
Exemplul 1. mediul de provenien este o variabil care poate lua trei
valori: urban, rural variabil categorial;
Exemplul 2. Variabila gen biologic poate lua 2 valori: feminin i
masculin. variabil categorial;
Exemplul 3: Vrsta poate lua valori de la 0 ani la peste 100 de ani.
variabil numeric;
Variabila Vrsta poate fi i variabil categorial i lua diferite valori
in funcie de categoriile stabilite. (se stabilesc categorii de vrste).
Exemplu: 1. 10-20 ani
9
2. 21-30 ani
3. 31-40 ani.
Gradul didactic;
n cazul variabilelor discrete, mulimea de definiie a valorilor sale este o
mulime discontinu iar ntre dou valori nu poate fi interpus o valoare
intermediar.
Variabilele discrete pot fi categoriale sau de rang.
b. Variabile continue
Sunt variabile de tip numeric (cantitativ, de tip interval/raport) care au
un numr teoretic infinit de niveluri de msurare...poate lua orice valoarea
(exprimabil i prin numere fracionate), permind utilizarea zecimalelor
(Popa, 2008, p. 25).
Exemplu:
greutatea ntre un subiect de 76 kg i un subiect de 78 kg putem gsi
oricnd un subiect de 77,5 kg;
cifra de afaceri a unei firme;
nlimea subiecilor.
n cazul acestor variabile, mulimea de definiie a valorilor sale este una
continu, ne-numrabil. Aceste variabile se mai numesc i variabile scalare
(de interval sau de raport).
Deoarece cercetarea unei colectiviti numeroase poate implica valori
mari, putem extrage din colectivitatea iniial o subcolectivitate (sau mai multe)
al crui studiu este mai simplu. n acest caz vorbim despre eantion
reprezint un subset de elemente selectate dintr-o colectivitate statistic.
Eantionul reprezint unitile de informaie selecionate pentru a fi efectiv
studiate (Popa, 2008, p. 38).
Calitatea unui eantion de a permite extinderea concluziilor la
ntreaga populaie din care a fost extras se numeste reprezentativitate (Popa,
2008, p. 39).
11
ntrebrile i problemele cu asterix (*) sunt preluate din Jaba E, Pintilescu C, (2005).
15
I.3. Rspunsuri
corecte
I.2. Rspunsuri corecte.
1. b - activitate de strngere a datelor;
2. a - numrtoare a populaiei i eviden a bunurilor materiale;
3. a - un pronunat caracter metodologic;
4. a - micrile curente continue ale fenomenelor i proceselor ce i au
existena sub form de colectiviti;
5. a - asociaii finite de elemente unite ntre ele prin omogenitate;
6. a - trsturi eseniale purtate la toate elementele unei colectiviti;
7. a - direct msurabile cantitativ;
8. b - msurabil cu aproximaie;
9. a - Gottfried Achenwall;
10.a - o persoan interogat ntr-o anchet;
11.a - ansamblul persoanelor nregistrate pe teritoriul Romniei la 18 martie
2002;
12.b - sexul persoanelor, starea civil, domiciliul;
13.b - numrul de copii pe familie, numrul de camere ale unui apartement,
numrul de piese defecte dintr-un lot de rulmeni;
14.a - talia, greutatea, salariul;
15.
- unitatea = angajatul;
- variabila = nr de zile=cantitativ discret
16
- unitatea= ntreprinderea;
- variabila= nr personalului =cantitativ, discret;
17
(procedeele de
19
erori de modelare:
- Se produc atunci cnd se alege n mod nejustificat un mod de calcul, fapt
ce determin obinerea unor indicatori fr coninut real.
21
22
1. b - sondaje statistice;
2. c - aplicarea aceluiai chestionar unui singur lot de subieci la momente
diferite de timp.
3. d - se organizeaz cu o anumit periodicitate.
4. c - este o metod de observare parial care numai ntmpltor poate s
ndeplineasc condiia de reprezentativitate;
5. a - anchetele prin sondaj;
6. a - un recensmnt;
7. c - sondaj statistic.
8. b - populaia rii;
9. a - momentele de recensmnt;
23
III. SCALE
DE MSURARE
_________________________________________________________________________________________________________________
________
Raport
Parametric
Cuantificare
Interval
Ordinal
Nominal
Neparametri
c
24
atribuirea
unor
noi
nume
(n
loc
de
Sangvinic
Melancolic
Flegmatic
26
NUMR DE INDIVIZI
32
48
37
33
ni=
n
i 1
100
27
ni
100
n
Proprietile scalei:
Proprietile specifice scalei ordinale le includ pe cele ale scalei nominale,
dar se adaug (Vasilescu, 1992):
Operaii statistice permise:
o Frecvena sumelor n valori cumulate i procentuale;
o Coeficieni de corelaie de rang: Spearman, sau Kendall.
28
Fci =
nk
k 1
F*ci =
(3)
n
k 1
*
k
(4)
29
Frecvena absolut
Nivel creativ
5. creativitate emergent.
Frecvena
absolut
cumulat
ascendent
Frecvena
absolut
cumulat
descendent
Frecvena
relativ
cumulat
ascendent
Frecvena
relativ
cumulat
descendent
1 75
47,8
75
157
47,8
100
2 52
33,1
127
82
80,9
52,2
3 20
12,7
147
30
93,6
19,1
3,8
153
10
97,1
6,4
2,6
157
100
2,6
157
100
trebuie s reflecte
30
III.2.
SCALE PARAMETRICE
A
r
xmax xmin
r
(6)
xmin+rh
A 100
25
r
4
32
Intervale
Frecven
221 - 246
246 - 271
271 - 296
296 - 321
34
35
36
III.4. Probleme
1. Ne propunem s studiem 200 de persoane pentru a vedea care este profesia
lor. Dup investigaie au rezultat:
32 avocai
50 economiti
66 juriti
21 contabili
31 psihologi
Cerine:
a. Identificai frecvena absolut;
b. Calculai frecvena relativ
2. n urma controlului de calitate, ntr-un lot de 500 de piese, se gsesc n i=30
piese rebut.
S se calculeze procentul mediu al pieselor de rebut din lot.
3. Populaia ocupat (mii persoane) pe sectoare de activitate n Romnia, n anii
1993 i 2001, se prezint astfel:
Sectorul de activitate
1993
Indistrie
3030
Construcii
574
Agricultur i
3614
silvicultur
Alte ramuri
2844
Total
10062
S se calculeze ponderea populaiei ocupate n
n anul 2001.
2001
2017
340
3498
2708
8563
sectorul de construcii,
ntrebrile i problemele cu asterix (*) sunt preluate din Jaba E, Pintilescu C, (2005).
37
1993
2001
3030
574
3614
2017
340
3498
2844
10062
2708
8563
0
6
6
1
18
24
2
23
47
3
20
67
4
14
81
5
6
87
6
2
89
7
1
96
Calculai:
a) Amplitudinea;
b) Marimea intervalului avnd r = 4 (numrul de intervale);
c) Frecvena absolut;
ntrebrile i problemele cu asterix (*) sunt preluate din Jaba E, Pintilescu C, (2005).
38
- 20
20-30
30-60
60-80
80-100
17
61
22
15
18
Ni*
Avocai
32
16
Contabili
21
25
Economiti
50
33
Psihologi
31
10,5
Juriti
66
15,5
Profesii
ni
* 100
n
30
* 100 6 0 0
500
40
ni
n
340
i
*100 3,97%
ni n 8563
ni
* 100
ni
3030
* 100 30,11%
10062
( ) ni1 ni 0 23,55 30,11 6,56%
Ni0*=
Ni1*=
2017
*100 23,55%
8563
Sub 2
10
2-4
25
4-6
40
6-8
20
8 i peste
total
100
100
100
IV. INDICATORI
STATISTICI
________________________________________________________________________________________________________________
42
IV.1.
Benea, M, Munteanu, G , 2007 Elemente de statistic economic i social, Ed. Andrei aguna,
Constana,p. 59
43
x
i 1
25 26 32 33 40 22 26 24 228
28,5ani
8
8
xn
i 1
r
i i
n
i 1
45
ni
20 - 40
10
40 - 60
15
60 - 80
10
80 - 100
S se calculeze media.
Rspuns : Fiind o serie cu distribuie de frecvene vom aplica urmtoarea
formul:
r
xn
i 1
r
i i
unde:
n
i 1
Xi = centrul de interval
Ni =frecvena absolut
Observm c n formul avem i necunoscute, adic X i (centrul de interval) i va
trebui s-l calculm.
Interval
ni
Xi
20 40
10
30
40 - 60
15
50
60 - 80
10
70
80 - 100
90
Xi =
Xi =
30
2
2
46
Xi =
40 60 100
50
2
2
.
Xi =
80 100 180
90
2
2
30 *10 50 *15 70 * 10 90 * 5
10 15 10 5
x
x
d1
hM 0
M 0 xinf M 0
d1 d 2
unde:
xinf M 0
48
O serie de date statistice poate s aib una sau mai multe valori modale.
O distribuie cu un singur mod se numete unimodal, dac are dou valori
dominante se numete bimodal, iar dac are mai mult de dou moduri se
numete multimodal.
ni
20
10
10
15
25
10
M0 =
xinf M o hM 0
d1
d1 d 2
Intmod = 50-60 (intervalul a crui frecven absolut este cea mai mare)
xinf M 0
= 50
d1 = nM nM
0
nM 0
nM 0 1
nM 0
d2 = 25 - 10 = 15
49
M 0 50 20
10
10
50 20
50 8 58
10 15
25
Mo =58
n 1
2
seriei
50
n 1
2
7 1 8
4
2
2
Scoruri:
Poziia:
b)
1, 2,
3, 4,
5,
6,
mijlocul seriei.
51
- dac datele sunt cantitative, mediana este media celor dou valori
din mijloc
Exemplu: Se consider urmtorul ir de date:
20, 10, 15, 18, 21, 22
Pentru a calcula mediana, primul pas este acela de a ordona cresctor sau
descresctor aceste date. Ordonnd cresctor irul de mai sus, obinem:
10, 15, 18, 20, 21, 22
S se calculeze mediana.
Se ordoneaz datele cresctor, astfel : 10, 15, 18, 20, 21, 22.
LocMe =
n 1
2
6 1 7
3,5
2
2
18 20 38
19
2
2
Numrul membrilor
de familie
Numrul de familii
ni
Frecvene cumulate
Fci
12
23
30
8
7
80
12
35
65
73
80
1
2
3
4
5
LocMe =
80 1
40,5
2
cumulat mai mare dect 40,5 este 65 varianta trei membrii de familie
reprezint varianta median situat n mijlocul distribuiei.
Pentru o serie de repartiie de frecvene pe intervale de variaie, mediana
se va ncadra n intervalul median, primul interval cu frecvena cumulat mai
mare dect LocMe.
Exemplul 2: Se d distribuia:
Intervale
10-20
20-30
30-40
40-50
50-60
60-70
ni
20
10
10
15
25
10
53
Fci
20
30
40
55
80
90
LocMe =
n 1 90 1 91
45,5 ;
2
2
2
Me = xinf Me hMe
n = 90
LocMe Fc ( Me 1)
nMe
unde:
xinf Me
40 10
45,5 40
15
= 43,66
Me = 43,66
54
A
100
x
IV.2.3. QUARTIELE
LocQ1 Fc ( Q1 1)
nQ1
unde:
x inf Q1
hQ1
LocQ1 =
n 1
4
Q3 xinf Q3 hQ3
LocQ3
LocQ3 Fc ( Q3 1)
nQ3
3( n 1)
;
4
56
ni
20
10
10
15
25
10
Q1 = xinf Q hQ
1
LocQ1
Fci
20
30
40
55
80
90
LocQ1 Fc (Q1 1)
nQ1
n 1 91
22,75
4
4
Intervalul 20;30 primul interval care are frecvena cumulat mai mare
dect locul quartilei Q1
hQ1 30 20 10
xinf Q1 20
Fc (Q1 1) 20
nQ1 10
Q1 20 10
22,75 20
20 10 * 0,27 22,75
10
Q3 = primele 25% din firmele care ofer cele mai mari salarii.
Q3 xinf Q3 hQ3
LocQ3
LocQ3 Fc (Q3 1)
nQ3
3( n 1) 3 91
68,25
4
4
57
xinf Q3 50
hQ3 60 50 10
Fc ( Q3 1) 55
nQ3 25
Q3 150 10
68,25 55
150 5,3 155,3
25
Q3= 155,3 primele 25% din firmele care ofer cele mai mici salarii.
dx
x x
i 1
1 n
xi x
n i 1
58
dx
x x n
i
i 1
n
i 1
dx
x x n %
i 1
*
i
100
Exemplu:
Pentru 200 de persoane s-au sistematizat datele culese cu privire la timpul
zilnic petrecut n faa televizorului rezultnd:
Timp (min)
Numr de
persoane ni
xi
xi*ni
xi - X
0-30
47
15
705
-57,75
57,75 2714,25
30-60
51
45
2295
-27,75
27,75 1415,25
60-90
76
75
5700
2,25
2,25
90-120
24
105
2520
32,25
32,25 774
120 -150
135
270
62,25
62,25 124,5
XI X
XI X
(Pn la 30)
171
T=5260,2
S se calculeze abaterea medie liniar.
n
x n
i 1
200
200
n
11490
57,45
200
dx
x ni
n
i 1
5260,2
26,30
200
59
*ni
x2
( x x)
i 1
2
x
( x x)
i 1
ni
n
i 1
( x x)
i
x2
100
60
ni* %
Timp
(min)
Numr de
persoane ni
0-30
xi
xi*ni
xi -
(xi- x )2
(xi- x )2*ni
47
15
705
-42,45
1802
84694
30-60
51
45
2295
-12,45
155
7905
60-90
76
75
5700
17,55
308
23408
90-120
24
105
2520
47,55
2261
54264
120 i peste
135
270
77,55
6014
12028
(Pn la 30)
T=11490
T=182299
S se calculeze dispersia.
k
x2
( x x)
i 1
n
i 1
x2
ni
182299
911,49
200
61
xn
i i
i 1
=57,45
22
22
( x x)
i 1
Petru, Al., 2005 Introducere n statstica social, Editura Paralela 45, Piteti, p. 52
62
( x x)
i 1
ni
n
i 1
( x x)
ni*%
100
Exemplu:
x x2
911,49 30.19
minute
Abaterile mici, indic faptul c valorile sunt uor distanate de medie, n timp ce
abaterile mari, arat c datele sunt distanate, mprtiate n jurul mediei, care,
nu mai este reprezentativ. Abaterea standard se exprim n aceleai uniti de
msur ca i media
Proprietile abaterii standard (Popa, 2008, p. 70):
- dac se adaug /scade o constnt la fiecare valoare a unei distribuii,
abaterea standard nu este afectat;
- dac se multiplic/divide fiecare valoarea a unei distribuii cu o
constant, abaterea stabdard se multiplic/divide cu acea constant.
63
x
100
x
sau
vx
25,99
dx
100 0,045 )
100 (dac s-a calculat abaterea medie liniar
57,45
x
coeficientului de variaie:
- dac
vx
reprezentativ;
- dac
vx
64
- dac
vx
reprezentativitate redus.
Cu ct nivelul lui
vx
redus, colectivitatea este mai omogen, media avnd un grad mai ridicat de
reprezentativitate; cu ct valoarea sa este mai departe de zero, cu att variaia
este mai intens, colectivitatea mai eterogen, iar media are un nivel de
semnificaie mai sczut.
Alegerea indicatorului mprtierii (Popa, 2008, p. 72):
- abaterea standard este cea mai utilizat pentru scalele de msurare
interval /raport, deoarece realizeaz cea mai bun combinaie ntre
calitatea estimrii i posibilitatea de a fundamenta inferene
statistice;
- amplitudinea - este un indicator nesigur, care nu poate fi calculat n
cazul scalelor nominale;
65
x Me M0
(fig. 1);
Mo me
Fig.1
medie
fig.2
x Me M0
Medie Me mo
Fig.3
n cazul distribuiilor perfect simetrice, modul, mediana i media se
plaseaz n aceeai poziie. Dac distribuiile sunt asimetrice, atunci cei trei
indicatori au poziii diferite: mediana se plaseaz ntotdeauna ntre mod i
66
medie, motiv pentru care, ea este cea mai reprezentativ valoare pentru
distribuiile simetrice.
Media este afectat de valorile extreme i din aceast cauz, ea nu est un
indicator veridic al tendinei centrale atunci cnd este vorba de distribuii
puternic asimetrice. (Popa, 2008).
Asimetria n valoarea absolut se poate msura cu indicatorii:
As x M 0
sau
As1 3 x M e
x M0
x
Cas1
3 x Me
,
x
deoarece
x M 0 3 x M e .
Exemplu:
Presupunem c pentru 200 de persoane s-au sistematizat datele culese
cu privire la timpul zilnic petrecut n faa televizorului, rezultnd:
Timp (min)
0-30
(Pn la 30)
30-60
60-90
90-120
120 i peste
Numr de
persoane ni
47
51
76
24
2
67
xi
xi*ni
15
705
45
75
105
135
T=11490
2295
5700
2520
270
* ni
Mo =xinfMo-hMo
11490
57,45
200
d1
d1 d 2
25
x M0
57,45 69,74
0,407
x
30,19
3 x Me
57,45 61
Cas1
0,118
x
30,19
negativ moderat (coada mai lung a distribuiei tinde spre valori mici).
q2 q1
q2 q1 unde
Q1= Me-Q1
Q2=Q3-Me
Casq
Q3 M e M e Q1 Q3 Q1 2M e
Q3 M e M e Q1
Q3 Q1
68
Acest coeficient este foarte uor de calculat, ns ine cont doar de cteva
valori valorile quartile i nu de toate valorile din distribuie, fapt care i
limiteaz precizia i se consider c este doar un coeficient elementar al
simetriei.
Exemplu:
Pentru o distribuie s-au stabilit urmtoarele rezultate:
Q1= 150
Me= 130
Q3=140.
S se calculeze valoarea coeficientului de asimetrie Yule.
Rspuns. Coeficientul de asimetrie yule se calculeaz dup relaia:
(q 2 q1 )
(Q3 M e ) ( M e Q1 )
Casq= (q q ) = (Q M ) ( M Q ) =
2
1
3
e
e
1
Q3 Q1 2 Me 10 20
=
Q3 Q1
10 20
= -3
x x
n
m3
i 1
n
utiliznd frecvente
x x m x x n %
r
m3
Dac
seriile
de
i 1
n
i 1
i 1
*
i
100
distribuie cu asimetrie negativ sunt mai numeroase, valorile x i mai mici dect
media, atunci abaterile
( xi x)
sunt negative.
69
( xi x)
sunt pozitive.
( xi x)
m3
m32
.
x3
m22
2 2 3
Sau
ntr-o
distribuie
asimetric
la
negativ, vezi figura alturat), predomin scorurile mari. n acest caz, modul este
valoarea situat cel mai la dreapta n irul de date, iar mediana este mai mare
dect media. Evident, mediana fiind valoarea care mparte irul ordonat de date
n dou pri egale, iar dac n distribuie predomin scorurile mari, atunci
scorurile mici sunt considerate ca scoruri extreme.
tim, de la analiza preciziei indicatorilor tendinei centrale, c ntr-o serie
de date n care ntlnim scoruri extreme
mici, media tinde s le pun n valoare.
Iat c acest fapt este ilustrat grafic n
figura de mai sus n care se observ
relaia existent.
71
IV.4.4. BOLTIREA
pe
orizontal,
m4 m4
x
n
m4
i 1
n
pe baza frecventelor
x
r
m4
i 1
n
i 1
x
r
x ni
i 1
x ni* %
100
73
x x
n
2 2 3
i 1
Numr de firme
50
70
90
100
50
20
380
x 149,47
M 0 166,67
M e 151,33
Q1 105,86
Q3 190,3
2 3068,14
55,39
Q3 M e M e Q1
Q3 M e M e Q1
Casq
0,08
190,3 105,86
84,44
Q3 M e M e Q1
Q3 Q1
74
2
m4
m4
m22
x x
n
i
ni
7,93306 109
20876491
380
20876491
2,218
9413483
2 2 3 2,218 3 0,78
2 3, 2 0
76
a) Mo = xi - hMo * d d ;
1
2
d1
b) Mo = xi + hMo * d d ;
1
2
( n mo n mo 1 )
c) Mo = xi-1 + hMo (n n ) (n n )
mo
mo 1
mo
mo 1
14. Care dintre urmtoarele variante nu reprezint un indicator al tendinei
centrale?
a) mod;
b) distribuie de frecvene;
c) median;
d) medie;
e) medie ponderat.
15. Dac dorim s obinem un indicator al tendinei centrale care s nu fie
afectat de valorile extreme, s poat fi calculat pentru date msurate pe
77
orice scal (cu excepia celei nominale) i s aib o singur valoare, vom
calcula*:
a) media aritmetic
b) modul;
c) media geometric;
d) mediana;
e) media ponderat.
16. Modul se utilizeaz pentru caracterizarea:
a. tendinei generale i gradului de asimetrie;
b. gradului de boltire;
c. gradului de concentrare.
17. Quartilele sunt mrimi de poziie care mpart colectivitatea n:
a. n-1 pri egale;
b. 4 pri egale;
c. 5 pri egale;
18. n distribuia de mai jos:
Interval
ni
0-5
3
5 - 10
7
10 - 15
15
15 - 20
20
a) Casq= (q q )
2
1
(q 2 q1 )
b) Casq= (q q )
2
1
(q3 q1 )
c) Casq= (q q )
3
1
22. Coeficientul de boltire se calculeaz dup relaia:
m4
a) 2= m2
b) 2=
m3
3
c) 2=
m3
m2
b)
dx
dx
x ni
n
27. Coeficientul 2
a)
b)
c)
d)
e)
m4
m2
asimetriei;
variaiei;
boltirii;
tendinei centrale;
indicatorilor medii de poziie.
79
IV.6. Probleme
Numrul
unitilor
comerciale
0 - 10
50
10 - 20
20
20 - 30
10
ni
5
10
12
6
8
4
80
30 - 40
5
S se calculeze modul.
90-120
120-15
150 -
45
15
Numr muncitori
Ni
25
50
60
45
15
5
200
Xi
F(ci)
15
45
75
105
135
165
25
75
135
180
195
200
12015
15
150 5
10. Distribuia unui eantion de firme dup cifra de afaceri lunar, X, n mil
lei, n anul 2004, este prezentat astfel*:
Xi-1; Xi
176-178
178-180
180-182
182-184
184-186
186-188
Total
ni
20
25
40
35
30
10
160
82
176-178
178-180
180-182
182-184
184-186
186-188
ni
20
25
40
35
30
10
83
18. Distribuia unui eantion de firme dup cifra de afaceri lunar, X, n mil. lei,
n anul 2006, este:
Interval 176-178 178-180 180-182 182-184
ni
20
25
40
35
S se calculeze valoarea coeficientului de variaie.
184-186
30
186-188
10
ntrebrile i problemele cu asterix (*) sunt preluate din Jaba E, Pintilescu C, (2005).
84
( n mo n mo 1 )
Mo = xi-1 - hMo (n n ) (n n )
mo
mo 1
mo
mo 1
21.a - Casq= (q q )
2
1
m4
22. a - 2= m2
23. a - 2 = 3, = 0;
85
dx
* ni ;
27. c. boltirii.
28. a - limitele inferioare i superioare ale intervalelor extreme;
x =
i
ni
xi
Xi . n
50
250
10-20
20
15
300
20-30
10
25
250
30-40
35
175
total
85
Xi= liminf +
h
2
sau
975
xi =
86
xi 1 xi
2
x *n =
n
i
5 * 50 15 * 20 25 *10 35 * 5
250 300 250 175 975
=
85
85
85
= 11,47
milioane lei.
= 11,47 mil lei valoarea medie a volumului vnzrilor este de 11,47 mil
lei.
x
1
3. Rspuns: Mo= xinf mo hmo d d 20 5 2 6 21,25
1
2
D1=nmo-nmo-1=12-10=2 ;
D2=nmo-nmo+1 =12-6=6
n 1
2
(5 1)
2
=3 Me = 9 milioane lei.
Locul medianei este al 3-lea termen al irului (5,7,9,14,20), deci Me=9 milioane.
5. Rspuns. Pentru o serie simpl cu numr par de termini, ordonai n sens
cresctor, mediana const n calcului mediei aritmetice simple a celor 2 termeni
centrali ai seriei.
irul de date ordonate cresctor este: 10,15, 20, 22, 35, 40.
Me =
20 22
=
2
21 milioane lei.
6. Rspuns. Locme=
n 1 34 1 35
17,5
2
2
2
n 1 200 1 201
100,5
2
2
2
87
Loc me Fc me 1
Me= xinfme+hme
la
Timp
necesar
-30
30-60
60-90
90-120
120-150
150-
n me
Me=60+30
Numr
Fci
muncitori
25
50
60
45
15
5
100,5 75
60 12,75 72,75 min
60
25
75
135
180
195
200
8. Rspuns: Q1=liminfQ1+hq1*
nq1
n 1 200 1 201
LocQ1= 4 = 4 4 =50,25
50,25 25
=30+30*0,50
50
=30+15= 45
3 n 1 3 * 201
150,75
4
4
LocQ 3 Fc Q 31
nQ 3
Q3= xinfQ3+hQ3
Se calculeaz frecvena absolut cumulat cresctor. Prima frecven mai mare
ca valoarea decct locul quartilei 3 ne indic intervalul quartilic 3.
88
Q3 90 30
150,75 135
100,75
45
Interpretare: 75% din numrul total al muncitorilor consum cel mult 100,75
minute pentru realizarea unei piese.
10. Rspuns. Media = 181,75
Abaterea medie liniara = 2,42 mil lei pe ansamblul firmelor se
realizeaz o cifr de afaceri lunar care variaz n medie fa de nivelul mediu,
cu 2,42 mil lei, n sens pozitiv sau negativ.
1.
se calculeaz centrul de interval
2.
se calculeaz media
x
* ni
x xn
n
i
(q 2 q1 ) (Q3 M e ) ( M e Q1 )
=
=
(q 2 q1 ) (Q3 M e ) ( M e Q1 )
10 20
Casq= (q q ) = 10 20 = -3
2
1
Q1= Me-Q1=130-150= -20
Q2=Q3-Me= 140-130= 10
Interpretare: Valoarea obinut, Casq= -3<0 arat c distribuia considerat este
asimetric la stnga.
13. Rspuns. Coeficientul de boltire se calculeaz dup relaia:
m4
2= m2
40.000
10.000
=4
m4= 40.000
m22 = (100)2 = 10.000
m4
2
54059,44
54059,44
2
(162,6) = 26438,76 =
14. Rspuns. 2= m2 =
2,045 i arat o distribuie uor
platicurtic deoarece
2 < 3 ( curba este mai turtit dect cea normal).
89
Cas=
130 125
= 0, 417.
12
x x
n
i
ni
x n
n
i
160
29080
181,75mil.lei
160
x x
n
i
ni
Interpretare: Pentru
2 0,5 <
90
Pentru caracterizarea statistic a fenomenelor i proceselor socialeconomice de mas, cu scopul evidenierii legitilor specifice acestora se
folosesc date individuale obinute prin metode de nregistrare total sau parial.
n condiiile economico-socialesocio-economice actuale, din nevoia de
informaii rapide, complexe, metoda principal de obinere a informaiilor
statistice este aceea a sondajului statistic.
Procesul cuprinde dou etape:
- etapa descriptiv n care se culeg date i se calculeaz indicatorii
ce caracterizeaz subcolectivitatea analizat;
- etapa inferenial n care rezultatele obinute pentru aceast
subcolectivitate,
se
extind,
termeni
probabilistici,
la
colectivitatea general.
Avantajele cercetrii prin sondaj:
- reducerea costurilor materiale i de munc;
- erorile de nregistrare sunt mai puin numeroase i mai uor de
nlturat n faza de verificare a datelor;
- programul observrilor prin sondaj cuprinde un numr mai mare de
caracteristici dect programul observrii totale, ceea ce permite
caracterizarea mai aprofundat a fenomenelor studiate prin metode
statistice;
- sondajul poate fi utilizat cu bune rezultate la verificarea
programului unei observri totale, ct i la verificarea unor ipoteze
statistice
91
N Ni
n ni
i 1
i 1
cazul n care este un indicator obinut printr-o cercetare statistic prin sondaj.
x
i 1
sau
x N
i 1
r
N
i 1
92
unde
i 1, r
i 1
sau
xn
i 1
r
i i
i 1
(x
i 1
sau
(x
i 1
)2 Ni
r
i 1
Dispersia eantionului:
r
s2
( x x)
i 1
sau
s
2
n 1
( x x)
i 1
ni
n 1
i 1
Observaie:
Rezolvarea problemelor cuprinse n planul de sondaj are drept scop asigurarea
reprezentativitii eantionului, de aceasta depinznd n totalitate valoarea rezultatelor
obinute n urma cercetrii.
Dac un numr este zero sau mai mare de N, el este eliminat, deoarece nu exist
o unitate corespunztoare n colectivitatea general care s fie selectat. Citirea
continu pn cnd se selecteaz n uniti statistice.
Exemplu:
S alegem un eantion aleator de n = 7 uniti dintr-o colectivitate de
38 uniti, ncepnd cu rndul 10, coloana 2 din tabelul cu numere aleatoare.
Numerele citite din tabel vor fi:
7730, 8330, 5928, 7333, 4707, 6007, 4538,
8210, 7319, 4119, 7062, 4346, 0613, 2238.
Cum N = 38 are dou cifre, se rearanjeaz secvena citit n grupuri de cte
dou cifre astfel:
77, 30, 83, 30, 59, 28, 73, 33, 47, 7, 60, 7, 45, 38,
82, 10, 73, 19, 41, 19, 70, 62, 43, 46, 6, 13, 22, 38.
Se elimin numerele mai mari de 38:
30, 30, 28, 33, 7, 7, 38, 38, 10, 19, 19, 6, 13, 22.
Dac selecia este fr revenire se elimin numerele care reapar n list:
30, 7, 38, 19.
1
N (i 1)
. Numrul de
Este foarte eficient atunci cnd, la nivelul populaiei int exist mai
multe straturi, astfel putndu-se reproduce ponderea fiecrui strat n eantonul
final.
Exemplu: Dac dorim s studiem consumul mediu de alcool din
judeul X, a crui populaie este de 100.000 de persoane, atunci ne intereseaz o
stratificare n funcie de variabilele gen i mediu de provenien.
V.3. Probleme
s = 3 ani
Pentru un = 0,05, valoarea erorii limit de selecie este:
a) 0,3
b) 0,588
c) 30
6. Pentru un sondaj aleator simplu nerepetat, realizat asupra unui eantion de
volum n=25, extras dintr-o populaie de volum N=1000, s-au obinut:
x
= 40 ani;
s=22 ani;
ntrebrile i problemele cu asterix (*) sunt preluate din Jaba E, Pintilescu C, (2005).
99
1,96 2 * 21
20,17 persoane
22
n=
400 * 2
1,96
* 100
384 * 400
400 * 4 386
153600
1984
77,45 persoane.
s
n
22
100
N n
N
1000 100
2,0856
1000
x z
s
2
3
5 1,96
4,804;5,196
n
900
100
x z
s
2
6. Rspuns b) =
1,96
s
n
3
100
0,588
N n
22
100
1000 100
2,0856
1000
101
102
109
aceast
afirmaie
rezult
din
proprietile
abaterii
110
Mihaela Rus
Mihaela Sandu
112
Mihaela Rus
Mihaela Sandu
113
Mihaela Rus
VII.
Mihaela Sandu
114
Mihaela Rus
Mihaela Sandu
115
Mihaela Rus
Mihaela Sandu
Mihaela Rus
Mihaela Sandu
117
Mihaela Rus
Mihaela Sandu
118
Mihaela Rus
Mihaela Sandu
119
Mihaela Rus
Mihaela Sandu
ntrebrile i problemele cu asterix (*) sunt preluate din Jaba E, Pintilescu C, (2005).
120
Mihaela Rus
Mihaela Sandu
VIII.
_________________________________________________________________________________________________________________
Prelucrarea datelor;
Formularea concluziilor.
Mihaela Rus
Mihaela Sandu
Mihaela Rus
Mihaela Sandu
condiiile
care,
cu
mare
probabilitate,
se
Mihaela Rus
Mihaela Sandu
din 20 de cazuri);
cu p sau
Observaie: Pragul de semnificaie permite respingerea ipotezei nule
atunci cnd exist valori mai mici dect p (p < 0,05).
124
Mihaela Rus
Mihaela Sandu
Mihaela Rus
Mihaela Sandu
Mihaela Rus
Mihaela Sandu
127
Mihaela Rus
Mihaela Sandu
datelor;
4.
Efectuarea
observaiilor;
5.
Formularea
Mihaela Rus
Mihaela Sandu
a. respingerea ipotezei nule atunci cnd exist valori mai mici dect p;
b. respingerea ipotezei nule atunci cnd exist valori mai mari dect p;
c. acceptarea ipotezei nule.
4. Eroarea de tip I corespunde:
a. pragului de semnificaie 0,05;
b. pragului de semnificaie 0,01;
c. niciunuia dintre ele.
5. Eroare de tip II corespunde:
a. pragului de semnificaie 0,05;
b. pragului de semnificaie 0,01;
c. niciunuia dintre ele.
1. a. 1, 6, 2, 4, 3, 5.
2. a. sunt formulate n urma unui cumul de observaii i n urma unui
studiu metaanalitic;
3. a. respingerea ipotezei nule atunci cnd exist valori mai mici dect
p;
4. a. pragului de semnificaie 0,05;
5. b. pragului de semnificaie 0,01;
129
Mihaela Rus
Mihaela Sandu
PARTEA A DOUA
- ASPECTE TEORETICE I PRACTICE ALE
PROGRAMULUI STATISTIC SPSS -
130
Mihaela Rus
Mihaela Sandu
INTRODUCERE
_________________________________________________________________________________________________________________
131
Mihaela Rus
Mihaela Sandu
I.
_________________________________________________________________________________________________________________
132
Mihaela Rus
Mihaela Sandu
Pasul 2:
Aceast fereastr va aprea
dup cteva momente i se
pot alege oricare dintre
opiunile din fereastr.
(Fereastra se numete Data Editor.
Fereastra de editare (Data Editor) se deschide
implicit la lansarea SPSS i este folosit
pentru introducerea, modificarea sau tergerea
datelor n format spreadsheet. ntr-o fereastr
de editare poate fi prezentat coninutul unui
fiier de date care a fost selectat dintr-o
list de fiiere creat anterior (n SPSS, Excel,
Statistica etc.) sau poate fi creat o nou foaie
de lucru. Aceast fereastr recunoate fiierele de date care au extensia implicit .sav.
n fereastra Data Editor sunt afiate datele de lucru. Acestea sunt aranjate n format tabel
(spreadsheet), care conine coloane i linii. La intersecia acestora sunt celulele (casetele,
csuele) n care se introduc datele. La un moment dat este activ (curent) o singur celul,
cea n care este plasat cursorul. Celula curent este scoas n eviden printr-un chenar
ngroat. Trecerea de la o celul la alta se realizeaz prin clic de mouse n noua celul sau de
la tastatur cu ajutorul tastelor de control (taste sgei, Page Up, Page Down).
Pasul 4:
Pentru a introduce date in SPSS
133
Mihaela Rus
Mihaela Sandu
Pasul 5:
Se introduce un numr folosind tastatura
calculatorului. La apsarea tastei Enter
sau la selectarea cu mouse-ul a unei alte
celule numrul va fi introdus n foaia de
lucru la fel cum este artat n figur.
Valoarea 5 este nregistrarea pentru primul
rnd (primul caz) al variabilei VAR00001.
Se observ c aceast variabil a primit automat un nume standard. Pentru
a efectua schimbarea se d clic pe numele variabilei.
134
Mihaela Rus
Mihaela Sandu
Pasul 6:
Corectarea erorilor se face folosind mouse-ul:
se selecteaz celula unde este eroarea i se
introduce valoarea corect.
Atunci cnd este apsat tasta Enter
sau se deplaseaz cursorul pe o alt celul,
valoarea corectat va fi introdus.
I.3. Salvarea datelor.
Pasul 7:
Selectnd File Save As datele se vor
salva sub forma unui fiier. Fiierul salvat
va primi automat de la SPSS extensia .sav.
* Se recomand folosirea unor nume
de fiiere distincte (ex. date1) pentru
a face coninutul lor ct mai clar. Salvarea
datelor este recomandat s se fac ntr-un fiier
diferit de cel al SPSS-ului.
Pasul 8:
Pentru a alege locaia unde va fi salvat
fiierul de date, se alege calea n mediul
Save In (se folosete sgeata pentru a
ajunge la locaia dorit).
O baz de date aflat n lucru nu are un
corespondent ntr-un fiier dect dup ce se execut
o salvare a acesteia, deoarece, programul nu are
o funcie de salvare automat dup un interval de
timp prestabilit (Popa, 2008, p. 250).
Salvarea unui fiier se realizeaz prin pictograma
Save din bara de instrumente Standard sau cu
ajutorul comenzilor Save sau Save As i meniul
File. Aceste comenzi deschid fereastra Save Data As n care se pot stabili: numele fiierului
(File name); tipul fiierului (Save as type); locaia n care s aib loc salvarea (Save In).
135
Mihaela Rus
Mihaela Sandu
Aici se modific
limea coloanei.
Aici se modific
numrul de zecimale.
Pasul 11:
La versiunea SPSS 19 nu exist
limit pentru lungimea numrului
unei variabile.
Se selecteaz o celul din coloana
Name i se scrie un nume diferit
de variabil. Celelalte variabile vor
primi valori care vor fi implicit
schimbate ulterior.
Acesta este numrul de zecimale care va aprea pe ecran.
136
Mihaela Rus
Mihaela Sandu
*La editarea unei variabile trebuie s se in cont de urmtoarele restricii: numele variabilei
s fie unic, primul caracter s fie o liter, sa nu conin simboluri speciale folosite n SPSS sau
spaii.
Semnificaia coloanelor din figura de la Pasul 10.
Numrul cazlui identific poziia cazului n baza de date;
Name numele variabilelor;
Type tipul variabilelor;
Width numrul total de digii;
Decimals numrul de digii pentur partea zecimal;
Label etichetarea variabilelor;
Values valorile pe care le poate lua variabila;
Missing valorile lips;
Columns limea coloanei din Data editor;
Align alinierea valorilor n coloan.
Pasul 12:
Apare acest buton:
se d clic pe el.
Pasul 13:
Va aprea aceast fereastr. n
continuare se vor urmri paii
care vor arta cum genul biologic
masculin i feminin este introdus
folosind codul 1 (masculin)
respectiv 2 (feminin).
Pasul 14:
Se scrie 1 n dreptul
cmpului value
i masculin n dreptul
cmpului value Label.
Apoi se apas Add
137
Mihaela Rus
Mihaela Sandu
Pasul 15:
Aceasta operaie de adugare
transfer informaia n cmpul
aflat dedesubt.
* La fel se procedeaz i pentru
introducerea celeilalte variabile
(Ex. 2 - feminin).
* Cele mai frecvent utilizate ferestre in SPSS sunt data Editor, Syntax Editor i Output
Viewer, Pivot Table (Pivot Table Editor), Chart Editor.
Fereastra de sintax (Syntax Editor) este folosit pentru a genera programe de comenzi
pe care le vom executa asupra datelor (exemplu: calculul unor noi variabile). Opiunile
selectate n casetele de dialog sunt afiate n fereastra de sintax sub form de comenzi.
Aceste ferestre i sunt specifice fiierele de tip .sps.
Fereastra de rezultate (Output Viewer) devine disponibil automat dup ce a fost
efectuat o comand de analiz a datelor. n aceast fereastr, sunt afiate rezultatele statistice,
tabele i grafice care au asociate ferestre distincte. Fereastra de editare a rezultatelor (Text
Output Editor) este folosit pentru modificarea textului rezultat, care nu a fost afiat n tabele
pivot.
* Fereastra de rezultate (Output Viewer) devine disponibil automat dup ce a fost efectuat o
comand de analiz a datelor. n aceast fereastr, sunt afiate rezultatele statistice, tabele i
grafice care au asociate ferestre distincte. Fereastra de editare a rezultatelor (Text Output
Editor) este folosit pentru modificarea textului rezultat, care nu a fost afiat n tabele pivot.
Toate rezultatele obinute din analizele statistice sunt afiate n fereastra Output Viewer.
Aceast fereastr se aseamn cu fereastra Windows Explorer i se deschide doar dac s-au
lansat comenzi din meniurile Statistics sau Graphs.
Fereastra Output Wiewer este structurat n dou cadre/zone. Cadrul din stnga
(cuprinsul/structura) prezint, sub forma unei schie, obiectele coninute n fereastr.
Elementele din schi se refer la titlu, note i denumirea rezultatelor statistice propriu-zise.
Fereastra Pivot Table (Pivot Table Editor) ofer multiple posibiliti de modificare a
tabelelor pivot: editare text, schimbarea datelor din rnduri i coloane, adugarea de culori,
crearea unor tabele multidimensionale, ascunderea sau afiarea selectiv a rezultatelor.
Fereastra de editare a graficelor (Chart Editor) permite modificarea elementelor unui
grafic (axe, scale, diagram, legend etc.)
I.5.
Pasul 16:
Pentru a calcula media de
vrst se urmresc urmtoarele
etape:
-se d clic pe Analyze;
-Se selecteaz Descriptive
statistics;
-Se selecteaz Descriptive
138
Mihaela Rus
Mihaela Sandu
Pasul 17:
Se selecteaz atenie.
Se apas butonul pentru a
muta atentie n csua
Variable(s) cu ajutorul sgeii.
Se d clic pe OK.
Pasul 18:
Fereastra Data Editor este nlocuit de output-ul SPSS-ului. Acest tabel
apare pentru analiza realizat anterior.
139
Mihaela Rus
Mihaela Sandu
Tipurile de variabile.
Variabilele pot fi clasificate ca fiind de dou tipuri:
Scoruri: Vorbim despre scoruri atunci cnd o valoarea numeric este atribuit
unei variabile, pentru fiecare caz n parte din eantion. Aceast valoare indic
cantitatea sau valoarea caracteristicii (variabilei) n cauz.
Exemplul. Vrsta, nlimea, greutatea sunt variabile numerice deoarece
valoarea scor indic o cantitate n cretere a variabilei respective.
Variabile nominale sau categoriale: Sunt variabile care se msoar
clasificnd cazurile n unul sau mai multe categorii.
Exemplul 1: Genul biologic are dou categorii: masculin i feminin
*Este foarte important s se hotrasc pentru fiecare variabil n parte dac este
variabil nominal (categorial) sau variabil cantitativ.
Definirea atributelor unei variabile este prima operaie din procesul de pregtire a
setului de date. Definirea presupune precizarea atributelor unei variabile: numele variabilei,
tipul, lungimea (numrul de caractere), numrul de zecimale (pentru cele numerice), eticheta,
valorile etichetei, valorile lips, alinierea i modalitile de msurare a variabilei. Variabilele
se definesc n coloanele foii Variabile View din fereastra Data Editor.
Tipul variabilei variabilele pot fi de mai multe tipuri: numerice (Numeric, Coma, Dot,
Scientific notation), alfanumerice (String), date calendaristice, simbol monetar.
*O sesiune de lucru n SPSS presupune, obligatoriu, existena unei baze de date
(ncepnd cu versiunea 14, SPSS poate deschide simultan mai multe baze de date).
140
Mihaela Rus
Mihaela Sandu
141
Mihaela Rus
Mihaela Sandu
142
Mihaela Rus
Mihaela Sandu
143
Mihaela Rus
Mihaela Sandu
Pasul 2:
Se selecteaz:
Analize,
Descriptive Statistics
Frequencies
144
Mihaela Rus
Mihaela Sandu
Pasul 3:
Se selecteaz specializare i se mut
n partea dreapt a tabelului
(procedeul a fost descris la pasul 17
din capitolul I).
Se apas OK
Pasul 4:
1. Prima coloan a tabelului conine eticheta celor 4 categorii de specializri.
Pasul 1:
Se selecteaz:
Graphs
Legacy dialogs
Pie.
145
Mihaela Rus
Pasul 2:
Se selecteaz Define.
Pasul 3:
Se selecteaz specializarea
i se transfer prin apsarea
butonului () n rubrica
define slices by.
Se apas OK.
Diagrama Pie este un cerc divizat
n sectoare. Fiecare sector de cerc
reprezint o categorie, aria
acestuia fiind proporional cu
numrul de cazuri din aceast
categorie a variabilei nominale.
Pasul 4:
Acesta este felul n care apare o diagram
circular folosind opiunile din SPSS.
Sectoarele din cerc sunt codate cu diferite culori.
* Caracteristicile din aceast diagram pot fi modificate
cu Chart Editor.
146
Mihaela Sandu
Mihaela Rus
Mihaela Sandu
Pasul 2:
Se selecteaz Count i
X-ul rou pentru a nu afia.
Se selecteaz specializare i sgeata
Verde curbat n sus pentru a afia
denumirile specializrilor.
Se procedeaz asemntor pentru
Procent pentru a afia procentajul
fiecrei specializri n parte.
Se selecteaz Apply i Close.
147
Mihaela Rus
Mihaela Sandu
Pasul 3:
Pentru a nltura legenda,
se selecteaz Options
i Hide Legend.
Se selecteaz:
Graphs
Legacy dialogs
Bar.
148
Mihaela Rus
Mihaela Sandu
Pasul 2:
Selectai Define.
Simple este preselectat.
*Selectare unei alte variante se face prin
clic cu mouse-ul pe varianta respectiv.
Pasul 3:
Se selecteaz ocupaia i se apas
butonul de lng Category
Axis pentru a introduce acolo
specializarea.
Se selecteaz % of cases.
Se apas OK
Diagrama cu bare.
149
Mihaela Rus
Mihaela Sandu
* Diagrama cu bare este folosit pentru a reprezenta grafic mediile diferitelor grupe dintr-o
colectivitate (Summaries for groups of cases) sau valorile medii ale diferitelor variabile pentru
aceeai colectivitate (Summaries of separate variables).
Diagrama Bar este folosit pentru a ilustra categoriile unei distribuii n form convenabil.
Diagrama prezint attea bare cte categorii are o variabil. Barele au aceeai baz, egal cu
unitatea, iar nlimea proporional cu frecvena categoriei astfel nct aria fiecrei bare
reprezint numrul cazurilor categoriei considerate.
Pentru a fi interpretat un grafic trebuie s conin urmtoarele elementele:
- titlul graficului ofer informaii asupra fenomenului reprezentat (Titlul graficului
coincide cu titlul tabelului de date);
axele de coordonate sunt folosite pentru a reprezenta variabilele. Pe abscis se
nscrie variabila de distribuie, iar pe ordonat frecvena.
legenda este folosit pentru a explica elementele din diagram;
sursa precizeaz originea datelor reprezentate.
II.5. Histograme.
Pentru a ilustra procesul de realizare a unei histograme vom folosi datele
obinute din rspunsurile subiecilor la ntrebarea V place statistica?.
(rspunsuri: a. foarte mult; b. mult; c. puin d. foarte puin; e. deloc).
Pasul 1:
Se introduc datele n Data Editor
(aa cum a fost prezentat la
nceputul capitolului).
Se selecteaz:
Graphs
Legacy Dialog
Hitogram
Pasul 2:
Se selecteaz ntrebarea V place
statistica? i se apas butonul de
lng Variable pentru a duce ntrebarea
n csua din dreapta.
Se apas OK.
Histograma
150
Mihaela Rus
Mihaela Sandu
151
Mihaela Rus
Mihaela Sandu
II.6. Exerciii
152
Mihaela Rus
Mihaela Sandu
153
Mihaela Rus
Mihaela Sandu
154
Mihaela Rus
Mihaela Sandu
155
Mihaela Rus
Mihaela Sandu
Pasul 2:
Pasul 3:
n Data View
din Data Editor
se introduc vrstele
n prima coloan.
Se selecteaz Analize
Descriptives statistics i
Frequencies...
156
Mihaela Rus
Mihaela Sandu
Pasul 4:
Se selecteaz vrsta
i butonul pentru a
introduce n lista de
variabile.
Se deselecteaz
butonul Display frequencys tables
i se ignor mesajul de avertizare.
Se d clic pe Statistics
Pasul 5:
Se selecteaz
Mean;
Median;
Mode.
Se d clic pe Continue.
Se apas OK din ecranul anterior,
care reapare.
157
Mihaela Rus
Mihaela Sandu
158
Mihaela Rus
Mihaela Sandu
159
Mihaela Rus
Mihaela Sandu
Mihaela Rus
Mihaela Sandu
_________________________________________________________________________________________________________________
161
Mihaela Rus
Pasul 2:
n Data View
din Data Editor
se introduc
scorurile obinute
la Atenie n
prima coloan.
Pasul 3:
Se selecteaz
Analyze,
Descriptives
Statistics i
Frequencies
Pasul 4:
Se selecteaz
atenie i apoi
se apas butonul
pentru a
introduce n lista
de variabile.
Se apas OK.
162
Mihaela Sandu
Mihaela Rus
Mihaela Sandu
Cumulative
atentie
Frequency
Valid
Percent
Valid Percent
Percent
56
10,0
10,0
10,0
57
10,0
10,0
20,0
58
20,0
20,0
40,0
64
10,0
10,0
50,0
65
20,0
20,0
70,0
66
10,0
10,0
80,0
A treia coloan
69
2
20,0
20,0
100,0
exprim aceste
Total
10
100,0
100,0
frecvene ca
un procent al numrului total A patra coloan
A cincea coloan
incluznd i datele care
exprim aceste frecvene
cumuleaz aceste
lipsesc.
ca un procent al numrului procentaje n josul
Exemplu: Din totalul cazurilor, total excluznd datele lips. tabelului.
10% au obinut scorul 56.
IV.3. Histograme.
Histograma este un grafic, folosit n statistica descriptiv i arat o distribuie de
frecven. Distribuia de frecven se refer la numrul de evenimente statistice pe clase
(grupe) de evenimente. Pentru o serie de date statistice cu o distribuie de frecven dup o
variabil numeric continu (sau continu pe poriuni), reprezentrile grafice care ne permit s
vizualizm distribuia de frecvene sunt histograma i poligonul frecvenelor.
163
Mihaela Rus
Mihaela Sandu
IV.5. Modalitatea.
O distribuie normal (figura 1)
Frecvena de apariie
mod
bimodale,
determin
trimodale,
distribuii
n
general
O
nlimea subiecilor.
2),
deoarece
observm
164
Mihaela Rus
Mihaela Sandu
Figura nr. 2.
IV.6. Simetria.
O
distribuie
este
Figura nr. 3
spre dreapta (sau distribuie skewness pozitiv). Cnd rezultatele tind ctre valori
mari, se aglomereaz n partea dreapt a distribuiei, vorbim despre o distribuie
asimetric la stnga (skewness negativ). Iat c, asimetria este dat de panta
distribuiei i nu de vrful acesteia, aa cum trateaz i consider unii.
n figura nr. 3, distribuia B este o distribuie simetric. Distribuia A
este o distribuie asimetric la dreapta (skewness pozitiv) unde predomin
scorurile sczute (mici), n timp ce distribuia C este o distribuie asimetric la
stnga (skewness negativ) n care predomin scorurile mari.
Nu ne putem limita la o apreciere pur vizual a simetriei; acest lucru necesit
demonstrarea statistic a simetriei sau asimetriei distribuiei. n acest scop, exist mai muli
coeficieni care pot fi calculai.
165
Mihaela Rus
Mihaela Sandu
punct,
la
mijlocul
Figura nr. 4
mai mici dect media este perfect simetric cu grupa subiecilor cu scoruri mai
mari dect media. Acest aspect este menionat din raiuni teoretice. n practic
nu vom ntlni o distribuie perfect normal, ci o distribuie care poate fi
acceptat ca fiind normal.
ntr-o distribuie asimetric la dreapta (distribuie skewness pozitiv,
vezi figura alturat), predomin
scorurile mici.
n acest caz,
care
mparte
irul
Figura nr. 5
iar dac n distribuie predomin scorurile mici, atunci scorurile mari sunt
considerate ca scoruri extreme. tim de la analiza preciziei indicatorilor
tendinei centrale, c ntr-o serie de date n care ntlnim scoruri extreme mari,
media tinde s le pun n valoare. Iat c acest fapt este ilustrat grafic n figura
166
Mihaela Rus
Mihaela Sandu
care
mparte
irul
Figura nr. 6
iar dac n distribuie predomin scorurile mari, atunci scorurile mici sunt
considerate ca scoruri extreme. tim, de la analiza preciziei indicatorilor
tendinei centrale, c ntr-o serie de date n care ntlnim scoruri extreme mici,
media tinde s le pun n valoare. Iat c acest fapt este ilustrat grafic n figura
de mai sus. Observai relaia existent ntr-o asemenea distribuie: Mo>Me>m.
Aceast relaie este relaia caracteristic a unei distribuii asimetrice negativ.
167
Mihaela Rus
Mihaela Sandu
168
Mihaela Rus
Mihaela Sandu
169
Mihaela Rus
Mihaela Sandu
1.
a.
b.
c.
Histograma:
este un grafic folosit n statistica descriptiv;
arat o distribuie de frecven;
se folosete pentru date calitative.
2. Valid procent:
a. exprim aceste frecvene ca un procent al numrului total excluznd
datele lips.
b. frecvene ca un procent al numrului total lipsesc incluznd i datele care
lipsesc.
c. frecvena valorilor.
3.
a.
b.
c.
4.
a.
b.
c.
5.
a.
b.
c.
6.
a.
b.
c.
170
Mihaela Rus
Mihaela Sandu
Mihaela Rus
Mihaela Sandu
5. a. unimodal;
b. bimodal;
c. trimodal.
6. b. media = mediana = modul;
7. b. modul <mediana<media;
8. c. modul>mediana>modul.
9. f. toate variantele de mai sus.
10. a. datele sunt foarte grupate i apropiate de median iar lotul de subieci
are un grad mare de omogenitate;
11. b. datele sunt foarte mprtiate de median iar lotul de subieci are un
grad mare de eterogenitate;
172
Mihaela Rus
Mihaela Sandu
V. Abaterea standard.
________________________________________________________________________________________________________________
22
25
26
35
Pasul 2:
n Data View din Data Editor
se introduc vrstele n prima
coloan.
Pasul 3:
Se selecteaz:
Analyze
Descriptive Statistics
Descriptives
173
38
28
24
23
24
Mihaela Rus
Mihaela Sandu
Pasul 4:
Se selecteaz vrsta i apoi se
apasnbutonul pentru a o i
ntroduce n lista de variabile.
Se selecteaz Options
Pasul 5:
Se deselecteaz Mean,
Minimum, Maximum.
Se selecteaz Continue.
Se selecteaz OK din
ecranul precedent care
reapare.
V. 2. Interpretarea output-ului.
V.3. Scorurile Z
Pasul 1:
La pasul 4 selectai Save
standardized values as variables.
174
Std. Deviation
varsta
10
Valid N (listwise)
10
5,740
Mihaela Rus
Mihaela Sandu
Se apas OK.
Pasul 2:
Scorurile Z sau standard
sunt n a doua coloan din
Data View n Data Editor
i sunt numite ZVrst.
Mihaela Rus
Mihaela Sandu
constant din fiecare scor particular. Deoarece din formul rezult aceast
diferen (se scade fiecare scor particular din medie), n final media va
ajunge la valoarea zero
Abaterea standard a unei distribuii z este ntotdeauna 1. i aceast
afirmaie rezult din proprietile abaterii standard. tim c dac mprim
abaterea standard cu o constant, valoarea acesteia se divide corespunztor.
Din formul, observm c acea constant cu la care mprim este chiar
abaterea standard iar mprirea a dou numere egale are ca rezultat 1
Notele z sunt note direct calculabile, utilizndu-se media i abaterea
standard i reprezint temelia oricrui proces de standardizare. Totui,
principalul dezavantaj al notelor z este acela c sunt puin intuitive. Trebuie s
tim bine ce nseamn distribuia normal pentru a nelege corect semnificaia
acestor note. n plus, au valori pozitive i negative, ceea ce le face, iari, greu
de utilizat.
Mihaela Rus
Mihaela Sandu
1. Abaterea standard:
a. este un indice care arat ct de mult deviaz (difer) unele scoruri n
medie fa de media setului de scoruri din care acestea fac parte.
b. este un indice care arat ct de simetric sau asimetric este o
distribuie;
c. este un indice care arat ct de turtit sau boltit este o distribuie.
2. Media este o mrime generalizat , adic, nlocuind fiecare nivel
individual al caracteristicii de distribuie cu nivelul mediu:
a) suma seriei rmne aceeai
b) suma termenilor seriei se modific
c) suma termenilor seriei este nul.
3. Media aritmetic reprezint:
a) valoarea pe care ar purta-o fiecare unitate statistic dac distribuia ar
fi eterogen
b) valoarea pe care ar purta-o fiecare unitate statistic dac distribuia ar
fi omogen
c) valoarea pe care ar purta-o fiecare variabil statistic dac distribuia
ar fi omogen.
4. Media aritmetic, ca indicator fundamental al tendinei centrale:
e) reprezint valoarea care modific nivelul totalizator;
f) se folosete cel mai frecvent i reprezint suma valorilor raportat la
numrul lor;
g) se calculeaz adunnd valorile existente;
h) nu poate determina numrul de uniti din colectivitate.
177
Mihaela Rus
Mihaela Sandu
178
Mihaela Rus
Mihaela Sandu
n foarte multe cercetri se studiaz relaiile dintre dou sau mai multe
variabile. Procedurile statistice univariate (cu o singura variabil) care au fost
descrise pn acum pot fi utilizate pentru analiza oricror date. Dar, cercetarea
poate necesita ca relaiile i corelaiile dintre diferitele variabile s fie studiate.
La fel ca statistica univariat, statistica bivariat a datelor necesit
studierea tendinelor fundamentale ale datelor utiliznd tabele i diagrame.
Modelele de prezentare a relaiilor bivariate includ crearea tabelelor scatter.
O condiie esenial o constituie etichetarea tabelelor i diagramelor i
denumirea acestora.
n continuare se va ilustra elaborarea unui tabel de asociere i a unei
diagrame cu bare.
179
Mihaela Rus
Mihaela Sandu
Pasul 2:
Se eticheteaz cele dou valori
ale instituionalizrii:
1 - instituionalizat;
2 - neinstituionalizat.
i genul biologic:
1. Feminin;
2. Masculin
*Paii acestei proceduri au fost explicai n capitolul 1.
Pasul 3:
Se introduc aceste numere n Data
View din Data Editor.
Primul rnd se refer la fetele care
au fost instituionalizate: sunt n numr
de 5.
Al doilea rnd se refer la bieii
care au fost instituionalizai:
sunt n numr de 6.
Al treilea rnd se refer la fetele neinstituionalizate: sunt n numr de 4.
Al patrulea rnd se refer la bieii
neinstituionalizai: sunt n numr de 5.
180
Mihaela Rus
Mihaela Sandu
181
Mihaela Rus
Mihaela Sandu
182
Mihaela Rus
Mihaela Sandu
Ocorelaiede1,00indicoasociereperfectntreceledouvariabile.
Cu alte cuvinte, o diagram scatter a celor dou variabile va arta c toate
punctelesuntconinutedeosingurdreapt.Ovaloarede0,00indicfaptulc
toate punctele din diagrama scatter sunt dispersate aleatoriu n jurul oricrei
dreptedesenatepeaceastdiagramadatelorsausuntaranjatentromanier
curbilinie.
Coeficieni de corelaie neparametrici
- Se utilizeaz atunci cnd una dintre variabilele folosite nu ndeplinete condiiile unei
distribuii normale. Dup Opariuc (2011), datele care se afl la un nivel de interval sau
de raport, pot fi convertite uor n ranguri sau n frecvene (la nivel ordinal sau
nominal) dar aceast situaie nu este posibil i n sens invers.
n cazul corelaiei exist trei elemente eseniale n interpretarea unui coeficient de
corelaie: sensul, valoarea i semnificaia. (Opariuc, 2011, p. 102). O corelaie pozitiv
semnific faptul c, cele dou variabile evolueaz n aceai direcie n timp ce o corelaie
negativ indic faptul c, n timp ce o variabil crete, cealalt variabil scade.
ncontinuarevomilustracalcululcorelaieiPearson,odiagramscatter
icoeficientuldecorelaieSpearman,folosindpentruaceastadateledintabelul
urmtor,carereprezintscorurialeabilitilormuzicaleimatematicepentru10
copii.
muzica
3
matematic 7
7
5
8
4
9
4
9
5
6
8
4
9
3
9
4
7
7
6
Pasul2:
nDataViewdinDataeditor
seintroducdatelepentru:
183
Mihaela Rus
Mihaela Sandu
- muzicnprimacoloan;
- matematicnadouacoloan.
Pasul2:
SeselecteazMuzici
Matematiciapoiseapas
butonulpentrualeintroduce
nlistadevariabileaacumeste
artatnfiguradindreapta.
SeapasOK.
Mihaela Rus
Mihaela Sandu
185
Mihaela Rus
Mihaela Sandu
Pasul1:
Identic corelaiei Pearson se
selecteaz Analyze, Correlate,
Bivariate i variabilele care se
doresc pentru corelaie.
Se selecteaz Spearman i se
deselecteaz Pearson (dac nu se
dorete ca i corelaie).
Se apas OK.
*Testul de corelaie a rangurilor, Spearman, este echivalentul pentru date ordinale al testului
de corelaie Pearson.
186
Mihaela Rus
Mihaela Sandu
Pasul 3:
187
Mihaela Rus
Mihaela Sandu
188
Mihaela Rus
Mihaela Sandu
1. Corelaia:
a. msoar variaia concomitent a doi factori
b. msoar parametria distribuiei ntre dou eantioane
c. msoar rangul unei distribuii trihotomice
2.CorelaiaPearson(r):
a. evalueazgraduldeasocieredintredouvariabilemsuratepescalde
interval/raport.
b. evalueaz gradul de asociere dintre dou variabile msurate pe scal
nominal;
c. evalueaz gradul de asociere dintre dou variabile msurate pe scal
ordinal.
3. Ocorelaiede1,00indic:
a. oasociereperfectntreceledouvariabile;
b. faptulctoatepuncteledindiagramascattersuntdispersatealeatoriun
juruloricreidreptedesenatepeaceastdiagramadatelor;
c. absenaoricreilegturi(corelaii)dintrevariabile.
4.
a.
b.
c.
Pearsonesteunindicatordecorelaie:
parametric;
neparametric;
ambelevariantedemaisus.
Mihaela Rus
Mihaela Sandu
b.neparametric;
c.ambelevariantedemaisus.
6. O corelaienegativsemnificfaptulc:
a. ntimpcescorurileuneivariabilecresc,scorurilepentrucealaltvariabil
descresc;
b. c scorurile unei variabile se mresc odat cu creterea scorurilor
celeilaltevariabile).
c. nuexistniciolegturntrevariabile.
O corelaiepozitivsemnificfaptulc:
a.
ntimpcescorurileuneivariabilecresc,scorurilepentrucealalt
variabildescresc;
b.
cscorurileuneivariabilesemrescodatcucretereascorurilor
celeilaltevariabile).
c.
nuexistniciolegturntrevariabile.
7.
190
Mihaela Rus
Mihaela Sandu
191
Mihaela Rus
Mihaela Sandu
VIII. Regresia.
Predicia cu precizie.
_________________________________________________________________________________________________________________
Dac exist o relaie ntre dou variabile atunci sunt posibile estimarea
sau predicia scorului unei persoane la o variabil pornind de la scorul obinut la
cealalt variabil. Cu ct este mai puternic corelaia cu att este mai bun
predicia. Variabila independent este variabila folosit pentru a realiza predicia,
aceasta fiind cunoscut i ca variabil predictor sau variabila X.
*Este foarte important a nu se confunda variabila independent cu cea dependent. Cel
mai bun mod de a evita aceste probleme este de a examina scatterplot-ul sau diagrama scatter
a relaiei dintre cele dou variabile. Axa orizontal X este variabila independent i axa
verticala Y este variabila dependent. Se poate investiga i punctul de tiere, acesta fiind
punctul n care panta se intersecteaz cu axa vertical.
Regresia devine o tehnic mult mai important atunci cnd sunt folosite
mai multe variabile pentru predicia valorilor unei alte variabile.
n continuare este ilustrat procesarea unei regresii simple i a unei
diagrame de regresie folosind datele din tabelul urmtor.
Scormuzica
Scor
matematic
3
7
7
5
8
4
9
4
9
5
6
8
4
9
3
9
4
7
7
6
Unul din principalele capitole ale statisticii are n vedere posibilitatea de a face
predictii. Desi nu se gasesc relatii perfecte n lumea reala, prin intermediul regresiei se pot
face predictii ale unei variabile, n functie de valoarea alteia. Predictia este procesul de
estimare a valorii unei variabile cunoscnd valoarea unei alte variabile.
Regresia se leaga foarte mult de conceptul de corelatie. O asociere puternica ntre
doua elemente conduce la cresterea preciziei predictiei unei variabile pe seama alteia. Daca
am avea o corelatie perfecta (+1 sau 1) estimarea ar fi extrem de precisa
192
Mihaela Rus
Mihaela Sandu
ialdoilearndmatematic.*Senlturceledouzecimale.
Pasul2:
nDataViewdinDataeditorse
introducdatelepentru:
- muzicnprimacoloan;
- matematicnadouacoloan.
Pasul 2:
Se selecteaz Muzic i apoi
se apas butonul de lng
eticheta Dependent, pentru a
introduce aceast variabil n
csua variabilei dependente.
Se selecteaz matematica
i apoi se apas butonul de
lng eticheta Independent(s)
pentru a introduce aceast
variabil n csua variabilei
(lor) independente.
Se selecteaz Statistics
Pasul 3:
Se selecteaz Confidence Intervals.
Se selecteaz Continue.
Se apas OK din ecranul precedent
care reapare.
193
Mihaela Rus
Mihaela Sandu
Coeficientul nestandardizat
Coeficientul standardizat
Intervalul de
al regresiei este 1,049.
al regresiei este 0,845.
ncredere ia valori
Acesta semnific faptul c,
Acesta este mai mult sau de la -1,591 la -0,507.
pentru fiecare cretere cu 1
mai puin coeficientul de
a variabilei matematic
corelaie Pearson dintre
valoarea variabilei muzic abilitile muzicale i
descrete cu 1,049.
cele matematice.
n acest tabel, B este panta liniei de regresie (n SPSS fiind denumit
coeficient de regresie nestandardizat).
Intervalul de ncredere de 95% pentru aceti coeficieni este de la -1,59 la
-0,50. Intervalul de ncredere de 95% arat intervalul pantelor de regresie n care
putem fi siguri ntr-o proporie de 95% c panta pentru populaie se va gsi.
Cota denumit Beta are valoarea -0,845. Aceasta este de fapt corelaia
Pearson ntre cele dou variabile.
Regresia simpl - o variabila dependenta si una independent
194
Mihaela Rus
Mihaela Sandu
195
Mihaela Rus
Mihaela Sandu
Linia de regresie are o pant negativ n acest caz; de exemplu: de la stnga sus
spre dreapta jos. n consecin B are valoare negativ.
n regresie axa orizontal este variabila predictor sau independent (n
cazul nostru matematic).
* Linia de regresie oblic, de la stnga sus spre dreapta jos, indic o relaie negativ ntre cele
dou variabile.
196
Mihaela Rus
Mihaela Sandu
197
Mihaela Rus
Mihaela Sandu
Pasul 2:
Se selecteaz stima de sine i apoi
se apas butonul pentru a
introduce variabila Stima de sine
n variable(s).
Se selecteaz Options
Pasul 3:
Se selecteaz S-E mean.
Se selecteaz continue.
Se apas OK din ecranul anterior care reapare.
Mihaela Rus
X.
Mihaela Sandu
Testul t.
Compararea a dou eantioane
de scopuri corelate/relaionate.
_________________________________________________________________________________________________________________
Procesarea unui Test t este ilustrat cu datele din tabelul urmtor unde
sunt prezentate numrul de cuvinte pe care aceeai copii le-au verbalizat cu
mamele lor la 18 luni i la 24 luni.
Numrul de cuvinte verbalizate ntr-un minut la vrste diferite.
199
Mihaela Rus
18 luni
24 luni
200
Mihaela Sandu
Cristi
2
4
Dan
4
6
Mihaela Rus
Pasul 2:
n Data View din Data Editor
se introduc datele n primele dou
coloane.
201
Mihaela Sandu
Mihaela Rus
Mihaela Sandu
Al doilea tabel arat gradul n care cele dou seturi de valori sunt corelate.
Corelaia dintre ele 0,94. Aceasta este o corelaie mare, nivelul de semnificaie
fiind de 0,00.
Primele trei coloane care conin cifre sunt componentele fundamentale ale
calcului unui Test t relaionat. Media de -2,000 este de fapt diferena dintre
mediile pe 18 i 24 luni, deci n realitate este media diferenei. Valoarea lui t
este bazat pe aceast medie a diferenei (-2,00), divizat cu eroarea standard a
mediei (0,267). Calculul ofer valoarea lui t (-7,483).
202
Mihaela Rus
Mihaela Sandu
XI. Testul t.
Compararea a dou eantioane de
scoruri necorelate/nerelaionate.
_________________________________________________________________________________________________________________
Mihaela Rus
Mihaela Sandu
12
18
14
10
19
15
11
10
13
13
14
12
11
204
Mihaela Rus
Mihaela Sandu
205
Mihaela Rus
Mihaela Sandu
Primul tabel arat , pentru fiecare grup n parte, numrul de cazuri, media
i abaterea standard. Media pentru familiile biparentale este 13,00. Dup cum se
observ exist o diferen ntre cele dou tipuri de familii, dar, ntrebarea este
dac mediile difer semnificativ.
Valoarea lui t este media diferenei (3,500) divizat cu eroarea standard a
diferenei (1,493), diviziune ce produce valoarea 2,345.
206
Mihaela Rus
Mihaela Sandu
207
Mihaela Rus
Mihaela Sandu
208
Mihaela Rus
Mihaela Sandu
1. b. eantioanelor independente;
2. a. dac mediile a dou grupe sunt egale;
3. a. compararea a dou seturi de date pentru identificarea diferenelor;
4. c. se testeaz dac media unei variabile este egal cu o constant
specificat;
5. c. compar mediile pentru un singur grup observat n momente
diferite
6. c. cele dou seturi de variabile provin din dou eantioane diferite de
oameni.
7. a. cele dou seturi de scoruri ce trebuie comparate provin dintr-un
singur eantion
b. coeficientul de corelaie ntre cele dou seturi este mare
8. a. este folosit pentru evaluarea semnificaiei statistice a diferenei
dintre mediile pentru dou seturi de scoruri;
b. este potrivit atunci cnd variabila dependent este msurat pe
scalcantitativ(intervalraport).
c. este utilizat pentru a calcula dac mediile pentru dou seturi de
variabile sunt diferite semnificativ una fa de cealalt.
209
Mihaela Rus
Mihaela Sandu
Respondeni
Feminin
Masculin
Site-uri
matrimoniale
27
17
anunuri muzic
14
33
19
9
Mihaela Rus
Mihaela Sandu
Pasul 2:
Se introduc valorile adecvate n meniul
Data View din meniul Data Editor.
Fiecare rnd reprezint una dintre cele ase
celule din tabelul prezentat anterior.
Paul 3:
Pentru a pondera aceste celule
se selecteaz:
Data
Weight Cases
Pasul 4:
Se selecteaz Frecvena, Weight
cases by i apoi se apas butonul
.
Se apas OK.
211
Mihaela Rus
Pasul 2:
Se selecteaz Gen i se
apas butonul pentru
Row(s): pentru a-l
introduce n caseta respectiv.
Se selecteaz Site i se apas
butonul pentru Column(s):
pentru a-l introduce n caseta
respectiv.
Se selecteaz Statistics
Pasul 3:
Se selecteaz Chi-square.
Se selecteaz Continue.
Pasul 4:
Se selecteaz Cells..
Pasul 5:
n seciunea Counts se selecteaz
Expected. Se selecteaz
Unstandardized n seciunea
Residuals. Se selecteaze Continue,
apoi se apas OK n ecranul anterior
care reapare.
* Termenul rezidual se refer la diferene.
212
Mihaela Sandu
Mihaela Rus
Mihaela Sandu
Mihaela Rus
Mihaela Sandu
Coloana final din tabel etichetat Total conine numrul de cazuri din
respectivul rnd, urmat de numrul ateptat de cazuri din tabel.
Astfel primul rnd are 60 de cazuri, urmat de numrul ateptat de cazuri
din tabel. Astfel, primul rnd are 60 de cazuri, numr care va fi identic
numrului de cazuri ateptate (adic 60).
n mod similar, rndul final din acest tabel (etichetat Total) prezint mai
nti numrul de cazuri din respectiva coloan urmat de numrul ateptat de
cazuri din tabel pentru coloana respectiv. Astfel, prima coloan are 44 de
cazuri, numr care ca fi ntotdeauna egal cu numrul ateptat de cazuri (adic
44,0).
Valoarea chi-square, gradul su de liberate i nivelul su de semnificaie sunt
afiate n al treilea tabel care ncepe cu Pearson (cel care a elaborat acest test).
Valoarea chi-square este de 13,518, care, rotunjit la un numr cu dou
zecimale, devine 13,52. Gradul su de libertate este 2, iar probabilitatea twotailed exact este 0,001.
Sub acest tabel se mai poate vedea i mrimea minimum expected count a
oricrei celule din tabel, care este 13,88 pentru ultima celul (fetele care prefer
site-urile cu muzic). Dac diferena minim ateptat este mai mic dect 5.0,
atunci trebuie s se acorde foarte mult atenie Testului chi-square.
* Dac se folosete un tabel 2x2 de tip chi-square i apar frecvene anticipate reduse, este
recomandat s se foloseasc testul Fisher, pe care aplicaia SPSS l include n output n astfel
de situaii.
214
Mihaela Rus
Mihaela Sandu
215
Mihaela Rus
Mihaela Sandu
Scor matematic
7
5
4
4
5
8
9
9
7
6
Gen biologic
1
1
2
1
2
2
2
1
2
1
Vrst
10
9
12
8
11
13
7
10
9
11
216
Mihaela Rus
Mihaela Sandu
Pasul 2:
Se selecteaz Transform,
recode
i Into Different Variables
Pasul 3:
Se selectea Vrst i se
apas butonul pentru a
introduce Vrsta n
caseta Numeric Variable
Output variable.
Se introduce numele noii
variabile.
Se selecteaz Change
pentru a aduga acest nume
nou n caseta Numeric variable
Output Variable.
Pasul 4:
Se selecteaz Lowest
through i se scrie 9 n
caseta alturat.
Se selecteaz Value
din meniul new value
i se scrie 1 n csua
alturat.
Se selecteaz Add i
se introduce lowest
throught 91 n caseta
OldNew.
217
Mihaela Rus
Mihaela Sandu
Pasul 5:
Se selecteaz
Range: through
highest i se scrie
10 n caseta de
lng el.
Se selecteaz
value i se scrie
2 n caseta
alturat.
Se selecteaz
Add i se
introduce 10
through
Highest2 n
caseta OldNew. Se apas OK n ecranul care va reaprea.
Pasul 6:
Noua variabil i valorile sale sunt
afiate n meniul Data View.
1 semnific copii cu vrste mai mici de 10
ani
2 semnific copii cu vrste mai mari de
10
ani.
Pentru o astfel de recodificare se
deschide fereastra Recode into Different
Variables (din meniul Transform comanda Recode) n care:
- se selecteaz variabila pe care dorim s o recodificm din lista variabilelor din
partea stng i se mut n lista variabileor de recodat;
- se scrie numele noii variabile n caseta Name din zona Output Variable;
- se scrie n caseta Label eticheta noii variabile;
- se acioneaz butonul de comand Change pentru a se realiza modificarea.
Pentru a defini categoriile variabilei numerice acionm butonul de comand Old and
New Values ce are ca efect deschiderea unei ferestre de dialog n care pentru a schimba o
valoare particular ntr-o valoare nou se introduce valoarea veche n caseta Old Value i
valoarea nou n caseta New Value i se acioneaz butonul Add.
De regul se schimb o valoare real cu alt valoare real. n acest scop selectm
butonul de opiuni Range. Casetele de editare sunt folosite pentru a stabili limita inferioar i
respectiv limita superioar a intervalului dorit. Apoi se selecteaz butonul de opiuni Value din
zona New Value n care se introduce noua valoare i acionm butonul Add.
218
Mihaela Rus
Mihaela Sandu
Prin clic pe butonul de comand Continue se revine n fereastra Record into Different
Variables n care acionm OK pentru recodificarea variabilei.
219
Mihaela Rus
Mihaela Sandu
220
Mihaela Rus
XIV.
Mihaela Sandu
_________________________________________________________________________________________________________________
2. de acord;
3. dezacord;
4. total dezacord.
dezacord
Total dezacord
Respondent 1
Respondent 2
Respondent 3
Deoarece este nevoie de scoruri mari pentru a indica satisfacia
profesional, se va inversa evaluarea, astfel:
4. total de acord;
3. de acord;
221
Mihaela Rus
2. dezacord;
1. total dezacord.
Pasul 4:
Pentru a salva aceast
procedur sub form de fiier
de sintax, se selecteaz
Paste n caseta principal.
Aceast comand de sintax
va aprea n fereastra
Syntax.
222
Mihaela Sandu
Mihaela Rus
XV.
Mihaela Sandu
Testele rangurilor.
Statistici nonparametrice.
_________________________________________________________________________________________________________________
care nu este
Alina
3
5
223
Cristi
2
4
Dan
4
6
Mihaela Rus
Mihaela Sandu
Pasul 2:
Se selecteaz:
Analyze
Nonparametric Tests
Legacy dialog
2 Related Samples
Pasul 3:
Se selecteaz Optsprezece
i douzecisipatru i se
apas butonul pentru a
introduce aceste dou
variabile n caseta Test Pair
(s) List.
Se deselecteaz Wilcoxon.
Se selecteaz Sign.
Se apas OK.
Mihaela Rus
Mihaela Sandu
225
Mihaela Rus
Mihaela Sandu
Se poate ignora primul dintre cele dou tabele de output. Acestea indic
numrul de diferene negative (0), pozitive (8) i inexistente (0) n ceea ce
privete datele ordonate dup cele dou vrste, i media i suma catalogate
negative i pozitive. Valorile pentru dou zeci i patru de luni sunt mai mari
dect cele pentru optsprezece luni.
Al doilea tabel indic nivelul de
semnificaie al acestui test. n loc s
foloseasc
tabelul
valorilor
critice,
226
Mihaela Rus
Mihaela Sandu
12
18
14
10
19
15
11
10
13
13
14
12
11
Pasul 1:
- este acelai ca i cel prezenta la capitolul XI.
Pasul 2:
Se selecteaz:
Analyze
Nonparametric tests
Legacy dialog
2 Independent Samples
Pasul 3:
Se selecteaz Emotivitate i
se apas butonul
pentru a introduce parametrul
Emotivitate n caseta Test
Variable List.
Se selecteaz Familie i se
apas butonul pentru a
introduce Familie n caseta
227
Mihaela Rus
Mihaela Sandu
Grouping Variables.
Se selecteaz Define Groups
Pasul 4:
Se scrie 1 (pentru un singur printe) n c
aseta de lng Group 1.
Se scrie 2 (pentru 2 prini) n caseta de
lng Group 2.
Se selecteaz Continue.
Se apas OK din ecranul anterior care va
reaprea.
*Testul Mann-Whitney este utilizat pentru testarea diferenelor dintre grupuri independente
pentru care variabila dependent este exprimat n valori ordinale (de rang) sau atunci cnd nu
suport un test parametric (testul t). (Popa, 2008, p. 333).
Se poate ignora primul dintre cele dou tabele de output. Acest tabel
indic faptul c rangul mediu dat parametrului Emotivitate pentru primul grup
(adic valoarea 2) este 13,15, iar rangul mediu pentru al doilea grup (adic
valoarea 1) este de 7,85. Aceasta nseamn c valorile din grupul 2 (biparentale)
au tendina s fie mai mari dect cele din grupul 1 (monoparentale).
228
Mihaela Rus
Mihaela Sandu
229
Mihaela Rus
Mihaela Sandu
XVI.
_________________________________________________________________________________________________________________
230
Mihaela Rus
Mihaela Sandu
Date studiu
Grup 1
Grup 2
Tratament hormonal Tratament hormonal
8
4
11
2
8
4
Grup 3
Placebo
4
6
4
Mihaela Rus
Mihaela Sandu
One-Way ANOVA.
Pasul 3:
Se selecteaz depresie i se
apas butonul de lng caseta
Dependent List pentru a
introduce parametrul n caset.
Se selecteaz Condiie i se
apas butonul de lng caseta
Factor pentru a introduce
parametrul acolo.
Se selecteaz Options
Pasul 4:
Se selecteaz metodele statistice descriptive
i Homogenity of variance test.
Se selecteaz Continue.
Se apas OK din ecranul anterior, care va
reaprea.
232
Mihaela Rus
Mihaela Sandu
233
Mihaela Rus
XVII.
Mihaela Sandu
_________________________________________________________________________________________________________________
Consum alcool
Fr alcool
3 ore
14
10
15
9
9
12
privare de somn
6 ore
16
14
23
11
8
234
11
9 ore
20
22
30
10
14
12
Mihaela Rus
Mihaela Sandu
Pasul 3:
Se selecteaz Erori i se apas butonul
de lng caseta Dependent Variable
pentru a introduce parametrul acolo.
Se selecteaz Alcool i Privare de
somn fie mpreun, fie separat, i se
apas butonul Fixed factor(s) pentru
a le introduce n caset.
Se selecteaz Options
235
Mihaela Rus
Mihaela Sandu
Pasul 4:
Se selecteaz Descriptives
statistics i Homogeneity test.
Se selecteaz Continue.
n ecranul anterior, care va
reaprea, se selecteaz Plots.
Pasul 5:
Se selecteaz Alcool i se apas
butonul de lng caseta
Horizontal axis pentru a
introduce parametrul acolo.
Se selecteaz Privare de somn i
se apas butonul de lng caseta
Separate Lines - pentru a
introduce opiunea n caset.
Se selecteaz Add
.
Se selecteaz Continue.
236
Mihaela Rus
Mihaela Sandu
(N) de cazuri pentru cele dou variabile Alcool i Privare de somn. Luate
separat sau mpreun.
Media pentru condiia Alcool este comparat cu Totalul pentru
Privare de somn (adic 18,22). Media pentru privare de 3 ore de somn este
comparat cu Total pentru Alcool (adic 11,50).
Al treilea tabel de ofer
informaii referitoare la Testul
Levene, care verific
similaritatea varianelor. Din
moment ce semnificaia acestui
test este 0,085 (valoarea care este
mai mare dect 0,05), varianele
sunt similare
Al patrulea
tabel indic
nivelele de
semnificaie
pentru cele dou
variabile
Alcool i
Privare de
somn, i
interaciunea
dintre acestea.
n tabelul de analiz a varianei, raportul F pentru cele dou efecte principale
(Alcool i Privare de somn) este prezentat primul.
Pentru prima variabil, cea a alcoolului, Raportul F este 22,891, ceea ce este
semnificativ la nivelul 0,000. Deoarece sunt numai dou condiii pentru ca acest
efect s se produc, se poate conhide c scorul mediu al uneia dintre condiii
este mult mai mare dect pentru cealalt.
Pentru a doua variabil a privrii de somn, aceasta este egal cu 5,797,
valoare care are un nivel exact de semnificaie de 0,017. Astfel, Raportul f este
semnificativ din punct de vedere statistic la un nivel de 0,05, ceea ce nseamn
c mediile celor trei condiii legate de somn nu sunt similare.
237
Mihaela Rus
Mihaela Sandu
E
s
t
i
m
a
e
d
M
a
r
g
i
n
a
l
M
e
a
n
s
o
f
e
r
o
i
p
r
i
v
a
e
d
s
o
m
n
3
r
e
,2
2
5
0
6
9
o
0
,
Acest grafic este realizat pentru mediile celor ase condiii. El a fost editat
cu ajutorul comenzii Chart Editor.
,1
1
7
5
0
,1
5
0
,1
2
5
0
0
,a
lco fa
rlco
XVII.3. Raportarea output-ului.
238
Mihaela Rus
Mihaela Sandu
Pasul 1:
Se introduc datele.
Se codific cele trei
condiii cu valorile 1, 2, 3.
Se eticheteaz Hormon 1,
Hormon 2 i Placebo.
Pasul 2:
Se selecteaz:
Analyze
Comparea Means
One-Way ANOVA.
239
Grup 3
Placebo
4
6
4
Mihaela Rus
Mihaela Sandu
Pasul 3:
Se selecteaz depresie i se
apas butonul de lng caseta
Dependent List pentru a
introduce parametrul n caset.
Se selecteaz Condiie i se
apas butonul de lng caseta
Factor pentru a introduce
parametrul acolo.
Se selecteaz Post Hoc
Pasul 4:
Se selecteaz:
Tukey
Duncan
Scheffe.
Se apas
Continue.
Se selecteaz OK n
ecranul care va aprea
din nou.
240
Mihaela Rus
Mihaela Sandu
Mihaela Rus
Mihaela Sandu
242
Mihaela Rus
Mihaela Sandu
1.
a.
b.
c.
243
Mihaela Rus
Mihaela Sandu
244
Mihaela Rus
Mihaela Sandu
BIBLIOGRAFIE
Ed. All,
Bucureti;
2. Benea, M, Munteanu, G , 2007 Elemente de statistic economic i
social, Ed. Andrei aguna, Constana;
3. Clocotici V., Stan A., 2001 Statistica aplicat n psihologie, Ed.
Polirom, Iai;
4. Dennis H., Duncan C., 2006 Introducere n SPSS pentru psihologie, Ed.
Polirom, Iai;
5. Howell, D, (2002), Statistical Methods for Psychology, Ediia a v-a,
Duxbury Press Boston;
6. Jaba E., Gramma A., (2004) Analiza statistic cu SPSS sub Windows,
Ed. Polirom, Iai;
7. Jaba E., Pintilescu C., 2005 Statistica teste gril i probleme, Ed.
Sedcom Libris, Iai;
8. Opariuc-Dan, Cristian, 2009 - "Statistica aplicata in stiintele socioumane. Notiuni de baza - Statistici univariate" Editura ASCR, ClujNapoca;
9. Radu I. i coord., 1993 Metodologie psihologic i analiza datelor, Ed.
Sincrom, Cluj Napoca;
10.Rotariu T. i coord., 2006 Metode statistice aplicate n tiinele sociale,
Ed. Polirom, Iai;
11.Sava, F. A. 2004. Analiza datelor n cercetarea psihologic. Metode
statistice complementare. Cluj-Napoca : ASCR;
12. ian, E, Ghi, S,, Tranda, C, 2003 Bazele statisticii, Ediia a 2-a, Ed.
Meteor Press, Bucureti;
245
Mihaela Rus
Mihaela Sandu
13. Vasilescu, Ilie P., 1992 Statistic informatizat pentru tiinele despre
om, Ed. Militar, Bucureti;
14.Voineagu, V; Mitru, C; Isaic-Maniu, Al, .a, 2004 Statistica, Ed.
Universitar, Bucureti;
15.Voineagu, V; Mitru, C; Isaic-Maniu, Al, .a, 1998 Statistic teoretic i
economic. Lucrri practice, teste i studii de caz,
Ed. Economic,
Bucureti;
16.Voineagu, V; ian, E, 2004 Sondaje i anchete, vol. 1 i II, Ed.
Fundaiei Andrei aguna, Constana.
246