Sunteți pe pagina 1din 14

STATISTICI DESCRIPTIVE

Analiza de frecvene i reprezentri grafice


Lect. univ. dr. Gheorghe Perea
Statistica descriptiv are drept obiective organizarea, sintetizarea i descrierea
datelor. n ciuda relativei simpliti a procedurilor descriptive, i a faptului c ele nu
permit n mod direct concluzii de cercetare, statistica descriptiv este esenial pentru
fundamentarea procedurilor infereniale.
Rezultatul msurrii se traduce n obinerea unei colecii de date. S presupunem c
am aplicat un test de cunotine unui grup de 25 de studeni i am obinut urmtoarele valori
pentru variabila rspunsuri corecte:
8, 6, 10, 9, 6, 6, 8, 7, 4, 9, 6, 2, 8, 6, 10, 4, 5, 6, 8, 4, 7, 8, 4, 7, 6
Datele de mai sus reprezint o serie statistic, sau o distribuie statistic,
compus din 25 de valori sau scoruri. Fiind rezultatul primar al msurrii, aceste
valori se mai numesc i valori brute. Valorile acestei variabile sunt acceptate ca fiind
exprimate pe o scal cantitativ de raport.
Este evident c, privite sub forma n care se prezint mai sus, datele respective ne
spun puine lucruri. Iar dac ar fi i mai multe, de ordinul sutelor sau miilor, atunci ar fi
practic imposibil de fcut vreo apreciere, n aceast form de prezentare. De aceea, pentru
a ne putea face o imagine mai coerent asupra unei distribuii de valori, acestea trebuie
supuse unor operaii care s scoat n eviden caracteristicile distribuiei.
Tehnicile i procedurile destinate organizrii, prezentrii i descrierii datelor,
constituie ceea ce se numete statistica descriptiv. Principalele ei componente sunt:
- Tehnici de organizare i prezentare a datelor, care pot fi:
o numerice (distribuia de frecvene simple sau grupate;) o grafice (histograme;
grafice de tip bar, linie, plcint, histograma stem-and-leaf, etc.)
- Indicatori numerici descriptivi, care sunt mprii, la rndul lor, n trei categorii:
o indicatori ai tendinei centrale;
o indicatori ai mprtierii;
o indicatori ai formei distribuiei (simetrie i aplatizare).
Dincolo de scopul n sine al acestor proceduri, acela de a oferi o imagine sintetic
asupra datelor analizate, trebuie s nelegem statistica descriptiv i ca pe o etap
pregtitoare n fundamentarea procedurilor statisticii infereniale (destinat verificrii
ipotezelor statistice), despre care vom vorbi mai trziu.

Analiza de frecvene
Distribuia simpl de frecvene
Dac ne ntoarcem la distribuia de mai sus, cel mai simplu lucru pe care putem s
l facem, i care ne poate da o anumit imagine asupra ei, este sortarea, punerea valorilor
n ordine cresctoare sau descresctoare:
10, 10, 9, 9, 8, 8, 8, 8, 8, 7, 7, 7, 6, 6, 6, 6, 6, 6, 6, 5, 4, 4, 4, 4, 2 Privind datele
aranjate astfel, putem observa cu uurin cteva lucruri: valoarea cea mai mare (10) i
valoarea cea mai mic (2), precum i valorile care se repet. Dar chiar i acest mod de
prezentare nu ne-ar fi de mare ajutor dac valorile ar fi ntr-un numr mare. ntr-o astfel
de situaie datele pot fi aranjate ntr-un tabel, numit tabelul frecvenelor simple.
Tabelul 1. Frecvene simple
Valoare
fa
10
9
8
7
6
5
4
3
2
Total

2
2
5
3
7
1
4
0
1
Zfa=N=25

Dac lum n considerare seria de valori de mai sus, un tabel al frecvenelor


simple (absolute) este compus din lista valorilor distincte, ordonate descresctor, la care
se adaug frecvena absolut (fa) a fiecrei valori (de cte ori se ntlnete n cadrul
seriei).
Se observ astfel c datele au un caracter mai ordonat, iar coloana frecvenelor
absolute scoate n eviden anumite aspecte cum ar fi, de exemplu, faptul c cea mai
frecvent valoare este 6 (apare de 7 ori). Observm c seria de valori din tabel include
toate valorile posibile ntre valoarea cea mai mare (10) i cea mai mic (2), incluznd i
valorile care nu se ntlnesc n mod real n cadrul seriei. n cazul nostru avem valoarea 3,
cu frecvena de apariie 0. Suma frecvenelor absolute (fa) indic totalul valorilor din
cadrul seriei, adic numrul de subieci evaluai(N=25).
n practic, pe lng frecvenele absolute se iau n considerare i alte tipuri de
frecvene (vezi tabelul 2):
- Frecvena cumulat (fc). Reprezint totalul valorilor care se cumuleaz ncepnd
de la valoarea cea mai mic pn la valoarea cea mai mare din tabel. De exemplu,
n tabelul sintetic de mai jos, avem 6 valori mai mici sau egale cu 5, 21 de valori
mai mici sau egale cu 8 i, evident, 25(N) de valori mai mici sau egale cu 10.

Frecvena relativ raportat la unitate fr(1). Este raportul dintre frecvena


absolut i suma frecvenelor absolute (fa/fa).
o Exemple:
pentru valoarea 10: fa/fa=2/25=0.08;
pentru valoarea 6: fa/fa=7/25=0.13; .a.m.d.
Frecvena relativ cumulat, raportat la unitate frc(1): Este similar
frecvenei cumulate absolute, cu deosebirea c n acest caz se cumuleaz
frecvenele relative.
o Exemple:
Dac privim ntreaga serie ca ntreg (egal cu 1 sau
unitate ), atunci toate valorile mai mici sau egale cu 5 au
o frecven cumulat egal cu 0.24 (adic,
fr(1)=0.04+0+0.16+0.04=0.24)
Pentru valoarea 7, frecvena relativ cumulat raportat la
unitate este: frc(1)=0.04+0+0.16+0.04+0.28+0.12=0.64
Frecvena relativ cumulat pentru valoarea cea mai mare
din serie este ntotdeauna 1.00 (corespunztoare n cazul
nostru valorii 10).
Frecvena relativ procentual fr(%): Exprim procentul valorilor care se
situeaz care corespunde unei anumite valori din cadrul distribuiei. Se calculeaz
fie prin nmulirea fr(1) cu 100, fie prin calcularea direct procentului pe care l
reprezint o anumit valoare raportat la totalul valorilor dintr-o distribuie. Suma
frecvenelor relative procentuale este ntotdeauna egal cu 100.
o Exemple (tabelul 2):
8% dintre studenii evaluai au realizat 10 rspunsuri
corecte
28% dintre studenii evaluai au realizat 6 rspunsuri
corecte
Frecvena relativ cumulat procentual (frc%): Exprim procentul valorilor
dintr-o distribuie care se plaseaz pn la o anumit valoare (inclusiv aceasta).
o Exemple:
52% dintre studeni au obinut o not egal sau mai mic de 6
92% au obinut cel puin nota 9
Desigur, pentru valoarea maxim a unei distribuii,
frecvena cumulat procentual este ntotdeauna 100%.
o Frecvena relativ procentual cumulat se numete rang percentil.
Astfel, despre valoarea 6 din distribuia de mai sus se poate spune c are
rangul percentil 52, adic, 52% dintre valorile unei distribuii sunt ntre
cea mai mic valoare i valoarea 6, inclusiv.
o Prin convenie, rangul percentil se definete ca procentajul datelor valorilor
dintr-o distribuie care se afl pn la o anumit valoare inclusiv.
o n mod complementar, numim percentil, valoarea dintr-o distribuie care
corespunde unui anumit rang percentil. n exemplul de mai sus, rangului
percentil 52 i corespunde valoarea 6, numit, de aceea, percentila 52.

o n practic, exist anumite percentile care au o importan aparte. Acestea


sunt percentilele corespunztoare rangurilor percentile cu valorile 10, 20,
30,..., 100. Despre semnificaia lor vom vorbi mai trziu n acest curs. De
asemenea, se utilizeaz termenul de quartile pentru percentilele care
mpart distribuia n patru zone egale ca numr de valori. Acestea sunt
corespunztoare rangurilor percentile 25, 50 i 75. Cu alte cuvinte,
valoarea dintr-o distribuie pn la care se afl 25% din valori este
percentila 25, valoarea pn la care se afl 50% din valori este percentila
50, iar valoarea pn la care se afl 75% din valori este percentila 75.
Tabelul 2. Tabloul sintetic al frecvenelor simple
Valoare

Fa

10
9
8
7
6
5
4
3
2
Total

2
2
5
3
7
1
4
0
1
fa=25

Fr (1)

Fc
25
23
21
16
13
6
5
1
1

0,08
0,08
0,20
0,12
0,28
0,04
0,16
0
0,04
fr=1

frc (1)

Fr (%)

frc (%)

1,00
0,92
0,84
0,64
0,52
0,24
0,20
0,04
0,04

8%
8%
20%
12%
28%
4%
16%
0%
4%
fr%=100

100%
92%
84%
64%
52%
24%
20%
4%
4%

Distribuia de frecvene grupate


Aranjarea unei distribuii sub forma tabelului de frecvene simple este foarte util,
dar nu este practic atunci cnd avem o distribuie cu un numr mare sau foarte mare de
valori, care ar genera un tabel cu prea multe linii pentru a fi inteligibil.
S presupunem c valorile de mai jos reprezint distribuia variabilei inteligen
msurat prin aplicarea unui test la un numr de 50 de subieci. Dac date ar fi aranjate la
ntmplare, aa ca n tabelul 2, ar fi dificil s ne facem o imagine asupra lor.
101
92
97
106
107

94
107
109
108
104

87
118
124
115
110

117
114
102
92
101

115
98
118
97
101

116
112
113
102
121

91
101
116
108
125

113
114
106
102
86

96
107
108
109
109

105
109
89
114
123

Presupunnd c le-am ordona i am face tabelul frecvenelor simple, am obine un


uor progres, dar nc ar fi greu de analizat, deoarece vom obine un tabel cu prea multe
valori distincte.
Pentru a ne face o imagine sintetic a distribuiei, ne propunem s realizm un
numr de categorii (clase) cuprinse ntre anumite intervale de performan la test, urmnd
s stabilim apoi care este frecvena de apariie a fiecrei clase n distribuia noastr.
Aceast tehnic de organizare a datelor se numete frecvena grupat

Pentru a realiza un tabel de frecvene grupate se procedeaz astfel:


1. Alegem numrul de intervale (clase, categorii), recomandabil, ntre 5 i 15 (valori
stabilite convenional i orientativ)
2. Definim mrimea intervalului de clas, respectnd urmtoarele reguli:

toate intervalele trebuie s fie egale


limitele intervalelor trebuie s cuprind toate valorile (ntre limitele intervalelor
alturate s nu existe goluri sau suprapuneri)

Pentru distribuia de mai sus, paii de realizare a distribuiei de frecvene grupate se


concretizeaz astfel:
Se face diferena dintre valoarea cea mai mare
125 86 = 39
i valoarea cea mai mic
Se mparte valoarea obinut la mrimea
39/2 = ~20 clase (prea multe) 39/3 =
posibil a intervalului de clas (2, 3, 5 sau 10) 13 clase (variant posibil) 39/5 = ~
pentru a realiza numrul de clase al noii
8 clase (variant acceptabil)
distribuii
Vom alege 5, pentru c produce o
Se
selecteaz mrimea intervalului care
distribuie cu 8 clase care este mai uor de
conduce la un numr de clase cuprins ntre 5
analizat i manipulat
i 15.
Se determin limita inferioar a primului
Alegem valoarea 85 ca limit inferioar
interval (trebuie s fie un multiplu al mrimii
Dac mrimea intervalului este 5,
Se determin limita superioar a primului
limita superioar va fi 89
interval
(85,86,87,88,89)
Se construiesc intervalele de clas pentru fiecare interval
(vezi coloana clase din tabelul 3)
Se aplic analiza de frecvene ca n cazul frecvenelor simple, aplicat la clase
Exist i diverse formule pentru calcularea numrului de clase dar, n general,
regulile de mai sus sunt suficiente n aceast faz. Oricum, trebuie s reinem c n
alegerea intervalelor de clas este necesar s inem seama i de aspecte calitative, nu
doar de ordin formal. Astfel, dac facem un studiu cu privire la efectul ritmului
circadian asupra performanei psihice, utiliznd rezultate obinute n diferite momente
ale zilei, intervalele orare vor fi alese astfel nct s corespund cu intervalele de
timp utilizate n studii similare, pentru a putea face, eventual, comparaii.
n fine, alegerea dimensiunii intervalului trebuie s in seama i de
caracteristicile distribuiei simple (discutat anterior). Intervalele trebuie astfel alese
nct s se evite situaia de a avea clase care cuprind un numr excesiv de valori, n
timp ce alte clase sunt puin reprezentate sau nu conin nici o valoare.
Atenie, n exemplul dat, dei valoarea maxim a variabilei este 125,
intervalul maxim este 125-129, deoarece intervalele declarate trebuie s fie egale. Ca
urmare, tabelul frecvenelor grupate pentru distribuia de mai sus va arta astfel:

Tabelul 3. Frecvene grupate


Clase
125 - 129
120 124
115 119
110 -114
105 109
100 104
95 -99
90 94
85 - 89

Fa

fr%

frc%

2%

100%

6%

98%

14%

92%

14%

78%
64%

13

26%
38%

16%
22%

8%
14%

8%
6%

6%

fa = 50

fr % =100

Este de la sine neles c clasele de intervale (grupele) vor putea fi analizate ntr-o
manier similar frecvenelor simple, utiliznd valorile absolute (fa) i valorile relative
raportate la unitate sau procentuale (fr(1), fr%). Analiznd tabelul de mai sus, putem
observa c cei mai muli subieci au obinut un scor la testul de inteligen cuprins ntre 105
i 109 (fa=13), acetia reprezentnd 26% din totalul subiecilor evaluai. n fine, din
coloana frecvenelor relative procentuale cumulate putem deduce c 64% dintre subieci
obin o performan de maxim 109 sau mai mic.
Limite aparente i limite reale ale intervalelor de clas
Valorile intervalelor de clas calculate mai sus sunt numite limite aparente ale
intervalelor. n intervalul superior, de exemplu, valoarea 129 este limita aparent
superioar, iar 125, limita aparent inferioar.
Mijlocul intervalelor construite se calculeaz prin nsumarea celor dou limite
aparente i mprirea la 2: (125+129)/2=127. n mod similar, mijlocul celui de-al doilea
interval este: (120+124)/2=122
Media celor dou mijloace de interval ne d limita real a intervalului superior:
(122+127)/2=124.5. ntr-o manier similar se pot construi limitele reale ale
tuturor intervalelor. Fiecare interval are o limit aparent i una real, distana dintre ele
fiind aceeai.

Limite aparente

Limite reale

125 - 129

124.5 129.5

120 124

119.5 124.5

115 119

114.5 119.5

110 114

109.5 114.5

105 109

104.5 109.5

100 104

99.5 104.5

95 99

94.5 99.5

90 94

89.5 94.5

85 89

84.5 89.5

Reprezentri grafice
Reprezentrile graficele sunt forme intuitive de prezentare a distribuiilor de
frecvene (o imagine face mai mult dect o mie de cuvinte). Ele sunt foarte frecvent
utilizate pentru analiza i prezentarea datelor n psihologia aplicat, deoarece faciliteaz
nelegerea semnificaiei datelor numerice. n prezent, programele computerizate ofer
mijloace extrem de puternice i de sofisticate pentru elaborarea reprezentrilor grafice,
dar simpla utilizare a unui astfel de program nu garanteaz realizarea unui grafic eficient.
n esen, un grafic eficient este o combinaie reuit ntre form i coninutul statistic pe care
l reflect. Realizarea acestei combinaii depinde de respectarea ctorva principii eseniale:
focalizarea pe coninutul i nu pe forma graficului
este esenial s fie evitate distorsiunile induse de forma graficului
este recomandabil s fie utilizate grafice care favorizeaz comparaii ntre
variabile i nu doar reprezentri individuale, statice, ale acestora
fiecare grafic trebuie s serveasc un singur scop, exprimat clar i evident
orice grafic va fi nsoit de informaii statistice i descrierile necesare pentru a fi uor
i corect neles
un grafic trebuie s scoat n eviden datele i nu abilitile tehnice de editare ale
celui care l-a creat.
Formele de expresie grafic a datelor statistice sunt foarte numeroase. Ne vom
ocupa aici doar de cteva dintre acestea, cel mai des utilizate1:
. graficul de tip bar
. histograma
. poligonul de frecvene
. graficul frecvenei cumulate
. graficul circular
. graficul de tip stem and leaf (tulpin i frunze)
. graficul box-plot n cele ce urmeaz, vom face o trecere sumar n
revist a celor mai utilizate tipuri de reprezentri grafice. Graficul box-plot va lipsi de
aici, urmnd s fie prezentat mai trziu, ntr-un alt context.
Graficul de tip bar
Este cel mai simplu mod de reprezentare grafic a datelor. Se utilizeaz atunci
cnd dorim s reprezentm o variabil discret (care prezint valori ntregi, de
exemplu, numrul de rspunsuri corecte la un test n funcie de nivelul de instruire al
subiecilor) sau de tip categorial.
n mod obinuit, un grafic se prezint ca o imagine inclus ntr-un sistem de axe
perpendiculare:
. Axa orizontal (Ox) pe care sunt reprezentate valorile distribuiei analizate,
1

O prezentare extensiv a tipurilor de reprezentri grafice poate fi gsit n Statistica,


Electronic Textbook, 1984-1999, StatSoft Inc., Graphical techniques

Axa vertical (Oy) pe care sunt reprezentate frecvenele fiecrei valori, sub forma
unei bare rectangulare.
Iat cum arat un grafic de tip bar efectuat pe datele din tabelul de frecvene
grupate, lund clasele drept valori ale distribuiei. Cu ct frecvena unei valori este mai
mare, cu att bara este mai nalt. Simplitatea i claritatea este cea mai mare calitate a
acestui tip de grafic.

Axa Ox
Observaii:
o toate barele trebuie sa aib aceeai lime
o ntre bare se las un spaiu (deoarece nu exist nici o legtur ntre ceea ce
reprezint ele) o barele pot fi puse n orice ordine o ordonarea barelor
n funcie de nlime, descresctor sau cresctor,
corespunde unui grafic-bar special, numit grafic Pareto.
Histograma
La prima vedere histograma este asemntoare cu graficul de tip bar. Ea este
adecvat pentru situaiile cnd variabila pe care dorim s o reprezentm este de tip
continuu (adic poate lua orice valoare pe o scal numeric, de ex., numr de
rspunsuri corecte, timpul de reacie, lungimea, etc.). Iat, de exemplu, histograma
distribuiei de frecvene din tabelul 3 (realizat cu programul SPSS):

Se observ faptul c programul a realizat automat o grupare de frecvene, afind


pe axa Ox limita minim a intervalului ca etichet a acestuia.

Poligonul de frecvene
Poligonul de frecvene este o reprezentare alternativ la histogram. Punctele
centrale ale suprafeelor rectangulare, are reprezint frecvena, sunt unite cu o linie ce
delimiteaz suprafaa poligonului.

Clase de interval
Poligonul alturat prezint distribuia de frecvene grupate din tabelul de mai sus, cifrele
1,2,3,4,5,6,7,8,9 reprezentnd denumirea convenional a fiecrei clase.
\

Graficul frecvenei cumulate


Este un grafic de tip liniar, care reprezint valorile frecvenei absolute
cumulate. Pe acest grafic se vede cu uurin cte valori se afl pn la o anumit
valoare din distribuie (datele reprezentate sunt cele din tabelul 3, fiecare interval de
clasa fiind etichetat convenional cu cifre de la 1 la 9).

Graficul circular Este utilizat n situaiile n care valorile sunt parte a unui ntreg.
De exemplu, poate fi utilizat la reprezentarea distribuiei de frecvene grupate de mai
sus, pentru a avea o imagine direct a ponderii frecvenei fiecrei clase de interval n
raport cu celelalte.

Graficul alturat reprezint frecvena absolut a claselor de interval ale


aceleiai distribuii de mai sus. Pe un grafic de acest tip se pot reprezenta fie valorile
absolute, fie procentajul fiecrei clase raportat la ntreg.
Reprezentarea de tip stem-and-leaf (sau stem plot)
Este o reprezentare care ncearc s mbine expresia numeric cu cea grafic,
fiind propus de statisticianul J.W. Tuckey (1977). Scopul principal a fost acela de a
oferi nu doar o imagine a distribuiei, ci i o metod de explorare a acesteia. Ea este
din ce n ce mai utilizat de psihologi, motiv pentru care considerm necesar s o
prezentm aici.
Atunci cnd utilizm o distribuie de frecvene grupate, cazurile individuale se
pierd la nivelul fiecrei clase de interval, fr a mai putea ti unde se plaseaz fiecare

valoare iniial n interiorul fiecrui interval. Reprezentarea de tip stem-and-leaf (pe


scurt stem plot), are tocmai avantajul de a realiza graficul distribuiei cu pstrarea
valorilor individuale.
Modul de realizare
S revenim la distribuia de scoruri QI prezentat anterior:
101

94

87

117

115

116

91

113

96

105

92

107

118

114

98

112

101

114

107

109

97

109

124

102

118

113

116

106

108

89

106

108

115

92

97

102

108

102

109

114

107

104

110

101

101

121

125

86

109

123

Mai nti, observm c valorile sunt cuprinse ntre 86 i 125. Alegem o valoare
convenabil pentru tulpin, care va juca rolul de interval de clasa, i care n cazul
nostru poate fi 10. Tulpina reprezentrii stem plot este n acest caz numrul de zeci
din fiecare valoare individual.
Valorile din coloana stem (tulpina) indic numrul de zeci, iar cele din coloana
leaf (frunza), numrul de uniti. Dac privim imaginea n ansamblu, ne-o putem
reprezenta ca pe o histogram orizontal. Valorile distribuiei se reconstituie astfel: se
nmulete tulpina cu mrimea ei, la care se adaug frunza. Valorile distribuiei se
reconstituie astfel: se nmulete tulpina cu mrimea ei, la care se adaug frunza.
Stem & Leaf
8 . 679
9 . 1224
9 . 6778
10 . 111122245
10 . 667778889999
11 . 023344455
11 . 66788
12 . 1345
Mrimea tulpinii: 10
Fiecare frunz : 1 caz
n exemplul nostru, pentru stem 8 citim 8x10+6=86; 8x10+7=87; 8x10+9=89,
iar pentru stem 12 citim 12x10+6=126; 12x10+6=126; 12x10+7=127; 12x10+8=128;
12x10+8=128.
Putem privi stem-plot-ul ca o form de reprezentare asociat unei analize de
frecvene grupate, unde valoarea stem este intervalul de clas. n exemplul de mai sus,
acest interval este 10. Uneori putem aprecia c intervalul ales (stem) este prea mare,

producnd un numr prea mic de linii ale reprezentrii stem plot. Acest neajuns poate
fi uor eliminat, e exemplu prin considerarea jumtii intervalului stem i plasarea
valorilor leaf pe dou linii succesive. Aa cum se vede n graficul nostru, am plasat pe
o linie valorile leaf pn la 5, i pe alt linie valorile leaf peste 5, pentru stem 9, 10 i
11.
Unul din avantajele graficului stem plot este i acela c se pot reprezenta
simultan, dou distribuii, ceea ce favorizeaz analiza lor comparativ. Iat, spre
ilustrare, graficul stem plot comparativ pentru rezultatele la dou teste de inteligen,
unul bazat pe sarcini verbale (stnga) i cellalt pentru sarcini de tip non-verbal
(dreapta):
Test verbal

Test non-verbal
7

22

000111123345

987775331110

25556667899

8887442200

223445

664330

3
Stem = 10
1Leaf = un caz

n general, forma reprezentrii stem and leaf trebuie s fie subordonat unei
ct mai bune nelegeri a distribuiei. Atunci cnd numrul valorilor unei distribuii
este foarte mare, se poate opta pentru atribuirea fiecrei frunze a mai multor cazuri,
ceea ce conduce la conservarea proporionalitii reprezentrii. Ca urmare, poate fi
aleas orice soluie care slujete acestui scop, cu condiia ca valorile stem i leaf s fie
bine precizate, la fel i celelalte convenii asumate de analist n construcia graficului.
Concluzii
Utilizarea tabelelor de frecven i a reprezentrilor grafice aduce un
important ctig n analiza datelor statistice. Att tabelele ct i reprezentrile grafice
nu sunt dect nceputul analizei datelor nu i sfritul acesteia. Cu alte cuvinte, nu
vom putea trage direct concluzii pe baza lor. Ele pot fi utilizate ns pentru a ilustra
concluzii, care devin astfel mai uor de neles i de reinut. n fazele primare de
analiz a datelor statistice, graficele ne ajut s ne facem o imagine general asupra
acestora, lucru util pentru alegerea procedurilor statistice. Este important s alegem
tipul de grafic adecvat n raport cu natura datelor i cu ideea pe care dorim s o
ilustrm. n practic, graficele se realizeaz utiliznd programe specializate, iar SPSS
are proceduri puternice de realizare a unei largi varieti de grafice.
Rezumat

Statistica descriptiv are drept obiective organizarea, sintetizarea i descrierea


datelor.
Tehnicile statisticii descriptive sunt globale sau sintetice

Statisticile descriptive globale sunt numerice (analiza de frecvene simple i


grupate) i grafice.
Analiza frecvenelor simple se refer la frecvena de apariie a valorilor
individuale dintr-o distribuie.
Frecvena absolut este numrul de apariie a unei valori.
Frecvena relativ este numrul de apariii a unei valori n raport cu totalul
valorilor (frecvena relativ raportat la unitate sau procentual)
Rangul percentil se definete ca procentajul datelor valorilor dintr-o distribuie
care se afl pn la o anumit valoare inclusiv.
Percentila este valoarea dintr-o distribuie care corespunde unui anumit rang
percentil.
Reprezentrile grafice servesc ilustrrii distribuiilor n completitudinea lor, n
forme variate: bar, histogram, poligon de frecvene, circular.
Graficul stem-and-leaf este o form de reprezentare grafic care utilizeaz
elemente numerice, imaginea permind reconstituirea valorilor distribuiei.
EXERCIII

Valorile de mai jos reprezint distribuia rezultatelor la un test de calcul


aritmetic (numrul de calcule corecte)
Scor
55
46
52
51
48
50

Scor
30
53
57
62
39
68

Scor
52
54
48
46
47
44

Scor
49
50
45
33
50
51

Scor
54
59
49
42
56
53

Realizai:
1. Tabelul frecvenelor simple
2. Indicai:

scorul cel mai frecvent


ce procent de valori se afl sub scorul 33
valoarea (scorul) ce mai apropiat de percentila 20

3. Tabelul frecvenelor grupate (indicai modul de alegere a numrului de


intervale, mrimea intervalului de clas, intervalele de clas, frecvena simpl,
relativ i cumulat a grupelor de frecven)
4. Reprezentarea grafic de tip stem-and-leaf

S-ar putea să vă placă și