Documente Academic
Documente Profesional
Documente Cultură
Analiza de frecvene
Distribuia simpl de frecvene
Dac ne ntoarcem la distribuia de mai sus, cel mai simplu lucru pe care putem s
l facem, i care ne poate da o anumit imagine asupra ei, este sortarea, punerea valorilor
n ordine cresctoare sau descresctoare:
10, 10, 9, 9, 8, 8, 8, 8, 8, 7, 7, 7, 6, 6, 6, 6, 6, 6, 6, 5, 4, 4, 4, 4, 2 Privind datele
aranjate astfel, putem observa cu uurin cteva lucruri: valoarea cea mai mare (10) i
valoarea cea mai mic (2), precum i valorile care se repet. Dar chiar i acest mod de
prezentare nu ne-ar fi de mare ajutor dac valorile ar fi ntr-un numr mare. ntr-o astfel
de situaie datele pot fi aranjate ntr-un tabel, numit tabelul frecvenelor simple.
Tabelul 1. Frecvene simple
Valoare
fa
10
9
8
7
6
5
4
3
2
Total
2
2
5
3
7
1
4
0
1
Zfa=N=25
Fa
10
9
8
7
6
5
4
3
2
Total
2
2
5
3
7
1
4
0
1
fa=25
Fr (1)
Fc
25
23
21
16
13
6
5
1
1
0,08
0,08
0,20
0,12
0,28
0,04
0,16
0
0,04
fr=1
frc (1)
Fr (%)
frc (%)
1,00
0,92
0,84
0,64
0,52
0,24
0,20
0,04
0,04
8%
8%
20%
12%
28%
4%
16%
0%
4%
fr%=100
100%
92%
84%
64%
52%
24%
20%
4%
4%
94
107
109
108
104
87
118
124
115
110
117
114
102
92
101
115
98
118
97
101
116
112
113
102
121
91
101
116
108
125
113
114
106
102
86
96
107
108
109
109
105
109
89
114
123
Fa
fr%
frc%
2%
100%
6%
98%
14%
92%
14%
78%
64%
13
26%
38%
16%
22%
8%
14%
8%
6%
6%
fa = 50
fr % =100
Este de la sine neles c clasele de intervale (grupele) vor putea fi analizate ntr-o
manier similar frecvenelor simple, utiliznd valorile absolute (fa) i valorile relative
raportate la unitate sau procentuale (fr(1), fr%). Analiznd tabelul de mai sus, putem
observa c cei mai muli subieci au obinut un scor la testul de inteligen cuprins ntre 105
i 109 (fa=13), acetia reprezentnd 26% din totalul subiecilor evaluai. n fine, din
coloana frecvenelor relative procentuale cumulate putem deduce c 64% dintre subieci
obin o performan de maxim 109 sau mai mic.
Limite aparente i limite reale ale intervalelor de clas
Valorile intervalelor de clas calculate mai sus sunt numite limite aparente ale
intervalelor. n intervalul superior, de exemplu, valoarea 129 este limita aparent
superioar, iar 125, limita aparent inferioar.
Mijlocul intervalelor construite se calculeaz prin nsumarea celor dou limite
aparente i mprirea la 2: (125+129)/2=127. n mod similar, mijlocul celui de-al doilea
interval este: (120+124)/2=122
Media celor dou mijloace de interval ne d limita real a intervalului superior:
(122+127)/2=124.5. ntr-o manier similar se pot construi limitele reale ale
tuturor intervalelor. Fiecare interval are o limit aparent i una real, distana dintre ele
fiind aceeai.
Limite aparente
Limite reale
125 - 129
124.5 129.5
120 124
119.5 124.5
115 119
114.5 119.5
110 114
109.5 114.5
105 109
104.5 109.5
100 104
99.5 104.5
95 99
94.5 99.5
90 94
89.5 94.5
85 89
84.5 89.5
Reprezentri grafice
Reprezentrile graficele sunt forme intuitive de prezentare a distribuiilor de
frecvene (o imagine face mai mult dect o mie de cuvinte). Ele sunt foarte frecvent
utilizate pentru analiza i prezentarea datelor n psihologia aplicat, deoarece faciliteaz
nelegerea semnificaiei datelor numerice. n prezent, programele computerizate ofer
mijloace extrem de puternice i de sofisticate pentru elaborarea reprezentrilor grafice,
dar simpla utilizare a unui astfel de program nu garanteaz realizarea unui grafic eficient.
n esen, un grafic eficient este o combinaie reuit ntre form i coninutul statistic pe care
l reflect. Realizarea acestei combinaii depinde de respectarea ctorva principii eseniale:
focalizarea pe coninutul i nu pe forma graficului
este esenial s fie evitate distorsiunile induse de forma graficului
este recomandabil s fie utilizate grafice care favorizeaz comparaii ntre
variabile i nu doar reprezentri individuale, statice, ale acestora
fiecare grafic trebuie s serveasc un singur scop, exprimat clar i evident
orice grafic va fi nsoit de informaii statistice i descrierile necesare pentru a fi uor
i corect neles
un grafic trebuie s scoat n eviden datele i nu abilitile tehnice de editare ale
celui care l-a creat.
Formele de expresie grafic a datelor statistice sunt foarte numeroase. Ne vom
ocupa aici doar de cteva dintre acestea, cel mai des utilizate1:
. graficul de tip bar
. histograma
. poligonul de frecvene
. graficul frecvenei cumulate
. graficul circular
. graficul de tip stem and leaf (tulpin i frunze)
. graficul box-plot n cele ce urmeaz, vom face o trecere sumar n
revist a celor mai utilizate tipuri de reprezentri grafice. Graficul box-plot va lipsi de
aici, urmnd s fie prezentat mai trziu, ntr-un alt context.
Graficul de tip bar
Este cel mai simplu mod de reprezentare grafic a datelor. Se utilizeaz atunci
cnd dorim s reprezentm o variabil discret (care prezint valori ntregi, de
exemplu, numrul de rspunsuri corecte la un test n funcie de nivelul de instruire al
subiecilor) sau de tip categorial.
n mod obinuit, un grafic se prezint ca o imagine inclus ntr-un sistem de axe
perpendiculare:
. Axa orizontal (Ox) pe care sunt reprezentate valorile distribuiei analizate,
1
Axa vertical (Oy) pe care sunt reprezentate frecvenele fiecrei valori, sub forma
unei bare rectangulare.
Iat cum arat un grafic de tip bar efectuat pe datele din tabelul de frecvene
grupate, lund clasele drept valori ale distribuiei. Cu ct frecvena unei valori este mai
mare, cu att bara este mai nalt. Simplitatea i claritatea este cea mai mare calitate a
acestui tip de grafic.
Axa Ox
Observaii:
o toate barele trebuie sa aib aceeai lime
o ntre bare se las un spaiu (deoarece nu exist nici o legtur ntre ceea ce
reprezint ele) o barele pot fi puse n orice ordine o ordonarea barelor
n funcie de nlime, descresctor sau cresctor,
corespunde unui grafic-bar special, numit grafic Pareto.
Histograma
La prima vedere histograma este asemntoare cu graficul de tip bar. Ea este
adecvat pentru situaiile cnd variabila pe care dorim s o reprezentm este de tip
continuu (adic poate lua orice valoare pe o scal numeric, de ex., numr de
rspunsuri corecte, timpul de reacie, lungimea, etc.). Iat, de exemplu, histograma
distribuiei de frecvene din tabelul 3 (realizat cu programul SPSS):
Poligonul de frecvene
Poligonul de frecvene este o reprezentare alternativ la histogram. Punctele
centrale ale suprafeelor rectangulare, are reprezint frecvena, sunt unite cu o linie ce
delimiteaz suprafaa poligonului.
Clase de interval
Poligonul alturat prezint distribuia de frecvene grupate din tabelul de mai sus, cifrele
1,2,3,4,5,6,7,8,9 reprezentnd denumirea convenional a fiecrei clase.
\
Graficul circular Este utilizat n situaiile n care valorile sunt parte a unui ntreg.
De exemplu, poate fi utilizat la reprezentarea distribuiei de frecvene grupate de mai
sus, pentru a avea o imagine direct a ponderii frecvenei fiecrei clase de interval n
raport cu celelalte.
94
87
117
115
116
91
113
96
105
92
107
118
114
98
112
101
114
107
109
97
109
124
102
118
113
116
106
108
89
106
108
115
92
97
102
108
102
109
114
107
104
110
101
101
121
125
86
109
123
Mai nti, observm c valorile sunt cuprinse ntre 86 i 125. Alegem o valoare
convenabil pentru tulpin, care va juca rolul de interval de clasa, i care n cazul
nostru poate fi 10. Tulpina reprezentrii stem plot este n acest caz numrul de zeci
din fiecare valoare individual.
Valorile din coloana stem (tulpina) indic numrul de zeci, iar cele din coloana
leaf (frunza), numrul de uniti. Dac privim imaginea n ansamblu, ne-o putem
reprezenta ca pe o histogram orizontal. Valorile distribuiei se reconstituie astfel: se
nmulete tulpina cu mrimea ei, la care se adaug frunza. Valorile distribuiei se
reconstituie astfel: se nmulete tulpina cu mrimea ei, la care se adaug frunza.
Stem & Leaf
8 . 679
9 . 1224
9 . 6778
10 . 111122245
10 . 667778889999
11 . 023344455
11 . 66788
12 . 1345
Mrimea tulpinii: 10
Fiecare frunz : 1 caz
n exemplul nostru, pentru stem 8 citim 8x10+6=86; 8x10+7=87; 8x10+9=89,
iar pentru stem 12 citim 12x10+6=126; 12x10+6=126; 12x10+7=127; 12x10+8=128;
12x10+8=128.
Putem privi stem-plot-ul ca o form de reprezentare asociat unei analize de
frecvene grupate, unde valoarea stem este intervalul de clas. n exemplul de mai sus,
acest interval este 10. Uneori putem aprecia c intervalul ales (stem) este prea mare,
producnd un numr prea mic de linii ale reprezentrii stem plot. Acest neajuns poate
fi uor eliminat, e exemplu prin considerarea jumtii intervalului stem i plasarea
valorilor leaf pe dou linii succesive. Aa cum se vede n graficul nostru, am plasat pe
o linie valorile leaf pn la 5, i pe alt linie valorile leaf peste 5, pentru stem 9, 10 i
11.
Unul din avantajele graficului stem plot este i acela c se pot reprezenta
simultan, dou distribuii, ceea ce favorizeaz analiza lor comparativ. Iat, spre
ilustrare, graficul stem plot comparativ pentru rezultatele la dou teste de inteligen,
unul bazat pe sarcini verbale (stnga) i cellalt pentru sarcini de tip non-verbal
(dreapta):
Test verbal
Test non-verbal
7
22
000111123345
987775331110
25556667899
8887442200
223445
664330
3
Stem = 10
1Leaf = un caz
n general, forma reprezentrii stem and leaf trebuie s fie subordonat unei
ct mai bune nelegeri a distribuiei. Atunci cnd numrul valorilor unei distribuii
este foarte mare, se poate opta pentru atribuirea fiecrei frunze a mai multor cazuri,
ceea ce conduce la conservarea proporionalitii reprezentrii. Ca urmare, poate fi
aleas orice soluie care slujete acestui scop, cu condiia ca valorile stem i leaf s fie
bine precizate, la fel i celelalte convenii asumate de analist n construcia graficului.
Concluzii
Utilizarea tabelelor de frecven i a reprezentrilor grafice aduce un
important ctig n analiza datelor statistice. Att tabelele ct i reprezentrile grafice
nu sunt dect nceputul analizei datelor nu i sfritul acesteia. Cu alte cuvinte, nu
vom putea trage direct concluzii pe baza lor. Ele pot fi utilizate ns pentru a ilustra
concluzii, care devin astfel mai uor de neles i de reinut. n fazele primare de
analiz a datelor statistice, graficele ne ajut s ne facem o imagine general asupra
acestora, lucru util pentru alegerea procedurilor statistice. Este important s alegem
tipul de grafic adecvat n raport cu natura datelor i cu ideea pe care dorim s o
ilustrm. n practic, graficele se realizeaz utiliznd programe specializate, iar SPSS
are proceduri puternice de realizare a unei largi varieti de grafice.
Rezumat
Scor
30
53
57
62
39
68
Scor
52
54
48
46
47
44
Scor
49
50
45
33
50
51
Scor
54
59
49
42
56
53
Realizai:
1. Tabelul frecvenelor simple
2. Indicai: