Documente Academic
Documente Profesional
Documente Cultură
Analiza Datelor Statistica
Analiza Datelor Statistica
1/13
Actualizat la 02.11.2006/1:04:44 PM
Analiza de frecvene
Distribuia simpl de frecvene
Dac ne ntoarcem la distribuia de mai sus, cel mai simplu lucru pe care putem s
l facem, i care ne poate da o anumit imagine asupra ei, este sortarea, punerea valorilor
n ordine cresctoare sau descresctoare:
10, 10, 9, 9, 8, 8, 8, 8, 8, 7, 7, 7, 6, 6, 6, 6, 6, 6, 6, 5, 4, 4, 4, 4, 2
Privind datele aranjate astfel, putem observa cu uurin cteva lucruri: valoarea
cea mai mare (10) i valoarea cea mai mic (2), precum i valorile care se repet. Dar
chiar i acest mod de prezentare nu ne-ar fi de mare ajutor dac valorile ar fi ntr-un
numr mare. ntr-o astfel de situaie datele pot fi aranjate ntr-un tabel, numit tabelul
frecvenelor simple.
Tabelul 1. Frecvene simple
Valoare
fa
10
9
8
7
6
5
4
3
2
Total
2
2
5
3
7
1
4
0
1
fa=25
2/13
Actualizat la 02.11.2006/1:04:44 PM
3/13
Actualizat la 02.11.2006/1:04:44 PM
frc (%)
100%
92%
84%
64%
52%
24%
20%
4%
4%
94
107
109
108
104
87
118
124
115
110
117
114
102
92
101
115
98
118
97
101
116
112
113
102
121
91
101
116
108
125
113
114
106
102
86
96
107
108
109
109
105
109
89
114
123
125 86 = 39
39/2 = ~20 clase (prea multe)
39/3 = 13 clase (variant posibil)
39/5 = ~ 8 clase (variant acceptabil)
Vom alege 5, pentru c produce o distribuie
cu 8 clase care este mai uor de analizat i
manipulat
Alegem valoarea 85 ca limit inferioar
frc%
100%
98%
92%
5/13
Actualizat la 02.11.2006/1:04:44 PM
110 114
105 109
100 104
95 99
90 94
85 89
7
13
8
4
4
3
fa=50
14%
26%
16%
8%
8%
6%
fr%=100
78%
64%
38%
22%
14%
6%
Este de la sine neles c clasele de intervale (grupele) vor putea fi analizate ntr-o
manier similar frecvenelor simple, utiliznd valorile absolute (fa) i valorile relative
raportate la unitate sau procentuale (fr(1), fr%). Analiznd tabelul de mai sus, putem
observa c cei mai muli subieci au obinut un scor la testul de inteligen cuprins ntre
105 i 109 (fa=13), acetia reprezentnd 26% din totalul subiecilor evaluai. n fine, din
coloana frecvenelor relative procentuale cumulate putem deduce c 64% dintre subieci
obin o performan de maxim 109 sau mai mic.
Limite aparente i limite reale ale intervalelor de clas
Valorile intervalelor de clas calculate mai sus sunt numite limite aparente ale
intervalelor. n intervalul superior, de exemplu, valoarea 129 este limita aparent
superioar, iar 125, limita aparent inferioar.
Mijlocul intervalelor construite se calculeaz prin nsumarea celor dou limite
aparente i mprirea la 2: (125+129)/2=127. n mod similar, mijlocul celui de-al doilea
interval este: (120+124)/2=122
Media celor dou mijloace de interval ne d limita real a intervalului superior:
(122+127)/2=124.5. ntr-o manier similar se pot construi limitele reale ale
tuturor intervalelor. Fiecare interval are o limit aparent i una real, distana dintre ele
fiind aceeai.
Limite aparente
Limite reale
125 - 129
124.5 129.5
120 124
119.5 124.5
115 119
114.5 119.5
110 114
109.5 114.5
105 109
104.5 109.5
100 104
99.5 104.5
95 99
94.5 99.5
90 94
89.5 94.5
85 89
84.5 89.5
6/13
Actualizat la 02.11.2006/1:04:44 PM
Reprezentri grafice
Reprezentrile graficele sunt forme intuitive de prezentare a distribuiilor de
frecvene (o imagine face mai mult dect o mie de cuvinte). Ele sunt foarte frecvent
utilizate pentru analiza i prezentarea datelor n psihologia aplicat, deoarece faciliteaz
nelegerea semnificaiei datelor numerice. n prezent, programele computerizate ofer
mijloace extrem de puternice i de sofisticate pentru elaborarea reprezentrilor grafice,
dar simpla utilizare a unui astfel de program nu garanteaz realizarea unui grafic eficient.
n esen, un grafic eficient este o combinaie reuit ntre form i coninutul statistic pe
care l reflect. Realizarea acestei combinaii depinde de respectarea ctorva principii
eseniale:
focalizarea pe coninutul i nu pe forma graficului
este esenial s fie evitate distorsiunile induse de forma graficului
este recomandabil s fie utilizate grafice care favorizeaz comparaii ntre
variabile i nu doar reprezentri individuale, statice, ale acestora
fiecare grafic trebuie s serveasc un singur scop, exprimat clar i evident
orice grafic va fi nsoit de informaii statistice i descrierile necesare pentru a fi
uor i corect neles
un grafic trebuie s scoat n eviden datele i nu abilitile tehnice de editare ale
celui care l-a creat.
Formele de expresie grafic a datelor statistice sunt foarte numeroase. Ne vom
ocupa aici doar de cteva dintre acestea, cel mai des utilizate1:
graficul de tip bar
histograma
poligonul de frecvene
graficul frecvenei cumulate
graficul circular
graficul de tip stem and leaf (tulpin i frunze)
graficul box-plot
n cele ce urmeaz, vom face o trecere sumar n revist a celor mai utilizate
tipuri de reprezentri grafice. Graficul box-plot va lipsi de aici, urmnd s fie prezentat
mai trziu, ntr-un alt context.
Graficul de tip bar
Este cel mai simplu mod de reprezentare grafic a datelor. Se utilizeaz atunci
cnd dorim s reprezentm o variabil discret (care prezint valori ntregi, de
exemplu, numrul de rspunsuri corecte la un test n funcie de nivelul de instruire al
subiecilor) sau de tip categorial.
n mod obinuit, un grafic se prezint ca o imagine inclus ntr-un sistem de axe
perpendiculare:
Axa orizontal (Ox) pe care sunt reprezentate valorile distribuiei analizate,
1
O prezentare extensiv a tipurilor de reprezentri grafice poate fi gsit n Statistica, Electronic Textbook,
1984-1999, StatSoft Inc., Graphical techniques
7/13
Actualizat la 02.11.2006/1:04:44 PM
Axa vertical (Oy) pe care sunt reprezentate frecvenele fiecrei valori, sub forma
unei bare rectangulare.
Iat cum arat un grafic de tip bar efectuat pe datele din tabelul de frecvene
grupate, lund clasele drept valori ale distribuiei. Cu ct frecvena unei valori este mai
mare, cu att bara este mai nalt. Simplitatea i claritatea este cea mai mare calitate a
acestui tip de grafic.
14
12
10
Axa Oy
0
1
Axa Ox
Observaii:
o toate barele trebuie sa aib aceeai lime
o ntre bare se las un spaiu (deoarece nu exist nici o legtur ntre ceea ce
reprezint ele)
o barele pot fi puse n orice ordine
o ordonarea barelor n funcie de nlime, descresctor sau cresctor,
corespunde unui grafic-bar special, numit grafic Pareto.
Histograma
La prima vedere histograma este asemntoare cu graficul de tip bar. Ea este
adecvat pentru situaiile cnd variabila pe care dorim s o reprezentm este de tip
continuu (adic poate lua orice valoare pe o scal numeric, de ex., numr de
rspunsuri corecte, timpul de reacie, lungimea, etc.). Iat, de exemplu, histograma
distribuiei de frecvene din tabelul 3 (realizat cu programul SPSS):
12
10
0
85,0
90,0
95,0
100,0
105,0
110,0
115,0
120,0
125,0
Clase
Poligonul de frecvene
Poligonul de frecvene este o reprezentare alternativ la histogram. Punctele
centrale ale suprafeelor rectangulare, care reprezint frecvena, sunt unite cu o linie ce
delimiteaz suprafaa poligonului.
14
12
10
2
0
1
Clase de interval
Poligonul alturat prezint distribuia de frecvene grupate din tabelul de mai sus,
cifrele 1,2,3,4,5,6,7,8,9 reprezentnd denumirea convenional a fiecrei clase.
Graficul frecvenei cumulate
Este un grafic de tip liniar, care reprezint valorile frecvenei absolute cumulate.
Pe acest grafic se vede cu uurin cte valori se afl pn la o anumit valoare din
distribuie (datele reprezentate sunt cele din tabelul 3, fiecare interval de clasa fiind
etichetat convenional cu cifre de la 1 la 9).
70
60
50
40
Frecvena cumulat
30
20
10
0
1
Clase de interval
Graficul circular
Este utilizat n situaiile n care valorile sunt parte a unui ntreg. De exemplu,
poate fi utilizat la reprezentarea distribuiei de frecvene grupate de mai sus, pentru a avea
o imagine direct a ponderii frecvenei fiecrei clase de interval n raport cu celelalte.
9/13
Actualizat la 02.11.2006/1:04:44 PM
94
107
109
108
104
87
118
124
115
110
117
114
102
92
101
115
98
118
97
101
116
112
113
102
121
91
101
116
108
125
113
114
106
102
86
96
107
108
109
109
105
109
89
114
123
Mai nti, observm c valorile sunt cuprinse ntre 86 i 125. Alegem o valoare
convenabil pentru tulpin, care va juca rolul de interval de clasa, i care n cazul
nostru poate fi 10. Tulpina reprezentrii stem plot este n acest caz numrul de zeci din
fiecare valoare individual.
10/13
Actualizat la 02.11.2006/1:04:44 PM
Test non-verbal
7 1
22 6 000111123345
987775331110 5 25556667899
8887442200 4 223445
664330 3
Stem=10
1 Leaf=un caz
n general, forma reprezentrii stem and leaf trebuie s fie subordonat unei ct
mai bune nelegeri a distribuiei. Atunci cnd numrul valorilor unei distribuii este
foarte mare, se poate opta pentru atribuirea fiecrei frunze a mai multor cazuri, ceea ce
conduce la conservarea proporionalitii reprezentrii. Ca urmare, poate fi aleas orice
soluie care slujete acestui scop, cu condiia ca valorile stem i leaf s fie bine precizate,
la fel i celelalte convenii asumate de analist n construcia graficului.
11/13
Actualizat la 02.11.2006/1:04:44 PM
Concluzii
Utilizarea tabelelor de frecven i a reprezentrilor grafice aduce un important
ctig n analiza datelor statistice. Att tabelele ct i reprezentrile grafice nu sunt dect
nceputul analizei datelor nu i sfritul acesteia. Cu alte cuvinte, nu vom putea trage
direct concluzii pe baza lor. Ele pot fi utilizate ns pentru a ilustra concluzii, care devin
astfel mai uor de neles i de reinut. n fazele primare de analiz a datelor statistice,
graficele ne ajut s ne facem o imagine general asupra acestora, lucru util pentru
alegerea procedurilor statistice. Este important s alegem tipul de grafic adecvat n raport
cu natura datelor i cu ideea pe care dorim s o ilustrm. n practic, graficele se
realizeaz utiliznd programe specializate, iar SPSS are proceduri puternice de realizare a
unei largi varieti de grafice.
Rezumat
12/13
Actualizat la 02.11.2006/1:04:44 PM
Scor
30
53
57
62
39
68
Scor
52
54
48
46
47
44
Scor
49
50
45
33
50
51
Scor
54
59
49
42
56
53
Realizai:
1. Tabelul frecvenelor simple
2. Indicai:
scorul cel mai frecvent
ce procent de valori se afl sub scorul 33
valoarea (scorul) ce mai apropiat de percentila 20
3. Tabelul frecvenelor grupate (indicai modul de alegere a numrului de
intervale, mrimea intervalului de clas, intervalele de clas, frecvena simpl,
relativ i cumulat a grupelor de frecven)
4. Reprezentarea grafic de tip stem-and-leaf
13/13
Actualizat la 02.11.2006/1:04:44 PM