Sunteți pe pagina 1din 4

Tabelul 3.

Tabelul de frecvenţe grupate


Clase fa fr% frc%
125 – 129 1 2% 100%
120 – 124 3 6% 98%
115 – 119 7 14% 92%
110 – 114 7 14% 78%
105 – 109 13 26% 64%
100 – 104 8 16% 38%
95 – 99 4 8% 22%
90 – 94 4 8% 14%
85 – 89 3 6% 6%
Σfa=50 Σfr%=100

Este de la sine înţeles că clasele de intervale (grupele) vor putea fi analizate într-o manieră
similară frecvenţelor simple, utilizând valorile absolute (fa) sau valorile relative raportate la unitate
sau procentuale (fr(1), fr%). Analizând tabelul de mai sus, putem observa că cei mai mulţi subiecţi
au obţinut un scor la testul de inteligenţă cuprins între 105 şi 109 (fa=13), aceştia reprezentând 26%
din totalul subiecţilor evaluaţi. În fine, din coloana frecvenţelor relative procentuale cumulate putem
deduce că 64% dintre subiecţi obţin o performanţă de maxim 109 sau mai mică (sau, dacă dorim, 36
% dintre subiecţi obţin o performanţă de minim 105) etc.

Exerciţiul 1: Alegeţi varianta de răspuns aleasă sau scrieţi răspunsul în text, apoi verificaţi
răspunsurile corecte
1. Percentila 25 este acea valoare a unei distribuţii care:
a. are 75% din valori mai mari decât ea
b. se întâlneşte la 25% dintre subiecţi
c. împarte distribuţia în 25 de părţi egale
d. nici una din variantele de mai sus
2. Percentila 50 este o valoare identică cu:
a. quartila 3; b. quartila 1; c. mediana; d. abaterea standard
3. Ce procent de valori este reprezentat în caseta reprezentării box-plot:
a. 50%; b. 25%; c. 30%; d. 75%
4. Ce reprezintă frecvenţa relativă raportată la unitate?
5. Ce înseamnă faptul că pe coloana frecvenţei relative procentuale din dreptul unui anumite
valori este scris 7%?
6. Cum se stabileşte limita inferioară a primei clase, în cazul unei distribuţii de frecvenţe
grupate?
7. Care este numărul recomandabil de clase într-o distribuţie de frecvenţe grupate?
8. Cum se numesc valorile de pe coloana frecvenţelor relative procentuale cumulate?
9. Cum se numeşte valoarea variabilei care corespunde unui anumit rang percentil?

2.1.2. Reprezentarea grafică a datelor


Reprezentările graficele sunt forme intuitive de prezentare a distribuţiilor de frecvenţe („o
imagine face mai mult decât o mie de cuvinte”). Ele sunt foarte frecvent utilizate pentru analiza şi
prezentarea datelor deoarece facilitează înţelegerea semnificaţiei datelor numerice. În prezent,
programele computerizate oferă mijloace extrem de puternice şi de sofisticate pentru elaborarea
reprezentărilor grafice. Dar simpla utilizare a unui astfel de program nu garantează realizarea unui
grafic eficient. În esenţă, un grafic eficient este o combinaţie reuşită între formă şi conţinutul statistic
pe care îl reflectă. Realizarea acestei combinaţii depinde de respectarea câtorva principii esenţiale:
 focalizarea pe conţinutul şi nu pe forma graficului
 este esenţial să fie evitate distorsiunile induse de forma graficului

15
 este recomandabil să fie utilizate grafice care favorizează comparaţii între variabile şi nu
doar reprezentări individuale, “statice”, ale acestora
 fiecare grafic trebuie să servească un singur scop, exprimat clar şi evident
 orice grafic va fi însoţit de informaţii statistice şi descrierile necesare pentru a fi uşor şi
corect înţeles
 un grafic trebuie să scoată în evidenţă datele şi nu abilităţile tehnice de editare ale celui
care l-a creat.

Formele de expresie grafică a datelor statistice sunt foarte numeroase. Ne vom ocupa aici
doar de câteva dintre acestea, cel mai des utilizate:
• graficul de tip bară
• histograma
• poligonul de frecvenţe
• graficul frecvenţei cumulate
• graficul circular
• graficul de tip „stem and leaf” („tulpină şi frunze”)

1.Graficul de tip bară


Este cel mai simplu mod de reprezentare grafic ă a datelor. Se utilizează atunci când dorim să
reprezentăm o variabilă „discretă” (care prezint ă valori întregi, de exemplu, numărul de răspunsuri
corecte la un test în funcţie de nivelul de instruire al subiecţilor).
În mod obişnuit, un grafic se prezintă ca o imagine inclusă într-un sistem de axe
perpendiculare:
 Axa orizontală (Ox) pe care sunt reprezentate valorile distribuţiei;
 Axa verticală (Oy) pe care sunt reprezentate frecvenţele fiecărei valori, sub
forma unei bare rectangulare.

Iată cum arată un grafic de acest tip efectuat pe datele din tabelul de frecvenţe grupate, luând
clasele drept valori ale distribuţiei. Cu cât frecvenţa unei valori este mai mare, cu atât bara este mai
mare. Simplitatea şi claritatea este cea mai mare calitate a acestui tip de grafic.

2.Histograma
La prima vedere, histograma este asemănătoare cu graficul de tip bară. Ea este mai adecvată
pentru situaţiile când variabila pe care dorim să o reprezentăm este de tip „continuu” (adică poate lua
orice valoare pe o scală numerică, de ex., număr de răspunsuri corecte, timpul de reacţie, lungimea ).
Iată, de exemplu, histograma distribuţiei de frecvenţe din tabelul 3 (realizată cu programul SPSS):

16
Se observă faptul că programul a realizat automat o grupare de frecvenţe, afişând pe axa Ox
limita minimă a intervalului ca „etichetă” a acestuia.
În principiu, nimic nu ne împiedică să realizăm o histogramă pe aceleaşi valori care au fost
reprezentate pe un grafic de tip bară.

3.Poligonul de frecvenţe
Este o reprezentare alternativă la histogramă. Punctele centrale ale suprafeţelor rectangulare
care reprezintă frecvenţa sunt unite cu o linie care delimitează suprafaţa poligonului.

Poligonul alăturat prezintă distribuţia de frecvenţe grupate din tabelul de mai sus, cifrele
1,2,3,4,5,6,7,8,9 reprezentând denumirea convenţională a fiecărei clase.

4. Graficul frecvenţei cumulate


Este un grafic de tip liniar care reprezintă valorile frecvenţei absolute cumulate. Pe acest
grafic se vede cu uşurinţă câte valori se află până la o anumit ă valoare din distribuţie (datele
reprezentate sunt cele din tabelul 3, fiecare interval de clasa fiind etichetat convenţional cu cifre
de la 1 la 9).

5.Graficul circular
Este utilizat în situaţiile în care valorile sunt „parte a unui întreg”. De exemplu, poate fi
utilizat la reprezentarea distribuţiei de frecvenţe grupate de mai sus, pentru a avea o imagine directă a
ponderii frecvenţei fiecărei clase de interval în raport cu celelalte.

17
Graficul alăturat reprezintă frecvenţa absolută a claselor de interval ale aceleiaşi distribuţii de
mai sus. Pe un grafic de acest tip se pot reprezenta fie valorile absolute, fie procentajul fiecărei clase
raportat la întreg.

6.Reprezentarea de tip stem-and-leaf (stem plot)


Este o reprezentare care încearcă să îmbine expresia numerică cu cea grafică, fiind propusă de
statisticianul J.W. Tuckey (1977). Scopul principal a fost acela de a oferi nu doar o imagine a
distribuţiei ci şi o metodă de explorare a acesteia.
Atunci când utilizăm o distribuţie de frecvenţe grupate, cazurile individuale „se pierd” la
nivelul fiecărei clase de interval fără a mai putea şti unde se plasează fiecare valoare iniţială în
interiorul fiecărui interval. Reprezentarea de tip stem-and-leaf (pe scurt stem plot), are tocmai
avantajul de a realiza graficul distribuţiei cu păstrarea valorilor individuale.

Modul de realizare
Să revenim la distribuţia prezentată anterior:
101 94 87 117 115 116 91 113 96 105
92 107 118 114 98 112 101 114 107 109
97 109 124 102 118 113 116 106 108 89
106 108 115 92 97 102 108 102 109 114
107 104 110 101 101 121 125 86 109 123

Mai întâi, observăm că valorile sunt cuprinse între 86 şi 125. Alegem o valoare convenabil ă
pentru tulpină, care va juca rolul de interval de clasa, care în cazul nostru poate fi 10. „Tulpina”
reprezentării stem plot este în acest caz numărul de zeci din fiecare valoare individuală.

Stem-and-Leaf
8 . 679
9 . 1224
9 . 6778
10 . 11112224
10 . 5667778889999
11 . 0233444
11 . 5566788
12 . 134
12 . 5
Mărimea tulpinii”: 10

Valorile din coloana stem indică numărul de zeci, iar cele din coloana Leaf, numărul de
unităţi. Dacă privim imaginea în ansamblu ne-o putem reprezenta ca pe o histogramă orizontală. În
acest exemplu:
Stem 8, urmat de Leaf 679 indică faptul că variabila noastră are în compunere valorile
86,87,89.
Stem 12, urmat de leaf 134, ne arată că distribuţia conţine valorile 121, 123,124

Exerciţiul 2: Scrieţi răspunsul în text, apoi verificaţi răspunsurile corecte


1. Pentru ce scale de măsurare se utilizează graficul de tip histogramă?
2. Prin ce se deosebeşte graficul de tip stem-and-leaf de histograma?
3. În ce situaţie se utilizează graficul de tip circular?
4. Faceţi reprezentarea stem-and-leaf pentru următoarea distribuţie de valori: 29, 28, 36, 41,
25, 15, 33, 40, 33, 20, 35, 26, 32, 23

18

S-ar putea să vă placă și