Documente Academic
Documente Profesional
Documente Cultură
STATISTICI DESCRIPTIVE
11
2.1.Statistici descriptive globale
Tehnicile descriptive de tip global se referă la prezentarea şi analiza tuturor valorilor unei
distribuţii statistice. Aceste tehnici sunt, la rândul lor de două feluri: numerice (analiza de
frecvenţe) şi grafice.
Valoare fa
10 2
9 2
8 5
7 3
6 7
5 1
4 4
3 0
2 1
Total
Dacă luăm în considerare seria de valori de mai sus, un tabel al frecvenţelor simple (absolute)
este compus din lista valorilor distincte, ordonate descrescător, la care se adaugă frecvenţa absolută
(fa) a fiecărei valori (de câte ori se întâlneşte în cadrul seriei). Se observă că astfel datele au un
caracter mai ordonat, iar coloana frecvenţelor absolute scoate în evidenţă anumite aspecte cum ar fi,
de exemplu, faptul că cea mai frecventă valoare este 6 (apare de 7 ori). Observăm că seria de valori
din tabel include toate valorile posibile între valoarea cea mai mare (10) şi cea mai mică (2),
incluzând şi valorile care nu se întâlnesc în mod real în cadrul seriei. În cazul nostru avem valoarea 3,
cu frecvenţa de apariţie 0. Suma frecvenţelor absolute (Σfa) indică totalul valorilor din cadrul seriei
(25). În practică, pe lângă frecvenţele absolute se iau în considerare şi alte tipuri de frecvenţe (vezi
tabelul 2):
Frecvenţa cumulată (fc). Totalul valorilor care se cumulează începând de la valoarea cea
mai mare până la valoarea cea mai mică din tabel. De exemplu, în tabelul sintetic de mai jos,
avem 6 valori mai mici sau egale cu 5, 21 de valori mai mici sau egale cu 8 şi, evident, 25 de
valori mai mici sau egale cu 10.
Frecvenţa relativă raportată la unitate fr(1). Este raportul dintre frecvenţa absolută şi
suma frecvenţelor absolute (fa/Σfa).
Exemple:
pentru valoarea 10: fa/Σfa=2/25=0.08;
pentru valoarea 6: fa/Σfa=7/25=0.13; ş.a.m.d.
Frecvenţa relativă cumulată, raportată la unitate frc(1): Este similară frecvenţei cumulate
absolute, cu deosebirea că în acest caz se cumulează frecvenţele relative.
12
Exemple:
Dacă privim întreaga serie ca întreg (egală cu 1 sau „unitate” ), atunci toate
valorile mai mici sau egale cu 5 au o frecvenţă cumulată egală cu 0.24
(adică, fr(1)=0.04+0+0.16+0.04=0.24)
Pentru valoarea 7, frecvenţa relativă cumulată raportată la unitate este:
frc(1)=0.04+0+0.16+0.04+0.28+0.12=0.64
Frecvenţa relativă cumulată pentru valoarea cea mai mare din serie este
întotdeauna 1.00 (corespunzătoare în cazul nostru valorii 10).
Frecvenţa relativă procentuală fr(%): Exprimă procentul valorilor care se situează până la
o anumită valoare din cadrul distribuţiei. Se calculează fie prin înmulţirea fr(1) cu 100, fie
prin calcularea directă procentului pe care îl reprezintă o anumită valoare raportat la totalul
valorilor dintr-o distribuţie. Suma frecvenţelor relative procentuale este întotdeauna egală cu
100.
Exemple (tabelul 2):
8% dintre studenţii evaluaţi au realizat 10 răspunsuri corecte
28% dintre studenţii evaluaţi au realizat 6 răspunsuri corecte
Frecvenţa relativă cumulată procentuală (frc%): Exprimă procentul valorilor dintr-o
distribuţie care se plasează până la o anumită valoare (inclusiv aceasta).
Exemple:
52% dintre studenţi au obţinut o notă egală sau mai mică de 6
92% au obţinut cel puţin nota 9
Desigur, pentru valoarea maximă a unei distribuţii, frecvenţa cumulată
procentuală este întotdeauna 100%.
Frecvenţa relativă procentuală cumulată se numeşte rang percentil. Astfel, despre
valoarea 6 din distribuţia de mai sus se poate spune că are rangul percentil 52, adică,
52% dintre valorile unei distribuţii sunt între cea mai mică valoare şi valoarea 6,
inclusiv.
Prin convenţie, rangul percentil se defineşte ca procentajul datelor valorilor dintr-o
distribuţie care se află până la o anumită valoare inclusiv.
În mod complementar, numim percentilă, valoarea dintr-o distribuţie care corespunde
unui anumit rang percentil. În exemplul de mai sus, rangului percentil 52 îi
corespunde valoarea 6, numită, de aceea, percentila 52.
În practică, există anumite percentile care au o importanţă aparte. Acestea sunt
percentilele corespunzătoare rangurilor percentile cu valorile 10, 20, 30,..., 100.
Despre semnificaţia lor vom vorbi mai târziu în acest curs. De asemenea, se utilizează
termenul de quartile pentru percentilele care împart distribuţia în patru zone egale ca
număr de valori. Acestea sunt corespunzătoare rangurilor percentile de 25, 50 şi 75.
Cu alte cuvinte, valoarea dintr-o distribuţie până la care se află 25% din valori este
percentila 25, valoarea până la care se află 50% este percentila 50, iar valoarea până la
care se află 75% din valori este percentila 75.
13
2.1.1.2. Analiza de frecvenţe grupate
Aranjarea unei distribuţii sub forma tabelului de frecvenţe simple este foarte utilă dar nu este
practică atunci când avem o distribuţie, cu un număr mare sau foarte mare de valori, care ar genera
un tabel cu prea multe linii pentru a fi inteligibil.
Să presupunem că valorile de mai jos reprezintă distribuţia variabilei „inteligenţă” măsurată
prin aplicarea unui test la un număr de 50 de subiecţi.
101 94 87 117 115 116 91 113 96 105
92 107 118 114 98 112 101 114 107 109
97 109 124 102 118 113 116 106 108 89
106 108 115 92 97 102 108 102 109 114
107 104 110 101 101 121 125 86 109 123
Datele din tabel sunt aranjate la întâmplare, analiza lor fiind dificilă. Presupunând că le-am
ordona şi am face tabelul frecvenţelor simple, am obţine un uşor progres, dar încă ar fi greu de
analizat deoarece vom obţine un tabel cu prea multe valori distincte.
Pentru a ne face o imagine sintetică a distribuţiei, ne propunem să realizăm un număr de
categorii (clase) cuprinse între anumite intervale de performanţă la test, urmând să stabilim apoi care
este frecvenţa de apariţie fiecărei clase în distribuţia noastră. Această tehnică de organizare a datelor
se numeşte „frecvenţa grupată”.
Pentru a realiza un tabel de frecvenţe grupate se procedează astfel:
1. Alegem numărul de intervale (clase, categorii), recomandabil, între 5 şi 15
(valori stabilite convenţional şi orientativ)
2. Definim mărimea intervalului de clasă, respectând următoarele reguli:
toate intervalele trebuie să fie egale
limitele intervalelor trebuie să cuprindă toate valorile (între limitele intervalelor
alăturate să nu existe „goluri” sau suprapuneri)
Este de la sine înţeles că clasele de intervale (grupele) vor putea fi analizate într-o manieră
similară frecvenţelor simple, utilizând valorile absolute (fa) sau valorile relative raportate la unitate
sau procentuale (fr(1), fr%). Analizând tabelul de mai sus, putem observa că cei mai mulţi subiecţi
au obţinut un scor la testul de inteligenţă cuprins între 105 şi 109 (fa=13), aceştia reprezentând 26%
din totalul subiecţilor evaluaţi. În fine, din coloana frecvenţelor relative procentuale cumulate putem
deduce că 64% dintre subiecţi obţin o performanţă de maxim 109 sau mai mică (sau, dacă dorim, 36
% dintre subiecţi obţin o performanţă de minim 105) etc.
Exerciţiul 1: Alegeţi varianta de răspuns aleasă sau scrieţi răspunsul în text, apoi verificaţi
răspunsurile corecte
1. Percentila 25 este acea valoare a unei distribuţii care:
a. are 75% din valori mai mari decât ea
b. se întâlneşte la 25% dintre subiecţi
c. împarte distribuţia în 25 de părţi egale
d. nici una din variantele de mai sus
2. Percentila 50 este o valoare identică cu:
a. quartila 3; b. quartila 1; c. mediana; d. abaterea standard
3. Ce procent de valori este reprezentat în caseta reprezentării box-plot:
a. 50%; b. 25%; c. 30%; d. 75%
4. Ce reprezintă frecvenţa relativă raportată la unitate?
5. Ce înseamnă faptul că pe coloana frecvenţei relative procentuale din dreptul unui anumite
valori este scris 7%?
6. Cum se stabileşte limita inferioară a primei clase, în cazul unei distribuţii de frecvenţe
grupate?
7. Care este numărul recomandabil de clase într-o distribuţie de frecvenţe grupate?
8. Cum se numesc valorile de pe coloana frecvenţelor relative procentuale cumulate?
9. Cum se numeşte valoarea variabilei care corespunde unui anumit rang percentil?
15