Sunteți pe pagina 1din 3

Cuantilele reprezint niveluri ale variabilei, avnd aceeai unitate de msur ca i

caracteristica studiat, indicatori utili n caracterizarea poziiei relative a unui nivel


individual n setul de date.
Cuantilele
Cuantilele (percentile, n engl.) realizeaz o divizare a distribuiei ntr-un
numr de k pri egale, localizarea lor n seria ordonat de date
determinndu-se cu relaia:
Qk

k n 1
, unde:
q

n reprezint volumul colectivitii


k reprezint indexul cuantilei
q reprezint numrul prilor n care se mparte seria de date de ctre
cuantilele luate n considerare.
n caracterizarea unui set de date, cele mai uzuale cuantile sunt:
Cuantila de ordin 2 ( mediana )
Cuantilele de ordin 4 (cuartile, notate Q1, Q2, Q3, care mpart seria n patru pri
egale, delimitnd cte 25% din observaii, figura 3.3)
Cuantilele de ordin 10 (decile, notate D1, ...., D9 i care delimiteaz cte 10% din
observaii, D5 = Me)
Cuantilele de ordin 100 (centile, care delimiteaz cte 1% din observaii)
Cuantilele de ordin mai mare dect 2 se folosesc n cazul seturilor de date de volum
mare ( n 30 )

Figura 3.3 Cuartilele ntr-o serie de repartiie

De exemplu, ne poate interesa capacitatea de cazare (locuri) peste care se situeaz cele mai
mari 20% dintre unitile de cazare dintr-o zon de destinaie turistic, ori nivelul ncasrilor sub
care s-au situat cele mai slabe 25% din zile, din punctul de vedere al vnzrilor realizate de un
magazin comercial. De asemenea, n statisticile oficiale, pentru analiza nivelului de trai sunt
urmrite decilele referitoare la veniturile i cheltuielile totale ale gospodriilor.

Indicatorii de poziie (cuantilele) pot fi folosii pentru a analiza forma distribuiei,


astfel:
- de exemplu, dac prima decil (decila inferioar) este mai apropiat (ca valoare)
de median, n timp ce decila a noua (decila superioar) este relativ mai deprtat de
median, vom concluziona c distribuia este pozitiv nclinat ctre valorile mari ale
variabilei;
- dac prima i cea de-a treia cuartil sunt situate aproximativ la aceeai distan de
median, vom concluziona c distribuia variabilei este aproximativ simetric.

Pe baza acestor indicatori medii de poziie se poate alctui un rezumat al celor cinci
indicatori, care ofer informaii privind tendina central, dar i forma distribuiei
studiate. Aceste cinci valori sunt:
- valoarea minim xmin (denumit, uneori, percentila 0);
- cuartila inferioar Q1 (delimiteaz cele mai mici 25% din valori);
- mediana Me (delimiteaz 50% din valori);
- cuartila superioar Q3 (delimiteaz cele mai mari 25% din valori);
- valoarea maxim xmax (denumit, uneori, a 100-a percentil).
Cele cinci valori se reprezint grafic prin intermediul diagramei Box-Plot (figura
3.4).

Figura 3.4 Diagrama Box-Plot

n cadrul diagramei Box-Plot, cutia cuprinde 50% din valorile situate n centrul
distribuiei (valori situate ntre cuartilele Q1 i Q3). Linia din interior reprezint valoarea
median, iar liniile inferioar, respectiv superioar sunt date de valorile extreme ale seriei
(xmin i xmax).
Valorile extreme ale unei serii de date nu trebuie confundate cu valorile
aberante (outliers, n engl.).
Diagrama Boxplot este util i pentru identificarea valorilor aberante.
Astfel, valorile extreme ale setului de date sunt fixate la o limit maxim
egal cu 1,5*lungimea cutiei (lungimea cutiei este Q3-Q1).
Observaiile situate la stnga sau la dreapta valorilor extreme (dac este cazul)
astfel stabilite sunt considerate date aberante (outliers) i, opional, figurate n
diagram.
Diagrama Boxplot este o form grafic foarte sugestiv, oferind informaii legate de
tendina central (mediana), mprtierea valorilor (intervalele intercuartilice), valorile
extreme i cele aberante.

Pentru un eantion de 50 de pacieni au fost nregistrate date referitoare la nivelul colesterolului


(concentraia de colesterol n snge, msurat n mg/dl):
250
160
145
230
190

200
220
220
180
160

240
150
150
250
180

210
260
170
230
250

180
150
210
230
180

160
180
220
240
160

210
170
210
170
190

170
140
230
260
220

240
180
140
240
260

Utiliznd funcia EXCEL QUARTILE ce are drept argumente setul de date i numrul
cuartilei dorite (valori ntre 0 i 4) se obin valorile:
Ordinul
cuartilei
0 (xmin)
1 (Q1)
2 (Me)
3 (Q1)
4 (xmax)

Valoarea
140
170
200
230
260

140
190
220
200
200

Programul SPSS permite determinarea cuantilelor de diferite ordine folosind urmtoarea secven de
comenzi:
Analyze
Descriptive Statistics
Frequencies
Statistics
Quartiles, Percentiles

Rezultatele obinute utiliznd SPSS pentru setul de date prezentat sunt:

Pentru a construi diagrama Box-Plot utilizm urmtoarea secven de comenzi SPSS:


Graphs
Legacy Dialogs
Boxplot

Valorile obinute se interprteaz astfel:


- 25% dintre pacieni au nivelul colesterolului mai mic de 170 mg/dl;
- 25% dintre pacieni au nivelul colesterolului mai mare de 230 mg/dl;
- 50% dintre pacieni au nivelul colesterolului mai mic de 200 mg/dl.

S-ar putea să vă placă și