Sunteți pe pagina 1din 3

Cuantilele reprezint niveluri ale variabilei, avnd aceeai unitate de msur ca i

caracteristica studiat, indicatori utili n caracterizarea poziiei relative a unui nivel


individual n setul de date.
Cuantilele
Cuantilele (percentile, n engl.) realizeaz o divizare a distribuiei ntr-un
numr de k pri egale, localizarea lor n seria ordonat de date
determinndu-se cu relaia:

( )
q
n k
Q
k
+
=
, unde:
n reprezint volumul colectivitii
k reprezint inde!ul cuantilei
q reprezint numrul prilor n care se mparte seria de date de ctre
cuantilele luate n considerare.
"n caracterizarea unui set de date, cele mai uzuale cuantile sunt:
Cuantila de ordin 2 # mediana )
Cuantilele de ordin 4 #cuartile, notate $

, $
%
, $
&,
care mpart seria n patru pri
egale, delimitnd cte %'( din observaii, )igura &.&)
Cuantilele de ordin 10 #decile, notate *
,
...., *
+
i care delimiteaz cte ,( din
observaii, *
'
- .e)
Cuantilele de ordin 100 #centile, care delimiteaz cte ( din observaii)
/uantilele de ordin mai mare dect % se )olosesc n cazul seturilor de date de volum
mare # &, n )
Figura 3.3 Cuartilele ntr-o serie de repartiie
De exemplu, ne poate interesa capacitatea de cazare (locuri) peste care se situeaz cele mai
mari 20% dintre unitile de cazare dintr-o zon de destinaie turistic, ori nivelul ncasrilor
su! care s-au situat cele mai "sla!e# 2$% din zile, din punctul de vedere al v%nzrilor realizate
de un ma&azin comercial' De asemenea, n statisticile o(iciale, pentru analiza nivelului de trai
sunt urmrite decilele re(eritoare la veniturile )i c*eltuielile totale ale &ospodriilor'
+ndicatorii de poziie #cuantilele) pot )i )olosii pentru a analiza (orma distri!uiei,
ast)el:
- de e!emplu, dac prima decil #decila in)erioar) este mai apropiat #ca valoare)
de median, n timp ce decila a noua #decila superioar) este relativ mai deprtat de
median, vom concluziona c distribuia este pozitiv nclinat ctre valorile mari ale
variabilei0
- dac prima i cea de-a treia cuartil sunt situate apro!imativ la aceeai distan de
median, vom concluziona c distribuia variabilei este apro!imativ simetric.
1e baza acestor indicatori medii de poziie se poate alctui un rezumat al celor cinci
indicatori, care o)er in)ormaii privind tendina central, dar i )orma distribuiei
studiate. 2ceste cinci valori sunt:
- valoarea minim x
min
#denumit, uneori, percentila ,)0
- cuartila in(erioar Q

#delimiteaz cele mai mici %'( din valori)0


- mediana ,e #delimiteaz ',( din valori)0
- cuartila superioar Q
&
#delimiteaz cele mai mari %'( din valori)0
- valoarea maxim x
max
#denumit, uneori, a ,,-a percentil).
/ele cinci valori se reprezint gra)ic prin intermediul diagramei Box-lot #)igura
&.3).
Figura 3.4 !iagrama Box-lot
"n cadrul diagramei 4o!-1lot, cutia cuprinde ',( din valorile situate n centrul
distribuiei #valori situate ntre cuartilele $

i $
&
). 5inia din interior reprezint valoarea
median, iar liniile in)erioar, respectiv superioar sunt date de valorile e!treme ale seriei
#x
min
i x
max
).
Valorile extreme ale unei serii de date nu trebuie con)undate cu valorile
aberante #outliers, n engl.).
*iagrama 4o!plot este util i pentru identi)icarea valorilor aberante.
2st)el, valorile extreme ale setului de date sunt )i!ate la o limit" maxim"
egal" cu 1#$%lungimea cutiei #lungimea cutiei este $
&
-$

).
6bservaiile situate la stnga sau la dreapta valorilor e!treme #dac este cazul)
ast)el stabilite sunt considerate date a!erante #outliers) i, opional, )igurate n
diagram.
Dia&rama -oxplot este o )orm gra)ic )oarte sugestiv, o)erind in)ormaii legate de
tendina central #mediana), mpr)tierea valorilor #intervalele intercuartilice), valorile
extreme i cele a!erante.
.entru un e)antion de $0 de pacieni au (ost nre&istrate date re(eritoare la nivelul colesterolului
(concentraia de colesterol n s%n&e, msurat n m&/dl)0
%', %,, %3, %, 7, 8, %, 9, %3, 3,
8, %%, ', %8, ', 7, 9, 3, 7, +,
3' %%, ', 9, %, %%, %, %&, 3, %%,
%&, 7, %', %&, %&, %3, 9, %8, %3, %,,
+, 8, 7, %', 7, 8, +, %%, %8, %,,
1tiliz%nd (uncia :;/:5 &'()*+,- ce are drept ar&umente setul de date )i numrul
cuartilei dorite (valori ntre 0 )i 2) se o!in valorile0
.rdinul
cuartilei /aloarea
, #xmin) 3,
#Q) 9,
% #.e) %,,
& #Q) %&,
3 #xmax) %8,
1rogramul 000 permite determinarea cuantilelor de di)erite ordine )olosind urmtoarea secven de
comenzi:
3nal4ze
Descriptive 5tatistics
6requencies
5tatistics
Quartiles, .ercentiles
<ezultatele obinute utiliznd =1== pentru setul de date prezentat sunt:
1entru a construi diagrama 4o!-1lot utilizm urmtoarea secven de comenzi =1==:
7rap*s
8e&ac4 Dialo&s
-oxplot
9alorile o!inute se interprteaz ast(el0
- 2$% dintre pacieni au nivelul colesterolului mai mic de :;0 m&/dl<
- 2$% dintre pacieni au nivelul colesterolului mai mare de 2=0 m&/dl<
- $0% dintre pacieni au nivelul colesterolului mai mic de 200 m&/dl'

S-ar putea să vă placă și