Documente Academic
Documente Profesional
Documente Cultură
, $
%
, $
&,
care mpart seria n patru pri
egale, delimitnd cte %'( din observaii, )igura &.&)
Cuantilele de ordin 10 #decile, notate *
,
...., *
+
i care delimiteaz cte ,( din
observaii, *
'
- .e)
Cuantilele de ordin 100 #centile, care delimiteaz cte ( din observaii)
/uantilele de ordin mai mare dect % se )olosesc n cazul seturilor de date de volum
mare # &, n )
Figura 3.3 Cuartilele ntr-o serie de repartiie
De exemplu, ne poate interesa capacitatea de cazare (locuri) peste care se situeaz cele mai
mari 20% dintre unitile de cazare dintr-o zon de destinaie turistic, ori nivelul ncasrilor
su! care s-au situat cele mai "sla!e# 2$% din zile, din punctul de vedere al v%nzrilor realizate
de un ma&azin comercial' De asemenea, n statisticile o(iciale, pentru analiza nivelului de trai
sunt urmrite decilele re(eritoare la veniturile )i c*eltuielile totale ale &ospodriilor'
+ndicatorii de poziie #cuantilele) pot )i )olosii pentru a analiza (orma distri!uiei,
ast)el:
- de e!emplu, dac prima decil #decila in)erioar) este mai apropiat #ca valoare)
de median, n timp ce decila a noua #decila superioar) este relativ mai deprtat de
median, vom concluziona c distribuia este pozitiv nclinat ctre valorile mari ale
variabilei0
- dac prima i cea de-a treia cuartil sunt situate apro!imativ la aceeai distan de
median, vom concluziona c distribuia variabilei este apro!imativ simetric.
1e baza acestor indicatori medii de poziie se poate alctui un rezumat al celor cinci
indicatori, care o)er in)ormaii privind tendina central, dar i )orma distribuiei
studiate. 2ceste cinci valori sunt:
- valoarea minim x
min
#denumit, uneori, percentila ,)0
- cuartila in(erioar Q
).
6bservaiile situate la stnga sau la dreapta valorilor e!treme #dac este cazul)
ast)el stabilite sunt considerate date a!erante #outliers) i, opional, )igurate n
diagram.
Dia&rama -oxplot este o )orm gra)ic )oarte sugestiv, o)erind in)ormaii legate de
tendina central #mediana), mpr)tierea valorilor #intervalele intercuartilice), valorile
extreme i cele a!erante.
.entru un e)antion de $0 de pacieni au (ost nre&istrate date re(eritoare la nivelul colesterolului
(concentraia de colesterol n s%n&e, msurat n m&/dl)0
%', %,, %3, %, 7, 8, %, 9, %3, 3,
8, %%, ', %8, ', 7, 9, 3, 7, +,
3' %%, ', 9, %, %%, %, %&, 3, %%,
%&, 7, %', %&, %&, %3, 9, %8, %3, %,,
+, 8, 7, %', 7, 8, +, %%, %8, %,,
1tiliz%nd (uncia :;/:5 &'()*+,- ce are drept ar&umente setul de date )i numrul
cuartilei dorite (valori ntre 0 )i 2) se o!in valorile0
.rdinul
cuartilei /aloarea
, #xmin) 3,
#Q) 9,
% #.e) %,,
& #Q) %&,
3 #xmax) %8,
1rogramul 000 permite determinarea cuantilelor de di)erite ordine )olosind urmtoarea secven de
comenzi:
3nal4ze
Descriptive 5tatistics
6requencies
5tatistics
Quartiles, .ercentiles
<ezultatele obinute utiliznd =1== pentru setul de date prezentat sunt:
1entru a construi diagrama 4o!-1lot utilizm urmtoarea secven de comenzi =1==:
7rap*s
8e&ac4 Dialo&s
-oxplot
9alorile o!inute se interprteaz ast(el0
- 2$% dintre pacieni au nivelul colesterolului mai mic de :;0 m&/dl<
- 2$% dintre pacieni au nivelul colesterolului mai mare de 2=0 m&/dl<
- $0% dintre pacieni au nivelul colesterolului mai mic de 200 m&/dl'