Sunteți pe pagina 1din 6

3.4.

Ali indicatori de localizare


n afar de indicatori de tendin central, care au sens doar pentru distribuiile
unimodale, putem vorbi de indicatori de localizare a tendinelor extreme sau intermediare,
valabili pentru orice distribuii. De pild, valorile minim i maxim dintr-un ir (notate n
mod curent, xmin, respectiv xmax) sunt exemple de indicatori de localizare a extremelor, cu sens
pentru orice distribuie.
n continuare, generaliznd modelul "geometric" al medianei, vom introduce o gam
foarte utilizat de indicatori de localizare (cuartilele, decilele, i centilele) i o generalizare a
acestora (cuantilele de ordinul m). n finalul paragrafului se prezint generalizarea
conceptelor de cuantil inferioar, respectiv superioar de ordinul m, i anume -cuantila
inferioar, respectiv superioar. Ultimele dou noiuni vor fi extrem de importante n special
pentru statistica inductiv.

3.4.1. Cuartile
1 Notaii: Q1, Q2, respectiv Q3.
2 Definiii

n cazul unei curbe de frecvene (distribuie continu a unei variabile continue),


cuartilele = cele 3 puncte care mpart aria de sub curba de frecvene n 4 arii egale
(fiecare arie reprezentnd 25% din ntreaga arie de sub curb).


Observaie: Cuartila a doua, Q2, este


chiar mediana, Me, i este, deci, un
indicator de tendin central, n timp ce
cuartilele ntia i a treia, Q1, respectiv
Q3, sunt indicatori de localizare a unor
tendine intermediare.

n cazul seriilor statistice, cuartile = trei valori care mpart seria statistic ordonat
cresctor n patru subserii de volume egale (volumele fiind msurate n numr de uniti
statistice i, eventual, ptrimi ale acestora).

Q1 se numete cuartil inferioar i las la stnga sa, n seria statistic ordonat

cresctor, 25% din termeni i, eventual, ptrimi ale acestora.


Q2 este mediana seriei.
Q3 se numete cuartil superioar i las la stnga sa, n seria statistic ordonat
cresctor, 75% din termeni i, eventual, ptrimi ale acestora.
n acest caz, definiia poate conduce la valori unice doar cu convenii suplimentare,
ntocmai ca la definiia medianei n acelai context. Conveniile necesare pentru stabilirea
unor valori unice vor rezulta din exemplul urmtor.
Exemplul 3.4.1.

Fie urmtoarea serie de 6 concentraii de oxigen msurate n mg/l, n apa din Delta
Dunrii i ordonate cresctor:
3,2 5,9 6,6 8,1 9,3 9,8.
Numerele ordonate sunt ca nite mrgele nirate, la diverse distane, pe o a. Strngem
mrgelele unele lng altele desfiinnd distanele. Astfel numerele devin ranguri. Tiem apoi acest
irag n patru pri egale - de cte o mrgea i jumtate, n acest caz - ca n mijlocul figurii urmtoare.

Cuartila inferioar, Q1, va tia mijlocul mrgelei a 2-a, adic va fi 5,9. Mediana va
cdea ntre cea de-a 3-a i cea de-a patra mrgea. Va fi semisuma acestora: Me = (6,6 + 8,1) / 2 =
7,35. Cuartila superioar Q3, va tia mijlocul mrgelei a 5-a. Va fi, deci, 9,3.
n practic, calculul cuartilei Ql, pentru l = 1, 2, 3, se face astfel, conform conveniilor
introduse mai sus:
Ordonm ascendent seria de volum N.
Calculm rangul cuartilei respective rg(Ql) = N (l / 4).

Dac rg(Ql) este numr fracionar, l rotunjim prin adaos i Ql este termenul cu rangul
rotunjit. n caz contrar, Ql este semisuma dintre termenul cu rangul rg(Ql) i
urmtorul termen.
n cazul exemplului anterior, seria ordonat ascendent fiind:
x1
x2
x3
x4
x5
x6
3,2

rg (Q1) = 6 (1 / 4) =

2
14,

6,6

8,1

9,3

9,8

rotunjit prin adaus = 2 Q1 = x2 din seria ordonat ascendent = 5,9.

Rg (Q2) = 6 (2 / 4) = 3 Q2 = Me =
Rg (Q3) = 6 (3 / 4) =

5,9

2
44,

x3 + x4
2

(x3, x4 din seria ordonat ascendent) =

6 ,6 + 8,1
= 7,35.
2

rotunjit prin adaus = 5 Q3 = x5 din seria ordonat ascendent = 9,3.

Exemplul 3.4.1.
Fie seria de volum 4 ordonat ascendent: 1; 2; 8; 8. Cuartilele vor fi numerele marcate cu bold
sub seria ordonat:
1
2
8
8
1,5
5
8
Exemplul 3.4.1.
S se calculeze cuartilele pentru seria 8; 7; 3; 1; 2.
Rezolvare:
Ordonm ascendent seria i marcm cu bold cuartilele:
1
2
3
7
8
2
3
7

3.4.2. Decile i centile


n mod analog, se introduc noiunile de decile (D1, D2, ..., D9) i de (per)centile (C1, C2, ... ,
C99), respectiv de decil inferioar (D1), decil superioar (D9), centil inferioar (C1) i centil superioar
(C99).

Definiiile decilelor, respectiv, ale centilelor se pot obine nlocuind n definiia cuartilelor
cuvntul trei cu nou, respectiv cu nouzeci i nou i cuvntul ptrimi cu zecimi, respectiv
cu sutimi. Algoritmul de calcul al acestora se poate obine, de asemenea, nlocuind n algoritmul de

calcul al cuartilelor, expresia N (l / 4) cu N (l / 10), respectiv cu N (l / 100). Cele mai


utilizate centile sunt C5 i C95.

1 Metod de calcul rapid


Pentru calculul rapid al centilelor propunem utilizarea urmtoarei metode. Aceasta
presupune trei pai.
Pasul 1. Pornim de la distribuia de frecvene relative procentuale a se vedea primele
dou coloane din tabela urmtoare. n coloana 1 (notat Col. 1) sunt trecute, ordonat
ascendent, valorile distincte al seriei, iar n coloana 2 (Col. 2) frecvenele relative procentuale
ale valorilor din prima coloan - denumite pe scurt procente.
Pasul 2. Construim coloana 3, care cuprinde frecvenele relative procentuale cumulate
pe scurt, procentele cumulate. Modul de calcul al acestora este descris de sgeile din
tabel:

primul element se transcrie din coloana de procente,

oricare din urmtoarele elemente este suma dintre:


- elementul din aceeai linie din coloana de procente i
- elementul precedent din propria coloan (de procente cumulate).
Exemplul 3.4.2.
S-a msurat greutatea, n kilograme, pentru 103 biei de 17 ani (date Dr. Cristiana Glavce).
Calculndu-se procentele valorilor distincte i procentele cumulate, s-a obinut tabela urmtoare, n
care numerele din coloanele 2 i 3 sunt procente.
Col. 1

Col. 2
%
1,0
1,9
1,9
2,8
1,0
1,9
1,0
6,8
3,9
7,8

Col. 3
%

Col. 1

Col. 2
%
2,8
1,0
4,9
6,8
7,8
5,8
1,0
1,0
7,8
6,8

Col. 3
%

Col. 1

Col. 2
%
2,9
1,9
1,0
6,8
2,9
3,9
1,0
1,9
1,0
1,0

Col. 3
%

1,0
32,8
78,6
57
66
2,9
33,8
80,5
58
67
4,8
38,7
81,5
59
68
7,6
45,5
88,3
60
69
8,6
53,3
91,2
61
70
10,5
59,1
95,1
62
71
11,5
60,1
96,1
63
72
18,3
61,1
98,0
63,5
75
22,2
68,9
99,0
64
77
30,0
75,7
100,0
65
80
Pasul 3. Determinm centila dorit. Pentru aceasta cutm n coloana 3 - de procente
cumulate - cel mai apropiat procent mai mare sau egal cu indicele centilei respective. Dac
procentul cumulat, astfel determinat, este mai mare strict dect indicele centilei, valoarea din
coloana 1 de pe aceeai linie va fi centila cutat. n caz de egalitate, centila va fi semisuma
dintre valoarea din coloana 1 de pe aceeai linie i valoarea de pe linia urmtoare.
44
46
47
49
51
52
53
54
55
56

Exemplul 3.4.2.
Pentru centila C3 gsim procentul cumulat 4,8 care este pe linia valorii 47. Deoarece 4,9 > 3
rezult C3 = 47.
n mod analog, pentru centila C30 gsim procentul cumulat 30, care este pe linia valorii 56.
Procentul cumulat fiind egal cu indicele centilei, rezult C30 = (56+57)/2 = 56,5.

Metoda poate fi utilizat i pentru calculul decilelor, cuartilelor i al medianei:

Exemplul 3.4.2.
Decilele se calculeaz innd cont c D1 = C10, D2 = C20, etc. Analog, cuartilele:
Q1 = C25 = 56, deoarece 30,1 - procentul cumulat superior cel mai apropiat de 25 - se afl pe
linia lui 56. Analog, Q2 = Me = C50 = 61, iar Q3 = C75 = 65.

In practic vom calcula centile doar pentru serii de volum mare (n > 200), cci o regul
de bun sim ne cere s mprim n o sut de pri doar serii cu numr mult mai mare de
uniti. Exemplul 3.4.2. cu volum 103 are doar rol didactic.
Scri de clasif icare bazate pe centile

Cu ajutorul unor
centile se alctuiesc scri
de
clasificare.
De
exemplu, n prac-tica
antropologic
se
pot
utiliza centilele C3, C10,
C25, C75, C90 i C97 pentru
stabilirea categoriilor unor
di-mensiuni (foarte mi-c,

mic, medie, mare


foarte mare) [14].

Deci o scar de clasificare cu 5 trepte, bazat pe centile este urmtoarea:


Interval de variaie a dimensiunii x: Diagnostic (clas) dimensiune:
C3 x < C10 foarte mic
C10 x < C25 mic
C25 x < C75 medie
C75 x < C90 mare
C90 x < C97 foarte mare
Valorile mai mici dect C3 sau mai mari dect C97 sunt excluse din serie.
Exemplul 3.4.2.
Calculnd pentru distribuia din exemplul 3.4.2. - dup modelul anterior - centilele necesare
acestei scri de clasificare, obinem C3 = 47, C10 = 52, C25 = 56, C75 = 65, C90 = 70 i C97 = 75.
Intervalele i denumirile vor fi:
47 x < 52 foarte mic ca greutate
Valorile mai mici dect
52 x < 56 mic ca greutate
47 kg i cele mai mari
56 x < 65 mediu ca greutate
sau egale cu 75 kg sunt
65 x < 70 are ca greutate
excluse din clasificare.
70 x < 75 foarte mare ca greutate

Recomandm utilizarea scrilor bazate pe centile n cazul distribuiilor asimetrice.


Acestea au aceeai logic de construcie ca i mediana Me - care este centila C50 - i care
exprim mai bine tendina central pentru distribuiile unimodale asimetrice. n cazul
distribuiilor simetrice recomandm scrile sigmatice vezi punctul 1 din 3.7.5.

3.4.3. Generalizare - cuantilele de ordinul m

n cazul unei curbe de frecvene (distribuie continu a unei variabile continue),


cuantilele sau fractilele de ordinul m = cele m - 1 valori care mpart aria de sub curba
de frecvene n m arii egale. Evident m = 2, 3, ... ,t.
n cazul seriilor statistice, cuantile sau fractile de ordinul m = (m - 1) valori care separ
seria statistic ordonat cresctor n m subserii de volume egale, volumele fiind msurate
n numr de uniti statistice i eventual fraciuni ale acestora. Evident m = 2, 3, ... ,t.
Pentru simplificarea enunului urmtor vom nota fractilele prin Fm1, Fm2, ... , Fml, ... , Fmm-1.






n practic, calculul celei de-a l-a cuantile de ordinul m, pentru l = 1, 2, 3, , m 1 se


face astfel:

Ordonm ascendent seria de volum N.

Calculm rangul cuantilei respective rg(Fml) = N (l / m).

Dac rg(Fml) este numr fracionar, l rotunjim prin adaos i cea de-a l-a cuantil de
ordinul m este termenul cu rangul rotunjit. n caz contrar, este semisuma dintre
termenul cu rangul rg(Fml) i urmtorul termen.
Se observ c:
mediana este cuantila de ordinul 2,
cuartilele sunt cuantilele de ordinul 4,
decilele sunt cuantilele de ordinul 10,
centilele sunt cuantilele de ordinul 100.

Urmtoarele definiii generalizeaz noiunile de cuartil superioar i cuartil


inferioar.
Cuantila superioar de ordinul m = cea mai mare cuantil de ordinul m.
Cuantila inferioar de ordinul m = cea mai mic cuantil de ordinul m.
 Cuantila superioar de ordinul m las la dreapta sa 1 / m
din aria distribuiei (n cazul distribuiilor continue), respectiv

din termenii seriei i eventual fraciuni ale acestora (n cazul seriilor statistice).
 Cuantila inferioar de ordinul m las la stnga sa 1 / m
din aria distribuiei (n cazul distribuiilor continue), respectiv

din termenii seriei i eventual fraciuni ale acestora (n cazul seriilor statistice).
Pentru distribuiile continue (teoretice) este util generalizarea noiunilor de cuantil
superioar, respectiv inferioar, de ordinul m. Este vorba de a lucra cu orice proporii din
arii (cu 0 < < 1), nu numai cu valori particulare de forma 1 / m.

3.4.4. -cuantile unilaterale i bilaterale


1 -cuantile unilaterale
Fie o curb de frecvene (distribuie continu a unei variabile continue),

-cuantila unilateral superioar = punctul care las la DREAPTA sa proporia


(respectiv procentul 100 %) din aria distribuiei. Se noteaz x.
Pentru distribuiile teoretice cu care se lucreaz n teoria probabilitilor i n statistica
inductiv, -cuantilele unilaterale superioare importante n aplicaii sunt tabelate. Tabelele
conin fie -cuantile n funcie de , fie invers. Modul de consultare a acestor tabele va fi
prezentat i exersat n paragraful dedicat distribuiei normale (3.7.) i n cadrul capitolelor de
statistic inductiv.
Definiia -cuantilelor unilaterale inferioare se obine nlocuind n definiia anterioar
cuvntul DREAPTA cu STANGA. Se noteaz x1- deoarece las la dreapta aria 1 - .

Se observ c x1 - = - x pentru orice


dac i numai dac distribuia este
simetric fa de axa x = 0 (simetrie
denumit, pe scurt, fa de zero) ca n
cazul distribuiei normale standard i al
distribuiilor Student (care vor fi
prezentate n cadrul statisticii inductive.).

n caz contrar (adic n cazul


distribuiilor asimetrice sau simetrice dar
nu fa de zero), egalitatea de mai sus nu
mai este valabil. Acesta este, de
exemplu, cazul distribuiilor 2 (care vor
fi prezentate, de asemenea, n cadrul
statisticii inductive).

n general, prin -cuantil (inferioar sau superioar) vom nelege -cuantil unilateral
(inferioar sau superioar).

-cuantile bilaterale
n cazul -cuantilelor unilaterale, aria a fost plasat ntr-o singur parte a
distribuiei. n cadrul paragrafului 10.2. dedicat testelor binare precum i n cadrul statisticii
inductive se va vedea utilitatea plasrii unui (dat) n ambele capete ale distribuiei prin
divizare n dou arii egale (cu / 2). n acest caz, vom vorbi de -cuantile bilaterale.

-cuantila bilateral superioar = punctul care las la DREAPTA sa


proporia / 2 (respectiv procentul / 2 100 %) din aria distribuiei.
Se noteaz x / 2 .

-cuantila bilateral inferioar = punctul care las la STANGA sa


proporia / 2 (respectiv procentul / 2 100 %) din aria distribuiei.
Se noteaz x 1 - / 2.


0,05-cuantilele bilaterale pentru
distribuia normal standard sunt figurate n
desenul alturat.





-cuantila bilateral superioar este / 2-cuantila unilateral superioar,


-cuantila bilateral inferioar este / 2-cuantila unilateral inferioar.
Cele dou -cuantile bilaterale sunt egale i de semne contrare distribuia este
simetric fa de origine (conform ultimei proprieti de la -cuantile unilaterale i innd
cont de observaiile anterioare).

S-ar putea să vă placă și