Sunteți pe pagina 1din 8

Dragomirescu L., Drane J. W., 2009, Biostatistic pentru nceptori. Vol I. Biostatistic descriptiv.

Editia a 6 revzut, Editura CREDIS, Bucure ti, 207p. ISBN 978-973-734-461-8.

3.5.

Indicatori de mprtiere

Indicatorii de mprtiere se raporteaz la indicatorii de localizare. Astfel, exist indicatori de mprtiere bazai pe: indicatori de tendin extrem i anume amplitudinea, indicatori de tendin intermediar i anume intercuartila i indicatori de tendin central i anume dispersia, abaterea standard, coeficientul de variaie. n continuare vom defini aceti indicatori numai pentru serii statistice, altfel spus distribuii discrete (fiind empirice). Pentru o nelegere mai intuitiv i vom desena ns pentru distribuii continue (teoretice).

3.5.1. Amplitudinea
1 Notaii: A, . 2 Definiie Amplitudinea = diferena dintre valoarea maxim i valoarea minim din serie: A = x max x min.
Exemplul 3.5.1. S se calculeze amplitudinea seriei: 30, 30, 26, 32, 30.

Rezolvare A = 32 - 26 = 6

3 Proprieti pozitive: negative: 2. Consider doar valorile extreme. 1. Ne ofer o imagine la valorile extreme, n particular la 3. Este sensibil general asupra mvalorile aberante. prtierii. 4. Nu este sensibil la celelalte valori n afar de valorile extreme. 5. Nu se preteaz la calcule algebrice. Din cauza ultimei proprieti, n special, amplitudinea este puin folosit (n mod analog cu moda).

3.5.2. Intercuartila
1 Notaie: IQ. 2 Definiie Intercuartila sau intervalul intercuartil sau abaterea cuartil = diferena ntre cuartila superioar i cuartila inferioar (Q3 Q1).

Dragomirescu L., Drane J. W., 2009, Biostatistic pentru nceptori. Vol I. Biostatistic descriptiv. Editia a 6 revzut, Editura CREDIS, Bucure ti, 207p. ISBN 978-973-734-461-8.

3 Proprieti 1. Intercuartila exprim abaterea fa de median, a aproximativ 50% dintre valori (sau, altfel spus, a 50% dintre valori i fraciuni ale acestora). Proprieti pozitive: 2. 3. Nu consider valorile extreme, n particular valorile aberante. Comparat cu amplitudinea A, intercuartila ofer o indicaie despre mprtierea a celor 50% din valorile grupate n centrul repartiiei fa de valorile extreme, astfel [19]:
dac IQ A / 2, distribuia este considerat intens concentrat;

Proprieti negative:

4.

Nu se preteaz la calcule algebrice .

dac IQ > A / 2, distribuia este considerat intens dispersat.

"Logica intuitiv" care a condus la stabilirea acestui criteriu pentru demarcarea conceptelor de intens concentrat, respectiv intens dispersat, se poate observa pe figura anterioar. ntr-adevr, dac intercuartila este mai mic dect jumtate din amplitudine nseamn c aproximativ 50% din puncte (cele cuprinse ntre cuartilele extreme) sunt plasate grupat aproximativ n jurul cuartilei centrale (medianei), deci distribuia este intens concentrat. Reprezentarea sintetic sub form de "boxplot" (vezi partea de jos a figurii anterioare) a oricrei distribuii, pune extrem de sugestiv n eviden logica criteriului de mai sus. Reprezentare sub form de "boxplot" = un segment avnd drept extremiti valorile extreme, peste interiorul segmentului fiind suprapuse, dou "plot"-uri (parcele) sub form de "box"-uri (cutii) alipite, cotele orizontale ale acestora fiind cele trei cuartile.

Dragomirescu L., Drane J. W., 2009, Biostatistic pentru nceptori. Vol I. Biostatistic descriptiv. Editia a 6 revzut, Editura CREDIS, Bucure ti, 207p. ISBN 978-973-734-461-8.

(nlimile "cutiilor" sunt egale cu o valoare arbitrar.) Exist i alte convenii de desenare a boxplot-urilor.

3.5.3. Indicatori de mprtiere n jurul tendinei centrale reprezentate de medie n continuare vom prezenta dispersia, abaterea standard i coeficientul de variaie.

Acetia sunt indicatori de mprtiere care in cont de toate valorile, pe de o parte, i care msoar mprtierea n jurul mediei, pe de alt parte. Pentru toi aceti indicatori este necesar s definim, mai nti, noiunea de abatere a unei valori fa de un numr fixat. Abaterea unei valori xi fa de un numr a, n particular fa de valoarea medie, M = diferena (xi - a), respectiv, (xi - M). Prima idee pentru alctuirea unui indicator de mprtiere pe baza abaterilor valorilor fa de un indicator de tendin central, de exemplu media M, este s calculm media aritmetic a abaterilor.
Fie seria de valori: 2, 3, 7. Media este (2 + 3 + 7) / 3 = 4. Abaterile fa de medie formeaz seria: -2, -1, 3. Calculnd media acestor abateri obinem: (-2 - 1 + 3) / 3 = 0.

Exemplul 3.5.3.

Rezultatul din exemplul anterior nu este conjunctural, ci general, cci se demonstreaz uor c "suma abaterilor valorilor unei serii fa de media aritmetic a seriei, este zero". Va trebui, deci, ca abaterile s nu se mai compenseze reciproc. Pentru aceasta le putem considera pe toate de acelai semn, fie aplicndu-le funcia modul, fie ridicndu-le la ptrat. Se prefer a doua soluie, datorit unei proprieti de aditivitate fundamental n ntreaga statistic.

3.5.4. Dispersia
Sinonime: variana, sigma ptrat - denumire bazat pe citirea notaiei 2, fluctuaia.
1 Notaii: S2 (pentru populaii n general), 2 (pentru populaii teoretice), s2 (pentru eantioane), Disp. 2 Definiii (a) n cazul unei serii statistice formate din N valori distincte sau nu, x1,x2,...,xi,...,xN, dispersia este media ptratelor abaterilor (valorilor seriei) fa de media seriei:

N (b) n cazul unei serii statistice grupate n distribuia de frecvene absolute, (xj, Nj), ale celor p ( N) valori distincte, xj, dispersia va fi dat de formula:
S2 =
p

S2 =

( xi M ) i
=1

N j (xj M ) j
=1

Nj j
=1

n care

N j = N , volumul seriei. j
=1

Numrtorul din expresia dispersiei (varianei) se numete variaia seriei i se noteaz V. Deci:

V = ( xi M ) 2 = N j ( x j M ) 2 .
i 1 j =1

Dragomirescu L., Drane J. W., 2009, Biostatistic pentru nceptori. Vol I. Biostatistic descriptiv. Editia a 6 revzut, Editura CREDIS, Bucure ti, 207p. ISBN 978-973-734-461-8.

n consecin, dispersia (variana) = 3 Proprieti ale dispersiei

varia \ ia . volum

1. Este o valoare pozitiv sau nul, fiind o sum de ptrate. 1. Este nul dac i numai dac irul este constant. 2. Se utilizeaz pentru: a. compararea variabilitii unui b. compararea variabilitii a dou sau mai multe caractere ale aceleiai populaii dac acestea caracter n dou sau mai multe populaii pentru care datele au sunt exprimate n aceeai unitate de msur i acelai ordin de mrime (i deci valorile au acelai ordin de mrime (i deci medii apropiate); medii apropiate).

Proprieti pozitive:

Proprieti negative:

3. ine cont de toate valorile din cadrul 5. Este sensibil la valorile extreme (n particular la cele seriei. aberante). 4. Numrtorul expresiei sale, adic 6. Are alt ordin de mrime fa de datele iniiale i medie i se exprim n unitatea de msur a datelor ridicat variaia, ndeplinete o proprietate de aditivitate (ca i media). la ptrat.

+4 Proprietatea de aditivitate a variaiei Ca i n cazul proprietii de aditivitate a mediei, s presupunem c o serie statistic de volum N a fost separat, din anumite raiuni, n q grupri de volume vk pentru care s-au calculat mediile Mk i variaiile Vk. Atunci variaia ntregii serii, pe care o vom denumi variaia total i o vom nota Vtot, se poate calcula i prin formula:

Vtot = vk ( M k M ) + Vk .

Prima sum este variaia unei noi serii obinut din seria iniial nlocuind fiecare valoare cu media gruprii din care face parte. Este, deci, variaia mediilor gruprilor fa de media total. De aceea se numete variaia intergrupri i se noteaz Vinter. A doua sum este suma variaiilor gruprilor. Se numete variaia intragrupri i se noteaz Vintra. Prin urmare: Vtot = Vinter + Vintra, adic variaia total = variaia intergrupri + variaia intragrupri. Aceast egalitate este denumit proprietatea de aditivitate a variaiei.

k =1

k =1

Dragomirescu L., Drane J. W., 2009, Biostatistic pentru nceptori. Vol I. Biostatistic descriptiv. Editia a 6 revzut, Editura CREDIS, Bucure ti, 207p. ISBN 978-973-734-461-8.

Exemplul 3.5.4. Pentru a se vedea asemnrile dar mai ales deosebirile fa de proprietatea de aditivitate a mediei, relum exemplul 3.3.4. Fie, deci, seria de 5 msurtori format din urmtoarele dou grupri: 0; 2 i 5; 6; 7, de volume v1 = 2, respectiv, v2 = 3 i cu mediile gruprilor:

(0 + 2 ) (5 + 6 + 7 ) = 1 i M 2 = = 6. 2 3 Media total (calculat prin intermediul proprietii de aditivitate a mediei) este v M1 + v2 M 2 (2 1 + 3 6) = = 4. M= 1 v1 + v2 2+3

M1 =

Variaia intergrupri:

Vint er = vk ( M k M ) 2 = v1 ( M1 M ) 2 + v2 ( M 2 M ) 2 = 2 (1- 4) 2 + 3 (6 - 4) 2 = 30.


k =1

Variaia intragrupri:

Vint ra = Vk = V1 + V2 = [(0 - 1) 2 + (2 - 1) 2
k =1

] + [(5 - 6)

+ (6 - 6) 2 + (7 - 6) 2 = 4.

Variaia total:

Vtot =

( xi M ) i
=1

= (0 - 4) 2 + (2 - 4) 2 + (5 - 4) 2 + (6 - 4) 2 + (7 - 4) 2

= 34.

Deci variaia total, Vtot, egal cu 34, se poate calcula i prin suma dintre variaia intergrupri, Vinter, i variaia intragrupri, Vintra: 34 = 30 + 4. Exemplul 3.5.4. Dac vom nlocui fiecare valoare a seriei anterioare cu media gruprii din care face parte vom obine seria: 1; 1 i 6; 6; 6. Calculnd variaia total pentru aceast nou serie vom obine exact variaia intergrupri a seriei anterioare cci media noii serii este aceeai cu cea a vechii serii (ceea ce se verific rapid pe baza proprietii de aditivitate a mediei scris mai sus). Deci aceast serie se obine din cea anterioar (exemplul 3.5.4.) dup ce am eliminat variaia n cadrul gruprilor (variaia intragrupri).

Proprietatea de aditivitate a variaiei joac un rol extrem de important n statistic, n particular genernd un ntreg capitol de metode din statistica inductiv denumit impropriu analiz dispersional sau analiza varianei, prescurtat ANOVA. Acesta este dedicat comparaiei mai multor medii prin studiul variaiilor intragrupri i intergrupri. Denumirea mai potrivit ar fi fost cea de analiz a variaiei mediilor de grup [31]. De exemplu, cazul n care mediile gruprilor sunt egale (sau aproape egale) se poate detecta prin faptul c variaia intergrupri (inter mediile gruprilor) este nul (sau aproape nul).

Vom vedea n continuare c, datorit proprietilor de aditivitate ale mediei i variaiei, media i dispersia - ca derivat al variaiei - se afl n centrul ateniei statisticii, n particular prin utilizarea lor n construcia altor concepte statistice foarte importante. Pentru corectarea defectului dispersiei de a avea alt ordin de mrime dect datele iniiale, respectiv media acestora, s-a construit abaterea standard.

Dragomirescu L., Drane J. W., 2009, Biostatistic pentru nceptori. Vol I. Biostatistic descriptiv. Editia a 6 revzut, Editura CREDIS, Bucure ti, 207p. ISBN 978-973-734-461-8.

3.5.5. Abaterea standard Sinonime: abaterea ptratic medie, abaterea medie ptratic, deviaia standard, -ul seriei (denumire bazat pe citirea notaiei ), abaterea tip, SD-ul seriei (de la denumirea sa n englez: Standard Deviation) 1 Notaii: S (pentru populaii statistice n general), (pentru populaii statistice teoretice),
s (pentru eantioane). 2 Definiie Abaterea standard = rdcina ptrat din dispersie.
Exemplul 3.5.4.

Revenind la exemplul 3.5.4., n care dispersia total era 6,8, abaterea standard va fi

6,8 2,6 .

3 Proprieti
Are aceleai proprieti ca i dispersia, mai puin proprietile 4 i 6, iar proprietatea 1 se justific dup cum urmeaz: 1. Este un numr pozitiv sau nul, fiind rezultatul extragerii unui radical de ordin par. 1. Este nul dac i numai dac irul este constant. La acestea se adaug urmtoarea proprietate: 6. Are aceeai unitate de msur precum i acelai ordin de mrime cu datele iniiale i media. Aceasta este deopotriv cea mai important calitate, dar i defect al abaterii standard. Este defect, deoarece nu vom putea compara prin acest indicator mprtierile unor serii exprimate n uniti de msur diferite. Astfel, o serie de lungimi n cm va avea o abatere standard exprimat n cm, iar o serie de durate de timp, msurate n secunde, va avea o abatere standard exprimat, de asemenea, n secunde. Mai mult chiar, dac vrem s comparm mprtierea a dou serii exprimate prin aceeai unitate de msur, dar de ordine de mrime foarte diferite, mrimile absolute ale abaterilor standard nu vor putea exprima direct gradele de mprtiere. Pentru corectarea defectului abaterii standard de a se exprima n unitatea de msur a valorilor seriei, precum i a proporionalitii ei cu ordinul de mrime al datelor, s-a construit indicatorul adimensional denumit coeficient de variaie.

3.5.6. Coeficientul de variaie


1 Notaii: CV%, CV, Cv, V. 2 Definiie
Fie o serie de valori pe o scal raport. Coeficientul de variaie sau de variabilitate = proporia reprezentat de abaterea standard (S) din medie (M), adic: S S 100 not = CV = % = CV% .
Se prefer exprimarea sa procentual notat CV% i denumit coeficientul (procentual) de variaie sau de variabilitate = procentul reprezentat de abaterea standard (S) din medie (M).

3 Proprieti
1. 2.

CV% 0, deoarece S 0 (conform proprietii 1 de la abaterea standard) i M > 0 cci

orice ir pe o scal raport nu are valori negative, deci nici medie negativ. CV% = 0 dac i numai dac S = 0, adic dac i numai dac irul de date este constant. (n particular, dac i M = 0 suntem n cazul neinteresant cnd toate valorile seriei sunt nule i lum prin convenie CV% = 0).

Dragomirescu L., Drane J. W., 2009, Biostatistic pentru nceptori. Vol I. Biostatistic descriptiv. Editia a 6 revzut, Editura CREDIS, Bucure ti, 207p. ISBN 978-973-734-461-8.

3.

Se utilizeaz n special atunci cnd nu pot fi utilizate dispersia sau abaterea standard, adic pentru compararea variabilitii: a. unui caracter n dou sau mai multe populaii dac valorile msurate au ordine de mrime (i deci medii) diferite; b. dou sau mai multe caractere n aceeai populaie, dac acestea sunt exprimate n: uniti de msur aceeai unitate de msur, dar au diferite; ordine de mrime (i deci medii) diferite.

Proprieti pozitive:
4. Poate fi utilizat i n cazurile recomandate pentru folosirea dispersiei sau a abaterii standard, deci se poate folosi n orice situaie (pentru o variabil pe o scal raport). n consecin, coeficientul de variaie este indicatorul universal de comparare a variabilitii pentru variabile pe scal raport. ine cont de toate valorile din cadrul seriei. Coeficientul de variaie este independent de unitatea de msur folosit pentru valorile seriei fiind adimensional i se exprim, de regul, procentual.

Proprieti negative:
7. Este sensibil la valorile extreme (inclusiv la cele aberante). 8. Este valabil numai pentru msurtorile pe scal raport, nu i pentru cele valabile doar pe o scal interval.

5. 6.

4 Reguli empirice
Fiecare domeniu experimental i stabilete n practic anumite limite ale coeficienilor de variabilitate pentru variabilele cu care se lucreaz, limite prin care se pot exprima conceptele generale de omogenitate versus eterogenitate. n afar de acestea, practica statistic aplicat n mai toate domeniile legate de tiinele vieii a stabilit urmtoarele limite empirice: un CV% sub 10% , indic o populaie omogen; un CV% mai mare de 30%, indic o populaie eterogen; un CV% cuprins ntre 10%-20%, indic o populaie relativ omogen sau chiar omogen (dup caz, n funcie de variabil1). un CV% cuprins ntre 20%-30% indic o populaie relativ eterogen.
1

De exemplu, n cazul nlimilor la oameni, un CV% pn la 10% este considerat semn de omogenitate, n schimb la greutate este considerat omogen o serie cu un CV% de pn la 20%.

Dragomirescu L., Drane J. W., 2009, Biostatistic pentru nceptori. Vol I. Biostatistic descriptiv. Editia a 6 revzut, Editura CREDIS, Bucure ti, 207p. ISBN 978-973-734-461-8.

Exemplul 3.5.6. Variabilitatea seriilor de temperaturi trebuie s fie exprimat obligatoriu n grade Kelvin. n caz contrar, se pot obine nu numai rezultate eronate, ci chiar absurditi. De exemplu, s comparm urmtoarele date sintetice fictive exprimate att n grade Kelvin ct i n grade Celsius:
Nr. serie 1 2 3 4 5 K (aa DA) S 10 10 10 10 0 C (aa NU) S 10 10 10 10 0

M 313,15 293,15 273,15 253,15 0,00

CV % 3,19 % 3,41 % 3,66 % 3,95 % # 0,00 %

M 40,00 20,00 0,00 -20,00 -273,15

CV % 25 % 50 % -50 % 0% ? !

prin convenie.

ntre primele dou serii se observ o mic cretere a variabilitii de la 3,19% la 3,41%. Dac se calculeaz aceast variabilitate (n mod eronat) folosind gradele Celsius se produce o dublare a sa (de la 25% la 50%). Seria 3 arat c utilizarea unei variabile pe o scal interval care nu este i scal raport (gradele Celsius) poate conduce chiar la imposibilitatea calculrii CV-ului i anume atunci cnd M = 0, acesta fiind un zero convenional, nu absolut. Aceast imposibilitate nu poate aprea pe o scal raport cci zeroul fiind absolut, abaterea standard va fi de asemenea zero, deoarece nu exist valori negative i deci n seria va fi 0, 0,...,0, ca n cazul seriei 5. Se convine ca 0 / 0 = 0, rezultat posibil matematic i cu sensul potrivit n acest caz. n sfrit, seria 4 conduce la o alt absurditate n cazul calculrii CV-ului pentru grade Celsius: un CV negativ, cu o valoare absolut egal cu cea a seriei 2, dar cu care, de fapt, nu are nici o legtur.

S-ar putea să vă placă și