Sunteți pe pagina 1din 19

BIOSTATISTICA

Indicatori de variabilitate

Proprietile seriilor de variaie


sunt:
- tendina central
Indicatori: media aritmetic, media armonic, media
cronologic, media ptratic, media geometric, modulul.
- variabilitatea
Indicatori: amplitudinea, abaterea valorilor individuale,
cuartilele, dispersia, abaterea medie patratica (abaterea
standard), coeficientul de variatie.
- forma distribuiilor
Indicatori: excentricitate (skewness), curbura (kurtosis)

Variabilitatea
Prin notiunea generala de variabilitate se au n vedere abaterile masurabile ale valorilor
individuale fata de o valoare centrala (medie).
Caracterizarea unei colectivitati statistice prin indicatorii tendintei centrale (mediile) ne
ajuta sa depistam ceea ce este comun n manifestarea unui fenomen.
Orice colectivitate are o organizare interna specifica, denita prin felul n care valorile
individuale se distribuie n jurul valorii centrale. Astfel se poate ntmpla ca doua
colectivitati analizate dupa aceeasi variabila sa e diferite prin tendinta centrala (Fig. a),
prin dispersie (Fig. b) sau prin amndoua (Fig. c). n felul acesta o valoare centrala
poate credibila, o alta nu. Din acest motiv se impune ca analiza prin indicatorii
tendintei centrale sa e completata cu indicatori ai variatiei si ai formei de distributie.

a) Distributii cu tendinta centrala diferita; b) Distributii cu variabilitate diferita;


c) Distributii cu tendinta centrala si variabilitate diferite.

exemplu:
seriile {2, 2, 2, 10, 18, 18, 18} si {9, 9, 9, 9, 10, 11, 11, 11, 11} au aceeasi medie si
mediana (10) dar dispersie diferita. Acest fapt este evidentiat de abaterile nregistrate
fata de medie (10) sau mediana (10). Seria a doua este mai omogena (nregistreaza o
variabilitate mai mica a valorilor individuale), iar valorile sale tipice sunt mai
reprezentative. Calculul si analiza indicatorilor variatiei valorilor individuale fata de medie
ofera posibilitatea de rezolvare a unor probleme de cunoastere statistica. Dintre acestea
se disting:
- analiza gradului de omogenitate a datelor din care s-au calculat indicatorii tendintei
centrale si vericarea reprezentativitatii acestora;
- compararea mai multor serii de distributie dupa caracteristici independente si/sau
interdependente;
- selectarea obiectiva a factorilor semnicativi de inuenta dupa care se structureaza
unitatile unei colectivitati statistice;
- separarea actiunii factorilor esentiali de factorii ntmplatori;
- concentrarea valorilor individuale ale caracteristicilor si deplasarea acestora fata de
valorile tipice;
- aplicarea diferitelor teste ale statisticii matematice.

Indicatori de variabilitate
Amplitudinea variatiei (A)
Se mai numeste cmp de variatie sau amplitudine absoluta. Se determina prin diferenta
dintre cea mai mare si cea mai mica valoare individuala nregistrata.
- n forma absoluta:

- n forma relativa:
Exemplu:
Un grup de bolnavi nregistreaza urmatoarele durate de tratament n zile:
8, 7, 9, 8, 9, 9, 10, 11, 12, 11, 10, 10, 9, 9, 7, 8, 10,10,11,10
Amplitudinea absoluta a variatiei pentru durata tratamentului: 12 7 = 5 zile.
Amplitudinea relativa a variatiei pentru durata tratamentului: (5/9) x 100 = 55,5%

Observatii:
- Amplitudinea nu tine seama de toate valorile, ci numai de cele extreme, care adeseori
sunt aberante;
- Este sensibila la valorile aberante, se considera un indicator mai putin relevant
nepermitnd cunoasterea structurii interne de variatie. De exemplu, urmatoarele trei serii
vizualizate au aceeasi amplitudine, dar prezinta variatii diferite:

Aceasta nseamna ca amplitudinea variatiei este un indicator rezonabil numai daca


valorile individuale ale seriei sunt repartizate n mod uniform;
- n cazul seriei de distributie pe intervale valorice calculul amplitudinii este lipsit de sens;
- Amplitudinea se utilizeaza frecvent la alegerea numarului de intervale de grupare a
datelor si la stabilirea marimii intervalelor.

Abaterea valorilor individuale de la medie (d i)


Exprima cu cte unitati de masura sau de cte ori valoarea caracteristicii individuale a
colectivitatii se abate de la marimea unui indicator al tendintei centrale:
- n forma absoluta:

- n forma relativa:
Exemplu:
Considernd aceleasi date din exemplul anterior, bolnavul care s-a tratat 12 zile se
abate de la media grupei cu 3 zile ceea ce reprezinta 33,3% din medie iar pacientul care
s-a tratat 7 zile se abate de la medie cu 2 zile, ceea ce reprezinta 22,2% din medie. Cu
ct se obtin mai multe abateri relative mari n analiza unui volum de date (catre 100%
sau peste acest nivel) cu att colectivitatea statistica respectiva este mai eterogena.

Observatii:
- valorile individuale se compara cu valoarea lor medie, dar la fel de bine poate utilizat
pentru comparare oricare alt indicator al tendintei centrale (de ex. mediana);
- n seriile de distributie pe intervale valorice pentru calculul abaterilor individuale se iau
n considerare centrele de interval;
- Abaterea valorilor individuale nu poate da informatii dect la nivelul ecarei variante
pierznd imaginea mprastierii pe ansamblul distributiei.
- n analizele statistice se urmaresc n mod deosebit abaterile maxime pozitive (d+max) si
abaterile maxime negative (d-max) calculate n cifre absolute sau relative astfel:

sau

Cuartilele
Sunt valori care impart seria statistica in patru zone:
Cuartila Q1 este acea valoare dintr-o serie de valori, pentru care 25% din valorile seriei
sunt sub Q1 i 75%, peste Q1.
Cuartila Q2 este acea valoare dintr-o serie de valori, pentru care 50% din valorile seriei
sunt sub Q2 i 50%, peste Q2.
Cuartila Q3 este acea valoare dintr-o serie de valori, pentru care 75% din valorile seriei
sunt sub Q3 i 25%, peste Q3.

Dispersia ( 2)
Valorile dintr-o serie statistica pot fi mai aglomerate n jurul mediei sau mai dispersate.
Un mod de a msura aceste abateri de la medie este s se fac diferena ntre toate
aceste valori i media lor. Deoarece unele abateri pot fi pozitive, altele negative si prin
adunare dau suma nula, ele sunt ridicate la ptrat nainte de a fi adunate, facand astfel
s dispar diferenta de semn.
Suma obinut, mprit la numrul de abateri este o medie care se numete dispersie,
fiind un indicator al gradului de mprtiere al seriei. Se calculeaza ca medie aritmetica a
patratelor abaterilor valorilor individuale de la tendinta centrala (media seriei).
Pentru o serie simpla formula dispersiei este:
Pentru o serie de distributie pe frecvente formula dispersiei este:

n cazul n care numarul cazurilor observate este mai mic de 120, numitorul formulelor
dispersiei devine n-1.
Are dezavantajul c are n general valori foarte mari comparativ cu abaterea medie; de
exemplu pentru o medie a abaterilor n jurul lui 10, dispersia va avea o valoare n jurul lui
100.

Abaterea standard (abaterea medie patratica )


Este calculata ca o medie patratica din abaterile valorilor individuale de la media lor. Se
calculeaza dupa urmatoarele formule:
n seriile statistice simple:
n seriile grupate pe frecvente:
n cazul n care numarul cazurilor observate este mai mic de 120, numitorul formulelor
abaterii standard devine n-1.
Abaterea standard este cel mai util si mai important indicator de variatie, punand n
evidenta intervalul valoric din jurul mediei n care s-au distribuit valorile individuale ale
variabilei studiate. O abatere standard cu valoare mica, semnifica o distributie strnsa a
valorilor individuale n jurul mediei, deci un esantion omogen. O valoare mare a abaterii
standard pune n evidenta o dispersie mare a valorilor individuale n jurul mediei,
dovedind ca esantionul este neomogen si ca atare rezultatele obtinute nu pot fi
generalizate.
n general, cu ct abaterea standard are valori mai mari, cu att media caracterizeaza
mai putin fenomenul cercetat. Abaterea standard are o valoare semnificativa atunci cnd
esantionul pe care s-a lucrat are o distributie normala, conform curbei Gauss Laplace.

Distributia normala - Gauss Laplace


n cadrul unei asemenea repartitii, ntre valoarea mediei si cea a abaterii standard se
distribuie 68,26% din totalul valorilor unei colectivitati statistice; ntre medie si de doua
ori valoarea abaterii standard se distribuie 95,45% din valori, iar ntre medie si de trei ori
valoarea abaterii standard sunt cuprinse 99,73% din valori. Practic, ntreaga arie de sub
grafic (99,73%) se afla ntre medie si de trei ori valoarea abaterii standard. Aceasta este
asa-numita regula celor sase sigma: pornind de la presupunerea ca populatia este
distribuita normal, abaterea standard este estimata la 1/6 din diferenta dintre valoarea
maxima si cea minima, valori ce sunt obtinute dintr-un esantion suficient de mare.

Exemplu de calcul:
S-a msurat zilnic tensiunea arterial sistolic la doi pacieni timp de 10 zile, obinnd
pentru fiecare urmtoarele valori:
170, 180, 160, 180, 190, 190, 180, 190, 170, 190, pentru primul pacient i
160, 170, 190, 160, 190, 190, 200, 180, 180, 180, pentru al doilea.
Sa se determine care pacient are tensiunea cu valori mai mprtiate, indiferent de
evoluia n timp. Notnd prima serie cu X iar pe a doua cu Y se constat c ambele au
media 180. Atunci, abaterile de la medie i ptratele lor vor avea urmtoarele valori:

Abaterile standard vor fi:


Deci, este mai mprtiat seria Y.

Coecientul de variatie (Cv)


Abaterea standard, fiind exprimata n unitati de masura specice fenomenelor cercetate,
nu poate utilizata n aprecierea comparativa a esantioanelor exprimate n unitati de
masura diferite. De exemplu, pentru naltimea si greutatea unui lot de 30 de elevi s-au
gasit valorile:
- naltime: media =145 cm; abatere standard = 5 cm,
- greutate: media = 35 kg; abaterea standard = 3 kg
Pe baza valorilor abaterii standard, exprimate n centimetri si kilograme, nu se poate
aprecia sub ce aspect, al naltimii sau al greutatii, lotul de elevi este mai uniform
dezvoltat. n aceasta situatie se recurge la coecientul de variatie - raportul procentual
dintre valoarea abaterii standard si media aritmetica:

Coecientul de variatie arata ct la suta din medie reprezinta abaterea standard.


n exemplul anterior, coecientul de variatie este:
- pentru naltime Cv = (5cm/145cm) 100 = 3,4%
- pentru greutate Cv = (3kg/35kg) 100 = 8,6%
Deci lotul de copii este mai omogen dezvoltat sub aspectul naltimii si nu al greutatii cum
ar rezulta din compararea valorilor abaterii standard. Cu cat valoarea coecientului de
variatie este mai mica, cu att esantionul este mai omogen. Se considera ca un
coecient de variatie cu valori sub 10% indica o variatie mica, ceea ce ne permite sa
generalizam rezultatele.

Indicatori de forma
Excentricitatea (skewness - sk)
O distribuie (ce poate fi reprezentata sub forma grafica ca un poligon al frecventelor)
este excentric dac una din lateralele sale este mai lung dect cealalt. Prima
distribuie din figura urmatoare este cu excentricitate pozitiv, avand laterala mai lunga
in partea pozitiva a axei orizontale. A doua distribuie este asimetric negativ, deoarece
are o laterala mai lunga n direcia negativ. Cea de-a treia distribuie este simetric,
mbele laterale fiind aproximativ egale.

Distribuii cu excentricitate pozitiv, negativ i distribuie simetric


Excentricitatea unei serii de valori se calculeaz cu formula:
Daca numarul cazurilor observate este mai mic
de 120, numitorul formulei devine (n-1)3
Cu ct o distribuie este mai simetric cu att sk tinde la 0

Curbura (kurtosis)
Denumirea indicatorului vine din limba greaca: kurtos = curbat, arcuit si apreciaza gradul
de curbura al distributiei statistice.
Formula de calcul a curburii este:
Daca numarul cazurilor observate este mai mic
de 120, numitorul formulei devine (n-1)

Reprezentari grafice
Graficul histogram
Ca i concept, histograma este echivalentul grafic al tabelului de frecvene.
Exemplu:
In tabelul urmator este sintetizat evolutia parametrului Greutate corporal la 1014
pacieni:
Greutatea corporal a 1014 pacieni
pe clase din 5kg n 5kg

Histograma greutilor corporale a


1014 pacieni

Histograma ne ajut s nelegem mai bine realitatea.


Pentru a realiza diferena dintre o distribuie simetric i una asimetric, s transpunem
ntr-o histogram situaia din tabelul urmator, care sistematizeaz situaia supravieuirilor
n cazurile de cancer mamar pe un lot de 2456 de pacieni.

Se observ ca histograma are o asimetrie puternic spre dreapta. Tendina observat n


aceast histogram este normal, avnd n vedere fenomenul surprins. Procesele de
supravieuire sunt de obicei marcate de o distribuie a valorilor cu excentricitate spre
dreapta, adic durata supravietuirii este relativ scazuta.
Pentru o familiarizare cu acest tip de grafic foarte important, s urmrim cteva situaii
culese din practica medical.

n figura alaturata, este reprezentat


histograma tensiunii arteriale la 593 de
pacieni cu diferite afeciuni. Se observ o
excentricitate puternic, spre dreapta.

n figura alaturata este histograma valorilor


hemoglobinei la 738 de pacieni cu diferite
afeciuni. Se observ o distribuie a
valorilor mai simetric dect n figurile
anterioare.

n figura alaturata este histograma valorilor


hemoglobinei la 738 de pacieni cu diferite
afeciuni. Se observ o distribuie a valorilor mai
simetric dect n figurile anterioare.

S-ar putea să vă placă și