Sunteți pe pagina 1din 48

Biostatistica

Aplicaii ale statisticii n medicin i biologie

1. Introducere

Definiii

Statistica este tiina care se ocup cu: q descrierea i analiza numeric a fenomenelor de mas q

1. 2. 3. 4. 5.

dezvluie particularitile lor de volum structur dinamic conexiune regularitile sau legile care le guverneaz

Biostatistica este tiina care aplic principiile statisticii n studiul tiinelor vieii.

Statistica medical este statistica aplicat n medicin

Generaliti

Utilitatea statisticii 1. Studiul fenomenelor complexe 2. Cnd intervin factori sau mrimi n relaii complexe 3. Cnd nu putem descrie un fenomen satisfctor prin ecuaii sau formule

1. 2. 3.

Aplicabilitate:
Determinrile cantitative, Unele determinri calitative Msurtorile referitoare la parametri fiziologici, biochimici, biofizici

Toate acestea au neles deplin numai n context statistic

Noiuni generale

Cea mai general noiune: cea care se refer la totalitatea cazurilor care au n comun trstura sau proprietatea studiat de noi.

DEFINIIE:

Vom numi populaie statistic o mulime de elemente care au una sau mai multe nsuiri comune i care fac obiectul unei cercetri statistice.

Populaii
Populaie statistic :

1. 2. 3. 4.

O mulime de persoane umane:


persoanele din judeul Dolj de sex feminin care sufer de HTA, persoanele din Romnia care sufer de cancer de colon i care au fost operate, etc. persoanele normale dintr-o arie geografic dat, copiii normali ntre 2 i 14 ani, etc

Fiecare nou studiu statistic = o populaie specific la care se refer.

1. 2.

n studiile demografice: populaii de grupuri socio-umane


aezri omeneti sau instituii, intreprinderi, populaia aezrilor omeneti din Romnia,

1.
1. 2.

Populaii de evenimente
accidentele de circulaie dintr-o arie geografic, accidentele cardiace pe o perioad anume de timp

1.

Populaii de msurtori
tensiunea arterial a unui pacient considerat la intervale regulate de timp, fie c a fost msurat sau nu).

Individ statistic

Individ statistic = element al unei populaii statistice Individ statistic =


1. 2. 3. 4.

Individ uman sau, Colectivitate uman sau Eveniment sau Msurtoare, etc

Date statistice

Date statistice = informaii care sunt culese

dup o scal prestabilit Nu orice informaie poate fi considerat din punct de vedere statistic

Date statistice:
1.

2.

Date alfanumerice Date scalate


Nominale Ordinale Numerice Logice

1. 2. 3. 4.

Scale:

Date alfanumerice

Permit nregistrarea de date literale si numerice. Exemple:


1.

2.
3. 4.

Nume, prenume Adres Loc de munc Starea general a pacientului


De obicei nu fac obiectul unei prelucrri statistice. Dau doar informaii generale

Date numerice

nregistreaz rezulate cantitative prin numere ntregi sau zecimale Exemple:


1. 2.

Msurtorile antropometrice Msurtorile de laborator (analizele)

Sunt cele mai indicate pentru prelucrri statistice

Date de tip logic


Se folosesc atunci cnd avem exact dou opiuni sau clase Se nregistreaz de obicei cu simbolurile: 1. + sau 2. Da sau Nu 3. Pozitiv sau Negativ 4. Y sau N Exemple: sex, mediu de provenien, prezent-absent

n analizele de laborator, sntos-bolnav, etc

Scala nominal

1.

Indivizii sunt mprii n cteva clase:


2.

3.

4.

5.

Exhaustive (fiecare individ aparine unei clase) Mutual exclusive (nici un individ nu aparine la dou clase simultan) Numele claselor sunt simbolice i de obicei sunt fixate de practica medical sau convenii internaionale Doi indivizi din aceeai clas sunt echivaleni pe scala considerat Nu are sens s ordonm clasele cresctor sau descresctor dup nici un criteriu Exemple: grupa sanguin, culoarea ochilor, culoarea prului, consistena ficatului, mirosul urinei, etc

Scala ordinal

Indivizii sunt mprii n cteva clase:


1. 2.

3.

4.

5.

Exhaustive (fiecare individ aparine unei clase) Mutual exclusive (nici un individ nu aparine la dou clase simultan) Numele claselor sunt simbolice i de obicei sunt fixate de practica medical sau convenii internaionale Doi indivizi din aceeai clas sunt echivaleni pe scala considerat Clasele pot fi ordonate cresctor sau descresctor Exemple: Stadiul evolutiv al unei afeciuni maligne, starea unui pacient la externare, etc

2. INDICATORI STATISTICI

Tabel de date
FO NUME PRENUME VIRSTA SEX MEDIU DIAGCOD HAV ALCOOL

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

Voinea Radu Diaconescu Ion Netcu Tudor Dobrescu Ana Cosmelita Ion IordanescuElena Craciunescu Misu Nedelcu Maria Radulescu Vasile Armeanca Dumitru Dumitrana Alexandru Ignat Maria Serbanescu Stefan Fronie Sofica DobrinescuFlorin Ciuta Maria Busuioc Nicolita

55 54 45 56 56 65 47 55 55 55 48 50 62 28 50 57 65

b b b f b f b f b b b f b f b f f

u r r r r u r u r u u u u u r r r

CHAUD CHA CHA CHA CHA CHALB CHA CHAUD CHA CHA CHA CHA CHA CHA CHA CHA CHA

da nu nu nu nu da nu nu nu da da nu da da da nu da

da da da da da nu da da da da da da nu nu da da nu

De cele mai multe ori, datele pe care le nregistrm despre pacieni se prezint n tabele ca cel de mai sus

Tabel de frecven Supravieiurea n cancerul de sn

2456 pacieni
Clase de supravieuire Clase din 12 in 12 luni

Nr. Cazuri = Frecvena absolut Procent = Frecvena relativ Uneori, datele sunt centralizate ca n tabelul de mai sus. Un astfel de tabel se numete tabel de freceven, pe clase

Tabel de inciden:
Pacienii clasificai dup dou criterii

Spunem c avem potrivire dac ambele complicaii sunt prezente sau absente n acest tabel sunt 29 potriviri + cu + (celula a) i 172 potriviri cu (celula d)

Indicatorii statistici pentru serii de date numerice

Dac am nregistrat valorile numerice ale unui parametru la mai muli indivizi, le considerm o

Serie de valori (de date)


Hb: 12,5; 13,5; 15,3; 16,4; 11,7,.....etc Vrsta: 36; 54; 73; 46; 31; 46; .....etc Vom scrie astfel:

X: x1, x2, x3,.......xn Y: y1, y2, y3,.......ym

Minimul i maximul

X: 58, 74, 70, 71, 56, 68, 70, 82, 62, 62

(vrste) Minim=56, Maxim=82

Y: 58, 74, 70, 71, 56, 68, 70, 82, 62, 62, 59, 46, 57, 71 (aceleai vrste i nc 4)

Minim=46, Maxim=82 Amplitudinea absolut A = Max Min = 36

Media aritmetic
Media unei serii statistice este raportul dintre suma valorilor seriei i numrul lor. Media este indicatorul care arat tendina central a seriei, i de obicei arat unde tind datele s se aglomereze. Media mai multor valori egale este egal cu fiecare din valori Dei se obine din valori concrete, msurate n practic, media este un numr abstract

Calculul mediei, influena unei valori extreme

Seria Y este alctuit din valorile lui X la care se adaug patru noi valori. Existena valorii 46, extrem de mic, modific media sensibil

Formula mediei ponderate

F1, F2, ...,Fm sunt frecvenele de apariie n serie ale valorilor x1, x2, ...,xm. Alte medii: media geometric, media armonic, mai puin folosite.

Diagrama de dispersie

Ne arat cum sunt distribuite datele n jurul mediei. Permite o apreciere grosier a dispersiei datelor n jurul mediei.

Compararea dispersiilor cu graficul de dispersie

Seria Y este evident mai dispersat cci abaterile individuale mari sunt mai multe. Seriile au aceeai medie dar reflect evident situaii foarte diferite.

Calculul dispersiei (Engl: variance)

Este bine de reinut c: 1. La medii aproximativ egale, este mai mprtiat seria cu dispersia mai mare. 2. La dispersii aproximativ egale, este mai mprtiat seria cu media mai mic.

Abaterea standard (Engl: standard deviation)


Dispersia are dezavantaje: 1. Se exprim cu unitile de msur ale variabilei, ridicate la ptrat 2. Are n general valori foarte mari comparativ cu media. De aceea se mai folosete un alt indicator, numit abatere standard care este radicalul dispersiei. Se noteaz cu i are deci formula:

Abaterea standard = Abaterea medie ptratic.

Exemplu de calcul

S presupunem c am msurat zilnic tensiunea arterial la doi pacieni timp de 10 zile, obinnd pentru fiecare urmtoarele valori pentru tensiunea arterial maxim:

170, 180, 160, 180, 190, 190, 180, 190, 170, 190, pentru primul pacient i 160, 170, 190, 160, 190, 190, 200, 180, 180, 180, pentru al doilea pacient.

Aranjarea calculelor

Este mai mprtiat seria Y care are o abatere standard de 13,3 fa de 10,5 la seria X, ambele serii avnd aceeai medie.

Coeficientul de variaie

Este raportul dintre deviaia standard i medie, atunci cnd media este diferit de 0, i se msoar n procente:
Pentru seriile de mai sus, coeficientul de variaie este mai mare pentru cea mai mprtiat, adic pentru cea cu deviaia standard mai mare:
1. C.V.x= 10,5 / 180 = 0,058 = 5,8 %.
2. C.V.y = 13,3 / 180 = 0,073 = 7,3%.

Eroarea standard (Engl: standard error)

Este raportul dintre deviaia standard i radicalul numrului de valori din serie.
Scade pe msur ce crete n, ceea ce nseamn c este o msur a preciziei calculelor pe care le vom face.

Indicatori de asimetrie
Mediana (Engl: median) este o valoare pentru parametrul msurat (greutate, nlime,etc) care corespunde individului din mijloc, dac indivizii sunt ordonai cresctor sau descresctor. Jumtate din valori sunt mai mari dect mediana i jumtate mai mici. Cuartila Q1 este valoarea parametrului msurat pentru care un sfert din indivizi au valori mai mici i trei sferturi mai mari dect aceast valoare. Analog, cuartila Q3.

Gsirea medianei i cuartilelor pe tabelul de frecvene

Se observ c mediana este ntre 54 i 55 ani, dar ar trebui fcut un calcul mai exact;
Am putea lua o aproximare de 54,5 ani; De fapt se observ c mediana este mai aproape de 54 ani;

Ali indicatori statistici

Decile. Pe eantioane mai mari de multe sute de indivizi.


Sunt 9 decile, fiecare corespunznd unui procent de 10%, 20%,,90% din eantion, asemntor cuartilelor. Decila a 5-a este mediana. Centile. Folosite, n studii pe mii de cazuri, de obicei de un interes mai larg, naional, internaional, i sunt corespunztoare precentelor de 1%, 2%,,99% din lot. Centila a 50-a este mediana. Modul. Clasa sau valoarea corespunztoare frecvenei maxime dintr-o serie statistic se numete mod.

3. HISTOGRAMA

Supravieuirea n cancerul mamar

Graficul histograma este echivalentul grafic al tabelului de frecvene absolute Vom reprezenta prin bare verticale fiecare clas O bar are o nlime proporionl cu frecvena absolut

Fiecare bar (clas) are aceeai lime nlimea barelor este proporional cu frecvenele absolute (numrul de indivizi din clas) Se observ c datele sunt distribuite asimetric

Bilirubina total este distribuit puternic asimetric spre valorile mari (spre dreapta)

Distributia taliei este relativ simetric

Distribuie simetric, cu uoare iregulariti datorate faptului c a fost aleas o lungime a claselor prea mic

Tensiunea arterial are o distribuie asimetric din cauza prezenei pacienilor cu hipertensiune (cei reprezentai prin barele din dreapta)

Hemoglobina se distribuie simetric

Distribuie bimodal, arat c eantionul are dou subeantioane diferite, este eterogen

Construcia histogramei
Histograma este dependent de factori aleatori, dac se mai adaug un numr de pacieni, aspectul ei se schimb mai mult sau mai puin Aspectul ei depinde i de lungimea claselor care trebuie aleas cu grij

Lungimea claselor
Cea mai important decizie n construcia unei histograme este alegerea lungimii unei clase Se mparte amplitudinea absolut la numrul de clase (bare) dorit: Lungimea = (Max Min)/numar clase Numrul de clase este 8-10-12 pentru eantioane de zeci de indivizi i 15-20 pentru eantioane de sute de indivizi

Excentricitate (Engl:Skewness)

Este un indicator al abaterii de la simetrie a distribuiei datelor.


De obicei msoar diferena dintre medie i median, eventual raportat la abaterea standard sau la intervale intercuartilice( Q3 - Q1). O excentricitate egal cu zero, sau foarte apropiat de zero, este un indiciu al simetriei distribuiei datelor. Din contr, excentriciti mult diferite de 0, peste 0,15 -0,20, sau mai jos de -0,15 -0,20 sunt indicii ale unei distribuii excentrice.

Boltire (Engl:Kurtosis)

Este un indicator al modului cum se comport distribuia datelor din serie.


Dac boltirea dat de un program pe calculator este mult mai mare ca 3, se spune despre distribuie c este boltit nalt, iar dac este mult mai mic dect 3 se spune c este boltit jos.

Boltirea (Kurtosis)
O distribuie poate fi prea nalt (leptocurtic) sau prea plat (platicurtic)

S-ar putea să vă placă și