Sunteți pe pagina 1din 8

CURS 6

Biostatistic
1. Noiuni de baz; definiii
Statistica este o ramur a matematicii aplicate cu rdcini n
teoria probabilitilor i este fundamentat pe toate tiinele
experimentale: fizica, biologia, sociologia. Statistica este tiina care
se ocup cu descrierea i analizarea numeric a fenomenelor de
mas. Ea studiaz latura cantitativ a fenomenelor, legile statistice
manifestndu-se sub form de tendine.
Biostatistica intereseaz aplicarea statisticii fenomenelor
biologice, incluznd biologia uman, medicina i sntatea public.
Concepte specifice:
1. Studiul reprezint o organizare tiinific a sarcinilor cu
definirea unei mulimi de obiective.
2. Rezumatul este un studiu al crui scop este s evalueze
condiiile care exist n natur i modificrile orict de
nensemnate (mici).
3. Experimentul este un studiu care modific condiiile
existente ntr-o manier definit pentru a evalua efectele
unuia sau mai multor tratamente.
4. Unitatea este cel mai mic obiect sau individ care poate fi
investigat, sursa informaiei de baz.
5. Populaia este un foarte mare grup de uniti avnd
aceleai caracteristici cuantificabile, cu privire la care sunt
fcute inferene tiinifice.
6. Eantionul de uniti este o submulime finit de uniti
din populaia de uniti.
7. Parametrul este o caracteristic a populaiei.
8. Variabila este o caracteristic observabil pe uniti.
9. Populaia de observaii este un grup care const n
valori numerice ale unei caracteristici cuantificabile
determinate pentru fiecare membru al populaiei de uniti.
10. Eantionul de observaii este o submulime finit din
populaia de observaii.
11. Statistica este o caracteristic a irului, utilizat pentru
verificarea inferenelor.

Observarea statistic a diverselor boli sau fenomene s-a fcut


din antichitate; primele statistici adevrate s-au fcut n sec. XVII,
de ctre John Grownt, care a fcut primele recensminte de bolnavi
n timpul unor epidemii de cium din Londra, construind tabele de
natalitate i mortalitate. Termenul de biostatistic a fost introdus
n 1772, de ctre Achenwald, matematician german. Pearson,
matematician i statistician englez, a condus revista de biostatistic
Biometrika; n 1900 a introdus testul 2. Un alt nume important
este cel al lui Francisc Gatton, expert n probleme de ereditate.

2. Elemente de statistic descriptiv. Descrierea unei serii


statistice
O serie statistic este constituit dintr-un ansamblu
(mulime) de valori numerice rezultat al unei observaii.
De exemplu, se studiaz numrul de biei ntr-un grup de
familii, nlimea, greutatea ntr-un grup de recrui, procentul urinar
sau sanguin al metabolismului ntr-un grup de bolnavi.
Prima etap a activitii statistice const n clasificarea
rezultatelor obinute, prezentarea sub o form facil, accesibil i
care ne d o descriere fidel pe ct posibil.
Ordonarea datelor. Distribuia de frecven
Fie un grup de valori numerice experimentale ale tipului pe
care l citm. Rezultatele sunt obinute ntr-o ordine oarecare. Este
logic s ncepem cu o ordonare cresctoare sau descresctoare,
etap care poart numele de punerea n ordine a datelor. Se
nscrie pentru fiecare valoare observat x, numrul F de apariii,
care se va numi frecvena (efectivul) valorii.
Mulimea valorilor efective ale frecvenelor respective
constituie distribuia frecvenei, care se poate prezenta printr-un
tabel.
Numrul total n de cazuri se definete ca fiind suma
efectivelor fiecrei valori,
p

Fi n
i 1

Exemplul 1: Se studiaz numrul de biei n 1877 familii de 7 copii.


Rezultatele sunt prezentate n funcie de numrul x de biei,
cuprins ntre 0 i 7. Se observ fiecare dintre aceste valori, care
indic efectivul F = numrul de apariii ntlnite, adic numrul de
familii avnd acest numr de copii.
Numr de biei
X
0
1
2

Numr de familii F
22
112
285

Frecvena
f=F/n
0.01
0.06
0.15

Procentajul
100*f
1
6
15

3
4
5
6
7
Total

470
513
320
132
23
1877

0.25
0.27
0.17
0.07
0.01
1

25
27
17
7
1
100

Tabelul 1: Distribuia numrului de biei n 1877 familii cu cte 7


copii
Gruparea datelor n clase
Cnd valorile studiate variaz continuu, cum este cazul
greutii i al nlimii etc., adic atunci cnd variabila poate lua
toate valorile posibile ntr-un interval dat, diferitele valori observate
pot fi foarte numeroase. Distribuia de frecven este atunci foarte
dispersat i nu ofer o interpretare semnificativ a mulimii de
valori. De aceea, se recurge la reducerea numrului de valori
posibile, grupnd valorile vecine. Mai precis, se mparte domeniul de
variaii posibile ntr-un numr de intervale sau clase n interiorul
crora se grupeaz toate valorile care cad n intervalul
corespunztor.
Exemplul 2: Se studiaz distribuia greutii ntr-un grup de 100
aduli normali de sex feminin. Greutatea variaz ntre 41 74 kg. Se
mparte domeniul de variaie n intervale de 5 kg (40 44, 45 49,
50 54, ), care constituie clase n interiorul crora se grupeaz
toi subiecii a cror greutate este cuprins ntre limitele intervalului;
mulimea acestor subieci constituie efectivul clasei.
Clase
x
40-44
45-49
50-54
55-59
60-64
65-69
70-74
Total

Efectiv
F
5
12
31
31
16
3
2
N=100

Frecvena
f=F/n
0.05
0.12
0.31
0.31
0.16
0.03
0.02
1

Procentaj
100*f
5
12
31
31
16
3
2
100

Tabelul 2: Distribuia greutii a 100 aduli de sex feminin


Intervalul de clas
n aceast activitate este important modul de precizare a
domeniului claselor alese, numit interval de clas, care trebuie
s fie n principiu acelai pentru toate clasele; intervalele de clas
trebuie de asemeni s fie alturate i fr suprapuneri.
Intervalele de clas se pot preciza n trei moduri (figura 1,
tabel 3):
Limite
reale
Msuri
limit

39.5
40

Puncte mediane: 42

44.5
44

49.5
45

47

49

54.5
50

54

52

55

59.5
59

57

Figura 1: Alegerea intervalelor de clas


Indicnd limitele reale ale fiecrei clase; n acest caz limita
superioar a unei clase i limita inferioar a clasei urmtoare
coincid, ca de exemplu valoarea 44.5 pentru clasele (39.5 ..
44.5) i (44.5 .. 49.5).
Indicnd msurile limit, adic cea mai mic i cea mai mare
msur corespunztoare apartenenei la clas, innd cont de
precizia msurtorii.
Indicnd valoarea care se gsete exact n centrul clasei, numit
punct median al clasei, i care este dat de semisuma
limitelor unei clase, ca de exemplu 42, 47, 52 etc.

Msuri
limit
40-44
45-49
50-54
55-59
60-64
65-69
70-74

Limitele
reale
39.5 44.5
44.5 49.5
49.5 54.5
54.5 59.5
59.5 64.5
64.5 69.5
69.5 74.5

Puncte
mediane
42
47
52
57
62
67
72

Efective
5
12
31
31
16
3
2
100

Tabelul 3: Distribuia greutii a 100 aduli de sex feminin


Grupnd datele n clase, se remarc asimilarea tuturor
valorilor unei clase la o valoare unic, aceea a punctului median (n
acest mod, se face reducerea la cazul unei variabile discontinue).
Observaie: Experiena arat c n practic numrul intervalelor de
clas este bine s fie cuprins ntre 10 i 20.
Frecvena relativ
Efectivul F al unei valori (sau al unei clase) reprezint
frecvena sa absolut, adic numrul de apariii ale acestei valori
(sau al acestei clase) n ansamblul distribuit.
Dac dorim s comparm serii statistice comportnd un
numr diferit de cazuri, este interesant s raportm aceast
frecven absolut la numrul n de cazuri, numit efectivul total, care
conine seria studiat. Se definete la fel frecvena relativ, sau
frecvena propriu-zis a valorilor considerate,
fr

F
n

Se poate atunci completa tabloul distribuiei de frecvene


printr-o coloan suplimentar indicnd valoarea frecvenei relative,
care poate fi de asemeni exprimat sub form de procente (coloana
4 din tabelele 1, 2).
O variant a frecvenei relative o constituie frecvena
procentual, obinut nmulind frecvena relativ cu 100,
fp = fr 100

Suma frecvenelor relative va fi egal cu 1. Analog, suma


frecvenelor procentuale va fi egal cu 100.
p

fi 1
i 1

Frecvena cumulat
Plecnd de la valoarea cea mai mic (prima din tabelulul ordonat) se
adun succesiv frecvenele fiecrei valori (sau clase); prin urmare,
pentru fiecare valoare se consider nu numai frecvena sa proprie,
ci suma acestei frecvene cu a tuturor valorilor inferioare mrime
numit
frecven
cumulat.
Distribuia
de
frecvene
corespunztoare se va numi distribuia frecvenelor cumulate
(tabelul 4).
Numr de
biei x
0
1
2
3
4
5
6
7

Numr de
familii F
21
111
287
480
529
304
126
19
Total: 1877

Numr cumulat
de biei xc
0
01
02
03
04
05
06
07

Numr cumulat
de familii Fc.
21
132
419
899
1428
1732
1858
1877

Tabelul 4: Frecvene cumulate pentru numrul de biei n familii cu


7 copii

27.00%
25.00% 513
470

Frecven absolut

600
500

200
100

0.2

320

285

300

0.25

17.00%

15.00%

400

0.3

0.15

7.00%

6.00%

132

1.00% 112

1.00%
23

22

0.1
0.05
0

Numr de biei

Frecven procentual

Diagrama frecvenelor
Este interesant s nlocuim tabloul cifrelor unei distribuii de
frecvene cu o reprezentare grafic, care d distribuiei de frecven
o imagine mai gritoare, permind a face s apar cu uurin
alura general a caracteristicilor eseniale, adic diagrama
frecvenelor.
Modul de reprezentare cel mai des utilizat este histograma:
fiecare valoare (clas) este figurat printr-un dreptunghi a crui
baz corespunde valorii (sau intervalului de clas) reprezentat pe
axa absciselor i a crui nlime este proporional cu efectivul
(numrul, procentajul) acestei valori (clase), fiind reprezentat pe
ordonat.

Figura 2: Histograma numrului de biei n familii cu 7 copii


Se obine astfel o mulime de dreptunghiuri cu aceeai lime i a
cror nlime i suprafa sunt respectiv proporionale cu efectivele
fiecrei valori (sau clase).
Se poate construi identic diagrama frecvenelor, notnd pe
ordonate nu frecvenele absolute, ci pe cele relative, f

F
. n acest
n

caz suprafaa histogramei va fi egal cu suma frecvenelor relative,


deci va fi egal cu 1. Acest mod de lucru nu modific aspectul
histogramei, cu condiia de a alege pentru scara frecvenelor
relative uniti mai mari. Axa ordonatelor este atunci gradat n
procente n raport cu numrul total de cazuri.
Similar, reprezentarea grafic a frecvenelor cumulate duce la
obinerea unei diagrame numit diagrama cumulat a datelor , cu
un aspect grafic caracteristic.
Diagrama cumulata
160
140
120
83

80

56

60
33

40
0

136 139 141

105

100

20

129

118

0
0

2
1

9
2

19

10

11

12

Figura 3. Exemplu de diagram cumulat


Principalele tipuri de diagram de frecvene
Diagramele de frecvene folosite pentru observaiile din
biologie i medicin pot acoperi aspecte foarte variate. Totodat, se
pot reduce adesea la tipuri bine-definite, evocnd cu certitudine
distribuiile
teoretice
ale
calculului
probabilitilor.
Exist
urmtoarele tipuri generale de diagrame:
1. Diagrame simetrice: frecvenele diferitelor clase se grupeaz
simetric descresctor de o parte i de alta a unei frecvene centrale
maximale (figura 4).
Diagrama simetrica

Frecvente absolute

30

27
23

25

22

20
14

15

13

10
10

11

5
0

11

12

0
0

10

Figura 4. Distribuia a 8879 proteine marcate cu iod


Acest tip de diagram corespunde cazului unei bine-cunoscute
distribuii teoretice din calculul probabilitilor, numit distribuia
normal (gaussian), care joac un rol fundamental n statistic. Ea
se ntlnete efectiv foarte adesea n biologie, cnd eantionul
studiat aparine unei populaii normal distribuite.
2. Diagrame asimetrice: corespund cazului unei frecvene
maximale n jurul creia se grupeaz i frecvenele diferitelor clase.
Frecvenele descresc mai rapid fa de cea maxim ntr-o parte a
diagramei, comparativ cu cealalt parte (figura 5).

Frecventa absoluta

Diagrama asimetrica
40
35
30
25
20
15
10
5
0

34
22

26

11
6

19

20

21

22

23

24

25

3
26

1
27

Valorile diametrului

Figura 5. Distribuia diametrelor a 100 cochilii de cepaea memoralis


3. Diagrame hiperbolice: sunt un caz particular al distribuiei
asimetrice, unde frecvena maximal se situeaz la una dintre
extremitile distribuiei (figura 6).

Frecventa absoluta

Diagrama hiperbolica
350 330302
286
300
250
200

195

150
100
50

40 39 42

23 22 24 23 21 20 35 36 34 37 32

0
5 10 15 20 25 30 35 40 45 50 55 60 65 70 65 70 75 80
Vrsta

Figura 6. Distribuia deceselor prin scarlatin (Anglia 1933)


Uneori, distribuia asimetric este mascat prin adoptarea unui
interval de clas mai mare.
4. Distribuia bimodal: prezint dou frecvene maximale
corespunztoare diferitelor valori ale variabilei (figura 7). Acest
aspect sugereaz existena, ntr-un eantion studiat, a dou
populaii distincte.

Diagrama bimodala

Frecventa absoluta

30
25
20
15
10
5
0
10

20

30

40

50

60

70

80

Varsta

Figura 7. Vrsta de apariie a gimcomastiei la 98 subieci


Poligoane de frecven
Se unesc mijloacele marginilor superioare ale fiecrui dreptunghi al
histogramei reprezentative a unei serii de frecvene. Se obine o
linie frnt, numit poligon de frecvene al seriei corespunztoare,
care indic cum variaz frecvena de-a lungul mulimii valorilor
seriei (figura 8). Dup construirea poligonului de frecvene, se vede
c fiecare dintre colurile amputate sunt compensate cu triunghiuri
adiacente, astfel nct suprafaa nglobat n poligonul de frecven
rmne aceeai (fiind echivalent cu suprafaa histogramei).
Observaie: Poligonul de frecven are aceeai semnificaie cu
marginea superioar a histogramei.
25

Frecventa

20
15
10
5
0
1

Figura 8. Poligon de frecvene

S-ar putea să vă placă și