Sunteți pe pagina 1din 47

BIOSTATISTICA

PARTEA I
Unelte

Vom nva prin acest curs s folosim dou


excelente instrumente pentru profesia pe care o vei
practica, familiarizndu-ne cu biostatistica, prin
intermediul calculatorului.
INDUCIE

Inferen Statistic

TEORII
OBSERVAII
GENERALE

Predicie Statistic

DEDUCIE
n a few minutes
a computer can make
a mistake so great that
it would have taken
many man many
months to equal it.
Bill Gates
BIOSTATISTIC INTUITIV

Curs orientat ctre nelegerea conceptelor i a


demersului logic statistic, fr a fi bazat pe formule
matematice (Motulsky H., Glantz S.), n ideea dezvoltrii
capacitii de utilizare a softurilor statistice
STATISTIC DESCRIPTIV

Tipuri de variabile
Sintetizarea datelor
TIPURI DE VARIABILE

Limbaj medical Limbaj statistic


Do you speak the language?
Tem: S identificai tipul fiecrei variabile din Setul Minim de Date la
nivel de Pacient (SMDP) din Foaia de Observaie Clinic General
(FOCG)
Variabila se definete ca o cantitate observabil sau un o
caracteristic, un atribut care variaz de la un membru la
altul al unei populaii luate n studiu. De exemplu, dac
msurm greutatea fiecrui elev dintr-o clas vom avea o
serie de numere care vor varia de la un elev la altul.

Variabil versus constant: Spre deosebire de variabil,


constanta reprezint un numr specific care rmne acelai
indiferent de condiii. De exemplu, punctul de ngheare al
apei este acelai n orice condiii, i anume 0C.
Limbaj medical Limbaj statistic

Problema de studiat: Spitalul in care suntem angajai ii


propune s ofere servicii de e-health/e-sntate marienilor.
Suntem trimii s culegem informaii n acest scop, i ncepem
prin a studia nlimea marienilor.

?
Definirea problemei

Sursa:National Geographic August 2004


Metoda de lucru

S presupunem c din mergem pe marte i ncepem prin a


msura nlimea (caracteristica sau variabila) tuturor
marienilor obinnd urmtoarele valori (variantele
variabilei):

129,144,122,130,135,130,135,121,127,121,128,128,123,138,12
9,140,122,
32,129,135,132,132,143136,142,138,147,140,142,149,143,130,
126,129,127,140,130,134,136,149,138,142,138,142,143,14012
5,126,128,139,132,129,137,139,122,123,128,124,130,133,119,1
15,137,126,122,130,135,125,128,135,126,128,113,130,123,123,
123,128,135,122,132,120,131,117,130,128,129,132,139,139,12
9,140132,139,135,126,129,133,141.
Dac ncerc s fac o scar a frecvenei valorilor obinute,
i pun unul sub altul marienii cu aceeai nlime (rotunjind
cifrele), obin o anumit form, (ca cea din slide-ul urmtor),
care reprezint felul n care se distribuie (distribuia) nlimile
marienilor (distribuie de frecven a nlimilor).

Se observ c majoriatea au o nlime ntre 124cm i


138cm, i c foarte puini au sub 117cm sau peste 145cm.
Dac ncerc s desenez o linie care s delimiteze limita
superioar a acestei forme, obin o linie curb care seamn
foarte mult cu un clopot.

Majoritatea marienilor au o nlime aflat mai aproape de


medie (132cm), de centru, dect la distan fa de ea, i un
numr aproximativ egal de persoane sunt mai nalte sau mai
scunde fa de medie, nlimile se mprtie simetric n jurul
mediei.
f

124 cm 138 cm
Medie =
132 cm
117 cm 145 cm
PARAMETRII -
CARACTERISTICI
Simbol n
POPULAIE
volumul N
media
deviaia standard
Cum am putea folosi un limbaj numeric, sintetic, pentru
toat informaia pe care am adunat-o?
Cu alte cuvinte, cum calculm parametrii statistici ai
distribuiei pe care o avem? ntreaga munc pe care am
depus-o poate fi sintetizat prin cei 3 parametri statistici care
definesc orice distribuie normal de variabil.

Volumul Media Deviaia Standard a


populaiei ? populaiei, cm populaiei, cm
200 132 7
INDICATOR DE TENDIN CENTRAL

Media : suma tuturor valorilor (notate cu X)


dintr-o distribuie divizat cu numrul acestor
valori (notate cu N).
=X/N
Media
Suma tuturor valorilor dintr-o distribuie de frecven
divizat cu numrul acestor valori
Ex.: 5 persoane de sex masculin incluse ntr-un studiu privind
medicamentele antihipertensive au vrstele: 52, 55, 56. 58, 59 ; suma
acestora este 280; prin divizarea cu 5 obinem media de vrst a grupului
de 56 de ani.

Este foarte sensibil la valorile extreme, deci nu este un


parametru care s poat caracteriza distribuiile asimetrice
Ex.: dac n exemplul de mai sus ar exista un al aselea pacient cu vrsta
de 92 de ani, atunci media de vrst ar fi de 62 de ani, dei un singir
brbat est peste 60 de ani; n aceste condiii mediana ar fi de preferat ca
punct de mijloc.

Rezist cel mai bine fluctuaiilor dintre diferite eantioane


(eantioane reprezentative repetate ale aceleiai populaii tind s
aib medii foarte similare , ceea ce se numete teorema limitei
centrale (calcul SE).
Distribuie asimetric pozitiv

Mod Median Medie

20
Mediana
mparte distribuia de frecven n dou atunci cnd toate
variabilele sunt listate n ordine: jumtate la stnga ei,
jumtate la dreapta ei
n cazul unui numr par de variabile, mediana se
calculeaz ca medie a celor dou variabile centrale
n ex. de mai sus, vrsta median a primilor 5 pacieni
din studiu este de 56 de ani, avnd aceeai valoare ca i
media; n cazul n care lum n considerare primii 6
pacieni, exist dou vrste centrale: 56 i 58 de ani.
Mediana reprezint media aritmetic a acestora, adic 57
de ani.
Nu este influenat de valorile extreme, fiind foarte util ca
msur central a distribuiilor de frecven asimetrice
Coincide cu percentila 50
Mod
valoarea care apare cu cea mai mare frecven
(distribuie unimodal)
dac apar dou variabile cu cea mai mare frecven,
distribuia se numete bimodal ( o distribuie
bimodal sugereaz faptul c dou populaii sunt
amestecate, aa nct ne putem gndi la mprtirea
acestei populaii n 2 subpopulaii unimodale care s fie
analizate prin intermediul testelor pentru distribuii
normale)
dac mai mult de 2 variabile apar cu cea mai mare
frecven, distribuia se numete multimodal
este total neinfluenat de valorile extreme ale
distribuiei
Distribuie Bimodal

Mod Medie Mod


Median
23
A

Poziia
parametrilor
50% sub medie

f
B

Medie
Median
Mod
24
Distribuie asimetric pozitiv

Mod Median Medie

25
Distribuie asimetric negativ

Medie Median Mod

26
Relaia dintre msurile tendinei
centrale depinde de forma distribuiei

Dac modul = mediana = media atunci distribuia


este unimodal i simetric, deci normal
Dac modul < mediana < media atunci distribuia
este uor asimetric spre stnga
Dac modul > mediana > media atunci distribuia
este uor asimetric spre dreapta
Dac modul > media > mediana atunci distribuia
este puternic asimetric spre dreapta
Dac modul < media < mediana atunci distribuia
este puternic asimetric spre stnga
Exemple

Ex: Precizai care este mediana i care este modul


pentru urmtorul set de date:
3,3,9,5,4,0,6,3,4,0,3,3,3,4,4,5,6,9
0,0,3,3,3,3,3,3,4,4,4,4,5,5,6,6,9,9
Ex: precizai care este modul pentru eantionul de 23
de pacieni cu urmtoarele grupe sangvine:
GRUPA SANGVIN FRECVENA
(NUMR DE PACIENI)
A 5
B 5
AB 3
O 10
INDICATOR DE TENDIN CENTRAL

Media
Median
Mod
Avantaje Dezavantaje

Media -calculat pe baza tuturor -distorsionat de valorile extreme, deci


variabilelor nu este un parametru care s poat
-definit i deci mangerizat caracteriza distribuiile asimetrice
matematic - distorsionat de distribuie asimetric
-distribuia eantionului a variabilelor
cunoscut
-rezist cel mai bine fluctuaiilor
dintre diferite eantioane
Mediana -nedistorsionat de valorile -ignor majoritatea informaiei
extreme, fiind foarte util ca - ntr-o oarecare msur, slab
msur central a distribuie de eantinare
distribuiilor de frecven - nedefinit matematic
asimetrice
-nedistorsionat de distribuie
asimetric a variabilelor
Modul - uor de calculat -ignor majoritatea informaiei
- util pentru datele nominale - slab stabilitate de eantionare
- nedefinit matematic
Marieni i
Venusieni

Medie

Ct de mult variaz nlimile n fiecare populaie (marieni i


venusieni) se exprim n forma mai larg sau mai ngust a
clopotului, deci am putea s o cuantificm att prin mrimea
suprafeei de sub clopot (varian), ct i prin distana de la medie
la fiecare variabil (deviaia standard). Dou populaii normale
(baze de date) pot avea aceeai medie dar deviaii standard diferite
(distana de la medie la marginea clopotului). Cu ct SD este mai
mare, cu att mai mare este variabilitatea (datele sunt mai
rspndite, mai mprtiate).
INDICATORI DE DISPERSIE

Ofer informaii despre extinderea, mprtierea


datelor:

Amplitudine
Deviaie standard
Varian
Coeficient de variaie
AMPLITUDINEA

diferena dintre valoarea maxim (Xmax) i


minim (Xmin) din serie:
A = Xmax Xmin

dezavantaj: se bazeaz doar pe valorile


extreme ale seriei
nu ofer nici o informaie despre ct de
aglomerate sunt datele ntre extreme
VARIANA

media ponderat a abaterilor ptratice dintre


valorile observate i media lor
k

(x x)
i 1
i
2
fi
x2 k

f
i 1
i
DEVIAIA STANDARD

distana fiecrui punct fa de centrul seriei,


abatere care poate fi n sens pozitiv, ct i n
sens negativ

x 2
x
Distribuia Normal

Datele sunt distribuite similar n stnga i n dreapta


mediei, aa nct distribuia este simetric

Are form de clopot

Depinde de doi parametri:


= media (populaiei)
= deviaia standard (a populaiei)
Aceast form de distribuie apare att de des, nct matematicienii au
numit-o distribuie normal sau gaussian.
Ex.: dac AV a unei populaii este normal distribuit, cu o medie de 70 i
o DS de 5, atunci putem spune c 68.3% din populaie are o AV cuprins
ntre 65 i 75, 95,5% din populaie are o AV cuprins ntre 60 i 80 i
99.7% din populaie are o AV cuprins ntre 55 i 85 (teorema limit
central)

Medie

1 sd 1 sd 1 sd 1 sd 1 sd 1 sd

68.3%
95,5%
99.7% 37
Coeficientul de variaie (CV%)

un indicator procentual al raportului dintre


deviaia standard i media caracteristicii
studiate:
COEFICIENTUL DE VARIAIE

Gradul de omogenitate al seriei relativ la pragurile


coeficientului de variaie:

CV% 10% Serie omogen cu dispersie mic


10% < CV% 20% Serie relative omogen
20% < CV% 30% Serie relative eterogen
30% < CV% Serie eterogen
INDICATORI DE LOCALIZARE

QUANTILE impartirea in n intervale

CAZURI PARTICULARE
MEDIANA n = 2
QUARTILE n = 4
DECILE n = 10
CENTILE n = 100
PROMILE n = 1000
Calcul: dupa ordonare!

From Primer of Biostatistics by Stanton A Glantz


Msuri ale Avantaje Dezavantaje
mprtierii

Amplitudinea - uor de determinat - utilizeaz numai dou valori


- este distorsionat de valorile
extreme
- tinde s creasc odat cu creterea
volumului eantionului

Variana - utilizeaz toate valorile - unitatea de msur este ptratul


- este definit matematic unitii seriei de date
- este sensibil la valorile extreme
- nu este un parametru care s poat
caracteriza distribuiile asimetrice

Deviaia - are avantajele varianei - sensibil la valorile extreme


Standard - unitatea de msur este - - nu este un parametru care s
aceeai cu a seriei de date poat caracteriza distribuiile
- este uor de interpretat asimetrice
FRECVENE
Frecvena absolut numrul de elemente din serie
care aparin clasei
Frecvena relativ frecvena absolut raportat la
talia seriei
Frecven procentual procentul din talia seriei
reprezentat de ctre frecvena absolut
Frecvena (absolut) cumulat cresctor numrul
de elemente de valoare mai mic sau egal dect
marginea superioar a clasei
Frecven (absolut) cumulat descresctor
numrul de elemente de valoare mai mare sau egal
dect marginea inferioar a clasei
HISTOGRAMA

Reprezentarea grafic a tabelului de clase de


frecven
STATISTIC DESCRIPTIV N EXCEL

Tools Add-Ins Analysis ToolPak

Rezultate
EPI INFO SOFT STATISTIC GRATUIT
CDC SUA

http://www.cdc.gov/epiinfo
STATISTIC EPI INFO
Multumesc pentru atenia acordat!

S-ar putea să vă placă și