Documente Academic
Documente Profesional
Documente Cultură
SI
BIOSTATISTICA
Informatica Medicala si
Biostatistica
7 cursuri
Nota:
LP (20%) (max 3 abs + min nota 5)
Proba practica (30%) (min nota 5)
Referat (proiect) (10% -optional)
Proba teoretica (40%) (min 4 rasp corecte/20)
LP -> Proba practica -> Proba teoretica
Tipuri de date, frecvene,
distribuii, eantionare
Coninutul acestui curs:
Tipuri de date
Distribuii de frecven
Histograme i alte reprezentri grafice
Simetrie i asimetrie, mediana i alte
cuantilele, media, amplitudinea, dispersia,
abaterea standard
Distribuia normal
Tipuri de date
Datele calitative apar atunci cnd indivizii pot aparine
unor (fi clasificai n) clase separate.
Ex: diagnosticul, sexul, decedat/viu
O variabil calitativ este cunoscut i sub numele de
variabil categorial, variabil de clasificare sau atribut.
Datele cantitative sunt numerice i sunt obinute fie prin
numrare fie sunt rezultatul unei msurtori.
Dac valorile sunt numere ntregi (obinute prin numrare)
atunci aceste date se numesc discrete.
Ex: nr de episoade de ulcer
Dac sunt valorile sunt obinute prin msurtori atunci ele
pot fi orice valoare dintr-un interval i n acest caz se
numesc continue.
Ex: presiunea sngelui, colesterolul seric
Tipuri de date
Populaie - nr mare de indivizi
- caracter dinamic
- este bine definit la un moment de timp dat
Eantion-ul este parte mic din populaie (se poate
extrage suficient informaie pentru a se face inferene
asupra caracteristicilor studiate la nivelul populaiei)
Variabilele sunt caliti sau cantiti care pot s aib
valori diferite de la un membru al unui grup (eantion) la
altul.
O statistic este o formul a crei valoare se obine cu
ajutorul datelor dintr-un eantion.
Distribuii de frecvene
Sursa de referin pentru pacienii dintr-un studiu
psihoterapeutic referitor la consilierea durerii lombare
(Frost et al., 2004)
Frost H, Lamb SE, Doll HA, Carver PT, Stewart-Brown S. (2004) Randomised controlled trial of physiotherapy compared with advice
for low back pain. British Medical Journal 329, 708-711.
Distribuii de frecvene
Sursa de referin pentru pacienii dintr-un studiu
psihotarapeutic (Frost et al., 2004)
Nelson EA, Iglesias CP, Cullum N, Torgerson DJ. (2004) Randomized clinical trial of four-layer and short-stretch compression
bandages for venous leg ulcers (VenUS I). British Journal of Surgery 91, 1292-1299.
Categorii ordonate
Mobilitatea pacienilor recrutai n studiul VenUS I
(Nelson et al., 2004)
Imobilitate
1
2
3
Markus HS, Barley J, Lunt R, Bland JM, Jeffery S, Carter ND, Brown MM. (1995) Angiotensin-converting enzyme gene deletion
polymorphism: a new risk factor for lacunar stroke but not carotid atheroma. Stroke 26, 1329-33.
Variabile continue
Colesterolul seric (mmol/L) msurat pe un eantion de 86
pacieni cu accident vascular cerebral (Markus et al., 1995).
Exist mai multe valori apar doar o singur dat iar numrul
de apariii al unei valori nu ajut n acest caz.
Variabile continue
Colesterolul seric (mmol/L) msurat pe un eantion de 86
pacieni cu accident vascular cerebral (Markus et al., 1995).
Frecvena relativ
Frecvena
Frecvena
Frecvena
Densitate de frecven
Frecvena
2 4
Frecven
Pe scala frecvenelor, unificarea
intervalelor produce o impresie
greit.
Presiunea sistolic a sngelui (mm Hg)
Combinarea
Densitate de frecven
Form corect
ultimelor 3 a distribuiei
Frecven
intervale!
Impresie
eronat!
Presiunea sistolic a sngelui (mm Hg) Presiunea sistolic a sngelui (mm Hg)
Histograme i alte grafice pentru frecven
Pentru o variabil discret dreptunghiurile (barele) pot
fi separate:
Frecvena
Frecvena relativ
unirea vrfurile barelor
din histogram
Sntoi
Util n reprezentarea a Frecvena relativ
mai mult de o Pacieni cu
accident vascular
distribuie pe aceleai
axe!
Colesterolul seric (mmol/L)
Histograme i alte grafice pentru frecven
Pentru o variabil calitativ se poate folosi diagrama
circular sau diagrama cu dreptunghiuri orizontale
(bare):
Forma distribuiilor de frecven
Modul este valoarea cea mai frecvent ntlnit n
distribuie.
Cozile sunt locuri sunt extreme ale distribuiei unde
observaiile sunt, de obicei, rare.
Distribuia unimodal este distribuia cu un singur modul.
Modul
Frecvena
Coada
Coada
inferioar
superioar
O singur
populaie!
Frecvena
nlimea (cm)
Forma distribuiilor de frecven
Prile histogramei aflate n apropierea extremelor se
numesc cozi ale distribuiei.
Dac coada din dreapta este mai lung dect coada
din stnga atunci distribuia este asimetric la
dreapta sau pozitiv asimetric.
Frecvena
Frecvena
Vrsta gestational
(sarcinii) n
Frecvena
momentul naterii.
-
Vrsta sarcinii (sptmni)
Forma distribuiilor de frecven
Media
Mediana
Aceasta este o msur util din punct de vedere descriptiv, dar are
dou dezavantaje:
- depinde de valorile extreme (variaz mult de la un eantion la altul)
- depinde de mrimea eantionului (eantion mare => extremele
departate una de cealalt)
Sintetizarea datelor cantitative:
variabilitatea
(m-2s, m+2s):
(148.1, 176.3)
nlimea (cm)
!!Majoritatea observaiilor (aproximativ 2/3 65%) se afl
la o SD fa de medie. Aproape toate se ncadreaz n
aproximativ 2xSD fa de medie (aproximativ 95%).
Sintetizarea datelor cantitative:
abaterea standard
Colesterol: s = 1.96 = 1.40 mmol/L
Distribuie aproape
simetric!
media= 6.34
Frecvena
mediana= 6.15
4,5 valori n afara
intervalului
(m-2s, m+2s)
Media-2s Media Media+2s
Media-s Media+s
(pozitiv asimetric)
media= 9.4
mediana= 3
7% valori mai mari dect
m+2s!
Media-2s Media Media+2s
Media-s Media+s
media= 38.5
mediana= 39
2 valori din 1749 (0.1%)
mai mari dect m+2s!
62 valori din 1749 (3.5%)
Media-2s Media Media+2s
mai mici dect m-2s!
Media-s Media+s