Sunteți pe pagina 1din 45

Curs de Informatică Medicală și

Biostatistică
Titular de curs:
Dr. Rac-Albu Marius M.D., PhD
Șef de lucrări IMBS
Medic Specialist Cardiologie, Epidemiologie

„...gândirea statistică va deveni într-o zi la fel de necesară pentru un cetăţean


eficient, la fel ca şi abilitatea de a citi şi a scrie”.

H.G. Wells (1866-1946)


Examen practic-30%
Activitate laborator-20%
Proiect-10%
Examen curs-40%->5!!!
Manuale de bază:
• Informatică medicală pentru studenți
Luminiţa Iliuţă, M.Rac-Albu, E.Poenaru, E.Panaitescu
Editura Universitara UMF Carol Davila, Bucuresti 2013
ISBN 978-973-708-725-6
• Biostatistică pentru studenți
E.Panaitescu, Luminiţa Iliuţă, M.Rac-Albu, E.Poenaru,
Editura Universitara UMF Carol Davila, Bucuresti 2013
ISBN 978-973-708-728-7

Bibliografie suplimentară (facultativă):

• Orice manual introductiv în statistică


• Referințele bibliografice ale cursului
Dificultăți:
Informație nouă, volum mare de concepte noi, informații
interdependente
• În special în prima parte a cursurilor si LP-urilor
• Atenție absențe: chiar și o absență poate însemna mult.

Folosirea unor termeni/concepte noi, particularizate, stricte

• Este nevoie de precizie și rigoare în exprimare. Se capătă prin studiu și


exercițiu
–domeniu al matematicii cu ramuri aplicative
•1770, Londra, baronul Bielfeld „The Elements of Universal Erudition” (capitol de
„statistică”)
–recoltarea, descrierea şi analizarea datelor în vederea extragerii unor concluzii
(inferenţe) pe baza acestora
–operează cu date numerice care descriu realitatea din jurul nostru
•Datele
–informații obținute prin categorializare, numărare sau măsurare, pe baza utilizării
unor metode adecvate
Statistica
• descrie şi prezintă în modul cel mai potrivit
informaţiile cu care veţi lucra - se obţin previziuni
credibile privind variabilele de interes

• îmbunătăţeste desfăşurarea activităţilor de care


sunteţi răspunzători - se trag concluzii privind
colectivităţi numeroase, având la dispoziţie date
obţinute din eşantioane
•Statistica este încercarea de a răspunde cu ajutorul
numerelor la întrebările pe care ni le punem

DAR…
•Punctul central al statisticii este problema (raționamentul) nu numerele!
–Ne punem o problemă
•Este eficientă utilizarea unei metode de tratament?
–Construim un model de cercetare
•Același grup înainte/după;
Două grupuri (terapie/non-terapie)
–Măsurăm (cuantificăm)
•Chestionar…
–Analizăm
•Proceduri statistice (descriptive, test de semnificație a diferenței ș.a.)
–Tragem concluzii…
•Acceptăm existența unui efect? Cât de mare este? Câtă încredere putem acorda?
Observație Un nou tratament în ICC

Definirea problemei Este eficient noul tratament?

Terapeutul: DA RISC
Ipoteză Cercetătorul: ???? vs
BENEFICIU
Date Măsurăm eficacitatea tratamentului pe 2 grupuri

Testarea ipotezei Compararea mediilor

Respingere Acceptare Este/Nu este diferența semnificativă?

Publicare/Concluzie Publicarea concluziei într-un anumit format


Date, frecvențe și distribuții
Date, frecvențe și distribuții
Statistica - asociată cu un anumit tip de prelucrare a informaţiilor
din lumea înconjurătoare - acel tip de prelucrare care:
- clasifică si centralizează informaţiile în tabele, şi grafice
- grupează informaţiile
- descoperă legături între ele, eventuale cauzalităţi
- analizează fenomene complexe
- face şi generalizări ale unor ipoteze descoperite de obicei empiric

Prelucrarea statistică a informaţiilor - “prelucrare a datelor”.


Date - informațiile referitoare la un pacient/individ normal/orice alt obiect
Ex: Numele, prenumele, vârsta, sexul, afecţiunea, celelalte informaţii despre un anume pacient

Prelucrarea datelor - prelucrarea informaţiilor, ca scop important al statisticii


Înregistrarea datelor - înregistrarea pe calculator a acestor informaţii
Datele - tipuri
Calitative – cele care pot lua câteva valori care sunt asociate unor clase (categorii) diferite /
când indivizii aparțin unor clase separate
• O variabilă calitativă mai este denumită și variabilă categorială sau variabilă de clasificare.
• Ex: Sexul pacientului (M, F), tip de diagnostic, statusul actual

Cantitative - sunt cifre (numere) ce pot fi obținute prin numărare, sau pot fi rezultatul unei
măsurători.
• Ex: Orice variabilă a cărei valoare poate fi exprimată în cifre este o variabilă cantitativă, ca de exemplu: aria unui
orificiu valvular, intervalul de timp până la vindecarea unei leziuni, numărul de sarcini anterioare ale unei persoane
de sex feminin etc.
• Variabilele cantitative - discrete sau continue
• Discrete - variabilele pot lua doar câteva valori separate, de ce mai multe ori întregi (numere întregi) - nr de episoade
de ulcer
• Continue - valorile măsurătorilor pot lua orice număr dintr-un interval, precum suprafața plăgii, înălțimea, greutatea
etc
Tipuri de date
Populația
–cercetării: totalitatea „unităților de informație” care constituie obiectivul de interes al unei investigații
(de regulă, persoane)-notiune fizica
–statistică: valorile care descriu populația cercetării-notiune descriptiva
- include un nr. mare de indivizi
- caracter dinamic
- este bine definită la un moment de timp dat
Eșantionul
– Cercetării: toate persoanele care fac obiectul studiului
– Statistic: toate valorile unei variabile, măsurate pe eșantionul cercetării
Este partea mică și reprezentativă din populație (se poate extrage suficientă informație pt a se face
inferențe asupra caracteristicilor studiate la nivelul populației)

Variabilele
- Sunt calități sau cantități care pot să aibă valori diferite de la un membru al unui grup (eșantion) la altul

O statistică este o formulă a cărei valoare se obține cu ajutorul datelor dintr-un eșantion
DISTRIBUȚII DE FRECVENȚĂ

• Distribuţia de frecvenţe a unui set de date – D, ce are N înregistrări


numere reale, se defineşte ca fiind un nou set de date Df ce descrie
încadrarea valorilor setului de date D (frecvenţa acestora) în intervale
de valori predefinite
DISTRIBUȚII DE FRECVENȚĂ
- se pot utiliza următorii indicatori:
• frecvenţa unei categorii este definită prin numărul de persoane care aparțin unei anumite categorii
• frecvența relativă sau frecvenţa proporţională reprezintă proporţia persoanelor care aparțin unei
anumite categorii raportată la totalul pacienților luați în studiu. Astfel, frecvenţa relativă pentru medicii
generaliști este de 256/285 = 0.898 sau 89.8%.
• distribuţia de frecvenţă a unei variabile este definită ca mulțimea valorilor frecvenţelor pentru toate
categoriile posibile
mobilitatea pacienţilor cu ulcere venoase de picior recrutați în studiul VenUS I (Nelson et al., 2004).

Frecvenţa cumulată pentru o valoare a unei variabile reprezintă numărul de indivizi cu valori mai mici
sau egale cu această valoare. Prin urmare, frecvenţa cumulată pentru mobilitatea pacienților cu ”mers”
este de 380, ceea ce înseamnă că 380 dintre participanţii la studiu pot merge într-o anumită măsură.
Frecvenţa cumulată relativă pentru o valoare este proporţia de indivizi din eşantion cu valori mai mici
sau egale cu această valoare. Frecvenţa relativă cumulată pentru mobilitatea pacienților cu ”mers cu
dificultate” este de 380/383 = 0.992 sau 99.2%.
Exemple de distribuții de frecvență :
 pentru variabilele cantitative
HISTOGRAME ȘI ALTE GRAFICE REFERITOARE LA FRECVENȚE
Fig. 2 - Histograma colesterorului seric, scala de frecvențe, cu
lăţimea intervalului de 0.5 mmol/L și limita inferioară a
primului interval de 3.25

Fig. 1: Histograma colesterolului seric, scala de frecvențe


Fig. 3: Histograma colesterorului seric, scala de frecvențe
relative

Densitatea de frecvență
Frecvenţa împărţită la lăţimea intervalului respectiv
numărul de observaţii pe unitatea de variabilă

Fig. 4: Histograma colesterorului seric pentru distribuția


din Figura 2, scala de densitate de frecvență
Figura 5: Histograma presiunilor arteriale sistolice (interval
10mmHg ) la un grup de 92 oameni sănătoşi, scală de frecvență
(date care provin din Markus et al., 1995)

Figura 6: Histograma presiunilor arteriale sistolice cu intervale


mari (20mmHg), scala de frecvență
Figura 6: Histograma presiunilor arteriale sistolice cu intervale
mari (20mmHg), scala de frecvență

Figura 7: Histogramă care induce in eroare pentru presiunile


arteriale sistolice, cu trei intervale combinate într-unul singur
mai larg, scala de frecvență
Figura 8: Histogramă pentru presiunile arteriale sistolice,
cu trei intervale combinate într-unul singur mai larg, scala
densitate de frecvență

Figura 9: Histograma colesterolului seric pentru grupul de


pacienţii cu accident vascular cerebral cu poligonul de
frecvență suprapus
FORMA DISTRIBUȚIILOR DE FRECVENȚĂ
Colesterolul seric (mmol/L) măsurat pe un eşantion de 86 pacienţi
cu accident vascular cerebral (Markus et al., 1995)
Atunci când o distribuție are un singur
modul, o numim distribuţie unimodală.

Modul și cozile unei distribuții

Distribuție bimodală

Tensiunea arterială sistolică la 251 pacienţi admişi la unitatea de


terapie intensivă (datele de Friedland et al, 1996.).
Înălțimea pentru 222 de femei admise în studiul VenUS I

Distribuţia simetrică

asimetrică la stânga sau negativ asimetrică


asimetrică la dreapta sau pozitiv asimetrică