Sunteți pe pagina 1din 30

NOTIUNI DE STATISTICA

Dr. Adina Ghemigian 2013

Definitie
Statistica = tiina, ramur a

matematicii, care permite aprecierea unor parametri populaionali prin studiul unui numr redus de elemente ale populaiei n studiu (int)

De ce avem nevoie de statistic?


Vrem sa tragem concluzii ct mai valide din cantiti limitate de date. Diferene importante sunt deseori mascate de variabilitatea biologic i/sau imprecizia experimental Mintea uman exceleaz n gsirea de tipare i relaii, dar tinde s generalizeze n exces.

De ce avem nevoie de statistic?

Calculele statistice extrapoleaz de la eantion la populaie


n cercetarea biomedical se presupune c populaia este infinit, sau cel puin foarte mare n comparaie cu eantionul nostru.

De ce avem nevoie de statistic?


Control de calitate O fabric de cmi: se extrage la ntmplare un eantion din ntreaga populaie de cmi, iar concluziile legate de calitatea eantionului se extrapoleaz la toat producia. Sondajul politic Se extrage la ntmplare un eantion de votani, iar rezultatul se extrapoleaz la ntreaga populaie de votani

De ce avem nevoie de statistic?


Studii clinice Eantionul de pacieni studiat este rareori extras la ntmplare. Totui, pacienii inclui n studiu sunt reprezentativi pentru ali pacieni similari, iar extrapolarea de la eantion la populaie se poate face. Care este definiia precis a populaiei?
Toi pacienii care vin la acel spital? Toi pacienii din ora? Din ar? Din lume?

Ce pot face calculele statistice?


Estimarea statistic
ex: media - estimare punctual interval de ncredere

Testarea statistic a unei ipoteze


decizia dac o asociere observat este real, sau datorat ntmplrii / p

Construirea de modele statistice


testeaz ct de bine se ncadreaz datele experimentale ntr-un model matematic (ex: regresia linear)

Variabile - definitie
Variabila = orice calitate, caracteristic sau constituent al unei persoane sau lucru, care poate fi evaluat la nivelul unei populatii toat cercetarea medical = studiul relaiilor dintre variabile cercettorii medicali sunt interesai de studierea fie a asociaiilor, fie a diferenelor dintre variabile.

Variabile - clasificare
Cantitative (caracteristic msurabil)

Calitative (caracteristic ce nu poate fi msurat)

Variabilele calitative
Nominale grupuri de elemente ce nu pot fi
ordonate una in raport cu cealalta (culoarea prului, rasa, grupa sanguina) Nominale ordonate (ordinale) concluziile pot fi grupate in doua sau mai multe categorii intre care exista o ordine naturala (evolutie, clasificari, eficiena unui tratament: slab, bun, foarte bun) Binare variabile ce nu pot lua decat 2 valori (bolnav / sntos, mort/viu, fumator/nefumator, prezent/absent, DA/NU, prezent/absent)

Variabilele cantitative
Continue o variabil msurabil care poate lua o infinitate de valori, de obicei ntr-un interval (TAD, colesterol, inaltimea, greutatea, varsta)
Discrete variabile care nu pot lua dect valori ntregi (scor APGAR)

Statistica
Descriptiva descrie valori obinute pentru o variabila studiata Interferentiala (inductiv) este partea de analiz a datelor care permite extrapolarea unei concluzii trase pe baza unui eantion spre populaia int pentru care a fost efectuat studiul.

Statistica descriptiv
Variabile nominale
tabel de frecven (frecvena observaiilor pe categorii) grafic: bare, plcint modul (categoria cea mai frecvent)

Figura II.3. Distribuia pe orae a cazurilor incluse n studiu

TIMISOARA

11 (6,7% ) 3 (1,8% ) 10 (6% ) 13 (8% ) 23 (14% )

TARGU MURES

SIBIU

IASI

CLUJ

BUCURESTI

98 (60% ) 6 (3,7% )

BRASOV

Statistica descriptiv
Variabile cantitative Msura tendinei centrale: Media aritmetica Mediana = este acea valoare din irul de date care mparte n dou pri egale irul ordonat de valori, situndu-se la mijlocul seriei statistice. Modul = constituie valoarea care apare cel mai des, deci valoarea cu numrul cel mai mare de apariii

Statistica descriptiv
Variabile cantitative
Msura dispersiei: Amplitudinea = diferenta dintre valoarea maxima si cea minima Abaterea standard (deviatia standard = DS) = indicator de imprastiere a datelor Coeficientul de variatie = raport procentual ntre abaterea standard i valoarea medie a irului de valori Curba de distributie indica distributia datelor: normala/asimetrica

47,5%

(x-x)2 SD = n-1

Statistica interferentiala
Scopul analizei statistice este de a evalua efectul unui tratament sau al unui factor de risc asupra unei populatii tinta prin intermediul datelor obinute din eantionul studiat. Exist posibilitatea ca rezultatele obinute prin studiul unui eantion s fie datorate ntmplrii incertitudine statistica. Testele statistice ne ajut s apreciem n ce msur rezultatele sunt ntmpltoare i mai ales n ce msur i dac se pot aplica populaiei generale. Se face prin testarea ipotezelor statistice = testarea semnificaiei statistice.

P si intervalele de incredere

populaie

eantionare

p, CI

eantion

Masurarea incertitudinii statistice/Testarea semnificatiei statistice


Incertitudinea statistica poate fi cuantificata prin:
testarea ipotezei (cu calculul valorii p) calculul intervalelor de incredere (CI)

Valoarea p
Colectarea datelor din dou eantioane valori medii diferite. Observarea celor dou medii diferite nu este suficient pentru a concluziona c populaiile au medii diferite. E posibil ca populaiile s aib aceeai medie, iar diferena observat s fie o coinciden n urma eantionrii aleatorii este necesara calcularea probabilitatii. Valoarea p rspunde la aceast ntrebare: dac populaiile au avut ntr-adevr aceeai medie, care este probabilitatea de a observa o asemenea diferen (sau una mai mare) ntre mediile eantioanelor ntr-un experiment de dimensiunea acestuia?

Valoarea p
Valoarea p este o probabilitate, cu valoarea oscilnd ntre 0 i 1. Dac valoarea p este mic, concluzia este c diferena are anse mici s fie provocat de eantionarea aleatorie putndu-se conchide c populaiile au medii diferite.

Marimea esantionului conteaza!

INDICATORI

Incidena
Msoar frecvena cu care un eveniment (boal) apare n populaie ntr-o perioad de timp Incidena = numrul de cazuri noi aprute ntr-o perioad de timp dat / populaia la risc n aceeai perioad de timp ! nu include cazuri preexistente ! este obligatorie mentionarea perioadei de timp Exemplu: 0.2% sau 2 cazuri noi/1000 locuitori/an

Prevalena
Proporia de persoane dintr-o populaie care au boala sau alt caracteristic la un moment dat sau ntr-o perioad de timp dat. Exemplu: 2% din populatie are diabet

Riscul relativ (RR)


Este o masura a asocierii intre un factor de risc si aparitia bolii. Se calculeaza raportul dintre riscul la expusi si la neexpusi: RR = 1 (risc identic in ambele grupuri) RR < 1 (riscul la neexpusi e mai mare posibil factor protector) RR> 1 (riscul la expusi e mai mare posibil factor de risc)

Tabel de contingenta 2 x 2 pentru calculul RR


Boala prezenta
Expus Neexpus Total a c a+c
a a+b
RR = c c+d

Boala absenta
b d b+d

Total
a+b c+d a+b+c+d

Sensibilitate, Specificitate
sensibilitate = a / (a+c) specificitate = d / (b+d)
sensitivity = probability of a positive test among patients with disease specificity = probability of a negative test among patients without disease

Patienti cu boala

Patienti fara boala

Test pozitiv Test negativ

a c

b d

Valoare Predictiva
Valoare predictiva pozitiva= a / ( a+b)
Valoare predictiva negativa= d / (c+d)
Positive predictive value = probability of disease among patients with a positive test Negative predictive value = probability of no disease among patients with a negative test

Patienti cu boala Test pozitiv


Test negativ

Patienti fara boala

a
c

b
d

S-ar putea să vă placă și