Documente Academic
Documente Profesional
Documente Cultură
Curs 3d Analiza Datelor Si Biostatistica
Curs 3d Analiza Datelor Si Biostatistica
C. Băicuş, 2009
De ce avem nevoie de statistică?
• Calculele statistice
extrapolează de la eşantion la
populaţie
• În cercetarea biomedicală se presupune că
populaţia este infinită, sau cel puţin foarte
mare în comparaţie cu eşantionul nostru.
De ce avem nevoie de statistică?
• Control de calitate
O fabrică de cămăşi: se extrage la întâmplare
un eşantion din întreaga populaţie de
cămăşi, iar concluziile legate de calitatea
eşantionului se extrapolează la toată
producţia.
De ce avem nevoie de statistică?
• Sondajul politic
Se extrage la întâmplare un eşantion de
votanţi, iar rezultatul se extrapolează la
întreaga populaţie de votanţi
De ce avem nevoie de statistică?
• Studii clinice
Eşantionul de pacienţi studiat este rareori
extras la întâmplare. Totuşi, pacienţii incluşi
în studiu sunt reprezentativi pentru alţi
pacienţi similari, iar extrapolarea de la
eşantion la populaţie se poate face.
Tipuri de variabile
• Variabile nominale
– variabile sub formă de nume sau alte simboluri
reprezentînd categorii ce nu pot fi ordonate una
în raport cu cealaltă
– numele, grupa sanguină, sexul, rasa, culoarea
ochilor, diagnosticul etc.
– variabile dihotomice (binare, bimodale) =
variabile ce nu pot lua decât două valori
• mort/viu, fumător/nefumător, prezent/absent,
normal/anormal - DA/NU
Tipuri de variabile
• Variabile ordinale
– variabile ce sunt clasificate în mai mult de două
categorii şi la care există o ordine naturală între
categorii
– evoluţia, stadializări, clasificări, scoruri etc.
Tipuri de variabile
• Variabile cantitative
– continue
• variabile cu un număr potenţial infinit de valori
de-a lungul unui continuum
• înălţimea, greutatea, TA, vârsta etc.
– discontinue (discrete)
• variabile ce pot fi descrise numai prin unităţi
întregi ce nu pot fi măsurate în intervale mai mici
decât unitatea
• AV, nr. copii etc.
Tipuri de variabile - statistică
descriptivă
Variabile nominale
• tabel de frecvenţă (frecvenţa observaţiilor
pe categorii)
• grafic: bare, plăcintă
• modul (categoria cea mai frecventă)
Figura II.3. Distribuţia pe oraşe a cazurilor incluse în studiu
TIMISOARA
11 (6,7%)
SIBIU 10 (6%)
IASI 13 (8%)
CLUJ 23 (14%)
BUCURESTI 98 (60%)
BRASOV 6 (3,7%)
Tipuri de variabile - statistică
descriptivă
Variabile ordinale
• tabel de frecvenţă, mediana, modul
• utilitatea mediei este discutabilă (intervalele
dintre categorii nu sunt egale ca mărime)
• deseori, media este furnizată - se presupune
că intervalele scalei sunt egale sau, cel puţin
aproximativ egale
Clasa Frecventa Frecventa Frecventa
NYHA relativa cumulata
I 50 %
23,8% 23,8%
%
II 70 %
33,3% %
57%
III 60 %
28,6% %
85,7%
IV 30 %
14,3% %
100%
TOTAL 210 %
100%
George J et al.
Heart 2006;92:1420–1424.
Tipuri de variabile - statistică
descriptivă
Variabile cantitative
• măsura tendinţei centrale (media, mediana,
modul)
• măsura dispersiei (deviaţia standard,
varianţa)
• distribuţia normală
47,5%
(x-x)2
SD =
n-1
• SD = deviatia standard
– arata gradul de dispersie al valorilor
Corelaţia a 2 Corelaţie
Variabilă variabile în (coeficient Pearson)/
cantitativă acelaşi grup regresie
Comparaţia a Kruskall-Wallis
3 grupuri
Variabilă Regresie
dihotomică X2 logistică
Fisher exact
Interval de Modelul
Log rank
timp lui Cox
ANALIZA STATISTICA II
C. Băicuş, 2005
P si intervalele de incredere
Cristian Baicus
nov 2005
populaţie
eşantionare p, CI
eşantion
Incertitudinea statistica
• 1/~ p
p=0,375
unidirectional, one tailed (one sided)
p
H0: C=P
H1: C>P 25%
20% 5C 20%
4C 6C
12% 12%
3C 7C
4,5% 4,5%
2C 8C 1%
0,1%1% 0,1%
0C 1C 9C 10C
~17,5%
p=0,175
unidirectional, one tailed (one sided)
p
H0: C=P
H1: C>P 25%
20% 5C 20%
4C 6C
12% 12%
3C 7C
4,5% 4,5%
2C 8C 1%
0,1%1% 0,1%
0C 1C 9C 10C
1%
p=0,01
unidirectional, one tailed (one sided)
p
H0: C=P
H1: CP 25%
20% 5C 20%
4C 6C
12% 12%
3C 7C
4,5% 4,5%
2C 8C 1%
0,1%1% 0,1%
0C 1C 9C 10C
37,5% 37,5%
p=0,75
bidirectional, two tailed (two sided)
p
H0: C=P
H1: CP 25%
20% 5C 20%
4C 6C
12% 12%
3C 7C
4,5% 4,5%
2C 8C 1%
0,1%1% 0,1%
0C 1C 9C 10C
~17,5% ~17,5%
p=0,35
bidirectional, two tailed (two sided)
p
H0: C=P
H1: CP 25%
20% 5C 20%
4C 6C
12% 12%
3C 7C
4,5% 4,5%
2C 8C 1%
0,1%1% 0,1%
0C 1C 9C 10C
1% 1%
p=0,02
bidirectional, two tailed (two sided)
CI
Basescu Procent CI
6/10 60% [27 ,86]
CI
Basescu Procent CI
6/10 60% [27%, 86%]
24/40 60% [43%, 74%]
CI
Basescu Procent CI
6/10 60% [27% 86%]
24/40 60% [43% 74%]
120/200 60% [53%, 67%]
CI
Basescu Procent CI
6/10 60% [27% 86%]
24/40 60% [43% 74%]
120/200 60% [53% 67%]
240/400 60% [55% 65%]
1200/2000 60% [58% 62%]
p şi CI
• p: probabilitatea ca diferenţa dintre tratamente observată în
studiul nostru să fie datorată întâmplării, iar în realitate
(la nivelul populaţiei) să nu existe nici o diferenţă între tratamente.
• (pt. NNT)
CI
semnificaţie statistică
semnificaţie clinică
• Efect important /efect surogat
• p publicate sunt mai optimiste