Sunteți pe pagina 1din 51

InfoMed

Alegerea metodei de
analiza a datelor

Alegerea metodei
Programe

Analiza
Biostatistica

Tipuri de
studii

Variabila
Variabila
cantitativa
cantitativa

Statistica
Statistica
descriptiva
descriptiva
-- centralitate
-- dispersie

Prezentarea
Prezentarea
esantionului
esantionului

Variabila
Variabila
calitativa
calitativa

Statistica
Statistica
descriptiva
descriptiva
-- Frecvente (FA,
FR,
FR, FACC,
FACC,
FRCC,
FRCC, FACD,
FACD,
FRCD)
FRCD)

Prezentarea
Prezentarea
esantionului
esantionului

Variabila
Variabila
cantitativa
cantitativa

Regresie

Coeficient
Coeficient de
corelatie
corelatie ++
Test
Test de
de semnificatie
semnificatie

Variabila
Variabila
cantitativa
cantitativa

Variabila
Variabila
calitativa
calitativa

Tabel
Tabel de
de
contingenta

Test
Test Chi
Chi22

Variabila
Variabila
calitativa
calitativa

Variabila
Variabila
calitativa
calitativa

Grupuri
Grupuri

Teste
Teste pentru
pentru
medii
medii (t),
(t),
mediana
mediana

Variabila
Variabila
cantitativa
cantitativa

Relatii de cauzalitate

Studii

xP, r

Factori de risc

Chi2

Semne diagnostice

Chi2

Trialuri clinice
Studii de supravietuire
Meta-analiza

Z, T, ANOVA
Logrank, Cox
Leaf Plot

InfoMed

Testarea ipotezelor
statistice

Testarea ipotezelor statistice


Formularea de noi ipoteze (sau model sau teorie)
este una dintre cele mai importante aspecte ale
cercetrii tiinifice.
Aceste ipoteze experimentale ncerc s descrie
sau s explice anumite fenomene reale.
In multe cazuri exist ipoteze anterioare
(descrieri sau explicaii) pe care oamenii de
tiin doresc s le nlocuiasc cu altele noi.
Este ns insuficient s se formuleze sau s fie
prezentat numai o nou ipotez.
O ipotez nou trebuie testat pentru a vedea c
are temei (n concordan cu observaiile) i
pentru a justifica c este mai bun dect alte
ipoteze anterioare.
10

Metode pentru testarea ipotezelor


Compararea a dou ipoteze sau teorii
concurente
Aceste dou teorii trebuie prima dat
formulate ca modele.
Aceste dou modele n continuare vor fi
denumite prin ipoteza nul i ipoteza
alternativ.
Ipoteza nul H0, reprezint modelul pe care
experimentatorul ar dori s-l nlocuiasc.
Ipoteza alternativ H1 este noul model care de
regul reprezint o negaie a ipotezei11 nule.

Metode pentru testarea ipotezelor


Inferen negativ
Scopul testului statistic este de a
dovedi c ipoteza nul H0 este fals
relativ la cea alternativ
nu putem niciodat afirma acceptm
ipoteza nul
O putem nega sau nu o putem nega

12

Metode pentru testarea ipotezelor


Prin respingerea ipotezei nule
cercettorul afirm c rezultatele
observate nu sunt datorate
ntmplrii
= efect semnificativ
Cnd ipoteza nul nu este rejectat
cercettorul afirm c diferenele
observate sunt datorate ntmplrii i
rezultatele nu sunt semnificative

13

Decizia
Stabilirea semnificaiei testului pe baza valorii
lui p se face frecvent cu urmtoarea regul
empiric:
1. Dac 0,01 <= p<0,05 , rezultatele sunt considerate semnificative.
2. Dac 0,001 <= p<0,01, rezultatele sunt considerate nalt
semnificative.
3. Dac p<0,001, rezultatele sunt considerate foarte nalt
semnificative.
4. Dac p>=0,05, rezultatele sunt considerate nesemnificative
statistic.
5. Dac 0,05 <= p<0,1, se noteaz o oarecare tendin spre
considerarea unei semnificaii statistice.

Valoare lui p nu este un indicator al validitii


ipotezei statistice. P se utilizeaz doar pentru a
face decizia semnificativ sau nu.
14

Erori n testarea ipotezelor statistice


Adevr

H0
adevrat

Fals

respinge

Eroare
tip I ()

Corect

H0 nu se

Corect

Eroare
tip II ()

H0 se
Rezultat

H0

respinge

15

Eroarea de tip I
= H0 este respins dei este adevrat
Am concluzionat c exist reale diferene dei
acestea sunt datorate ansei
Concluzionm c un tratament este eficient pe
baza unei interpretri greite
Adevr

H0

H0 adevrat

Rezultat

Fals

H0 se respinge

Eroare tip I ()

Corect

H0 nu se

Corect

Eroare tip II ()

respinge

16

Eroarea de tip II
= H0 este nu este respins dei este fals
Am concluzionat c exist diferenele observate
sunt datorate ansei atunci cnd acestea apar
datorit diferenelor dintre eantioane
Am putea abandona un tratament pe care tocmai
l testm sau o direcie de cercetare
Adevr

H0

H0 adevrat

Rezultat

Fals

H0 se respinge

Eroare tip I ()

Corect

H0 nu se

Corect

Eroare tip II ()

respinge

17

InfoMed

Relaii de
cauzalitate

Legtura dintre evenimente probabiliti


Legtura dintre variabile cantitative - regresii

Relatia de cauzalitate
Orict de exacte ar fi determinrile din cadrul unui
studiu analitic observaional, ele nu pot dect s
alimenteze un fascicol de argumente de prezumii
pentru relaia cauz efect ntre factorul
prognostic i mbolnvire.
Numai studiile experimentele corect conduse pot
confirma i argumenta o relaie cauzal.
Argumentele care permit s se presupun c ar
exista o relaie de la cauz la efect n studiile
analitice de punere n eviden a factorilor
prognostici poart denumirea de argumente de
prezumie.
www.info.umfcluj.ro

Independena a dou evenimente

Dou evenimente A i B se numesc


independente dac i numai dac
Pr(AB) Pr(A) x Pr(B).
Aceast proprietate se mai numete
i legea de nmulire a
probabilitilor.
Dou evenimente A i B sunt
dependente dac
Pr(AB) Pr(A) x Pr(B).

Statistici descriptive n dou dimensiuni


Varsta X: X1, X2,..., Xn
TAS
Y: Y1, Y2,..., Yn.
S se stabileasc dac exist o legtur
ntre variabilele X i Y i s se determine o
modalitate de a msura intensitatea
acestei legturi.

Coeficientul de corelatie Pearson

21

Diagrama de dispersie
Diagrama de
dispersie asociat
unei tabel de date
bidimensional:
X: X1, X2,..., Xn
Y: Y1, Y2,..., Yn

se obine
reprezentnd grafic
punctele de
coordonate (Xi,Yi)
i=1,2,...,n.

II

I
*
*

*
*

*
Y

*
*

*
*

*
*

*
*

*
*

* *

*
IV

II
I
X

22

*
*

Diagrama de dispersie

II

I
*
*

*
*

*
Y

*
*

*
*

*
*

*
*

*
*

*
*

* *

*
IV

II
I
X

23

Diagrama de dispersie

II
*

*
* *

*
*

*
*
*

*
* *
*

*
*

III
X

* *
IV

24

Diagrama de dispersie

II

*
*

*
*
*

*
*

* *

*
*

III

Y
*

*
*

*
IV

25

Atenie!

Coeficientul de corelaie Pearson


Pentru a obine un indicator independent i de unitile
de msur ale celor dou variabile se utilizeaz
coeficientul de corelaie sau coeficientul BravaisPearson:
COV ( X , Y )
r

Sx Sy

n XY X Y

n X 2 X 2

n Y 2 Y 2

unde SX i SY reprezint abaterile standard pentru


seriile X i respectiv Y:
n

S s2

s2

2
(
X

X
)
i
i 1

unde s este variatia.


27

Coeficientul de corelaie Pearson


Coeficientul de corelaie msoar intensitatea
relaiei dintre variabilele X i Y i valoarea sa r este
totodat cuprins ntre -1 i 1.
Dac r=1 punctele sunt situate pe o dreapt de
pant pozitiv (cresctoare).
Dac 0 < r < 1, norul de puncte poate fi nlocuit
(ajustat) printr-o dreapt de pant pozitiv .
Dispersia punctelor n jurul dreptei de regresie va fi
cu att mai mare cu ct r se apropie de 0 i cu att
mai mic cu ct r se apropie de 1.
Dac -1 < r < 0 atunci norul de puncte poate fi
aproximat cu o dreapt de pant negativ.
Dispersia punctelor fa de dreapt va fi cu att mai
mic cu ct r este mai apropiat de -1.
Dac r=-1 atunci toate punctele sunt situate pe o
dreapt de pant negativ.
28

Regulile empirice Colton (1974)

un coeficient de corelaie de la -0.25 la


0,25 nseamn o corelaie slab sau nul,
un coeficient de corelaie de la 0.25 la 0.50
(sau de la -0.25 la -0.50) nseamn un
grad de asociere acceptabil
un coeficient de corelaie de la 0.5 la 0.75
(sau de la -0.5 la -0.75) nseamn o
corelaie moderat spre bun
un coeficient de corelaie mai mare dect
0.75 (sau mai mic dect -0.75) nseamn o
foarte bun asociere sau corelaie

29

Testul de semnificaie
Semnificaia coeficientului de corelaie Pearson
poate fi evaluat dac valoarea observat a
aprut datorit ntmplrii (dac este semnificativ
diferit de zero).
Interpretarea este c datele experimentale permit
sau nu ne permit enunarea existenei unei relaii
ntre variabilele luate n calcul

30

Interpretarea r,p
Valoarea r

p > 0,05

p < 0,05

-0.25 la 0,25

corelaie slab corelaie slab


sau nul
sau nul

0.25 la 0.50
(-0.25 la
-0.50)

Nu are
semnificatie
statistica

un grad de
asociere
acceptabil

0.5 la 0.75
Nu are
(-0.5 la -0.75) semnificatie
statistica

o corelaie
moderat spre
bun

0.75 (sau mai


mic dect
-0.75)

Nu are
semnificatie
statistica

o foarte bun
asociere sau
corelaie

r < -1; r > 1

Eroare

Eroare
31

Interpretarea r,p

Atenie:
Variabilele corelate trebuie sa fie cantitative
Intre variabilele pentru care se calculeaza
corelaie trebuie sa existe o relaie logic

32

Coeficientul de corelaie Spearman


Coeficientul de corelaie Spearman, notat
rs, este analogul nonparametric al
coeficientul de corelaie Pearson, calculat
pentru a fi utilizat cu date ordinale.

rs

6 X Y

n(n 2 1)

Unde n este numrul de perechi de


variabile
33

Testul de semnificaie
Semnificaia coeficientului de corelaie
Spearman poate fi evaluat dac valoarea
observat a aprut datorit ntmplrii
(dac este semnificativ diferit de zero).
Valorile obinute pentru rs trebuie s fie
mai mari sau egale dect valorile critice
din tabel pentru ca s fie semnificative

34

InfoMed

Legatura intre variabile


calitative si cantitative

Variabila
Variabila
calitativa
calitativa

Grupuri
Grupuri

Teste
Teste pentru
pentru
medii
medii (t,
(t, Z),
Teste
Teste ANOVA
ANOVA

Variabila
Variabila
cantitativa
cantitativa

36

Compararea a dou medii


Compararea mediilor eantioanelor pentru
determinarea statistic a diferenelor se face
prin dou caracteristici:
Media diferena mediilor ntre grupuri
caracterizeaz nivelul de separare ntre
grupuri
Variana caracterizeaz variabilitatea n
interiorul grupurilor
Ambele caracteristici sunt o surs de
variabilitate utilizabil pentru a descrie
efectele tratamentului

Compararea a dou medii - situatia ideal


Se consider dou eantioane aleator extrase
din aceiasi populatie, unul experimental i unul
de control
Dac tratamentul a fost eficient tot grupul supus
experimentului va atinge acelai nivel al
parametrului studiat
Exist diferene ntre grupuri
Nu exist diferene n interiorul grupurilor

Compararea a dou medii - situatia real


Situaia real
Exist diferene ntre grupuri
Exist diferene n interiorul grupurilor
Trebuie demonstrat dac diferenele observate
ntre mediile parametrului studiat sunt datorate
experimentului i nu ntmplrii

Testul t Student
Subtipuri:
Testul t pentru eantioane independente:
Variane egale
O coad
Dou cozi

Variane inegale

Testul t pentru eantioane perechi

Testul t pentru eantioane


independente
Utilizat pentru compararea a dou eantioane
independente
Eantioanele sunt considerate independente
deoarece sunt compuse din seturi
independente de subieci ntre care nu exist
nici o relaie derivat din studiu

Prezumia de egalitate a varianelor


Testul t pentru eantioane independente se
bazeaz pe aceast prezumie
Se mai numete i omogenitatea varianelor
n mod normal omogenitatea varianelor se
testeaz statistic
Testul F
Testul Levene sau testul Barlett
Bazate pe statistica F

Dac varianele nu sunt semnificativ statistic


diferite (p>0,05) atunci pot fi considerate
egale
Dac sunt diferite se aplic alt formul de
calcul a lui t

Testul t pentru variane inegale

Literatura de specialitate arat c atunci cnd eantioanele


comparate au un numr egal de cazuri violarea regulii egalitii
varianelor nu duce la compromiterea testului Student
Dac numrul de cazuri difer ntre eantioane atunci statistica
t trebuie calculat conform formulei, iar gradele de libertate se
ajusteaz n funcie de varian:

Testul t pentru eantioane pereche


Se folosete n protocoale de cercetare
care implic msurtori repetate asupra
acelorai indivizi sau asupra unor indivizi
cu caracteristici asemntoare (chiar
gemeni)
Datele sunt considerate mperecheate
deoarece pentru fiecare valoare exist o
valoare pereche
Testul evalueaz scorul de diferen din
cadrul fiecrei perechi astfel nct
subiecii sunt comparai numai cu ei nii
sau cu perechea lor

Analiza de varian ANOVA


Este un test destinat analizei
cercetrilor multinivel i/sau
multifactoriale
Este utilizat atunci cnd trebuiesc
cercetate 3 sau mai multe condiii sau
eantioane
Bazat pe statistica F i pe prezumia
c eantioanele sunt extrase aleator
dintr-o populaie normal distribuit
(n practic se verific ntotdeauna)

Teste parametrice i neparametrice


Distributie normala
teste parametrice
Distributie care nu respecta legea normal
teste neparametrice

46

Sunt datele normal distribuite?


Parametrii de statistic descriptiv
care indic distribuia normal:
Media, modulul i mediana au valori identice
sau apropiate
Modulul este apropiat de centrul distribu iei
Asimetria aproape de 0
Boltirea aproape de 0

47

Sunt datele normal distribuite?


Teste de verificare a normalitii datelor:
Testul Kolmogorov-Smirnov
Dac n < 50 se folosete testul Shapiro-Wilk
H0 = nu exist diferene statistice
semnificative ntre distribuia observat
i cea normal
H1 = exist diferene statistice
semnificative ntre distribuia observat
i cea normal
p < 0,05 se respinge ipoteza nul, datele
nu sunt normal distribuite
48

Teste parametrice i neparametrice


Teste
parametrice

Teste neparametrice
echivalente

ANOVA

Kruskal-Wallis

Student
(eantioane
independente)

MannWhitney U
MannWhitneyWilcoxon
WilcoxonMannWhitney
Wilcoxon rank-sum

Student
(eantioane
pereche)

Wilcoxon signed-rank

49

Teste parametrice i neparametrice


Z (n>30)
2 eantioane
independente

KS p > 0,05
Normal
distribuite

Date de
analizat

KS p < 0,05
Date
neomogene

Student
(n<30)

2 eantioane
perechi

Student
pereche

>2
eantioane

ANOVA

2 eantioane
independente

Mann
Whitney
Wilcoxon

Eantioane
perechi

Wilcoxon
signed-rank

>2
eantioane

Kruskal-Wallis
50

Kruskal-Wallis

V mulumesc pentru atenie!

S-ar putea să vă placă și