Sunteți pe pagina 1din 34

12/11/2020

TESTE PARAMETRICE

SORANA D. BOLBOACĂ
1
Parametric Neparametric
Distribuţia Normală oricare Testele parametrice
TESTE
Varianţa PARAMETRICE
Omogene VS, NON-PARAMETRICE
oricare
o Se aplică în cazul variabilelor cantitative
sau calitative ordinale cu clase multiple
Scala de măsură Raţie / Interval oricare o Datele urmează distribuția normală
Valoarea centrală Media mediana o Se pot aplica pentru a compara două sau
Dispersia Deviaţia standard (Q1 to Q3) mai multe grupuri, dependente sau
independente

Parametric Neparametric
2 grupuri Testul Z Mann-Whitney
independente Independent t-test
2 grupuri dependente Paired t-test Wilcoxon test
> 2 grupuri ANOVA Kruskal-Wallis test
Corelaţia Pearson Spearman, Kendall, etc,
… … …
TESTE PARAMETRICE - MEDII

Teste Z pentru medii

2 populații: test student pentru eșantioane


independente sau dependente

Mai mult de 2 populații: testul ANOVA


12/11/2020 3
12/11/2020 4
MEDIA: 2 GRUPURI
Testul Z Testul Student (t)
Grupuri independente Grupuri independente
Talia fiecărui grup în parte ≥ 30 Talia fiecărui grup în parte < 30
Deviațiile standard cunoscute Varianţe egale

(𝑋ത1 −𝑋ത2 ) − (𝜇1 − 𝜇2 )


𝑍=
𝜎12 𝜎22
+
𝑛1 𝑛2 Varianţe inegale

12/11/2020 5
TESTUL Z
MEDIA: 2 GRUPURI
Testul Z Testul Student (t)
Grupuri independente Grupuri independente
Talia fiecărui grup în parte ≥ 30 Talia fiecărui grup în parte < 30
Deviațiile standard cunoscute Varianţe egale

(𝑋ത1 −𝑋ത2 ) − (𝜇1 − 𝜇2 )


𝑍=
𝜎12 𝜎22
+
𝑛1 𝑛2 Varianţe inegale

12/11/2020 5
Abb Ex: Efectul Nebivolului și a Atenololului asupra ritmului cardiac
2 populații, unul tratat cu Nebivolol (n=39) și cel de-al doilea cu Atenolol (n=38)
N Test pentru grupuri independente:
• Varianțe egale? Student t-test for equal variances
• Varianțe inegale? Student t-test for unequal variances
T Nebivolol (n=39): 14,51±4,69
Atenolol (n=38): 17,55±5,06
Z = (14,51-17,55)/sqrt(4,69^2/39+5,06^2/38)) = -2,73
O Valoarea P = 0,0032 (=NORSDIST(Z))
M (-∞;-Zα)⋃(Zα;+∞) unde Zα=0.05 = 1,96 - 𝑍 ∈ −∞; −1,96 ⋃ 1,96; +∞ - avem suficiente dovezi să
respingem H0
Deoarece valorea p < 0,05 → avem suficiente dovezi să respingem H0
Există diferențe semnificative statistic în reducerea ritmului cardiac la pacienții tratați cu
Nebivolol comparativ cu cei tratați cu Atenolol
S Reducerea medie a ritmului cardiac este mai mare la pacienții tratați cu Atenolol comparativ cu
cei tratați cu Nebivolol → vom opta pentru administrarea Atenololului dacă dorim o reducere
mai mare a ritmului cardiac
Abb Ex: Efectul Nebivolului și a Atenololului asupra ritmului cardiac
2 populații, unul tratat cu Nebivolol (n=39) și cel de-al doilea cu Atenolol (n=38)
N Test pentru grupuri independente:
• Varianțe egale? Student t-test for equal variances
• Varianțe inegale? Student t-test for unequal variances
T Nebivolol (n=39): 14,51±4,69
Atenolol (n=38): 17,55±5,06
Z = (14,51-17,55)/sqrt(4,69^2/39+5,06^2/38)) = -2,73
O Valoarea P = 0,0032 (=NORSDIST(Z))
M (-∞;-Zα)⋃(Zα;+∞) unde Zα=0.05 = 1,96 - 𝑍 ∈ −∞; −1,96 ⋃ 1,96; +∞ - avem suficiente dovezi să
respingem H0
Deoarece valorea p < 0,05 → avem suficiente dovezi să respingem H0
Există diferențe semnificative statistic în reducerea ritmului cardiac la pacienții tratați cu
Nebivolol comparativ cu cei tratați cu Atenolol
S Reducerea medie a ritmului cardiac este mai mare la pacienții tratați cu Atenolol comparativ cu
cei tratați cu Nebivolol → vom opta pentru administrarea Atenololului dacă dorim o reducere
mai mare a ritmului cardiac
TESTUL STUDENT
PENTRU EȘANTIOANE
INDEPENDENTE
TESTUL STUDENT PENTRU EȘANTIOANE
INDEPENDENTE
o Scop: să determinăm dacă diferenţa dintre mediile eşantioanelor studiate indică
o diferenţă reală între cele două populaţii sau dacă diferenţa obţinută este
datorată erorii de eşantionare,
o De reţinut! Dacă două eşantioane se extrag din aceeaşi populaţie şi la fiecare
eşantion se administrează acelaşi tratament, pot exista diferenţe între mediile
celor două eşantioane

Formularea generică a ipotezelor statistice:


o H0: Nu există diferenţe semnificative statistic între mediile celor două populaţii
o H1 (test bilateral): Există diferenţe semnificative statistic între mediile celor
două populaţii
6-Dec-167 12
Testarea egalităţii varianţelor se face cu testul LEVENE sau BARTLETT (teste bazate
pe statistica F)

Dacă varianţele nu sunt semnificativ statistic diferite (p>0,05) atunci pot fi considerate
egale ➔ test student pentru eşantioane independente varianţe egale

Sunt
varianțele
egale?

t-test t-test
assuming assuming
unequal equal
variances variances
6-Dec-167 13
M F
Media 5 4
HYPOTHESIS TESTING: PHANTOMS Variaţia 2 2

Abb Ex: Acidul uric la femei şi bărbaţi cu diabet zaharat n 16 16

P Media acidului uric


H H0: media acidului uric a subiecţilor de gen feminin nu diferă semnificativ de medie acidului
uric a subiecţilor de gen masculin (μM= μF)
H1 (test bilateral): media acidului uric a subiecţilor de gen feminin diferă semnificativ de medie
acidului uric a subiecţilor de gen masculin (μM≠ μF)
A • Femeile și bărbații nu provin din aceleași familii
• Randomizare: subiecții sunt incluși aleatoriu
• Acidul uric la subiecții de gen feminin și cei masculini cu diabet urmează distribuția
normală
N Testul student pentru varianțe egale - Student t-test for equal variances
M F
Media 5 4
Abb Ex: Acidul uric la femei şi bărbaţi cu diabet zaharat
Variaţia 2 2
T M (n=16): 5±4
F (n=16): 4±4 n 16 16
sqrt(15*4+15*4)/(16+16-2) = 2
t = (5-4)/(2*sqrt(1/16+1/16)) = 1,41
O Valoarea P = 0,1676 (=TDIST(t, df, 2))
M (-∞;-tdf,α)⋃(tdf,α;+∞) unde tdf,α = 2,04 - 𝑡 ∈ −∞; −2,04 ⋃ 2,04; +∞ - nu avem suficiente
dovezi să respingem H0
Deoarece valorea p > 0,05 → nu avem suficiente dovezi să respingem H0
S Media acidului uric nu diferă semnificativ statistic la pacienţii diabetici de gen feminin
comparativ cu cei de gen masculin
TESTUL STUDENT
PENTRU EȘANTIOANE
DEPENDENTE
PHANTOMS:
EȘANTIOANE PERECHI/DEPENDENTE
Abb Ex: Efectul Nebivolului asupra ritmului cardiac (n=39)
P μdif
Media reducerii ritmului cardiac (2 evaluări perechi, înainte și după tratamentul cu
Nebivolol)
H H0: Nu există o scădere semnificativă statistic a ritmului cardiac după administrarea
Nebiololului (μdif = 0)
H1 (test unilateral): Ritmul cardiac se reduce semnificativ după tratamentul cu Nebivolol
(μdif < 0)
A • Independența: observațiile sunt dependente
• Randomizare: includerea subiecților în eșantion este prin randomizare
• Ritmul cardiac înainte și după tratamentul cu Nebivolol urmează distribuția normală
N Testul student pentru eșantioane perechi
PHANTOMS:
EȘANTIOANE PERECHI/DEPENDENTE
Abb Ex: Efectul Nebivolului asupra ritmului cardiac (n=39)
T Înainte de tratament: 78,05±5,84
După tratament: 63,53±3,86
Diferența: 14,51±4,69
t = avem nevoie de datele brute pentru a obține acest parametru
(estimat: 14,51/(4,69/sqrt(38)) = 19,07
O P-value = 9,86E-21 (0,000000000000000000009860)
M o tcritic (df, α) = 2,03 → t (19,07) > tcritic (2,03) → avem suficiente
dovezi să respingem ipoteza nulă
o p < 0,05 → avem suficiente dovezi să respingem H0
o → diferența între frecvența cardiacă înainte și după tratament
cu Nebivolol este semnificativ diferită de zero
S Tratamentul cu Nebivolol este eficient în reducerea frecvenței
cardiace
TESTUL ANOVA
Abb Ex:
P Diferențe între mediile variabilei de tip răspuns
ANOVA
H H0: μA = μB = ...= μx
H1: μA ≠ μB ≠ ... ≠ μx
A • Factorul (variabila independentă) este o variabilă calitativă cu cel puțin 3 valori distincte
• Variabila de tip răspuns este cantitativă (scala interval sau rație/raport) iar datele în
populațiile de unde s-au extras eșantioanele fiecărui grup urmează o distribuție aproximativ
normală
• Independența observațiilor: nu există nici o relație între observațiile unui grup sau între
observațiile grupurilor diferite (același subiect într-un singur grup)
• În fiecare subgrup nu există valori extreme (date individuale care nu urmează pattern-ul
celorlalte date)
• Varianțele sunt omogene: Test Levene
N One way ANOVA test
T Testul ANOVA utilizează testul F de semnificație statistică
O Valoarea p este calculată de programul statistic utilizat
M o Nivelul de semnificație trebuie ajustat. Ajustarea Bonfferoni se face în conformitate cu
numărul de grupuri evaluate: dacă variabile independentă are 3 grupuri α* = α/3 (0,05/3 =
0,017) 12/11/2020 20
ANOVA: EXEMPLU

o Este masa grasă asociată cu deficitul de


vitamină D la copii care practică atletism?
o Masa grasă (kg, variabila dependentă sau de
tip răspuns) și nivelul seric de vitamină D
(variabila independentă) la copii care
practică atletism
o Variabila de grupare (factorul) = clasa în
conformitate cu nivelul seric al vit D: deficit
(<30 nmol/L, 5 copii), insuficient (30–50
nmol/L, 30 copii), adecvat (50 nmol/L, 12
copii)
12/11/2020 21
Abb Ex: Masa grasă (kg) și nivelul seric de vitamină D (variabila independentă)
la copii care practică atletism ANOVA
P Diferențe între mediile masei grase (kg)
H PHANTOMS:
H :μ
0 =μ ANOVA

deficit inadecvat adecvat
H1: μdeficit ≠ μinadecvat≠ μadecvat
A • Clasa vit. D: deficit, inadecvat, adecvat
• Masa grasă (rație/raport)
• Masa grasă în populație urmează distribuția normală
• Independența observațiilor: un copil este într-o singură clasă
• Varianțele sunt omogene (test Levene p > 0,05)
N One way ANOVA test
T F = 4,62
O P=0,0151
M o F (4,62) > Fcritic (3,20) → avem suficiente evidenție să respingem H0
o P < 0,017 → avem suficiente evidențe să respingem H0 - avem diferențe semnificative a masei
de grăsime între grupurile de copii realizate în conformitate cu valoarea serică a Vit. D
S o Există o asociere între masă grasă și nivelul seric al vitaminei D la copii care practică atletism

Putem spune între care perechi de grupuri avem diferențe semnificative? 12/11/2020 22
PHANTOMS: ANOVA PENTRU MĂSURĂTORI REPETATE
Abb Ex: Efectul Nebivololului asupra presiunii arteriale sistolice (cinci evaluări)
P Diferența mediilor în evaluări multiple (5 evaluări)
H H0: Mediile PAS nu sunt semnificativ diferite la evaluările repetate.
H0: μ0(baseline) = μ1(2 weeks) = μ2(4 weeks) = μ3(8 weeks) = μ4(12 weeks)
H1 (test bilateral): O diferență semnificativă există undeva printre evaluările PAS atunci
când pacienții sunt tratați cu Nebivolol
H1:μ0 ≠ μ1 ≠ μ2 ≠ μ3 ≠ μ4
A • Dependența: aceeași pacienți sunt evaluați în momente diferite de timp
• Randomizare: subiecții sunt incluși aleator în eșantion
• PAS la includerea în studiu, la 2, 4, 8 și 12 luni după inițierea tratamentului cu Nebivolol
urmează distribuția normală
• Varianțele sunt omogene
N Testul Anova pentru măsurători repetate
T Avem nevoie de datele brute pentru aceste calcule ...
O P < 0,0001
M P < 0,0001 (0,05/5 = 0,01) → avem suficiente evidențe să respingem H0
S Există diferențe semnificative în tensiunea arterială sistolică printre evaluări după
tratamentul cu Nebivolol (nu putem spune însă care perechi de evaluări au avut diferențe
semnificative – pentru aceasta trebuie să aplicăm analiza post-hoc)
TESTUL ANOVA
Abb Ex:
P Diferențe între mediile variabilei de tip răspuns
ANOVA
H H0: μA = μB = ...= μx
H1: μA ≠ μB ≠ ... ≠ μx
A • Factorul (variabila independentă) este o variabilă calitativă cu cel puțin 3 valori distincte
• Variabila de tip răspuns este cantitativă (scala interval sau rație/raport) iar datele în
populațiile de unde s-au extras eșantioanele fiecărui grup urmează o distribuție aproximativ
normală
• Independența observațiilor: nu există nici o relație între observațiile unui grup sau între
observațiile grupurilor diferite (același subiect într-un singur grup)
• În fiecare subgrup nu există valori extreme (date individuale care nu urmează pattern-ul
celorlalte date)
• Varianțele sunt omogene: Test Levene
N One way ANOVA test
T Testul ANOVA utilizează testul F de semnificație statistică
O Valoarea p este calculată de programul statistic utilizat
M o Nivelul de semnificație trebuie ajustat. Ajustarea Bonfferoni se face în conformitate cu
numărul de grupuri evaluate: dacă variabile independentă are 3 grupuri α* = α/3 (0,05/3 =
0,017) 12/11/2020 20
ANOVA: EXEMPLU

o Este masa grasă asociată cu deficitul de


vitamină D la copii care practică atletism?
o Masa grasă (kg, variabila dependentă sau de
tip răspuns) și nivelul seric de vitamină D
(variabila independentă) la copii care
practică atletism
o Variabila de grupare (factorul) = clasa în
conformitate cu nivelul seric al vit D: deficit
(<30 nmol/L, 5 copii), insuficient (30–50
nmol/L, 30 copii), adecvat (50 nmol/L, 12
copii)
12/11/2020 21
SEMNIFICAȚIA STATISTICĂ VS. RELEVANȚA
CLINICĂ

12/11/2020 29
SEMNIFICAȚIA STATISTICĂ VS. RELEVANȚA CLINICĂ
Studiu de cohortă n=34,079 femei → greutatea câștigată de grupul care a efectuat exercițiu
fizic >21 ore/săptămână față de grupul cu <7,5 ore de exercițiu fizic/săptămână (p<0,001)

• Mărimea efectului ? <7,5 ore/săpt → 0,15 kg în plus față de grupul cu ≥21


• Extrapolare: dacă studiul se continuă 13 ani grupul cu ≥21 va acumula în greutate cu
0,635 kg mai puțin comparativ cu grupul cu < 7,5! 12/11/2020 30
SEMNIFICAȚIA STATISTICĂ VS. RELEVANȚA CLINICĂ
Rezultatele unui studiu pot fi:
o Nesemnificative statistic și fără relevanță clinică
o Semnificative statistic dar fără relevanță – aceasta poate să apară când talia
eșantionului este mare și o diferență mică este semnificativă statistic. Un
tratament semnificativ statistic comparativ cu un tratament alternativ nu
înseamnă neapărat că diferențele observate sunt importante din punct de vedere
clinic sau că sunt relevante pentru pacient.
o Semnificative statistic și relevante clinic
o Nesemnificative statistic dar relevante clinic – apare atunci când puterea
studiului este mică și diferențe mici între grupuri nu sunt clasificate ca
semnificative statistic.
12/11/2020 31
Abb Ex: Efectul Nebivololului asupra presiunii arteriale sistolice (cinci evaluări)
P Diferența mediilor în evaluări multiple (5 evaluări)
H H0: Mediile PAS nu sunt semnificativ diferite la evaluările repetate.
H0: μ0(baseline) = μ1(2 weeks) = μ2(4 weeks) = μ3(8 weeks) = μ4(12 weeks)
H1 (test bilateral): O diferență semnificativă există undeva printre evaluările PAS atunci
când pacienții sunt tratați cu Nebivolol
H1:μ0 ≠ μ1 ≠ μ2 ≠ μ3 ≠ μ4
A • Dependența: aceeași pacienți sunt evaluați în momente diferite de timp
• Randomizare: subiecții sunt incluși aleator în eșantion
• PAS la includerea în studiu, la 2, 4, 8 și 12 luni după inițierea tratamentului cu Nebivolol
urmează distribuția normală
• Varianțele sunt omogene
N Testul Anova pentru măsurători repetate
T Avem nevoie de datele brute pentru aceste calcule ...
O P < 0,0001
M P < 0,0001 (0,05/5 = 0,01) → avem suficiente evidențe să respingem H0
S Există diferențe semnificative în tensiunea arterială sistolică printre evaluări după
tratamentul cu Nebivolol (nu putem spune însă care perechi de evaluări au avut diferențe
semnificative – pentru aceasta trebuie să aplicăm analiza post-hoc)
TESTAREA IPOTEZELOR
VS. INTERVALUL DE
ÎNCREDERE
PHANTOMS VS. PANIC
Ce? Valoarea P Intervalul de încredere
Semnificativ Valoarea P < nivelul de semnificație (α) Intervalul de încredere nu conține valoarea
statistic ipotezei nule
Utilizat atunci când este de interes o comparație pentru a descrie magnitudinea efectului
strictă a unei ipoteze la un nivel de sau
semnificație predefinit când dorim să descriem un singur grup

Semnificația statistică arată probabilitatea ca rezultatul unui studiu să fie datorat întâmplării →
diferența observată în eșantion există și în populație.
Relevanța clinică se referă la magnitudinea clinică a efectului și reflectarea acesteia în practica
medicală curentă.
12/11/2020 28
12/11/2020 35

S-ar putea să vă placă și