Documente Academic
Documente Profesional
Documente Cultură
TU DO R DR U GAN
STATISTICA
Testarea ipotezelor
statistice
Testarea ipotezelor statistice
• Formularea de noi ipoteze (sau model sau teorie) este una dintre
cele mai importante aspecte ale cercetării ştiinţifice.
• Aceste ipoteze experimentale încercă să descrie sau să explice
anumite fenomene reale.
• In multe cazuri există ipoteze anterioare (descrieri sau explicaţii)
pe care oamenii de ştiinţă doresc să le înlocuiască cu altele noi.
• Este însă insuficient să se formuleze sau să fie prezentată numai o
nouă ipoteză.
• O ipoteză nouă trebuie testată pentru a vedea că are temei (în
concordanţă cu observaţiile) şi pentru a justifica că este “mai
bună” decât alte ipoteze preexistente.
• Aceasta conduce la scheme de experimente, eşantioane şi de
observaţii în scopul obţinerii dovezii pentru susţinerea (sau
respingerea) unei noi ipoteze.
2
Metode pentru testarea ipotezelor
3
ATENȚIE!
• Orice studiu are două nivele de analiză:
• Unul conceptual (medical, farmaceutic) la nivelul căruia
este formulată ipoteza de ceretare
• De exemplu tratamentul antiinflamator A este mai eficient
decât tratamentul antiinflamator B
• Altul este cel statistic atașat celui conceptual și
reprezintă doar validarea matematică a celor observate
• Utilizând tratamentul antiinflamator A am putut demonstra că
PCR este mai redusă la acești pacienţi în mod semnificativ
statistic decât la cei care utilizează tratamentul B
• Eq. Efectele inflamatorii vor fi diminuate la majoritatea
pacienţilor care folosesc A (fenomen repetitiv)
ATENȚIE!
6
Ipoteza
Eu știu că media de vârstă
Eu cred că media de a celor de aici este de 30
vârstă a celor de aici de ani sau mai mult!
este sub 30 de ani!
Demostrează-mi că
Am dreptate? Verificați! greșesc!
7
• H1: µ<30
• H0: µ>=30
• Inferenţă negativă
• Similar cu justiţia inculpatul este nevinovat până
la pronunţarea sentinţei
• Scopul testului: infirmarea ipotezei nule
8
Testarea ipotezei
Media de vârstă
în populație
este peste 30.
(Ipoteza nulă) Populație
În eșantion
X = 20 =30 media este 20
Nu prea!
Resping
Eșantion
Ipoteza nulă
9
Cum și de ce se poate respinge ipoteza nulă
Distribuția de eșantionare
Media
noastră Putem rejecta
cade pe una ipoteza că µ = 30.
din cozi... H0
Media conform
ipotezei nule
20 µ = 30 Media eșantionului
0 11
Metode pentru testarea ipotezelor
12
Decizia
• Stabilirea semnificaţiei testului pe baza valorii lui p
se face frecvent cu următoarea regulă empirică:
• 1. Dacă 0,01 <= p<0,05 , rezultatele sunt considerate
semnificative.
• 2. Dacă 0,001 <= p<0,01, rezultatele sunt considerate înalt
semnificative.
• 3. Dacă p<0,001, rezultatele sunt considerate foarte înalt
semnificative.
• 4. Dacă p>=0,05, rezultatele sunt considerate
nesemnificative statistic.
• 5. Dacă 0,05 <= p<0,1, se notează o oarecare tendinţă spre
considerarea unei semnificaţii statistice.
13
Decizia
• Valoarea p nu este probabilitatea ca ipoteza nulă să
fie falsă. O valoare mică a lui p nu înseamnă că există
o probabilitate mai mică ca ipoteza nulă să fie falsă.
• Ipoteza de lucru nu poate fi inversată şi de exemplu
pentru un p=0,02 nu se poate spune că avem o
probabilitate de 98% ca diferenţa să existe.
• Valoarea lui p nu este un indicator al validităţii
ipotezei statistice.
• p se utilizează doar pentru a evalua dacă decizia este
semnificativă sau nu.
14
Erori în testarea ipotezelor statistice
Adevăr
H0 H0
adevărată Falsă
H0 se Eroare tip
Corect
respinge I (α)
Rezultat
H0 nu se Corect
Eroare tip
respinge II (β)
• alfa (α) = probabilitatea ca testul să respingă ipoteza nulă
deși ipoteza alternativă nu se diferenţiază statistic de
aceasta
• beta (β) = probabilitatea ca testul să nu poată respinge
ipoteza nulă deși ipoteza alternativă se diferenţiază statistic
de aceasta 15
Eroarea de tip I
• = H0 este respinsă deși ipoteza alternativă nu se diferenţiază statistic de
aceasta
• Am concluzionat că există reale diferenţe deși acestea sunt datorate
șansei
• Concluzionăm că un tratament este eficient pe baza unei interpretări
greșite
• Alfa (α) = nivelul de semnificaţie ales = mărimea riscului asumat
Adevăr
H0 adevărată H0
Falsă
Eroare tip I
H0 se respinge (α)
Corect
Rezultat
H0 nu se Corect
Eroare tip II
respinge (β)
16
Eroarea de tip II
• = H0 este nu este respinsă deşi ipoteza alternativă se diferenţiază
statistic de aceasta
• Am concluzionat că există diferenţele observate sunt datorate şansei
atunci când acestea apar datorită diferenţelor dintre eşantioane
• Am putea abandona un tratament pe care tocmai îl testăm sau o direcţie
de cercetare
• Puterea unui test (1-β) = capacitatea testului statistic de a evidenţia
diferenţa
Adevăr
H0 adevărată H0
Falsă
Ipoteza alternativă β
Orice aș face una din
două posibilități crește.
eșantionului!!!!
20
Obiective
• Compararea mediilor
• Distribuţia normală și distribuţii care
nu respectă legea normală
• Teste de comparare a mediilor:
• Teste Student
• Teste de comparare multiplă
• Teste neparametrice
Compararea mediilor
• Situaţia reală
• Există diferenţe între grupuri
• Există diferenţe în interiorul grupurilor
• Trebuie demonstrat dacă diferenţele observate între
mediile parametrului studiat sunt datorate
experimentului şi nu întâmplării
Compararea a două medii 26
Teste parametrice și neparametrice
• Distributie normală
• → teste parametrice
• Distributie care nu respecta legea normală
• → teste neparametrice
Sunt datele normal distribuite? 28
Test of Normality
Disease Kolmogorov-Smirnova
Statistic df Sig.
IL-1ra No 0,183 17 0,135
Yes 0,189 13 0,200*
IL-2 No 0,255 17 0,004
Yes 0,303 13 0,002
IL-4 No 0,333 17 0,000
Yes 0,232 13 0,054
IL-10 No 0,167 17 0,200*
Yes 0,151 13 0,200*
IL-13 No 0,175 17 0,176
Yes 0,255 13 0,021
IL-15 No 0,129 17 0,200*
Yes 0,261 13 0,016
*. This is a lower bound of the true significance.
a. Lilliefors Significance Correction
Verificarea normalității
Test Student
pentru varianțe
egale
Varianțe egale
Testare (p>=0,05)
egalitate
varianțe Varianțe
inegale
(p<0,05)
Test Student
pentru varianțe
inegale
X1 − X 2
t=
S X1−X 2
s 2
( n − 1) + s2 (n2 − 1)
2
sp =
2 1 1
n1 + n2 − 2
39
Testul t: egalitatea varianţelor
• Eroarea standard a diferenţei mediilor
eşantioanelor este:
s 2p s 2p1 1
SX1−X 2 = + = s +
2
p
n1 n2 n1 n2
⚫ Grade de libertate:
⚫ df =(n1-1)+(n2-1)=(n1+n2-2)
⚫ df =N-2 unde N este dimensiunea combinată a
eşantioanelor
40
Testul t pentru varianţe inegale
• Literatura de specialitate X1 − X 2
arată că atunci cînd t=
2 2
eşantioanele comparate au s s
un număr egal de cazuri +
1 2
+
diferă între eşantioane atunci n1 n2
df =
statistica t trebuie calculată 2
s12 1 s22 1
2
+
conform formulei, iar gradele n1 n1 − 1 n2 n2 − 1
de libertate se ajustează în
funcţie de varianţă:
Aplicarea testului student in SPSS
Disease
No Yes
Mean Standard Standard Mean Standard Standard
Deviation Error of Deviation Error of
Mean Mean
IL-1ra 14.109 7.044 1.265 30.155 2.600 0.460
IL-2 103.735 9.087 1.494 108.780 41.531 7.020
IL-4 84.710 2.070 0.332 138.459 79.838 13.125
IL-10 0.688 0.760 0.128 1.489 1.149 0.203
IL-13 2.371 2.077 0.393 2.419 1.774 0.348
IL-15 9.835 4.544 0.803 9.345 5.052 0.799
180 40
160
30
140
120 20
100
10
80
60 0
IL-10 IL-13 IL-15
40
-10
20
0 -20
IL-1ra IL-2 IL-4
Controls Cases
Controls Cases
Levene's Test for t-test for Equality of Means
Equality of Variances
F p t df p (2-tailed)
• Ce se investighează?
• Efectul variabilei A
independent de B
• Efectul variabilei B
independent de A
• Efectul cumulat al celor
două variabile
Efectele principale
• Efectele datorate
aplicării uneia din
cele 2 variabile se
măsoară prin media
pentru nivelurile
rezultate din efectele
principale şi se
numeşte medie
marginală
Efectele simple
Testarea ipotezei statistice
ANOVA Kruskal-Wallis
Student Mann–Whitney U
(eșantioane independente) Mann–Whitney–Wilcoxon
Wilcoxon–Mann–Whitney
Wilcoxon rank-sum
Student Wilcoxon signed-rank
(eșantioane pereche)
Testul de comparare a
medianelor
Teste neparametrice SPSS