Sunteți pe pagina 1din 23

Cursul 7 Teste statistice

Intervale de ncredere
Testul Student
Testul ANOVA
Testul Fisher pentru dispersii
Teste neparametrice

Curba Gauss

Media=100, Deviaia standard=15

Eantion dintr-o populaie normal


In urmtoarele 9 imagini vei vedea:
n prima, distribuia unei populaii Gauss
n a doua, distribuia mediilor calculate
pe loturi de 2 indivizi
n
continuare,
distribuia
mediilor
calculate pe eantioane de 3, 4, 9, 16,
25, 36, 100 de indivizi

Concluzie:
Media de eantionare calculat pe un
eantion de volum n extras dintr-o
populaie distribuit Gauss are:
Distribuia Gauss
Media egal cu cea a populaiei de
provenien
Abaterea
standard
este
abaterea
populaiei de provenien mprit la
radicalul lui n = Eroarea standard!
Err = / n

Interval de ncredere - definiie


Numim interval de ncredere pentru
medie, un interval de numere reale n
care suntem aproape siguri c se afl
media real, pe care o aproximm.
Gradul de siguran poate fi ales; de
obicei este 95% sau 99%

Interval de ncredere
Dac avem o serie de valori i am obinut
media
de
eantionare X i
abaterea
standard , atunci avem urmtoarea
probabilitate furnizat de distribuia
mediei de eantionare:
s
s

P X t c
< m < X + tc
0,95
n
n

Exemplu de calcul: I95%

Serie: Latene pe nervul optic


Medie: 112,2
Abatere standard: 12,5
Volum eantion: 156
Eroarea standard:
n tabele:
Limitele sunt:

Ce este un test statistic?


Este o metod de decizie care ne
ajut la validarea sau invalidarea
cu un anumit grad de siguran a unei
ipoteze statistice

Teste statistice
Testele statistice verific veridicitatea
unor ipoteze - inferene statistice
ipoteza H0 (sau ipoteza de nul): datele nu
prezint legturi ntre ele, sunt independente/
valorile comparate nu difer ntre ele
ipoteza H1 (sau ipoteza alternativ): datele
prezint legturi ntre ele, sunt dependente/
valorile comparate difer ntre ele

Teste statistice
Rezultatul p al testului, furnizat ca un numr ntre 0 i 1,
reprezint probabilitate de a face o eroare dac respingem
ipoteza H0.
Dac p este mai mic dect pragul de semnificaie ales de
obicei =0,05 - respingem ipoteza H0 i admitem ca
adevrat ipoteza H1.
Interpretarea valorilor p se face la majoritatea testelor
statistice astfel:

p < 0.05, legtura statistic este semnificativ (S, ncredere 95%).


p < 0.01, legtura statistic este semnificativ (S, ncredere 99%).
p < 0.001, legtura statistic este nalt semnificativ (HS, ncredere
99.9%).
p > 0.05, legtura statistic este nesemnificativ (NS).

Testul t-Student clasic

Testul de comparare a dou medii cnd


abaterile
standard
sunt
egale
(cazul
eantioanelor mici)
1.
2.
3.

Se aplic dac msurtorile efectuate la cele dou


eantioane sunt independente
Se aplic dac eantioanele provin din populaii care
sunt normal distribuite (lucru care trebuie verificat
nainte de aplicarea testului)
Se aplic dac populatiile din care provin
eantioanele au dispersii egale (sau abateri
standard, ceea ce este acelasi lucru)

Convenie
Ipoteza c mediile populatiior din care provin
eantioanele sunt egale o vom numi ipoteza de
nul (notat totdeauna cu H0) ----------H0 : m1 = m2
Ipoteza, sau ipotezele, care epuizeaz restul
posibilitilor le vom numi ipoteze alternative
(notate totdeauna cu H1, H2 etc.) ------ H1 : m1 m2
Dac testul respinge H0, vom spune c datele
suport ipoteza c mediile populaiilor sunt diferite
Dac testul nu respinge H0, vom spune c datele
nu susin ipoteza c mediile populaiilor sunt diferite

Au fost analizai 25 de pacieni cu o infecie


localizat i 25 cu sepsis, printre alte msurtori
nregistrndu-se i valoarea VSH.
Nr.pacient
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Media
Deviaia standard
Dispersia
C.V. (%)

Infecie localizat
25
20
110
45
50
50
72
53
30
50
27
35
85
22
78
65
85
85
55
25
50
85
75
40
50
54.68
24.42
596.56
44.67%

Sepsis
55
88
53
30
72
52
91
70
110
123
56
31
100
70
44
70
90
123
85
72
75
50
85
107
110
76.48
26.55
704.84
34.81%

VSH
Medie deviia standard

Exemplu de calcul

120
100
74.48

80
54.68

60
40
20
0

Infecie localizat

Sepsis

p test Student = 0.011186 - S


t-Test: Two-Sample Assuming Equal Variances
Infecie localizat
Mean
54.68
Variance
596.56
Observations
25
Pooled Variance
650.70
Hypothesized Mean Diffe
0
df
48
t Stat
-3.02149
P(T<=t) one-tail
0.00201
t Critical one-tail
1.67722
P(T<=t) two-tail
0.00403
t Critical two-tail
2.01063

Sepsis
76.48
704.84
25

EXPLICATII
MEDIA ESANTIOANELOR
DISPERSIA ESANTIOANELOR
VOLUMUL ESANTIOANELOR
DISPERSIA COMUNA
DIFERENTA TESTATA
GRADE DE LIBERTATE: 25+25-2
VALOAREA t CALCULATA

p - REZULTATUL TESTULUI
PRAGUL CRITIC AL LUI t (tc)

p<0,05 - se respinge H0
cu pragul de semnificaie de 95%

Analiza intervalelor de ncredere


Infecie localizat

Sepsis

25

25

Media

54.68

76.48

Deviaia standard

24.42

26.55

Eroarea standard

4.88

5.31

Valoare t95% (df=24)

2.064

2.064

Nivel de eroare 95%

10.08

10.96

Limita inferioar

44.60

65.52

Limita superioar

64.76

87.44

Parametru
Nr.pacieni

Observm c limita superioar a intervalului de ncredere de 95%


pentru media mai mic este sub limita superioar a intervalului de
ncredere de 95% pentru media mai mare.
n concluzie, cele dou medii sunt diferite pentru nivelul de
semnificaie de 95% - ceea ce am demonstrat prin testul t Student.

Testul t-Student - variante


Testul t Student pentru eantioane
cu dispersii egale (exemplificat)
Testul t Student pentru eantioane
cu dispersii diferite
Testul t Student pentru eantioane
pereche
Difer prin modul n care se
calculeaz valoarea coeficientului t.

Testul ANOVA
Compar n acelai timp mediile mai multor
eantioane.
H0: m1 = m2 = m3 = m4 (pentru 4 eantioane)
H1: cel puin dou medii difer semnificativ
Rezultatul este un numr p care se interpreteaz la fel ca
la celelalte teste:

Dac p>0,05 nu se respinge H0, diferena este


nesemnificativ la pragul de semnificaie de 95%
Dac p<0,05 se respinge H0 cu pragul de semnificaie de
95%. Cel puin dou medii difer semnificativ
Dac p<0,01 se respinge H0 cu pragul de semnificaie de
99%. Cel puin dou medii difer semnificativ
Dac p<0,001 se respinge H0 cu pragul de semnificaie de
99,9%. Cel puin dou medii difer nalt semnificativ

Exemplu
n trei comune ale judeului Dolj au fost colectate date despre
obiceiurile alimentare i legtura lor cu obezitatea i diabetul.
Printre alte date s-au nregistrat greutatea indivizilor i date
despre fumat
Indivizii, indiferent de sex sau grup de vrst, au fost
mprii n patru categorii: nefumtori, foti fumtori, uor
fumtori (sub 10 igarete pe zi) i fumtori (peste 10 igarete
pe zi)
O ntrebare a fost aceea dac exist o legtur ntre obiceiul
fumatului i greutatea corporal la aceti indivizi.
H0: Indiferent dac fumeaz sau nu, greutatea corporal este
aceeai
H1: Cel puin dou categorii din cele 4 au greuti corporale
diferite

Rezultate test ANOVA

Teste de comparare a dispersiilor


Testul Fischer se utilizeaz pentru
verificarea egalitii dispersiilor a dou
variabile independente repartizate normal.
Ipoteza nul este H0: 12=22

Testul Bartlett este un test pentru


verificarea egalitii mai multor dispersii
pentru mai multe variabile independente
repartizate normal
Ipoteza nul este H0: 12=22=...=k2

SUNT TESTE PARAMETRICE

Teste neparametrice
Sunt teste care nu fac presupuneri legate de
distribuia datelor.
Se aplic n orice condiii, dac msurtorile sunt
independente
Se aplic atunci cnd nu putem aplica un test
parametric
Sunt teste care au o acuratee a rezultatului mai
slab dect a testelor parametrice i se aplic
numai atunci cnd nu este posibil aplicarea
unui test parametric

Teste neparametrice
Compararea
datelor

Date nepereche

Date pereche

2 eantioane

Mann-Whitney

Wilcoxon

mai multe
eantioane

Kruskal-Wallis

Friedman

Compararea
dispersiilor

Levene

Teste neparametrice

Compar mai degrab medianele dect


mediile eantioanelor
Datele din toate grupurile, separat sau puse impreuna,
sunt aranjate descrescator.
Cel mai mic numr are rangul 1; cel mai mare numr are
rangul N, unde N este numrul total de valori.
Dac dou sau mai multe valori sunt egale, atunci li se
atribuie ca rang valoarea medie a pozitiilor ocupate de
ele.
Se face suma rangurilor pentru fiecare grup comparat i
se calculeaz media rangurilor.
n cazul n care mediile rangurilor pentru grupurile
comparate si, implicit, valorile initiale, sunt foarte
diferite, valoarea p obtinuta in urma testului va fi mica.

S-ar putea să vă placă și