Sunteți pe pagina 1din 23

Cursul 7 Teste statistice

Intervale de ncredere
Testul Student
Testul ANOVA
Testul Fisher pentru dispersii
Teste neparametrice
Curba Gauss

Media=100, Deviaia standard=15


Eantion dintr-o populaie normal

In urmtoarele 9 imagini vei vedea:


n prima, distribuia unei populaii Gauss
n a doua, distribuia mediilor calculate
pe loturi de 2 indivizi
n continuare, distribuia mediilor
calculate pe eantioane de 3, 4, 9, 16,
25, 36, 100 de indivizi
Concluzie:
Media de eantionare calculat pe un
eantion de volum n extras dintr-o
populaie distribuit Gauss are:
Distribuia Gauss
Media egal cu cea a populaiei de
provenien
Abaterea standard este abaterea
populaiei de provenien mprit la
radicalul lui n = Eroarea standard!
Err = / n
Interval de ncredere - definiie

Numim interval de ncredere pentru


medie, un interval de numere reale n
care suntem aproape siguri c se afl
media real, pe care o aproximm.
Gradul de siguran poate fi ales; de
obicei este 95% sau 99%
Interval de ncredere

Dac avem o serie de valori i am obinut


media de eantionare X i abaterea
standard , atunci avem urmtoarea
probabilitate furnizat de distribuia
mediei de eantionare:

s s
P X t c < m < X + tc 0,95
n n
Exemplu de calcul: I95%
Serie: Latene pe nervul optic
Medie: 112,2
Abatere standard: 12,5
Volum eantion: 156
Eroarea standard:
n tabele:
Limitele sunt:
Ce este un test statistic?

Este o metod de decizie care ne


ajut la validarea sau invalidarea
cu un anumit grad de siguran a unei
ipoteze statistice
Teste statistice

Testele statistice verific veridicitatea


unor ipoteze - inferene statistice

ipoteza H0 (sau ipoteza de nul): datele nu


prezint legturi ntre ele, sunt independente/
valorile comparate nu difer ntre ele

ipoteza H1 (sau ipoteza alternativ): datele


prezint legturi ntre ele, sunt dependente/
valorile comparate difer ntre ele
Teste statistice

Rezultatul p al testului, furnizat ca un numr ntre 0 i 1,


reprezint probabilitate de a face o eroare dac respingem
ipoteza H0.

Dac p este mai mic dect pragul de semnificaie ales de


obicei =0,05 - respingem ipoteza H0 i admitem ca
adevrat ipoteza H1.

Interpretarea valorilor p se face la majoritatea testelor


statistice astfel:
p < 0.05, legtura statistic este semnificativ (S, ncredere 95%).
p < 0.01, legtura statistic este semnificativ (S, ncredere 99%).
p < 0.001, legtura statistic este nalt semnificativ (HS, ncredere
99.9%).
p > 0.05, legtura statistic este nesemnificativ (NS).
Testul t-Student clasic
Testul de comparare a dou medii cnd
abaterile standard sunt egale (cazul
eantioanelor mici)

1. Se aplic dac msurtorile efectuate la cele dou


eantioane sunt independente
2. Se aplic dac eantioanele provin din populaii care
sunt normal distribuite (lucru care trebuie verificat
nainte de aplicarea testului)
3. Se aplic dac populatiile din care provin
eantioanele au dispersii egale (sau abateri
standard, ceea ce este acelasi lucru)
Convenie
Ipoteza c mediile populatiior din care provin
eantioanele sunt egale o vom numi ipoteza de
nul (notat totdeauna cu H0) ----------H0 : m1 = m2
Ipoteza, sau ipotezele, care epuizeaz restul
posibilitilor le vom numi ipoteze alternative
(notate totdeauna cu H1, H2 etc.) ------ H1 : m1 m2

Dac testul respinge H0, vom spune c datele


suport ipoteza c mediile populaiilor sunt diferite
Dac testul nu respinge H0, vom spune c datele
nu susin ipoteza c mediile populaiilor sunt diferite
Exemplu de calcul 120
VSH

Medie deviia standard


Au fost analizai 25 de pacieni cu o infecie 100
localizat i 25 cu sepsis, printre alte msurtori 74.48
80
nregistrndu-se i valoarea VSH. 54.68
60

40
Nr.pacient Infecie localizat Sepsis
1 25 55
2 20 88 20
3 110 53
4 45 30 0
5 50 72 Infecie localizat Sepsis
6 50 52
7 72 91 p test Student = 0.011186 - S
8 53 70
9 30 110 t-Test: Two-Sample Assuming Equal Variances
10 50 123
11 27 56 Infecie localizat Sepsis EXPLICATII
12 35 31
Mean 54.68 76.48 MEDIA ESANTIOANELOR
13 85 100
14 22 70 Variance 596.56 704.84 DISPERSIA ESANTIOANELOR
15 78 44 Observations 25 25 VOLUMUL ESANTIOANELOR
16 65 70 Pooled Variance 650.70 DISPERSIA COMUNA
17 85 90 Hypothesized Mean Diffe 0 DIFERENTA TESTATA
18 85 123
df 48 GRADE DE LIBERTATE: 25+25-2
19 55 85
t Stat -3.02149 VALOAREA t CALCULATA
20 25 72
21 50 75 P(T<=t) one-tail 0.00201
22 85 50 t Critical one-tail 1.67722
23 75 85 P(T<=t) two-tail 0.00403 p - REZULTATUL TESTULUI
24 40 107 t Critical two-tail 2.01063 PRAGUL CRITIC AL LUI t (tc)
25 50 110
Media 54.68 76.48
Deviaia standard 24.42 26.55 p<0,05 - se respinge H0
Dispersia
C.V. (%)
596.56
44.67%
704.84
34.81%
cu pragul de semnificaie de 95%
Analiza intervalelor de ncredere

Parametru Infecie localizat Sepsis


Nr.pacieni 25 25
Media 54.68 76.48
Deviaia standard 24.42 26.55
Eroarea standard 4.88 5.31
Valoare t95% (df=24) 2.064 2.064
Nivel de eroare 95% 10.08 10.96
Limita inferioar 44.60 65.52
Limita superioar 64.76 87.44

Observm c limita superioar a intervalului de ncredere de 95%


pentru media mai mic este sub limita superioar a intervalului de
ncredere de 95% pentru media mai mare.
n concluzie, cele dou medii sunt diferite pentru nivelul de
semnificaie de 95% - ceea ce am demonstrat prin testul t Student.
Testul t-Student - variante
Testul t Student pentru eantioane
cu dispersii egale (exemplificat)
Testul t Student pentru eantioane
cu dispersii diferite
Testul t Student pentru eantioane
pereche
Difer prin modul n care se
calculeaz valoarea coeficientului t.
Testul ANOVA
Compar n acelai timp mediile mai multor
eantioane.
H0: m1 = m2 = m3 = m4 (pentru 4 eantioane)
H1: cel puin dou medii difer semnificativ
Rezultatul este un numr p care se interpreteaz la fel ca
la celelalte teste:
Dac p>0,05 nu se respinge H0, diferena este
nesemnificativ la pragul de semnificaie de 95%
Dac p<0,05 se respinge H0 cu pragul de semnificaie de
95%. Cel puin dou medii difer semnificativ
Dac p<0,01 se respinge H0 cu pragul de semnificaie de
99%. Cel puin dou medii difer semnificativ
Dac p<0,001 se respinge H0 cu pragul de semnificaie de
99,9%. Cel puin dou medii difer nalt semnificativ
Exemplu
n trei comune ale judeului Dolj au fost colectate date despre
obiceiurile alimentare i legtura lor cu obezitatea i diabetul.
Printre alte date s-au nregistrat greutatea indivizilor i date
despre fumat
Indivizii, indiferent de sex sau grup de vrst, au fost
mprii n patru categorii: nefumtori, foti fumtori, uor
fumtori (sub 10 igarete pe zi) i fumtori (peste 10 igarete
pe zi)
O ntrebare a fost aceea dac exist o legtur ntre obiceiul
fumatului i greutatea corporal la aceti indivizi.
H0: Indiferent dac fumeaz sau nu, greutatea corporal este
aceeai
H1: Cel puin dou categorii din cele 4 au greuti corporale
diferite
Rezultate test ANOVA
Teste de comparare a dispersiilor

Testul Fischer se utilizeaz pentru


verificarea egalitii dispersiilor a dou
variabile independente repartizate normal.
Ipoteza nul este H0: 12=22
Testul Bartlett este un test pentru
verificarea egalitii mai multor dispersii
pentru mai multe variabile independente
repartizate normal
Ipoteza nul este H0: 12=22=...=k2
SUNT TESTE PARAMETRICE
Teste neparametrice
Sunt teste care nu fac presupuneri legate de
distribuia datelor.
Se aplic n orice condiii, dac msurtorile sunt
independente
Se aplic atunci cnd nu putem aplica un test
parametric
Sunt teste care au o acuratee a rezultatului mai
slab dect a testelor parametrice i se aplic
numai atunci cnd nu este posibil aplicarea
unui test parametric
Teste neparametrice

Compararea Date nepereche Date pereche


datelor

2 eantioane Mann-Whitney Wilcoxon

mai multe
eantioane Kruskal-Wallis Friedman

Compararea
Levene
dispersiilor
Teste neparametrice
Compar mai degrab medianele dect
mediile eantioanelor

Datele din toate grupurile, separat sau puse impreuna,


sunt aranjate descrescator.
Cel mai mic numr are rangul 1; cel mai mare numr are
rangul N, unde N este numrul total de valori.
Dac dou sau mai multe valori sunt egale, atunci li se
atribuie ca rang valoarea medie a pozitiilor ocupate de
ele.
Se face suma rangurilor pentru fiecare grup comparat i
se calculeaz media rangurilor.
n cazul n care mediile rangurilor pentru grupurile
comparate si, implicit, valorile initiale, sunt foarte
diferite, valoarea p obtinuta in urma testului va fi mica.

S-ar putea să vă placă și