Sunteți pe pagina 1din 23

Cursul 7 Teste statistice

Intervale de ncredere Testul Student Testul ANOVA Testul Fisher pentru dispersii Teste neparametrice

Curba Gauss

Media=100, Deviaia standard=15

Eantion dintr-o populaie normal


In urmtoarele 9 imagini vei vedea:
n prima, distribuia unei populaii Gauss n a doua, distribuia mediilor calculate pe loturi de 2 indivizi n continuare, distribuia mediilor calculate pe eantioane de 3, 4, 9, 16, 25, 36, 100 de indivizi

Concluzie:
Media de eantionare calculat pe un eantion de volum n extras dintr-o populaie distribuit Gauss are:
Distribuia Gauss Media egal cu cea a populaiei de provenien Abaterea standard este abaterea populaiei de provenien mprit la radicalul lui n = Eroarea standard! Err = / n

Interval de ncredere - definiie


Numim interval de ncredere pentru medie, un interval de numere reale n care suntem aproape siguri c se afl media real, pe care o aproximm. Gradul de siguran poate fi ales; de obicei este 95% sau 99%

Interval de ncredere
Dac avem o serie de valori i am obinut media de eantionare X i abaterea standard , atunci avem urmtoarea probabilitate furnizat de distribuia mediei de eantionare:
s s P X t c < m < X + tc 0,95 n n

Exemplu de calcul: I95%


Serie: Latene pe nervul optic Medie: 112,2 Abatere standard: 12,5 Volum eantion: 156 Eroarea standard: n tabele: Limitele sunt:

Ce este un test statistic?


Este o metod de decizie care ne ajut la validarea sau invalidarea cu un anumit grad de siguran a unei ipoteze statistice

Teste statistice
Testele statistice verific veridicitatea unor ipoteze - inferene statistice
ipoteza H0 (sau ipoteza de nul): datele nu prezint legturi ntre ele, sunt independente/ valorile comparate nu difer ntre ele ipoteza H1 (sau ipoteza alternativ): datele prezint legturi ntre ele, sunt dependente/ valorile comparate difer ntre ele

Teste statistice
Rezultatul p al testului, furnizat ca un numr ntre 0 i 1, reprezint probabilitate de a face o eroare dac respingem ipoteza H0. Dac p este mai mic dect pragul de semnificaie ales de obicei =0,05 - respingem ipoteza H0 i admitem ca adevrat ipoteza H1. Interpretarea valorilor p se face la majoritatea testelor statistice astfel:

p < 0.05, legtura statistic este semnificativ (S, ncredere 95%). p < 0.01, legtura statistic este semnificativ (S, ncredere 99%). p < 0.001, legtura statistic este nalt semnificativ (HS, ncredere 99.9%). p > 0.05, legtura statistic este nesemnificativ (NS).

Testul t-Student clasic


Testul de comparare a dou medii cnd abaterile standard sunt egale (cazul eantioanelor mici)
1. 2. 3. Se aplic dac msurtorile efectuate la cele dou eantioane sunt independente Se aplic dac eantioanele provin din populaii care sunt normal distribuite (lucru care trebuie verificat nainte de aplicarea testului) Se aplic dac populatiile din care provin eantioanele au dispersii egale (sau abateri standard, ceea ce este acelasi lucru)

Convenie
Ipoteza c mediile populatiior din care provin eantioanele sunt egale o vom numi ipoteza de nul (notat totdeauna cu H0) ----------H0 : m1 = m2 Ipoteza, sau ipotezele, care epuizeaz restul posibilitilor le vom numi ipoteze alternative (notate totdeauna cu H1, H2 etc.) ------ H1 : m1 m2 Dac testul respinge H0, vom spune c datele suport ipoteza c mediile populaiilor sunt diferite Dac testul nu respinge H0, vom spune c datele nu susin ipoteza c mediile populaiilor sunt diferite

Au fost analizai 25 de pacieni cu o infecie localizat i 25 cu sepsis, printre alte msurtori nregistrndu-se i valoarea VSH.
Nr.pacient 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 Media Deviaia standard Dispersia C.V. (%) Infecie localizat 25 20 110 45 50 50 72 53 30 50 27 35 85 22 78 65 85 85 55 25 50 85 75 40 50 54.68 24.42 596.56 44.67% Sepsis 55 88 53 30 72 52 91 70 110 123 56 31 100 70 44 70 90 123 85 72 75 50 85 107 110 76.48 26.55 704.84 34.81%

Medie deviia standard

Exemplu de calcul

VSH
120 100 80 60 40 20 0 54.68 74.48

Infecie localizat

Sepsis

p test Student = 0.011186 - S


t-Test: Two-Sample Assuming Equal Variances Infecie localizat Mean 54.68 Variance 596.56 Observations 25 Pooled Variance 650.70 Hypothesized Mean Diffe 0 df 48 t Stat -3.02149 P(T<=t) one-tail 0.00201 t Critical one-tail 1.67722 P(T<=t) two-tail 0.00403 t Critical two-tail 2.01063 Sepsis 76.48 704.84 25 EXPLICATII MEDIA ESANTIOANELOR DISPERSIA ESANTIOANELOR VOLUMUL ESANTIOANELOR DISPERSIA COMUNA DIFERENTA TESTATA GRADE DE LIBERTATE: 25+25-2 VALOAREA t CALCULATA

p - REZULTATUL TESTULUI PRAGUL CRITIC AL LUI t (tc)

p<0,05 - se respinge H0 cu pragul de semnificaie de 95%

Analiza intervalelor de ncredere


Parametru Nr.pacieni Media Deviaia standard Eroarea standard Valoare t95% (df=24) Nivel de eroare 95% Limita inferioar Limita superioar Infecie localizat 25 54.68 24.42 4.88 2.064 10.08 44.60 64.76 Sepsis 25 76.48 26.55 5.31 2.064 10.96 65.52 87.44

Observm c limita superioar a intervalului de ncredere de 95% pentru media mai mic este sub limita superioar a intervalului de ncredere de 95% pentru media mai mare. n concluzie, cele dou medii sunt diferite pentru nivelul de semnificaie de 95% - ceea ce am demonstrat prin testul t Student.

Testul t-Student - variante


Testul t Student pentru eantioane cu dispersii egale (exemplificat) Testul t Student pentru eantioane cu dispersii diferite Testul t Student pentru eantioane pereche Difer prin modul n care se calculeaz valoarea coeficientului t.

Testul ANOVA
Compar n acelai timp mediile mai multor eantioane. H0: m1 = m2 = m3 = m4 (pentru 4 eantioane) H1: cel puin dou medii difer semnificativ Rezultatul este un numr p care se interpreteaz la fel ca la celelalte teste:
Dac p>0,05 nu se respinge H0, diferena este nesemnificativ la pragul de semnificaie de 95% Dac p<0,05 se respinge H0 cu pragul de semnificaie de 95%. Cel puin dou medii difer semnificativ Dac p<0,01 se respinge H0 cu pragul de semnificaie de 99%. Cel puin dou medii difer semnificativ Dac p<0,001 se respinge H0 cu pragul de semnificaie de 99,9%. Cel puin dou medii difer nalt semnificativ

Exemplu
n trei comune ale judeului Dolj au fost colectate date despre obiceiurile alimentare i legtura lor cu obezitatea i diabetul. Printre alte date s-au nregistrat greutatea indivizilor i date despre fumat Indivizii, indiferent de sex sau grup de vrst, au fost mprii n patru categorii: nefumtori, foti fumtori, uor fumtori (sub 10 igarete pe zi) i fumtori (peste 10 igarete pe zi) O ntrebare a fost aceea dac exist o legtur ntre obiceiul fumatului i greutatea corporal la aceti indivizi. H0: Indiferent dac fumeaz sau nu, greutatea corporal este aceeai H1: Cel puin dou categorii din cele 4 au greuti corporale diferite

Rezultate test ANOVA

Teste de comparare a dispersiilor


Testul Fischer se utilizeaz pentru verificarea egalitii dispersiilor a dou variabile independente repartizate normal. Testul Bartlett este un test pentru verificarea egalitii mai multor dispersii pentru mai multe variabile independente repartizate normal
Ipoteza nul este H0: 12=22=...=k2 Ipoteza nul este H0: 12=22

SUNT TESTE PARAMETRICE

Teste neparametrice
Sunt teste care nu fac presupuneri legate de distribuia datelor. Se aplic n orice condiii, dac msurtorile sunt independente Se aplic atunci cnd nu putem aplica un test parametric Sunt teste care au o acuratee a rezultatului mai slab dect a testelor parametrice i se aplic numai atunci cnd nu este posibil aplicarea unui test parametric

Teste neparametrice
Compararea datelor 2 eantioane mai multe eantioane Date nepereche Date pereche

Mann-Whitney

Wilcoxon

Kruskal-Wallis

Friedman

Compararea dispersiilor

Levene

Compar mai degrab medianele dect mediile eantioanelor


Datele din toate grupurile, separat sau puse impreuna, sunt aranjate descrescator. Cel mai mic numr are rangul 1; cel mai mare numr are rangul N, unde N este numrul total de valori. Dac dou sau mai multe valori sunt egale, atunci li se atribuie ca rang valoarea medie a pozitiilor ocupate de ele. Se face suma rangurilor pentru fiecare grup comparat i se calculeaz media rangurilor. n cazul n care mediile rangurilor pentru grupurile comparate si, implicit, valorile initiale, sunt foarte diferite, valoarea p obtinuta in urma testului va fi mica.

Teste neparametrice

S-ar putea să vă placă și