Sunteți pe pagina 1din 70

Catedra de medicină socială și management „Nicolae Testemițanu”

Elemente de statistică inferențială

Vladislav Badan
Statistica inferenţială

• Esența problemei: eșantionarea/variabilitatea biologică și/sau


imprecizia experimentală.
• Pentru că rezultatele provin din eşantion, există posibilitatea ca
acestea să fie obținute întâmplător.
• Întrebări urmare cercetării: sunt rezultatele întâmplătoare
sau nu? Pot fi rezultatele din eșantion extrapolate? Sunt
diferențele semnificative sau nu?
• SI permite extrapolarea rezultatelor din eşantion în populaţia
ţintă.
• Pentru a aprecia în ce măsură rezultatele au fost obţinute
întâmplător şi în ce măsură şi dacă se pot extrapola în
populaţia generală, se utilizează testele statistice de
semnificaţie. 2
Concepte cheie

• Eroare standard
• Interval de încredere
• Ipoteză nulă/alternativă
• Probabilitate
• Prag de semnificație
• Nivel de semnificație/nivel de încredere
• Statistica testului
• Valoarea critică a testului
• Aria de respingere/acceptare a ipotezei nule
3
Eroarea standard 𝜹
𝒑𝒒
𝑺𝑬 = 𝑺𝑬 =
𝒏 𝒏

• Reflectă precizia estimării parametrului populației de


către parametrul eșantionului.
• Măsoară distanța dintre parametrul de eșantion și cel
din populația țintă, prin urmare este o măsură a
depărtării de valoarea așteptată.
• Este atașabilă orcărui parametru obținut la nivel de
eșantion.
• Prin definiție, este întotdeauna mai mică decât deviația
standard.
• Are valoare invers proporțională cu volumul
eșantionului.
• Are valoare direct proporțională cu dispersia.
4
Eroarea standard

Poate fi raportată sub formă grafică și numerică

O1 (5.79±0.08);
O2 (7.23±0.16);
O3 (7.55 ±0.11)
O4 (8.46 ±0.12)
O5 (11.07 ±0.47)

Se utilizează pentru calculul intervalului de încredere


(confidență) 5
Intervalul de încredere

Pune în evidență intervalul valoric în jurul parametrului


de eșantion, în care se poate afla valoarea parametrului
populației țintă (valoarea adevărată), cu o probabilitate
fixată independent de date.
Pentru a fi calculat, se utilizează valoarea parametrului
de eșantion (punctul de estimare), valoarea erorii
standard, un nivel de încredere sau de semnificație pe
curba normală, delimitat de anumite valori z sau t,
specificate în tabele.
Este dependent de omogenitatea și volumul
eșantionului, respectiv de mărimea erorii standard.
6
Intervalul de încredere

• Multe variabile biologice respectă distribuția


normală.
• Distribuția normală este ușor de înțeles din punct
de vedere matematic.
• Populațiile cu care lucrăm respectă distribuția
normală.
• Eșantioanele extrase din populații distribuite
normal au aceeași distribuție.
• Conform teoremei limită centrală, eșantioanele
extrase din populații care nu respectă distribuția
normală vor avea o distribuție de eșantion
normală.

Nivel de încredere Nivel de semnificație Prag de semnificație Valoarea „t” Interval de încredere
68.26% 31.74% 0.3174 (1-0,6826) 1X sau P ± 1ES
95.45% 4.55% 0.0455 (1-0,9545) 2X sau P ± 2ES
99.73% 0.27% 0.0027 (1-0,9973) 3X sau P ± 3ES
Nivel de încredere Nivel de semnificație Prag de semnificație Valoarea „t” Interval de încredere
95% 5% 0.05 () 1.96X sau P ± 1.96ES
99% 1% 0.01 () 2.58X sau P ± 2.58ES
7
99.90% 0.10% 0.001 () 3.29X sau P ± 3.29ES
Nivel de încredere

Nivel de Nivel de
semnificație semnificație

Z (t)critic Z (t)critic

8
Intervalul de încredere

Mod de raportare:
prin prezentarea limitelor inferioară și superioară
prin valoarea care se adaugă/se scade din parametrul de
eșantion (punct de estimare)
Interpretare:
Nu există criterii obiective pentru a spune dacă un
interval de încredere este mare sau mic
Cu cât limitele intervalului de încredere sunt mai
apropiate de punctul de estimare, cu atât estimarea este
mai precisă.
MĂSURĂ A SEMNIFICAȚIEI CLINICE!
9
Intervalul de încredere

Rezultate Frevența
ES IC
testare relativă, p
7/10 70% 14,5% [42%-98%]
35/50 70% 6,5% [57%-83%]
70/100 70% 4,6% [61%-79%]
210/300 70% 2,6% [65%-75%]
700/1000 70% 1,4% [67%-73%]
Intervalul de încredere

11
Intervalul de încredere

12
Intervalul de încredere

Colesterolemia
13

12

11

10

Media
5 Media±ES
Norma Obezitate 1 Obezitate 3 Media±1,96*ES
13
Supraponderali Obezitate 2
Intervalul de confidență

Nesemnificativ statistic atunci când include:


• 1 (pentru Riscul Relativ, Raportul Șanselor)
• 0 (pentru Reducerea Relativă a Riscului;
Reducerea Absolută a Riscului)
•  (pentru Numărul Necesar de Tratat)
Testarea ipotezelor

• Esenţial în inferenţa statistică este formularea şi


testarea ipotezelor.
• Ipoteza cercetării poate fi exprimată în 2 moduri:
ipoteză nulă şi ipoteză alternativă.
• Într-o cercetare există o singură ipoteză nulă, care
direcţionează studiul şi una sau mai multe ipoteze
alternative.
• Urmare analizei sunt posibile două rezultate:
respingerea sau nerespingerea ipotezei nule.

15
Testarea ipotezelor

• Respingerea ipotezei nule sugerează că ipoteza


alternativă poate fi adevărată.
• Nerespingerea ipotezei nule sugerează că nu există
destule argumente pentru respingerea acesteia.
• Ipoteza alternativă poate lua trei forme:
H1 ≠ H0
H1 > H0
H1 < H0

16
Semnificaţie şi eroare în testarea ipotezelor

• Ipoteza nulă poate fi respinsă dacă probabilitatea să


fie adevărată este foarte mică.
• Dar cât de mică? Care este pragul ce permite
respingerea ipotezei nule?
• Pentru a decide, se utilizează pragul de semnificaţie
(p)/nivelul de semnificaţie (α).
• Valorile utilizate ale pragului de semnificaţie
statistică: 0,05; 0,01; 0,001.

17
Semnificaţie şi eroare în testarea ipotezelor

• Pragul de semnificație permite respingerea ipotezei


nule în condiţiile unor valori strict mai mici decât „p”
(pentru p<0,05).
• Respectiv, un indicator statistic poate fi semnificativ
sau nesemnificativ statistic în funcţie de raportarea la
acest prag.

18
Semnificaţie şi eroare în testarea ipotezelor

• Dacă presupunem că ipoteza nulă este adevărată și


probabilitatea ca diferenţa să fie obţinută urmare
erorilor de eșantionare este mai mică de 0,05 (5%),
atunci se poate respinge ipoteza nulă, iar indicatorul
este semnificativ statistic.
• Distanțele între parametrii comparați sunt mari.

19
Semnificaţie şi eroare în testarea ipotezelor

• Dacă probabilitatea ca diferenţa să fie o coincidenţă


urmare eşantionării, este mai mare de 0,05 (5%),
indicatorul nu este semnificativ statistic, iar ipoteza
nulă nu poate fi respinsă.
• În acest caz se poate afirma că nu exista diferenţă
semnificativă statistică între grupurile comparate.
• Distanțele între parametrii comparați sunt mici.

20
Semnificaţie şi eroare în testarea ipotezelor

• Valoarea pragului de semnificaţie reprezintă


probabilitatea de apariţie a unui eveniment în cazul
ipotezei nule adevărate, dar nu indică probabilitatea
de apariţie a evenimentului la nivelul populaţiei.
• Un prag de semnificație mai mic de 0,05 ne spune că
sunt mai puţin de 5% şanse ca diferenţa observată să
fie întâmplătoare, însă nu înseamnă că avem peste
95% şanse sa regăsim diferenţa la nivelul populaţiei
întregi.
• Rezultatele sunt semnificative sau nu pentru nivelul
de 5%, ceea ce conirmă faptul că rezultatul nu a fost
obținut întâmplător.
21
Moduri de raportare a pragului de semnificaţie

• raportarea inegalităţii, de forma p<0,05 sau p>0,01. Nu


este cea mai preferată modalitate, deoarece permite o
raportare de calitate proastă a probabilităţii de respingere
a ipotezei nule.
• raportarea exactă a pragului de semnificaţie, de forma
p=0,0016. Această metodă este preferată, deoarece
permite evaluarea exactă a probabilităţii de respingere a
ipotezei nule.
• dacă programul statistic raportează pragul de semnificație
de forma .000, în acest caz se preferă prima modalitate de
raportare, de genul p<0,001.

22
Moduri de raportare a pragului de semnificaţie

23
Pragul de semnificaţie

• MĂSOARĂ SEMNIFICAȚIA STATISTICĂ.


• NU MĂSOARĂ SEMNIFICAȚIA CLINICĂ.
• Nu oferă informații cu referire la șansa de beneficiu a
unui individ.
• Nu oferă informații privind procentul de pacienți care vor
avea beneficii urmare aplicării tratamentului.

24
Etape în testarea semnificaţiei statistice

1.Formularea ipotezei nule şi alternative.


Ipoteza nulă (H0) decide, apriori, faptul că nu există
nici o diferenţă între grupurile (eşantioanele) studiate.
Totodată, ipoteza alternativă (notată H1), se opune
ipotezei nule şi afirmă că există o diferenţă între
grupurile (eşantioanele) studiate. Dacă, urmare
studiului, ipoteza nulă este respinsă, ipoteza
alternativă devine concluzie.

25
Etape în testarea semnificaţiei statistice

2. Determinarea formei ipotezei: bilaterală?


unilaterală stânga? unilaterală dreapta?
3. Selectarea pragului de semnificaţie pentru testul
statistic (p). Reprezintă probabilitatea de a respinge
ipoteza nulă adevărată. Valoarea pragului de
semnificaţie trebuie să fie mică, pentru a nu respinge
greşit ipoteza nulă (0,05; 0,01; 0,001). Această
valoare corespunde unei valori critice a testului.

26
Etape în testarea semnificației statistice

4. Selectarea testului statistic potrivit în testarea


ipotezei. Este important, deoarece trebuie luate în
considerare volumul eşantionului, forma distribuţiei
(simetrică sau nu), tipul datelor (pereche sau
nepereche).
5. Determinarea valorii la care testul trebuie să ajungă
pentru a putea fi declarată ca fiind semnificativă.

27
Suprafața critică pentru testarea ipotezelor statistice

Suprafața, care permite respingerea ipotezei


nule, dacă valoarea testului de senâmnificație
se plasează aici.
Nivelul de semnificație alfa reprezintă
probabilitatea de nimerire a valorii testului
statistic în suprafața critică, dacă ipoteza nulă
este adevărată.
Suprafața critică bilaterală

Suprafața critică unilaterală stânga Suprafața critică unilaterală dreapta


28
Etape în testarea semnificației statistice

6. Efectuarea calculelor.
7. Compararea valorii calculate a testului cu valoarea
critică a testului.
8. Interpretarea rezultatelor. Cercetătorul trebuie să
folosească datele obţinute pentru a determina una din
cele două decizii posibile – să accepte sau să respingă
ipoteza nulă.

29
Etape în testarea semnificației statistice

Dacă valoarea calculată a testului este mai mare decât cea


critică, valoarea „p” este mai mică decât pragul stabilit,
ipoteza nulă se respinge pentru nivelul respectiv de
semnificație, diferenţa este semnificativă statistic.
Dacă valoarea calculată a testului este mai mică decât cea
critică, valoarea „p” este mai mare decât pragul stabilit,
respectiv ipoteza nulă nu se respinge pentru nivelul
respectiv de semnificație, diferenţa se consideră
nesemnificativă statistic.

30
H0 nu se respinge

H0 se respinge H0 se respinge

Z (t)critic Z (t)critic

31
Etape în testarea semnificației statistice

În cazul nerespingerii ipotezei nule nu se poate trage


concluzia că aceasta este adevărată.

Nerespingerea ipotezei nule poate fi o dovadă a lipsei


probelor suficiente pentru a o respinge!

32
Tipuri de erori în testarea ipotezei

Realitatea (necunoscută)

H0 adevărată H0 falsă

Corectă Eroare de tip II


Acceptăm H0
Decizia urmare 1-α β
studiului Eroare de tip I Corectă
Respingem H0
α 1-β

33
Tipuri de erori în testarea ipotezei

• Eroarea de tip I – respingerea ipotezei nule, care în


realitate este adevărată, dar datele studiului indică
faptul că ea este falsă („alarmă falsă”).
• Probabilitatea de a comite această eroare este
denumită nivel de semnificaţie alfa (α).
• Cu cât nivelul de semnificație este mai mic, riscul
comiterii acestei erori este mai mic.
• Nivelul dorit de semnificație este stabilit de către
cercetător până la obținerea rezultatelor
experimentale, valori uzuale în medicină și biologie –
0.05; 0.01; 0.001.

34
Tipuri de erori în testarea ipotezei

• Eroarea de tip II – acceptarea ipotezei nule, care în


realitate este falsă, dar datele studiului indică faptul
că ea este adevărată („omiterea țintei”).
• Probabilitatea de a comite eroarea de tip II se numeşte
nivel beta (β).
• De regulă, are mărimea 0,2 sau 0,1.

Nu este posibil de redus simultan ambele riscuri de


eroare.

35
Tipuri de erori în testarea ipotezei

• Probabilitatea acceptării ipotezei nule adevărate se


numeşte nivel de încredere (1-α) al testului (eng.
confidence level).
• Nivelul de încredere este probabilitatea de a nu găsi
nici o diferenţă, atunci când această diferenţă într-
adevăr nu există.
• Valoarea minimă a nivelului de încredere – 0.95 sau
95%.

36
Tipuri de erori în testarea ipotezei

• Probabilitatea respingerii ipotezei nule false se numeşte


putere statistică (1-β) a testului (eng. statistical power).
• Puterea este probabilitatea de a detecta o diferenţă, care
într-adevăr există.
• Puterea testului este direct proporțională cu volumul
eșantionului!
• Un studiu cu putere mare permite stabilirea diferenţelor
între eşantioanele cercetate, atunci când această diferenţă
într-adevăr există.
• Puterea testului este stabilită la etapa de planificare a
cercetării. De regulă, are valoarea 0,8 sau 0,9.
• Studiul, care are puterea de respingere a ipotezei nule
false sub valoarea de 80%, este inacceptabil.

37
Tipuri de teste

• De valabilitate – Grubbs, Chauvenet - precizează


dacă un anumit rezultat experimental se datorează
variabilităţii biologice normale sau este un rezultat
aberant, urmare acţiunii factorilor accidentali, apăruţi
în timpul cercetării.

• De concordanţă (în engleză goodness of fit test).

• De semnificaţie.

38
Testul Grubbs

• Frecvent utilizat pentru verificarea existenţei valorilor extreme


(aberante) – în engleză outliers, în eșantioane care respectă distribuția
normală.
• Ipoteza nulă: în setul de date nu sunt valori extreme;
• Ipoteza alternativă: în setul de date există cel puțin o valoare extremă.

• Verifică valorile care se îndepărtează de restul populaţiei şi care nu


caracterizează din punct de vedere statistic populaţia respectivă.

• Valoarea testului se exprimă în număr de abateri standard dintre


valorile extreme și media de eșantion.

• Dacă valoarea testului este mai mare decât cea critică, valoarea
extremă se consideră aberantă și exclude din analiza statistică, iar
testul se repetă până la identificarea tuturor valorilor aberante.

39
Testul Grubbs

n Z n Z n Z n Z
α=0,05 α=0,05 α=0,05 α=0,05
3 1,15 16 2,59 29 2,89 60 3,2
4 1,48 17 2,62 30 2,91 70 3,26
5 1,71 18 2,65 31 2,92 80 3,31
6 1,89 19 2,68 32 2,94 90 3,35
7 2,02 20 2,71 33 2,95 100 3,38
8 2,13 21 2,73 34 2,97 110 3,42
9 2,21 22 2,76 35 2,98 120 3,44
10 2,29 23 2,78 36 2,99 130 3,47
11 2,34 24 2,8 37 3 140 3,49
12 2,41 25 2,82 38 3,01
13 2,46 26 2,84 39 3,03
14 2,51 27 2,86 40 3,04
15 2,55 28 2,88 50 3,13 40
Tipuri de teste

• De concordanţă: Kolmogorov-Smirnov; D’Agostino &


Pearson; Shapiro-Wilk – verifică dacă eşantioanele
provin dintr-o populaţie, care se supune sau nu legilor
distribuţiei normale.
• Mai frecvent utilizate: testele Shapiro-Wilk și
Kolmogorov-Smirnov.
• Ipotezele testate:
Distribuţia eşantionului corespunde distribuţiei normale
(Gauss-Laplace).
Distribuţia eşantionului nu corespunde distribuţiei
normale (Gauss-Laplace).

41
42
43
44
45
Tipurile testelor de semnificaţie

• Parametrice;
• Neparametrice.
• Pentru eşantioane dependente (date pereche);
• Pentru eşantioane independente (date nepereche).
• Unilaterale;
• Bilaterale.
• Pentru eşantioane cu dispersie egală;
• Pentru eşantioane cu dispersie inegală.

46
Alegerea testelor de semnificație statistică

Tipul datelor
Scop Distribuție Distribuție Distribuție binomială
simetrică asimetrică (non-
(Gaussiană) Gaussiană)

Descrierea unui grup Medie, abatere Mediană, abaterea


Proporție
standard intercuantilică
Compararea unui grup Test Student pentru
cu o valoare ipotetică Test Wilcoxon Test Chi-pătrat
un eșantion
Compararea a două Test Student
eșantioane pereche Test Wilcoxon Test McNemar
pereche
Compararea a două Test Fisher (Chi-
eșantioane nepereche Test Student
Test Mann-Whitney pătrat pentru
nepereche
eșantioane mari)
Compararea a trei sau
mai multe grupuri ANOVA Kruskal-Wallis Regresie Cox

47
Tipurile testelor de semnificaţie

• Parametrice: pentru variabile cantitative (scalele de


interval și de raport); distribuția de eșantion respectă
distribuţia normală; operează cu parametrii
distribuției de eșantion (media și abaterea standard).

• Neparametrice: pentru variabile calitative (scalele


nominală și ordinală); distribuția de eșantion nu
respectă distribuţia normală sau normalitatea
distribuţiei nu poate fi testată, datorită eşantionului
mic.

48
Date pereche

• este măsurată o variabilă înainte şi după o intervenţie


asupra aceluiaşi subiect;
• se efectuează un experiment de laborator de mai multe
ori, prin determinări paralele ale preparatului studiat şi ale
controlului;
• selecţia cazurilor a fost efectuată prin metoda perechilor
pe baza unor anumite criterii cum ar fi vârsta, rasa sau
gravitatea bolii etc.;
• sunt măsuraţi anumiţi parametri în cazul gemenilor sau a
unor perechi de genul părinte/copil etc.

49
Testul ”t” Student

• testul „t” pentru date “pereche” (eşantioane dependente);


• testul „t” pentru date “nepereche” (eşantioane
independente) cu dispersie egală;
• testul „t” pentru date “nepereche” (eşantioane
independente) cu dispersie inegală;
• Pentru eşantioane mici, între testul „t” şi celelalte teste
de semnificaţie parametrice există diferenţe, dar
începând de la n > 15 cifrele testului „t” se apropie de 2,
ceea ce corespunde cu distribuţia normală.

50
51
52
53
54
Testul Mann-Whitney

• analogul testului parametric ”t” independent;


• unul din cele mai puternice teste neparametrice.
• poate fi utilizat atât cu eşantioane mici, cât si cu
eşantioane mari;
• necesită numai măsurători de tip rang;
• este valabil când nu se respectă condiţiile aplicării
testului t independent.
• operează cu numere ordinale.

55
56
57
Testul Wilcoxon

• analogul testului parametric ”t” dependent;


• unul din cele mai utilizate teste neparametrice.
• necesită numai măsurători de tip rang
• este valabil când nu se respectă condiţiile aplicării
testului t dependent.
• operează cu numere ordinale.

58
59
Analiza dispersională ANOVA

• Scopul principal al analizei varianței este de a testa


semnificația diferenței dintre mediile a mai mult de două
eșantioane.
• Analiza varianței ne permite să răspundem la întrebarea dacă
grupurile comparate aparțin aceleiași populații generale sau
sunt selectate din populații diferite.
• Acest lucru se realizează prin calcularea unui raport simplu
numit raport F: dispersia dintre grupe/dispersia din grupe.
• Dacă eșantioanele comparate diferă între ele prin o singură
variabilă, se utilizează analiza unifactorială a varianței. (One-
way ANOVA).
• Dacă eșantioanele comparate diferă între ele prin două
variabile, se utilizează analiza bifactorială a varianței. (Two-
way ANOVA).
60
61
62
63
64
Testul Χ2 (chi pătrat)

• este un test non-parametric, poate fi utilizat pentru


eşantioane formate din seturi de date care nu sunt
normal distribuite;
• verifică diferența dintre frecvențele observate și cele
estimate;
• poate fi utilizat pentru date măsurate pe scala
nominală și ordinală;
• poate fi utilizat pentru mai mult de două eşantioane.
• !!!este mai puţin sensibil decât testul t, astfel, dacă
datele pot fi prelucrate cu testul t, acesta va fi preferat
testului χ2 65
Testul Χ2 (chi pătrat)

test χ2 pentru un singur eşantion:


• ipoteza nulă: setul de date prezintă diferenţe între categorii;
• ipoteza alternativă: setul de date nu prezintă diferenţe între categorii.
test χ2 pentru doua eşantioane:
• ipoteza nulă: cele doua eşantioane fac parte din aceeaşi populaţie;
• ipoteza alternativă: cele doua eşantioane nu fac parte din aceeaşi
populaţie.
test χ2 pentru 3 sau mai multe eşantioane:
• ipoteza nulă: nici un eşantion nu este semnificativ diferit de
celelalte;
• ipoteza alternativă: cel puţin un eşantion este semnificativ diferit de
celelalte

66
Testul Χ2 (chi pătrat), condiții

• Utilizează mărimi absolute.


• Datele trebuie să fie grupate pe categorii.
• Trebuie să existe cel puţin două categorii, pentru a putea construi un
tabel de contingenţă.
• Frecvenţele aşteptate trebuie să fie mai mari decât 1.
• Dacă sunt doar două categorii, atunci frecvenţele aşteptate trebuie să
fie mai mari decât 5.
• Dacă sunt mai multe categorii, nu mai mult de 20% din celulele
tabelului de contingenţă pot sa conţină frecvenţe aşteptate mai mici
decât 5.
• Eşantioanele trebuie sa fie independente (date nepereche).
!!!Dacă se încalcă vreun punct din punctele 4-6, atunci testul χ2 este
nesigur, deci putem lua o decizie greşită. Pentru a evita acest lucru,
uneori se apelează la combinarea categoriilor. 67
Testul Χ2 (chi pătrat), aplicare

• Se formulează ipoteza nulă și alternativă.


• Calculăm valorile așteptate (total coloană*total rând/total
general).
• Calculul valorii testului;
• Valoarea obținută se compară cu valoarea critică pentru nivelul
de semnificație stabilit și numărul gradelor de libertate (degree
of freedom, df ): df = (C-1) x (R-1).
• Dacă valoarea calculată a testului este mai mare decât cea
critică, ipoteza nulă se respinge, diferențele se consideră
semnificative statistic.

68
69
70

S-ar putea să vă placă și