Sunteți pe pagina 1din 20

BIOSTATISTICA

Teste de ipoteză
Compararea mediilor – testul t (student)
Compararea varianțelor - testul F (Fisher)

Conf.dr. Lucian V. Boiculese


Conf. Dr. Mihaela Moscalu
Teste de Ipoteză
Se ştie că în statistică obiectul fundamental constă în luarea unei decizii chiar în cazul existenţei unei incertitudini.
Decizia luată trebuie să fie corectă şi independentă (pe cât posibil) de lipsa de cunoştinţă materializată prin
incertitudine. Variabilitatea datelor definește incertitudinea.
În cazul testelor de ipoteză problema de bază constă în elaborarea regulilor de decizie în aşa fel încât dintre
variantele posibile să se aleagă concluzia corectă cu o probabilitate acceptată ca satisfăcătoare măcar.
Se emit mai multe ipoteze şi prin decizie se acceptă doar o ipoteză ce se încadrează în probabilitatea stabilită.
Ipoteza statistică reprezintă o presupunere asupra parametrilor uneia sau unor repartiţii sau chiar asupra repartiţiei
în sine (spre exemplu verificarea normalităţii unei repartiţii).
Testele statistice reprezintă metode matematice de verificare a ipotezelor statistice. Prin acestea se doreşte a se
verifica o ipoteză care apoi se aplică populaţiei de date (dacă este adevărată). Testarea se face pe baza
eşantionului de date. Astfel orice decizie comportă un anumit risc.
În enunţarea unei ipoteze (de exemplu compararea mediilor) există două posibilităţi:
– Ipoteza nulă notată H0 în care parametrii de comparat se consideră egali. Spre exemplu media populaţiei 1
având date în eşantionului 1 este egală cu media populaţiei 2 caracterizată de eşantionul 2. H0 : 1   2
– Ipoteza alternativă în care se consideră cei doi parametri diferiţi. H1 : 1  2
Posibile erori

Statistica are ca scop luarea unei decizii – o concluzie asupra analizei făcute.
Se pot comite în această situaţie două erori :
Eroare de tip I – să se accepte în mod greşit ipoteza alternativă H1, când în realitate H0 este
adevărată. Aceasta este notată cu α și are valoarea standard 0.05.
Eroare de tip II – să se accepte în mod greşit ipoteza nulă H0, când în realitate H1 este adevărată.
Se notează cu β și are valoarea standard 0.10.
Situaţiile posibile sunt prezentate în tabelul de mai jos.

Situaţie adevărată
Sistem decizional cu prag. Ipoteza H0 este Ipoteza H1 este
adevărată adevărată
Eroare tip II
Decizie prin

Acceptare ipoteză H0 Nu există eroare β


Falsi negativi
test

Eroare tip I
Acceptare ipoteză H1 α Nu există eroare
Falsi pozitivi
Este de dorit ca aceste erori să fie cât mai mici posibil. Se cunoaşte că există o legătură invers
proporţională între ele. Putem micşora eroarea α dar drept consecinţă, eroarea de tip II se va mări într-o
anumită măsură. Încercând să scădem valoarea β obţinem o creştere a erorii de tip I. Este clar că efectele
sunt contradictorii şi un compromis trebuie acceptat, funcţie de scopul urmărit.

0.45
H0 este adevărată H1 este adevărată
0.4
0.35 d
0.3 A
0.25
0.2 B
0.15
0.1
0.05 b a
0
Pentru luarea unei decizii se creează funcţia discriminantă statistică (forma matematică a testului), a cărei valoare
calculată se compară cu valori tabelate ale tipului de repartiţie în care se încadrează.
Pe scurt paşii de urmat în verificarea prin test statistic:
1. Enunţarea ipotezei.
2. Alegerea parametrului de studiu (poate să fie conţinut implicit în enunţarea ipotezei).
3. Deducerea şi calculul statisticii discriminante – Alegerea testului specific
4. Concluzia: acceptarea sau respingerea ipotezei nule.

Testul Ipotezei Simple (o singură variabilă aleatoare – one arm test)


Acest test constă în verificarea unei afirmații asupra valorilor parametrilor necunoscuţi ai unei repartiţii.
Se poate verifica egalitatea dintre media unei populaţii repartizate normal, cu o anumită valoare cunoscută ca
normală (un prag, sau un punct extrem: min sau max).

Testul Ipotezei Duble (două variabile aleatoare – two arms test)


Foarte frecvent în aplicaţiile de tip medical (şi nu numai) apare problema comparării unor parametri dintr-un
eşantion cu parametrii altui eşantion (pot fi chiar din aceeaşi populaţie dar la momente diferite).
Presupunem că avem două eşantioane notate cu X cu valorile x1, x2, …, xn respectiv Y cu valorile y1, y2, …, yn.
Considerăm că cele două populaţii sunt repartizate normal.
Dorim să testăm ipoteza H0: x = y , mediile sunt egale cu alternativa H1: x  y , mediile sunt diferite.
Populaţia 2
Populaţia 1

Comparăm !!!

Diferă
semnificativ
statistic ???!!!
p<0,05
Media1 Media 2
M1 M2
Dispersiile  x2 ,  2y se cunosc
În această situaţie variabila V urmează o distribuţie normală şi va
Exemplu de calcul
 x2  2y
avea dispersia echivalentă  V2   .
Testul ipotezei duble nx ny
Compararea mediilor a Funcţia discriminantă se va calcula cu formula:
doua esantioane
Z
V  V

  
X Y  x   y 
V  x2  2y
Se creeaza variabila V 
egala cu diferenta celor nx ny
doua variabile. Variabila Z este repartizată normal N(0,1).
Pentru specificaţie bilaterală simetrică regiunea de acceptare va fi:
 
P  Za 2  Zc  Za 2  1  a , cu a nivelul de semnificaţie.
Pentru medii egale se calculează:
X Y
Zc 
 x2  2y
Decizia se ia functie de 
valoarea calculata Zc n x ny
sau functie de valoarea Dacă calculând Zc se respectă realţia Zc  Za 2 , atunci acceptăm
p corespunzatoare. ipoteya H0 cu încredere b = 1 - a. Astfel putem considera că mediile sunt
egale.
Dacă relaţia: Zc  Z a 2 este respectată atunci nu putem accepta
ipoteza H0 şi vom considera mediile ca fiind diferite.
CUM DECIDEM STATISTIC ?
Presupunem că avem mai multe populații definite de funcțiile densitate de probabilitate ca în cazul
următor (repartiții normale):
f(x)
f1(x) f2(x)
Limite 95%

x1 x
media 1
Presupunem că avem un punct notat x1 – reprezentat grafic.
Cum decidem cărei populații aparține această valoare x1 ?

Dacă punctul respectiv se află in jurul mediei într-un domeniu simetric definit de 95% probabilitate, atunci
acel punct aparține acelei populații.
Practic am definit limitele unui interval de încredere de 95% în jurul mediei.
Pentru cazul nostru x1 aparține populației definită de funcția de distribuție f1(x).
Funcția discriminantă folosită în cadrul testelor este practic o nouă variabilă aleatoare (deci prezintă o
funcție de probabilitate) și măsoară diferențele dintre medii, dispersii … ce dorim să comparăm.
INTERPRETAREA GRAFICĂ PENTRU LUAREA DECIZIEI STATISTICE
- forma bilaterală (ne interesează doar diferenţa nu şi sensul)
Distribuția Z poate fi înlocuită cu t sau student dacă nu se cunosc deviațiile standard ale populațiilor
sau dacă volumele eșantioanelor sunt mai mici ca 30.
0.4
Nivelul de încredere standard este
Densitate de probabilitate

0.35
0.95 (sau 95%) iar nivelul prag de
0.3 semnificație (notat α sau p-critic)
H1 adevărat H0 adevărat (95%) H1 adevărat
0.25 este 1-0.95 deci 0.05 sau 5%.
0.2
Zcalculat se află în domeniul
0.15
H1 – avem semnificație !
0.1
0.05 Zcritic cât și tcritic arată limita maximă admisa ca
variație a diferenței mediilor.
0
-3.5

-2.5

-1.5

-0.5
-4

-3

-2

-1

0.5

1.5

3.5
0

2.5

4
Zcritic Z sau t
Zcalculat
De exemplu valoarea statisticii calculate
pe baza datelor din eşantioane (Z sau t ) Rețineți:
Statistica t calculată (cât și Z calculată) este proporțională cu diferența
poate avea valoarea reprezentată.
mediilor și măsoară cât de diferite sunt mediile.
X  X2
Se mai numește și tstat – statistica calculată t t  1
stat calculat
 echivalent
f(z)
1.2

1
DECIZIA STATISTICĂ
0.8

0.6

0.4 a sau p

0.2

0 M[z]=0 Z calculat

Prin calculul statisticii se deduce valoarea Zcalculat (sau t calculat etc.) si corespunzător acesteia se poate determina
valoarea semnificației p calculate.
Zcritic (sau t_critic) – este valoarea statisticii corespunzătoare încrederii standard de 0.95. Este limita maximă
admisă ca variație.
DECIZIA
Dacă |Zcalculat| ≥ Zcritic (sau tabelat) sau daca pcalculat ≤ 0.05 deducem existența diferenței semnificative statistic.
Dacă |Zcalculat| <Zcritic (tabelat) sau daca pcalculat> 0.05 nu exista diferență semnificativă statistic.
COMPARAREA MEDIILOR A DOUĂ EȘANTIOANE

SE POT APLICA TESTELE:

1 – TESTUL Z ÎN SITUAȚIA ÎN CARE DATELE SUNT REPARTIZATE NORMAL ȘI SE CUNOSC


DISPERSIILE (CU VOLUM MARE DE DATE / CEL PUȚIN 30).

2 – TESTUL T PENTRU DATE REPARTIZATE NORMAL DAR NU SE CUNOSC DISPERSIILE (DACA


VOLUMUL DE DATE ESTE MARE, PESTE 30 TESTUL T CONVERGE CĂTRE Z). Testul t
funcționează bine și pentru eșantioane mici.

3 – TESTUL ANOVA(analiza varianței) PENTRU VOLUM MARE DE DATE, REPARTIȚIE NORMALĂ,


VARIANȚE EGALE (HOMOSCEDASTICITATE)

Observație: pentru eșantioane mari , sau pentru situații în care se cunoaște deviația standard
este indicat testul Z pentru comparații. Ținând cont de faptul că testul t (sau distribuția t sau
student) converge în Z pentru volume mari de date rezultă că nu facem nicio eroare dacă folosim
testul t în loc de Z în astfel de situații !
Testul t (doar pt. compararea mediilor a două populații prin eșantioane)
Prezintă variante diferite funcție de:

1 – Datele sunt perechi (înainte / după tratament);


2 – Se cunoaște că dispersiile sunt egale (exista teste specifice de verificare a egalității dispersiilor);
3 – Dispersiile nu sunt egale – este testul t standard .
Exista astfel 3 forme ale testului t cu formule dedicate. Informația suplimentară aduce un plus de cunoștință
ce poate ajuta în determinarea semnificației statistice.

Testul ANOVA nu se cere la examen.


Testul ANOVA (analysis of variance / se compară mai multe eșantioane)
Pentru două sau mai multe populații.
Înainte de a aplica acest test trebuie sa ne asiguram că:
1 – Eșantioanele de lucru trebuie să fie independente,
2 – Datele sa fie extrase din populații repartizate normal,
3 – Homoscedasticitate – dispersiile (varianțele) sa fie egale.
Verificarea egalității varianțelor (dispersiilor) TESTUL F (Fisher)

O variantă a testului student se bazează pe ipoteza că datele au varianțe egale.


Cunoscând aceasta putem aplica pentru compararea datelor testul t dedicat – astfel vom avea un rezultat
calculat cu o aproximare mai bună, ducând în concluzie la o decizie cu grad crescut de corectitudine.

Verificarea egalității varianțelor se face cu testul F (Fisher).


Testul Fisher precede testul t(student) doar în situația în care datele nu sunt perechi. Astfel putem alege
varianta optimă a testului t (alegem între cele două variante: funcție de egalitatea / inegalitatea varianțelor).
Tehnica de lucru este standard, așadar vom calcula un nivel de semnificație notat p. Dacă valoarea p este mai
mică sau egală cu 0.05 (valoare critică standard) atunci vom avea semnificație statistică deci diferență confirmată
între dispersiile datelor. Dacă valoarea p este peste 0.05 atunci putem aproxima ca egale dispersiile celor două
populații.
Testul Fisher funcționează corect dacă datele sunt repartizate normal – această condiție trebuie îndeplinită.

Excel testul F – verificarea egalității varianțelor


1. Din grupul DATA se alege F-Test Two-sample for Varinces .
2. Se selectează seturile și se definește destinația unde vor fi prezentate rezultatele.
3. Se lansează în execuție (clic pe OK).
4. Se citesc și se interpretează rezultatele.
Alegerea testului F din grupul de
analiză a datelor

Definirea seturilor de date și a


opțiunilor de calcul

Rezultatele calculate.
Nivelul de probabilitate p determină
semnificația statistică.
Pentru acest caz p=0.079 ce este mai
mare ca 0.05 – așadar putem aproxima ca F-Test Two-Sample for Variances

egale varianțele. SET2 SET1


Mean 6.718868 6.367376
Variance 10.75793 8.336785
Observations 106 141
df 105 140
F 1.290417
P(F<=f) one-tail 0.079424
F Critical one-tail 1.346838
F-Test Two-Sample for Variances
F-Test Two-Sample for Variances
SET1 SET2
Mean 6.367376 6.718868 SET2 SET1
Variance 8.336785 10.75793 Mean 6.718868 6.367376 CORECT ! Ca
Observations
df
141
140
106
105
Variance
Observations
10.75793 8.336785
106 141
interpretare standard
F 0.774944 df 105 140
P(F<=f) one-tail 0.079424 F 1.290417
F Critical one-tail 0.74248 P(F<=f) one-tail 0.079424
F Critical one-tail 1.346838

Observație ! S12
Statistica Fisher se calculează cu formula: Fcalculat=S1^2/S2^2 sau Fcalculat  2
S2
S1 respectiv S2 sunt deviațiile standard calculate din eșantioane, dacă Fcalculat=1 înseamnă S1=S2.
Fiind un raport de valori pozitive rezultă un rezultat pozitiv deci variabila aleatoare studiată este pozitivă!
F este întotdeauna mai mare ca 0: F>0 !!!
Cu cât valoarea Fcalculat este mai depărtată de 1 cu atât ipoteza H0 este mai puțin probabilă.
Pentru a interpreta corect (prin metoda standard) se selectează mai întâi setul cu varianța mai mare.
Valoarea statisticii F este raportul dintre cele două dispersii. Astfel comparația se face cu valoarea 1, dacă
considerăm raportul subunitar (prima dispersie mai mică supra a doua) atunci valoarea calculată a lui F se va
apropia de 1(pentru lipsă diferență) deci va fi mai mare ca F critic și va însemna lipsa diferenței semnificative
statistice – ceea ce este invers față de regula generală: Fcalculat mai mare ca Fcritic.
Deoarece F nu poate fi negativ (fiind un raport de numere la pătrat) – iată și densitatea de
probabilitate reprezentată grafic prezintă evident această proprietate.
În concluzie x poate fi doar pozitiv – numai graficul C poate reprezenta o distribuție de tip Fisher.
Variabila de interes este x=S1^2/S2^2 și are doar valori pozitive.
Curba A poate reprezenta o distribuție de tip Gauss sau t dar sub nicio formă o distribuție de tip Fisher.
Curba C reprezintă distribuția FISHER.

Logica de decizie este aceeași pentru orice tip de


distribuție: Dacă ne aflăm în jurul mediei într-un
interval de 95% - atunci nu avem semnificație !
Pentru eșantioane mari media unei distribuții
Fisher tinde către valoarea 1.
TESTUL FISHER – compararea varianțelor
Da – să explicăm mai în amănunt, pentru valori F calculate mai mari ca 1.

Avem distribuția Fisher desenată în imaginea din stânga.


Suprafața roșie reprezintă limita de 0.95 probabilitate și
H0 adevărat corespunde valorii critice pe x:
Fcritical one-tail=3.07.
Valoarea calculată a statisticii F=3.45 (din eșantioanele de
studiu).
Valoarea corespunzătoare p=0.035.

Fcritic

Decizia asupra alegerii ipotezei se poate lua prin două metode:


1) – Verificăm mai întâi ca valoarea Fcalculat să fie mai mare ca 1 (altfel inversăm eșantioanele). Fcalculat
este mai mare ca 1. Dacă F calculat este mai mare ca Fcritic (3.45 > 3.07) rezultă că avem semnificație
statistică deci varianțele sunt diferite.
2) – Nivelul de semnificație p=0.035 este mai mic ca 0.05 ceea ce duce la aceeași concluzie, deci varianțele
sunt diferite.
În concluzie prin ambele metode, cum era și de așteptat obținem același rezultat.
Exemple de întrebări pentru examen

• Compararea mediilor se face folosind testul ….? R: t sau Student.


• Compararea varianțelor se face folosind testul…..? R: Fisher notat F.
• Pentru comparații, folosind teste de ipoteză, nivelul de semnificație standard este ….? 0.05 sau 5%
• Definiți ipotezele ce descriu posibila relație între valorile de comparat (teste de ipoteză) ?
• Cum se ia decizia în cadrul testelor de ipoteză ?
• Care este diferența dintre testul ”t” sau ”Student” respectiv testul Z ?
• Câte variante de test t cunoașteți ?
• Cum se ia decizia în cadrul comparării varianțelor a două seturi de date (descrieți ambele metode) ?
• Cum se ia decizia în cadrul comparării mediilor a două seturi de date (descrieți ambele metode) ?
• Desenați curba densitate de probabilitate și asociați regiunile ipotezelor H0 respectiv H1.
• Statistica Fisher este un raport al ……. ? R: dispersiilor
• Statistica t este o diferența standardizată a …….? R: mediilor
• Desenați distribuțiile t și Fisher pe același grafic. Care sunt diferențele ?

• …………………………….etc.
Mulțumesc !

S-ar putea să vă placă și