Sunteți pe pagina 1din 5

BIOSTATISTICA

Teste statistice
Teme:
Compararea populaiilor prin mediile eantioanelor testul t sau Student.
Compararea varianelor populaiilor testul F (Fisher).
n cadrul testelor statistice se folosete noiunea de ipotez statistic.
Ipoteza statistic reprezint o presupunere asupra parametrilor uneia sau unor repartiii sau
chiar asupra repartiiei n sine (spre exemplu, egalitatea mediilor a dou populaii, a
dispersiilor, a proporiilor, verificarea formei normale a unei repartiii, etc.).
Testele statistice reprezint metode matematice de verificare a ipotezelor statistice. Prin
acestea se dorete examinarea unei ipoteze care apoi se aplic populaiei de date dac este
confirmat a fi adevrat. Testarea se face pe baza eantionului de date. Astfel, orice decizie
comport un anumit risc. Decizia se ia asupra ntregii populaii, deci constituirea eantionului
este de importan major.
n enunarea unei ipoteze exist dou posibiliti:
Ipoteza nul notat H0, n care parametrii de comparat se consider egali. Spre exemplu,
media populaiei 1 avnd date n eantionul 1 este egal cu media populaiei 2 caracterizat
de eantionul 2.
H0 :
1 2
Aceasta arat lipsa diferenelor parametrilor examinai sau a existenei unei relaii.
Ipoteza alternativ H1 sau HA n care se consider cei doi parametri diferii.
H1 :
1 2
Aceast ipotez este contrar ipotezei nule i arat existena diferenelor sau a relaiilor
posibile ntre parametri.
Variante de ipoteze Ipoteza nul
Ipoteza alternativ
Forma bilateral
H1 :
1 2
H0 :
1 2
Forma unilateral
H0 :
1 2
H1 :
1 2
H0 :
1 2
Obs. ipoteza nul conine totdeauna semnul =.

Forma unilateral

H1 :

1 2

Se creeaz apoi funcia discriminant statistic (forma matematic a testului), a crei


valoare calculat se compar cu valori tabelate corespunztoare tipului de repartiie n care se
ncadreaz.
Pe scurt, etapele de urmat n verificarea prin test statistic vor fi:
1. Enunarea ipotezei. Se definesc ipotezele: nul, respectiv alternativ. Acestea
urmresc scopul cercetrii, exprimnd ceea ce avem de verificat.
2. Alegerea parametrului de studiu (poate s fie coninut implicit n enunarea ipotezei).
Ca exemple avem: media, variana, relaia exprimat prin corelaie, parametrii de regresie,
proporii n cadrul populaiilor, etc.
3. Deducerea i calculul statisticii discriminante dorite aplicnd regula de decizie. De
exemplu, la compararea mediilor se poate lua n calcul o nou variabil aleatoare definit ca
diferena ntre indicatori. n acest caz aceasta poate urma o distribuie de tip t (Student) sau Z,
deci normal.
4. Acceptarea sau respingerea ipotezei nule prin calculul semnificaiei p. Se calculeaz
statistica (t, Z sau Fisher spre exemplu) din datele eantioanelor de lucru. Corespunztor se

Page 1 of 5

deduce valoarea p, care reprezint probabilitatea de a avea o eroare de tip I. Aceasta este o
integral n cadrul distribuiei de frecven determinate i reprezint semnificaia testului.
Dac p (nivelul de semnificaie) este mai mic sau egal cu 5% adic 0.05 atunci ipoteza H0
este eliminat n favoarea ipotezei H1 spunem c exist diferen semnificativ statistic.
Decidem c cele dou populaii difer semnificativ.
Acelai lucru se obine dac comparm valoarea statisticii t-calculat cu valoarea
corespunztoare pragului de 5% adic t-0.05 sau t-critic. Dac t-critic este mai mare ca t-0.05
atunci avem semnificaie statistic. Este acelai lucru cu p0.05.
n caz contrar dac p>0.05 sau t-calculat<t-critic atunci nu avem semnificaie statistic
deci H0 rmne valabil i eliminm ipoteza H1.
Pentru testul t avem 3 variante (formulele de calcul difer oferind astfel o precizie mai
bun):
1. Datele sunt perechi aceleai pacient de exemplu nainte i dup tratament
(volumul eantionului nainte trebuie s fie egal cu cel denumit dup).
2. Datele au variane egale (aceasta poate fi verificat cu testul F).
3. Formula standard nu se cunosc informaii suplimentare despre date.
Metoda de lucru este aceeai indiferent de tipul ipotezei comparm mediile sau
dispersiile datelor.
Exemple (Excel):

Compararea mediilor.
1 - Avem dou seturi de date nainte i dup tratament:

1
2
3
4
5
6
7
8
9
10

Glicemia tratament
nainte
dup
1.83
1.34
1.60
1.63
1.74
1.00
1.84
1.45
1.26
1.13
1.44
1.28
1.43
1.08
1.43
1.48
1.50
1.12
1.72
1.53

11
12
13
14
15
16
17
18
19
20
21
22
23

1.33
1.43
1.87
1.57
1.64
1.44
1.57
1.44
1.74
1.42
1.24
1.32
1.22

1.42
1.35
1.13
1.27
1.01
1.46
1.01
1.04
1.31
1.11
1.57
1.15
1.30

Alegem din Meniul DATA apoi DATA ANALYSES testul t corespunztor testul pentru
date perechi.

Page 2 of 5

n continuare definim opiunile pentru realizarea testului.

Se specific irurile de celule n


care se afl valorile nainte i
dup tratament.
Se specific irul de celule n
care se deoarece
afl valorile
Se bifeaz,
amprimei
selectat i
variabile
Glicemia
celula
cu numele
seriilorla femei.
Nu se bifeaz, deoarece irurile de
Se precizeaz
locul de
afiare a
valori au acelai
nume.
rezultatelor pe foaia de calcul
curent, pe o nou foaie de calcul sau
chiar ntr-un registru de calcul nou.
Se precizeaz locul de afiare a
rezultatelor pe foaia de calcul
curent, pe o nou foaie de calcul sau
chiar ntr-un registru de calcul nou.

Page 3 of 5

Interpretm rezultatul obinut.


t-Test: Paired Two Sample for Means
Mean
Variance
Observations
Pearson Correlation
Hypothesized Mean Difference
df
t Stat
P(T<=t) one-tail
t Critical one-tail
P(T<=t) two-tail
t Critical two-tail

nainte
1.523389088
0.038711492
23
-0.040121114
0
22
4.351833135
0.000127727
1.717144335
0.000255454
2.073873058

Dup
1.267697646
0.037625235
23

Interpretare:
1- Valoarea statisticii calculate este t Stat=4.3518 i este mai mare ca t Critical two-tail =
2.0738. Decidem c exist semnificaie statistic deci avem confirmarea statistic a
diferenelor gsite. Cu alte cuvinte valorile dup tratament sunt diferite de cele dinainte.
Dac citim valorile mediilor observm c valorile dup tratament sunt mai mici
comparativ cu cele dinaintea tratamentului.
2- Acelai lucru l obinem dac comparm valoarea P(T<=t) two-tail=0.00025 cu valoarea
prag 0.05. Deoarece este mai mic concluzionm la fel ca n analiza statisticii t c
exist semnificaie statistic diferene confirmate.
Deoarece acesta a fost scopul tratamentului s scad valoarea glicemiei concluzionm c
tratamentul este eficient.
Obs. atenie la alegerea tipului de test !
Una din variantele de test t consider varianele egale acest lucru trebuie verificat cu
testul F(Fisher).

Compararea varianelor testul Fisher


Pentru a putea decide ce variant de test t se folosete n situaia noastr, vom verifica mai
nti dac cele dou eantioane au varianele egale sau nu. Pentru aceasta, se va folosi un alt
test statistic, i anume testul F de egalitate a varianelor.
Acest test este relativ simplu ca structur; el calculeaz valorile medii i varianele pentru
cele dou eantioane luate n discuie i apoi determin raportul celor dou variane calculate,
notat cu F; dac F este foarte apropiat sau chiar egal cu 1, nseamn c varianele n cele
dou eantioane sunt egale, i cu ct F este mai mare cu att eantioanele sunt mai diferite
ntre ele n ceea ce privete acest parametru
Procedeul este asemntor testului t.
Se selecteaz comanda Data / Data Analysis / F-Test Two Sample for Variances:
Se completeaz cu datele (referinele) corespunztoare testului F.

Page 4 of 5

Fereastra de definire a testului Fisher


Rezultatele i interpretarea:

Sunt calculai urmtorii indicatori:


Media, variana i numrul de observaii pentru cele dou iruri de valori;
Valoarea statisticii calculate F = 1.0204;
P(F<=f) one-tail: probabilitatea de a se observa o valoare F = Fcalculat mai mic dect
F = Ftabel (atunci cnd Ftabel este un numr pozitiv) sau mai mare dect Ftabel (atunci
cnd Ftabel este un numr negativ), n ipoteza n care varianele variabilei Glicemie la
femei i brbai sunt egale (ca exemplu de calcul). Dac aceast probabilitate este mai
mic de 0.05 (5%), se poate considera c ipoteza de la care s-a pornit, c varianele
variabilei Glicemie la femei i brbai, sunt egale, este INFIRMAT, diferenele ntre
ele fiind semnificative statistic.
n cazul nostru P(F<=f) one-tail = 0.4669 > 0.05, deci ipoteza nul este
CONFIRMAT, VARIANELE SUNT EGALE.
-

Atenie prima variabil pentru testul F pentru lucru n Excel este variabila cu varian
mai mare !! astfel se respect regula F-calculat mai mare ca F-critic pentru a obine
semnificaie.
Din fiierul Excel corespunztor laboratorului realizai comparaiile statistice prin testele
t respectiv F.

Page 5 of 5

S-ar putea să vă placă și