Documente Academic
Documente Profesional
Documente Cultură
Teste statistice
Teme:
Compararea populaiilor prin mediile eantioanelor testul t sau Student.
Compararea varianelor populaiilor testul F (Fisher).
n cadrul testelor statistice se folosete noiunea de ipotez statistic.
Ipoteza statistic reprezint o presupunere asupra parametrilor uneia sau unor repartiii sau
chiar asupra repartiiei n sine (spre exemplu, egalitatea mediilor a dou populaii, a
dispersiilor, a proporiilor, verificarea formei normale a unei repartiii, etc.).
Testele statistice reprezint metode matematice de verificare a ipotezelor statistice. Prin
acestea se dorete examinarea unei ipoteze care apoi se aplic populaiei de date dac este
confirmat a fi adevrat. Testarea se face pe baza eantionului de date. Astfel, orice decizie
comport un anumit risc. Decizia se ia asupra ntregii populaii, deci constituirea eantionului
este de importan major.
n enunarea unei ipoteze exist dou posibiliti:
Ipoteza nul notat H0, n care parametrii de comparat se consider egali. Spre exemplu,
media populaiei 1 avnd date n eantionul 1 este egal cu media populaiei 2 caracterizat
de eantionul 2.
H0 :
1 2
Aceasta arat lipsa diferenelor parametrilor examinai sau a existenei unei relaii.
Ipoteza alternativ H1 sau HA n care se consider cei doi parametri diferii.
H1 :
1 2
Aceast ipotez este contrar ipotezei nule i arat existena diferenelor sau a relaiilor
posibile ntre parametri.
Variante de ipoteze Ipoteza nul
Ipoteza alternativ
Forma bilateral
H1 :
1 2
H0 :
1 2
Forma unilateral
H0 :
1 2
H1 :
1 2
H0 :
1 2
Obs. ipoteza nul conine totdeauna semnul =.
Forma unilateral
H1 :
1 2
Page 1 of 5
deduce valoarea p, care reprezint probabilitatea de a avea o eroare de tip I. Aceasta este o
integral n cadrul distribuiei de frecven determinate i reprezint semnificaia testului.
Dac p (nivelul de semnificaie) este mai mic sau egal cu 5% adic 0.05 atunci ipoteza H0
este eliminat n favoarea ipotezei H1 spunem c exist diferen semnificativ statistic.
Decidem c cele dou populaii difer semnificativ.
Acelai lucru se obine dac comparm valoarea statisticii t-calculat cu valoarea
corespunztoare pragului de 5% adic t-0.05 sau t-critic. Dac t-critic este mai mare ca t-0.05
atunci avem semnificaie statistic. Este acelai lucru cu p0.05.
n caz contrar dac p>0.05 sau t-calculat<t-critic atunci nu avem semnificaie statistic
deci H0 rmne valabil i eliminm ipoteza H1.
Pentru testul t avem 3 variante (formulele de calcul difer oferind astfel o precizie mai
bun):
1. Datele sunt perechi aceleai pacient de exemplu nainte i dup tratament
(volumul eantionului nainte trebuie s fie egal cu cel denumit dup).
2. Datele au variane egale (aceasta poate fi verificat cu testul F).
3. Formula standard nu se cunosc informaii suplimentare despre date.
Metoda de lucru este aceeai indiferent de tipul ipotezei comparm mediile sau
dispersiile datelor.
Exemple (Excel):
Compararea mediilor.
1 - Avem dou seturi de date nainte i dup tratament:
1
2
3
4
5
6
7
8
9
10
Glicemia tratament
nainte
dup
1.83
1.34
1.60
1.63
1.74
1.00
1.84
1.45
1.26
1.13
1.44
1.28
1.43
1.08
1.43
1.48
1.50
1.12
1.72
1.53
11
12
13
14
15
16
17
18
19
20
21
22
23
1.33
1.43
1.87
1.57
1.64
1.44
1.57
1.44
1.74
1.42
1.24
1.32
1.22
1.42
1.35
1.13
1.27
1.01
1.46
1.01
1.04
1.31
1.11
1.57
1.15
1.30
Alegem din Meniul DATA apoi DATA ANALYSES testul t corespunztor testul pentru
date perechi.
Page 2 of 5
Page 3 of 5
nainte
1.523389088
0.038711492
23
-0.040121114
0
22
4.351833135
0.000127727
1.717144335
0.000255454
2.073873058
Dup
1.267697646
0.037625235
23
Interpretare:
1- Valoarea statisticii calculate este t Stat=4.3518 i este mai mare ca t Critical two-tail =
2.0738. Decidem c exist semnificaie statistic deci avem confirmarea statistic a
diferenelor gsite. Cu alte cuvinte valorile dup tratament sunt diferite de cele dinainte.
Dac citim valorile mediilor observm c valorile dup tratament sunt mai mici
comparativ cu cele dinaintea tratamentului.
2- Acelai lucru l obinem dac comparm valoarea P(T<=t) two-tail=0.00025 cu valoarea
prag 0.05. Deoarece este mai mic concluzionm la fel ca n analiza statisticii t c
exist semnificaie statistic diferene confirmate.
Deoarece acesta a fost scopul tratamentului s scad valoarea glicemiei concluzionm c
tratamentul este eficient.
Obs. atenie la alegerea tipului de test !
Una din variantele de test t consider varianele egale acest lucru trebuie verificat cu
testul F(Fisher).
Page 4 of 5
Atenie prima variabil pentru testul F pentru lucru n Excel este variabila cu varian
mai mare !! astfel se respect regula F-calculat mai mare ca F-critic pentru a obine
semnificaie.
Din fiierul Excel corespunztor laboratorului realizai comparaiile statistice prin testele
t respectiv F.
Page 5 of 5