Sunteți pe pagina 1din 64

Inferen referitoare la medii

Metode de inferen pentru medii


Eantioane mari
O singur medie: Metoda normal (metoda z)
Date n perechi: Metoda normal (metoda z)
Dou eantioane: Metoda normal (metoda z)
Eantioane mici
O singur medie: Metoda t pentru un eantion
Date n perechi: Metoda t pentru eantioane perechi
Dou eantioane: Metoda t pentru dou eantioane
(metoda t pentru eantioane independente, metoda t
pentru dou grupuri)
Mai mult de dou eantioane
Analiza de varian unidirecional (ANOVA)
O singur medie, metoda pentru
eantioane mari
Idee: Interval de ncredere care folosete distribuia normal.
Metoda se poate folosi pentru orice eantion mare. Datele pot
s provin din orice distribuie.
Ex: Distribuia greutii la natere a copiilor n cazul a 1749
sarcini de tip singleton la mamele caucaziene din sudul Londrei.

1: Media = 3296.0 g
Abaterea standard = 563.2 g
Eroarea standard a mediei =
13.5 g = 1769 / 2 . 563
Greutatea la natere (g)
F
r
e
c
v
e
n

a

Brooke OG, Anderson HR, Bland JM, Peacock JL, Stewart
CM. (1989) Effects on birth weight of smoking, alcohol,
caffeine, socioeconomic factors, and psychosocial stress.
British Medical Journal, 298, 795-801.
O singur medie, metoda pentru
eantioane mari
2: Interval de ncredere (CI) care folosete distribuia normal.
Media = 3296.0 g, Abaterea standard (SD) = 563.2 g,
Eroarea standard a mediei = 13.5 g.
Eantioane mari media eantioanelor au distribuia normal
cu media = 3296.0 i SD = 13.5 (estimate din date).
3: 95% din observaii dintr-o
distribuie normal se afl n
intervalul 1.96 SD de o
parte i de alta a mediei.
95% CI:
Lim inf: 3296.0 - 1.96 13.5
Lim sup: 3296.0 + 1.96 13.5
adic (3270, 3322).

Greutatea la natere (g)
F
r
e
c
v
e
n

a

O singur medie, metoda pentru
eantioane mari
Presupuneri:
Observaiile sunt independente ntre ele. Nu
trebuie s avem, de exemplu, un grup de 100
observaii astfel ca pentru 10 subieci s avem cam
10 observaii pentru fiecare.
Eantionul trebuie s fie suficient de mare astfel
nct eroarea standard s poat fi bine
determinat. O regul empiric: ar trebui s fie 100
observaii pentru un grup
Date n perechi, metoda pentru
eantioane mari
Idee: Interval de ncredere (CI) pentru media diferenelor
bazat pe distribuia normal.
Ex: Modificrile strii de depresie cu ajutorul internetului
Au fost recrutai 525 indivizi cu simptome de depresie
indentificate ntr-un sondaj
Acestia au fost alocai aleatoriu la 3 site-uri web:
-BluePages care ofer informaii despre depresie (n = 166),
-MoodGYM care se refer la o terapie cognitiv
comportament (n = 182)
-un grup de control care folosete placebo (n = 178).
Christensen H, Griffiths KM, Jorm AF. (2004) Delivering interventions for depression by using the internet: randomised controlled
trial. British Medical Journal 328, 265-268.
Date n perechi, metoda pentru
eantioane mari
Scorul de baz n depresie i dup ase sptmni de tratament
pentru un grup de 525 pacieni cu depresie et al. (2004)






90 (17%) dintre subiecii nu au rspuns la chestionar i autorii au
presupus c scorurile lor au rmas neschimbate.
Aceasta nseamn c indiferent de distribuia iniial a scorurilor,
distribuia diferenelor trebuie s aib un vrf mare care apare
pentru un numr de cel puin 90 de observaii. Astfel nu putem
avea o distribuie normal!
Date n perechi, metoda pentru
eantioane mari
1: BluePages: 165 de subieci,
media diferenelor n scorurile depresiei = 3.9,
abaterea standard = 9.1.
2: Eroarea standard a mediei = 0.71
3: Intervalul de 95% ncredere pentru media diferenelor
este:
Lim inf: 3.9 - 1.96 x 0.71
Lim sup: 3.9 + 1.96 x 0.71
(2.5, 5.3) puncte pe scala depresiei.
Aceasta reprezint este estimarea pentru intervalul mediei
diferenelor pentru punctajele depresiei presupunnd c
rspunsul nonrespondenilor este acelai.
Date n perechi, metoda pentru
eantioane mari
BluePages: 165 de subieci,
media diferenelor n scorurile depresiei = 3.9,
abaterea standard = 9.1,
eroarea standard a mediei = 0.71
Idee: Test de semnificaie:
- Ipoteza nul: Media schimbrilor n populaie este 0.
- Ipoteza alternativ: Exist o schimbare (n orice direcie)
Eantioane mari media estimat urmeaz o distribuie
normal cu abarerea egal cu eroarea standard a mediei.
Diferena dintre media observat n eantionul i media
populaiei (aici 0) mprit prin eroarea standard va urma
distribuia normal standard (statistica testului).
Date n perechi, metoda pentru
eantioane mari
BluePages: 165 de subieci,
media diferenelor n scorurile depresiei = 3.9,
abaterea standard = 9.1,
eroarea standard a mediei = 0.71
Test de semnificaie:
- Ipoteza nul: Media schimbrilor n populaie este 0.
Dac ipoteza nul este adevrat atunci media observat n
eantionul mprit prin eroarea standard (statistica
testului) va urma distribuia normal standard.
z = 3.9/0.71 = 5.49.
p = 0.00000004 (vom scrie p <0.0001)
Atentie! 95%CI: (2.5, 5.3) 0 nu se afl n interval!
Aceasta este testul pentru eantioane mari de distribuie
normal pentru o singur medie, test cunoscut, de
asemenea, i sub denumirea de testul z pentru o singur
medie.
Date n perechi, metoda pentru
eantioane mari
Presupuneri:
Observaiile sunt independente. Trebuie s avem, de
exemplu, un grup de 100 observaii astfel ca pentru 10
subieci s avem cam 10 observaii pentru fiecare.
Eantionul este suficient de mare. Regula empiric
spune c trebuie cel puin 100 observaii pentru un grup.
Media i abaterea standard a diferenelor nu trebuie
s aib legtur cu dimensiunea variabilelor (efectul
dimensiunii eantionului).
Putem verifica ultima afirmaie printr-o reprezentare grafic
a diferenelor dintre dou msurtori pentru un subiect.
Aceasta va fi descris n detaliu mai trziu la testul t n
perechi.
Date independente, metoda
pentru eantioane mari






Idee: Intervalul de ncredere pentru diferena mediilor:
(BluePages MoodGYM)
Diferena = -0.3
Eroarea standard a diferenei = = 0.98
Observaie: Testul se aplic doar n cazul grupurilor
independente.
Intervalul de 95% ncredere pentru media diferenelor este:
Lim inf: -0.3 - 1.96 x 0.98
Lim sup: -0.3 + 1.96 x 0.98,
Adic (-2.2, +1.6) puncte pe scala depresiei.
2 2
67 . 0 71 . 0
Date independente, metoda
pentru eantioane mari





Idee: Ipoteza nul pentru testarea egalitatii mediilor
(BluePages versus MoodGYM).
Diferena = -0.3,
Eroarea standard a diferenei = = 0.98
Dac ipoteza nul este adevrat: diferena/eroarea standard
(statistica testului) va avea o distribuie normal standard.
Diferena/eroarea standard = -0.3/0.98=-0.31
Pentru distribuia normal p = 0.76.
Atentie! 95%CI: (-2.2, +1.6) 0 se afl n interval!
Acesta este testul z pentru eantioane mari idenpendente sau
testul z pentru dou medii.
2 2
67 . 0 71 . 0
Date independente, metoda
pentru eantioane mari






BluePages versus Control:
Diferena = 2.9,
Eroarea standard a diferenei = 0.95
95%CI: (1.0, 4.8) 0 nu se afl n interval!
Diferena/eroarea standard = 2.9/0.95=3.05
Pentru distribuia normal p = 0.002. (0.002 x 3 = 0.006!!)
MoodGYM versus Control:
Diferena = 3.2,
Eroarea standard a diferenei = 0.92
95%CI: (1.4, 5.0) 0 nu se afl n interval!
Diferena/eroarea standard = 3.2/0.92=3.48
Pentru distribuia normal p = 0.0005. (0.0005 x 3 = 0.0015 !!)

Date n perechi, metoda pentru
eantioane mari
Presupuneri:
Observaiile i grupurile sunt independente ntre ele.
Nu trebuie s existe legturi ntre observaiile dintre cele
dou grupuri, precum ar fi un studiu n care fiecare
subiect ntr-un grup este relaionat, de exemplu, prin
vrst i sex, cu un subiect din cellalt grup.
Eantioanele trebuie s suficient de mari pentru ca
erorile standard s fie bine estimate iar mediile trebuie
s aib o distribuie normal. Regula empiric spune c
pentru un singur eantion ar trebui s avem cel puin 100
de observaii iar pentru dou eantioane de cel puin 50
de observaii n fiecare.

Metoda t pentru eantioane mici
Ex: 9 pacieni cu rni cronice nevindecte (Shukla et al., 2004).
Biopsiile au fost evaluate folosind scorul obinut cu ajutorul
unui sistem care gradeaz angiogeneza microscopic (MAGS)
i care furnizeaz un indice care evalueaz ct de bine vasele
mici de snge sunt n curs de dezvoltare deci, prin urmare,
evalueaz regenerarea epitelial. Scorurile mari sunt cele mai
bune.
Cele nou observaiile au fost: 20, 31, 34, 39, 43, 45, 49, 51 i 63.
Media = 41.7,
Abaterea standard = 12.5,
Eroarea standard a mediei este de 4.2.
Shukla VK, Rasheed MA, Kumar M, Gupta SK, Pandey SS. (2004) A trial to determine the role of placental extract in the
treatment of chronic non-healing wounds. Journal of Wound Care 13, 177-9,
Metoda t pentru eantioane mici
Observaii: 20, 31, 34, 39, 43, 45, 49, 51 i 63.
Media = 41.7,
Abaterea standard = 12.5,
Eroarea standard a mediei este de 4.2.
Idee: Interval de 95% ncredere pentru medie!
Dac am fi avut eantioane mari se putea folosi formula:
media 1.96 eroarea , media + 1.96 eroarea
standard a mediei standard a mediei
Nu putem folosi metoda pentru eantioane mari bazat pe
distribuia normal deoarece eantionul este prea mic!
n acest caz eroarea standard nu este suficient de bine estimat!
Metoda t pentru eantioane mici
Observaii: 20, 31, 34, 39, 43, 45, 49, 51 i 63.
Media = 41.7,
Abaterea standard = 12.5,
Eroarea standard a mediei este de 4.2.
Idee: Interval de 95% ncredere pentru medie!
media 1.96 eroarea , media + 1.96 eroarea
standard a mediei standard a mediei
Vom folosi distribuia Student T.
Interval de 95% ncredere pentru medie:
media t
0.05
eroarea , media + t
0.05
eroarea
standard a mediei standard a mediei



Metoda t pentru eantioane mici
Observaii: 20, 31, 34, 39, 43, 45, 49, 51 i 63.
Media = 41.7,
Abaterea standard = 12.5,
Eroarea standard a mediei este de 4.2.
Idee: Interval de 95% ncredere pentru medie!
media t
0.05
eroarea , media + t
0.05
eroarea
standard a mediei standard a mediei
Ce este t
0.05
?
Aceasta este o valoare care provine din distribuia Student T,
definit ca fiind distribuia urmat de diferena dintre media
unui eantion i media populaiei mprit la eroarea standard,
cnd observaiile urmeaz o distribuie normal.
t
0.05
este valoarea critic pentru pragul de 5% bilateral al
distribuiei t cu un numr de grade de libertate egal cu nr de
observaii minus unu.

Distribuia Student t
Familia de distribuii t cu un parametru (numrul gradelor
de liberate):








Cu ct numrul gradelor de libertate crete cu att distribuia
t tinde s devin mai apropiat de distribuia normal
standard!


t
D
e
n
s
i
t
a
t
e

d
e


p
r
o
b
a
b
i
l
i
t
a
t
e

1 grad de libertate
t
D
e
n
s
i
t
a
t
e

d
e


p
r
o
b
a
b
i
l
i
t
a
t
e

4 grade de libertate
D
e
n
s
i
t
a
t
e

d
e


p
r
o
b
a
b
i
l
i
t
a
t
e

D
e
n
s
i
t
a
t
e

d
e


p
r
o
b
a
b
i
l
i
t
a
t
e

t
t
20 grade de libertate
Distribuia normal standard
Valori critice pentru distribuia
normal
Teste unilaterale Teste bilaterale
Valoarea critic pentru pragul de 5%
pentru distribuia t cu 4 grade de libertate

D
e
n
s
i
t
a
t
e

d
e

p
r
o
b
a
b
i
l
i
t
a
t
e

t cu 4 grade de libertate
Regiune de acceptare
H
0
adevrat
Valori critice pentru distribuia t


Metoda t pentru eantioane mici
Observaii: 20, 31, 34, 39, 43, 45, 49, 51 i 63.
Media = 41.7,
Abaterea standard = 12.5,
Eroarea standard a mediei este de 4.2.
Idee: Interval de 95% ncredere pentru medie!
media t
0.05
eroarea , media + t
0.05
eroarea
standard a mediei standard a mediei
Ce este t
0.05
?
t
0.05
este valoarea critic pentru pragul de 5% bilateral al distribuiei
t cu un numr de grade de libertate egal cu nr de observaii minus
unu.
Acestea sunt gradele de libertate folosite i la calculul varianei
(dispersiei) eantionului.
Avem 9 observaii astfel 9 1 = 8 grade de libertate.

Valori critice pentru distribuia t


Metoda t pentru eantioane mici
Observaii: 20, 31, 34, 39, 43, 45, 49, 51 i 63.
Media = 41.7,
Abaterea standard = 12.5,
Eroarea standard a mediei este de 4.2.
Idee: Interval de 95% ncredere pentru medie!
media t
0.05
eroarea , media + t
0.05
eroarea
standard a mediei standard a mediei
t
0.05
= 2.31.
Interval de 95% ncredere pentru medie:
(41.7 2.31 4.2, 41.7 + 2.31 4.2)=
= (32.0, 51.4) uniti MAGS

Metoda t pentru eantioane mici
Presupuneri:

Observaiile i grupurile sunt independente ntre ele

Observaiile provin dintr-o distribuie normal
Metoda t pentru eantioane mici
Presupunere: Observaiile provin dintr-o distribuie
normal
Dificil de verificat cu ajutorul unei histograme pentru un eantion
mic:







Se poate verifica presupunerea referitoare la normalitate cu
ajutorul unei reprezentri grafice a normalitii.
F
r
e
c
v
e
n

a

Scoruri MAGS nainte de tratament
Reprezentarea grafic a
normalitii
Construcie:
1. Se ordoneaz observaiile:
20, 31, 34, 39, 43, 45, 49, 51 i 63.
Care va fi prima observaie ntr-un eantion normal distribuit
cu 9 observaii?
Valoarea medie pentru cea mai mic observaie ntr-un
eantion cu 9 observaii extras ditr-o distribuie normal
standard este -1.28.
2. Estimm cea de-a doua observaie, cea de-a treia, a patra
etc ca fiind:
-1.28, -0.84, -0.52, -0.25, 0.00, 0.25, 0.52, 0.84, 1.28
Reprezentarea grafic a
normalitii
Observaiile ordonate:
20, 31, 34, 39, 43, 45, 49, 51 i 63.
2: Valorile medii pentru prima observaie, cea de-a doua
observaie, cea de-a treia, a patra etc dintr-un eantion cu 9
observaii extras dintr-o distribuie normal standard:
-1.28, -0.84, -0.52, -0.25, 0.00, 0.25, 0.52, 0.84, 1.28
3: Pentru un eantion extras dintr-o distribuie normal cu
media i abaterea standard precum MAGS, vom multiplica
cu abaterea standard = 12.5 i vom aduna cu media 41.7:
25.6, 31.1, 35.1, 38.5, 41.7, 44.8, 48.2, 52.2, 57.7

Reprezentarea grafic a
normalitii
MAGS: 20, 31, 34, 39, 43, 45, 49, 51, 63.
Normala: 25.6, 31.1, 35.1, 38.5, 41.7, 44.8, 48.2, 52.2, 57.7
4: Dac vom face reprezentarea grafic a normalitii pentru
datele MAGS n raport cu valorile normale va trebui s ca
cele mai multe dintre observaii s fie aproape de linie, dac
scorurile MAGS urmeaz o distribuie normal.

S
c
o
r
u
r
i

M
A
G
S

Normala invers
Diagram de
corelaie -
scatter
Linie de
egalitate
Reprezentarea grafic a
normalitii
Distribuiile asimetrice produc n jurul liniei de egalitate o
curb sau o ncovoiere.

C
o
l
e
s
t
e
r
o
l

s
e
r
i
c

(
m
m
o
l
/
L
)

Normala invers Colesterol (mmol/L)
F
r
e
c
v
e
n

a

Distribuie
pozitiv
asimetric
sau
asimetric la
dreapta!
Form
convex!

ine ap
Reprezentarea grafic a
normalitii
Distribuiile asimetrice produc n jurul liniei de egalitate o
curb sau o ncovoiere.
Pt greutatea la natere (toate valorile):

G
r
e
u
t
a
t
e
a

l
a

n
a

t
e
r
e

(
g
)

Normala invers
Greutatea la natere (g)
F
r
e
c
v
e
n

a

Distribuie
negativ
asimetric
sau
asimetric la
stnga!
Form
concav!

nu ine ap
Reprezentarea grafic a
normalitii
Distribuiile asimetrice produc n jurul liniei de egalitate o
curb sau o ncovoiere.
Pt greutatea la natere (la termen):

G
r
e
u
t
a
t
e
a

l
a

n
a

t
e
r
e

(
g
)

Normala invers
Greutatea la natere (g)
F
r
e
c
v
e
n

a

Distribuie
aproximativ
simetric
Linie
dreapt!
Reprezentarea grafic a
normalitii
Exist mai multe modaliti de obinere a reprezentrilor grafice
pentru normalitate:
-Unele programe, precum SPSS, pun valorile calculate pe baza
distribuiei normale pe axa vertical iar datele observate pe axa
orizontal. Astfel o curb de tip nu ine ap (concav) indic o
asimetrie pozitiv iar o curba de tip ine ap (convex) o
asimetrie negativ.
- Alte programe folosesc valorile distribuiei normale standard ca
valori calculate n locul celor pentru o distribuie normal cu
aceeai medie i abatere standard ca i cele calculate pentru
datele observate, caz n care linia dreapt depinde de medie i
abatere standard, deci nu avem o linia de egalitate.
-Mai exist i cazul n care se ofer o reprezentare grafic a
valorilor probabilitii pentru distribuia normal i nu o
reprezentare grafic a cuantilelor pentru distribuia normal, ns
acestea arat similar i sunt interpretate n acelai mod.
Teste de semnificaie: Shapiro-Wilk, Shapiro-Francia, Kolmogorov-Smirnov
Metoda t pentru eantioane
perechi
Scorurile MAGS nainte i dup tratamentul local cu extract de
placent la pacienii cu rni nevindecate (Shukla et al., 2004)












media diferenelor= 9.33,
abaterea standard = 4.03,
eroarea standard a mediei = 1.34
Metoda t pentru eantioane
perechi
Pentru eantioane mici, va trebui s presupunem c
diferenele urmeaz o distribuie normal.
Intervalul de 95% ncredere:
media t
0.05
eroarea , media + t
0.05
eroarea
standard a mediei standard a mediei
t
0.05
este valoarea critic pentru pragul de 5% bilateral al
distribuiei t cu un numr de grade de libertate egal cu nr de
observaii minus unu.
Idee: Testul de semnificaie se refer la
media_diferenelor/eroarea_standard (statistica testului)
care urmeaz o distribuie t cu un numr de grade de
libertate egal cu numrul de observaii minus 1.
Metoda t pentru eantioane
perechi
Ex: Creterea scorului MAGS
Media diferenelor = 9.33,
SE = 1.34 litri/min
9 diferene, deci 9 1 = 8 grade de libertate.
Valori critice pentru distribuia t


Metoda t pentru eantioane
perechi
Ex: Creterea scorului MAGS
Media diferenelor = 9.33,
SE = 1.34 litri/min
9 diferene, deci 9 1 = 8 grade de libertate.
Din randul cu 8 grade de libertate (d.f) se obine valoarea
t
0.05
= 2.31.
Idee: Intervalul de 95% ncredere:
(9.33 2.31 1.34, 9.33 + 2.31 1.34)=
=(6.2, 12.4)
Idee: Test de semnificaie:
Media/SE = 9.33/1.34 = 6.96
Metoda t pentru eantioane
perechi
Ex: Creterea scorului MAGS
Media diferenelor = 9.33,
SE = 1.34 litri/min
9 diferene, deci 9 1 = 8 grade de libertate.
Din randul cu 8 grade de libertate (d.f) se obine valoarea
t
0.05
= 2.31.
Idee: Intervalul de 95% ncredere:
(9.33 2.31 1.34, 9.33 + 2.31 1.34)=
=(6.2, 12.4)
Idee: Test de semnificaie:
Media/SE = 9.33/1.34 = 6.96
Din tabelul t, p<0.001. Dintr-un program de analiz statistic
p = 0.0001.
Metoda t pentru eantioane
perechi
Presupuneri:
Observaiile sunt independente ntre ele.
Diferenele urmeaz o distribuie normal
Media i abaterea standard a diferenelor este
constant, adic nu este legat de dimensiunea
variabilei
Metoda t pentru eantioane
perechi
Verificarea presupunerilor pentru metoda t pentru
eantioane perechi:
Diferenele urmeaz o distribuie normal (Verificarea
histogramei i a reprezentrii grafice a normalitii)
D
i
f
e
r
e
n

n

s
c
o
r
u
r
i
l
e

M
A
G
S
,

(
d
u
p


m
i
n
u
s

n
a
i
n
t
e
)

Normala invers
Metoda t pentru eantioane
perechi
Verificarea presupunerilor pentru metoda t pentru
eantioane perechi:
Diferenele urmeaz o distribuie normal (Verificarea
histogramei i a reprezentrii grafice a normalitii)
Media i abaterea standard
a diferenelor este
constant, adic nu este
legat de dimensiunea
variabilei (verificarea
reprezentrii grafice a
diferenelor n raport cu
mediile)
D
i
f
e
r
e
n

n

s
c
o
r
u
r
i
l
e

M
A
G
S
,

(
d
u
p


m
i
n
u
s

n
a
i
n
t
e
)

Mediile scorurilor MAGS
Metoda t pentru eantioane
perechi
Abateri de la presupuneri:
Diferenele urmeaz o distribuie normal
Sunt necesare cel puin 100 de observaii pentru a
ignora normalitatea. Totui, diferenele tind s aib o
distribuie simetric astfel c aceast presupunere este
ndeplinit cu uurin.
Media i abaterea standard a diferenelor este
constant, adic nu este legat de dimensiunea
variabilei.
De obicei se aplic transformri.

Metoda t pentru dou eantioane
Aceasta este cunoscut i sub numele de: metoda t pentru
eantioane neperechi, testul t nepereche, metoda t pentru
dou grupuri sau testul Student t pentru dou eantioane.
Ex: Densitatea capilar (msurat pe mm
2
) pentru dou grupuri
de pacieni: un grup de pacienii cu ulcer diabetic la picior i un
grup de control fr ulcer (Marc Lamah)

Metoda t pentru dou eantioane
Nu se poate folosi metoda pentru eantioane mari bazat pe
distribuia normal deoarece eantioanele sunt prea mici!
Eroarea standard nu poate fi subicient de bine estimat!
Distribuia erorilor standard estimate depinde de distribuia
observaiilor.
Pentru metoda t pentru dou eantioane independente vom
face urmtoarele presupuneri :
observaiile din grupuri provin din distribuii normale,
distribuii celor dou populaii din care au fost extrase
eantioanele au aceeai varian. (Atenie! Populaiile i
nu eantioanele extrase din ele au aceeai varian.)


Metoda t pentru dou eantioane
n cazul n care distribuiile celor dou populaii au aceeai
varian avem nevoie doar de o estimare a varianei. Noi numim
aceast estimare varian comun sau grupat (amestecat).
Gradele de libertate necesare pentru aceast estimare a
varianei comune sunt egale cu numrul de observaii minus 2.
Vom utiliza aceast estimare comune pentru varian pentru a
estima eroarea standard a diferenei dintre medii.
Ex: Densitatea capilar
Variana comun = 53.31,
SD = 7.30 capilare/mm
2
,
df = 19 + 23 - 2 = 40
SE pentru diferen = 2.26 capilare/mm
2

Diferena = 34.08 22.59 = 11.49capilare/mm
2

(control ulcer)
Metoda t pentru dou eantioane
Ex: Densitatea capilar
Variana comun = 53.31,
SD = 7.30 capilare/mm
2
,
df = 19 + 23 - 2 = 40
SE pentru diferen = 2.26 capilare/mm
2

Diferena = 34.08 22.59 = 11.49capilare/mm
2

(control ulcer)
Intervalul de 95% ncredere pentru diferen:
(11.49 - ? 2.26, 11.49 + ? 2.26)
? nu provine din distribuia normal ci din distribuia t cu 40
grade de libertate
Valori critice pentru distribuia t


Metoda t pentru dou eantioane
Ex: Densitatea capilar
Variana comun = 53.31,
SD = 7.30 capilare/mm
2
,
df = 19 + 23 - 2 = 40
SE pentru diferen = 2.26 capilare/mm
2

Diferena = 34.08 22.59 = 11.49capilare/mm
2

(control ulcer)
Intervalul de 95% ncredere pentru diferen:
(11.49 - ? 2.26, 11.49 + ? 2.26)
? nu provine din distribuia normal ci din distribuia t cu 40
grade de libertate
(11.49 2.02 2.26, 11.49 + 2.02 2.26) =
= (6.29, 16.07) capilare/mm
2


Metoda t pentru dou eantioane
Ex: Densitatea capilar
Variana comun = 53.31,
SD = 7.30 capilare/mm
2
,
df = 19 + 23 - 2 = 40
SE pentru diferen = 2.26 capilare/mm
2

Diferena = 34.08 22.59 = 11.49capilare/mm
2

(control ulcer)
Testul de semnificaie:
ipoteza nul stabilete c n populaie diferena ntre medii = 0:
(diferena 0)/SE = 11.49/2.26 = 5.08
Dac ipoteza nul este adevrat atunci acest raport urmeaz o
distribuie t cu 40 grade de libertate.
Metoda t pentru dou eantioane
Ex: Densitatea capilar
Testul de semnificaie:
ipoteza nul stabilete c n populaie diferena ntre medii = 0:
(diferena 0)/SE = 11.49/2.26 = 5.08
Dac ipoteza nul este adevrat atunci acest raport urmeaz o
distribuie t cu 40 grade de libertate.

Din tabel, probabilitatea observrii unei astfel de valori
extreme este mai mic de 0.001.
Folosind un program de analiz statistic se afiseaz valoarea
p = 0.0000, ceea ce nseamn c p<0.0001.
Metoda t pentru dou eantioane
Presupuneri:
Observaiile sunt independente ntre ele.
Distribuia densitii capilare este o distribuie
normal pentru fiecare populaie.
Varianele sunt aceleai n fiecare populaie.
Metoda t pentru dou eantioane
Presupuneri:
Distribuia densitii capilare este o distribuie
normal pentru fiecare populaie.
Varianele sunt aceleai n fiecare populaie.
Problem:
Observaiile nu
sunt suficiente
pentru a trage
vreo concluzie!
Densitatea capilarelor
F
r
e
c
v
e
n

a

F
r
e
c
v
e
n

a

Densitatea capilarelor
Control Ulcere
Metoda t pentru dou eantioane
Presupuneri:
Distribuia densitii capilare este o distribuie
normal pentru fiecare populaie.
Varianele sunt aceleai n fiecare populaie.

Soluie:
Vom combina cele dou grafice
scznd media grupului din fiecare
observaie pentru a obine
reziduurile.
Reziduurile au media = 0.
Reprezentarea grafic pare destul de
simetric ns tot avem prea puine
observaii. O alt soluie (mai bun)
ar fi s ntocmeasc o reprezentare
grafic a normalitii pentru reziduuri.
Reziduuri
F
r
e
c
v
e
n

a

Metoda t pentru dou eantioane
Ex: Densitatea capilar











Distribuia pare apropiat de cea normal.
Reziduuri
F
r
e
c
v
e
n

a

Normala invers
R
e
z
i
d
u
u
r
i

Metoda t pentru dou eantioane
Presupuneri:
Distribuia densitii capilare este o distribuie
normal pentru fiecare populaie.
Varianele sunt aceleai n fiecare populaie.

Ex: Densitatea capilar
Control Pacieni cu ulcer




Abaterile standard sunt similare.
Testarea egalitii varianelor: Testul F, testul Levene, testul
Bartlett etc!
Metoda t pentru dou eantioane
Presupuneri:
Distribuia densitii capilare este o distribuie
normal pentru fiecare populaie.
Varianele sunt aceleai n fiecare populaie.
D
e
n
s
i
t
a
t
e
a

c
a
p
i
l
a
r
e
l
o
r

Control Ulcere
Grup de pacieni
Metoda t pentru dou eantioane
Efectele nendeplinirii presupunerilor:
1. Metodele care folosesc distribuia t depind de ndeplinirea
anumitor condiii (presupuneri) referitoare la distribuia din
care provin datele.
n general, pentru dou eantioane de dimensiuni egale,
metoda t este foarte rezistent la abaterile de la
normalitate, ns pe msur ce eantioanele devin mai puin
egale ca mrime, aproximarea devine i ea mai puin bun.
Acesta este probabil un efect al asimetriei care duce la
pierderea puterii.
Valorile p devin astfel prea mari iar intervale de ncredere
prea largi.
Asimetria se poate, de obicei, corecta cu ajutorul unei
transformri!

Metoda t pentru dou eantioane
Efectele nendeplinirii presupunerilor:
2. Dac nu putem presupune o varian uniform, efectul,
de obicei, este mic dac cele dou populaii urmeaz o
distribuie normal.
Varianele inegale sunt adesea asociate cu asimetrii ale
datelor, caz n care, este necesar o transformare pentru a
corecta acest defect care de cele mai multe ori tinde, de
asemenea, s corecteze i alte.
Dac distribuiile sunt normale, putem folosi corecia
Satterthwaite a gradelor de libertate adesea numit i
metoda t pentru dou eantioane (grupuri) cu variane
inegale sau necomune.
Metoda t pentru dou eantioane
Variane inegale: corecia Satterthwaite pentru gradele de
libertate.
n cazul n care varianele sunt inegale, nu se poate face o
estimaie a varianei comune.
Vom folosi, n schimb, un model care se aplic eantioanelor
mari pentru a calcula eroarea standard a diferenei dintre
medii. Vom nlocui valoarea t pentru intervale de ncredere
i de testele de semnificaie cu un alt t cu mai puine grade
de libertate.
Gradele de libertate Satterthwaite depind de dimensiunile
relative ale varianelor. Variane mari domin i n cazul n
care una dintre ele este mult mai mare dect cealalt, doar
gradele de libertate pentru acel grup sunt luate n
considerare ca fiind gradele de libertate.
Metoda t pentru dou eantioane
Variane inegale: corecia Satterthwaite pentru gradele
de libertate.
Ex: Densitatea capilar
Grade de libertate: 40 (= 19 + 23 2)
Grade de libertate Satterthwaite: 38.56.
Rotunjim valoarea la 38 pentru a folosi tabelul t.
Variane egale: 95% CI = (6.92, 16.07), p<0.0001.
Variane inegale: 95% CI = (6.91, 16.07), p<0.0001.
Observaie: Metoda Satterthwaite este o aproximare
folosit n condiii neobinuite. Metoda varianelor egale
este testul standard t.
Mai mult de dou eantioane
Analiza de varian unidirecional (ANOVA).
Presupunerile sunt la fel ca n cazul testului t pentru
dou eantioane indiferent de dimensiunea
eantionului.