Sunteți pe pagina 1din 64

Inferen referitoare la medii

Metode de inferen pentru medii


Eantioane mari
O singur medie: Metoda normal (metoda z)
Date n perechi: Metoda normal (metoda z)
Dou eantioane: Metoda normal (metoda z)
Eantioane mici
O singur medie: Metoda t pentru un eantion
Date n perechi: Metoda t pentru eantioane perechi
Dou eantioane: Metoda t pentru dou eantioane
(metoda t pentru eantioane independente, metoda t
pentru dou grupuri)
Mai mult de dou eantioane
Analiza de varian unidirecional (ANOVA)
O singur medie, metoda pentru
eantioane mari
Idee: Interval de ncredere care folosete distribuia normal.
Metoda se poate folosi pentru orice eantion mare. Datele pot
s provin din orice distribuie.
Ex: Distribuia greutii la natere a copiilor n cazul a 1769
sarcini de tip singleton la mamele caucaziene din sudul Londrei.

1: Media = 3296.0 g
Abaterea standard = 563.2 g
Frecvena

Eroarea standard a mediei =


13.5 g = 563.2 / 1769

Brooke OG, Anderson HR, Bland JM, Peacock JL, Stewart


CM. (1989) Effects on birth weight of smoking, alcohol,
caffeine, socioeconomic factors, and psychosocial stress.
British Medical Journal, 298, 795-801.
Greutatea la natere (g)
O singur medie, metoda pentru
eantioane mari
2: Interval de ncredere (CI) care folosete distribuia normal.
Media = 3296.0 g, Abaterea standard (SD) = 563.2 g,
Eroarea standard a mediei (ES) = 13.5 g.
Eantioane mari (th. Limita Centrala) media eantioanelor are o
distribuie normal cu media = 3296.0 i SD = 13.5 (estimate din date).

3: 95% din observaii dintr-o


distribuie normal se afl n
intervalul 1.96 SD de o parte i
Frecvena

de alta a mediei.
95% CI:
Lim inf: 3296.0 - 1.96 13.5
Lim sup: 3296.0 + 1.96 13.5
adic (3270, 3322).

Greutatea la natere (g)


O singur medie, metoda pentru
eantioane mari
Presupuneri:
Observaiile sunt independente ntre ele. Nu
trebuie s avem, de exemplu, un grup de 100
observaii astfel ca pentru 10 subieci s avem cam
10 observaii pentru fiecare.
Eantionul trebuie s fie suficient de mare astfel
nct eroarea standard s poat fi bine
determinat. O regul empiric: ar trebui s fie 100
observaii pentru un grup
Date n perechi, metoda pentru
eantioane mari
Idee: Interval de ncredere (CI) pentru media diferenelor
bazat pe distribuia normal.
Ex: Modificrile strii de depresie cu ajutorul internetului.
Au fost recrutai 525 indivizi cu simptome de depresie
indentificate ntr-un sondaj.
Acestia au fost alocai aleatoriu la 3 site-uri web:
-BluePages (site) care ofer informaii despre depresie
(n = 166),
-MoodGYM care se refer la o terapie cognitiv
comportament (n = 182)
-un grup de control care folosete placebo (n = 178).
Christensen H, Griffiths KM, Jorm AF. (2004) Delivering interventions for depression by using the internet: randomised controlled
trial. British Medical Journal 328, 265-268.
Date n perechi, metoda pentru
eantioane mari
Scorul de baz n depresie i dup ase sptmni de tratament
pentru cei 525 pacieni cu depresie (Christensen et al. (2004))

90 (17%) dintre subiecii nu au rspuns la chestionar i autorii au


presupus c scorurile lor au rmas neschimbate.
Aceasta nseamn c indiferent de distribuia iniial a scorurilor,
distribuia diferenelor trebuie s aib un vrf mare care apare
pentru un numr de cel puin 90 de observaii. Astfel nu putem
avea o distribuie normal!
Date n perechi, metoda pentru
eantioane mari
1: BluePages: 165 de subieci,
media diferenelor n scorurile depresiei = 3.9,
abaterea standard = 9.1.
2: Eroarea standard a mediei = 0.71
3: Intervalul de 95% ncredere pentru media diferenelor
este:
Lim inf: 3.9 - 1.96 x 0.71
Lim sup: 3.9 + 1.96 x 0.71
(2.5, 5.3) puncte pe scala depresiei.
Aceasta reprezint o estimaie de tip interval pentru media
diferenelor ntre punctajele depresiei presupunnd c
rspunsul nonrespondenilor este acelai.
Date n perechi, metoda pentru
eantioane mari
BluePages: 165 de subieci,
media diferenelor n scorurile depresiei = 3.9,
abaterea standard = 9.1,
eroarea standard a mediei = 0.71
Idee: Test de semnificaie:
- Ipoteza nul: Media schimbrilor n populaie este 0
(Tratamentul nu are efect!).
- Ipoteza alternativ: Exist o schimbare (n orice direcie).
Eantioane mari (th. Limita Centrala) media estimat urmeaz o
distribuie normal cu abarerea egal cu eroarea standard a mediei.
Diferena dintre media observat n eantion i media populaiei (aici
0) mprit prin eroarea standard (statistica testului) va urma
distribuia normal standard.
Date n perechi, metoda pentru
eantioane mari
BluePages: 165 de subieci,
media diferenelor n scorurile depresiei = 3.9,
abaterea standard = 9.1,
eroarea standard a mediei = 0.71
Test de semnificaie:
- Ipoteza nul: Media schimbrilor n populaie este 0.
Dac ipoteza nul este adevrat atunci media observat n
eantionul mprit prin eroarea standard va urma
distribuia normal standard.
z = 3.9/0.71 = 5.49.
p = 0.00000004 (vom scrie p <0.0001)
Atentie! 95%CI: (2.5, 5.3) 0 nu se afl n interval!
Aceasta este testul pentru eantioane mari de distribuie
normal pentru o singur medie, test cunoscut, de
asemenea, i sub denumirea de testul z pentru o singur
medie.
Date n perechi, metoda pentru
eantioane mari
Presupuneri:
Diferentele sunt independente .
Eantionul (de diferente) este suficient de mare.
Regula empiric spune c trebuie cel puin 100
observaii pentru un grup.
Media i abaterea standard a diferenelor nu
trebuie s aib legtur cu dimensiunea variabilelor
(efectul dimensiunii eantionului).
Putem verifica ultima afirmaie printr-o reprezentare grafic
(diagrama de corelaie) a diferenelor i mediei celor dou
msurtori.
Aceasta va fi descris n detaliu mai trziu la testul t n perechi.
Date independente, metoda
pentru eantioane mari

Idee: Intervalul de ncredere pentru diferena mediilor:


(BluePages MoodGYM)
Diferena = -0.3 (4.2-3.9)
Eroarea standard a diferenei = 0.712 0.672= 0.98
Observaie: Testul se aplic doar n cazul grupurilor
independente.
Intervalul de 95% ncredere pentru media diferenelor este:
Lim inf: -0.3 - 1.96 x 0.98
Lim sup: -0.3 + 1.96 x 0.98,
Adic (-2.2, +1.6) puncte pe scala depresiei.
Date independente, metoda
pentru eantioane mari

Idee: Ipoteza nul pentru testarea egalitatii mediilor


(BluePages versus MoodGYM).
Diferena = -0.3,
Eroarea standard a diferenei = 0.712 0.672 = 0.98
Dac ipoteza nul este adevrat: diferena/eroarea standard
(statistica testului) va avea o distribuie normal standard.
Diferena/eroarea standard = -0.3/0.98=-0.31
Pentru distribuia normal p = 0.76.
Atentie! 95%CI: (-2.2, +1.6) 0 se afl n interval!
Acesta este testul z pentru eantioane mari independente sau
testul z pentru dou medii.
Date independente, metoda
pentru eantioane mari

BluePages versus Control:


Diferena = 2.9,
Eroarea standard a diferenei = 0.95
95%CI: (1.0, 4.8) 0 nu se afl n interval!
Diferena/eroarea standard = 2.9/0.95=3.05
Pentru distribuia normal p = 0.002. (0.002 x 3 = 0.006!!)
MoodGYM versus Control:
Diferena = 3.2,
Eroarea standard a diferenei = 0.92
95%CI: (1.4, 5.0) 0 nu se afl n interval!
Diferena/eroarea standard = 3.2/0.92=3.48
Pentru distribuia normal p = 0.0005. (0.0005 x 3 = 0.0015 !!)
Date independente, metoda
pentru eantioane mari
Presupuneri:
Observaiile i grupurile sunt independente ntre ele.
Nu trebuie s existe legturi ntre observaiile dintre cele
dou grupuri, precum ar fi un studiu n care fiecare
subiect ntr-un grup este relaionat, de exemplu, prin
vrst i sex, cu un subiect din cellalt grup.
Eantioanele trebuie s suficient de mari pentru ca
erorile standard s fie bine estimate iar mediile trebuie
s aib o distribuie normal. Regula empiric spune c
pentru un singur eantion ar trebui s avem cel puin 100
de observaii iar pentru dou eantioane de cel puin 50
de observaii n fiecare.
Metoda t pentru eantioane mici
Ex: 9 pacieni cu rni cronice nevindecte (Shukla et al., 2004).
Biopsiile au fost evaluate folosind scorul obinut cu ajutorul
unui sistem care gradeaz angiogeneza microscopic (MAGS)
i care furnizeaz un indice care evalueaz ct de bine vasele
mici de snge sunt n curs de dezvoltare deci, prin urmare,
evalueaz regenerarea epitelial. Scorurile mari sunt cele mai
bune.
Cele nou observaiile au fost: 20, 31, 34, 39, 43, 45, 49, 51 i 63.
Media = 41.7,
Abaterea standard = 12.5,
Eroarea standard a mediei este de 4.2.
Shukla VK, Rasheed MA, Kumar M, Gupta SK, Pandey SS. (2004) A trial to determine the role of placental extract in the
treatment of chronic non-healing wounds. Journal of Wound Care 13, 177-9,
Metoda t pentru eantioane mici
Observaii: 20, 31, 34, 39, 43, 45, 49, 51 i 63.
Media = 41.7,
Abaterea standard = 12.5,
Eroarea standard a mediei este de 4.2.
Idee: Interval de 95% ncredere pentru medie!
Dac am fi avut eantioane mari se putea folosi formula:
media 1.96 eroarea , media + 1.96 eroarea
standard a mediei standard a mediei
Nu putem folosi metoda pentru eantioane mari bazat pe
distribuia normal deoarece eantionul este prea mic!
n acest caz eroarea standard nu este suficient de bine estimat!
Metoda t pentru eantioane mici
Observaii: 20, 31, 34, 39, 43, 45, 49, 51 i 63.
Media = 41.7,
Abaterea standard = 12.5,
Eroarea standard a mediei este de 4.2.
Idee: Interval de 95% ncredere pentru medie!
media 1.96 eroarea , media + 1.96 eroarea
standard a mediei standard a mediei
Vom folosi distribuia Student T.
Interval de 95% ncredere pentru medie:
media t0.05 eroarea , media + t0.05 eroarea
standard a mediei standard a mediei
Metoda t pentru eantioane mici
Observaii: 20, 31, 34, 39, 43, 45, 49, 51 i 63.
Media = 41.7,
Abaterea standard = 12.5,
Eroarea standard a mediei este de 4.2.
Idee: Interval de 95% ncredere pentru medie!
media t0.05 eroarea , media + t0.05 eroarea
standard a mediei standard a mediei
Ce este t0.05?
Aceasta este o valoare care provine din distribuia Student T,
definit ca fiind distribuia urmat de diferena dintre media
unui eantion i media populaiei mprit la eroarea standard,
cnd observaiile urmeaz o distribuie normal.
t0.05 este valoarea critic pentru pragul de 5% bilateral al
distribuiei t cu un numr de grade de libertate egal cu nr de
observaii minus unu.
Distribuia Student t
Familia de distribuii t (Student) cu un parametru (numrul
gradelor de libertate):
1 grad de libertate 4 grade de libertate

probabilitate
Densitate de
probabilitate
Densitate de

t t
20 grade de libertate Distribuia normal standard
probabilitate

probabilitate
Densitate de

Densitate de

t t
Cu ct numrul gradelor de libertate crete cu att distribuia
t tinde s devin mai apropiat de distribuia normal
standard!
Valori critice pentru distribuia
normal
Teste unilaterale Teste bilaterale
Valoarea critic pentru pragul de 5%
pentru distribuia t cu 4 grade de libertate
Densitate de probabilitate

H0
adevrat

Regiune de acceptare

t cu 4 grade de libertate
Valori critice pentru distribuia t
Metoda t pentru eantioane mici
Observaii: 20, 31, 34, 39, 43, 45, 49, 51 i 63.
Media = 41.7,
Abaterea standard = 12.5,
Eroarea standard a mediei este de 4.2.
Idee: Interval de 95% ncredere pentru medie!
media t0.05 eroarea , media + t0.05 eroarea
standard a mediei standard a mediei
Ce este t0.05?
t0.05 este valoarea critic pentru pragul de 5% (caz bilateral) al
distribuiei t cu un numr de grade de libertate egal cu nr de
observaii minus unu.
Acestea sunt gradele de libertate folosite i la calculul varianei
(dispersiei) eantionului.
Avem 9 observaii astfel 9 1 = 8 grade de libertate.
Valori critice pentru distribuia t
Metoda t pentru eantioane mici
Observaii: 20, 31, 34, 39, 43, 45, 49, 51 i 63.
Media = 41.7,
Abaterea standard = 12.5,
Eroarea standard a mediei este de 4.2.
Idee: Interval de 95% ncredere pentru medie!
media t0.05 eroarea , media + t0.05 eroarea
standard a mediei standard a mediei
t0.05 = 2.31.
Interval de 95% ncredere pentru medie:
(41.7 2.31 4.2, 41.7 + 2.31 4.2)=
= (32.0, 51.4) uniti MAGS
Metoda t pentru eantioane mici
Presupuneri:

Observaiile i grupurile sunt independente ntre ele

Observaiile provin dintr-o distribuie normal


Metoda t pentru eantioane mici
Presupunere: Observaiile provin dintr-o distribuie
normal
Dificil de verificat cu ajutorul unei histograme pentru un eantion
mic:
Frecvena

Scoruri MAGS nainte de tratament


Se poate verifica presupunerea referitoare la normalitate cu
ajutorul unei reprezentri grafice a normalitii.
Reprezentarea grafic a
normalitii
Construcie:
1. Se ordoneaz observaiile:
20, 31, 34, 39, 43, 45, 49, 51 i 63.
Care va fi prima observaie ntr-un eantion normal distribuit
cu 9 observaii?
Valoarea teoretic (ateptat) pentru cea mai mic
observaie ntr-un eantion cu 9 observaii extras dintr-o
distribuie normal standard este -1.28.
2. Estimm cea de-a doua observaie, cea de-a treia, a patra
etc ca fiind:
-1.28, -0.84, -0.52, -0.25, 0.00, 0.25, 0.52, 0.84, 1.28
Reprezentarea grafic a
normalitii
Observaiile ordonate:
20, 31, 34, 39, 43, 45, 49, 51 i 63.
2: Valorile medii pentru prima observaie, cea de-a doua
observaie, cea de-a treia, a patra etc dintr-un eantion cu 9
observaii extras dintr-o distribuie normal standard:
-1.28, -0.84, -0.52, -0.25, 0.00, 0.25, 0.52, 0.84, 1.28
3: Pentru un eantion extras dintr-o distribuie normal cu
media i abaterea standard precum MAGS, vom multiplica
cu abaterea standard = 12.5 i vom aduna cu media 41.7:
25.6, 31.1, 35.1, 38.5, 41.7, 44.8, 48.2, 52.2, 57.7
Reprezentarea grafic a
normalitii
MAGS: 20, 31, 34, 39, 43, 45, 49, 51, 63.
Normala: 25.6, 31.1, 35.1, 38.5, 41.7, 44.8, 48.2, 52.2, 57.7
4: Dac vom face reprezentarea grafic a normalitii pentru
datele MAGS n raport cu valorile normale va trebui s ca
cele mai multe dintre observaii s fie aproape de linie, dac
scorurile MAGS urmeaz o distribuie normal.
Scoruri MAGS

Diagram de Linie de
corelaie - egalitate
scatter

Valori teoretice
Reprezentarea grafic a
normalitii
Distribuiile asimetrice produc n jurul liniei de egalitate o
curb sau o ncovoiere.

Colesterol seric (mmol/L)


Distribuie
Frecvena

pozitiv
asimetric Form
sau convex!
asimetric la
dreapta! ine ap

Colesterol (mmol/L) Valori teoretice


Reprezentarea grafic a
normalitii
Distribuiile asimetrice produc n jurul liniei de egalitate o
curb sau o ncovoiere.
Pt greutatea la natere (toate valorile):

Greutatea la natere (g)


Distribuie
negativ
asimetric Form
Frecvena

sau concav!
asimetric la
stnga! nu ine ap

Greutatea la natere (g) Valori teoretice


Reprezentarea grafic a
normalitii
Distribuiile asimetrice produc n jurul liniei de egalitate o
curb sau o ncovoiere.
Pt greutatea la natere (la termen):

Greutatea la natere (g)


Distribuie Linie
aproximativ dreapt!
Frecvena

simetric

Greutatea la natere (g) Valori teoretice


Reprezentarea grafic a
normalitii
Exist mai multe modaliti de obinere a reprezentrilor grafice
pentru normalitate:
-Unele programe, precum SPSS, pun valorile calculate pe baza
distribuiei normale pe axa vertical iar datele observate pe axa
orizontal. Astfel o curb de tip nu ine ap (concav) indic o
asimetrie pozitiv iar o curba de tip ine ap (convex) o
asimetrie negativ.
- Alte programe folosesc valorile distribuiei normale standard ca
valori calculate n locul celor pentru o distribuie normal cu
aceeai medie i abatere standard ca i cele calculate pentru
datele observate, caz n care linia dreapt depinde de medie i
abatere standard, deci nu avem o linia de egalitate.
-Mai exist i cazul n care se ofer o reprezentare grafic a
valorilor probabilitii pentru distribuia normal i nu o
reprezentare grafic a cuantilelor pentru distribuia normal, ns
acestea arat similar i sunt interpretate n acelai mod.
Teste de semnificaie: Shapiro-Wilk, Shapiro-Francia, Kolmogorov-Smirnov .
Metoda t pentru eantioane
perechi
Scorurile MAGS nainte i dup tratamentul local cu extract de
placent la pacienii cu rni nevindecate (Shukla et al., 2004)

media diferenelor= 9.33,


abaterea standard pt diferene = 4.03,
eroarea standard a mediei diferenelor = 1.34
Metoda t pentru eantioane
perechi
Pentru eantioane mici, va trebui s presupunem c
diferenele urmeaz o distribuie normal.
Intervalul de 95% ncredere:
media t0.05 eroarea , media + t0.05 eroarea
standard a mediei standard a mediei
t0.05 este valoarea critic pentru pragul de 5% (caz bilateral)
al distribuiei t cu un numr de grade de libertate egal cu nr
de observaii minus unu.
Testul de semnificaie se refer la
media_diferenelor/eroarea_standard (statistica testului)
care urmeaz o distribuie t cu un numr de grade de
libertate egal cu numrul de observaii minus 1.
Metoda t pentru eantioane
perechi
Ex: Creterea scorului MAGS
Media diferenelor = 9.33,
SE = 1.34 litri/min
9 diferene, deci 9 1 = 8 grade de libertate.
Valori critice pentru distribuia t
Metoda t pentru eantioane
perechi
Ex: Creterea scorului MAGS
Media diferenelor = 9.33,
SE = 1.34 litri/min
9 diferene, deci 9 1 = 8 grade de libertate.
Din randul cu 8 grade de libertate (d.f) se obine valoarea
t0.05 = 2.31.
Intervalul de 95% ncredere:
(9.33 2.31 1.34, 9.33 + 2.31 1.34)=
=(6.2, 12.4)
Test de semnificaie:
Media/SE = 9.33/1.34 = 6.96
Metoda t pentru eantioane
perechi
Ex: Creterea scorului MAGS
Media diferenelor = 9.33,
SE = 1.34 litri/min
9 diferene, deci 9 1 = 8 grade de libertate.
Din randul cu 8 grade de libertate (d.f) se obine valoarea
t0.05 = 2.31.
Idee: Intervalul de 95% ncredere:
(9.33 2.31 1.34, 9.33 + 2.31 1.34)=
=(6.2, 12.4)
Idee: Test de semnificaie:
Media/SE = 9.33/1.34 = 6.96
Din tabelul t, p<0.001. Dintr-un program de analiz statistic
p = 0.0001.
Metoda t pentru eantioane
perechi
Presupuneri:
Observaiile sunt independente ntre ele.
Diferenele urmeaz o distribuie normal
Media i abaterea standard a diferenelor este
constant, adic nu este legat de dimensiunea
variabilei
Metoda t pentru eantioane
perechi
Verificarea presupunerilor pentru metoda t pentru
eantioane perechi:
Diferenele urmeaz o distribuie normal (Verificarea
histogramei i a reprezentrii grafice a normalitii)
Diferena n scorurile MAGS,
(dup minus nainte)

Valori teoretice
Metoda t pentru eantioane
perechi
Verificarea presupunerilor pentru metoda t pentru
eantioane perechi:
Diferenele urmeaz o distribuie normal (Verificarea
histogramei i a reprezentrii grafice a normalitii)
Media i abaterea standard

Diferena n scorurile MAGS,


a diferenelor este

(dup minus nainte)


constant, adic nu este
legat de dimensiunea
variabilei (verificarea
reprezentrii grafice a
diferenelor n raport cu
mediile) Mediile scorurilor MAGS
Metoda t pentru eantioane
perechi
Dac nu sunt ndeplinite presupunerile:
Diferenele urmeaz o distribuie normal
Sunt necesare cel puin 100 de observaii pentru a
ignora normalitatea. Totui, diferenele tind s aib o
distribuie simetric astfel c aceast presupunere este
ndeplinit cu uurin.
Media i abaterea standard a diferenelor este
constant, adic nu este legat de dimensiunea
variabilei.
De obicei se aplic transformri.
Metoda t pentru dou eantioane
Aceasta este cunoscut i sub numele de: metoda t pentru
eantioane neperechi, testul t nepereche, metoda t pentru
dou grupuri sau testul Student t pentru dou eantioane.
Ex: Densitatea capilar (msurat pe mm2) pentru dou grupuri
de pacieni: un grup de pacienii cu ulcer diabetic la picior i un
grup de control fr ulcer (Marc Lamah)
Metoda t pentru dou eantioane
Nu se poate folosi metoda pentru eantioane mari bazat pe
distribuia normal deoarece eantioanele sunt prea mici!
Eroarea standard nu poate fi subicient de bine estimat!
Distribuia erorilor standard estimate depinde de distribuia
observaiilor.
Pentru metoda t pentru dou eantioane independente vom
face urmtoarele presupuneri :
observaiile din grupuri provin din distribuii normale,
distribuii celor dou populaii din care au fost extrase
eantioanele au aceeai varian. (Atenie! Populaiile i
nu eantioanele extrase din ele au aceeai varian.)
Metoda t pentru dou eantioane
n cazul n care distribuiile celor dou populaii au aceeai
varian avem nevoie doar de o estimare a varianei. Noi numim
aceast estimare varian comun sau grupat (amestecat).
Gradele de libertate necesare pentru aceast estimare a
varianei comune sunt egale cu numrul de observaii minus 2.
Vom utiliza aceast estimare comune pentru varian pentru a
estima eroarea standard a diferenei dintre medii.
Ex: Densitatea capilar
Variana comun = 53.31,
SD = 7.30 capilare/mm2,
df = 19 + 23 - 2 = 40
SE pentru diferen = 2.26 capilare/mm2
Diferena = 34.08 22.59 = 11.49capilare/mm2
(control ulcer)
Metoda t pentru dou eantioane
Ex: Densitatea capilar
Variana comun = 53.31,
SD = 7.30 capilare/mm2,
df = 19 + 23 - 2 = 40
SE pentru diferen = 2.26 capilare/mm2
Diferena = 34.08 22.59 = 11.49capilare/mm2
(control ulcer)
Intervalul de 95% ncredere pentru diferen:
(11.49 - ? 2.26, 11.49 + ? 2.26)
? nu provine din distribuia normal ci din distribuia t cu 40
grade de libertate
Valori critice pentru distribuia t
Metoda t pentru dou eantioane
Ex: Densitatea capilar
Variana comun = 53.31,
SD = 7.30 capilare/mm2,
df = 19 + 23 - 2 = 40
SE pentru diferen = 2.26 capilare/mm2
Diferena = 34.08 22.59 = 11.49capilare/mm2
(control ulcer)
Intervalul de 95% ncredere pentru diferen:
(11.49 - ? 2.26, 11.49 + ? 2.26)
? nu provine din distribuia normal ci din distribuia t cu 40
grade de libertate
(11.49 2.02 2.26, 11.49 + 2.02 2.26) =
= (6.29, 16.07) capilare/mm2
Metoda t pentru dou eantioane
Ex: Densitatea capilar
Variana comun = 53.31,
SD = 7.30 capilare/mm2,
df = 19 + 23 - 2 = 40
SE pentru diferen = 2.26 capilare/mm2
Diferena = 34.08 22.59 = 11.49capilare/mm2
(control ulcer)
Testul de semnificaie:
Ipoteza nul stabilete c n populaie diferena ntre medii = 0:
(diferena 0)/SE = 11.49/2.26 = 5.08
Dac ipoteza nul este adevrat atunci acest raport urmeaz o
distribuie t cu 40 grade de libertate.
Metoda t pentru dou eantioane
Ex: Densitatea capilar
Testul de semnificaie:
ipoteza nul stabilete c n populaie diferena ntre medii = 0:
(diferena 0)/SE = 11.49/2.26 = 5.08
Dac ipoteza nul este adevrat atunci acest raport urmeaz o
distribuie t cu 40 grade de libertate.

Din tabel, probabilitatea observrii unei astfel de valori


extreme este mai mic de 0.001.
Folosind un program de analiz statistic se afiseaz valoarea
p = 0.0000, ceea ce nseamn c p<0.0001.
Metoda t pentru dou eantioane
Presupuneri:
Observaiile sunt independente ntre ele.
Distribuia densitii capilare este o distribuie
normal pentru fiecare populaie.
Varianele sunt aceleai n fiecare populaie.
Metoda t pentru dou eantioane
Presupuneri:
Distribuia densitii capilare este o distribuie
normal pentru fiecare populaie.
Varianele sunt aceleai n fiecare populaie.
Control Ulcere
Problem:
Observaiile nu
Frecvena

Frecvena

sunt suficiente
pentru a trage
vreo concluzie!

Densitatea capilarelor Densitatea capilarelor


Metoda t pentru dou eantioane
Presupuneri:
Distribuia densitii capilare este o distribuie
normal pentru fiecare populaie.
Varianele sunt aceleai n fiecare populaie.
Soluie:
Vom combina cele dou grafice
scznd media grupului din fiecare
Frecvena

observaie pentru a obine


reziduurile.
Reziduurile au media = 0.
Reprezentarea grafic pare destul de
simetric ns tot avem prea puine
observaii. O alt soluie (mai bun)
ar fi s ntocmeasc o reprezentare
Reziduuri grafic a normalitii pentru reziduuri.
Metoda t pentru dou eantioane
Ex: Densitatea capilar
Frecvena

Reziduuri

Reziduuri Normala invers


Distribuia pare apropiat de cea normal.
Metoda t pentru dou eantioane
Presupuneri:
Distribuia densitii capilare este o distribuie
normal pentru fiecare populaie.
Varianele sunt aceleai n fiecare populaie.
Ex: Densitatea capilar
Control Pacieni cu ulcer

Abaterile standard par a fi similare.


Testarea egalitii varianelor: Testul F, testul Levene, testul
Bartlett etc!
Metoda t pentru dou eantioane
Presupuneri:
Distribuia densitii capilare este o distribuie
normal pentru fiecare populaie.
Varianele sunt aceleai n fiecare populaie.
Densitatea capilarelor

Control Ulcere
Grup de pacieni
Metoda t pentru dou eantioane
Efectele nendeplinirii presupunerilor:
1. Metodele care folosesc distribuia t depind de ndeplinirea
anumitor condiii (presupuneri) referitoare la distribuia din
care provin datele.
n general, pentru dou eantioane de dimensiuni egale,
metoda t este foarte rezistent la abaterile de la
normalitate, ns pe msur ce eantioanele devin mai puin
egale ca mrime, aproximarea devine i ea mai puin bun.
Acesta este probabil un efect al asimetriei care duce la
pierderea puterii.
Valorile p devin astfel prea mari iar intervale de ncredere
prea largi.
Asimetria se poate, de obicei, corecta cu ajutorul unei
transformri!
Metoda t pentru dou eantioane
Efectele nendeplinirii presupunerilor:
2. Dac nu putem presupune o varian uniform, efectul,
de obicei, este mic dac cele dou populaii urmeaz o
distribuie normal.
Varianele inegale sunt adesea asociate cu asimetrii ale
datelor, caz n care, este necesar o transformare pentru a
corecta acest defect care de cele mai multe ori tinde, de
asemenea, s corecteze i alte.
Dac distribuiile sunt normale, putem folosi corecia
Satterthwaite a gradelor de libertate adesea numit i
metoda t pentru dou eantioane (grupuri) cu variane
inegale sau necomune.
Metoda t pentru dou eantioane
Variane inegale si distributie normala: corecia
Satterthwaite pentru gradele de libertate.
n cazul n care varianele sunt inegale, nu se poate face o
estimaie a varianei comune.
Vom folosi, n schimb, un model care se aplic eantioanelor
mari pentru a calcula eroarea standard a diferenei dintre
medii. Vom nlocui valoarea t pentru intervale de ncredere
i de testele de semnificaie cu un alt t cu mai puine grade
de libertate.
Gradele de libertate Satterthwaite depind de dimensiunile
relative ale varianelor. Variane mari domin i n cazul n
care una dintre ele este mult mai mare dect cealalt, doar
gradele de libertate pentru acel grup sunt luate n
considerare ca fiind gradele de libertate.
Metoda t pentru dou eantioane
Variane inegale: corecia Satterthwaite pentru gradele
de libertate.
Ex: Densitatea capilar
Grade de libertate: 40 (= 19 + 23 2)
Grade de libertate Satterthwaite: 38.56.
Rotunjim valoarea la 38 pentru a folosi tabelul t.
Variane egale: 95% CI = (6.92, 16.07), p<0.0001.
Variane inegale: 95% CI = (6.91, 16.07), p<0.0001.
Observaie: Metoda Satterthwaite este o aproximare
folosit n condiii neobinuite. Metoda varianelor egale
este testul standard t.
Mai mult de dou eantioane
Analiza de varian unidirecional (ANOVA).
Presupunerile sunt la fel ca n cazul testului t pentru
dou eantioane indiferent de dimensiunea
eantionului.