st1 07 Erori Putere Efect

Erori statistice Puterea testului statistic Mrimea efectului
Marian Popa
2013
Enunarea ipotezei cercetrii (H1)

QI mediu al elevilor olimpici este mai mare
Enunarea ipotezei de nul (H0)

QI mediu al elevilor olimpici nu este mai mare (diferit)
Alegerea nivelului de semnificaie (alfa)

0.05; 0.01; 0.001
Colectarea i analiza descriptiv a datelor

Selectarea eantionului, aplicarea unui test de inteligen Raportarea la un criteriu pentru evaluarea rezultatului pe eantion z critic corespunztor lui alfa=0.05 pe curba normal
Adoptarea deciziei statistice

Am respins H0 pentru c valoarea calculat a testului a fost mai mare dect valoarea critic Am fi admis H0 dac valoarea calculat a testului era mai mic dect valoarea critic
pentru exemplul nostru

Decizie unilateral:
Decizia statistic (unilateral): se respinge H0 Concluzia cercetrii: se confirm H1
0.014
0.05
QI=100 z=0 zcritic=+1.65 QIcalculat=106 zcalculat =+2.18
Decizie bilateral:
Decizia statistic (bilateral): se respinge H0 Concluzia cercetrii: se confirm H1
0.014 0.025
zcritic=-1.96 QI=100 z=0 zcritic=+1.96 QIcalculat=106 zcalculat =+2.18
0.025
... cum nelegem rezultatul?

Fiecare elev olimpic este mai inteligent dect unul ne-olimpic? Elevii olimpici sunt n mod sigur mai inteligeni dect elevii n general?
... ce am testat de fapt?

Posibilitatea ca H1 s fie adevrat?
(olimpicii sunt mai inteligeni) Nu, am testat probabilitatea ca H1 s fie fals

(olimpicii nu sunt mai inteligeni)
Erori statistice
Se refer la eroarea deciziei statistice n raport cu realitatea vieii, nu la aplicarea greit a procedurii de testare. n raport cu realitatea vieii, decizia cu privire la ipoteza de nul poate fi corect sau greit
Cercettorul nu poate ti cu certitudine dac decizia statistic este corect sau este greit (dac ar putea ti, nu ar mai avea nevoie de statistic)
Eroarea statistic de tip I

Adevrul vieii (necunoscut)
H0 este adevrat (olimpicii NU SUNT mai inteligeni) H0 este fals (olimpicii SUNT mai inteligeni)
Decizia statistic
Acceptarea H0 (olimpicii NU SUNT mai inteligeni)
Respingerea H0 (olimpicii SUNT mai inteligeni)
2. eroare de tip I P=alfa
Acceptarea corect a H0
Decizia statistic
1. decizie corect
p=1-alfa
Eroarea de tip I i nivelul de ncredere
n condiiile deciziei bilaterale
Nivelul de ncredere 1-alfa=0.95
Eroarea de tip I fals pozitiv p=0.025 zcalculat =-1.96 z=0
Eroarea de tip I fals pozitiv p=0.025 zcalculat =+1.96
Eroarea statistic de tip II

Decizia statistic
1. decizie corect
p=1-alfa
4. eroare de tip II p=beta
care eroare este mai grav?

societatea (comunitatea tiinific) este interesat s evite respingerea H0 cnd ea este de fapt adevrat
evitarea erorii de tip I Declararea existenei unui zcmnt inexistent
cercettorul este interesat s evite acceptarea H0 cnd ea este de fapt fals

eroarea de tip II Declararea inexistenei unui zcmnt existent
ambele sunt rele

eroare de tip I = se vor consuma resurse pentru exploatarea unui zcmnt nereal (Climani) eroare de tip II = un zcmnt real va rmne neexploatat
Eroarea de tip III

1. Respingerea corect a ipotezei de nul, urmat de atribuirea incorect a cauzei (Raiffa)
interpretare greit a rezultatului. ceva semnificativ se ntmpl, dar nu ceea ce crede cercettorul Exemplul clasic este ilustrat de efectul de noutate Efectul placebo poate fi inclus de asemenea n categoria erorilor de tip III, dar nu toate erorile de tip III sunt de tip placebo Nu exist metode statistice pentru eliminarea erorii de tip III, n aceast accepie Singura protecie vine dinspre calitatea modelului de cercetare Pentru evaluarea efectului placebo studiile medicale prevd protocoale de tip dublu orb
2. Rezultatul cercetrii conduce la confirmarea unui efect sau relaii ntre variabile, dar sensul (direcia) efectului este greit interpretat.
Rezultatele cercetrii susin c efectul noii metode de nvare este superior celei vechi dei, n realitate, situaia st exact invers, concluzia fiind greit. n aceast accepie, probabilitatea erorii de tip III este codificat cu litera (gamma) Unele programe statistice sunt capabile s o estimeze.
Eroarea de tip III se poate manifesta numai n cercetri de tip experimental, singurele care permit concluzii de natur cauzal.
Respingerea corect a H0 PUTEREA TESTULUI

Decizia statistic
1. decizie corect
p=1-alfa
4. eroare de tip II p=beta
3. decizie corect p=1-beta (power)
Metode de cretere a puterii testului
creterea volumului eantionului (N)
Scade eroarea standard

efectul variabilei independente se manifest mai puternic pe grupurile de subieci aflate la extremitile scalei de msurare a variabilei dependente dect pe valorile ntregii scale dac mprtierea datelor de cercetare este mic, atunci puterea testului de a surprinde un efect semnificativ se reduce. utilizarea unor proceduri de investigare adecvate controlul i eliminarea surselor de eroare; tratarea identic a tuturor subiecilor cercetrii; selectarea aleatoare a eantioanelor eliminarea surselor de selecie prtinitoare (bias).
maximizarea variabilitii primare, aceea care decurge ca urmare a efectului unei variabile asupra celeilalte
Reducerea erorilor de msurare
Alegerea modelul de cercetare

Testul bilateral reduce probabilitatea erorii de tip I, dar crete probabilitatea erorii de tip II i, implicit, reduce puterea Testele parametrice prezint o putere statistic mai mare dect cele neparametrice
modelele de cercetare within-subjects (intrasubiect) au mai mult putere dect modelele between-subjects (inter-subiect) ori de cte ori este justificabil, se va opta pentru test unilateral, chiar dac, n practic, testul bilateral este cel uzual
utilizarea acestora din urm se va face doar atunci cnd este absolut necesar (n conformitate cu condiiile de aplicare) nu se va renuna cu uurin la un test parametric, dac datele cercetrii sunt msurate pe scal cantitativ.
ct de mult putere?
prea mult putere este tot att de nedorit ca i prea puin
dac mrim puterea reducem probabilitatea erorii de tip II, dar cretem probabilitatea erorii de tip I
un studiu cu putere mare (cu N foarte mare), are probabilitate mai mare de a respinge ipoteza de nul, chiar dac aceasta este adevrat (eroare de tip I)
Thompson
... testul statistic devine o cutare tautologic pentru suficieni participani n msur s ating semnificaia statistic
utilizarea analizei de putere

n faza premergtoare a unei cercetri
pentru a evalua ansa de a obine un rezultat semnificativ statistic ct de mic poate fi puterea unei cercetri pentru a accepta efectuarea ei? 0.5 este prea puin pentru a investi timp i bani 0.7, care corespunde unei probabiliti de 0.3 pentru eroarea de tip II, este considerat ca fiind minim 0.8 este considerat cel mai bun compromis ntre nivelul puterii i consecinele ei negative
Dup efectuarea unei cercetri

care este probabilitatea ca rezultatul acesteia s indice un efect real al variabilei independente asupra variabilei dependente
GPower... n semestrul 2
Mrimea efectului
semnificaia statistic nu spune nimic despre intensitatea relaiei (efectului) dintre variabile
S considerm c rezultatul testului dintre inteligena olimpicilor i a elevilor n general

Am obinut o diferen de 6 uniti QI Este mult?... este puin?
mrimea efectului rspunde acestei ntrebri
indici de mrime a efectului

indici care se bazeaz pe diferena standardizat dintre medii
d al lui Cohen, delta al lui Glass, g al lui Hedges;
Indici care se bazeaz pe asocierea dintre variabile

r, r2 (coeficient de determinare), eta ptrat, omega ptrat
unii sunt oferii de SPSS, alii de alte programe dar sunt relativ uor de calculat manual
Calcularea indicelui lui d Cohen pentru testul z(t) pentru un singur eantion
106 100 d 0.4 15
m=media eantionului =media populaiei =abaterea standard a populaiei (se poate utiliza s)
d (Cohen)
0.20 mic
0.50 mediu
0.80 mare
Suprapunerea distribuiilor comparate, ca expresie a mrimii efectului
Creterea mrimii efectului reduce suprapunerea distribuiilor
Raportarea mrimii efectului

Testarea ipotezei de nul este supus unor critici puternice
American Psychological Association a organizat un grup de lucru avnd ca obiect elaborarea unor recomandri cu privire la raportarea rezultatelor statistice (Wilkinson&APA Task Force on Statistical Inference, 1999)
raportarea i interpretarea mrimii efectului (...) este esenial pentru o cercetare bun
raportarea i interpretarea mrimii efectului prezint trei avantaje importante:

faciliteaz studiile de meta-analiz (studii care sintetizeaz rezultatele mai multor cercetri pe aceeai tem); faciliteaz formularea unor ipoteze cu un grad mai mare de specificitate de ctre cercettorii care vor studia aceeai tem; faciliteaz integrarea rezultatului unei cercetri n literatura dedicat acelui subiect,
Interdependena erorilor statistice cu puterea testului i mrimea efectului
Distribuia H0
mrimea efectului
Distribuia H1
Nivelul de ncredere (1-alfa)
Puterea (1-beta)
H0 Eroarea de tip II (beta) Pragul de decizie (valoarea critic)
H1 Eroarea de tip I (alfa)
mrimea efectului
Nivelul de ncredere (eroarea de tip II)
(1-alfa)
Puterea (1-beta)
H0
mrimea efectului
Crete
Nivelul de ncredere (eroarea de tip II)
Puterea (1-beta)
(1-alfa)
acelai
H0 Eroarea de tip II scade
aceeai
Important...
La interpretarea rezultatului unei cercetri trebuie s inem cont: de nivelul de semnificaie de puterea testului de mrimea efectului
Rezultat semnificativ statistic? (se respinge H0?)

DA
Volumul eantionului
Concluzii
Rezultat important. Chiar dac puterea testului este mic, din cauza volumului redus al eantionului, existena unui rezultat semnificativ arat o mrime a efectului important. Rezultatul poate fi important sau nu: semnificaia poate rezulta din puterea ridicat a testului, ca urmare a volumului mare al eantionului SAU poate fi expresia unei diferene importante dintre populaiile comparate Rezultatul este neconcludent. Absena semnificaiei statistice se poate datora: faptului c ipoteza cercetrii este fals SAU puterii reduse a testului, ca urmare a eantionului prea mic Ipoteza cercetrii este probabil fals din cauz c, n ciuda puterii ridicate (eantion mare), rezultatul nu a atins nivelul semnificaiei statistice. Mrimea efectului este foarte mic
MIC
DA
MARE
NU
MIC
NU
MARE
Testarea ipotezei de nul - varianta extins 1. Enunarea ipotezei de nul (H0)
2. Enunarea ipotezei cercetrii (H1)

3. Alegerea nivelului de semnificaie (alfa)
5. Colectarea i analiza descriptiv a datelor

6. Raportarea la un criteriu pentru evaluarea rezultatului pe eantion
7. Adoptarea deciziei statistice (reinerea sau respingerea H0)

8. Calcularea mrimii efectului
indicele de intensitate a asocierii (r2, eta2 omega2, ) d Cohen estimarea puterii testului
Concluzii
interpretarea testului statistic nu este complet fr discuia n jurul erorilor statistice, puterii testului i mrimii efectului n ultimii ani, din ce n ce mai mult se atrage atenia asupra faptului c limitarea rezultatelor la raportarea semnificaiei statistice nu este suficient
American Psychological Association (2001)

recoman publicarea, alturi de semnificaia statistic, a mrimii efectului i limitelor de ncredere din ce n ce mai multe reviste de specialitate care se respect pretind includerea acestui indice n completarea semnificaiei statistice

st1 07 Erori Putere Efect

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

st1 07 Erori Putere Efect

Încărcat de

Drepturi de autor:

Formate disponibile

Erori statistice Puterea testului statistic Mrimea efectului

Enunarea ipotezei cercetrii (H1)

Enunarea ipotezei de nul (H0)

Alegerea nivelului de semnificaie (alfa)

Colectarea i analiza descriptiv a datelor

Adoptarea deciziei statistice

pentru exemplul nostru

... cum nelegem rezultatul?

... ce am testat de fapt?

(olimpicii sunt mai inteligeni) Nu, am testat probabilitatea ca H1 s fie fals

Eroarea statistic de tip I

Acceptarea H0 (olimpicii NU SUNT mai inteligeni)

Respingerea H0 (olimpicii SUNT mai inteligeni)

2. eroare de tip I P=alfa

Acceptarea H0 (olimpicii NU SUNT mai inteligeni)

Respingerea H0 (olimpicii SUNT mai inteligeni)

2. eroare de tip I P=alfa

Eroarea de tip I i nivelul de ncredere

n condiiile deciziei bilaterale

Nivelul de ncredere 1-alfa=0.95

Eroarea de tip I fals pozitiv p=0.025 zcalculat =-1.96 z=0

Eroarea de tip I fals pozitiv p=0.025 zcalculat =+1.96

Eroarea statistic de tip II

Acceptarea H0 (olimpicii NU SUNT mai inteligeni)

4. eroare de tip II p=beta

Respingerea H0 (olimpicii SUNT mai inteligeni)

2. eroare de tip I P=alfa

care eroare este mai grav?

cercettorul este interesat s evite acceptarea H0 cnd ea este de fapt fals

ambele sunt rele

Eroarea de tip III

Respingerea corect a H0 PUTEREA TESTULUI

Acceptarea H0 (olimpicii NU SUNT mai inteligeni)

4. eroare de tip II p=beta

Respingerea H0 (olimpicii SUNT mai inteligeni)

2. eroare de tip I P=alfa

3. decizie corect p=1-beta (power)

Metode de cretere a puterii testului

creterea volumului eantionului (N)

Scade eroarea standard

Reducerea erorilor de msurare

Alegerea modelul de cercetare

utilizarea analizei de putere

Dup efectuarea unei cercetri

S considerm c rezultatul testului dintre inteligena olimpicilor i a elevilor n general

mrimea efectului rspunde acestei ntrebri

indici de mrime a efectului

Indici care se bazeaz pe asocierea dintre variabile

Suprapunerea distribuiilor comparate, ca expresie a mrimii efectului

Creterea mrimii efectului reduce suprapunerea distribuiilor

Raportarea mrimii efectului

raportarea i interpretarea mrimii efectului prezint trei avantaje importante:

Interdependena erorilor statistice cu puterea testului i mrimea efectului

Nivelul de ncredere (1-alfa)

H0 Eroarea de tip II (beta) Pragul de decizie (valoarea critic)

H1 Eroarea de tip I (alfa)

Nivelul de ncredere (eroarea de tip II)

H1 Eroarea de tip I (alfa)

Nivelul de ncredere (eroarea de tip II)

H0 Eroarea de tip II scade

H1 Eroarea de tip I (alfa)

Rezultat semnificativ statistic? (se respinge H0?)

Testarea ipotezei de nul - varianta extins 1. Enunarea ipotezei de nul (H0)