Sunteți pe pagina 1din 5

Erorile statistice.

Marimea efectului s, i puterea


testului
Asist. drd. Adrian Gorbanescu
30 Noiembrie 2014

Tipuri de erori statistice

De multe ori, am fost ntrebat de student, i de ce trebuie sa analizam datele s, i sa


aplicam testele statistice pentru a compara media unui es, antion cu cea a populat, iei
din care a fost extras sau cu a altui es, antion?. Daca diferent, ele sunt suficient de
mari, respingem ipoteza de nul s, i afirmam ca es, antionul provine dintr-o populat, ie
cu o medie superioara celei propuse prin intermediul ipotezei. Totus, i, n sufletul
nostru, pot exista urme de ndoiala. Daca a intervenit un factor extern care a
influent, at rezultatul?
Nivelul maxim de eroare pe care ni-l putem asuma este de 5. Totus, i, este
adevarat faptul ca adoptand un nivel de ncredere de 95, ne asumam o marja de
eroare ca diferent, a obt, inuta ntre mediile comparate sa nu fie reala. Daca dorim
sa mics, oram cantitatea de eroare asumata, trebuie sa cunoas, tem faptul ca exista
o probabilitate mai mare de a realiza o alta forma de eroare.

Accept H0
Resping H0

Table 1: Tipuri de erori


H0 este adevarata
H0 este falsa
Decizie corecta (p = 1 - alfa) Eroare de tip II (p = beta)
Eroare de tip 1 (p = alha)
Decizie corecta (p = 1-beta)

Dupa cum putem observa, decizia statistica corecta poate fi luata n doua
situat, ii: acceptarea ipotezei de nul atunci cand ea este adevarata n realitate s, i
respingerea ipotezei de nul atunci cand n realitate este falsa. Aceasta ultima decizie reprezinta o situat, ie statistica ideala, n care acceptam ipoteza cercetarii,
atunci cand este advarata s, i n realitate. Capacitatea unui test statistic de a
sust, ine o astfel de decizie se numes, te puterea testului.
Eroarea statistic
a de tip I
Daca diferent, a dintre cele doua medii analizate este semnificativa s, i respingem
ipoteza de nul, des, i n realitate este adevarata, se produce o eroare statistica de tip
I. Probabilitatea acestui tip de eraoare este egala cu pragul alfa, iar nivelul maxim
este stabilit convent, ional la 0,05. In funct, ie de tipul cercetarii s, i de domeniul de
studiu, alfa poate lua valori mai mici. De exemplu, n domeniul farmaceutic un
prag de asumare a erorii la 0,05 poate fi foarte riscant, motiv pentru care se alege
un alfa mult mai mic (0,001). Eroarea de tip I genereaza un rezultat fals pozitiv
s, i are o probabilitate mai mare de aparit, ie n cazul es, antioanelor mari.
Atunci cand ne asumam o eroare de 0,05, avem o probabilitate de a accepta
ipoteza de nul cand s, i n realitate este adevarata de 0,95. Valoarea complementara
1

lui alfa (1 - 0,05) se numes, te nivel de ncredere.


Eroarea statistic
a de tip II
Atunci cand afirmam ca media es, antionului nu difera semnificativ de media
ipotezei de nul, des, i n realitate aceasta diferent, a ar fi semnificativa statistic realizam o eroare de tip II. Prin urmare, eroarea de tip II presupune acceptarea unei
ipoteze de nul, care n realitate este falsa. Aceasta genereaza un rezultat de tip
fals negativ. Eroarea de tip II este codificata cu beta. Nivelul acceptabil pentru
eroarea de tip II este beta = 0,20. Valoarea complementara erorii de tip II (1 beta) poarta denumirea de puterea testului.
In decizia statistica ne intereseaza sa acceptam ipoteza de nul doar atunci cand
aceasta este adevarata s, i n realitate. Cu toate acestea, trebuie sa cunoas, tem faptul ca mics, orerea erorii de tip II determina o cres, tere a erorii de tip I.
De multe ori am fost ntrebat de student, i care este cea mai rea eroare?. Des, i
ambele tipuri de erori trebuie evitate, comunitatea s, tiint, ifica afirma ca eroarea de
tip I este mai daunatoare s, i stabiles, te un nivel maxim al acesteia (alfa =0,05).
In concluzie, mai bine respingem un argument adevarat, decat sa acceptam un
argument fals.
Eroarea statistic
a de tip III
In cercetarea psihologica nu este suficient sa respingem ipoteza de nul falsa sau
sa acceptam o ipoteza de nul adevarata. Acceptarea ipotezi de nul sau respingerea
acesteia trebuie nsot, ita de o atribuire corecta a cauzei. Astfel, respingerea corecta
a ipotezei de nul, urmata de atribuire gres, ita a cauzei genereaza o eroare de tip III.
De exemplu, n exercit, ul de la antrenorul lotului de arcas, i a respins ipoteza de nul s, i
a afirmat ca programul de relaxare aduce o mbunatat, ire la nivelul performant, elor
sportivilor. Totus, i, exista posibilitatea ca modificarea performant, elor sa nu fie
generata de programul de relaxare, ci ca urmare a faptului ca sportivii au fost
motivat, i de introducerea unui element nou la antrenament. De asemenea, rezultatul ar putea fi influent, at de faptul ca sportivii care au participat la programul
de relaxare aveau un nivel mai bun decat al celor care nu au participat la training. Din acest motiv, n situat, ii de acest gen, se recomanda o evaluare a loturilor
nainte de a introduce un astfel de program.
Eroarea statistica de tip III n aceasta forma nu poate fi detectata cu ajutorul
programelor statistice. Singura modalitate de a o t, ine sub control este designul
cercetarii.
Eroarea de tip III apare s, i n situat, ia n care respingem ipoteza de nul, dar sensul efectului variabilei independente este interpretat incorect. In exemplul de mai
sus, performant, ele sportivilor care au facut relaxare sunt semnificativ mai bune
decat ale celor care nu au facut parte din program, dar n realitate, situat, ia ar fi
exact opusa.
Acest tip de eroare ne atrage atent, ia asupra faptului ca cercetarile devin vulnerabile atunci cand nu reus, im sa explicam direct, ia rezultatelor obt, inute. O modalitate practica de a ne proteja de eroarea de tip III o reprezinta replicarea cercetarilor
s, i formularea ipotezelor n conformitate cu cele din studiile pe care le reproducem.

M
arimea efectului

Respingerea ipotezei de nul pentru diferent, a dintre doua medii s, i concluzionarea


existent, ei unei diferent, e semnificative ne permite sa afirmam ca aceasta diferent, a
nu este datorata hazardului sau ntamplarii. Totus, i, acest lucru nu se traduce n
faptul ca diferent, a dintre medii este mare.
Marimea efectului este un indicator statistic care prezinta m
arimea diferent, ei
dintre medii sau intensitatea asocierii dintre variabile.
Putem nt, elege marimea efectului prin gradul de suprapunere dintre distribt, ia
de nul s, i distribut, ia cercetarii. Indicele de marime a efectului este o valoare numerica care exprima intensitatea diferent, ei/relat, iei dintre variabilele cercetate.
Deoarece indicele de marime a efectului se obt, ine prin mpart, irea diferent, ei
dintre medii cu abaterea standard, se considera ca acesta este o valoare standardizata. Valorile pe care le poate lua d sunt cuprinse ntre 0 (efect inexistent) s, i 1
(efect maxim). In condit, ii extreme, indicele de marime a efectului poate avea s, i
valori mai mari.
2
d = m1 m

Jacob Cohen, cel care a introdus termenul de marime a efectului nu a specificat


formula de calcul pentru . Pentru a fi mai us, or de exemplificat sa ne imaginam
ca avem doua grupuri cu dispersii omogene. Astfel, media unui es, antion este 7,
media celui de al doilea es, antion este 6, iar abaterea standard este 2.
2
d = 76
d = 0, 5
d = m1 m

2
In imaginea de mai jos prezentam gradul de suprapunere al celor doua distribut, ii.

Cohen a propus urmatoarele intervale de interpretare ale indicilor de matime


ai efectului (d):
Table 2: Interpretarea indicelui d pentru marimea efectului
M
arime a efectului
d
Mare
0,80
Medie
0,50
Mica
0,20
Pentru exemplul nostru s-a nregistrat un indice de marime al efectului mediu.
Prin intermediul lui putem aprecia intensitatea diferent, ei dintre cele doua medii,
fara a lua decizii cu privire la respingerea sau acceptarea ipotezei de nul. Pot
exista cazuri n care indicele de marime al efectului este mare, dar diferent, a nu
este semnificativa s, i invers. Atunci cand indicele de marime al efectului este mare
s, i acceptam ipoteza de nul nseamna ca testul nu are suficienta putere.
Exista mai mult, i indicatori ai marimii efectului s, i aces, tia pot fi grupat, i n doua
categorii:
Indicatori care se bazeza pe diferent, a standardizata dintre medii: d (Cohen),
(Glass).
3

Indicatori care au la baza gradul de asociere dintre variabile (descriu variabilitatea comuna a celor doua variabile): r s, i r2 (corelat, ia Pearson), R2
(coeficientul de regresie), 2 s, i 2 (ANOVA) sau (chi-patrat).
Intervalul de ncredere al m
arimii efectului
Avand n vedere faptul ca indicele de marime al efectului se obt, ine la nivel de
es, antion, acesta estimeaza valoarea sa reala la nivelul populat, iei cu o anumita cantitate de eroare. In cazul diferent, ei dintre mediile a doua es, antioane independente,
intervalul de ncredere pentru indicele d (Cohen) poate fi calculat cu ajutorul unui
document Excel.

Pentru exemplul de mai sus, am obt, inut un indice de marime al efectului d


= 0,50 s, i un interval de ncredere 95ntre -0,41 s, i 1,37. Faptul ca ntre limitele
interalului de ncredere al marimii efectului se afla valoarea 0 reprezinta un indiciu
pentru acceptarea ipotezei de nul.
Exemple de calcul a m
arimii efectului
In cazul testului z(t) pentru un singur es, antion, indicele de marime a efectului
se calculeaza dupa formula:
d=

Astfel, pentru situat, ia n care = 35, m = 38, 33 s, i = 3.65 indicele de


marime al efectului va fi:
d=

38,3335
3,65

d=

3,33
3,65

d = 0,91 .

Acest indice de marime a efectului este unul care ne indica faptul ca diferent, a
dintre media es, antionului s, i media populat, iei are un nivel ridcat de marime.
Atunci cand aplicam testul t pentru es, antioane independente vom calcula indicele d al lui Cohen, care se interpreteaza dupa aceleas, i praguri.
d=

mx my
sc

sc =

(Nx 1)s2x +(Ny 1)s2y


(Nx 1)+(Ny 1)

Pentru situat, ia n care avem doua es, antioane de 10 subiect, i cu mx = 7 s, i


sx = 1.5, respectiv my = 5 s, i sy = 1.2 vom calcula indicele d astfel:
sc =
d=

92,25+91,44
18

75
1,35

d=

sc =

2
1,35

1, 85 sc = 1, 35.

d = 1,48 .

In acest caz, am obt, inut o diferent, a ntre cele doua es, antioane studiate cu un
nivel ridicat de marime a efectului.

Atunci cand aplicam testul t pentru es, antioane dependente vom calcula indicele d al lui Cohen, care se interpreteaza dupa aceleas, i praguri ment, ionate mai
sus.
d=

m1 m2
sD

Presupunem ca avem un es, antion de pilot, i care sunt testat, i pentru a verifica
performant, ele n zborul pe timp de noapte nainte s, i dupa trainingul pe un anumit
simulator. Astfel, ntre cele doua situat, ii s-a nregistrat o medie a diferent, elor
mD = 3, 5 s, i o abatere standard a diferent, elor sD = 3, 2. Prin urmare, indicele de
marime a efectului devine:
2
d = msDD d = 3,5
d = 1, 09.
d = m1sm
3,2
D
S, i n acest caz, am obt, inut o diferent, a ntre mediile celor doua momente ale
testarii are un nivel ridicat de marime a efectului.

Puterea testului

Puterea testului reprezinta probabilitatea de a respinge ipoteza de nul atunci cand


aceasta este cu adevarat falsa. Puterea testului este complementara erorii statistice de tip II. Daca eroarea de tip II este beta, puterea testului este 1-beta.
Prin puterea testului nt, elegem sensibilitatea (capacitatea) testului de a detecta un efect real ntre variabile.
Eroarea de tip II apare atunci cand acceptam o ipoteza de nul falsa. Spre
deosebire de eroarea de tip I (), eroarea de tip II este mai greu de calculat. Analiza
de putere este cea care s, i propune sa aproximeze puterea testului s, i cantitatea de
eroare de tip II. Exista mai multe strategii pentru a cres, te puterea testului:
Cres, terea volumului es, antionului. La numitorul formulei de calcul se afla
eroarea standard a mediei, iar aceasta devine mai mica atunci cand volumul
es, antionului cres, te.
Maximizarea variabilitat, ii primare, decurge ca urmare a efectului unei variabile asupra celeilalte.
Reducerea erorilor de masurare (instrumente adecvate, eliminarea surselor
de eroare, eliminarea erorilor de select, ie a es, antioanelor)
Testul statistic bilateral reduce probabilitatea erorii de tip I, dar cres, tre pe
cea a erorii de tip II s, i reduce puterea testului.
Testele statistice parametrice au mai multa putere decat cele neparametrice.
Prin urmare, testele neparametrice se vor utiliza doar atunci cand nu se
ntrunesc condit, iile aplicarii celor parametrice.
Modelul de cercetare intra-subiect (within-subject) are mai multa putere
decat cel inter-subiect(between-subject). Modelul intra-subiect presupune
utilizarea aceluias, i es, antion n condit, ii diferite. Modelul inter-subiect presupune utilizarea unor grupuri de subiect, i diferit, i n condit, ii diferite.