Sunteți pe pagina 1din 29

VERIFICAREA IPOTEZELOR STATISTICE

Conform DEX, ipoteza este o presupunere enunțată pe baza unor fapte cunoscute,
cu privire la anumite legături între fenomene care nu pot fi observate direct sau cu
privire la esența fenomenelor, la cauza sau la mecanismul intern care le produce.
Ipotezele sunt de două feluri, științifice și statistice. Ipotezele științifice se referă la
relația cauză-efect, și pot fi înlaturate doar printr-un singur contra-argument, printr-o
singură situatie, în care nu sunt adevarate în timp ce ipotezele statistice raman adevarate
chiar dacă într-un număr limitat de cazuri au fost infirmate. De exemplu, afirmatia ca
ratiile cu raport energo-proteic diferit cauzează sporuri în greutate diferite este o ipoteza
stiințifică în baza căreia se poate organiza un experiment. Ea este înlocuită cu o ipoteza
statistică de tipul H:μ1= μ2=,...,= μn= μ. Aceasta ipoteză, conform careia tratamentele
diferite asociate celor n probe nu vor modifica mediile, acestea estimand acelasi μ, care
este media populației din care s-au extras probele înainte de experiment, se numește
ipoteza nulă și se notează cu Ho.
Respingerea ipotezei nule echivaleaza cu acceptarea ipotezei alternative, notate
cu HA, conform căreia tratamentele diferite au modificat în așa măsura mediile
probelor încât ele par a estima mediile unor populații diferite, ca si cum probele
ar fi fost extrase din populatii diferite. Se poate scrie ca HA:μ1≠ μ2≠,...,= μn≠ μ.
În acest caz se acceptă ca tratamentele au afectat omogenitatea mediilor, lăsând
nemodificată varianța în interiorul fiecărei probe, deoarece toți membrii probei
primind același tratament se așteaptă să-și modifice valoarea caracterului
măsurat cu o constantă, care nu va afecta variabilitatea.
Pentru un experiment cu două probe, ipoteza nulă se formulează astfel:

𝐻0 : 𝜇1 = 𝜇2 ⇒ 𝜇1 − 𝜇2 = 0
(de unde și denumirea de ipoteză nulă sau ipoteză de nul)

Respingerea ipotezei nule echivalează cu acceptarea ipotezei alternative (Ha),


HA: μ1≠ μ2

Referitor la ipoteza alternativă, deosebim trei situații prin care putem descrie situația concretă:

- 𝐻𝐴 : 𝜇1 ≠ 𝜇2 𝑠𝑎𝑢 𝜇1 − 𝜇2 ≠ 0
- 𝐻𝐴 : 𝜇1 > 𝜇2 𝑠𝑎𝑢 𝜇1 − 𝜇2 > 0
- 𝐻𝐴 : 𝜇1 < 𝜇2 𝑠𝑎𝑢 𝜇1 − 𝜇2 < 0

Verificarea ipotezelor statistice se realizează cu ajutorul testelor statistice. Luarea unei decizii cu
privire la o ipoteza statistică se face în urma testării ipotezei cu ajutorul unui test statistic. De precizat
faptul că printr-un test statistic nu se stabilește adevărul, ci doar dacă rezultatele experimentului sprijină
ipoteza în baza căreia el a fost organizat.
Aplicarea concretă a unui test statistic, presupune parcurgerea următoarelor etape:

1) Calcularea, pe baza datelor loturilor experimentale, a statisticii testului considerat


(Student, Fisher, Bartlett, Grubbs, Kolmogorov-Smirnov, etc),
2) Stabilirea valorii critice a testului, pe baza gradelor de libertate (rezultate din mărimea
loturilor experimentale) și a nivelului de semnificație ales, alfa (5%, 1% sau 0,1%),
3) Luarea unei decizii privind ipoteza nulă, prin comparația (întotdeauna) a valorii
calculate (numită statistica testului), cu valoarea critică a testului, preluată din tabele
proprii testelor aplicate,
4) În cazul în care statistica testului este mai mică decât valoarea critică, se acceptă
ipoteza nulă și se respinge ipoteza alternativă,
5) În caz contrar, dacă statistica testului este mai mare decât valoarea critică, se respinge
ipoteza nulă și se acceptă ipoteza alternativă.
Din cauza faptului că testarea ipotezelor operează cu eșantioane și probabilități există
posibilitatea de a lua decizii greșite, de a comite erori. Există două tipuri de erori care se
referă la acceptarea sau respingerea ipotezei nule: eroarea de tipul I și eroarea de tipul II.

Erori ce pot fi comise în testarea ipotezelor statistice


Situația reală
Decizie luată Ipoteza alternativă (Ha)
Ipoteza nulă (H0) adevărată
adevărată

Ipoteza nulă (H0) Decizie corectă cu Eroare de tipul II, cu


acceptată probabilitatea probabilitatea egală cu 𝛽
𝑃1 = 1 − 𝛼 (nivelul de semnificație)
Ipoteza alternativă (Ha) Eroare de tipul I, cu Decizie corectă cu
acceptată probabilitatea egală cu 𝛼 probabilitatea
(nivelul de semnificație) 𝑃2 = 1 − 𝛽
Eroarea de tipul I, apare atunci când ipoteza nulă H0 este adevărată, însă este
respinsă, fiind considerată falsă. Probabilitatea de apariție a unei erori de tipul I este
pragul de semnificație α.
Eroarea de tipul II, apare atunci când ipoteza nulă H0 este falsă, dar este acceptată,
considerând că aceasta este adevărată. Probabilitatea de apariție a unei erori de tipul II
este β.
Pentru un volum prestabilit al eșantionului, probabilitatea de a comite o eroare de
tipul I se poate micșora prin reducerea corespunzătoare a mărimii α, care coincide cu
pragul de semnificație ales. Aceasta atrage după sine o mărire corespunzătoare a
probabilității β, deci a probabilității erorii de tipul II. De aceea, singurul mijloc de a
micșora simultan ambele probabilități ale erorilor constă în mărirea numărului de
măsurări ale căror rezultate se folosesc pentru testul statistic.
Există mai multe valori ale nivelului de semnificație a testului (𝛼), iar alegerea
acestuia rămâne la latitudinea cercetătorului, în funcție de domeniul în care se
întreprinde cercetarea. În general, se lucrează cu astfel de valori:
- 𝛼 = 0,05 – orice valoare calculată a testului mai mare decât valoarea tabelară a
lui corespunzătoare nivelului de semnificație de 0,05, determină respingerea
ipotezei nule; spunem că testul a evidențiat o diferență semnificativă (ipoteza
alternativă diferă semnificativ de ipoteza nulă și, ca urmare, se va accepta ca
adevărată Ha) și se marchează prin semnul grafic „*”;
- 𝛼 = 0,01 – orice valoare calculată a testului mai mare decât valoarea tabelară a
lui corespunzătoare nivelului de semnificație de 0,01, determină respingerea
ipotezei nule; spunem că testul a evidențiat o diferență distinct semnificativă
(ipoteza alternativă diferă distinct semnificativ de ipoteza nulă și, ca urmare, se
va accepta ca adevărată Ha) și se marchează prin semnul grafic „**”;
𝛼 = 0,001 – orice valoare calculată a testului mai mare decât valoarea tabelară a lui
corespunzătoare nivelului de semnificație de 0,001, determină respingerea ipotezei nule; spunem că
testul a evidențiat o diferență foarte (înalt) semnificativă (ipoteza alternativă diferă foarte semnificativ
de ipoteza nulă și, ca urmare, se va accepta ca adevărată Ha) și se marchează prin semnul grafic
„***”, conform figurii 1.

Probabilitatea 𝑃2 = 1 − 𝛽 se
numește puterea testului. Aceasta
va fi cu atât mai mare cu cât
volumul eșantionului va fi mai
mare, la un nivel de semnificație
(𝛼) fix. Ca regulă, un test statistic
va fi mai puternic comparativ cu
un altul dacă, la același nivel de
semnificație, respinge ipoteza nulă
pe un volum mai mic al
eșantionului.
Clasificarea testelor statistice

În funcție de modul de formulare a ipotezei alternative, există două categorii


de teste statistice:
1. Testele bilaterale sau „teste cu două cozi” (two tailed test);
2. Teste unilaterale dreapta sau „teste cu coadă pe dreapta” (right tailed test);
3. Teste unilaterale stânga sau „teste cu coadă pe stânga” (left tailed test).

Testele bilaterale. Presupunem că în cadrul unui experiment am avansat


ipoteza nulă:
𝐻0 : 𝜇1 = 𝜇2 ⇒ 𝜇1 − 𝜇2 = 0,
iar alternativa ei:
𝐻𝐴 : 𝜇1 > 𝜇2 𝑠𝑎𝑢 𝜇1 − 𝜇2 > 0
Cu alte cuvinte, în cadrul experimentului presupus, în cazul în care cele
două medii sunt diferite, se va accepta ipoteza alternativă, însă ne este
indiferent din ce motiv cele două medii nu coincid, adică nu ne interesează
dacă ∶ 𝜇1 > 𝜇2 , sau 𝜇1 < 𝜇2 .

Decizia statistică (adică acceptarea


sau respingerea ipotezei nule) se va lua în
urma aplicării unui test statistic, a cărui
zonă de variație va avea regiunea de
acceptare (domeniul de confidență) plasată
pe valorile cele mai probabile, central
(adică între valoarea negativă și pozitivă a
valorii testului, respectiv între -T și +T),
iar regiunea critică (de respingere) va
acoperi cozile domeniului de variație (de o
parte și de alta a a regiunii de acceptare).
Aria regiunii de respingere va fi egală cu
nivelul de semnificație (𝛼) – figura 2. Un
astfel de test se numește bilateral.
Testele unilaterale dreapta. Presupunem că în cadrul unui experiment am avansat ipoteza
nulă:
𝐻0 : 𝜇1 = 𝜇2 ⇒ 𝜇1 − 𝜇2 = 0, iar alternativa ei: 𝐻𝐴 : 𝜇1 > 𝜇2 𝑠𝑎𝑢 𝜇1 − 𝜇2 > 0
Cu alte cuvinte, în cadrul experimentului
presupus, în cazul în care cele două medii sunt
diferite, se va accepta ipoteza alternativă,
respectiv 𝜇1 > 𝜇2 . Decizia statistică (adică acceptarea
sau respingerea ipotezei nule) se va lua în urma
aplicării unui test statistic, a cărui zonă de variație va
avea regiunea de acceptare (domeniul de confidență)
plasată pe valorile cele mai probabile, respectiv între
− ∞ și +T, iar regiunea critică (de respingere) va
acoperi coada din dreapta a domeniului de variație.
Aria regiunii de respingere va fi egală cu nivelul de
semnificație (𝛼), însă aceasta nu se va mai distribui de
o parte și de alta a zonei de acceptare, ci unilateral
dreapta. Un astfel de test se numește unilateral
dreapta – figura 3 . În cazul unor astfel de teste,
ipoteza nulă se respinge, implicit se acceptă ipoteza
alternativă, atunci când valoarea calculată a testului
este mai mare decât +T.
Testele unilaterale stânga. Presupunem că în cadrul unui experiment am avansat
ipoteza nulă:
𝐻0 : 𝜇1 = 𝜇2 ⇒ 𝜇1 − 𝜇2 = 0, iar alternativa ei:𝐻𝐴 : 𝜇1 < 𝜇2 𝑠𝑎𝑢 𝜇1 − 𝜇2 < 0

În cadrul experimentului presupus, în


cazul în care cele două medii sunt diferite, se
va accepta ipoteza alternativă, respectiv 𝜇1 <
𝜇2 . Decizia statistică (adică acceptarea sau
respingerea ipotezei nule) se va lua în urma
aplicării unui test statistic, a cărui zonă de
variație va avea regiunea de acceptare
(domeniul de confidență) plasată pe valorile
cele mai probabile, respectiv între −𝑇 și +∞,
iar regiunea critică (de respingere) va acoperi
coada din stânga a domeniului de variație. Aria
regiunii de respingere va fi egală cu nivelul de
semnificație (𝛼), însă aceasta nu se va mai
distribui de o parte și de alta a zonei de
acceptare, ci unilateral stânga. Un astfel de test
se numește unilateral stânga – figura 4.
În cazul unor astfel de teste, ipoteza nulă se respinge, implicit se acceptă ipoteza
alternativă, atunci când valoarea calculată a testului este mai mică decât -T.

Într-un test bilateral, în cazul în care mediile diferă semnificativ (𝜇1 ≠ 𝜇2 ), nu


ne interesează dacă ele sunt diferite prin lipsă sau prin adaos, ceea ce înseamnă că
regiunea de respingere (cu aria egală cu 𝛼) se distribuie, în mod egal, de o parte și de
alta a regiunii de acceptare, practic pe ambele cozi ale distribuției. Spre exemplu, să
presupunem că avem în studiu două loturi de animale în ceea ce privește efectul
unor rații diferite asupra cantității de lapte. Media observată pentru primul lot este
ഥ 𝟏 , iar pentru lotul al doilea 𝑿
𝑿 ഥ 𝟐 . Presupunem că tratamentele diferite nu afectează
media celor două loturi, astfel încât vom fixa ipoteza nulă, astfel: 𝐻0 : 𝜇1 = 𝜇2 .
Aceasta se testează prin aplicarea unui test statistic, însă în supoziția respingerii ei
(și implicit a acceptării alternativei 𝐻𝑎 : 𝜇1 ≠ 𝜇2 ), nu ne interesează dacă mediile
diferă semnificativ în plus sau în minus, luând în considerare ambele situații
(simultan). Ca urmare, testul aplicat va fi considerat unul bilateral și tratat ca atare.
Într-un test unilateral, ne interesează sensul diferenței dintre două medii, adică nu
ne este indiferent dacă ele diferă prin lipsă sau prin adaos. Astfel, regiunea de
respingere se va distribui pe una din cozile distribuției, în stânga sau în dreapta zonei
de acceptare. Mergând pe exemplul anterior, în urma unor rații diferite aplicate celor
două loturi, eficacitatea tratamentului ar fi nesatisfăcătoare în cazul în care media
lotului 2 ar fi mai mică decât media lotului 1 (𝜇2 < 𝜇1 ). Ca urmare, ipoteza
alternativă într-o astfel de situație se descrie ca fiind 𝐻𝐴 : 𝜇2 < 𝜇1 . În acest moment,
zona de respingere va fi plasată numai spre coada din stânga a distribuției. Ca
urmare, testul aplicat va fi considerat unul unilateral (stânga) și tratat ca atare.
O problemă a acestui criteriu de clasificare a testelor este reprezentată de
stabilirea nivelului de semnificație (𝛼). Dacă în testele bilaterale, se va lucra cu
nivelul de semnificație 𝛼, în cazul celor unilaterale se recomandă înjumătățirea
𝛼
nivelului de la testele bilaterale, respectiv , în caz contrar fiind afectată eficacitatea
2
testului (Dragomirecu, 1998, 2003). Spre exemplu, în situația în care într-un bilateral
lucrăm cu 𝛼 = 0,05, într-un test unilateral vom considera nivelul de semnificație 𝛼 =
0,025. Aceasta deoarece, în cazul testelor unilaterale, jumătate din aria de respingere
din bilateral va intra în zona de acceptare a unilateralului.
Succesiunea normală de aplicare a testelor statistice înainte de
începerea experimentului
Discuția referitoare la succesiunea normală de aplicare a testelor statistice se face diferit, în funcție
de tipul de experiment ce se organizează. Astfel, există două categorii de experimente:
✓ experimente formate din două loturi: un martor și un lot experimental;
✓ experimente formate din mai mult de două loturi: un martor și mai multe loturi experimentale.
Aplicarea testelor statistice se face pentru:
➢ verificarea existenței erorilor grosolane (implicit eliminarea lor);
➢ verificarea omogenității varianțelor;
➢ verificarea omogenității mediilor;

Notă: Aceste teste se aplică înainte de începerea experimentului și au drept scop verificarea
comparabilității probelor. Dacă un singur răspuns este nefavorabil, experimentul NU începe și se vor
extrage noi probe! În acest fel, ne asigurăm că eventualele diferențe dintre mediile loturilor vor putea fi
puse exclusiv pe seama tratamentelor aplicate.
Cazul experimentelor formate din două loturi

Verificarea existenței erorilor grosolane

Existența erorilor grosolane se verifică aplicând testul Grubbs și are drept scop detectarea
valorilor din afara distribuției normale, rezultatul fiind interpretat ca probabilitate de apartenență a
datelor la populația statistică.
Testul constă în determinarea diferenței dintre valorile considerate a fi străine de șirul de
variație și medie, raportată la valoarea deviației standard.

Statistica testului Grubbs se determină după relația:


𝑥𝑖 − 𝑋ത
𝑣ො =
𝑠
în care:
în care:
- 𝑥𝑖 = valoarea bănuită că nu ar face parte din șirul de variație (se iau în discuție valorile extreme);
- 𝑋ത = media probei;
- 𝑠 = deviația standard a probei.
Inițial se avansează ipoteza nulă (H0) conform căreia valoarea analizată nu este
străină de șirul de variație. Valoarea calculată a testului se va compara cu o valoare
tabelară citită în funcție de volumul probei (n) și nivelul de semnificație (𝛼).
Dacă valoarea calculată a testului este mai mică decât valoarea tabelară, se
acceptă ipoteza nulă (valoarea nu este străină de șirul de variație).
Dacă valoarea calculată este mai mare decât valoarea tabelară, se respinge
ipoteza nulă și se acceptă alternativa (HA: valoarea este străină de șirul de variație și
se va elimina).
Este important de subliniat faptul că testul este eficient numai în condițiile
existenței unei distribuții normale.
Exemplu numeric

Să considerăm cazul unui experiment de nutriție, format din două loturi de date
referitoare la greutatea purceilor (kg) în prima fază de îngrășare (5 luni):

Specificare Lot martor Lot experimental


1 53 72
2 57 90 (val. max.)
3 54 62
4 61 61
5 58 59
6 59 64
7 70 57 (val. min.)
8 62 68
9 70 (val. max.) 67
10 25 (val. min.) 58
n 10 10

𝑿 56,90 65,80
s 12,62 9,75
Vom aplica testul Grubbs valorilor extreme din cele două loturi.
Valorile calculate (luate în modul) se vor compara cu valoarea tabelară:
𝑣𝑛; 𝛼 = 𝑣10;0,05 = 2,41

Lotul martor:
Vom testa valoarea minimă (25):

25 − 56,90
𝑣ො𝟐𝟓 = = −2,53 ⇒ 𝐻𝐴
12,62

Rezultatul obținut arată că valoarea de 25 este străină de șirul de variație și se elimină.


În acest moment, noua valoare minimă din șirul de variație este 53 și se va testa:
53−56,90
𝑣ො53 = = −0,31 ⇒ 𝐻0
12,62
Vom testa valoarea maximă (70):
70 − 56,90
𝑣ො𝟕𝟎 = = 1,04 ⇒ 𝐻0
12,62

Ca urmare, în lotul martor au rămas 9 valori.


Lotul experimental:

Vom testa valoarea minimă (57):


57 − 65,80
𝑣ො57 = = −0,90 ⇒ 𝐻0
9,75
Vom testa valoarea maximă (90):
90 − 65,80
𝑣ො90 = = 2,48 ⇒ 𝐻𝐴
9,75

Rezultatul obținut arată că valoarea de 90 este străină de șirul de variație și se


elimină.
În acest moment, noua valoare maximă din șirul de variație este 72 și se va
testa:
72 − 65,80
𝑣ො72 = = 0,64 ⇒ 𝐻0
9,75
Ca urmare, în lotul experimental au rămas tot 9 valori.
Verificarea omogenității varianțelor

În cazul experimentelor formate din două loturi, testarea omogenității varianțelor se


realizează cu ajutorul testului Fisher.
Inițial se avansează ipoteza nulă conform căreia varianțele sunt omogene:

𝐻0 : 𝜎12 = 𝜎22 = 𝜎 2

Statistica testului se notează cu 𝐹෠ și se prezintă sub forma unui raport de varianțe:

𝑆12 (varianța cu valoarea cea mai mare)


𝐹෠ = 2
𝑆2 (varianța cu valoarea cea mai mică)

Valoarea calculată a testului se va compara cu o valoare tabelară, citită în funcție de


gradele de libertate pentru cele două probe și nivelul de semnificație ales:

𝑛 −1 (gradele de libertate pentru proba cu varianța cea mai mare)


𝐹 = 𝐹𝑛21−1 gradele de libertate pentru proba cu varianța cea mai mică ; α
Dacă valoarea calculată a testului este mai mică decât
valoarea tabelară, se acceptă ipoteza nulă (varianțele sunt
omogene).
Dacă valoarea calculată este mai mare decât valoarea
tabelară, se respinge ipoteza nulă și se acceptă alternativa
(Ha: varianțele nu sunt omogene, ca și cum probele ar fi
extrase din populații diferite). În această situație loturile
se resping, repetându-se procesul de extragere.
Exemplu numeric

Vom considera același set de date ca în exemplul anterior:

Specificare Lot martor Lot experimental


1 53 72
2 57 62
3 54 61
4 61 59
5 58 64
6 59 57
7 70 68
8 62 67
9 70 58
n 9 9

𝑿 60,44 63,11
S2 37,78 25,61
Valoarea calculată se va compara cu valoarea tabelară:

𝑛 −1 9−1 8
𝐹 = 𝐹𝑛21−1; α = 𝐹9−1; α = 𝐹8;0,05 = 3,44

Valoarea calculată a testului Fisher pentru cazul nostru va fi:

37,78
𝐹෠ = = 1,47 ⇒ 𝐻0
25,61

Având în vedere că valoarea calculată (1,47) este mai mică decât valoarea critică (citită în tabel =
3,44) rezultă că se acceptă ipoteza nulă, respectiv varianțele sunt omogene. În acest context, se
merge mai departe și se verifică și omogenitatea (egalitatea) mediilor.
Testarea omogenității mediilor
În cazul experimentelor formate din două loturi, omogenitatea mediilor se testează cu
testul Student, imaginat de către William Sealy Gosset care a publicat propunerea sa în 1908,
în revista Biometrika, sub pseudonimul Student.

Inițial se avansează ipoteza nulă conform căreia mediile sunt omogene:


𝐻0 : 𝜇1 = 𝜇2 = 𝜇
Statistica testului Student se notează cu 𝒕ො și este de forma:

𝑋ത1 − 𝑋ത2
𝑡Ƹ =
𝑠𝑑
în care:
- 𝑋ത1 , 𝑋ത2 = mediile probelor ce se testează;
- 𝑠𝑑 = eroarea diferenței între medii, calculată după relația:
𝑆12 𝑆22
𝑠𝑑 = +
𝑛1 𝑛2
în care:
- 𝑆12 , 𝑆22 = varianțele probelor;
- 𝑛1 , 𝑛2 = volumul probelor.
În final, relația de calcul a statisticii testului Student va fi (prin înlocuire), următoarea:

𝑋ത1 − 𝑋ത2
𝑡Ƹ =
𝑆12 𝑆22
+
𝑛1 𝑛2

Valoarea calculată a testului se va compara cu o valoare tabelară citită în funcție de


gradele de libertate cumulate pentru cele două probe (𝑛1 + 𝑛2 − 2) și nivelul de semnificație
(𝛼):
𝑡 = 𝑡 𝑛1+𝑛2−2 ; 𝛼

Dacă valoarea calculată a testului este mai mică decât valoarea tabelară, se acceptă
ipoteza nulă (mediile sunt omogene).
Dacă valoarea calculată este mai mare decât valoarea tabelară, se respinge ipoteza nulă și
se acceptă alternativa (Ha: mediile nu sunt omogene, ca și cum probele ar fi extrase din
populații diferite). În această situație loturile se resping, repetându-se procesul de extragere.
Exemplu numeric

Vom considera același set de date ca în exemplul anterior:

Specificare Lot martor Lot experimental


1 53 72
2 57 62
3 54 61
4 61 59
5 58 64
6 59 57
7 70 68
8 62 67
9 70 58
n 9 9

𝑿 60,44 63,11
S2 37,78 25,61
Valoarea calculată se va compara cu valoarea tabelară:

𝑡 = 𝑡 𝑛1+𝑛2−2 ; 𝛼 = 𝑡 9+9−2 ; 𝛼 = 𝑡16; 0,05 = 2,12

Valoarea calculată a testului Student pentru exemplul considerat va fi:

63,11 − 60,44 2,67


𝑡Ƹ = = = 1,01
37,78 25,61 2,65
+
9 9

Deoarece valoarea calculată a testului (1,01) este mai mică decât valoarea
tabelară (2,12), se formulează concluzia de acceptare a ipotezei nule, mediile lor
fiind omogene.

S-ar putea să vă placă și